logo
logo
'더' 잘 읽히고 자연스러운 이미지 번역을 위해(파파고 텍스트 렌더링 개발기)
코드너리  |  2023. 03. 18
머신러닝
NLP
사용된 기술:
관련 기술 스택이 없습니다 🙄

개요:

이 세션에서는 파파고 이미지 바로 번역 기술, 그 중에서도 번역된 글자를 이미지에 합성하는 '텍스트 렌더링' 기능의 고도화 방법론에 대해 소개합니다. 자연스러운 텍스트 렌더링을 위해서는 우선 원본 글자를 매끄럽게 지울 수 있어야 합니다. GAN을 활용하여 원본 텍스트를 더욱 섬세하게 제거한 경험을 공유합니다. 추가로 '더' 자연스러운 텍스트 렌더링을 위해 필요한 요소들과 관련 기술에 대해 소개합니다. 원문의 스타일을 유지하는 데 필요한 텍스트 색상, 원문의 문단 구조를 유지하면서 텍스트를 합성하는 데 필요한 정렬, 번역된 텍스트의 가독성에 큰 영향을 미칠 수 있는 글꼴 크기 등 텍스트 렌더링과 관련된 문제를 다루는 기술과 노하우를 공유한다.

본 세션에서 소개한 인페인팅 방법은 모델 개선 방법에 대한 독창성 및 성능이 검증이 되었고, 유럽 컴퓨터 비젼 학회(ECCV 2022)에 논문으로 채택되었습니다.

목차

1. 파파고 이미지 바로 번역

  • 이미지 바로 번역 소개
  • 텍스트 렌더링 과정 소개

2. 텍스트 인페인팅

  • 기존 방법 및 문제점
  • GAN을 활용한 텍스트 제거

3. 글자 색상 추출

  • 기존 방법 및 문제점
  • 글자 색상 추출의 방법
  • '더'좋은 가독성을 위해

4. 글자 정렬 추출

  • 글자 정렬 추출의 필요성
  • 글자 정렬 추출의 방법

5. 글자 영역 추출

  • 영역 추출의 필요성
  • 영역 추출의 방법

6. 서비스 적용 결과

  • 적용 결과 예시

대상

  • 렌더링 기술에 관심이 있는 서비스 기획자, 연구자 및 개발자
  • 머신러닝, GAN의 서비스 적용에 관심 있는 모든 분들
Copyright © 2024. Codenary All Rights Reserved.