'더' 잘 읽히고 자연스러운 이미지 번역을 위해(파파고 텍스트 렌더링 개발기)
코드너리 | 2023. 03. 18
머신러닝
NLP
사용된 기술:
관련 기술 스택이 없습니다 🙄
개요:
이 세션에서는 파파고 이미지 바로 번역 기술, 그 중에서도 번역된 글자를 이미지에 합성하는 '텍스트 렌더링' 기능의 고도화 방법론에 대해 소개합니다. 자연스러운 텍스트 렌더링을 위해서는 우선 원본 글자를 매끄럽게 지울 수 있어야 합니다. GAN을 활용하여 원본 텍스트를 더욱 섬세하게 제거한 경험을 공유합니다. 추가로 '더' 자연스러운 텍스트 렌더링을 위해 필요한 요소들과 관련 기술에 대해 소개합니다. 원문의 스타일을 유지하는 데 필요한 텍스트 색상, 원문의 문단 구조를 유지하면서 텍스트를 합성하는 데 필요한 정렬, 번역된 텍스트의 가독성에 큰 영향을 미칠 수 있는 글꼴 크기 등 텍스트 렌더링과 관련된 문제를 다루는 기술과 노하우를 공유한다.
본 세션에서 소개한 인페인팅 방법은 모델 개선 방법에 대한 독창성 및 성능이 검증이 되었고, 유럽 컴퓨터 비젼 학회(ECCV 2022)에 논문으로 채택되었습니다.
목차
1. 파파고 이미지 바로 번역
- 이미지 바로 번역 소개
- 텍스트 렌더링 과정 소개
2. 텍스트 인페인팅
- 기존 방법 및 문제점
- GAN을 활용한 텍스트 제거
3. 글자 색상 추출
- 기존 방법 및 문제점
- 글자 색상 추출의 방법
- '더'좋은 가독성을 위해
4. 글자 정렬 추출
- 글자 정렬 추출의 필요성
- 글자 정렬 추출의 방법
5. 글자 영역 추출
- 영역 추출의 필요성
- 영역 추출의 방법
6. 서비스 적용 결과
- 적용 결과 예시
대상
- 렌더링 기술에 관심이 있는 서비스 기획자, 연구자 및 개발자
- 머신러닝, GAN의 서비스 적용에 관심 있는 모든 분들