검출과 인식 모델을 하나로? : challenge 우승 OCR 서비스 모델 새 출시!
코드너리 | 2023. 03. 18
OCR
컴퓨터 비전
머신러닝
사용된 기술:
관련 기술 스택이 없습니다 🙄
개요:
이번 세션에서는 Text Vision 팀에서 Next OCR model 개발을 위해 했던 고민들과 해결해 나간 과정을 공유합니다. 기존 2개의 model (text detection 과 recognition) 으로 OCR을 하며 발생했던 문제들과 새로운 End-To-End 모델이 가지는 장점 및 새롭게 할 수 있게 된 것을 소개합니다. 또한 AI 모델을 실제 서비스로 배포하기 위해 진행한 Out Of Domain Data수집과 QA 대해 소개합니다. ECCV OOV scene text understanding 대회에서 우승한 경험을 공유합니다.
목차
1. OCR 이란?
- CLOVA OCR 의 서비스 현황
- 기존 OCR 모델 구성 (검출 + 인식)
- 기존 OCR 모델의 단점
2. 글자 탐지와 인식이 한번에 된다고?
- 검출과 인식을 한번에 하는 End-to-End OCR : DEER
- 얼마나 빠르고 가볍다고요
- 척하면 척 잘 맞춰요
- 관리가 훨씬 쉬워졌어요
- 검출, 인식 한번에 학습
- 서로 다른 서비스 별 특화 모델 성능을 뛰어넘는 one model
3. 국제 OCR challenge 1등
- OOV challenge 란?
- 서비스 출시 예정인 모델로 참가하여 우승 달성
4. 새 모델은 이것도 할 수 있어요
- 단어 단위를 넘어 문자 하나 하나 검출
- 문서 구조 인식 : 라인과 문단 검출
5. 서비스 배포를 위해
- 좀 더 가볍게
- out-of-domain data 수집 및 성능 검증