logo
logo
검출과 인식 모델을 하나로? : challenge 우승 OCR 서비스 모델 새 출시!
코드너리  |  2023. 03. 18
OCR
컴퓨터 비전
머신러닝
사용된 기술:
관련 기술 스택이 없습니다 🙄

개요:

이번 세션에서는 Text Vision 팀에서 Next OCR model 개발을 위해 했던 고민들과 해결해 나간 과정을 공유합니다. 기존 2개의 model (text detection 과 recognition) 으로 OCR을 하며 발생했던 문제들과 새로운 End-To-End 모델이 가지는 장점 및 새롭게 할 수 있게 된 것을 소개합니다. 또한 AI 모델을 실제 서비스로 배포하기 위해 진행한 Out Of Domain Data수집과 QA 대해 소개합니다. ECCV OOV scene text understanding 대회에서 우승한 경험을 공유합니다.

목차

1. OCR 이란?

  • CLOVA OCR 의 서비스 현황
  • 기존 OCR 모델 구성 (검출 + 인식)
  • 기존 OCR 모델의 단점

2. 글자 탐지와 인식이 한번에 된다고?

  • 검출과 인식을 한번에 하는 End-to-End OCR : DEER
  • 얼마나 빠르고 가볍다고요
  • 척하면 척 잘 맞춰요
  • 관리가 훨씬 쉬워졌어요
  • 검출, 인식 한번에 학습
  • 서로 다른 서비스 별 특화 모델 성능을 뛰어넘는 one model

3. 국제 OCR challenge 1등

  • OOV challenge 란?
  • 서비스 출시 예정인 모델로 참가하여 우승 달성

4. 새 모델은 이것도 할 수 있어요

  • 단어 단위를 넘어 문자 하나 하나 검출
  • 문서 구조 인식 : 라인과 문단 검출

5. 서비스 배포를 위해

  • 좀 더 가볍게
  • out-of-domain data 수집 및 성능 검증
Copyright © 2024. Codenary All Rights Reserved.