검출과 인식 모델을 하나로? : challenge 우승 OCR 서비스 모델 새 출시! | 코드너리

디스커버리

컨퍼런스 일정

기술 아키텍처

기술 블로그

검출과 인식 모델을 하나로? : challenge 우승 OCR 서비스 모델 새 출시!

코드너리 | 2023. 03. 18

OCR

컴퓨터 비전

머신러닝

사용된 기술:

관련 기술 스택이 없습니다 🙄

개요:

이번 세션에서는 Text Vision 팀에서 Next OCR model 개발을 위해 했던 고민들과 해결해 나간 과정을 공유합니다. 기존 2개의 model (text detection 과 recognition) 으로 OCR을 하며 발생했던 문제들과 새로운 End-To-End 모델이 가지는 장점 및 새롭게 할 수 있게 된 것을 소개합니다. 또한 AI 모델을 실제 서비스로 배포하기 위해 진행한 Out Of Domain Data수집과 QA 대해 소개합니다. ECCV OOV scene text understanding 대회에서 우승한 경험을 공유합니다.

목차

1. OCR 이란?

CLOVA OCR 의 서비스 현황
기존 OCR 모델 구성 (검출 + 인식)
기존 OCR 모델의 단점

2. 글자 탐지와 인식이 한번에 된다고?

검출과 인식을 한번에 하는 End-to-End OCR : DEER
얼마나 빠르고 가볍다고요
척하면 척 잘 맞춰요
관리가 훨씬 쉬워졌어요
검출, 인식 한번에 학습
서로 다른 서비스 별 특화 모델 성능을 뛰어넘는 one model

3. 국제 OCR challenge 1등

OOV challenge 란?
서비스 출시 예정인 모델로 참가하여 우승 달성

4. 새 모델은 이것도 할 수 있어요

단어 단위를 넘어 문자 하나 하나 검출
문서 구조 인식 : 라인과 문단 검출

5. 서비스 배포를 위해

좀 더 가볍게
out-of-domain data 수집 및 성능 검증

네이버

Remember Me: 맞춤 케어를 위한 기억하기 챗봇

* 관련 기술 스택이 없습니다 🙄

쿠팡

대용량 처리를 위한 백엔드 아키텍처

* 관련 기술 스택이 없습니다 🙄

실시간 스트리밍

대용량 처리

라인

쇼핑 플랫폼 백엔드 파이프라인

* 관련 기술 스택이 없습니다 🙄

Copyright © 2025. Codenary All Rights Reserved.

서비스 이용약관 개인정보 처리방침