Transformer 기반의 Global pLACE(GLACE) Matching 개발기
코드너리 | 2023. 03. 18
ML 파이프라인
머신러닝
추천 서비스
사용된 기술:
개요:
본 세션에서 첫 번째로 OCR POI Matching을 소개합니다. OCR POI Matching은 GLACE에서 다루는 데이터 중 영수증 데이터로부터 문자 인식(OCR)을 통해 추출한 가게 정보(업체명, 주소, 사업자 번호, 전화 번호 등..)를 통해 문자가 오인식되더라도 정확한 가게 정보를 내려주는 place of interest(POI) matching 서비스 개발과 고도화 경험을 공유합니다. 두 번째로 Menu Option Extraction에서는 영수증 데이터를 활용하여 각 가게의 메뉴명에 존재하는 옵션들을 추출하는 서비스를 개발하여 적용하기까지 사용했던 기술과 경험을 공유하려 합니다.
목차
1. OCR POI Matching
검색엔진으로 문제해결이 어려운 배경
Baseline
- CLOVA POI Matching
- 학습데이터 구축
성능 고도화
- Supervised Contrastive Learning
- Pairwise Supervised Contrastive Learning
- 2 stage learning
- DeepSpeed를 활용한 Big-batch training
- 평가 지표
- 실험 결과
- 실서비스 적용
POI Matching 확장
2. Menu matching
- Menu Matching 소개
- Dataset
- Menu Matching
- Modeling
- Model Inference
- Result
- 성능 평가
- 에러 케이스 & 고도화 방안
3. Option Extraction
- Option Extraction 소개
- Dataset
- Option Extraction
- Modeling
- Result
- 성능 평가
- Reranking logic