logo
logo
Transformer 기반의 Global pLACE(GLACE) Matching 개발기
코드너리  |  2023. 03. 18
ML 파이프라인
머신러닝
추천 서비스
사용된 기술:
pytorch-image

개요:

본 세션에서 첫 번째로 OCR POI Matching을 소개합니다. OCR POI Matching은 GLACE에서 다루는 데이터 중 영수증 데이터로부터 문자 인식(OCR)을 통해 추출한 가게 정보(업체명, 주소, 사업자 번호, 전화 번호 등..)를 통해 문자가 오인식되더라도 정확한 가게 정보를 내려주는 place of interest(POI) matching 서비스 개발과 고도화 경험을 공유합니다. 두 번째로 Menu Option Extraction에서는 영수증 데이터를 활용하여 각 가게의 메뉴명에 존재하는 옵션들을 추출하는 서비스를 개발하여 적용하기까지 사용했던 기술과 경험을 공유하려 합니다.

목차

1. OCR POI Matching

검색엔진으로 문제해결이 어려운 배경

Baseline

  • CLOVA POI Matching
  • 학습데이터 구축

성능 고도화

  • Supervised Contrastive Learning
  • Pairwise Supervised Contrastive Learning
  • 2 stage learning
  • DeepSpeed를 활용한 Big-batch training
  • 평가 지표
  • 실험 결과
  • 실서비스 적용

POI Matching 확장

2. Menu matching

  • Menu Matching 소개
  • Dataset
  • Menu Matching
  • Modeling
  • Model Inference
  • Result
  • 성능 평가
  • 에러 케이스 & 고도화 방안

3. Option Extraction

  • Option Extraction 소개
  • Dataset
  • Option Extraction
  • Modeling
  • Result
    • 성능 평가
  • Reranking logic
Copyright © 2024. Codenary All Rights Reserved.