파파고의 빨간펜 선생님: 자동 번역 품질 평가 모델 구축과 응용
코드너리 | 2023. 03. 18
머신러닝
NLP
사용된 기술:
관련 기술 스택이 없습니다 🙄
개요:
이 세션에서는 자동 번역 품질 평가 (Quality Estimation; QE) 분야에 대하여 소개합니다. 자동 번역 품질 평가의 필요성 및 활용 가능성에 대하여 알아보고, 번역 도메인에서의 shared tasks 인 WMT의 파파고 참여 내용 및 이 때 얻은 노하우들을 공유합니다. 마지막으로 파파고는 QE 를 활용하여 어떤 효과를 얻고 있는지에 대해서도 소개합니다.
- 자동 번역 평가의 중요성 및 Quality Estimation (QE) 의 필요성
- 자동 번역 평가를 위한 QE 모델의 필요성
- QE 의 기대 효과
- 파파고에서의 QE 개발 개요
- 파파고에서 수행하고 있는 data augmentation 방법 및 효과
- QE 모델의 학습 데이터 형식 및 학습과정
- 학습데이터 부족 문제를 해결하기 위한 대표적인 방법들
- 어떤 요인들이 QE 모델 성능 개선에 영향을 주는지 알아보기
- 자동 번역 평가 모델의 활용 예시
- QE 가 구분한 저품질/고품질 데이터 예시
- 번역 학습데이터 정제를 통한 번역 품질 향상
- 코퍼스 마이닝을 통한 자동 번역 데이터 확보