통합적인 AI/ML 시스템을 구축하는 방법
코드너리 | 2022. 08. 12
머신러닝
데이터 분류
데이터 파이프라인
사용된 기술:
관련 기술 스택이 없습니다 🙄
모듈:
통합 AI 시스템을 구축하려면 다음 모듈들이 필요합니다.
- 데이터 수집 모듈. 현 머신러닝 기법은 막대한 데이터 볼륨에 의존합니다. 데이터 없이는 지식도 모델도 존재할 수 없습니다.
- 데이터 라벨링 모듈. 초기에는 데이터를 수동으로 라벨링해야 합니다. 지식 및 데이터베이스가 진화하면서 데이터 라벨링 역시 부분적으로 자동화합니다.
- 모델 학습 및 평가 모듈. 모델을 제공된 데이터로 학습 및 평가합니다.
운영:
- 첫째, 모델은 사용 가능한 모든 지식을 온전히 활용해야 합니다. 예를 들어, 두 개의 이미지의 상품이 동일한지를 판단할 수 있는 모델을 학습시킨다고 가정하겠습니다. 모델 복잡도를 고도화하고 성능을 개선하려면, 신발, 모니터 등의 이미지 요소를 인식하도록 학습시킬 수 있습니다. 이러한 추가 정보를 바탕으로 모델은 두 개의 상품의 동일성을 판단할 수 있습니다.
- 둘째, 모델은 프로덕션에서 처음 보는(unseen) 데이터에 노출될 가능성이 크기 때문에 불특정 주제(open-domain) 환경에서 새로운 지식을 파악할 수 있는 능력을 내재해야 합니다.
- 셋째, 정확한 평가 지표로 모델 성능을 모니터링해야 합니다. 모델이 예상대로 데이터에 학습을 하지 않는다면, 평가 지표를 자세히 살펴 개선해야 합니다. 또한, 학습 데이터의 유효성과 효율성을 측정할 수 있는 기제가 있으면 모델 평가에 도움이 됩니다.