logo
logo
배민 사장님용 통계 데이터
코드너리  |  2022. 07. 05
대용량 처리
데이터 파이프라인
사용된 기술:
airflow-image
spark-image
hive-image
mysql-image
content

요구 사항:

사장님에게 새로운 통계 화면을 제공하기 위해, 다음과 같은 요구사항을 구현해야 했습니다.

  • 주문/배달 데이터로부터 주문 접수율, 주문 접수시간, 조리시간 준수율 등의 통계 데이터를 만들 수 있어야 합니다.
  • 통계 데이터를 바탕으로 상대평가를 해야 합니다. 각 지표별로 모든 가게들 중 상위 몇 퍼센트인지 수치로 나타낼 수 있어야 합니다.
  • 매일 아침 9시에 통계/상대평가 데이터 최신본을 업데이트해야 합니다.

최종 구조:

  • 중간 통계 결과를 저장하는 hive 테이블을 두고, 중간 결과를 합친 최종 결과만 팀 내 RDB로 저장하도록 만들었습니다.
  • 통계 데이터를 계산하는 로직은 데이터 레이크에서 데이터를 추출하는 SparkSQL에 있습니다.
  • 이를 통해, 우리가게NOW 오픈 첫날 30분 안쪽으로 데이터 처리를 완료할 수 있었습니다.
  • 지금까지도 평균적으로 30분 처리 시간을 유지하고 있습니다.
Copyright © 2024. Codenary All Rights Reserved.