Page 14 -
P. 14
에 표시되지요. 자기가 만든 모델의 예측 정확도를 시험해 보는 공개 테스트 데이터 20%뿐 아니
라 여기에 포함되지 않는 나머지 80%에서도 정확도가 높아야 하므로 참가자들은 결국 어떤 데이
터든지 정확도가 높은 학습 모델을 만드는 것을 목표로 해야 합니다. 캐글에서 공개 리더보드보다
비공개 리더보드의 결과가 더 좋은 경우를 shake up, 반대로 더 좋지 않은 경우를 shake down
이라고 합니다.
캐글의 각 경쟁자에게는 비공개 리더보드의 최종 순위 결과에 따라 골드(Gold), 실버(Silver), 브론즈
(Bronze) 같은 메달 및 상금이 수여됩니다(메달 및 상금 수여의 대상이 되는 경진대회만 해당합니
다). 각 경쟁자 수에 따라 메달을 수여하는 조건은 다르지만, 그림 1-5의 캐글 공식 페이지에 기재
된 바에 따르면 참가자가 1000명 이상인 경우 상위 10%는 브론즈, 상위 5%는 실버, 1~12등 이
내는 골드를 수여받습니다.
그림 1-5 참가 인원별 메달 수여 조건(캐글 공식 페이지)
https://www.kaggle.com/progression
예전에 개최된 Mercari Price Suggestion Challenge는 그림 1-6과 같이 메달을 수여했습니다
(가로축이 최종 예측 점수, 세로축이 점수별 팀 수). 오른쪽 끝에 골드, 실버, 브론즈 영역이 표시
되어 있는데 브론즈 영역 앞쪽에 특히 많은 인원이 몰려 있는 것을 볼 수 있습니다. 캐글에서는
앞서 설명한 대로 자신의 코드를 공유할 수 있는데 자신이 원할 때는 최종 결과까지 모두 공개하
기도 합니다. 이를 활용해서 예측 정확도를 제출하는 사람이 많아지고 있습니다. 캐글에 공개한
Discussion, Notebooks을 계속해서 살펴보고 꾸준히 노력하여 더 나은 모델을 만들다 보면 메
달권에 입성할 수 있습니다.
028