Page 10 -
P. 10
게 만족하는 여행 일정표를 받는 날이 머잖아 오지 않을까?
두말할 것도 없이 이런 추천 엔진에는 수많은 수학이 정교하게 들
어가 있다. 그렇다고 수학 공포증이 있는 독자들이 지레 겁먹을 필요
는 없다. 여러분이 알아야 할 핵심 개념은 한 가지뿐이기 때문이다. 바
로 추천 엔진에서 ‘개인화’는 ‘조건부확률’을 의미한다는 사실이다.
수학에서 조건부확률이란 어떤 사건이 이미 일어났을 때 다른 사
건이 일어날 확률이다. 좋은 예가 일기예보다. 오늘 아침에 창밖을 보
니 구름이 모이고 있다면, 여러분은 비가 올 것 같으니 출근할 때 우산
을 들고 나가자고 생각할 것이다. 이런 판단을 조건부확률로 표현하
면 다음과 같다. ‘오늘 아침에 구름이 끼었다면 오후에 비가 올 조건
부확률은 60퍼센트다.’ 데이터 과학자들은 다음과 같이 조금 더 간결
하게 표현한다.
P(오후 비 | 아침 구름) = 60%
P는 ‘확률’을 뜻하며, 수직 막대 기호 | 는 ‘~한다면’ 또는 ‘~라는 조
건으로’라는 뜻이다. 막대 왼쪽은 우리의 관심사이고, 막대 오른쪽은
‘우리가 알고 있는 지식’, 즉 우리가 사실이라고 믿거나 가정하는 ‘조
건이 되는 사건’이다. AI는 이 조건부확률을 다음과 같이 활용한다.
• 당신은 영화 <셜록 홈스Sherlock Holmes>에 높은 점수를 줬다. 당신
이 <이미테이션 게임 The Imitation Game>이나 <팅커 테일러 솔저 스
파이 Tinker Tailor Soldier Spy>를 좋아할 조건부확률은 얼마인가?
I.넷플릭스가취향을읽는법|23