Page 29 -
P. 29
(predictive distribution)를 생각해야 한다. 최대가능도 추정일 때의 예측분포는 데이터 Y에서 추정된
̂
̂
매개변수 값 θ을 확률 모델 p(у|θ)에 대입해서 구했다. 수식으로 쓰면 p pred (у|Y) 5 p(у|θ)이다.
̂
у 21.4
이번 예제라면 가능도를 최대로 하는 θ는 θ 5 1.4이므로 Poisson(у|θ 5 1.4) 5 1.4 e / у!이 예
측분포가 된다. 예를 들어 10분 동안 별똥별 1개를 셀 확률은 у에 1을 대입하면 약 0.35가 된다. 2
한편 베이즈 추정의 예측분포는 구한 매개변수의 사후분포 p(θ|Y)를 가중치로 한 확률 모델
p(у|θ)를 전부 더한 것이 된다. 수식으로 쓰면 다음과 같다. 베이즈 추정 복습
여기서 MCMC를 사용한 경우 p(θ|Y)는 MCMC 표본으로 구할 수 있다. 그리고 확률 모델
p(у|θ)는 이미 알고 있는 수식이므로 θ의 적분을 MCMC 표본의 합으로 치환해 계산하면 예측
분포를 구할 수 있다. 또는 좀 더 간단히 “p(θ|Y)에서 추출한 MCMC 표본에서 값을 1개 선택하
고 그 값을 θ 로 확률 모델 p(у|θ )(이번 예제에서는 Poisson(у|θ ))를 따르는 난수 у 를 반복해
†
†
†
†
서 생성한다.”이다. 이 у 를 모은 것은 예측분포 p pred (у|Y)에서 추출한 MCMC 표본이라 볼 수
†
있다. 더 나아가 MCMC 표본에서 예측분포를 간단히 구할 수 있다. 이렇게 베이즈 추정으로 구
한 예측분포에서 계산한 예측 구간을 베이즈 예측 구간(Bayesian prediction interval)이라고 부른다.
베이즈 신뢰 구간과 마찬가지로 예측분포의 양 끝에서 α / 2%에 해당하는 면적을 잘라내고 남은
(1 2 α)%의 가운데 부분에 대응하는 구간을 (1 2 α)% 베이즈 예측 구간이라 부른다.
모델이 단순하고 데이터도 충분히 있는 경우에는 가능도함수가 (다변량)정규분포로 충분히 잘 근
사되어 최대가능도 추정으로 구한 예측분포와 베이즈 추정으로 구한 예측분포는 거의 차이가 없
다. 하지만 일반적으로 많은 수의 복잡한 모델은 가능도함수가 (다변량)정규분포로 잘 근사되지
않아 예측분포가 일치하지 않는다. 최대가능도 추정으로 구한 예측분포는 얻어진 데이터에 지나
치게 맞춰지는 경향(과학습)이 있다.
사후분포가 아니라 사전분포 p(θ)에 가중치를 주어서 더한 예측분포
는 사전에 있다는 것을 강조해 사전예측분포라고 부른다. 여기서는 데이터가 없음을 명확히 하기
위해 p pred (у| .)이라 표기하였다. 모델이 정해져 있는 경우에 모델이 어떤 성질을 가지는지 알려면
시뮬레이션으로 사전예측분포를 구해 보면 좋다. 또한, 사전예측분포에서 베이즈 사전예측 구간
을 계산할 수도 있다.
여기까지 읽은 독자 중에서는 “모처럼 분포를 구했는데 왜 베이즈 신뢰 구간(이나 베이즈 예측 구
041
1데이터분석을위한베이지안통계모델링.indd 41 2019. 3. 14. 오후 8:32