Page 29 -
P. 29

(predictive distribution)를 생각해야 한다. 최대가능도 추정일 때의 예측분포는 데이터 Y에서 추정된
                               ̂
                                                                                         ̂
                    매개변수 값 θ을 확률 모델 p(у|θ)에 대입해서 구했다. 수식으로 쓰면 p pred  (у|Y) 5 p(у|θ)이다.
                                                    ̂
                                                                                   у 21.4
                    이번 예제라면 가능도를 최대로 하는 θ는 θ 5 1.4이므로 Poisson(у|θ 5 1.4) 5 1.4   e     / у!이 예
                    측분포가 된다. 예를 들어 10분 동안 별똥별 1개를 셀 확률은 у에 1을 대입하면 약 0.35가 된다.                        2
                    한편 베이즈 추정의 예측분포는 구한 매개변수의 사후분포 p(θ|Y)를 가중치로 한 확률 모델
                    p(у|θ)를 전부 더한 것이 된다. 수식으로 쓰면 다음과 같다.                                              베이즈 추정 복습






                    여기서 MCMC를 사용한 경우 p(θ|Y)는 MCMC 표본으로 구할 수 있다. 그리고 확률 모델
                    p(у|θ)는 이미 알고 있는 수식이므로 θ의 적분을 MCMC 표본의 합으로 치환해 계산하면 예측

                    분포를 구할 수 있다. 또는 좀 더 간단히 “p(θ|Y)에서 추출한 MCMC 표본에서 값을 1개 선택하
                    고 그 값을 θ 로 확률 모델 p(у|θ )(이번 예제에서는 Poisson(у|θ ))를 따르는 난수 у 를 반복해
                                                                       †
                                                                                      †
                              †
                                              †
                    서 생성한다.”이다. 이 у 를 모은 것은 예측분포 p pred  (у|Y)에서 추출한 MCMC 표본이라 볼 수
                                       †
                    있다. 더 나아가 MCMC 표본에서 예측분포를 간단히 구할 수 있다. 이렇게 베이즈 추정으로 구
                    한 예측분포에서 계산한 예측 구간을 베이즈 예측 구간(Bayesian prediction interval)이라고 부른다.
                    베이즈 신뢰 구간과 마찬가지로 예측분포의 양 끝에서 α / 2%에 해당하는 면적을 잘라내고 남은
                    (1 2 α)%의 가운데 부분에 대응하는 구간을 (1 2 α)% 베이즈 예측 구간이라 부른다.

                    모델이 단순하고 데이터도 충분히 있는 경우에는 가능도함수가 (다변량)정규분포로 충분히 잘 근
                    사되어 최대가능도 추정으로 구한 예측분포와 베이즈 추정으로 구한 예측분포는 거의 차이가 없
                    다. 하지만 일반적으로 많은 수의 복잡한 모델은 가능도함수가 (다변량)정규분포로 잘 근사되지

                    않아 예측분포가 일치하지 않는다. 최대가능도 추정으로 구한 예측분포는 얻어진 데이터에 지나
                    치게 맞춰지는 경향(과학습)이 있다.

                    사후분포가 아니라 사전분포 p(θ)에 가중치를 주어서 더한 예측분포





                    는 사전에 있다는 것을 강조해 사전예측분포라고 부른다. 여기서는 데이터가 없음을 명확히 하기

                    위해 p pred  (у| .)이라 표기하였다. 모델이 정해져 있는 경우에 모델이 어떤 성질을 가지는지 알려면
                    시뮬레이션으로 사전예측분포를 구해 보면 좋다. 또한, 사전예측분포에서 베이즈 사전예측 구간
                    을 계산할 수도 있다.

                    여기까지 읽은 독자 중에서는 “모처럼 분포를 구했는데 왜 베이즈 신뢰 구간(이나 베이즈 예측 구

                                                                                                  041







     1데이터분석을위한베이지안통계모델링.indd   41                                                            2019. 3. 14.   오후 8:32
   24   25   26   27   28   29   30   31