Page 30 -
P. 30

간)이라는 두 수로 정보를 줄일까?”라고 의문을 갖는 분도 있을지도 모르겠다. 그 이유는 매개변
               수 수가 많은 경우에 고차원 사후분포를 시각화해서 특징을 이해하기가 어렵기 때문이다. 분포에
               서 베이즈 신뢰 구간을 계산함으로써 분포의 특징을 한눈에 파악하는 게 가능해진다. 예를 들어

               시계열 데이터를 분석하는 경우에는 각 시각의 사후분포를 그대로 시각화하는 것이 아니라 각 시
               각의 베이즈 신뢰 구간을 시각화함으로써 사후분포의 시간적인 추이를 한눈에 파악할 수 있다. 물
               론 매개변수 수가 적은 경우에는 매개변수의 사후분포를 그대로 보는 것이 좋다.






               2.6        최대가능도 추정과 베이즈 추정의 관계
                                                            MODELING WITH ST AN






                                             ∗
               사후분포 p(θ|Y)값이 최대가 되는 점 θ 를 사후확률 최대 추정 값(maximum a posteriori estimate)이
               라 부른다. 줄여서 MAP 추정 값(MAP estimate)이라 부를 때도 있다. 여기서 사전분포 p(θ)로 충분

               히 폭이 넓은 균일분포나 충분히 편평한 정규분포를 사용한다고 하자. 이런 사전분포를 무정보 사
               전분포(noninformative prior)라고 부른다. p(θ)는 넓은 범위에서 상수로 볼 수 있으므로 MAP 추정
               값 θ 에 대해
                   ∗





               가 성립된다. 여기서 arg max f (θ)는 f(θ)값이 최대가 되는 θ를 반환한다. 마지막으로 p(Y|θ)는
                                   θ
               가능도이므로 θ 는 최대가능도 추정 값과 일치함을 알 수 있다. 무정보 사전분포를 사용해서 얻은
                           ∗
               결과는 최대가능도 추정을 사용한 전통적인 통계학과 정합성이 있다고 말할 수 있다.






               2.7        이 책의 사전분포 선택 방법
                                                            MODELING WITH ST AN







               앞 절까지 설명했듯이 베이즈 통계와 MCMC의 조합은 다루기 쉽고 해석도 쉽지만, 문제도 있다.
               그중 한 가지는 2.4절에서 이야기했던 MCMC의 수렴 문제다. 수렴하지 않을 경우에 모델을 어떻

         042







     1데이터분석을위한베이지안통계모델링.indd   42                                                            2019. 3. 14.   오후 8:32
   25   26   27   28   29   30   31