Page 30 -
P. 30
간)이라는 두 수로 정보를 줄일까?”라고 의문을 갖는 분도 있을지도 모르겠다. 그 이유는 매개변
수 수가 많은 경우에 고차원 사후분포를 시각화해서 특징을 이해하기가 어렵기 때문이다. 분포에
서 베이즈 신뢰 구간을 계산함으로써 분포의 특징을 한눈에 파악하는 게 가능해진다. 예를 들어
시계열 데이터를 분석하는 경우에는 각 시각의 사후분포를 그대로 시각화하는 것이 아니라 각 시
각의 베이즈 신뢰 구간을 시각화함으로써 사후분포의 시간적인 추이를 한눈에 파악할 수 있다. 물
론 매개변수 수가 적은 경우에는 매개변수의 사후분포를 그대로 보는 것이 좋다.
2.6 최대가능도 추정과 베이즈 추정의 관계
MODELING WITH ST AN
∗
사후분포 p(θ|Y)값이 최대가 되는 점 θ 를 사후확률 최대 추정 값(maximum a posteriori estimate)이
라 부른다. 줄여서 MAP 추정 값(MAP estimate)이라 부를 때도 있다. 여기서 사전분포 p(θ)로 충분
히 폭이 넓은 균일분포나 충분히 편평한 정규분포를 사용한다고 하자. 이런 사전분포를 무정보 사
전분포(noninformative prior)라고 부른다. p(θ)는 넓은 범위에서 상수로 볼 수 있으므로 MAP 추정
값 θ 에 대해
∗
가 성립된다. 여기서 arg max f (θ)는 f(θ)값이 최대가 되는 θ를 반환한다. 마지막으로 p(Y|θ)는
θ
가능도이므로 θ 는 최대가능도 추정 값과 일치함을 알 수 있다. 무정보 사전분포를 사용해서 얻은
∗
결과는 최대가능도 추정을 사용한 전통적인 통계학과 정합성이 있다고 말할 수 있다.
2.7 이 책의 사전분포 선택 방법
MODELING WITH ST AN
앞 절까지 설명했듯이 베이즈 통계와 MCMC의 조합은 다루기 쉽고 해석도 쉽지만, 문제도 있다.
그중 한 가지는 2.4절에서 이야기했던 MCMC의 수렴 문제다. 수렴하지 않을 경우에 모델을 어떻
042
1데이터분석을위한베이지안통계모델링.indd 42 2019. 3. 14. 오후 8:32