Page 23 -
P. 23

이터를 다시 받아서 분석했을 때 ‘θ값이 구간 [a, b]에 있다’고 말하면 95% 정도는 맞을 것이
                         다.”라고 해석할 수밖에 없다.

                       ●   복잡한 모델의 신뢰 구간과 예측 구간 계산이 어렵다.
                         복잡한 모델에 포함된 매개변수의 신뢰 구간과 예측 구간을 구하기는 이론적으로 어렵고 수                             2
                         식도 난해하다. 그렇지만 분포(또는 폭)를 고려하는 것은 결과를 해석해 다음에 취할 행동을
                         결정할 때 매우 중요하다. 예를 들어 내년 이익을 예측할 때 ‘100억원’이라고만 하면 불충분                         베이즈 추정 복습
                         하다. 그 예측 폭이 ‘100억원 6 10억원’인지 ‘100억원 6 1,000억원’인지에 따라 차이가 큼
                         을 알 수 있다.


                    또한, 전통적인 통계학에서는 최대가능도 추정을 주로 사용하는데 이 방법에서 발생하는 문제점
                    도 있다. 다음 절에서 알아보자.






                    2.3         가능도와 최대가능도                       MODELING WITH ST AN







                    예를 들어 표준편차가 1인 정규분포에서 추출한 독립인 데이터 20개가 있다고 하자(그림 2-1 왼
                    쪽). 다음으로 A에게 표준편차가 1인 정규분포를 그린 투명한 판(그림 2-1 가운데)을 주고 “이 판

                    아래쪽을 그림 2-1 왼쪽의 가로축에 맞추고 가로축을 따라 판을 좌우로 움직이세요. 판에 그려진
                    정규분포로부터 데이터가 만들어졌다고 생각하고 가장 잘 맞는다고 생각하는 위치로 옮기세요.”
                    라고 부탁한다. A는 어느 위치에 판을 옮겨 놓을까? 자신을 A라고 생각해 보자.

                    이 질문에 답하려면 ‘잘 맞는다’의 척도가 되는 값을 정해야 한다. 여기서 A는 각 데이터 위치에
                    해당하는 정규분포 세로축 값의 곱을 L이라 하고, 이 값이 최대가 되게 옮겼다. 이 L을 가능도
                    (likelihood)라고 한다. 잘 맞는 정도를 나타내는 지표 중 하나다.

                    앞 문제를 수식화해 보자. 먼저 “얻은 데이터 Y[n](n 5 1,…, 20)은 평균이 μ고 표준편차가 1인
                    정규분포 Normal(μ, 1)로부터 확률적으로 생성되었다.” 또는 같은 의미로 “Y[n](n 5 1,…, 20)

                    은 Normal(μ, 1)을 따른다.”고 하자. 이렇게 따를 것이라 생각한 확률분포가 확률 모델이다. 그
                                                20
                    러면 가능도는 μ의 함수 L(μ) 5 Π n51   Normal(Y[n]|μ, 1)이 된다(그림 2-1 오른쪽). 추정해야
                    할 매개변수는 μ가 된다. 다음으로 “가로축에 맞춰 판을 좌우로 움직여서 가장 잘 맞는 위치로 옮
                    겨 놓는다.”는 “μ를 옮겨가며 가능도가 가장 커지는 지점이 우리가 원하는 μ값이다.”에 해당한다.


                                                                                                  035







     1데이터분석을위한베이지안통계모델링.indd   35                                                            2019. 3. 14.   오후 8:32
   18   19   20   21   22   23   24   25   26   27   28