Page 22 -
P. 22

●   벡터와 행렬 기호
                    이 책에서는 벡터와 행렬을 쉽게 알아볼 수 있게 벡터는 화살표를 붙여서 x와 같이 표기하
                    고, 행렬은 대문자 굵은체 X와 같이 표기한다. 단순히 벡터라 썼을 때는 열벡터를 가리킨

                    다. 지면 관계상 행벡터에 전치 기호 T를 사용해서 열벡터로 표기하는 경우도 있다. 예를
                    들어 다음과 같이 표기한다.








                 ●   첨자와 [ ]

                    첨자는 두 종류가 있다. 하나는 σ Y (Y의 σ(표준편차)라는 뜻)와 같이 변수의 내용을 나타내
                    는 경우다. 다른 하나는 벡터나 배열의 성분을 나타내는 경우다. 예를 들어 벡터 θ의 k번째
                    성분을 나타낼 때는 θ k 라 표기한다. 벡터나 배열의 성분을 쉽게 알아보기 위해 [ ]를 사용해
                    서 θ k 라는 뜻으로 θ[k]라 표기할 때도 있다. 마찬가지로 θ n, k 라는 뜻으로 θ[n, k]라 표기할
                    때도 있다. 또한, Y [3]이라는 표기는 Y의 3번째 성분이 벡터임을 나타낸다.





               2.2        전통적인 통계학의 문제점
                                                            MODELING WITH ST AN







               전통적인 통계학에서 매개변수 θ는 어느 한 점에서 참값을 가지는 상수로 생각한다. 따라서 실제
               로 사용할 때 문제가 발생한다. 예를 들어 보자.


                 ●   검정 해석이 직관적이지 않다.
                     가설 H가 맞다고 했을 때 데이터 Y나 그보다 극단적인 데이터가 얻어질 확률(예를 들어
                    p(у ≥ Y|H))을 p값이라 부르며 검정에 사용하는데, 이 p값은 유의수준과 비교하는 데 사
                    용되는 값이므로 값의 의미가 직관적이지 않고 해석이 어렵다. 이와 비교해 베이즈 통계에
                    서는 데이터를 얻었을 때 가설 H가 맞는지 틀린지의 확률 p(H|Y)를 구할 수 있어서 해석
                    이 쉽다.

                 ●   신뢰 구간 해석이 직관적이지 않다.

                     매개변수 θ는 상수이므로 “θ값이 구간 [a, b]에 있을 확률은 95%다.”라고 말할 수 없다. “데

         034







     1데이터분석을위한베이지안통계모델링.indd   34                                                            2019. 3. 14.   오후 8:32
   17   18   19   20   21   22   23   24   25   26   27