Page 15 -
P. 15
난이도
12 | 무작위 표본
확률 변수의 독립성
56 Independence of Random Variable
7장에서 자세히 설명한 대로 우리는 가지고 있는 데이터를 모집단에서
추출한 표본으로 간주한다. 무작위 추출로 얻은 표본, 즉 무작위 표본은 이
른바 모집단의 ‘대푯값’이며 모집단의 축소도일 것으로 기대된다. 이 사실
은 무작위 표본을 토대로 모집단에 관해 추측할 때 하나의 근거가 된다.
앞에서 우리는 모집단의 각 개체를 똑같은 확률로 추출하여 얻은 표
본을 무작위 표본 ch-033 으로 정의했다. 유한 모집단일 때는 이 정의만 있으
면 충분하다(30명의 개체로 이루어진 모집단에서 7명을 추출한다고 할 때 각 개체를
7/30의 확률로 추출하면 된다). 그러나 모집단의 개체 수가 무한할 때는 이 정
의로는 잘 풀리지 않는다. 따라서 무한 모집단도 취급할 수 있도록 무작
위 표본의 정의를 일반화할 필요가 있다. 모집단은 확률 분포이므로 확률
개념을 이용해서 정의한다.
그 준비 작업으로 먼저 확률 변수의 독립성을 정의한다. 이 책에서는 이
산 확률 변수 ch-041 로 설명하지만, 연속형 ch-051 도 똑같다. 이산 확률 변수
X와 Y가 서로 독립이라는 것은 X 와 Y 가 얻을 수 있는 모든 값에 대해 다음
식이 성립하는 것이라고 정의한다.
P(X=x 그리고 Y=y)=P(X=x)P(Y=y)
이 정의는 사건의 독립성 정의 ch-040 와 관련이 있다. 두 가지 사건 A와
B가 서로 독립이라는 것은 P(A 그리고 B)=P(A)_P(B)가 성립
한다는 뜻이다. 변수 X와 Y가 독립이라는 것은 두 확률 변수가 얻을 수
155