본문 바로가기
확률과 통계/3. 통계

[모듈식 확률과 통계] 3.통계 (33) 모평균의 신뢰구간

by bigpicture 2019. 11. 19.
반응형

[확률과통계]-[3.통계]-[②통계적 추정]-[(33) 모평균의 신뢰구간]


모평균의 신뢰구간


모집단이 있습니다. 모집단의 평균과 분산은 아래와 같습니다. 



이 모집단에서 표본을 뽑았습니다. 한가지 조건을 설정하겠습니다. 모집단이 정규분포를 따르거나, 중심극한정리가 성립할 만큼 표본이 충분히 큰 상황이라고 해봅시다. 


모집단이 정규분포를 따른다 → 표본평균이 정규분포를 따른다.

표본의 크기가 충분히 크다 → 표본평균이 정규분포를 따른다.


따라서 우리가 뽑은 표본평균은 아래와 같은 정규분포를 따릅니다. 



그래프는 아래와 같습니다. 


만약 우리가 표본을 뽑는다면, 우리가 뽑은 표본의 평균은 위 분포를 따를 것입니다. 매번 뽑을 때마다 위치는 달라지겠지만, 위 분포를 따릅니다. 우리는 우리가 뽑은 표본평균이 속할 확률이 95%가 되는 영역을 아래와 같이 설정할 수 있습니다. 



정규분포의 평균에서 부터 표준편차의 1.96배 떨어져 있다는 것은, 표준정규분포에서 Z가 1.96일 때를 의미합니다. 표준정규분포표를 이용하면 아래 수식이 성립하는 것을 보일 수 있습니다. 




우리가 뽑은 표본에 적용하면 아래와 같습니다. 



이 구간에 우리가 뽑은 표본이 들어갈 확률이 95%라는 의미입니다. 위 식을 변형하겠습니다. 모든 항에 m을 빼줍니다. 




이번에는 모든 항에서 표본평균을 빼줍니다. 



모든 항에 -1을 곱하고 부등호 방향을 바꿔줍니다. 



아래와 같이 자리를 바꿔쓰겠습니다. 



모집단을 중심으로 하는 부등식으로 바뀌었습니다. 변형된 식을 해석해봅시다. 우리가 뽑은 표본평균으로 위와 같은 구간을 만들었을 때, 그 구간 안에 모평균이 들어가는 상황이 95% 확률로 일어납니다. 우리가 표본을 무수히 많이 뽑는다면, 그 표본평균들 중의 95%는 위 식을 만족시킨다는 뜻입니다. 


모평균이 95%의 확률로 위 범위에 들어간다는 의미는 아닙니다. 


1.96을 2.58로 바꿔주면 확률은 99%로 올라갑니다. 



발생 확률이 95%인 아래와 같은 구간을 신뢰도 95%인 모평균 m의 신뢰구간이라고 합니다. 



발생 확률이 99%인 아래와 같은 구간을 신뢰도 99%인 모평균 m의 신뢰구간이라고 합니다. 


반응형

댓글