1st ed.

[확률과 통계] 39. 연속확률분포(3) - 표준 정규 분포, Standard Normal Distribution

프로필

2016. 10. 21. 5:20

이웃추가

이전 포스팅에서 '정규 분포'에 대해 알아봤습니다. 확률통계학에서 매우매우 중요한 확률분포입니다.



정규 분포를 보여주는 그래프인 정규 곡선은 평균 μ 을 중심으로 좌우 대칭입니다. 두 개의 정규곡선을 생각해 볼까요? 다음 그림과 같은 두 정규곡선 A, B가 있다고 해봅시다.



평균과 표준편차가 다른 A, B의 두 정규분포가 있습니다. 두 정규분포 모두 구하고자 하는 확률의 범위는 (x1 < X < x2) 로 같지만, A 정규분포와 B정규분포에서의 두 확률 P(x1 < X < x2)은 서로 분명히 다릅니다. 만약 확률변수 (x1 < X < x2) 에서의 분포 A와 B의 확률을 비교하려고 한다면, 그냥 무턱대고 두 확률을 비교할 수 없습니다. 왜냐하면 A와 B는 평균과 표준편차가 다르기 때문에 애초에 비교대상이 될 수 없는 것이죠. 따라서 두 A, B 정규분포의 확률을 비교하고자 한다면, 평균과 표준편차를 일치시켜야 합니다. 새로운 확률변수 Z를 도입해서 A와 B의 확률을 비교해야 하는 것이죠. 정규분포는 평균 μ 를 중심으로 좌우대칭이기 때문에 A, B 두 정규분포의 평균을 0으로 맞추고, 표준편차를 1로 일치시킨다면 서로의 확률을 비교할 수 있습니다. 이렇게 새로운 변수 Z를 도입해서 평균 0, 표준편차를 1 을 갖는 정규분포'표준정규분포(standard normal distribution)' 라고 합니다.



표준정규분포는 평균 0, 표준편차 1을 가지므로 다음과 같은 확률밀도함수를 가집니다.



그럼 정규분포의 확률변수 X에서 새로운 확률변수인 표준정규분포의 확률변수 Z로 변환하는 방법을 알아야겠죠. 정규분포의 확률변수 X를 표준정규분포의 확률변수 Z로 변환하는 과정을 '표준화 혹은 정규화(normalization)' 라고 합니다.




원래 평균 μ, 표준편차 σ 를 갖는 정규분포에서 표준화 과정을 거친 표준정규분포의 모습은 아래 그림에 잘 나와 있습니다.


그리고 표준정규분포의 누적분포함수는 다음과 같습니다. 이 누적분포함수는 표준정규분포 문제를 풀 때 꼭 사용하기 때문에 반드시 알아두셔야 합니다.



이 누적분포함수를 그림으로 나타내면 다음과 같습니다.


 

 

만약 위 그림에서 z의 오른쪽 영역의 확률을 구하고 싶으면 전체확률 1에서 Φ(z) 을 빼면 됩니다. 즉


 


간단한 문제 하나 풀어봅시다.



 


정규분포 문제를 풀려면 누적분포함수 Φ(z)를 해결해야 합니다. 정규분포는 연속확률변수이므로 적분을 해결해야 하는 것이죠. 하지만 이 과정이 만만치 않기 때문에 수학자들이 번거로움을 덜어주기 위해 '표준정규분포표'를 이미 만들어놨습니다! 표준정규분포표를 읽는 법은 이미 교과서 및 인터넷에 많이 나와있으니 여기서 따로 언급하지는 않겠습니다. 그럼 문제를 계속 풀어보죠.


 


확률과 통계 30번 포스팅 '이항분포'는 이산 확률변수의 확률분포입니다. 하지만 이항분포의 n이 충분히 크다면, 이항분포는 정규분포에 근사합니다.


 


아래는 이산 확률변수 X에서 n이 증가할 수록 정규분포에 근사되는 것을 보여주는 그림입니다.


존이
존이 교육·학문

Advancement through Engineering & Technologies, 공학과 기술로 더 나은 세상을 위해