Excel_데이터/확률분포

엑셀에서 중심극한정리(Central Limit Theorem) 구하기

palefaceman 2021. 3. 25. 17:53

중심 극한 정리(Central Limit Theorem)는 표본의 크기(n)이 충분히 크다면 표본의 분포가 정규화(normalization)된다는 가정이다. 심지어 모집단(population)이 정규분포(normal distribution)를 취하지 않더라도, 채취한 표본은 정규화(normalization) 된다.

 

중심 극한 정리(central limit theorem)는 또한 이와 같은 뜻을 가진다.

1. 표본의 평균은 모집단의 평균과 같다.

x = μ

2. 표본의 표준편차는 모집단의 표준편차에 표본의 크기로 나눈 값과 같다.

s = σ / √n

어떻게 엑셀에서 구하는지 알아본다.

중심 극한 정리(central limit theorem) 엑셀에서 구하기

어느 모집단 평균8, 표준편차 4를 가진다.

여기서 포본의 평균과, 표준편차를 구한다.

표본 평균은 모집단의 평균과 같다. 8

표본 표준편차는 모집단의 표준편차에서 표본크기 제곱근을 나눈 값과 같다. 1.0328

 

중심극한정리(central limit theorem)로 확률 문제도 풀어볼 수 있다.

예를 들어. 평균 8, 표준편차 4인 모집단의 표본 크기가 15일 때 표본의 평균이 7보다 작거나 같을 확률을 구할 수 있다. 

그리고 여기에서, 7보다 클 확률 또한 구할 수 있다.

 

NORM.DIST() 엑셀 내장 함수를 이용한다.

 

NORM.DIST(x, mean, standard_dev, cumulative)

  • x: 알고 싶은 표본 평균
  • mean: 기대하는 평균
  • standard_dev: 기대하는 표본 표준편차
  • cumulative: 누적 분포 함수라면 TRUE, 확률 밀도 함수라면 FALSE를 적는다. 

평균 8, 표준편차 4인 모집단에서 표본 15개를 추출하면 평균이 7 이하일 확률은 0.16646이다.

7을 초과할 확률은 0.83354이다.

 

또한 주어진 범위에서 표본 평균이 결정될 확률도 구할 수 있다.

7~9사이에 15개의 크기에 표본의 평균이 분포할 확률은 0.667이다.