표본 분포(sampling distribution)는 모집단으로부터 추출된 n개의 표본(sample)들의 통계 값을 나타내는 것이다.
엑셀에서 어떻게 표본 분포(sampling distrubtion)를 구하는지 실습해본다.
- 데이터 추출
- 시각화하기
- 표본 데이터의 평균, 표준편차 구하기
- 확률 구하기
데이터 추출
=NORM.INV(RAND(), 5.3, 9)
=NORM.INV(RAND(), 5.3, 9)을 사용해서 평균 5.3, 표준편차 9인 정규분포 모집단(population) 임의의 데이터를 추출해온다. 표본의 크기는 20, 추출 표본의 개수는 1000개로 한다.
이제 각셀에 평균을 구한다.
표본의 평균의 평균과 표준편차를 구한다.
표본 평균의 평균 5.424
표본 평균의 표준편차 2.0147
표준편차는 모집단 표준편차/sqrt(표본크기)로도 구할 수 있다.
모집단 표준편차 9, 표본 크기 20에서 표본들의 표준편차를 구해보면 2.0124로 앞에서 구한 2.0147과 매우 근접한다.
평균도 첨에 지정한 모집단의 평균 5와 5.424로 근접하고 있다.
시각화
표본의 평균 열을 선택하고,
삽입 > 차트 > 히스토그램을 클릭하면 이렇게 아름다운 분포도가 나온다.
그림에서 보듯이 5 부근에서 가장 많은 분포를 보이는 종모양(bell-shaped)된 정규분포에 근접한 히스토그램이다. 또한, 임의로 추출한 표본의 평균이 10과 11, -0.2, -0.9에서도 나오고 있음을 확인할 수 있다.
확률 구하기
지금까지 구한 통계값을 바탕으로 특정 값에 표본 평균이 나올 확률도 구할 수 있다.
=COUNTIF(U2:U1001, "<=6")/COUNT(U2:U1001)
표본 평균이 6보다 작거나 같을 확률은 0.626이다.
=NORM.DIST(x,mean,stdev,true) 함수로도 구할 수 있다.
- x: 구하고자 하는 값
- mean: 표본의 평균
- stdev: 표본의 표준편차
그렇게 하면 0.6126로 0.626과 근사하게 나온다.
'Excel_데이터 > 확률분포' 카테고리의 다른 글
엑셀에서 카이제곱통계량(Chi-Square Statistic) p-value 구하기 (0) | 2021.03.27 |
---|---|
엑셀에서 p-value구하기 (0) | 2021.03.27 |
엑셀에서 z-점수(z-socre)구하기 (0) | 2021.03.26 |
엑셀에서 중심극한정리(Central Limit Theorem) 구하기 (0) | 2021.03.25 |
엑셀에서 체비셰프 가정(Chebyshev's Theorem) 적용하기 (0) | 2021.03.19 |