통계에서 경험 법칙(Empirical Rule)은 68-95-99.7 법칙으로, 정규 분포(normal distribution)에서 적용된다.
- 68%의 데이터 값들이 1 표준편차 안에 들어간다.
- 95%의 데이터 값들이 2 표준편차 안에 들어간다.
- 99.7%의 데이터 값들이 3 표준편차 안에 들어간다.
엑셀에서 경험 법칙(Empirical Rule)을 적용해 본다.
엑셀에서 경험 법칙(Empirical Rule) 적용하기
정규분포(normal distribution)를 가지는 평균이 7, 표준편차가 2.2인 데이터 세트가 있다. 이 데이터에서 68%, 95%, 99.7% 의 범위 값들을 알아본다.
- 68% 데이터는 4.8~9.2 사이에 있다
- 95% 데이터는 2.6~11.4 사이에 있다.
- 99.7% 데이터는 0.4~13.6 사이에 있다.
경험 법칙(Empirical Rule)을 적용하기 위해서 단순히 평균과, 표준편차만 변경하면 68%, 95%, 99.7% 데이터 값의 범위가 나온다.
평균을 40과 3.75로 변경해본다.
- 68% 데이터는 36.25~43.75 사이에 있다
- 95% 데이터는 32.5~47.5 사이에 있다.
- 99.7% 데이터는 28.75~51.25 사이에 있다.
평균 100과 표준편차 5도 할 수 있다.
- 68% 데이터는 95~105 사이에 있다
- 95% 데이터는 90~110 사이에 있다.
- 99.7% 데이터는 85~115 사이에 있다.
특정 두 값의 범위는 몇 % 안에 들어가는지도 구할 수 있다.
앞서 했던 순서와 반대로, 이번에는 이미 알고 있는 두 값과 그 두 값의 범위는 몇 % 안에 들어가는지도 알 수 있다.
평균 100, 표준편차 5인 정규분포(normal distribution)데이터를 알고 있다. 그리고 99와 105는 몇 % 안에 들어 가는지 알고 싶다.
엑셀 내장함수(built-in function) =NORM.DIST()를 이용하여 쉽게 구할 수 있다.
NORM.DIST(x, mean, standard_dev, cumulative)
- x: 데이터 값
- mean: 데이터 평균
- standard_dev: 데이터 표준편차
- cumulative: “TRUE” 연속 분포 함수 반환(CDF, continuous distribution function), or “FALSE” 확률분포 함수 반환(PDF, probability distribution function) – 여기선 TRUE로 연속 분포 함수 반환
NORM.DIST() 함수는 데이터 값의 좌측부터 몇 % 포함하는지 반환하는데, 여기서 사이 값을 구하기 위해서, 두 개의 퍼센트(%)에 차를 했다. 그러면 그 사이 값이 나온다. 그 사이 값이 데이터 99와 105 사이에 퍼센트(%)의 값이다. 즉 99와 105 사이에는 42.1% 데이터가 포함된다.
'Excel_데이터 > 확률분포' 카테고리의 다른 글
엑셀에서 포아송분포(Poisson Distribution) 구하기 (0) | 2021.03.31 |
---|---|
엑셀에서 이항분포(binomial distribution) 구하기 (0) | 2021.03.31 |
엑셀에서 t-분포(t-distribution) 그래프 그리기 (0) | 2021.03.30 |
엑셀에서 z-점수 p-value 구하기 (0) | 2021.03.29 |
액셀에서 백분위수 z-점수(z-score)로 치환하기 (0) | 2021.03.29 |