Excel_데이터/확률분포

엑셀에서 경험 법칙(Empirical Rule) 적용하기.

palefaceman 2021. 3. 30. 21:34

통계에서 경험 법칙(Empirical Rule)68-95-99.7 법칙으로, 정규 분포(normal distribution)에서 적용된다.

  • 68%의 데이터 값들이 1 표준편차 안에 들어간다.
  • 95%의 데이터 값들이 2 표준편차 안에 들어간다.
  • 99.7%의 데이터 값들이 3 표준편차 안에 들어간다.

엑셀에서 경험 법칙(Empirical Rule)을 적용해 본다.

엑셀에서 경험 법칙(Empirical Rule) 적용하기

정규분포(normal distribution)를 가지는 평균이 7, 표준편차가 2.2인 데이터 세트가 있다. 이 데이터에서 68%, 95%, 99.7% 의 범위 값들을 알아본다.

 

  • 68% 데이터는 4.8~9.2 사이에 있다
  • 95% 데이터는 2.6~11.4 사이에 있다.
  • 99.7% 데이터는 0.4~13.6 사이에 있다.

경험 법칙(Empirical Rule)을 적용하기 위해서 단순히 평균과, 표준편차만 변경하면 68%, 95%, 99.7% 데이터 값의 범위가 나온다.

 

평균을 40과 3.75로 변경해본다.

  • 68% 데이터는 36.25~43.75 사이에 있다
  • 95% 데이터는 32.5~47.5 사이에 있다.
  • 99.7% 데이터는 28.75~51.25 사이에 있다.

평균 100과 표준편차 5도 할 수 있다.

  • 68% 데이터는 95~105 사이에 있다
  • 95% 데이터는 90~110 사이에 있다.
  • 99.7% 데이터는 85~115 사이에 있다.

특정 두 값의 범위는 몇 % 안에 들어가는지도 구할 수 있다.

앞서 했던 순서와 반대로, 이번에는 이미 알고 있는 두 값과 그 두 값의 범위는 몇 % 안에 들어가는지도 알 수 있다.

 

평균 100, 표준편차 5인 정규분포(normal distribution)데이터를 알고 있다. 그리고 99와 105는 몇 % 안에 들어 가는지 알고 싶다. 

 

엑셀 내장함수(built-in function) =NORM.DIST()를 이용하여 쉽게 구할 수 있다.

 

NORM.DIST(x, mean, standard_dev, cumulative)

  • x: 데이터 값
  • mean: 데이터 평균
  • standard_dev: 데이터 표준편차
  • cumulative: “TRUE” 연속 분포 함수 반환(CDF, continuous distribution function), or “FALSE” 확률분포 함수 반환(PDF, probability distribution function) – 여기선 TRUE로 연속 분포 함수 반환

NORM.DIST() 함수는 데이터 값의 좌측부터 몇 % 포함하는지 반환하는데, 여기서 사이 값을 구하기 위해서, 두 개의 퍼센트(%)에 차를 했다. 그러면 그 사이 값이 나온다. 그 사이 값이 데이터 99와 105 사이에 퍼센트(%)의 값이다. 즉 99와 105 사이에는 42.1% 데이터가 포함된다.