Excel_데이터/Chi-Square Tests

엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기

palefaceman 2021. 4. 27. 16:38

카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)은 주어진 데이터 분포가 예상되는 분포에 따르는지/아닌지 검증할 때 사용한다.

 

이번 포스팅에서 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 실행해본다.

 

예시: 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기

한 PC방 주인이 매주 똑같은 수에 손님이 온다고 했다. 이 가정을 검정해보자. 일주일간 온 손님 수를 관찰했다.

50 60 40 47 53

단계별로 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 통해서 PC방 주인의 말이 타당한지 판단해본다.

1단계: 데이터 입력

'매주 같은 수에 고객이 온다.' 라는 가정을 검증한다. 관측치는 5일 중에 250명이 왔다. 매일 50명이 온다면, 매주 똑같이 250명이 온다. 예측치는 50, 관측치는 관측된 값을 요일별로 입력한다.

2단계: 관측값과 예상값에 차이를 구한다. 

카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)의 통계량은 아래 식으로 구한다.

 X²= Σ(O-E)^2 / E

  • Σ: 합
  • O: 관찰 값
  • E: 예상치

 

엑셀에서 (O-E)2 / E 입력해서 검정 통계량(test statistiscs)을 구한다.

3단계: 카이제곱 적합도 검정(Chi-Square  Test)의 통계량을 구하고, 상응하는 p-값(p-value) 구한다.

Goodness-of-fit

마지막으로 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)의 통계량을 구한다. 그리고 그에 상응하는 p-값(p-value)을 구한다. 

=CHISQ.DIST.RT(X², df)는 카이제곱 분포(Chi-Square distribution)의 오른쪽 꼬리 확률 값을 반환한다. 입력 상수 X² 는 구해진 검정 통계량, 자유도(df)는 관측수-1이다.

4단계: 결과 해석하기

X²은 4.36이다. 그리고 그에 상응하는 p-값(p-value)은 0.3595다. 이 p-값(p-value)은 0.05보다 크지 않기 때문에 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 관측치는 예상치와 다르다고 할만한 충분한 근거가 없다. 결과적으로 PC방 사장이 말한 매주 같은 수에 손님이 온다는 말은 틀린 말이라고 할 수 없다.

 

 

※ 카이제곱 검정(Chi-Square Test) 관련 포스팅

엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기

엑셀에서 피셔 정확 검정(Fisher’s Exact Test) 하기

에서 래머 V 계수(Cramer’s V) 하기