카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)은 주어진 데이터 분포가 예상되는 분포에 따르는지/아닌지 검증할 때 사용한다.
이번 포스팅에서 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 실행해본다.
예시: 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기
한 PC방 주인이 매주 똑같은 수에 손님이 온다고 했다. 이 가정을 검정해보자. 일주일간 온 손님 수를 관찰했다.
월 | 화 | 수 | 목 | 금 |
50 | 60 | 40 | 47 | 53 |
단계별로 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 통해서 PC방 주인의 말이 타당한지 판단해본다.
1단계: 데이터 입력
'매주 같은 수에 고객이 온다.' 라는 가정을 검증한다. 관측치는 5일 중에 250명이 왔다. 매일 50명이 온다면, 매주 똑같이 250명이 온다. 예측치는 50, 관측치는 관측된 값을 요일별로 입력한다.
2단계: 관측값과 예상값에 차이를 구한다.
카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)의 통계량은 아래 식으로 구한다.
X²= Σ(O-E)^2 / E
- Σ: 합
- O: 관찰 값
- E: 예상치
엑셀에서 (O-E)2 / E 입력해서 검정 통계량(test statistiscs)을 구한다.
3단계: 카이제곱 적합도 검정(Chi-Square Test)의 통계량을 구하고, 상응하는 p-값(p-value) 구한다.
Goodness-of-fit
마지막으로 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)의 통계량을 구한다. 그리고 그에 상응하는 p-값(p-value)을 구한다.
=CHISQ.DIST.RT(X², df)는 카이제곱 분포(Chi-Square distribution)의 오른쪽 꼬리 확률 값을 반환한다. 입력 상수 X² 는 구해진 검정 통계량, 자유도(df)는 관측수-1이다.
4단계: 결과 해석하기
X²은 4.36이다. 그리고 그에 상응하는 p-값(p-value)은 0.3595다. 이 p-값(p-value)은 0.05보다 크지 않기 때문에 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 관측치는 예상치와 다르다고 할만한 충분한 근거가 없다. 결과적으로 PC방 사장이 말한 매주 같은 수에 손님이 온다는 말은 틀린 말이라고 할 수 없다.
※ 카이제곱 검정(Chi-Square Test) 관련 포스팅
엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기
엑셀에서 피셔 정확 검정(Fisher’s Exact Test) 하기
'Excel_데이터 > Chi-Square Tests' 카테고리의 다른 글
엑셀에서 크래머 V 계수(Cramer's V) 구하기 (0) | 2021.04.30 |
---|---|
엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기 (0) | 2021.04.29 |
엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기 (1) | 2021.04.28 |