독립성 카이제곱 검정(Chi-Square Test of Independence)은 두 변수 간에 유의미한 상관성이 있는지 없는지 결정할 때 사용한다.
이번 포스팅은 엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence)을 시행한다.
예시: 엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence)하기
성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다.
차례차례 단계별로 독립성 카이제곱 검정(Chi-Square Test of Independence)을 시행해서, 성별과 정치성향에 상관관계를 파악해보자.
1단계: 가정 설정한다.
독립성 카이제곱 검정(Chi-Square Test of Independence)을 하기 위해서 가설을 설정한다.
- H0: 성별과 정치성향은 관계없다(독립적이다.)
- H1: 성별과 정치성향은 관계있다.(독립적이지 않다.)
2단계: 예상치 구하기
분할표(contingency table)에 아래에 공식을 이용해서 각 셀에 예상치(expexted value)를 구한다. 예상치 = (행의 합 * 열의 합) / 테이블 합.
예를 들어, 남자이면서 보수 지지자들에 예상치는 (230*250)/500 = 115
위 과정을 반복해서 예상치 분할표(contingency table) 칸을 채운다.
3단계: 각 셀마다 (O-E) ²/E 값을 구한다.
다음으로 각 셀마다 (O-E)2 / E 구한다.
- O: 관측치
- E: 예상치
예를들어, 남성이면서 보수성향이 사람의 값은 (120-115) ²/115 = 0.2174
위 과정을 반복해서 예상치 분할표(contingency table) 칸을 채운다.
4단계: 검정 통계량 X²값을 구한다. 그리고 검정 통계량에 상응하는 p-값(p-value)을 구한다.
검정 통계량 X²값은 마지막으로 만든 테이블에 값들에 합으로 구한다.
검정 통계량 X²에 상응하는 p-값(p-value)은 엑셀에 =CHISQ.DIST.RT(x, deg_freedom) 내장 함수로 구한다.
=CHISQ.DIST.RT(x, deg_freedom)
- x: 검정 통계량 X²
- deg_freedom: 자유도(#행-1) * (#열-1)
검정 통계량 X²은 0.8640, 상응하는 p-값(p-value)은 0.649198이다.5단계: 검정량을 해석한다.p-값(p-value)은 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.
※ 카이제곱 검정(Chi-Square Test) 관련 포스팅
엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test) 하기
'Excel_데이터 > Chi-Square Tests' 카테고리의 다른 글
엑셀에서 크래머 V 계수(Cramer's V) 구하기 (0) | 2021.04.30 |
---|---|
엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기 (0) | 2021.04.29 |
엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기 (1) | 2021.04.27 |