Excel_데이터/Chi-Square Tests

엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기

palefaceman 2021. 4. 28. 17:19

독립성 카이제곱  검정(Chi-Square Test of Independence)은 두 변수 간에 유의미한 상관성이 있는지 없는지 결정할 때 사용한다. 

 

이번 포스팅은 엑셀에서 독립성 카이제곱  검정(Chi-Square Test of Independence)을 시행한다.

예시: 엑셀에서 독립성 카이제곱  검정(Chi-Square Test of Independence)하기

성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다.

차례차례 단계별로 독립성 카이제곱  검정(Chi-Square Test of Independence)을 시행해서, 성별과 정치성향에 상관관계를 파악해보자.

1단계: 가정 설정한다.

독립성 카이제곱  검정(Chi-Square Test of Independence)을 하기 위해서 가설을 설정한다.

  • H0: 성별과 정치성향은 관계없다(독립적이다.)
  • H1: 성별과 정치성향은 관계있다.(독립적이지 않다.)

2단계: 예상치 구하기

분할표(contingency table)에 아래에 공식을 이용해서 각 셀에 예상치(expexted value)를 구한다. 예상치 = (행의 합 * 열의 합) / 테이블 합.

 

예를 들어, 남자이면서 보수 지지자들에 예상치는 (230*250)/500 = 115

 

위 과정을 반복해서 예상치 분할표(contingency table) 칸을 채운다.

3단계: 각 셀마다 (O-E) ²/E 값을 구한다.

다음으로 각 셀마다 (O-E)2 / E 구한다.

  • O: 관측치
  • E: 예상치

 

예를들어, 남성이면서 보수성향이 사람의 값은 (120-115) ²/115 = 0.2174

 

위 과정을 반복해서 예상치 분할표(contingency table) 칸을 채운다.

4단계: 검정 통계량 X²값을 구한다. 그리고 검정 통계량에 상응하는 p-값(p-value)을 구한다.

검정 통계량 X²값은 마지막으로 만든 테이블에 값들에 합으로 구한다. 

 

검정 통계량 X²에 상응하는 p-값(p-value)은 엑셀에 =CHISQ.DIST.RT(x, deg_freedom) 내장 함수로 구한다.

 

=CHISQ.DIST.RT(x, deg_freedom)

  • x: 검정 통계량 X²
  • deg_freedom: 자유도(#행-1) * (#열-1)

 

검정 통계량 X²은 0.8640, 상응하는 p-값(p-value)은 0.649198이다.5단계: 검정량을 해석한다.p-값(p-value)은 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.

 

 

※ 카이제곱 검정(Chi-Square Test) 관련 포스팅

엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test) 하기

엑셀에서 피셔 정확 검정(Fisher’s Exact Test) 하기

에서 래머 V 계수(Cramer’s V) 하기