Excel_데이터/Chi-Square Tests

엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기

palefaceman 2021. 4. 29. 15:20

피셔 정확 검정(Fisher's Exact Test)은 두 분류의 변수간 유의미한 상관성이 있는지 판별하는 데 사용한다. 

 

피셔 정확 검정(Fisher's Exact Test)은 카이제곱 독립성 검정(Chi-Square Test of Independence)의 대체 방법으로 하나 이상의 셀에 관측수가 5 이하 일 때 사용한다.

 

엑셀에서 피셔 정확 검정(Fisher's Exact Test)을 시행 해본다.

예시: 엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기

성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다.

성별과 정치성향의 두 분류가 서로 유의미한 상관성이 있는지 검정하기 위해서 피셔 정확 검정(Fisher's Exact Test) 시행한다.

 

=HYPGEOM.DIST(sample_s, number_sample, population_s, number_pop, cumulative)

  • sample_s = 표본에서 관측수
  • number_sample = 표본의 크기
  • population_s = 모집단(총계)에서 관측수
  • number_pop = 모집단(총계)의 크기
  • cumulative = TRUE: CDF, 누적 분포 함수, FALSE: PMF, 확률 함수, 여기에서는 목적에 맞게 'TRUE'값을 사용한다.

함수에 상수를 입력하기 위해서, 4개의 셀에서 하나의 셀만 선택한다. 하지만 총계의 값들은 상응하는 동일한 값을 사용한다.

 

이제 엑셀에서 구해본다.=HYPGEOM.DIST(4개 중 1셀 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)

단측(one-tailed)의 p-값(p-value)은 0.0812

 

p-값(p-value)이 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.

 

양측(two-taied) p-값(p-value)도 찾을 수 있다.

 

우선, 관심 있는 관측값을 선택하고 확률을 구한다.=HYPGEOM.DIST(4개 중 1셀 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)그리고, 1 - 관심 있는 관측값(전체 확률 - 아닐 확률)을 구하고 두 값을 합한다.=1- HYPGEOM.DIST(정해진 셀에 같은 열에셀 값 외에 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)

양측(two-tailed)의 p-값(p-value)은0.11524

 

p-값(p-value)이 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.

 

※ 카이제곱 검정(Chi-Square Test) 관련 포스팅

엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test) 하기

엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기

에서 래머 V 계수(Cramer’s V) 하기