Excel_데이터/ANOVA 분석

엑셀에서 tukey-kramer post hoc 검정(tukey-kramer post hoc Test) 하기

palefaceman 2022. 9. 30. 00:11

단 방향 ANOVA(one-way ANOVA)는 3개 이상의 독립적인 그룹의 평균 간에 유의미한 차이가 있는지 판별하는 검정 방법이다.

 

단 방향 ANOVA(one-way ANOVA)에서 사용된 가설은 귀무가설(null hypothesis), H0: μ1= μ2=μ3=...=μk (각각 그룹에 평균은 같다.)이다.

 

대립 가설(alternative hypothesis), Ha: 적어도 하나의 평균의 값이 다르다, 이다.

 

ANOVA에서 구해진 p-value가 유의 수준(siginificance level)보다 작으면, 귀무가설(null hypothesis)을 기각할 수 있다. 그리고, 적어도 하나의 평균이 다르다고 볼 수 있는 충분한 통계적 근거가 있다고 말할 수 있다.

 

그러나, ANOVA로 어느 그룹에 평균이 다른가에 대한 정보를 얻을 수 없다. 단지, 하나 모든 그룹의 평균이 같지 않다는 정보만 제공한다. 정확히 어느 그룹이 다른 평균을 가지는 지 알기 위해서 post hoc 검정(post hoc test)을 한다.

 

post hoc 검정(post hoc test)의 방법 중 가장 널리 사용되는 방법이 Tukey-Kramer 검정(Ukey-Kramer test)이다. Tukey-Kramer 검정(Tukey-Kramer test)은 2개의 그룹 평균을 비교한다.

 

아래 예시는 어떻게 엑셀에서 Tukey_kramer 검정을 하는 지 보여준다.

 

예시: 엑셀에서 Tukey-Kramer(Tukey-Kramer Test) 검정 하기

3개의 (독립)그룹, A, B, C에 대해서 단 방향 ANOVA(one-way ANOVA)을 시행한 결과가 아래처럼 나온다.

단 방향 ANOVA(one-way ANOVA) 시행

 

p-값(p-value)은 0.000588이다. p-값(p-value)는 유의 수준(siginificance level) 0.05보다 작다. 그러므로, 우리는 귀무가설(null hypothesis)을 기각(rejection)할 수 있다. 그 결과, 독립 그룹 3개의 평균은 같다고 할 수 없다.

 

어떤 그룹에 평균이 다른지 확인하기 위해서, Tukey-Kramer post hoc 검정(Tukey-Kramer post hoc Test)을 아래 단계 별로 시행한다.

 

단계 1: 각 그룹에 절대 평균 차(abosoute mean difference)를 구한다.

첫 째, ANOVA 분석 첫 번째 테이블에 있는 그룹들의 평균값 결과를 사용해서 절대 평균 차(absolute mean difference)를 구한다.

단계 2: Q 임계치(Q ciritical value)을 찾는다.

다음으로, Q 임계치(Q critical value)를 아래에 공식을 이용해서 찾는다.

 

Q_critical value = Q*√(s^2(pooled)/ n)

 

  • Q = Q 테이블에 있는 Q의 값
  • S^2(pooled) = 합동 분산(3개의 그룹에 값을 모두 포함한 변수들의 분산)
  • n = 주어진 그룹에 표본 크기

 

Q 값(Q value)를 찾기 위해서 Studentized Range Q 테이블을 사용한다.

지금 하고 있는 예시에서, k = 그룹의 수, k = 3이다. 자유도(The degrees of freedom, df)는 n - k = 30 -3 = 27이다. 27이 테이블에서 보이지 않는다. 그렇기 때문에, 보수적 추정(conservative estimate)을 한다.  k =3 , df = 24에 Q = 3.53을 선택할 수 있다.

 

다음으로  s^2(pooled), 합동 분산(pooled variance)은 각 그룹에 분산의 평균을 이용하여 구한다. 그 값은 19.056이다.

마지막으로, 표본의 크기는 10이다.

 

그러므로, Q 임계값(Q critical value)을 계산하면 4.87이다.

 

Q 임계값(Q critical value) = Q*√(s^2(pooled) / n) =  3.53*√(19.056/10)  = 4.87.

단계 3: 어떤 그룹에 평균이 다른 지 결정한다.

마지막 단계로, 각 그룹에 절대 평균 차(absolute mean difference)와 Q 임계값(Q critical value)을 비교한다. 만약에, 절대 평균 차(absolute mean difference)가 Q 임계값(Q ciritical value) 보다 크다면, 두 그룹 간 평균에 차이는 통계적으로 유의미하다.

Tukey_Kramer post hoc 검정(Tukey_Kramer post hoc Test)을 통해서 아래와 같이 분석할 수 있다.

 

  • A와 B 그룹 사이에 차이는 통계적으로 유의미하다.(평균이 다르다)
  • B와 C 그룹 사이에 차이는 통계적으로 유의미하지 않다.(평균이 다르지 않다)
  • A와 C 그룹 사이에 차이는 통계적으로 유의미하다.(평균이 다르다)

 

관련 포스팅

8.1. 엑셀에서 단 방향 ANOVA(One-Way ANOVA) 분석하기