Excel_데이터/가설검증

엑셀에서 상관계수 검정(Correlation Test) 하기

palefaceman 2021. 4. 19. 17:55

두 변수(two variables) 간에 관계를 파악하기 위해서 피어슨 상관계수(pearson correlation coefficient)를 이용한다. 피어슨 상관계수(pearson correlation coefficient)는 서로 다른 두 변순(two variables) 간 선형 관계를 지시하는 통계 값이다. 

 

피어슨 상관계수(pearson correlation coefficient)는 -1에서 1의 범위를 갖는다.

 

  • -1: 두 변수간 완벽한 음에 상관관계가 있다.
  • 0 두 변순간 선형관계가 없다.
  • 1: 두 변수간 완벽한 양에 상관관계가 있다.

피어슨 상관계수(pearson correlation coefficient)가 사용하기에 적합한지 확인하는 방법으로 상관계수 검정(Correlation Test)을 한다. 검증을 위한 t-점수(t-score)를 구하고, 적절한 p-값(p-value)을 찾는다.

 

상관계수 검증(Correlation Test)에서 t-점수(t-score)는 아래 식으로 구해진다.

 

t = r√(n-2) / (1-r2)

 

  • r: 상관계수(Correlation coefficient)
  • n: 표본크기(The sample size)

 

p-값(p-value)는 t-분포(t-distribution)에 n-2에 자유도(degrees of freedom)의 양측 검정(two tailed test) 값으로 찾는다.

 

엑셀에서 상관계수 검증(Correlation Test)을 단계별로 시행해본다.

1단계: 데이터 입력

x, y 두 변수에 데이터 값이 주어졌다.

 

2단계: 상관계수(correlation coefficient) 구하기

CORREL()함수를 이용해서 x, y 두 변수간 상관계수(correlation coefficient)를 구한다. 

상관계수(correlation coefficient)는 0.8037로 나왔다.

 

상관계수(correlation coefficient)가 양의 값이고 1에 가까운 값이기 때문에 x, y 두 변수 간에 양에 선형 관계가 있음을 알 수 있다. 하지만 결과를 내리기 전에, 구해진 상관계수(correlation coefficient)가 사용하기에 적합한 값인지 t-점수(t-score)와 p-값(p-value)을 구해서 검정해봐야 한다.

3단계: t 통계량과 p-값 구하기

상관계수 검정(Correlation Test) t 통계량(t-score) 구하는 공식을 이용해서 t 값을 구하고, T.DIST.2T() 함수를 이용해서 t-분포(t-distiribution)에서 p-값(p-value)을 구한다.

 

t 통계량= 4.27124

p-값= 0.00163

으로 각각 나왔다. 

 

p-값이 0.05보다 충분히 작기 때문에, 상관계수 검정(Correlation Test) 결과 x, y 두 변수간 상관계수(correlatin coefficient) 0.8037은 통계적으로 사용 가능한 값으로 판정되었다.