Excel_데이터/가설검증

엑셀에서 상관계수 p-값(P-value for a correlation coefficient) 구하기

palefaceman 2021. 4. 24. 17:45

두 변수 간에 관계를 알고 싶을 때 쓰는 방법 중 하나로, 피어슨 상관계수(Pearson correlation coefficient)를 구하는 방법이 있다.

 

피어슨 상관계수(Pearson correlation coefficient)는 두 변수간 선형 관계를 측정하는 수치다.

 

피어슨 상관계수(Pearson correlation coefficient)는 -1에서 1사이에 값을 가진다.

 

  • -1 두 변수는 완벽하게 음(-)의 선형 관계가 있다. 
  • 0 두 변수간 선형 관계가 없다
  • 1 두 변수는 완벽하게 양(+)의 선형 관계가 있다.

 

피어슨 상관계수(Pearson correlation coefficient)값이 통계적으로 유의미한지 검증하기 위해서, 피어슨 상관계수(Pearson correlation coefficient)의 t-점수(t-score)와 p-값(p-value)을 구할 수 있다. 

 

t-점수(t-score)을 구하기 위한 식은 아래와 같다. 상관계수(correlation coefficient)는 'r'이다.

 

t = r√(n-2) / √(1-r²)

 

p-값(p-value)는 n-2 자유도(degrees of freedom)에서 t-분표(t-distribution)의 양측(two-sided) 값으로 구한다.

 

엑셀에서 상관계수(Correlation Coefficient)의 P-값(p-value) 구하기

아래에 식을 엑셀 셀에 입력해서 해당 상관계수(correlation coefficient)에 대한 p-값(p-value)을 구할 수 있어야 한다.

상관계수(correlation coefficient) r = 0.56, 표본 크기 n =14에 대해서

 

  • t-점수: 2.3415
  • p-값: 0.0373

 

상관계수 검정의 가설 조건은 아래와 같다.

 

  • 귀무가설(null hypothesis) = H0: 두 변수간 상관성이 '0'이다.
  • 대립 가설(alternative hypothesis) = H1: 두 변수간 상관성이 '0'이 아니다. 두 변수간 통계적으로 유의미한 상관관계가 있다. 

 

 

유의 수준 alpah = 0.05로 선택했다고 하면, 0.0373은 0.05보다 작기 때문에 귀무가설(null hypothesis)을 기가 한다. 그러므로 두 변수 간에는 통계적으로 유의미한 상관성이 있다고 본다.