두 변수(two variables) 간에 관계를 파악하기 위해서 피어슨 상관계수(pearson correlation coefficient)를 이용한다. 피어슨 상관계수(pearson correlation coefficient)는 서로 다른 두 변순(two variables) 간 선형 관계를 지시하는 통계 값이다.
피어슨 상관계수(pearson correlation coefficient)는 -1에서 1의 범위를 갖는다.
- -1: 두 변수간 완벽한 음에 상관관계가 있다.
- 0 두 변순간 선형관계가 없다.
- 1: 두 변수간 완벽한 양에 상관관계가 있다.
피어슨 상관계수(pearson correlation coefficient)가 사용하기에 적합한지 확인하는 방법으로 상관계수 검정(Correlation Test)을 한다. 검증을 위한 t-점수(t-score)를 구하고, 적절한 p-값(p-value)을 찾는다.
상관계수 검증(Correlation Test)에서 t-점수(t-score)는 아래 식으로 구해진다.
t = r√(n-2) / (1-r2)
- r: 상관계수(Correlation coefficient)
- n: 표본크기(The sample size)
p-값(p-value)는 t-분포(t-distribution)에 n-2에 자유도(degrees of freedom)의 양측 검정(two tailed test) 값으로 찾는다.
엑셀에서 상관계수 검증(Correlation Test)을 단계별로 시행해본다.
1단계: 데이터 입력
x, y 두 변수에 데이터 값이 주어졌다.
2단계: 상관계수(correlation coefficient) 구하기
CORREL()함수를 이용해서 x, y 두 변수간 상관계수(correlation coefficient)를 구한다.
상관계수(correlation coefficient)는 0.8037로 나왔다.
상관계수(correlation coefficient)가 양의 값이고 1에 가까운 값이기 때문에 x, y 두 변수 간에 양에 선형 관계가 있음을 알 수 있다. 하지만 결과를 내리기 전에, 구해진 상관계수(correlation coefficient)가 사용하기에 적합한 값인지 t-점수(t-score)와 p-값(p-value)을 구해서 검정해봐야 한다.
3단계: t 통계량과 p-값 구하기
상관계수 검정(Correlation Test) t 통계량(t-score) 구하는 공식을 이용해서 t 값을 구하고, T.DIST.2T() 함수를 이용해서 t-분포(t-distiribution)에서 p-값(p-value)을 구한다.
t 통계량= 4.27124
p-값= 0.00163
으로 각각 나왔다.
p-값이 0.05보다 충분히 작기 때문에, 상관계수 검정(Correlation Test) 결과 x, y 두 변수간 상관계수(correlatin coefficient) 0.8037은 통계적으로 사용 가능한 값으로 판정되었다.
'Excel_데이터 > 가설검증' 카테고리의 다른 글
엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk) 구하기 (0) | 2021.04.21 |
---|---|
엑셀에서 효과크기(Cohen's D) 구하기 (3) | 2021.04.20 |
엑셀에서 이항검정(Binomial Test) 하기 (0) | 2021.04.18 |
엑셀에서 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 하기 (0) | 2021.04.17 |
엑셀에서 양비율 z-검정(Two Proportion Z-Test)하기 (0) | 2021.04.16 |