점이연 상관관계(Point-biserial correlation)은 이분변수'x'와 연속변수'y'에 상관관계를 구하는데 사용된다.
피어스 상관계수(Pearson correlation coefficient)와 똑같이 -1~1에 값을 가진다.
- -1: 두 변수간 음의 상관관계가있다.
- 0: 두 변수간 상관관계가 없다.
- +1: 두변수간 양의 상관관계가 있다.
어떻게 만드는지 살펴보자
예시: 점이연 상관관계(Point-Biserial Correlation)을 구해보자
x는 이분변수
y는 연속변수
일단 =CORREL() 함수를 이용한다.
상관계수가 +값이다. 0.218163
이는 x 값이 1일 때 y 값이 0일 때 보다, 더 큰 값을 대체로 나타냄을 알 수 있다.
이를 확인하기 위해서 1일 때 y값과 0일 때 y값의 평균을 구해보면 쉽게 비교할 수있다.
x = 0: y(avg) = 14.2
x = 1 :x(avg) = 16.2
다음으로 이 값에 p-value를 구한다.
표본크기n: COUNT(array)
t-test : D2*SQRT(E7-2)/SQRT(1-D2^2)
p-value: T.DIST.2T(E8,E7-2)
비록 두 관계가 양의 관계가 있는 것 처럼 보였으나. T-test를 시행한 후 결과, 유의미한 통계적 관계는 없는 것으로 드러났다.
'Excel_데이터 > 기술적 통계' 카테고리의 다른 글
엑셀에서 카파상관분석(Fleiss's Kappa) 구하기 (0) | 2021.03.19 |
---|---|
엑셀에서 이상치(Outlier) 빨리 찾기 (0) | 2021.03.18 |
엑셀에서 편상관관계(Partial Correlation) 구하기 (0) | 2021.03.17 |
엑셀에서 누적도수(cumulative frequency)구하기 (0) | 2021.03.16 |
엑셀에서 상대도수(Relative Frequency) 구하기 (0) | 2021.03.16 |