Excel_데이터/기술적 통계

엑셀에서 점이연 상관관계(Point-biserial correlation) 분석

palefaceman 2021. 3. 18. 07:45

점이연 상관관계(Point-biserial correlation)은 이분변수'x'와 연속변수'y'에 상관관계를 구하는데 사용된다. 

 

피어스 상관계수(Pearson correlation coefficient)와 똑같이 -1~1에 값을 가진다.

  • -1: 두 변수간 음의 상관관계가있다.
  •  0: 두 변수간 상관관계가 없다.
  • +1: 두변수간 양의 상관관계가 있다.

어떻게 만드는지 살펴보자

예시: 점이연 상관관계(Point-Biserial Correlation)을 구해보자

x는 이분변수

y는 연속변수

일단 =CORREL() 함수를 이용한다.

상관계수가 +값이다. 0.218163

이는 x 값이 1일 때 y 값이 0일 때 보다, 더 큰 값을 대체로 나타냄을 알 수 있다.

 

이를 확인하기 위해서 1일 때 y값과 0일 때 y값의 평균을 구해보면 쉽게 비교할 수있다.

x = 0: y(avg) = 14.2

x = 1 :x(avg) = 16.2

 

다음으로 이 값에 p-value를 구한다. 

 

표본크기n: COUNT(array)

t-test : D2*SQRT(E7-2)/SQRT(1-D2^2)

p-value: T.DIST.2T(E8,E7-2)

비록 두 관계가 양의 관계가 있는 것 처럼 보였으나. T-test를 시행한 후 결과, 유의미한 통계적 관계는 없는 것으로 드러났다.