Excel_데이터/기술적 통계

엑셀에서 공분산표(covariance matrix) 구하기

palefaceman 2021. 3. 11. 05:02

공분산(covariance) 하나의 변수(variable)에 또 다른 변수(variable)가 어떻게 변화하는지 상관관계를 보여주는 지표다.

구체적으로 두 변수간 선형적 관계 정도를 보여준다.

 

COV(X, Y) = Σ(x-μ)(y-γ) / n

 

위의 공식으로 x와 y사이에 공분산(covariance)를 구할 수 있다. 공분산은 쉽고, 유용하게 두 변수간 선형적 관계 정도를 알 수 있게 해 준다.

 

공분산 표(covariance matrix)를 구해보기

아래와 같이 3개의 과목에서 10명의 학생에 성적이 있다.

엑셀 항목에서 데이터 > 데이터 분석 > 공분산 분석

입력 범위에 분석할 데이터 범위를 입력한다.

첫째 행 이름표 사용 박스에 체크표시를 한다. 이는 첫 번째 1x1을 라벨 값으로 사용하겠다는 표시다.

그리고 출력 범위를 지정해준다.

그러면 공분산표(covariance metrix)이 자동적으로 풀려 나온다.

공분산(covariance metrix) 분석해보기

  • 수학(Math)에 분산(variance)은 64.96
  • 과학(Science)에 분산(variance)은 56.4
  • 역사(History)에 분산(variance)은 80.96

공분산(covariance)은

  • 수학-과학 공분산(covariance)은 33.2
  • 수학-역사 공분산(covariance)은 -39.24
  • 과학-역사 공분산(covariance)은 -23.1

 

 + 공분산(covariance)은 두 변수들이 같이 증가하거나, 감소한다는 것을 보여준다. 수학-과학은 공분산(covariance)가 33.2로 상관 관계가 비례적이다.

수학을 잘하는 학생은 과학도 잘하는 경향이 있다.

 

- 공분산(covariance)는 두 변수들이 반대로 움직이는 경향성을 보여준다.

수학-역사, 과학-역사에서, 수학이나 과학 점수가 올라가게 되면 역사 점수는 떨어지고, 역사 점수가 올라가면 수학/과학에서 점수가 낮게 나오는 경향이 있다.