공분산(covariance) 하나의 변수(variable)에 또 다른 변수(variable)가 어떻게 변화하는지 상관관계를 보여주는 지표다.
구체적으로 두 변수간 선형적 관계 정도를 보여준다.
COV(X, Y) = Σ(x-μ)(y-γ) / n
위의 공식으로 x와 y사이에 공분산(covariance)를 구할 수 있다. 공분산은 쉽고, 유용하게 두 변수간 선형적 관계 정도를 알 수 있게 해 준다.
공분산 표(covariance matrix)를 구해보기
아래와 같이 3개의 과목에서 10명의 학생에 성적이 있다.
엑셀 항목에서 데이터 > 데이터 분석 > 공분산 분석
입력 범위에 분석할 데이터 범위를 입력한다.
첫째 행 이름표 사용 박스에 체크표시를 한다. 이는 첫 번째 1x1을 라벨 값으로 사용하겠다는 표시다.
그리고 출력 범위를 지정해준다.
그러면 공분산표(covariance metrix)이 자동적으로 풀려 나온다.
공분산(covariance metrix) 분석해보기
- 수학(Math)에 분산(variance)은 64.96
- 과학(Science)에 분산(variance)은 56.4
- 역사(History)에 분산(variance)은 80.96
공분산(covariance)은
- 수학-과학 공분산(covariance)은 33.2
- 수학-역사 공분산(covariance)은 -39.24
- 과학-역사 공분산(covariance)은 -23.1
+ 공분산(covariance)은 두 변수들이 같이 증가하거나, 감소한다는 것을 보여준다. 수학-과학은 공분산(covariance)가 33.2로 상관 관계가 비례적이다.
수학을 잘하는 학생은 과학도 잘하는 경향이 있다.
- 공분산(covariance)는 두 변수들이 반대로 움직이는 경향성을 보여준다.
수학-역사, 과학-역사에서, 수학이나 과학 점수가 올라가게 되면 역사 점수는 떨어지고, 역사 점수가 올라가면 수학/과학에서 점수가 낮게 나오는 경향이 있다.
'Excel_데이터 > 기술적 통계' 카테고리의 다른 글
엑셀에서 분할표(contingency table)만들기 (0) | 2021.03.12 |
---|---|
엑셀에서 도수분포(frequency distribution)구하기 (0) | 2021.03.11 |
엑셀에서 평균표준오차(standard error of the mean) 구하기 (0) | 2021.03.10 |
엑셀에서 왜도(Skewness)구하기 (0) | 2021.03.10 |
엑셀에서 변동계수(CV, coefficient of variation) 구하기 (0) | 2021.03.09 |