Excel_데이터

엑셀에서 합동 분산(Pooled Variance)구하기

palefaceman 2021. 3. 24. 18:01

합동 분산(pooled variance)은 두 개 이상의 데이터 표본(sample)의 분산에 평균을 한 통계 지표다.

 

합동 분산(pooled variance)은 두 개 이상의 데이터 표본(sample)의 분산(variance)을 통합해서 공용 하나의 분산(variance)를 의미한다. 

 

합동 분산(pooled variance)은 두 표본(two samples)에 대한, t-test를 할 때 가장 많이 사용된다.

(t-test는 표본의 평균이 같은지 아닌지 측정하는 테스트)

 

합동 분산(pooled variance)는  sp^2 기호로 사용된다.

sp^2 = ( (n₁-1)s₁^2 + (n₂-1) s₂^2 )  /  (n₁+n₂-2)

어떻게 구하는지 살펴본다.

1단계: 데이터 생성

2단계: 표본크기(sample size)와 표본 분산(sample variance)을 구한다.

COUNT(array), VAR.S(array)로 표본 크기와 표본 분산을 각각 구한다.

3단계: 합동 분산(pooled variance)을 구한다.

=((B17-1)*B18 + (C17-1)*C18) / (B17+C17-2)

합동 분산(pooled variance)은  (s1*(n1-1) - s2*(n2-1)) / (n1 + n2 - 2)로 각 데이터의 분산과 자유도를 변수로로 구할 수 있다.

 

데이터 1, 데이터 2 간에 합동 분산(pooled variance)은 46.971이다.