Excel_데이터/기술적 통계

엑셀에서 데이터 정규화(Date Normalization)하기

palefaceman 2021. 3. 15. 07:56

데이터 정규화(Date Normalization)는 데이터의 평균 0, 표준편차 1로 만드는 작업을 말한다.

 

예시: 데이터 정규화하기(date normalization)

위에 데이터를 정규화해보자

1단계: 평균(mean) 찾기

=AVERAGE(range) 함수 사용

2단계: 표준편차(standard deviation) 찾기

=STDEV(range) 함수 사용

3단계: 사이즈 정규화(normalizing)하기

마지막으로, =STANDARDIZE(x, mean, standard_deviation) 함수를 사용한다.

Note:

STANDARDIZE() 함수는 이렇게 작동한다.

정규화 값 = (x – μ) / s

    x = 데이터 값(value)
    μ = 평균(mean)
    s = 표준편차(standard deviation))

B2 셀에서 함수를 입력하고 드래그, 혹은 더블 클릭해서 칸을 채운다.

정규화 데이터 분석

정규화 값 = (x – μ) / s

    x = 데이터 값(value)
    μ = 평균(mean)
    s = 표준편차(standard deviation))

 

정규화 값이 0보다 작은 경우는 데이터가 평균보다 작음을

정규화 값이 0보다 큰 경우는 데이터가 평균보다 큼을

의미한다.

 

정규화된 데이터 값(normalized date value)은 기존 데이터가 평균(mean)에서 표준편차(standard deviation) 값만큼 얼마나 벗어나 있는지 말해준다. 다른 말로 표준편차(standard deviation)를 최소 단위(척도)로 얼마나 가 있나를 나타낸다.

 

기존 데이터 "12"는 왼쪽으로 1.288개의 표준편차(standard deviation)만큼 평균에서 떨어져 있다.

 

정규화 값(normalized value)은 평균(mean)에서 얼마나 떨어져 있나를 알려주는 좋은 지표다. 

크기가 클수록 평균(mean)에서 멀리

크기가 작을수록 평균(mean)에서 가까이 있다.