데이터 정규화(Date Normalization)는 데이터의 평균 0, 표준편차 1로 만드는 작업을 말한다.
예시: 데이터 정규화하기(date normalization)

위에 데이터를 정규화해보자
1단계: 평균(mean) 찾기
=AVERAGE(range) 함수 사용

2단계: 표준편차(standard deviation) 찾기
=STDEV(range) 함수 사용

3단계: 사이즈 정규화(normalizing)하기
마지막으로, =STANDARDIZE(x, mean, standard_deviation) 함수를 사용한다.
Note:
STANDARDIZE() 함수는 이렇게 작동한다.
정규화 값 = (x – μ) / s
x = 데이터 값(value)
μ = 평균(mean)
s = 표준편차(standard deviation))

B2 셀에서 함수를 입력하고 드래그, 혹은 더블 클릭해서 칸을 채운다.
정규화 데이터 분석
정규화 값 = (x – μ) / s
x = 데이터 값(value)
μ = 평균(mean)
s = 표준편차(standard deviation))
정규화 값이 0보다 작은 경우는 데이터가 평균보다 작음을
정규화 값이 0보다 큰 경우는 데이터가 평균보다 큼을
의미한다.
정규화된 데이터 값(normalized date value)은 기존 데이터가 평균(mean)에서 표준편차(standard deviation) 값만큼 얼마나 벗어나 있는지 말해준다. 다른 말로 표준편차(standard deviation)를 최소 단위(척도)로 얼마나 가 있나를 나타낸다.
기존 데이터 "12"는 왼쪽으로 1.288개의 표준편차(standard deviation)만큼 평균에서 떨어져 있다.
정규화 값(normalized value)은 평균(mean)에서 얼마나 떨어져 있나를 알려주는 좋은 지표다.
크기가 클수록 평균(mean)에서 멀리
크기가 작을수록 평균(mean)에서 가까이 있다.
'Excel_데이터 > 기술적 통계' 카테고리의 다른 글
엑셀에서 상대도수(Relative Frequency) 구하기 (0) | 2021.03.16 |
---|---|
엑셀에서 계급폭(class width)구하기 (0) | 2021.03.16 |
엑셀에서 스피어맨 서열상관분석(Spearman Rank Correlation)구하기 (0) | 2021.03.14 |
엑셀에서 베이즈 정리(bayes' Theorem) (0) | 2021.03.14 |
엑셀에서 조건부 확률(Conditional Probability)구하기 (0) | 2021.03.13 |