Excel_데이터/회귀분석

엑셀에서 회귀분석 표준오차(Standard Error of Regression) 구하기

palefaceman 2021. 5. 18. 22:12

선형 회귀 모델을 피팅하면 항상. 아래와 같은 식이 나온다.

 

Y = β0 + β1X + … + βiX + ϵ

 

'ϵ'은 오차항이며 X값에 대해 독립적이다.

 

그러므로, X가 아무리 정교하게 Y를 예측하더라도 항상 우연오차(random error)가 존재하기 때문에 오차항 'ϵ'가 존재한다.

 

우연오차(random error)에 대한 오차와 피팅에서 나타나는 오차의 분산(dispersion)을 파악하는 방법으로 회귀분석 표준오차(Standard Error of Regression)를 사용한다. 

 

회귀분석 표준오차(Standard Error of Regression)는 잔차(residual)의 표준편차를 측정한다.

 

이번 포스팅에선 단계별로 회귀분석 표준오차(Standard Error of Regression)를 구한다.

 

1단계: 데이터 생성하기

아래와 같이 공부 시간 시험 결과, 평균 성적에 대한 12개의 데이터를 입력한다.

2단계: 회귀분석을 한다.

다음으로 데이터 분석에 들어가서 회귀분석을 한다.

데이터 분석이 없다면 여기서 다운 받는다.

 

데이터 분석을 하고 회귀분석을 선택하면 아래 창이 떠오른다. 그러면 빈칸을 채워준다.

아래와 같은 결과가 프린트된다.

3단계: 회귀분석 표준오차(Standard Error of Regression)를 해석한다.

표준오차(Standard Error)는 회귀분석 결과 출력에서 찾을 수 있다.

표준오차(Standard Error)는 2.79이다.

 

표준오차(standard error)는 실제 시험 점수와 회귀모델에서 예측되는 점수 사이에 평균 거리다.

 

실제 시험점수와 회귀모델에서 예측 점수 사이에 값들은 2.79보다 크기도 하고 작기도 하다. 모든 거리에 평균값이 2.79이다. 표준오차(standard error) 값이 작으면 작을수록 피팅이 잘 드러 맞다.

 

만약에 또 다른 회귀분석을 통해서 피팅을 했더니 표준오차(standard error)가 4.53이었다. 그렇다면 이 모델은 기존 모델보다 더 Y값 예측을 못한다고 할 수 있다.