Excel_데이터/회귀분석

엑셀에서 다항 회귀분석(Polynomial Regression) 하기

palefaceman 2021. 5. 10. 22:59

회귀분석은 원인 변수(explnatory variable)와 반응 변수(response variable) 간에 값의 관계를 분석하는 데 사용한다.

 

회귀분석에서 원인 변수(explnatory variable)과 반응 변수(response variable)의 관계는 대부분에 선형(linear)으로 선형 회귀분석(linear regression)으로 분석한다.

 

하지만 때때로, 비선형(non-linear) 관계일 때가 있다. 이때는 다항 회귀분석(Polynomial Regression)으로 분석할 수 있다.

 

이번 포스팅에서 단계별로 엑셀에서 다항 회귀분석(Polynomial Regression)을 해본다.

1단계: 데이터 생성

첫 번째로 데이터를 입력한다.

2단계: 분산형 그래프를 생성한다.

데이터를 선택하고, 삽입> 차트> 분산형(X,Y)또는 거품형 차트 삽입 > 분산형을 선택한다.

분산형을 선택하면 아래와 같이 나온다.

3단계: 추세선을 추가한다.

차트에서 데이터 점을 선택하고 오른쪽 마우스 클릭 > 추세선 추가를 선택한다.

추세선에서 다항식을 선택하고 차수를 3으로 한다. 

 

차트에 추세선 방정식이 나오고, 추세선이 점선으로 그려진다.

4단계: 추세선에 도출된 방정식을 해석한다.

이 예시에 대해서 3차 방정식으로 회귀분석 모델 방정식을 선택했다. 그리고 결과가 아래와 같이 나왔다.

 

y = -0.1265x³ + 2.6482 x²– 14.238x + 37.213

 

이 방정식을 이용해서 임의의 원인 변수(explanatory variable) x에 대해, 반응 변수(response variable) y의 값을 도출해낼 수 있다. 예를 들어 x=4 일 때 y는 14.5362다.

 

y = -0.1265*(4)³ + 2.6482*(4)² – 14.238*(4) + 37.213 = 14.5362