Excel_데이터/회귀분석

엑셀에서 결정계수(coefficient of determination) R² 구하기

palefaceman 2021. 7. 11. 17:08

 결정계수(coefficeint of determination)는 R²로 표기되면서 주로 선형 회귀 모델(Linear regression model)이 선형으로 잘 피팅되었는지 나타내는 지표다.

 

결정계수(coefficeint of determination)의 기술적 의의(意義)는 예측 변수(predictor variable)로 설명할 수 있는 반응 변수(response variable)의 분산(variance)이다.

 

R²의 범위는 0에서 1이다. 

  • R²가 0일 때는 어떠한 반응 변수(reponse variable)도 예측 변수(predictor variable)로 설명되지 않는다.
  • R²가 1일 때는 모든 반응 변수(reponse variable)가 예측 변수(predictor variable)로 설명된다.

 

예: 결정계수(R²) 구하기

아래와 같은 공부 시간에 따른 시험 점수 결과 데이터가 있다.

다음으로 hours를 예측 변수(predictor varaible)로 score를 반응 변수(response variable)로 해서 선형 회귀 모델(simple linear regression model)을 만들어 본다고 가정했을 때 R²값을 찾기 위해서 엑셀에 내장 함수 =RSQ(y, x)을 이용한다.

= RSQ(y,x)

  • y: 반응 변수(response variable)
  • x: 예측 변수(predictor varaible)

예로 제시된 데이터에서 72.73%의 반응 변수(reponse variable)가 예측 변수(predictor variable)로 설명될 수 있다. 

 

데이터를 가지고 데이터 분석에서 회귀 분석을 하면 아래와 같은 결과를 출력한다.

결정계수(coefficeint of determination)가 RSQ() 함수를 사용했을 때와 동일하게 0.7273으로 나옴을 알 수 있다.