전체 글 149

엑셀에서 다항 회귀분석(Polynomial Regression) 하기

회귀분석은 원인 변수(explnatory variable)와 반응 변수(response variable) 간에 값의 관계를 분석하는 데 사용한다. 회귀분석에서 원인 변수(explnatory variable)과 반응 변수(response variable)의 관계는 대부분에 선형(linear)으로 선형 회귀분석(linear regression)으로 분석한다. 하지만 때때로, 비선형(non-linear) 관계일 때가 있다. 이때는 다항 회귀분석(Polynomial Regression)으로 분석할 수 있다. 이번 포스팅에서 단계별로 엑셀에서 다항 회귀분석(Polynomial Regression)을 해본다. 1단계: 데이터 생성 첫 번째로 데이터를 입력한다. 2단계: 분산형 그래프를 생성한다. 데이터를 선택하고,..

엑셀에서 지수함수 회귀분석(Power Regression) 하기

지수함수 회귀분석(Power Regression)은 비선형(non-linear) 방정식으로 아래와 같은 형태를 가진다. y = ax^b y: 반응 변수 x: 원인 변수 a, b: 회귀 분석 계수(coefficient)로 x, y에 값을 계량치로 나타낸다. 이번 포스팅에서 단계별로 엑셀에서 지수함수 회귀분석(Power Regression)을 해본다. 1단계: 데이터 생성 첫 번째로 데이터를 입력한다. 2단계: y값을 자연로그값으로 변환한다. 옆에 새로운 열(column)에 x, y 값에 대한 자연로그 값을 구한다. 3단계: 지수 회지수 회귀분석(Exponential Regression) 모델에 피팅(fitting)한다. 지수함수 회귀분석(Power Regression)을 하기 위해서 데이터 분석에 들어간다..

엑셀에서 로그 회귀분석(Logarithmic Regression) 하기

로그 회귀분석(Logarithmic Regression)은 처음에 빠르게 감소하다가 서서히, 변화가 평탄해지는 경우에 사용하기 적합한 회귀분석법이다. 주로 성장 감소, 자연 부식(decay)등에서 볼 수 있다. 로그 회귀분석(Logarithmic Regression)은 y = a + b*ln(x) 의 수식으로 표현한다. y: 반응 변수 x: 원인 변수 a, b: 회귀 분석 계수(coefficient)로 x, y에 값을 계량치로 나타낸다. 이번 포스팅에서 단계별로 엑셀에서 로그 회귀분석(Logarithmic Regression)을 해본다. 1단계: 데이터 생성 첫 번째로 데이터를 입력한다. 2단계: y값을 자연로그값으로 변환한다. 옆에 새로운 열(column)에 y값에 대한 자연로그 값을 구한다. 3단계:..

엑셀에서 지수 회귀분석(Exponential Regression)하기

지수 회귀분석(Exponential Regression)은 특별한 경우에 사용하기 적합한 회귀분석 법이다. 1. 기하급수적 성장: 처음에 성장이 서서히, 하지만 늘어나는 숫자에 비례해서 인구증가속도가 빨라지는 현상 2. 기하급수적 감소: 처음에 굉장히 빠르게 감소하다가. 나중에 감소 속도가 둔화되는 현상 지수 회귀분석(Exponential Regression)은 y=ab^x의 수식 형태로 표현한다. y: 반응 변수 x: 원인 변수 a, b: 회귀 분석 계수(coefficient)로 x, y에 값을 계량치로 나타낸다. 이번 포스팅에서 단계별로 엑셀에서 지수 회귀분석(Exponential Regression)을 해본다. 1단계: 데이터 생성 첫 번째로 데이터를 입력한다. 2단계: y값을 자연로그값으로 변환한..

엑셀에서 3차회귀분석(Cubic Regression) 하기

3차 회귀분석(cubic regression)은 원인 변수(predictor variable)와 반응 변수(response variable) 사이에 비선형(non-linear) 관계일 때 사용하는 회귀분석 방법이다. 아래 차례차례 단계로 3차 회귀분석(cubic regression)을 시행해본다. 1단계: 데이터 생성 임의의 데이터 x, y 값을 입력한다. 2단계: 큐빅회귀분석(Cubic Regression)을 한다. 엑셀에 내장된 함수를 이용해서 3차 회귀분석(Cubic Regression)을 한다. =LINEST(B2:B13, A2:A13^{1,2,3}) 아래와 같은 값으로 출력된다. 반환된 계수들을 이용해서 3차 회귀 모델을 만들 수 있다. ŷ = -32.0118 + 9.832x – 0.3214 x..

엑셀에서 이차회귀분석(Quadratic Regression) 하기

회귀분석(regression)은 서로 다른 두 변수 간에 관계를 알아보기 위해서 사용한다. 가장 흔한 분석 방법은 선형 회귀(linear regression)로 원인 변수(explanatory variable)와 반응 변수(response variable)에 관계가 선형에 있을 때 사용한다. 선형에 관계에 원인 변수(explanatory variable)값이 증가하면, 반응 변수(response variable) 값도 따라서 증가하고, 또 감소하면 따라서 감사하게 된다. 하지만, 때때로 원인 변수(explanatory variable)와 반응 변수(response variable)에 관계가 비선형(non-linear) 관계에 있을 수 있다. 비선형 관계 중 가장 대표적인 예가 이차 관계(quadratic..

엑셀에서 다중 선형회귀분석(Multiple Linear Regression) 하기

다중 선형 회귀분석(Multiple Linear Regression)은 두 개 이상의 원인 변수(Explanatory variable)와 반응 변수(reponsive variable) 사이에 관계를 알아볼 때 사용하는 분석이다. 이번 포스팅에서 엑셀에서 다중 선형회귀분석(Multiple Linear Regression)을 시행해본다. 만약에 원인 변수(explanatory variable)가 하나가 있다면 선형 회귀분석(simple Linear regression)을 한다. 예시: 엑셀에서 다중 선형회귀분석(Multiple Linear Regression)하기 학생들의 공부시간과 지난 기출문제가 시험 성적과 어떤 관계가 있는 파악하고 싶다. 그래서 '공부시간'과 '기출문제'를 원인 변수(explanato..

엑셀에서 선형회귀분석(Simple Linear Regression) 하기

선형 회귀분석(simple linear regression)은 원인 변수(Explanatory variable)와 반응 변수(response variable) 사이에 관계를 파악하는 데 사용하는 분석이다. 이번 포스팅에서 엑셀에서 선형회귀분석(simple linear regression)을 시행해본다. 예시: 엑셀에서 선형회귀분석(linear regression)하기 학생들의 공부시간과 시험점수에 상관관계를 파악하고 싶다. 그래서 공부시간을 원인 변수(explanatory variable)로 시험성적을 반응 변수(response variable)로 해서 선형 회귀분석(simple linear regression) 시행한다. 엑셀에서 아래단계별로 따라가면서 선형 회귀분석(simple linear regre..

엑셀에서 크래머 V 계수(Cramer's V) 구하기

크래머 V 계수(Cramer's V)는 두 이산형 변수(nomial variables)에 대한 관계를 측정하는 데 사용한다. 크래머 V 계수(Cramer's V)는 0 - 1에 값을 가진다. 0: 두 이산형 변수(nomial variables)간에 아무런 관련성도 없다. 1: 두 이산형 변수(nomial variables)간에 서로 강한 관련성이 있다. 크래머 V 계수(Cramer's V) = √(X²/n) / min(c-1, r-1) X2: 카이제곱 통계량 n: 표본 크기 r: 행의 수 c: 열의 수 이번 포스팅에서 어떻게 엑셀에서 분할표(contingency table)에 쓰일 크래머 V 계수(Cramer's V) 구하는지 알아본다. 예시1: 2x2 표에서 크래머 V 계수(Cramer's V) 주입식..

엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기

피셔 정확 검정(Fisher's Exact Test)은 두 분류의 변수간 유의미한 상관성이 있는지 판별하는 데 사용한다. 피셔 정확 검정(Fisher's Exact Test)은 카이제곱 독립성 검정(Chi-Square Test of Independence)의 대체 방법으로 하나 이상의 셀에 관측수가 5 이하 일 때 사용한다. 엑셀에서 피셔 정확 검정(Fisher's Exact Test)을 시행 해본다. 예시: 엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기 성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다. 성별과 정치성향의 두 분류가 서로 유의미한 상관성이 있는지 검..