전체 글 149

엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기

독립성 카이제곱 검정(Chi-Square Test of Independence)은 두 변수 간에 유의미한 상관성이 있는지 없는지 결정할 때 사용한다. 이번 포스팅은 엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence)을 시행한다. 예시: 엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence)하기 성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다. 차례차례 단계별로 독립성 카이제곱 검정(Chi-Square Test of Independence)을 시행해서, 성별과 정치성향에 상관관계를 파악해보자. 1단계: 가정 설정한다...

엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기

카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)은 주어진 데이터 분포가 예상되는 분포에 따르는지/아닌지 검증할 때 사용한다. 이번 포스팅에서 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 실행해본다. 예시: 엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기 한 PC방 주인이 매주 똑같은 수에 손님이 온다고 했다. 이 가정을 검정해보자. 일주일간 온 손님 수를 관찰했다. 월 화 수 목 금 50 60 40 47 53 단계별로 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)을 통해서 PC방 주인의 말이 타당한지 판단해본다. 1단계: 데이터 입력 '매주 같은 수..

엑셀에서 더빈-왓슨 검정(Durbin-Watson Test)하기

선형 회귀분석(linear regression)에 핵심 전제는 오차항(residuals)이 서로 독립적이어야 한다는 것이다. 오차항(residuals)이 독립인지 확인하는 방법 중, 더빈-왓슨 검정(Durbin-Watson Test)이 있다. 더빈-왓슨 검정(Durbin-Watson Test)을 통해서 자기 상관(autocorrelation)에 대해서 검정할 수 있다. 더빈-왓슨 검정(Durbin-Watson Test)은 아래의 귀무가설(null hypothesis)을 가진다. 귀무가설(null hypothesis): H0 = 오차항(residuals) 간에 관계는 없다. 대립가설(alternative hypothesis): Ha = 오차항(residuals) 간에 자기 상관(autocorrelation..

엑셀에서 신뢰구간(Confidence Interval) 구하기

신뢰구간(Confidence Interval) 안에 값은 모수(population parameter)를 포함하고 있다. 신뢰구간(confidence interval)은 아래에 공식으로 계산한다. 신뢰구간(Confidence Interval) = (point estimate) +/- (critical value)*(표준 오차) 위의 공식은 신뢰구간(confidence interval)의 상한 값(uppter bound)과 하한 값(lower bound)을 구한다. 어떻게 신뢰구간(confidence interval)을 구하는지 단계별로 알아본다. 1. 평균의 신뢰구간(confidence interval) 2. 평균차이의 신뢰구간(confidence interval) 3. 비율의 신뢰구간(confidence..

엑셀에서 상관계수 p-값(P-value for a correlation coefficient) 구하기

두 변수 간에 관계를 알고 싶을 때 쓰는 방법 중 하나로, 피어슨 상관계수(Pearson correlation coefficient)를 구하는 방법이 있다. 피어슨 상관계수(Pearson correlation coefficient)는 두 변수간 선형 관계를 측정하는 수치다. 피어슨 상관계수(Pearson correlation coefficient)는 -1에서 1사이에 값을 가진다. -1 두 변수는 완벽하게 음(-)의 선형 관계가 있다. 0 두 변수간 선형 관계가 없다 1 두 변수는 완벽하게 양(+)의 선형 관계가 있다. 피어슨 상관계수(Pearson correlation coefficient)값이 통계적으로 유의미한지 검증하기 위해서, 피어슨 상관계수(Pearson correlation coefficie..

엑셀에서 쟈크베라의 정규성 검정(Jarque-Bera Normality Test)하기

쟈크베라의 검정(Jarque-Bera Test)은 적합도(Goodness-of-ift) 검정이다. 쟈크베라의 검정(Jarque-Bera Test)은 왜도(Skewness)와 첨도(Kurtosis)가 정규분포(normal distribution)로 보기에 적합한지에 대한 적합도(Goodness-of-fit) 검정에 사용한다. 쟈크베라의 검정(Jarque-Bera Test)에 결과값은 언제나 양의 숫자다. 그리고 결괏값이 0에서 멀리 떨어진 값이 나오면, 그때는 정규분포(normal distiribuiton)에 적합하지 않다고 판정한다. 쟈크베라의 검정(Jarque-Bera Test)의 통계량은 아래 식으로 구한다. JB =(n/6) * (S² + (C²/4)) n: 관찰된 표본 수 S: 표본의 왜도(ske..

엑셀에서 등분산 검정(Levene's Test) 하기

등분산 검정(Levene's Test)은 두 그룹 또는 두 그룹 이상이 서로 같은 분산을 가지고 있느냐/없느냐를 판별할 때 사용한다. 등분산 검정(Levene's Test)는 통계 분석에서 빈번하게 사용된다. 대부분에 통계 분석은 서로 다른 그룹 간에 분산이 같다고 가정을 하고 분석을 하기 때문에 등분산 검정(Levene's Test)을 선행하여 실제 같은 분산을 가졌다고 할 수 있는지 판별한다. 아래 예시를 따라서 엑셀에서 등분산 검정(Levene's Test)을 실습해본다. 예시: 엑셀에서 등분산 검정(Levene's Test) 연구자들은 서로 다른 3개의 비료를 개발했다. 3개의 비료의 효과에 대해 알아보고 싶다. 그래서 같은 식물을 3개의 서로 다른 비료를 이용해서 키운다면 한 달 후 식물의 성장..

엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk) 구하기

아래와 같은 2:2 테이블을 분석할 때 이따금씩 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 사용한다. 오즈비(Odds Ratio)는 실험군에서 발생한 사건과 사건 비발생에 비와 대조군에서 발생한 사건 발생과 사건 비발생의 비를 나타낸다. 오즈비(Odds Ratio) = (A/B) / (C/D) = (A*D) / (B*C) 상대 위험도(Relative Risk)는 실험군에서 사건이 발생할 확률분에 대조군에서 사건이 발생할 확률의 비를 나타낸다. 상대 위험도(Relative Risk) = [A/(A+B)] / [C/(C+D)] 아래 설명에 따라 엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 구해본다. 오즈비(Odds Ratio)와 상대 위험도(R..

엑셀에서 효과크기(Cohen's D) 구하기

두 데이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 확인하고 싶을 때 가설 검증(hypothesis test)을 한다. 그 결과 값으로 p-값(p-value) 계산한다. 그리고 p-값(p-value)과 유의 수준(significance level)과 비교하여 가설의 기각 여부를 판별하여, 두 세이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 통계적을 판별할 수 있다. p-값(p-value)으로 정성적으로 두 그룹간에 차이가 있고/없고를 알 수 있다면, 효과 크기(Cohen's D)는 실제로 차이에 정량 값을 구한다. 효과 크기(effect size)를 구하는 방법은 여러 가지가 있지만, Cohen's D가 가장 많이 쓰이고 있다. Cohen’s D = (x1 – x2) / pooled SD ..

엑셀에서 상관계수 검정(Correlation Test) 하기

두 변수(two variables) 간에 관계를 파악하기 위해서 피어슨 상관계수(pearson correlation coefficient)를 이용한다. 피어슨 상관계수(pearson correlation coefficient)는 서로 다른 두 변순(two variables) 간 선형 관계를 지시하는 통계 값이다. 피어슨 상관계수(pearson correlation coefficient)는 -1에서 1의 범위를 갖는다. -1: 두 변수간 완벽한 음에 상관관계가 있다. 0 두 변순간 선형관계가 없다. 1: 두 변수간 완벽한 양에 상관관계가 있다. 피어슨 상관계수(pearson correlation coefficient)가 사용하기에 적합한지 확인하는 방법으로 상관계수 검정(Correlation Test)을 ..