카이제곱 검정
1. 개요
1. 개요
카이제곱 검정은 범주형 자료 분석에서 널리 사용되는 가설 검정 방법이다. 이 검정은 주로 두 개 이상의 범주형 변수 간의 관계를 분석하거나, 표본 데이터가 특정 이론적 분포를 따르는지 확인하는 데 활용된다. 검정의 핵심은 관찰된 도수와 기대되는 도수 사이의 차이를 바탕으로 카이제곱 통계량을 계산하여 통계적 유의성을 판단하는 것이다.
주요 검정 유형은 크게 세 가지로 구분된다. 첫째, 적합도 검정은 하나의 범주형 변수가 특정 분포를 따르는지 검증한다. 둘째, 독립성 검정은 두 범주형 변수가 서로 통계적 독립인지, 즉 관련이 있는지를 판단한다. 셋째, 동질성 검정은 두 개 이상의 모집단이 특정 범주에 대해 동일한 비율 분포를 가지는지 확인한다.
이 검정은 교차표 형태로 정리된 데이터에 적용되며, 기대도수가 너무 작지 않아야 한다는 등의 가정을 전제로 한다. 의학 연구, 사회과학, 시장 조사 등 다양한 분야에서 데이터의 패턴을 이해하고 귀무가설을 검증하는 강력한 도구로 사용되고 있다.
2. 기본 개념
2. 기본 개념
2.1. 적합도 검정
2.1. 적합도 검정
적합도 검정은 관찰된 표본 데이터의 분포가 특정한 이론적 분포나 가정된 분포에 얼마나 잘 맞는지를 평가하는 통계적 가설 검정 방법이다. 즉, 수집된 범주형 자료가 예상되는 분포 패턴을 따르는지, 아니면 유의미한 차이가 있는지를 검증하는 데 사용된다.
이 검정은 먼저 귀무가설로 '표본이 특정 분포를 따른다'는 명제를 설정한다. 예를 들어, 주사위를 던져 나온 결과가 각 면이 균등하게 나오는 균등분포를 따르는지, 또는 유전자 실험 결과가 멘델의 유전법칙에 부합하는지 확인할 때 적합도 검정을 적용할 수 있다. 그 후, 관찰된 각 범주의 빈도와 가정된 분포 하에서 기대되는 빈도를 비교하여 카이제곱 통계량을 계산한다.
계산된 검정 통계량 값은 카이제곱 분포를 기준으로 유의확률을 구하는 데 사용된다. 만약 이 유의확률이 사전에 설정한 유의수준 (예: 0.05)보다 작다면, 관찰된 데이터가 가정된 분포를 따른다는 귀무가설을 기각하게 된다. 이는 표본 데이터와 이론적 모형 사이에 통계적으로 유의미한 불일치가 존재함을 의미한다.
적합도 검정은 다양한 분야에서 활용된다. 품질 관리 공정에서 불량품의 발생 패턴이 예상과 다른지 분석하거나, 사회과학 연구에서 설문 응답 분포가 특정 모델과 일치하는지 검증하는 데 유용하다. 이 검정을 수행할 때는 모든 기대빈도가 일정 수준 이상이어야 한다는 기대도수 조건과 같은 제한사항을 고려해야 한다.
2.2. 독립성 검정
2.2. 독립성 검정
카이제곱 독립성 검정은 두 개의 범주형 변수 사이에 통계적으로 유의미한 연관성이 존재하는지, 아니면 서로 독립적인지를 판단하는 데 사용되는 방법이다. 예를 들어, 성별과 특정 제품에 대한 선호도, 또는 교육 수준과 정당 지지도와 같은 두 변수 간의 관계를 분석할 때 널리 적용된다. 이 검정은 교차표 또는 분할표 형태로 정리된 관측도수를 바탕으로 수행된다.
검정의 귀무가설은 일반적으로 "두 변수는 서로 독립이다"로 설정되며, 대립가설은 "두 변수는 서로 독립이 아니다"로 설정된다. 검정을 수행하기 위해서는 먼저 귀무가설이 참이라는 가정 하에 각 셀의 기대도수를 계산한다. 기대도수는 해당 행의 총합과 열의 총합, 그리고 전체 표본 크기를 이용해 구해지며, 이 값은 변수 간에 아무런 연관성이 없을 때 기대할 수 있는 이론적인 빈도에 해당한다.
다음으로, 관측된 빈도와 기대 빈도 사이의 차이를 종합하여 하나의 수치인 카이제곱 통계량을 계산한다. 이 통계량 값이 크다는 것은 관측된 데이터가 두 변수가 독립이라는 가정과 크게 일치하지 않음을 의미한다. 계산된 통계량은 특정 자유도를 가지는 카이제곱 분포와 비교되어 p-값이 도출된다. 이 p-값이 사전에 설정한 유의수준 (예: 0.05)보다 작으면, 두 변수가 독립이라는 귀무가설을 기각하고 변수 간에 통계적으로 유의한 연관성이 존재한다고 결론 내린다.
이 검정 방법은 의학 연구, 사회과학, 시장 조사 등 다양한 분야에서 활용된다. 그러나 모든 셀의 기대도수가 너무 작으면(일반적으로 5 미만) 검정의 정확도가 떨어질 수 있다는 제한점이 있으며, 이 경우 피셔의 정확 검정과 같은 다른 방법을 고려해야 한다. 또한, 카이제곱 독립성 검정은 변수 간 연관성의 존재 유무를 알려줄 뿐, 그 연관성의 강도나 방향을 나타내지는 않는다.
2.3. 동질성 검정
2.3. 동질성 검정
동질성 검정은 두 개 이상의 집단이 하나의 범주형 변수에 대해 동일한 확률 분포를 가지고 있는지 여부를 검정하는 방법이다. 즉, 서로 다른 모집단에서 추출한 표본들이 특정 범주의 비율이나 분포가 서로 동질한지를 확인하는 데 사용된다. 이는 독립성 검정과 계산 방법이 유사하지만, 검정의 목적과 가설 설정에서 차이가 있다.
동질성 검정의 귀무가설은 "모든 집단의 분포가 동일하다"는 것이며, 대립가설은 "적어도 하나의 집단의 분포가 다른 집단과 다르다"는 것이다. 예를 들어, A, B, C 세 가지 교육 방법을 적용한 서로 다른 세 학급의 학생들이 시험 결과(합격/불합격)에 대해 동일한 합격률 분포를 보이는지 검정할 때 사용할 수 있다. 이는 각 집단이 사전에 정의되어 있고, 그 집단들 간의 분포를 비교하는 것이 목적이다.
검정 절차는 독립성 검정과 마찬가지로 분할표를 구성하고, 각 셀의 기대도수를 계산한 후, 카이제곱 통계량을 산출하여 유의수준과 비교한다. 그러나 동질성 검정은 일반적으로 각 집단의 표본 크기가 연구 설계 단계에서 고정되어 있다는 점이 특징이다. 이 검정은 의학 연구에서 서로 다른 치료법 군 간의 반응 차이를 비교하거나, 마케팅에서 다양한 인구통계학적 집단 간의 선호도 분포를 비교하는 데 널리 활용된다.
3. 검정 절차
3. 검정 절차
3.1. 가설 설정
3.1. 가설 설정
카이제곱 검정을 수행할 때는 먼저 귀무가설과 대립가설을 설정한다. 이는 검정의 목적에 따라 달라지며, 검정의 방향성을 결정짓는 중요한 첫 단계이다.
적합도 검정의 경우, 귀무가설은 표본 데이터가 특정 이론적 분포를 따른다는 것이다. 예를 들어, 주사위가 공정하다는 가정을 검정할 때 귀무가설은 "각 면이 나올 확률이 1/6로 동일하다"가 된다. 반면 대립가설은 표본 데이터가 해당 분포를 따르지 않는다는 주장이다. 독립성 검정에서는 두 범주형 변수가 서로 통계적으로 독립적이라는 주장이 귀무가설이다. 예를 들어, 성별과 특정 제품 선호도가 관련이 없다는 것이 귀무가설이 될 수 있다. 대립가설은 두 변수가 서로 연관되어 있다는 것이다.
동질성 검정의 귀무가설은 비교하는 두 개 이상의 모집단이 특정 범주형 변수에 대해 동일한 분포를 가진다는 것이다. 예를 들어, 서로 다른 지역의 고객들이 제품에 대한 만족도 분포가 동일하다는 것이 귀무가설이다. 이에 대한 대립가설은 적어도 하나의 모집단의 분포가 다르다는 것이다. 설정된 가설은 이후 기대도수 계산과 카이제곱 통계량 계산의 기준이 되며, 최종적으로 유의수준과 비교하여 기각 여부를 판단하게 된다.
3.2. 기대도수 계산
3.2. 기대도수 계산
기대도수 계산은 카이제곱 검정을 수행하는 핵심 단계로, 귀무가설이 참이라는 가정 하에 각 범주 또는 교차표의 셀에서 기대되는 이론적인 빈도를 산출하는 과정이다. 이 계산은 관찰된 실제 빈도(관측도수)와 비교할 기준값을 제공하며, 검정 통계량을 구하는 데 직접적으로 사용된다.
기대도수의 계산 방식은 검정의 유형에 따라 다르다. 적합도 검정에서는 귀무가설에서 가정한 이론적 확률분포에 따라 계산된다. 예를 들어, 주사위의 공정성을 검정할 때 각 면이 나올 확률을 1/6으로 가정하면, 총 시행 횟수에 1/6을 곱하여 각 면의 기대도수를 얻는다. 독립성 검정과 동질성 검정에서는 분할표를 사용하며, 특정 셀의 기대도수는 (해당 셀이 속한 행의 합계 × 해당 셀이 속한 열의 합계) / 총 관측수라는 공식으로 구한다. 이 공식은 두 범주형 변수가 서로 독립적일 때 예상되는 빈도를 반영한다.
계산된 기대도수는 이후 검정 통계량 계산의 기초가 된다. 검정 통계량은 각 셀에서 (관측도수 - 기대도수)² / 기대도수 의 값을 모든 셀에 대해 합산하여 구한다. 따라서 기대도수의 정확한 계산은 검정 결과의 타당성을 보장하는 필수 조건이다. 일반적으로 검정의 신뢰도를 위해 각 셀의 기대도수가 너무 작지 않아야 한다는 가정이 따른다.
3.3. 검정 통계량 계산
3.3. 검정 통계량 계산
카이제곱 검정의 핵심은 관찰된 빈도와 기대 빈도 사이의 차이를 하나의 수치로 요약하는 검정 통계량을 계산하는 데 있다. 이 통계량은 카이제곱 분포를 따르며, 그 값이 클수록 귀무가설이 참일 가능성이 낮아진다.
검정 통계량 χ²(카이)는 다음 공식으로 계산된다. 각 셀(범주의 조합)에 대해 (관찰도수 - 기대도수)² / 기대도수를 구한 후, 모든 셀의 값을 합산한다. 이 공식은 관찰된 데이터와 기대값 사이의 상대적 불일치를 측정하며, 차이의 제곱을 기대도수로 나누어 표준화함으로써 각 셀의 기여도를 공정하게 비교할 수 있게 한다.
계산 요소 | 설명 |
|---|---|
관찰도수 (O) | 표본 데이터에서 실제로 관측된 빈도 |
기대도수 (E) | 귀무가설이 참이라는 가정 하에 기대되는 빈도 |
자유도 (df) | (행의 수 - 1) × (열의 수 - 1) (독립성/동질성 검정 기준) |
계산된 χ² 통계량은 미리 결정된 유의수준과 자유도에 해당하는 카이제곱 분포의 임계값과 비교된다. 통계량 값이 임계값보다 크면, 관찰된 차이가 확률적으로 우연히 발생하기 어렵다고 판단하여 귀무가설을 기각하게 된다. 이 절차는 적합도 검정, 독립성 검정, 동질성 검정 모두에 공통적으로 적용되는 핵심 단계이다.
3.4. 유의성 판단
3.4. 유의성 판단
유의성 판단은 계산된 카이제곱 검정 통계량을 기준으로 귀무가설을 기각할지 말지를 결정하는 최종 단계이다. 이 과정은 검정 통계량을 미리 정해진 유의수준과 비교하여 이루어진다.
판단의 핵심은 자유도에 따른 카이제곱 분포를 사용하는 것이다. 검정 통계량이 특정 임계값보다 크거나, 계산된 p-값이 유의수준보다 작으면 귀무가설을 기각한다. 예를 들어, 독립성 검정에서 귀무가설은 '두 변수가 독립적이다'이며, 검정 결과 이 가설이 기각되면 두 변수 사이에 통계적으로 유의한 연관성이 존재한다고 해석할 수 있다.
이때 주의할 점은, 검정 결과가 통계적 유의성을 보여준다는 것이 반드시 실질적 중요성이나 강한 인과 관계를 의미하는 것은 아니라는 것이다. 특히 표본 크기가 매우 클 경우, 실제 영향은 미미하더라도 통계적으로 유의미한 결과가 나올 수 있다. 따라서 효과 크기나 연관성 측도를 함께 고려하는 것이 바람직하다.
4. 가정과 제한사항
4. 가정과 제한사항
카이제곱 검정을 적용하기 위해서는 몇 가지 기본적인 가정이 충족되어야 하며, 그렇지 않을 경우 검정 결과의 신뢰도가 떨어질 수 있다. 가장 중요한 가정은 각 관측값이 서로 독립적이어야 한다는 점이다. 즉, 하나의 응답이 다른 응답에 영향을 미쳐서는 안 된다. 또한, 검정은 범주형 자료에 적용되며, 변수는 명목 척도나 순서 척도로 측정되어야 한다.
이 검정 방법에는 몇 가지 제한사항이 존재한다. 첫째, 기대도수가 너무 작으면 카이제곱 근사의 정확도가 떨어진다. 일반적으로 모든 셀의 기대도수가 5 이상이어야 한다는 경험적 기준이 널리 사용된다. 기대도수가 작은 셀이 많으면 피셔의 정확 검정과 같은 다른 방법을 고려해야 할 수 있다. 둘째, 이 검정은 변수 간의 관계 유무를 판단할 뿐, 관계의 강도나 방향을 측정하지는 않는다. 관계의 강도를 알아보기 위해서는 크래머의 V나 파이 계수 같은 연관성 측도를 추가로 계산해야 한다.
표본의 크기도 중요한 요소이다. 표본 크기가 매우 크면 통계적으로 유의미한 차이가 쉽게 발견될 수 있으나, 그 차이가 실제로 의미 있는 크기인지는 별개의 문제이다. 반대로 표본 크기가 너무 작으면 실제로 존재하는 효과를 발견하지 못할 위험(2종 오류)이 커진다. 마지막으로, 카이제곱 검정은 선형적 관계만을 탐지하며, 변수 간 복잡한 비선형 관계는 포착하지 못할 수 있다는 점에 유의해야 한다.
5. 사용 예시
5. 사용 예시
카이제곱 검정은 다양한 분야에서 실제 데이터를 분석하는 데 널리 활용된다. 가장 흔한 예는 독립성 검정을 통한 두 범주형 변수 간의 연관성 파악이다. 예를 들어, 마케팅 조사에서 '고객의 연령대'와 '선호하는 제품 유형' 사이에 통계적으로 유의미한 관계가 있는지 확인하거나, 의학 연구에서 '흡연 여부'와 '특정 질병 발병 여부'가 서로 독립적인지 검증하는 데 사용된다. 이는 교차표를 구성하고 관찰된 빈도와 기대 빈도를 비교하여 판단한다.
적합도 검정은 표본 데이터가 이론적인 분포를 따르는지 평가할 때 사용된다. 주사위나 동전이 공정한지 검정하는 것이 전형적인 예시이며, 품질 관리에서 생산된 제품의 불량률이 기대한 이항 분포를 따르는지, 또는 고객 도착 시간이 포아송 분포에 부합하는지 확인하는 데에도 적용된다. 이를 통해 실제 관측치와 기대치 사이의 차이가 우연히 발생한 것인지, 모집단 분포가 가정과 다른지를 통계적으로 판단할 수 있다.
동질성 검정은 서로 다른 두 개 이상의 집단이 특정 범주형 변수에 대해 동일한 분포를 보이는지 비교한다. 예를 들어, 교육 효과를 평가하기 위해 서로 다른 교수법(A, B, C)을 적용한 세 학급의 학생들이 시험 결과(합격/불합격)에 있어 동일한 성적 분포를 보이는지 분석할 수 있다. 또는 지역별(서울, 부산, 대구)로 실시한 특정 정책에 대한 찬반 의견 비율이 통계적으로 동질한지 검정하는 데에도 사용된다. 이는 각 집단의 비율이 동일한지를 검증하는 것과 유사한 결과를 제공한다.
