문서의 각 단락이 어느 리비전에서 마지막으로 수정되었는지 확인할 수 있습니다. 왼쪽의 정보 칩을 통해 작성자와 수정 시점을 파악하세요.

가설 검정 | |
정의 | 전체 모집단 중 일부를 표본으로 추출하여 통계량을 구한 뒤, 오차 및 오류의 허용 수준을 객관적으로 관리하면서 모수의 불확실한 성질을 추정하고, 이를 근거로 하여 특정한 진술을 받아들일지를 검정하는 학문 |
다른 명칭 | 추론통계학 통계적 추론 |
주요 활동 | 추정 가설검정 |
추정의 유형 | 점추정 구간추정 |
가설검정의 핵심 요소 | 영가설 대립가설 검정통계량 오류 관리 |
상세 정보 | |
점추정의 예시 | 표본평균 표본표준편차 |
구간추정의 예시 | 신뢰 구간 신뢰도 |
가설검정의 조건 | 신뢰구간 유의수준 |
관련 분야 | 경제학 공학 사회과학 |
관련 개념 | 통계량 모수 편의 불편추정 효율추정 표본 모집단 |

가설 검정은 추론통계학의 핵심 활동으로, 표본 자료를 바탕으로 모집단에 대한 특정 주장을 검증하는 통계적 절차이다. 이는 모수에 대한 불확실한 진술을 표본 통계량을 근거로 받아들일지 말지를 객관적인 기준에 따라 판단하는 과정이다.
가설 검정의 기본 틀은 영가설과 대립가설의 설정에서 시작된다. 영가설은 일반적으로 기존의 관념이나 차이가 없음을 나타내는 보수적 주장이며, 대립가설은 연구자가 입증하고자 하는 새로운 주장이나 차이의 존재를 나타낸다. 검정은 표본 데이터를 분석하여 영가설을 기각할 충분한 증거가 있는지 평가하는 방식으로 진행된다.
이 과정에서 검정통계량을 계산하고, 미리 설정한 유의수준과 비교한다. 유의수준은 영가설이 참일 때 이를 잘못 기각할 확률의 허용 한계를 의미하며, 일반적으로 0.05가 널리 사용된다. 계산된 검정통계량의 확률인 p-값이 유의수준보다 작으면 영가설을 기각하는 증거가 있다고 판단한다.
가설 검정은 점추정이나 구간추정과 함께 통계적 추론의 주요 도구로, 과학적 방법의 핵심을 이루며 다양한 학문 분야와 실제 의사결정에서 광범위하게 활용된다.

가설 검정에서 영가설과 대립가설은 검정의 핵심적인 두 가지 진술이다. 영가설은 기존의 관점이나 차이가 없음을 나타내는 보수적인 주장이며, 대립가설은 연구자가 증명하고자 하는 새로운 주장이나 차이의 존재를 나타낸다.
검정의 논리는 영가설이 참이라는 가정 아래에서 시작된다. 즉, 표본 데이터를 분석했을 때 관찰된 결과가 영가설 하에서 매우 드물게 발생한다면(이는 유의수준으로 관리되는 제1종 오류 확률과 비교된다), 영가설을 기각하고 대립가설을 지지하는 증거가 있다고 판단한다. 이 과정에서 검정통계량과 p-값이 계산되어 의사 결정의 근거가 된다.
영가설과 대립가설은 상호 배타적이며 포괄적으로 설정된다. 예를 들어, 어떤 신약의 효과를 검정할 때, 영가설은 "신약이 위약과 효과에 차이가 없다"는 반면, 대립가설은 "신약이 위약보다 효과가 있다"로 설정될 수 있다. 검정 결과 영가설이 기각되면 대립가설을 지지하는 통계적 증거가 있는 것으로 해석되지만, 이는 대립가설이 절대적 진리임을 증명하는 것은 아니다.
이러한 가설 설정과 검정 프레임워크는 과학적 방법의 핵심 요소로, 새로운 지식이 축적되는 방식을 체계화한다. 법정의 무죄추정의 원칙에 비유될 수 있으며, 충분한 증거(데이터)가 제시되기 전까지는 기존 주장(영가설)을 기각하지 않는 보수적인 접근을 취한다.
검정통계량은 가설 검정 과정에서 표본 데이터를 기반으로 계산되는 하나의 수치이다. 이 통계량은 영가설이 참이라는 가정 하에, 현재 관찰된 표본 데이터가 얼마나 극단적인지를 수치화하여 나타낸다. 검정통계량의 값은 특정 확률 분포(예: 정규분포, t-분포, 카이제곱분포, F-분포)를 따른다고 가정하며, 이를 통해 p-값을 계산하거나 기각역과 비교하여 최종 결론을 도출한다.
검정통계량의 구체적인 계산 공식은 검정하고자 하는 가설의 유형과 사용하는 통계적 방법에 따라 달라진다. 예를 들어, 모평균에 대한 검정에서는 표본평균과 가설된 모평균(영가설에서 주장하는 값)의 차이를, 표준오차로 나누어 Z-검정 통계량이나 t-검정 통계량을 계산한다. 두 집단의 평균을 비교할 때는 두 표본평균의 차이를 합동 표준오차로 나눈 값을 검정통계량으로 사용한다.
이렇게 계산된 검정통계량은 가설 검정의 핵심 판단 기준이 된다. 검정통계량의 절댓값이 클수록, 현재의 표본 데이터가 영가설 하에서 기대되는 범위에서 멀리 벗어났음을 의미한다. 이는 영가설이 참일 가능성이 낮아짐을 시사하며, 결과적으로 대립가설을 지지하는 증거가 된다. 따라서 검정통계량은 불확실한 표본 정보를 객관적인 수치로 변환하여, 유의수준에 기반한 합리적인 의사결정을 가능하게 하는 도구 역할을 한다.
가설 검정에서 유의수준과 p-값은 검정의 오류를 관리하고 결론을 도출하는 데 핵심적인 역할을 한다. 이 두 개념은 영가설을 기각할지 말지에 대한 객관적인 기준을 제공한다.
유의수준은 제1종 오류를 범할 최대 허용 확률을 의미하며, 일반적으로 기호 α(알파)로 표기한다. 연구자는 검정을 수행하기 전에 유의수준을 0.05(5%)나 0.01(1%)과 같이 미리 설정한다. 이는 영가설이 사실인데도 불구하고 이를 잘못 기각할 위험을 5% 또는 1% 이내로 통제하겠다는 것을 의미한다. 유의수준은 기각역의 범위를 결정하며, 설정된 α 값에 따라 검정통계량의 임계값이 정해진다.
반면, p-값은 실제로 관측된 표본 데이터를 바탕으로 계산된 확률이다. 구체적으로, 영가설이 참이라는 가정 하에, 현재 관찰된 검정통계량 값보다 더 극단적인 결과가 나올 확률을 의미한다. p-값이 작을수록 현재의 표본 데이터는 영가설 하에서는 매우 발생하기 어려운, 즉 '이상한' 데이터라는 것을 시사한다. 따라서 연구자는 계산된 p-값을 미리 설정한 유의수준 α와 비교하여 결론을 내린다. 만약 p-값이 α보다 작다면(p < α), 영가설을 기각하는 데 충분한 증거가 있다고 판단한다.

제1종 오류는 가설 검정 과정에서 발생하는 중요한 오류 유형 중 하나이다. 이는 실제로 영가설이 참인데도 불구하고, 표본 데이터를 근거로 영가설을 잘못 기각하는 오류를 의미한다. 다시 말해, 차이나 효과가 실제로 존재하지 않음에도 불구하고, 통계적 검정 결과가 그렇지 않다고 잘못 결론 내리는 상황에 해당한다.
이러한 오류를 범할 확률은 통상적으로 유의수준(α)으로 표시하며, 연구자는 검정을 설계할 때 이 확률을 사전에 설정하여 관리한다. 예를 들어, 유의수준을 0.05로 설정했다는 것은 제1종 오류를 저지를 위험을 5% 이내로 통제하겠다는 것을 의미한다. 이는 가설 검정이 단순히 데이터에 기반한 결론 도출이 아니라, 그 결론이 틀릴 가능성을 체계적으로 관리하는 과정임을 보여준다.
제1종 오류는 거짓양성 또는 알파 오류라고도 불리며, 실제 상황에서 심각한 결과를 초래할 수 있다. 예를 들어, 신약의 효과가 실제로는 없는데도 임상시험 결과가 유의미하다고 잘못 판단하여 허가를 내린다면, 효과 없는 약이 시장에 유통되는 위험을 초래한다. 반대로, 형사재판에서 무죄추정의 원칙은 무고한 사람을 유죄로 판단하는 제1종 오류의 위험을 최소화하기 위한 제도적 장치로 볼 수 있다.
가설 검정의 논리는 이러한 오류의 가능성을 인정하면서도, 그 확률을 낮추기 위해 검정통계량, 기각역, p-값 등의 도구를 활용한다. 연구자는 유의수준이라는 허들을 설정하고, 표본 데이터로부터 계산된 p-값이 이 허들보다 낮을 때만 영가설을 기각하는 결론에 도달한다. 따라서 제1종 오류에 대한 이해는 통계적 추론의 신뢰성을 평가하는 데 필수적이다.
제2종 오류는 가설 검정 과정에서 발생할 수 있는 오류 유형 중 하나로, 실제로는 영가설이 거짓인데도 불구하고 이를 기각하지 못하는 오류를 말한다. 즉, 대립가설이 사실이지만 표본 데이터가 이를 뒷받침할 만큼 충분히 강력하지 않아 연구자가 효과나 차이를 발견하지 못하고 영가설을 유지하는 상황이다. 이는 '거짓긍정'이 아닌 '거짓부정'에 가까운 오류로, 실제 존재하는 현상을 놓치는 실수에 해당한다.
제2종 오류를 범할 확률은 일반적으로 베타(β)로 표기한다. 이 오류의 위험은 연구의 검정력과 직접적으로 연관되어 있다. 검정력은 영가설이 거짓일 때 이를 올바르게 기각할 확률, 즉 (1-β)를 의미한다. 따라서 β가 클수록 검정력은 낮아지며, 연구 설계가 효과를 탐지하는 데 실패할 가능성이 높아진다. 제2종 오류의 확률을 줄이기 위해서는 표본 크기를 늘리거나, 효과 크기가 큰 상황을 연구하거나, 측정의 신뢰도를 높이는 등의 방법이 사용된다.
의학 분야에서 비유하자면, 실제로 질병이 있는 환자를 건강하다고 진단하는 오류에 해당한다. 이는 환자가 필요한 치료를 받지 못하게 만들어 결과적으로 더 큰 위험을 초래할 수 있다. 통계적 검정에서도 마찬가지로, 제2종 오류는 중요한 발견을 놓치거나, 실제로 효과가 있는 처치나 정책을 채택하지 못하게 만드는 위험을 내포한다. 따라서 연구 설계 단계에서 충분한 검정력(통상 0.8 이상)을 확보하기 위한 표본 크기 계산이 필수적이다.
검정력은 가설 검정에서 영가설이 실제로 거짓일 때 이를 올바르게 기각할 수 있는 확률을 의미한다. 이는 1에서 제2종 오류를 범할 확률을 뺀 값으로, 검정의 민감도를 나타내는 중요한 지표이다. 검정력이 높을수록 연구는 실제로 존재하는 효과나 차이를 더 잘 발견할 수 있다.
검정력의 크기는 주로 표본의 크기, 효과 크기, 그리고 설정된 유의수준에 의해 결정된다. 표본의 크기가 클수록, 관측하려는 효과의 크기가 클수록, 그리고 유의수준을 완화할수록(예: α=0.05에서 α=0.1로) 검정력은 일반적으로 증가한다. 반대로, 표본이 작거나 효과 크기가 미미하며 유의수준을 엄격하게 관리하면 검정력은 낮아져 제2종 오류를 범할 가능성이 높아진다.
연구를 설계할 때는 충분한 검정력을 확보하기 위해 사전에 표본 크기를 결정하는 것이 일반적이다. 이를 위해 G*Power와 같은 전용 소프트웨어나 통계 표를 활용하여, 원하는 효과 크기와 유의수준, 검정력(통상 0.8 이상을 목표로 함)을 만족시키는 최소 표본 수를 계산한다. 이는 임상시험이나 사회조사와 같이 자원이 제한된 연구에서 특히 중요하다.
검정력 분석은 실험의 효율성을 높이고, 무의미한 결과(즉, 영가설을 기각하지 못한 결과)가 진정한 효과의 부재 때문인지, 아니면 표본 부족으로 인한 검정력 저하 때문인지를 판단하는 데 도움을 준다. 따라서 통계적 방법을 적용하는 모든 연구에서 검정력은 연구 설계 단계부터 고려해야 할 핵심 요소이다.

단측 검정과 양측 검정은 대립가설의 방향성에 따라 가설 검정을 분류하는 방법이다. 이 구분은 검정의 목적과 연구 질문에 따라 결정되며, 결과적으로 기각역의 위치와 형태에 직접적인 영향을 미친다.
양측 검정은 대립가설이 모수가 특정 기준값과 '다르다'는 것을 검정할 때 사용된다. 예를 들어, '새로운 교수법이 기존 교수법과 효과가 다르다'와 같은 가설이 여기에 해당한다. 이 경우, 영가설이 참일 때 검정통계량이 극단적으로 크거나 작은 값 모두를 기각역으로 설정한다. 따라서 정규 분포나 t-분포 상에서 기각역은 분포의 양쪽 꼬리에 각각 위치하게 되며, 일반적으로 설정된 유의수준 α를 양쪽으로 나누어 α/2씩 할당한다. 이는 효과의 방향(크다/작다)에 사전적인 예측이 없을 때 주로 채택되는 방식이다.
반면, 단측 검정은 대립가설이 모수가 특정 기준값보다 '크다' 또는 '작다'는 방향성을 명시적으로 가질 때 사용한다. '새로운 약이 기존 약보다 효과가 더 크다'거나 '개입 프로그램이 범죄율을 감소시킨다'는 가설이 그 예이다. 이 검정에서는 관심 있는 효과의 방향이 한쪽으로만 제한되므로, 기각역은 분포의 한쪽 꼬리(좌측 또는 우측)에만 설정된다. 설정된 전체 유의수준 α가 해당 한쪽 꼬리에 모두 할당되므로, 같은 α 수준에서 양측 검정보다 귀무가설을 기각하기가 상대적으로 용이해진다. 그러나 연구자는 효과의 방향에 대한 강한 이론적 또는 경험적 근거를 가지고 있어야 단측 검정을 정당화할 수 있다.
검정 유형 | 대립가설(H₁) 형태 | 기각역 위치 | 사용 시기 |
|---|---|---|---|
양측 검정 | μ ≠ μ₀ (다르다) | 분포의 양쪽 꼬리 | 효과 방향에 대한 예측이 없을 때 |
단측 검정 (우측) | μ > μ₀ (크다) | 분포의 우측 꼬리 | 모수가 기준값보다 클 것이라고 예측할 때 |
단측 검정 (좌측) | μ < μ₀ (작다) | 분포의 좌측 꼬리 | 모수가 기준값보다 작을 것이라고 예측할 때 |
검정 유형을 선택하는 것은 매우 중요하다. 사후적으로 데이터를 본 후에 방향을 정하는 것은 p-해킹에 해당할 수 있으며, 연구의 타당도를 심각하게 훼손한다. 또한, 단측 검정과 양측 검정에서의 p-값 계산과 임계값 비교 방법이 다르므로, 연구 설계 단계에서 검정 방향을 명확히 확정하는 것이 필수적이다.
기각역은 가설 검정에서 영가설을 기각하는 데 필요한 검정통계량의 값 또는 범위를 의미한다. 이는 사전에 설정한 유의수준에 따라 결정되며, 검정통계량이 이 영역에 속하면 영가설을 기각하고 대립가설을 지지하는 증거가 있다고 판단한다.
기각역의 위치와 크기는 검정의 형태(단측 또는 양측)와 선택한 유의수준에 따라 달라진다. 예를 들어, 95% 신뢰수준(α=0.05)에서의 양측 검정에서는 정규분포의 양쪽 꼬리 각각 2.5%에 해당하는 영역이 기각역이 된다. 이때 임계값은 대략 ±1.96이다. 만약 검정통계량의 절댓값이 1.96보다 크다면, 이는 기각역에 속하게 되어 영가설을 기각하게 된다. 반대로, 검정통계량이 기각역 바깥, 즉 비기각역에 위치하면 영가설을 기각할 충분한 증거가 없다고 결론 내린다.
기각역을 설정하는 과정은 검정의 오류, 특히 제1종 오류를 통제하는 핵심적인 단계이다. 연구자는 허용 가능한 제1종 오류의 확률인 유의수준을 먼저 정한 후, 해당 분포(예: 정규분포, t-분포)에서 이 확률에 상응하는 임계값을 찾아 기각역을 정의한다. 이렇게 함으로써 데이터에 기반한 결론이 단순한 우연에 의한 것이 아닐 가능성을 관리할 수 있다.
따라서 기각역은 가설 검정의 객관성과 엄격함을 보장하는 장치로, 검정통계량과의 비교를 통해 통계적 결론을 도출하는 명확한 기준선 역할을 한다.
결론 도출은 가설 검정의 최종 단계로, 검정 결과를 해석하고 연구 질문에 대한 통계적 결론을 내리는 과정이다. 이 단계에서는 계산된 검정통계량이나 p-값을 사전에 설정한 기준(예: 유의수준)과 비교하여 영가설을 기각할지 여부를 결정한다.
결론 도출의 핵심은 검정 결과를 '영가설 기각' 또는 '영가설 기각 실패'라는 통계적 용어로 명확히 진술하는 것이다. 만약 검정통계량이 기각역에 속하거나 p-값이 유의수준(예: 0.05)보다 작다면, 표본 데이터가 영가설 하에서는 발생하기 매우 드문 상황임을 의미한다. 이 경우 충분한 통계적 증거가 있다고 판단하여 영가설을 기각하고, 대립가설을 지지하는 방향으로 결론을 내린다. 반대로, 검정통계량이 기각역에 속하지 않거나 p-값이 유의수준보다 크다면, 표본 데이터가 영가설 하에서도 충분히 발생 가능한 상황으로 해석된다. 따라서 영가설을 기각할 만한 충분한 증거가 없다고 판단하여 '영가설을 기각하지 못한다'는 결론을 내린다.
이때 주의할 점은 '영가설을 기각하지 못한다'는 결론이 '영가설이 참이다'라는 적극적인 주장으로 해석되어서는 안 된다는 것이다. 이는 단지 현재의 표본 데이터로는 대립가설을 지지할 만한 충분한 증거를 찾지 못했다는 의미일 뿐이다. 또한, '대립가설을 채택한다'는 표현보다는 '영가설을 기각한다'는 표준적인 표현을 사용하는 것이 통계적 결론의 확률적 성격과 제1종 오류의 가능성을 정확히 반영한다. 결론 도출 후에는 이 통계적 결론을 원래의 연구 문제나 실제 상황의 맥락에서 해석하는 것이 중요하다.

Z-검정은 모집단의 분산이나 표준편차를 알고 있을 때, 표본평균이 특정한 모평균과 통계적으로 유의한 차이가 있는지를 검정하는 방법이다. 이 검정은 검정통계량으로 표준정규분포를 따르는 Z-값을 사용하며, 대표적인 모수적 검정 방법에 속한다.
Z-검정을 수행하기 위한 주요 전제 조건은 모집단의 표준편차(σ)를 알고 있어야 하며, 표본의 크기가 충분히 크거나 모집단 자체가 정규분포를 따라야 한다는 점이다. 검정 절차는 먼저 영가설과 대립가설을 설정한 후, 표본 데이터로부터 Z-값을 계산한다. Z-값은 (표본평균 - 가설된 모평균) / (모표준편차 / √표본크기) 의 공식으로 구해진다.
계산된 Z-값의 절댓값이 미리 설정한 임계값(예: 유의수준 0.05, 양측검정 시 ±1.96)보다 크면 영가설을 기각한다. 이는 표본평균과 가설된 모평균 사이의 차이가 표준오차에 비해 충분히 커, 단순한 표본 추출의 변동으로 보기 어렵다는 통계적 증거가 있다는 결론을 내리게 된다. 반대로 Z-값이 임계값보다 작으면 영가설을 기각할 충분한 증거가 없다고 판단한다.
Z-검정은 표본크기가 충분히 클 때 중심극한정리에 의해 t-검정을 대체하여 사용될 수도 있지만, 모표준편차를 정확히 알지 못하는 경우에는 t-검정이 더 적합하다. 이 검정 방법은 품질 관리, 여론 조사 결과 분석, 공정 평균 비교 등 다양한 분야에서 모집단 평균에 대한 추론을 하는 데 널리 활용된다.
t-검정은 두 집단의 평균 차이가 통계적으로 유의한지를 검정하는 방법이다. 특히 모집단의 표준편차를 알지 못하고 표본의 크기가 작을 때(n<30) 주로 사용된다. 이 검정은 윌리엄 고셋(William Sealy Gosset)이 기네스 양조장에서 근무하며 소표본 문제를 해결하기 위해 개발했으며, 그의 필명 'Student'를 따서 Student's t-test라고도 불린다.
t-검정의 핵심은 표본평균의 차이를 표준오차로 나눈 t-통계량을 계산하는 데 있다. 이 t-통계량은 자유도(degree of freedom)에 따라 모양이 변하는 t-분포를 따른다. 표본 크기가 작을수록 t-분포의 꼬리가 두꺼워져, 같은 유의수준에서도 정규분포를 사용하는 Z-검정보다 더 보수적인(기각역이 넓은) 판단을 내리게 한다. 검정 절차는 먼저 영가설(예: 두 집단 평균이 같다)과 대립가설을 설정한 후, 계산된 t-통계량이 t-분포 상의 기각역에 속하는지, 또는 p-값이 사전에 설정한 유의수준(예: 0.05)보다 작은지를 확인하여 결론을 도출한다.
t-검정은 주로 세 가지 유형으로 구분된다. 독립표본 t-검정은 서로 관련 없는 두 집단(예: 남성과 여성)의 평균을 비교할 때 사용된다. 대응표본 t-검정은 동일 집단에게 처치 전후를 비교하거나 짝을 이룬 관측치(예: 환자의 치료 전후 혈압)를 비교할 때 적합하다. 단일표본 t-검정은 하나의 표본 평균이 특정 기준값(예: 국가 평균)과 유의미하게 다른지 검정할 때 사용된다. 이 검정 방법들은 심리학, 의학, 교육학 등 다양한 분야에서 실험 결과를 분석하는 데 필수적으로 활용된다.
카이제곱 검정은 범주형 자료의 분석에 널리 사용되는 비모수적 가설 검정 방법이다. 이 검정은 관찰된 빈도와 기대 빈도 간의 차이가 통계적으로 유의미한지를 평가하여, 두 범주형 변수 간의 독립성 또는 분포의 적합도를 검정하는 데 활용된다.
검정의 핵심은 카이제곱 분포를 따르는 검정통계량을 계산하는 것이다. 이 통계량은 각 범주에서 관찰된 빈도와 기대 빈도의 차이를 제곱한 후, 기대 빈도로 나누어 합산하여 구한다. 계산된 검정통계량 값이 카이제곱 분포 상의 임계값보다 크거나, 해당하는 p-값이 사전에 설정한 유의수준 (예: 0.05)보다 작으면, 영가설을 기각하게 된다.
주요 적용 분야는 크게 두 가지로 나뉜다. 첫째는 적합도 검정으로, 표본 자료의 분포가 특정 이론적 분포(예: 정규분포, 균등분포)를 따르는지 확인한다. 둘째는 독립성 검정으로, 교차표를 활용하여 두 범주형 변수(예: 성별과 선호도) 사이에 연관성이 있는지, 즉 서로 독립적인지를 판단한다. 이 검정은 의학, 사회과학, 마케팅 등 다양한 분야에서 설문 조사 결과를 분석하거나 실험 데이터를 해석하는 데 필수적이다.
F-검정은 두 개 이상의 집단 간 평균 차이를 검정하거나, 두 모집단의 분산이 동일한지 비교할 때 사용하는 통계적 가설 검정 방법이다. 이 검정은 검정통계량으로 F-분포를 따르는 F-값을 사용하며, 주로 분산 분석과 등분산 검정에 활용된다.
F-검정의 핵심은 비교 대상인 분산의 비율을 계산하는 것이다. 예를 들어, 세 개 이상의 집단 평균을 비교하는 일원 분산 분석에서는 집단 간 변동의 평균(평균제곱)과 집단 내 변동의 평균(평균제곱)의 비율을 F-통계량으로 계산한다. 계산된 F-값이 F-분포상의 임계값보다 크면, 집단 간 평균에 유의미한 차이가 있다는 영가설을 기각하게 된다.
또 다른 주요 용도는 등분산성 가정을 검증하는 것이다. 예를 들어, 독립 이표본 t-검정을 실시하기 전에 두 집단의 모분산이 동일한지 확인하기 위해 F-검정을 수행할 수 있다. 이때 두 표본분산의 비율을 F-통계량으로 계산하여, 그 값이 유의수준 내에서 1과 크게 다르지 않으면 등분산 가정을 기각하지 않게 된다.
F-검정을 수행할 때는 검정의 목적에 따라 영가설과 대립가설을 설정하고, 계산된 F-값과 자유도를 기준으로 p-값을 구해 유의수준과 비교하여 결론을 도출한다. 이 검정은 실험 설계, 경제학, 심리학 등 다양한 분야에서 집단 비교의 핵심 도구로 널리 쓰인다.
