Hypothesis Testing 자동 분석
2-Sample t-test · One-way ANOVA · Chi-square. 데이터만 입력하면 p-value와 결론 문구를 즉시 제공합니다.
해설
- 가설검정 (Hypothesis Testing)
- 관측된 데이터가 "우연"으로 설명될 수 있는지, 아니면 "의미 있는 차이"가 있는지를 통계적으로 판단하는 절차. DMAIC의 Analyze 단계에서 잠재 X의 유의성 검증, 개선 효과 측정 등에 필수.
- 지원 검정 3종
- 2-Sample t-test (Welch's) — 두 그룹 평균 비교 (분산 동일 가정 안 함) · One-way ANOVA — 3개 이상 그룹의 평균 비교 · Chi-square 독립성 검정 — 범주형 변수 간 연관성 검정.
- 유의수준 α
- 1종 오류(거짓 양성)를 허용하는 확률. 일반적으로 0.05 사용. 안전·의료 분야는 0.01, 탐색적 분석은 0.10도 사용. 다중 비교 시 Bonferroni 보정(α/n) 권장.
자주 묻는 질문 (FAQ)
p-value는 무엇이고 어떻게 해석하나요?
p-value는 "귀무가설이 참일 때, 관찰된 데이터 또는 그보다 극단적인 결과가 나올 확률"입니다. p < α(통상 0.05)이면 귀무가설을 기각하고 통계적으로 유의한 차이가 있다고 결론짓습니다. p ≥ α는 "차이가 없다"가 아니라 "차이가 있다고 결론짓기 위한 증거가 부족하다"는 의미입니다.
Welch t-test는 일반 t-test와 무엇이 다른가요?
Welch t-test는 두 그룹의 분산이 다를 수 있다고 가정합니다(Behrens-Fisher problem). 일반 Student's t-test는 분산이 같다는 강한 가정을 하지만, 실무에서는 거의 항상 위배됩니다. 본 도구는 더 robust한 Welch 방식을 기본으로 사용합니다.
ANOVA에서 유의하다고 나오면 어느 그룹이 다른지 알 수 있나요?
아닙니다. ANOVA는 "적어도 한 그룹이 다른 그룹과 다르다"만 알려주지, 어느 그룹인지는 알려주지 않습니다. 사후분석(Post-hoc test) — Tukey HSD, Bonferroni, Scheffé 등을 추가로 수행해야 구체적인 차이를 식별할 수 있습니다.
Chi-square 검정 시 주의사항은?
Cochran's rule: 기대 빈도 5 미만 셀이 전체의 20%를 초과하면 결과가 신뢰할 수 없습니다. 작은 표본 또는 희귀 카테고리는 Fisher's Exact Test 사용을 권장합니다. 본 도구는 기대 빈도 표를 함께 제공해 주의를 환기합니다.
데이터가 정규분포가 아니어도 t-test를 쓸 수 있나요?
t-test는 정규성을 가정하지만, 중심극한정리에 의해 표본 크기가 30개 이상이면 비교적 robust합니다. 극심한 왜도·이상치가 있는 경우 Mann-Whitney U test(2그룹) 또는 Kruskal-Wallis(3+그룹) 같은 비모수 검정을 사용하세요. 분포 검증은 Nex-Kit의 분포 적합 도구를 활용 가능합니다.