분포 적합 (Distribution Fitting)
데이터를 Normal·Lognormal·Exponential·Weibull 4개 분포에 자동 적합하여 최적 분포를 추천합니다.
해설
- 4개 분포 자동 비교
- Normal(MoM) · Lognormal(MoM) · Exponential(MLE) · Weibull(MRR) 4개 분포의 파라미터를 동시에 추정하고 K-S statistic으로 적합도를 비교해 최적 분포를 추천합니다.
- 왜 Cpk 전에 분포 검증이 필요한가
- Cpk는 정규분포를 가정한 PPM(불량률)을 계산합니다. 데이터가 비대칭이면 실제 불량률이 Cpk 계산값보다 크게 차이날 수 있습니다. 본 도구로 가정을 검증한 뒤 Cpk를 사용하세요.
- K-S vs Anderson-Darling
- K-S는 빠르지만 분포 꼬리 부분에서 둔감합니다. AD 검정은 꼬리 적합도까지 평가하여 더 엄밀합니다. 본 도구는 빠른 진단용 K-S를 사용하며, 정밀 분석은 통계 소프트웨어를 권장합니다.
자주 묻는 질문 (FAQ)
분포 적합은 언제 필요한가요?
Cp/Cpk·SPC 관리도·신뢰성 분석 등 대부분의 통계 도구는 데이터가 특정 분포(주로 정규분포)를 따른다는 가정을 합니다. 가정이 위배되면 결과가 잘못될 수 있어, 사용 전 분포 검증이 필수입니다. 본 도구로 Cpk 사용 전 정규성을 빠르게 확인하세요.
K-S statistic은 무엇이고 어떻게 해석하나요?
Kolmogorov-Smirnov D는 경험적 CDF와 이론적 CDF의 최대 차이입니다. 0에 가까울수록 분포가 데이터에 잘 적합한다는 뜻으로, 본 도구는 K-S D가 작은 분포를 최적 분포로 추천합니다.
4개 분포는 각각 어떤 데이터에 적합한가요?
Normal — 대칭적 측정값(치수·무게). Lognormal — 양의 skewed 데이터(소득·시간 지연). Exponential — 시간 간격·도착 시간(랜덤 발생). Weibull — 수명·고장 시간(가장 유연).
정규분포가 아니면 어떻게 해야 하나요?
세 가지 옵션: ① 데이터 변환 (Box-Cox, log 변환) 후 다시 검증. ② 비파라메트릭 Cpk(Cnpk) 사용. ③ Weibull·Lognormal에 적합한 도구로 분석. 자동차 산업 PPAP은 변환을 우선 권장합니다.
본 도구의 한계는?
K-S 검정은 분포 검증의 빠른 진단용이며, 정밀 분석은 Anderson-Darling(AD) 검정이 권장됩니다. 또한 표본이 30개 미만이면 어떤 검정도 신뢰도가 떨어집니다. 50개 이상 권장.