STUDY_SEONMIN
DAY37 - 등분산검정, 정규성검정 본문
등분산검정
- 두 정규분포로부터 생성된 두 개의 데이터 집합으로부터 두 정규분포의 분산 모수가 같은지 확인하기 위한 검정
- 독립표본 t검정(두 정규분포의 기대값이 같은지 비교)을 하기 위해서는 먼저 두 정규분포의 분산이 같은지를 알아야하는데, 이를 검정하는 것이 "등분산검정"입니다.
- 등분산검정에는 다양한 방법들이 있는데 주로 bartlett, fligner, levene 검정을 사용합니다.
- 파이썬에서는 scipy.stats의 bartlett, flingner, levene 함수를 사용해 구현할 수 있습니다.
이 때 각각의 검정 방법마다 결과가 다르게 나올 수 있습니다. 여기서도 만약 유의수준을 1%로 설정한다면 bartlett 검정으로는 "두 정규분포의 분산이 같다"는 결론을 얻게 되고, 나머지 2개의 검정방법으로는 "두 정규분포의 분산이 다르다"는 결론을 얻게 됩니다.
이럴 때에는 각자의 판단에 의해 결론을 가져가야 합니다.
정규성검정
- 확률변수의 확률분포가 정규분포를 따르는지를 확인하는 검정 방법입니다.
- 등분산검정과 마찬가지로 매우 다양한 검정방법들이 있습니다.
1) 콜모고로프-스미르노프 검정 : scipy.stast.sk_2samp, statsmodels.stats.diagnostic.kstest_normal
2) 샤피로-윌크 검정 : scipy.stats.shapiro
3) 앤더스-달링 검정 : scipy.stast.anderson
4) 다고스티노 K-제곱 검정 : scipy.stats.mstats.normaltest
5) 옴니버스 검정 : statsmodels.stats.stattools.omni_normtest
6) 자크-베라 검정 : statsmodels.stats.stattools.jarque_bera
7) 릴리포스 검정 : statsmodels.stats.diagnostic.lillifors
- 콜모고로프 스미르노프 검정은 사실 정규분포에 국한되지 않고 두 표본이 같은 분포를 따르는지 확인할 수 있는 방법입니다. 따라서 콜모고로프 스미르노프 검정은 한 표본을 정규분포로부터 생성된 표본을 넣고 나머지에 우리가 가진 데이터를 넣어서 해당 정규분포를 따르는지 확인하는 것입니다.
'EDUCATION > DSS Online 6기' 카테고리의 다른 글
DAY37 - 조건부엔트로피 (0) | 2021.03.08 |
---|---|
DAY37 - 엔트로피 (0) | 2021.03.08 |
DAY37 - 카이제곱 독립검정, 단일표본 검정, 독립표본 검정, 대응표본 검정 (0) | 2021.03.08 |
DAY36 - 이항검정, 카이제곱검정 (0) | 2021.03.07 |
DAY36 - 검정 (0) | 2021.03.07 |