STUDY_SEONMIN

DAY37 - 등분산검정, 정규성검정 본문

EDUCATION/DSS Online 6기

DAY37 - 등분산검정, 정규성검정

Kululu_ 2021. 3. 8. 13:22

등분산검정

- 두 정규분포로부터 생성된 두 개의 데이터 집합으로부터 두 정규분포의 분산 모수가 같은지 확인하기 위한 검정

- 독립표본 t검정(두 정규분포의 기대값이 같은지 비교)을 하기 위해서는 먼저 두 정규분포의 분산이 같은지를 알아야하는데, 이를 검정하는 것이 "등분산검정"입니다.

- 등분산검정에는 다양한 방법들이 있는데 주로 bartlett, fligner, levene 검정을 사용합니다.

- 파이썬에서는 scipy.stats의 bartlett, flingner, levene 함수를 사용해 구현할 수 있습니다.

 

이 때 각각의 검정 방법마다 결과가 다르게 나올 수 있습니다. 여기서도 만약 유의수준을 1%로 설정한다면 bartlett 검정으로는 "두 정규분포의 분산이 같다"는 결론을 얻게 되고, 나머지 2개의 검정방법으로는 "두 정규분포의 분산이 다르다"는 결론을 얻게 됩니다.

 

이럴 때에는 각자의 판단에 의해 결론을 가져가야 합니다.

 

정규성검정

- 확률변수의 확률분포가 정규분포를 따르는지를 확인하는 검정 방법입니다.

- 등분산검정과 마찬가지로 매우 다양한 검정방법들이 있습니다.

    1) 콜모고로프-스미르노프 검정 : scipy.stast.sk_2samp, statsmodels.stats.diagnostic.kstest_normal

    2) 샤피로-윌크 검정 : scipy.stats.shapiro

    3) 앤더스-달링 검정 : scipy.stast.anderson

    4) 다고스티노 K-제곱 검정 : scipy.stats.mstats.normaltest

    5) 옴니버스 검정 : statsmodels.stats.stattools.omni_normtest

    6) 자크-베라 검정 : statsmodels.stats.stattools.jarque_bera

    7) 릴리포스 검정 : statsmodels.stats.diagnostic.lillifors

 

- 콜모고로프 스미르노프 검정은 사실 정규분포에 국한되지 않고 두 표본이 같은 분포를 따르는지 확인할 수 있는 방법입니다. 따라서 콜모고로프 스미르노프 검정은 한 표본을 정규분포로부터 생성된 표본을 넣고 나머지에 우리가 가진 데이터를 넣어서 해당 정규분포를 따르는지 확인하는 것입니다.

Comments