안녕하세요. 이번 포스팅에서는 통계적 가설검정의 의미와 절차에 대해 알아보겠습니다.
가설의 검정은 통계적 추론에 있어 가장 중요한 영역으로, 표본자료에서 얻은 통계량을 이용하여 모집단의 특성인 모수에 대한 정보를 분석하는 과정이라고 할 수 있습니다.
즉, 표본자료를 이용하여 통계적 방법으로 모집단 특성에 대한 주장을 받아들이거나 기각하는 의사결정이 가설검정입니다. 검정의 대상이 되는 가설은 모집단의 평균이나 비율 등에 대해 설정할 수 있으며, 어떤 경우에서나 가설을 검정하는 과정은 다음의 다섯 단계를 거치게 됩니다.
1단계 : 가설과 그에 따른 의사결정 대안을 설정합니다.
2단계 : 의사결정의 오류에 대한 비용을 결정합니다.
3단계 : 유의수준을 선택합니다.
4단계 : 자료를 수집하고 표본통계치를 계산합니다.
5단계 : 표본통계치를 이용하여 가설의 수용여부와 이에 따른 최선의 대안을 선택합니다.
먼저 통계적 가설에 대해 알아 보겠습니다.
통계적 가설
하나의 가설을 설정한다면 이는 우리가 관심을 가지고 있는 모집단에 대한 미지의 특성에 관한 가정이나 주장입니다. 가설은 우리가 알지 못하는 실상에 대한 정확한 설명일 수도 있고 잘못된 설명일 수도 있습니다.
그러므로, 표본자료를 이용하여 우리가 설정한 가설이 옳다고 보아야 하는지, 아니면 틀리다고 보아야 하는지를 결정합니다.
하나의 가설이 있을 때 표본자료를 이용하여 통계적 분석으로 그 가설의 진위를 평가할 수 있을 때, 우리는 그 가설을 통계적 가설이라고 합니다.
가설검정에서는 두 가설 중 어느 쪽에 더 가능성이 높은 지를 결정합니다. 그러므로, 가설검정에서는 이들 두 가설은 각각 특별한 역할을 합니다.
귀무가설(null hypothesis)은 현재 문제가 되고 있는 사안에 대한 확실한 증거가 없을 때 우리가 받아들여야 할 일반적 관념입니다.
하나의 새로운 변화가 있을 때 그것의 효과에 대하여 “아무런 차이가 없다” 또는 “전혀 효과가 없다”는 내용의 주장으로 그것이 틀렸다는 증거가 없는 한 타당한 것으로 받아들여야 하는 가설입니다.
대립가설(alternative hypothesis)은 연구조사에서 주장하고자 하는 내용이므로 연구가설이라고도 합니다.
귀무가설이 “아무런 차이가 없다” 또는 “전혀 효과가 없다”는 내용을 담은 주장인데 반해, 대립가설은 “차이가 있다” 또는 “효과가 있다”는 주장을 담은 것으로 귀무가설과 정반대의 내용을 담도 있습니다.
이러한 대립가설은 귀무가설이 사실이 아니라는 확신할 만한 통계적 증가가 있을 때에만 타당한 것으로 인식합니다.
사람들은 흔히 대립가설에 관심이 있고 그것을 주장하기 위해 귀무가설을 만듧니다. 그리고 나서 “ 나의 실험결과가 귀무가설이 맞는 경우에는 나타날 가능성이 희박하므로 나의 주장은 대립가설이다”라고 합니다.
다음은 가설검정의 결론과 오류에 대한 내용입니다.
가설검정의 결론과 오류
가설검정에서는 항상 한 쌍의 가설 중 하나만을 타당한 것을 받아들입니다. 즉, 가설검정의 최종적 결론은 다음 중 어느 하나를 선택하는 형식을 취합니다.
A : 귀무가설을 합당한 것으로 받아들입니다. (귀무가설을 기각하지 못합니다.)
B : 귀무가설을 기각하고 대립가설을 합당한 것으로 받아들입니다.
B를 선택하여 대립가설을 합당한 것으로 수용한다고 해서 그것이 맞다고 증명하는 것은 아닙니다. 단지 가능성이 더 높다는 것을 의미합니다.
귀무가설을 기각할 만한 충분한 증거를 찾지 못하였을 때, 우리는 A를 선택합니다. 그렇다고 해도 우리는 결코 대립가설을 기각한다고는 말하지 않습니다.
이것은 귀무가설을 유리한 위치에 두고, 귀무가설을 반대한 만한 충분한 증거가 없을 때에는 그것을 받아들인다는 가설검정의 논리 때문입니다.
의사결정 오류에는 제1종 오류와 제2종 오류가 있습니다. 제1종 오류란 귀무가설이 모집단의 특성을 제대로 나타내고 있음에도 불구하고 이를 기각하게 되는 오류를 말하며, 제2종 오류는 귀무가설이 모집단의 특성을 잘못 설명하고 있음에도 불구하고 이를 받아들이는 오류입니다.
마지막으로 유의수준의 결정입니다.
유의수준의 결정
가설검정에서는 결론과 함께 항상 오류가능성을 동시에 제시합니다.
통계적 추론에서 “α”로 표기하는 유의수준은 제1종 오류를 범할 확률을 의미합니다. 즉, 유의수준이란 귀무가설을 기각했지만, 사실은 귀무가설이 모집단 특성을 제대로 설명하였을 가능성입니다.
용의자가 사실은 무죄이나 유죄로 판결을 내릴 확률이 유의수준입니다. 유의수준을 낮게 잡으면 제1종 오류가 작아져, 귀무가설이 옳은데도 그것을 기각함으로써 의사결정이 잘못된 가능성은 낮아집니다.
그러므로 유의수준은 가능한 낮게 잡아야 하지만, 유의수준이 낮아질수록 제2종 오류와 이에 따른 비용이 증가합니다. 결국 적당한 수준에서 절충하여야 합니다.
이상으로 통계적 가설검정의 의미와 절차에 대해 알아보았습니다.
감사합니다.
'(1) 통계개념' 카테고리의 다른 글
표본추출 이해 (1) | 2024.01.15 |
---|---|
정규분포 이해 및 실생활 활용 (0) | 2024.01.14 |
분산도 종류 및 특징 (0) | 2024.01.13 |
중심경향치 종류, 특징, 선택 (0) | 2024.01.13 |
통계분석 관련 자료(DATA) 종류 (0) | 2024.01.13 |