이번 포스팅에서는 표준추출에 대해 알아보겠습니다.
무작위 표본추출
귀납적 추론과정에서는 해당 모집단의 모수를 추정량을 통해 추정하게 되는데 그 추정이 얼마나 정확할 것인가 하는 문제는 추출된 표본이 얼마나 좋은 표본인가에 따라 결정됩니다.
좋은 표본이란 표본이 어느 정도로 모집단을 대표하는가로 판단합니다. 무작위 표본이 되기 위해서는 첫째 모집단에 있는 모든 개체가 표본으로 뽑힐 확률이 동일해야 하고, 둘째 각 개체는 독립적으로 뽑혀야 합니다.
첫째 조건은 표본을 추출하는 과정이 공정해야 한다는 의미이고, 둘째 조건은 가능한 한 정보의 독립성을 높이기 위한 것입니다. 이처럼 모집단에 있는 모든 개체가 표본에 포함될 확률이 동일하도록 만들어진 표본은 대표성을 갖습니다.
대통령에 출마한 후보자에 대한 지지도 조사에서 조사표본에 성별, 연령, 지역, 학력, 소득, 직업 등이 전체 유권자의 비율과 같게 포함되어 있어야 합니다. 그렇지 못한 경우의 표본을 편의표본이라고 합니다.
모든 개인은 각각 독특한 개성을 가지고 있으므로 완전한 대표성을 기대할 수는 없습니다. 표본추출과정에서 특정 특성을 가진 개인이 의도적으로 배제되지 않으면 대표성을 갖는다고 해도 무방합니다.
전문기관의 표본추출법
대부분의 전문여론조사기관은 유권자 선호조사 시 단순무작위 표본추출법을 사용하지 않습니다.
단순무작위 표본추출법을 이용하기 위해서는 전국의 유권자 명단을 가지고 있어야 하며, 이러한 명단이 있어 추출이 가능하다 할지라도 표본으로 뽑힌 유권자는 전국에 걸쳐 흩어져 있게 되어 그들을 면접하기 위해서는 상당한 비용과 시간을 소모해야 하기 때문입니다.
실제로 많은 여론조사기관은 확률표본추출절차인 단계적 집단표본추출법을 주로 이용합니다. 이 방법은 전국을 크게 몇 개의 지역으로 분할하고, 각 지역을 다시 크기에 따라 몇 개의 집단으로 만든 후에 무작위추출법으로 집단을 추출하여 선정된 집단내에서 조사대상가구를 무작위로 추출합니다.
단계적이란 말은 단순히 표본추출의 과정이 몇 단계에 걸쳐 이루어진다는 것을 의미하며, “집단”이란 한 지역내에 있는 도시들을 크기별로 집단화한다는 것을 의미합니다.
갤럽의 경우 약 1,500명의 유권자를 표본으로 선정하지만, 그 추정결과는 일반적으로 2% 내지 3% 정도의 오차한계를 보여 줄 정도로 정확한 것으로 알려져 있습니다.
편의
통계분석을 위한 표본은 무작위 표본과 편의표본으로 구분할 수 있습니다.
무작위표본은 모집단의 모든 개별 관측치가 표본에 포함될 확률이 비슷한 표본을 말하며 편의표본은 특정 표본에 포함될 기회가 다른 표본에 포함될 기회보다 크거나 작은 표본을 말합니다.
편의표본에서는 표본이 모집단을 대표하지 못하므로, 평균이나 표준편차 등의 모집단 모수가 과대 또는 과소하게 추정될 가능성이 있습니다.
표본추출의 편의란 바로 이 자료수집과정의 실수를 의미하는 것으로, 편의표본이 되는 원인은 대개 선정편의, 응답편의, 무응답편의로 분류될 수 있습니다. 선정편의란 표본 추출시 모집단의 일부가 체계적으로 제외되는 경향을 의미합니다.
선정편의를 없애기 위해서는 모든 모집단의 구성원이 똑같은 확률로 표본에 뽑힐 수 있도록 해야 합니다. 단순히 표본의 크기를 증가시키는 것만으로는 선정편의 현상을 줄일 수 없으며 오히려 악화시킬 우려가 큽니다.
응답편의의 현상은 일반적으로 대중의견조사에서 나타납니다. 조사자는 질문내용을 약간 바꾸어 줌으로써 어떤 문제에 대한 응답에 영향을 미칠 수 있습니다. 이러한 편의현상도 표본크기를 크게 한다고 해서 없어지지는 않으며 무작위 표본추출로도 이런 현상은 줄일 수는 없습니다.
응답편의는 표본이 문제가 아니라 어떤 방식으로 질문을 하느냐, 질문을 어떻게 표현하느냐, 누가 질문하느냐 등이 문제가 되기 때문입니다.
마지막으로 많은 수의 무응답은 표본통계량에 심각한 편의현상을 일으킬 수 있습니다. 무응답편의는 선정편의와는 구별됩니다.
선졍편의는 설문서를 우송받은 집단이 모집단의 대표집단이 아닐 경우를 말하여, 무응답편의는 응답한 집단이 대표집단이 아닐 때 발생합니다. 이 경우 물론 응답해 오지 않는 사람들을 다시 뽑아 표본의 크기를 크게 하면 무응답편의를 감소시킬 수 있습니다.
따라서 여론조사에서는 최소한 응답자와 무응답자가 연령, 성별, 경제 사회적 위치로 보아 체계적으로 어떤 차이가 있는지를 검토해야 하고 어떤 뚜렷한 차이가 있을 수 있다면 이러한 조사를 바탕으로 하여 통계적 추론을 시도해서는 안 됩니다.
이상으로 표본추출에 대해 알아보았습니다.
감사합니다.
'(1) 통계개념' 카테고리의 다른 글
모수와 비모수 통계분석방법 (1) | 2024.01.21 |
---|---|
효과적인 자료수집 방법 (0) | 2024.01.20 |
정규분포 이해 및 실생활 활용 (0) | 2024.01.14 |
통계적 가설검정 의미와 절차 (0) | 2024.01.14 |
분산도 종류 및 특징 (0) | 2024.01.13 |