본문 바로가기
반응형

분류 전체보기10

모수와 비모수 통계분석방법 이번 포스팅에서는 모수통계분석방법과 비모수통계분석 방법에 대해 알아보겠습니다. 먼저 모수통계분석방법입니다. 모수통계분석방법 모집단의 분포 또는 검정통계량의 표본분포를 안다는 했을 때 그 적합성이 성립되는 분석방법들을 모수통계분석방법이라 합니다. 검정통계량의 표본분포를 알 수 없는 상황에서는 이러한 분석방법을 사용할 수가 없습니다. 올바른 가설검정을 하기 위해서는 귀무가설과 대립가설의 차이에 민감하게 반응하는 검정통계량을 선택하여야 하며 동시에 귀무가설이 맞다고 가정할 경우에 이 검정통계량의 표본분포를 알고 있어야 합니다. 예를 들어, 모집단의 평균에 관한 가설검정에 있어서는 표본평균을 검정통계량을 사용합니다. 왜냐하면, 표본평균은 모집단 평균의 값에 민감하게 반응하며, 모집단이 정규분포를 따르는 경우에는.. 2024. 1. 21.
로또 당첨 확률 계산과 1등 당첨자 수 적정성 확인 이번 포스팅에서는 로또 등위결정방법, 당첨확률 및 당첨금 배분 구조와 로또 당첨확률 계산 방법, 1등 당첨자 수의 적정성을 확인하겠습니다. 로또는 ㈜동행복권에서 운영하고 있으며, 총당첨금은 전체 판매액의 50%입니다. 즉, 전체 판매액이 1,000억 원이라면 500억원이 당첨금으로 지급됩니다. 먼저 로또 등위결정방법, 당첨확률 및 당첨금 배분 구조에 대해 알아보겠습니다. 1. 로또 등위결정방법, 당첨확률 및 당첨금 배분 구조 로또 등위는 총 45개(1~45)의 숫자 중 6개를 뽑았을 때, 뽑힌 숫자와 구매한 로또의 일치 정도에 따라 결정되며, 1등부터 5등까지 5개의 등위가 있습니다. 5등은 45개의 숫자 중 3개의 번호를 맞추면 되며, 당첨확률은 1/45, 당첨금은 5,000원입니다. 4등은 4개의 번.. 2024. 1. 21.
효과적인 자료수집 방법 이번 포스팅에서는 효과적 자료수집 방법에 대해 알아보겠습니다. 조사의 내용이나 목적이 다양해도 본질적으로 대부분의 조사는 전체(모집단)를 모두 조사하지는 않습니다. 전체의 일부인 표본만 조사해 전체를 예측합니다. 다시 말하면 대부분의 조사에서는 모집단의 일부를 가려 이 표본에 대해서만 특성을 조사한 뒤, 이를 근거로 모집단의 특성을 추정하는 방법, 즉 표본조사를 사용합니다. 표본조사의 가장 중요한 요소는 바로 좋은 표본을 뽑는 것입니다. 좋은 표본이란 간단히 말해 '표본이 모집단의 축소판 닮은 꼴'이 되는 것입니다. 다른 말로는 모집단을 대표할 수 있는 표본, 즉 대표성을 갖는 표본을 뽑아야 합니다. 대표성이 없는 표본으로부터는 아무리 신뢰성 있게 자료를 수집하더라도 모집단의 특성을 추정할 때 ‘장님 코.. 2024. 1. 20.
표본추출 이해 이번 포스팅에서는 표준추출에 대해 알아보겠습니다. 무작위 표본추출 귀납적 추론과정에서는 해당 모집단의 모수를 추정량을 통해 추정하게 되는데 그 추정이 얼마나 정확할 것인가 하는 문제는 추출된 표본이 얼마나 좋은 표본인가에 따라 결정됩니다. 좋은 표본이란 표본이 어느 정도로 모집단을 대표하는가로 판단합니다. 무작위 표본이 되기 위해서는 첫째 모집단에 있는 모든 개체가 표본으로 뽑힐 확률이 동일해야 하고, 둘째 각 개체는 독립적으로 뽑혀야 합니다. 첫째 조건은 표본을 추출하는 과정이 공정해야 한다는 의미이고, 둘째 조건은 가능한 한 정보의 독립성을 높이기 위한 것입니다. 이처럼 모집단에 있는 모든 개체가 표본에 포함될 확률이 동일하도록 만들어진 표본은 대표성을 갖습니다. 대통령에 출마한 후보자에 대한 지지도.. 2024. 1. 15.
정규분포 이해 및 실생활 활용 이번 포스팅에서는 정규분포를 이해하고 활용하는 것에 대해 알아보겠습니다. 정규분포는 통계학에서 가장 대표적인 연속 확률분포이며, 가장 많이 사용됩니다. 정규분의 모양이 종 모양 형태이기 때문에 종형분포라고 불리기도 하며, 가우스분포라고 합니다. 통계조사의 대상이 되는 대부분의 통계자료는 정규분포 또는 정규분포에 근사한 형태입니다. 먼저 정규분포의 정의는 다음과 같습니다. 정의 정규분포는 연속확률 분포중 가장 대표적인 형태로 가우스분포라고도 하며, 다음식으로 표현되는 확률분포를 정규분포라 합니다. μ는 평균, σ 는 표준편차를 의미합니다. 정규분포(Normal Distribution)에서 ‘정규(Normal)’ 명칭이 쓰이게 된 이유는 보통 자료의 분포가 정규분포에 가까운 형태를 지니고 있어야 일반적이고,.. 2024. 1. 14.
통계적 가설검정 의미와 절차 안녕하세요. 이번 포스팅에서는 통계적 가설검정의 의미와 절차에 대해 알아보겠습니다. 가설의 검정은 통계적 추론에 있어 가장 중요한 영역으로, 표본자료에서 얻은 통계량을 이용하여 모집단의 특성인 모수에 대한 정보를 분석하는 과정이라고 할 수 있습니다. 즉, 표본자료를 이용하여 통계적 방법으로 모집단 특성에 대한 주장을 받아들이거나 기각하는 의사결정이 가설검정입니다. 검정의 대상이 되는 가설은 모집단의 평균이나 비율 등에 대해 설정할 수 있으며, 어떤 경우에서나 가설을 검정하는 과정은 다음의 다섯 단계를 거치게 됩니다. 1단계 : 가설과 그에 따른 의사결정 대안을 설정합니다. 2단계 : 의사결정의 오류에 대한 비용을 결정합니다. 3단계 : 유의수준을 선택합니다. 4단계 : 자료를 수집하고 표본통계치를 계산합.. 2024. 1. 14.
분산도 종류 및 특징 이번 포스팅에서는 분산도의 종류 및 특징에 대해 살펴보겠습니다. 주어진 자료의 특성을 완전하게 기술하게 이해하기 위해서는 산출평균, 중앙치 등의 중심경향치와 함께 각 관측치들이 서로 얼마나 밀집 또는 분산되어 있는가를 알아야 합니다. 통계적 분석이 필요한 이유 중 하나는 자료의 변동성입니다. 자료에 변동이 없다면, 즉 모든 관측치가 똑같다면 통계적 분석을 거치지 않고도 자명한 결론을 얻을 수 있습니다. 변동이 적을수록 자료에서 얻은 대표치의 신뢰도는 높아집니다. 관측치들의 퍼진 정도, 즉 분산도를 측정하기 위한 통계량은 범위, 사분편차, 분산과 표준편차, 변동계수, 왜도, 첨도가 있습니다. 각각의 특징에 대해 알아보겠습니다. 먼저 범위입니다. 범위 범위란 주어진 자료에서 가장 큰 값과 가장 작은 값의 차.. 2024. 1. 13.
중심경향치 종류, 특징, 선택 안녕하세요. 이번에는 자료의 중심을 어떻게 해야 잘 나타낼 수 있는지, 중심경향치에 대해 살펴보겠습니다. 임의로 선정한 다섯 명의 키가 각각 165cm, 168cm, 171cm, 175cm, 179cm 일 경우, 이들 다섯 명의 키를 하나의 대표적 수치로 나타내고 싶다면 얼마로 하는 것이 전체적 경향을 잘 나타낸다고 할 수 있을까요? 이런 경우에 쓰이는 척도가 중심경향치(measure of central tendency)입니다. 즉, 중심경향치는 자료에 포함된 관측값들이 어디에 집중되어 있는가, 또는 자료 전체를 대표할 수 있는 값은 얼마인가를 알아보기 위한 척도입니다. 후자의 의미에서 중심경향치는 대푯값이라고도 합니다. 먼저 가장 일반적으로 사용하는 산술평균부터 알아보겠습니다. 산술평균 산술평균은 가장.. 2024. 1. 13.
통계분석 관련 자료(DATA) 종류 안녕하세요. 이번 포스팅에서는 통계분석 관련 DATA의 종류에 대해 알아보겠습니다. 통계분석에서는 여러 가지 형태의 자료가 이용되며, 자료의 형태에 따라 적용되는 분석기법도 다양합니다. 분석자료(data set)는 다수의 관측대상들로 구성되는데, 각 관측대상은 분석자료의 기본단위가 됩니다. 기본단위로는 소비자, 가구, 기업, 하청업체 등이 될 수 있습니다. 통계분석을 위하여 필요한 변수에 관한 정보를 기본단위부터 수집한 것이 분석자료입니다. 예를 들어 매출을 책임지는 관리 책임자의 자료에는 많은 관계된 업체들의 기업규모, 주문 품목, 주문 시기 등의 정보가 있을 것입니다. 이때 기본단위는 관계 업체이고, 변수들은 기업규모, 주문 품목, 주문 시기 등이 됩니다. 통계분석에서 우리는 주로 변수의 관측값들이 .. 2024. 1. 13.
통계적 분석 절차 안녕하세요. 이번 포스팅에서는 통계적 분석 절차에 대해 살펴보겠습니다. 의사결정에 필요한 정보를 수집할 목적으로 통계적 방법을 활용할 때, 우리가 수행하는 통계적 분석작업은 설계, 탐색, 추정, 가설검정으로 구분할 수 있습니다. 먼저 설계단계는 다음과 같습니다. 1. 설계단계 통계적 분석을 위해서는 자료수집을 위한 설계가 필요합니다. 통계분석에 사용하는 자료를 수집하는 방법은 표본조사, 실험계획, 과거실적자료로 나누어 볼 수 있습니다. 표본조사는 시장수요 파악, 신제품 설계, 경쟁력 확보를 위한 전략수립 등의 목적으로 조사할 경우에 필요한 자료를 확보하기 위한 방법입니다. 실험계획은 화학공장의 공정최적화, 품질 원가 등 표준설정을 위한 효과적 방법으로 자연과학 분야에서 사용빈도가 높습니다. 과거실적자료는.. 2024. 1. 13.
반응형