본문 바로가기
(1) 통계개념

중심경향치 종류, 특징, 선택

by 경이로움1 2024. 1. 13.
반응형

 

중심경향치
중심경향치

 

안녕하세요. 이번에는 자료의 중심을 어떻게 해야 잘 나타낼 수 있는지, 중심경향치에 대해 살펴보겠습니다.

 

임의로 선정한 다섯 명의 키가 각각 165cm, 168cm, 171cm, 175cm, 179cm 일 경우, 이들 다섯 명의 키를 하나의 대표적 수치로 나타내고 싶다면 얼마로 하는 것이 전체적 경향을 잘 나타낸다고 할 수 있을까요?

 

이런 경우에 쓰이는 척도가 중심경향치(measure of central tendency)입니다. , 중심경향치는 자료에 포함된 관측값들이 어디에 집중되어 있는가, 또는 자료 전체를 대표할 수 있는 값은 얼마인가를 알아보기 위한 척도입니다. 후자의 의미에서 중심경향치는 대푯값이라고도 합니다.

 

먼저 가장 일반적으로 사용하는 산술평균부터 알아보겠습니다.

 


 산술평균 


산술평균은 가장 보편적으로 사용되고 있는 중심경향치입니다. 간단히 평균이라고 할 때, 일반적으로 산술평균을 의미합니다.

 

산술평균은 모든 관측치들을 다 합한 뒤 그 합을 전체 관측치의 수로 나누어 계산하므로, 관측치 크기가 의미를 갖는 정량적 자료에서 계산할 수 있습니다.

 

예를 들어, 한 편의점의 최근 10일간 일일 매출액(단위:백만원)이 31, 33, 36, 36, 37, 38, 39, 41, 44, 47 이라고 하면, 산술평균은 다음과 같이 계산할 수 있습니다.

 

산술평균 = (31 + 33 + 36 + 36 + 37 + 38 + 39 + 41 + 44 + 47) / 10 = 38.2(백만원)

, 평균적으로 보아 해당 편의점의 최근 10일간 매출액은 38.2(백만원)이라고 할 수 있습니다.

 

다음은 중앙치입니다.

 


 중앙치 


중앙치(median)는 관측치의 분포가 극도로 편재되어 있는 경우 또는 서수자료에 많이 쓰이는 중심경향치로, 모든 관측치를 크기의 순서대로 나열했을 때 중앙에 있는 관측치의 값을 의미합니다.

 

그러나 관측치의 수가 짝수개이면 중앙이 없으므로 중앙에 가장 가까운 두 값의 평균을 취하여 중앙치로 합니다.

 

앞에서 설명한 산술평균의 편의점 매출의 예를 통해 중앙치를 계산해 봅니다. 중앙치를 계산하기 위해서는 우선 관측치를 크기 순으로 재배열하면 다음과 같습니다

 

               31, 33, 36, 36, 37, 38, 39, 41, 44, 47

 

상부에 총 관측치의 50%, 하부에 나머지 50%가 놓여지는 분기점을 선택하면 됩니다. 이 경우, 관측치가 모두 10개이므로 정확히 중앙에 위치하는 관측치는 존재하지 않습니다.

 

예를 들어, 중앙치를 37로 설절하는 경우 이보다 작은 값은 4개이고 이보다 큰 값은 5개이므로, 정확하게 중앙에 위치하지 않습니다.

 

관측치의 수가 이와 같이 짝수인 경우에는 중앙에 위치하는 두 개의 관측치를 찾은 뒤, 이를 두 관측치의 중간값을 중앙치로 정하면 됩니다.

 

편의점 10일간 매출액의 경우 중앙에 위치하는 두 개의 관측치는 3738이 되므로, 중앙치는 대략 37.5가 됩니다.

 

중앙치와 산출평균의 차이는 중앙치의 경우 그 값보다 크거나 작은 관측치는 전혀 고려하지 않는 반면, 산술평균은 모든 관측치의 값을 다 반영하는 데 있고 볼 수 있습니다.

 

따라서, 다른 관측치들보다 지나치게 크거나 작은 값이 포함된 경우(이러한 관측치를 특이치라고 합니다)에는, 중앙치와 산출평균이 차이가 커지게 됩니다

 

중앙치는 소득과 같은 인구통계학적 자료나 경기변동 자료의 요약에 자주 사용하게 되는데, 이는 지나치게 큰 값이 자료 전체의 특성을 흐려버리는 경향을 줄이기 위해서입니다. 물론 특이값이 존재하지 않는 경우에는 중앙치와 산술평균값은 대개 비슷해집니다.

 

다음은 최빈치에 대해 알아보겠습니다.


 최빈치 


최빈치(mode)는 주어진 자료에서 가장 많이 나타나고 있는 관측치를 말합니다.

 

산술평균의 예처럼,  한 편의점의 10일간 매출액이  31, 33, 36, 36, 37, 38, 39, 41, 44, 47 의 형태로 나타났다면, 최빈치는 이 중 나타난 빈도가 가장 높은 36이 됩니다.

 

자료가 도수분포표나 히스토그램 형태로 요약되어 있는 경우, 간단히 최빈 구간의 중간값을 최빈치로 해도 됩니다.

 

마지막으로 기하평균은 아래와 같습니다.


 기하평균 


기하평균은 산술평균만큼 널리 사용되지는 않으나, 평균인구증가율, 평균물가상승률 등을 계산하는데 사용됩니다. n개의 관측치의 기하평균은 이들 관측치들의 곱의 n제곱근으로 정의합니다.

 

 

지금까지 중심경향치로 사용되는 산술평균, 중앙치, 최빈치, 기하평균에 대해 알아봤는데요, 어떤 자료에 대해 어떤 경향치를 선택해야 중심을 잘 나타낼 수 있을지 중심경향치의 선택에 대해 알아보겠습니다.

 


 중심경향치 선택 


산술평균은 계산과 정의가 쉽고 모든 관측치를 다 고려한다는 점에서 가장 많이 이용되고 있습니다. 그러나, 중앙치와 최빈치도 특징이 있으므로, 어떤 척도를 사용할 것인가를 결정하고자 할 때 우리가 고려해야 할 몇 가지 사항이 있습니다.

 

첫째, 주어진 자료의 특성을 감안해야 합니다. 관측치들의 분포가 거의 좌우대칭이며, 봉우리가 하나인 형태를 취할 때에는 어떤 대표치를 선택하더라도 큰 문제가 없습니다.

 

그러나 왼쪽 또는 오른쪽으로 편향된 분포형태를 취할 때에는 단순히 산술평균만을 그 대표치로 삼아서는 곤란합니다. 이러한 경우에는 산술평균과 함께 중앙치를 대푯값으로 사용해야 합니다.

 

둘째, 자료의 분포에 극단적으로 크거나 작은 값을 갖는 관측치가 포함되어 있는 경우에는 산출평균을 그 대표치로 선택해서는 곤란합니다.

 

산출평균은 이 극단치가 분포의 어느 쪽에 포함되어 있느냐에 따라 큰 영향을 받게 되지만, 중앙치의 경우 산출평균에 비해서는 그 영향의 정도가 극히 미미합니다.

 

최빈치는 속해 있는 사례수가 가장 많은 구간에 의해 결정되므로, 중앙치와 마찬가지로 극단치의 영향을 받지 않습니다.

 

셋째, 중심경향치는 자료를 대표하는 기능도 있지만 통계분석에 사용될 수 있어야 합니다.

 

산술평균은 분산의 계산과 가설검정 등의 통계처리에 사용될 수 있지만, 중앙치나 최빈치는 대개 대표치로서의 기능만으로 끝나게 되는 경우가 많습니다.

 

따라서, 주어진 자료에서 대푯값 이외의 통계정 정보를 얻고자 하는 경우에는 산술평균을 선택하는 것이 바람직하다고 할 수 있습니다.

 

이상으로 중심경향치가 종류와 특징, 선택에 대해 알아봤습니다.

 

감사합니다.

 

 

함께보면 도움 되는 글

 

통계적 분석 절차

안녕하세요. 이번 포스팅에서는 통계적 분석 절차에 대해 살펴보겠습니다. 의사결정에 필요한 정보를 수집할 목적으로 통계적 방법을 활용할 때, 우리가 수행하는 통계적 분석작업은 설계, 탐

wmhb.kr

 

통계분석 관련 자료(DATA) 종류

통계분석에서는 여러 가지 형태의 자료가 이용되며, 자료의 형태에 따라 적용되는 분석기법도 다양합니다. 분석자료(data set)는 다수의 관측대상들로 구성되는데, 각 관측대상은 분석자료의 기

wmhb.kr

 

분산도 종류 및 계산

주어진 자료의 특성을 완전하게 기술하게 이해하기 위해서는 산출평균, 중앙치 등의 중심경향치와 함께 각 관측치들이 서로 얼마나 밀집 또는 분산되어 있는가를 알아야 합니다. 통계적 분석이

wmhb.kr

 

통계적 가설검정의 의미와 절차

가설의 검정은 통계적 추론에 있어 가장 중요한 영역으로, 표본자료에서 얻은 통계량을 이용하여 모집단의 특성인 모수에 대한 정보를 분석하는 과정이라고 할 수 있습니다. 즉, 표본자료를 이

wmhb.kr

 

정규분포 이해 및 활용

정규분포는 통계학에서 가장 대표적인 연속 확률분포이며, 가장 많이 사용됩니다. 정규분의 모양이 종 모양 형태이기 때문에 종형분포라고 불리기도 하며, 가우스분포라고 합니다. 통계조사의

wmhb.kr

 

표본추출 이해

무작위 표본추출 귀납적 추론과정에서는 해당 모집단의 모수를 추정량을 통해 추정하게 되는데 그 추정이 얼마나 정확할 것인가 하는 문제는 추출된 표본이 얼마나 좋은 표본인가에 따라 결정

wmhb.kr

 

인구 관련 통계학 이해(1)

인구 증가율 인구 증가율은 특정 지역의 인구가 일정기간 증가하는 비율을 의미하며, 출생자 수에서 사망자 수를 차감한 후, 이 수를 전체 인구수로 나누어 계산합니다. 한 국가가 계속 성장하

wmhb.kr

 

인구 관련 통계학 이해(2)

도시화율 도시화율은 도시 지역에 거주하는 인구의 비율을 의미합니다. 도시화율은 보통 높은 인구 밀도, 문화, 경제활동이 집중되어 나타납니다. 이 비율은 국가의 개발 수준의 척도로 사용되

wmhb.kr

 

통계학의 기원 및 일상 생활에서의 통계학

통계학의 기원 통게학은 17세기에 들어서며 학문으로 확립되었지만, 그 이전부터 고대 로마, 중국, 바빌로니아 등에서 인구 조사 등 간단한 통계가 행해졌습니다. 고대 로마제국의 초대 황제 아

wmhb.kr

 

효과적인 자료수집 방법

조사의 내용이나 목적이 다양해도 본질적으로 대부분의 조사는 전체(모집단)를 모두 조사하지는 않습니다. 전체의 일부인 표본만 조사해 전체를 예측합니다. 다시 말하면 대부분의 조사에서는

wmhb.kr

 

모수와 비모수 통계분석방법

모수통계분석방법 모집단의 분포 또는 검정통계량의 표본분포를 안다는 가정에서 그 적합성이 성립되는 분석방법들을 모수통계분석방법이라 부릅니다. 검정통계량의 표본분포를 알 수 없는

wmhb.kr

 

로또 당첨 확률 계산과 1등 당첨자 수 적정성 확인

이번 포스팅에서는 로또 등위결정방법, 당첨확률 및 당첨금 배분 구조와 로또 당첨확률 계산 방법, 1등 당첨자 수의 적정성을 확인하겠습니다. 로또는 ㈜동행복권에서 운영하고 있으며, 총당첨

wmhb.kr

 

 

반응형

'(1) 통계개념' 카테고리의 다른 글

정규분포 이해 및 실생활 활용  (0) 2024.01.14
통계적 가설검정 의미와 절차  (0) 2024.01.14
분산도 종류 및 특징  (0) 2024.01.13
통계분석 관련 자료(DATA) 종류  (0) 2024.01.13
통계적 분석 절차  (2) 2024.01.13