본문 바로가기
(1) 통계개념

통계분석 관련 자료(DATA) 종류

by 경이로움1 2024. 1. 13.
반응형

 

DATA
DATA

 

안녕하세요. 이번 포스팅에서는 통계분석 관련 DATA의 종류에 대해 알아보겠습니다.

 

통계분석에서는 여러 가지 형태의 자료가 이용되며, 자료의 형태에 따라 적용되는 분석기법도 다양합니다. 분석자료(data set)는 다수의 관측대상들로 구성되는데, 각 관측대상은 분석자료의 기본단위가 됩니다.

 

기본단위로는 소비자, 가구, 기업, 하청업체 등이 될 수 있습니다. 통계분석을 위하여 필요한 변수에 관한 정보를 기본단위부터 수집한 것이 분석자료입니다.

 

예를 들어 매출을 책임지는 관리 책임자의 자료에는 많은 관계된 업체들의 기업규모, 주문 품목, 주문 시기 등의 정보가 있을 것입니다. 이때 기본단위는 관계 업체이고, 변수들은 기업규모, 주문 품목, 주문 시기 등이 됩니다.

 

통계분석에서 우리는 주로 변수의 관측값들이 기본단위들 간에 어떤 차이를 보이는가에 관심이 있습니다. 그러므로 자료를 구분할 때에는 변수를 기준으로 하는 것이 일반적이고, 이러한 맥락에서 자료는 기본적으로 다음과 같이 세 가지 방식으로 분류됩니다.

 

, 하나의 기본단위가 가지고 있는 정보의 수(변수의 수)에 따라 단변수 자료와 다변수 자료로 나누어지고, 변수의 측정방식에 따라 정성적 자료와 정량적 자료로 나누어진다. , 변수의 측정값이 시간의 흐름에 따라 관측된 시계열자료와 같은 시점에 관측된 횡단면자료로 구분됩니다.

 

먼저 단변수 자료와 다변수 자료에 대해 알아보겠습니다.

 


 단변수 자료와 다변수 자료 


관측대상이 되는 각 기본단위에 하나의 변수만 있을 때 단변수 자료라 하고, 변수가 여러개 있을 때 다변수 자료라 합니다.

 

단변수 자료에는 각 관측대상마다 변수가 하나밖에 없어 자료가 단순하고, 이러한 자료에 대해 적용할 수 있는 통계적 방법도 비교적 단순합니다. 단변수 자료에서 우리의 관심은 주로 대표값, 기본단위의 동질성, 전체와 차별되는 특이한 관측대상이 존재하는가 등 입니다.

 

다변수 자료에는 하나의 관측대상에 두 개 이상의 변수가 있으므로, 보다 다양한 내용의 정보를 추출할 수 있습니다. 앞에서 언급한 단변수 자료에서 알아볼 수 있는 세 개 이외에 변수간의 관련성, 몇 개의 변수를 이용한 다른 변수의 미래값 예측 등이 가능합니다.

 

예를 들어 2차전지를 생산하는 국내 5개 사의 지난 분기 생산량과 생산원가 자료를 이용하여 두 변수간의 관계를 알아볼 수 있으며, 또한 각 회사의 생산원가를 비교하여 그들의 효율성을 평가할 수 있습니다.

 

다음은 정량정 자료와 정성적 자료 입니다.

 


 정량적 자료와 정성적 자료 


모든 통계자료는 관측값의 속성에 따라 정량적 자료와 정성적 자료로 크게 나눌 수 있습니다.

 

정량적 자료는 크기를 가진 수치로 표현된 자료이므로 수치적 자료라고도 합니다. 체중, 거리, 시간 등과 같은 측정치나 불량품 개수, 안전사고 건수 등과 같은 도수가 이에 속합니다.

 

정량적 자료에 대해서는 평균치를 계산하거나 분산을 측정하는 것과 같은 모든 수치적 조작이 가능합니다. 정량적 자료는 변수가 취하는 값의 형태에 따라 이산자료와 연속자료로 구분합니다.

 

이산자료에 속하는 변수는 특정 사건의 발생횟수를 의미하여, 따라서 양의 정수 값을 갖습니다. 예를 들어, 특정 가구의 TV , 일정 기간 동안 교통사고 발생 건수, 월별 산업재해 발생 건수 등은 모두 이산자료에 속합니다.

 

연속자료는 체중, 거리, 시간과 같은 변수는 원칙적으로 무한히 작은 단위로 측정이 가능하여 모든 실수 값을 취할 수 있습니다. 이러한 변수로 구성된 자료를 연속자료라 합니다. 기업의 투자수익률, 부채비율, 불량률, 시장점유율 등은 모두 연속자료의 보기입니다.

 

정성적 자료는 남성, 여성과 같이 두 개의 범주로 나뉘어지거나, 전문직, 판매직, 사무직, 관리직 등의 직종 분류에서와 같이 여럿으로 나뉘어지는 자료를 의미하므로 범주적 자료라고도 합니다. 정성적 자료에서는 각 범주에 0, 1, 2 등의 숫자를 할당하여 자료를 처리하더라도, 범주는 수치개념이 아니므로 각 변수가 취하는 값의 크기에 별 의미를 주지 않습니다. 다만, 변수가 취하는 값이 순서나 순위의 의미를 가지는가에 따라, 순서의 의미가 있는 서수자료와 의미가 없는 명목자료로 구분합니다.

 

마지막으로 시계열자료와 횡단면자료은 다음과 같습니다.

 


 시계열자료와 횡단면자료 


월 생산실적, 분기별 판매실적, 주식가격 변동, 결근현황 등과 같이 자료가 기록된 시간적 순서에 의미가 있을 때, 그 자료를 시계열자료(time-series data)라 합니다. 한편, 1/4분기의 작업반별 생산성이나 2024년도 상반기 지점별 영업실적과 같이, 같은 시점에서 관찰한 자료는 횡단면자료(cross-sectional data)라 부릅니다. , 횡단면자료는 시간적으로 한 시점에서 본 여러 관측대상의 활동수준에 대한 정보를 제공합니다.

 

지금까지 통계분석 관련 DATA의 종류에 대해 알아보았습니다.

 

감사합니다.

 

 

함께보면 도움 되는 글

 

통계적 분석 절차

안녕하세요. 이번 포스팅에서는 통계적 분석 절차에 대해 살펴보겠습니다. 의사결정에 필요한 정보를 수집할 목적으로 통계적 방법을 활용할 때, 우리가 수행하는 통계적 분석작업은 설계, 탐

wmhb.kr

 

중심경향치의 특징과 선택

임의로 선정한 다섯 명의 키가 각각 165cm, 168cm, 171cm, 175cm, 179cm 일 경우 이들 다섯 명의 키를 하나의 대표적 수치로 나타내고 싶다면 얼마로 하는 것이 전체적 경향을 잘 나타낸다고 할 수 있을까

wmhb.kr

 

분산도 종류 및 계산

주어진 자료의 특성을 완전하게 기술하게 이해하기 위해서는 산출평균, 중앙치 등의 중심경향치와 함께 각 관측치들이 서로 얼마나 밀집 또는 분산되어 있는가를 알아야 합니다. 통계적 분석이

wmhb.kr

 

통계적 가설검정의 의미와 절차

가설의 검정은 통계적 추론에 있어 가장 중요한 영역으로, 표본자료에서 얻은 통계량을 이용하여 모집단의 특성인 모수에 대한 정보를 분석하는 과정이라고 할 수 있습니다. 즉, 표본자료를 이

wmhb.kr

 

정규분포 이해 및 활용

정규분포는 통계학에서 가장 대표적인 연속 확률분포이며, 가장 많이 사용됩니다. 정규분의 모양이 종 모양 형태이기 때문에 종형분포라고 불리기도 하며, 가우스분포라고 합니다. 통계조사의

wmhb.kr

 

표본추출 이해

무작위 표본추출 귀납적 추론과정에서는 해당 모집단의 모수를 추정량을 통해 추정하게 되는데 그 추정이 얼마나 정확할 것인가 하는 문제는 추출된 표본이 얼마나 좋은 표본인가에 따라 결정

wmhb.kr

 

인구 관련 통계학 이해(1)

인구 증가율 인구 증가율은 특정 지역의 인구가 일정기간 증가하는 비율을 의미하며, 출생자 수에서 사망자 수를 차감한 후, 이 수를 전체 인구수로 나누어 계산합니다. 한 국가가 계속 성장하

wmhb.kr

 

인구 관련 통계학 이해(2)

도시화율 도시화율은 도시 지역에 거주하는 인구의 비율을 의미합니다. 도시화율은 보통 높은 인구 밀도, 문화, 경제활동이 집중되어 나타납니다. 이 비율은 국가의 개발 수준의 척도로 사용되

wmhb.kr

 

통계학의 기원 및 일상 생활에서의 통계학

통계학의 기원 통게학은 17세기에 들어서며 학문으로 확립되었지만, 그 이전부터 고대 로마, 중국, 바빌로니아 등에서 인구 조사 등 간단한 통계가 행해졌습니다. 고대 로마제국의 초대 황제 아

wmhb.kr

 

효과적인 자료수집 방법

조사의 내용이나 목적이 다양해도 본질적으로 대부분의 조사는 전체(모집단)를 모두 조사하지는 않습니다. 전체의 일부인 표본만 조사해 전체를 예측합니다. 다시 말하면 대부분의 조사에서는

wmhb.kr

 

모수와 비모수 통계분석방법

모수통계분석방법 모집단의 분포 또는 검정통계량의 표본분포를 안다는 가정에서 그 적합성이 성립되는 분석방법들을 모수통계분석방법이라 부릅니다. 검정통계량의 표본분포를 알 수 없는

wmhb.kr

 

로또 당첨 확률 계산과 1등 당첨자 수 적정성 확인

이번 포스팅에서는 로또 등위결정방법, 당첨확률 및 당첨금 배분 구조와 로또 당첨확률 계산 방법, 1등 당첨자 수의 적정성을 확인하겠습니다. 로또는 ㈜동행복권에서 운영하고 있으며, 총당첨

wmhb.kr

 

반응형

'(1) 통계개념' 카테고리의 다른 글

정규분포 이해 및 실생활 활용  (0) 2024.01.14
통계적 가설검정 의미와 절차  (0) 2024.01.14
분산도 종류 및 특징  (0) 2024.01.13
중심경향치 종류, 특징, 선택  (0) 2024.01.13
통계적 분석 절차  (2) 2024.01.13