관리 메뉴

NineTwo meet you

[확률 및 통계] 모집단 표본 모수 통계량 대푯값 산포도 본문

수학/확률 및 통계

[확률 및 통계] 모집단 표본 모수 통계량 대푯값 산포도

NineTwo 2021. 2. 5. 15:48
반응형

모집단 Population이란?

연구 대상이 되는 모든 개체 즉 집단 전체를 의미한다.

표본 Sample이란?

연구 대상이 되는 개체 중 일부 관측 결과의 집합을 의미한다. 


모수 parameter란?

모집단의 특징을 표현하는 수치를 의미한다.

모평균, 모 분산, 모 표준편차 등이 있다.

통계량 statistics란?

표본의 특징을 표현하는 수치를 의미한다.

표본 평균, 표본 분산, 표본 표준편차 등이 있다.

추정 estimation이란?

모집단으로부터 적절하게 표본을 추출해서 구한 표본의 자료로부터 모수의 값을 추측하는 통계적 절차를 의미한다.

추정량 estimator이란?

모수를 추정하기 위한 관찰가능한 표본의 함수를 의미한다.

추정값 estimate 이란?

추정량이라는 함수에 실제 관찰치를 대입하여 계산한 추정량의 값을 의미한다.


자료의 종류

자료는 크게 수치형 자료와 범주형 자료로 나뉘게 된다.

수치형 자료의 경우 연속된 자료라면 연속형, 분절된 자료라면 이산형 자료에 속하게 된다.

범주형 자료의 경우 순서가 있는 자료라면 순위형, 순서가 없는 자료라면 명목형 자료에 속하게 된다.


대푯값이란?

평균 mean

어떤 데이터를 대표하는 값으로 평균, 중앙값, 최빈값, 백분위수, 사분위수, 절사 평균 등이 있다.

평균 mean

데이터를 모두 더한 후 데이터의 개수로 나눈 값

중앙값 median

데이터를 정렬했을때 중앙에 위치하는 값
최빈값 mode 데이터에서 가장 빈번하게 등장하는 값

산포도란?

변량이 흩어져있는 정도를 하나의 수로 표현한 수치로 범위, 분산, 표준 편차등이 있다.

범위 range 최대값에서 최소값을 뺀 값
사분위간 범위 자료를 같은 갯수로 4개로 나눈 각각의 값을 사분위수(quartile)라고 하고 3 사분위수에서 1 사분위수를 뺀 값
분산 variance 관측값에서 평균을 뺀 값을 제곱해서 모두 더한 후 전체 갯수로 나눈 값
즉, 차이값의 제곱의 평균
표준 편차 standard deviation 분산에 루트를 씌운 값

왜도 skewness란?

자료의 분포의 비대칭 정도를 나타낸는 값을 의미한다.

left - skewed와 right- skewed가 존재하는데 left - skewed는 negative skewed, right- skewe는positive skewed로 표현하 기도한다.

첨도 Kurtosis란?

확률 분포의 뾰족한 정도를 나타내는 척도를 의미한다.

첨도가 클수록 값이 중심에 집중적으로 몰려있다고 생각할 수 있다.

 

 

 

 

반응형
Comments