본문 바로가기
컴퓨터공학/통계학

통계학 용어 정리

by the artisan 2022. 11. 28.
반응형

1 위치추정

 1) 평균(mean)

   - 모든값의 총합을 개수로 나눈값.

   - 유의어 : 평균(average)

 

 2) 가중평균(weighted mean)

   - 가중치를 곱한 값의 총합을 가중치의 총합으로 나눈값.

   - 유의어 : 가중평균(weighted average)

 

 3) 중간값(median)

   - 데이터에서 가장 가운데 위치한 값.

   - 유의어 : 50번째 백분위수(50th percentile)

 

 4) 가중중간값(weighted median)

   - 데이터를 정렬한 후, 각 가중치 값을 위에서부터 더할때, 총합의 중간이 위치하는 데이터 값.

   - 단순히 가운데 위치한 값이 아닌 어떤 위치를 기준으로 상위 절반의 가중치의 합이 하위 절반의 가중치의 합과 동일한 위치의 값.

   - 특이값에 대해 로버스트하다.

 

 5) 백분위수(percentile)

   - 전체 데이터의 P%를 아래에 두는 값.

   - 유의어 : 분위수(quantile)

 

 6) 절사평균(trimmed mea)

   - 정해진 개수의 극단값을 제외한 나머지 값들의 평균.

     * 가장작은값(x1)과 자장큰값(xn)을 제외한 평균값.

   - 극단값의 영향을 제거하여 로버스트하게 데이터를 만든것.

   - 유의어 : 절단평균(truncated mean)

 

 7) 로버스트하다(robust)

   - 극단값들에 민감하지 않은 것.

   - 유의어 : 저항성이있다(resistant)

 

 8) 특이값(outlier)

   - 대부분의 값과 매우 떨어져있거나, 매우 다른 데이터 값.

   - 잘못된 값이 섞이거나, 유효하지 않은값이 포함된 것. 에러값.

   - 이상검출(anomaly detection) : 특이값은 때론 유익한 정보를 내포하는데, 정상적인 데이터가 아닌 예회적으로 측정된 특이값을 주요로 관찰하고 분석하여 유요한 정보를 도출하는 것.

   - 유의어 : 극단값

 

2 변이추정

 1) 편차(deviation)

   - 관측값과 위치 추정값 사이의 차이

   - 유의어 : 오차

 

 2) 분산(variance)

   - 평균과의 편차를 제곱한 값들의 합을 n-1로 나눈값

   - 유의어 : 평균제곱

 

 3) 표준편차(standard deviation)

   - 분산의 제곱근

 

 4) 평균절대편차(mean absoute deviation)

   - 평균과의 편차의 절대값의 평균

 

 5) 범위(range)

   - 데이터의 최대값과 최소값의 차이

 

 6) 순서통계량(order statistics)

   - 최소에서 최대까지 정렬된 데이터 값에 따른 계량형

   - 유의어 : 순위

 

 7) 사분위범위(IQR interquartile range)

   - 75번째 백분위수와 25번째 백분위수 사이의 차이

반응형

'컴퓨터공학 > 통계학' 카테고리의 다른 글

표준편차와 표준오차  (0) 2022.12.07
통계학_표본과 분포  (0) 2022.11.22
통계와 데이터  (0) 2022.11.14