본문 바로가기
컴퓨터공학/통계학

통계학_표본과 분포

by the artisan 2022. 11. 22.
반응형

1 귀납적추론
 1) 귀납적추론의 정의
   - 표본을 통해서 모집단을 추정하는 활동
   - 내적타당성 : 표본이 연구모집단의 대표성을 가질 경우.
   - 외적타당성 : 연구모집단과 목적모집단이 정확히 일치하지 않으며 연구모집단의 결과를 목적모집단으로 확장할 수 있는 경우.
 2) 표본의 추출
   - 임의표본추출/단순임의추출(simple random sample)
   - 층화표본추출/층화추출(stratified smpleing)
   - 군집표본추출/집락추출(cluster sampling)
   - 다단계표본추출/다단계추출(multistage smpling)
     * 집락추출과 임의추출

2 이항분포와 정규분포
 1) 이항분포
   - 매회 사건 X가 일어날 확률이 동일한 독립시행의 경우에 있어서 확률변수 X가 따르는 분포

   - n개의 베르누이시해엥서 k개의 성공횟수를 나타내는 확률변의의 분포

   - 이항분포의 성질

     * 평균(E(X)) = np

     * 분산(Var(X)) = np(1-p)

 2) 정규분포
   - 도수분포곡선이 평균값을 중심으로 좌우대칭인 종모양을 이루는 것
     * 정규분포곡선은 평균에서 좌우로 멀어질수록 x축에 무한히 가까워지는 형태를 이룬다.
   - 연속확률분포(continous probability distribution) 또는 가우스분포라고 한다.



3 임의표본추출
 1) 표본평균과 모평균
   - 표본평균 : X
   - 모평균 : μ
 2) 평균으로의 회기
   - 표본의 개수가 증가하면 표본평균이 모평균으로 수렴하는 것
   - 중심극한정리(central limit theorem)
     * 표본크기가 30이상이고 모집단의 분포가 치우치지 않으면(표본편향, bias) 표본평균의 분포는 정규분포를 향한다.
 3) 표준오차
   - 통계량의 변동을 나타내는 지표로 표준편차와 동일
   - 표본평균의 분포는 평균이 0이고 분산이 σ^2/n 의 정규분포를 따름.
 4) 통계량의 분포(표본분포, sampling distribution)

4 신뢰구간(confidence interval)
 1) 신뢰구간의 정의
   - 모집단의 모수가 가질 수 있는 값의 범위
   - 신뢰구간은 점추정치(point estimates)의 변동을 고려한 구간 추정방법
   - 신뢰구간은 X개의 샘플중 X-(U-L) 의 개수는 평균을 벗어날 수 있다는 의미
 2) 신뢰구간의 표현
   - θ의 95% 신뢰구간(L, U)의 표현
     Pr(L<X<U)=0.95
   - 모수에 대한 95% 신뢰구간
     point extimate ± 1.96(≒2) * standard error

반응형

'컴퓨터공학 > 통계학' 카테고리의 다른 글

표준편차와 표준오차  (0) 2022.12.07
통계학 용어 정리  (0) 2022.11.28
통계와 데이터  (0) 2022.11.14