1 귀납적추론
1) 귀납적추론의 정의
- 표본을 통해서 모집단을 추정하는 활동
- 내적타당성 : 표본이 연구모집단의 대표성을 가질 경우.
- 외적타당성 : 연구모집단과 목적모집단이 정확히 일치하지 않으며 연구모집단의 결과를 목적모집단으로 확장할 수 있는 경우.
2) 표본의 추출
- 임의표본추출/단순임의추출(simple random sample)
- 층화표본추출/층화추출(stratified smpleing)
- 군집표본추출/집락추출(cluster sampling)
- 다단계표본추출/다단계추출(multistage smpling)
* 집락추출과 임의추출
2 이항분포와 정규분포
1) 이항분포
- 매회 사건 X가 일어날 확률이 동일한 독립시행의 경우에 있어서 확률변수 X가 따르는 분포
- n개의 베르누이시해엥서 k개의 성공횟수를 나타내는 확률변의의 분포
- 이항분포의 성질
* 평균(E(X)) = np
* 분산(Var(X)) = np(1-p)
2) 정규분포
- 도수분포곡선이 평균값을 중심으로 좌우대칭인 종모양을 이루는 것
* 정규분포곡선은 평균에서 좌우로 멀어질수록 x축에 무한히 가까워지는 형태를 이룬다.
- 연속확률분포(continous probability distribution) 또는 가우스분포라고 한다.
3 임의표본추출
1) 표본평균과 모평균
- 표본평균 : X
- 모평균 : μ
2) 평균으로의 회기
- 표본의 개수가 증가하면 표본평균이 모평균으로 수렴하는 것
- 중심극한정리(central limit theorem)
* 표본크기가 30이상이고 모집단의 분포가 치우치지 않으면(표본편향, bias) 표본평균의 분포는 정규분포를 향한다.
3) 표준오차
- 통계량의 변동을 나타내는 지표로 표준편차와 동일
- 표본평균의 분포는 평균이 0이고 분산이 σ^2/n 의 정규분포를 따름.
4) 통계량의 분포(표본분포, sampling distribution)
4 신뢰구간(confidence interval)
1) 신뢰구간의 정의
- 모집단의 모수가 가질 수 있는 값의 범위
- 신뢰구간은 점추정치(point estimates)의 변동을 고려한 구간 추정방법
- 신뢰구간은 X개의 샘플중 X-(U-L) 의 개수는 평균을 벗어날 수 있다는 의미
2) 신뢰구간의 표현
- θ의 95% 신뢰구간(L, U)의 표현
Pr(L<X<U)=0.95
- 모수에 대한 95% 신뢰구간
point extimate ± 1.96(≒2) * standard error
'컴퓨터공학 > 통계학' 카테고리의 다른 글
표준편차와 표준오차 (0) | 2022.12.07 |
---|---|
통계학 용어 정리 (0) | 2022.11.28 |
통계와 데이터 (0) | 2022.11.14 |