💗추정: 모집단의 모수치를 추론하기 위해 미지의 모집단에서 추출된 표본의 통계치를 이용하는 추론적 과정. 효과의 유의성에 대한 지표로서, 처치 후의 모집단 평균값을 정하여 처치가 얼마나 평균을 변화시켰는지 보여줌.
- 추정이 이용되는 경우
1. 영가설 기각 후, 영향이 얼마나 있었는가라는 후속 질문에 대한 답을 내리기 위해
2. 처치 효과가 있다는 것을 알고 있을 때, 영향의 정도를 구하기 위해
3. 단순히 미지의 모집단에 대한 기본 정보를 원할 때 - 추정의 종류
1. 점추정: 하나의 값을 추정. 정교하지만 큰 신뢰를 갖기 어려움
2. 구간추정: 값의 범위를 추정.
신뢰를 줄 수 있지만 그 구간이 넓어지면 정교함을 갖기 어려움. (정밀성과 신뢰의 trad-off)
구간 추정이 구체적인 신뢰수준에서 이루어질 때, 이를 신뢰구간이라고 함.- 신뢰구간: 신뢰구간의 폭 = 정밀도의 정도 (좁은 구간은 넓은 구간보다 더 정밀)
- 표본 크기(n)가 증가할 때
- 표준오차($\sigma$)는 줄고
- 자유도(df)는 커지고
- 신뢰구간은 작아짐
: 표본이 클수록 정보량이 큰 것. 이는 더 정밀한 추정이 가능하므로, 구간이 작아질 여력이 있는 것!
자유도가 커질 수록 신뢰구간의 특정 비율과 연관된 t통계치는 작아지고, 이에 따라 신뢰구간이 작아짐.
신뢰구간은 표본 변산성이 증가할 때 커지고, 신뢰수준이 증가할 때 넓어짐.
- 신뢰구간: 신뢰구간의 폭 = 정밀도의 정도 (좁은 구간은 넓은 구간보다 더 정밀)
💗추정 공식 & 과정
추정은 아래 공식에 따라 모집단 평균의 추정치를 계산하여 진행한다.
- 일반적 형태: 모집단 평균 = 표본평균±t*추정 표준오차
- 단일 표본 연구
한 표본으로부터의 평균($\mu$)은 그에 상응하는 모집단의 평균을 추정하는 데 사용
$${\mu}=M±t*{s_M}$$ - 독립측정 연구
2개의 분리된 표본으로부터의 평균은 두 모집단 사이의 평균 차이를 추정하는 데 사용
$$({{\mu}_1}-{{\mu}_2})=({M_1}-{M_2})±t*{s_{({M_1}-{M_2})}}$$ - 반복측정 연구
차이점수(D값)의 한 표본으로부터 얻은 평균이 일반적인 모집단의 평균 차이를 추정하는 데 사용
$${\mu_D}={M_D}±t*{s_{M_D}}$$
1. 위 공식에서 알려지지 않은 t값을 제외하고 방정식 우변의 값은 모두 표본 데이터에서 계산한다.
2. 추정된 t값을 이용해서 모집단 평균의 추정치를 계산한다. (가설검증으로 t값 얻지 말 것!)
- 점 추정 시 분포의 정중앙 값인 t=0을 대입
- 구간 추정 시 신뢰수준을 정한 후에 신뢰수준에 따라 t분포표에서 t값의 해당 범위를 찾는다.
- 추정과 가설 검증 비교
공통점: 모집단에 대한 문제 해결을 위해 표본 데이터를 이용, 서로 다른 질문에 답하기 위해 고안됨
- 가설검증: 처치효과가 있는지 여부 (예/아니오)
- 추정: 얼마만큼의 처치효과가 있는지 알려지지 않은 모집단 평균(or 평균의 차이)의 t검증 방정식을 풀면서 시작
[참고] 사회과학 통계방법론의 핵심 이론 (커뮤니케이션북스)
'공부 > 통계·ML' 카테고리의 다른 글
Data granularity와 Aggregation (0) | 2022.08.10 |
---|---|
[통계 스터디] 16. 카이스퀘어: 적합도와 독립성검증 (0) | 2022.06.03 |
[통계 스터디] 13. 일원 변량분석(ANOVA) - 변량분석, F분포, 사후검사 (0) | 2022.06.01 |
[통계스터디] 14. 반복측정 변량분석 - 반복측정 ANOVA, 2요인 ANOVA (0) | 2022.05.12 |
[통계스터디] 11. 대응/상관표본 t검증 (0) | 2022.04.08 |