- 독립표본: 비교되는 2개의 처치조건 혹은 모집단
- 대응(상관)표본: 반복측정을 통해 동일한 하나의 표본에서 얻어낸 2개의 데이터. 피험자 내 설계. 단일 대산 집단에 대해 처치의 차이를 평가.
- 독립측정과 달리, 모든 처치 상태에서 같은 피험자를 쓰기 때문에 편향될 위험이 적음
- 한 표본 속의 각 개체는 다른 표본 대상들과 짝지어짐
- 데이터는 두 집합의 점수로 이루어지며, 한 표본의 점수가 두번째 표본의 점수와 일대일로 대응됨
- 상관표본 t검증은 차이점수($D={X_1}-{X_2}$) 모집단의 평균값 즉, 모집단의 평균값의 차이$μ_D$)으로 계산됨
- 일반적인 독립측정 설계보다 적은 수의 표본을 요구하며, 개인 차이를 최소화할 수 있음
대응/상관표본 t검증
$H_0:{\mu_D}=0$
$H_1:{\mu_D}≠0$
다른 가설검증과 동일한 4단계 절차를 밟는다.
$t=\frac{{M_D}-{\mu_D}}{s_{M_D}}$ (차이점수 D)
$s^2=\frac{SS}{n-1}=\frac{SS}{df}$ 또는 $s=\sqrt{\frac{SS}{df}}$
$s_{M_D}=\sqrt{\frac{s^2}{n}}$ 혹은 $s_{M_D}=\frac{s}{\sqrt{n}}$
$t=\frac{표본통계치-모집단모수치}{추정된 표준오차}$
$=\frac{데이터(M_D)와 가설 사이의 실제 차이}{우연으로 생길 수 있는 표준적 차이}$
기본가정
- 각 처치조건 안의 관찰은 독립적
- 차이점수(D값들)의 모집단 분포는 정규적
효과크기
$H_0$에 의하면 표본에서 얻은 0이 아닌 평균값 차이는 단순히 우연에 의한 것이나 표집오차 때문이다.
전체 평균값 차이가 0이라 해도, 표본평균 차이가 반드시 0과 동일하다고 할 수 없는 것이다.
반면 $H_1$은 두 처치 조건 사이에 체계적인 차이가 있음을 말하는 것이다.
코헨의 d = $\frac{평균차이}{표준편차}=\frac{M_D}{s}$
$r^2=\frac{t^2}{t^2+df}$
변산성이 높다면 처치효과의 일관성과 유의성을 의심해야 한다.
단점: 이월효과와 전진오류
- 이월효과: 두번째 처치에서 피험자의 반응에 첫번째 처치의 여파나 후유증이 남아있는 경우.
- 전진오류: 개체의 행동이나 반응이 시간이 지남에 따라 피험자의 수행 능력이 처치로 인한 변화가 아닌 피곤으로 인해 줄어들거나 숙련으로 인해 향상될 수도 있을 경우.
해소법: 처치의 순서를 바꾼 실험집단을 별도로 무작위로 만든다.
[참고] 사회과학 통계방법론의 핵심 이론 (커뮤니케이션북스)
'공부 > 통계·ML' 카테고리의 다른 글
Data granularity와 Aggregation (0) | 2022.08.10 |
---|---|
[통계 스터디] 16. 카이스퀘어: 적합도와 독립성검증 (0) | 2022.06.03 |
[통계 스터디] 13. 일원 변량분석(ANOVA) - 변량분석, F분포, 사후검사 (0) | 2022.06.01 |
[통계스터디] 14. 반복측정 변량분석 - 반복측정 ANOVA, 2요인 ANOVA (0) | 2022.05.12 |
[통계 스터디] 12. 추정 - 점추정, 구간추정, 신뢰구간 (0) | 2022.04.15 |