공부/통계·ML

[통계스터디] 11. 대응/상관표본 t검증

jiyoonmik 2022. 4. 8. 00:16
  • 독립표본: 비교되는 2개의 처치조건 혹은 모집단
  • 대응(상관)표본: 반복측정을 통해 동일한 하나의 표본에서 얻어낸 2개의 데이터. 피험자 내 설계. 단일 대산 집단에 대해 처치의 차이를 평가.
    • 독립측정과 달리, 모든 처치 상태에서 같은 피험자를 쓰기 때문에 편향될 위험이 적음
    • 한 표본 속의 각 개체는 다른 표본 대상들과 짝지어짐
    • 데이터는 두 집합의 점수로 이루어지며, 한 표본의 점수가 두번째 표본의 점수와 일대일로 대응됨
    • 상관표본 t검증은 차이점수($D={X_1}-{X_2}$) 모집단의 평균값 즉, 모집단의 평균값의 차이$μ_D$)으로 계산됨
    • 일반적인 독립측정 설계보다 적은 수의 표본을 요구하며, 개인 차이를 최소화할 수 있음

 

대응/상관표본 t검증

 

$H_0:{\mu_D}=0$

$H_1:{\mu_D}≠0$

다른 가설검증과 동일한 4단계 절차를 밟는다.

 

 

$t=\frac{{M_D}-{\mu_D}}{s_{M_D}}$ (차이점수 D)

$s^2=\frac{SS}{n-1}=\frac{SS}{df}$ 또는 $s=\sqrt{\frac{SS}{df}}$

$s_{M_D}=\sqrt{\frac{s^2}{n}}$ 혹은 $s_{M_D}=\frac{s}{\sqrt{n}}$

 

 

$t=\frac{표본통계치-모집단모수치}{추정된 표준오차}$

$=\frac{데이터(M_D)와 가설 사이의 실제 차이}{우연으로 생길 수 있는 표준적 차이}$

 

기본가정

  • 각 처치조건 안의 관찰은 독립적
  • 차이점수(D값들)의 모집단 분포는 정규적

 

효과크기

$H_0$에 의하면 표본에서 얻은 0이 아닌 평균값 차이는 단순히 우연에 의한 것이나 표집오차 때문이다.

전체 평균값 차이가 0이라 해도, 표본평균 차이가 반드시 0과 동일하다고 할 수 없는 것이다. 

반면 $H_1$은 두 처치 조건 사이에 체계적인 차이가 있음을 말하는 것이다.

 

코헨의 d = $\frac{평균차이}{표준편차}=\frac{M_D}{s}$

$r^2=\frac{t^2}{t^2+df}$

 

변산성이 높다면 처치효과의 일관성과 유의성을 의심해야 한다.

 

 

단점: 이월효과와 전진오류

  • 이월효과: 두번째 처치에서 피험자의 반응에 첫번째 처치의 여파나 후유증이 남아있는 경우. 
  • 전진오류: 개체의 행동이나 반응이 시간이 지남에 따라 피험자의 수행 능력이 처치로 인한 변화가 아닌 피곤으로 인해 줄어들거나 숙련으로 인해 향상될 수도 있을 경우.

해소법: 처치의 순서를 바꾼 실험집단을 별도로 무작위로 만든다.  

 

 

 

 

[참고] 사회과학 통계방법론의 핵심 이론 (커뮤니케이션북스)