Kahe valimi t-test

Allikas: testwiki
Mine navigeerimisribale Mine otsikasti

Kahe valimi t-test on üks statistiline test, üks t-testidest. See kontrollib kahe valimi keskmiste järgi, kas kahe üldkogumi keskmised on omavahel võrdsed (alternatiiviks on see, et üks keskmistest on teisest väiksem).

Kahe valimi t-testil on kaks varianti:

  • kahe sõltumatu valimi jaoks, kusjuures mõlemal üldkogumil on sama standardhälve σ
  • kahe mittesõltumatu valimi jaoks.

Kui kaks sõltumatut valimit pärinevad erineva standardhälbega üldkogumitest, siis tuleb kasutada Welchi testi.

Testi idee

Kahe valimi t-test kontrollib (lihtsaimal juhul) kahe valimi keskmiste x¯1 ja x¯2 järgi, kas vastavate üldkogumite keskmised on erinevad.

Joonis näitab kahte üldkogumit (mustad punktid) ja kahte valimit (sinised ja punased punktid), mis on üldkogumitest juhuslikult valitud. Valimite keskmised x¯1 ja x¯2 saab valimitest, arvutada, üldkogumite keskmised μ1 ja μ2 on aga tundmatut. Joonisel on üldkogumid nii konstrueritud, et nende keskmised on võrdsed: μ1=μ2. Nüüd oletatakse ajaloosündmuste tõttu või teoreetilistel kaalutlustel, et üldkogumite keskväärtused μ1 ja μ2 on erinevad.

Lihtsaimal juhul kontrollib test

Kui valimid on sobivalt valitud, näiteks lihtsate juhuvalimitena, siis on valimi 1 keskmine x¯1 suure tõenäosusega üldkogumi 1 keskmise μ1 lähedal ja valimi 2 keskmine x¯2 suure tõenäosusega üldkogumi 2 keskmise μ2 lähedal. See tähendab, kaugus punase ja musta punktiirjoone vahel ning kaugus sinise ja musta punktiirjoone vahel on suure tõenäosusega väikesed.

  • Kui x¯1 ja x¯2 vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on väike, siis on ka üldkogumite keskmised μ1 ja μ2 lähestikku. Siis ei saa nullhüpoteesi tagasi lükata.
  • Kui x¯1 ja x¯2 vaheline kaugus ehk sinise ja punase punktiirjoone vaheline kaugus on suur, siis on ka üldkogumite keskmised μ1 ja μ2 teineteisest kaugel. Siis võib nullhüpoteesi tagasi lükata.

Täpsed arvutused on järgnevates jaotistes.

Kahe valimi t-test sõltumatute valimite korral

Et uurida kahe võrdse tundmatu standardhälbega σ üldkogumi keskmiste vahesid, kasutatakse kahe valimi t-testi. Selleks peavad mõlemad üldkogumid olema normaaljaotusega või valimid nii suured, et rakendub tsentraalne piirteoreem, (valimite suurus ületab 30). Testi jaoks valitakse n-elemendiline valim x1,,xn 1. üldkogumist ja sellest sõltumatult m-elemendiline valim y1,,ym 2. üldkogumist. Vastavate sõltumatute valimimuutujate X1,,Xn ja Y1,,Ym keskväärtuste kohta kehtib siis E(Xi)=μX ja E(Yj)=μY, kus μX ja μY on üldkogumite keskmised. Kui keskmiste vahe jaoks on ette antud arv ω0, siis ütleb nullhüpotees, et

H0:μXμY=ω0,

ja alternatiivhüpotees, et

H1:μXμYω0.

Statistiliseks kriteeriumiks osutub

T=X¯Y¯ω0S1n+1m=nmn+mX¯Y¯ω0S,

kusX¯ ja Y¯ on vastavad valimikeskmised ja

S2=(n1)SX2+(m1)SY2n+m2

kaalutud dispersioon, mis arvutatakse valimite dispersioonide SX2 ja SY2 kaalutud keskmisena.

Statistilisel kriteeriumil T on nullhüpoteesi korral m+n2 vabadusastmega t-jaotus. Kontrollväärtus (statistilise kriteeriumi realisatsioon valimi korral) saadakse siis kujul

t=nmn+mx¯y¯ω0s,

kus x¯ ja y¯ on valimist arvutatavad keskväärtused ja

s2=(n1)sx2+(m1)sy2n+m2

kaalutud dispersiooni realisatsioon, mis arvutatakse valimite dispersioonidest sx2 ja sy2.

Olulisnivool α lükatakse nullhüpotees alternatiivi kasuks tagasi, kui

|t|>t(112α, n+m2).

Teise võimalusena võib sama statistilise kriteeriumiga T testida järgmisi hüpoteese:

  • H0:μXμYω0 versus H1:μXμY>ω0 ja nullhüpotees lükatakse tagasi, ui t>t(1α, m+n2).
  • H0:μXμYω0 versus H1:μXμY<ω0 ja nullhüpotees lükatakse tagasi, kui t<t(1α, m+n2).

Märkus

Kui üldkogumite dispersioonid ei ole võrdsed, siis tuleb teha Welchi test.

Näide 1

Tuleb võrrelda väetisesorte. Selleks kasutatakse 25 väetisena ühesuurust portsjonit, nimelt n=10 portsjonit väetist sordist A ja m=15 portsjonit väetist sordist B. Eeldatake, et saakidel on normaaljaotus ja dispersioonid on võrdsed. Esimese sordi puhul on keskmine saak x¯=23,6 valimi dispersiooniga sx2=9,5 ja teise sordi puhul on keskmine saak y¯=20,1 dispersiooniga sy2=8,9. Kaalutud keskmiseks saame

s2=99,5+148,910+152=9,135.

Siit saame kontrollväärtuse

t=101510+1523,620,19,135=2,837.

See väärtus on suurem kui 10+152=23 vabadusastmega t-jaotuse 0,975-kvantiil t(0,975; 23)=2,069. Järelikult saab 95%-ise usaldusega väita, et väetisesortide toimes on erinevus.

Kahe valimi t-test mittesõltumatute valimite korral (paarisvõrdluse t-test)

Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.
Seotud ja mitteseotud t-testi I tüüpi viga sõltuvalt korrelatsioonist. Simuleeritud juhuarvud pärinevad kahemõõtmelisest normaaljaotusest dispersiooniga 1. Olulisusnivoo on 5 % ja juhtumite arv 60.

Siin on x1,x2,,xn und y1,y2,,yn kaks paarikaupa erinevat valimit, mis on saadud näiteks samade uuritavate üksuste kahest mõõtmisest (korduvmõõtmine). Valimid võivad olla paarikaupa mittesõltumatud ka muudel põhjustel, näiteks kui x-i ja y-i väärtused on partnerluses olevate naiste ja meeste näidud ning huvi pakuvad soolised erinevused.

Selleks et testida nullhüpoteesi, et normaaljaotusega üldkogumil on võrdsed keskmised, võib testida ühe valimi t-testi abil hüpoteesi, et vahede di=xiyi keskmine on null. Praktikas peab väiksemate valimite (n30) korral olema täidetud tingimus, et vahedel on üldkogumis normaaljaotus. Piisavalt suurte valimite korral jaotuvad paaride vahed ligikaudselt normaaljaotusega ümber üldkogumi vahe aritmeetilise keskmise. Tingimuste täidetuse suhtes ei ole t-test kuigi tundlik.[1]

Näide 2

Et testida uut ravimeetodit kolesterooli taseme alandamiseks, määratakse 10 katsealusel kolesterooli tase enne ja pärast ravi. Saadakse järgmised näidud:

Enne ravi: 223 259 248 220 287 191 229 270 245 201
Pärast ravi: 220 244 243 211 299 170 210 276 252 189
Vahe: 3 15 5 9 −12 21 19 −6 −7 12

Näitude vahede aritmeetiline keskmine on d¯=5,9 ja valimi standardhälve on sd=11,3866. Kontrollväärtuseks saame

t=105,911,3866=1,6385.

Et t(0,975; 9)=2,2622, siis |t|t(0,975; 9). Seega ei saa nullhüpoteesi, et kolesteriini taseme keskväärtused on enne ja pärast ravi võrdsed, nii et ravil pole toimet, olulisusnivool α=5% tagasi lükata. Et t<t(0,95; 9)=1,8331, siis ka ühepoolne alternatiiv, et ravi alandab kolesterooli taset, statistiliselt oluline. Kui ravil üldse toime on, pole see nii suur, et seda võiks nii väikse valimi pealt avastada.

Welchi test

Mall:Vaata Welchi testi puhul arvutatakse statistiline kriteerium sarnaselt nagu kahe valimi t-testi puhul:

T=X¯Y¯ω0SX2n+SY2mtν.

Ent sellel kriteeriumil ei ole nullhüpoteesi korral t-jaotust, vaid seda lähendatakse t-jaotuse abil vabadusastmete arvu muutmise teel (vaata ka Behrensi-Fisheri probleem):

ν=(sx2n+sy2m)21n1(sx2n)2+1m1(sy2m)2,

kus sx ja sy on üldkogumite standardhälvete hinnangud valimite järgi ning n ja m on valimite suurused.

Kuigi Welchi test on välja töötatud spetsiaalselt juhtumiks, kus σXσY, ei tööta ta hästi, kui vähemalt üks jaotus on mittenormaalne ning juhtumite arvud on väikesed ja väga erinevad nm). [2][3]

Alternatiivsed testid

t-testi kasutatakse selleks, et testida hüpoteese ühe või kahe tundmatu standardhälbega normaaljaotusega üldkogumitest võetud valimi keskväärtuste kohta.

Viited

Mall:Viited

Välislingid

  1. Viitamistõrge: Vigane <ref>-silt. Viide nimega ZoEZb on ilma tekstita.
  2. Viitamistõrge: Vigane <ref>-silt. Viide nimega mz9NE on ilma tekstita.
  3. Viitamistõrge: Vigane <ref>-silt. Viide nimega hqjwJ on ilma tekstita.