Welch-próba
A Welch-próba vagy más néven d-próba a statisztikai hipotézisvizsgálatok közül a paraméteres próbák közé tartozik. A próba azt vizsgálja, hogy két külön mintában egy-egy valószínűségi változó átlagai egymástól szignifikánsan különböznek-e.
A próba alkalmazásának feltételei
[szerkesztés]a vizsgált valószínűségi változók
- normális eloszlásúak
- intervallum vagy arányskálán mértek
- függetlenek
A próba nullhipotézise
[szerkesztés]Nullhipotézis: a két mintában a két átlag statisztikai szempontból megegyezik.
Alternatív hipotézis: a két mintában a két átlag statisztikai szempontból nem egyezik meg.
- A "statisztikai szempontból" kifejezés itt arra utal, hogy az eltérés a két átlag között olyan minimális, hogy pusztán csak a véletlen ingadozásnak tulajdonítható (ekkor a két átlag statisztikai szempontból azonosnak tekinthető), vagy jelentősen nagyobb, mint ami a véletlennel magyarázható (ekkor a két átlag statisztikai szempontból nem tekinthető azonosnak).
Valójában a fenti két hipotézis precíz matematikai megfogalmazása a következő.
- H0: Az X és Y valószínűségi változók várható értékei megegyeznek, (E(X) = E(Y)).
- H1: Az X és Y valószínűségi változók várható értékei nem egyeznek meg, (E(X) ≠ E(Y)).
A próbastatisztika
[szerkesztés]A Welch-próba próbastatisztikája
ahol
- az egyik valószínűségi változó átlaga a mintájában,
- a másik valószínűségi változó átlaga a mintájában,
- sx az egyik valószínűségi változó becsült szórása,
- sy a másik valószínűségi változó becsült szórása,
- n az egyik minta elemszáma,
- m a másik minta elemszáma.
A próba végrehajtásának lépései
[szerkesztés]- Az t próbastatisztika értékének kiszámítása.
- A p szignifikanciaszint megválasztása. (Ez a legtöbb vizsgálat esetén 0,05 vagy 0,01.)
- A p szignifikanciaszinttől függő tp érték kiválasztása a próbának megfelelő táblázatból. A táblázat jelen esetben a t-eloszlás táblázata, mely eloszlásra szoktak úgy is utalni, mint Student-eloszlás, illetve Student-féle t-eloszlás. A táblázat kétdimenziós, a p szignifikanciaszint és az f szabadsági fok ismeretében azonnal megkapjuk a táblázatbeli tp értéket. Az f szabadsági fok a Welch-próba esetén az összefüggés alapján a jobb oldal reciprokaként adódik. (Mivel ezt láthatóan meglehetősen bonyolult számolni, a gyakorlatban helyette sokszor egy – a Megjegyzésekben bemutatott – egyszerűsítéssel élnek.)
- A nullhipotézisre vonatkozó döntés meghozása.
- Ha |t| ≥ tp, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy
a két mintában a valószínűségi változók átlagai szignifikánsan eltérnek egymástól (p szignifikancai szint mellett). - Ha |t| < tp, akkor a nullhipotézist megtartjuk, amit úgy interpretálunk, hogy
a Welch-próba nem mutat ki szignifikáns különbséget a két mintában a valószínűségi változók átlagai között (p szignifikanciaszint mellett).
- Ha |t| ≥ tp, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy
Példa
[szerkesztés]A próba matematikai háttere
[szerkesztés]A próba matematikai hátterének legfontosabb gondolata, hogy bármely X és Y független, normális eloszlású valószínűségi változóra vett X1, X2, … Xn illetve Y1, Y2, … Xm minták esetén az
valamint az
jelölésekkel élve megmutatható, hogy a
valószínűségi változó t-eloszlást követ a fenti képlet alapján számítható f szabadsági fokkal.
Emiatt az f szabadsági fokú t-eloszlás ismeretében bármilyen 1 > p > 0 esetén meg lehet határozni azt az tp értéket, melyre teljesül hogy ha igaz a nullhipotézis, akkor a t próbastatisztika értéke 1-p valószínűséggel jó közelítéssel a (-tp, tp) intervallumba esik.
Megjegyzések
[szerkesztés]- Az f szabadsági fokot az
- képlet alapján számítani igen bonyolult. Megmutatható azonban, hogy – az fmin = min {n – 1; m – 1} és fmax = n + m – 2 jelölésekkel élve – teljesül, az fmin ≤ f ≤ fmax összefüggés, vagyis az f értéke két nagyon könnyen számítható korlát közé szorítható. Ennek felhasználásával az f fáradságos kiszámítása sokszor elkerülhető.
- Mivel fix p mellett a t-eloszlás táblázatának értékei f növelésével nőnek biztos, hogy tmin ≤ t p ≤ tmax, ahol tmin, t p és tmax rendre a p szignifikanciaszinthez és fmin, f és fmax szabadsági fokhoz tartozó t-eloszlás táblázatában található értékek. Így |t| ≥ tmax esetén biztos, hogy |t| ≥ tp is teljesül, vagyis a nullhipotézis elvetéséhez elegendő, hogy |t| ≥ tmax teljesüljön. Hasonlóan |t| < tmin esetén biztos, hogy |t| < tp is teljesül, s így a nullhipotézis megtartásához |t| < tmin is elegendő.
- Egy másik lehetőség az f fáradságos kiszámításának megkerülésére annak a felhasználása, hogy ha m és n elég nagy (általában az m > 40, n > 40 feltételt szokták megadni), akkor a t-táblázat helyett lehet a standard normális eloszlás táblázatát használni ugyanúgy, mint például az egymintás u-próba (vagy egyébként bármely u-próba) esetén. Ezt azért lehet megtenni, mert ilyen magas n és m értékek mellett a t-eloszlás nagyon közel van a normális eloszláshoz (a t-eloszlás a szabadsági fok növelésével aszimptotikusan normális eloszlású).
- A Welch-próba bizonyos tekintetben a kétmintás u-próba párja. A kétmintás u-próba ugyanezt a nullhipotézist vizsgálja, csak feltétele az szórások értékének előzetes ismerete is, s nem a minták adatai alapján becsli azokat. A próbastatisztika képlete is nagyon hasonló, csak benne az becsült sx és sy szórások helyett az eleve ismert σx és σy szórások szórások szerepelnek. A két próba matematikai háttere is nagyon hasonló.
- Szintén szoros a kapcsolat a Welch-próba és a kétmintás t-próba között. Ez a két próba is ugyanazt a nullhipotézist teszteli, ugyanolyan adottságok mellett, csak a kétmintás t-próba feltételezi, hogy a két valószínűségi változó szórásai megegyeznek, míg a Welch-próbához nincs szükségünk ilyen feltételezésre. Ennek a két próbának a képlete viszont jelentősen különbözik egymástól.
- A szakirodalom nem teljesen egységes annak tekintetében, hogy a nullhipotézis elvetéséről vagy megtartásáról szóló döntésben az |t| és tp közötti két egyenlőtlenség közül melyiknél engedi meg az egyenlőséget. Ennek gyakorlati jelentősége nem igazán van, az alkalmazások során nagyon ritkán adódik, hogy a kiszámított próbastatisztika pontosan egybeessen a táblázatbeli értékkel. Ha esetleg mégis így alakul, akkor az eredmény úgy interpretálható, hogy a nullhipotézis elvetése esetén a kockázat pontosan megegyezik a szignifikanciaszinttel, s innen a kutató (és a tudós társadalom) szája ízétől függ, hogy ebben inkább a nullhipotézis elvetésének, vagy inkább a nullhipotézis megtartásának zálogát látja.
- Érdemes megfigyelni az óvatos fogalmazást a nullhipotézis megtartása esetén. Az általunk meghatározott p szignifikanciaszint az elsőfajú hiba elkövetésének valószínűségét adja meg. Ha el tudom vetni a nullhipotézist, ekkora kockázatot vállalok arra nézve, hogy esetleg hiba elvetni. Amennyiben viszont nem tudom elvetni a nullhipotézis, akkor elsőfajú hibát biztosan nem fogok elkövetni, ám elkövethetek másodfajú hibát, melynek kockázatáról semmit nem mond a próba. Ez indokolja, hogy ha a nullhipotézist megtartjuk, akkor nem azt mondjuk, hogy nincs szignifikáns különbség a minta átlaga és az előre megadott m érték között, hanem hogy a Welch-próba nem tudott szignifikáns különbséget kimutatni (ami ettől még lehet, hogy van).
Források
[szerkesztés]- Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen
- Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest
- Michaletzky Gy. – Mogyoródi J. (1995): Matematikai statisztika, Nemzeti Tankönyvkiadó, Budapest
- Michelberger P. – Szeidl L. – Várlaki P. (2001): Alkalmazott folyamatstatisztika és idősor-analízis. Typotex Kiadó, Budapest
- Vargha A. (2000): Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, Budapest