Welch-próba

A Welch-próba vagy más néven d-próba a statisztikai hipotézisvizsgálatok közül a paraméteres próbák közé tartozik. A próba azt vizsgálja, hogy két külön mintában egy-egy valószínűségi változó átlagai egymástól szignifikánsan különböznek-e.

A próba alkalmazásának feltételei

a vizsgált valószínűségi változók

A próba nullhipotézise

Nullhipotézis: a két mintában a két átlag statisztikai szempontból megegyezik.

Alternatív hipotézis: a két mintában a két átlag statisztikai szempontból nem egyezik meg.

A "statisztikai szempontból" kifejezés itt arra utal, hogy az eltérés a két átlag között olyan minimális, hogy pusztán csak a véletlen ingadozásnak tulajdonítható (ekkor a két átlag statisztikai szempontból azonosnak tekinthető), vagy jelentősen nagyobb, mint ami a véletlennel magyarázható (ekkor a két átlag statisztikai szempontból nem tekinthető azonosnak).

Valójában a fenti két hipotézis precíz matematikai megfogalmazása a következő.

H₀: Az X és Y valószínűségi változók várható értékei megegyeznek, (E(X) = E(Y)).
H₁: Az X és Y valószínűségi változók várható értékei nem egyeznek meg, (E(X) ≠ E(Y)).

A próbastatisztika

A Welch-próba próbastatisztikája

t={\frac {{\overline {x}}-{\overline {y}}}{\sqrt {{\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}}}}

ahol

${\overline {x}}$ az egyik valószínűségi változó átlaga a mintájában,
${\overline {y}}$ a másik valószínűségi változó átlaga a mintájában,
s_x az egyik valószínűségi változó becsült szórása,
s_y a másik valószínűségi változó becsült szórása,
n az egyik minta elemszáma,
m a másik minta elemszáma.

A próba végrehajtásának lépései

Az t próbastatisztika értékének kiszámítása.
A p szignifikanciaszint megválasztása. (Ez a legtöbb vizsgálat esetén 0,05 vagy 0,01.)
A p szignifikanciaszinttől függő t_p érték kiválasztása a próbának megfelelő táblázatból. A táblázat jelen esetben a t-eloszlás táblázata, mely eloszlásra szoktak úgy is utalni, mint Student-eloszlás, illetve Student-féle t-eloszlás. A táblázat kétdimenziós, a p szignifikanciaszint és az f szabadsági fok ismeretében azonnal megkapjuk a táblázatbeli t_p értéket. Az f szabadsági fok a Welch-próba esetén az ${\frac {1}{f}}={\frac {1}{n-1}}\left({\frac {\frac {s_{x}^{2}}{n}}{{\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}}}\right)^{2}+{\frac {1}{m-1}}\left({\frac {\frac {s_{y}^{2}}{m}}{{\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}}}\right)^{2}$ összefüggés alapján a jobb oldal reciprokaként adódik. (Mivel ezt láthatóan meglehetősen bonyolult számolni, a gyakorlatban helyette sokszor egy – a Megjegyzésekben bemutatott – egyszerűsítéssel élnek.)
A nullhipotézisre vonatkozó döntés meghozása.
- Ha |t| ≥ t_p, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy
  a két mintában a valószínűségi változók átlagai szignifikánsan eltérnek egymástól (p szignifikancai szint mellett).
- Ha |t| < t_p, akkor a nullhipotézist megtartjuk, amit úgy interpretálunk, hogy
  a Welch-próba nem mutat ki szignifikáns különbséget a két mintában a valószínűségi változók átlagai között (p szignifikanciaszint mellett).

Példa

A próba matematikai háttere

A próba matematikai hátterének legfontosabb gondolata, hogy bármely X és Y független, normális eloszlású valószínűségi változóra vett X₁, X₂, … X_n illetve Y₁, Y₂, … X_m minták esetén az

${\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i},\qquad {\overline {Y}}={\frac {1}{m}}\sum _{j=1}^{m}X_{,}$

valamint az

$s_{X}={\sqrt {\frac {\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}}{n}}},\qquad s_{Y}={\sqrt {\frac {\sum _{i=1}^{m}(Y_{i}-{\overline {Y}})^{2}}{m}}}$

jelölésekkel élve megmutatható, hogy a

$t={\frac {{\overline {X}}-{\overline {Y}}}{\sqrt {{\frac {s_{X}}{n}}+{\frac {s_{Y}}{m}}}}}$

valószínűségi változó t-eloszlást követ a fenti képlet alapján számítható f szabadsági fokkal.

Emiatt az f szabadsági fokú t-eloszlás ismeretében bármilyen 1 > p > 0 esetén meg lehet határozni azt az t_p értéket, melyre teljesül hogy ha igaz a nullhipotézis, akkor a t próbastatisztika értéke 1-p valószínűséggel jó közelítéssel a (-t_p, t_p) intervallumba esik.

Megjegyzések

Az f szabadsági fokot az

{\frac {1}{f}}={\frac {1}{n-1}}\left({\frac {\frac {s_{x}^{2}}{n}}{{\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}}}\right)^{2}+{\frac {1}{m-1}}\left({\frac {\frac {s_{y}^{2}}{m}}{{\frac {s_{x}^{2}}{n}}+{\frac {s_{y}^{2}}{m}}}}\right)^{2}

képlet alapján számítani igen bonyolult. Megmutatható azonban, hogy – az f_min = min {n – 1; m – 1} és f_max = n + m – 2 jelölésekkel élve – teljesül, az f_min ≤ f ≤ f_max összefüggés, vagyis az f értéke két nagyon könnyen számítható korlát közé szorítható. Ennek felhasználásával az f fáradságos kiszámítása sokszor elkerülhető.

Mivel fix p mellett a t-eloszlás táblázatának értékei f növelésével nőnek biztos, hogy t_min ≤ t _p ≤ t_max, ahol t_min, t _p és t_max rendre a p szignifikanciaszinthez és f_min, f és f_max szabadsági fokhoz tartozó t-eloszlás táblázatában található értékek. Így |t| ≥ t_max esetén biztos, hogy |t| ≥ t_p is teljesül, vagyis a nullhipotézis elvetéséhez elegendő, hogy |t| ≥ t_max teljesüljön. Hasonlóan |t| < t_min esetén biztos, hogy |t| < t_p is teljesül, s így a nullhipotézis megtartásához |t| < t_min is elegendő.

Egy másik lehetőség az f fáradságos kiszámításának megkerülésére annak a felhasználása, hogy ha m és n elég nagy (általában az m > 40, n > 40 feltételt szokták megadni), akkor a t-táblázat helyett lehet a standard normális eloszlás táblázatát használni ugyanúgy, mint például az egymintás u-próba (vagy egyébként bármely u-próba) esetén. Ezt azért lehet megtenni, mert ilyen magas n és m értékek mellett a t-eloszlás nagyon közel van a normális eloszláshoz (a t-eloszlás a szabadsági fok növelésével aszimptotikusan normális eloszlású).
A Welch-próba bizonyos tekintetben a kétmintás u-próba párja. A kétmintás u-próba ugyanezt a nullhipotézist vizsgálja, csak feltétele az szórások értékének előzetes ismerete is, s nem a minták adatai alapján becsli azokat. A próbastatisztika képlete is nagyon hasonló, csak benne az becsült s_x és s_y szórások helyett az eleve ismert σ_x és σ_y szórások szórások szerepelnek. A két próba matematikai háttere is nagyon hasonló.
Szintén szoros a kapcsolat a Welch-próba és a kétmintás t-próba között. Ez a két próba is ugyanazt a nullhipotézist teszteli, ugyanolyan adottságok mellett, csak a kétmintás t-próba feltételezi, hogy a két valószínűségi változó szórásai megegyeznek, míg a Welch-próbához nincs szükségünk ilyen feltételezésre. Ennek a két próbának a képlete viszont jelentősen különbözik egymástól.
A szakirodalom nem teljesen egységes annak tekintetében, hogy a nullhipotézis elvetéséről vagy megtartásáról szóló döntésben az |t| és t_p közötti két egyenlőtlenség közül melyiknél engedi meg az egyenlőséget. Ennek gyakorlati jelentősége nem igazán van, az alkalmazások során nagyon ritkán adódik, hogy a kiszámított próbastatisztika pontosan egybeessen a táblázatbeli értékkel. Ha esetleg mégis így alakul, akkor az eredmény úgy interpretálható, hogy a nullhipotézis elvetése esetén a kockázat pontosan megegyezik a szignifikanciaszinttel, s innen a kutató (és a tudós társadalom) szája ízétől függ, hogy ebben inkább a nullhipotézis elvetésének, vagy inkább a nullhipotézis megtartásának zálogát látja.
Érdemes megfigyelni az óvatos fogalmazást a nullhipotézis megtartása esetén. Az általunk meghatározott p szignifikanciaszint az elsőfajú hiba elkövetésének valószínűségét adja meg. Ha el tudom vetni a nullhipotézist, ekkora kockázatot vállalok arra nézve, hogy esetleg hiba elvetni. Amennyiben viszont nem tudom elvetni a nullhipotézis, akkor elsőfajú hibát biztosan nem fogok elkövetni, ám elkövethetek másodfajú hibát, melynek kockázatáról semmit nem mond a próba. Ez indokolja, hogy ha a nullhipotézist megtartjuk, akkor nem azt mondjuk, hogy nincs szignifikáns különbség a minta átlaga és az előre megadott m érték között, hanem hogy a Welch-próba nem tudott szignifikáns különbséget kimutatni (ami ettől még lehet, hogy van).

Források

Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen
Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest
Michaletzky Gy. – Mogyoródi J. (1995): Matematikai statisztika, Nemzeti Tankönyvkiadó, Budapest
Michelberger P. – Szeidl L. – Várlaki P. (2001): Alkalmazott folyamatstatisztika és idősor-analízis. Typotex Kiadó, Budapest
Vargha A. (2000): Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, Budapest

Matematikaportál • összefoglaló, színes tartalomajánló lap