F-próba
Ez a szócikk nem tünteti fel a független forrásokat, amelyeket felhasználtak a készítése során. Emiatt nem tudjuk közvetlenül ellenőrizni, hogy a szócikkben szereplő állítások helytállóak-e. Segíts megbízható forrásokat találni az állításokhoz! Lásd még: A Wikipédia nem az első közlés helye. |
A statisztikában az F-próba a szórásnégyzetek egyenlőségét vizsgáló eljárás, melynél a nullhipotézis, hogy két normális eloszlású mintának azonos a varianciája.
Két csoport teljesítménye azonos átlagteljesítmény esetén is lehet különböző az eltérő szórás miatt. Az F-próba arra adja meg a választ, hogy szignifikáns-e ez az eltérés. Alapvetően F-próba alatt bármelyik statisztikai eljárást érthetjük, amely két vagy több minta szórását hasonlítja össze (Levene-próba, Brown–Forsythe-próba); ebben a szócikkben F-próba alatt azt az eljárást értjük, ahol a próbastatisztika két minta tapasztalati szórásának arányán alapszik. Ez egy rendkívül egyszerű példája a matematikai statisztikának, amelyből az F-eloszlás is levezethető. A gyakorlati statisztikában a használatával kapcsolatban vannak akadályok: a próba túlságosan érzékeny a normalitás meglétére ahhoz, hogy rutinpróbaként alkalmazhassuk a szórásnégyzet különbségének megállapításához. Tehát a minták elemzésénél minden olyan esetben, ahol akár minimálisan is, de sérül a normalitás feltevése, nem javasolt a próba használata, mivel túlságosan sérül a statisztikai ereje.
A próba
[szerkesztés]Legyen X1, ..., Xn és Y1, ..., Ym független minta két populációból, ahol mindkét populáció normális eloszlással rendelkezik. A két populáció várható értékei lehetnek különbözőek, a nullhipotézis pedig az, hogy a varianciájuk egyenlő (). Legyenek
- és
a minták tapasztalati átlagai és legyenek
- és
a minták tapasztalati varianciái (Bessel-korrigált becslések a varianciára). Ekkor a próbastatisztikának használandó az
tapasztalati, empirikus érték. F-nek F-eloszlása van, de az F-statisztika eloszlása különböző mintanagyságok esetén különböző. Azt, hogy melyik F-eloszlást kell választanunk, azaz az F-eloszlás paramétereit a minták szabadsági foka mutatja meg, ami n – 1 és m – 1.
Adott szignifikanciaszint (szokásos p = 0,05 = 5%-ot választani) mellett kikeressük F(n–1, m–1) értékét táblázatból, ez lesz a kritikus érték. Ha Femp ≤ Fkrit, akkor elfogadjuk a H0 nullhipotézist, azaz a szórásnégyzetek egyenlősége igaz, különben elvetjük.
Tulajdonságok
[szerkesztés]Az F-próba rendkívül érzékeny a nem normális eloszlásra, így a Levene-próba, a Bartlett-próba vagy a Brown–Forsythe-próba alkalmasabb a szórásnégyzet egyenlőségének vizsgálatára (azonban ezeknél a próbáknál nagyobb esély van elsőfajú hibára).
Az F-próbát más hipotézisvizsgálatok során is szokták alkalmazni, például átlagok különbségének vizsgálatánál három, vagy több csoportban, vagy faktoriális elrendeződésben. Ezek az F-próbák általában nem robusztusak, ha sérül a normalitás feltétele, különösen egyenlőtlen elrendezés és magas konfidenciaintervallum (alacsony alfa-szint) esetén. Magas alfa-érték (0,05 = 5% felett) és kiegyenlített elrendezés esetén a próba relatíve robusztus, azonban, a normális eloszlás kis változása esetén is veszít statisztikai erejéből nem parametrikus változataihoz képest.