Levene-próba
Ez a szócikk nem tünteti fel a független forrásokat, amelyeket felhasználtak a készítése során. Emiatt nem tudjuk közvetlenül ellenőrizni, hogy a szócikkben szereplő állítások helytállóak-e. Segíts megbízható forrásokat találni az állításokhoz! Lásd még: A Wikipédia nem az első közlés helye. (2018 decemberéből) |
A statisztikában a Levene-próba egy következtető statisztikai eljárás, amit két vagy több változó szóráshomogenitásának megállapítására használnak. Előfeltétele a legalább intervallumszinten mért változó vagy változók.
Számos gyakran használt statisztikai eljárás azt feltételezi, hogy a populációk szórása, melyekből vesszük mintáinkat, egyenlőek. A Levene-próba ezt az állítást ellenőrzi. Ezen kívül használhatjuk önmagában is eljárásként, amikor azt akarjuk megválaszolni, hogy egy populációból vett két alminta között azonos-e a szórás, vagy sem. A nullhipotézis, hogy a populációk szórása egyenlő (szóráshomogenitás). Mint minden hipotézisvizsgálat esetében, ha a Levene-próba p-értéke kisebb a szignifikanciaszintjénél (pl. 0,05-nél), valószínűsíthetjük, hogy az eltérő szórás nem magyarázható az azonos varianciájú populációkból vett minták véletlenszerűségével. Ennélfogva a nullhipotézist elvethetjük és következtethetünk rá, hogy van különbség a vizsgált populációk szórásában. Megjegyzendő azonban, hogy a szóráshomogenitást vizsgálata sok esetben eltérő számú csoportoknál érdemes vizsgálni (de azonos elemszámúaknál is hasznos lehet.
Néhány statisztikai eljárás jellemzően szóráshomogenitást feltételez, aminek megállapításához a Levene-próbát használhatjuk. Ilyen eljárás a t-próba és a varianciaanalízis is. Ha előfeltétel ellenőrzésére használjuk a Levene-próbát, és szignifikáns az eredménye, ajánlott átváltani olyan statisztikai eljárásra, mely nem feltételez szóráshomogenitást (ez gyakran nem parametrikus próbák használatát igényli).
Definíció
[szerkesztés]A W statisztikai a következőképp van definiálva:
ahol
- a csoportok száma, melyekhez a megfigyelt minták tartoznak
- a gyakoriság száma az -edik számú csoportban
- az összes gyakoriság száma minden csoportban
- az i-edik csoportból vett j-edik gyakoriság változójának értéke
(megjegyzés: A fenti kép a két definíciót tartalmazza, az egyik az átlagot, a második a mediánt tartalmazza)
(Mindkettő definíciót használják, habár a második, szigorú kritériumokkal a Brown–Forsythe-próbának felel meg - lentebb látható a két eljárás összehasonlítása).
- a átlaga az -edik csoportban,
- az összes átlaga.
A W próbastatisztika megközelítőleg F-eloszlású k-1 és N-k szabadságfokkal, ennélfogva az eredménye a W statisztikának az érték, ahol F az F-eloszlás kvantilise, k-1 és N-k szabadságfokkal, ahol az a választott szignifikanciaszint (általában 0.05, vagy 0.01 az értéke).
Összehasonlítás a Brown–Forsythe-próbával
[szerkesztés]A Brown–Forsythe-próba a mediánt használja az átlag helyett a terjedelem kiszámításában mindegyik csoportnál (<math> \bar{Y}</math> vs. <math> \tilde{Y}</math>, feljebb). Az, hogy melyik próbát választjuk ki a szóráshomogenitás ellenőrzéséhez, a vizsgált mintánk tulajdonságain múlik; a Brown–Forsythe-próba egy robusztus eljárás, mely nem normális eloszlású minták esetén kínál jó statisztikai erőt. Ha tudjuk, hogy a mintánk milyen eloszlású, könnyedén ki tudjuk választani a helyes eljárást. Brown és Forsythe Monte Carlo módszerrel készült tanulmányokat készített, melynek eredményei alapján Cauchy-eloszlás esetén a trimmelt átlaggal, khí-négyzet eloszlás (4-es szabadságfokkal) esetén a mediánnal számolás (Brown–Forsythe-próba) teljesített a legjobban. Az átlaggal való számolás (Levene-próba) a legjobb statisztikai erőt szimmetrikus, normál eloszlású minták esetén mutatta.
Hátrányok
[szerkesztés]Egy minta vizsgálatánál a szóráshomogenitás akkor számít igazán, ha a vizsgált csoportok mérete jelentősen eltér egymástól. Ha a vizsgált csoportok mérete nagyjából egyenlő, a szóráshomogenitás értéke . A Levene-próba azonban általában nagy és azonos csoportméreteknél erős statisztikailag, kis méretű, eltérő elemszámú csoportoknál nem. Ennélfogva a Levene-próba akkor működik igazán jól, amikor nem számít jelentősen a szórásegyezés. Végezetül, amennyiben nem jönne létre a szfericitás feltétele, lehetőségünk van nem parametrikus eljárások használatára (például Welch-próba használata T-próba helyett).
Levene-próba használata SPSS-ben
[szerkesztés]SPSS-ben a szórásegyezést legkönnyebben úgy tudjuk ellenőrizni, ha olyan statisztikai próbát használunk, aminek előfeltétele a szórásegyezés (feltételezve a normál eloszlást). Egy kétmintás T-próbánál tehát a következőképp tehetjük meg a szórásegyezés ellenőrzését:
Analyze -> Compare Means -> Independent Samples T test
Ezt követően a vizsgált és a csoportosító változó meghatározása után az Options menüpontra kattintva, a Statistics szekcióban pipáljuk ki a „Homogenity of variance test” rubrikát. Az outputban így megjelenik egy külön oszlop a Levene-próbának („Levene’s Test for Equality of Variances” oszlop), benne az F érték (a próba ereje) és a szignifikancia értéke (Sig.).