Regressziószámítás
A statisztikában a regressziószámítás vagy regresszióanalízis során két vagy több véletlen változó között fennálló kapcsolatot modellezzük. A regressziós modell tulajdonságai alapján megkülönböztethetünk lineáris és nemlineáris regressziót, az adataink alapján pedig idősor, keresztmetszeti, és panel regresszióanalízist.
A feladat
[szerkesztés]A regresszió feladata két vagy több valószínűségi változó közötti függvénykapcsolat meghatározása.
A változókat reprezentáló (n+1) dimenziós vektor koordinátáira kapott m számú mérési adatból meg kell határozni egy, a vizsgált jelenséget leíró, jól kezelhető függvényt: , amelynek az helyeken felvett értékei
- vagy megegyeznek a megfelelő mért értékekkel: - (interpoláció),
- vagy az eltérések valamilyen minimum-feltételnek eleget tesznek (regresszió).
Az eltérések mértékét többféleképpen lehet megadni. Leggyakrabban a hibaértékek eltérések : négyzetösszegének minimumát követeljük meg. (l.: legkisebb négyzetek módszere).
A vizsgált jelenség természete szabja meg a közelítésre alkalmas függvény típusát. Eszerint megkülönböztetünk lineáris és nemlineáris regressziót. A kapcsolt változók száma szerint ugyancsak eltérnek a modellek. Ilyen értelemben beszélünk két-, három- stb. változós regresszióról.
Lineáris regresszió
[szerkesztés]Az általános lineáris modell az
függvény együtthatóinak meghatározását követeli meg. (Többváltozós lineáris regresszió.)
A leggyakoribb kétváltozós lineáris modell a síkon derékszögű koordináta-rendszerben pontokkal ábrázolható adathalmazra egyenletű egyenes illesztését írja elő. Ezt az egyenest szokás trend-vonalnak, az egyenlet együtthatóját trendnek (meredekség, tendencia), konstansát tengelymetszetnek nevezni.
Az együtthatók becslésére alkalmazott eljárások:
- a legkisebb négyzetek módszere (angolul Ordinary Least Squares – OLS)
- az általánosított legkisebb négyzetek módszere (Generalized Least Squares – GLS)
- az általánosított momentumok módszere (Generalized Method of Moments – GMM)
- a legnagyobb valószerűség módszere (Maximum Likelihood estimation – ML).
Nemlineáris regresszió
[szerkesztés]Nemlineáris regressziószámítást akkor alkalmaznak, ha a modell nemlineáris. Az ilyenkor alkalmazható linearizáló módszer abból áll, hogy az eredeti változók helyett, velük összefüggő, de egymással lineáris kapcsolatban lévő változókat vezetünk be.
- Például az formulából az helyettesítésekkel az lineáris kapcsolat adódik. Ennek(a,b) együtthatóiból az eredeti formula konstansai adódnak: .
Regresszió. Gyakorlati alkalmazások
[szerkesztés]- Kehl Dániel-Sipos Béla. Excel parancsfájlok felhasználása a statisztikai elemzésekben. Oktatási segédlet. Gyakorlati alkalmazások. OSZK-MEK (PDF és XLSM) (magyar nyelven). (Hozzáférés: 2022. március 1.)