Ugrás a tartalomhoz

Kovariancia

Ellenőrzött
A Wikipédiából, a szabad enciklopédiából

A kovariancia a valószínűségszámítás és a statisztika tárgykörébe tartozó mennyiség, ami megadja két egymástól különböző változó együttmozgását. Kis értékei gyenge, nagy értékei erős lineáris összefüggésre utalnak. Nem normált; normálással a korrelációt kapjuk.

Definíció

[szerkesztés]

Létezésének szükséges feltétele, hogy létezzen mindkét véletlen valószínűségi változó, továbbá szorzatuk várható értéke. Ez biztosan teljesül, ha és négyzetesen integrálható, azaz és . Értéke , ahol E az úgynevezett várhatóérték-operátor.

Folytonos és diszkrét valószínűségi változók kovarianciája:

.

Az n elemű statisztikai minta tapasztalati (empirikus) kovarianciáját az alábbi képlettel adjuk meg:

, ahol az , az minta . eleme, és pedig az és az minták mintaátlagai. (Ugyanez a képlet átalakítható az formára)

Példák

[szerkesztés]

Legyen kétdimenziós normális eloszlású, és a kovarianciamátrixszal:

ekkor a kovariancia:

Legyen kétdimenziós multinomiális eloszlású (), így:

Tulajdonságai

[szerkesztés]
  • A kovariancia pozitív, ha és között pozitív az összefüggés, ha nagy, akkor is nagy, és ha kicsi, akkor is kicsi.
  • A kovariancia negatív, ha és között negatív az összefüggés, ha nagy, akkor kicsi, és ha kicsi, akkor nagy. Ez nem fordított arányosságot jelez, hiszen a kovariancia csak lineáris összefüggés kimutatására képes.
  • A kovariancia nulla, akkor és között nincs lineáris összefüggés, de másfajta lehet.

Az eltolási tulajdonság:

Bizonyítás:

Kapcsolat a szórásnégyzettel

[szerkesztés]

Tétel: A kovariancia a szórásnégyzet általánosítása, mivel

Bizonyítás:

Tehát a szórásnégyzet a valószínűségi változó önmagával vett kovarianciája.

A kovarianciával kiszámítható négyzetesen integrálható valószínűségi változók összegének szórásnégyzete. Általában:

Speciálisan, két valószínűségi változó összegének szórásnégyzete:

Ahogy az közvetlenül következik a definícióból, ha az egyik valószínűségfi változó előjele megváltozik, akkor a kovariancia is:

Így két valószínűségi változó különbségére:

Linearitás, szimmetria és definitség

[szerkesztés]

Tétel: A kovariancia szimmetrikus pozitív szemidefinit bilineáris forma a négyzetesen integrálható valószínűségi változók terében.

Tétel: Bilineárisság: Az valós számokra:

Bizonyítás:

Könnyen látható, hogy a kovariancia invariáns a konstans hozzáadására. A második egyenlőségben szimmetria miatt első változójában is lineáris.

Tétel: Szimmetria.

Bizonyítás:

Tétel (Pozitív szemidefinit):

Bizonyítás:

A szimmetrikus szemidefinit bilineáris alakból következik, hogy teljesül a Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenség:

A linearitásból következik, hogy a kovariancia függ a véletlen változók nagyságáétól. Így a kovariancia a tízszeresére változik, ha helyett a valószínűségi változót használjuk. Így a kovariancia nagysága a valószínűségi változók mértékegységeitől is függ. Mivel ez a tulajdonság nehezen értelmezhetővé teszi a kovariancia nagyságát, azért helyette inkább a korrelációs együtthatót használják, ami skálafüggetlen:

Korrelálatlanság és függetlenség

[szerkesztés]

Definíció: Ha és valószínűségi változók, és , emiatt , akkor és korrelálatlan.

Tétel: Ha és független valószínűségi változók, akkor

Bizonyítás: Független valószínűségi változók esetén , d. h.

A megfordítás nem mindig teljesül. Legyen az valószínűségi változó egyenletes eloszlású a intervallumon, és . Nyilvánvaló, hogy és nem függetlenek. Viszont

.

További példák korrelálatlan, de nem független valószínűségi változókra:

Legyenek és valószínűségi változók úgy, hogy und

Ekkor és ,
Következik, hogy és , tehát
Másrészt és nem függetlenek, mivel .

Legyenek és valószínűségi változók Bernoulli-eloszlásúak a paraméterrel és függetlenek. Ekkor és korrelálatlan, de nem független.

A korrelálatléanság nyilvánvaló, mivel
De és nem függetlenek, hiszen

Források

[szerkesztés]

Fordítás

[szerkesztés]

Ez a szócikk részben vagy egészben a Kovarianz (Stochastik) című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.