Ugrás a tartalomhoz

NM-módszer

A Wikipédiából, a szabad enciklopédiából
NM-method
NM-módszer

Az NM-módszer (avagy a Naszódi–Mendonça-módszer) a statisztikában, ökonometriában, közgazdaságtanban, szociológiában és demográfiában alkalmazható módszer, amellyel tényellentétes kontingenciatáblázatok készíthetők. A módszer megkeresi azt az () mátrixot, amely a „legközelebb” áll a () – magtáblázatnak is nevezett – mátrixhoz abban az értelemben, hogy azonos rangsorolású, de a sor- és oszlop-összegei egy célmátrix sor- és oszlop-összegeivel egyeznek meg. Míg az mátrix sor- és az oszlop-összegei ismertek, addig maga az mátrix nem feltétlen ismert.

Mivel a fenti megkötések egyértelműen meghatározzák az mátrixot, ezért az NM-módszer egy függvény: , ahol egy kizárólag 1-esekből álló, méretű sor-vektor, míg egy kizárólag 1-esekből álló, méretű oszlop-vektor.

Az NM-módszert Naszodi és Mendonca (2021)[1] fejlesztette ki (és először Naszodi és Mendonca (2019)[2] alkalmazta) olyan kontingenciatáblázat transzformálási problémákra, ahol a mátrix nem a keresett mátrix által reprezentált populációból vett mintát, hanem egy attól eltérő populációt reprezentál.

Az alkalmazásukkal a végzettség szerinti homofília erősségének generációk közötti változását számszerűsítették és ezáltal a különböző végzettségű csoportok közötti társadalmi egyenlőtlenség historikus változását mérték meg az USA-ra 1980 és 2010 között. Az egyenlőtlenség trendjét U-alakúnak találták, ami azt a nézetet erősíti, hogy megfelelő társadalom- és gazdaság-politikával az egyenlőtlenség mérsékelhető.[3]

A mátrixok rangsorának definíciója

[szerkesztés]

Két azonos méretű mátrix "közelsége" többféleképpen definiálható. Az euklideszi távolság és a Kullback-Leibler divergencia két jól ismert példa.

Az NM-módszer egy harmadik, a Liu-Lu ordinális indexen alapuló definícióval[4] áll összhangban, ahol a Liu-Lu index a Coleman-index kissé módosított változata (lásd Coleman (1958)-ös tanulmányának (15)-ös egyenletét).[5] A meghatározás szerint akkor áll az mátrix a mátrixhoz legközelebb, ha a Liu-Lu értékeik megegyeznek. Más szóval, ha az és mátrixok azonos rangsorolásúak a Liu-Lu ordinális index alapján.

Ha egy 2-szer-2-es méretű mátrix, akkor a Liu-Lu index skalár-értékű és így definiált:

, ahol  ;  ;  ;  ; .

Coleman (1958)[5] nyomán ezt az indexet úgy értelmezhetjük, mint a „ténylegesen felvett érték mínusz a várható érték osztva a maximálisan felvehető érték mínusz a minimálisan felvehető érték”, mivel a magtáblázat -helyén felvett tényleges értékét jelöli; az ugyanezen helyen felvett érték várható értékét (illetve annak egészrészét) jelöli azon tényellentétes feltételezés mellett, hogy a mátrix sor- és oszlop-összegei előre meghatározottak, míg a mátrix belső elemei véletlenszerűek. a magtáblázat -helyén felvehető érték minimális értéke is egyben, feltéve, hogy a magtáblázat sor- és oszlop-változója közötti asszociáció nem-negatív. Végül, a maximális értéke adott sor-összeg () és oszlop-összeg () vektorok mellett.

A Liu-Lu indexet Naszodi és Mendonca (2021)[1] általánosította arra az esetre, amikor mérete (, ). Az általánosított Liu-Lu index mátrix-értékű. Az általánosítás egyik előfeltétele, hogy a mátrix sor- és oszlop-változója rendezett legyen. Ugyanis a és az mátrixok mátrix-értékű Liu-Lu indexei csak úgy tehetők egyenlővé, hogy dichotomizáljuk a rendezett sor- és oszlop-változóikat módon, melynek során kihasználjuk a rendezettségüket. Majd az így kapott 2-szer-2-es mátrixok skalár-értékű Liu-Lu indexeit tesszük egyenlővé. Formalizálva: minden egyes párra (ahol , és ) kikötjük, hogy , ahol az alábbi méretű mátrix melynek az első blokkja méretű, a második blokkja méretű. Hasonlóképpen, a egy méretű mátrix, amely az alábbi mátrix transzponáltjaként áll elő: , amelynek első blokkja méretű, második blokkja méretű.

A sorösszegekre és az oszlopösszegekre vonatkozó megkötések

[szerkesztés]

A keresett matrixnak nem csak az megkötést, hanem a sor- és oszlop-összegekre vonatkozó megkötéseket is teljesíteni kell, azaz: és .

Megoldás

[szerkesztés]

Feltéve, hogy teljesül minden párra (ahol , és ), a mátrixra vonatkozó megoldás egyértelmű, determinisztikus, és egy zárt formájú képlettel megadható.[1]

A méretű és mátrixokra a megoldás:

.

Az mátrix további 3 cellájában lévő értékeket pedig egyértelműen megadják a sor- és az oszlop-összegekre vonatkozó megkötések. Tehát így működik az NM-módszer -es táblázatokra.

Ha azonban az , és mátrixok (, ) méretűek, akkor először a rendezett értékű sor- és oszlop-változókat minden lehetséges módon dichotomizálnunk kell, mielőtt megoldunk számú -es formátumú feladatot. Egy tetszőleges párra (ahol és ) a feladatokat egyfelől a megkötés, másfelől a sor- és oszlop-összegekre vonatkozó megkötések definiálják: , és . Minden egyes feladatot külön-külön meg kell oldani a fenti képlettel. A megoldások meghatározzák az mátrix darab cella-értékét. Míg a maradék cella-értéket a sor- és oszlop-összegek határozzák meg.

Ezután azt nézzük meg, hogy alkalmazható-e az NM-módszer, ha a mátrix nem teljesíti azt az előfeltételt, hogy párra .

Ennek egyik alesete, ha párra . Ekkor a megoldás szintén egyértelmű, determinisztikus, és zárt formájú képlettel adott. A mátrix-rangsor fogalma azonban kissé eltér a fentebb tárgyalttól. Liu és Lu (2006)[4] így definiálja azt , ahol  ; az a legkisebb egész szám, amely nagyobb vagy egyenlő, mint .

Végül ha van olyan pár is, amelyre , és olyan pár is, amelyre, akkor sem az NM-módszer, sem nem definiált.

Egy számpélda

[szerkesztés]

Tekintsük az alábbi mátrixot, amelyet kiegészítettünk annak sor- és oszlop-összegeivel, valamint a cél-sor-összegeivel (azaz az mátrix sor-összegeivel) és cél-oszlop-összegeivel (azaz az mátrix oszlop-összegeivel):

Z 1 2 3 4 ÖSSZES CÉL
1 120 70 30 20 240 400
2 50 100 50 35 235 300
3 30 40 75 40 185 150
4 10 20 30 80 140 150
ÖSSZES 210 230 185 175 800
CÉL 400 300 200 100 1000

Az NM-módszer első lépéseként a mátrixot megszorozzuk az egyes (, és ) párokhoz tartozó , és mátrixokkal. Szorzatként a következő 9 darab -es méretű mátrixot kapjuk (ahol a cél-sor- és cél-oszlop-összegeket is feltüntettük):

1 2 ÖSSZES CÉL
1 120 120 240 400
2 90 470 560 600
ÖSSZES 210 590 800
CÉL 400 600 1000
1 2 ÖSSZES CÉL
1 190 50 240 400
2 250 30 560 600
ÖSSZES 440 360 800
CÉL 700 300 1000
1 2 ÖSSZES CÉL
1 220 20 240 400
2 405 155 560 600
ÖSSZES 625 175 800
CÉL 900 100 1000
1 2 ÖSSZES CÉL
1 170 305 475 700
2 40 285 325 300
ÖSSZES 210 590 800
CÉL 400 600 1000
1 2 ÖSSZES CÉL
1 340 135 475 700
2 100 225 325 300
ÖSSZES 440 360 800
CÉL 700 300 1000
1 2 ÖSSZES CÉL
1 420 55 475 700
2 205 120 325 300
ÖSSZES 625 175 800
CÉL 900 100 1000
1 2 ÖSSZES CÉL
1 200 460 660 850
2 10 130 140 150
ÖSSZES 210 590 800
CÉL 400 600 1000
1 2 ÖSSZES CÉL
1 410 250 660 850
2 30 110 140 150
ÖSSZES 440 360 800
CÉL 700 300 1000
1 2 ÖSSZES CÉL
1 565 95 660 850
2 60 80 140 150
ÖSSZES 625 175 800
CÉL 900 100 1000

A következő lépés az általánosított mátrix-értékű Liu-Lu index kiszámítása , (ahol ) alkalmazva az eredeti skalár-értékű Liu-Lu index képletét mind a 9 mátrixra:

0,39 0,54 0,62
0,53 0,44 0,47
0,73 0,61 0,45

Amint az látható, az mátrix pozitív, ezért az NM-módszer definiált. A 9 darab 2-szer-2-es feladat megoldása az mátrix 9 cella-értékét határozza meg. A maradék 7 cella értékét pedig a cél-sor-összegek és a cél-oszlop-összegek alapján tudjuk kiszámolni. A megoldás:

1 2 3 4 ÖSSZES
1 253,1 91,4 40,5 15,1 400
2 91,1 147,1 39,8 21,9 300
3 39,6 36,8 64,2 9,3 150
4 16,2 24,7 55,5 53,6 150
ÖSSZES 400 300 200 100 1000

Egy további numerikus példa, amely Abbott és szerzőtársaitól (2019) származik

[szerkesztés]

Tekintsük a következő mátrixot kiegészítve annak sor- és oszlop-összegeivel, valamint a cél-sor- ( mátrix sor-összegei) és a cél-oszlop-összegekkel ( mátrix oszlop-összegei):

Z 1 2 3 ÖSSZES CÉL
1 1 070 270 20 1360 1 600
2 300 4 980 560 5840 5 900
3 20 420 2 360 2800 2 500
ÖSSZES 1 390 5 670 2 940 10 000
CÉL 1 390 5 670 2 940 10 000

Az NM-módszer első lépéseként a mátrixot megszorozzuk az egyes (, és ) párokhoz tartozó , és mátrixokkal. Ez a következő 4 darab 2-szer-2-es mátrixot eredményezi (kiegészítve a cél-sor- és a cél-oszlop-összegekkel):

1 2 ÖSSZES CÉL
1 1 070 290 1 360 1 600
2 320 8 320 8 640 8 400
ÖSSZES 1 390 8 610 10 000
CÉL 1 390 8 610 10 000
1 2 ÖSSZES CÉL
1 1 340 20 1 360 1 600
2 5 720 2 920 8 640 8 400
ÖSSZES 7 060 2 940 10 000
CÉL 7 060 2 940 10 000
1 2 ÖSSZES CÉL
1 1 370 5 830 7 200 7 500
2 20 2 780 2 800 2 500
ÖSSZES 1 390 8 610 10 000
CÉL 1 390 8 610 10 000
1 2 ÖSSZES CÉL
1 6 620 580 7 200 7 500
2 440 2 360 2 800 2 500
ÖSSZES 7 060 2 940 10 000
CÉL 7 060 2 940 10 000

A következő lépés az általánosított mátrix-értékű Liu-Lu index kiszámítása , (ahol ) alkalmazva az eredeti skalár-értékű Liu-Lu index képletét mind a 4 mátrixra:

0,75 0,95
0,95 0,78

Látható, hogy az mátrix pozitív. Ezért az NM-módszer definiált. A 4 darab 2-szer-2-es feladat megoldása az mátrix 4 cella-értékét határozza meg. A többi 5 cella-értéket pedig a cél-sor- és a cél-oszlop-összegek alapján számolhatjuk ki. A megoldás a következő mátrix:

1 2 3 ÖSSZES
1 1 101 476 24 1 600
2 271 4 819 809 5 900
3 18 375 2 107 2 500
ÖSSZES 1 390 5 670 2 940 10 000

Implementáció

[szerkesztés]

Az NM-módszer Excelben,[6] Visual Basicben,[6] R-ban[6] és Statában[7] érhető el leprogramozva.

Alkalmazások

[szerkesztés]

Az NM-módszer különféle jelenségek tanulmányozására alkalmazható, beleértve az assortatív párválasztást, a generációk közötti mobilitást, mint a társadalmi mobilitás egy fajtáját, a lakóhely szerinti szegregációt, a munkaerő-toborzást, és a tehetséggondozást.

Mindezen alkalmazásokban az , , és mátrixok a párokba rendezett entitások (pl. férjek és feleségek, vagy elsőszülött gyermekek és anyák, lakások és főbérlők, vagy vezérigazgatók és cégek, vagy sakkoktatók és legtehetségesebb tanítványaik) együttes eloszlásait reprezentálják, amelyeket vagy egy dichotóm kategorikus változó jellemez (pl. vegetáriánus/nem vegetáriánus, nagymester/nem nagymester), vagy egy rendezett multinomiális kategorikus változó (pl. végső iskolai végzettség szintje, a sítudás szintje, jövedelmi kategória, bérleti díj kategória, hitelminősítés, FIDE címek). Bár az NM-módszer széles körben alkalmazható, a következőkben bemutatásra kerülő példák mindegyike az iskolai végzettség szerinti asszortatív párválasztásról szól. Ezen alkalmazások esetén ugyanis az NM-módszer alkalmazhatóságának két előfeltétele (a rendezett-értékű tulajdonság-változó, és a minden oktatási csoportra jellemző pozitív assortatív párválasztás) nem vitatott.

Tegyük fel, hogy a és az mátrixok jellemzik a zalaegerszegi, valamint a yorki férjek és feleségek együttes iskolázottsági megoszlását, rendre. Az NM-módszerrel konstruálandó mátrix azt mondja meg, hogy mi lenne a párok együttes végzettség-eloszlása Zalaegerszegen, ha a házasulandó férfiak és nők iskolai végzettsége megegyezne a yorkiakéval, miközben a homogámia iránti általános vágy (vagy közgazdasági szóhasználattal élve, az aggregált házassági preferenciák, avagy szociológiai szóhasználattal élve, a házasodási társadalmi norma) változatlan maradna.

Egy második alkalmazásban a és mátrixok ugyanazt az országot két különböző évben jellemzik. A mátrix jellemzi az olyan frissen házasodott amerikaiak együttes iskolázottsági eloszlását 2040-ben, ahol a férjek a Z-generációba tartoznak, és a megfigyelés évében (2040-ben) fiatal felnőttek. Az mátrix annyiban tér el a mátrixtól, hogy az a 2024-ben megfigyelt Y-generációt jellemzi. Az mátrix megkonstruálásával azt lehet majd tanulmányozni a jövőben, hogy a frissen házasodott amerikai fiatal párok iskolai végzettség szerinti együttes eloszlása milyen lenne, ha az érintettek ugyanúgy szeretnének majd házasodni, mint a Z-generációs férfiak és partnereik, miközben az iskolai végzettségük az Y-generációba tartozó férfiak és partnereik végzettségével azonos.

Egy harmadik alkalmazásban a és mátrixok ismét ugyanazt az országot jellemzik, de két különböző évben. Ebben az alkalmazásban a mátrix a portugál fiatal párok (ahol a férfi partnerek életkora 30 és 34 év közötti) együttes végzettség szerinti elosztását mutatja 2011-ben. ugyancsak egy végzettség szerinti elosztást mutat, de az 1981-ben megfigyeltet. Az mátrix megkonstruálásának ebben az esetben az lehet a célja, hogy tanulmányozzuk, milyen lett volna a portugál fiatal párok iskolai végzettsége, ha a 2011-ben fiatal társaikhoz hasonlóan rendeződtek volna párokba, miközben a nemenkénti iskolai végzettségük megegyezett volna az 1981-essel.

Az első két alkalmazás mindegyikében az mátrix egy tényellentétes együttes eloszlást reprezentál, amely bizonyos ceteris paribus hatások számszerűsítésére szolgál. Pontosabban, a segítségével egy tényellentétes dekompozíció során kardinális skálán számszerűsíthetjük a Zalaegerszegiek és York-iak – közvetlenül nem-megfigyelhető – házassági preferencia különbségét, vagy a Z- és az Y-generációk házassági preferencia különbségét. A dekompozíció minden esetben az tényellentétes táblázatra épül, hiszen annak segítségével tudjuk kiszámolni az egyes faktorok (azaz a különböző iskolai végzettségű potenciális partnerek megfigyelhető strukturális elérhetősége, amely meghatározza a párválasztási lehetőségeket a népesség szintjén; és a nem-megfigyelhető nem-strukturális mozgatórugók, pl. aggregált házassági preferenciák, vágyak, normák, társadalmi korlátok) és azok interakciójának[8] a hozzájárulását egy megfigyelhető kardinális statisztika változásához (pl. a végzettség szerinti homogám pár-arány változásához).

A harmadik alkalmazást Naszodi és Mendonca (2021)[1] arra használta, hogy az értelmetlen tényellentétes esetét illusztrálja vele: az iskolai végzettség olyan drasztikusan változott meg Portugáliában a vizsgált három évtized alatt, hogy az 1981 és 2011-es megfigyelésekből "összemixelt" tényellentétes nem fordulhatna/ nem fordulhatott volna elő.

Az NM-módszer néhány jellemzője

[szerkesztés]

Először is, az NM-módszer nem ad értelmes megoldást, ha átlépi az alkalmazhatósága határát.[1] Például a harmadik alkalmazásban az NM-módszer negatív cella-értékű mátrixot eredményez, mivel a tényellentétes lehetetlen (lásd: AlternativeMethod_US_1980s_2010s_age3035_main.xls PT_A1981_P2011_Not_meaningful lap).[6] E tekintetben az NM-módszer hasonlít a lineáris valószínűségi modellhez, amely ugyancsak jelzi, ha elértük az alkalmazhatósága határát: az egységnyi intervallumon kívüli valószínűséget rendel egyes eseményekhez.

Másodszor, az NM-módszer kommutál mind a sor-változó, mind az oszlop-változó szomszédos kategóriáinak összevonásával:[1] , ahol az méretű sor-összevonó mátrix; és , ahol az méretű oszlop-összevonó mátrix.

Harmadszor, az NM-módszer akkor is alkalmazható, ha a mátrix egyes celláiban nulla szerepel.[1]

Összehasonlítás az IPF-fel

[szerkesztés]

Az Iterative Proportional Fitting eljárás (IPF) is egy függvény:[9][10][11][12] . Ezzel az eljárással megtalálható az az mátrix (), amely ahhoz hasonló megkötéseket elégít ki, mint amilyeneket az NM-módszerrel készített mátrix. Pl. az mátrix az a mátrixhoz legközelebbi mátrix, amelynek a sor- és oszlop-összegei az mátrix által meghatározott cél-sor- és cél-oszlop-összegek.

Azonban van néhány fontos különbség az IPF és az NM-módszer között. Az IPF az azonos méretű mátrixok közelségét a kereszt-entrópiával avagy a Kullback-Leibler divergenciával határozza meg.[13] Ennek megfelelően a 2x2 mátrixok közötti távolság IPF-kompatibilis fogalma szerint az és mátrixok távolsága akkor nulla, ha a kereszt-szorzati arányaik[12] (más néven esélyhányadosaik) egyenlők: .[14] Emlékeztetőül, az NM-módszer hasonló feltétele az és mátrixok azonos rangsorolására: .

A következő numerikus példa rávilágít arra, hogy az IPF és az NM-módszer nem azonos: . Vegyük a következő mátrixot a cél-sor- és cél-oszlop-összegeivel

1 2 ÖSSZES CÉL
1 450 150 600 1 050
2 50 350 400 450
ÖSSZES 500 500
CÉL 1 000 500 1 500

Az NM-módszerrel a következő mátrixot kapjuk:

1 2 ÖSSZES
1 925 125 1 050
2 75 375 450
ÖSSZES 1 000 500 1 500

Míg az IPF- fel kapott megoldás:

1 2 ÖSSZES
1 900 150 1 050
2 100 350 450
ÖSSZES 1 000 500 1 500

Az IPF ekvivalens az együttes populációs eloszlás maximum likelihood-módszerén alapuló becslésével,[11] ahol az mátrix a mátrixból becsült együttes populációs eloszlás és a mátrix egy olyan populációból vett véletlen minta, amelynek marginális eloszlásait az mátrix sor- és oszlop-összegei jellemzik. Az IPF által megoldott problémával ellentétben a mátrix nem egy sokaságból vett mintát reprezentál abban a problémában, amelynek megoldására az NM-módszert fejlesztették ki. Valójában az NM-problémában a és mátrixok két különböző populációt jellemeznek (amelyek vagy egyidejűleg megfigyelhetőek, mint a Zalaegerszegiek és Yorkiak esetében, vagy két különböző időpontban figyelhetőek meg, mint a Z- és Y-generációkról szóló példánkban). Az empirikus alkalmazások során ez a különbség segít az NM-módszer és az IPF közötti választásban.[14]

Deming és Stephan (1940), az IPF kitalálói,[15] módszerük alkalmazását egy klasszikus maximum likelihood becslési problémával illusztrálták, ahol a mátrix egy adott marginális eloszlással jellemzett populációból vett mintát reprezentált. Ők ugyanis tisztában voltak azzal a ténnyel, hogy az IPF nem alkalmas általánosan tényellentétes predikció készítésére: kifejezetten felhívták a figyelmet arra, hogy algoritmusuk „önmagában nem használható predikció készítésére” (lásd Stephan és Deming 1940, p. 444).[14][15]

Egy további különbség: azon értelmezési tartományok is eltérőek, amelyekre az IPF és az NM-módszer megoldásokat ad. Először is, ellentétben az NM-módszerrel, az IPF nem nyújt megoldást bármely, nulla értéket tartalmazó magtáblázatra (Csiszár (1975)[16] tárta fel az IPF alkalmazhatóságának szükséges és elégséges feltételeit a nulla értéket tartalmazó magtáblázatok esetére). Másodszor, az IPF-től eltérően, az NM-módszer nem ad értelmes megoldást olyan és mátrix-párokra, amelyek lehetetlen tényellentéteseket határoznak meg. Harmadszor, az NM-módszer alkalmazhatóságának azon előfeltétele, hogy vagy , vagy , nem előfeltétele az IPF alkalmazhatóságának.

Végül, az NM-től eltérően, az IPF nem kommutál a szomszédos kategóriák összevonásával, amint azt Naszodi (2023)[17] egy numerikus példája illusztrálja. Emiatt az IPF-fel kapott transzformált táblázat érzékeny lehet a kategóriák számának megválasztására.

Összehasonlítás a minimális euklideszi távolság megközelítéssel

[szerkesztés]

A Minimum Euclidean Distance Approach (MEDA) (amelyet Abbott és szerzőtársai (2019) írtak le részletesen, de Fernández és Rogerson 2001 alkalmazott először) szintén egy függvény:[18][19] .

A MEDA első lépésként egy skalárt rendel a mátrixhoz: a skalár a két szélsőséges eset (a véletlenszerű és a tökéletesen assortatív párválasztás esetei, ahol a marginálisok ) konvex kombinációjánál alkalmazandó azon relatív súly, amellyel a kombináció eredményéül kapott mátrix és a mátrix euklédeszi távolsága minimalizált. Pl. ennek a skalárnak az értéke az Abbott és szerzőtársai (2019) által elemzett példában.[18] Második lépésként a MEDA megkonstruálja a két szélsőséges eset konvex kombinációját (azaz a véletlenszerű és a tökéletesen assortatív párválasztás kombinációját) bármely tényellentétes határeloszlás-párra ().

Különbségek az NM és a MEDA között: míg az NM az asszortativitás mértékét (avagy az aggregált házassági preferenciákat) az általánosított mátrix-értékű Liu-Lu index változatlanságával tartja fixen, addig a MEDA ugyanezt a skalár rögzítésével éri el. Ha , és mátrixok -esek, akkor a két módszer eredményezheti ugyanazt a transzformált táblázatot feltéve, hogy a ugyanúgy rangsorolja a kontingencia táblákat, mint a skalár-értékű Liu-Lu index.[20] Azonban ha 2-szer-2-esnél nagyobb, akkor az általánosított Liu-Lu index mátrix-értékű, így nem egyezhet meg a skalár-értékű -vel. Emiatt az NM-el kapott transzformált táblázat is különbözik a MEDA-val kapott transzformált táblázattól.

Visszatérve az Abbott és tsai (2019) numerikus példájához, a MEDA-val készített tényellentétes táblázat:

1 2 3 ÖSSZES
1 1 081 240 279 1 600
2 217 5 054 629 5 900
3 92 376 2 032 2 500
ÖSSZES 1 390 5 670 2 940 10 000

Nem elhanyagolható az mátrix és az mátrix közötti eltérés. Pl. a homogám párok aránya 2 százalékponttal kisebb a MEDA által konstruált tényellentétes mátrixban, mint a megfigyelt mátrixban, míg ugyanez a különbség 3,4 százalékpont az NM-által konstruált tényellentétes mátrix és a megfigyelt mátrix esetén.

Mivel Abbott számpéldája nem egy kitalált példa, hanem egy, az Amerikaiakat jellemző, empirikus végzettség szerinti eloszláson alapszik, ezért a 2 százalékpont és a 3,4 százalékpont közötti különbséget úgy interpretálhatjuk, hogy a MEDA lényegesen kisebbnek találja a iskolázottság szerinti homofília (avagy az eltérő végzettségűek közötti társadalmi egyenlőtlenség) generációról generációra való megváltozását az NM-hez képest.

Jegyzetek

[szerkesztés]
  1. a b c d e f g Naszodi (2021). „A new method for identifying the role of marital preferences at shaping marriage patterns”. Journal of Demographic Economics 1 (1), 1–27. o. DOI:10.1017/dem.2021.1. 
  2. Naszodi (2019). „Like marries like”. Fairness Policy Brief Series. [2023. április 16-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. április 21.) 
  3. Naszodi (2021). „A széteső és összeforró társadalom”. Defacto. 
  4. a b Liu (2006). „Measuring the degree of assortative mating”. Economics Letters 92 (3), 317–322. o. DOI:10.1016/j.econlet.2006.03.010. 
  5. a b Coleman (1958). „Relational Analysis: The Study of Social Organizations with Survey Methods”. Human Organization 17 (4), 28–36. o. DOI:10.17730/humo.17.4.q5604m676260q8n7. 
  6. a b c d Naszodi (2021). „Code for A NEW METHOD2, Kiadó: Mendeley. DOI:10.17632/x2ry7bcm95.2. 
  7. Naszodi (2023). „Code for "A NEW METHOD FOR IDENTIFYING WHAT CUPID'S INVISIBLE HAND IS DOING. IS IT SPREADING COLOR BLINDNESS WHILE TURNING US MORE "PICKY" ABOUT SPOUSAL EDUCATION?"”, Kiadó: Mendeley. DOI:10.17632/95k6mmrxvg. 
  8. Naszodi (2022). „Hogyan szálazzuk szét a megfigyelhető változások okait?”. Közgazdasági Szemle 69 (11), 1407-1432. o. 
  9. Sinkhorn, Richard (1964). “A Relationship Between Arbitrary Positive Matrices and Doubly Stochastic Matrices”. In: Annals of Mathematical Statistics 35.2, pp. 876–879.
  10. Bacharach, Michael (1965). “Estimating Nonnegative Matrices from Marginal Data”. In: International Economic Review 6.3, pp. 294–310.
  11. a b Bishop (1967). „Multidimensional contingency tables: cell estimates”. PhD Thesis. Harvard University. 
  12. a b Fienberg (1970). „An Iterative Procedure for Estimation in Contingency Tables”. Annals of Mathematical Statistics 41 (3), 907–917. o. DOI:10.1214/aoms/1177696968. 
  13. Kullback S. and Leibler R.A. (1951) On information and sufficiency, Annals of Mathematics and Statistics, 22 (1951) 79-86.
  14. a b c Naszodi, A. (2023). "The iterative proportional fitting algorithm and the NM-method: solutions for two different sets of problems". arXiv:2303.05515 [econ.GN].
  15. a b Deming (1940). „On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known”. Annals of Mathematical Statistics 11 (4), 427–444. o. DOI:10.1214/aoms/1177731829. 
  16. Csiszár (1975). „I-Divergence of Probability Distributions and Minimization Problems”. Annals of Probability 3 (1), 146–158. o. DOI:10.1214/aop/1176996454. 
  17. Naszodi, A. (2023). "What do surveys say about the historical trend of inequality and the applicability of two table-transformation methods?". arXiv:2303.05895 [econ.GN].
  18. a b Abbott (2019). „Education policy and intergenerational transfers in equilibrium”. Journal of Political Economy 127 (6), 2569–2624. o. DOI:10.1086/702241. 
  19. Fernández (2001). „Sorting and long-run inequality”. The Quarterly Journal of Economics 116 (4), 1305–1341. o. DOI:10.1162/003355301753265589. 
  20. Chiappori (2021). „The measuring of assortativeness in marriage: A comment”. Cowles Foundation Discussion Paper NO. 2316. 

Fordítás

[szerkesztés]

Ez a szócikk részben vagy egészben a NM-method című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.