Ugrás a tartalomhoz

Szerkesztő:Pallor/Segédletek/Statisztikák a Wikidatából

A Wikipédiából, a szabad enciklopédiából
Tudnivalók

A Wikidatában tárolt adatokból különféle statisztikákat lehet készíteni. Pontosan számszerűsíthetünk addig csak elnagyoltan emlegetett adatokat, vagy a legkülönbözőbb szempontok szerint szelektálhatjuk, sorbarendezhetjük azokat. Lentebb néhány engem érdeklő összesítés található. A lekérdezések egyszeriek, nem, vagy csak alkalmomszerűen frissülnek, de közzéteszem azokat a lekérdezéseket, amikkel készültek, így bármikor csinálhatsz friss statisztikát, vagy a lekérdezés paramétereinek a módosításával akár más összetételű adathalmazt is vizsgálhatsz.

Fontos szem előtt tartani, hogy a közismert statisztikáktól eltérően a Wikidatában a történelmi Magyarország, sőt, a világ írott történetének kezdete óta ismert (és a Wikidatába felvitt) adataiból készülnek a statisztikák. Tehát pl. míg azt arra a kérdésre, hogy hány magyar állampolgár van, általában a kérdés feltételének időpillanatában élő személyek adatait szokás vizsgálni, a Wikidatában a magyar államiság kezdetétől magyarként számontartott személyekről beszélünk, így például a magyar történészek, görög csillagászok, arab matematikusok stb. szűréséhez további finomítások szükségesek (pl. születési-halálozási paraméterek megadása). Ebből adódóan előfordul, hogy a statisztika nem szolgáltat érdemi adatot semmiféle hipotézishez, csupán azt tükrözi, hogy az adatfelvitel egyenetlenségei milyen torzuláshoz vezetnek a Wikidatán.

Hány magyar van a Wikidatában?

[szerkesztés]

Magyarokról többféle vonatkozásban beszélhetünk:

  • magyar nemzetiségűek - erről nem lehet információkat nyerni, mert a Wikidata nem tárol adatot a nemzetiségről
  • magyar állampolgárságúak - erről találsz információt a lenti táblázatban (magyar állampolgárság = az állampolgárság (P27) tulajdonságnál az alábbi három entitás valamelyike szerepel: Magyarország (Q28), Erdélyi Fejedelemség (Q655621), Magyar Királyság (Q171150)
  • magyar anyanyelvűek - ezt az adatot lehetőség lenne felvinni, de nagyon ritkán élünk vele, ezért igen csalóka számok mutatkoznak

2021. január 21-én

állampolgárság szerint
országok 2021 január 2024 szeptember
Magyarország (Q28) 37 136 61 487
Oroszország (Q159) 67 995 86 380
Amerikai Egyesült Államok (Q30) 430 787 583 335
Finnország (Q33) 46 295 71 686
Holland Királyság (Q29999) 70 837 94 269
Románia (Q218) 24 482 34 401
Kína (Q148) 35 284 50 665
anyanyelv szerint
nyelvek 2021 január 2024 szeptember
magyar (Q9067) 670 8416
orosz (Q7737) 11 583 13 283
angol (Q1860) 4730 62 851
finn (Q1412) 215 605
holland (Q7411) 2464 11 501
román (Q7913) 95 657
sztenderd mandarin (Q727694) (kínai (Q7850)) 25 (224) 34 (5601)
Érdemes megfigyelni az anyanyelv szerinti adatok torz voltát. Nyilvánvalóan nem két és félszer annyian beszélnek a Földön oroszul, mint angolul, egyszerűen csak arról van szó, hogy az orosz Wikidata-szerkesztők következetesebben viszik fel az anyanyelvre vonatkozó adatokat, mint más nemzetiségű társaik.

Akinek magyar az anyanyelve, milyen nyelvet beszél még?

[szerkesztés]
nyelv beszélők száma
magyar (Q9067) 585
angol (Q1860) 241
német (Q188) 194
francia (Q150) 107
orosz (Q7737) 71
latin (Q397) 55
román (Q7913) 51
eszperantó (Q143) 45
olasz (Q652) 38
spanyol (Q1321) 24
szlovák (Q9058) 23
héber (Q9288) 21
török (Q256) 13
lengyel (Q809) 11
cseh (Q9056) 10
szerb (Q9299) 9
finn (Q1412) 9
ógörög (Q35497) 9
holland (Q7411) 8
horvát (Q6654) 8
görög (Q9129) 7
bolgár (Q7918) 7
svéd (Q9027) 7
japán (Q5287) 7
kínai (Q7850) 6
ukrán (Q8798) 5
portugál (Q5146) 4
oszmán-török (Q36730) 4
arab (Q13955) 4
perzsa (Q9168) 3
dán (Q9035) 3
norvég (Q9043) 3
volapük (Q36986) 3
jiddis (Q8641) 3
szerbhorvát (Q9301) 3
örmény (Q8785) 3
szlovén (Q9063) 2
ruszin (Q26245) 2
arámi (Q28602) 2
koreai (Q9176) 2
katalán (Q7026) 2
albán (Q8748) 2
bosnyák (Q9303) 1
középfelnémet (Q837985) 1
mordvin (Q627313) 1
csagatáj (Q36831) 1
lett (Q9078) 1
sumer (Q36790) 1
akkád (Q35518) 1
brazíliai portugál (Q750553) 1
thai (Q9217) 1
szuahéli (Q7838) 1
kazak (Q9252) 1
baszk (Q8752) 1
szogd (Q205979) 1
középperzsa (Q32063) 1
kanadai francia (Q1450506) 1
tibeti (Q34271) 1
montenegrói (Q8821) 1
ír (Q9142) 1
prákrit nyelvek (Q192170) 1
óperzsa (Q35225) 1
avesztai (Q29572) 1
szanszkrit (Q11059) 1
számi nyelvek (Q56463) 1
észt (Q9072) 1
bunyevác nyelvjárás (Q33185) 1
besenyő (Q877881) 1
grúz (Q8108) 1
asszír újarámi (Q29440) 1
óegyházi szláv (Q35499) 1
dalmát (Q35527) 1
cigány nyelv (Q13201) 1
vend (Q129431) 1
szír (Q33538) 1
kongói szuahéli (Q10961696) 1
svájci irodalmi német (Q1366643) 1
osztrák német (Q306626) 1
komi (Q36126) 1
manysi (Q33759) 1
hanti (Q33563) 1
indonéz (Q9240) 1

Látható, hogy annyira kevés az elemszám, hogy érdemi statisztika nem készíthető. Egyes esetekben ha csak két újabb valamilyen nyelven beszélő kerül a Wikidatába, már megváltozik a sorrend, holott ennél sokkal nagyobb számú idegen nyelven beszélő személyről van adatunk. Látszik egy adatfelviteli hiba is: a640 magyar anyanyelvű személyből csak 585-en beszélnek ténylegesen magyarul - a Wikidata adatai szerint. Nyilvánvaló, hogy az adatfelvitelnél kell jobban odafigyelni. Érdemes átgondolni, hogy hány diplomatánk, műfordítónk, valamilyen idegen nyelv és kultúra művelője az, akiknek van szócikkük, de a Wikidatába a beszélt nyelveik nem kerülnek be adatként.€

Eszperantóul beszélők anyanyelve

[szerkesztés]

Fordítsuk meg a fenti lekérdezést, és nézzük meg, hogy akiknél a beszélt nyelvek egyike az eszperantó (Q143), annak mi az anyanyelve?

nyelv beszélők száma
magyar (Q9067) 62
cseh (Q9056) 56
francia (Q150) 52
eszperantó (Q143) 49
német (Q188) 42
angol (Q1860) 33
holland (Q7411) 30
orosz (Q7737) 23
lengyel (Q809) 17
svéd (Q9027) 12
spanyol (Q1321) 12
japán (Q5287) 10
szlovák (Q9058) 9
olasz (Q652) 8
portugál (Q5146) 7
bolgár (Q7918) 4
brazíliai portugál (Q750553) 3
dán (Q9035) 3
finn (Q1412) 3
norvég (Q9043) 3
koreai (Q9176) 3
szlovén (Q9063) 3
vietnámi (Q9199) 2
észt (Q9072) 2
görög (Q9129) 2
katalán (Q7026) 2
horvát (Q6654) 2
jiddis (Q8641) 2
udmurt (Q13238) 1
román (Q7913) 1
német jelnyelv (Q33282) 1
gilaki (Q33657) 1
galiciai (Q9307) 1
litván (Q9083) 1
albán (Q8748) 1
sztenderd mandarin (Q727694) 1
ukrán (Q8798) 1
héber (Q9288) 1
török (Q256) 1
kínai (Q7850) 1
izlandi (Q294) 1
bangla (Q9610) 1
brit angol (Q7979) 1
grúz (Q8108) 1

Itt még inkább a kevés elemszám okozta torzulás figyelhető meg: tudható, hogy nem a magyarok közül beszélik a világon a legtöbben az eszperantót, hanem a kínai anyanyelvűek. Ez a lista nem tükröz mást, minthogy a magyaroknál alaposabban jelölve vannak az anyanyelv és beszélt nyelvek tulajdonságok.