Wikipédia:Jelölt lapváltozatok/Statisztikák
Az oldal egy statisztikai elemzést tartalmaz a jelölt lapváltozat és annak beállításaival kapcsolatosan: milyen hatással járt annak bevezetése és módosítása a szerkesztők számára és aktivitására. (A statisztika nem tudja különválasztani a különböző hatásokat, így nem lehet kijelenteni, hogy a változások a jelölt lapváltozatok bevezetésének vagy módosításának következményei, de nagyon valószínű, hogy jelentős szerepet játszik, különösen az anonok próbálkozásainak számára és a kevés szerkesztéssel rendelkező szerkesztőkre, lásd alább.)
A grafikonok a Wikimédia Alapítvány által a magyar Wikipédiára vonatkozóan szolgáltatott havi statisztikai adatok és a JDemetra+ program 2.2.2 verziója segítségével készültek. (Ezt a programot a Belga Nemzeti Bank az Eurostat részére készítette az amerikai statisztikai hivatal által a szezonális és naptárhatások kiszűrésére alkalmazott X-13-ARIMA és a Spanyol Nemzeti Bank által kidolgozott TRAMO-SEATS algoritmusok kombinálásával.)
Az alábbi ábrákon a rózsaszín háttér a jelölt lapváltozatok azon (2008. november és 2018. március közötti) időszakát jelöli, amikor a változtatások csak az ellenőrzést követően jelentek meg a nem bejelentkezett felhasználók számára, míg a világoskék háttér azt az (2018. április és 2019. április közötti) időszakot jelöli, amikor a változtatások egyből (már az ellenőrzést megelőzően) megjelentek az olvasók és szerkesztők számára. A 2019. május és 2020. április közötti időszakra megjelölt értékek a jövőre vonatkozó statisztikai előrejelzés eredményei.
Az aktív regisztrált szerkesztők száma
[szerkesztés]
Az aktív regisztrált szerkesztők számának emelkedést követő stagnálása látszólag már valamivel a jelölt lapváltozatok 2009. júniusi bevezetését megelőzően megkezdődött, a határozott csökkenése pedig csak 2010 tavaszán kezdődött, így a szerkesztőszám alakulása alapján az összefüggés nem egyértelmű a csökkenés megindulását illetően, a beállítások 2018. áprilisi módosítása azonban teljesen egybeesik a korábban 1600–1650 szerkesztős tartományban stagnáló (2015 óta talán minimálisan emelkedő) grafikon 1700–1750 szerkesztőre való emelkedésével. Ez a kb. 100 szerkesztőnyi (6–7%-os) növekmény ezen grafikon alapján akár következhetne a korábban kezdődött pozitív folyamatok felgyorsulásából is, de későbbi grafikonok alapján valószínűsíthető, hogy legalább részben éppen a módosításnak köszönhető.
Az adott hónapban 1-4 szerkesztést végző szerkesztők száma
[szerkesztés]
A grafikon szerint a 2008-ban megindult visszaesés 1-1,5 évvel korábban kezdődött, mint a jelölt lapváltozatok bevezetése. A folyamatosan csökkenő trend egészen 2015 tavaszáig tartott, amikor egy határozott irányváltással emelkedésbe váltott. Ez az növekedés 2016 végén hullámzó stagnálásba, majd a jelölt lapváltozatok beállításának módosításával teljesen egybeesve intenzív növekedésbe váltott át, ami a szoftvermódosítás óta eltelt egyéves időszak alatt közel 1000 plusz alkalmi közreműködőt jelentett.
Az adott hónapban 5-24 szerkesztést végző szerkesztők száma
[szerkesztés]
A jelölt lapváltozatok bevezetése és beállításának módosítása és a szerkesztőszám közötti vélhető összefüggés leginkább a havi 5–24 szerkesztéssel rendelkező szerkesztői csoporton figyelhető meg. Ez logikusan következhet abból a hatásból, hogy az 1-4 szerkesztést végző csoport részben éppen azokból állt, akik korábban nem tértek vissza azt látva, hogy a módosításaik nem jelentek meg a cikkben, míg az 5–24 szerkesztéssel rendelkező csoportba azok az alkalmi szerkesztők tartoznak, akik a sikeres módosításon fellelkesülve még többször visszatértek és módosítgatták a kiválasztott cikket vagy cikkeket. A grafikonokat elemezve az látszik, hogy a 2008 elejéig tartó gyors emelkedő szakaszt egy 2009 első feléig tartó stagnáló időszak követte, majd a jelölt lapváltozatok bevezetésével nagyjából egybeeső időszaktól kezdve ez fokozatos csökkenésbe váltott 2014 második feléig, amikortól nagyjából stabilizálódott (minimálisan csökkenő trenddel), és ez váltott határozottan és élesen emelkedésbe a beállítások módosításával 2018 áprilisában, egy év alatt 200-250 közreműködővel növelve ezen szerkesztői csoport létszámát.
Az adott hónapban 25-99 szerkesztést végző szerkesztők száma
[szerkesztés]
Ebben a szerkesztői csoportban a szerkesztőszám lendületes emelkedése már 2007 júliusában megtört, de a lendület még 2009 végéig, valamivel a jelölt lapváltozatok bevezetését követően kitartott. A csökkenés 2007 januárjában meglepő hirtelenséggel, egy kb. 50 szerkesztős (kb. 25%-os) eséssel kezdődött, ami kevésbé gyorsan, de egészen 2015 közepéig kitartott, amit egy mai napig tartó stagnáló, minimálisan emelkedő trend követett. Az elmúlt egy évben 5-10%-os növekedés figyelhető meg, amivel a grafikon a 120-145 közötti tartományból átment a 135-155 közötti tartományba.
Az adott hónapban legalább 100 szerkesztést végző szerkesztők száma
[szerkesztés]
A havi 100 szerkesztésnél többet végző (ún. törzsszerkesztők) számának gyors növekedése hirtelen, 2008 nyarán váltott át csökkenésbe. Ez a törés kb. 1 évvel a jelölt változatok bevezetését megelőzően volt, így legfeljebb a későbbi csökkenésre lehetett (valószínűleg indirekt) hatással. Érdekes módon ez a folyamatos csökkenés 2013 első felében hirtelen felgyorsult, majd egy évvel később stagnálásba váltott. Azóta kissé emelkedő, majd újabb csökkenő hullámok követik egymást, ahol az utóbbi egy évben újra a csökkenő trend erősödött fel (kb. 10 szerkesztővel, 6-7%-kal csökkent a szám ezalatt), azaz a törzsszerkesztők nem tudtak eddig profitálni az alkalmi szerkesztők számának növekedéséből.
A különböző aktivitási szintű szerkesztők számának összehasonlítása
[szerkesztés]Az alábbi adatsorok az összehasonlíthatóság érdekében azok maximális értékével normalizáltak, így a függőleges tengely a csúcsértékhez képest egy százalékos értéket mutat.
A különböző szerkesztői csoportok grafikonjait együtt nézve megállapítható, hogy a 2005 elején felgyorsult szerkesztőszám-növekedés a különböző csoportokban kicsit eltérő időpontokban, de 2008 első fele és 2009 második fele között váltott át előbb stagnálásba, majd csökkenésbe. Ez 2014 közepe és 2015 közepe között érte el a mélypontját, ahonnan egy alapvetően stagnáló (a különböző csoportoknál enyhén emelkedő vagy enyhén csökkenő) jellegű volt 2018 elejéig. A szoftvermódosítás óta eltelt egy évben az alkalmi (1–4 és 5–24 szerkesztéssel rendelkező) szerkesztői csoportok tagjainak száma intenzíven (kb. 25%-kal, illetve 50%-kal) növekedett, míg a 25–99 szerkesztéssel rendelkező csoport tagjainak száma egészen minimálisan (talán 5 szerkesztővel) növekedett, míg a 100+-os szerkesztők száma minimálisan (kb. 10 szerkesztővel) csökkent. 2019 áprilisában az 1–4 szerkesztéses csoport nagyjából a korábbi csúcsértéke 80%-át, az 5–24 szerkesztéses csoport nagyjából a korábbi csúcsértéke 70%-át, a 25–99 szerkesztéses csoport a 60-65%-át, míg a 100+ szerkesztéses csoport kb. a 60%-át érte el.
A szerkesztők számának változásának szezonális és naptári komponense
[szerkesztés]Az alábbi adatsorok az összehasonlíthatóság érdekében azok maximális értékével normalizáltak, így a függőleges tengely a csúcsértékhez képest egy százalékos értéket mutat.
A fenti grafikon alapján a szerkesztők számában a június–szeptember időszakban van a mélypont (az utóbbi években ezen belül is kiugróan szeptemberben), míg a január–május időszakban van a pozitív eltérés (ezen belül is januári kiugró értékkel).
Az alkalmi (döntően nem regisztrált) szerkesztők esetén az összes szerkesztőknél látotthoz hasonló következtetést lehet levonni, kisebb eltérésekkel: a szerkesztők számában a június–augusztus időszakban van a mélypont (ezen belül a csúcs július–augusztusban, a nyári tanítási szünet idején található), míg a január–május időszakban van a legnagyobb pozitív eltérés (ezen belül is januári kiugró értékkel).
A nagyon aktív (törzs-) szerkesztők esetén nem ennyire egyértelmű és jellegzetes a szezonális hatás. Két mélypont figyelhető meg az ilyen szerkesztők számában, egy az április-június időszakban, és egy az október–november időszakban. A lokális maximumok többsége az alkalmi szerkesztőkhöz hasonlóan januárra (alkalmanként márciusra vagy márciusra is) esik, és megfigyelhető egy nyárközepi, augusztusi csúcs is.
A két grafikont egymásra illetve megfigyelhetőek az alkalmi és a törzsszerkesztők számának szezonális ingadozásainak hasonlóságai és különbségei is: a jellemzően egybeeső januári csúcsok és az érdekes módon ellentétes csúcsokat mutató nyári (augusztusi) időszakok.
A havi regisztrációk száma
[szerkesztés]Megjegyzés: 2006. tavaszig nem mértük a regisztrációkat.
A havi új regisztrációs száma 2007-ben ugrásszerűen növekedett egészen a havi több mint 4000 új regisztrációig, majd 2008 elejétől 2011 végéig fokozatosan csökkent. Ezután 1000–1200-as értékre állt be, ami nagyjából megfelel a 2006 végi értékeknek, és azóta jelentős változás nem tapasztalható. Kivétel ez alól a 2014 második fele és 2015 első fele közötti időszak, ahol lokálisan megugrottak a regisztrációk – érdemes lenne utánanézni, mi történt ekkor. Némi képzelőerővel azonban 2011 második fele és a 2018 áprilisa közötti időszakot egy lassan csökkenő trend jellemezte (az évek alatt az 1200–1250-es sávból lassan a 950–1000-es sávba csúsztak vissza az értékek), míg az elmúlt évben a havi új regisztrációk száma visszatért az 1000–1100 közötti tartományba, tehát lehet némi pozitív hatása a jelölt lapváltozatok beállításának módosításának (és ezzel a nem regisztrált szerkesztők és szerkesztéseik számának megugrásának) a regisztrációk és így az új szerkesztők számára.
A nem regiszrált (anon) szerkesztők szerkesztései
[szerkesztés]
A nem regisztrált szerkesztők szerkesztéseinek száma 2008 elején érte el a csúcsát, majd 2010 közepéig kb. felére visszaesett. Ezután a csökkenés lassabban, de továbbra is folytatódott, egészen 2017 második feléig. Azóta határozottan, lendületes nő az anonszerkesztések száma. A csúcsérték, és a csökkenő trend kezdete több mint egy évvel a jelölt lapváltozatok bevezetését megelőzően volt, a trendforduló, az újabb emelkedő periódus pedig kb. fél évvel volt a szoftvermódosítás előtt, így ezekkel való összefüggése kérdéses.
A regisztrált szerkesztők szerkesztései
[szerkesztés]A regisztrált szerkesztők nem tartalmazzák a botjoggal rendelkező szerkesztőket, és azokat a szerkesztőket, akiknek szerepel a nevében a bot szó.
A regisztrált szerkesztők szerkesztéseinek száma a jelölt lapváltozatok bevezetésével nagyjából egyidőben, 2009 júniusa és augusztusa között érte el a maximumát, majd 2014 tavaszáig kb. 40%-kal csökkent. Ennek lehet oka a jelölt lapváltozatokkal járó járőri feladatokkal való leterheltség, különösen a bevezetést követő időszakban. 2014 második fele óta egy alapvetően stagnáló, talán minimálisan emelkedő trend látható. A jelölt lapváltozatok beállításainak hatása nem egyértelmű, bár az pozitív, hogy a korábban 60 és 80 ezer közötti tartomány a 70 és 80 ezer szerkesztés közötti tartományban stabilizálódott az elmúlt évben.
A nem regisztrált és a regisztrált szerkesztők és szerkesztéseik száma
[szerkesztés]A regisztrált szerkesztők nem tartalmazzák a botjoggal rendelkező szerkesztőket, és azokat a szerkesztőket, akiknek szerepel a nevében a bot szó.
A jelölt lapváltozatok beállítása kapcsán fontos vizsgálni a nem regisztrált (anonim) és az adott hónapban aktív regisztrált szerkesztők és szerkesztéseik arányát. A szerkesztőszámok aránya alapján a kezdeti (2003-as) 1,0-1,5 körüli arány 2005-re 4 köré növekedett (négyszer annyi nem regisztrált szerkesztő szerkesztett, mint regisztrált), majd 2009 második felére 1,3-1,4-es értékre csökkent. Az arány ezután 2014 végéig stagnált, majd 2015-től lassan emelkedni kezdett. Ez az emelkedő trend kb. a szoftvermódosítás idején felgyorsult, és 2019. áprilisra 2,2 körüli értékre emelkedett (2,2-szer annyi anonim szerkesztő szerkeszti a magyar Wikipédiát, mint ahány bejelentkezett).
A szerkesztések számát tekintve a kezdeti bizonytalan értékeket követően a 2005-től 2007 közepéig a 0,11 körüli érték volt jellemző (a regisztrált szerkesztők 9-szer annyi szerkesztést végeztek az adott hónapban, mint az anonok). Ekkortól 2010 végéig csökkenő trend jellemezte a szerkesztések arányának alakulását, majd 2018 közepéig az arány trendje a 0,07-0,08, maga az arány pedig a 0,06-0,1 tartományban tartózkodott (hullámozva stagnált). Ekkor átlagosan kb. 13-szor annyi szerkesztés kapcsolódott regisztrált szerkesztőkhöz, mint anonokhoz. Az arány a 2018. áprilisi szoftvermódosítást követően határozottan növekedni kezdett, és 2019. áprilisra elérte a 0,12-es értéket (kb. nyolcszor annyi szerkesztést végeznek a bejelentkezett szerkesztők, mint az anonok).
Elemzés az ORES modellje alapján
[szerkesztés]Az ORES egy osztályozó algoritmus, amit a magyar Wikipédia szerkesztői betanítottak a problémás és/vagy rosszindulatú szerkesztések felismerésére; a friss változtatások modern felületén a "Szinte biztosan jó" / "Problémák lehetnek" / "Valószínűleg problémák vannak" / "Szinte biztosan problémák vannak" illetve a "Szinte biztosan jóhiszemű" / "Rosszhiszemű lehet" / "Valószínűleg rosszhiszemű" / "Szinte biztosan rosszhiszemű" szűrők tartoznak hozzá. Az ezen szűrők által a jelölt változtatások működésének átállítása előtti és utáni egy-egy évben felcímkézett szerkesztések gyakorisága azt mutatja, hogy a vandalizmusok és jószándékú, de nem hasznos szerkesztések száma nőtt, de csak viszonylag elhanyagolható mértékben (2-3%-ot):
Az ORES "Valószínűleg rosszhiszemű" és "Valószínűleg problémák vannak" szűrői a megjelölt szerkesztések mennyiségét nézve nagyjából jól illenek a kézi vizsgálattal beazonosított vandalizmushoz ill. (nem feltétlenül rosszindulatú, de) problémás szerkesztéshez. Ez alapján, és azt is figyelembe véve, hogy az anonim szerkesztések száma mintegy haramadával nőtt a váltás után, azt mondhatjuk, hogy a jelölt változatok átállításának hatására a vandalizmusok száma havonta körülbelül 500-zal, a jószándékú, de problémás szerkesztések száma 800-zal nőtt; a hasznos szerkesztések száma mintegy 2000-rel.
(A bejelentkezett szerkesztések között valamivel nagyobb arányban nőttek a valószínűleg rosszhiszemű vagy problémás szerkesztések, de még így is olyan kevés van belőlük - havi 20-30 helyett havi 30-40, - hogy a járőrök terhelésére csak elhanyagolható hatással vannak.)
Összefoglalás
[szerkesztés]A jelölt lapváltozatok bevezetésének hatása egyértelműen nem kimutatható ezekből a grafikonokból. Az intenzív növekedés már kb. egy évvel korábban megtört (más, külső és belső hatások együttesének eredményeként), a csökkenés is valamivel korábban kezdődött, bár valószínűleg volt negatív hatása a csökkenés felgyorsulására. Ezzel szemben a 2018. tavaszi szoftvermódosítás egyértelmű növekedést eredményezett a nem regisztrált és alkalmi szerkesztők esetén (a havi 1–4 szerkesztéssel rendelkező szerkesztők száma 50%-kal, a havi 5–24 szerkesztéssel rendelkező szerkesztők száma 25%-kal növekedett egy év alatt). Ugyanezen időszakban a regisztrációk és az aktívabb szerkesztők száma nagyjából stagnált, a legaktívabb törzsszerkesztők száma pedig kismértékben csökkent is. Ebből az látszik, hogy a magyar Wikipédia-közösség nem tudja elérni, bekapcsolni, bevonni, és hasznos, tartósan aktív közreműködővé tenni az alkalmi szerkesztőket, így ezen a ponton szükséges javítani a növekedés érdekében.