Szerkesztő:Bináris/DEFAULTSORT
Előtanulmányok botos javításhoz
Problémameghatározás
[szerkesztés]2013-ban a fejlesztők megoldották a kategóriákon belül a nagyjából helyes ábécébe rendezést. Ami változott:
- A magyar ékezetes betűket automatikusan helyesen kezeli a szoftver.
- Az ékezettelenített betűk ennélfogva feleslegesek, zavaróak, ezért eltávolítandók.
- A magyar kettős betűket (a hosszúakat is) automatikusan helyesen kezeli a szoftver, a hamis digráfokat (pl. Tucson nevében a cs) jelölni kell.
- A ssz → szsz átalakítások tehát elavultak és eltávolítandóak.
- A tilde (~) a fenti két okból elavult, szükségtelen, ennélfogva eltávolítandó.
- A névtér előtagját automatikusan figyelmen kívül hagyja a szoftver (a nem szócikknévtérbeli lapok többségénél feleslegessé vált a rendezőkulcs).
Ami nem változott:
- A vesszők elhagyandóak a defsortból, sose lett volna szabad ott lenniük, még 2013 előtt se.
Továbbra is szükséges
- a névelő elhagyása a rendezőkulcsból
- a nem személynévi kategóriák egybeírása a rendezőkulcsban
- a külföldi személyneveknél a nyugati névsorrend jelölése
- a pontok elhagyása a rendezőkulcsból
stb.
A probléma, hogy a 2013 előtt kihelyezett elavult rendezőkulcsok többsége ma is ott van, és ezek hatására azóta is születnek újabbak. Javítandók továbbá a teljesen hibás, a lap címéhez nem igazodó rendezőkulcsok.
A jelen projekt csak az alapértelmezett rendezőkulcs (DEFAULTSORT) javítására irányul, a | után megadott egyedi rendezőkulcsokkal nem foglalkozom.
Linkek
[szerkesztés]- Alapismeretek: Wikipédia:Kategóriák#Szócikkek kategórián belüli betűrendbe sorolása
- Az izlandi nevekről és az átadó elvről: Wikipédia:Kocsmafal (egyéb)/Archív279#Izlandi személynevek abc-sorrendje
- A régi (2013 előtti) és az új rendszer közötti különbség: Speciális:Diff/15544990/25903535
- Wikipédia:Kocsmafal (műszaki)/Archív71#ABC-sorrend probléma kategórialistában (2013, az új rendszer bevezetése kapcsán)
- Előzménye: Wikipédia:Kocsmafal (műszaki)/Archív72#Rendezés a kategóriákban (2011–13)
- Kiegészítés, megerősítés: Wikipédia:Kocsmafal (műszaki)/Archív72#ABC-sorrend probléma kategórialistában: Cs
- A bot által készített tesztlisták:
A bot képességei
[szerkesztés]A Pywikibot képességeit a huwiki csomag hordozza.
Kész:
- Életrajzok elkülönítése a szócikkeken belül
- A meglévő defsort felismerése
- Magyarok és nem magyarok szétválasztása (nem üzembiztos)
- A
{{külföldi név}}
(?) sablon alapján felismeri, ha a magyar kategóriában levő cikkalany neve nem magyar
Megvalósítható:
- Bizonyos hibás és elavult defsortok kiszűrése és eltávolítása, ill. aktualizálása
- Ismétlődő rendezőkulcsok észrevétele, amelyekből akár defsort is lehet
- Defsort képzése névelő elhagyásával, ha van lista a névelőkről
Nem valószínű:
- Hamis digráfok automatikus felismerése
Kérdéses:
- Teljesen idegen kulcs felismerése (pl. átnevezés után maradt)
A Szerkesztő:Bináris/DEFAULTSORT-tesztek oldalon látható lista fejlesztésének nem a tökéletesség a célja, hanem inkább a bot tevékenységének korlátozása a biztonságosan végezhető feladatokra.
A lap alján levő tesztlista alapján kijelenthetjük, hogy a bot képes eltávolítani a tildéket, és a tesztállományban (Kategória:Írók 6 alkategória mélységben) nem talált megtartandó tildét.
Feladatok, kérdések
[szerkesztés]Egyáltalán nem cél egy teljes megoldás, csak azoknak a problémáknak a kezelése, amelyek bottal biztonságosan megoldhatók. A többi marad kézi szerkesztésre.
- Elandslaagtei csata: {{DEFAULTSORT:Elandslaagteic~sata}} – az ilyenek automatikusan törlendők? A jelenlegi útmutatóban nem szerepel tilde.
- A cikk címével megegyező defsortok eltávolítandók? (Döntés: az izlandi személyeknél maradnak.)
- A cikk címétől csak a magyar ékezetek hiányában eltérő defsortok eltávolítandók? (A nem magyarok maradnak!)
- A névelők automatikusan elhagyandók? Melyek ezek? (a, the, le, la, l', der, die, das...)
- A címből a kötőjelek automatikusan elhagyandók?
- Személyneveknél a defsortban már meglévő vesszők automatikusan elhagyandók?
- Kiderült, hogy vegyületekben is előfordulnak, ahol maradniuk kell. Én csak személynevekre gondoltam, csak pontatlanul fogalmaztam, mert nem tudtam, hogy máshol is van.
- Példa: Paul Vanden Boeynants → {{DEFAULTSORT:Vanden Boeynants, Paul}}
- A szóközök a nem életrajzi szócikkekből automatikusan elhagyandóak, az emberek nevéből pedig nem?
- Milyen egyéb elavult, a jelenlegi útmutatóban már nem szereplő régi gyakorlatok vannak? (Lehetőleg példával)
- Jó lenne detektálni az átnevezés után úgy maradt elavult kulcsokat.
- A magyar ékezetes betűket helyesen sorolja be a szoftver, de a külföldieknél maradjon a tilde?