Ugrás a tartalomhoz

Wikipédia:Adatlekérdezés más Wikikről

A Wikipédiából, a szabad enciklopédiából

Ez a technikai útmutató részletes leírást ad arról a módszerről, hogy hogyan tudunk adatokat lementeni más Wikikről egy szöveges fájlba, majd azokat hogy tudjuk felhasználni a magyar Wikipédián.

Hozzávalók

[szerkesztés]

Menete

[szerkesztés]
  1. Először is indítsuk el az AWB-t, majd jelentkezzünk be abba a Wikibe, ahonnan az adatokat szeretnénk importálni. Bot jog nem szükséges, ugyanis a más nyelvű Wikipédiát nem fogjuk módosítani, ráadásul néhány Wiki nem is engedi a nem-regisztrált bottal történő bejelentkezést (megjegyzés: bizonyos esetekben még így is kizár minket a Wiki, főleg az angol kényes nagyon az AWB felhasználókra).
  2. Valamilyen módszerrel gyűjtsük ki a minket érdeklő szócikkeket. Ez lehet kategórialekérdezés vagy egy adott lapon található kék/piros linkek. De akár használhatunk egy tetszőleges szövegfájlt is, mely tartalmazza a szócikkek neveit.
  3. Ellenőrizzük, hogy az AWB-ben a Skip fülön a Doesn’t exist legyen bepipálva.
  4. Kattintsunk a Tools menüpont Make module parancsára (forrógomb: CTRL + M).
  5. Másoljuk be az alábbi szövegrészt a megjelenő ablakba:
    private static readonly Regex infoboxRegex = Tools.NestedTemplateRegex(new string[] { "Ficha de estación" });
    public string ProcessArticle(string ArticleText, string ArticleTitle, int wikiNamespace, out string Summary, out bool Skip)
    {
              string parameterValue = "";
              Skip = true;
              Summary = "";
    
              foreach (Match m in infoboxRegex.Matches(ArticleText))
              {
                    string infoboxCall = m.Value;
                    parameterValue = WikiFunctions.Tools.GetTemplateParameterValue(infoboxCall, "imagen");
              }
    
              if (!string.IsNullOrWhiteSpace(parameterValue))
              {
                    System.IO.StreamWriter sw = System.IO.File.AppendText("d:/Infodata.txt");
                    sw.WriteLine(ArticleTitle + "\t" + parameterValue);
                    sw.Close();
              }
              return ArticleText;
    }
    
  6. A fenti példa a spanyol Ficha de estación infoboxból olvassa ki a képadatokat (imagen paraméter). Ezek az értékek tetszőleges infoboxra és paraméterekre kicserélhetőek.
  7. Kattintsunk a Make module gombra, majd a Close gombra.
  8. Kattintsunk a Start gombra
  9. Ha mindent a megadott sorrendben csináltunk, a D meghajtónkon létrejött egy új fájl Infodata.txt néven, mely tartalmazza a szócikkek neveit és a kiolvasott értéket. Minden sorban egy szócikk-kép páros lesz, egy tabulátorral elválasztva.
  10. A kapott fájlt nyissuk meg egy szövegszerkesztővel, és másoljuk át a teljes szöveget az Excelbe (vagy más táblázatkezelőbe).
  11. Indítsuk el a Quickstatements előkészítőt, az első ablakba másoljuk be az első oszlop tartalmát, a másodikba a második oszlop tartalmát.
  12. A példánkban válasszuk ki a Kép lehetőséget a legördülő listából.
  13. Kattintsunk a Mehet! gombra.
  14. Ezzel létrejött az a szövegfájl, melyet már át tudunk másolni a Quickstatements weboldalára.
  15. Miután beillesztettük, adjuk meg a forrásként használt Wiki nevét (Példánkban eswiki).
  16. Kattintsunk a Go gombra.
  17. Az értékek ezzel hozzáadódnak a megfelelő szócikkekhez, majd ezután, ha a magyar wiki infoboxa támogatja a Wikidatát, akkor az értékek már a magyar Wiki cikkekben is megjelennek automatikusan.

Lásd még

[szerkesztés]