Microsoft Translator
Microsoft Translator | |
Kategória | machine translation software |
A Microsoft Translator weboldala |
A Microsoft Translator egy gépi fordítási felhő alapú API szolgáltatás, amelyet a Microsoft cég fejleszt. A szolgáltatás elérését számos szoftverében és webes felületen biztosítja, például mint a Bing kereső[1] egy kiegészítő funkciója, valamint elérhető mobilapplikáció formájában Android és Apple iOS platformokon.
A szolgáltatás több mint 70 nyelv között alkalmas szöveges fordításra, több mint 20 nyelv esetében pedig hangfelismerési támogatással tud leiratot készíteni, valamint képes azt lefordítani és felolvasni.[2]
Történet
[szerkesztés]A Microsoft Research – a Microsoft cég kutatás-fejlesztési részlege – már 1999-től foglalkozott a gépi fordító elkészítésével, amelynek felelőse a Natural Language Processing csapat volt, a projekt pedig The Machine Translation néven indult.[3] A kutatás-fejlesztési részleg 2002-ben hozta létre a gépi fordításért felelős csoportot (Machine Translation Group), amely része volt a beszéd és nyelvi csoportnak (Speech and Language).[4] Az első generációs szoftverüket arra használták, hogy több különböző nyelvre lefordították a támogatási oldalaik tartalmát.
Az általuk fejlesztett fordító szolgáltatást 2006 óta használhatják a felhasználók a különböző Microsoft termékekben, 2011 óta pedig elérhető a szolgáltatás API felületen keresztül is.
Fordítási módszer
[szerkesztés]A Microsoft kutatási részlegének megközelítése a kezdetektől „adatközpontú” („data-driven”), tehát ahelyett hogy a természetes nyelvek fordítására explicit szabályokat fogalmazna meg, már emberek által lefordított szövegpárokkal „tanítja” meg a rendszernek, hogy „hogyan kell fordítani”. A fordító szoftverük több különböző metódust használ és folyamatos fejlesztés alatt áll – néhány speciális nyelv és nyelvpár esetében a többi nyelvtől eltérő megoldásokra is szükség van. Az első generációs szoftverük absztrakt struktúrák elemzésével tanulta meg fordítási mintákat. Az ezt követő megoldás a statisztikai elemzésen alapuló tanulása a gépi fordításnak, amelyből létezik szintaxis alapú és kifejezés alapú megközelítés, de közös bennük, hogy nem igényelnek nyelvészeti tudásbázist. Ez egészült ki a neurális hálózatok használatával,[5] amely az emberi gondolkodást utánozva modellezi a fordításra beküldött szöveget, amellyel növeli a fordítás pontosságát – jobb eséllyel határozza meg a szöveg kontextusát.
Példa egy neurális háló segítségével végzett fordításra
[szerkesztés]Egy a magyar és francia nyelvet folyékonyan beszélő ember a „kutya” szó hallatán a gondolataiban egy kutya képét látja, emellett természetesen a képről asszociál a „le chien” kifejezésre, ami a kutya francia nyelven. A neurális háló – korábbi hasonlatnál maradva az emberi agy – eredendően tudná, hogy a „chien” francia nyelven a kutya hím megfelelője („le”, nem pedig „la”). Viszont ha a teljes mondat úgy hangzik, hogy „a kutya éppen hat kölyökkutyának adott életet”, akkor az elképzelt kép a gondolataiban egy olyan kutyára változna, ami éppen a kölykei társaságában van, ezzel együtt pedig a „la chienne” kifejezést használná a szöveg fordítása során, ami a kutya kifejezés nőnemű alakja a francia nyelvben.[5]
Fordítás pontossága
[szerkesztés]Mivel a fordítás továbbra is legfőképp statisztikai elemzések elvén működik, amely eltér az emberek által végzett fordítási módszertől, a gépi fordító által végzett fordítás minősége erősen változik és nem minden esetben hoz pontos eredményt.
A fordítás minőségének mérésére a BLEU (Bilingual Evaluation Understudy) algoritmus pontozási rendszerét használják.[6]
Támogatott nyelvek
[szerkesztés]2021 márciusában a Microsoft Translator 89 nyelvet támogatott, a szerbnek támogatta cirill és latin betűs írásmódját is.
Támogatott nyelvek listája:
- Afrikaans
- Albán
- Amhara
- Arab
- Örmény
- Asszámi
- Azerbajdzsáni
- Bengáli
- Bosnyák
- Bolgár
- Kantoni (hagyományos)
- Katalán
- Kínai (egyszerűsített)
- Kínai (hagyományos)
- Horvát
- Cseh
- Dán
- Dari
- Holland
- Angol
- Észt
- Fidzsi
- Filipino
- Finn
- Francia
- Francia (Kanada)[7]
- Német
- Görög
- Gujarati
- Haiti kreol
- Héber
- hindi
- Hmong Daw
- Magyar
- Izlandi
- Indonéz
- Inuktitut
- Ír
- Olasz
- Japán
- Kannada
- Kazakh
- Khmer
- Klingon (latin)
- Klingon (plqaD)
- Koreai
- Kurd (közép) (Sorani)
- Kurd (északi) (Kurmanji)
- Lao
- Lattár
- Litván
- Malagasy
- Maláj
- Malájalam
- Máltai
- Māori
- Marathi
- Mianmar
- Nepáli
- Norvég
- Odia
- Pashto
- Persz
- Polák
- Portugál (Brazília)
- Portugál (Portugália)
- Punjabi
- Querétaro Otomi
- Román
- Orosz
- Szamoai
- Szerb nyelv (cirill és latin írásmód is)
- Szlovák
- Szlovén
- Spanyol
- Szuahéli
- Svéd
- Tahiti nyelv
- Tamil
- Telugu
- Thai
- Tigrinya
- Tongai
- Török
- Ukrán
- Urdu
- Vietnami
- Walesi
- Jukaték-maja
Jegyzetek
[szerkesztés]- ↑ Bing – Microsoft Translator
- ↑ Microsoft - Language and region support for text and speech translation. docs.microsoft.com (angolul) (Hozzáférés: 2021. február 8.)
- ↑ Microsoft Research - Machine Translation (archívált változat). research.microsoft.com (angolul) (Hozzáférés: 2021. február 8.) arch
- ↑ Microsoft Research - Machine Translation. www.microsoft.com (angolul) (Hozzáférés: 2021. február 8.)
- ↑ a b Frequently Asked Questions (FAQ) - What is neural network based translation? microsofttranslator.uservoice.com (angolul) (Hozzáférés: 2021. február 8.) arch
- ↑ What is a BLEU score? docs.microsoft.com (angolul) (Hozzáférés: 2021. február 8.)
- ↑ https://news.microsoft.com/en-ca/2020/10/20/introducing-canadian-french-to-microsoft-translator/
Források
[szerkesztés]- Microsoft - Translator FAQ. www.microsoft.com (Hozzáférés: 2021. február 8.)
- Microsoft Research - Machine Translation (archívált változat). research.microsoft.com (Hozzáférés: 2021. február 8.) arch