GPT-4
GPT-4 | |
A GPT-4 logója | |
Fejlesztő | OpenAI |
Első kiadás | 2023 |
Programozási nyelv | Python |
Platform | platform.openai.com |
Méret | 1.76 billió paraméter |
Elérhető | A rendszer több mint 50 nyelvet támogat, lefedve a beszélt nyelvek több mint 97 százalékát. |
Kategória | chatbotok |
Licenc | kereskedelmi licenc |
[chatgpt.com A GPT-4 weboldala] |
A Generatív Előtrénelt Transzformátor 4 (GPT-4) egy multimodális, nagy nyelvi modell, amelyet az OpenAI hozott létre, és a GPT alapmodellek sorozatának negyedik tagja.[1][2] A multimodalitás azt jelenti, hogy a GPT-4 esetében már nem csak szöveges parancsokkal, de képekkel is lehet tartalmat generálni.[3]
A GPT-4 modellt 2023. március 14-én mutatták be a nagyközönségnek. A ChatGPT GPT-4-et használó verziója javulást jelentett a GPT-3.5-ön alapuló korábbi verzióhoz képest, de nem szüntette meg a korábbi verziók minden problémáját. Mindemellett GPT-4 megbízhatóbb, kreatívabb és sokkal árnyaltabban képes az utasításokat kezelni, mint a GPT-3.5.. Ez a modell mérföldkőnek számított a mesterséges intelligencia fejlődésében.[4]
Jellemzők
[szerkesztés]Az OpenAI 2018-ban bemutatta az első GPT modellt, amely a transzformátor architektúrára épült. Ez a technológia lehetővé tette, hogy a modell nagyméretű könyvgyűjteményeken tanuljon, és a következő években jelentős fejlődést mutatott. A GPT-3, majd annak továbbfejlesztett változata, a GPT-3.5, már rendkívüli képességekkel rendelkezett, például példák alapján történő tanulásban. A GPT-4 azonban minden eddigi modellt túlszárnyal, amit a meg nem erősített hírek szerint 1,76 billió paraméterének köszönhetett.
A GPT-4 előtréningezése nyilvános és engedélyezett harmadik féltől származó adatok felhasználásával történt, melyet megerősítéses tanulási technikákkal finomhangoltak emberek és mesterséges intelligencia által adott visszajelzések alapján.Az OpenAI csak korlátozott információt bocsátott rendelkezésre a GPT-4 technikai jellemzőit illetően; a műszaki ismertetés során kifejezetten elzárkózott attól, hogy ismertesse a modell paramétereit, felépítését, vagy a betanítás során használt hardvert. Ugyan tájékoztatást adtak arról, hogy a modellt először egy nagy adatbázisra épülő irányított, mennyiségi alapú képzéssel, majd emberi és mesterséges intelligencia-visszacsatolással kombinált minőségi betanítással képezték ki, de nem közöltek további részleteket sem a betanítás folyamatáról, sem a képzési adatbázis összeállításának szempontjairól. Nem adtak meg olyan hiperparamétereket, mint például a tanulási sebesség, az epochaszám vagy az alkalmazott optimalizátorok, nem tájékoztattak a felmerült erőforrásigényekről sem. Döntésüket „a versenyhelyzettel és a nagyméretű modellek biztonsági kockázataival” indokolták.[5]
Alkalmazás
[szerkesztés]Az OpenAI példaként azzal érzékeltette új modellje képességét, hogy a GPT-4 az amerikai jogi egyetemek végzősei számára a hivatásos ügyvédi tevékenység megkezdése előtt előírt ügyvédi vizsga szimulációja során a tesztet kitöltők legjobb 10 százaléka körül teljesített, míg a régebbi modell „csak” az alsó 10 százalék körüli eredményt érte el.[6] A Microsoft Research[7] is tesztelte az új modellt, és arra a következtetésre jutott, hogy „joggal tekinthető egy mesterséges általános intelligencia (Artifical General Intelligence, AGI) rendszer korai, de még nem tökéletes változatának”.[8]
A Microsoft hivatalosan is megerősítette, hogy a Bing GPT egy hónappal korábbi bemutatásakor (ld. alább) valójában már a GPT-4 verziót használták,[9] és bejelentette a GPT-4 további integrációját már meglévő termékeibe, az emberek milliói által nap mint nap használt olyan alkalmazásokba, mint a Wordbe, az Excelbe, a PowerPointba, az Outlookba és a Teamsbe.[8]
ChatGPT Plus
[szerkesztés]A ChatGPT Plus a ChatGPT továbbfejlesztett változata.[10]
A ChatGPT Plus havi 20 dollár felárért[11] hozzáférést biztosított a ChatGPT[12] GPT-4 által támogatott verziójához; az eredeti verziót a GPT-3.5 támogatta.[13] Az OpenAI a GPT-4 API várólistáján keresztül a GPT-4-et is elérhetővé tette a jelentkezők egy általuk kiválasztott csoportja számára;[14] a felvétel után további 0,03 dollár 1000 tokenenként a modellnek megadott kezdeti szövegben ("prompt"), és 0,06 dollár 1000 tokenenként, amit a modell generál ("completion"), a modell 8192 tokenes kontextusablakkal rendelkező verziójának használatához; a 32768 tokenes verzió esetében az árak megduplázódnak.[15]
Továbbfejlesztés
[szerkesztés]A GPT-4 használata során tapasztaltak kiemelkedő fejlődésről tettek tanúbizonyságot. Az OpenAI a GPT-3.5-tel való összehasonlítás eredményeként megerősítette, hogy a GPT-4 modell "megbízhatóbb, kreatívabb, és képes a legfinomabb utasításokat is megérteni és kezelni", összehasonlítva a . Ez a modell továbbá képes képeket is feldolgozni, amely egyedülálló lehetőséget biztosít a felhasználóknak arra, hogy komplex információkat osszanak meg, mint például diagramok, képek vagy képernyőképek értelmezése. Az OpenAI GPT-4-gyel való technológiai fejlődése azonban nem ér véget itt; az eddigi második legnagyobb kontextusablakot kínálja, amely akár 32 768 token hosszúságú is lehet, ami jelentősen meghaladja a korábbi modellek által nyújtott lehetőségeket.
Az OpenAI új funkcióként bevezette a "rendszerüzenetek" használatát, melyek segítségével a modell hangneme és feladata finomhangolható lett. Ez lehetőséget adott arra, hogy a GPT-4 például Shakespeare-stílusú szövegeket készítsen, vagy válaszait JSON formátumban adja meg, így még szélesebb körben alkalmazható technológiai és kreatív projektek során.
Sam Altman az OpenAI vezérigazgatója kijelentette, hogy a GPT-4 betanításának költsége meghaladta a 100 millió dollárt. A Semafor nevű hírportál állítása szerint nyolc, a projekt belső részleteivel ismerős forrással beszéltek, akik szerint a GPT-4 paramétereinek száma elérte az 1 billiót.
Az OpenAI nem állt meg itt: 2023 novemberében bejelentették a GPT-4 Turbo[16] és GPT-4 V(ision)[17] modelleket, amelyek még nagyobb kontextusablakot (akár 128K token) és gazdaságosabb árazást biztosítanak. Ezek a fejlesztések különösen vonzóvá tették a GPT-4-et a nagyvállalati környezetben történő alkalmazásra, ahol a költséghatékonyság kulcsfontosságú szempont.
GPT-4o
[szerkesztés]2024. május 13-án az OpenAI bemutatta a GPT-4o („o” mint „omni”) modellt, amely jelentős előrelépést jelent a szöveg, hang és kép modalitások valós idejű feldolgozásával és kimenetek létrehozásával. A GPT-4o az emberi reakcióhoz hasonló gyors válaszidőt mutatott a beszélgetések során, jelentősen javult a teljesítménye a nem angol nyelveken, valamint a látás és az audió jobb megértése.
A GPT-4o a különböző bemeneteket és kimeneteket egységes modellbe integrálta, így gyorsabb és költséghatékonyabb, mint elődei.
Jegyzetek
[szerkesztés]- ↑ Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Coëffé, Thomas: OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale (fr-FR nyelven). BDM, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Wiggers, Kyle: OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art (amerikai angol nyelven). TechCrunch, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Belfield, Haydn: If your AI model is going to sell, it has to be safe (amerikai angol nyelven). Vox, 2023. március 25. (Hozzáférés: 2024. december 12.)
- ↑ OpenAI (2023). GPT-4 Technical Report (PDF) (Technical report). arXiv:2303.08774. doi:10.48550/arxiv.2303.08774. Archived (PDF) from the original on March 14, 2023. Retrieved March 14, 2023https://web.archive.org/web/20230314190904/https://cdn.openai.com/papers/gpt-4.pdf
- ↑ Itt a minden eddiginél fejlettebb mesterséges intelligencia (magyar nyelven). Portfolio.hu, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Microsoft Research – Emerging Technology, Computer, and Software Research (amerikai angol nyelven). Microsoft Research. (Hozzáférés: 2024. december 12.)
- ↑ a b Bubeck, Sébastien, Ronen (2023. március 24.) http://arxiv.org/abs/2303.12712
- ↑ Confirmed: the new Bing runs on OpenAI’s GPT-4 (amerikai angol nyelven). blogs.bing.com, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ Introducing ChatGPT Plus (amerikai angol nyelven). openai.com. (Hozzáférés: 2024. december 12.)
- ↑ Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
- ↑ OpenAI API. web.archive.org, 2023. március 20. [2023. március 20-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 27.)
- ↑ GPT-4 API waitlist (amerikai angol nyelven). openai.com. (Hozzáférés: 2023. március 27.)
- ↑ (2019. február 1.) „Angol–amerikai történelmi tanulmányok”. Magyar Tudomány. DOI:10.1556/2065.180.2019.1.18. ISSN 0025-0325. (Hozzáférés: 2024. december 12.)
- ↑ OpenAI Platform (angol nyelven). platform.openai.com. (Hozzáférés: 2024. december 12.)
- ↑ GPT-4V(ision) technical work and authors (amerikai angol nyelven). openai.com. (Hozzáférés: 2024. december 12.)