Ugrás a tartalomhoz

GPT-4

Ellenőrzött
A Wikipédiából, a szabad enciklopédiából
GPT-4
A GPT-4 logója
A GPT-4 logója

FejlesztőOpenAI
Első kiadás2023
Programozási nyelvPython
Platformplatform.openai.com
Méret1.76 billió paraméter
ElérhetőA rendszer több mint 50 nyelvet támogat, lefedve a beszélt nyelvek több mint 97 százalékát.
Kategóriachatbotok
Licenckereskedelmi licenc
[chatgpt.com A GPT-4 weboldala]

A Generatív Előtrénelt Transzformátor 4 (GPT-4) egy multimodális, nagy nyelvi modell, amelyet az OpenAI hozott létre, és a GPT alapmodellek sorozatának negyedik tagja.[1][2] A multimodalitás azt jelenti, hogy a GPT-4 esetében már nem csak szöveges parancsokkal, de képekkel is lehet tartalmat generálni.[3]

A GPT-4 modellt 2023. március 14-én mutatták be a nagyközönségnek. A ChatGPT GPT-4-et használó verziója javulást jelentett a GPT-3.5-ön alapuló korábbi verzióhoz képest, de nem szüntette meg a korábbi verziók minden problémáját. Mindemellett GPT-4 megbízhatóbb, kreatívabb és sokkal árnyaltabban képes az utasításokat kezelni, mint a GPT-3.5.. Ez a modell mérföldkőnek számított a mesterséges intelligencia fejlődésében.[4]

Jellemzők

[szerkesztés]

Az OpenAI 2018-ban bemutatta az első GPT modellt, amely a transzformátor architektúrára épült. Ez a technológia lehetővé tette, hogy a modell nagyméretű könyvgyűjteményeken tanuljon, és a következő években jelentős fejlődést mutatott. A GPT-3, majd annak továbbfejlesztett változata, a GPT-3.5, már rendkívüli képességekkel rendelkezett, például példák alapján történő tanulásban. A GPT-4 azonban minden eddigi modellt túlszárnyal, amit a meg nem erősített hírek szerint 1,76 billió paraméterének köszönhetett.

A GPT-4 előtréningezése nyilvános és engedélyezett harmadik féltől származó adatok felhasználásával történt, melyet megerősítéses tanulási technikákkal finomhangoltak emberek és mesterséges intelligencia által adott visszajelzések alapján.Az OpenAI csak korlátozott információt bocsátott rendelkezésre a GPT-4 technikai jellemzőit illetően; a műszaki ismertetés során kifejezetten elzárkózott attól, hogy ismertesse a modell paramétereit, felépítését, vagy a betanítás során használt hardvert. Ugyan tájékoztatást adtak arról, hogy a modellt először egy nagy adatbázisra épülő irányított, mennyiségi alapú képzéssel, majd emberi és mesterséges intelligencia-visszacsatolással kombinált minőségi betanítással képezték ki, de nem közöltek további részleteket sem a betanítás folyamatáról, sem a képzési adatbázis összeállításának szempontjairól. Nem adtak meg olyan hiperparamétereket, mint például a tanulási sebesség, az epochaszám vagy az alkalmazott optimalizátorok, nem tájékoztattak a felmerült erőforrásigényekről sem. Döntésüket „a versenyhelyzettel és a nagyméretű modellek biztonsági kockázataival” indokolták.[5]

Alkalmazás

[szerkesztés]

Az OpenAI példaként azzal érzékeltette új modellje képességét, hogy a GPT-4 az amerikai jogi egyetemek végzősei számára a hivatásos ügyvédi tevékenység megkezdése előtt előírt ügyvédi vizsga szimulációja során a tesztet kitöltők legjobb 10 százaléka körül teljesített, míg a régebbi modell „csak” az alsó 10 százalék körüli eredményt érte el.[6] A Microsoft Research[7] is tesztelte az új modellt, és arra a következtetésre jutott, hogy „joggal tekinthető egy mesterséges általános intelligencia (Artifical General Intelligence, AGI) rendszer korai, de még nem tökéletes változatának”.[8]

A Microsoft hivatalosan is megerősítette, hogy a Bing GPT egy hónappal korábbi bemutatásakor (ld. alább) valójában már a GPT-4 verziót használták,[9] és bejelentette a GPT-4 további integrációját már meglévő termékeibe, az emberek milliói által nap mint nap használt olyan alkalmazásokba, mint a Wordbe, az Excelbe, a PowerPointba, az Outlookba és a Teamsbe.[8]

ChatGPT Plus

[szerkesztés]

A ChatGPT Plus a ChatGPT továbbfejlesztett változata.[10]

A ChatGPT Plus havi 20 dollár felárért[11] hozzáférést biztosított a ChatGPT[12] GPT-4 által támogatott verziójához; az eredeti verziót a GPT-3.5 támogatta.[13] Az OpenAI a GPT-4 API várólistáján keresztül a GPT-4-et is elérhetővé tette a jelentkezők egy általuk kiválasztott csoportja számára;[14] a felvétel után további 0,03 dollár 1000 tokenenként a modellnek megadott kezdeti szövegben ("prompt"), és 0,06 dollár 1000 tokenenként, amit a modell generál ("completion"), a modell 8192 tokenes kontextusablakkal rendelkező verziójának használatához; a 32768 tokenes verzió esetében az árak megduplázódnak.[15]

Továbbfejlesztés

[szerkesztés]

A GPT-4 használata során tapasztaltak kiemelkedő fejlődésről tettek tanúbizonyságot. Az OpenAI a GPT-3.5-tel való összehasonlítás eredményeként megerősítette, hogy a GPT-4 modell "megbízhatóbb, kreatívabb, és képes a legfinomabb utasításokat is megérteni és kezelni", összehasonlítva a . Ez a modell továbbá képes képeket is feldolgozni, amely egyedülálló lehetőséget biztosít a felhasználóknak arra, hogy komplex információkat osszanak meg, mint például diagramok, képek vagy képernyőképek értelmezése. Az OpenAI GPT-4-gyel való technológiai fejlődése azonban nem ér véget itt; az eddigi második legnagyobb kontextusablakot kínálja, amely akár 32 768 token hosszúságú is lehet, ami jelentősen meghaladja a korábbi modellek által nyújtott lehetőségeket.

Az OpenAI új funkcióként bevezette a "rendszerüzenetek" használatát, melyek segítségével a modell hangneme és feladata finomhangolható lett. Ez lehetőséget adott arra, hogy a GPT-4 például Shakespeare-stílusú szövegeket készítsen, vagy válaszait JSON formátumban adja meg, így még szélesebb körben alkalmazható technológiai és kreatív projektek során.

Sam Altman az OpenAI vezérigazgatója kijelentette, hogy a GPT-4 betanításának költsége meghaladta a 100 millió dollárt. A Semafor nevű hírportál állítása szerint nyolc, a projekt belső részleteivel ismerős forrással beszéltek, akik szerint a GPT-4 paramétereinek száma elérte az 1 billiót.

Az OpenAI nem állt meg itt: 2023 novemberében bejelentették a GPT-4 Turbo[16] és GPT-4 V(ision)[17] modelleket, amelyek még nagyobb kontextusablakot (akár 128K token) és gazdaságosabb árazást biztosítanak. Ezek a fejlesztések különösen vonzóvá tették a GPT-4-et a nagyvállalati környezetben történő alkalmazásra, ahol a költséghatékonyság kulcsfontosságú szempont.

GPT-4o

[szerkesztés]

2024. május 13-án az OpenAI bemutatta a GPT-4o („o” mint „omni”) modellt, amely jelentős előrelépést jelent a szöveg, hang és kép modalitások valós idejű feldolgozásával és kimenetek létrehozásával. A GPT-4o az emberi reakcióhoz hasonló gyors válaszidőt mutatott a beszélgetések során, jelentősen javult a teljesítménye a nem angol nyelveken, valamint a látás és az audió jobb megértése.

A GPT-4o a különböző bemeneteket és kimeneteket egységes modellbe integrálta, így gyorsabb és költséghatékonyabb, mint elődei.

Jegyzetek

[szerkesztés]
  1. Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
  2. Coëffé, Thomas: OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale (fr-FR nyelven). BDM, 2023. március 14. (Hozzáférés: 2024. december 12.)
  3. Wiggers, Kyle: OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art (amerikai angol nyelven). TechCrunch, 2023. március 14. (Hozzáférés: 2024. december 12.)
  4. Belfield, Haydn: If your AI model is going to sell, it has to be safe (amerikai angol nyelven). Vox, 2023. március 25. (Hozzáférés: 2024. december 12.)
  5. OpenAI (2023). GPT-4 Technical Report (PDF) (Technical report). arXiv:2303.08774. doi:10.48550/arxiv.2303.08774. Archived (PDF) from the original on March 14, 2023. Retrieved March 14, 2023https://web.archive.org/web/20230314190904/https://cdn.openai.com/papers/gpt-4.pdf
  6. Itt a minden eddiginél fejlettebb mesterséges intelligencia (magyar nyelven). Portfolio.hu, 2023. március 14. (Hozzáférés: 2024. december 12.)
  7. Microsoft Research – Emerging Technology, Computer, and Software Research (amerikai angol nyelven). Microsoft Research. (Hozzáférés: 2024. december 12.)
  8. a b Bubeck, Sébastien, Ronen (2023. március 24.) http://arxiv.org/abs/2303.12712
  9. Confirmed: the new Bing runs on OpenAI’s GPT-4 (amerikai angol nyelven). blogs.bing.com, 2023. március 14. (Hozzáférés: 2024. december 12.)
  10. Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
  11. Introducing ChatGPT Plus (amerikai angol nyelven). openai.com. (Hozzáférés: 2024. december 12.)
  12. Edwards, Benj: OpenAI’s GPT-4 exhibits “human-level performance” on professional benchmarks (amerikai angol nyelven). Ars Technica, 2023. március 14. (Hozzáférés: 2024. december 12.)
  13. OpenAI API. web.archive.org, 2023. március 20. [2023. március 20-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 27.)
  14. GPT-4 API waitlist (amerikai angol nyelven). openai.com. (Hozzáférés: 2023. március 27.)
  15. (2019. február 1.) „Angol–amerikai történelmi tanulmányok”. Magyar Tudomány. DOI:10.1556/2065.180.2019.1.18. ISSN 0025-0325. (Hozzáférés: 2024. december 12.) 
  16. OpenAI Platform (angol nyelven). platform.openai.com. (Hozzáférés: 2024. december 12.)
  17. GPT-4V(ision) technical work and authors (amerikai angol nyelven). openai.com. (Hozzáférés: 2024. december 12.)