Generatív MI
A generatív mesterséges intelligencia (más néven: generatív AI, GenAI,[1] vagy GAI) a mesterséges intelligencia egy olyan alcsoportja, amely generatív modelleket használ szövegek, képek, videók vagy más adatformák előállítására.[2][3][4] Ezek a modellek megtanulják a képzési adatok mögöttes mintáit és struktúráit, és ezeket használják fel új adatok előállítására[5][6] a bemenet alapján, amely gyakran természetes nyelvi kérések formájában érkezik.[7][8]
A transzformátor-alapú mély neurális hálózatok, különösen a nagy nyelvi modellek (LLM) fejlesztése lehetővé tette a generatív mesterséges intelligencia rendszerek mesterséges intelligencia boomját a 2020-as évek elején. Ezek közé tartoznak az olyan chatbotok, mint a DeepSeek, ChatGPT, Copilot, Gemini és LLaMA; a szövegből képet generáló mesterséges intelligencia képgeneráló rendszerek, mint a Stable Diffusion, Midjourney és DALL-E; és a szövegből videót generáló mesterséges intelligencia generátorok, mint a Sora.[9][10][11][12] Olyan vállalatok, mint az OpenAI, Anthropic, Microsoft, Google és Baidu, valamint számos kisebb cég fejlesztett generatív AI modelleket.[7][13][14]
A generatív mesterséges intelligenciát számos iparágban alkalmazzák, többek között a szoftverfejlesztésben, az egészségügyben, a pénzügyekben, a szórakoztatásban, az ügyfélszolgálatban,[15] az értékesítésben és a marketingben,[16] a művészetben, az írásban,[17] a divatban[18] és a terméktervezésben.[19] Ugyanakkor aggályok merültek fel a generatív mesterséges intelligencia lehetséges visszaéléseivel kapcsolatban, mint például a kiberbűnözés, az álhírek vagy a deepfakes használata az emberek megtévesztésére vagy manipulálására, valamint az emberi munkahelyek tömeges helyettesítése.[20][21] Szellemi tulajdonjogi aggályok is felmerülnek az olyan generatív modellekkel kapcsolatban, amelyeket szerzői jogvédelem alatt álló műalkotásokon képeznek ki és utánoznak.[22]
Története
[szerkesztés]Korai történelem
[szerkesztés]A terület kutatói a kezdetektől fogva filozófiai és etikai érveket vetettek fel az emberi elme természetével és az emberhez hasonló intelligenciával rendelkező mesterséges lények létrehozásának következményeivel kapcsolatban; ezeket a kérdéseket már az ókor óta a mítoszok, a fikció és a filozófia vizsgálta.[23] Az automatizált művészet fogalma legalább az ókori görög civilizáció automatáihoz nyúlik vissza, ahol olyan feltalálókról, mint Daidalosz és Hérón, azt írták, hogy olyan gépeket terveztek, amelyek képesek voltak szöveget írni, hangokat generálni és zenét játszani.[24][25] A kreatív automaták hagyománya a történelem során virágzott, példaként említve Maillardet 1800-as évek elején létrehozott automatáját.[26] A Markov-láncokat régóta használják természetes nyelvek modellezésére, amióta Andrej Markov orosz matematikus a 20. század elején kifejlesztette őket. Markov 1906-ban publikálta első tanulmányát a témában,[27][28] és Markov-láncok segítségével elemezte a magán- és mássalhangzók mintázatát az Eugenij Onegin című regényben. Ha egy Markov-láncot megtanultunk egy szövegkorpuszon, akkor az valószínűségi szöveggenerátorként használható.[29][30]
Akadémiai mesterséges intelligencia
[szerkesztés]A mesterséges intelligencia akadémiai tudományágát a Dartmouth College-ban 1956-ban tartott kutatóműhelyen alapították meg, és az azóta eltelt évtizedekben több hullámban is fejlődött és optimista lett.[31] A mesterséges intelligencia kutatása az 1950-es években kezdődött olyan munkákkal, mint a Computing Machinery and Intelligence (1950) és az 1956-os Dartmouth Summer Research Project on AI. Az 1950-es évek óta művészek és kutatók művészi alkotások létrehozásához használták a mesterséges intelligenciát. Az 1970-es évek elejére Harold Cohen generatív mesterséges intelligencia műveket készített és állított ki, amelyeket az AARON, a Cohen által festmények generálására létrehozott számítógépes programmal készített..[32]
A generatív MI tervezés vagy generatív tervezés kifejezéseket az 1980-as és 1990-es években használták a mesterséges intelligencia tervezőrendszerekre, különösen a számítógépes folyamattervezésre, amelyeket egy meghatározott cél eléréséhez szükséges cselekvéssorozatok generálására használtak.[33][34] A generatív MI tervezőrendszerek olyan szimbolikus MI módszereket használtak, mint az állapottér-keresés és a korlátok kielégítése, és az 1990-es évek elejére „viszonylag érett” technológiának számítottak. Ezeket katonai célú válsághelyzeti akciótervek,[35] gyártási folyamattervek[33] és döntési tervek, például autonóm űrhajók prototípusai generálására használták.[36]
Generatív neurális hálók (2014-2019)
[szerkesztés]A gépi tanulás területe a kezdetektől fogva mind diszkriminatív, mind generatív modelleket használt az adatok modellezésére és előrejelzésére. A 2000-es évek végétől kezdve a mélytanulás megjelenése hajtotta a fejlődést és a kutatást a képosztályozás, a beszédfelismerés, a természetes nyelvi feldolgozás és más feladatok terén. A neurális hálózatokat ebben a korszakban jellemzően diszkriminatív modellként képezték, a generatív modellezés nehézségei miatt.[37]
2014-ben az olyan fejlesztések, mint a variációs autoencoder és a generatív adverzális hálózat létrehozták az első olyan gyakorlati mély neurális hálózatokat, amelyek képesek generatív modelleket tanulni, szemben a diszkriminatív modellekkel, olyan összetett adatokra, mint a képek. Ezek a mély generatív modellek voltak az elsők, amelyek nemcsak a képek osztálycímkéit, hanem teljes képeket is ki tudtak adni.
2017-ben a Transformer hálózat lehetővé tette a generatív modellek továbbfejlesztését a régebbi Long-Short Term Memory modellekhez képest,[38] ami 2018-ban a GPT-1 néven ismert első generatív, előre betanított transzformátorhoz (GPT) vezetett.[39] 2019-ben ezt követte a GPT-2, amely alapmodellként bizonyította, hogy képes felügyelet nélkül általánosítani számos különböző feladatra.[40]
Az ebben az időszakban bevezetett új generatív modellek lehetővé tették, hogy a nagy neurális hálózatokat felügyelet nélküli tanulással vagy félig felügyelt tanulással képezzék, a diszkriminatív modellekre jellemző felügyelt tanulás helyett. A felügyelet nélküli tanulással megszűnt az embereknek az adatok kézi címkézése, így nagyobb hálózatok képzése vált lehetővé.[41]
Jegyzetek
[szerkesztés]- ↑ Executive Order N-12-23. Executive Department, State of California, 2023. szeptember 5. [2024. február 21-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. szeptember 7.)
- ↑ Pinaya, Walter H. L.; Graham, Mark S.; Kerfoot, Eric; Tudosiu, Petru-Daniel; Dafflon, Jessica; Fernandez, Virginia; Sanchez, Pedro; Wolleb, Julia; da Costa, Pedro F.; Patel, Ashay (2023). "Generative AI for Medical Imaging: extending the MONAI Framework". arXiv:2307.15208 [eess.IV].
- ↑ What is ChatGPT, DALL-E, and generative AI?. McKinsey . (Hozzáférés: 2024. december 14.)
- ↑ What is generative AI?. IBM , 2024. március 22.
- ↑ Pasick, Adam. „Artificial Intelligence Glossary: Neural Networks and Other Terms Explained”, The New York Times, 2023. március 27.. [2023. szeptember 1-i dátummal az eredetiből archiválva] (Hozzáférés: 2023. április 22.) (amerikai angol nyelvű)
- ↑ Generative models. OpenAI, 2016. június 16. [2023. november 17-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 15.)
- ↑ a b Anthropic Said to Be Closing In on $300 Million in New A.I. Funding. The New York Times, 2023. január 27. [2023. december 9-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 14.)
- ↑ „A Cheat Sheet to AI Buzzwords and Their Meanings”, Bloomberg News , 2023. március 10.. [2023. november 17-i dátummal az eredetiből archiválva] (Hozzáférés: 2023. március 14.)
- ↑ Metz, Cade. „OpenAI Plans to Up the Ante in Tech's A.I. Race”, The New York Times, 2023. március 14.. [2023. március 31-i dátummal az eredetiből archiválva] (Hozzáférés: 2023. március 31.) (amerikai angol nyelvű)
- ↑ Thoppilan, Romal; De Freitas, Daniel; Hall, Jamie; Shazeer, Noam; Kulshreshtha, Apoorv (January 20, 2022). "LaMDA: Language Models for Dialog Applications". arXiv:2201.08239 [cs.CL].
- ↑ Roose, Kevin: A Coming-Out Party for Generative A.I., Silicon Valley's New Craze. The New York Times , 2022. október 21. [2023. február 15-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 14.)
- ↑ Metz, Cade. „OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos”, The New York Times, 2024. február 15.. [2024. február 15-i dátummal az eredetiből archiválva] (Hozzáférés: 2024. február 16.) (amerikai angol nyelvű)
- ↑ „The race of the AI labs heats up”, The Economist , 2023. január 30.. [2023. november 17-i dátummal az eredetiből archiválva] (Hozzáférés: 2023. március 14.)
- ↑ Google Cloud brings generative AI to developers, businesses, and governments, 2023. március 14. [2023. november 17-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 15.)
- ↑ Brynjolfsson, Erik; Li, Danielle & Raymond, Lindsey R. (April 2023), Generative AI at Work, Working Paper Series, doi:10.3386/w31161, <https://www.nber.org/papers/w31161>. Hozzáférés ideje: 2024-01-21
- ↑ Don't fear an AI-induced jobs apocalypse just yet. The Economist, 2023. március 6. [2023. november 17-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 14.)
- ↑ Coyle, Jake: In Hollywood writers' battle against AI, humans win (for now). AP News . Associated Press, 2023. szeptember 27. [2024. április 3-i dátummal az eredetiből archiválva]. (Hozzáférés: 2024. január 26.)
- ↑ Generative AI: Unlocking the future of fashion. [2023. november 17-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. március 14.)
- ↑ „How Generative AI Can Augment Human Creativity”, Harvard Business Review, 2023. június 16.. [2023. június 20-i dátummal az eredetiből archiválva] (Hozzáférés: 2023. június 20.)
- ↑ Hendrix, Justin: Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI. techpolicy.press , 2023. május 16. [2023. november 17-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. május 19.)
- ↑ (2023. október 18.) „Misinformation reloaded? Fears about the impact of generative AI on misinformation are overblown” (amerikai angol nyelven). Harvard Kennedy School Misinformation Review. DOI:10.37016/mr-2020-127. (Hozzáférés: 2023. november 16.)
- ↑ „New AI systems collide with copyright law”, BBC News, 2023. augusztus 1. (Hozzáférés: 2024. szeptember 28.)
- ↑ Newquist, H. P.. The Brain Makers: Genius, Ego, And Greed In The Quest For Machines That Think (amerikai angol nyelven). New York: Macmillan/SAMS, 45–53. o. (1994). ISBN 978-0-672-30412-5
- ↑ Sharkey, Noel (July 4, 2007), A programmable robot from 60 AD, vol. 2611, New Scientist, <https://www.newscientist.com/blog/technology/2007/07/programmable-robot-from-60ad.html>. Hozzáférés ideje: October 22, 2019
- ↑ Brett, Gerard (July 1954), "The Automata in the Byzantine "Throne of Solomon"", Speculum 29 (3): 477–487, ISSN 0038-7134, DOI 10.2307/2846790
- ↑ kelinich: Maillardet's Automaton (angol nyelven). The Franklin Institute , 2014. március 8. [2023. augusztus 24-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. augusztus 24.)
- ↑ Introduction to Probability (amerikai angol nyelven). American Mathematical Society, 464–466. o. (1997). ISBN 978-0-8218-0749-1
- ↑ Bremaud, Pierre. Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues. Springer Science & Business Media, ix. o. (2013. március 9.). ISBN 978-1-4757-3124-8
- ↑ Hayes, Brian (2013. január 30.). „First Links in the Markov Chain”. American Scientist 101 (2), 92. o. DOI:10.1511/2013.101.92. ISSN 0003-0996. (Hozzáférés: 2023. szeptember 24.)
- ↑ (1998. július 1.) „The Hierarchical Hidden Markov Model: Analysis and Applications” (angol nyelven). Machine Learning 32 (1), 41–62. o. DOI:10.1023/A:1007469218079. ISSN 1573-0565.
- ↑ Crevier, Daniel. AI: The Tumultuous Search for Artificial Intelligence. (amerikai angol nyelven). New York, New York: BasicBooks, 109. o. (1993). ISBN 0-465-02997-3
- ↑ (2023. január 30.) „A Brief History of Generative AI”. Dichotomies: Generative AI: Navigating Towards a Better Future (2), 4. o. (Hozzáférés: 2023. augusztus 8.)
- ↑ a b (1989) „Computer aided process planning: the state-of-the-art survey”. The International Journal of Production Research 27 (4), 553–585. o. DOI:10.1080/00207548908942569. (Hozzáférés: 2023. október 3.)
- ↑ Chien, Steve (1998). „Automated planning and scheduling for goal-based autonomous spacecraft”. IEEE Intelligent Systems and Their Applications 13 (5), 50–55. o. DOI:10.1109/5254.722362.
- ↑ ARPA/Rome Laboratory Knowledge-based Planning and Scheduling Initiative Workshop Proceedings. The Advanced Research Projects Agency, Department of Defense, and Rome Laboratory, US Air Force, Griffiss AFB, 219. o. (1994). ISBN 155860345X
- ↑ An Autonomous Spacecraft Agent Prototype. Autonomous Robots Volume 5, No. 1, 29–45. o. (1998) „Our deliberator is a traditional generative AI planner based on the HSTS planning framework (Muscettola, 1994), and our control component is a traditional spacecraft attitude control system (Hackney et al. 1993). We also add an architectural component explicitly dedicated to world modeling (the mode identifier), and distinguish between control and monitoring.”
- ↑ Jebara, Tony. Machine learning: discriminative and generative. Springer Science & Business Media (2012)
- ↑ Cao, Yihan; Li, Siyu; Liu, Yixin; Yan, Zhiling; Dai, Yutong; Yu, Philip S.; Sun, Lichao (7 March 2023). "A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT". arXiv:2303.04226 [cs.AI].
- ↑ finetune-transformer-lm. GitHub . [2023. május 19-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. május 19.)
- ↑ Language models are unsupervised multitask learners. OpenAI Blog , 2019
- ↑ Radford, Alec: Improving language understanding with unsupervised learning. OpenAI , 2018. június 11. (Hozzáférés: 2024. október 6.)