Ugrás a tartalomhoz

DeepSeek

Ellenőrzött
A Wikipédiából, a szabad enciklopédiából
DeepSeek
Típusstartup
Alapítva2023. május[1]
SzékhelyHangcsou
AlapítóLiang Venfeng
Iparág
TulajdonosHigh-Flyer
Formamagántulajdonban lévő vállalat
A DeepSeek weboldala
A Wikimédia Commons tartalmaz DeepSeek témájú médiaállományokat.

Liang Venfeng

A DeepSeek (kínaiul: 深度求索; pinjin:Shēndù Qiúsuǒ) kínai mesterséges intelligencia (MI) startup, amely nyílt forráskódú nagy nyelvi modelleket (Large Language Model) fejleszt. A cég székhelye Hangcsouban van, tulajdonosa és kizárólagos finanszírozója a kínai High-Flyer fedezeti alap. A High-Flyer társalapítója Liang Venfeng,[2] alapította a DeepSeek vállalatot 2023 áprilisában, melynek vezérigazgatója lett.[2]

A DeepSeek az MI-modellt az Egyesült Államok Kínával szemben a Nvidia chipek miatt bevezetett szankciói közepette fejlesztette ki, amelyek célja az volt, hogy korlátozzák az ország fejlett MI-rendszerek fejlesztésére való képességét.[3][4]

A szankciók ellenében megvalósított kínai fejlesztés eredményeként létrehozott DeepSeek-R1 chatbot nemzetközi bemutatkozását követően több matematikai, számítógépes programírási és logikai benchmarkon is magasabb teljesítményt nyújtott, mint a ChatGPT.[5][6]

Történt ez annak ellenére, hogy a DeepSeek-R1 szignifikánsan alacsony költségből, mindössze 6 millió dollárból készült el, míg például az OpenAI ChatGPT botja, 2023-ban bemutatott GPT-4 modellje 100 millió dollárból valósult meg.[7][8] Összehasonlításul, a Meta Platforms 65 milliárd dollárt, a Microsoft 80 milliárd dollárt, az Amazon 75 milliárd dollárt, míg a Google, valamint az Anthropic[9] is dollármilliárdot meghaladó nagyságrendben tervezte 2025-ös MI fejlesztési költségeit.[10] A teljesítmény tekintetében a kínai chatbotnak a GPT–4-hez képest a szoftvervezérelt erőforrás-optimalizálás maximalizálásának köszönhetően mindössze egytizednyi számítógép-teljesítményre volt szüksége.[6][11]

A DeepSeek nyílt forráskódúvá tette generatív mesterséges intelligencia algoritmusait, modelljeit és azok képzési részleteit;[12] szabadon hozzáférhetővé kínálta kódját használatra, módosításra és megtekintésre; ez magában foglalta a forráskód és a tervezési dokumentumok fejlesztési célú hozzáférésének és felhasználásának engedélyezését is.[12] A DeepSeek HR-stratégiája mentén a legjobb kínai egyetemekről csábította magához a fiatal MI-kutatókat, és az informatika területén kívülről is alkalmazott szakembereket, hogy diverzifikálja nyelvi modelljei tudását és képességeit.[13]

A DeepSeek 2025. január 20-án[14] mutatta be első ingyenes chatbot-alkalmazását Apple IOS és Android rendszerekre. Egy hétre rá, 2025. január 27-én a DeepSeek-R1 megelőzte a ChatGPT vezető modelljét, a 2024 szeptemberében piacra dobott az OpenAI o1-t, és az Egyesült Államok iOS App Store-jának legnagyobb részben letöltött ingyenes alkalmazásaként[13] az első helyre került a legtöbbet telepített iPhone-alkalmazások közül.[15] A mesterséges intelligencia területén meghatározó jelentőségű Nvidia chipóriás és más, a mesterséges intelligenciához kapcsolódó amerikai technológiai cégek, köztük a Microsoft és a Google értéke a DeepSeek hirtelen betörése miatt zuhanni kezdett. Az Nvidia részvényárfolyamának 18 százalékos esésével[16] „eldördült a startlövés” a globális mesterséges intelligencia forradalmasításának versenyében,[13] „új MI-korszak kezdődött".[17]

Technológia

[szerkesztés]

2023 novemberében a cég DeepSeek Coder néven elindította első modelljét[18] és botját, amely egyetlen nagy nyelvi modellt, a DeepSeek LLM-et használt.[19] 2024. május 7-én prezentálták a DeepSeek-V2-t,[20] majd a következő hónapban a DeepSeek Coder második verzióját. 2024 decemberében a mutatkozott be a DeepSeek-V3, amely felváltotta az előző verziót.[21][22]

A 2025. január 20-án bemutatták a DeepSeek-R1 nagy nyelvi modellt, amely gépi tanulási technológiákon alapult, és olyan számítógép-architektúrát használt, amely koncepcionálisan hasonló az elterjedt Transformer modellekhez.[14]

A DeepSeek válasza a Hszi Csin-pinggel és Narendra Modival kapcsolatos kérdésekre (angol)

A DeepSeek-R1-et MIT-licenc alatt tették közzé, amely a korlátlan nyílt hozzáférést támogatja, és korlátozások nélkül lehetővé teszi mind a kereskedelmi, mind a tudományos alkalmazást. Ezzel a vállalat szándékosan állítja szembe magát számos saját fejlesztésű mesterséges intelligencia rendszerrel, amelyeket korlátozó licencek jellemeznek.[23]

A modellt a rendszeres felhasználók számára ingyenesen hozzáférhetővé tették. Széles felhasználói bázist célzott meg, hogy elősegítse a legmodernebb mesterséges intelligencia technológiához való nyílt hozzáférést.[23]

A DeepSeek a hatékonyabb algoritmusoknak és a speciális hardvereknek köszönhetően optimalizálta mesterséges intelligenciamodelljeit, hogy a hagyományos, energiaigényesebb mesterséges intelligenciamodellekhez képest akár 70 százalékkal csökkentse az energiafogyasztást.[24]

2025. január 27-én a DeepSeek Janus-Pro néven egy új multimodális MI-modellt mutatott be, amely nyílt forráskódú és MIT-licenc alatt érhető el. A modell a DALL-E-hez és a Stable Diffusionhöz hasonló képességeket egyesít, és képes képeket generálni és elemezni. Fejlesztésekor a pontos értelmezési képességekre, a hatékony architektúrára és az erőforrások optimalizált felhasználására helyezték a hangsúlyt.[25]

Fenntartások

[szerkesztés]
A ChatGPT és a DeepSeek interpretálása Tajvan történelme kapcsán (angol)

Megállapították, hogy az DeepSeek-R1 hivatalos API-verziója cenzúrázási mechanizmusokat alkalmazott az érzékeny témákra, elsősorban azokra, amelyeket Pekingben politikailag érzékenynek minősítettek. A modell például nem volt hajlandó válaszolni az 1989-es Tiananmen téri vérengzéssel, az ujgurok elnyomásával vagy a kínai emberi jogokkal kapcsolatos kérdésekre.[26] Előfordult, hogy az MI választ generált, de röviddel később egy olyan üzenettel helyettesítette azt, mint például: „Sajnálom, a kérdés megválaszolására jelenleg nincs felhatalmazásom. Beszéljünk másról."[27][28] A belső cenzori mechanizmusok és korlátozások csak nagy erőfeszítések árán szüntethetők meg a DeepSeek-R1 modell nyílt forráskódú és módosítható nyílt forráskódú változatában. A kínai internetszabályozók által meghatározott „alapvető szocialista értékek” szóba hozása, vagy a tajvani kérdés felvetése esetén a modell a beszélgetést megszakította.[29]

A DeepSeek alapítója, Liang Venfeng állítólag szoros kapcsolatban áll a kommunista párttal. A kritikusok aggodalmukat fejezték ki, hogy a mesterséges intelligenciát potenciálisan külföldi befolyásolásra, dezinformációra, megfigyelésre és kiberfegyverek kifejlesztésére használhatják a kínai titkosszolgálatok közreműködésével. Emellett az adatvédők (a TikTok-hoz hasonlóan) arra figyelmeztettek, hogy az alkalmazás személyes adatokat továbbíthat Kínába.[30][31]

Piaci reakciók

[szerkesztés]

Miután a média nyilvánosságra hozta a DeepSeek MI-modell viszonylag alacsony befektetéssel elért impozáns teljesítményét, 2025. január 27-én a világtörténelem legnagyobb tőzsdei esése következett be.[32] Számos nyugati technológiai részvény névértéke 5-18 százalékkal esett. Különösen az Nvidia volt érintett, amelynek piaci kapitalizációja ezen a napon 593 milliárd dollárral esett – ez a New York-i tőzsdén a valaha volt legnagyobb napi veszteség volt. A chipgyártó Broadcom részvényeinek árfolyama hasonlóan, 17,4%-kal esett.[33]

A Nvidia mellett az Oracle 14 százalékot; az MI-fejlesztő cégek (Bigbear, Soundhound, Palantir) árfolyama 5-11 százalékot esett. A chipgyártók (ARM, Micron) papírjai 10-12 százalékkal, a kvantum számítástechnikai cégek (Quantum Computing, IoniQ, Rigetti) részvényei 5-10 százalékkal értek kevesebbet a nap végére. A DeepSeek piacralépésével hozták kapcsolatba a nagy nyersanyagkitermelők (Anglo American, Antofagasta, Fresnillo) részvényárfolyamának 2-6 százalékos csökkenését is. Az európai tőzsdéket sem hagyta érintetlenül a hír, a Siemens Energy papirjainak értéke 20 százalékot zuhant egy nap alattt.[10]

Fogadtatás

[szerkesztés]

A DeepSeek piacra lépését követő döbbent csendet Sam Altman, a "GPT arca" törte meg, azt írta az X-en, hogy a DeepSeek-R1 teljesítménye lenyűgözte, főleg ahhoz képest, hogy mennyibe került. Azt állította, hogy örül a versenytársnak, és sokkal jobb modelleket fognak fejleszteni nála.[10]

Donald Trump úgy reagált, hogy az amerikai technológiai ipar számára egy ébresztőt jelent a DeepSeek piacra lépése és a jelenség rámutatott, hogy hasonló eredményeket sokkal költséghatékonyabban is el lehet érni.[10]

A Bridgewater Associates rövid távú visszaesést jósolt az amerikai technológiai részvényeknek a DeepSeek konkurenciája miatt, amelynek modellje olcsóbb és erőforrás-hatékonyabb, mint a meglévő amerikai technológiáké, és amely az Apple App Store legtöbbet letöltött MI-alkalmazása lett, felvetve a kérdést, hogy indokoltak-e a nyugati vállalatok óriási összegű befektetései az MI-ba. Hosszú távon azonban a Bridgewater arra számított, hogy a DeepSeek piacra történt belépése világszerte felgyorsítja az MI elfogadását, és végérvényesen megváltoztatja az MI-fejlesztő iparágat.[34]

Jegyzetek

[szerkesztés]
  1. All About DeepSeek - The Chinese AI Startup Challenging The US Big Tech, 2025. január 26. (Hozzáférés: 2025. január 27.)
  2. a b Ottinger, Lily: Deepseek: From Hedge Fund to Frontier Model Maker (angol nyelven). www.chinatalk.media. (Hozzáférés: 2025. január 29.)
  3. Nvidia investigation signals widening of US and China chip war | Computer Weekly (angol nyelven). ComputerWeekly.com. (Hozzáférés: 2025. január 29.)
  4. Nvidia targeted by China in new chip war probe (brit angol nyelven). www.bbc.com, 2024. december 9. (Hozzáférés: 2025. január 29.)
  5. Gibney, Elizabeth (2025. január 23.). „China’s cheap, open AI model DeepSeek thrills scientists” (angol nyelven). Nature. DOI:10.1038/d41586-025-00229-6. ISSN 1476-4687. (Hozzáférés: 2025. január 29.) 
  6. a b Metz, Cade. „How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants”, The New York Times, 2025. január 23. (Hozzáférés: 2025. január 29.) (amerikai angol nyelvű) 
  7. Vincent, James. „The DeepSeek panic reveals an AI world ready to blow”, The Guardian, 2025. január 28. (Hozzáférés: 2025. január 29.) (brit angol nyelvű) 
  8. Nvidia shares sink as Chinese AI app DeepSeek spooks US markets (brit angol nyelven). www.bbc.com, 2025. január 27. (Hozzáférés: 2025. január 29.)
  9. Henshall, Will: What to Know About Claude 2, Anthropic's Rival to ChatGPT (angol nyelven). TIME, 2023. július 18. (Hozzáférés: 2025. január 29.)
  10. a b c d Kínai mesterséges intelligencia tartja lázban a világot - Mutatjuk, mit érdemes tudni a DeepSeekről (magyar nyelven). Portfolio.hu, 2025. január 29. (Hozzáférés: 2025. január 29.)
  11. Cosgrove, Emma: DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending (amerikai angol nyelven). Business Insider. (Hozzáférés: 2025. január 29.)
  12. a b Romero, Luis E.: ChatGPT, DeepSeek, Or Llama? Meta’s LeCun Says Open-Source Is The Key (angol nyelven). Forbes. (Hozzáférés: 2025. január 29.)
  13. a b c Metz, Cade. „What is DeepSeek? And How Is It Upending A.I.?”, The New York Times, 2025. január 27. (Hozzáférés: 2025. január 29.) (amerikai angol nyelvű) 
  14. a b DeepSeek-R1 Release | DeepSeek API Docs (angol nyelven). api-docs.deepseek.com. (Hozzáférés: 2025. január 29.)
  15. DeepSeek versus Nvidia: Hype um chinesischen KI-Anbieter belastet Tech-Aktien”, Der Spiegel, 2025. január 27. (Hozzáférés: 2025. január 29.) (német nyelvű) 
  16. Metz, Cade. „What is DeepSeek? And How Is It Upending A.I.?”, The New York Times, 2025. január 27. (Hozzáférés: 2025. január 29.) (amerikai angol nyelvű) 
  17. Roose, Kevin. „Why DeepSeek Could Change What Silicon Valley Believe About A.I.”, The New York Times, 2025. január 28. (Hozzáférés: 2025. január 29.) (amerikai angol nyelvű) 
  18. Horsey, Julian: Deepseek Coder open source AI coding assistant runs online and locally (amerikai angol nyelven). Geeky Gadgets, 2023. november 5. (Hozzáférés: 2025. január 29.)
  19. Post, 🔳 Turing: Inside DeepSeek Models (angol nyelven). Turing Post. (Hozzáférés: 2025. január 29.)
  20. Gibney, Elizabeth (2025. január 23.). „China’s cheap, open AI model DeepSeek thrills scientists”. Nature. DOI:10.1038/d41586-025-00229-6. ISSN 0028-0836. (Hozzáférés: 2025. január 29.) 
  21. Gibney, Elizabeth (2025. január 23.). „China’s cheap, open AI model DeepSeek thrills scientists”. Nature. DOI:10.1038/d41586-025-00229-6. ISSN 0028-0836. (Hozzáférés: 2025. január 29.) 
  22. « Deepseek 3 », la réponse chinoise à Chat GPT relance la rivalité sino-américaine (francia nyelven). France Inter, 2025. január 3. (Hozzáférés: 2025. január 29.)
  23. a b Chowdhury, Hasan: KI aus China: Überholt dieses Startup jetzt OpenAI? (de-DE nyelven). Business Insider, 2025. január 25. (Hozzáférés: 2025. január 29.)
  24. DeepSeek-Durchbruch revolutioniert Energieeffizienz von KI – Was bedeutet das für die globale Energiewende? On 27. Januar 2025 https://www.cleanthinking.de/deepseek-ki-energieeffizienz-energiewende/
  25. online, heise: Deepseek greift nun auch noch KI-Bildgeneratoren an (német nyelven). heise online, 2025. január 28. (Hozzáférés: 2025. január 29.)
  26. Lappen, Sebastian (2025. január 6.). „Bericht über die 3. Zukunftswerkstatt Ellenbogen”. Obere Extremität. DOI:10.1007/s11678-024-00845-0. ISSN 1862-6599. (Hozzáférés: 2025. január 29.) 
  27. Steinschaden, Jakob: DeepSeek: So sieht Live-Zensur beim chinesischen AI-Chatbot aus (német nyelven). Trending Topics, 2025. január 27. (Hozzáférés: 2025. január 29.)
  28. Steinschaden, Jakob: DeepSeek: This is what live censorship looks like in the Chinese AI chatbot (angol nyelven). Trending Topics, 2025. január 27. (Hozzáférés: 2025. január 29.)
  29. Editorial. „The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos”, The Guardian, 2025. január 26. (Hozzáférés: 2025. január 29.) (brit angol nyelvű) 
  30. China’s DeepSeek AI poses formidable cyber, data privacy threats | Biometric Update (amerikai angol nyelven). www.biometricupdate.com, 2025. január 26. (Hozzáférés: 2025. január 29.)
  31. White, Keith (1994. november 1.). „The Killer App:WiredMagazine, Voice of the Corporate Revolution”. The Baffler 6, 23–28. o. DOI:10.1162/bflr.1994.6.23. ISSN 1059-9789. (Hozzáférés: 2025. január 29.) 
  32. Itt a világtörténelem legnagyobb tőzsdei esése, mutatjuk, hogy érdemes-e már beszállni (magyar nyelven). Portfolio.hu, 2025. január 28. (Hozzáférés: 2025. január 29.)
  33. DeepSeek sparks AI stock selloff; Nvidia posts record market-cap loss Reuters January 28, 2025 https://www.reuters.com/technology/chinas-deepseek-sets-off-ai-market-rout-2025-01-27/
  34. Bridgewater sees short-term correction for tech stocks but bullish on DeepSeek impact Reuters January 28, 2025 https://www.reuters.com/technology/bridgewater-sees-short-term-correction-tech-stocks-bullish-deepseek-impact-2025-01-28/

További információk

[szerkesztés]
Commons:Category:DeepSeek
A Wikimédia Commons tartalmaz DeepSeek témájú médiaállományokat.