Szerkesztő:Bithisarea/próbalap/Udio
Bithisarea/próbalap/Udio | |
Fejlesztő | Udio |
Első kiadás | 2024. április 10. |
Legfrissebb stabil kiadás | v1.5 (2024. július 23. ) |
Kategória | Generatív mesterséges intelligencia |
Az Udio egy generatív mesterséges intelligencia modell, amely szöveges utasítások alapján zenét generál. A rendszer képes énekhangot és hangszerelést létrehozni. Ingyenes bétaverzióját 2024. április 10-én tették nyilvánosan elérhetővé. A felhasználók havidíjas vagy éves előfizetéssel további funkciókhoz férhetnek hozzá, például hangrestauráláshoz.
A programot 2023 januárjában alapították a Google DeepMind korábbi kutatói David Ding vezérigazgató irányításával. A fejlesztést többek között az Andreessen Horowitz kockázatitőke-társaság, valamint a zenészek, Will.i.am és Common is támogatták. A kritikusok kiemelték a rendszer képességét, hogy valósághű énekhangot hoz létre, ugyanakkor aggályokat fogalmaztak meg a felhasznált képzési adatok szerzői jogi státuszával kapcsolatban.
Történelem
[szerkesztés]Az Udiót 2023 decemberében alapította az Google DeepMind négy korábbi kutatója, köztük David Ding vezérigazgató, valamint Conor Durkan, Charlie Nash, Yaroslav Ganin és Andrew Sanchez.[1][2] A vállalkozás kezdetben Uncharted Labs néven működött.[3]
Az indulást több jelentős befektető támogatta, köztük az Andreessen Horowitz kockázatitőke-társaság, a UnitedMasters zeneforgalmazó, valamint zenészek, például will.i.am, Tay Keith és Common. A finanszírozók között volt továbbá Kevin Wall befektető, Mike Krieger, az Instagram társalapítója, és a DeepMind kutatója, Oriol Vinyals is. A projekt indulásakor a magvető finanszírozást 10 millió dollárra becsülték, amelyhez korábban 8,5 millió dollár tőkét gyűjtöttek össze. [3] [4]
A szoftver hónapokig tartó zárt béta tesztelési fázist követően 2024. április 10-én vált nyilvánosan elérhetővé az Udio weboldalán.[5] 2024 áprilisától a szolgáltatás lehetővé teszi, hogy a felhasználók havonta akár 600 dalt generáljanak ingyenesen.[6]
Andrew Sanchez az Udio célját úgy fogalmazta meg, hogy „lehetővé tegye a zenészek számára, hogy nagyszerű zenét alkossanak és ... hogy a jövőben pénzt keressenek ebből a zenéből". [1] Az Udio megjelenése egybeesett más hasonló szöveg-zene generátorok, például Suno AI és a Stability Audio piacra lépésével.[7]
Az Udio egyik legismertebb felhasználása Willonius Hatcher „BBL Drizzy” című paródiadala volt, amely a Drake–Kendrick Lamar-rivalizálás kapcsán vált virálissá. A dal több mint 23 millió megtekintést ért el a Twitteren és 3,3 millió lejátszást generált SoundCloud-on az első héten.[8]
2024 augusztusában az osztrák producer, Butterbro „Verknallt in einen Talahon” (In Love with a Talahon) című, Udióval generált dala lett az első mesterséges intelligencia által készített zeneszám, amely bekerült a német Top 50-be.[9]
Képességek
[szerkesztés]Az Udio a generált dalokat szöveges utasítások alapján hozza létre, amelyek tartalmazhatják a kívánt zenei műfajt (például barbershop quartet, country, klasszikus zene, hiphop, német popzene vagy hard rock), a dalszöveget, a történetvezetést, valamint az inspirációként szolgáló előadókat. A dalszövegek nagy nyelvi modellek (LLM) segítségével készülnek, míg a zene előállításának pontos technológiáját 2024 áprilisáig nem hozták nyilvánosságra.[10]
A program egy-egy szöveges utasításra két változatot generál, amelyeket a felhasználók további szöveges módosításokkal „remixelhetnek”.[11] Az elkészült dalok kezdetben körülbelül 30 másodperces szakaszokban generálódnak, és további 30 másodperces lépésekkel hosszabbíthatók.[12]
A fizetős előfizetők további fejlett funkciókhoz férhetnek hozzá, például hangbeillesztéshez.[13][14]
Recepció
[szerkesztés]Mark Hachman, a PC World vezető szerkesztője az Udiót az AI művészeti generátorokkal hasonlította össze, és kiemelte, hogy képes „néhány meglehetősen gyenge szöveget” „meglepően fülbemászó” dallá alakítani. Az általa generált énekhangot „hihetetlenül valósághűnek, sőt érzelmesnek” nevezte.[15] Sabrina Ortiz, ZDNET újságírója lenyűgözőnek nevezte az Udio által generált dalokat, amelyek szerinte „olyan hangzásúak, mintha professzionális stúdióban készültek volna”. Véleménye szerint az Udio által előállított zenék „teljesebbek és gazdagabbak”, mint más AI-alapú zenealkotó eszközöké, és nagyobb személyre szabhatóságot kínálnak.[16]
Ryan Morrison, Tom's Guide újságírója szerint az Udio „kiemelkedő képességgel ragadja meg az érzelmeket a szintetikus énekben”, és az egyetlen mesterséges intelligencia alapú zenegenerátorként említette, amely képes visszaadni „az énekes előadás szenvedélyét, fájdalmát és karakterét”.[17] Ugyanakkor hozzátette, hogy az Udio elsősorban azoknak készült, akik nem rendelkeznek zenei képességekkel, vagy csak minimális tapasztalatuk van ezen a területen.[18]
Brian Hiatt, a Rolling Stone újságírója szerint az Udio „jobban testreszabható, de kevésbé intuitív”, mint a Suno AI. Megjegyezte, hogy „néhány korai felhasználó szerint az Udio által generált zene élesebb és tisztább hangzású, mint a Suno AI kimenete”.[19]
Kritika
[szerkesztés]Benj Edwards, Ars Technica újságírója szerint az Udio generációs képességei „kevésbé lenyűgözőek”, mint a Suno AI-é. Megjegyezte, hogy az Udióval készült dalok rövidebbek, és az általa generált zenéket „félig kidolgozottnak és szinte lidércesnek” nevezte.[20]
Az Udio bejelentése után a Telefon Tel Aviv nevű zenei projekt egyik tagja, Joshua Eustis, Twitteren azt írta, hogy az Udio „a zenészeket helyettesítő alkalmazás”, és megkérdőjelezte a modell képzéséhez használt adatok eredetét. Az interneten több kritika is érte a szoftvert, egyes vélemények szerint az Udio által generált dalok „lelketlenek”, és aggályokat vetettek fel azzal kapcsolatban, hogy a rendszer képes mélyhamisított énekhangokat létrehozni.[21][22]
Lucas Ropek, a Gizmodo újságírója különösen élesen bírálta a szoftvert, mondván, hogy az Udio „tele van akusztikai ostobaságokkal”, és az általa generált dalokat „rendkívül rossznak” nevezte.[23]
Szerzői jogi aggályok
[szerkesztés]Az Udio kritikusai kétségbe vonták, hogy milyen adatokat használtak fel a modell betanításához, és felmerült a gyanú, hogy a képzési adatok között szerzői joggal védett zenék is szerepelhettek. A Rolling Stone szerint „jó okkal feltételezhető”, hogy mind az Udio, mind a Suno AI szerzői joggal védett dalokon is tanult, míg Benj Edwards, az Ars Technica újságírója úgy fogalmazott, hogy a modell „valószínűleg szerzői jog által védett tartalmakkal van betanítva”.[24][25]
Az Udio nem generál közvetlen másolatokat szerzői jog által védett dalokról.[26] David Ding, a vállalat vezérigazgatója kijelentette, hogy az Udio „kiterjedt automatizált szerzői jogi szűrőket” alkalmaz, és folyamatosan fejleszti a jogvédett tartalmak kiszűrésére szolgáló mechanizmusokat.[27]
Ezzel szemben Stability AI a Stable Audio 2.0 modelljének betanításához kifejezetten licencelt zenei adatkészletet, az AudioSparx nevű gyűjteményt használta.[28]
2024 júniusában az Amerikai Hanglemezgyártók Szövetsége (Recording Industry Association of America, RIAA) által vezetett per indult az Udio és a Suno AI ellen, amelyben a vállalatokat szerzői jogok széles körű megsértésével vádolták. A kereset szerint a modellek jogvédett hangfelvételeken is tanulhattak, és a felperesek követelték, hogy a cégeket tiltsák el a szerzői joggal védett zenék felhasználásával történő modellbetanítástól. Emellett dalonként akár 150 000 dollár kártérítést is követeltek a már bekövetkezett jogsértések miatt.[29][30]
Jegyzetek
[szerkesztés]- ↑ a b AI-Music Arms Race: Meet Udio, the Other ChatGPT for Music (2024. április 10.)
- ↑ Morrison: Meet Udio — the most realistic AI music creation tool I've ever tried. Tom's Guide, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ a b Louise: Uncharted Labs, an AI startup founded by three Google DeepMind researchers, raises $8.5 million in funding (angol nyelven). Tech Startups, 2024. január 31. (Hozzáférés: 2024. június 1.)
- ↑ Tencer: New AI-powered 'instant' music-making app Udio raises $10m; launches with backing from will.i.am, Common, UnitedMasters, a16z. Music Business Worldwide, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Ortiz: Is Udio really the best AI music generator yet? I put it to the test and so can you. ZDNET, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Hachman: Udio's AI music is my new obsession. PC World, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Nuñez: Former Google DeepMind researchers launch AI-powered music creation app Udio. VentureBeat, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Lawrence: 'I bet Drake heard it and laughed': BBL Drizzy is the real winner of the Drake-Kendrick feud. The Guardian, 2024. május 9. (Hozzáférés: 2024. május 12.)
- ↑ Oltermann. „AI-generated parody song about immigrants storms into German Top 50”, The Guardian, 2024. augusztus 18. (Hozzáférés: 2024. október 13.) (angol nyelvű)
- ↑ Edwards: New AI music generator Udio synthesizes realistic music on demand. Ars Technica, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Eede: 'Game-changing' new app generates music from text prompts. DJ Mag, 2024. április 12. (Hozzáférés: 2024. április 15.)
- ↑ Hachman: Udio's AI music is my new obsession. PC World, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Bastian: AI music app Udio rolls out new features and subscription plan (angol nyelven). The Decoder, 2024. május 10. (Hozzáférés: 2024. május 30.)
- ↑ How do I make music with Udio?. Udio, 2024. május 8. (Hozzáférés: 2024. május 29.)
- ↑ Hachman: Udio's AI music is my new obsession. PC World, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Ortiz: Is Udio really the best AI music generator yet? I put it to the test and so can you. ZDNET, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Morrison: Udio is a game changer for AI music — 9 best prompts to try now. Tom's Guide, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Morrison: Meet Udio — the most realistic AI music creation tool I've ever tried. Tom's Guide, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ AI-Music Arms Race: Meet Udio, the Other ChatGPT for Music (2024. április 10.)
- ↑ Edwards: New AI music generator Udio synthesizes realistic music on demand. Ars Technica, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Eede: 'Game-changing' new app generates music from text prompts. DJ Mag, 2024. április 12. (Hozzáférés: 2024. április 15.)
- ↑ Nuñez: Former Google DeepMind researchers launch AI-powered music creation app Udio. VentureBeat, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Ropek: Dune, the Broadway Musical and 8 Other Brain-Dead Songs From Udio's AI Music Generator. Gizmodo, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Edwards: New AI music generator Udio synthesizes realistic music on demand. Ars Technica, 2024. április 10. (Hozzáférés: 2024. április 15.)
- ↑ Eede: 'Game-changing' new app generates music from text prompts. DJ Mag, 2024. április 12. (Hozzáférés: 2024. április 15.)
- ↑ Hachman: Udio's AI music is my new obsession. PC World, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Nuñez: Former Google DeepMind researchers launch AI-powered music creation app Udio. VentureBeat, 2024. április 11. (Hozzáférés: 2024. április 15.)
- ↑ Introducing Stable Audio 2.0 (brit angol nyelven). Stability AI, 2024. április 3. (Hozzáférés: 2024. június 1.)
- ↑ Sato: Major record labels sue AI company behind "BBL Drizzy" (angol nyelven). The Verge, 2024. június 24. (Hozzáférés: 2024. június 24.)
- ↑ Robinson, Kristin. Major Labels Sue AI Firms Suno and Udio for Alleged Copyright Infringement (amerikai angol nyelven) (2024. június 24.)