Udio

eina generadora de text a cançons

Udio és una eina d'intel·ligència artificial generativa que produeix cançons basades en descripcions textuals, combinant veus amb instruments. La seva versió beta gratuïta es va llançar públicament el 10 d'abril de 2024.

Udio
Modifica el valor a Wikidata

Tipusaplicació web i intel·ligència artificial generativa Modifica el valor a Wikidata
Versió inicial
10 abril 2024 Modifica el valor a Wikidata
Més informació
Lloc webudio.com (anglès) Modifica el valor a Wikidata


X: udiomusic Modifica el valor a Wikidata

Fundat al desembre de 2023 per un equip d'investigadors de Google DeepMind encapçalats pel director executiu d'Udio, David Ding, el programa va rebre suport financer de l'empresa de capital de risc Andreessen Horowitz i dels músics will.i.am i Common, entre altres.[1][2] Els crítics van elogiar la seva capacitat per a crear veus amb so realista, mentre que uns altres van expressar la seva preocupació per la possibilitat que les seves dades d'entrenament continguessin música protegida per drets d'autor.

Història

modifica

Udio va ser creat al desembre de 2023 per un equip de quatre investigadors de Google DeepMind, inclòs el director executiu d'Udio, David Ding, Conor Durkan, Charlie Nash, Yaroslav Ganin i Andrew Sanchez, sota el nom d'Uncharted Labs.[1][3][4] L'empresa de capital de risc Andreessen Horowitz; el distribuïdor de música UnitedMasters; els músics will.i.am, Tay Keith i Common; l'inversor Kevin Wall; el cofundador d'Instagram Mike Krieger; i l'investigador de DeepMind Oriol Vinyals van brindar suport financer a Udio, valorat en 10 milions de dòlars en finançament inicial (més els 8,5 milions de dòlars originals recaptats anteriorment).[1][2] Va trigar diversos mesos en una fase beta tancada abans de ser llançat públicament el 10 d'abril de 2024, al lloc web d'Udio.[5] A partir d'abril de 2024, va permetre als usuaris generar 600 cançons per mes de manera gratuïta.[6] Sánchez ho va descriure com «permetrà als músics crear bona música i [...] guanyar diners en el futur».[3] La publicació d'aquesta eina va donar peu a la publicació d'altres generadors de text a música com Suno AI i Stability Audio.[7]

Udio es va utilitzar per crear «BBL Drizzy» de Willonius Hatcher, una cançó parodia que es va tornar viral en el context de la disputa entre Drake i Kendrick Lamar, amb més de 23 milions de visites a X (Twitter, anteriorment) i 3,3 milions de reproduccions a SoundCloud la primera setmana.[8]

Capacitats

modifica

Udio crea cançons basades en instruccions textuals, que poden especificar el gènere musical, incloent quartet de barbershop, country, clàssica, hip hop, pop alemany, hard rock, entre altres. La lletra es crea amb un model de llenguatge gran (LLM), mentre que el procés utilitzat per a generar la música en si, a data d'abril de 2024, no ha estat revelat.[9] El programa genera dues cançons basant-se en les indicacions, i els usuaris poden «remesclar» les seves cançons amb més indicacions de text.[10] Les cançons es generen primer com a peces d'aproximadament 30 segons de durada i es poden ampliar en increments addicionals de 30 segons.[6] Els subscriptors de pagament poden accedir a funcions avançades.[11][12]

Recepció

modifica

Mark Hachman, escriptor sènior de PC World, va comparar Udio amb els generadors d'art de IA i va elogiar la seva capacitat per a convertir «algunes lletres bastant pobres» en una cançó «bastant atractiva», i també va qualificar les veus que va generar com «increïblement realistes i fins i tot emocionals».[6] Sabrina Ortiz de ZDNET va descriure les cançons que va generar com a «impressionants» i que sonaven «com si haguessin estat produïdes professionalment». També el va descriure com a «més complet i ric» que els altres generadors de text a música, que, segons va dir, tenien «més opcions de personalització».[5] Ryan Morrison, de Tom's Guide, va assenyalar que Udio tenia «una sorprenent habilitat per a capturar emocions en veus sintètiques» i era l'únic generador de música amb IA «que havia capturat la passió, el dolor i l'esperit d'una interpretació vocal».[13] Va afegir que el programa estava dirigit a «persones amb mínima o nul·la capacitat musical».[4] Brian Hiatt de Rolling Stone va escriure que Udio era «més personalitzable però potser també menys intuïtiu d'usar que Suno AI» i va agregar que «alguns dels primers usuaris han opinat que, de mitjana, la sortida d'Udio pot sonar més nítida que la de Suno».[3]

Per a Ars Technica, Benj Edwards va escriure que la capacitat de generació d'Udio era «imperfecta» i «menys impressionant» que la de Suno AI, i va assenyalar que les seves cançons eren substancialment més curtes.[9] En resposta a l'anunci de la companyia sobre el llançament beta d'Udio a Twitter, Joshua Eustis, membre de Telefon Tel Aviv, va opinar a través d'X que Udio era «una aplicació per a reemplaçar als músics» i va qüestionar les dades que utilitzava. Udio també ha estat criticat a través de xarxes socials per ser «sense ànima» i per tenir el potencial de crear àudio deepfakes.[7][10] Lucas Ropek de Gizmodo va afirmar que Udio estava «ple de ximpleries acústiques» i que les seves cançons eren «extraordinàriament dolentes».[14]

Preocupacions per drets d'autor

modifica

Els crítics d'Udio han qüestionat quines dades es van utilitzar per a entrenar-lo i si aquestes dades consistien en música protegida per drets d'autor. Rolling Stone va escriure que hi havia «raons substancials per a creure» que tant Udio com Suno AI van ser entrenats amb música protegida per drets d'autor, mentre que Benj Edwards d'Ars Technica va escriure que les seves dades d'entrenament «probablement estaven plenes de material protegit per drets d'autor».[9][10] Udio no recrea directament cançons amb drets d'autor quan se li sol·licita.[6] Ding ha declarat que Udio té «amplis filtres de drets d'autor automatitzats» i que l'empresa està «refinant contínuament [les seves] salvaguardes».[7] Stability AI va adoptar un enfocament diferent amb Stable Audio 2.0 i va utilitzar un conjunt de dades de música amb llicència explícita anomenat AudioSparx.[15]

Al juny de 2024, l'Associació de la Indústria Discogràfica dels Estats Units (RIAA) va interposar una demanda contra Udio i Suno AI, un altre generador de cançons, per suposada infracció massiva d'enregistraments sonors amb drets d'autor. L'acció legal cerca prohibir a aquestes empreses la formació sobre música amb drets d'autor i exigeix indemnitzacions de fins a 150,000 dòlars estatunidencs per cada infracció comesa.[16][17]

Vegeu també

modifica

Referències

modifica
  1. 1,0 1,1 1,2 Louise, Nickie. «Uncharted Labs, an AI startup founded by three Google Deepmind researchers, raises $8.5 million in funding» (en anglès). Tech Startups, 31-01-2024. [Consulta: 1r juny 2024].
  2. 2,0 2,1 «New AI-powered ‘instant’ music-making app Udio raises $10m; launches with backing from will.i.am, Common, UnitedMasters, a16z» (en anglès). Music Business Worldwide, 10-04-2024. [Consulta: 15 maig 2024].
  3. 3,0 3,1 3,2 Hiatt, Brian. «AI-Music Arms Race: Meet Udio, the Other ChatGPT for Music» (en anglès). Rolling Stone, 10-04-2024. [Consulta: 15 abril 2024].
  4. 4,0 4,1 Morrison, Ryan. «Meet Udio — the most realistic AI music creation tool I've ever tried» (en anglès). Tom's Guide, 10-04-2024. [Consulta: 15 abril 2024].
  5. 5,0 5,1 Ortiz, Sabrina. «Is Udio really the best AI music generator yet? I put it to the test and so can you» (en anglès). ZDNet.com, 10-04-2024. [Consulta: 15 abril 2024].
  6. 6,0 6,1 6,2 6,3 Hachman, Mark. «Udio's AI music is my new obsession» (en anglès). PC World, 11-04-2024. [Consulta: 15 abril 2024].
  7. 7,0 7,1 7,2 Nuñez, Michael. «Former Google DeepMind researchers launch AI-powered music creation app Udio» (en anglès). VentureBeat.ai, 11-04-2024. [Consulta: 15 abril 2024].
  8. Lawrence, Andrew. «‘I bet Drake heard it and laughed’: BBL Drizzy is the real winner of the Drake-Kendrick feud» (en anglès). The Guardian, 09-05-2024. [Consulta: 12 maig 2024].
  9. 9,0 9,1 9,2 Edwards, Benj. «New AI music generator Udio synthesizes realistic music on demand» (en anglès). Ars Technica, 10-04-2024. [Consulta: 15 abril 2024].
  10. 10,0 10,1 10,2 Eede, Christian. «"Game-changing" new app generates music from text prompts» (en anglès). DJ Mag, 12-04-2024. [Consulta: 15 abril 2024].
  11. Bastian, Matthias. «AI music app Udio rolls out new features and subscription plan» (en anglès). the decoder, 10-05-2024. [Consulta: 30 maig 2024].
  12. «How do I make music with Udio?» (en anglès). Udio, 08-05-2024. [Consulta: 24 maig 2024].
  13. Morrison, Ryan. «Udio is a game changer for AI music — 9 best prompts to try now» (en anglès). Tom's Guide, 11-04-2024. [Consulta: 15 abril 2024].
  14. Ropek, Lucas. «Dune, the Broadway Musical and 8 Other Brain-Dead Songs From Udio’s AI Music Generator» (en anglès). Gizmodo, 11-04-2024. [Consulta: 15 abril 2024].
  15. «Introducing Stable Audio 2.0» (en anglès). Stability AI, 03-04-2024. [Consulta: 1r juny 2024].
  16. Sato, Mia. «Major record labels sue AI company behind ‘BBL Drizzy’» (en anglès). The Verge, 24-06-2024. [Consulta: 24 juny 2024].
  17. Robinson, Kristin. «Major Labels Sue AI Firms Suno and Udio for Alleged Copyright Infringement» (en anglès). Billboard, 24-06-2024. [Consulta: 24 juny 2024].

Enllaços externs

modifica
  • Udio - Lloc web oficial (anglès)