GPT-4o (GPT-4 Omni) és un transformador generatiu pre-entrenat multilingüe i multimodal dissenyat per OpenAI. Va ser anunciat per la directora de tecnologia d'OpenAI, Mira Murati, durant una demostració en directe el 13 de maig de 2024 i es va publicar el mateix dia.[1] GPT-4o és gratuït, però amb un límit d'ús 5 vegades superior per als subscriptors de ChatGPT Plus.[2] Pot processar i generar text, imatges i àudio.[3] La seva API és el doble de ràpida i té la meitat del preu del seu predecessor, GPT-4 Turbo.[1]

GPT-4o

Tipustransformadors generatius pre-entrenats, model d'intel·ligència artificial i model de fundació Modifica el valor a Wikidata
Versió inicial13 maig 2024 Modifica el valor a Wikidata
Llicènciallicència de propietat Modifica el valor a Wikidata
Disponible en
EpònimGPT-4 Modifica el valor a Wikidata
Part deOpenAI API Modifica el valor a Wikidata
Característiques tècniques
Dispositiu d'entradamicròfon, càmera digital i teclat d'ordinador Modifica el valor a Wikidata
Equip
Desenvolupador(s)OpenAI Modifica el valor a Wikidata
EditorOpenAI Modifica el valor a Wikidata
Més informació
Lloc webopenai.com… (anglès) Modifica el valor a Wikidata


GPT-4 Modifica el valor a Wikidata

Antecedents

modifica

Originalment, diverses versions de GPT-4o es van llançar en secret amb diferents noms al bot de conversa Arena de la Large Model Systems Organization (LMSYS) com a 3 models diferents. Aquests 3 models es van anomenar gpt2-chatbot, im-a-good-gpt2-chatbot i im-also-a-good-gpt2-chatbot.[4] El 7 de maig de 2024, Sam Altman va tuitar "im-a-good-gpt2-chatbot", que s'interpretava habitualment com una confirmació que es tractava de nous models OpenAI que s'estaven provant.[5][6]

Capacitats

modifica

GPT-4o va aconseguir resultats d'última generació en trets de veu, multilingüisme i visió, establint nous rècords en reconeixement de veu i traducció d'àudio.[7][8] GPT-4o va obtenir un 88,7 en la comparativa Massive Multitask Language Understanding (MMLU) en comparació amb el 86,5 de GPT-4.[9] A diferència de GPT-3.5 i GPT-4, que depenen d'altres models per processar el so, GPT-4o admet de manera nativa el veu a veu, fent que la resposta sigui gairebé instantània i perfecta.[9] Sam Altman va assenyalar el 15 de maig de 2024 que les capacitats de veu a veu del GPT-4o encara no estaven integrades a ChatGPT i que encara s'estava utilitzant la versió antiga.[10]

El model admet més de 50 idiomes,[1] que OpenAI afirma que cobreixen més del 97% dels parlants.[11] Mira Murati va demostrar la capacitat multilingüe del model parlant italià amb el model i fent-lo traduir entre l'anglès i l'italià durant l'esdeveniment de demostració d'OpenAI en directe el 13 de maig de 2024. A més, el nou tokenitzador utilitza menys fitxes per a determinats idiomes, especialment idiomes que no es basen en l'alfabet llatí, el que fa que sigui més barat per a aquests idiomes.[9]

GPT-4o incorpora coneixements fins a l'octubre de 2023[12][13] i té una longitud de context de 128.000 fitxes [12] amb un límit de testimonis de sortida de 2.048.[13]

A partir del maig de 2024, és el model líder en el sistema de puntuació Elo Arena de LMSYS de la Universitat de Califòrnia, Berkeley.[14]

Vegeu també

modifica

Referències

modifica
  1. 1,0 1,1 1,2 Wiggers, Kyle. «OpenAI debuts GPT-4o 'omni' model now powering ChatGPT» (en anglès). Tech Crunch, 13-05-2024. [Consulta: 13 maig 2024].
  2. Field, Hayden. «OpenAI launches new AI model GPT-4o and desktop version of ChatGPT» (en anglès). CNBC, 13-05-2024. [Consulta: 14 maig 2024].
  3. Colburn, Thomas. «OpenAI unveils GPT -4o, a fresh multimodal AI flagship model» (en anglès). The Register, 13-05-2024. [Consulta: 18 maig 2024].
  4. Edwards, Benj. «Before launching, GPT-4o broke records on chatbot leaderboard under a secret name» (en anglès). Ars Technica, 13-05-2024. [Consulta: 17 maig 2024].
  5. Sam, Altman (2024-05-07). "https://twitter.com/sama/status/1787222050589028528" Twitter, X. Retrieved 14 May 2024.
  6. Zeff, Maxwell. «Powerful New Chatbot Mysteriously Returns in the Middle of the Night» (en anglès). Gizmodo, 07-05-2024. [Consulta: 17 maig 2024].
  7. van Rijmenam, Mark. «OpenAI Launched GPT-4o: The Future of AI Interactions Is Here» (en anglès). The Digital Speaker, 13-05-2024. [Consulta: 17 maig 2024].
  8. Daws, Ryan. «GPT-4o delivers human-like AI interaction with text, audio, and vision integration» (en anglès). AI News, 14-05-2024. [Consulta: 18 maig 2024].
  9. 9,0 9,1 9,2 «Hello GPT-4o» (en anglès). OpenAI. [Consulta: 16 juny 2023].
  10. «OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman». , 16-05-2024.
  11. Edwards, Benj. «Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot» (en anglès). Ars Technica, 13-05-2024. [Consulta: 17 maig 2024].
  12. 12,0 12,1 «Models - OpenAI API» (en anglès). OpenAI. [Consulta: 17 maig 2024].
  13. 13,0 13,1 Conway, Adam. «What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free» (en anglès). XDA Developers, 13-05-2024. [Consulta: 17 maig 2024].
  14. Franzen, Carl. «OpenAI announces new free model GPT-4o and ChatGPT for desktop» (en anglès). VentureBeat, 13-05-2024. [Consulta: 18 maig 2024].