ChatGPT

prototip de bot conversacional d'IA centrat en la usabilitat i el diàleg

ChatGPT[1] (acrònim del nom anglès Chat Generative Pre-trained Transformer, Transformador generatiu preensinistrat per a converses) és un prototip de bot conversacional d'intel·ligència artificial centrat en la usabilitat i el diàleg. Desenvolupat per OpenAI, el xatbot utilitza un model de llenguatge entrenat mitjançant l'aprenentatge per reforç i basat en l'arquitectura GPT-3.

ChatGPT
Modifica el valor a Wikidata
Modifica el valor a Wikidata
Tipusmodel de llenguatge, bot conversacional, prototip, intel·ligència artificial i programari de propietat Modifica el valor a Wikidata
Versió inicial30 novembre 2022 Modifica el valor a Wikidata
Versió estable
ChatGPT Mar 14 Version (14 març 2023) Modifica el valor a Wikidata
Llicènciallicència de propietat
llicència de propietat Modifica el valor a Wikidata
Epònimxat i GPT Modifica el valor a Wikidata
Característiques tècniques
Plataformanavegador web Modifica el valor a Wikidata
Equip
Creador/sOpenAI Modifica el valor a Wikidata
Desenvolupador(s)OpenAI Modifica el valor a Wikidata
Més informació
Lloc webchat.openai.com… (anglès) Modifica el valor a Wikidata
Id. SubredditChatGPT Modifica el valor a Wikidata

Presentat el novembre de 2022, ChatGPT va cridar l'atenció per la seva facilitat d'ús i s'ha destacat per les seves respostes detallades i el seu coneixement històric. El format de diàleg permet que ChatGPT respongui preguntes de seguiment, admeti els seus errors, desafiï premisses incorrectes i rebutgi sol·licituds inadequades.[2] El xatbot és capaç de generar tota classe de texts, des de poesia fins a diàlegs. Tanmateix, tot i l'ampli ventall d'indicacions a les quals és capaç de reaccionar, la seva precisió factual imperfecta ha rebut algunes crítiques.

ChatGPT es va entrenar mitjançant l'aprenentatge per reforç a partir de la retroalimentació humana, un mètode que augmenta l'aprenentatge automàtic amb intervenció humana per aconseguir un resultat realista.[3] Es basa en l'arquitectura GPT-3.[4] Durant el procés de formació, els entrenadors humans van fer el paper d'usuari i d'assistent d'intel·ligència artificial. Els models es van formar a la infraestructura de supercomputació de Microsoft Azure i es van ajustar mitjançant algorismes d'optimització de polítiques proximals.[5] Els algorismes d'optimització de polítiques proximals presenten un benefici rendible per confiar en els algorismes d'optimització de polítiques regionals i neguen moltes de les operacions computacionalment costoses amb un rendiment més ràpid.[6][7]

En comparació amb el seu predecessor InstructGPT, ChatGPT intenta reduir les respostes nocives i enganyoses. Les dades d'entrenament de ChatGPT inclouen pàgines man i coneixements sobre fenòmens d'internet i llenguatges de programació, com ara sistemes de tauler d'anuncis i el llenguatge de programació Python.[8]

A diferència de la majoria de xatbots, ChatGPT té estat, recordant les converses anteriors i les indicacions que ha rebut, la qual cosa pot permetre que ChatGPT s'utilitzi com a terapeuta personalitzat.[9] En un esforç per evitar que es presentin i es produeixin sortides ofensives a ChatGPT, les consultes es filtren mitjançant una interfície de programació d'aplicacions de moderació i es descarten les indicacions potencialment racistes o sexistes.[10][9]

ChatGPT pateix múltiples limitacions. El model de recompensa de ChatGPT, dissenyat al voltant de la supervisió humana, es pot sobreoptimitzar i, per tant, dificultar-ne el rendiment, també conegut com a llei de Goodhart.[11] Durant la formació, els revisors preferien respostes més llargues, independentment de la comprensió real o del contingut real.[12] Les dades d'entrenament també poden patir un biaix algorítmic i les indicacions que inclouen descriptors vagues de persones, com ara els CEO, podrien generar una resposta que suposa que aquesta persona és un home blanc.[13]

LimitacionsModifica

Malgrat la seva capacitat d'enteniment i velocitat per a la resposta de preguntes i la generació de textos, el xatbot té certes limitacions i el seu programari pot tenir problemes per a processar la informació donada si aquesta és massa complexa. D'altra banda, tampoc no és capaç de tractar conceptes o esdeveniments massa recents amb total precisió i detall. A més, el ChatGPT està dissenyat per a no admetre preguntes inadequades ni peticions perilloses.[14]

Preocupacions ètiquesModifica

La relació entre la intel·ligència artificial i l'ètica és un tema que està a l'ordre del dia i que produeix certes inquietuds. Les empreses tecnològiques que posen a disposició pública programes com aquest són conscients de certs límits que no es poden creuar.

En el cas de ChatGPT, el sistema pot recollir biaixos i opinions generals d'internet de manera que a vegades, en funció de la petició de l'usuari, crearà acudits o es guiarà per estereotips sobre determinats personatges. De la mateixa manera, també té accés a notícies falses i teories de conspiració que poden interferir en què les dades proporcionades pel xatbot no siguin del tot verídiques. Una de les altres restriccions programades per OpenAI són les advertències a preguntes concretes: si se li pregunta com assetjar algú respondrà que l'assetjament és dolent, així com ho farà si se li demana informació sobre la manipulació de persones o la construcció d'armes perilloses.[15]

També ha generat certa controvèrsia i debat en l'àmbit de l'educació, ja que pot elaborar treballs escrits coherents que no reconeixen els detectors de plagi.[16]

ReferènciesModifica

  1. «ChatGPT». ésAdir. [Consulta: 21 gener 2023].
  2. «ChatGPT: Optimizing Language Models for Dialogue» (en anglès). OpenAI, 30-11-2022. [Consulta: 13 desembre 2022].
  3. Knox, W. Bradley. "Augmenting Reinforcement Learning with Human Feedback".  
  4. Ahmed, Zohaib. «What is ChatGPT, the AI chatbot that everyone is talking about» (en anglès). The Indian Express, 02-12-2022. [Consulta: 5 desembre 2022].
  5. OpenAI. «ChatGPT: Optimizing Language Models for Dialogue» (en anglès), 30-11-2022. [Consulta: 5 desembre 2022].
  6. Schulman, John. Proximal Policy Optimization Algorithms. 
  7. van Heeswijk, Wouter. «Proximal Policy Optimization (PPO) Explained» (en anglès). Towards Data Science, 29-11-2022. [Consulta: 5 desembre 2022].
  8. Edwards, Benj. «No Linux? No problem. Just get AI to hallucinate it for you» (en anglès). Ars Technica, 05-12-2022. [Consulta: 5 desembre 2022].
  9. 9,0 9,1 Roose, Kevin. «The Brilliance and Weirdness of ChatGPT» (en anglès). The New York Times, 05-12-2022. [Consulta: 5 desembre 2022].
  10. OpenAI. «ChatGPT: Optimizing Language Models for Dialogue» (en anglès), 30-11-2022. [Consulta: 5 desembre 2022].
  11. Scaling Laws for Reward Model Overoptimization. 
  12. OpenAI. «ChatGPT: Optimizing Language Models for Dialogue» (en anglès), 30-11-2022. [Consulta: 5 desembre 2022].
  13. Murphy Kelly, Samantha. «This AI chatbot is dominating social media with its frighteningly good essays» (en anglès). CNN, 05-12-2022. [Consulta: 5 desembre 2022].
  14. «ChatGPT: Everything you need to know about OpenAI's GPT-3 tool» (en anglès). BBC Science Focus Magazine, 08-12-2022. [Consulta: 13 desembre 2022].
  15. «ChatGPT: Everything you need to know about OpenAI's GPT-3 tool» (en anglès). BBC Science Focus Magazine, 08-12-2022. [Consulta: 13 desembre 2022].
  16. Silva, Diana. «La irrupció de la intel·ligència artificial obliga les universitats catalanes a repensar la docència». Diari Ara, 17-01-2023. [Consulta: 20 gener 2023].

Enllaços externsModifica