Aprenentatge automàtic: diferència entre les revisions

Contingut suprimit Contingut afegit
→‎Vegeu també: selecció de VT #QQ16
mCap resum de modificació
Línia 1:
L''''Aprenentatge automàtic''' és un camp de la [[intel·ligència artificial]] que està dedicat al disseny, l'anàlisi i el desenvolupament d'[[algorismes]] i tècniques que permeten que les màquines evolucionin. Es tracta de crear programes capaços de generalitzar comportaments a partir del [[reconeixement de patrons]] o classificació. L'aprenentatge automàtic està relacionat amb el camp de l'[[estadística]], però també coincideix amb els mètodes de construcció de models, o l'aprenentatge estadístic. També hi ha punts de contacte amb la informàtica teòrica. Això és degut a la [[complexitat computacional]] dels problemes.
L'aprenentatge automàtic està relacionat amb el camp de l'[[estadística]] però també té solapament amb els mètodes de construcció de models, o l'aprenentatge estadístic. També hi ha punts de contacte amb la informàtica teòrica. Això és degut a la [[complexitat computacional]] dels problemes.
 
Alguns camps on s'ha aplicat aquest tipus d'aprenentatge són les aplicacions dedicades al processament del llenguatge natural, als algorismes de cerca, la diagnosi mèdica, la bioinformàtica, la detecció de fraus i la [[classificació]].
Linha 12 ⟶ 11:
 
Durant molts anys la investigació sobre l'aprenentatge automàtic s'ha realitzat en diferents graus d'intensitat, tot utilitzant diferents tècniques i enfocant diferents aspectes i objectius. Es pot parlar de tres etapes importants, on cada una d'elles està centrada en un paradigma específic:
* Tècniques de modelatmodelatge neuronal i de decisió
* Aprenentatge orientat a conceptes simbòlics
* Sistemes d'aprenentatge de coneixements amb exploració de diferents tasques d'aprenentatge.
 
La característica distintiva del primer paradigma esmentat anteriorment, va ser l'interès de construir sistemes d'aprenentatge que tinguessin com a punt de partida poc o cap coneixement inicial. L'objectiu va ser crear una gran varietat de màquines basades en models neuronals. Aquests sistemes es van anomenar [[xarxes neuronals]] o Sistemes Auto-organitzatius. Per cauda de la poca tecnologia computacional dels primers anys, la majoria de les investigacions en aquesta àrea van ser de caràcter teòric o relatives a la construcció específica de sistemes ''hardware'' amb propòsits específics, com per exemple Perceptrones (Rosenblatt, 1958), Panemonium (Selfridge, 1959) i Adelaina (Widrow, 1962). Aquests treballs van ser fets a la dècada dels anys quaranta per Rashvesky i els seus seguidors de l’àrea de biofísica. Un altre tipus de recerca relacionada amb aquesta àrea, és la que té a veure amb la simulació de processos evolutius, que a través d’operacions aleatòries de mutació i de selecció natural, poden crear un sistema capaç de realitzar un comportament intel·ligent (Friedberg, 1958 i Holland,1980).
Degut a la poca tecnologia computacional dels primers anys, la majoria de les investigacions en aquesta àrea van ser de caràcter teòric o relatives a la construcció específica de sistemes hardware amb propòsits específics, com per exemple Perceptrones (Rosenblatt, 1958), Panemonium (Selfridge, 1959) i Adelaina (Widrow, 1962). Aquests treballs van ser fets a la dècada dels anys quaranta per Rashvesky i els seus seguidors de l’àrea de biofísica. Un altre tipus d’investigació relacionada amb aquesta àrea, és la que té a veure amb la simulació de processos evolutius, que a través d’operacions aleatòries de mutació i de selecció natural, poden crear un sistema capaç de realitzar un comportament intel·ligent (Friedberg, 1958 i Holland,1980).
 
L’experiència adquirida en aquestes àrees, va donar pas a una nova disciplina de [[Reconeixement de patrons]] que va ajudar a desenvolupar sistemes de decisió en aprenentatge automàtic. Un dels sistemes més exitosos i coneguts va ser el programa de joc de dames de Samuel (1963).
Linha 23 ⟶ 21:
Com a investigació paral·lela al modelat de [[xarxes neuronals]] i sistemes de decisió, es van realitzar altres investigacions relacionades amb la teoria del control, ja que els resultats pràctics d’aquestes investigacions sobre [[xarxes neuronals]] i sistemes de decisió es van trobar amb diverses limitacions. Les altes expectatives esperades no es van complir i la investigació en aquesta àrea va començar a disminuir.
 
A partir d’aquí, un nou paradigma va començar a sorgir a la dècada dels sesantaseixanta gràcies a treballs de psicòlegs i investigadors de la intel·ligència artificial sobre el modelatmodelatge de l’aprenentatge humà. Aquest paradigma, utilitzava estructures lògiques en comptes de numèrics i estadístics. Els sistemes aprenien descripcions simbòliques que representaven millor els coneixements adquirits. En aquesta àrea, cal destacar el treball de Winston sobre l’aprenentatge estructural així com diversos treballs dedicats a programes d’aprenentatge basats en lògica inductiva. El tercer i últim paradigma representa un període més actual, començant doncs, a mitjans dels anys setanta. Les investigacions han estat orientades a l’aprenentatge de conceptes a partir d’exemples, utilitzant una gran varietat de tècniques.
El tercer i últim paradigma representa un període més actual, començant doncs, a mitjans dels anys setanta. Les investigacions han estat orientades a l’aprenentatge de conceptes a partir d’exemples, utilitzant una gran varietat de tècniques.
 
 
Linha 36 ⟶ 33:
* [[Aprenentatge no supervisat]] — L'algorisme disposa d'un conjunt d'exemples, però no de la classe que els hi correspon. Això és, que els exemples no estan etiquetats com passa en el cas anterior. En aquest cas, l'algorisme ha de ser capaç de trobar patrons similars per tal de poder etiquetar. Els algorismes de [[categorització]] (en anglès, ''clustering'') són un exemple d'aquests tipus d'aprenentatge.
 
* [[Aprenentatge semi-supervisat|Aprenentatge semisupervisat]] — Aquest algorisme combina els dos tipus d'algorismes anteriors per tal de generar una funció o classificador adequats. S'utilitza una combinació de les dades marcades i de les no marcades com a conjunt d'entrenament.
 
* [[Aprenentatge per reforçament]] — Un cop realitzada l'acció que pren el sistema s'obté un retorn per part de l'entorn (una gratificació o una penalització segons si l'acció ha estat reeixida o no). És a dir, la informació d'entrada és el resultat que obté de l'exterior com a resposta a les seves accions. s'aprèn mitjançant prova-error i degut això, es requereix un elevat nombre de repeticions.
Linha 57 ⟶ 54:
* [[Motors de cerca]]
* Diagnòstics mèdics
* Detecció de frau en lúsl'ús de targetes de crèdit
* Anàlisi del mercat de valors
* Classificació de seqüències d'[[ADN]]