Aprenentatge automàtic: diferència entre les revisions
Contingut suprimit Contingut afegit
m Tipografia |
Etiqueta: Revertida |
||
Línia 34:
* [[Aprenentatge per reforç]] — Un cop realitzada l'acció que pren el sistema s'obté un retorn per part de l'entorn (una gratificació o una penalització segons si l'acció ha estat reeixida o no). És a dir, la informació d'entrada és el resultat que obté de l'exterior com a resposta a les seves accions. s'aprèn mitjançant prova-error i degut això, es requereix un elevat nombre de repeticions.
'ย'''
== Aplicacions ==
|