Corba d'aprenentatge (aprenentatge automàtic)

representa el valor òptim de la funció de pèrdua.

En l'aprenentatge automàtic, una corba d'aprenentatge (o corba d'entrenament) representa el valor òptim de la funció de pèrdua d'un model per a un conjunt d'entrenament amb aquesta funció de pèrdua avaluada en un conjunt de dades de validació amb els mateixos paràmetres que va produir la funció òptima.[1] És una eina per esbrinar quant es beneficia un model de màquina afegint més dades d'entrenament i si l'estimador pateix més un error de variància o un error de biaix. Si tant la puntuació de validació com la puntuació d'entrenament convergeixen a un valor que és massa baix amb l'augment de la mida del conjunt d'entrenament, no es beneficiarà gaire de més dades d'entrenament.[2]

Corba d'aprenentatge que mostra la puntuació d'entrenament i la puntuació de validació creuada.

La corba d'aprenentatge automàtic és útil per a molts propòsits, com ara comparar diferents algorismes,[3] triar els paràmetres del model durant el disseny,[4] ajustar l'optimització per millorar la convergència i determinar la quantitat de dades utilitzades per a l'entrenament.[5]

En el domini de l'aprenentatge automàtic, hi ha dues implicacions de les corbes d'aprenentatge que difereixen en l'eix x de les corbes, amb l'experiència del model representada gràficament com el nombre d'exemples d'entrenament utilitzats per a l'aprenentatge o el nombre d'iteracions utilitzades en l'entrenament del model.[6]

Definició modifica

Un model d'aprenentatge automàtic està produint una funció, f(x), que donada una mica d'informació, x, prediu alguna variable, y, a partir de les dades d'entrenament   i  . És diferent de l'optimització matemàtica perquè   hauria de predir bé per   fora de  .

Sovint limitem les funcions possibles a una família de funcions parametritzada,  , perquè la nostra funció sigui més generalitzable [7] o perquè la funció tingui certes propietats com les que fan trobar un bé   més fàcil, o perquè tenim alguna raó a priori per pensar que aquestes propietats són certes.[7] :172

Atès que no és possible produir una funció que encaixi perfectament les dades, llavors és necessari produir una funció de pèrdua   per mesurar com de bona és la nostra predicció. Aleshores definim un procés d'optimització que troba a   que minimitza   denominat  .

Referències modifica

  1. «Mohr, Felix and van Rijn, Jan N. "Learning Curves for Decision Making in Supervised Machine Learning - A Survey." arXiv preprint arXiv:2201.12150 (2022).». .
  2. scikit-learn developers. «Validation curves: plotting scores to evaluate models — scikit-learn 0.20.2 documentation» (en anglès). [Consulta: 15 febrer 2019].
  3. Madhavan, P.G. «A New Recurrent Neural Network Learning Algorithm for Time Series Prediction» (en anglès). Journal of Intelligent Systems, 1997.
  4. «Machine Learning 102: Practical Advice» (en anglès). Tutorial: Machine Learning for Astronomy with Scikit-learn. Arxivat de l'original el 2012-07-30. [Consulta: 25 febrer 2023].
  5. Meek, Christopher; Thiesson, Bo; Heckerman, David Journal of Machine Learning Research, 2, 3, Summer 2002, pàg. 397.
  6. Sammut, Claude. Encyclopedia of Machine Learning (en anglès). 1st. Springer, 28 març 2011, p. 578. ISBN 978-0-387-30768-8. 
  7. 7,0 7,1 Goodfellow, Ian. Deep Learning (en anglès). MIT Press, 2016-11-18, p. 108. ISBN 978-0-262-03561-3.