L'algorisme C4.5 en l'àmbit de la intel·ligència artificial, és un algorisme inventat per Ross Quinlan com a extensió del seu algorisme ID3. S'empra per a generar un arbre de decisió a partir d'un conjunt de dades. Aquests arbres de decisió generats per C4.5 poden ser utilitzats per a classificació, i per aquest motiu, C4.5 es coneic com un classificador estadístic. C4.5 també s'utilitza en l'aprenentatge automàtic i el processament de llenguatge natural.[1][2]

Fig.1 Exemple d'arbre de decisió generat amb l'algorisme C4.5

Propietats modifica

C4.5 construeix arbres de decisió des d'un conjunt de dades d'entrenament de la mateixa forma en què ho fa ID3, emprant el concepte d'entropia d'informació. Les dades d'entrenament  són un grupo d'exemples ja classificats. Cada exemple   és un vector on   representen els atributs o característiques de l'exemple. Les dades d'entrenament són augmentades amb un vector  on   representen la classe a la qual pertany cada mostra.

En cada node de l'arbre, C4.5 escull un atribut de les dades que divideixen més eficaçment el conjunt de mostres en subconjunts enriquits en una classe o altra. El criteri és el normaltizat per a guany d'información (diferència d'entropia) que resulta de l'elecció d'un atribut per a dividir les dades. L'atribut amb el major guany d'informació normalitzada s'escull com a paràmetre de decisió. L'algorisme C4.5 divideix recursivament en subllistes més petites.[3]

Referències modifica

  1. «A comparative study of decision tree ID3 and C4.5» (en anglès). http://saiconference.com.+[Consulta: 7 novembre 2018].
  2. «Book Review: C4.5:by J. Ross Quinlan.Inc., 1993.Programs for Machine Learning Morgan Kaufmann Publishers,» (en anglès). Kaufmann Publishers. [Consulta: 7 novembre 2018].
  3. «Lecture6 - C4.5» (en anglès). https://www.slideshare.net.+[Consulta: 7 novembre 2018].