Clusterització de dades: diferència entre les revisions
Contingut suprimit Contingut afegit
m Robot insereix {{ORDENA:Clusteritzacio De Dades}} |
m Robot: Canvis cosmètics |
||
Línia 1:
La '''clusterització de dades''' és una tècnica molt comuna en l'[[estadística|anàlisi estadístic]] de dades. Bàsicament és la [[classificació]] d'objectes similars en diferents grups, o més precisament, la partició de les dades en diferents subconjunts (o [[clúster
A grans trets, podem dividir els [[algorisme
En els primers, es generen clústers successius a partir de clústers ja establerts prèviament. Aquests poden ser aglomeratius si cada element es considera un clúster diferent i posteriorment van agrupant-se. O bé divisoris, si a partir del conjunt sencer es procedeix a dividir-lo en subconjunts més petits.
Línia 8:
Per altra banda, cal destacar les tècniques de cerca per densitat i de 'clumping'.
En les primeres, les entitats es consideren com a punts en un espai mètric i normalment es prima la incorporació de nous elements en clústers ja existents abans que crear-ne'n de nous.
Les segones es caracteritzen per permetre l'existència de clústers que no siguin [[disjunt
== Referències ==
Línia 16:
{{ORDENA:Clusteritzacio De Dades}} <!--ORDENA generat per bot-->
[[Categoria:Estadística]]
|