Clusterització de dades: diferència entre les revisions

Contingut suprimit Contingut afegit
m Robot insereix {{ORDENA:Clusteritzacio De Dades}}
m Robot: Canvis cosmètics
Línia 1:
La '''clusterització de dades''' és una tècnica molt comuna en l'[[estadística|anàlisi estadístic]] de dades. Bàsicament és la [[classificació]] d'objectes similars en diferents grups, o més precisament, la partició de les dades en diferents subconjunts (o [[clúster | clústers]]s). Així doncs, les dades de cada subgrup idealment comparteixen un tret comú.
 
A grans trets, podem dividir els [[algorisme | algorismes]]s en jeràrquics o particionals.
 
En els primers, es generen clústers successius a partir de clústers ja establerts prèviament. Aquests poden ser aglomeratius si cada element es considera un clúster diferent i posteriorment van agrupant-se. O bé divisoris, si a partir del conjunt sencer es procedeix a dividir-lo en subconjunts més petits.
Línia 8:
Per altra banda, cal destacar les tècniques de cerca per densitat i de 'clumping'.
En les primeres, les entitats es consideren com a punts en un espai mètric i normalment es prima la incorporació de nous elements en clústers ja existents abans que crear-ne'n de nous.
Les segones es caracteritzen per permetre l'existència de clústers que no siguin [[disjunt | disjunts]]s, això és, que els elements puguin incloure's en diferents subgrups simultàniament.
 
== Referències ==
Línia 16:
 
{{ORDENA:Clusteritzacio De Dades}} <!--ORDENA generat per bot-->
 
[[Categoria:Estadística]]