Algorisme k-means

(S'ha redirigit des de: K-means)

L'algorisme K-means és un mètode de quantificació vectorial que té com a objectiu la partició d'un conjunt n observacions en k grups en el qual cada observació pertany al grup més proper a la mitjana. És un mètode utilitzat en mineria de dades.[2]

[1]exemple de k-means++

Descripció

modifica

Donat un conjunt d'observacions (x1, x₂, …, xn), on cada observació és un vector real de d dimensions, k-means construeix una partició de les observacions en k conjunts (kn) S = {S1, S₂, …, Sk}. A fi de minimitzar la suma dels quadrats a dins de cada grup (WCSS):

 

on µi és la mitjana de punts en Si.

Aplicacions

modifica

L'algorisme k-means és fàcil d'aplicar fins i tot en grans grups de dades. S'utilitza sovint abans d'aplicar altres algorismes per donar un punt de partida al programa (preprocessing).

Clusterització de dades

modifica

Un dels seus usos és la clusterització de dades,[1] fonamental en l'aprenentatge automàtic. Consisteix a agrupar punts de dades segons la seva similitud. Aquest us serveix, per exemple, per la segmentació de mercat, on els clients són agrupats segons característiques o comportaments similars.

Quantificació vectorial

modifica

L'algorisme k-means s'utilitza per quantificar colors dins dels grups k. Amb això es pot, per exemple, agrupar els colors d'una imatge digital per “simplificar-la” i així evitar perdre qualitat quan es comprimeix.[2]

Referències

modifica
  1. «A demo of K-Means clustering on the handwritten digits data» (en anglès). [Consulta: 21 octubre 2024].
  2. «Color Quantization using K-Means» (en anglès). [Consulta: 21 octubre 2024].