Algorisme k-means
Aquest article o secció no cita les fonts o necessita més referències per a la seva verificabilitat. |
L'algorisme K-means és un mètode de quantificació vectorial que té com a objectiu la partició d'un conjunt n observacions en k grups en el qual cada observació pertany al grup més proper a la mitjana. És un mètode utilitzat en mineria de dades.[2]

Descripció
modificaDonat un conjunt d'observacions (x1, x₂, …, xn), on cada observació és un vector real de d dimensions, k-means construeix una partició de les observacions en k conjunts (k ≤ n) S = {S1, S₂, …, Sk}. A fi de minimitzar la suma dels quadrats a dins de cada grup (WCSS):
on µi és la mitjana de punts en Si.
Aplicacions
modificaL'algorisme k-means és fàcil d'aplicar fins i tot en grans grups de dades. S'utilitza sovint abans d'aplicar altres algorismes per donar un punt de partida al programa (preprocessing).
Clusterització de dades
modificaUn dels seus usos és la clusterització de dades,[1] fonamental en l'aprenentatge automàtic. Consisteix a agrupar punts de dades segons la seva similitud. Aquest us serveix, per exemple, per la segmentació de mercat, on els clients són agrupats segons característiques o comportaments similars.
Quantificació vectorial
modificaL'algorisme k-means s'utilitza per quantificar colors dins dels grups k. Amb això es pot, per exemple, agrupar els colors d'una imatge digital per “simplificar-la” i així evitar perdre qualitat quan es comprimeix.[2]
Referències
modifica- ↑ «A demo of K-Means clustering on the handwritten digits data» (en anglès). [Consulta: 21 octubre 2024].
- ↑ «Color Quantization using K-Means» (en anglès). [Consulta: 21 octubre 2024].