MapReduce: diferència entre les revisions

Contingut suprimit Contingut afegit
mCap resum de modificació
Afegit un enllaç intrawiki
Línia 1:
'''MapReduce''' és un [[Paradigma de programació|model de programació]] i d'implementació per a processar i generar jocs de dades grans, amb un [[algorisme]] paral·lel i distribuït, en un [[clúster]].<ref>[http://news.cnet.com/8301-10784_3-9955184-7.html Google spotlights data center inner workings | Tech news blog - CNET News.com<!-- Bot generated title -->]</ref><ref>[http://static.googleusercontent.com/media/research.google.com/es/us/archive/mapreduce-osdi04.pdf MapReduce: Simplified Data Processing on Large Clusters]</ref>
 
Un programa MapReduce es composa d'un [[Subrutina | procediment]] '''[[Map()]]''' que efectua el filtrat i ordenat (per exemple ordenar estudiants pel primer cognom en cues, amb una cua per cognom) i un[[subrutina | procediment]] '''[[Reduce()]]''', que fa l'operació d'agregació (com, per exemple, comptar el nombre d'estudiants a cada cua, obtenint-ne la freqüència dels cognoms). El "Sistema MapReduce" (també conegut com a ''infraestructura'' o ''framework'') orquestra el procés fent [[marshalling]] dels servidors distribuïts, executant diverses tasques en paral·lel, gestionant les comunicacions de transferència de dades entre les diverses parts del sistema i proporcionant [[redundància]] i [[tolerància a errors]].