MapReduce: diferència entre les revisions

Contingut suprimit Contingut afegit
Cap resum de modificació
Línia 129:
 
== Usos ==
Per norma general, s'utilitza MapReduce en aquells problemes de [[Computació concurrent]] entre els quals es troben involucrats grans datasets que han de ser processats per una gran quantitat de computadores (nodes), als que ens referim de forma col·lectiva com a [[Clúster|clústers]] (sempre que tots els nodes es trobin a la mateixa xarxa d'àrea local i utilitzin el mateix hardware), o a [[Graella de càlcul|graelles de càlcul]] (si els nodes es comporten de forma distribuïda al llarg de zones geogràfiques o administratives extenses, i que generalment posseeixen un hardware més heterogeni). El processament paral·lel es pot donar tant amb l'ús de dades emmagatzemades tant en [[Sistema de fitxers|sistemes de fitxers]] (no estructurats) o en una [[Base de dades|database]] (estructurats)<ref name="FG">Jeffrey Dean, Sanjay Ghemawat, (2008), ''MapReduce: simplified data processing on large clusters'', Communications of the ACM - 50th anniversary issue: 1958 - 2008, Volume 51 Issue 1, January 2008
Pages 107-113 </ref>. Per aquesta raó s'usa en aplicacions que posseeixen dades a gran escala, tals com les aplicacions paral·leles, la [[indexació web]], [[Mineria de dades|data mining]] i la simulació científica.
 
== Referències ==