Hadoop és el nom d’un elefant de joguina de color groc d’un nen, el pare del qual va crear un dels projectes de codi obert que mouen més volum de dades en aquest moment. Hadoop és l’estructura de programari de codi obert que emmagatzema dades de forma massiva, amb un enorme poder de processament i que permet operar amb tasques concurrents.
Què és Hadoop?
Hadoop prové d’un cercador creat entre les dècades dels noranta i dos mil, de codi obert anomenat Nutch. Creat per Doug Cutting (el pare del nen amb l’elefant groc) i Mike Cafarella. És un cercador contemporani de Google. L’any 2006, Cutting es va unir a Yahoo i també el seu projecte Nutch, que es va dividir en dues parts: una va seguir sent un cercador i la part de còmput i processament distribuït es va convertir en Hadoop. Actualment, Hadoop és gestionat i mantingut per una comunitat global de programadors de programari, a través de l’Apatxe Programari Foundation (ASF).
Per què has d’interessar-te per Hadoop?
En l’àmbit del Desenvolupament d’aplicacions multiplataforma, Hadoop té molt per aportar. La seva gran capacitat per emmagatzemar i processar enormes quantitats de dades, a l’instant, és una dels seus majors avantatges. El Big Data, dades i més dades dels mitjans socials o de l’Internet de les Coses, fan d’aquest recurs una cosa molt interessant.
Hadoop té gran velocitat i poder de còmput en el processament de macro dades o Big Data. És a dir, quants més nodes de còmput utilitzis, més poder de processament té.
No és necessari processar prèviament les dades abans d’emmagatzemar-los. És totalment flexible, text, imatges, vídeos…Posteriorment pots decidir com utilitzar-los.
Al tractar-se de codi obert és gratuït (part estructural de Hadoop) i gràcies al hardward comercial pot emmagatzemar grans quantitats de dades. A més, posseeix intel·ligència contra les fallades de hardward. En el cas que falli un node, es redirigeixen els treballs automàticament a uns altres. Es creen còpies múltiples de totes les dades de forma automàtica i evita que falli el processament distribuït.