Qué es hadoop?Hasta el día de hoy venimos hablando de Big Data, las empresas que existen en el mercado, las tendencias y los casos de éxito, pero hay una herramienta que se lleva casi todos los laureles y por eso nos llenan de mensajes preguntando ¿Qué es Hadoop?. Hadoop se considera hoy en día como un sistema de código libre o abierto que es utilizado para resguardar, procesar, almacenar y analizar grandes cantidades y volúmenes de datos, hablando de cientos de terabytes, peta bytes e incluso exa bytes a través de una enorme cantidad de grupos de ordenadores que utilizan modelos de programación, está diseñado para pasar de servidores individuales a miles de máquinas.

Es un componente más que se encuentra dentro del panorama de la tecnología Big Data, pero ¿Qué es Big Data?, tal vez habrás escuchado alguna vez éste término, pues Big Data es una tendencia que se encarga de sacar provecho y darle valor a la información; nos da la oportunidad de transformar esa inmensidad de datos fragmentados y de esa información tomar y descartar decisiones inmediatas para darle seguimiento a todo tipo de información.

Hadoop fue diseñado para diferentes tipos de datos y cargas de trabajo específicos, es sin lugar a duda una tecnología que sirve para dividir grandes cantidades de datos sin procesar (audio, imágenes, videos), tanto estructurados, no estructurados como semi estructurados, que se necesita estudiar y preparar para su análisis.

El nacimiento de Hadoop surge como iniciativa de un sistema de código abierto a consecuencia de los comentarios y las publicaciones de varios asistentes de Google sobre sus sistemas de archivo, ya que la empresa Google tenía una gigantesca base de datos que necesitaba que se organizara, se utilizara y se manejara de manera correcta.

Hadoop al paso del tiempo ha ido adquiriendo más importancia debido a su facilidad para gestionar sistemas en red, por otra parte cabe destacar que Hadoop tiene una arquitectura con la capacidad de asegurar una alta disponibilidad y recuperación de los datos que ingesta.

Es de gran utilidad cuando vamos a empezar a realizar proyectos que necesiten de una red o un proceso, ya se ha mencionado que puede almacenar y procesar cantidades enormes de información. A su vez se distribuye la información entre los nodos, habiendo una posibilidad de disponer de miles de nodos. Al disponer los datos de forma distribuida, la búsqueda se puede realizar de manera rápida y fácil.

El buscador Yahoo! es una aplicación de Hadoop que produce datos que son utilizados en cada consulta de búsqueda web. Algunos de los usuarios que tienen grandes relaciones con Hadoop son:
• eBay
• Yahoo!
• IBM
• Google
• Facebook
• Twitter

Finalmente podemos obtener que Hadoop es una plataforma a nivel universal de software que permite el desarrollo y ejecución de aplicaciones que procesan datos, Organizando la información para un uso estable y adecuado.

Esta herramienta la van a encontrar en varios casos de uso de Big Data, como el que ya vimos en esta página de Paypal.

Pueden encontrar interesante información de Hadoop en http://big-dataanalytics.blogspot.com/2013/10/what-is-hadoop.html

Si esta entrada fue de tu interés compártela con tus conocidos