Tutoriales Hadoop

Tutoriales

Los tutoriales normalmente consisten en una serie de pasos que van aumentando su nivel de dificultad y entendimiento. Por ello los tutoriales que mostramos a continuación se deben de estudiar en su secuencia para que se entiendan todos los componentes.

En el menu lateral puede seleccionar sobre los elementos de los que disponemos tutoriales. También pueden usar este listado:

 

  • Tutoriales sobre Hadoop
  • Tutoriales sobre HBase
  • Tutoriales sobre Hive

 

Tutorial sobre Bidoop

Bidoop usa Bidoop Layer que es una capa de componentes Big Data para Hadoop que permite analizar diversas fuentes de información y acelerar el desarrollo de nuevos modelos analíticos o la creación de procesos operacionales, dotando de valor a grandes volúmenes de datos incluso en tiempo real.

 

 

Tutoriales sobre Hadoop

Apache Hadoop es un ecosistema software que soporta aplicaciones distribuidas bajo una licencia libre. Este sistema permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS).

Hadoop es un proyecto de alto nivel Apache que está siendo construido y usado por una comunidad global de contribuidores, mediante el lenguaje de programación Java.

 

 

Tutorial sobre HBase

Apache HBase de Hadoop es una BBDD NoSQL de baja latencia, distribuida y de código abierto. Se trata de la versión java opensource de Hadoop de la famosa BBDD NoSQL de Google: BigTable. Como principales características podemos destacar: datos almacenados en columnas, sistema de versioning de los datos, consistencia de las escrituras y lecturas, recuperación automática en caso de fallos. Ha sido elegido por Facebook, entre otras cosas, para almacenar todos los correos de los usuarios de la misma plataforma.

 

 

Tutorial sobre Hive

Hive es un almacén de datos y paquete de análisis en código abierto que se ejecuta por encima de Hadoop. Hive funciona con un lenguaje basado en SQL denominado Hive QL que permite a los usuarios estructurar, resumir y consultar fuentes de datos almacenadas en HDFS. Hive añade metadatos a la información para facilitar su manejo, creando lo que se llama un almacén. Fué desarrollado originalmente por Facebook.