Blog | Pragsis Bidoop

¿Está sacando el máximo rendimiento a su hardware?

¿Está sacando el máximo rendimiento a su hardware?

   Desde el Departamento de I+D de Bidoop tuvimos ocasión de desarrollar una fantástica demo, con el fin de descubrir el entorno ideal para arrancar Bidoop y analizar su rendimiento. Para ella tuvimos el enorme placer de contar con la gente de Flytech y SuperMicro, que nos facilitaron el hardware para esta aventura. Y una vez finalizada tuvimos tiempo para hacer benchmarks para ver el rendimiento del sistema.por Gerardo Vázquez, 24 de Marzo, 2014.FlyTech es una empresa...
Algoritmos que todo Data Scientist debería conocer: Reservoir Sampling

Algoritmos que todo Data Scientist debería conocer: Reservoir Sampling

Artículo Original Algorithms Every Data Scientist Should Know: Reservoir Samplingpor Josh Wills, April 23, 2013Los Científicos de Datos, esa peculiar mezcla entre ingeniero de software y estadístico, son notablemente difíciles de entrevistar. Una aproximación que he usado a lo largo de los años es plantear un problema que requiera de una mezcla de estadística y diseño de algoritmos para encontrar la respuesta. Aquí estun ejemplo de este tipo de preguntas que ha sido popular en Silicon...

Hadoop para Todos: dentro de Cloudera Search

CDH, la distribución 100% opensource de Cloudera agrupando Apache Hadoop y los proyectos relacionados, ha permitido con éxito el procesamiento Big Data durante muchos años. El uso típico es insertar un gran conjunto de datos en HDFS o en Apache HBase para tener un almacenamiento barrato, flexible, eficaz y con una capacidad de procesamiento escalable. Con el tiempo han nacido varias herramientas que permiten un acceso más fácil, de tal forma que puedes ahora interactura con Hadoop a través de...

Cómo instalar un cluster Hadoop con cifrado de red

La funcionalidad de cifrado de red en Hadoop se añadió en la versión Apache Hadoop 2.0.2-alpha y en CDH4.1.En este artículo de blog repasaremos, primero, las funcionalidades de seguridad que ya existían en Hadoop. Luego, explicaremos por qué puede ser necesario el cifrado de la red. También daremos algunos detalles sobre cómo se está desarrollada esta funcionalidad. Al final de este artículo, el lector tendrá instrucciones paso a paso que le ayudarán a instalar un cluster Hadoop con cifrado de...

Cómo instalar Hadoop con 3 comandos

Esta guía muestra cómo instalar un entorno de prueba Apache Hadoop, el cual permitirá ejecutar comandos básicos. La guía está planeada para tener un primer contacto con Apache Hadoop, y no para establecer un entorno de pre-producción o producción. Durante esta guía trabajaremos con un tarball simplificado de Hadoop, creado y hosteado por Pragsis, el cual se puede obtener de la web aquí. RequisitosPara poder utilizar nuestro tarball correctamente, los siguientes requisitos deben...
Tags: Hadoop

Formación para Desarrollador Apache Hadoop: Ayuda Consulta Masiva de Datos Telecom.

Soy un desarrollador de software en Denver y he trabajado con C#, Java, y Ruby on Rails durante los últimos seis años. Escribir código es gran parte de mi vida, por lo que estoy siempre atento a los nuevos avances, desarrollos, y oportunidades en el terreno, especialmente aquellos que prometen tener un gran impacto en la ingeniería de software y las industrias que se apoyan en ello.Por Rohit Menon, 11 de marzo de 2013 (Articulo original: Apache Hadoop Training Helps Query Massive...

Cómo implantar un clúster CDH en Skytap Cloud

Es posible que haya visto el reciente anuncio de Skytap sobre la disponibilidad de plantillas pre-configuradas CDH4 en la biblioteca pública Skytap Cloud. Así que para cualquiera que quiera probar un cluster Hadoop Cloudera (sea del tamaño que sea) ahora se puede lograr fácilmente en Skytap Cloud. Matt Sousely de Skytap explica cómo hacerlo a continuación:por Matt Sousley, 23 de enero de 2013 (Artículo original: How-to: Deploy a CDH Cluster in Skytap Cloud)El...
Carreras del Futuro: Data Scientist

Carreras del Futuro: Data Scientist

¿Quiere un trabajo donde el talento es escaso – y con tendencias a continuar así por lo menos en los próximos 5 años? Conviértase en Data Scientist. Ésta, por lo menos, es la conclusión de la encuesta global de la compañía de TI EMC.Por Chris Taylor, 13 de enero de 2013 (Articulo original: Career of the Future: Data Scientist)Alrededor del 63% de los Data Scientist dicen que la profesión seguirá sin personal suficiente para un futuro predecible – y la mitad de ellos lo ven como una seria...
Tags: Big Data
Cloudera Impala

Cloudera Impala: ¿Qué es lo siguiente?

Ha sido un mes y medio muy emocionante desde el lanzamiento de la beta Cloudera Impala, y pensamos que es un buen momento para ofrecer una actualización sobre lo que viene para el proyecto, incluyendo nuestra hoja de ruta del producto, la fecha de lanzamiento y el plan de código abierto.por Justin Erickson, 4 de deceiembre de 2012 (Artículo original: What’s Next for Cloudera Impala?) En primer lugar, nos gustaría darle las gracias por su entusiasmo y aportación tan valiosa a la beta....
Hadoop Operations

Consigue gratis un Ebook de "Hadoop Operations" inscribiéndote en el curso de Administrator

Comienza bien el año aprovechando, a través de Pragsis University, las ofertas especiales de Cloudera para los aspirantes a administradores de Hadoop. Todos los participantes que completen una formación como Administrador Hadoop en febrero de 2013 recibirán una copia digital gratuita de "Hadoop Operations", cuyo autor es Eric Sammer. Si necesitas ampliar sus conocimientos como administrador de clusters Hadoop, este libro es obligatorio. Además de proporcionar una guía práctica para convertirte...

Páginas