Los fabricantes de Big Data crean una plataforma común de Hadoop

Posted by Unknown on 8:20 p.m. with No comments

Las Plataformas de Datos Abiertas buscan brindar compatibilidad entre las diferentes versiones de Hadoop


By Joab Jackson
IDG News Service

Los principales fabricantes de soluciones de Big Data se han unido para especificar una plataforma de código abierto unificada para el software de procesamiento de datos Hadoop.

La Plataforma de Datos Abierta deberá identificar  las versiones específicas de Apache Hadoop y su software de apoyo, que se ejecutaran en conjunto y como un todo, lo que podría reducir el trabajo necesario por parte de las empresas para construir y mantener los sistemas de análisis de datos basadas en Hadoop.

“En la medida que las empresas reconocen el valor que Apache Hadoop aporta al negocio, en esa medida crece la necesidad de realizar pruebas rigurosas, consistentes y bien definidas del ecosistema” Raymie Stata, CEO de Altiscale.

El código base de Hadoop is manejado por la Fundación Apache Software. Tal como el kernel del sistema operativo Linux, Hadoop es empaquetado por múltiples fabricantes dentro de distribuciones comerciales y no todas son compatibles entre ellas. Adicionalmente existen una serie de programas Hadoop colindantes, como Hive, Ambari y ZooKeeper, lo cual implica un gran trabajo de integración con Hadoop.

Creando un base común para las librerías de Hadoop, la Plataforma de Datos Abierta agilizara el proceso de entendimiento sobre que tecnologías y que versiones de estas tecnologías pueden ser utilizadas entre sí sin problemas. Luego las organizaciones podrán integrar más fácilmente el software en sus sistemas de Hadoop, mezclando y comparando diferentes componentes de Hadoop de diferentes fabricantes.

Algunos de los fabricantes que han firmado esta iniciativa son: General Electric, Infosys, SAS, Altiscale, Capgemini, CenturyLink, EMC, Splunk, Verizon Enterprise Solutions, Teradata, VMware, IBM, Hortonworks y Pivotal.


Categories: , , ,