NorbertoGallego.com :: Análisis de mercados y empresas de tecnología

28/04/2017

Hortonworks calienta motores

Cuando Hortonworks empezó su andadura, en 2011, se hablaba de Big Data como algo que se ocupaba de datos en reposo, pero desde entonces los datos en movimiento se han convertido en el tesoro del que más valor se quiere extraer. Esta evolución viene marcada, en primer lugar, por el auge de Internet de las Cosas y, segundo, porque a diferencia del análisis predictivo que se postulaba hasta ahora, hoy se pueden sacar conclusiones analizando los datos en tiempo real. Este fue un eje central del DataWorks Summit, celebrado en Munich a principios de abril. Ya no se llama Hadoop Summit, y el cambio de nombre tiene su razón de ser: el ´ecosistema` del elefantito tiende a una apertura de miras.

Raj Verma

Como en años anteriores, los organizadores han sido Hortonworks y Yahoo [o lo que queda de esta mientras Verizon acaba de tragarla]. A Munich acudieron 1.400 asistentes, entre ellos partners y clientes europeos, pero también competidores: Cloudera, por ejemplo, como patrocinador gold.

En los últimos años, la plataforma Hadoop ha ganado nuevas dimensiones, generando a su alrededor un verdadero stack de proyectos – Spark, Kafka, Ranger, Zeppelin, etc – que, sin por ello cambiar su naturaleza, catalizan una nueva actitud hacia el mercado.

En una primera fase de la historia de Hadoop – su paternidad se atribuye a Doug Cutting, hoy en Cloudera, pero Hortonworks ensalza el papel de su confundador Owen O´Malley – la plataforma se orientaba a las entrañas de los departamentos de TI. Ahora mismo, cortejar a las líneas de negocio de las empresas requiere otras cualidades, sin apartarse de la ortodoxia. Una disyuntiva que da lugar a una moraleja del DataWorks Summit, la necesidad de ajustar los modelos de negocio.

Hadoop ha adquirido en los últimos años otra dimensión, generando a su alrededor proyectos open source – Stark, Kafka, Ranger, etc – que forman un verdadero stack, con el que se ensanchan las diferencias entre las tres compañías nacidas del tronco común. Cada una de ellas ha desarrollado un perfil propio. Hortonworks es hasta ahora la única cotizada en bolsa, pero con una capitalización de 650 millones de dólares. MapR es la más consecuente con sus raíces, por lo que vive marginada y no alcanza el estatus de le permitiría estar entre los unicornios. De las otras dos, MapR es consecuente con sus raíces, con escaso relieve público, en las antípodas de Cloudera que – confortaba por el apoyo financiero de Intel – se inclina por incorporar elementos ´propietarios` en una fórmula HOSS (hybrid open source), con el fin de ser aceptada en el mundo corporativo.

En este contexto, Hortonworks enarbola la bandera del código abierto sin concesiones. Raj Verma, presidente y COO de Hortonworks desde enero, abordó el asunto el día que se estrenaba en público, sin escatimar referencias a Cloudera, por razones que se verán. «¿Con qué fin añadir una capa propietaria a un software open source? Para bloquear las opciones de salida del cliente. Punto». Según Verma, las empresas no quieren verse atrapados en un callejón sin salida, como les ocurre con las bases de datos relacionales y la analítica tradicional, cuyas migraciones son onerosas y, por tanto, a menudo disuasorias.

«El coste de abandonar una solución ´propietaria` es entre 10 y 15 veces más alto que la adquisición inicial más su implementación. En el modelo 100% open source, como el nuestro, el coste de salida es cero». Aunque de inmediato matizó: «habrá costes para cambiar a otro sistema, pero será de carácter organizativo».

Sin lugar a dudas, Verma – anteriormente COO de Tibco – es un converso del movimiento open source. «El mercado del big data está cambiando tan rápido que los desarrolladores que trabajan dentro de una empresa no consiguen seguir el ritmo. Hace falta una comunidad para mantenerse al cabo de la innovación que está teniendo lugar. Así que estamos contentos con nuestro enfoque de open source puro», dijo en un encuentro con la prensa.

La comparación entre entre Hortoworks y Cloudera estaba en el ambiente, y tiene sentido porque esta se apresta a salir a bolsa este año, lo que planteará ante los inversores la idoneidad de ambas estrategias. Como no puede presumir de beneficios, Verma apostilló que Hortonworks va por delante de su competidor en cuanto a márgenes (84% frente al 82%) y se encuentra muy cerca de cruzar el umbral de rentabilidad.

En lo que respecta a su crecimiento, Hortonworks ve la nube como el gran motor del mercado de big data. En 2016, las ventas relacionadas con entornos de cloud pública o híbrida fueron algo más del 20% del total de sus ingresos. La compañía está convencida de que la nube pública será la forma preferida de consumo de su tecnología. A esto deberían contribuir las alianzas con Microsoft [HD Insights Azure] y AWS [Hortoworks Data Cloud].

La colaboracíón con los partners – IBM, Teradata, HPE, Dell-EMC y Microsof, también presentes en el DataWorks Summit – es fundamental para que sus soluciones basadas en Hadoop lleguen a los clientes en determinados verticales: banca, seguros, telecos, retail. En una de las 80 sesiones programadas en Munich se dieron ejemplos como el análisis de riesgo o el estudio de patrones de consumo, al parecer muy demandados.

Entre los casos de uso que más lucieron destacó el sector de automoción: desentrañar ciberataques y ´jaqueos` en el flujo de datos que genera un coche conectado: la información aterriza en una plataforma Hadoop y entrena los algoritmos que definen cuándo se producen. Dando un paso hacia el futuro, despertó interés la experiencia de BMW, que trata de identificar las medidas de seguridad que serán necesarias para el coche autónomo: es una misión de big data basada en patrones extraídos tanto de pruebas reales como de simulación, y permite ahorrar costes de I+D. En lo que respecta a sus fábricas, repletas de sensores, la marca alemana monitoriza los tiempos de producción y el inventario con el propósito de optimizar los procesos.

En una presentación de Mercedes se dieron cifras impresionantes: un coche actual de alta gama genera 500 GB de datos por día, mientras que un coche autónomo (en 2025) generará 50 TB por día; por consiguiente, requerirá inteligencia en el borde de la red y gestión en tiempo real de los procesos en la nube.

Sin salir del ámbito del motor, es sabido que las aseguradoras podrían ajustar – con la contribución de Hortonworks – el precio de sus productos y premiar a los conductores que compartan hábitos de buena conducción. Pues bien, la decisión sobre el uso ético de los datos debe recaer en el cliente, aunque hay un aspecto que depende de la compañía: saber de dónde viene la información para determinar la fiabilidad de las conclusiones. También el sector energético se ha lanzado de lleno al uso de big data. En el evento, lo ilustró la eléctrica británica Centrica, que ha reunido una amalgama de datos – estructurados, de sensores, geolocalización, acceso a servidores, redes sociales – para entender mejor el consumo de sus clientes. El resultado, según se explicó, ha sido el desarrollo de un nuevo sistema de facturación inteligente, presentado como más satisfactorio para el consumidor.

Lo habitual es el uso de Hadoop para añadir capacidades analíticas a la infraestructura, pero el Danske Bank utiliza Hortonworks para penetrar profundamente en los datos transaccionales. Una preocupación que tenía la entidad danesa era el aumento exponencial de datos generados por la interacción de sus clientes a través de la web y su rama móvil; pasado un cierto volumen, sólo el análisis en tiempo real puede ser eficiente. De cara a la entrada en vigor de la directiva europea sobre protección de datos, en mayo de 2018, el Danske Bank se prepara para ´mapear` todos los datos entrantes, con metadatos que contendrán el linaje de cada dato (de dónde viene y cómo se interconecta) dijo el director de arquitectura de este banco.

Es obvio que otro sector de referencia en big data son los operadores de telecomunicaciones. En este punto se destacó como cliente a Telefónica, que usa las soluciones de Hortonworks para mejorar el rendimiento de sus torres y reducir gastos operativos.

Buena parte de los casos de uso que se expusieron en el DataWorks Summit remiten al uso de Hortonworks para generar data lakes, una misión poco crítica y, por ello, menos susceptible de crear dependencia de los clientes con respecto a Hortonworks. Es una de las razones por las que la empresa trata de ampliar su foco hacia campos con perspectivas de creación de valor. Sólo 24 horas después de concluir el evento de Munich, Hortonworks anunció la compra de SequenceIQ – hasta ahora un partner certificado – que propone herramientas de simplificación del despliegue de Hadoop en distintos entornos de cloud pública aplicando la tecnología de contenedores.

La inteligencia artificial es otra tendencia del mercado que altera el habitat de Hadoop. Sobre esta convergencia se explayaron los representantes de IBM, lo que llevo a Hortonworks – que no tiene productos específicos en IA – desvelara que prevé tenerlos en el futuro. Sin más precisiones, que ya se había dicho mucho.

[informe de Pablo G. Bejerano]