Es completamente falso que en Silicon Valley aten los perros con longaniza. No cualquiera cierra una ronda de financiación de 160 millones de dólares (una parte cortesía de Google Ventures) y a los pocos días recibe otro empujón de Intel, con el se asegura un total de 900 millones de dólares. La proeza es obra de Tom Reilly, que hace ocho meses fue fichado como CEO de Cloudera y acelera la misión para la que fue contratado: traspasar las fronteras del movimiento open source para convertirla en una empresa de software capaz de toserle a las grandes. Cloudera prevé emplear esos fondos frescos para contratar ingenieros, desarrollar nuevas herramientas y expandirse hacia Europa y Asia.
Es evidente que la cantidad excede de lejos lo que cualquier compañía de la galaxia open source suele necesitar para crecer. Pero el caso de Cloudera no es único. En las últimas semanas se anunciaron otros movimientos del mismo género: Hortoworks ha cerrado su ronda de 100 millones de dólares – con la participación, entre otros, de Yahoo, la cuna de Hadoop – y una tercera, Platfora, recaudaba 38 millones de dólares, de un consorcio inversor en el que se alinean Cisco e I-Qtel para desarrollar su plataforma analítica que también corre sobre Hadoop. En este caso, los nombres de los inversores no son menos importantes: Cisco es uno de ellos, y otro se llama In-Q-Tel, notorio instrumento financiero de la CIA.
Tanta agitación en sólo dos semanas ha puesto de manifiesto la relevancia adquirida por Hadoop, el framework analítico para Big Data que nació con espíritu open source en el seno de Yahoo para posteriormente extenderse a través de varias distribuciones que, por su parte, se han incorporado a la oferta de los grandes de la industria.
¿Son señales de una revolución inminente en el emergente mercado que se envuelve en la denominación genérica de Big Data? Eso parece. Hadoop ha dejado atrás la fase experimental, para enriquecerse con funciones adyacentes que no forman parte del proyecto comunitario Apache. En este contexto de maduración de Hadoop, Cloudera quiere distinguirse de sus parientes presentándose como «una empresa de software», lo que implica consolidar esas funciones en una plataforma integrada para empresas. Esto le valdría la posibilidad de tener voz propia en el mercado, sin por ello romper las alianzas que tiene firmadas.
El primer paso lo dio en octubre, con la presentación de Enterprise Data Hub, que facilita a las empresas una capacidad propia de gestionar sus datos por encima de lo que permite hacer Hadoop. Además de los miles de descargas gratuitas, y de las licencias que cobra a sus aliados IBM, Oracle y HP por integrar la distribución en sus respectivas ofertas de Big Data, tiene otros ingresos: más de 300 clientes desembolsan entre 5.000 y 7.000 dólares anuales por nodo, a cambio del derecho a un servicio permanente. Sobre esta base, y con la financiación asegurada, Reilly puede plantearse un modelo de negocio distinto. De hecho, declaraba el mes pasado su convicción de que la compañía podría un día alcanzar una facturación de 20.000 millones de dólares. La cifra suena fantástica, porque el mercado del ´ecosistema` Hadoop se estimaba el año pasado en no más de 2.000 millones.
El mercado de Hadoop se segmenta en software, hardware y servicios, siendo estos últimos dominantes con más de la mitad del total, debido a la creciente necesidad de integración y de contar con analistas de datos, una profesión escasa. Es otro factor a tener en cuenta: para que Hadoop sea útil a las empresas, sus distribuciones necesitan incorporar funciones por encima de la arquitectura propiamente open source. Esas funciones tienen precio y necesitan especialistas: Cloudera ofrece formación a través de 19 universidades, y mediante la plataforma online Udacity; según la compañía, ya ha certificado a más de 8.000 ingenieros.
A propósito de la fortuna que le tocará gestionar, Reilly ha dicho que le permitirá salir a bolsa cuando le convenga, pero sólo ha añadido que «ser una empresa de software cotizada tranquilizaría a los clientes». Cuando Reilly tomó el puesto de CEO, fue muy comentado su antecedente al frente de ArcSight, compañía de seguridad que vendió a HP por 1.500 millones en setiembre de 2010. En la nueva situación, el futuro de Cloudera está más cerca de Wall Street. Aunque nunca se sabe: tras su inversión, estimada en 730 millones de dólares, Intel ha pasado a ser dueña del 18% del valor hipotético de Cloudera.
Hortonworks – otra empresa de linaje open source – parece inclinarse por una pronta salida a bolsa, quizás a finales de este año o comienzos del próximo, aprovechando el viento a favor. Este parece ser el sentido de su reciente ronda de financiación de 100 millones, pero el movimiento de su competidor podría ser un revulsivo para, eventualmente, recibir una oferta de compra de alguna de las empresas con las que está unida por alianzas (Microsoft, Teradata, Red Hat o SAP). Su CEO, Rob Bearden, expresa una ambición apenas más templada que la de Reilly: en el plazo de tres o cuatro años, asegura, Hortonworks podría estar manejando la mitad de los datos que se generan en el mundo.
El tercero de los exponentes en esta manada de elefantes – el logo de Hadoop – es MapR. Un reciente estudio de la consultora Forrester asigna la puntuación más alta a su distribución, por su arquitectura y su capacidad de proceso de datos. Sin embargo, no tiene un reconocimiento de marca comparable al de sus parientes. El analista que firma el informe afirma que, si tuviera más recursos para dedicar al marketing, su posición en el mercado podría mejorar mucho. No hay noticia de que tenga en marcha una financiación adicional, pero habida cuenta del entorno, no le costaría mucho esfuerzo.
[informe de Pablo G. Bejerano]