11/04/2023

Juan Carlos Sánchez de la Fuente

Vicepresidente, Director regional de Cloudera para España y Portugal

Por distintas circunstancias, Cloudera ha estado presente en la trayectoria de este blog con frecuencia. La empresa nació en 2008 por iniciativa de un puñado de ingenieros que procedían de Google y Yahoo, a quienes unía la paternidad de un software que buscaba facilitar el procesamiento de grandes volúmenes de datos, lo que la costumbre llama big data. Bautizado Hadoop, aquel framework, como  lo definía uno de ellos, Doug Cutting, se fundamentaba en el  crecimiento exponencial de los datos, un problema que sigue trayendo de cabeza a las empresas. Fue recibido con gran entusiasmo, en la medida que sacudía el mercado de las bases de datos relacionales, dominado (entonces y ahora algo menos) por Oracle.

Juan Carlos Sánchez de la Fuente

Su modelo de negocio se alineaba con el movimiento open source: bastaría con que un 2% de las empresas que descargaban la versión gratuita aceptasen pagar por sus componentes y servicios adyacentes, para que Cloudera fuera rentable en unos años.

Con este planteamiento tan propio del Silicon Valley [tenía su sede en Palo Alto y se trasladaría a Santa Clara], Cloudera mereció que Intel asumiera durante seis años un 18% de su capital, respaldo que le ayudó a salir a bolsa en 2017 y al año siguiente absorber a su rival Hortonworks. En este punto comienza la conversación con Juan Carlos Sánchez de la Fuente, director regional de la compañía cuya responsabilidad abarca España y Portugal.

Confieso de entrada que he perdido hace años el hilo de Cloudera [risas]. Tiempo después de la fusión con Hortonworks, creo recordar.   

Le pondré al día, porque yo mismo me incorporé a Cloudera en 2019,  cuando se había consumado la fusión y Rob Bearden había tomado el relevo de Tom Reilly, a quien creo usted conoció. Desde mi punto de vista, lo más relevante fue el intenso trabajo de desarrollo de una plataforma que reuniría la mejor tecnología de las dos compañías fusionadas: se llamaría Cloudera Data Platform (CDP) y mi llegada coincidió con el lanzamiento de ese nuevo mensaje.

[…] Cloudera toma distancia con respecto a Hadoop y se decanta por CDP como producto-bandera.

Lo que se busca en ese momento es llevar al mercado el mejor producto de analítica avanzada del dato, pasando a un segundo plano el concepto de big data que se encarnaba en Hadoop y seguiría formando parte de la oferta hasta hoy. CDP se define como una plataforma de gestión de todo el ciclo de vida del dato, para lo que asimilamos las soluciones de análisis en tiempo real de Hortonworks cuyos componentes principales eran Kafka y NiFi  […] Tenía lógica, porque todo provenía del mismo entorno open source, Apache, que se despliega como proyectos comunitarios.

Tengo claro el sentido económico de la fusión. O eso creía entonces. ¿En qué ha consistido la fusión tecnológica?

Se trataba de capturar el dato en el dispositivo final para analizarlo y dar respuesta en tiempo real. Y combinar esa capacidad con la ingeniería de data warehouse […]. El significado último de estos movimientos era convertir Cloudera en una empresa cloud, ya que desde sus orígenes se había basado en tecnologías on-premise.

¿Qué implicaba esa decisión para el mercado? ¿Tiene vigencia hoy?

[…] Ningún competidor tiene una solución 100% transversal comparable a la plataforma de Cloudera: vale en un entorno privado on-premise o en uno hibrido en la nube. Esta es nuestra apuesta, la hibridez. Al poco tiempo llegó la pandemia y nos obligó a cambiar la velocidad de la hoja de ruta sin alterar el objetivo: seguimos invirtiendo en el producto cloud y ayudando a los clientes en su migración. Recuerdo muy bien que a mediados de 2020 firmamos el primer cliente de CDP en España.

¿A qué llama migración?

A cambiar el producto que tenían instalado por la nueva plataforma. Ya no era la antigua Cloudera ni la antigua Hortonworks, sino una compañía única con un producto único, válido para ambos entornos. El objetivo era consolidar CDP, que fuera lo más estándar posible […]

En julio de 2021, Cloudera dejaría de cotizar en bolsa, lo que sugiere dos preguntas: ¿por qué? y ¿la privatización precipitó una nueva estrategia?

El cambio de estrategia fue anterior a esa decisión. El motivo principal fue una situación que minimizaba los efectos positivos de la salida a bolsa. Desde 2018, la compañía venía creciendo a tasas del 10% o el 12%, trimestre a trimestre, según reportaba como empresa cotizada. Pero, a la vez, se sentía encorsetada por presiones externas que transmitían los analistas […] Un rumor persistente acerca del interés de IBM en adquirir Cloudera nunca se concretó, pero salía una y otra vez. En aquel contexto, la compañía tenía como línea a segur el impulso de su plataforma con una reingeniería de ciertas capas y pensaba en alguna adquisición; para lo que necesitaba capital adicional que no encontraba en la bolsa.

Está describiendo una situación bastante frecuente.

Sí, pero con final feliz. Entraron dos fondos de inversión importantes, KKR y CDR (Clayron, Dubilier & Rice], el primero muy conocido en Europa y en España por otras operaciones […]. El CEO, Rob Bearden, fue ratificado en su puesto y la hoja de ruta se mantuvo con una evolución apropiada […] Tecnológicamente, Cloudera podría hacer muchas cosas, pero ha decidido centrarse en la gestión del dato y más precisamente en su analítica avanzada. Insistimos, por lo tanto, en la hibridación, en la capacidad de aportar soluciones para que los clientes tengan flexibilidad y agilidad a la hora de trabajar en un entorno o en otro, que tengan visibilidad de las diferentes nubes disponibles y de sus cargas estén donde estén.

No habrá sido tan lineal; ha habido cambios en el equipo directivo […]

Así es, pero los cambios a los que alude tienen dos características: confirman la hoja de ruta a la vez que renuevan el empuje competitivo. La clave es que Cloudera quiere seguir siendo líder, una condición que no le atribuyo yo, sino Gartner y Forrester, que la identifican como uno de los cuatro o cinco líderes en su segmento.

¿Qué contexto lo explica, según las consultoras? 

Estamos viendo un crecimiento formidable del volumen de datos. IDC estimaba no hace mucho que en 2025 habrá 175 zettabytes de información, la suma de los datos estructurados y no estructurados. Si hablamos de los no estructurados, cada vez más importantes, las compañías no están siendo capaces de gestionarlos y por lo tanto se enfrentan al peligro de no tomar decisiones con la urgencia que exige la defensa de sus posiciones. Esta es la razón por la que las diez principales aseguradoras y los diez grandes bancos del mundo utilizan herramientas de Cloudera. Tenemos experiencia con diferentes sectores de actividad, tanto privados como públicos. Porque, cuanto más ayudemos a unos y otros a extraer el valor que reside en esos datos, más eficientes serán y más se ensanchará nuestro mercado […]

Lo mejor será que me dé un par de ejemplos.

Desde luego, pero tengo limitaciones a la hora de identificar nominalmente a los clientes. Una empresa de transportes necesita contar con una analítica en tiempo real para tener bajo control una serie de parámetros propios de su actividad; entre otros la predicción del número de pasajeros con la que definir el equipamiento que destinar a cada ruta en cada momento, con lo que ganaría eficiencia y ahorraría costes. Al final, su propósito es mejorar su TCO sin sacrificar el rendimiento de los servicios. Es una analítica avanzada en la mejor acepción del adjetivo. Igualmente, trabajamos con una compañía de energías renovables que busca elevar su eficiencia conociendo los patrones de comportamiento del viento, para que en cada circunstancia la rotación de los aerogeneradores sea la idónea […]. De esto trata la analítica del dato, no es una abstracción.

¿En qué se diferencian esas propuestas de Cloudera de las de otras compañías que también hablan de gestión del dato y de su análisis?

Esperaba la pregunta [risas] Nos reconocemos como los pioneros en la utilización de Hadoop por las empresas a lo largo de los años la compañía ha acentuado su perfil enterprise. Y aquí, claro, debo destacar nuestra naturaleza open source. Cloudera ofrece un subconjunto de protocolos de código abierto, lo que significa que cualquiera puede descargarlos gratis desde Internet […] Añade una capa de seguridad, otra de administración y el valor del metadato lleva asociados una serie de componentes para que, cuando se decida tratarlos, no se pierda el ciclo de vida. Por supuesto, estamos siempre atentos a la evolución de esos protocolos, una cercanía de la que otras compañías carecen.

Eso estará vinculado con la filiación original de Cloudera, su afinidad con el código abierto.

Como está familiarizado con la historia de la compañía, conoce nuestras credenciales open source […] Seguimos contribuyendo a la comunidad de código abierto. El último proyecto que hemos adoptado es Apache Iceberg. Lo pongo como ejemplo porque es una tecnología nueva, originalmente desarrollada por Netflix, que Cloudera integra dentro de su plataforma, le añade varias capas y contribuye a asegurar su continuidad embebida en su ingeniería.

Esto en el plano tecnológico. ¿Qué pasa con la monetización, el dilema de open source de toda la vida?  

Monetizamos a través de dos partidas, de las que la primera es más relevante: el cliente descarga uno de nuestros componentes estrella, como NiFi para trabajar en proyectos de tiempo real el modo gráfico, muy visual y potente. Es gratuito y una vez lo ha descargado, podrá pedir acceso al soporte de un equipo de nuestros ingenieros.

[…] Ha dicho dos partidas. Dos.

Ya voy con la segunda. Tenemos ciertas capas de software propietarias que han sido incluidas en la plataforma. Es algo importante, porque ayudan a que haya un gobierno unificado: una capa de seguridad, otra de linaje […] La plataforma de Cloudera tiene más de 70 componentes y cuando un cliente opta por el modelo de suscripción tiene derecho a ellas como ventaja adicional a las que ya son propias de la comunidad open source.

¿Aprecian los clientes esos rasgos de la compañía?

Sí que los aprecian. Nuestra diferencia reside en que vamos a acompañarlos en la hibridación de sus cargas. Si están on-premise, en una nube privada o en una nube pública. Hay competidores que ofrecen soluciones estupendas 100% cloud y merecen nuestro respeto. También Cloudera tiene una solución cloud, pero no creemos que sea por sí sola la mejor solución actual ni futura […]

Suena categórico […]  

Lo dicen los informes de Gartner y Forrester, que estiman el crecimiento de la infraestructura cloud en torno al 40% anual durante los próximos cinco años. Es perfecto  para nosotros, pero no significa que van a decrecer on-premise o la nube privada: en realidad seguirían creciendo un 2% anual. ¿Qué es mucho menos? Si, pero sería insensato ignorar la existencia de organizaciones para las que migrar por completo a la nube sería una cabriola de riesgo.

Aun dentro de esa tendencia, Cloudera trabaja con los grandes proveedores de la nube pública […]

Nuestros socios son Amazon Web Services, Azure y, desde hace menos tiempo, Google Cloud. Los tres tienen sus propias soluciones analíticas en la nube, muy competitivas, pero también la nuestra es competitiva, por lo que han aceptado incorporarla a su oferta cuando se da el caso.

¿Cuándo se da el caso?

Cuando a un cliente le proponemos un proyecto para mover a la nube algo que tiene on-premise, obviamente lo hacemos sobre la base de nuestra plataforma. Del mismo modo que, si la ofrecemos on-premise, hace falta la colaboración de un fabricante dotado de la preceptiva certificación. Es un hecho que para Microsoft o AWS somos uno de los principales colaboradores en este campo y que, recíprocamente, son socios posibles en cualquier proyecto que llevemos a la nube pública. Dejo a Google Cloud para el final sólo porque el acuerdo es más reciente […]

¿En qué consisten esas relaciones con los hiperescalares?  

Tenemos acuerdos marco firmados con los tres. Si un cliente nos dice que ya tiene tratos con alguno de ellos, no pasa nada […] se pide al que corresponda que habilite la solución de Cloudera en la cuenta del cliente.

¿Cómo ha evolucionado el producto?

[…] Vertiginosamente. Con tantos cambios que a la propia compañía le ha costado asimilarlos: integraciones, funcionalidades, capacidades, nuevas soluciones, ya puede hacerse una idea. En algún momento no conseguíamos avanzar comercialmente tan rápido como el producto. Para tener reconocimiento del mercado, necesitas una estabilidad. Por esto, ahora mismo, nuestra prioridad es tener siempre actualizado el soporte […] sin dejar de lado la incorporación a su debido tiempo de nuevos protocolos.

El concepto de plataforma es polisémico en esta industria. ¿La de Cloudera se comercializa como un bloque?

No, no es un bloque. Imagine que un cliente quiere hacer con Cloudera un proyecto de inteligencia artificial: ¿se puede hacer? Por supuesto que sí. Es normal que un cliente quiera sólo determinados componentes. Pero, ¿dónde le aportamos más valor? Sin duda, trabajando con el cliente en el ciclo de vida completo del dato y en un contexto híbrido.

Llevamos cuarenta minutos hablando y casi ha hablado de clientes con nombre propio [risas]

Hay todo tipo de situaciones y no siempre puedo dar los nombres. La Comunidad de Madrid, concretamente la consejería de Salud, está montando su gestión del dato sobre un core que es de Cloudera; ¿quiere decir que todo es de Cloudera? Por supuesto que no: tienen componentes diferentes para diferentes capas, pero la parte analítica la hacen con Cloudera. Otro cliente de referencia es la Agencia Tributaria de Cataluña, que ha unificado con Cloudera la extracción, procesamiento e integración de los datos que antes se gestionaban con una diversidad de herramientas de distinto origen.

Me ha dicho que trabajan con grandes bancos mundiales. ¿Alguno español?

Puedo nombrar a Santander y Kutxabank, pero no son los únicos.

En la comercialización de su plataforma intervienen partners de distinta naturaleza y capacidades […]

Cloudera tiene unos 4.000 registrados en todo el mundo; en España, si no me equivoco, son 132. Todos activos en las categorías clásicas, pero el núcleo duro está compuesto por menos de 20. Inevitablemente olvidaré alguno, pero ahora mismo me vienen los nombres de Accenture, Atos, Capgemini, IBM, Ibermática,  Loficals, Minsait y NTT, lo siento […]

¿Por qué los ha definido como activos?

Porque tenemos un trato constante y con algunos ellos casi diario. Lo importante es que son unas 4.000 personas que en alguna medida han recibido formación en la tecnología de Cloudera. Y unas 300 han pasado por un proceso de certificación.


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons