22/12/2015

Basho, otro paladín de NoSQL

El volumen de datos creados en el mundo ha pasado de 1.800 millones de gigabytes en 2011 a 7.900 millones en 2015, entre otras razones por la multiplicación de los terminales móviles y los sensores relacionados con IoT, según un informe de IDC. En estas cifras se apoyó Dave McCrory, CTO de Basho Technologies, con el argumento de que «las bases de datos relacionales no son capaces de soportar esta evolución inevitable». Este fue la premisa que McCrory sostuvo durante el encuentro con periodistas europeos para presentar su compañía, uno de los adalides de las bases de datos NoSQL, que han encontrado en IoT una nueva razón de ser tras 40 años de existir como tecnología minoritaria.

Dave McCrory

Dave McCrory

Fundada en Cambridge (Boston) en 2008 por antiguos directivos de Akamai, esta startup ha trasladado recientemente su cuartel general a Bellevue (Seattle), donde disfruta de la abundancia de desarrolladores que se enriquece con la vecindad de Microsoft y Amazon. En palabras de McCrory, el cambio ha sido una opción consciente para evitar instalarse en el Silicon Valley, donde cada vez se hace más notoria la rotación de personal.

Tras la salida del anterior equipo directivo, en marzo del 2014 fue reclutado como CEO Adam Wray, quien desde entonces ha dado la vuelta a la compañía y extendido su línea de productos en nuevas direcciones. Al mismo tiempo fue fichado Dave McCrory, procedente de Warner Music y previamente cloud architect de VMware. El cambio de perspectiva ha sido acompañado por una mejor financiación: en total, los inversores llevan aportados 65 millones de dólares, una cifra que sorprende por ser menos de la mitad de lo cosechado por otros especialistas de NoSQL con los que Basho gusta compararse.

Estadísticamente, el predominio de Oracle sobre el mercado de bases de datos es abrumador pero empieza a notarse el avance de los proponentes de tecnologías alternativas, entre ellos los partidarios de NoSQL. Por otro lado, los gigantes de Internet, empezando por Google, Yahoo y Facebook, han desarrollado sus propias soluciones porque las bases de datos clásicas no satisfacían sus necesidades, y el fenómeno se va extendiéndose al resto de las empresas porque, apostilla McCrory, «los costes de licencias pueden ser muy elevados si se mantuvieran fieles a soluciones como la de Oracle».

En el actual catálogo de Basho hay varias soluciones de bases de datos con unos 200 clientes de distintos sectores y tamaños. Su producto estrella es Riak KV [key value], antes llamado simplemente Riak. Es una plataforma NoSQL orientada a empresas que – interviene Peter Coppola – «es probablemente la solución de base de datos distribuída más fácilmente escalable del mercado y sensiblemente más barata que las de nuestros competidores». Otro producto, de nombre Riak S2, es una solución de almacenamiento objeto optimizada para vídeo, imágenes y ficheros voluminosos, concebida para trabajar en concierto con nubes públicas, privadas o híbridas [es compatible con Amazon S3 y OpenStack Swift] con APIs robustas para manejar petabytes sobre una plataforma distribuída capaz de evolucionar. Está instalada en clientes como Cisco (con la que Basho tiene acuerdos de cooperación), Adobem CNN o Comcast (para streaming de vídeo) y Yammer, adquirida por Microsoft.

Con su siguiente producto, Data Platform, Basho propone la explotación de datos no estructurados, principal debilidad de las bases de datos relacionales. Es una combinación de Riak KV y Riak S2 con otro software open source, entre otro el motor Spark para análisis in-memory. «El crecimiento de este tipo de datos vive una aceleración superior a la de los datos estructurados», apunta Coppola.

La evolución del mercado para NoSQL, según Coppola, ha pasado de las soluciones puntuales hacia los modelos múltiples. «Las empresas pasan demasiado tiempo en desplegar y mantener soluciones diferentes para la gestión de big data, analíticas, IoT, etc, una creciente complejidad cuando se trata de desplegar servicios a través de entornos cloud heterogéneos y dispersos». Simplificación, es la palabra clave en el discurso corporativo.

Adam Wray, ausente del encuentro, exponía su visión días después en una entrevista con The Register: «la industria de las bases de datos se encuentra en un auténtico punto crucial, que se caracteriza por la consolidación de una variedad de servicios críticos, antes dispersos, la simplificación de los requisitos operativos para los equipos de TI que trabajan con aplicaciones escalables y cargas de trabajo muy activas».

Uno de los grandes clientes de Basho es The Weather Company, tiene una de las más extensas redes de instrumentos de captación de datos del planeta para alimentar su servicio de información meteorológica Weather Channel. Gestiona 20 terabytes de datos nuevos cada día, incluyendo previsiones en tiempo real de 130.000 fuentes. Como es obvio, la latencia es un factor decisivo, y para atenderlo cuenta con centros de análisis distribuidos basados en Riak KV, una operación de alta disponibilidad. En el momento del encuentro aún no se conocía la oferta de compra presentada por IBM sobre The Weather Company, por lo que no hubo ocasión de preguntar por el impacto que esta operación pudiera tener sobre el negocio de Basho.

Pero ese cliente fue referencia obligada para ilustrar a los asistentes sobre el uso de Riak TS (time series), producto que en este momento merece la atención prioritaria de parte de Basho. Los datos recogidos por sensores son, en muchos casos, series temporales [de ahí el apelativo TS ] en los que la localización es esencial y, por tanto, plantean problemas específicos que se pretende resolver con la arquitectura de base de datos NoSQL distribuída, para agregar y analizar cantidades masivas secuenciadas de datos no estructurados.

Los casos de uso de Riak TS, quiso aclarar Coppola, no se limitan a IoT. Otros ejemplos incluyen transacciones financieras masivas que se concentran en el tiempo, o el análisis de datos recogidos por smart meters en las redes eléctricas. Otras aplicaciones – para las que, remachó el argumento inicial de McCrory – no son aptas las bases de datos relacionales, son los instrumentos médicos sobre redes IP, motores y maquinaria industrial, sin contar la oportunidad que ofrecen los wearables.

Basho, como otras empresas de la galaxia NoSQL – Mongo DB, DataStax, y Couchbase completan el cuarteto – han empezado a abrirse camino entre aquellas empresas que encuentran ventajosos su modelo de bases de datos, idóneos para arquitecturas web distribuídas. Según Coppola, el 50% de la clientela está compuesta por «empresas que se han apartado de las bases de datos relacionales» y otro 30% por usuarios de Mongo DB y Couchbase que han alcanzado un estadio de producción «demasiado críticos».

Europa representa más del 40% del negocio de Basho, que tiene oficinas en Reino Unido, Francia y Alemania. Uno de sus clientes más destacados en el National Health Service británico, así como Bet365, uno de los grandes (también británico) de las apuestas online.

El mercado para NoSQÑ está creciendo, ya no es un nicho más o menos pintoresco, con el foco puesto en los desarrolladores para dirigirse y va madurando como alternativa para las empresas. Está por ver si a empresas como las nombradas les espera un futuro autónomo o acabarán forzando a alguno de los grandes de la industria a echar mano de la chequera.


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons