17/04/2016

Confabulación contra los silos de datos

Otra vez a vueltas con el almacenamiento, comentó un lector tras leer el post de la semana pasada. Pues sí, y es uno de los ámbitos de mercado en los que este blog tiene una apreciable y leal audiencia. El almacenamiento de datos y su transferencia de un lugar a otro, ya sea real o virtual, es una práctica generalizada para ahorrar espacio y mejorar la eficiencia. Los datos, sin embargo, están siempre asociados a un archivo o a un bloque, con lo que al transferirlos se crean compartimentos estancos, que suelen describirse como silos. Acabar con ellos es el guante que varias startups han lanzado a la cara de los actores tradicionales del dinámico mercado del almacenamiento.

Para optimizar el almacenamiento y que los archivos sean independientes del protocolo, las soluciones que se plantean se proponen, con mayor o menor acierto – el tiempo lo dirá – lograr una movilidad total de los datos, y en alguno de los casos llegar a jerarquizarlos. El objetivo es común, pero los métodos son distintos.

Una de las jóvenes compañías que recientemente visitó este cronista en el Silicon Valley se llama Primary Data. Tan joven que nació en 2014, justo a tiempo para recaudar [antes del parón actual del venture capital] 60 millones de dólares. En la captación de fondos algo pudo haber influído el hecho de que Steve Wozniak prestara su demediado nombre para figurar como «director científico». Wozniak y el CEO de Primary Data, Lance Smith, coincidieron en Fusion-io antes de que esta fuera adquirida por SanDisk. Pero el verdadero CTO es David Flynn, quien junto a Smith atendió al grupo de periodistas europeos en su sede de Los Altos.

El objetivo de Primary Data es más fácil de enunciar que de conseguir: transformar la economía de un centro de datos a base de mover los datos a través de su virtualización. En este empeño trabaja un equipo de 80 personas. La semana pasada se anunció un acuerdo por el que la empresa acogida por Intel entre sus storage builder partners, sin duda una buena noticia.

David Flynn

David Flynn

El cliente potencial es cualquier compañía que busque una solución SDS (Software-Defined Storage) sobre un sistema existente que no sea hiperconvergente. Puso de relieve Flynn que cada tipo de almacenamiento, ya sea en archivo o en bloque, crea su propia estructura o silo, lo que hace complicado mover los datos. «Se puede hacer, pero siempre que el suministrador sea el mismo y no siempre con los mismos productos», apuntó el CTO sin nombrar a nadie.

Para ser eficiente, una compañía necesita mover sus datos a medida que cambian sus necesidades, más aún con la cantidad de fusiones que se producen. La virtualización es una solución, que permite conectar los datos que se procesan con el movimiento de los que se almacenan automáticamente. Primary Data quiere conseguirlo a base de virtualizar todos los recursos físicos y lógicos, en un espacio común. Por un lado, se trata de conseguir mayor rendimiento – más velocidad de entrada y salida de datos – junto con más ancho de banda y menos latencia. Pero también más protección, duración, disponibilidad, prioridad, recuperación y seguridad.

Primary Data no se conforma con esta enumeración. También pretende que se pueda jerarquizar los datos en función de las necesidades y prioridades del usuario; es lo que llama ´objetivos inteligentes`: una suerte de menú – dice Flynn – para que cada usuario escoja sus prioridades. Si de algo va sobrada esta startup es de ambición: la impresión que se llevaron los cronistas fue que la solución es única e interesante, pero tendrá que llevarla a la práctica en entornos reales.

Igualmente ambiciosa, si no más, es la propuesta de Cohesity. Se trata, en su caso, de tener un almacenamiento secundario hiperconvergente, con la peculiaridad de que lo quiere hacer con una plataforma que consolide los datos y los sitios creados a escala web. En los sistemas tradicionales de almacenamiento secundario, precisa el fundador Mohit Aron, se producen múltiples fragmentaciones. En cambio con la plataforma consolidada de Cohesity se logra – según Aron – que los datos estén integrados y protegidos.

Como suele suceder, esta startup también tiene su intrahistoria. Mohit Aron es un tipo de mucho prestigio en el ambiente de los especialistas en almacenamiento. Fundó Cohesity en 2013, con el bagaje personal de ser un pionero de la hiperconvergencia, una arquitectura en la que convergen computación y almacenamiento simplificados mediante la virtualización. Su antecedente directo es haber sido fundador de la hoy célebre Nutanix y su CTO hasta concebir su actual aventura. Antes, entre 2003 y 2007, había sido parte del equipo de Google que diseñó su File System. Con semejante currículo, no le fue difícil recaudar 70 millones de dólares antes de hacer visible su nueva compañía.

La fragmentación es un tema que vuelve una y otra vez al discurso de Aron: si un cliente decide comprar productos diferentes de múltiples vendedores, tendrá que ocuparse manualmente del interfaz; la aparición del cloud añade más fragmentación. «En mi filosofía, cloud es como arrendar una habitación de hotel, y un datacenter privado es como tener una casa en propiedad: las dos fórmulas tienen cosas positivas». Suena tranquilizador, pero no lo es.

Mohit Aron

Mohit Aron

«Tal como la hiperconvergencia trastornó el mercado del almacenamiento primario, Cohesity quiere llevar la ´disrupciónal` almacenamiento secundario». Típicamente, este se usa para el backup de los datos primarios u otra forma de protección, por lo que implica una segunda copia. La idea que expone Aron es sugerente: una plataforma que almacene todos los datos secundarios en un silo único que además del backup abarque su análisis, desarrollo, test y archivado.

El modelo de negocio es de pago por uso: el usuario dispone de un único interfaz para visualizar sus archivos y flujos de trabajo, con lo que tiene un sistema de gestión simple y centralizado. Esto, subraya Aron, reduce el coste total de propiedad, tanto en capex como en el espacio requerido.

El colega Chris Mellor (The Register) ha descrito la oferta de Cohesity como «un enfoque elegante para un problema que preocupa a las grandes empresas, el alto coste de mantener silos múltiples para múltiples aplicaciones, hardware, interfaces y movimientos de datos, todo lo cual se resolvería con esta plataforma». ¿Tiene sentido concentrar todos los datos secundarios en un repositorio único y ahorrarse millones de dólares?, se pregunta Chris . La respuesta afirmativa sienta la base de un problema para decenas de empresas de almacenamiento.

Aron niega que Cohesity tenga ánimo de conflicto, pero sus alianzas excluyen a los ´incumbentes`: de momento, exhibe acuerdos de certificación con un proveedor ´todo-flash`(Pure Storage) y con un vendedor de servidores (Cisco), y dice estar abierto a trabajar con Dell. Una idea extraña, puesto que Cohesity podría dañar los ingresos de la marca tejana y, dentro de unos meses, ser una amenaza tangible para la oferta de EMC (Data Domain).

Minio es otra compañía creada en California por un ingeniero indio, que abunda en la misma problemática desde otro ángulo. En su caso, el almacenamiento de objetos, una tecnología que en los últimos años ha ganado terreno a favor de la multiplicación de datos no estructurados. Como suele suceder, esta startup tiene el impulso de emprendedor «accidental» según él) que ha ganado sus galones en batallas anteriores y goza del respaldo de varias luminarias del movimiento open source.

AB Periasamy

AB Periasamy

Anand Babu Periasamy [más conocido como AB] fue el creador de Gluster, un sistema de almacenamiento scale-out que vendió en 2011 a RedHat en 136 millones de dólares; al término de su contrato preceptivo de tres años, se puso a montar su siguiente aventura. El nombre de la empresa actual de AB es la contracción de minimum I/O, y su enfoque difiere de las anteriores en que se dirige a los desarrolladores, con el argumento de simplificarles el trabajo.

El almacenamiento objeto es una de las piedras sillares en la construcción de ´la nube`. Se usa preferentemente para almacenar datos binarios no estructurados como vídeos, imágenes y documentos, pero no índices ni metadatos. Amazon S3 es el servicio más popular en esta categoría, tanto que todos los demás asumen como requisito el ser compatibles con S3. Lo que no es óbice para la competencia: VIPR de EMC, Swift de OpenStack o Ceph, más abierto. Pese a ello, AB proclama que hay espacio para un recién llegado que se define como «la alternativa minimalista a Amazon S3». Sin complejos.

«Manejar bloques no es complicado – predica Periasamy – el problema es la cantidad de datos a almacenar, particularmente los no estructurados». Recibe a la prensa en una incubadora de negocios de Redwood City, y casi se disculpa por ser emprendedor reincidente: «volver a crear una startup de almacenamiento no era lo que yo quería, pero en la situación actual es una de las mayores oportunidades del mercado».

Los primeros elementos de la plataforma están disponibles en GitHub – gratuitamente, claro – y el dinero de los inversores deberá financiar los otros componentes: Minio Server, Minio Client y Minio XL. La idea que motiva a AB es la conquista de los desarrolladores con una solución evolutiva para que puedan lanzar sus proyectos. A diferencia de sus antecesores – explica el ingeniero indio – trabajar para ´la nube` les da una gran libertad de ejecución de sus aplicaciones mediante APIs abiertas. Emprendedor, sí, pero con principios.

[informe de Lluís Alonso]


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons