Recapitulando: históricamente, la moderna industria del almacenamiento de datos se ha levantado sobre un mercado de sistemas externos, con EMC y NetApp como primeros exponentes, que arrastraron detrás a los fabricantes generalistas. Este peculiar reparto del mercado es representativo de una visión estadística del sector, pero no refleja cabalmente la pluralidad de tecnologías que han aparecido en los últimos años. El fruto de estos movimientos ha sido la proliferación de compañías innovadoras que alimentan la dinámica del mercado. Si la primera parte de la crónica estaba dedicada a la tecnología flash, esta segunda parte corresponde a la de almacenamiento basado en objetos.
Con el viento a favor de la tendencia Big Data, los proponentes de esta tecnología se han cargado de razones para propugnar su superioridad sobre sobre los sistemas de ficheros: según ellos, se puede almacenar un gran volumen de datos más eficientemente y con acceso más rápido. Pero tiene que pasar un tiempo antes de que la mayoría de los proveedores de servicios – sus clientes naturales – asimilen esas virtudes; para entonces, tal vez la ventaja obtenida por haber llegado antes, haya menguado.
El almacenamiento basado en objetos trata los datos de manera diferente a los sistemas tradicionales, que se basan en el nombre de un fichero y su lugar en una carpeta. Cada archivo es almacenado como un objeto, una entidad formada por los datos y sus metadata, a la que se asigna un único identificador. Los partidarios de esta tecnología sostienen que puede escalar mucho más allá de la convencional, con volúmenes ilimitados y sin riesgo de cuellos de botella; sobre todo, sería más barata en hardware, software y costes de gestión.
Velocidad, eficiencia espacial y escala son los principales atributos de esta tecnología. Hasta ahora, el almacenamiento basado en objetos había sido usado para contenidos fijos de datos no estructurados, en los que la ratio de acceso suele ser lenta. La oferta existente se materializaba en suministradores independientes que fueron a su vez adquiridos por EMC (Centera, Atmos), NetApp (Bycast) o Hitachi (HCAP). Pero la gira del grupo de periodistas europeos por el Silicon Valley ha permitido conocer otras propuestas interesantes, que juegan la baza de su pertinencia para los proveedores de servicios cloud.
Atmos, un producto absorbido por EMC, es considerado como líder de la categoría. Le ha surgido un competidor con agallas, llamado Caringo, cuyo producto CAStor ya ha sido adoptado por OpenStack, una ascendente plataforma open source de servicios cloud.
La pregunta era obvia: si tan evidentes son sus cualidades, ¿por qué es tan baja la penetración de esta tecnología? El CEO de Caringo, Mark Goros, explica: “lleva tiempo cambiar una industria; los sistemas de ficheros son muy populares, pero vemos un futuro diáfano para el almacenamiento basado en objetos por la abundancia de datos no estructurados y el crecimiento de Big Data […] acabamos de despegar, y lo que hemos hecho hasta ahora ha sido trabajo de misioneros”.
CAStor, la solución que propone Caringo, tiene – según Goros – unos 400 clientes, una cuarta parte de ellos a través del acuerdo con Dell, que la comercializa bajo el nombre DX6000. Este acuerdo es la causa notoria de que la compañía haya entrado en beneficios a mediados de 2011, pero las partes no parecen tener prisa en llevar más lejos sus relaciones.
Scality, fundada por Jerôme Lecat, emprendedor en serie francés residente en San Francisco, se postula como alternativa para replicar grandes conjuntos de datos gracias a su tecnología Ring de “almacenamiento orgánico”. Actualmente, la compañía tiene 25 clientes; parecen pocos, pero entre ellos hay nombres prominentes que soportan 50 millones de usuarios finales. Lecat dijo al autor de este blog que los test independientes dan apreciables ventajas técnicas al producto de Scality sobre Atmos. 2011 ha sido importante para la joven compañía, creada por Lecat tras vender su anterior aventura empresarial, Bizanga. El año se inició con una segunda ronda de financiación exitosa, y se cerró con un crecimiento del 120%, gracias a contratos con clientes como TimeWarner Cable, la agencia espacial alemana y plataformas web como Openwave y Zimbra, entre otros.
Sus productos son descritos como “la única tecnología de almacenamiento que puede combinar el rendimiento exigido por la era cloud y la eficiencia de costes por petabyte”. Scality emplea una estructura de anillo de nodos x86 que almacenan objetos – no ficheros ni bloques – y que pueden trabajar en paralelo. Los nodos soportan estado sólido o discos, según los casos, con una latencia estimada por debajo de los 40 milisegundos, a un coste de un dólar por gigabyte.
“El sector del almacenamiento nunca ha estado tan vivo y dinámico como en la actualidad”, presume Lecat. Según él, el “almacenamiento orgánico” que predica Scality es una evolución del almacenamiento basado en objetos, que se encuentra todavía en su infancia, pero presenta ventajas fundamentales al hacer más fácil el despliegue en grandes entornos corporativos. La diferencia de costes entre una nube privadas y una pública no tendrá razón de existir, pronostica. A condición, corresponde añadir, que su entusiasmo de fundador orgulloso de su criatura se cumpla: performance, escalabilidad y TCO más bajo, simultáneamente. A comprobar en una futura visita.