12/12/2024

Meta, paladín del código abierto en la IA

Muchos han sido los cambios en Meta estos últimos años.  Deseados o forzados, buenos o malos, muchos han tenido en vilo a la compañía y  a sus empleados. En Mark Zuckerberg, el único apreciable ha sido el corte de pelo (y el color en las camisetas) algo que en los hombres suele ocurrir al llegar a los 40. A punto de entrar en el 2025, Meta está – como todas las Big Tech – enfrascada en la digestión de la IA generativa. Gracias a una importante experiencia previa, ha podido gestionar la recogida de velas tras los dislates del metaverso, para centrarse en el desarrollo de un modelo propio, capaz de competir con ChatGPT o Gemini: lo ha llamado Llama 3 y se caracteriza por ser de código abierto.

Yan Le cun

Según lo que se dice y escribe, está siendo un éxito, sin los conflictos que afligen a otras compañías. La comunidad de desarrolladores ha contribuido al código y Llama 3 está siendo bien aceptado. El progreso ha sido meteórico: a finales de 2022, Meta lanzó su modelo Galactica, con alcance restringido a los científicos, pero ciertas salidas de tono y unas reacciones desabridas aconsejaron cerrarlo a los tres días. Doce días después, el mundo se enteró de la existencia de Chat GPT que inició el frenesí actual con la inteligencia artificial generativa. La tecnología de Meta estaba muy por detrás y de ella nunca más se supo.

Todo el mundo recordaba que Zuckerbeg había proclamado pomposamente su apuesta por el metaverso sólo un año antes y no podía bajarse del ensueño tan pronto como convendría a las finanzas de su compañía. Para ponerse al día en la IA generativa, Meta tuvo que mudar de actitud. Una secuencia que habría sido imposible si Zuckerberg no ejerciera un control absoluto sobre el rumbo a seguir: cualquier otro fundador hubiera sido cuestionado, no así el de Facebook reconvertida en Meta.

En febrero de 2023, se formó un equipo con la función de acelerar el desarrollo de la tecnología LLM (Large Language Model). Símbolo de una migración de recursos fue el fichaje de Ahmad Al-Dahle, antiguo empleado de Apple que, tras unirse a Meta en el proyecto de metaverso, fue reasignado a encabezar el grupo que definiría Llama 3, cuando aún no tenía nombre.

En realidad, el empuje se remonta a 2013: fue el año en que Zuckerberg reclutó a Yann LeCunn, renombrado profesor de la Universidad de Nueva York y especialista en redes neuronales, para supervisar y orientar los trabajos del recién creado FAIR (Fundamental AI Research). Años más tarde, cuando Meta vivió un debate interno acerca del lanzamiento de Llama 2 en código abierto, se impuso la tesis abanderada por LeCun, gran defensor de esta filosofía de desarrollo.

Inicialmente, Llama 2 sólo estaba disponible para la comunidad científica, pero su código se filtró y entonces Meta anunció que lo lanzaría en julio de 2023. Esta fórmula ayudaría al modelo a crecer con la contribución de los desarrolladores, ansiosos por ser reconocidos tras sentirse ninguneados por otras tecnológicas.

Cuando Llama 3 estuvo listo para su lanzamiento en distintas versiones, entre abril y junio, ya igualaba o superaba a los prominentes, desde OpenAI a Anthropic. Google aún seguía dándole vueltas a Gemini). Una ventaja decisiva de Meta era y es que entrena su herramienta con los datos compartidos voluntariamente por miles de millones de cuentas de Facebook e Instagram.

A la fecha, la compañía ha desplegado Meta AI, basada en Llama 3, en sus cuatro líneas de negocio: Facebook, Instagram, WhastApp y Messenger. Aunque no lo ha hecho en Europa debido a la manifiesta incompatibilidad con el RGPD). Los usuarios pueden interactuar con el chatbot e incluso crear su propio agente conversacional. La tecnología se incluye en las gafas Ray Ban lanzadas por Meta tras un extraño acuerdo con la italiana Luxottica, dueña de la marca, pero también en el dispositivo de realidad virtual Quest. Está previsto el lanzamiento de un buscador basado en AI.

Los modelos de Llama (que por cierto no alude al camélido andino sino a la sigla de Large Language Models Meta AI) han sido descargados 600 millones de veces desde sitios populares, entre ellos la comunidad de Hugging Face. Esta difusión conlleva que hay muchos miles de desarrolladores que experimentan e investigaban en torno al software de Meta como no lo pueden hacer con ningún otro LLM del mismo nivel.

Este ejército de desarrolladores construye sobre la plataforma, desarrolla mejoras, corrige fallos y refina resultados. Para Meta se ha convertido en una forma de acelerar la innovación y, además, actúa como polo de atracción para el talento que prefiere no trabajar con sistemas propietarios. Otra de las ventajas aireadas por la compañía es que se evita depender de tecnologías de terceros, circunstancia de la que tiene malas experiencias en el pasado (sin ir más lejos, con los cambios en la política de privacidad de Apple en su AppStore).

Aunque los modelos no son cabalmente de código abierto al no cumplir uno de los requisitos: Meta no revela las bases de datos (parte del material proviene de los usuarios de sus redes sociales) con las que ha entrenado al sistema. Además, ha impuesto que ninguna compañía con más de 700 millones de usuarios activos al mes puede utilizar su software, una medida establecida para impedir que sus competidores se aprovechen de la tecnología de Meta.

Pero comparte el código fuente y los pesos dentro del modelo. Estos son valores matemáticos que han aprendido el sistema a base de utilizar información en su entrenamiento. Se trata, como imaginará el lector, de un aspecto importante para los pequeños desarrolladores. Analizar un gran volumen de datos requiere poner a trabajar cientos de chips especializados que cuestan decenas de millones de dólares. Y contar con unos recursos gratuitamente supone que muchas empresas pueden desplegar software basado en Llama de forma sencilla, rápida y barata.

Con ello, Meta aspira a que sus modelos Llama se conviertan en un estándar. Con este propósito, la compañía se ha acercado al sector público en Estados Unidos, como socio indispensable para buscar una adopción a gran escala. No es la única empresa de IA generativa que ha contactado con el gobierno federal. A OpenAI y Anthropic no les duelen prendas a la hora de compartir sus modelos con el AI Safety Institute, creado por una orden ejecutiva del presidente Biden para colaborar en la investigación de la tecnología. Google tiene su propio historial – resistido internamente – de colaboraciones con el Pentágono, mientras que Amazon y Microsoft disfrutan de vínculos fuertes en Washington. Un problema que podría tener Meta deriva de la ojeriza que el presidente electo tiene por la compañía y su fundador; esto explica la urgencia de Zuckerberg por peregrinar a Mar-a-Lago inmediatamente después de las elecciones. La comida fue fructífera, según dicen que dijo Donald Trump.

La idea subyacente de todos estos movimientos es discernible: popularizar el modelo. Meta espera que Llama sea adoptado masivamente y que fabricantes como Nvidia o AMD optimicen sus chips para ejecutar el software de la IA de Meta. Por el momento, está en camino la siguiente generación del modelo: Zuckerberg ha señalado que su lanzamiento tendrá lugar a principios del nuevo año. Se sabe que Llama 4 está siendo entrenado en un clúster de más de 100.000 GPU Nvidia H100, especializadas en este tipo de tarea. Por comparación, en el entrenamiento de Llama 3 se usaron 25.000 H100.

Claro está que el enfoque de código abierto también presenta varios inconvenientes. Por una parte, la compañía pierde el control sobre la tecnología e incluso podrían salirle competidores que la superen en IA generativa utilizando Llama como base. Aunque es muy cierto que el negocio de Meta está en sus redes sociales y en la publicidad, no en la comercialización de su IA.

No obstante, circulan opiniones escépticas entre los inversores acerca de la viabilidad económica de Llama. Inquietud que apenas ha trascendido gracias a que los buenos resultados de Meta no inspiran ánimo critico: un incremento del 19% en ingresos y del 35% en sus beneficios en el tercer trimestre. Pero el ojo está puesto en el enorme desembolso que se supone: no hay cifras específicas sobre el dinero que se gasta en Llama, pero el total de gastos de la compañía puede ascender a unos 40.000 millones de dólares en 2024. Un 42% más que en 2023 y la previsión de una cifra superior en 2025, avisó Susan Li, CFO de Meta.

Mientras tanto, Llama 3 ha recalado gratuitamente en compañías que disponen de chequeras saneadas, como Goldman Sachs, AT&T o Accenture. Los inversores en Meta se preguntan de dónde y cuándo vendrán los ingresos de la IA. La compañía responde que ya aporta una mejora en sus redes sociales y acabará repercutiendo en la generación de contenidos de valor y en oportunidades de servir anuncios. Estos argumentos tendrán que ponerse a prueba.


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons