De Anthropic se pueden decir muchas cosas, pero ninguna de ellas la definirá por completo. La empresa fundada por los hermanos Darío y Daniela Amodei juega un papel insólito en lo que algún día será el mercado de la inteligencia artificial. Tiene buenos padrinos, Google y Amazon, sin caer en la dependencia ni decantarse por uno u otro. La comparación con OpenAI, sendas startups y supuestamente rivales cara a cara, eclipsa cualquier etiqueta posible. Los 7.300 millones que ha recaudado en los últimos doce meses y el lanzamiento de su modelo Claude 3 revelan una ambición de jugar en primera división de la imaginaria liga de IA. Por ahora, no muestra intención de ser devorada por un dragón.
Darío Amodei, CEO y su cara visible, no es un tipo veleidoso como Sam Altman ni provoca incomodidad en sus socios y aliados como hace Altman entre micrófono y micrófono . He ahí una diferencia que no se puede minimizar. En la línea de otros modelos de IA, Anthropic ha lanzado su nuevo LLM en tres versiones. De esta manera, Claude 3 trata de captar a un cliente empresarial o profesional [la versión Opus] como al gran público con Sonnet y a casos de uso que merecen una economía de recursos, con Haiku. La compañía afirma que su sistema está tan evolucionado que posee capacidades “casi humanas”, una audaz aproximación cognitiva que ya es un reclamo asfixiante que practican muchos propagandistas de la IA.
Lo que sin duda es cierto es que Claude 3 tiene cualidades como para ser un digno rival frente a los modelos más potentes de OpenAI, cuando a todos se les aplican métricas de rendimiento. Sólo está algo por debajo en capacidades y los sobrepasa en la ventana de contexto, parámetro que designa cuántas unidades elementales, como fragmentos de una palabra o una imagen, puede procesar a la vez un modelo. Alcanza los 200.000 tokens o unidades frente a los 128.000 de GPT-Turbo, el más sofisticado de la familia OpenAI. Aunque, todo sea dicho, estas referencias sólo sirven como referencia, porque la utilidad de la IA generativa dependerá del uso real que hagan los usuarios. Por cierto, Google Gemini maneja una ventana de contexto de un millón de tokens.
Más números avalan el asalto de Claude 3 al trono de la IA generativa. La versión Opus supera a GPT-4 en diez benchmarks, entre ellos el MMLU – utilizado para medir el grado de conocimientos generales- el GSM8k (que mide el nivel de matemáticas escolares), el Human Eval (de programación) y el HellaSwag (que evalúa el sentido común). En algunos de estos por estrecho margen, algo que se ha visto antes, cuando Google se expuso a comparar Gemini con el equivalente de OpenAI.
Desde luego, la finalidad de estas mediciones no es la exactitud, puesto que el resultado varía enormemente según la instrucción que reciban o de la preparación específica del modelo. Pueden comportarse de modo óptimo en las pruebas y después fallar a la hora de generalizar sus capacidades a situaciones que desconoce. Lo que parece más claro es el salto con respecto a la generación anterior.
Claude 3 demuestra mejores resultados en tareas cognitivas que incluyan razonamiento [discutible vocablo empleado en la literatura de Anthropic] o fluídez en el lenguaje [mucho más concreto]. También mejora la producción de análisis y la predicción, así como la creación de contenido, la generación de código y las conversaciones en varias lenguas. Además, tiene capacidades visuales mejoradas, con las que puede procesar fotografías, diagramas y otros gráficos, igual que GPT-4 – modelo de OpenAI para esta tarea – o Google Gemini. Otra referencia: puede resumir textos de unas 150.000 palabras, equivalentes a una edición de Moby Dick y muy por encima del límite de 3.000 palabras de ChatGPT.
Claude 3 Sonnet, pensado para el gran público, está disponible en la web de Anthropic y en los servicios de Amazon Bedrock y Google Vertex AI. Una distribución que pone de manifiesto el apoyo que los dos gigantes prestan a la startup. Los movimientos se desataron en poco tiempo: primero llegó Google acompañada de Salesforce y otros inversores y puso 450 millones de dólares sobre la mesa. Corría mayo de 2023 y, cuatro meses después, desembarcó Amazon con otros 4.000 millones. Poco tardó Google en anunciar una segunda inyección de 2.000 millones para que no se diga… Entremedias, los Amodei y sus capitalistas originales recibieron una remesa de 100 millones enviada por telecos asiáticas y, de remate, Menlo Ventures agrupo una serie de inversores para añadir 750 millones a la tesorería de Anthropic. No ocurre todos los días una carrera así por financiar una empresa emergente.
Por consiguiente, Anthropic es un exponente notorio de la lluvia de dinero que está regando el huerto de la IA generativa en 2023. Alrededor de 700 acuerdos de inversión cerrados, un 260% más que un año antes y sólo una parte de los 29.100 millones desembolsados para ayudar a unas cuantas startups que se los gastarán muy pronto. De esta cuantía, más de la mitad [10.000 millones corresponden a la transacción que urdieron Altman y Satya Nadella] son la suma ingresada por OpenAI y Anthropic.
Aunque OpenAI se lleve la fama, Anthropic carda la lana. La primera disfruta la inversión de Microsoft en forma de bono de cómputo en Azure para utilizar sus recursos e infraestructura. De la misma forma, Anthropic acordó comprar capacidad de cómputo a Google – aunque esta sugiere una separación deliberada entre el acuerdo y la inversión dineraria – para entrenar y distribuir su tecnología. También Amazon proporciona potencia de cálculo a su ahijada, escogida tras comprobar que era la herramienta de IA más popular entre los usuarios de AWS.
Una startup nada en aguas en las que quienes mandan son dos tiburones. Suficiente para despertar curiosidad en la Federal Trade Commission (FTC), que ha abierto una investigación por posible violación de las leyes antimonopolio. De nuevo, vidas paralelas (sin Plutarco) porque el trato entre Microsoft y OpenAI también es objeto de escrutinio por parte del organismo y del departamento de Justicia estadounidense. La fórmula empleada, que opta por invertir una cantidad abultada en lugar de intentar una adquisición, está pensada para esquivar los resquemores del regulador. A saber en qué acaba ese capítulo de la novela.
En todo caso, la trayectoria de Anthropic ha sido fulgurante, una lección que parece imposible de emular a este lado del Atlántico, como se está viendo: Europa es rica en predicadores sobre la IA pero pobretona en proyectos. A saber: Anthropic empezó en 2021 y el mismo año levantó 124 millones. Al año siguiente, llegaron otros 580 millones, que en parte fueron facilitados por Sam Backman-Fried, aquel tramposo de las criptomonedas. Su casa de cambio FTX, en bancarrota, conserva un 8% de Anthropic y ha pedido permiso a la justicia para venderlos en la próxima ronda que los Amodei decidan lanzar. Con el resto de las inversiones, se ha estimado que el valor de Anthropic está en unos 15.000 millones de dólares, con ingresos mensuales de 8 millones al mes, que aspira a multiplicar por ocho este año. Está muy lejos de la facturación anual de OpenAI: 1.000 millones de ingresos y 80.000 millones de valoración hipotética.
Es imposible evitar que OpenAI y Anthropic se vigilen mutuamente. Pero Anthropic está empeñada en marcar un perfil propio, incluso en el modelo de negocio. Ambas apuntan a la gran empresa – aunque a OpenAI le interesa vivamente el impacto entre los consumidores – dando calurosa acogida a los verticales de sanidad y servicios financieros. Daniela Amodei, presidenta de Anthropic, lo atribuye a que son áreas especialmente interesadas en el enfoque centrado en la seguridad y la fiabilidad del modelo.
Claro está, no hay que olvidar que Darío y Daniela se marcharon de su empleo en OpenAI cuando esta se acercó demasiado a Microsoft. Cuentan los cotillas que a ambos hermanos les inquietaba que el desarrollo del modelo sacrificara la seguridad y la ética, aspectos que enfatizarían en la presentación de su empresa. La gestora de inversiones Bridgewater, el centro de investigación médica Dana Farber Cancer Institute y la pródiga Salesforce se cuentan entre sus clientes. En favor de Anthropic hay que añadir su acercamiento a la educación, para la que su propuesta no apunta una inyección forzada de tecnología sino a dotarla de una sólida base ética. O eso prometen.
Entre 60 y 80 personas han trabajado en la parte central del modelo de IA, mientras que los aspectos técnicos se han dejado en manos de otras 120 a 150 individuos. El resultado ha sido un sistema multimodal [con capacidad de generar texto pero también imágenes fijas y vídeo], el tipo de producto al que tiende en este momento la industria.
Esto implica que los modelos son más complejos y multiplican los riesgos. Otro rasgo de la compañía es que, con menos temores a la pérdida de reputación, se relaja ante instrucciones que otros descartarían y que su marco ético original les impedía desarrollar por si las respuestas fueran inadecuadas. Un dilema que será cada vez más común cuando se esparza la hojarasca. Se ha visto con claridad cristalina en los problemas que ha encontrado Gemini, cuyo afán por no resultar ofensivo conducía a respuestas disparatadas.
Gran parte del éxito que se espera de Claude 3 como producto, va a depender del precio. Su versión más completa, Opus, se propone procesar un millón de tokens de entrada por 15 dólares; GPT-4, mejor financiada, se puede permitir tarifas más bajas, hasta 10 dólares por la misma cantidad procesada a través de su API. Sin embargo, la versión reducida de Anthropic, Haiku, es más barata que el equivalente de OpenAI: 0,25 frente a 0,50 y 1,25 frente a 1,50. Innegablemente, una oferta competitiva atrayente. Queda por ver cómo reaccionará la demanda cuando se trate de pasar del entusiasmo de la conversación a la viabilidad de un presupuesto.