9/05/2025

Amazon busca (tarde) hueco en los agentes de IA

Para extrañeza de propios y extraños, Amazon es el más rezagado de los colosos tecnológicos, el que más se ha dejado estar desde que a finales de 2023 se desató la fiebre de la inteligencia artificial generativa, tal vez con la pasmosa excepción de Apple, otro ilustre que no acaba de coger ritmo. Así que el gigante del comercio electrónico – y de la nube, que en la IA es más relevante – ha optado por una estrategia diferente. En  vez de pelear por los modelos fundacionales o por los chatbots de propósito general, se ha centrado en los agentes de IA: el lanzamiento de Amazon Nova Act llega a tiempo para dar la batalla, contra OpenAI o Anthropic y para rivalizar con Microsoft y Google.

Desde luego, la intención de Amazon es clara y plausible: placar a los otros grandes proveedores en la nube, mejor posicionados que su filial AWS en lo que concierne a la IA generativa. Ha elegido un terreno, los agentes de AI, que tienen a medio mundo agitado y a la otra mitad expectante. Interés manifiesto en un contexto donde OpenAI y Anthropic (participada por Amazon) han mostrado tecnologías capaces de realizar tareas autónomas.  Google,  Microsoft y Salesforce – también ServiceNow y los que vendrán – han potenciado esta figura como una pócima para la productividad empresarial.

Permitir la ejecución de tareas autónomamente va bastante más allá de las capacidades extensivas – y un poco revueltas – de los chatbots generales al uso. La idea subyacente es que sirvan de ayuda en procesos específicos del negocio. Y esta otra: Amazon Nova Act ha logrado excelentes puntuaciones en algunos benchmarks que evalúan la inteligencia y capacidades de los agentes de AI. Basado en un modelo fundacional llamado Nova, el software de la compañía puede ejecutar tareas en un navegador de forma autónoma. Está preparado para completar formularios, comprar productos (cómo no, viniendo de quien viene) o hacer reservas de vuelos.

De momento, Nova Act solamente está disponible para investigación. Por una razón aparente: Amazon prefiere rearmarse silenciosamente antes de entrar en la carrera cuando s sienta preparada. Al inicio, sus modelos Nova, en los que está basado el agente, eran accesibles por invitación, mientras que ahora puede usarlos cualquiera.

El sigilo de Amazon no implica que no haya un sólido trabajo detrás. En diciembre, durante la conferencia re: Invent, el CEO de la compañía, Andy Jassy, presentó en sociedad una familia de cuatro modelos denominados Micro, Lite, Pro y Premier, cada uno de ellos representativo de tamaño, complejidad y capacidad (y coste) ordenados de menos a más. Junto con ellos, de naturaleza multimodal, Jassy anunció dos modelos creativos: Canvas, de generación de imágenes, y Reel, para la creación de videos.

Todo el andamiaje es fruto del AGI SF Lab, instalado en San Francisco y dirigido por David Luan (quien fuera por varios años VP de ingenieria de OpenAI). En teoría, el equipo de Luan tendría como meta la elusiva IA general (AGI, pero desde que los fichó Amazon se han consagrado a poner en escena la tecnología “agéntica”.

Hay algo más en esta historia que remite a OpenAI. Un colaborador destacado es Pieter Abbeel, catedrático en Berkeley y también veterano de la empresa fundada por Sam Altman. Abbeel se especializa en las aplicaciones de robótica, rasgo que lo hace indicado como asesor en el comportamiento de “entidades” autónomas como los agentes IA.

El laboratorio californiano ha servido a Amazon para ajustar el tiro en sus planes de IA enfocados en los agentes. De Luan se conoce una aproximación más pragmática que la de otros prófugos de OpenAI. Segùn ha escrito, lo que ha demorado la expansión de los agentes de IA ha sido lo que llama “el problema Waymo”. Tal como suena: en su argumento criticaba la frivolidad de ilusionar con demos asombrosas cuando el resultado no está suficientemente pulido.

Por seguir su ejemplo, los coches autónomos necesitan ser entrenados para manejar distancias absolutamente inusuales, antes de salir a circular por las calles sin supervisión. ¿Qué relación guarda esa tesis con los agentes de IA? Que estos son una fusión de modelos LLM con una larga lista de reglas programadas por personas y diseñadas para impedir que cometan tropelías. Pero – he ahí el nudo – precisamente esto hace que el comportamiento de los modelos sea especialmente pobre. En consecuencia, para pulir Nova, Amazon ha llevado a cabo un entrenamiento adicional con aprendizaje por refuerzo, orientado a la toma de decisiones sobe las acciones que se encomiendan al software y cuándo.

Claro está que para quien llega tarde como para quien se adelanta, la  competencia es feroz. Proliferan los modelos “de razonamiento”, con capacidades de planificación, cimientos de los nuevos agentes IA. Gemini 25 Pro es la baza de Google, pero en ese espacio compiten o3 y o4-mini de OpenAI o bien Claude 3.7 Sonnet, de Anthropic.

En este panorama, la estrategia de Amazon para despuntar aun llegando rezagada pasa por mimar a los desarrolladores y exprimir el precedente de Alexa. En febrero, anunció una nueva versión de su asistente, que muchos daban por jubilado. Ahora, Alexa es capaz – son ejemplos variopintos de Amazon – de ayudar a concertar la visita de un servicio de reparación de electrodomésticos, pedir una ensalada a una cadena de restaurantes o reservar una mesa para cenar. Esta es, evidentemente, una evolución más útil de las antes llamadas skills.

Para los desarrolladores, Amazon ofrece un SDK que facilita la construcción de agentes de IA utilizando Nova Act. De esta forma, quiere atraer a una masa de programadores y empresas que desarrollan software sobre la infraestructura de AWS. Al mismo tiempo, esta efervescente actividad ayudaría a descubrir nuevas aplicaciones y casos de uso que refuercen el papel de Amazon.

El SDK permite a los desarrolladores incorporar capacidades de agentes de IA en sus aplicaciones. Plantea un esquema segmentado en pequeños comandos diferenciados, de modo que la programación se pueda hacer mediante bloques sencillos. No ha sido pensado para completar flujos de trabajo enteros con una instrucción, tendencia que siguen otros agentes para imitar el modo de actuar de los LLM. En su lugar, Nova Act se orienta a ejecutar tareas más abarcables y cuya verificación sea más factible. Con esto se pretende la dualidad flexibilidad + fiabilidad, ¿quién no lo firmaría?

Si una ventaja tiene Amazom es la de contar con una visión panorámica de las necesidades de los desarrolladores. En su nube ya funciona un millar de aplicaciones de IA generativa. La información extraíble de este gigantesco campo de pruebas le resultará valiosa a la hora de recuperar terreno perdido en la carrera precedente. Sobre todo, con un entorno empresarial que cada vez pone más la vista en los agentes capaces de automatizar cierto tipo de tareas concretas.

[informe de Pablo G. Bejerano]


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2025 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons