9/10/2023

Un barniz de inteligencia para mejorar Alexa

Nadie osaría negar a Amazon su condición de pionera en muchas cosas, pero la verdad es que hace tiempo que Alexa y su familia de dispositivos carecen del ímpetu de su edad temprana. Domótica, reproducción de música, consultas por voz,… todo un catálogo de servicios vertebrados por el célebre asistente virtual, hoy lucen desfasados en espera de renovación. Tanto más cuanto que el advenimiento de la IA generativa hace que parezca viejuno. Esta es la clave de las novedades presentadas en setiembre con la indisimulable intención de preservar su su papel instrumental en una línea de negocio secundaria y hasta ahora subordinada a la actividad principal de la compañía, el comercio electrónico.

David Limp

Se trata, reconoce Amazon en su propaganda, de personalizar la experiencia de usuario para que Alexa y compañía sigan facilitando las transacciones que son la razón de existir de Amazon: compras por un lado, entretenimiento por otro. Activarlas con un simple comando de voz resultaba sorprendente en 2014, pero nueve años después es una trivialidad que muchos usuarios han relegado al trastero. Había, pues, urgencia en ponerse a la altura de los nuevos chatbots, que no sólo procesan consultas sencillas sino que ofrecen un simulacro de conversación.

Han confluído varias circunstancias. El nuevo CEO de Amazon, Andy Jassy, tiene la misión de enderezar los negocios que generan pérdidas, aunque su cuantía pueda parecer venial para una compañía que vale 1,3 billones de dólares en bolsa. No sirve, si es que alguna vez sirvió, el pretexto de que esas pérdidas son generosamente compensadas por los beneficios de otros negocios a los que Alexa sirve como soporte. Una prueba de que las pérdidas ya no son tolerables es que la división de hardware ha sido castigada con cuota desproporcionada de los 27.000 despidos comunicados en lo que va de año. No es que el fundador Jeff Bezos fuera magnánimo, pero Andy Jassy es un empleado agradecido.

Coincide, no casualmente, con un nuevo destino profesional de David Limp, quien ha sido el máximo responsable de la rama de dispositivos y que se marcha a dirigir Blue Origin, el capricho espacial de Bezos. Una sorpresa que se  bifurca: para ocupar la plaza de Limp, Amazon ha pescado un pez gordo, Panos Panay, VP ejecutivo y chief product officer de Microsoft. Recuérdese que bajo el mando de Panay se ha desarrollado la línea Surface de portátiles y tabletas y que a él personalmente le ha tocado supervisar el lanzamiento de Windows 11.

Es pronto para saber cómo encajará Panay en Amazon, después de 19 años con roles directivos en Microsoft, otra cultura corporativa. El momento parece idóneo para alguien de quien se dice que estaba descontento con los recortes que le impusieron en el desarrollo de dispositivos experimentales, una marcha atrás dictada por la situación del mercado.

Por otro lado, Amazon estaba hambrienta de nuevas ideas, que no abundan en la última camada de productos presentada por Limp el mes pasado. Ni el nuevo Echo Show 8 ni la segunda generación de gafas ´inteligentes` traen una revolución, aunque la adición de IA generativa se presente como tal. Tampoco tienen grandes atributos los altavoces infantiles inspirados en personajes de Marvel y Disney. Mejoran las cámaras de seguridad y el mando Fire TV, porque al menos simulan interacciones más “naturales” ya que entienden mejor el lenguaje de los usuarios.

A Alexa, sin duda la pieza central de este ecosistema, se le pueden pedir ideas para organizar una velada, indicarle que escriba un poema o actualice la lista de la compra o bien que busque aquella película de acción cuyo título no se recuerda. Son avances, pero hechos con tino: lo que Amazon ha querido con ellos no es una disrupción (sic) sino que su asistente haga mejor sus tareas principales: controlar la domótica y el entretenimiento digital, comunicar información y noticias en tiempo real. Queda la impresión de que otras funciones añadidas no pasan de ser ocurrencias, como el intento de humanizar a Alexa con una voz más expresiva y dotarlo de opiniones y preferencias, sin pasarse de la raya. Hacer que se identifique con el equipo favorito del usuario puede ser un buen truco para sostener las conocidas intenciones de Amazon en la retransmisión de eventos deportivos.

Claro está que la incorporación de la IA generativa en un chatbot conlleva dificultades, en el actual estado de la tecnología. A las consultas por escrito, sus competidores ChatGPT y Bing Chat devuelven respuestas con cierta latencia, fastidio que también provoca Alexa, por mucho que Amazon diga que su asistente es entre cinco y diez veces más rápido que los rivales. A diferencia de ChatGPT, tendría una mejor comprensión del mundo real -dijo Limp – porque mientras la base de conocimiento d OpenAI se detiene en los primeros meses de 2022, el LLM de Alexa ofrece información “en tiempo real” y es “más conversacional” que las versiones anteriores.

Rohit Prasad, director científico de IA de Amazon, explicó a la audiencia que la superioridad del LLM de Alexa es consecuencia de haber sido construído con cuatro componentes: el modelo en si mismo, los dispositivos y servicios del mundo real, el contexto personal y una IA responsable.

No hay por qué dudarlo, pero, en las interacciones con periodistas durante la presentación, Alexa dio varias respuestas erróneas, que pueden tomarse con paciencia o bien prestar atención a la intrigante explicación de David Limp. Según dijo, con los modelos grandes de lenguaje (LLM) existe riesgo de alucinaciones. Este es un eufemismo acuñado de urgencia para explicar los fallos de la IA, pero que acaba por esconder el verdadero problema: la posibilidad de que un asistente se convierta en vehículo de informaciones erróneas en cadena.

En los dispositivos para el hogar, las contrariedades pueden ocurrir si Alexa malinterpreta una petición y, por ejemplo, abre la puerta del garaje en mitad de la noche. En previsión de fallos que aún no controla, Amazon ha optado por limitar el tipo de dispositivos habilitados para recibir respuestas del asistente, entre los que excluye cualquier mecanismo de seguridad (como las cerraduras supuestamente inteligentes), que promete integrar más adelante en su oferta. Nada ha dicho, en cambio, acerca de los peligros potenciales de jaqueo.

La cuestión de la privacidad es la más problemática. La IA generativa tiene necesidad de una gran cantidad de datos para perfeccionar sus méritos y ajustarse a las necesidades del usuario. Amazon se vanagloria de no vender a terceros la información que recoge de sus clientes, pero le es muy útil para tomar decisiones sobre su negocio y para ´compartir` tendencias (anónima) con los inscritos en su marketplace.

Lo cierto es que la capacidad de estos dispositivos para captar y retener información es apabullante. Hay otro factor delicado: el anticipo de que habrá un Alexa separado para niños ha puesto los pelos de punta a los pedagogos: ¿es éticamente aceptable poner esta tecnología al alcance de los pequeños?

Son cuestiones aún por dilucidar y que darán mucho que hablar. Al igual que los fundamentos económicos del asistente. Cuando un usuario utiliza con frecuencia la IA generativa, el entrenamiento de esta tiene un coste bajo pero material por cada inferencia del modelo en la nube. En la que será su última presentación antes de dejar el puesto, Limp dejó sentado que la versión actual de Alexa será gratuita, pero en el futuro habrá otra u otras con capacidades adicionales sólo disponibles para suscriptores. Los analistas han pillado al vuelo al mensaje: Amazon tiene prisa por encontrar un modelo propio de monetización.

Este es un punto crucial. Porque no sólo Amazon lo tiene complicado. Google Assistant tampoco ha tenido éxito como fuente de ingresos y hasta ahora no le ha preocupado. Los altavoces y otro dispositivos de Amazon se han vendido a precio de coste con la esperanza de obtener rentabilidad de las compras o de suscripciones a contenidos digitales. La advertencia de Limp indicaría un cambio de estrategia que tendrá que gestionar su sucesor.

Hay que tener en cuenta que los Echo son los altavoces ´inteligentes` más populares mundialmente. Sólo en Estados Unidos, 71 millones de personas los usaron de media mensual en 2022, según Insider Intelligence, mientras se estima que la división de hardware de Amazon habría ´quemado` unos 5.000 millones de dólares. El nuevo enfoque busca revertir esta tendencia.

[informe de Pablo G. Bejerano


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons