6/09/2024

Asistentes inteligentes, una fórmula resultona

Tras una primera fase, la curiosidad se ha transmutado en entusiasmo; ahora mismo, lo que IA generativa necesita es convencer, multiplicar usuarios y generar ingresos. Sin ellos, se cortaría el flujo de inversión. O sea que hay que buscarle utilidades para que de una vez surja un modelo de negocio. Entre las empresas, los esfuerzos ya van bien encaminados, a falta de limar asuntos como las alucinaciones y ciertas inexactitudes en la argumentación comercial: aparece gradualmente una variedad de aplicaciones. No está escrito que ocurra lo mismo entre los consumidores, aunque unos cuantos millones hayan catado la golosina. Falta justificar un precio, asuntillo en el que pocos habían pensado.

Se supone que la fórmula más a mano para seducir masivamente a los consumidores seria lograr que la IA generativa se encarne en un hardware cuya función llaman asistente o a veces agente. El primer empujón, incorporar la IA en los smartphones, está casi a punto, en espera de que maduren los AI PC.

Como es lógico, los fabricantes de unos y otros dispositivos están encantados de sumarse al movimiento, pero van a tener que encajar muy bien las piezas, porque en este caso se trata de sostener un modelo de negocio, no de apuntalar otro existente, aunque esto no pueda descartarse. Y los proveedores de la IA  generativa no sólo buscan ratios de adopción sino que se materialice (esto es, se monetice) mediante el pago de suscripciones.

A priori, esta sería hoy la única forma imaginable de rentabilizar los costes que implican los modelos de IA (grandes o pequeños). Durante la presentación de sus nuevos dispositivos Pixel, Google incorpora en alguno de ellos su versión de Gemini por voz, a la que se accede mediante una suscripción de 20 dólares al mes. Como siempre ocurre con esta familia de terminales acuñados por la compañía, más que disputar cuota de mercado a otras marcas que usan Android, lo que se pretende es mostrar la dirección en la que debería marchar la industria.

Para Google, que presentó estas novedades en su evento Made by Google el mes pasado, la IA generativa es claramente un elemento que diferencia los dispositivos Pixel de las numerosas marcas que tienen en común su adhesión al sistema operativo Android. Se ha señalado que su ventaja es que no cuenta con cuotas de mercado previas que le obliguen a pelear por una posición en el ranking; por consiguiente, tiene perfecto derecho a pensar que los Pixel sólo pueden crecer.

En este caso, además de mostrar las capacidades de Gemini Advanced (versión de su modelo de IA que incorpora dotes conversacionales por voz), los Pixel 9 siembran otras pistas para guiar a los fabricantes: un año de gratuidad a los usuarios que compren determinados terminales, es un camino que ya explora Samsung, cuyos móviles de alta gama ofrecen ciertas prestaciones de IA que son temporalmente gratuitas. No está claro, sin embargo, qué pasará más adelante, pero es una iniciativa reveladora.

Por su parte, Apple – que no tiene costumbre – ha comprendido que si quiere que el “nuevo Siri” con funciones muy mejoradas y conexión a ChatGPT, se utilice y se disemine entre un público masivo tendrá que ser gratuito para los usuarios de las camadas del iPhone que saldrán al mercado a partir de la semana entrante. Aun así, los analistas de Wedbush contemplan que la gratuidad durará poco, sólo el tiempo suficiente para que juegue como incentivo y desaparezca antes de crear hábitos. Nadie podrá acusar a Apple de cambalache: el usuario sabrá que más pronto que tarde le tocará pagar: al fin y al cabo, la marca hará de la inteligencia artificial avanzada un emblema del que en orgullercerse.

Amazon no se quedará quieta mientras sus rivales dan esos pasos. En octubre tiene previsto presentar un asistente Alexa renovado, que se basará en la IA de su participada Anthropic. No parece decidido – o al menos no se ha adelantado – si tendrá un precio per se o será un producto/servicio empaquetado para los suscriptores de Prime a cambio (o no) de pago adicional.

Gemini Advanced, que – lo dice Google – contaría más de un millón de suscriptores, tiene muchas otras funciones aparte de la conversación ´inteligente`. Puede escanear documentos para extraer de ellos la información más relevante, generar gráficos y visualizaciones de una hoja de cálculo, así como imágenes a partir de una instrucción de texto. O responder preguntas y resumir llamadas telefónicas, que sin duda son aplicaciones más o menos interesantes según a qué precio.

Además, la IA de Google deja que el usuario le interrumpa sin que la experiencia se vea entorpecida, como ocurría en los primeros Google Assistant. La integración con aplicaciones del ecosistema de la marca  hará posible usos transversales de Gemini, una forma de lograr que la interacción sea más efectiva y natural.

Este esfuerzo por mostrar la utilidad de la IA generativa en un móvil recuerda las intentonas de la generación precedente de asistentes personales en la que el de Google competía con Alexa (Amazon) y Siri (Apple). De estos – que, por cierto, no presumían de inteligencia – los consumidores se aburrieron pronto. Condición natural para que una nueva generación barra a la anterior. Por el momento, Google Assistant no ha sido sustituido, pero es lógico esperar una consolidación de modelos.

Que un cacharro digital cumpla tareas específicas siguiendo un guion aprendido – encender o apagar las luces, recordar una cita, buscar una canción o actuar como buscador de informaciones puntuales – resulta poco inteligente a juicio de un consumidor de 2024. Para empezar, no se puede mantener una conversación con estos asistentes condenados al desuso.  Otra cosa será con sus sucesores, entrenados con lenguaje natural, capaces de asimilar una pregunta y responderla con más corrección a medida que se usan. Las cajas de texto de chatbots como ChatGPT, de OpenAI, dejarán paso a los modelos multimodales.

Lógicamente, el mercado es provisional, con la explicación de que su uso permitirá ajustar sus funciones e ir escalando la infraestructura. La función de voz de ChatGPT todavía no está disponible. Pero los consumidores no ven OpenAI como una marca y esto devuelve la pelota al tejado de las que tienen reconocimiento como asistentes.

Tanto bregar y reconfigurar un mercado está dando lugar a una confusión terminológica en torno a los servicios de la inteligencia artificial. Se habla de chatbots, asistentes y agentes como si fueran sinónimos, que no lo son. Si acaso, son conceptos resbaladizos cuya diferencias convendría señalar. Brevemente, serían estas: 1) los chatbots están diseñados para simular una conversación entre la máquina y el usuario siguiendo un guion predeterminado, suficiente en la atención al cliente, 2) los asistentes entienden el lenguaje natural, aprenden de las interacciones y están preparados para llevar a cabo instrucciones sencillas y 3) los agentes gozan de cierta autonomía y son capaces de tomar algunas decisiones, vienen empaquetados en un servicio que requiere mínima intervención humana, como los que Meta ha distribuido por sus plataformas para contestar y publicar mensajes.

La diferencia principal entre los asistentes y los nuevos agentes residiría, pues, en la autonomía y capacidad de aprendizaje de los segundos. Combinan técnicas de machine learning con IA propiamente dicha, así como procesamiento de lenguaje natural y disponen de componentes múltiples para aprender por refuerzo. Pero – y es mucho pero – aún no está claro cuál será su aplicación: el razonamiento de los modelos mejorará y, por tanto, su capacidad para llevar a cabo nuevas tareas, pero hay que reconocer que los LLM en los que se apoyan los agentes distan de ser perfectos.

Basta con que en alguna ocasión el agente de IA falle en su tarea – aunque sea en un porcentaje mínimo – para que no resulte fiable. Así, por ejemplo, si un software para reservar vuelos se equivocara en uno de los pasos, arrojaría resultados incorrectos. Ha de tenerse en cuenta que probablemente los agentes de IA del futuro estén compuestos por  múltiples LLM en lugar de uno solo, con la complicación que es de imaginar. Cuanto más tengan que hablar entre sí los LLM, mayor precisión cabrá esperar de ellos, pero hay otros puntos susceptibles de producir errores por incomunicación.

Con todo, a falta de descubrir qué encarnación definitiva adquirirá la IA generativa, las estimaciones levantan expectativas. La consultora Omnia apunta que su volumen de negocio crecerá desde los 6.200 millones de dólares en 2023  a los 58.500 millones en 2028, una tasa de incremento anual del 56%. Para ello, el primer paso sería su expansión en los smartphones: Gemini ya ha aterrizado y Apple está a un paso de lanzar un joven Siri vitaminado con Apple Intelligence, con el iPhone cosecha del 2024.

[informe de Pablo G. Bejerano]


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons