26/03/2025

Gemini en el núcleo de la galaxia Google

Sería redundante repetir aquí algo que los lectores saben de sobra: la IA generativa está remodelando toda la oferta de la industria tecnológica. Nadie podría quedarse al margen y tal vez sea Google la que menos puede permitírselo: acaba de lanzar una andanada de novedades bajo su modelo Gemini. No son mejoras técnicas – conocidas desde diciembre en Gemini 2 – sino del desembarco de este último en servicios clave para la compañía. El más crítico de todos, la función de búsqueda. Aunque no altera – ni convendría que lo hiciera – los cimientos de su buscador: los  cambios, que son muchos, se van  desplegando con la máxima cautela, para preservar su reputación, su audiencia… y su recaudación.

Las búsquedas están en el nacimiento de Google y – directa o indirectamente – representan todavía una porción muy considerable de sus ingresos. De ahí que al introducir Gemini en su buscador lo haga con pies de plomo. La IA podrá acceder al historial de búsqueda de los usuarios, previo consentimiento, para personalizar sus respuestas, lo que quiere decir que Gemini sabrá qué páginas han sido visitadas, en qué noticias se han detenido o cuáles son sus fuentes de referencia sobre cualquier tema, ya sea para profundizar en la actualidad económica o cómo reparar un enchufe en su casa.

Esta es una posición que eventualmente podría conducir a frustraciones. El chatbot de Google contestará la consulta del usuario basándose en las fuentes que este acostumbre utilizar, tal vez en detrimento de la objetividad. Pero la personalización no se detiene aquí: Google ha anunciado que en los próximos meses Gemini podría tener acceso a la información en otras aplicaciones de su ecosistema, como YouTube o Photos. El argumento a favor es que así podría optimizar los resultados, acercándose lo máximo a las presuntas intenciones del usuario

Hay aspectos en Gemini que podrían constituir una ventaja frente a ChatGPT y a otros rivales que vienen alzando la cabeza. No hay que perder de vista que lo que está en juego es el uso de Gemini, no del uso de Google: cualquiera que acuda al buscador seguirá encontrando el interfaz y los resultados de antes. Pero la compañía experimenta desde hace tiempo con respuestas basadas en IA generativa con su programa AI Overviews; a  esta iniciativa ha sumado AI Mode, una pestaña dentro del buscador que invoca resultados extraídos con IA. En esta fase de prueba, ambas funciones sólo están disponibles para un número limitado de usuarios.

Gemini 2.0 es el motor de todas estas iniciativas y también de la herramienta Deep Research, que hace un análisis más profundo sobre la consulta del usuario. Esta clase de búsqueda – que también ofrecen ChatGPT y Perplexity – está disponible gratuitamente pero dentro de ciertos límites. Sólo podrá usarse “unas pocas veces al mes”. Es explicable: al ser más refinados y exhaustivos, los resultados requerirán más recursos de computación y, por lo tanto, elevarán los costes.

En su ambición de colocar a Gemini como vertebrador de su oferta, era de esperar que Google optara por sustituir Assistant por la nueva oferta. Así será, pero gradualmente, por pura precaución. El asistente de voz será reemplazado primero en smartphones y luego en tabletas, antes que en Android Auto y en los wearables. Téngase en cuenta que Assistant nació en 2016 con vocación de interfaz conversacional para las tareas del día a día y obtener respuestas de Google. Su rendimiento ha sido más bien pobre, al igual que el del resto de asistentes personales de su generación (Siri y Alexa). Ninguno de ellos interpretaba correctamente los comandos de cierta complejidad y, al final, su uso real se ha quedado en pedir música y configurar alarmas, poco más.

Google no ha aclarado del todo qué nuevas funcionalidades aportará Gemini por comparación con su ancestro, pero se puede prever que sea más eficiente a la hora de llevar a cabo tareas para las que teóricamente estaba preparado el anterior asistente. A primera vista, dos de las ventajas que trae la nueva IA son su entendimiento del lenguaje natural y su capacidad para promover la interacción de varias apps para conseguir un resultado. Precisamente, este es un factor diferencial con los modelos de OpenAI. Gemini está presente en Android, con los permisos e información del sistema necesarios para convertirse en un asistente personal cuando llegue el momento. En cambio, a ChatGPT le falta el bagaje que Google ha adquirido durante años acerca de las formas de uso de los dispositivos. Además, Google tiene alianzas de gran calado para integrarse en el sistema operativo de aparatos móviles.

Aparte, también se ha anunciado la disponibilidad de Gems y sus agentes de IA para las cuentas gratuitas. Estos chatbots están diseñados para ocuparse de tareas específicas, pero el usuario puede crear sus propios agentes para cualquier actividad susceptible de automatizar. Gems en Gemini facilita a los usuarios la creación de sus propios expertos de IA personalizados en torno a una serie de tópicos personalizados, sin necesidad de habilidades para machine learning. Como muestra de una política más general, la compañía ha anunciado Gemini with Personalization, con carácter experimental y opcional que permitirá – cuando esté disponible – que los usuarios conecten Gemini con su historia de búsquedas para valorar las respuestas del asistente evolucionado.

Este catálogo de funcionalidades, normalmente gratuitas, requiere una cantidad nada desdeñable de inferencia en su procesamiento. Dar acceso al público general a sus modelos de IA más costosos conllevaría gastos considerables que Google prefiere no asumir para no crear un incómodo precedente: está demostrado que la gratuidad como estímulo inicial puede ser de difícil supresión. Lo que no significa que la compañía escatime dinero para avanzar en la carrera de la IA y copar una buena tajada del mercado.

A pesar de que la monetización de la IA generativa es todavía una incógnita, uno de los caminos que parece tomar la industria apunta a que los servicios de IA pasen a ser una commodity. En teoría, otra vía posible serian las suscripciones de pago sobre los servicios más avanzados. Queda por ver hacia qué lado se inclina la balanza, cuestión que no incumbe sólo a Google sino que todo el sector tendrá algo que decir.

Con todo, la compañía toca otro palo, el de los modelos destinados a ejecutarse en un dispositivo que no implicaría usar recursos en la nube. Se adelanta que Gemma 3, basada en Gemini 2 , tendrá capacidades avanzadas de razonamiento, vinculadas al texto y a las imágenes. Está pensado para funcionar con agilidad en un portátil o incluso en un smartphone, pero no está claro todavía cuáles serán las especificaciones.  

La expansión de Gemini alcanza hasta la robótica. En este campo, la IA generativa ofrece beneficios tan claros como una mejora en la toma de decisiones en tiempo real. Google se ha apuntado a este baile de la mano de Google Robotics, un modelo avanzado de visión-lenguaje-acción, que permite dar instrucciones y controlar las acciones de un mediante y datos en imágenes o comandos hablados. También ha presentado Robotics-ER, que implementa en una máquina la capacidad e evaluar y entender el entorno de manera similar a como lo hace una persona gracias a su experiencia.

Ambos modelos están concebidos para funcionar con cualquier hardware, lo que no quiere decir que sea posible de inmediato. DepMind, filial científica de Google, tiene un acuerdo con Apptronik, un desarrollador de robots humanoides y ha puesto sus modelos a disposición de un grupo de empresas, entre ellas Agile Robots, Agility Robotics y Boston Dynamics (esta última fue propiedad de Google durante cuatro años).

Porque la compañía no es una recién llegada a la robótica: al trabajo de experimentación que en su día hizo con máquinas antropomorfas de Boston Dynamics se une la labor de Waymo con sus coches autónomos, que ha implicado el desarrollo de un software optimizado para la toma de decisiones y la reacción ante incidencias. De nuevo, este es un bagaje que sus competidores no tienen: OpenAI cerró en 2021 un departamento que se dedicaba a la robótica, para concentrar recursos en el desarrollo de GPT; ahora promete volver a esa senda, para lo que está contratando especialistas. Como se puede ver, la IA en su acepción más amplia, es un campo que se ensancha a medida que pasan los meses.


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2025 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons