8/11/2024

Una joyita de la IA, entre millones y litigios

Para el catálogo de startups en las que Telefónica invierte a través de su filial Wayra,  contar con Perplexity es una buena jugada.  Con menos de dos años de vida,  es uno de los frutos más deseados de la nueva cosecha de la inteligencia artificial generativa, un proyecto de moda con un enfoque diferente al de ChatGPT y otros más conocidos.  En su caso, se trata de un buscador que emplea la GenAI para extraer información de diferentes fuentes para generar un texto que responda a la pregunta del usuario. No disimula su objetivo de comerle una tajada de mercado a Google pero de momento su negocio real consiste en proporcionar servicios de búsqueda a las empresas para su consumo interno.

Aravind Srinivas

El acuerdo entre Perplexity y Wayra incluye términos comerciales para ofrecer el buscador a los clientes de Telefónica, a lo que se suma el compromiso de integrar su tecnología en la plataforma de streaming bajo la marca Movistar Plus. La herramienta promete servir respuestas en tiempo real mediante textos generados por IA a cualquier pregunta (o casi).

Como no todo lo que reluce es oro, el axioma se cumple en este caso. Perplexity fue fundada en 2022 por tres ex empleados de Google cuyo líder natural es Aravind Srinivas, hoy CEO de la compañía. Como otras de su camada, afronta problemas: ningún modelo de IA está exento de sesgos y/o de fallos. Porque, ya se sabe, el formato de estos sistemas les lleva a servir una respuesta como si no fuera discutible y como si fuera la única posible. Pero el problema más acuciante para Perplexity no es este sino las acusaciones – algunas ya en los tribunales – sobre infracción de las reglas de copyright.

La imagen externa es la propia de una compañía innovadora, con todos sus rituales. Premisa suficiente – en California –  para que sus fundadores levantaran una primera financiación de 25,6 millones de dólares en marzo de 2023. Menos de un año después, la cuestación  subió a 73,6 millones. Entre sus apoyos económicos se encuentran Nvidia, el megamillonario Jeff Bezos y el director científico de Meta, Yann LeCun, además de Nat Friedman, conocido como fundador de GitHub. Con estos nombres, no es de extrañar que la valoración informal de la startup subiera como la espuma, algo corriente en el ambiente de la IA. En enero se le estimaba un valor de 520 millones y en verano cruzaba la barrera de los 3.000 millones. Ha trascendido en las últimas semanas que negocia una nueva ronda de 500 millones de dólares que auparía su valoración hipotética a 8.000 millones. En menos de dos años, es toda una proeza.

Sobre todo si se considera que sus ingresos anuales no pasan de los 50 millones de dólares. Hasta la fecha, Perplexity factura suscripciones a sus servicios más avanzados y ha despertado gran interés al lanzar una herramienta con la cual las empresas  pueden rastrear en sus archivos internos. En esta modalidad, admite que se suba un máximo de 500 archivos a una plataforma en la que hace su labor el buscador. La tecnología, conocida con la sigla RAG (retrieval augmented generation) consiste en aplicar un modelo LLM a un dominio específico, en este caso un conjunto de conocimiento proporcionado por una empresa cliente.

No es una exclusividad ni mucho menos: sus competidores se llaman Glean y Elastic y llevan años  ofreciendo búsquedas RAG a las empresas. Además, como cualquier LLM tiene potencialmente las capacidades para esa tarea, así que la rivalidad podría intensificarse. En Perplexity tratan de hacer pedagogía y explicar el valor diferencial de su servicio. Comparado  con un buscador tradicional – que presenta una página de resultados preindexados – Perplexity emite una respuesta con resumen de la información a la que tiene acceso.

Con un tonillo presumido, los directivos de la startup dicen ofrecer un texto “claro y con un lenguaje cercano”, que asocia a la respuesta los enlaces a las fuentes de donde ha extraído los datos. Y anuncian pomposamente que su misión es “demostrar el acceso al conocimiento”, señalando que con su buscador, a los usuarios les será más fácil aprender y explorar nuevas temáticas.

Por ahora, hasta donde puede saberse, el crecimiento procede del público general: en todo 2023 recibió 500 millones de consultas y el pasado septiembre fueron 350 millones. En el fondo está la aspiración de convertirse en una alternativa a Google. Aunque se esperan cambios en el negocio de las búsquedas tras la irrupción de la IA [OpenAI acaba de anunciar una versión de ChatGPT con esa funcionalidad] pero no parece tarea sencilla arrancar puntos porcentuales a una corporación que se ha ganado a pulso el 90% de la tarta global: a ChatGPT se le estima un 9,81% de cuota y a Perplexity un porcentaje marginal: 0,22%.

En esta ambición hay una cuestión fundamental, el modelo de negocio. Google se ha constituido en una de las compañías más valoradas del mundo gracias a su recaudación publicitaria (básicamente asociada a su buscador). Pero el formato de las respuestas generadas por un LLM deja menos espacio para insertar anuncios. Esta es la principal razón por la que Google se mueve con cautela en su exploración de la IA generativa. Se ve empujada a introducir esta tecnología para defender su dominio pero a la vez no quisiera dañar su modelo de negocio.

Comparativamente, Perplexity no tiene nada que perder, de manera que se ha lanzado a introducir publicidad en su buscador, pero es consciente del escaso soporte publicitario que hace posible la IA generativa. Por eso pretende renovar el modelo de subastas en el que se basa Google. Perplexity negocia con Nike y Marriott – por ejemplo – para que estas marcas puedan pujar por preguntas patrocinadas a las que estarían asociadas unas respuestas generadas por IA pero aprobadas de antemano por el anunciante. La objeción es obvia: si se requiere una aprobación previa, en poco se va a diferenciar de un mensaje precocinado por el departamento de marketing.

Independientemente de cuánto calen estas propuestas entre público y empresas, las pretensiones de negocio de Perplejidad tienen todavía una papeleta que solventar: la propiedad intelectual del material usado para entrenar los modelos de IA. El conglomerado mediático News Corp. Ha demandado a la startup, acusándola de copiar grandes cantidades de contenido protegido por el derecho de autor, sin ofrecer contrapartida alguna. Asimismo, la señala por presentar contenido reformulado como sustituto directo de la fuente original.

La demanda del grupo propiedad de la familia Murdoch argumenta que Perplejidad ha engullido contenidos del Wall Street Journal y del New York Post para nutrir sus sistemas. Otros medios, como The New York Times, Forbes o Wired, han acusado a Perplexity de utilizar frases similares o fragmentos copiados de sus publicaciones. El primero y más grande de estos tres denunciantes sigue adelante con su demanda contra a OpenAI por uso no autorizado de contenidos suyos, usados para entrenar modelos LLM.

Lejos de amilanarse por las denuncias Perplexity se ha revuelto para atacar a los medios que la cuestionan. En una declaración, afirma que “prefieren vivir en un mundo en el que la comunicación sobre los hechos públicos sea controlada por corporaciones”. A las que acusan de cobrar un peaje a otras empresas por utilizar esa comunicación. Perplexity finge ignorar que sus herramientas de IA no engullen los hechos tal como son, sino las informaciones y la digestión que los medios han hecho de esos hechos. Los algoritmos se entrenan con la estructura lingüística de la información publicada.

Aravind Srinivas, CEO y uno de los fundadores de Perplexity – quien trabajó brevemente en OpenAI – , ha ofrecido a los medios participar en un programa de ingresos compartidos: en verano anunció una iniciativa para recompensarlos por utilizar sus contenidos en una interacción de la que Perplexity ganara dinero. Las revistas Time, Fortune y Der Spiegel han aceptado la propuesta.

No parece que la oferta valga para todos, pero puede ser una maniobra para aparentar buena voluntad. Por cierto, News Corp ha firmado un acuerdo con OpenAI para licenciar los contenidos de sus periódicos, de los que espera recaudar 250 millones de dólares en los próximos cinco años. Esto lleva a preguntarse sobre la naturaleza legal de firmar acuerdos con desarrolladores de LLM que compiten entre sí.

Las alucinaciones y los sesgos son otra fuente de problemas con los modelos de IA, Perplexity no es una excepción. Las primeras se deben a la extrapolación que los sistemas de IA hacen de los datos a los que tienen acceso; los segundos pueden provenir de una fuente de información errada o tendenciosa a la que el modelo presta crédito inmerecido.

Recientemente se supo que los buscadores de Google y Microsoft, así como el de Perplexity, todos con IA generativa, arrojaban respuestas racistas en las que se sugería la superioridad genética de las personas blancas. Esta tesis que parece traída de otras épocas, se incluía en una tesis firmada por un profesor de la universidad de Texas, no aceptada por la comunidad científica y argumento difundido por grupos supremacistas. Era la respuesta de los tres buscadores a una pregunta sobre el cociente intelectual en un determinado país: tan sesgada como falsa.

 


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons