No es una entrevista como otras que cada semana publica este blog. No lo es por su nula relación con modelos de negocio, estrategias de producto y otras servidumbres del marketing. La conversación se asoma al mundo de la inteligencia artificial, que no es nuevo pero últimamente está saltando de la esfera académica a la industria. La personalidad de Nuria Olivé y su trayectoria científica – en el tramo final de la charla relata su experiencia de 13 años en Estados Unidos antes de retornar a España – aporta algo nuevo, y diferente, el conocimiento de cómo funciona la rama de I+D de una empresa como Telefónica. La lectura es necesariamente larga, pero cuenta una experiencia poco conocida.
La inteligencia artificial está ahora mismo en el candelero, se diría que después de tantos años, está llegando al mercado en forma de productos ¿Por qué ahora?
Creo que ese despertar está relacionado directamente con la explosión de datos que vivimos. Se habla mucho de big data, a veces con ligereza, pero sin sacar la consecuencia de que la mayor parte de esos datos son generados por humanos, producidos por nuestras interacciones en un mundo cada vez más digitalizado; por primera vez, los datos nos están permitiendo entender a gran escala el comportamiento humano.
No podría ocurrir sin un crecimiento de la capacidad de procesamiento, como nunca antes se había conocido…
Nominalmente, esto se atribuye a la vigencia de la ley de Moore. Los procesadores actuales están permitiendo digerir y procesar tales cantidades ingentes de datos en tiempos razonables o incluso en tiempo real, que facilitan el trabajo con algoritmos de inteligencia artificial que hasta ahora no eran prácticos porque no eran escalables. Últimamente se habla mucho de deep learning, por ejemplo, pero los algoritmos de deep learning en realidad son antiguos, sólo que ahora es cuando se les puede sacar su utilidad. Aplicarlos a la solución de problemas era difícil porque los procesadores no podían resolver todas las ecuaciones de sus algoritmos. Y no había suficiente cantidad de datos para entrenarlos. En resumen, ahora tenemos grandes volúmenes de datos, tenemos una gran capacidad de procesar y de entrenar los algoritmos.
Hay quien identifica los algoritmo como un invento de Google…
Qué va. Los algoritmos exstían mucho antes que Google. Realmente, los de Google están inspirados en los trabajos pioneros sobre redes neuronales de los primeros años de la inteligencia artificial. Lo que se está dando ahora es la confluencia, en unos campos más que en otros, que está trayendo avances significativos de performance; lo vemos en el reconocimiento de la voz, de las imágenes, etc. Están impregnando nuestra vida diaria, y en los próximos años ganarán escala.
Ha dicho ´en unos campos más que en otros`, ¿cuáles son los más avanzados y cuáles los rezagados?
Yo no diría que algunos están rezagados, sino que hay mucho que avanzar si se compara la inteligencia artificial con la inteligencia humana, si lo que pretendemos es que una máquina tenga capacidad propias de los humanos. Falta avanzar en lo emocional, lo social, la creatividad, el sentido común y demás, pero se ha avanzado muchísimo en el reconocimiento de objetos, palabras, gestos, caras, cosas objetivas en las que la respuesta está al alcance de un algoritmo. Nos queda mucho por delante hasta implementar el concepto de affective computing, que viene de los años 97 o 98 y que todavía no es una realidad.
Se ha avanzado más rápido en la adaptación al contexto.
Es que es más fácil. Con la proliferación de sensores, la palabra contexto empieza a ser de uso corriente. Se habla mucho de context aware computing. Robert Scoble ha escrito un libro magnífico sobre el tema, The Age of Context. Sin falsa modestia, en Telefónica I+D, trabajamos desde hace cinco o seis años en lo que se llama recomendaciones contextuales. Que hacen que los algoritmos de recomendación no solamente tengan en cuenta tus gustos personales sino el contexto en el que se manifiestan; hemos demostrado que es posible incorporar elementos del contexto para mejorar las recomendaciones y lo estamos viendo en las aplicaciones móviles.
¿Con eso quiere decir que se han banalizado?
Quiero decir que es un campo acotado, en el que se intenta que el sistema automatice y reconozca aquello que en los humanos es fruto de un aprendizaje de muchos años. Para que así sea a los algoritmos hay que entrenarlos, pero no pueden alcanzar la sutileza necesaria para distinguir lo que tiene sentido y lo que no. Sin las técnicas de inteligencia artificial, que conocemos como Machine Learning, muchos de los datos que se recogen y acumulan de diversas fuentes no sirven de nada, son sólo basura digital.
¿Cuáles son los principales campos de trabajo en inteligencia artificial?
Los resumiría en cuatro: Speech Recognition, Computer Vision, obviamente todo lo relacionado con Robótica, son los tres más vinculados a la interacción con las personas, y luego el cuarto es Predictive Analytics, más cercano a las TI.
Centrémonos en los tres primeros, empezando por la robótica.
Ha alcanzado un nivel muy elevado de sofisticación, sobre todo en Japón, y sus aplicaciones dependen mucho del tipo de industria. Es bien conocido el caso de la automovilística o de la electrónica, pero hay otras industrias en las que el proceso productivo todavía necesita la intervención humana. No soy una experta en este campo…
Vaya, de saberlo hubiera empezado por otro. ¿Computer Vision?
Es posiblemente el campo en el que se notan más los avances, en el reconocimiento de objetos. Con la consiguiente complejidad. Una botella es mucho más fácil que un gato, porque este puede estar en muy distintas posiciones, es asimétrico. Se plantea el problema de las oclusiones: un ser humano sabe inmediatamente que se trata de un gato sólo con ver una oreja o la cola, lo que sería especialmente difícil esperar de un ordenador. Seguramente este tendría millones de interpretaciones pero sin llegar a reconocer un gato por su oreja o su cola. A todo esto, hay diferentes grados de desarrollo. Por ejemplo, Face Recognition se considera por lo general que es un problema resuelto, aunque siempre se puede engañar al algoritmo. Es mucho más difícil con el vídeo. porque son 30 imágenes por segundo y por medio anda la dinámica, que suele involucrar el reconocimiento de interacciones, algo que no ocurre con un objeto estático. Como he dicho antes, lo relacionado con las emociones es la parte más atrasada, porque exige una capacidad multisensorial que las máquinas no tienen.
¿Se trabaja para dotarlas de esa capacidad?
No se da por perdido. Hasta hace poco, una de las áreas que había progresado menos es la monitorización de señales fisiológicas, que supuestamente permitirían detectar emociones: el ritmo cardíaco, la conductividad de la piel… pero no quiere decir que todas las emociones que un ser humano experimenta durante su vida diaria tengan reflejo en su ritmo cardíaco.
Me hace pensar en los asistentes personales, tan deliciosamente imperfectos…
Siempre van a ser imperfectos, si empezamos por aceptar que los humanos no somos perfectos. ¿Se puede aceptar como perfecto algo que sea tan bueno como un ser humano? ¿O se pretende que sea mejor? Habría que matizar el objetivo, porque hay cosas específicas en las que los asistentes funcionan muy bien. Tomemos el ejemplo de Watson, el ordenador de IBM que ganó el concurso de Jeopardy y ahora está empezando una carrera comercial. Resolvió preguntas realmente enrevesadas, y fue capaz de derrtotar a un humano. Por tanto, es una referencia como sistema de análisis del lenguaje natural y de capacidad de razonamiento, muy superior a lo que se puede conseguir con Siri o Cortana, por citar los dos asistentes más conocidos. Desde este punto de vista, el reto para Watson sería la miniaturización.
Según su experiencia, ¿en qué nivel se encuentra España en materia de inteligencia artificial?
Desde luego, no estamos al nivel científico de Estados Unidos, ni al de UK o Alemania. Son comparaciones que no dicen nada acerca del potencial. En España tenemos un problema de inversión continuada y otro de inercias en la universidad española,… porque lo que realmente te nutre y te hace ser competitivo es el entorno de colaboración que mantienes con otros equipos.
¿En Telefónica I+D se practica esa colaboración?
Sí, desde luego. Cuando vinimos Carlos [Domingo CEO de Telefónica I+D hasta el año pasado] y Pablo [Rodriguez, director del centro de I+D de Telefónica] y yo misma, una de sus iniciativas fue un programa de internship, por el que cada año vienen aquí entre 15 y 20 estudiantes de doctorado, a trabajar con nosotros durante varios meses en un proyecto. También tenemos otro para estudiantes, normalmente de último año de carrera, y un tercero de doctorandos industriales, por convenio con la UPC, la Autónoma o la Pompeu Fabra, en Barcelona, o con la Carlos III y la Politécnica de MadrId: sus drectivos pueden hacer su doctorado con nosotros. No voy a esconder que es muy positivo, pero en el área de Research somos 20 en total, por lo que no podríamos tener todo el tiempo 20 estudiantes con nosotros.
¿Son suficientes 20 personas para el área de Research?
Depende de cómo se vea. Tenemos un modelo de funneling, que de por sí implica una manera de trabajar en I+D, lo que se conoce como Funnel de Innovación, cuya fase más temprana sería la nuestra, en Research. Luego viene la de early innovation, otra más madura en la que se va pasando de prototipo a beta, y luego alfa hasta llegar al producto. Normalmente,en nuestra fase no podemos saber cómo va a funcionar algo, y según se van madurando las cosas, algunas se caen, otras puedes licenciarlas o trabajarlas con otros. Conforme van avanzando los proyectos se les asignan recursos. De todos modos, entre una cosa y otra, esto cunde como si fuéramos más de 20.
Veo que en esa pizarra pone bien grande Open Innovation ¿por qué?
Ay, la pizarra… significa que el funnel tiene agujeros [risas], hay cosas que entran y cosas que salen. Tenemos proyectos de colaboración externa como la Bullipedia con Ferran Adriá, o un proyecto con el Barça, con Aguas de Barcelona, con Inditex… no necesariamente son áreas de fuerte contenido tecnológico, pero ayudan a resolver problemas, que es lo que importa en el concepto de open innovation.
Me ha quedado una pregunta sobre la colaboración con universidades extranjeras…
Tenemos acuerdos de colaboración, concretamente dos con el MIT, con Columbia, y también trabajos y patentes en común con el University College de Londres, … siempre dependiendo del proyecto.
¿Cómo compara esta actividad de I+D con la que hacen otras compañías operadoras?
Antes debería explicar que en Telefónica I+D hay otra área relacionada con las redes, obvia, que no es mi expertise. En una visión así de amplia, no hay presencia de otros operadores en la comunidad científica, aparte de AT&T Lab, muy importante y reconocida. Orange lanza un concurso todos los años, para apoyar investigaciones basadas en datos que cede a ese efecto. Hay mucha más presencia de laboratorios de empresas de software, Microsoft Research es uno de los líderes en publicaciones acadèmicas, IBM Research algo menos, Google sólo regular y Facebook parece con ganas de publicar más. De manera que entre los laboratorios de origen industrial, puedo decir que el de Telefónica I+D está entre los mejores.
El fenómeno de Big Data ha hecho que se hable mucho de la emergente figura del data scientist. ¿Qué relación tiene con la inteligencia artificial?
En principio, deberías saber inteligencia artificial para ser un data scientist, pero no necesariamente todas las ramas de la inteligencia artificial son data driven, algunas están basadas en la lógica. He de añadir que la mayoría de los data scientists tienen un background muy fuerte en inteligencia artificial, pero para esa función hay que saber programar, algo que un experto en inteligencia artificial no siempre ha necesitado saber.
No quisiera dejar pasar la oportunidad de hablar de su trayectoria, de cómo ha llegado hasta aquí, habiendo pasado por el MIT y por Microsoft Research.
Soy de Alicante, pero hice telecos en Madrid. Y suelo contar mi historia no por lucimiento, sino porque creo que puede ser un estímulo para que las chicas que ahora empiezan la universidad no tengan miedo de las carreras científicas. Al acabar la carrera, lo que más quería en el mundo era hacer un doctorado en Estados Unidos; me apunté a una beca de La Caixa, y mientras se concretaba, me llamó un headhunter al colegio mayor para proponerme trabajar en Telefónica I+D. Acepté pero sólo por unos meses, y lo curioso es que en esos ocho o nueve meses llegué a la conclusión de que no era el sitio donde yo hubiera querido trabajar.
Vueltas que da la vida. Si yo le contara…
[risas] El mayor problema fue escoger entre las varias universidades de Estados Unidos que me aceptaron. […] Tuve la enorme suerte de que mi tesis fuera dirigida por Sandy Pentland, que ahora es una celebridad, cuyo último libro, Social Physics, presenté en la Fundación Telefónica. Para mí, Sandy es mi padre americano, mi segundo padre.
¿Y al terminar el doctorado?
Estuve en el MIT en la época dorada del MediaLab, que luego sufrió una crisis de la que le ha costado reponerse. Recuerdo que llegué el día del décimo aniversario, en octubre de 1995 […] Organizamos el primer desfile de moda inteligente…¡en 1997!, trabajé en casa, oficinas y coches inteligentes. Entre otros proyectos, un Volvo equipado con sensores e inteligencia artificial, que predecía la maniobra que ibas a hacer. Estuve en los comienzos de lo que ahora se llama Computational Social Science, que es la especialidad de Sandy.
Puedo imaginar el dilema: quedarse en Seattle a ver llover o volver al Mediterráneo.
Lo que yo quería era ir a San Francisco, por la atracción del Silicon Valley, donde conocía gente que había estado en el MIT, pero en esas recibí un mail de Microsoft Research proponiéndome una entrevista, y resultó que una de las personas que me entrevistó fue un investigador español, Alex Acero, que hace poco ha fichado por Apple, y se ocupó de organizar una cena con David del Val, que había vendido su empresa a Microsoft y que ahora es el CEO de Telefónica I+D. La verdad es que fuí muy feliz en Seattle, pero mi marido, canadiense, dice que siempre tuvo la intuición de que vendríamos a España. Mi camino coincidió con Carlos Domingo, que estaba a punto de regresar a Barcelona para dirigir este centro. Fue Carlos quien me convenció de volver, pese a mi mala experiencia de 1995. Nos mudamos en enero de 2008, y aquí seguimos.