Lo desconocido siempre ha fascinado, sobre todo cuando mucha gente habla de ello, una circunstancia que tiene su punto irónico. El trabajo de científico de datos, al que le ha quedado adherida su expresión inglesa, tiene algo de esa fascinación. Es un puesto importante, al que se supone capaz de mejorar el rendimiento de una empresa, y a la vez un hueco atractivo para hacer carrera, pues ofrece oportunidades de empleo estable y salario alto. Se dice que su papel es convertir la información en valor, porque el data scientist es quien sabe hacer las preguntas adecuadas para obtenerlo. Es una nueva disciplina, que aún no tiene una carrera específica, pero sí hay demanda creciente de formación.
Según un informe elaborado por SAP, la mayoría de las empresas con experiencia digital no cuentan con técnicas de análisis de Big Data. Sin embargo, añade, se hace más necesario que nunca un especialista capaz de analizar millones de datos para descubrir, por ejemplo, qué tiendas de una cadena venden más de cada referencia y qué tendencias mueven la demanda. Uno de los casos de éxito más llamativos que suelen citarse es el de la web Buzzfeed, del sector editorial, que destaca por los 55 millones de visitantes que recibe cada mes. Su particular científico de datos calcula el número de veces que algo relacionado con su catálogo se comparte en Facebook, e identifica los factores que influyen para después emplear algoritmos de aprendizaje que buscan la convergencia entre ellos.
Lo interesante de ese caso es que Buzzfeed no es una empresa tecnológica pero, como es de imaginar, Google se sirve de las mismas técnicas para optimizar el rendimiento de sus anuncios, mientras los especialistas de Facebook rastrean el mapa de interacciones en su red social. Groupon se basa en el conocimiento acumulado para mejorar sus ofertas así como la comunicación con sus usuarios. En otro plano destaca PayPal, centrado en la gestión de riesgos, la búsqueda de patrones de compra y, con todo ello, la captación de nuevos clientes. Todas las empresas mencionadas han publicado en LinkedIn ofertas de trabajo para científicos de datos, pero PayPal explicita su objetivo de crear un equipo multidisciplinar, con las siguientes dosis: un 80% de inteligencia artificial, un 10% de MBA y otro 10% de estadística.
LinkedIn, por cierto, atribuye gran parte de su éxito a la contratación de Jonathan Goldman, doctor en Física que perfeccionó un modelo para la interconexión de los usuarios de la red, poniendo en marcha una de las claves del servicio, los anuncios de personas relacionadas entre sí. Esto ocurría en los primeros tiempos, en los que quedó definida la naturaleza del puesto de trabajo.
En el libro The Field Guide to Data Science, la consultora Booz & Co – ahora integrada en Price Watehouse – enumeraba las características que debe tener un data scientist. Para empezar, se necesita una sólida base matemática y amplios conocimientos de informática, rasgos estos que pueden parecer obvios pero no siempre coinciden en un individuo. Pero, además, dice el libro, hay que dominar el área de actividad en la que se va a trabajar, y una amalgama de cualidades como creatividad, curiosidad, perspicacia, capacidad de concentración y atención a los detalles. No es nada sencillo encontrar semejante combinación.
En consecuencia, los perfiles para un data scientist pueden ser muy variados, y es bueno que así sea. Los hay biólogos o astrofísicos, no sólo informáticos o matemáticos. Por ello, la consultora insta a las empresas a buscar primero dentro de su plantilla alguien que reúna al menos varias de esas cualidades. Lo cierto es que hay muy poco definido en torno a esta emergente profesión, porque el origen de cada individuo no es más que un punto de partida. Algo que se está empezando a comprender es la comunicación indispensable entre un responsable que conozca a fondo el negocio y los analistas; de ahí a postular un trabajo en equipo equilibrado, que neutralice cualquier sesgo que pueda tener el científico de datos en virtud de su formación primera.
En cuanto a la enseñanza de esta función, el mismísimo Barack Obama ha dicho que es una prioridad educativa. Con un aval de ese calibre, la startup Udacity, especializada en educación online, ofrece un curso por 2.000 dólares que promete hacer del estudiante un data scientist en sólo dos meses, pero en este contexto hay que acotar los requisitos que debe reunir el estudiante, porque si no….
Varias universidades estadounidenses han puesto en marcha programas de este tipo, como la prestigiosa Universidad de Berkeley. Otra institución, el Data Science Summer Institute de la Universidad de Illinois, ya no puede acoger más alumnos porque su numerus clausus ha tocado techo. En España empieza a aparecer una oferta de formación en este campo, que todavía debe demostrar su calidad.
Por supuesto, también hay oferta formativa que nace de las empresas. EMC, muy involucrada en Big Data, tiene un programa de enseñanza y certificación para analistas de datos, lo mismo que IBM y Oracle. Cloudera, abanderada de Hadoop, ha creado lo que llama Cloudera University, y no iba a ser menos su rival MapR, que estrena su propia Academy. En Irlanda, un programa apoyado por Accenture trata de acercar a los alumnos de universidades a las oportunidades de esta nueva profesión.
Aunque el panorama de empleo en la industria de las TI no casa bien con los planes de despidos masivos de IBM, HP y otros grandes del sector, la tendencia va por barrios. Inasequible a esa realidad, Gartner predice que habrá alrededor de 4,4 millones de nuevos puestos de trabajo en los próximos dos años, pero añade que sólo una tercera parte de los candidatos estarán realmente cualificados para desempeñar esos trabajos. Concreta más el McKinsey Global Institute, para el que en los próximos cinco años se abrirán casi medio millón de puestos de data scientist, sin contar con los directivos y empleados que deberán reciclarse con el fin comprender los resultados de análisis elaborados por aquéllos.
Las agencias que intermedian en la contratación de personal informan que cada vez les llegan más curriculos de personas que se etiquetan con el cliché de data scientist, pero muchos no corresponden al perfil que se busca. No hay suficientes candidatos que reúnan las condiciones pedidas. Por esto, el estudio de Accenture revela que se recurre a subcontratar el servicio; pero las posibilidades de externalización son limitadas. En China, India y Brasil, apenas hay personas que puedan cumplir los requisitos. El estudio prevé que en 2015 habrá escasez mundial de profesionales, salvo en Estados Unidos y Reino Unido.
Ah, por cierto: las perspectivas salariales son un caramelo. De la última promoción del máster en business analytics de la Universidad Estatal de Carolina del Norte, todos los 84 graduados consiguieron empleos con un salario medio de 89.000 dólares anuales, que se eleva a 100.000 dólares en caso de tener experiencia previa. Pero, pasarán varios años antes de que la mayoría de los que se han puesto a estudiar Big Data últimamente, lleguen al mercado laboral.
No todo es como se cuenta. La realidad está bastante lejos del ambiente mágico que sugieren los informes de consultoras. Kaggle, compañía de Big Data, se ha topado de bruces con la necesidad de trabajar sólo para industrias específicas, sobre todo petróleo y gas. Reconocen haberse equivocado al pensar que basta con saber manejar información para trabajar con cualquier input de datos; posteriormente se aplicaron la lección al descubrir que un data scientist tiene que conocer bien el área en el que trabaja, para optimizar los resultados, y cada campo de actuación requiere su propia regla de aprendizaje.
Esta experiencia, aunque lejana para un lector español, tiene un gran mérito: deslegitima el punto de vista de que cualquiera vale para todo. Lo que una compañía descubre tiene gran valor para ella, pero no siempre para otra empresa: la mejor estrategia es centrarse.
Tampoco faltan agoreros para los cuales «esto» del data scientist es una moda pasajera y morirá antes de salir del cascarón, porque los nuevos programas pueden asumir tareas autónomamente. Pero los estudiosos del asunto opinan que, como toda labor científica, no se puede dejar exclusivamente en manos de las máquinas.
Subsiste una duda que los estudios no aclaran. Si la profesión más sexy del siglo – como la ha calificado la Harvard Business Review – será otro terreno abonado para los hombres y con reticencias hacia las mujeres.
Desafortunadamente, los científicos de datos – al fin, una categoría específica de white collar – no están a salvo de contingencias. Para ellos, su particular «reforma estructural» no la dicta ninguna troika sino que estaría agazapada en la propia tecnología que diseñan y gestionan. James Manyika, director del McKinsey Global Institute, advierte: «ni siquiera los profesionales mejor pagados y altamente especializados son inmunes a los avances en la automatización del análisis de grandes cantidades de datos para obtener respuestas inteligibles […]». Y remata Manyika: «los empleos de muchos de esos profesionales podrían estar también en la línea de fuego».