
El Data Scientist, un talento escaso
El data science o ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas. En pocas palabras, nos ayuda a responder preguntas complejas a través del análisis de los datos. Cada vez más empresas tradicionales están identificando el inmenso valor que la ciencia de datos puede aportar a sus modelos de negocio.
Una de ellas es Reale Group, más conocida como Reale Seguros en España que, con casi 200 años de historia, sigue creciendo gracias a su continua actitud innovadora. Victor Santamaría, Jefe del Centro de Data Science de Reale Group, nos ha contado en el marco de las masterclasses de la escuela de negocios referencia en data science y nuevas tecnologías en España, MIOTI, algunas claves para desplegar acciones de ciencia de datos en el ámbito corporativo.
El punto de partida para implementar la ciencia de datos en una empresa es tener siempre muy claro que una iniciativa de data science no será consistente si no aporta valor adicional al negocio. Por ello, si las personas encargadas de crear y aplicar los modelos de datos no entienden o no tienen en cuenta la estrategia de negocio de su compañía, muy posiblemente no podrán ayudar a mejorar los procesos de las compañías.
Victor Santamaría señala los tres pasos que una empresa debe seguir si quiere implementar el uso de data science como motor de desarrollo en su negocio:
Los posibles casos de uso donde aplicar IA son infinitos. Cualquier proceso de negocio, y sobre todo aquellos que requieren alguna actividad de tipo cognitivo por parte del ser humano, puede ser acelerado, reforzado o escalado utilizando soluciones de ciencia de datos. El problema no será encontrar secciones donde aplicar la Inteligencia Artificial, si no decidir en cuáles se implementará buscando un equilibrio entre los costes de desarrollo y los beneficios consecuentes.
Reale mantiene que la base para hacer ciencia de datos es un triángulo cuyos vértices son: poner siempre el foco en el negocio, una elección y uso adecuados de la tecnología y un buen dataset gobernado.
El foco de cualquier estrategia de datos enfocada a empresa debe estar siempre en el negocio. Para ello, debe existir siempre un diálogo fluido entre los encargados de ambas funciones que haga que los equipos entiendan el lenguaje y la importancia de las estrategias de cada uno.
La elección de tecnología que pueda soportar los procesos que se quieran llevar a cabo es importante, pero de nada sirve si no contamos con los expertos necesarios para poder desplegar las estrategias. Un ingeniero de datos es una de las figuras necesarias en el equipo de científicos de datos, ya que será el encargado de coger el data product o modelo del científico de datos y envolverlo en un software capaz de ser integrado en una aplicación tecnológica.
El último vértice del triángulo mágico de Reale es el dataset, que se refiere a los datos que un proyecto abarca y usa. El dataset es el factor indispensable para crear data science, ya que sin datos no se puede hacer ciencia de datos. Pero para crear modelos de datos no basta con tener un gran bruto de datos, han de ser de calidad y además estar gobernados.
La gobernanza de datos se refiere al control que se tiene sobre los mismos, como por ejemplo saber cuál es su origen, qué procesos los han transformado y cuál es su significado, entre otras características. Sin esta información, los modelos de datos que se puedan crear más allá de ser inútiles pueden llegar a ser contraproducentes e incluso peligrosos para la empresa. El uso de datos no gobernados puede llevar a activar decisiones de negocio masivas erróneas que pongan en riesgo toda la estructura de la empresa.
Como comenta Victor Santamaría, su experiencia en este sector le ha hecho darse cuenta de que la incertidumbre es una parte muy importante a la hora de trabajar con ciencia de datos. La incertidumbre es algo a lo que los científicos de datos están más que acostumbrados, ya que antes de procesar su dataset no saben qué respuestas o incluso preguntas generarán los datos. Las personas encargadas de la parte de negocio suelen trabajar con métricas y procesos técnicos más predecibles, por lo que los proyectos conducidos por datos estarán asociados en mayor o menor medida a un cambio cultural en las empresas. Por ello, la clave para que las empresas empiecen a mirar hacia modelos exitosos basados en Inteligencia Artificial será la creación de buenas sinergias entre los encargados de la ciencia de datos y de negocio.
“Los planes a largo plazo cada vez tienen menos sentido, hay que ser muy flexibles, muy dinámicos, muy ágiles a la hora de implementar las estrategías de Data Science y de decidir cuáles son las iniciativas de mayor valor para tu estrategía de negocio”, señala Santamaría. ¿Quieres conocer más acerca de cómo escalar proyectos de Data Science a empresas y sus diferentes estrategías? Puedes ver la masterclass completa en el siguiente vídeo.
Desde MIOTI, el primer escuela tecnológica aplicada a los negocios y referente en formación especializada en Data Science, Internet of Things y eBusiness, se trabaja día a día en la formación de los futuros profesionales que serán los protagonistas del desarrollo, implementación y despliegue del data science en las empresas.