Data Science para predecir el COVID-19

o realmente atrayente para la mayoría es conocer las claves que maneja el Data Science para hace frente a una situación tan delicada como la actual. Es algo que, por fuerza, genera un interés indiscutible, y prueba de ello son las muchas acciones que se están llevando a cabo para combatir esta crisis sanitaria. Solo en Kaggle, una de las comunidades para data scientists más importantes del mundo, se han llegado a publicar más de 44.000 investigaciones profesionales relacionadas con el coronavirus. La comunidad amateur también se ha volcado publicando más de 5000 notebooks. Y las cifras, en pocas semanas, no hacen más que aumentar.

Visualizar el problema (Data Analysis)

Instituciones, universidades y compañías de primer nivel, han creado decenas de dashboards que ofrecen representaciones visuales de datos sobre la situación actual de la pandemia. Adicionalmente, también usuarios y comunidades cuyo único interés es participar y contribuir, han sido capaces de crear estas útiles herramientas.

Esto solo es una pequeña muestra de lo que en Data Science se conoce como data analysis. Para entender un problema, primero debemos ser capaces de visualizarlo. Solo así conoceremos su magnitud. Por eso resultan tan útiles los dashboards, y por eso la representación visual de datos se torna esencial.

Además, tras la aparente complejidad de estas representaciones, no se esconde una disciplina solo apta para unos pocos. Cualquiera con unos mínimos conocimientos y mucho interés, puede crear la suya (de hecho, los alumnos de MIOTI, tras solo 4 semanas de clases, son capaces de elaborar un dashboard perfectamente funcional). Unos pequeños bloques de código realizados en Python, uno de los lenguajes de programación más populares de la actualidad y el preferido por buena parte de la comunidad de data scientists, son suficientes para crear un dashboard que ayude a entender la dimensión de un problema.

A continuacón, y a modo de ejemplo, hemos destacado los siguientes por su calidad y utilidad.

Predecir su evolución (Forecasting)

Una vez que vemos y entendemos qué es lo que está pasando, llega el momento de ‘predecir’ qué va a suceder a continuación. En data sciente, esta es la fase de forecasting. Siguiendo con el caso del COVID-19, cualquiera puede llegar a pensar que, para realizar una predicción sobre su evolución, será necesario recurrir a complejas técnicas de Machine Learning, Deep Learning, redes neuronales o algoritmos complejos. La realidad es bien distinta, puesto que la mayoría de los modelos de predicción que podemos encontrar y que, en muchos casos, son los mismos que han utilizado las administraciones gubernamentales para intentar adelantarse al virus, se corresponden con el conocido modelo “SIR”. Se trata de un modelo matemático utilizado para enfermedades contagiosas creado a principios del siglo XX por Ronald Ross y William Hammer y que forma parte de un conjunto de modelos conocidos como compartamental models.

SIR, en su ramificación más sencilla, se basa en clasificar a la población en tres bloques diferenciados: aquellos susceptibles de contraer una infección, aquellos que ya están infectados, y aquellos que ya se han recuperado, englobando en este último caso tanto a los que sobreviven a la enfermedad, como a los que fallecen por ella.

Una vez hecha la clasificación, lo primero es definir las probabilidades de pasar de un estado a otro. Si, por ejemplo, un sujeto se encuentra en el bloque de infectados en un determinado día, pasará al bloque de recuperados en función de lo que dure la enfermedad. Si ésta dura 14 días, diríamos que cada persona infectada tiene, cada día, 1/14 probabilidades de recuperarse.

En el caso de querer saber las probabilidades de pasar del bloque de susceptibles al bloque de infectados, deberíamos tener en cuenta 3 factores:

  • La probabilidad de encontrase con alguien
  • La probabilidad de que esa persona estuviera infectada
  • La probabilidad de que esa persona infecte a otra

La probabilidad de que una persona esté infectada dependerá de la cantidad de infectados que existen sobre el total de la población. Por otra parte, la probabilidad de encontrase con alguien y la probabilidad de que, si esa persona está enferma, contagie la enfermedad, implica dos factores distintos que, matemáticamente, se modelan en uno solo. Así, podemos crear un sistema de ecuaciones diferenciales para establecer cuál es la probabilidad de pasar de un estado a otro. Como hemos dicho, muchos de los modelos y sus correspondientes variaciones tienen como base el modelo SIR.

Como ejemplo actual y cercano, tenemos el creado por Myriam Barnés, data scientist de K-Fund que, utilizando un modelo similar al SIR, pero teniendo en cuenta además variaciones por las necesidades hospitalarias, nos permite prever el pico de hospitalizaciones que habrá en diferentes países del mundo. Puedes consultar la herramienta en este enlace.

Otro ejemplo es el creado por Gabriel Goh, Machine Learning Researcher en OpenAI, que, en este caso, se basa en el modelo SEIR y que también nos permite prever el pico. Consulta la herramienta aquí.

De cualquier forma, esta es la parte más compleja. Diferentes modelos basados en distintas variables y datos arrojarán predicciones alternativas. Por eso George Box dijo aquello de que ‘todos los modelos son incorrectos, pero algunos de ellos resultan útiles’.

Solucionar el problema

Una vez que hemos logrado realizar ciertas predicciones, ¿puede aportar algo Data Science para llegar a solucionar el problema? Por supuesto. En el webinar, Mario López destacó algunas de las iniciativas que, basándose en esta tecnología, ayudan de forma determinante a la lucha contra la pandemia.

En Kaggle existe un reto que intenta contestar a 10 preguntas clave sobre el coronavirus. Para ello, se va a utilizar el datasheet leíble por una máquina más grande elaborado hasta el momento. Esto es, las más de 44.000 investigaciones y los más de 5000 notebooks publicados en la propia comunidad de Kaggle. Evidentemente, si un investigador necesita información, por muy estructurada y organizada que esté, será complicado que la encuentre entre semejante cantidad de recursos. Gracias a sistemas de procesamiento de lenguaje natural, se espera poder encontrar el trabajo o investigación que de la respuesta adecuada a cada pregunta.

Otra aplicación recurrente en estos momentos, es la de es utilizar Computer Vision para ayudar en el diagnóstico de pacientes con coronavirus. Con acceso a una serie de imágenes médicas, como escáneres y radiografías de pacientes con y sin coronavirus, se crean patrones que sirven para identificar y diferenciar a personas que hayan desarrollado síntomas provocados por el virus, de aquellas que hayan desarrollado síntomas por otra causa.

Siendo posible que aún tardemos bastante tiempo en encontrar un remedio efectivo contra el COVID-19, existe un campo de estudio que utiliza Machine Learning denominado Drug Repurposing y que busca compuestos químicos comercialmente disponibles, como los que se pueden encontrar en farmacias y hospitales, que tengan potencial para resultar efectivos contra la infección. Se busca que esos compuestos puedan anexionarse a algunas de las proteínas del coronavirus, cambiando su estructura y logrando que sea menos efectivo. Para ello, existen bancos y bases de datos en las que se encuentran registradas tanto los químicos como las proteínas con sus características codificadas. Gracias a algoritmos de aprendizaje supervisado y no supervisado, se pueden cruzar dichas características e inferir qué combinaciones pueden resultar efectivas y cuáles no.

 

El Data Science se ha desmarcado como una de las disciplinas más determinantes en la lucha contra las pandemias. Nos encontramos ante una tecnología cuya curva de aprendizaje es muy suave y que, lejos de requerir la intervención de perfiles excesivamente técnicos, puede ser aprendida y aprovechada por profesionales de áreas muy diversas. La mayoría de los programas de MIOTI tratan en menor o mayor profundidad esta especialización. Y es que los datos nos respaldan: los profesionales que optan por Data Science, son los más demandados del mercado laboral.

Los 6 trabajos del futuro van sobre Datos

Dentro de varios años, cuando se hable sobre la Cuarta Revolución Industrial o la Transformación Digital, los estudiantes del futuro lo percibirán como un breve periodo en el que todo cambió mucho y muy rápido. Aquellos que estamos inmersos en dicho cambio, sabemos que el proceso está lejos de ser inmediato, pero también somos conscientes de que su avance es inexorable y que, para mantener el tipo, sobre todo en el ámbito profesional, lo mejor es no quedarse descolgado. Por eso es tan importante entender cómo los movimientos macro y microeconómicos impactarán en el mundo laboral y reconfigurarán los trabajos del futuro. En MIOTI nos esforzamos en entender y transmitir estas nuevas corrientes a la hora de ofrecer una formación de calidad que sea consecuente con las nuevas demandas del mercado laboral.

Impulsores de la transformación del mercado laboral

Buena parte del cambio en el mercado laborar viene impulsado por la tecnología, la digitalización y las recientes, aunque todavía insuficientes, reformas de los marcos que rigen las nuevas relaciones y situaciones laborales. Esto implica la aparición de nuevas oportunidades y perfiles profesionales, así como la desaparición de otros. Lo que queda claro es que las profesiones más demandados de la actualidad no estaban en el imaginario colectivo de hace unos años. Bien merecido tienen que nos refiramos a ellas como los ‘trabajos del Futuro’.

La tecnología siempre ha sido un agente de cambio determinante, y el mercado laboral no es ajeno a su influencia. En MIOTI hemos detectado que Internet de las Cosas, la Inteligencia Artificial, Data Science, Blockchain o la robótica, son algunas de las tecnologías que más focos acaparan en la actualidad. Su evolución ha sido exponencial y, como es de esperar, nuevas tecnologías demandan nuevos profesionales. Aquellos que quieran progresar en estas áreas deben ser resilientes y estar dispuestos a mantener un proceso de aprendizaje constante. La evolución de estas tecnologías es continua, como también deben serlo las propias capacidades actitudinales de quienes decidan trabajar con ellas.

Cada vez más, los perfiles serán tan competentes como exigentes. El trabajador que mantiene un interés constante por ser un profesional cualificado también es, por naturaleza, más ambicioso. Por lo tanto, demandará una mayor participación en la toma de decisiones de la empresa, transparencia en sus procesos, un modelo que valore las ideas por encima de la jerarquía y que, además de por el cumplimiento de los objetivos, vele también por la felicidad y el bienestar de sus empleados. Estas son algunas de las necesidades que los trabajos del futuro deberán ser capaces de cubrir.

Los trabajos del futuro apostarán por la movilidad geográfica y el teletrabajo

Dos tendencias consecuencia de la tecnología y la digitalización. El puesto de trabajo ‘fijo’ que conocemos y que todavía está tan arraigado en muchos entornos laborales, cada vez lo estará menos debido a la globalización y la digitalización. Por una parte, la movilidad geográfica se torna imprescindible, sobre todo en corporaciones multinacionales, pero también en startups que nacen con el proceso de internacionalización marcado en su hoja de ruta. Por otra, el teletrabajo, impulsado por las tecnologías y la digitalización de los procesos, indica que cada vez más empresas comienzan a valorar la productividad y la eficiencia por encima del simple presentismo.

 

En 2017, Capgemini y LinkedIn elaboraron un informe con el objetivo de analizar la oferta y la demanda de talento con competencias digitales específicas. En él se reflejan muchos datos interesantes, pero hemos querido destacar dos:

  • El 50% de los empleados (cerca del 60% si hablamos de aquellos catalogados como ‘digitales’) invierte su propio dinero y tiempo en el aprendizaje y desarrollo de sus capacidades digitales.
  • De los 10 perfiles digitales con más futuro que se recogen en el informe, 5 están directamente relacionados con los datos. Por eso, los programas formativos de MIOTI pivotan sobre esta tendencia.

El primer apunte no hace más que ratificar la existencia del perfil de trabajador flexible y adaptable que nunca deja de formarse, ya sea por necesidad o por gusto. El segundo habla sobre la importancia de los datos en la actualidad. Arquitectos de datos, ingenieros de datos, científicos de datos, datos y ciberseguridad, IoT y su estrecha relación con, efectivamente, los datos. Desde el Big Data hasta el Data Science. Diferentes engranajes de una máquina imponente y compleja que requiere profesionales cualificados para su correcto funcionamiento. Un aspecto que define la tipología de muchos de los trabajos del futuro que tanto interesan a empresas y profesionales.

De hecho, algunas de las profesiones consideradas más ‘sexys’ del futuro (y también del presente), dependen directamente de los datos, uno de los recursos más valiosos para las empresas del siglo XXI. Los alumnos de MIOTI demandan formación específica en estos campos conscientes de su importancia.

Algunos de los trabajos del futuro que destacan por su importancia, alta valoración y creciente demanda, son:

 

  • Big Data Architect

    El responsable de diseñar y crear una estructura virtual cuya función sea almacenar grandes volúmenes de datos que no pueden ser gestionados de manera convencional debido a las limitaciones de gestión y procesamiento de las plataformas de software convencionales. Está en contacto directo con el cliente para diseñar los sistemas a medida en función de sus necesidades.

  • Data Analyst

    Profesional capacitado para procesar y realizar análisis estadísticos de datos. Su trabajo le permite descubrir cómo se pueden usar los datos para sacar conclusiones y resolver problemas que se presentan en una organización. Entre sus tareas está la extracción, limpieza, análisis y visualización de los datos.

  • Data Scientists

    Se centran en la minería de grandes cantidades de datos, estructuradas y no estructuradas, con el objetivo de identificar patrones. Para cumplir sus tareas utilizan una mezcla de programación, habilidades estadísticas, aprendizaje automático y algoritmos. También deberán conocer y entender el negocio o la industria en la que trabajan.

  • Expertos en Ciberseguridad

    Detectan fallos de seguridad que pueden afectar a una empresa en el ámbito digital utilizando herramientas y tecnologías diseñadas para proteger sus activos. Uno de sus principales objetivos es evitar accesos no autorizados a información sensible. Hace años, solo grandes corporaciones invertían en este ámbito, pero ya es habitual que pequeñas y medianas empresas también lo hagan. En empresas que trabajan con datos, es una parte esencial.

  • Customer Intelligence Specialist

    En Business Intelligence, el experto en Customer Intelligence procura aprovechar la información generada por los clientes y, en base a esta, ayudar a entender cómo reaccionan a la comercialización de ciertos productos o servicios.

  • Expertos en Internet de las Cosas (IoT)

    Todos aquellos profesionales capacitados para encabezar y liderar proyectos “smart” aplicados al mundo de las ciudades, de la salud, del hogar o de la industria, cuyo expertise incluirá entender el ciclo completo que va desde el hardware de los sensores hasta el software y las plataformas necesarias para almacenar y explotar el dato.

Algunas de las profesiones del futuro (y también del presente), dependen directamente de los datos, uno de los recursos más valiosos para las empresas del siglo XXI

Fórmate en las profesiones del futuro con el Máster Data Science y el Máster de IoT de MIOTI

 

Siendo conscientes del nuevo paradigma, en MIOTI hemos puesto en marcha nuestro propio Máster en Data Science y el Máster en IoT. Somos el primer centro de formación especializado en Internet de las Cosas y Data Science, las tecnologías disruptivas e innovadoras que más demanda el mercado laboral.

Si quieres liderar proyectos de innovación en un mundo cada vez más “smart”, el Máster en Internet de las Cosas te dará todas las herramientas para identificar oportunidades de negocio y plantear la arquitectura tecnológica para capturar dicha oportunidad. Sin embargo, si estás buscando centrarte en el mundo de los datos, el Máster en Data Science de MIOTI es la mejor opción.

Contamos con un profesorado con amplia experiencia profesional en las materias que imparten (todos actualmente en activo) y con un contenido diseñado para responder a los retos a los que se enfrentan las empresas en la actualidad. Nuestra sede se encuentra en THECUBE Madrid, uno de los principales hub tecnológicos de innovación de Madrid, principal punto de encuentro en la capital para corporaciones, startups y stakeholders del panorama emprendedor. Ponte en contacto con nosotros y solicita toda la información que necesites. ¡Te esperamos!

Razones para estudiar un máster en Data Science

Data Science: qué es y para qué sirve

En primer lugar aclaremos que el Data Science es un campo de estudio que se basa en extraer información de valor de una gran cantidad de datos. Es una combinación de uso de la estadística, informática y las matemáticas. El Data Science sirve en primer lugar para tomar decisiones basadas en esa extracción de datos. Además de esto existen conceptos básicos que siempre acompañan a la definición de data Science, como machine learning, data mining, big data o data analytics, los cuales explicaremos en profundidad más adelante. Aclarados estos primeros conceptos pasamos a detallar las razones por las que estudiar un máster en Data Science es una buena idea.

¿Para que estudiar un máster en Data Science?

Trabaja en un sector continuamente actualizado

A la hora de elegir un puesto de trabajo una de las razones por las que los trabajadores lo hacen es por contar con la posibilidad de trabajar en un entorno dinámico, que permita la constante actualización de conocimientos y herramientas en el trabajo que realizamos día a día, ya que resulta mucho más interesante trabajar en algo que nos garantice hacer interesante nuestro trabajo del día a día sin que llegue a convertirse en algo monótono y repetitivo.

Salidas profesionales

Uno de los motivos por los que estudiar un máster en data science es una buena idea es por supuesto las salidas profesionales y el perfil de Data Scientist es uno de los más demandados en la actualidad laboral. Formarte en el análisis de datos te asegura el acceso a un sector profesional en el que la demanda de profesionales es mucho mayor que la oferta, por lo que será realmente fácil la búsqueda de empleo e incluso podrás tener la posibilidad de elegir entre varias ofertas de trabajo y no requiere años de experiencia profesional.

Satisfacción personal

Convertirse en  un activo de valor para la empresa en la que trabajamos es un aspecto muy importante en nuestra vida, tanto profesional como personal.
Al adquirir los conocimientos en Data Science podrás convertirte en un elemento clave a imprescindible en tu puesto de trabajo, por lo que podrás llegar a ser una persona de alto valor en tu carrera profesional.

Acceso al mercado internacional

Es cierto que en España cada vez son mayores los puestos de trabajo y las empresas en las que se implementa el uso de las tecnologías en Data Science y la incorporación de los profesionales Data Scientist. También es cierto que en las empresas norteamericanas e indias llevan años en cabeza en el uso de estas tecnologías por lo que si tienes expectativas de trabajar en el extranjero o empresas internacionales estudiar el máster en Data Science es una idea excelente para lograrlo.

Remuneración profesional

No solo nos motivamos por un salario competitivo a la hora de buscar un trabajo pero una remuneración económica por encima de la media puede ser un gran incentivo para levantarnos temprano por las mañana todos los días y hacer la rutina mucho más llevadera.

Transformar la realidad

Cada día y a medida que pasa el tiempo es más sencillo convertir los datos en algo tangible y a través del Data Science tendrás la posibilidad de transformar la realidad basándose en decisiones tomadas a través de la extracción de un gran volumen de datos.

Aprovechar el valor de la tecnología

Los tiempos están cambiando y cada día nuevos recursos y tecnologías están al alcance de nuestra mano. Según datos recogidos por IDC, en 2020 las empresas gastarán 70 mil millones de dólares en software de big data.

Cada vez es mayor la utilización del Data Science para el tratamiento de bases de datos, análisis de datos y la extracción de datos en todo tipo de empresas.

Visión global

El análisis y tratamiento de los datos te permite una visión mucho más global y a valorar la importancia de poder optimizar estos datos para obtener unos resultados específicos.

Trabajar en un entorno en constante evolución

El uso de Data Science está en constante cambio y crecimiento y las compañías y empresas actuales tienen la posibilidad de evolucionar al mismo ritmo. Trabajando como Data Scientist podrás ser partícipe de este cambio en las empresas y conseguir más rentabilidad y beneficios que se pueden conseguir implementando el uso del Data Science.

Para estudiar un máster en Data Science no necesitas tener conocimientos previos, en MIOTI te asesoramos y te ayudamos a formarte para conseguir tus objetivos profesionales. Para ello contamos con diferentes programas 100% prácticos y totalmente a medida, dependiendo de tu nivel de formación y conocimientos.

Con nuestro primer programa Data Science Fundamentals podrás iniciarte en el mundo del Data Science y el procesamiento de datos y dominar herramientas como Python, predictive analytics y aprender machine learning. Con nuestro programa Data Science Advanced podrás continuar la formación adquirida en Data Scinece Fundamentals y convertirte en un Data Scientist.

Con el Máster en Data Science conseguirás una formación completa combinando los programas Data Science Fundamentals y Data Science Advanced.
Si estás pensando en estudiar un máster de Data Science no lo dudes y contacta con nosotros para informarte de todo lo necesario.