Clairity Breast, mamografía inteligente que anticipa el riesgo de cáncer
Cada persona posee miles de pequeñas variaciones en su ADN. La mayoría son completamente inocuas, simples diferencias naturales entre individuos. Sin embargo, algunas pueden alterar proteínas esenciales para el funcionamiento del organismo y, en consecuencia, desencadenar enfermedades graves. El reto para la genética clínica ha sido siempre distinguir qué variantes son realmente dañinas y cuáles no tienen relevancia médica. Esta tarea, lejos de ser trivial, ha requerido durante décadas un enorme trabajo manual, criterios múltiples y, a menudo, un grado significativo de incertidumbre.
La aparición de PopEVE, un nuevo modelo de inteligencia artificial desarrollado conjuntamente por el Centro de Regulación Genómica (CRG) en Barcelona y la Harvard Medical School, supone un avance notable en este campo. No se trata de una herramienta mágica ni de un sustituto del diagnóstico clínico, pero sí de un sistema que podría acelerar y afinar la interpretación de variantes genéticas, especialmente en el contexto de enfermedades raras, donde cada minuto cuenta y la información suele ser escasa.
En MIOTI, programas como el Máster en Inteligencia Artificial permiten a los profesionales prepararse para participar en esta transformación que ya está redefiniendo el futuro.
PopEVE nace como evolución del modelo EVE (Evolutionary model of Variant Effect), un enfoque generativo que aprende de la historia evolutiva de las proteínas. La premisa es sencilla pero poderosa: millones de años de selección natural han “probado” infinidad de variantes. Las posiciones de una proteína que se mantienen idénticas entre especies suelen ser críticas para su función; las regiones donde la evolución permite cambios suelen ser más tolerantes a mutaciones. EVE capturaba esta lógica mediante modelos generativos, pero presentaba limitaciones a la hora de comparar la “gravedad” de mutaciones entre genes distintos.
PopEVE introduce mejoras clave que lo convierten en un modelo más robusto y clínicamente útil. Por un lado, incorpora un gran modelo tipo language model para proteínas, capaz de identificar patrones complejos en secuencias, dependencias entre posiciones que están distantes en la estructura tridimensional o firmas evolutivas que no son evidentes para métodos más clásicos. Por otro lado, añade una calibración basada en la variación genética humana real, utilizando bases de datos poblacionales como gnomAD para ajustar sus predicciones y hacerlas comparables entre distintos genes. El resultado es una puntuación unificada que indica la probabilidad de que una variante sea dañina.
Esta capacidad es especialmente importante en genética clínica. Cuando se secuencia el genoma completo de un paciente con una enfermedad rara, pueden aparecer miles de variantes. La pregunta crítica es: ¿cuáles de ellas tienen relevancia patogénica? PopEVE no da una respuesta definitiva, pero sí ayuda a priorizar de manera más eficaz qué mutaciones merece la pena estudiar primero. En enfermedades donde la ventana diagnóstica es estrecha, este filtrado inteligente puede marcar una diferencia significativa.
El funcionamiento de PopEVE combina varias fuentes de información en un esquema complementario:
La combinación de estas capas permite estimar la probabilidad de que una variante missense altere de forma significativa la función de la proteína correspondiente. Esto no sustituye a la información clínica, pero sí aporta una señal cuantitativa que orienta la interpretación de variantes desconocidas.
En artículos científicos y reportes divulgados, PopEVE ha demostrado un rendimiento notable en contextos clínicos reales. Un ejemplo especialmente ilustrativo procede de un estudio con miles de familias afectadas por trastornos del desarrollo. En un subconjunto de 513 casos donde las mutaciones eran completamente nuevas, es decir, nunca observadas previamente en humanos, PopEVE logró identificar la variante más probable de causar la enfermedad en aproximadamente el 98% de ellos. Esta cifra no implica certeza diagnóstica, pero sí una capacidad sobresaliente para orientar la atención de los genetistas.
Además, el modelo señaló 123 genes candidatos que podrían estar implicados en trastornos del desarrollo y que hasta ahora no habían sido asociados a estas condiciones. Estos hallazgos abren la puerta a nuevas líneas de investigación.
Los autores también subrayan algunos beneficios prácticos: mejor rendimiento en poblaciones no europeas en ciertos benchmarks (algo relevante dado el sesgo histórico hacia genomas europeos en investigación genética) y menor huella computacional respecto a otros modelos de tamaño similar, lo que facilita su adopción en entornos clínicos con recursos limitados.
Aun con estas limitaciones, PopEVE apunta hacia una la integración de herramientas de IA en la práctica rutinaria de la genética médica. Su utilidad es especialmente evidente en:
A medio plazo, es razonable prever la incorporación de modelos híbridos que combinen IA basada en evolución, modelos lingüísticos, datos clínicos electrónicos y resultados de ensayos experimentales como el deep mutational scanning. Estas integraciones producirán predicciones más robustas y estandarizadas, alineadas con los criterios clínicos actuales.