MIAMI.- Un trabajo, dirigido por Kiley Graim, profesora adjunta del Departamento de Ciencias de la Computación e Ingeniería de la Información de la Universidad de Florida (UF), tiene como objetivo mejorar la salud humana abordando el "sesgo ancestral" en los datos genéticos, un problema que surge cuando la mayoría de las investigaciones se basan en datos mayoritarios de un solo grupo de origen.
Este sesgo limita los avances en la medicina de precisión, afirmó Graim, y deja a gran parte de la población mundial desatendida en lo que respecta al tratamiento y la prevención de enfermedades.
Para solucionar esto, el equipo desarrolló PhyloFrame, una herramienta de aprendizaje automático que utiliza inteligencia artificial para representar la diversidad ancestral, considerando los diferentes orígenes, en los datos genéticos.
El objetivo es mejorar la predicción, el diagnóstico y el tratamiento de enfermedades para todas las personas, independientemente de su ascendencia.
"Si los datos de entrenamiento no coinciden con los del mundo real, tenemos maneras de solucionarlo mediante el aprendizaje automático. No son perfectos, pero pueden hacer mucho para abordar el problema", dijo la autora del estudio en una nota corporativa.
Los modelos que se crean están mejor preparados para gestionar diversos trasfondos genéticos. Por ejemplo, puede predecir las diferencias entre subtipos de enfermedades como el cáncer de mama y sugerir el mejor tratamiento para cada paciente, independientemente de su ascendencia u origen.
Procesar cantidades tan masivas de datos no es tarea fácil. El equipo utiliza el HiPerGator de la UF, una de las supercomputadoras más potentes del país, para analizar la información genómica de millones de personas. Para cada persona, esto significa procesar 3 mil millones de pares de bases de ADN.
El ADN, o ácido desoxirribonucleico, es la molécula que contiene la información genética que determina las características y el funcionamiento de los seres vivos, transmitiéndose de generación en generación.
Crucial
Este hallazgo investigativo es crucial porque la mayoría de los modelos actuales se construyen con datos que no representan completamente a la población mundial.
Gran parte de los datos existentes provienen de hospitales de investigación y de pacientes que confían en el sistema de salud. Esto significa que las poblaciones de pueblos pequeños o quienes desconfían de los sistemas médicos suelen quedar excluidos, lo que dificulta el desarrollo de tratamientos eficaces para todos.
El 97% de las muestras secuenciadas provienen de personas de ascendencia europea, debido, en gran medida, a la financiación y las prioridades a nivel nacional y estatal, pero también a factores socioeconómicos que se multiplican a diferentes niveles.
“Algunos otros países, en particular China y Japón, han intentado recientemente cerrar esta brecha, por lo que hay más datos de estos países que antes, pero aún no se comparan con los datos europeos”, afirmó. “Las poblaciones más pobres suelen quedar completamente excluidas”.
Por lo tanto, la diversidad en los datos de entrenamiento es esencial. En Estados Unidos, se realizan estudios genéticos para detectar enfermedades hereditarias y propensión a desarrollar otras y se busca ampliar su base de datos para reflejar con exactitud la composición demográfica estadounidense, según estudios publicados.
“Queremos que estos modelos funcionen para cualquier paciente, no solo para los de nuestros estudios”, añadió. “Contar con datos de entrenamiento diversos también mejora los modelos existentes. Disponer de datos genómicos poblacionales ayuda a evitar el sobreajuste de los prototipos, lo que significa que funcionarán mejor para todos, incluidos los europeos”, refirió la científica.
Perfeccionar la aplicación
La doctora Graim cree que esta herramienta se utilizará con el tiempo en el ámbito clínico, reemplazando los modelos tradicionales para abordar planes de tratamiento personalizados según la composición genética de cada individuo.
Los próximos pasos del equipo incluyen perfeccionar PhyloFrame y ampliar sus aplicaciones. “Mi sueño es contribuir al avance de la medicina de precisión mediante este tipo de método de aprendizaje automático, para que las personas puedan recibir un diagnóstico temprano y recibir el tratamiento específico”, afirmó Kiley Graim.
FUENTE: Universidad de Florida