Nuevas herramientas de IA predicen con precisión el papel de los elementos reguladores del ADN



Los programas de inteligencia artificial (IA) recientemente desarrollados predijeron con precisión el papel de los elementos reguladores del ADN y la estructura tridimensional (3D) basándose únicamente en su secuencia sin procesar, según dos estudios recientes en Nature Genetics. Estas herramientas eventualmente podrían arrojar nueva luz sobre cómo las mutaciones genéticas conducen a la enfermedad y podrían conducir a una nueva comprensión de cómo la secuencia genética influye en la organización espacial y la función del ADN cromosómico en el núcleo, dijo el autor del estudio, Jian Zhou, Ph.D.
, Profesor Asistente en el Departamento de Bioinformática de Lyda Hill en UTSW. En conjunto, estos dos programas brindan una imagen más completa de cómo los cambios en la secuencia de ADN, incluso en regiones no codificantes, pueden tener efectos dramáticos en su función y organización espacial". Jian Zhou, profesor asistente, Departamento de Bioinformática Lyda Hill, UT Southwestern Medical Center El Dr.
Zhou también es miembro del Harold C. Simmons Comprehensive Cancer Center, becario de investigación médica de la Fundación Lupe Murchison y becario del Instituto de Investigación y Prevención del Cáncer de Texas (CPRIT). Solo alrededor del 1 % del ADN humano codifica instrucciones para fabricar proteínas.
Las investigaciones realizadas en las últimas décadas han demostrado que gran parte del material genético no codificante restante contiene elementos reguladores, como promotores, potenciadores, silenciadores y aislantes, que controlan la forma en que la codificación El ADN se expresa. No se comprende bien cómo la secuencia controla las funciones de la mayoría de estos elementos reguladores, explicó el Dr. Zhou.
Para comprender mejor estos componentes reguladores, él y sus colegas de la Universidad de Princeton y el Instituto Flatiron desarrollaron un modelo de aprendizaje profundo que llamaron Sei, que clasifica con precisión estos fragmentos de ADN no codificante en 40 "clases de secuencia" o trabajos, por ejemplo, como un potenciador de actividad génica de células madre o células cerebrales. Estas 40 clases de secuencias, desarrolladas utilizando casi 22 000 conjuntos de datos de estudios previos que estudian la regulación del genoma, cubren más del 97 % del genoma humano. Además, Sei puede puntuar cualquier secuencia por su actividad predicha en cada una de las 40 clases de secuencias y predecir cómo las mutaciones afectan dichas actividades.
Al aplicar Sei a los datos genéticos humanos, los investigadores pudieron caracterizar la arquitectura regulatoria de 47 rasgos y enfermedades registrados en la base de datos del Biobanco del Reino Unido y explicar cómo las mutaciones en los elementos regulatorios causan patologías específicas. Tales capacidades pueden ayudar a obtener una comprensión más sistemática de cómo los cambios en la secuencia genómica están relacionados con enfermedades y otros rasgos. Los hallazgos se publicaron este mes.
En mayo, el Dr. Zhou informó sobre el desarrollo de una herramienta diferente, llamada Orca, que predice la arquitectura 3D del ADN en los cromosomas en función de su secuencia. Usando conjuntos de datos existentes de secuencias de ADN y datos estructurales derivados de estudios previos que revelaron los pliegues, giros y vueltas de la molécula, el Dr.
Zhou entrenó al modelo para hacer conexiones y evaluó la capacidad del modelo para predecir la estructura en varias escalas de longitud. Los hallazgos mostraron que Orca predijo estructuras de ADN tanto pequeñas como grandes en función de sus secuencias con alta precisión, incluso para secuencias que portaban mutaciones asociadas con diversas afecciones de salud, incluida una forma de leucemia y malformaciones en las extremidades. Orca también permitió a los investigadores generar nuevas hipótesis sobre cómo la secuencia de ADN controla su estructura 3D local y a gran escala.
El Dr. Zhou dijo que él y sus colegas planean usar Sei y Orca, que están disponibles públicamente en servidores web y como código de fuente abierta, para explorar más a fondo el papel de las mutaciones genéticas en la causa de las manifestaciones moleculares y físicas de las enfermedades: investigación. que eventualmente podría conducir a nuevas formas de tratar estas condiciones. El estudio de Orca fue apoyado por subvenciones de CPRIT (RR190071), los Institutos Nacionales de Salud (DP2GM146336) y el Programa de Becarios Dotados en Ciencias Médicas de UT Southwestern.
.

Yorumlar

Bu blogdaki popüler yayınlar

Estudio muestra cómo RAS normal interactúa con RAS mutado en células vivas

La detección de SDOH no es suficiente para identificar a los pacientes con riesgo de desconexión

Los trasplantes de órganos de donantes vivos no emparentados no son inferiores a los órganos de donantes fallecidos