genoma humano Archive

Cómo mejorar la gestión de datos en los superordenadores del futuro

UC3M/DICYT La Universidad Carlos III de Madrid (UC3M) investiga cómo sentar las nuevas bases de la gestión de datos en los grandes sistemas de supercomputación del futuro. Y lo hace junto con uno de los centros científicos punteros en este área, el Laboratorio Nacional de Argonne (EEUU), en el marco del proyecto europeo CLARISSE. Esta tecnología podría aplicarse para aumentar el rendimiento, escalabilidad y fiabilidad de los superordenadores del futuro, ubicados en grandes centros de datos de todo el mundo.

En las últimas décadas, muchos descubrimientos científicos han dependido del análisis de un ingente volumen de datos, lo que se realiza fundamentalmente a través de simulaciones computacionales ejecutadas a gran escala en superordenadores. Este tipo de máquinas se emplean para el estudio de modelos climáticos, el desarrollo de nuevos materiales, investigaciones sobre el origen del universo, el genoma humano o nuevas aplicaciones de bioingeniería.

En la actualidad, a medida que se recaba y almacena cada vez más información, la gestión de datos científicos se enfrenta a un problema: el software que gestiona los superordenadores de última generación no ha sido diseñado para los requisitos de escalabilidad que se esperan en los próximos años. De hecho, en menos de una década estas infraestructuras van a ser dos órdenes de magnitud más rápidas que los supercomputadores de hoy.

“En la actualidad, estas aplicaciones experimentan grandes problemas de rendimiento y escalabilidad debido al aumento exponencial de datos por el empleo de mejores instrumentos, la creciente ubicuidad de sensores y la mayor conectividad entre dispositivos”, explica el profesor Florin Isaila, del grupo ARCOS del departamento de Informática de la UC3M. “Hoy en día es necesario un rediseño radical de las infraestructuras computacionales y del software de gestión para adecuarlos al nuevo paradigma de ciencia basada en procesamiento masivo de datos”, concluye.

El objetivo del proyecto CLARISSE (Cross-Layer Abstractions and Run-time for I/O Software Stack of Extreme-scale systems) es precisamente ese: aumentar el rendimiento, escalabilidad, programabilidad y fiabilidad de la gestión de datos de aplicaciones científicas con el fin de ofrecer soporte al diseño de los superordenadores de la próxima generación. Para ello, este proyecto coordinado por la UC3M cuenta con financiación del Séptimo Programa Marco de la Unión Europea (FP7/2007-2013, bajo el acuerdo de subvención número 328582), además de la colaboración del Laboratorio Nacional de Argonne (EEUU), uno de los principales actores a nivel mundial en I+D de software de sistemas para supercomputadores de gran escala.

Históricamente, el desarrollo de software de gestión de datos se ha realizado en capas con poca coordinación en la gestión global de recursos. “Hoy en día, esta falta de coordinación representa uno de los mayores obstáculos para el aumento de la escalabilidad de los sistemas actuales. En este sentido, en CLARISSE investigamos soluciones a estos problemas a través del diseño de nuevos mecanismos para coordinar la gestión de datos de las diferentes capas”, comenta el profesor Isaila.

“En la actualidad ARCOS está muy involucrado en varias iniciativas a nivel mundial para reformar el software de gestión de los futuros supercomputadores, incluyendo la coordinación tanto del proyecto CLARISSE como de la red de colaboración de investigación NESUS. Las sinergias resultantes de estos esfuerzos van a contribuir de forma sustancial a acelerar los descubrimientos científicos de las próximas décadas”, explica el investigador principal del proyecto, Jesús Carretero, catedrático de la UC3M y responsable de ARCOS.

El ADN de los estadounidenses refleja sus múltiples orígenes

La reforma migratoria que intenta sacar adelante el presidente Obama ha puesto de manifiesto la esencia migratoria de aquél país. Tras hacer un estudio sobre casi ciento sesenta mil estadounidenses, un grupo de científicos ha llegado a la conclusión de que su población es un mosaico formado en sucesivas oleadas llegadas desde todo el mundo: desde los primeros pobladores indígenas han ido llegando europeos, africanos y asiáticos de todos los países a lo largo de los últimos cuatrocientos años. Tal vez por eso cuesta entender la feroz oposición de algunos grupos conservadores, mayoritariamente hijos de inmigrantes europeos que masacraron a los indios nativos, a la legalización de la situación de diez millones de inmigrantes hispanos que conviven junto a ellos.

Durante los últimos 500 años, Estados Unidos ha sido un lugar de mezcla continua de diferentes grupos raciales y étnicos, principalmente nativos americanos, colonos europeos y africanos, estos últimos llevados por el comercio de esclavos a través del Atlántico. Sin embargo, no se conoce cómo la ascendencia genética de estas poblaciones varía actualmente en las distintas regiones geográficas del país norteamericano.

Un estudio publicado en la revista American Journal of Human Genetics ha analizado los genomas de más de 160.000 afroamericanos, latinos y estadounidenses de origen europeo y ha dado a conocer que la ascendencia genética de estas poblaciones está fuertemente marcada por la historia.

Cadena de ADN

Aunque se ha caracterizado genéticamente a la población de buena parte del mundo, Estados Unidos ha recibido menos atención por parte de los genetistas debido a sus complejos patrones de ascendencia. Además, la relación entre la ascendencia genética y las autodenominadas identidades raciales y étnicas en cada región de los Estados Unidos no se había caracterizado profundamente.

Katarzyna Bryc, autora principal del estudio, señala que el trabajo realizado “no solo revela los fundamentos históricos de las diferencias regionales en la ascendencia genética sino que también arroja luz sobre las complejas relaciones entre la ascendencia genética y la raza y la etnia autodenominada”.

Para hacer frente a esta investigación, Bryc y sus colegas analizaron variaciones en la secuencia de ADN llamadas polimorfismos de un solo nucleótido en los genomas de 5.269 autodenominados afroamericanos, 8.663 autodenominados latinos y 148.789 autodenominados estadounidenses de origen europeo. Para ello utilizaron muestras de saliva proporcionadas por 23andMe, una empresa estadounidense dedicada al diagnóstico genético. Las más de 160.000 muestras habían sido cedidas por los pacientes tras completar una encuesta y consentir que los datos fueran utilizados con fines de investigación.

Reflejo de las oleadas de inmigración

Encontraron que las diferencias regionales en la ascendencia genética reflejaban acontecimientos históricos, como la temprana colonización española, la reubicación forzada de los nativos americanos en los Estados Unidos o las oleadas de inmigración. Por ejemplo, la ascendencia escandinava se encontró en trazas genéticas en la mayoría de los estados, pero comprendió alrededor del 10% de la ascendencia de los europeo-americanos que viven en Minnesota, Dakota del Norte y Dakota del Sur, donde se registraron oleadas de inmigrantes escandinavos, por ejemplo, en la segunda mitad del siglo XIX.

En cuanto a la autodenominación de identidades raciales y étnicas, más de seis millones de estadounidenses que se identifican como europeos podrían tener ascendencia africana y hasta cinco millones de autodenominados europeo-americanos podrían tener al menos un 1% de ascendencia indígena.

“Estos hallazgos sugieren que muchos individuos con ascendencia afroamericana y nativa americana han pasado a la comunidad blanca, socavando así el uso de etiquetas culturales que separan a los individuos en grupos discretos, no superpuestos”, asegura Bryc, quien añade que en conjunto los resultados muestran que la ascendencia genética “se puede aprovechar para aumentar los registros históricos y para informar sobre los procesos culturales que conformaron a las poblaciones modernas”.

En el trabajo han colaborado investigadores de la Escuela Médica de Harvard, la Universidad Chapman y el Instituto Broad del MIT (Instituto Tecnológico de Massachusetts, por sus siglas en inglés) y Harvard.

Referencia bibliográfica
Bryc, K., Durand, E. I., Macpherson, J. M., Reich, D. y Mountain, J. L. (2014). “The Genetic Ancestry of African Americans, Latinos, and European Americans across the United States”. American Journal of Human Genetics

Fuente DICYT (http://www.dicyt.com/noticias/la-historia-de-los-estados-unidos-esta-escrita-en-su-mapa-genetico)