Colección pública de secuencias de ADN y ARN alcanza 100 gigabases
Gracias a su política de intercambio de datos, que ha abierto el camino al intercambio global de muchos tipos de información biológica, los tres miembros del INSDC (International Nucleotide Sequence Database Collaboration), que son: EMBL Bank, GenBank, y DNA Data Bank de Japón, han conseguido alcanzar juntos este hito importante en la historia de las bases de datos de secuencias de nucleótidos.
Desde la primera entrada en la EMBL Data Library disponible en 1982, hasta la provisión actual de más de 55 millones de secuencias de al menos 200.000 organismos diferentes, estos recursos se han anticipado a las necesidades de los biólogos moleculares y las han atendido de manera crucial para sus investigaciones.
A finales de la década de 1970, cuando los investigadores comenzaron a estudiar a los organismos a nivel genético, varios grupos comenzaron a explorar la posibilidad de desarrollar una base de datos de secuencias. A principios de 1980, esto condujo a la formación de dos bases de datos. La primera fue la EMBL Data Library, ubicada en el Laboratorio Europeo de Biología Molecular en Heidelberg, Alemania. Poco después vino GenBank, ubicado en el Laboratorio Nacional de Los Alamos (LANL) y actualmente en el Centro Nacional para Información de Biotecnología, en Bethesda, Maryland, Estados Unidos.
Ambas bases de datos fueron alimentadas por colecciones de individuos con indudable visión de futuro: la del EMBL Bank por la colección de Kurt Stuber, entonces ubicada en la Universidad de Colonia en Alemania, y la de GenBank por la colección de Walter Goad en el LANL. Ambas empezaron a colaborar desde muy pronto, una interacción que fue iniciada por Greg Hamm, el primer empleado de la EMBL Data Library. Efectuando tareas de coordinación para evitar la duplicación de esfuerzos, empezó la ardua tarea conjunta de recopilar e intercambiar información.
 | | Evolución del número de secuencias de nucleótidos integrado en las bases de datos desde 1982, en millones. (Foto: EMBL ) |
Cuando el Consorcio Internacional de Secuencias de Nucleótidos se formalizó en febrero de 1987, un tercer socio, el DNA Data Bank de Japón, apareció en el Instituto Nacional de Genética en Mishima, y empezó de inmediato a colaborar con sus homólogos europeos y estadounidenses.
Muchas cosas han cambiado desde los días en los que las secuencias eran tecleadas manualmente a partir de textos difundidos en publicaciones académicas de papel o enviadas en disquetes de ordenador, y distribuidas a los usuarios en aparatosas cintas magnéticas de 9 pistas. Pero el propósito de las bases de datos, hacer pública cada secuencia de nucleótidos con la mayor rapidez posible, sigue manteniéndose ahora con tanta fuerza como al principio.
|