Investigadores de Microsoft y de la Universidad de Washington establecieron récord para el almacenamiento de ADN

Article
07/11/2016

[caption id="attachment_11455" align="aligncenter" width="1198"] El profesor Asociado de la UW, Luis Henrique Ceze, en azul, y la investigadora Lee Organick preparan ADN que contiene datos digitales para la secuenciación, lo que les permite "leer" y recuperar los archivos originales. Foto por Tara Brown / Universidad de Washington[/caption]

Por: Mike Brunker

Los investigadores de Microsoft y de la Universidad de Washington han alcanzado un primer, pero importante, hito en el almacenamiento del ADN al almacenar un récord de 200 megabytes de datos en cadenas moleculares.

La parte impresionante no es sólo la cantidad de datos que fueron capaces de codificar en el ADN sintético, y después decodificarlo. También es el espacio en el que fueron capaces de almacenarlo.

Una vez codificados, los datos ocuparon un lugar en un tubo de ensayo "mucho más pequeño que la punta de un lápiz", dijo Douglas Carmean, arquitecto socio en Microsoft que supervisa el proyecto.

Pensemos en la cantidad de datos en un centro big data, comprimido en el tamaño de unos pocos terrones de azúcar. Es como si todos los datos de acceso público en Internet se metieran en una caja de zapatos. Esa es la promesa de almacenamiento del ADN, una vez que los científicos sean capaces de escalar la tecnología y superar una serie de obstáculos técnicos.

[caption id="attachment_11465" align="aligncenter" width="1212"] Datos digitales de más de 600 smartphones básicos se pueden almacenar en el frotis de color rosa tenue de ADN, ubicado en el extremo de este tubo de ensayo. Foto por Tara Brow / Universidad de Washington.[/caption]

El equipo de Microsoft-UW almacena versiones digitales de obras de arte (incluyendo un vídeo de alta definición de la banda OK Go!), La Declaración Universal de los Derechos Humanos en más de 100 idiomas, los 100 mejores libros del Proyecto Guttenberg y, la base de datos, sin fines de lucro, de las semillas Crop Trust en cadenas de ADN.

La demanda de almacenamiento de datos crece exponencialmente y la capacidad de los medios de almacenamiento existentes no sigue el ritmo. Eso es lo que hace difícil para las organizaciones que necesitan almacenar una gran cantidad de datos, tales como hospitales con extensas bases de datos con información del paciente o empresas con una gran cantidad de imágenes de vídeo, para mantenerse al día. Esto significa que se está perdiendo información y el problema sólo empeorará sin una nueva solución.

El ADN podría ser la respuesta.

Tiene varias ventajas como medio de almacenamiento. Es compacto, duradero, capaz de durar por mucho tiempo si se mantiene en buenas condiciones (el ADN de mamuts se recuperó varios miles de años después de que se extinguieron, por ejemplo), y será siempre actual, creen los investigadores.

"Mientras hay vida basada en el ADN en el planeta, estaremos interesados en leerlo", dijo Karin Strauss, investigadora principal de Microsoft en el proyecto. "Así que es eternamente relevante".

Esto explica por qué el equipo de Microsoft-UW es sólo uno de una serie de grupos de investigación en todo el mundo persiguiendo el potencial del ADN como un gran ático digital.

Los investigadores reconocen que tienen un largo camino por recorrer.

Luis Henrique Ceze, profesor asociado de cómputo e ingeniería de la Universidad de Washington e investigador principal de la universidad en este proyecto, dijo que la industria de la biotecnología ha realizado grandes avances tanto en "sintetización" (codificación) "secuenciación" (decodificación) de los datos en los últimos años. A pesar de ello, dijo, el equipo aún tiene un largo camino por recorrer para que sea viable como una tecnología de archivo.

Pero los investigadores son optimistas.

Ellos señalan que sus diversos equipos de ciencias computacionales, arquitectos en computación y biólogos moleculares ya han aumentado la capacidad de almacenamiento mil veces en el último año. Y ellos creen que pueden hacer grandes avances en velocidades mediante la aplicación de los principios de la informática, como la corrección de errores en el proceso.

Carmean, quien estuvo involucrado en el desarrollo de la arquitectura del microprocesador de Intel a principios de 1989, lo puso de esta manera:

"Es una de esas asociaciones casuales, en el que un sólido entendimiento de los procesadores y la computación en conjunto con expertos en biología molecular, tienen el potencial de producir grandes avances".

Para tener una idea de cómo el equipo de Microsoft-UW hace su trabajo, regresemos a la preparatoria en la clase de biología y recordemos que el ADN, o ácido desoxirribonucleico, es una molécula que contiene las instrucciones biológicas utilizadas en el crecimiento, desarrollo, funcionamiento y reproducción de todos los organismos vivos conocidos.

"El ADN es una molécula de almacenamiento de información increíble que codifica los datos sobre el funcionamiento de un sistema vivo. Estamos reutilizando la capacidad de almacenar datos digitales, fotos, vídeos, documentos", dijo Ceze, quien está llevando el equipo encargado de las investigaciones en el Laboratorio Molecular de Sistemas de Información (MISL, por sus siglas en inglés), que está alojado en un sótano en el campus de la Universidad de Washington. "Este es un ejemplo importante del potencial de los préstamos de la naturaleza para construir mejores sistemas informáticos."

El almacenamiento de datos digitales sobre el ADN funciona así:

En primer lugar, los datos se traducen de 1s y 0s en las "letras" de las cuatro bases de nucleótidos de una cadena de ADN, (A) denina, (C) itosina, (G) uanina y (T) imina.

[caption id="attachment_11475" align="aligncenter" width="1125"] Karin Strauss. Photo by Scott Eklund/Red Box Pictures[/caption]

Después, tienen al proveedor Twist Bioscience "traduce esas cartas, que todavía están en formato electrónico, en moléculas en sí mismas y las envía de vuelta", dijo Strauss. "Básicamente se trata de un tubo de ensayo y apenas se puede ver lo que hay en él. Parece un poco de sal que se secó en la parte inferior".

La lectura de los datos utiliza un pellizco de la biotecnología a la memoria de acceso aleatorio (RAM, por sus siglas en inglés), otro concepto tomado de la informática. El equipo utiliza la reacción en cadena de la polimerasa (PCR, por las siglas en inglés), una técnica que los biólogos moleculares utilizan rutinariamente para manipular el ADN, para multiplicar o "amplificar" las cadenas que se quieren recuperar. Una vez que han aumentado drásticamente la concentración de los fragmentos deseados, toman una muestra, secuencian o decodifican el ADN y luego se ejecutan los cálculos de corrección de errores.

El recorrido de laboratorio está completo, si hay preguntas necesarias por hacer: ¿Por qué un video de OK Go?

"Nos gusta mucho porque hay muchos paralelismos con la obra", dijo Strauss con una risa. "Son muy innovadores y están trayendo cosas diferentes de diversas áreas en su campo, y sentimos que estamos haciendo algo muy similar".

Investigadores de Microsoft y de la Universidad de Washington establecieron récord para el almacenamiento de ADN

Additional resources