El crecimiento de los datos digitales es de tal magnitud que algunos apuestan por expandir las capacidades de almacenamiento mediante el uso del manual de instrucciones de los seres vivos: el ADN
Si en 1895 la película Llegada de un tren a la estación de La Ciotat, de los hermanos Lumiere, formó parte de una revolución llamada cine, más de un siglo después este patrimonio de la humanidad ha sido utilizado como parte de otro experimento innovador.
El filme, digitalizado, junto a otros cinco archivos: una tarjeta de compra de Amazon, el sistema operativo KolibriOS, un artículo del matemático Claude Shannon, el virus ZipBomb y una foto de la placa que llevaron las naves Pioneer 10 y 11 con un mensaje en pictogramas, fue guardado y luego recuperado hace dos semanas, sin errores, en una molécula de ADN, de acuerdo con un reporte del diario El País.
No es la primera vez que se archiva información en el código genético que identifica a todos los seres vivos. Hace cinco años el genetista estadounidense George Church salvó un libro en una secuencia de genoma. Se trata, no obstante, de que la densidad de información que es posible almacenar en un solo gramo de ADN ha crecido, como nunca antes, hasta 215 petabytes. Ello equivale a 225 443 840 gigabytes.
El mundo digital ocupará 44 000 millones de gigabytes en el año 2020, cifra que supera en diez veces lo registrado en 2013, según la multinacional tecnológica Dell EMC. Ese pronóstico indica que muy pronto la producción de datos superará a la capacidad de almacenamiento de todos los discos duros del planeta.
Por eso varias compañías buscan evitar que los datos se desborden y sea imposible conservarlos. Para ello han tratado de aplicar una premisa: Si la biología ha almacenado ingentes cantidades de información en el ADN celular, ¿por qué no copiar este método y utilizar tejidos vivos como discos duros?
A fin de cuentas, la evidencia es prometedora: los datos archivados en el ADN resisten decenas de miles de años, tal y como demuestra la secuenciación realizada a un hombre de las cavernas que vivió hace 430 000 años en una cueva de España, cuya información biológica fue recuperada casi por completo.
La durabilidad de la información en el ADN, unido a su alta capacidad de almacenamiento, ha motivado, por ejemplo, a Microsoft —en alianza con Twist Bioscience, una empresa con sede en San Francisco, Estados Unidos—, a crear moléculas de ADN sintético cargadas de información digital.
En abril de 2016, Microsoft anunció en su blog oficial que había archivado información en un código genético, el cual tendría capacidad de hasta mil terabytes (0,97 petabytes), y una durabilidad de mil a diez mil años, en dependencia de las condiciones de almacenamiento. Y esta técnica podría ser una alternativa para los discos duros del futuro.
A un año del exitoso experimento de Microsoft se ha producido otro punto de giro en esta carrera por almacenar la información que genera la humanidad.
De nuevo Twist Bioscience ha sido el soporte utilizado para la codificación del ADN, esta vez en alianza con la Universidad de Columbia y el Centro del Genoma de Nueva York. Ambos centros ejecutaron un procedimiento novedoso para guardar los seis archivos citados al inicio de este artículo.
La razón del éxito se debe a un algoritmo matemático que lee el código genético —identificado con las letras A (adenina), G (guanina), C (citosina) y T (timina)— y elimina los trozos defectuosos.
La revista Science explica que una secuencia de ADN puede tener tramos con letras repetidas, como AAAAAAA. Sin embargo, el algoritmo creado por los genetistas Yaniv Erlich y Dina Zielinski, del Centro del Genoma de Nueva York, elimina estas cadenas innecesarias y optimiza el ADN resultante para su correcta decodificación, según aseguraron a la revista especializada.
El método, llamado Fuente de ADN, opera de la siguiente forma: la información digital se traduce a código binario, que es separado en pequeñas porciones e identificado con códigos de barras, como los que tienen los productos en un mercado. Luego este código binario es convertido en un par genético. Los investigadores indicaron que la secuencia usada en esta ocasión fue CATTGACCGA.
Una vez determinada la secuencia de ADN, se envió a Twist Bioscience, que la sintetizó en moléculas y la regresó al laboratorio neoyorquino. Sus creadores usaron entonces máquinas de secuenciación para reconvertir la molécula en código binario y recuperar la información original almacenada.
Aunque los experimentos demuestran la capacidad del ADN para almacenar información, el elevado costo del proceso es su principal limitación. Fueron necesarios 9 000 dólares para leer los archivos almacenados por la Universidad de Columbia y el Centro del Genoma de Nueva York, los que solo «pesaron» dos megabytes.
Si bien esta pesquisa demostró que es posible almacenar información en grandes cantidades en el ADN (los dos megas de la prueba correspondieron a una porción ínfima de la capacidad de la molécula), hasta que los costos no sean rebajados será un método elitista.
Sus creadores matizan, no obstante, que hace diez años secuenciar ADN era cien veces más caro, y esperan que esta técnica se emplee, en primer lugar, por las compañías de almacenamiento en la nube. Si se cumple este propósito, en unos años los datos estarían guardados en una cadena genómica. Por ahora, lo cierto es que todos los organismos vivos son un disco duro en potencia.