Mas não é apenas uma questão de pares de bases se tornando bits
D
A razão não é tanto a dificuldade tecnológica quanto o custo. Codificar um único gigabyte no DNA chegaria a uma conta de vários milhões de dólares. Fazê-lo em um disco rígido custa menos de um centavo. A Catalog, uma empresa de biotecnologia em Boston, espera reduzir o custo do armazenamento de dados de DNA para menos de US $ 10 por gigabyte. Isso ainda está no lado caro. Mas para requisitos de armazenamento realmente grandes, uma segunda relação também entra em jogo: gigabytes armazenados por metro cúbico.
Os discos rígidos ocupam espaço. Sua taxa de armazenamento é de cerca de 30 milhões de gigabytes por metro cúbico. O método do catálogo poder
a armazenar 600 bilhões de gigabytes no mesmo volume.
A tentação óbvia ao projetar um sistema de armazenamento baseado em DNA é ver os zeros e uns dos dados binários e os pares de bases químicas ( at e gc ) do ácido nucleico de desoxirribose como equivalentes, e simplesmente traduzir um para o outro, com cada um deles. arquivo a ser armazenado correspondendo a uma única e grande molécula de DNA . Infelizmente, isso produz moléculas que são difíceis de serem lidas por máquinas de sequenciamento quando chega a hora de verificar quais dados o DNA está codificando. Em particular, há lugares em dados de computador que consistem em longas cadeias de caracteres ou zeros. os sequenciadores de DNA têm dificuldade quando confrontados com sequências de pares de bases igualmente monótonas.
O catalog tomou um rumo diferente. O sistema da empresa é baseado em 100 moléculas de DNA diferentes , cada uma com dez pares de bases de comprimento.
A abordagem combinatória do catálogo significa que é necessário mais DNA por byte armazenado do que outros métodos baseados em DNA requerem. Isso aumenta o tempo e o custo de leitura para recuperar os dados armazenados em formato eletrônico para processamento. No geral, porém, o método promete ter vantagens significativas sobre seus predecessores.
A próxima tarefa é traduzir essa promessa em realidade. Para isso, a Catalog trabalha com a Cambridge Consultants, uma empresa britânica de desenvolvimento de tecnologia, para criar um protótipo capaz de escrever cerca de 125 gigabytes de dados para o DNA todos os dias. Se esta máquina funcionar como esperado (espera-se que esteja pronta no próximo ano), a empresa pretende produzir um dispositivo mais potente, capaz de escrever 1.000 vezes mais rápido, dentro de três anos. A segunda era de armazenamento de informações do DNA pode, então, finalmente começar. ( Fonte: The economist)
NA é o mais antigo sistema de armazenamento de informações conhecido. É anterior a todos os outros, de lápis e papel para discos rígidos de computador, por bilhões de anos. Mas as tentativas de empregá-lo para armazenar dados gerados por pessoas, ao contrário dos dados necessários para que essas pessoas (e todas as outras coisas vivas) sejam colocadas em primeiro lugar, falharam.
A razão não é tanto a dificuldade tecnológica quanto o custo. Codificar um único gigabyte no DNA chegaria a uma conta de vários milhões de dólares. Fazê-lo em um disco rígido custa menos de um centavo. A Catalog, uma empresa de biotecnologia em Boston, espera reduzir o custo do armazenamento de dados de DNA para menos de US $ 10 por gigabyte. Isso ainda está no lado caro. Mas para requisitos de armazenamento realmente grandes, uma segunda relação também entra em jogo: gigabytes armazenados por metro cúbico.
Os discos rígidos ocupam espaço. Sua taxa de armazenamento é de cerca de 30 milhões de gigabytes por metro cúbico. O método do catálogo poder
a armazenar 600 bilhões de gigabytes no mesmo volume.
Para organizações como estúdios cinematográficos e laboratórios de física de partículas, que precisam arquivar quantidades enormes de informações indefinidamente, a proporção das duas razões, por assim dizer, pode logo favorecer
DNA.
O catalog tomou um rumo diferente. O sistema da empresa é baseado em 100 moléculas de DNA diferentes , cada uma com dez pares de bases de comprimento.
A ordem dessas bases, no entanto, não codifica diretamente os dados binários. Em vez disso, a empresa cola essas moléculas de DNA curtas juntas em outras mais longas.
Crucialmente, o sistema de enzimas que ele usa para fazer isso é capaz de montar moléculas curtas em longas em qualquer ordem que seja desejada. A ordem das unidades moleculares curtas dentro de uma molécula mais longa codifica, de acordo com um livro de regras inventado pela empresa, os dados a serem armazenados.
Começando com 100 tipos de moléculas curtas, trilhões de combinações são possíveis dentro de um período mais longo. Isso permite que as moléculas longas contenham grandes quantidades de informação.

A economia de custos do método do Catalog vem do número limitado de moléculas com as quais ele começa. Fazer novas moléculas de DNA um par de bases de cada vez é caro, mas fazer cópias das existentes é barato, assim como juntar essas moléculas.
A abordagem de catálogo também significa que é mais difícil interpretar incorretamente os dados. Mesmo se uma máquina de sequenciamento obtiver uma base ou duas erradas, geralmente é possível adivinhar a identidade da unidade de dez pares de bases em questão, preservando assim os dados.
A próxima tarefa é traduzir essa promessa em realidade. Para isso, a Catalog trabalha com a Cambridge Consultants, uma empresa britânica de desenvolvimento de tecnologia, para criar um protótipo capaz de escrever cerca de 125 gigabytes de dados para o DNA todos os dias. Se esta máquina funcionar como esperado (espera-se que esteja pronta no próximo ano), a empresa pretende produzir um dispositivo mais potente, capaz de escrever 1.000 vezes mais rápido, dentro de três anos. A segunda era de armazenamento de informações do DNA pode, então, finalmente começar. ( Fonte: The economist)
Em breve estarei postando meu ponto de vista sobre tudo isso.



0 Comentários
Deixa seu comentário