Os geneticistas podem armazenar dados em DNA sintético como meio de armazenamento de longo prazo devido à sua densidade, facilidade de cópia, longevidade e sustentabilidade. A pesquisa na área avançou recentemente com novos algoritmos de codificação, automação, preservação e sequenciamento. No entanto, o obstáculo mais desafiador na implantação de armazenamento de DNA continua sendo a taxa de transferência de gravação, que pode limitar a capacidade de armazenamento de dados.
Em um novo relatório, Bichlien H. Nguyen e uma equipe de cientistas da Microsoft Research e ciência da computação e engenharia da University of Washington, Seattle, EUA, desenvolveram o primeiro escritor de armazenamento de DNA em nanoescala. A equipe pretendia dimensionar a densidade de gravação do DNA para 25 x 106 sequências por centímetro quadrado, uma capacidade de armazenamento aprimorada em comparação com os arranjos de síntese de DNA existentes. Os cientistas escreveram e decodificaram com sucesso uma mensagem no DNA para estabelecer um sistema prático de armazenamento de dados de DNA. Os resultados foram publicados na Science Advances.
Arquivos de DNA de longo prazo
O ritmo atual de geração de dados excede as capacidades de armazenamento existentes, o DNA é uma solução promissora para este problema em uma densidade prática esperada de mais de 60 petabytes por centímetro cúbico. O material é durável em uma variedade de condições, relevante e fácil de copiar, com a promessa de ser mais sustentável ou mais verde do que a mídia comercial. Durante o processo, os dados digitais na forma de sequências de bits podem ser codificados em sequências das quatro bases naturais do DNA – guanina, adenina, tiamina e citosina, embora bases adicionais também sejam possíveis. Em seguida, a equipe pode escrever as sequências na forma molecular por meio da síntese de novo de oligonucleotídeos de DNA para criar moléculas específicas com base em um conjunto de etapas químicas repetidas. Os oligonucleotídeos resultantes podem ser preservados e armazenados após a síntese. Para acessar os dados, o armazenamento de DNA pode ser amplificado usando reações em cadeia de polimerase e sequenciado para retornar as sequências de bases de DNA para o domínio digital, então as sequências de bases de DNA podem ser decodificadas para recuperar a sequência original de bits.
Um novo método para armazenamento de dados de DNA sintético
Neste estudo, Nguyen et al. produziu uma matriz de eletrodos que demonstrou controle específico de eletrodo independente da síntese de DNA com tamanhos de eletrodo e pitches para estabelecer a densidade de síntese de 25 milhões de oligonucleotídeos por cm2. Este valor é estimado como a densidade do eletrodo necessária para atingir a meta mínima de kilobytes por segundo de armazenamento de dados no DNA. A equipe impulsionou o estado da arte em controle químico-eletrônico e forneceu evidências experimentais para a largura de banda de gravação necessária para o armazenamento de dados de DNA.
A equipe apresentou um controlador molecular de prova de conceito na forma de um minúsculo mecanismo de gravação de armazenamento de DNA em um chip. O chip poderia empacotar a síntese de DNA em 3 ordens de magnitude maior do que antes para atingir maior capacidade de gravação de DNA. Armazenar informações no DNA na escala necessária para uso comercial exigia dois processos cruciais. Primeiro, a equipe teve que traduzir bits digitais (uns e zeros) em fitas de DNA sintético representando bits com software de codificação e um sintetizador de DNA. Em seguida, eles devem ser capazes de ler e decodificar as informações de volta aos seus bits para recuperá-las em forma digital novamente com um sequenciador de DNA e software de decodificação.
Desenvolvimento de matrizes eletroquímicas para recursos em nanoescala
Durante a síntese tradicional de cadeias de DNA, os cientistas usam um método de várias etapas conhecido como química de fosforamidita, em que uma cadeia de DNA pode ser cultivada sequencialmente pela adição de bases de DNA. Cada base de DNA contém um grupo de bloqueio para evitar múltiplas adições de bases de DNA à cadeia crescente. No anexo a uma cadeia de DNA, o ácido pode ser entregue na configuração para clivar o grupo de bloqueio e preparar a cadeia de DNA para adicionar a próxima base. Durante a síntese eletroquímica de DNA, cada ponto na matriz contém um eletrodo e quando uma voltagem é aplicada, o ácido é gerado no eletrodo de trabalho (ânodo) para desbloquear as cadeias de DNA em crescimento, enquanto uma base equivalente é gerada no contra-eletrodo (cátodo) . A equipe evitou a difusão de ácido na configuração projetando uma matriz de eletrodos, onde cada eletrodo de trabalho em torno do qual ocorreu a formação de ácido durante a síntese de DNA foi afundado em um poço e rodeado por quatro contraeletrodos comuns, ou seja, cátodos que impulsionaram a formação de base, para confinar o ácido para regiões específicas. Nguyen et al. verificou a eficácia do projeto usando análise de elementos finitos. Durante os experimentos, quando apresentado em concentração suficiente, o ácido desbloqueou os nucleotídeos ligados à superfície para permitir que o próximo nucleotídeo se acoplar. Usando a configuração de chips contendo pontos característicos para confinar ácidos, eles desenvolveram matrizes eletroquímicas com quatro eletrodos individuais para regular a síntese de DNA. A equipe então realizou experimentos com duas bases marcadas com fluorescência em verde e vermelho. Como prova de conceito, eles mostraram a capacidade do dispositivo de escrever dados sintetizando quatro fitas únicas de DNA, cada uma com 100 bases de comprimento, com uma mensagem codificada, sem erros.
Outlook: Sintetizando oligonucleotídeos curtos na matriz de eletrodos para armazenamento de dados
Usando a configuração, Nguyen et al. também demonstrou a síntese espacialmente controlada de oligonucleotídeos curtos no arranjo de eletrodos para avaliar o comprimento máximo de DNA que poderia ser formado. Os cientistas criaram uma única sequência de DNA com 180 nucleotídeos e amplificaram por PCR vários produtos de comprimento do comprimento completo dos oligonucleotídeos. Conforme o amplicon ficava mais longo, os produtos de PCR esperados pareciam mais fracos e menos bem definidos, enquanto amplicons mais curtos mostraram bandas mais fortes e bem definidas, indicativas de erros de síntese mais altos. Com base nos resultados, os pesquisadores selecionaram o comprimento da sequência contando com 100 bases para facilidade de purificação para fornecer uma demonstração prática de armazenamento de dados de DNA sem otimização adicional. Desta forma, o método de prova de conceito demonstrado neste trabalho por Bichlien H. Nguyen e colegas abriu o caminho para gerar sequências de DNA únicas e em grande escala em paralelo para armazenamento de dados. O trabalho ultrapassou relatórios anteriores sobre sequências de DNA sintético densas para fornecer uma primeira indicação experimental para atingir a largura de banda de gravação necessária para armazenamento de dados em tamanhos de recursos em nanoescala. Os cientistas esperam aplicações imediatas dos dispositivos em tecnologia da informação e prevêem suas aplicações práticas na ciência dos materiais, biologia sintética e ensaios de biologia molecular em grande escala.
Publicado em 08/12/2021 18h13
Artigo original:
Estudo original: