Armazenando informações no DNA: melhorando o armazenamento de DNA com poços de eletrodo em nanoescala

O armazenamento de dados de DNA requer um rendimento de síntese mais alto do que é possível com as técnicas atuais. (A a D) Visão geral do pipeline de armazenamento de dados de DNA. (A) Os dados digitais são codificados a partir de sua representação binária em sequências de bases de DNA, com um identificador que os correlaciona com um objeto de dados, informações de endereçamento que são usadas para reordenar os dados durante a leitura e informações redundantes que são usadas para correção de erros. (B) Essas sequências são sintetizadas em oligonucleotídeos de DNA e armazenadas. (C) No momento da recuperação, as moléculas de DNA são selecionadas e copiadas via PCR ou outros métodos e sequenciadas de volta em representações eletrônicas das bases nessas sequências. (D) O processo de decodificação pega esse conjunto ruidoso e às vezes incompleto de leituras de sequenciamento, corrige erros e sequências ausentes e decodifica as informações para recuperar os dados. (E) Resumo dos processos de síntese comercial e correspondentes densidades oligonucleotídicas estimadas, conforme relatado na literatura ou pelas próprias empresas. A densidade do nosso método eletroquímico é destacada em vermelho escuro. Crédito: Science Advances, 10.1126 / sciadv.abi6714

Os geneticistas podem armazenar dados em DNA sintético como meio de armazenamento de longo prazo devido à sua densidade, facilidade de cópia, longevidade e sustentabilidade. A pesquisa na área avançou recentemente com novos algoritmos de codificação, automação, preservação e sequenciamento. No entanto, o obstáculo mais desafiador na implantação de armazenamento de DNA continua sendo a taxa de transferência de gravação, que pode limitar a capacidade de armazenamento de dados.

Em um novo relatório, Bichlien H. Nguyen e uma equipe de cientistas da Microsoft Research e ciência da computação e engenharia da University of Washington, Seattle, EUA, desenvolveram o primeiro escritor de armazenamento de DNA em nanoescala. A equipe pretendia dimensionar a densidade de gravação do DNA para 25 x 106 sequências por centímetro quadrado, uma capacidade de armazenamento aprimorada em comparação com os arranjos de síntese de DNA existentes. Os cientistas escreveram e decodificaram com sucesso uma mensagem no DNA para estabelecer um sistema prático de armazenamento de dados de DNA. Os resultados foram publicados na Science Advances.

Arquivos de DNA de longo prazo

O ritmo atual de geração de dados excede as capacidades de armazenamento existentes, o DNA é uma solução promissora para este problema em uma densidade prática esperada de mais de 60 petabytes por centímetro cúbico. O material é durável em uma variedade de condições, relevante e fácil de copiar, com a promessa de ser mais sustentável ou mais verde do que a mídia comercial. Durante o processo, os dados digitais na forma de sequências de bits podem ser codificados em sequências das quatro bases naturais do DNA – guanina, adenina, tiamina e citosina, embora bases adicionais também sejam possíveis. Em seguida, a equipe pode escrever as sequências na forma molecular por meio da síntese de novo de oligonucleotídeos de DNA para criar moléculas específicas com base em um conjunto de etapas químicas repetidas. Os oligonucleotídeos resultantes podem ser preservados e armazenados após a síntese. Para acessar os dados, o armazenamento de DNA pode ser amplificado usando reações em cadeia de polimerase e sequenciado para retornar as sequências de bases de DNA para o domínio digital, então as sequências de bases de DNA podem ser decodificadas para recuperar a sequência original de bits.

Visão geral da matriz de 650 nm com inclinação de 2 μm. (A) A análise de elemento finito da geração e difusão de ácido anódico em um eletrodo de 650 nm de diâmetro com um poço de 200 nm é representada com uma vista em corte transversal ao longo do plano y = x e (B) vista de cima para baixo no plano z = 0. As cores azul e amarelo representam regiões com concentrações de ácido relativamente baixas e altas, respectivamente. (C) Uma visão geral da matriz de síntese de DNA em nanoescala com imagens de microscopia eletrônica de varredura da matriz de eletrodos de 650 nm e visão ampliada de um eletrodo. (D) Uma imagem fluorescente em que o poço em torno de cada ânodo ativado é padronizado com AAA-fluoresceína. O diagrama cartoon mostra quais eletrodos no layout foram ativados. (E) Ilustração dos poços padronizados com AAA-fluoresceína e AAA-AquaPhluor e (F) sobreposição de imagem correspondente dos dois fluoróforos no final do DNA sintetizado no mesmo arranjo de eletrodos de 650 nm. Crédito: Science Advances, 10.1126 / sciadv.abi6714

Um novo método para armazenamento de dados de DNA sintético

Neste estudo, Nguyen et al. produziu uma matriz de eletrodos que demonstrou controle específico de eletrodo independente da síntese de DNA com tamanhos de eletrodo e pitches para estabelecer a densidade de síntese de 25 milhões de oligonucleotídeos por cm2. Este valor é estimado como a densidade do eletrodo necessária para atingir a meta mínima de kilobytes por segundo de armazenamento de dados no DNA. A equipe impulsionou o estado da arte em controle químico-eletrônico e forneceu evidências experimentais para a largura de banda de gravação necessária para o armazenamento de dados de DNA.

A equipe apresentou um controlador molecular de prova de conceito na forma de um minúsculo mecanismo de gravação de armazenamento de DNA em um chip. O chip poderia empacotar a síntese de DNA em 3 ordens de magnitude maior do que antes para atingir maior capacidade de gravação de DNA. Armazenar informações no DNA na escala necessária para uso comercial exigia dois processos cruciais. Primeiro, a equipe teve que traduzir bits digitais (uns e zeros) em fitas de DNA sintético representando bits com software de codificação e um sintetizador de DNA. Em seguida, eles devem ser capazes de ler e decodificar as informações de volta aos seus bits para recuperá-las em forma digital novamente com um sequenciador de DNA e software de decodificação.

Processo de armazenamento de DNA usando síntese de DNA. O software codifica bits digitais em uma representação eletrônica das sequências de DNA, e a síntese ocorre para gravar e preservar as informações nas moléculas de DNA. Para ler essas informações, as moléculas de DNA são sequenciadas e, em seguida, o software decodifica as informações de volta em bits digitais. Crédito de animação: Microsoft Research Blog, Crédito: Science Advances, 10.1126 / sciadv.abi6714

Desenvolvimento de matrizes eletroquímicas para recursos em nanoescala

Durante a síntese tradicional de cadeias de DNA, os cientistas usam um método de várias etapas conhecido como química de fosforamidita, em que uma cadeia de DNA pode ser cultivada sequencialmente pela adição de bases de DNA. Cada base de DNA contém um grupo de bloqueio para evitar múltiplas adições de bases de DNA à cadeia crescente. No anexo a uma cadeia de DNA, o ácido pode ser entregue na configuração para clivar o grupo de bloqueio e preparar a cadeia de DNA para adicionar a próxima base. Durante a síntese eletroquímica de DNA, cada ponto na matriz contém um eletrodo e quando uma voltagem é aplicada, o ácido é gerado no eletrodo de trabalho (ânodo) para desbloquear as cadeias de DNA em crescimento, enquanto uma base equivalente é gerada no contra-eletrodo (cátodo) . A equipe evitou a difusão de ácido na configuração projetando uma matriz de eletrodos, onde cada eletrodo de trabalho em torno do qual ocorreu a formação de ácido durante a síntese de DNA foi afundado em um poço e rodeado por quatro contraeletrodos comuns, ou seja, cátodos que impulsionaram a formação de base, para confinar o ácido para regiões específicas. Nguyen et al. verificou a eficácia do projeto usando análise de elementos finitos. Durante os experimentos, quando apresentado em concentração suficiente, o ácido desbloqueou os nucleotídeos ligados à superfície para permitir que o próximo nucleotídeo se acoplar. Usando a configuração de chips contendo pontos característicos para confinar ácidos, eles desenvolveram matrizes eletroquímicas com quatro eletrodos individuais para regular a síntese de DNA. A equipe então realizou experimentos com duas bases marcadas com fluorescência em verde e vermelho. Como prova de conceito, eles mostraram a capacidade do dispositivo de escrever dados sintetizando quatro fitas únicas de DNA, cada uma com 100 bases de comprimento, com uma mensagem codificada, sem erros.

Erros decorrentes da síntese seguida de sequenciamento. (A) Inserções (Ins), deleções (Del) e substituições (Sub) por posição para uma sequência de 180 bases sintetizada e amplificada por PCR. (B) Imagem de eletroforese de produtos de síntese após amplificação por PCR. (C) Mensagem codificada em 64 bytes dividida em quatro sequências exclusivas de 104 bases (topo). Inserções, deleções e substituições por locus de cada uma das quatro sequências na execução de síntese multiplex. Em cada gráfico de análise de erro, as 20 bases terminais nas extremidades 3 ‘e 5’ vêm dos primers usados na PCR e não são representativas dos erros sintetizados. Crédito: Science Advances, 10.1126 / sciadv.abi6714

Dimensionamento do armazenamento de dados de DNA com poços de eletrodos em nanoescala. Minúsculo mecanismo de gravação de armazenamento de DNA em um chip. Crédito: Microsoft Research Blog, Science Advances, 10.1126 / sciadv.abi6714

Outlook: Sintetizando oligonucleotídeos curtos na matriz de eletrodos para armazenamento de dados

Usando a configuração, Nguyen et al. também demonstrou a síntese espacialmente controlada de oligonucleotídeos curtos no arranjo de eletrodos para avaliar o comprimento máximo de DNA que poderia ser formado. Os cientistas criaram uma única sequência de DNA com 180 nucleotídeos e amplificaram por PCR vários produtos de comprimento do comprimento completo dos oligonucleotídeos. Conforme o amplicon ficava mais longo, os produtos de PCR esperados pareciam mais fracos e menos bem definidos, enquanto amplicons mais curtos mostraram bandas mais fortes e bem definidas, indicativas de erros de síntese mais altos. Com base nos resultados, os pesquisadores selecionaram o comprimento da sequência contando com 100 bases para facilidade de purificação para fornecer uma demonstração prática de armazenamento de dados de DNA sem otimização adicional. Desta forma, o método de prova de conceito demonstrado neste trabalho por Bichlien H. Nguyen e colegas abriu o caminho para gerar sequências de DNA únicas e em grande escala em paralelo para armazenamento de dados. O trabalho ultrapassou relatórios anteriores sobre sequências de DNA sintético densas para fornecer uma primeira indicação experimental para atingir a largura de banda de gravação necessária para armazenamento de dados em tamanhos de recursos em nanoescala. Os cientistas esperam aplicações imediatas dos dispositivos em tecnologia da informação e prevêem suas aplicações práticas na ciência dos materiais, biologia sintética e ensaios de biologia molecular em grande escala.


Publicado em 08/12/2021 18h13

Artigo original:

Estudo original: