PT2963709T - Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos - Google Patents

Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos Download PDF

Info

Publication number
PT2963709T
PT2963709T PT151793395T PT15179339T PT2963709T PT 2963709 T PT2963709 T PT 2963709T PT 151793395 T PT151793395 T PT 151793395T PT 15179339 T PT15179339 T PT 15179339T PT 2963709 T PT2963709 T PT 2963709T
Authority
PT
Portugal
Prior art keywords
dna
labeled
fragments
sequence
dna fragments
Prior art date
Application number
PT151793395T
Other languages
English (en)
Inventor
Jendrisak Jerome
Dahl Gary
Li Grunenwald Haiying
Caruccio Nicholas
Original Assignee
Epicentre Tech Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42119714&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT2963709(T) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Epicentre Tech Corp filed Critical Epicentre Tech Corp
Publication of PT2963709T publication Critical patent/PT2963709T/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Description

DESCRIÇÃO "COMPOSIÇÕES DE EXTREMIDADE DE TRANSPOSÃO E MÉTODOS DE MODIFICAÇÃO DE ÁCIDOS NUCLEICOS"
Este pedido reivindica prioridade para os Pedidos Provisórios U.S. Nos. de Série Nos. 61/108,321, registado em 24 de outubro, 2008; 61/108,326, registado em 24 de outubro, 2008; 61/108,329, registado em 24 de outubro, 2008; 61/155,431, registado em 25 de fevereiro, 2009, e 61/184,530, registado em 5 de junho, 2009.
CAMPO DA INVENÇÃO A presente invenção refere-se a métodos, composições e estojos para utilização de transposase e composições de extremidade de transposão para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo. Os fragmentos de ssDNA gerados são úteis como modelos, por exemplo, para uma variedade de aplicações, incluindo, por exemplo, sequenciação de DNA de alto rendimento, massivamente paralela e/ou multiplex.
ANTECEDENTES DA INVENÇÃO Há uma variedade de métodos e aplicações para os quais é desejável gerar uma biblioteca de moléculas de DNA fragmentadas e marcadas a partir de moléculas-alvo de DNA de filamentação dupla (dsDNA). Muitas vezes, a finalidade é gerar moléculas de DNA de filamentação simples (ssDNA) mais pequenas (por exemplo, fragmentos de DNA) a partir de moléculas de dsDNA maiores para utilização como modelos em reações de DNA ou RNA polimerase (por exemplo, para utilização como modelos em reações de sequenciação de DNA ou em reações de amplificação DNA ou RNA nas quais um "primer" emparelha com o marcador e é estendido por uma polimerase).
Até recentemente, a maior parte da sequenciação de DNA era realizada usando o método de sequenciação de terminação de cadeia didesoxi de Sanger, no qual um "primer" é estendido por uma polimerase utilizando o DNA a ser sequenciado como modelo. São conduzidas quatro reações, cada uma com uma mistura de todos os nucleótidos canónicos (dATP, dCTP, dGTP e dTTP) e um dos quatro didesoxinucleótidos de terminação de cadeia (ddATP, ddCTP, ddGTP ou ddTTP), e cada reação produz um conjunto encaixado de fragmentos de cadeia terminada que começam com o "primer" e terminam com o didesoxinucleótido. Quando estas moléculas de DNA de cadeia terminada são separadas por tamanho após eletroforese, a ordem pela qual os ddNTPs foram incorporados reflete a sequência do DNA modelo. Utilizando estes métodos, a sequência pode ser determinada para algumas centenas ou milhares de bases a partir do sítio do "primer". A determinação de sequências maiores requereu agrupar a sequência maior a partir de informação sobreposta de numerosos clones.
Uma vez que estes métodos tradicionais requerem grandes quantidades de modelo de DNA, e uma vez que estes métodos produziram fracos resultados quando estavam presentes grandes quantidades de DNA diferente do modelo, a sequenciação didesoxi de Sanger é muitas vezes realizada utilizando um DNA clonado ou amplificado. Por exemplo, a maior parte da sequenciação efetuada durante o Projeto Genoma Humano, que começou formalmente em 1990 e culminou com o anúncio da finalização de um 'esboço grosseiro' da sequência do genoma humano em 2000 e publicação da sequência do último cromossoma humano em 2006, baseou-se na utilização de bibliotecas genómicas consistindo numa população de bactérias hospedeiras, em que cada uma continha uma molécula de DNA que foi clonada num vetor de DNA, de modo que o conjunto de todos os clones de DNA, cada um contendo uma porção do DNA genómico, representou o genoma completo. Este processo foi trabalhoso e altamente iterativo, envolvendo a construção e formação de bancos de grandes números de clones de DNA (por exemplo, clones de BAC), que, por sua vez, foram muitas vezes subclonados para gerar bibliotecas de clones de DNA mais pequenos, que foram usados como modelos de sequenciação. Muitas vezes, os "primers" utilizados nestes métodos foram concebidos para emparelhar com o vetor de modo que eram prolongados no DNA clonado desconhecido durante as reações de sequenciação. Esta abordagem permitiu a utilização do mesmo conjunto de "primers" para analisar muitos clones diferentes.
Para diminuir a quantidade de subclonagem necessária para o projeto de sequenciação do genoma humano, um método que foi por vezes utilizado foi a "transposição in vitro". 0 método de transposição in vitro compreende utilizar elementos genéticos móveis denominados transposões para inserir uma pequena porção de DNA de sequência conhecida no meio do DNA desconhecido. 0 método compreende incubar um clone de DNA de uma biblioteca genómica com um transposão em condições em que ocorre uma única inserção do transposão no clone de DNA, depois transformar células de E. coli com uma alíquota da reação de transposição in vitro e selecionar células que continham um marcador, como um marcador de resistência a antibióticos, codificado pelo transposão. Assim, a reação de transposição in vitro gera uma biblioteca de "clones de inserção de transposão" a partir do clone de DNA paterno, cada um dos quais contém o transposão inserido numa localização diferente no clone de DNA. Cada clone de inserção é depois sequenciado a partir de cada extremidade do transposão utilizando um "primer" diferente para cada filamento de DNA. Como descrito acima, a sequência completa do clone de DNA paterno é construída por sobreposição das sequências obtidas de diferentes clones de inserção. Exemplos da utilização deste método de inserção de transposões para o Projeto Genoma Humano foram descritos por Butterfield, YSN et ai., Nucleic Acids Res 30: 2460-2468, 2002; Shevchenko, Y et ai., Nucleic Acids Res 30: 2469-2477, 2002, e Haapa, S et al. , Genome Res 9: 308-315, 1999. A utilização do processo de transposição in vitro para o Projeto Genoma Humano facilitou a sequenciação completa de clones de DNA genómico e clones de cDNA gerados a partir de mRNA codificado pelo DNA genómico. No entanto, uma desvantagem deste método de transposição in vitro residiu no facto de não ser totalmente in vitro, pois requereu os passos de transformar células de E. coli, selecionar colónias de E. coli que continham inserções de transposão e depois isolar o DNA dos clones de inserção de transposão para sequenciação.
Para eliminar o requisito de transformar células de E. coli com uma alíquota da reação de transposição in vitro e cultura das células de E. coli em meio seletivo para obter clones de inserção de transposão, Teknanen et al. (Patente U.S. No. 6,593,113) desenvolveram métodos à base de transposões totalmente in vitro compreendendo uma reação de transposição in vitro e uma reação de amplificação por PCR para selecionar modelos de sequenciação. De acordo com Teknanen et al., o DNA examinado ou DNA-alvo utilizado nos seus métodos pode variar desde alguns pares de bases até 40 000 pares de bases, sendo o único fator limitador da não utilização de segmentos de DNA ainda mais longos como DNA-alvo a incapacidade de reações de amplificação, tais como PCR, de amplificar segmentos maiores. Assim, nalgumas formas de realização para gerar modelos de sequenciação utilizando este método, o DNA examinado ou DNA-alvo com até cerca de 40 Kb é primeiramente submetido a uma reação de transposição in vitro e depois é amplificado por PCR utilizando, como primeiro "primer" de PCR, um "primer" fixo que é complementar a uma sequência conhecida no DNA-alvo ou, se o DNA-alvo for clonado num vetor, um "primer" fixo que é complementar a uma sequência no vetor e, como segundo "primer" de PCR, um "primer" seletivo que é complementar a uma sequência da extremidade de transposão à qual é unido o DNA-alvo, mais, opcionalmente, um até dez nucleótidos adicionais de identidade conhecida na sua extremidade 3'. Noutra forma de realização, utilizam-se dois "primers" seletivos para o passo de amplificação por PCR, pelo menos um dos quais tem um até dez nucleótidos adicionais de identidade conhecida na sua extremidade 3'. Os métodos de Teknanen et al. proporcionam certos benefícios para a sequenciação de Sanger porque eliminam a necessidade de utilizar células de E. coli para selecionar moléculas de DNA que tenham inserções de transposão. No entanto, estes métodos estão limitados a DNA-alvo de um tamanho até cerca de 40 Kb e, devido à utilização de "primers" fixos ou seletivos, os métodos selecionam moléculas de DNA que exibem apenas uma porção das sequências exibidas pelo DNA-alvo. Em consequência, apesar de estes métodos terem sido úteis para a sequenciação de Sanger, não são adequados para gerar modelos de sequenciação para os mais recentes métodos de sequenciação de DNA de "geração seguinte", que são capazes de gerar dados de sequências até milhões de modelos de sequenciação numa única ronda de sequenciação utilizando um formato massivamente paralelo ou multiplex.
Plataformas de sequenciação de geração seguinte incluem os instrumentos 454 FLX™ ou 454 TITANIUM™ (Roche), o Analisador de Genoma SOLEXA™ (Illumina), o Sequenciador de Molécula Única HELISCOPE™ (Helicos Biosciences) e o sequenciador de DNA SOLID™ (Life Technologies/Applied Biosystems), bem como outras plataformas que ainda estão a ser desenvolvidas por empresas tais como a Intelligent Biosystems e Pacific Biosystems. Apesar de a química da geração de informação de sequências variar para as diferentes plataformas de sequenciação de geração seguinte, todas partilham a característica comum de gerar dados de sequências a partir de um número muito grande de modelos de sequenciação, nos quais as reações de sequenciação são conduzidas simultaneamente. Em geral, os dados de todas estas reações de sequenciação são recolhidos utilizando um "scanner" e depois são reunidos e analisados utilizando computadores e programas bioinformáticos poderosos. As reações de sequenciação são realizadas, lidas, reunidas e analisadas de um modo "massivamente paralelo" ou "multiplex". A natureza massivamente paralela destes instrumentos requereu uma alteração do raciocínio sobre o tipo de modelos de sequenciação que são necessários e como gerá-los para obter as quantidades máximas possíveis de dados de sequenciação a partir destes instrumentos poderosos. Assim, em vez do requisito de bibliotecas genómicas de clones de DNA em E. coli, é agora necessário pensar em termos de sistemas in vitro para gerar bibliotecas de fragmentos de DNA compreendendo uma coleção ou população de fragmentos de DNA gerados a partir de DNA-alvo numa amostra, em que a combinação de todos os fragmentos de DNA na coleção ou população exibe sequências que são qualitativa e/ou quantitativamente representativas da sequência do DNA-alvo de onde foram gerados os fragmentos de DNA. De facto, nalguns casos é necessário pensar em termos da geração de bibliotecas de fragmentos de DNA que consistem em múltiplas bibliotecas de fragmentos de DNA genómico, cada uma das quais é etiquetada com um marcador de endereço ou código de barras diferente para permitir a identificação da fonte de cada fragmento sequenciado.
Em geral, estes métodos de sequenciação de geração seguinte requerem fragmentação de DNA genómico ou cDNA de filamentação dupla (preparado a partir de RNA) em fragmentos de ssDNA mais pequenos e adição de marcadores a pelo menos um filamento ou, preferencialmente, ambos os filamentos dos fragmentos de ssDNA. Nalguns métodos, os marcadores proporcionam sítios de iniciação para a sequenciação de DNA utilizando uma DNA polimerase. Nalguns métodos, os marcadores também proporcionam sítios de captura dos fragmentos sobre uma superfície, tal como uma esférula (por exemplo, antes da amplificação por PCR de emulsão para alguns destes métodos; por exemplo, utilizando métodos descritos na Patente U.S. No. 7,323,305). Na maior parte dos casos, as bibliotecas de fragmentos de DNA utilizados como modelos para a sequenciação de geração seguinte compreendem fragmentos de DNA com marcação 5' e 3' ou "fragmentos de DNA duplamente marcados". Em geral, métodos correntes para gerar bibliotecas de fragmentos de DNA para sequenciação de geração seguinte compreendem fragmentar o DNA-alvo que é desejado sequenciar (por exemplo, DNA-alvo compreendendo DNA genómico ou cDNA de filamentação dupla após transcrição reversa de RNA) utilizando um sonicador, nebulizador, ou uma nuclease, e unir (por exemplo, por ligação) oligonucleótidos que consistem em adaptadores ou marcadores às extremidades 5' e 3' dos fragmentos. Há alguns problemas e ineficiências com os métodos correntes para gerar modelos de sequenciação de geração seguinte, como ilustrado pelo fluxo de trabalho desenvolvido no Wellcome Trust Sanger Institute, um dos maiores centros mundiais de investigação de genomas (por exemplo, descrito em Quail, MA et ai., Nature Methods 5: 1005-1010, 2008) . Por exemplo, Quail et al. descobriram que a nebulização de DNA genómico para sequenciação originou perda de aproximadamente metade da massa do DNA e apenas cerca de 5 % do DNA original consistiu em fragmentos no intervalo de dimensões de aproximadamente 200 pb desejado para sequenciação utilizando o Analisador do Genoma Illumina. Descobriram que um método alternativo, denominado "Adapted Focused Acoustics", originou rendimentos maiores de DNA fragmentado e cerca de 17 % do DNA original consistiu em fragmentos no intervalo de dimensões desejado de 200 pb, mas mesmo este processo desperdiça DNA de amostra ou alvo. Ainda suplementarmente, os fragmentos de DNA resultantes requerem muitas vezes seleção de tamanho por eletroforese em gel e passos adicionais para marcar os fragmentos de DNA de tamanho selecionado, o que é difícil, trabalhoso, demorado e dispendioso.
Assim, muitos dos métodos presentemente utilizados para fragmentação e marcação de DNA de filamentação dupla para utilização em sequenciação de geração seguinte desperdiçam o DNA, requerem instrumentos dispendiosos para a fragmentação e os procedimentos de fragmentação, marcação e recuperação de fragmentos de DNA marcados são difíceis, maçadores, trabalhosos, demorados, ineficientes, dispendiosos, requerem quantidades relativamente grandes de ácidos nucleicos de amostra. Além disso, muitos destes métodos geram fragmentos de DNA marcados que não são completamente representativos das sequências contidas nos ácidos nucleicos de amostra de onde foram gerados. Assim, são necessários na área métodos para gerar bibliotecas de fragmentos de DNA duplamente marcados de um modo massivamente paralelo que ultrapassem as limitações dos métodos correntes.
Alguns dos métodos de sequenciação de geração seguinte empregam substratos de ssDNA circular no seu processo de sequenciação. Por exemplo, os Pedidos de Patentes U.S. Nos. 20090011943; 20090005252; 20080318796; 20080234136; 20080213771; 20070099208, e 20070072208, de Drmanac et al., divulgam a geração de modelos de ssDNA circular para sequenciação de DNA massivamente paralela. O Pedido de Patente U.S. No. 20080242560 de Gunderson e Steemers divulga métodos que compreendem: preparar bolas de DNA digitais (ver, por exemplo, FIG 8 no Pedido de Patente U.S. No. 20080242560), e/ou clivagem específica de locus e amplificação de DNA, tal como DNA genómico, incluindo para amplificação por amplificação de deslocamento múltiplo ou amplificação do genoma completo (por exemplo, FIG 17 no mesmo documento) ou por RCA hiper-ramifiçado (por exemplo, FIG 18 no mesmo documento) para gerar séries de ácidos nucleicos amplificados (por exemplo, ILLUMINA BeadArrays™; ILLUMINA, San Diego CA, EUA). São necessários métodos, composições e estojos aperfeiçoados para preparar fragmentos de ssDNA circular marcados a partir de DNA de uma amostra biológica (por exemplo, a partir de DNA genómico ou DNA mitocondrial ou DNA epissomal, incluindo DNA clonado num plasmídeo, BAC, fosmídeo ou outro vetor epissomal) para utilização em métodos de amplificação ou sequenciação de DNA (como os métodos descritos nos Pedidos de Patentes U.S. Nos. 20090011943; 20090005252; 20080318796; 20080234136; 20080213771; 20070099208, e 20070072208 de Drmanac et al., ou no Pedido de Patente U.S. No. 20080242560 de Gunderson e Steemers ou por Turner et al. da Pacific Biosciences e colocado no seu "website" em www.pacificbiosciences.com) .
Ainda adicionalmente, alguns métodos de amplificação, tais como amplificação do genoma completo, também requerem fragmentação e marcação de DNA genómico. Alguns destes métodos são revistos em: "Whole Genome Amplification", editado por S. Hughs e R. Lasken, 2005, Scion Publishing Ltd (na "worldwide web" em scionpublishing.com). São necessários métodos aperfeiçoados para gerar bibliotecas de fragmentos de DNA a partir de moléculas de DNA-alvo para amplificação, incluindo amplificação de genomas completos ou parciais de um organismo (por exemplo, de uma amostra clinica) ou de múltiplos organismos (por exemplo, DNA-alvo metagenómico de uma amostra ambiental), para análise adicional (por exemplo, por PCR em tempo real, PCR de emulsão, hibridização genómica comparativa (CGH), sequenciação genómica comparativa (CGS), ou para a preparação de sondas etiquetadas especificas para DNA (por exemplo, sondas especificas para cromossomas, por exemplo, pinturas cromossómicas, ou, por exemplo, sondas especificas para genes, por exemplo, para hibridização in situ fluorescente (FISH), para uma variedade de finalidades (por exemplo, para fins de investigação, diagnóstico e industriais) .
Assim, são necessários na área métodos melhores e mais eficientes de preparação de bibliotecas de fragmentos de DNA marcados a partir de DNA-alvo para utilização em métodos de análise de ácidos nucleicos, como métodos de sequenciação de geração seguinte e amplificação. São necessários métodos para gerar bibliotecas de fragmentos de DNA que não requeiram instrumentos especializados e que sejam mais fáceis, mais rápidos, requeiram menos tempo de manipulação, possam ser realizados com amostras mais pequenas de DNA e volumes menores, sejam eficientes na marcação de uma ou de ambas as extremidades dos fragmentos e gerem fragmentos de DNA marcados que sejam qualitativa e quantitativamente representativos dos ácidos nucleicos-alvo na amostra de onde foram gerados.
RESUMO DA INVENÇÃO A presente invenção refere-se a métodos, para o tratamento de ácidos nucleicos e, em particular, métodos e composições para fragmentação e marcação de DNA utilizando composições de transposão. Os métodos da presente invenção são úteis, por exemplo, para gerar bibliotecas de fragmentos de DNA marcados para utilização, por exemplo, em métodos de sequenciação paralela, tais como os reivindicados na reivindicação 1, métodos de sequenciação de geração seguinte, hibridização in situ por fluorescência e semelhantes. Nalgumas formas de realização preferenciais, a presente invenção refere-se à preparação de fragmentos de ssDNA lineares (e respetivos produtos de amplificação) a partir de DNA-alvo compreendendo qualquer dsDNA de interesse (incluindo cDNA de filamentação dupla preparado a partir de RNA), de qualquer fonte, para análise genómica, subgenómica, transcriptómica ou metagenómica, ou análise de expressão de RNA.
Em algumas formas de realização, a presente invenção proporciona métodos para gerar uma biblioteca de fragmentos de DNA marcados de um DNA-alvo, que compreendem incubar o DNA-alvo com uma transposase e uma extremidade de transposão ou composição de extremidade de transposão compreendendo um filamento transferido que tem um domínio marcador na sua porção 5', em condições em que uma reação de transposição é catalisada pela transposase, e em que o DNA-alvo é fragmentado para gerar uma pluralidade de fragmentos de DNA-alvo, e um filamento transferido da extremidade de transposão ou composição de extremidade de transposão é unido às extremidades 5' de cada um de uma pluralidade dos fragmentos de DNA-alvo, para produzir uma pluralidade de fragmentos de DNA-alvo com marcação 5'. Na presente divulgação, os métodos compreendem adicionalmente incubar a pluralidade de fragmentos de DNA-alvo com marcação 5' com pelo menos uma enzima modificadora de ácido nucleico em condições em que um marcador 3' é unido a uma extremidade 3' do fragmento de DNA-alvo com marcação 5' para produzir um compreendendo fragmentos de DNA-alvo duplamente marcados.
Em algumas formas de realização, a presente invenção proporciona métodos de marcação de um fragmento de um DNA-alvo, que compreendem incubar DNA-alvo com uma transposase e uma extremidade de transposão ou composição de extremidade de transposão compreendendo um filamento transferido que compreende um domínio marcador na sua porção 5', em condições em que uma reação de transposição é catalisada pela transposase, em que o DNA-alvo é fragmentado e o filamento transferido da extremidade de transposão ou composição de extremidade de transposão é unido a uma extremidade 5' de um fragmento do DNA-alvo para produzir um fragmento de DNA-alvo com marcação 5'. Na presente divulgação, os métodos compreendem adicionalmente incubar o fragmento de DNA-alvo com marcação 5' com uma enzima modificadora de ácido nucleico em condições em que um marcador 3' é unido a uma extremidade 3' do fragmento de DNA-alvo com marcação 5' para produzir um fragmento de DNA-alvo duplamente marcado. Os métodos estão limitados à utilização de qualquer enzima modificadora de ácido nucleico particular. Por exemplo, enzimas modificadoras de ácidos nucleicos compreendem polimerases, nucleases, ligases e semelhantes. Na presente divulgação, a enzima modificadora de ácido nucleico compreende uma DNA polimerase e o marcador 3' é formado por extensão da extremidade 3' do fragmento de DNA-alvo com marcação 5' . Nalgumas formas de realização, a DNA polimerase compreende uma DNA polimerase dependente do modelo e, nalgumas formas de realização, a DNA polimerase compreende uma DNA polimerase independente do modelo. Nalgumas formas de realização preferenciais, a DNA polimerase é uma DNA polimerase dependente do modelo que tem atividade de deslocamento de filamento e/ou nuclease 5'.
Nalgumas formas de realização da divulgação, uma enzima modificadora de ácido nucleico utilizada nos presentes métodos é uma ligase e o marcador 3' é formado por ligação de um oligonucleótido à extremidade 3' do fragmento de DNA-alvo com marcação 5'. Nalgumas formas de realização da divulgação, a ligase compreende uma ligase dependente do modelo, ao passo que, nalgumas formas de realização, a ligase compreende uma ligase independente do modelo.
Nalgumas formas de realização, as extremidades transferidas compreendem domínios marcadores de captura. Na presente divulgação, os domínios marcadores compreendendo um ou mais de um domínio de sítio de restrição, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição. Nalgumas formas de realização, os domínios marcadores são domínios marcadores de sequenciação que compreendem ou consistem em marcadores de sequenciação selecionados de marcadores de sequenciação Roche 454A e 454B, marcadores de sequenciação ILLUMINA™ SOLEXA™, marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics.
Algumas formas de realização da divulgação compreendem adicionalmente amplificar um ou mais fragmentos de DNA-alvo com marcação 5' e/ou fragmentos de DNA-alvo duplamente marcados. Na divulgação, a amplificação compreende utilizar uma ou mais de uma reação de amplificação por PCR, uma reação de amplificação por deslocamento de filamento, uma reação de amplificação por círculo rolante, uma reação em cadeia de ligase, uma reação de amplificação mediada por transcrição ou uma reação de amplificação mediada por alça. Em certas formas de realização preferenciais na divulgação, amplificar compreende amplificar de modo não seletivo fragmentos de DNA-alvo com marcação 5' compreendendo uma biblioteca de fragmentos de DNA ou fragmentos de DNA-alvo duplamente marcados compreendendo uma biblioteca de fragmentos de DNA.
Nalgumas formas de realização da presente divulgação, a composição de extremidade de transposão utilizada na marcação de um fragmento ou biblioteca compreende uma pluralidade de filamentos transferidos cujas sequências de ácido nucleico diferem em pelo menos um nucleótido, e a amplificação compreende amplificar seletivamente fragmentos de DNA duplamente marcados com base nas sequências de ácido nucleico dos marcadores ou domínios marcadores de extremidades 5'. Noutras formas de realização, a amplificação compreende uma reação em cadeia de polimerase utilizando um único "primer" oligonucleotídico que é complementar ao marcador 3' dos fragmentos de DNA-alvo duplamente marcados.
Nalgumas formas de realização da divulgação, a amplificação compreende uma reação de amplificação por deslocamento de filamento utilizando um único "primer" oligonucleotídico, em que o "primer" oligonucleotídico consiste apenas em ribonucleótidos, ou consiste apenas em ribonucleótidos purina e apenas 2'-F-2'-desoxirribonucleótidos pirimidina, e a reação de amplificação por deslocamento de filamento compreende uma DNA polimerase de deslocamento de filamento e uma ribonuclease H.
Nalgumas formas de realização da divulgação, a amplificação compreende uma reação em cadeia de polimerase utilizando um primeiro e um segundo "primers" oligonucleotídicos, em que cada um compreende porções de extremidade 3' , em que pelo menos a porção de extremidade 3' do primeiro "primer" de PCR é complementar ao marcador 3' dos fragmentos de DNA-alvo duplamente marcados, e em que pelo menos a porção de extremidade 3' do segundo "primer" de PCR exibe a sequência de pelo menos uma porção do marcador ou domínio marcador 5' dos fragmentos de DNA-alvo duplamente marcados. Em formas de realização da divulgação, o primeiro ou segundo "primer" oligonucleotídico compreende uma porção de extremidade 5', em que pelo menos a porção de extremidade 5' do primeiro "primer" não é complementar ao marcador 3' dos fragmentos de DNA-alvo duplamente marcados, ou em que a porção 5' do segundo "primer" não exibe a sequência de pelo menos uma porção do marcador ou domínio marcador 5' dos fragmentos de DNA-alvo duplamente marcados. Em formas de realização da divulgação, cada um do primeiro e um segundo "primers" oligonucleotídicos compreende porções de extremidade 5', em que pelo menos a porção de extremidade 5' do primeiro "primer" de PCR não é complementar ao marcador 3' dos fragmentos de DNA-alvo duplamente marcados, e/ou em que a porção de extremidade 5' do segundo "primer" de PCR não exibe a sequência de pelo menos uma porção do domínio marcador 5' dos fragmentos de DNA-alvo duplamente marcados.
Em algumas formas de realização, a presente divulgação proporciona métodos de geração de uma população de fragmentos de DNA de filamentação simples circulares marcados a partir de um DNA-alvo. Em certas formas de realização, isto compreende incubar o DNA-alvo com uma transposase e uma extremidade de transposão ou uma composição de extremidade de transposão compreendendo um filamento transferido que tem um domínio marcador na sua porção 5' e uma extremidade de transposão na sua porção 3', em condições em que uma reação de transposição é catalisada pela transposase, de modo que o DNA-alvo é fragmentado para gerar uma pluralidade de fragmentos de DNA-alvo e o filamento transferido da extremidade de transposão ou composição de extremidade de transposão é unido à extremidade 5' de cada um da pluralidade dos fragmentos de DNA-alvo para produzir uma população de fragmentos de DNA-alvo com marcação 5'. Estes métodos compreendem adicionalmente passos de desnaturação dos fragmentos de DNA-alvo com marcação 5' para produzir fragmentos de DNA-alvo com marcação 5' de filamentação simples e incubar os fragmentos de DNA-alvo com marcação 5' de filamentação simples com uma ácido nucleico ligase em condições em que os fragmentos de DNA-alvo com marcação 5' de filamentação simples são ligados de modo intramolecular para formar fragmentos de DNA de filamentação simples circulares marcados, em que cada um exibe as sequências do filamento transferido e uma porção do DNA-alvo.
Nas formas de realização divulgadas, é desejável clivar tal DNA de filamentação simples circular. Assim, nalgumas formas de realização dos métodos da presente divulgação, o domínio marcador exibe uma sequência ou estrutura de um sítio de clivagem e o método compreende adicionalmente: incubar os fragmentos de DNA de filamentação simples circulares marcados com pelo menos uma enzima compreendendo uma composição de enzima de clivagem em que a composição de enzima de clivagem procede à clivagem dos fragmentos de DNA de filamentação simples circulares marcados para produzir fragmentos de DNA de filamentação simples lineares duplamente marcados. Em certas formas de realização divulgadas, a composição de enzima de clivagem compreende uma enzima de restrição. Em certas formas de realização, o domínio marcador exibe uma sequência de um sítio de restrição e o método compreende adicionalmente emparelhamento com os fragmentos de DNA de filamentação simples circulares marcados de oligonucleótidos complementares ao domínio marcador e incubação dos fragmentos de DNA de filamentação simples circulares marcados com uma endonuclease de restrição que reconhece o sítio de restrição, em que a endonuclease de restrição procede à clivagem dos fragmentos de DNA de filamentação simples circulares marcados para produzir fragmentos de DNA de filamentação simples lineares duplamente marcados.
Em algumas formas de realização da divulgação, é útil amplificar os fragmentos e bibliotecas da invenção. Assim, algumas formas de realização compreendem adicionalmente amplificar um ou mais dos fragmentos de DNA de filamentação simples circulares marcados e/ou dos fragmentos de DNA de filamentação simples lineares duplamente marcados. Em formas de realização divulgadas, a amplificação compreende uma reação em cadeia de polimerase utilizando um primeiro e um segundo "primers" oligonucleotídicos, cada um compreendendo porções de extremidade 3' , em que pelo menos a porção de extremidade 3' do primeiro "primer" de PCR é complementar a pelo menos uma porção da sequência do filamento transferido nos fragmentos de DNA de filamentação simples circulares marcados ou nos fragmentos de DNA de filamentação simples lineares duplamente marcados, e em que pelo menos a porção de extremidade 3' do segundo "primer" de PCR é complementar a pelo menos uma porção do complemento do filamento transferido nos fragmentos de DNA de filamentação simples circulares marcados ou nos fragmentos de DNA de filamentação simples lineares duplamente marcados.
Em formas de realização divulgadas em que fragmentos de DNA de filamentação simples circulares marcados ou os fragmentos de DNA de filamentação simples lineares duplamente marcados são amplificados, cada um do primeiro e segundo "primers" oligonucleotídicos compreende porções de extremidade 5', em que a porção de extremidade 5' do primeiro "primer" de PCR não é complementar à sequência do filamento transferido nos fragmentos de DNA de filamentação simples circulares marcados ou nos fragmentos de DNA de filamentação simples lineares duplamente marcados, e em que a porção de extremidade 5' do segundo "primer" de PCR não é complementar ao complemento do filamento transferido nos fragmentos de DNA de filamentação simples circulares marcados ou nos fragmentos de DNA de filamentação simples lineares duplamente marcados.
Em formas de realização da divulgação, a presente divulgação proporciona métodos de geração de uma população de fragmentos de DNA circulares marcados a partir de um DNA-alvo, que compreendem incubar DNA-alvo com uma transposase e uma composição de extremidade de transposão em grampo compreendendo um oligonucleótido que exibe uma sequência de filamento não transferido na sua extremidade 5', uma sequência de filamento transferido na sua extremidade 3' e uma sequência de alça interveniente compreendendo um domínio marcador, em condições em que o oligonucleótido pode formar uma haste-alça intramolecular, e em que uma reação de transposição é catalisada pela transposase, de modo que o DNA-alvo é fragmentado para gerar uma pluralidade de fragmentos de DNA-alvo, e o oligonucleótido da composição de extremidade de transposão em grampo é unido à extremidade 5' de cada um da pluralidade de fragmentos de DNA-alvo para produzir uma população de fragmentos de DNA-alvo com marcação 5'. Em algumas formas de realização da divulgação, o método compreende adicionalmente preencher hiatos e ligar cortes nas moléculas dos fragmentos. Em algumas formas de realização da divulgação, isto compreende incubar a população de fragmentos de DNA-alvo com marcação 5' com uma ligase dependente do modelo e uma DNA polimerase desprovida de atividades de exonuclease 5' para 3', exonuclease 3' para 5' e deslocamento de filamento, ou um ou mais tamanhos de oligonucleótidos de sequências aleatórias, que, isoladamente ou em combinação, têm o mesmo comprimento dos hiatos de filamentação simples nos fragmentos de DNA com marcação 5' resultantes após uma reação de transposição com a transposase e a composição de extremidade de transposão em grampo, em condições em que hiatos de filamentação simples nos fragmentos de DNA-alvo com marcação 5' são preenchidos e a extremidade 3' de cada fragmento de DNA com marcação 5' é unida à extremidade 5' de outro fragmento de DNA com marcação 5' que compreende uma porção complementar do DNA-alvo, para formar fragmentos de DNA circulares marcados compreendendo o domínio marcador em estruturas em alça e ambos os filamentos de uma porção do DNA-alvo. Em certas formas de realização da divulgação, o preenchimento e união compreendem incubar os fragmentos de DNA com marcação 5' com a DNA polimerase em condições em que a extremidade 3' de cada fragmento de DNA com marcação 5' é estendida para formar uma população de produtos de extensão de fragmentos de DNA com marcação 5' , e incubar os produtos de extensão de fragmentos de DNA com marcação 5' com a ligase dependente do modelo em condições em que os produtos de extensão de fragmentos de DNA com marcação 5' são ligados, desse modo gerando os fragmentos de DNA circulares marcados. Em formas de realização da divulgação, a DNA polimerase e a ligase são proporcionadas numa mistura e o preenchimento e ligação são efetuados numa única mistura reacional. Em algumas formas de realização da divulgação, os passos de preenchimento e ligação compreendem incubar os fragmentos de DNA com marcação 5' com o um ou mais tamanhos de oligonucleótidos de sequências aleatórias e a ligase dependente do modelo em condições em que os oligonucleótidos de sequências aleatórias emparelham e preenchem hiatos de filamentação simples e são ligados uns aos outros ou a extremidades adjacentes de fragmentos de DNA com marcação 5' para formar fragmentos de DNA circulares marcados.
Em formas de realização da divulgação, o método compreende adicionalmente separar os fragmentos de DNA circulares marcados de DNA linear, oligonucleótidos de sequências aleatórias não ligados e/ou composição de extremidade de transposão em grampo não unidos a DNA-alvo. Nas referidas formas de realização, a mistura reacional contendo os fragmentos de DNA circulares marcados é tratada com exonuclease T5 para remover DNA linear, como fragmentos e oligonucleótidos de sequências aleatórias não ligados.
Em formas de realização da divulgação, é desejável clivar as moléculas de DNA circular marcado. Por exemplo, o método compreende adicionalmente um passo de: clivar os fragmentos de DNA circulares marcados nas estruturas em alça para gerar fragmentos de DNA de filamentação dupla de cauda de andorinha, em que cada filamento tem uma porção do marcador na sua extremidade 5' e uma porção do marcador na sua extremidade 3'. Assim, o domínio marcador nas estruturas em alça exibe uma sequência ou estrutura de um sítio de clivagem e o método compreende adicionalmente: incubar os fragmentos de DNA de filamentação simples circulares marcados com pelo menos uma enzima compreendendo uma composição de enzima de clivagem em que a composição de enzima de clivagem procede à clivagem dos fragmentos de DNA de filamentação simples circulares marcados para produzir fragmentos de DNA de filamentação dupla de cauda de andorinha.
Em algumas formas de realização da divulgação, a composição de enzima de clivagem compreende uma N-glicosilase e uma endonuclease AP. Nas referidas formas de realização, a enzima de clivagem é uma N-glicosilase selecionada de entre uracil-N-glicosilase e uma endonuclease AP e proteína FPG, e a endonuclease AP é selecionada de entre endonuclease III ou endonuclease IV de E. coli.
Em formas de realização da divulgação, a composição de enzima de clivagem compreende uma enzima de restrição. Nas referidas formas de realização, o domínio marcador exibe uma sequência de um sítio de restrição e o método compreende adicionalmente emparelhamento com os fragmentos de DNA de filamentação simples circulares marcados de oligonucleótidos complementares ao domínio marcador e incubação dos fragmentos de DNA de filamentação simples circulares marcados com uma endonuclease de restrição que reconhece o sítio de restrição, em que a endonuclease de restrição procede à clivagem dos fragmentos de DNA de filamentação simples circulares marcados para produzir fragmentos de DNA de filamentação dupla de cauda de andorinha, em que cada filamento tem uma porção do marcador na sua extremidade 5' e uma porção do marcador na sua extremidade 3'.
Algumas divulgações compreendem adicionalmente desnaturar os fragmentos de DNA de filamentação dupla de cauda de andorinha para gerar fragmentos de DNA de filamentação simples lineares duplamente marcados.
As divulgações circular e de cauda de andorinha têm aplicação em métodos que compreendem utilizar os fragmentos de DNA como modelos num método de sequenciação de DNA ou numa reação de amplificação. Assim, os métodos da presente divulgação compreendem adicionalmente amplificar fragmentos de DNA circulares marcados, fragmentos de DNA de filamentação dupla de cauda de andorinha e/ou fragmentos de DNA de filamentação simples lineares duplamente marcados. Amplificar compreende utilizar uma ou mais de uma reação de amplificação por PCR, uma reação de amplificação por deslocamento de filamento, uma reação de amplificação por círculo rolante, uma reação em cadeia de ligase, uma reação de amplificação mediada por transcrição ou uma reação de amplificação mediada por alça. Na divulgação, a amplificação compreende uma reação em cadeia de polimerase utilizando um primeiro e um segundo "primers" oligonucleotídicos, em que cada um compreende porções de extremidade 3', em que pelo menos a porção de extremidade 3' do primeiro "primer" de PCR é complementar a pelo menos uma porção do domínio marcador e em que pelo menos a porção de extremidade 3' do segundo "primer" de PCR exibe a sequência de pelo menos uma porção do domínio marcador. Na divulgação, cada um do primeiro e segundo "primers" oligonucleotídicos compreende porções de extremidade 5', em que a porção de extremidade 5 ' do primeiro "primer" de PCR não é complementar à sequência marcadora e em que a porção de extremidade 5' do segundo "primer" de PCR não exibe a sequência do domínio marcador. A divulgação de qualquer uma das amplificações por PCR descritas acima compreende amplificações em que as porções de extremidade 5' do primeiro e/ou do segundo "primers" de PCR exibem domínios marcadores. Na referida divulgação, os domínios marcadores compreendem um ou mais de um domínio de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição.
Em formas de realização particularmente preferenciais dos métodos descritos aqui, os domínios marcadores são domínios marcadores de sequenciação que compreendem ou consistem em marcadores de sequenciação selecionados de marcadores de sequenciação Roche 454A e 454B, marcadores de sequenciação ILLUMINA™ SOLEXA™, marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics.
Em algumas formas de realização, a presente invenção proporciona métodos de marcação de um fragmento de um DNA-alvo, que compreendem incubar DNA-alvo com uma transposase e uma composição de extremidade de transposão compreendendo um filamento transferido que exibe, na sua porção 5', a sequência de um domínio marcador que não é uma extremidade de transposão e, na sua porção 3', a sequência da extremidade de transposão transferida, em que o DNA-alvo é fragmentado e o filamento transferido da composição de extremidade de transposão é unido a uma extremidade 5' de um fragmento do DNA-alvo para produzir um fragmento de DNA-alvo com marcação 5 ' .
Em algumas formas de realização, a presente invenção proporciona métodos de produção de uma biblioteca de fragmentos de DNA com marcação 5', que compreendem incubar o DNA-alvo com uma transposase e uma composição de extremidade de transposão compreendendo filamentos transferidos que exibem, nas suas porções 5', a sequência de um ou mais domínios marcadores para uma finalidade particular e, nas suas porções 3', a sequência da extremidade de transposão transferida, em condições em que uma reação de transposição é catalisada pela transposase, em que o DNA-alvo é fragmentado e os filamentos transferidos da composição de extremidade de transposão são unidos a extremidades 5' de fragmentos do DNA-alvo para produzir fragmentos de DNA-alvo com marcação 5 ' , de modo que a reação de transposição produz uma pluralidade de fragmentos de DNA-alvo com marcação 5' compreendendo uma biblioteca de fragmentos de DNA do DNA-alvo . A presente divulgação também proporciona composições. Por exemplo, a presente divulgação proporciona uma composição que compreende uma molécula de ácido nucleico sintético tendo uma porção 5' compreendendo um domínio marcador e uma porção 3' compreendendo um filamento transferido de uma extremidade de transposão. Nalgumas formas de realização, a divulgação é uma composição compreendendo uma pluralidade de moléculas de ácidos nucleicos sintéticos, em que as moléculas de ácidos nucleicos compreendem porções 5' compreendendo domínios marcadores que diferem por pelo menos um nucleótido e porções 3' compreendendo um filamento transferido de uma extremidade de transposão.
Em divulgações das composições descritas acima, pelo menos a porção 3' da molécula de ácido nucleico é DNA de filamentação dupla.
Em formas de realização, a extremidade de transposão é uma extremidade de transposão Tn5 ao passo que, noutras formas de realização, a extremidade de transposão é uma extremidade de transposão Mu. 0 domínio marcador da composição de moléculas de ácidos nucleicos compreende um domínio de sítio de captura, ou em outras divulgações, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição, ou um domínio de sítio de restrição. Em formas de realização particularmente preferenciais, os domínios marcadores compreendem marcadores de sequenciação compreendendo ou consistindo em marcadores de sequenciação selecionados de marcadores de sequenciação Roche 454A e 454B, marcadores de sequenciação ILLUMINA™ SOLEXA™, marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics.
Na divulgação, a composição compreendendo uma molécula de ácido nucleico compreende adicionalmente uma transposase purificada. Na divulgação, a transposase é selecionada de uma transposase Tn5 e uma transposase Mu. Na divulgação, a molécula de ácido nucleico e a transposase são proporcionadas numa mistura. Na divulgação, a mistura compreende adicionalmente um detergente não iónico. Em formas de realização ainda mais preferenciais, o detergente não iónico compreende Nonidet P-40 e/ou Tween-20. A presente divulgação proporciona um estojo compreendendo qualquer uma das composições descritas acima ou noutro local do presente documento. Na referida divulgação, o estojo compreende adicionalmente uma ou mais de uma ligase, uma polimerase e/ou reagentes para uma reação de amplificação. Na referida divulgação, os reagentes para uma reação de amplificação compreendem reagentes para uma reação em cadeia de polimerase. Na referida divulgação, os reagentes para uma reação de amplificação e/ou reação em cadeia de polimerase compreendem pelo menos um "primer" e, em formas de realização particularmente preferenciais, os reagentes compreendem um "primer" que compreende uma porção 3' que é complementar ao complemento do domínio marcador da porção 5' da molécula de ácido nucleico. Na divulgação, o domínio marcador compreende um ou mais de um domínio de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição e, em formas de realização particularmente preferenciais, o domínio marcador compreende um domínio de marcador de sequenciação que compreende ou consiste num marcador de sequenciação selecionado de marcadores de sequenciação Roche 454A e 454B, marcadores de sequenciação ILLUMINA™ SOLEXA™, marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics.
Na divulgação, um estojo da presente invenção compreende adicionalmente reagentes para uma reação de sequenciação de DNA. A divulgação compreende uma mistura reacional compreendendo um DNA-alvo de filamentação dupla e qualquer uma das moléculas de ácidos nucleicos de extremidade de transposão marcadas e/ou composições de transposase descritas acima. A presente divulgação proporciona uma composição compreendendo uma transposase purificada e uma pluralidade de extremidades de transposão ou composições de extremidade de transposão sintéticas. Na referida divulgação, as composições de extremidade de transposão compreendem extremidades de transposão em grampo, ao passo que, nalgumas formas de realização, as extremidades de transposão ou composições de extremidade de transposão sintéticas compreendem filamentos transferidos e filamentos não transferidos separados. Na diculgação, os filamentos transferidos compreendem domínios marcadores 5', por exemplo, compreendendo um ou mais de um domínio de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição. Na divulgação, os domínios marcadores compreendem marcadores de sequenciação compreendendo ou consistindo num marcador sequenciação selecionado de marcadores de sequenciação Roche 454A e 454B, marcadores de sequenciação ILLUMINA™ SOLEXA™, marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics.
Na divulgação, a composição compreendendo uma transposase purificada compreende uma pluralidade de extremidades de transposão sintéticas que compreendem pelo menos dois filamentos transferidos que diferem entre si por pelo menos um nucleótido e, em formas de realização preferenciais, os filamentos transferidos compreendem porções 5' e porções 3', em que pelo menos duas das porções 5' dos filamentos transferidos compreendem marcadores que diferem entre si por pelo menos um nucleótido, e em que as porções 3' dos filamentos transferidos compreendem a mesma sequência de extremidade de transposão.
As extremidades de transposão compreendem extremidades de transposão Mu e a transposase é transposase Mu e, nalgumas formas de realização preferenciais, as porções 3' dos filamentos transferidos compreendem uma sequência de uma extremidade de transposão Mu, e em que as porções 5' dos filamentos transferidos não provêm de um transposão Mu.
Nalgumas formas de realização, as extremidades de transposão compreendem extremidades de transposão Tn5 e a transposase é transposase Tn5 e, nalgumas formas de realização preferenciais, as porções 3' dos filamentos transferidos compreendem uma sequência de uma extremidade de transposão Tn5, e em que as porções 5' dos filamentos transferidos não provêm de um transposão Tn5. A presente divulgação proporciona composições compreendendo uma biblioteca de fragmentos de DNA, em que a biblioteca de fragmentos de DNA compreende fragmentos do DNA-alvo tendo extremidades 5' que compreendem sequências de filamentos transferidos de extremidades de transposão ou composições de extremidade de transposão. As sequências dos filamentos transferidos compreendem domínios marcadores 5' e, em formas de realização ainda mais preferenciais, a biblioteca de fragmentos de DNA compreende fragmentos de DNA-alvo compreendendo marcadores 3' complementares a um filamento transferido de uma extremidade de transposão ou composição de extremidade de transposão. Na diculgação, a biblioteca de fragmentos de DNA compreende fragmentos de filamentação dupla do DNA-alvo. A presente divulgação proporciona composições que compreendem um fragmento de DNA circular marcado de um DNA-alvo, compreendendo uma porção que compreende uma sequência de filamento não transferido na extremidade 5' da porção, uma sequência de filamento transferido na extremidade 3' da porção, uma sequência de alça interveniente compreendendo um domínio marcador, sequências de ambos os filamentos de uma porção de um DNA-alvo. A presente divulgação proporciona composições que compreendem um fragmento de DNA de filamentação simples circular marcado de um DNA-alvo, compreendendo uma sequência do filamento transferido de uma extremidade de transposão ou de uma composição de extremidade de transposão e uma porção de filamentação simples de um DNA-alvo. Em exemplos preferenciais, a sequência do filamento transferido compreende um domínio marcador. A presente divulgação proporciona composições que compreendem um fragmento de DNA de filamentação dupla de cauda de andorinha de um DNA-alvo, compreendendo uma porção de filamentação dupla de um DNA-alvo em que cada filamento tem uma extremidade 5' compreendendo pelo menos uma porção de uma sequência de filamento transferido e uma extremidade 3' compreendendo pelo menos uma porção de uma sequência de filamento não transferido.
Formas de realização da invenção são descritas neste resumo e na Descrição Pormenorizada da Invenção, abaixo, que é aqui dada comoincorporada a título de referência.
Formas de realização da invenção são descritas neste resumo e na Descrição Pormenorizada da Invenção, abaixo.
Embora a invenção tenha sido descrita em conexão com formas de realização específicas, deve entender-se que a invenção, tal como reivindicada, não pretende ficar limitada a tais formas de realização específicas.
DESCRIÇÃO BREVE DAS FIGURAS
As seguintes figuras fazem parte da presente especificação e são incluídas para demonstrar adicionalmente certos aspetos da presente invenção. A invenção pode ser mais bem compreendida com referência a uma ou mais destas figuras em combinação com a descrição pormenorizada de formas de realização específicas apresentada neste documento. A FIG. 1 proporciona um diagrama esquemático que mostra inserção de um transposão num DNA-alvo numa reação de transposição. A FIG. 2 proporciona um diagrama esquemático que mostra fragmentação e marcação de DNA-alvo por inserção de extremidades de transposão numa reação de transposição. A FIG. 3 proporciona um diagrama esquemático dos produtos de dois eventos de inserção de composição de extremidade de transposão catalisada por transposase. Assim, o produto da inserção de composição de extremidade de transposão catalisada por transposase representada à esquerda da figura mostra uma orientação da extremidade de transposão em que o filamento transferido da composição de extremidade de transposão (isto é, em que a extremidade de transposão transferida exibe a sequência 5' AGATGTGTATAAGAGACAG 3' (SEQ ID N0:1), com a sua extremidade 3' unida ao DNA-alvo) está no filamento de cima, e o produto da inserção de composição de extremidade de transposão catalisada por transposase representada à direita da figura mostra uma orientação da extremidade de transposão em que o filamento transferido está no filamento de baixo. 0 filamento não transferido é a SEQ ID NO:2. A FIG. 4 ilustra exemplos de duas extremidades de transposão marcadas diferentes, em que cada uma compreende um oligonucleótido de filamento transferido com um marcador diferente na porção 5' para utilização na geração de uma biblioteca de fragmentos de DNA marcados. A extensão das extremidades 3' de cada filamento utilizando, por exemplo, DNA polimerase tendo atividade de nuclease 5' ou deslocamento de filamento produz fragmentos de ssDNA duplamente marcados. A sequência do filamento transferido mostrada é a SEQ ID N0:1; o filamento não transferido é a SEQ ID NO:2. A FIG. 5 mostra uma imagem de gel de agarose que mostra o intervalo de tamanhos de produtos de transposição de fragmentos de DNA com marcação 5' produzidos utilizando diferentes concentrações de transpossoma. A FIG. 6 mostra uma imagem de gel de agarose que mostra o intervalo de tamanhos de produtos de transposição de fragmentos de DNA com marcação 5' produzidos em reações de 5 minutos a diferentes temperaturas, com diferentes tampões reacionais, na presença ou ausência de dimetilformamida (DMF).
A FIG. 7 ilustra um exemplo do método em que uma DNA polimerase que tem atividade de DNA polimerase de deslocamento de filamento e/ou que tem atividade de exonuclease 5' para 3' é utilizada para unir o complemento do filamento transferido aos fragmentos de DNA com marcação 5' da reação de transposição in vitro para gerar uma biblioteca de fragmentos de DNA compreendendo fragmentos de ssDNA duplamente marcados. Como mostrado, a atividade de deslocamento de filamento e/ou exonuclease 5' para 3' da DNA polimerase desloca ou digere o DNA que é emparelhado a jusante de um produto de extensão de DNA polimerase e a extensão pela DNA polimerase une um segundo marcador que compreende ou consiste numa sequência de DNA que é complementar ao primeiro marcador inserido no filamento oposto. Nalgumas formas de realização, os produtos de fragmentos de DNA duplamente marcados são amplificados por PCR utilizando oligonucleótidos que são complementares ao complemento do filamento transferido. A sequência do filamento transferido mostrada é a SEQ ID N0:1; o filamento não transferido é a SEQ ID N0:2. A FIG. 8 ilustra um exemplo do método em que uma DNA polimerase que tem atividade de DNA polimerase de deslocamento de filamento e/ou que tem atividade de exonuclease 5' para 3' é utilizada para unir o segundo marcador aos fragmentos de DNA com marcação 5' da reação de transposição in vitro para gerar uma biblioteca de fragmentos de DNA compreendendo fragmentos de DNA duplamente marcados. Como mostrado, a atividade de deslocamento de filamento e/ou exonuclease 5' para 3' da DNA polimerase desloca ou digere o DNA que é emparelhado a jusante de um produto de extensão de DNA polimerase e a extensão pela DNA polimerase une um segundo marcador que compreende ou consiste numa sequência de DNA que é complementar ao primeiro marcador inserido no filamento oposto. Nalgumas formas de realização, os produtos de fragmentos de ssDNA duplamente marcados são amplificados por PCR utilizando oligonucleótidos que são complementares às diferentes sequências no respetivo primeiro ou segundo marcador como "primers" de PCR. A sequência do filamento transferido mostrada é a SEQ ID N0:1; o filamento não transferido é a SEQ ID N0:2. A FIG 9 proporciona uma comparação do comprimento de leitura da sequenciação, precisão e cobertura de uma única sequência contígua utilizando uma biblioteca de fragmentos de DNA produzida de acordo com formas de realização da presente invenção, em comparação com uma biblioteca de controlo produzida utilizando nebulização. A FIG. 10 proporciona um diagrama esquemático que mostra fragmentação e marcação de DNA-alvo para produzir uma biblioteca compatível com Roche/454 por inserção de extremidades de transposão marcadas numa reação de transposição, seguido de PCR específico para marcadores +/códigos de barras. A FIG 11 mostra uma imagem de gel de agarose que mostra DNA de entrada (via 2), o intervalo de tamanhos de produtos de transposição de fragmentos de DNA com marcação 5' (via 3), o intervalo de tamanhos de produtos da reação de PCR (via 4) e uma reação de controlo (via 5) para a preparação de uma biblioteca de sequenciação compatível com Roche/454 FLX com código de barras como ilustrado na FIG. 10. A FIG 12 mostra uma imagem de um gel de agarose que mostra o intervalo de tamanhos de produtos de transposição de fragmentos de DNA com marcação 5' (via 2), o intervalo de tamanhos de produtos da reação de PCR (via 3) e uma reação de controlo (via 5) para a preparação de uma biblioteca de sequenciação compatível com Roche/454 FLX Titanium de DNA de amplificação, semelhante ao método ilustrado na FIG. 10. A FIG. 13 proporciona um diagrama esquemático que mostra fragmentação e marcação de DNA-alvo para produzir uma biblioteca compatível com Illumina/Solexa por inserção de extremidades de transposão marcadas numa reação de transposição, seguido de PCR especifico para marcadores +/códigos de barras. A FIG 14 mostra uma imagem de gel de agarose que mostra DNA de entrada (via 2), o intervalo de tamanhos de produtos de transposição de fragmentos de DNA com marcação 5' (via 3), o intervalo de tamanhos de produtos da reação de PCR (via 4) e uma reação de controlo (via 5) para a preparação da biblioteca de sequenciação compatível com Illumina GAII com código de barras como ilustrado na figura 13. A FIG. 15 compara o processo e complexidade de métodos da técnica anterior de preparação de bibliotecas com a preparação de bibliotecas de fragmentos de DNA de acordo com formas de realização da presente invenção. A FIG. 16. mostra um exemplo de um produto do método da invenção, após incubação de uma transposase (por exemplo, Transposase EZ-Tn5™ no presente documento) e uma composição de extremidade de transposão em grampo (por exemplo, a composição de extremidade de transposão em grampo EZ-Tn5™ "pMETS-N-MENTS" ilustrada no presente documento) numa reação de transposase in vitro na presença de DNA-alvo de filamentação dupla (por exemplo, DNA genómico ou cDNA de filamentação dupla). A FIG. 17. Fragmentação e Marcação de DNA-Alvo com uma Composição de Extremidade de Transposão em Grampo. A FIG 17A mostra um diagrama esquemático de um produto (entre uma população de muitos de tais produtos) resultante de dois eventos de inserção catalisada por transposase da composição de extremidade de transposão em grampo em DNA-alvo. Em resumo, DNA-alvo (por exemplo, compreendendo DNA genómico ou cDNA de filamentação dupla) é incubado numa reação de transposase in vitro contendo uma transposase e uma composição de extremidade de transposão em grampo (por exemplo, Transposase EZ-Tn5™ e uma composição de extremidade de transposão em grampo EZ-Tn5™). A sequência da extremidade transferida de cada composição de extremidade de transposão em grampo inserida é unida, via uma estrutura em alça, à sequência do filamento não transferido da extremidade de transposão. A alça pode ter qualquer domínio marcador arbitrário, tal como um domínio de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de deteção, um domínio de marcador de endereço, um domínio de promotor de transcrição ou um domínio de marcador de amplificação. Por exemplo, o domínio de marcador de sequenciação pode exibir a sequência de um marcador de sequenciação Roche 454A ou 454B. Por exemplo, nesta figura, o domínio de marcador de sequenciação exibe uma ou mais sequências na alça entre as sequências de extremidade de transposão complementares (a haste) . FIG 17B mostra um gel de eletroforese de agarose com coloração por SYBR Gold 1 % dos produtos de marcação 5' e fragmentação de 1 yg de dsDNA genómico de T7 Dili utilizando 0, 0,5, 1, 2, ou 3 μΜ da composição de extremidade de transposão em grampo pMETS-N-MENTS e quantidades equimolares de transposase EZ-Tn5™ (EPICENTRE Biotechnologies, Madison, WI), após incubação em Tris-acetato 33 mM pH 7,6, KOAc 66 mM, e Mg(OAc)2 10 mM durante 2 horas a 37 °C. FIG. 18. Geração de Modelos de DNA Circular com Marcação 5'. A FIG 18A é um diagrama esquemático de uma forma de realização do método. Em resumo, hiatos de 9 nucleótidos gerados por duas inserções da composição de extremidade de transposão em grampo num DNA-alvo são preenchidos por extensão das extremidades 3' dos fragmentos de DNA com marcação 5' gerados utilizando uma DNA polimerase que está desprovida de atividades de exonuclease 5' para 3' e deslocamento de filamento (por exemplo, DNA polimerase de T4) e do DNA de filamentação simples nas regiões de hiatos como modelos, e depois os produtos de extensão de DNA polimerase dos fragmentos de DNA com marcação 5' são ligados utilizando uma ligase dependente do modelo (por exemplo, DNA ligase de E. coli) para gerar fragmentos de DNA circulares marcados. Os fragmentos de DNA circulares marcados são resistentes a exonuclease T5, que é utilizada na forma de realização na figura para remover DNA de filamentação simples e de filamentação dupla linear não ligado. A FIG 18B mostra um gel de eletroforese de agarose com coloração por SYBR Gold 1 % dos produtos reacionais gerados na presença ou ausência de DNA polimerase de T4 e/ou DNA ligase de E. coli. Como mostrado, fragmentos de DNA circulares marcados, que são resistentes a tratamento por exonuclease T5, foram gerados apenas na presença da DNA polimerase de T4 e da DNA ligase de E. coli. A FIG. 19 ilustra a utilização de uma transferase terminal para unir um segundo marcador (3') a fragmentos de DNA com marcação 5', para gerar uma biblioteca de fragmentos de DNA compreendendo fragmentos de ssDNA com marcação 5' e 3' ("duplamente marcados"). Na forma de realização ilustrada, é adicionado um domínio de marcador de sequenciação compreendendo um marcador de sequenciação (SEQ) utilizando uma DNA polimerase dependente do modelo. A FIG. 20 ilustra a utilização de um oligonucleótido de marcação terminal como modelo para adicionar um segundo marcador (3') a fragmentos de ssDNA com marcação 5' para gerar uma biblioteca de fragmentos de DNA compreendendo fragmentos de ssDNA duplamente marcados. A FIG. 21 ilustra uma forma de realização em que fragmentos de DNA com marcação 5' são incubados na presença de uma DNA ligase e de um oligonucleótido de marcação de ligação que compreende uma porção 5' que tem um grupo fosfato na sua extremidade 5 ' e que exibe uma sequência aleatória que emparelha com o hiato ou região de 9 bases de DNA de filamentação simples resultante da inserção, catalisada por EZ-transposase Tn5, da extremidade de transposão EZ-Tn5 ME no DNA-alvo, e uma porção 3' que exibe uma segunda sequência marcadora (marcador #2). Neste exemplo, o oligonucleótido de marcação de ligação tem uma porção 5' que exibe uma sequência aleatória de 6 nucleótidos. A sequência aleatória emparelha com o DNA-alvo emparelhado de filamentação simples nas regiões de hiatos de 9 bases resultantes da inserção das extremidades de transposão (por exemplo, aqui, a extremidade de mosaico EZ-Tn5 ou extremidade de transposão ME de 19 pares de bases) no DNA-alvo de filamentação dupla. Aqueles oligonucleótidos de marcação de ligação que emparelham com o DNA-alvo de filamentação simples nas regiões de hiatos de modo que uma extremidade fosforilada em 5' confina com a extremidade 3' de um fragmento de DNA com marcação 5' são depois unidos pela ácido nucleico ligase numa reação de ligação dependente do modelo, desse modo gerando fragmentos de DNA com marcação 5' e 3' com o primeiro marcador na extremidade 5' e o segundo marcador na extremidade 3' . Assim, se ocorrerem inserções de extremidade de transposão em ambos os filamentos do DNA-alvo próximos (por exemplo, em sítios do DNA-alvo que estão a cerca de 50 Kb, cerca de 40 Kb, cerca de 30 Kb, cerca de 20 Kb, cerca de 10 Kb, cerca de 5 Kb, cerca de 1 Kb, cerca de 500 bp ou, preferencialmente, a cerca de 150 bp até cerca de 500 bp entre si), os filamentos com marcação dual podem ser purificados, amplificados por PCR, opcionalmente etiquetados com um corante detetável (por exemplo, para utilização como alvo para emparelhamento com uma microssérie, por exemplo, para análise de expressão) ou primeiramente capturados numa superfície (por exemplo, numa esférula; por exemplo, uma esférula para sequenciação de geração seguinte) e depois amplificados (por exemplo, utilizando PCR de emulsão, por exemplo, para utilização como modelos de sequenciação de geração seguinte; ou utilizando PCR de ciclos limitados, por exemplo, para utilização em experiências de variação do número de cópias (CNV), por exemplo, por hibridização genómica comparativa numa microssérie). A FIG. 22 (A) mostra um diagrama esquemático de uma forma de realização de fragmentação de DNA, marcação e circularização de DNA genómico utilizando o método da invenção. A caixa apontada com linha preta representa a composição de extremidade de transposão p454.lMEDS. As linhas tracejadas representam fragmentos de dsDNA genómico de T7 Dili. A FIG. 22 (B) mostra um gel de agarose dos produtos de marcação 5' e fragmentação de dsDNA genómico de T7 Dili utilizando a composição de extremidade de transposão p454.1MEDS e transposase EZ-Tn5™ (EPICENTRE Biotechnologies) . Um yg de dsDNA genómico de T7 Dili foi incubado com ou sem 0,5 yM da composição de extremidade de transposão p454.lMEDS em Tris-acetato 33 mM pH 7,6, KOAc 66 mM e Mg(OAc)2 10 mM durante 1 hora a 37 °C, na presença ou na ausência de transposase EZ-Tn5 como indicado. Os produtos reacionais de ssDNA linear com marcação 5' foram resolvidos por eletroforese num gel de agarose 1 % e coloração com SYBR Gold. A FIG. 23 (A) mostra um diagrama esquemático de amplificação por PCR dos fragmentos de ssDNA circulares marcados utilizando os oligonucleótidos pMETS e p454.1 como "primers" de PCR. A FIG. 23 (B) mostra um gel de agarose dos produtos de amplificação por PCR obtidos quando fragmentos de ssDNA circulares marcados obtidos utilizando o método da invenção foram amplificados por PCR utilizando os oligonucleótidos pMETS e pc454.1 como "primers" de PCR. Em primeiro lugar, o dsDNA fragmentado com marcação 5', obtido como mostrado na FIG. 22 (B), foi desnaturado por aquecimento 95 °C durante 3 minutos e arrefecimento rápido em gelo. Uma porção dos fragmentos de ssDNA lineares com marcação 5' desnaturados resultantes foi incubada em Tris-acetato 33 mM pH 7,6, KOAc 66 mM, MnCl2 2,5 mM e betaína 1 M durante 2 horas a 60 °C na presença ou ausência de 400 unidades de ssDNA ligase CIRCLIGASE™ como descrito no Exemplo 17 com a finalidade de circularizar os fragmentos de ssDNA lineares com marcação 5'. Os produtos reacionais foram incubados com exonuclease I e exonuclease III durante 1 hora a 37 °C para digerir fragmentos de ssDNA lineares antes de amplificação por PCR. Os fragmentos de ssDNA circulares marcados foram depois amplificados por PCR utilizando os oligonucleótidos pMETS e pc454.1 como "primers" de PCR. Os produtos de PCR foram resolvidos por eletroforese em agarose 1 % e visualizados por coloração com SYBR Gold.
DEFINIÇÕES A menos que especificamente definido ou descrito de modo diferente noutro local do presente documento, os seguintes termos e definições relacionados com a invenção devem ser entendidos como apresentado abaixo.
Quando os termos "por exemplo", "p.ex.", "tal como", "incluem", "incluindo" ou suas variações são usados no presente documento, estes termos não serão considerados termos de limitação e serão interpretados como significando "mas não limitado a" ou "sem limitação".
Deve ser considerado que o uso de termos "um" e "uma" e "o" e "a" e referentes semelhantes, no contexto da descrição da invenção (especialmente no contexto das reivindicações seguintes), abrange o singular e o plural, a menos que indicado em contrário no presente documento ou claramente contradito pelo contexto.
Como usados no presente documento, os termos "isolado", "isolar", "isolamento", "purificado", "purificar", "purificação" e respetivos equivalentes gramaticais, como usados no presente documento, a menos que especificado em contrário, referem-se à redução da quantidade de pelo menos um contaminante (tal como uma sequência de proteina e/ou ácido nucleico) de uma amostra ou de uma fonte (por exemplo, uma célula) de onde o material é isolado. Assim, purificação origina um "enriquecimento", isto é, um aumento da quantidade de uma sequência de proteina e/ou de ácido nucleico desejável na amostra.
Como usado no presente documento, um "marcador" refere-se a um componente de ácido nucleico não alvo, geralmente DNA, que proporciona um meio de endereçar um fragmento de ácido nucleico ao qual é unido. Por exemplo, em formas de realização preferenciais, um marcador compreende uma sequência de nucleótidos que permite a identificação, reconhecimento e/ou manipulação molecular ou bioquímica do DNA ao qual está ligado o marcador (por exemplo, proporcionando um sítio para emparelhamento de um oligonucleótido, tal como um "primer", para extensão por uma DNA polimerase, ou um oligonucleótido para captura ou para uma reação de ligação) . 0 processo de unir o marcador à molécula de DNA é por vezes referido no presente documento como "marcação" e DNA que sofre marcação ou que contém um marcador é referido como "marcado" (por exemplo, "DNA marcado").
Como usado no presente documento, o termo "ligase" refere-se a uma enzima modificadora de ácido nucleico que catalisa a formação intra- e intermolecular de ligações fosfodiéster entre terminais 5'-fosfato e 3'-hidroxilo de filamentos de ácidos nucleicos. Ligases incluem, por exemplo, ligases independentes do modelo, tais como ssDNA ligase CIRCLIGASE™, que conseguem unir extremidades de RNA e DNA de filamentação simples, e ligases dependentes do modelo ou homólogas, que procedem à selagem de cortes em DNA de filamentação dupla (exemplo descrito abaixo).
Como usado no presente documento, uma "ligase homóloga" ou "ligase dependente do modelo" significa uma DNA ligase que catalisa a formação intra- e intermolecular de ligações fosfodiéster entre terminais 5'-fosfato e 3'-hidroxilo de filamentos de DNA que são adjacentes uns aos outros quando emparelhados com um polinucleótido complementar. Algumas formas de realização de ligação intramolecular produzem uma molécula circular e são denominadas "circularização". 0 polinucleótido com o qual ambas as extremidades das extremidades de DNA a serem ligadas emparelham de modo adjacente é referido no presente documento como "modelo de ligação" e a ligação é referida como "ligação homóloga" ou "ligação dependente do modelo". 0 modelo de ligação pode ser uma sequência de DNA complementar em DNA genómico ou outro numa amostra biológica (em cujo caso é muitas vezes referido como "sequência-alvo"), ou o modelo de ligação pode ser um "oligodesoxirribonucleótido em ponte" ou "oligodesoxirribonucleótido de tala de ligação" (ou "tala de ligação") que é sintetizado e/ou proporcionado especificamente para utilização num ensaio ou método particular. Exemplos de DNA ligases homólogas ou dependentes do modelo incluem DNA ligases do tipo NAD, tais como DNA ligase de E. coli, DNA ligase Tth, DNA ligase Tfl e DNA ligase AMPLIGASE® (EPICENTRE Biotechnologies, Madison, WI, EUA) , que catalisam a ligação intramolecular de moléculas de ssDNA apenas na presença de um modelo de ligação, e DNA ligases do tipo ATP, tais como DNA ligase de T4 ou DNA ligase FASTLINK™ (EPICENTRE Biotechnologies), que, apesar de não requererem um modelo de ligação para ligação de extremidades planas, catalisam a ligação dependente do modelo de modo muito mais eficiente.
Nalgumas formas de realização preferenciais, a ligase dependente do modelo provém de uma bactéria psicofrílica ou de um bacteriófago psicofrílico, de modo que a ligação pode ser realizada a temperaturas mais baixas (por exemplo, quando as sequências dos oligonucleótidos ou polinucleótidos que formam a junção de ligação exibem menores Tfs) . Para utilização no método é escolhida uma DNA ligase que é ativa a uma temperatura à qual as moléculas de DNA utilizadas para união (por exemplo, os produtos de extensão de fragmentos de DNA com marcação 5' ou os fragmentos de DNA com marcação 5' e os oligonucleótidos de sequências aleatórias) emparelham durante um período de tempo suficiente para serem ligadas pela ligase.
Um passo importante em formas de realização do método da presente invenção é a utilização de uma reação de transposição in vitro para fragmentar e marcar o DNA-alvo com a finalidade de gerar fragmentos de DNA marcados. A reação de transposição in vitro requer uma transposase, uma composição de extremidade de transposão e condições reacionais adequadas.
Uma "transposase" significa uma enzima que é capaz de formar um complexo funcional com uma composição contendo extremidades de transposão (por exemplo, transposões, extremidades de transposão, composições de extremidade de transposão) e catalisar a inserção ou transposição da composição contendo extremidade de transposão no DNA-alvo de filamentação dupla com o qual é incubada numa reação de transposição in vitro. 0 termo "extremidade de transposão" significa um DNA de filamentação dupla que exibe apenas as sequências de nucleótidos (as "sequências de extremidade de transposão") que são necessárias para formar o complexo com a enzima transposase ou integrase que é funcional numa reação de transposição in vitro. Uma extremidade de transposão forma um "complexo" ou um "complexo sináptico" ou um "complexo de transpossoma" ou uma "composição de transpossoma" com uma transposase ou integrase que reconhece e se liga à extremidade de transposão, e cujo complexo é capaz de inserir ou transpor a extremidade de transposão em DNA-alvo com o qual é incubado numa reação de transposição in vitro. Uma extremidade de transposão exibe duas sequências complementares que consistem numa "sequência de extremidade de transposão transferida" ou "filamento transferido" e uma "sequência de extremidade de transposão não transferida" ou "filamento não transferido". Por exemplo, uma extremidade de transposão que forma um complexo com uma transposase Tn5 hiperativa (por exemplo, Transposase EZ-Tn5™, EPICENTRE Biotechnologies, Madison, WI, EUA) que é ativa numa reação de transposição in vitro compreende um filamento transferido que exibe uma "sequência de extremidade de transposão transferida" como se segue: S' ÃGATGTGTATÃAGASÃCAG 3* |SEQ 1D NOr1>, e um filamento não transferido que exibe uma "sequência de extremidade de transposão não transferida" como se segue: 5’ CTGTCT CTTATACAfiATCT 3’ (SEQ !D NO:2}. A extremidade 3' de um filamento transferido é unida ou transferida para DNA-alvo numa reação de transposição in vitro. 0 filamento não transferido, que exibe uma sequência de extremidade de transposão que é complementar à sequência de extremidade de transposão transferida, não é unido ou transferido para o DNA-alvo numa reação de transposição in vitro.
Nalgumas formas de realização, o filamento transferido e filamento não transferido são unidos de modo covalente. Por exemplo, nalgumas formas de realização, as sequências dos filamentos transferido e não transferido são proporcionadas num único oligonucleótido, por exemplo, numa configuração em grampo. Como tal, apesar de a extremidade livre do filamento não transferido não ser unida ao DNA-alvo diretamente pela reação de transposição, o filamento não transferido fica ligado ao fragmento de DNA indiretamente, pois o filamento não transferido é ligado ao filamento transferido pela alça da estrutura em grampo.
Uma "composição de extremidade de transposão" significa uma composição que compreende uma extremidade de transposão (isto é, o segmento de DNA de filamentação dupla mínimo que é capaz de atuar com uma transposase para sofrer uma reação de transposição), opcionalmente mais uma sequência ou sequências adicionais. A 5' da sequência de extremidade de transposão transferida e/ou a 3' da sequência de extremidade de transposão não transferida. Por exemplo, uma extremidade de transposão ligada a um marcador é uma "composição de extremidade de transposão". Nalgumas formas de realização, a composição de extremidade de transposão compreende ou consiste em dois oligonucleótidos de extremidade de transposão que consistem no "oligonucleótido de extremidade de transposão transferida" ou "filamento transferido" e no "oligonucleótido de extremidade de filamento não transferido" ou "filamento não transferido" que, em combinação, exibem as sequências da extremidade de transposão, e em que um ou ambos os filamentos compreendem uma sequência adicional.
Os termos "oligonucleótido de extremidade de transposão transferida" e "filamento transferido" são usados indistintamente e referem-se à porção transferida de "extremidades de transposão" e "composições de extremidade de transposão", isto é, independentemente de a extremidade de transposão ser ligada a um marcador ou outra fração. De modo semelhante, os termos "oligonucleótido de extremidade de transposão não transferida" e "filamento não transferido" são usados indistintamente e referem-se à porção não transferida de "extremidades de transposão" e "composições de extremidade de transposão". Nalgumas formas de realização, uma composição de extremidade de transposão é uma "composição de extremidade de transposão em grampo". Como usado no presente documento, uma "composição de extremidade de transposão em grampo" significa uma composição de extremidade de transposão que consiste num único oligodesoxirribonucleótido que exibe uma sequência de extremidade de transposão não transferida na sua extremidade 5', uma sequência de extremidade de transposão transferida na sua extremidade 3' e uma sequência arbitrária interveniente entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida que é suficientemente longa para permitir a formação de haste-alça intramolecular, de modo que a porção de extremidade de transposão pode atuar numa reação de transposição. Nalgumas formas de realização, a extremidade 5' da composição de extremidade de transposão em grampo tem um grupo fosfato na posição 5' do nucleótido 5'. Nalgumas formas de realização, a sequência arbitrária interveniente entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida de uma composição de extremidade de transposão em grampo proporciona um marcador (por exemplo, incluindo um ou mais domínios marcadores) para uma utilização ou aplicação particular.
Nalgumas formas de realização, os métodos da presente invenção produzem fragmentos de ssDNA circulares marcados. Nalgumas formas de realização, fragmentos de ssDNA circulares marcados exibem apenas a sequência do filamento transferido da composição de extremidade de transposão e os fragmentos de ssDNA circulares marcados não exibem a sequência do filamento não transferido da composição de extremidade de transposão.
Nalgumas formas de realização, a composição de extremidade de transposão utilizada no método da presente invenção compreende oligonucleótidos de extremidade de transposão que exibem apenas as sequências de extremidade de transposão que formam um complexo com a transposase ou integrase e que são necessárias para a reação de transposição; nestas formas de realização, o marcador nos fragmentos de ssDNA circulares marcados gerados utilizando o método exibe apenas a sequência de extremidade de transposão transferida.
No entanto, nalgumas formas de realização, a composição de extremidade de transposão compreende ou consiste em pelo menos um oligonucleótido de extremidade de transposão que exibe uma ou mais sequências de nucleótidos diferentes para além das sequências de extremidade de transposão. Assim, nalgumas formas de realização, a composição de extremidade de transposão compreende um filamento transferido que exibe uma ou mais sequências de nucleótidos diferentes a 5' da sequência de extremidade de transposão transferida, cuja uma ou mais sequências de nucleótidos diferentes também são exibidas pelo marcador. Assim, para além da sequência de extremidade de transposão transferida, o marcador pode ter uma ou mais porções marcadoras ou domínios marcadores diferentes.
Como usado no presente documento, uma "porção marcadora" ou um "domínio marcador" significa uma porção ou domínio de um marcador que exibe uma sequência para uma finalidade ou aplicação pretendida desejada. Uma porção marcadora ou domínio marcador é o "domínio de extremidade de transposão", cuja porção marcadora ou domínio marcador exibe a sequência de extremidade de transposão transferida. Nalgumas formas de realização em que o filamento transferido também exibe uma ou mais sequências de nucleótidos diferentes a 5' da sequência de extremidade de transposão transferida, o marcador também tem um ou mais "domínios marcadores" diferentes na referida porção 5', sendo cada um desses domínios marcadores proporcionado para qualquer finalidade desejada. Por exemplo, algumas formas de realização da invenção compreendem ou consistem numa composição de extremidade de transposão que compreende ou consiste em: (i) um filamento transferido que exibe uma ou mais sequências a 5' da sequência de extremidade de transposão transferida que compreende ou consiste num domínio marcador selecionado de entre um ou mais de um domínio de marcador de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de deteção, um domínio de marcador de endereço e um domínio de promotor de transcrição, e (ii) um filamento não transferido que exibe a sequência de extremidade de transposão não transferida. A invenção compreende formas de realização do método que empregam qualquer uma ou mais das referidas composições de extremidade de transposão.
Como usado no presente documento, um "domínio de clivagem" refere-se a uma sequência de ácido nucleico que é suscetível.
Como usado no presente documento, um "domínio de sítio de restrição" significa um domínio marcador que exibe uma sequência para a finalidade de facilitar a clivagem utilizando uma endonuclease de restrição. Por exemplo, nalgumas formas de realização, o domínio de sítio de restrição é utilizado para gerar fragmentos de ssDNA lineares duplamente marcados. Nalgumas formas de realização, o domínio de sítio de restrição é utilizado para gerar uma extremidade 5' de filamentação dupla compatível no domínio marcador de modo que esta extremidade possa ser ligada a outra molécula de DNA utilizando uma DNA ligase dependente do modelo. Nalgumas formas de realização preferenciais, o domínio de sítio de restrição no marcador exibe a sequência de um sítio de restrição que está presente apenas raramente, se é que está presente, no DNA-alvo (por exemplo, um sítio de restrição para uma endonuclease de restrição de cortes raros, como Notl ou Asei). Nalgumas formas de realização preferenciais, o sítio de restrição no domínio de sítio de restrição é para uma endonuclease de restrição do tipo II, como endonuclease de restrição Fokl.
Nalgumas formas de realização em que o filamento transferido da composição de extremidade de transposão compreende um ou mais domínios de sítio de restrição a 5' da sequência de extremidade de transposão transferida, o método compreende adicionalmente: emparelhar um oligodesoxirribonucleótido que é complementar ao sítio de restrição de filamentação simples dos fragmentos de ssDNA circulares marcados e depois clivar os fragmentos de ssDNA circulares marcados no sítio de restrição utilizando a endonuclease de restrição que reconhece o sítio de restrição. Assim, nalgumas formas de realização, o método compreende linearizar os fragmentos de ssDNA circulares marcados para gerar fragmentos de ssDNA lineares duplamente marcados.
Nalgumas formas de realização diferentes em que o filamento transferido da composição de extremidade de transposão compreende um ou mais domínios de sítio de restrição a 5' da sequência de extremidade de transposão transferida, o filamento transferido da composição de extremidade de transposão compreende um grampo de filamentação dupla compreendendo o sítio de restrição e o método compreende adicionalmente os passos de clivar os fragmentos de ssDNA lineares marcados no sítio de restrição utilizando a endonuclease de restrição que reconhece o sítio de restrição; no entanto, nalgumas formas de realização, este método não é preferencial porque o grampo de filamentação dupla proporciona um sítio de dsDNA para o qual a composição de extremidade de transposão pode ser transposta pela transposase ou integrase.
Nalgumas formas de realização preferenciais que compreendem (i) gerar um sítio de restrição de filamentação dupla, por emparelhamento de um oligodesoxirribonucleótido que é complementar ao sítio de restrição de filamentação simples ou por utilização de um filamento transferido que compreende um grampo de filamentação dupla, e (ii) depois clivar o sítio de restrição utilizando a endonuclease de restrição que reconhece o sítio de restrição de filamentação dupla, em que o método compreende adicionalmente o passo de ligar os fragmentos de ssDNA lineares marcados clivados com a endonuclease de restrição a outra molécula de DNA que tem uma extremidade 3' compatível.
Como usado no presente documento, um "domínio de marcador de captura" ou um "marcador de captura" significa um domínio marcador que exibe uma sequência para a finalidade de facilitar a captura do fragmento de ssDNA ao qual é unido o domínio marcador (por exemplo, para proporcionar um sítio de emparelhamento ou um marcador de afinidade para uma captura dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados numa esférula ou outra superfície, por exemplo, em que o sítio de emparelhamento da sequência do domínio marcador permite a captura por emparelhamento com uma sequência específica que está numa superfície, como uma sonda numa esférula ou num "microchip" ou microssérie ou numa esférula de sequenciação). Nalgumas formas de realização do método, depois de os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados serem capturados por emparelhamento com uma sonda complementar numa superfície, o domínio de marcador de captura proporciona um sítio para iniciação de síntese de DNA utilizando os referidos fragmentos de ssDNA circulares marcados ou os referidos fragmentos de ssDNA lineares duplamente marcados (ou os complementos dos referidos fragmentos de ssDNA circulares marcados ou fragmentos de ssDNA lineares duplamente marcados) como modelos. Nalgumas formas de realização diferentes, o domínio de marcador de captura compreende uma porção 5' do filamento transferido que é unida a um grupo ou fração química que compreende ou consiste numa molécula de ligação de afinidade (por exemplo, em que a porção 5' do filamento transferido é unida a uma primeira molécula de ligação de afinidade, tal como biotina, estreptavidina, um antigénio ou um anticorpo que se liga ao antigénio, que permite a captura dos fragmentos de ssDNA marcados circulares ou dos fragmentos de ssDNA lineares duplamente marcados numa superfície à qual se liga uma segunda molécula de ligação de afinidade que forma um par de ligação específica com a primeira molécula de ligação de afinidade).
Como usado no presente documento, um "domínio de marcador de sequenciação" ou um "marcador de sequenciação" significa um domínio marcador que exibe uma sequência para a finalidade de facilitar a sequenciação do fragmento de ssDNA ao qual é unido o marcador utilizando o método para sintetizar fragmentos de ssDNA circulares marcados (por exemplo, para proporcionar um sítio de iniciação para sequenciação por síntese, ou para proporcionar sítios de emparelhamento para sequenciação por ligação, ou para proporcionar sítios de emparelhamento para sequenciação por hibridização). Por exemplo, nalgumas formas de realização, o domínio de marcador de sequenciação proporciona um sítio para iniciação de síntese de DNA do referido fragmento de ssDNA ou do complemento do referido fragmento de ssDNA.
Como usado no presente documento, um "domínio de marcador de amplificação" significa um domínio marcador que exibe uma sequência para a finalidade de facilitar a amplificação de um ácido nucleico ao qual é fixado o referido marcador. Por exemplo, nalgumas formas de realização, o domínio de marcador de amplificação proporciona um sítio de iniciação para uma reação de amplificação de ácido nucleico utilizando uma DNA polimerase (por exemplo, uma reação de amplificação por PCR ou uma reação de amplificação por deslocamento de filamento, ou uma reação de amplificação por círculo rolante), ou um modelo de ligação para ligação de sondas utilizando uma ligase dependente do modelo numa reação de amplificação de ácido nucleico (por exemplo, uma reação em cadeia de ligação).
Como usado no presente documento, um "domínio de marcador de deteção" ou um "marcador de deteção" significa um domínio marcador que exibe uma sequência ou uma fração química ou bioquímica detetável para a finalidade de facilitar a deteção dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados (por exemplo, em que a sequência ou fração química compreende ou é unida a uma molécula detetável; tal como uma molécula detetável selecionada de entre: um corante visível, fluorescente, quimioluminescente ou outro detetável; uma enzima que é detetável na presença de um substrato, por exemplo, uma fosfatase alcalina com NBT mais BCIP ou uma peroxidase com um substrato adequado); uma proteína detetável, por exemplo, uma proteína fluorescente verde, e uma molécula de ligação de afinidade que é ligada a uma fração detetável ou que pode formar um par de ligação de afinidade ou um par de ligação específica com outra molécula de ligação de afinidade detetável; ou qualquer uma das muitas moléculas ou sistemas detetáveis diferentes conhecidos na área).
Como usado no presente documento, um "domínio de marcador de endereço" ou um "marcador de endereço" significa um domínio marcador que exibe uma sequência que permite a identificação de uma amostra específica (por exemplo, em que o filamento transferido tem um domínio de marcador de endereço diferente que exibe uma sequência diferente para cada amostra).
Como usado no presente documento, um "domínio de promotor de transcrição" ou um "domínio promotor" significa um domínio marcador que exibe uma sequência para uma sequência de promotor sentido ou para uma sequência de promotor antissentido de um promotor de RNA polimerase. Como usado no presente documento, uma "sequência de promotor sentido" significa a sequência de um promotor de RNA polimerase que é unida ao filamento de DNA que serve de modelo para transcrição por uma RNA polimerase que se liga ao promotor de RN A polimerase e a partir daí inicia a transcrição em condições reacionais adequadas para a transcrição. Como usado no presente documento, uma "sequência de promotor antissentido" significa a sequência de um promotor de RNA polimerase que é complementar à sequência do promotor sentido. Nalgumas formas de realização, a sequência de promotor sentido exibida pelo domínio de promotor de transcrição é para uma RNA polimerase que se liga a um promotor de RNA polimerase de filamentação simples e a partir daí inicia a transcrição, em cujas formas de realização a sequência de promotor sentido é suficiente para atuar como promotor de RNA polimerase (por exemplo, para RNA polimerase do bacteriófago N4). Nalgumas formas de realização, a sequência de promotor sentido é para uma RNA polimerase que se liga a um promotor de RNA polimerase de filamentação dupla e a partir daí inicia a transcrição, em cujas formas de realização o método compreende dotar o promotor de RNA polimerase de filamentação dupla (por exemplo, por emparelhamento com a sequência de promotor sentido de um oligodesoxirribonucleótido que exibe uma sequência de promotor antissentido que é complementar à sequência de promotor sentido, ou utilizando os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados como modelos para a síntese de dsDNA compreendendo ou consistindo na sequência de promotor sentido) antes da transcrição utilizando uma RNA polimerase que se liga e inicia transcrição a partir do promotor de RNA polimerase de filamentação dupla. Nalgumas formas de realização, a sequência de promotor sentido é para uma RNA polimerase do tipo T7 (por exemplo, selecionada de entre RNA polimerase de T7, RNA polimerase de T3 e RNA polimerase de SP6) . Um domínio de promotor de transcrição que exibe uma sequência de promotor sentido permite a síntese de RNA que é complementar ao DNA-alvo de filamentação simples ao qual é ligado o filamento transferido da composição de extremidade de transposão utilizando o método. Fragmentos de ssDNA circulares marcados gerados utilizando uma composição de extremidade de transposão compreendendo um filamento transferido que tem um domínio de promotor de transcrição que exibe uma sequência de promotor antissentido não podem ser transcritos por uma RNA polimerase. No entanto, nalgumas formas de realização, dsDNA sintetizado por extensão de um "primer" que emparelha com os fragmentos de ssDNA circulares marcados é utilizado para transcrição por uma RNA polimerase que se liga e inicia a transcrição a partir de um promotor de RNA polimerase de filamentação dupla; nestas formas de realização, o RNA sintetizado exibe a mesma sequência dos fragmentos de ssDNA circulares marcados.
Os nomes e descrições de diferente domínios marcadores são apresentados por motivos de conveniência, de modo a facilitar a compreensão e discussão das finalidades pretendidas e aplicações das diferentes porções ou domínios do marcador em diferentes formas de realização. No entanto, não é pretendido que estes nomes e descrições limitem a utilização ou aplicações do marcador ou de qualquer um dos seus domínios marcadores de modo nenhum. Assim, qualquer marcador ou domínio marcador particular pode ser utilizado para qualquer finalidade para além ou em vez da finalidade ou aplicação pretendida ou principal. Além disso, um domínio marcador pode compreender dois ou mais domínios marcadores diferentes (por exemplo, um domínio de marcador de sequenciação pode compreender o domínio de extremidade de transposão e outro domínio marcador a 5' do domínio de extremidade de transposão) ou um domínio marcador pode proporcionar as funções ou finalidades ou aplicações de dois ou mais domínios marcadores diferentes (por exemplo, o domínio de extremidade de transposão pode proporcionar a finalidade da extremidade de transposão transferida e também proporcionar a função ou finalidade de um domínio de marcador de sequenciação e/ou um domínio de marcador de captura para uma aplicação particular). Ainda adicionalmente, não é necessário que o marcador seja descrito em termos de um ou mais domínios diferentes para que seja utilizado para qualquer finalidade ou aplicação ou função particular.
Como usados no presente documento, os termos "amplificar" ou "amplificado" "amplificando", usados relativamente a um ácido nucleico ou reações de ácidos nucleicos, referem-se a métodos in vitro de preparação de cópias de um ácido nucleico particular, tal como um ácido nucleico-alvo, ou um ácido nucleico marcado produzido, por exemplo, por uma forma de realização da presente invenção. Numerosos métodos de amplificação de ácidos nucleicos são conhecidos na área, e reações de amplificação incluem reações em cadeia de polimerase, reações em cadeia de ligase, reações de amplificação por deslocamento de filamento, reações de amplificação por círculo rolante, métodos de amplificação mediada por transcrição, tais como NASBA (por exemplo, Patente U.S. No. 5,409,818), métodos amplificação mediada por alça (por exemplo, amplificação "LAMP" utilizando sequências formadoras de alça, por exemplo, como descrito na Patente U.S. No. 6,410,278). O ácido nucleico que é amplificado pode ser DNA compreendendo, consistindo ou derivado de DNA ou RNA ou uma mistura de DNA e RNA, incluindo DNA e/ou RNA modificados. Os produtos resultantes da amplificação de uma molécula ou moléculas de ácido nucleico (isto é, "produtos de amplificação"), independentemente de o ácido nucleico de partida ser DNA, RNA ou ambos, podem ser DNA ou RNA, ou uma mistura de nucleósidos ou nucleótidos de DNA e RNA, ou podem compreender nucleósidos ou nucleótidos de DNA ou RNA modificados. Uma "cópia" não significa necessariamente complementaridade perfeita de sequências ou identidade com a sequência-alvo. Por exemplo, cópias podem incluir análogos nucleotidicos, tais como desoxi-inosina ou desoxiuridina, alterações intencionais em sequências (tais como alterações em sequências introduzidas através de um "primer" que compreende uma sequência que é hibridizável, mas não complementar, à sequência-alvo e/ou erros em sequências que ocorrem durante a amplificação.
"Substâncias de ligação de afinidade" ou "moléculas de ligação de afinidade" ou "moléculas de afinidade", no presente documento, significa moléculas que têm afinidade e se "ligam" entre si em certas condições, referidas como "condições de ligação", para formar um "par de ligação especifica". Por exemplo, biotina e estreptavidina, biotina e avidina ou digoxigenina e um anticorpo especifico que se liga a digoxigenina são exemplos de "pares de ligação especifica", em que os membros de cada par de ligação especifica compreendem "moléculas de ligação de afinidade" ou "substâncias de ligação de afinidade" ou "moléculas de afinidade". Moléculas de ligação de afinidade (por exemplo, biotina e/ou estreptavidina) podem ser covalentemente unidas ou conjugadas, ou ligadas de modo não covalente, a outras moléculas (por exemplo, a RNA ou DNA) ou a uma superfície sólida utilizando métodos conhecidos na área (por exemplo, utilizando reagentes e métodos como descrito em "Avidin-Biotin Chemistry: A Handbook", por D. Savage et al., Pierce Chemical Company, 1992, e em "Handbook of Fluorescent Probes and Research Products", Nona Edição, por R.P. Hoagland, Molecular Probes, Inc., e em "BIOCONJUGATE
Techniques", por Greg T. Hermanson, Publicado por Academic Press, Inc., San Diego, CA, 1996). Moléculas de afinidade que são conjugadas a DNA ou RNA também podem ser sintetizadas utilizando um sintetizador de oligonucleótidos utilizando reagentes e métodos conhecidos na área. 0 termo "ligação" de acordo com a presente invenção significa a interação entre uma molécula de afinidade e uma substância de ligação de afinidade em resultado de ligações não covalentes, tais como, mas sem limitação, ligações de hidrogénio, interações hidrofóbicas, ligações de van der Waals e ligações iónicas. Sem ficar restringido pela teoria, crê-se na área que estes tipos de ligações não covalentes resultam em ligação em parte devido a formatos ou estruturas complementares das moléculas envolvidas no par de ligação especifica. Com base na definição de "ligação", e na grande variedade de moléculas de ligação de afinidade ou pares de ligação especifica, é claro que as condições de ligação variam para diferentes pares de ligação especifica. Os peritos na área podem facilmente encontrar ou determinar condições pelas quais, numa amostra, ocorre ligação entre as moléculas de ligação de afinidade. Em particular, os peritos na área podem facilmente determinar condições pelas quais pode ser forçada a ocorrência de ligação entre moléculas de ligação de afinidade que seria considerada na área "ligação especifica". Como entendido na área, tal especificidade deve-se habitualmente à afinidade mais elevada entre as moléculas de ligação de afinidade do que para outras substâncias e componentes (por exemplo, paredes de recipientes, suportes sólidos) numa amostra. Em certos casos, a especificidade também pode envolver ou pode dever-se a uma associação significativamente mais rápida de moléculas de ligação de afinidade do que com outras substâncias e componentes presentes numa amostra. os termos "emparelhar" ou "hibridizar" e "emparelhamento" ou "hibridização" referem-se à formação de complexos entre sequências de nucleótidos que são suficientemente complementares para formar complexos via emparelhamento de bases de Watson-Crick. Relativamente à presente invenção, sequências de ácidos nucleicos que são "complementares a" ou "complementares com" ou que "hibridizam" ou "emparelham" entre si devem ser capazes de formar ou formam "híbridos" ou "complexos" que são suficientemente estáveis para servirem a finalidade pretendida. Não é necessário que cada base de ácido nucleico numa sequência exibida por uma molécula de ácido nucleico seja capaz de emparelhamento de bases ou seja emparelhada ou seja complexada com cada base de ácido nucleico numa sequência exibida por uma segunda molécula de ácido nucleico para que as duas moléculas de ácidos nucleicos ou as respetivas sequências aí exibidas sejam "complementares" ou "emparelhadas" ou "hibridizadas" entre si. Como usado no presente documento, os termos "complementar" ou "complementaridade" são usados relativamente a uma sequência de nucleótidos relacionada pelas regras de emparelhamento de bases. Por exemplo, a sequência 5'-A-G-T-3' é complementar à sequência 3'-T-C-A-5' . A complementaridade pode ser "parcial", em que apenas algumas das bases dos ácidos nucleicos são emparelhadas de acordo com as regras de emparelhamento de bases. Ou então pode haver complementaridade "completa" ou "total" entre os ácidos nucleicos. 0 grau de complementaridade entre filamentos de ácidos nucleicos tem efeitos significativos na eficiência e força da hibridização entre filamentos de ácidos nucleicos. Isto tem importância particular em reações de amplificação, bem como em métodos de deteção que dependem de hibridização de ácidos nucleicos. 0 termo "homologia" refere-se a um grau de complementaridade de uma sequência de ácido nucleico com outra sequência de ácido nucleico. Pode haver homologia parcial ou homologia completa (isto é, complementaridade). Uma sequência parcialmente complementar é tal que inibe, pelo menos parcialmente, a hibridização de uma sequência completamente complementar com um ácido nucleico-alvo e refere-se ao uso do termo funcional "substancialmente homóloga". A inibição da hibridização da sequência completamente complementar com a sequência-alvo pode ser examinada utilizando um ensaio de hibridização (coloração "Southern" ou "Northern", hibridização em solução e semelhantes) em condições de baixa estringência. Uma sequência ou sonda substancialmente homóloga irá competir e inibir a ligação (isto é, a hibridização) de uma sequência completamente homóloga com um alvo em condições de baixa estringência. Isto não significa que condições de baixa estringência sejam tais que é permitida ligação inespecífica; condições de baixa estringência requerem que a ligação de duas sequências entre si seja uma interação específica (isto é, seletiva). A ausência de ligação inespecífica pode ser testada utilizando um segundo alvo que está desprovido de complementaridade ou que tem apenas um baixo grau de complementaridade (por exemplo, menos de cerca de 30 % de complementaridade) . No caso em que a ligação específica é baixa ou inexistente, a sonda não irá hibridizar com um alvo de ácido nucleico. Quando usado relativamente a uma sequência de ácido nucleico de filamentação dupla, tal como um cDNA ou um clone genómico, o termo "substancialmente homólogo" refere-se a qualquer oligonucleótido ou sonda que consiga hibridizar com qualquer um ou ambos os filamentos da sequência de ácido nucleico de filamentação dupla em condições de baixa estringência, como descrito no presente documento. Como usado no presente documento, os termos "emparelhamento" ou "hibridização" são usados relativamente ao emparelhamento de filamentos de ácidos nucleicos complementares. A hibridização e a força da hibridização (isto é, a força da associação entre filamentos de ácidos nucleicos) são afetadas por muitos fatores bem conhecidos na área, incluindo o grau de complementaridade entre os ácidos nucleicos, a estringência das condições envolvidas que é afetada por condições tais como a concentração de sais, a Tf (temperatura de fusão) do híbrido formado, a presença de outros componentes (por exemplo, a presença ou ausência de polietilenoglicol ou betaína), a molaridade dos filamentos que hibridizam e o teor G:C dos filamentos de ácidos nucleicos.
Em geral, "cDNA" ou uma "molécula de cDNA" refere-se a "DNA complementar" que é sintetizado por extensão catalisada por DNA polimerase ou transcriptase reversa dependente de RNA de um "primer" que emparelha com uma molécula de RNA de interesse utilizando pelo menos uma porção da molécula de RNA de interesse como modelo (cujo processo é também denominado "transcrição reversa"). As moléculas de cDNA sintetizadas são "homólogas a" ou "formam pares de bases com" ou "formam um complexo com" pelo menos uma porção do modelo.
Como usado no presente documento, uma "população de fragmentos de DNA" refere-se a uma pluralidade ou coleção de fragmentos de DNA, por exemplo, de um DNA-alvo. Nalgumas formas de realização, uma população de fragmentos de DNA compreende uma biblioteca de fragmentos de DNA compreendendo sequências que são qualitativa e/ou quantitativamente representativas da sequência do DNA-alvo, ao passo que, nalgumas formas de realização, uma população de fragmentos de DNA contém um subconjunto de uma biblioteca de DNA, por exemplo, pode não ser representativa da sequência do DNA-alvo .
Como usado no presente documento, uma "biblioteca de fragmentos de DNA" significa uma coleção ou população de fragmentos de DNA marcados (por exemplo, fragmentos de DNA duplamente marcados ou fragmentos de ssDNA circulares marcados) gerada a partir de DNA-alvo, em que a combinação dos fragmentos de DNA marcados na coleção ou população exibe sequências que são qualitativa e/ou quantitativamente representativas da sequência do DNA-alvo de onde foram gerados os fragmentos de DNA marcados, e em que os fragmentos de DNA marcados que estão na coleção ou população não foram selecionados positivamente ou selecionados negativamente por utilização intencional de um método que inclui ou exclui fragmentos de DNA marcados com base na composição de nucleótidos ou sequências do DNA-alvo.
Por uma variedade de motivos, é possível que uma biblioteca de fragmentos de DNA possa não conter um fragmento de DNA marcado que represente cada sequência que é exibida pelo DNA-alvo. Por exemplo, nalgumas formas de realização, a biblioteca de fragmentos de DNA marcados pode não conter fragmentos de DNA marcados que exibem sequências das extremidades de um DNA-alvo compreendendo dsDNA linear (por exemplo, devido a uma baixa frequência de inserção de duas composições de extremidade de transposão nas porções de extremidade do DNA-alvo). Geralmente, uma frequência menor ou ausência de fragmentos de DNA marcados que exibem sequências de certas porções ou regiões do DNA-alvo é aceitável para a finalidade ou aplicação pretendida. No entanto, a invenção também compreende formas de realização de métodos adicionais para aquelas situações em que é considerado importante ou desejável para uma finalidade ou aplicação particular gerar uma biblioteca de fragmentos de DNA na qual há uma probabilidade mais elevada de os fragmentos de DNA marcados exibirem cada sequência que é exibida pelo DNA-alvo a partir de onde foram gerados os fragmentos (por exemplo, ver a secção da especificação intitulada ("Métodos de Geração de Bibliotecas de Fragmentos de DNA com Representação Melhorada de Sequências nas Extremidades do DNA-Alvo"). Ainda adicionalmente, nalguns casos, a probabilidade de a biblioteca de fragmentos de DNA conter um fragmento de DNA marcado que exibe cada sequência do DNA-alvo aumentará se mais moléculas de DNA-alvo estiverem presentes no passo da reação de transposição do método, desse modo gerando mais moléculas de fragmentos de DNA com marcação 5' utilizando o método. Assim, ainda outro método para aumentar a probabilidade de uma biblioteca de fragmentos de DNA conter um fragmento de DNA marcado que exibe cada sequência que é exibida pelo DNA-alvo consiste em amplificar o DNA-alvo e depois utilizar o DNA-alvo amplificado em vez do DNA-alvo para gerar a biblioteca de fragmentos de DNA. Ainda noutras formas de realização em que DNA-alvo compreende dsDNA preparado a partir de RNA utilizando uma reação de transcrição reversa, a quantidade de DNA-alvo é amplificada por amplificação do RNA antes de o converter em dsDNA utilizando o passo de transcrição reversa. Alguns métodos de amplificação de moléculas de RNA e DNA que podem ser utilizados para proporcionar DNA-alvo amplificado são revelados no presente documento. No entanto, a invenção não está limitada no que se refere ao método utilizado para amplificar o DNA-alvo. Em algumas formas de realização, o DNA-alvo é amplificado utilizando um dos métodos revelados no presente documento, ao passo que, em algumas formas de realização, utiliza-se outro método conhecido na área.
Como usado no presente documento, o termo "enzima modificadora de ácido nucleico" refere-se a qualquer enzima que atua em DNA para efetuar uma modificação, por exemplo, clivagem, ligação, polimerização, fosforilação, etc. Enzimas modificadoras de ácidos nucleicos incluem, por exemplo, polimerases, nucleases, transferases, ligases, fosforilases, fosfatases, metilases, transosases, etc. "Enzimas modificadoras de DNA" compreendem quaisquer enzimas que atuam em DNA, incluindo enzimas que também atuam noutros substratos, tais como RNA.
Como usado no presente documento, uma "DNA polimerase" refere-se a uma enzima que catalisa a polimerização de desoxirribonucleótidos num filamento de DNA. DNA polimerases compreendem "DNA polimerases dependentes do modelo", que requerem um ácido nucleico modelo para determinar a ordem pela qual desoxirribonucleótidos são adicionados ao polímero, ou podem ser "independentes do modelo", de modo que catalisam a polimerização sem referência a uma sequência modelo.
Uma "DNA polimerase dependente de DNA" é uma enzima que sintetiza uma cópia de DNA complementar ("cDNA") por extensão de um "primer" que é emparelhado com um DNA modelo. Algumas DNA polimerases dependentes de DNA também podem sintetizar uma cópia de DNA complementar de um modelo de RNA, um processo que é também denominado "transcrição reversa". DNA polimerases que podem transcrever de forma reversa também podem ser denominadas "transcriptases reversas".
Para além da síntese de polímeros de DNA, DNA polimerases podem compreender outras características ou atividades. Por exemplo, uma DNA polimerase pode ser caracterizada como tendo ou estando desprovida de atividade de exonuclease 5' para 3' (também denominada atividade de exonuclease 5' ou nuclease 5') , atividade de exonuclease 3' para 5', atividade de deslocamento de filamento, e podem ser caracterizadas relativamente ao grau em que são processivas ou distributivas, como discutido mais pormenorizadamente abaixo.
Algumas DNA polimerases são capazes de deslocar o filamento complementar ao filamento modelo, sendo um novo filamento de DNA sintetizado pela polimerase. Este processo é denominado "deslocamento de filamento" e as DNA polimerases que têm esta atividade são referidas no presente documento como "DNA polimerases de deslocamento de filamento". 0 modelo para a síntese de DNA por deslocamento de filamento pode ser um DNA de filamentação simples (ssDNA) ou DNA de filamentação dupla (dsDNA) linear ou circular. Se o DNA modelo for um círculo de filamentação simples, a síntese iniciada de DNA prossegue sempre em redor do círculo, com deslocamento contínuo do filamento à frente do filamento replicante, um processo denominado "replicação por círculo rolante". A replicação por círculo rolante conduz à síntese de cópias em série do modelo circular. Em geral, é preferencial que uma DNA polimerase específica de modelo de DNA utilizada para um método da invenção sintetize eficientemente DNA de um comprimento adequado para a finalidade pretendida sem "abandono" do modelo (ou terminação da síntese do DNA), o que é denominado processividade da enzima. A capacidade de uma DNA polimerase para proceder ao deslocamento de filamentos pode ser facilmente determinada utilizando a polimerase num ensaio de replicação por circulo rolante como descrito por Fire e Xu (Proc. Natl. Acad. Sei. USA 92: 4641-4645, 1995). 0 deslocamento de filamentos e processividade da DNA polimerase também podem ser avaliados utilizando métodos descritos em Kong et al. (J. Biol. Chem. 268: 1965-1975, 1993) . Transferase terminal também é definida como uma DNA polimerase no presente documento, cuja DNA polimerase é utilizada como uma composição nalgumas formas de realização dos estojos e métodos da presente invenção. Transferase terminal é preferencial nalgumas formas de realização porque catalisa a adição independente do modelo de dNTPs aos terminais 3'-hidroxilo de DNA.
Algumas formas de realização compreendem um método que emprega uma composição de DNA polimerase que tem atividade de exonuclease 5' para 3' para libertar um nucleótido que é etiquetado com uma fração detetável (por exemplo, uma fração compreendendo uma molécula visível, fluorescente, quimioluminescente ou outra molécula detetável) como meio de avaliar a polimerização de DNA e, desse modo, detetar e/ou quantificar a presença na amostra da molécula de ácido nucleico que serve de modelo (por exemplo, de um modo semelhante aos ensaios TaqMan® da Applied Biosystems, Inc.). Nalgumas formas de realização, a presente invenção compreende uma composição de DNA polimerase que está desprovida de atividade de exonuclease 5' para 3'.
Algumas formas de realização compreendem um método que emprega uma composição de DNA polimerase que está desprovida de atividade de exonuclease 5' para 3'. Por exemplo, nalgumas formas de realização, uma composição de DNA polimerase que está desprovida de atividade de exonuclease 5' para 3' é utilizada para sequenciação de DNA. Por exemplo, nalgumas formas de realização diferentes, uma composição de DNA polimerase que está desprovida de atividade de exonuclease 5' para 3' é utilizada para amplificação do genoma completo.
Nalgumas formas de realização, a presente invenção compreende uma composição de DNA polimerase que tem atividade de exonuclease 5' para 3'. Nalgumas formas de realização preferenciais (por exemplo, em que uma DNA polimerase é utilizada, para além de uma ligase dependente do modelo, para união num dos métodos descritos no presente documento), o método emprega uma composição de DNA polimerase que está desprovida de atividade de nuclease 5' (incluindo atividade de exonuclease 5' para 3' e de nuclease dependente da estrutura 5') . Por exemplo, nalgumas formas de realização diferentes, uma composição de DNA polimerase que está desprovida de atividade de exonuclease 5' para 3' é utilizada para preencher um hiato. Assim, nalgumas formas de realização de métodos ou estojos, a presente invenção compreende uma composição de DNA polimerase que está desprovida de atividade de nuclease 5'. No entanto, uma composição de DNA polimerase que tem atividade de nuclease 5' para libertar um nucleótido ou um oligonucleótido que é etiquetado com um fração detetável (por exemplo, uma fração compreendendo uma molécula visível, fluorescente, quimioluminescente ou outra molécula detetável) como meio de avaliar a polimerização de DNA e, desse modo, detetar e/ou quantificar a presença na amostra da molécula de ácido nucleico que serve de modelo (por exemplo, de um modo semelhante aos ensaios TaqMan® da Applied Biosystems, Inc.) pode ser utilizada para quantificar moléculas de DNA geradas utilizando um método da invenção.
Exemplos de DNA polimerases de deslocamento de filamento que podem ser utilizadas incluem, embora sem limitação, DNA polimerase RepliPHI™ phi29, DNA polimerase DisplaceAce™, DNA polimerase rGka, DNA polimerase SequiTherm™, DNA polimerase Taq, DNA polimerase Tfl e transcriptase reversa MMLV (todas disponibilizadas pela EPICENTRE Biotechnologies, Madison, WI, EUA). Nalgumas formas de realização, uma combinação de uma DNA polimerase que está desprovida de atividade de verificação de exonuclease 3' para 5' com uma DNA polimerase que tem esta atividade, tal como DNA polimerase FAILSAFE™, é utilizada como DNA polimerase de deslocamento de filamento. A combinação enzimática é útil nalgumas formas de realização porque exibe fidelidade melhorada durante a síntese de DNA (isto é, sintetiza DNA com menos nucleótidos que não são complementares ao modelo). A fidelidade e/ou taxas de erro de muitas DNA polimerases em condições particulares são conhecidas, bem como métodos de medição da fidelidade (por exemplo, por sequenciação).
Em geral é desejável, num método de amplificação por deslocamento de filamento da presente invenção, que a quantidade de DNA polimerase de deslocamento de filamento utilizada no método seja tão elevada quanto possível sem inibir ou afetar adversamente a reação. Por exemplo, a DNA polimerase REPLIPHI™ phi29 (EPICENTRE) pode ser utilizada a cerca de um micrograma de proteína numa reação de 20 microlitros e a DNA polimerase DISPLACE™ (EPICENTRE) pode ser utilizada a cerca de 50 unidades até cerca de 300 unidades numa reação de 50 microlitros. Uma vez que definições de unidades variam para diferentes DNA polimerases e mesmo para DNA polimerases semelhantes de vendedores ou fontes diferentes, e também porque a atividade para cada enzima varia a diferentes temperaturas e em diferentes condições reacionais, é desejável otimizar a quantidade de DNA polimerase de deslocamento de filamento e condições reacionais para cada modelo de DNA e "primer" utilizados. 0 deslocamento de filamento pode ser facilitado utilizando um fator de deslocamento de filamento, como helicase, mas uma vez que ; pode ser utilizada uma variedade de DNA polimerases para a presente invenção, tal fator de deslocamento de filamento não é habitualmente necessário. Considera-se que qualquer DNA polimerase que consiga efetuar replicação por circulo rolante na presença de um fator de deslocamento de filamento é adequada para utilização em formas de realização da i nven ç ão que compreendem deslocamento de filamento mesmo que a DNA polimerase não efetue replicação por circulo rolante na ausência de tal fátõr.Fátorésdêdêslocàmêhtõdêfilamentõquêpermitem replicação por circulo rolante incluem, embora sem limitação, a : subunidade acessória de polimerase BMRFl (Tsurumi et al. , J. Virology, 67: 7648-7653, 1993), proteína de ligação a DNA de adenovirus (Zijderveld e van der vliet, J. Virology, 68: 1158-1164, 1994), proteína viral de herpes simplex ICP8 ;(Boehmer e Lehman, J. Virology, 67: 711-715, 1993); Skaliter e Lehman, Proc. Natl. Acad. Sei. USA, 91: 10,..6.6.5.-:.1.0,669,: 1994), proteínas de ligação de DNA de filamentação simples (SSB; Rigler e Romano, J. Biol. Chem., 270: 8910-8919, 1995) e helicase de timo de vitelo (Siegel et al., J. Biól Chem., 267: 13.629—13.635, 1992).
Um "mononucleósido" ou "nucleósido", como usado no presente documento, refere-se a um composto que consiste numa base de purina (guanina (G) ou adenina (A) ) ou pirimidina (timina (T), uridina (U) ou citidina (C)) covalentemente ligada a um açúcar pentose, ao passo que "nucleótido" se refere a um nucleósido fosforilado num dos grupos hidroxilo do açúcar pentose. 0 termo "canónica" é usado para referir as quatro bases de ácido nucleico comuns adenina, citosina, guanina e timina que estão habitualmente presentes em DNA ou nos respetivos desoxirribonucleósidos, desoxirribonucleótidos ou 2'-desoxirribonucleósido-5'-trifosfatos que contêm uma base canónica. 0 termo "não canónica" é usado para referir bases de ácido nucleico em DNA diferentes das quatro bases canónicas ou nos respetivos desoxirribonucleósidos, desoxirribonucleótidos ou 2'-desoxirribonucleósido-5'-trifosfatos que contêm uma base não canónica. Por exemplo, apesar de uracilo ser uma base de ácido nucleico comum em RNA, uracilo é uma base não canónica em DNA. "Bases não canónicas" estão presentes em ácidos nucleicos devido a incorporação de nucleótidos não canónicos (por exemplo, por sintese utilizando um sintetizador de oligonucleótidos ou por sintese utilizando uma DNA polimerase) ou devido a modificação de bases existentes (canónicas ou não canónicas).
Um "ácido nucleico" ou "polinucleótido" significa uma molécula polimérica que compreende uma série de "mononucleósidos", também referidos como "nucleósidos", em que a posição 3' do açúcar pentose de um nucleósido é ligada por uma ligação internucleosidica, tal como, embora sem limitação, uma ligação fosfodiéster, à posição 5' do açúcar pentose do nucleósido seguinte. Um nucleósido ligado a um grupo fosfato é denominado "nucleótido". 0 nucleótido que é ligado à posição 5' do nucleótido seguinte da série é denominado "a 5' de" ou o "nucleótido 5'" e o nucleótido que é ligado à posição 3' do nucleótido 5' é denominado "a 3' de" ou o "nucleótido 3'". Como usado no presente documento, os termos "a 5' de" e "a 3' de" referem-se à posição ou orientação de um grupo químico, nucleótido, sequência de nucleótidos ou elemento genético particular (por exemplo, uma sequência promotora de RNA polimerase) relativamente a outro grupo químico, nucleótido, sequência de nucleótidos ou elemento genético num único filamento de um ácido nucleico. Se uma primeira sequência de ácido nucleico estiver a 3' de uma segunda sequência num filamento, o complemento da primeira sequência estará a 5' do complemento da segunda sequência no filamento complementar. A descrição da invenção será entendida relativamente à posição e orientação relativa 5' ou 3' de uma sequência ou elemento genético num filamento de ácido nucleico particular. É dito que moléculas de ácidos nucleicos lineares têm um "terminal 5'" (extremidade 5') e um "terminal 3'" (extremidade 3') porque ocorrem ligações fosfodiéster de ácidos nucleicos no carbono 5' e carbono 3' das frações açúcar dos mononucleótidos substituintes. A extremidade de um polinucleótido na qual uma nova ligação será efetuada num carbono 5' é o seu nucleótido 5' terminal. A extremidade de um polinucleótido na qual uma nova ligação será efetuada num carbono 3' é o seu nucleótido 3' terminal. Um nucleótido terminal, como usado no presente documento, é o nucleótido na posição de extremidade do terminal 3' ou 5' . 0 açúcar pentose do ácido nucleico pode ser ribose, em cujo caso o ácido nucleico ou polinucleótido é denominado "RNA", ou pode ser 2'-desoxirribose, em cujo caso o ácido nucleico ou polinucleótido é denominado "DNA". Em alternativa, especialmente se o ácido nucleico for sintetizado por via química, o ácido nucleico pode ser composto por mononucleótidos de DNA e RNA. Em RNA e DNA, cada açúcar pentose é covalentemente ligado a uma de quatro bases de ácido nucleico comuns ou "canónicas" (cada uma também denominada "base"). Três das bases predominantes de ocorrência natural que são ligadas aos açúcares (adenina, citidina e guanina) são comuns para DNA e RNA, ao passo que uma base é diferente; DNA tem a base adicional timina, ao passo que RNA tem a base adicional uridina. Nalguns casos, uridina pode estar presente como uma base em DNA. Os peritos na área habitualmente pensam num pequeno polinucleótido como um "oligonucleótido". 0 termo "oligonucleótido", como usado no presente documento, é definido como uma molécula que compreende dois ou mais desoxirribonucleótidos ou ribonucleótidos, preferencialmente cerca de 6 até 100 nucleótidos, mas não há nenhum limite definido para o comprimento de um oligonucleótido. O tamanho exato dependerá de muitos fatores, o que por sua vez depende da função ou utilização final do oligonucleótido.
Além disso, por uma variedade de motivos, um ácido nucleico ou polinucleótido da invenção pode compreender uma ou mais bases de ácido nucleico, frações açúcar ou ligações internucleosídicas modificadas. A título exemplificativo, alguns motivos para utilização de ácidos nucleicos ou polinucleótidos que contêm bases, frações de açúcar ou ligações internucleosídicas modificadas incluem, embora sem limitação: (1) modificação da Tf,· (2) alteração da suscetibilidade do polinucleótido a uma ou mais nucleases; (3) proporcionar uma fração para ligação de uma etiqueta; (4) proporcionar uma etiqueta ou um inibidor para uma etiqueta, ou (5) proporcionar uma fração, tal como biotina, para ligação a outra molécula que está em solução ou ligada a uma superfície. Por exemplo, nalgumas formas de realização, um oligonucleótido, tal como um "primer", pode ser sintetizado de modo que uma porção aleatória contenha um ou mais análogos de ácidos ribonucleicos de conformação restringida, como, mas sem limitação, um ou mais análogos de ácidos ribonucleicos nos quais o anel ribose está "trancado" com uma ponte metileno que liga o átomo 2'-0 ao átomo 4'-C (por exemplo, como disponibilizado pela Exiqon, Inc. com a marca registada "LNA™"); estes nucleótidos modificados originam um aumento da Tf ou temperatura de fusão em cerca de 2 graus até cerca de 8 graus centígrados por monómero nucleotídico. Se a Tf for aumentada, pode ser possível reduzir o número de nucleótidos aleatórios na porção 3' aleatória do oligorribonucleótido de marcação terminal. No entanto, um nucleótido modificado, como um LNA, tem que ser validado para atuar no método para a sua finalidade pretendida, bem como satisfazer outros critérios do método. Por exemplo, nalgumas formas de realização em que é utilizado um "primer" oligonucleotídico compreendendo ribonucleótidos, um critério para utilização do nucleótido modificado no método pode ser que o oligonucleótido que o contém possa ser digerido por uma RNase específica de filamentação simples.
Para atingir os objetivos da invenção, a título exemplificativo, as bases de ácido nucleico nos mononucleótidos de uma ou mais posições de um polinucleótido ou oligonucleótido podem compreender guanina, adenina, uracilo, timina ou citidina ou, alternativamente, uma ou mais das bases de ácido nucleico podem compreender uma base modificada, tal como mas não se limitando a xantina, aliamino-uracilo, aliamino-timidina, hipoxantina, 2-aminoadenina, 5-propiniluracilo, 5-propinilcitosina, 4-tiouracilo, 6-tioguanina, aza e desaza uracilos, timidinas, citosinas, adeninas ou guaninas. Ainda adicionalmente, podem compreender uma base de ácido nucleico que é derivatizada com uma fração biotina, uma fração digoxigenina, uma fração fluorescente ou quimioluminescente, uma fração inibidora ou alguma fração diferente. A invenção não está limitada às bases de ácidos nucleicos enumeradas; essa lista é proporcionada para apresentar um exemplo da gama larga de bases que podem ser utilizadas para uma finalidade particular num método.
Relativamente a ácidos nucleicos ou polinucleótidos da invenção, uma ou mais das frações açúcar podem compreender 2' -desoxirribose ou, alternativamente, uma ou mais das frações açúcar podem ser uma fração de açúcar diferente, tal como mas não se limitando a ribose ou 2'-fluoro-2'-desoxirribose ou 2'-O-metil-ribose, que proporcionam resistência a algumas nucleases, ou 2'-amino-2'-desoxirribose ou 2'-azido-2'-desoxirribose, que podem ser etiquetadas pela sua reação com um corante visível, fluorescente, fluorescente infravermelho ou outros corantes ou porções químicas detetáveis tendo uma fração eletrofílica, fotorreativa, alcinilo ou outra fração química reativa.
As ligações internucleosídicas de ácidos nucleicos ou polinucleótidos da invenção podem ser ligações fosfodiéster ou, alternativamente, uma ou mais das ligações internucleosídicas podem compreender ligações modificadas, tais como mas não se limitando a ligações fosf orotioato, fosforoditioato, fosforosselenato ou fosforodisselenato, que são resistentes a algumas nucleases.
Ao fazer referência a um oligonucleótido ou a uma porção de um oligonucleótido que exibe uma "sequência aleatória", pretendemos significar que o oligonucleótido ou sua porção é sintetizado (por exemplo, utilizando um sintetizador de oligonucleótidos) utilizando quantidades iguais das quatro bases nucleotidicas canónicas (A, G, C e T ou U) para cada posição nucleotidica na porção da sequência aleatória. Este método conduz à síntese de uma mistura de oligonucleótidos que compreende (4 levantado à potência de n) + 1 de diferentes oligonucleótidos, em que "n" é igual ao número de posições nucleotidicas na porção da sequência aleatória. Assim, nestas formas de realização, o oligonucleótido compreende uma mistura de muitos oligonucleótidos diferentes, que representa todas as sequências possíveis para a porção da sequência aleatória. Ao fazer referência a um oligonucleótido ou a uma porção de um oligonucleótido que exibe uma "sequência semialeatória", pretendemos significar que é sintetizado o oligonucleótido ou porção semialeatória (por exemplo, utilizando um sintetizador de oligonucleótidos) em que algumas posições nucleotidicas são sintetizadas utilizando quantidades iguais das quatro bases nucleotidicas canónicas (A, G, C e T ou U) (isto é, aquelas posições são "aleatórias" como descrito acima) mas uma ou mais posições diferentes na porção semialeatória são sintetizadas utilizando apenas uma, duas ou três, em vez dos quatro, nucleótidos de bases canónicas (isto é, A, C, G e T ou U) . Nalgumas formas de realização, um oligonucleótido contém um ou mais nucleótidos com uma "base degenerada", pelo qual pretendemos significar uma base de ácido nucleico que é capaz de emparelhamento de bases com uma ou mais bases de ácido nucleico diferentes das de acordo com as regras comuns de emparelhamento de bases segundo as quais A emparelha com T ou U e G emparelha com C, e um "nucleótido degenerado" é um nucleótido que contém uma base degenerada. Uma "porção" ou "região", usados indistintamente no presente documento, de um polinucleótido ou oligonucleótido (incluindo um "primer") é uma sequência contígua de 2 ou mais bases. Noutras formas de realização, uma região ou porção tem pelo menos cerca de quaisquer de 1, 2, 3, 5, 10, 15, 20, 25, 50, 75 ou mesmo mais nucleótidos contíguos.
Um "primer" é um oligonucleótido ("oligo") , geralmente com um grupo 3'-OH livre, que pode ser estendido por uma ácido nucleico polimerase. Para uma polimerase dependente do modelo, geralmente pelo menos a porção 3' do "primer" oligo é complementar a uma porção de um ácido nucleico modelo, à qual o oligo "se liga" (ou "complexa", "emparelha" ou "hibridiza"), por formação de ligações de hidrogénio e outras forças moleculares, ao modelo para dar origem a um complexo "primer"/modelo para iniciação da síntese por uma DNA polimerase, e que é estendido (isto é, "estendido por "primer"") pela adição de bases ligadas de modo covalente ligadas à sua extremidade 3' que são complementares ao modelo no processo de síntese de DNA. O resultado é um produto de extensão de "primer". DNA polimerases dependentes do modelo (incluindo transcriptases reversas) geralmente requerem complexação de um "primer" oligonucleotídico com um modelo de filamentação simples para iniciar a síntese de DNA ("iniciação"), mas RNA polimerases geralmente não requerem um "primer" para a síntese de RNA que é complementar a um modelo de DNA (transcrição).
Uma "DNase específica de filamento simples" significa uma DNase que digere especificamente DNA de filamentação simples, mas que não digere RNA de filamentação simples ou RNA ou DNA que é emparelhado ou complexado com RNA ou DNA complementar, seja o referido RNA ou DNA complementar parte de outra molécula de ácido nucleico (por exemplo, por emparelhamento intermolecular de bases) ou uma porção da mesma molécula de ácido nucleico (por exemplo, por emparelhamento intramolecular de bases). A DNase específica de filamento simples pode ser uma endonuclease ou uma exonuclease, desde que seja ativa na digestão específica de DNA de filamentação simples em monómeros ou oligodesoxirribonucleótidos pequenos. Nalgumas formas de realização preferenciais, oligodesoxirribonucleótidos, incluindo "primers", são removidos da mistura reacional após o passo do método em que são utilizados por digestão com uma DNase específica de filamento simples. Exonuclease I, exonuclease VII e exonuclease Rec J são DNases específicas de filamento simples exemplificativas.
Uma "RNA polimerase do tipo T7" (RNAP) no presente documento significa RNA polimerase de T7 (por exemplo, ver Studier, FW et ai., páginas 60-89 em "Methods in Enzymology", Volume 185, editado por Goeddel, DV, Academic Press, 1990) ou uma RNAP derivada de um bacteriófago "do tipo T7", significando um bacteriófago que tem uma organização genética semelhante à do bacteriófago T7. A organização genética de todos os fagos do tipo T7 foi examinada; verificou-se que é essencialmente igual à de T7. Exemplos de bacteriófagos do tipo T7 de acordo com a invenção, incluem, embora bsem limitação, os fagos T3, phi I, phi II, W31, Η, Y, Ai, 122, cro, C21, C22 e C23 de Escherichia coli; fago gh-1 de Pseudomonas putida; fago SP6 de Salmonella typhimurium; fagos IV de Serratia marcescens; fago VilII de Citrobacter, e fago No. 11 de Klebsiella (Hausmann, Current Topics in Microbiology and Immunology 75:77-109, 1976; Korsten et al., J. Gen. Virol. 43:57-73, 1975; Dunn, et al. , Nature New Biology 230:94-96, 1971; Towle, et al., J. Biol. Chem. 250:1723-1733, 1975; Butler e Chamberlin, J. Biol. Chem. 257:5772-5778, 1982), bem como formas mutantes de tais RNAPs (por exemplo, Sousa et al., Patente U.S. No. 5,849,546; Padilla, R e Sousa, R, Nucleic Acids Res., 15: el38, 2002; Sousa, R e Mukherjee, S, Prog Nucleic Acid Res Mol Biol., 73: 1-41, 2003; Guillerez, J, et al., Pedido de Patente U.S. No. 20040091854). Em formas de realização preferenciais da invenção, o promotor utilizado é uma sequência promotora de tipo selvagem ou mutante que é reconhecida por uma RNA polimerase do tipo T7. Nalgumas formas de realização, o promotor pode ser de filamentação simples, tal como um pseudopromotor (por exemplo, Ohmichi et al., Proc. Natl. Acad. Sei. USA 99:54-59, 2002), ou um promotor N4 vRNAP, em cujo caso é utilizada a proteína truncada compreendendo o domínio de 1 106 aminoácidos (correspondente aos aminoácidos 998-2103) da N4 vRNAP (designado "mini-vRNAP"; EPICENTRE Biotechnologies, Madison, WI, EUA) transcricionalmento ativo (Kazmierczak, K.M., et al., EMBO J., 21: 5815-5823, 2002).
Como usado no presente documento, "DNA-alvo" refere-se a qualquer dsDNA de interesse que é sujeito a transposição, por exemplo, para gerar uma biblioteca de fragmentos de DNA marcados (por exemplo, fragmentos de ssDNA ou dsDNA lineares com marcação 5' e 3' ou duplamente marcados ou fragmentos de ssDNA circulares marcados). "DNA-alvo" pode ser derivado de qualquer fonte in vivo ou in vitro, incluindo de uma ou múltiplas células, tecidos, órgãos ou organismos, vivos ou mortos, ou de qualquer fonte biológica ou ambiental (por exemplo, água, ar, solo) . Por exemplo, nalgumas formas de realização, o DNA-alvo compreende ou consiste em dsDNA eucariótico e/ou procariótico que é originário ou que é derivado de humanos, animais, plantas, fungos, (por exemplo, bolores ou leveduras), bactérias, vírus, viroides, micoplasma ou outros
microrganismos. Nalgumas formas de realização, o DNA-alvo compreende ou consiste em DNA genómico, DNA subgenómico, DNA cromossómico (por exemplo, de um cromossoma isolado ou de uma porção de um cromossoma, por exemplo, de um ou mais genes ou loci de um cromossoma), DNA mitocondrial, DNA de cloroplasto, DNA plasmídico ou outro DNA de derivação epissomal (ou DNA recombinante ai contido) , ou cDNA de filamentação dupla preparado por transcrição reversa de RNA utilizando uma DNA polimerase dependente de RNA ou transcriptase reversa para gerar cDNA de primeiro filamento e depois estender um "primer" emparelhado com o cDNA de primeiro filamento para gerar dsDNA. Nalgumas formas de realização, o DNA-alvo compreende múltiplas moléculas de dsDNA em ou preparadas a partir de moléculas de ácidos nucleicos (por exemplo, múltiplas moléculas de dsDNA em ou preparadas a partir de DNA genómico ou cDNA preparado a partir de RNA em ou a partir de uma fonte biológica (por exemplo, célula, tecido, órgão, organismo) ou ambiental (por exemplo, água, ar, solo, saliva, expetoração, urina, fezes) . Nalgumas formas de realização, o DNA-alvo provém de uma fonte in vitro. Por exemplo, nalgumas formas de realização, o DNA-alvo compreende ou consiste em dsDNA que é preparado in vitro a partir de DNA de filamentação simples (ssDNA) ou a partir de RNA de filamentação simples ou de filamentação dupla (por exemplo, utilizando métodos que são bem conhecidos na área, tais como extensão de "primers" utilizando uma DNA polimerase dependente de DNA e/ou dependente de RNA (transcriptase reversa) adequada). Nalgumas formas de realização, o DNA-alvo compreende ou consiste em dsDNA que é preparado a partir de todas ou de uma porção de uma ou mais moléculas de DNA ou RNA de filamentação dupla ou de filamentação simples utilizando quaisquer métodos conhecidos na área, incluindo métodos para: amplificação de DNA ou RNA (por exemplo, PCR ou PCR com transcriptase reversa (RT-PCR), métodos de amplificação mediada por transcrição, com amplificação de todas ou de uma porção de uma ou mais moléculas de ácidos nucleicos); clonagem molecular de todas ou de uma porção de uma ou mais moléculas de ácidos nucleicos num plasmídeo, fosmideo, BAC ou outro vetor que subsequentemente é replicado numa célula hospedeira adequada; ou captura de uma ou mais moléculas de ácidos nucleicos por hibridização, tal como por hibridização com sondas de DNA numa série ou microssérie (por exemplo, por "captura de sequência"; por exemplo, utilizando estojos e/ou séries da ROCHE NIMBLEGEN, AGILENT ou FEBIT).
Nalqumas formas de realização, "DNA-alvo" significa dsDNA que é preparado ou modificado (por exemplo, utilizando várias técnicas bioquímicas ou de biologia molecular) antes de ser utilizado para gerar uma biblioteca de fragmentos de DNA marcados (por exemplo, fragmentos de ssDNA ou dsDNA lineares com marcação 5' e 3' ou duplamente marcados ou fragmentos de ssDNA circulares marcados). Por exemplo, os presentes inventores observaram que a representação de dados de sequências de geração seguinte das extremidades de DNA-alvo compreendendo moléculas de dsDNA com um tamanho menor do que 10 Kb era baixa em comparação com a representação de dados de sequências do meio desse DNA-alvo. Sem ficar restringido pela teoria, uma explicação possível para esta observação é que a probabilidade de encontrar fragmentos de DNA com duas composições de extremidade de transposão inseridas em orientações opostas nas extremidades de uma molécula de dsDNA linear é menor do que a probabilidade de encontrar fragmentos de DNA com duas composições de extremidade de transposão inseridas em orientações opostas no meio da molécula de dsDNA linear. Assim, nalgumas formas de realização, para gerar
bibliotecas de fragmentos de DNA duplamente marcados ou fragmentos de DNA circulares marcados que representem melhor as sequências de extremidade, o método compreende adicionalmente proporcionar DNA-alvo para utilização no método compreendendo dsDNA (por exemplo, DNA genómico de filamentação dupla ou cDNA preparado a partir de RNA, tal como mRNA) que já tem um marcador na extremidade 5' e/ou 3'. Por exemplo, nalgumas formas de realização, o DNA-alvo compreende cDNA de filamentação dupla que é preparado a partir de RNA por: síntese de cDNA de primeiro filamento por extensão de um "primer" de síntese de cDNA de primeiro filamento que tem uma porção 3' e uma porção 5', em que a porção 3' é complementar à porção de extremidade 3' do RNA e a porção 5' compreende um primeiro marcador, depois união de um segundo marcador à extremidade 3' do cDNA de primeiro filamento utilizando um oligonucleótido de marcação terminal e uma DNA polimerase como descrito noutro local do presente documento, e depois utilização de uma DNA polimerase para sintetizar cDNA de filamentação dupla por extensão de um "primer" de síntese de cDNA de segundo filamento que emparelha com o segundo marcador. Alternativamente, nalgumas formas de realização preferenciais diferentes, para gerar bibliotecas de fragmentos de DNA duplamente marcados que representem melhor as sequências de extremidade, o DNA-alvo utilizado no método para gerar fragmentos de DNA duplamente marcados ou fragmentos de DNA circulares marcados compreende dsDNA circular que é preparado por ligação intramolecular de dsDNA linear (por exemplo, que é preparado por ligação intramolecular de DNA genómico de filamentação dupla ou de cDNA de filamentação dupla preparado a partir de RNA, tal como mRNA). Assim, nalgumas formas de realização, o método compreende adicionalmente: ligar o dsDNA linear utilizando uma ligase (por exemplo, DNA ligase de T4) para gerar dsDNA circular para utilização como DNA-alvo no método. Nalgumas formas de realização do método que compreende gerar dsDNA circular para utilização como DNA-alvo por ligação de dsDNA linear, o dsDNA linear é tratado com DNA polimerase de T4 e polinucleótido quinase de T4 (por exemplo, utilizando o Estojo de Reparação de Extremidades de DNA END-It™ (EPICENTRE Biotechnologies, Madison, WI, EUA)) antes do passo de ligação com a finalidade de tornar as extremidades planas e fosforilar as extremidades 5'.
Como usado no presente documento, um "fragmento de DNA" significa uma porção ou pedaço ou segmento de um DNA-alvo que é clivado ou libertado ou partido de uma molécula de DNA maior de modo que já não está ligado à molécula paterna. Um fragmento de DNA pode ser de filamentação dupla (um "fragmento de dsDNA") ou de filamentação simples (um "fragmento de ssDNA"), e o processo de geração de fragmentos de DNA a partir do DNA-alvo é denominado "fragmentação" do DNA-alvo. Nalgumas formas de realização preferenciais, o método é utilizado para gerar uma "biblioteca de fragmentos de DNA" compreendendo uma coleção ou população de fragmentos de DNA marcados.
Um "modelo" é uma molécula de ácido nucleico que é copiada por uma ácido nucleico polimerase, tal como uma DNA polimerase. Quer a molécula de ácido nucleico compreenda dois filamentos (isto é, seja "de filamentação dupla") ou apenas um filamento (isto é, seja "de filamentação simples"), o filamento da referida molécula de ácido nucleico que serve para especificar a sequência de nucleótidos exibida por um ácido nucleico que é sintetizado é o "modelo" ou "o filamento modelo". 0 ácido nucleico sintetizado pela ácido nucleico polimerase é complementar ao modelo. RNA e DNA são sempre sintetizados na direção 5'-para-3', começando na extremidade 3' do filamento modelo, e os dois filamentos de um duplex de ácido nucleico são sempre alinhados de modo que as extremidades 5' dos dois filamentos estão em extremidades opostas do duplex (e, necessariamente, também o estão as extremidades 3'). É necessário um "primer" para modelos de RNA e DNA para iniciar a síntese por uma DNA polimerase, mas não é necessário um "primer" para iniciar a síntese por a RNA polimerase dependente de DNA, que habitualmente é denominada apenas "RNA polimerase". "Transferase terminal", também denominada "desoxirribonucleotidiltransferase terminal" ou "TdT", é uma DNA polimerase que catalisa a adição independente do modelo (ou "formação de cauda") de desoxirribonucleósido trifosfatos (dNTPs) ou de um único didesoxirribonucleósido trifosfato aos terminais 3'-hidroxilo de DNA. Uma transferase terminal comum utilizada na área, que é disponibilizada comercialmente, é produzida numa estirpe de E. coli que expressa o gene recombinante a partir de timo de vitelo. Em algumas formas de realização, a invenção compreende adicionalmente o passo de incubar fragmentos de DNA com marcação 5', após desnaturação, com TdT e um dNTP em condições e durante um período de tempo suficiente em que são sintetizados os fragmentos de DNA com marcação 5' e 3' que têm um segundo marcador compreendendo uma cauda de DNA homopolimérica. Nalgumas formas de realização, a cauda de DNA homopolimérica é adicionalmente utilizada como sítio de iniciação para a síntese de cDNA de filamentação dupla. Nalgumas formas de realização, o "primer" utilizado para sintetizar o segundo filamento de DNA tem uma porção 3' que é complementar ao segundo marcador compreendendo a cauda homopolimérica e uma porção 5' que exibe uma sequência desejada arbitrária que não é complementar ao primeiro marcador, ao DNA-alvo ou ao segundo marcador compreendendo a cauda homopolimérica. Por exemplo, nalgumas formas de realização, a porção 5' do "primer" exibe uma sequência de promotor antissentido para um promotor de RNA polimerase e o método compreende adicionalmente incubar o cDNA de filamentação dupla resultante com a RNA polimerase em condições e durante um período de tempo suficiente em que RNA é sintetizado.
Em algumas formas de realização, os oligonucleótidos de extremidade de transposão utilizados no método da presente invenção exibem apenas as sequências de extremidade de transposão necessárias numa reação de transposição. No entanto, nalgumas formas de realização, pelo menos um dos oligonucleótidos de extremidade de transposão exibe adicionalmente uma ou mais sequências de nucleótidos diferentes a 5' da sequência de extremidade de transposão. Assim, nalgumas formas de realização, o método ou estojo emprega um filamento transferido que tem uma porção 3' e uma porção 5', em que a porção 3' exibe a sequência de extremidade de transposão transferida e a porção 5' exibe uma ou mais sequências adicionais que não participam na formação de um complexo funcional com a transposase. Não há nenhum limite a quais sequências adicionais são utilizadas para a uma ou mais sequências adicionais na porção 5' do filamento transferido, cujas sequências podem ser utilizadas para atingir qualquer finalidade desejada. Por exemplo, nalgumas formas de realização, a porção 5' do filamento transferido exibe uma ou mais sequências marcadoras adicionais (por exemplo, uma sequência marcadora que permite captura por emparelhamento com uma sequência específica numa superfície, tal como uma esférula ou uma sonda num "microchip" ou série; por exemplo, para captura num esférula para sequenciação de geração seguinte; por exemplo, uma sequência marcadora 454A ou 454B para captura na esférula para sequenciação utilizando sequenciador Roche 454 Next-Gen) ou uma ou mais sequências para identificação, deteção (por exemplo, deteção fluorescente) ou triagem dos produtos do método. Nalgumas formas de realização diferentes, a porção 5' do filamento transferido exibe um ou mais nucleótidos ou sequências adicionais ou um grupo ou fração química que compreende ou consiste numa ligação de afinidade (por exemplo, uma sequência marcadora) que permite captura por emparelhamento com uma sequência específica numa superfície, tal como uma esférula ou uma sonda num "microchip" ou série. Nalgumas formas de realização preferenciais, o tamanho da uma ou mais sequências adicionais na porção 5' do filamento transferido é minimizado com a finalidade de minimizar a probabilidade ou frequência de inserção do filamento transferido em si próprio durante a reação de transposase in vitro. Por exemplo, nalgumas formas de realização, o tamanho da porção 5' do filamento transferido é menor do que cerca de 150 nucleótidos, menor do que cerca de 100 nucleótidos, menor do que cerca de 75 nucleótidos, menor do que cerca de 50 nucleótidos, menor do que cerca de 25 nucleótidos ou menor do que cerca de 15 nucleótidos.
Nalgumas formas de realização, a extremidade 5' do filamento transferido tem um grupo 5'-monofosfato. Nalgumas formas de realização, tanto o filamento transferido como o filamento não transferido têm um grupo 5'-monofosfato. Nalgumas formas de realização preferenciais, apenas a extremidade 5' do filamento não transferido tem um grupo 5'-monofosfato. Nalgumas formas de realização diferentes, não há nenhum grupo 5'-monofosfato na extremidade 5' do filamento transferido. É pretendido que o termo "transposase" relativamente à presente invenção signifique uma enzima capaz de formar um complexo funcional com uma extremidade de transposão ou sequências de extremidade de transposão necessárias numa reação de transposição. Uma transposase da invenção também inclui integrases de retrotransposões e retrovirus.
Uma "reação de transposição" é uma reação em que uma ou mais extremidades de transposão são inseridas num DNA-alvo em sítios aleatórios ou sítios quase aleatórios. Componentes essenciais numa reação de transposição são uma transposase e oligonucleótidos de DNA que exibem as sequências de nucleótidos da extremidade de transposão, incluindo a sequência de extremidade de transposão transferida e o seu complemento, a sequência de extremidade de transposão não transferida, bem como outros componentes necessários para formar um complexo de transposição funcional. 0 método desta invenção é exemplificado por utilização de um complexo de transposição formado por uma transposase Tn5 hiperativa e uma extremidade de transposão do tipo Tn5 (Goryshin, I. e Reznikoff, W.S., J. Biol. Chem., 273: 7367, 1998) ou por uma transposase MuA e uma extremidade de transposão Mu compreendendo sequências de extremidade Rl e R2 (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et ai., EMBO J. , 14: 4893, 1995). No entanto, qualquer sistema de transposição que seja capaz de inserir uma extremidade de transposão de um modo aleatório ou quase aleatório com eficiência suficiente para fazer uma marcação 5' e fragmentar um DNA-alvo para a sua finalidade pretendida pode ser utilizado na presente invenção. Exemplos de sistemas de transposição conhecidos na área que podem ser avaliados para os presentes métodos incluem mas não estão limitados a Tn552 de
Staphylococcus aureus (Colégio OR et al., J Bacteriol., 183: 2384-8, 2001; Kirby C et al. , Mol Microbiol., 43: 173-86, 2002), Tyl (Devine SE, e Boeke JD., Nucleic Acids Res., 22: 3765-72, 1994 e Pedido de Patente Internacional No. WO 95/23875), Transposão Tn7 (Craig, NL, Science. 271: 1512, 1996; Craig, NL, Revisto em: Curr Top Microbiol Immunol., 204: 27-48, 1996), TnlO e IS10 (Kleckner N, et al., Curr Top Microbiol Immunol., 204: 49-82, 1996), transposase Mariner (Lampe DJ, et al., EMBO J., 15: 5470-9, 1996), Tel (Plasterk RH, Curr Top Microbiol Immunol, 204: 125-43, 1996), Elemento P (Gloor, GB, Methods Mol Biol., 260: 97-114, 2004), Tnd (Ichikawa H, e Ohtsubo E., J Biol Chem. 265: 18829-32, 1990), sequências de inserção bacterianas (Ohtsubo, F e Sekina, Y, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), retrovirus (Brown PO, et al. , Proc Natl Acad Sci USA, 86: 2525-9, 1989), e retrotransposão de levedura (Boeke JD e Corces VG, Annu Rev Microbiol. 43: 403-34, 1989). O método de inserção de uma extremidade de transposão numa sequência-alvo pode ser realizado in vitro utilizando qualquer sistema de transposão adequado para o qual um sistema de transposição in vitro adequado está disponível ou pode ser desenvolvido com base no conhecimento na área. Em geral, um sistema de transposição in vitro adequado para utilização nos métodos da presente invenção requer, no mínimo, uma enzima transposase de suficiente pureza, suficiente concentração e suficiente atividade de transposição in vitro e uma extremidade de transposão com a qual a transposase forma um complexo funcional com a transposase respetiva que é capaz de catalisar a reação de transposição. Sequências de extremidade de transposão de transposase adequadas que podem ser utilizadas na invenção incluem mas não estão limitadas a sequências de extremidade de transposão de tipo selvagem, derivadas ou mutantes que formam um complexo com uma transposase escolhida de entre uma forma de tipo selvagem, derivada ou mutante da transposase. Transposases exemplificativas que foram utilizadas com êxito pelos Requerentes nos métodos da presente invenção incluem formas de tipo selvagem ou mutantes da transposase Tn5 e transposase MuA (apesar de a transposase EZ-Tn5 ter sido significativamente mais eficiente do que uma quantidade de proteína equivalente de transposase MuA na geração de fragmentos de DNA com marcação 5' nos métodos da presente invenção), mas qualquer outra transposase para a qual são conhecidas ou subsequentemente desenvolvidas composições e condições para transposição in vitro eficiente de extremidades de transposão definidas pode ser utilizada nos presentes métodos. Sequências de extremidade de transposão reconhecidas por formas de tipo selvagem ou mutantes de transposase Tn5 ou transposase MuA são preferenciais, e aquelas sequências de extremidade de transposão que originam as eficiências mais elevadas de transposição quando complexadas com a transposase, juntamente com as enzimas transposase correspondentes otimamente ativas que complexam com aquelas, são muito preferenciais para formas de realização da presente invenção. Preferencialmente, é escolhido um transposão em que a sequência de extremidade de transposase requerida pela transposase para transposição não seja demasiado grande e as sequências de extremidade de transposão tenham o tamanho mínimo possível que funcione bem para a finalidade pretendida e que tenham um tamanho suficiente para que a mesma sequência esteja presente apenas raramente ou, preferencialmente, não esteja presente de todo, no DNA-alvo ou DNA de amostra. A título exemplificativo, as sequências de extremidade de transposão das sequências de extremidade de transposão derivadas de Tn5 EZ-Tn5™ compreendem apenas 19 nucleótidos, ao passo que algumas transposases diferentes requerem sequências de extremidade muito maiores para transposição (por exemplo, transposase MuA requereu sequências de extremidade de transposão de aproximadamente 51 nucleótidos).
Sistemas de transposição in vitro adequados que podem ser utilizados para inserir uma extremidade de transposão num ácido nucleico-alvo incluem mas não estão limitados àqueles que empregam a Transposase Tn5 hiperativa EZ-Tn5™ disponibilizada pela EPICENTRE Technologies, Madison, WI, ou a Transposase MuA Hiperativa HyperMu™ da EPICENTRE ou outra Transposase MuA, como as disponibilizadas pela Finnzymes Oy, Espoo, Finlândia. Oligonucleótidos de extremidade de transposão que exibem as sequências das extremidades de transposão respetivas podem ser sintetizados utilizando um sintetizador de oligonucleótidos ou adquiridos de uma fonte comercial com base nas informações disponibilizadas pelos respetivos vendedores ou utilizando informações bem conhecidas na área. Por exemplo, as sequências de nucleótidos da extremidade em mosaico de transposão hiperativa para a transposase EZ-Tn5™ são apresentadas no Exemplo 1 e informações adicionais relacionadas com a transposase EZ-Tn5™ são disponibilizadas na literatura publicada e "online" em www.EpiBio.com. da EPICENTRE Biotechnologies, Madison, WI, EUA.
Nalgumas formas de realização, a inserção de uma extremidade de transposão em DNA-alvo de acordo com a presente invenção também pode ser efetuada in vivo. Se a transposição for realizada in vivo, a transposição para o DNA-alvo é preferencialmente obtida por eletroporação de um complexo sináptico de uma transposase e uma composição de extremidade de transposão adequada na célula hospedeira, como descrito na Patente U.S. No. 6,159,736. Este método de transposição é exemplificado empregando um complexo de transposição formado por uma transposase Tn5 hiperativa e uma composição de extremidade de transposão do tipo Tn5 adequada utilizando métodos semelhantes aos descritos por (Goryshin, I. e Reznikoff, W.S. (J. Biol. Chem. , 273: 7367, 1998) ou um complexo de transposição formado por Transposase MuA Hiperativa HyperMu™ (EPICENTRE, Madison, WI) e uma composição de extremidade de transposão MuA adequada que exibe as sequências de extremidade Rl e R2 reconhecidas pela transposase. Complexos sinápticos ou complexos "Transposome™" (EPICENTRE) adequados entre uma composição de extremidade de transposão e uma transposase podem ser preparados como descrito na Patente U.S. No. 6,159,736 e patentes relacionadas de Goryshin e Reznikoff, ou como descrito na literatura do produto para complexos Transposome™ do tipo Tn5 EZ-Tn5™ ou para complexos Transposome™ MuA HyperMu™ da EPICENTRE Technologies, Madison, WI, com a exceção de serem utilizados oligonucleótidos que exibem apenas uma extremidade de transposão em vez de um polinucleótido ou oligonucleótido que tem duas extremidades de transposão, habitualmente em cada extremidade ou próximo de cada extremidade do respetivo polinucleótido ou oligonucleótido. A invenção também compreende estojos e composições individuais para qualquer um dos métodos da invenção . Um estojo é uma combinação de composições individuais úteis para implementar um método da invenção , em que as composições são otimizadas para utilização conjunta no método. Uma composição compreende um componente individual ou uma combinação de componentes para pelo menos um passo de um método da invenção. A invenção compreende qualquer estojo que possa ser montado a partir de uma combinação de quaisquer duas composições da invenção e qualquer composição nova que seja utilizada num estojo ou método da invenção. Alternativamente, um estojo pode ser montado a partir de um único componente ou composição num formato de utilização conveniente, por exemplo, formação prévia de alíquotas numa porção de utilização única, e pode opcionalmente incluir um conjunto de instruções para utilização do componente ou composição.
DESCRIÇÃO DA INVENÇÃO
Introdução A presente invenção refere-se a métodos e composições para o tratamento de ácidos nucleicos e, em particular, métodos e composições para fragmentação e marcação de DNA utilizando composições de transposão. Os métodos, composições e estojos da presente invenção são úteis para gerar bibliotecas de fragmentos de ssDNA lineares duplamente marcados ou fragmentos de ssDNA circulares marcados (e respetivos produtos de amplificação) a partir de DNA-alvo compreendendo qualquer dsDNA de interesse (incluindo cDNA de filamentação dupla preparado a partir de RNA) de qualquer fonte para análise genómica, subgenómica, transcriptómica ou metagenómica ou análise de expressão de RNA (por exemplo, para utilização na preparação de um alvo etiquetado para análise de microsséries; por exemplo, para análise de variação do número de cópias, para deteção e análise de polimorfismos de um único nucleótido e para encontrar genes de amostras ambientais, tais como fontes de solo ou água).
Os métodos são úteis numa variedade de processos, incluindo mas não se limitando a processos para amplificação do genoma completo de um ou mais organismos, incluindo um ou mais organismos microbianos ou ambientais para os quais são desconhecidas condições de cultura ou crescimento (por exemplo, amplificação do genoma completo ou WGA), PCR em tempo real, PCR de emulsão, hibridização genómica comparativa (CGH), sequenciação genómica comparativa (CGS), e para a preparação de sondas especificas para DNA (por exemplo, sondas especificas para cromossomas, por exemplo, pinturas cromossómicas, ou, por exemplo, sondas especificas para genes ou loci) para aplicações tais como hibridização in situ fluorescente (FISH). Nalgumas formas de realização. Nalgumas formas de realização, os métodos também são utilizados para gerar modelos para sequenciação de DNA massivamente paralela (denominada "sequenciação de geração seguinte"). Cada um destes processos ou aplicações pode ser utilizado para fins de investigação e diagnóstico molecular. A presente invenção proporciona métodos, composições e estojos para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo compreendendo DNA de filamentação dupla (dsDNA) contido em qualquer amostra de interesse. Os métodos são mais fáceis, mais rápidos, requerem menos tempo de manipulação, podem ser realizados com amostras mais pequenas e quantidades menores de ácidos nucleicos de amostra, são mais eficientes na marcação de ambas as extremidades dos fragmentos e geram fragmentos de DNA duplamente marcados que são qualitativa e/ou quantitativamente representativos dos ácidos nucleicos de amostra de onde são gerados. Os métodos podem ser facilmente implementados manualmente sem um instrumento, mas também são facilmente adaptados a automatização robótica num ambiente de alta produção.
Formas de realização de Métodos
Todas as formas de realização dos métodos da presente invenção reveladas no presente documento empregam uma reação de transposição in vitro para simultaneamente quebrar um DNA-alvo em fragmentos e unir um marcador à extremidade 5' de cada fragmento. Uma vez que todos os métodos estão relacionados, a menos que especificamente afirmado em contrário relativamente a uma forma de realização particular, um método que seja apresentado no presente documento relativamente a uma forma de realização também pode ser utilizado com outra forma de realização descrita no presente documento. Todas as formas de realização dos métodos revelados no presente documento que empregam uma reação de transposição in vitro podem ser realizadas implementando a reação utilizando composições separadas de transposase e extremidade de transposão ou uma única composição de transpossoma compreendendo um complexo estável formado entre a transposase e a composição de extremidade de transposão. Em consequência, será entendido que qualquer método que descreva a utilização de uma transposase e uma composição de extremidade de transposão também pode empregar uma composição de transpossoma preparada a partir da transposase e a composição de extremidade de transposão, e qualquer método que descreva a utilização de uma composição de transpossoma também pode empregar a transposase separada e uma composição de extremidade de transposão de que é composta a composição de transpossoma. Isto é ilustrado pelas seguintes duas descrições de um método geral da invenção.
Uma forma de realização da invenção consiste num método para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo compreendendo qualquer dsDNA de interesse (por exemplo, para utilização como modelos de sequenciação de geração seguinte ou amplificação), em que o método compreende: incubar o DNA-alvo numa reação de transposição in vitro com pelo menos uma transposase e uma composição de extremidade de transposão com a qual a transposase forma um complexo de transposição, em que a composição de extremidade de transposão compreende (i) um filamento transferido que exibe uma sequência de extremidade de transposão transferida e, opcionalmente, uma sequência adicional a 5' da sequência de extremidade de transposão transferida e (ii) um filamento não transferido que exibe uma sequência que é complementar à sequência de extremidade de transposão transferida, em condições e durante um período de tempo suficiente em que ocorrem múltiplas inserções no DNA-alvo, cada uma das quais origina união de um primeiro marcador compreendendo ou consistindo no filamento transferido à extremidade 5' de um nucleótido no DNA-alvo, desse modo fragmentando o DNA-alvo e gerando uma população de fragmentos de DNA com marcação 5' emparelhados, cada um dos quais tem o primeiro marcador na extremidade 5', e depois unir as extremidades 3' dos fragmentos de DNA com marcação 5' ao primeiro marcador ou a um segundo marcador, desse modo gerando uma biblioteca de fragmentos de DNA marcados (por exemplo, compreendendo fragmentos de ssDNA circulares marcados ou fragmentos de DNA com marcação 5' e 3' (ou "fragmentos de DNA duplamente marcados")).
Numa forma de realização preferencial, como descrito imediatamente acima, o método é realizado utilizando composições de transposase e extremidade de transposão separadas, ao passo que nalgumas formas de realização preferenciais diferentes, o método é realizado utilizando uma composição de transpossoma compreendendo o complexo formado entre a transposase e a composição de extremidade de transposão.
Assim, uma forma de realização preferencial da invenção consiste num método para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo numa reação de transposição in vitro compreendendo qualquer dsDNA de interesse (por exemplo, para utilização como modelos de sequenciação de geração seguinte ou amplificação), em que o método compreende: incubar o DNA-alvo com uma ou mais composições de transpossoma, cada compreendendo um complexo entre uma transposase e uma composição de extremidade de transposão com a qual a transposase forma um complexo de transposição, em que a composição de extremidade de transposão compreende (i) um filamento transferido que exibe uma sequência de extremidade de transposão transferida e, opcionalmente, uma sequência adicional a 5' da sequência de extremidade de transposão transferida e (ii) um filamento não transferido que exibe uma sequência que é complementar à sequência de extremidade de transposão transferida, em condições e durante um período de tempo suficiente em que ocorrem múltiplas inserções no DNA-alvo, cada uma das quais origina união de um primeiro marcador compreendendo ou consistindo no filamento transferido à extremidade 5' de um nucleótido no DNA-alvo, desse modo fragmentando o DNA-alvo e gerando uma população de fragmentos de DNA com marcação 5' emparelhados, cada um dos quais tem o primeiro marcador na extremidade 5', e depois unir as extremidades 3' dos fragmentos de DNA com marcação 5' ao primeiro marcador ou a um segundo marcador, desse modo gerando uma biblioteca de fragmentos de DNA marcados (por exemplo, compreendendo fragmentos de ssDNA circulares marcados ou fragmentos de DNA com marcação 5' e 3' (ou "fragmentos de DNA duplamente marcados")).
Nalgumas formas de realização de qualquer um dos métodos da invenção, a quantidade da transposase e da composição de extremidade de transposão ou da composição de transpossoma utilizadas na reação de transposição in vitro está situada entre cerca de 1 picomole e cerca de 25 picomoles por 50 nanogramas de DNA-alvo por reação de 50 microlitros. Nalgumas formas de realização preferenciais de qualquer um dos métodos da invenção, a quantidade da transposase e da composição de extremidade de transposão ou da composição de transpossoma utilizadas na reação de transposição in vitro está situada entre cerca de 5 picomoles e cerca de 50 picomoles por 50 nanogramas de DNA-alvo por reação de 50 microlitros. Nalgumas formas de realização preferenciais de qualquer um dos métodos da invenção em que a transposase é a transposase Tn5 hiperativa e a composição de extremidade de transposão compreende a composição de extremidade de transposão MEDS ou em que a composição de transpossoma compreende a referida transposase Tn5 hiperativa e uma composição de extremidade de transposão que compreende a extremidade de transposão MEDS, as quantidades da referida transposase e composição de extremidade de transposão ou da referida composição de transpossoma utilizadas na reação de transposição in vitro estão situadas entre cerca de 5 picomoles e cerca de 25 picomoles por 50 nanogramas de DNA-alvo por reação de 50 microlitros. Nalgumas formas de realização preferenciais de qualquer um dos métodos da invenção em que a transposase é uma transposase Tn5 ou transposase MuA hiperativa, as concentrações finais da transposase e da composição de extremidade de transposão ou da composição de transpossoma utilizadas na reação de transposição in vitro são pelo menos 250 nM; nalgumas formas de realização diferentes, as concentrações finais da transposase Tn5 ou transposase MuA hiperativa e da sua respetiva composição de extremidade de transposão ou composição de transpossoma são pelo menos 500 nM.
Nalgumas formas de realização de gualguer um dos métodos da invenção, o tempo reacional para a reação de transposição in vitro é duas horas ou menos, uma hora ou menos, 30 minutos ou menos, ou 15 minutos ou menos. Nalgumas formas de realização preferenciais de gualguer um dos métodos da invenção, o tempo reacional para a reação de transposição in vitro é 5 minutos ou menos. Nalgumas formas de realização preferenciais de gualguer um dos métodos da invenção em gue a composição de transpossoma compreende a transposase Tn5 hiperativa e uma composição de extremidade de transposão que compreende a extremidade de transposão MEDS, o tempo reacional para a reação de transposição in vitro é 5 minutos ou menos.
Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar de modo não seletivo os fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados ou fragmentos de ssDNA circulares marcados utilizando uma DNA polimerase termoestável e pelo menos um "primer" que é complementar ao primeiro marcador ou ao segundo marcador. Nalgumas formas de realização preferenciais do método em que apenas um transpossoma é utilizado na reação de transposição in vitro, o passo de amplificar os fragmentos de DNA marcados compreende amplificar os fragmentos de DNA duplamente marcados ou os fragmentos de ssDNA circulares marcados utilizando um único "primer" que exibe a sequência de pelo menos uma porção do filamento transferido. Nalgumas formas de realização, o passo de amplificar os fragmentos de DNA marcados utilizando um único "primer" compreende uma reação de PCR ou de replicação por circulo rolante. Nalgumas formas de realização, a porção 5' de um "primer" utilizado para a amplificação compreende ou consiste num domínio de marcador de sequenciação.
Nalguma forma de realização preferencial de qualquer um dos métodos da invenção, a biblioteca de fragmentos de DNA é utilizada para proporcionar modelos para sequenciação de DNA ou amplificação de ácidos nucleicos. A invenção compreende várias formas de realização para gerar uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados ou fragmentos de ssDNA circulares marcados, como discutido abaixo.
Utilização de uma DNA polimerase com Atividade de Deslocamento de Filamento ou Nuclease 5' que Gera Fragmentos de DNA Marcados Compreendendo Fragmentos de DNA Duplamente Marcados
Uma forma de realização preferencial do método compreende: incubar o DNA-alvo na reação de transposição in vitro com ο pelo menos um transpossoma em condições e durante um período de tempo suficiente para gerar uma população de fragmentos de DNA com marcação 5' emparelhados, e depois incubar a população de fragmentos de DNA com marcação 5' emparelhados com uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5' em condições sem aplicação de ciclos térmicos e em que os fragmentos de DNA com marcação 5' emparelhados não são desnaturados, em que a DNA polimerase estende a extremidade 3' de cada filamento dos fragmentos de DNA com marcação 5' emparelhados utilizando o filamento complementar como modelo e desloca ou digere o filamento não transferido, desse modo gerando a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de dsDNA duplamente marcados.
Uma forma de realização preferencial do método compreende: incubar o DNA-alvo na reação de transposição in vitro com ο pelo menos um transpossoma para gerar uma população de fragmentos de DNA com marcação 5' emparelhados; incubar a população de fragmentos de DNA com marcação 5' emparelhados com a DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5' para gerar fragmentos de dsDNA duplamente marcados, e desnaturar os fragmentos de dsDNA duplamente marcados para gerar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA duplamente marcados (por exemplo, por aquecimento para 95 graus C e arrefecimento rápido). Numa versão preferencial desta forma de realização do método, a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA duplamente marcados é gerada a partir do DNA-alvo num único tubo sem conduzir quaisquer passos de purificação intervenientes.
Nalgumas formas de realização do método que compreende gerar uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5', o método compreende adicionalmente o passo de amplificar os fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando uma DNA polimerase termoestável e pelo menos um "primer" que é complementar ao segundo marcador. Nalgumas formas de realização preferenciais deste método, o passo de amplificar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados compreende amplificar a biblioteca de fragmentos de DNA marcados por PCR utilizando apenas um oligodesoxirribonucleótido que exibe a sequência de pelo menos uma porção do filamento transferido como "primer" de PCR e os fragmentos de DNA duplamente marcados como modelos. Assim, esta forma de realização consiste num método para amplificação por PCR com "primer" único de uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados gerados a partir do DNA-alvo. Se o DNA-alvo compreender DNA genómico total de um organismo, esta forma de realização é um método de amplificação não seletiva do genoma completo.
Nalgumas formas de realização preferenciais em que uma única composição de extremidade de transposão é utilizada na reação de transposição in vitro do método que compreende gerar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5' e adicionalmente amplificar os fragmentos de DNA duplamente marcados gerados por PCR, utilizam-se dois "primers" de PCR diferentes, em que cada um desses "primers" de PCR exibe a sequência de pelo menos uma porção da extremidade de transposão transferida que compõe a composição de extremidade de transposão. Nalgumas formas de realização preferenciais, cada "primer" de PCR compreende uma porção 3' e uma porção 5', em que a porção 3' exibe a respetiva sequência de extremidade de transposão transferida e a porção 5' exibe a sequência de um domínio marcador respetivo para uma finalidade particular (por exemplo, um domínio de marcador de sequenciação ou um domínio de marcador de amplificação e, opcionalmente, um domínio de marcador de endereço para sequenciação de geração seguinte ou amplificação).
Nalgumas formas de realização preferenciais de qualquer um dos métodos que compreendem gerar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5', o pelo menos um transpossoma na reação de transposição in vitro compreende ou consiste em dois transpossomas diferentes. Nalgumas formas de realização preferenciais em que são utilizados dois transpossomas diferentes, cada um dos dois transpossomas compreende a mesma transposase mas uma composição de extremidade de transposão diferente. Nalgumas formas de realização preferenciais em que são utilizados dois transpossomas diferentes, cada um dos dois transpossomas diferentes compreende a mesma transposase e as composições de extremidade de transposão compreendem diferentes filamentos transferidos. Nalgumas formas de realização preferenciais em que são utilizados dois transpossomas diferentes, cada um dos dois transpossomas compreende diferentes enzimas transposase e diferentes composições de extremidade de transposão, em que cada uma forma um complexo funcional com a transposase respetiva. Nalgumas formas de realização preferenciais do método em que duas composições de extremidade de transposão diferentes são utilizadas na reação de transposição in vitro e em que a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA duplamente marcados é gerada utilizando uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5', o primeiro marcador exibe a sequência do filamento transferido de uma composição de extremidade de transposão e o segundo marcador exibe a sequência do filamento não transferido da outra composição de extremidade de transposão.
Nalgumas formas de realização preferenciais do método que compreende gerar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando uma DNA polimerase que tem atividade de deslocamento de filamento ou nuclease 5', em que duas composições de extremidade de transposão diferentes são utilizadas na reação de transposição in vitro e o método compreende adicionalmente o passo de amplificar os fragmentos de DNA duplamente marcados gerados por PCR, utilizam-se dois "primers" de PCR diferentes, em que um dos "primers" de PCR exibe a sequência de pelo menos uma porção do filamento transferido que compõe uma composição de extremidade de transposão e o outro "primer" de PCR exibe a sequência de pelo menos uma porção do filamento transferido que compõe a outra composição de extremidade de transposão. Nalgumas formas de realização preferenciais, em que o filamento transferido que compõe cada composição de extremidade de transposão respetiva compreende uma porção 3' e uma porção 5' , em que a porção 3' exibe a respetiva sequência de extremidade de transposão transferida e a porção 5' de cada filamento transferido respetivo exibe uma sequência diferente compreendendo um domínio marcador para uma finalidade particular (por exemplo, um domínio de marcador de sequenciação ou um domínio de marcador de amplificação e, opcionalmente, um domínio de marcador de endereço para sequenciação de geração seguinte ou amplificação), cada "primer" de PCR exibe a sequência do domínio marcador do respetivo oligonucleótido de transposão transferido.
Utilização de Transferase Terminal para Gerar Fragmentos de DNA Marcados Compreendendo Fragmentos de DNA Duplamente Marcados
Outra forma de realização do método compreende: incubar o DNA-alvo na reação de transposição in vitro com o pelo menos um transpossoma para gerar os fragmentos de dsDNA com marcação 5'; desnaturar os fragmentos de dsDNA com marcação 5' para gerar fragmentos de ssDNA com marcação 5', e incubar os fragmentos de ssDNA com marcação 5' com uma DNA polimerase que consiste numa transferase terminal e pelo menos um substrato de dNTP para a transferase terminal em condições e durante um período de tempo suficiente em que a transferase terminal une o segundo marcador consistindo no poli(dNMP) à extremidade 3' dos fragmentos de DNA com marcação 5', desse modo gerando uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados (por exemplo, FIG. 3) . Nalgumas formas de realização deste método, a extremidade 3' do oligonucleótido de extremidade de transposão não transferida que compõe a composição de extremidade de transposão do transpossoma é bloqueada (por exemplo, por utilização de um oligonucleótido de extremidade de transposão não transferida que tem um didesoxinucleótido ou um 3'-O-metil-nucleótido como nucleótido 3'-terminal), cujo nucleótido 3' bloqueado previne a adição do poli(dNMP) pela transferase terminal, desse modo prevenindo marcação de fundo do oligonucleótido de extremidade de transposão não transferida.
Ainda outra forma de realização do método compreende: incubar o DNA-alvo na reação de transposição in vitro com o pelo menos um transpossoma para gerar os fragmentos de DNA com marcação 5'; incubar os fragmentos de DNA com marcação 5', sem um passo de desnaturação prévio, com uma DNA polimerase que consiste numa transferase terminal e pelo menos um substrato de dNTP para a transferase terminal em condições e durante um período de tempo suficiente em que a transferase terminal une o segundo marcador consistindo no poli(dNMP) à extremidade 3' dos fragmentos de DNA com marcação 5', desse modo gerando uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados. Nalgumas formas de realização deste método, a extremidade 3' do oligonucleótido de extremidade de transposão não transferida que compõe a composição de extremidade de transposão do transpossoma é bloqueada (por exemplo, por utilização de um oligonucleótido de extremidade de transposão não transferida que tem um didesoxinucleótido ou um 3'-O-metil-nucleótido como nucleótido 3'-terminal).
Utilização de uma DNA Polimerase e um Oligonucleótido de Marcação Terminal para Gerar Fragmentos de DNA Marcados Compreendendo Fragmentos de DNA Duplamente Marcados
Ainda outra forma de realização do método compreende: incubar o DNA-alvo na reação de transposição in vitro com o pelo menos um transpossoma para gerar os fragmentos de dsDNA com marcação 5'; desnaturar os fragmentos de dsDNA com marcação 5' para gerar fragmentos de ssDNA com marcação 5' (por exemplo, por aquecimento para 95 graus C e arrefecimento rápido), e unir o segundo marcador aos fragmentos de ssDNA com marcação 5' utilizando uma DNA polimerase e um oligonucleótido de marcação terminal (por exemplo, FIG. 4), desse modo gerando uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados. Nalgumas formas de realização preferenciais, o passo de unir o segundo marcador à extremidade 3' dos fragmentos de DNA com marcação 5' utilizando uma DNA polimerase e um oligonucleótido de marcação terminal compreende: (1) Proporcionar um oligonucleótido de marcação terminal que compreende ou consiste numa porção 5' e porção 3', em que a porção 5' exibe uma sequência que é complementar à sequência do segundo marcador que é desejado unir aos terminais 3' dos fragmentos de ssDNA com marcação 5' e a porção 3' exibe uma sequência aleatória que compreende ou consiste em entre três e oito (por exemplo, 3, 4, 5, 6, 7 ou 8 nucleótidos aleatórios, dos quais o nucleótido 3'-terminal é bloqueado de modo que não pode ser estendido pela DNA polimerase; (2) contactar os fragmentos de ssDNA com marcação 5' com o oligonucleótido de marcação terminal em condições e durante um período de tempo suficiente em que o oligonucleótido de marcação terminal emparelha com os fragmentos de ssDNA com marcação 5', e (3) contactar os fragmentos de ssDNA com marcação 5' com os quais é emparelhado o oligonucleótido de marcação terminal com a DNA polimerase numa mistura reacional e em condições de polimerização de DNA e durante um período de tempo suficiente em que os terminais 3' dos fragmentos de ssDNA com marcação 5' são estendidos utilizando o oligonucleótido de marcação terminal como modelo, de modo que o segundo marcador é unido aos seus terminais 3' e são gerados fragmentos de ssDNA com marcação 5' e 3'. Nalgumas formas de realização, é utilizada uma sequência semialeatória em vez da sequência aleatória no oligonucleótido de marcação terminal.
Nalgumas variantes desta forma de realização, o oligonucleótido de marcação terminal compreende ou consiste em desoxirribonucleótidos. Nalgumas variantes desta forma de realização, o oligonucleótido de marcação terminal compreende ou consiste em ribonucleótidos, em cujas formas de realização a DNA polimerase é uma DNA polimerase dependente de RNA. Nalgumas formas de realização preferenciais, a porção 3' do oligonucleótido de marcação terminal consiste em sete nucleótidos aleatórios. Nalgumas formas de realização preferenciais do método em que um oligonucleótido de marcação terminal é utilizado para unir o segundo marcador aos fragmentos de ssDNA com marcação 5', o segundo marcador não é complementar ao primeiro marcador.
Utilização de uma Ligase Dependente do Modelo (ou Homóloga) e de um Oligonucleótido de Marcação de Ligação para Gerar Fragmentos de DNA Marcados Compreendendo Fragmentos de DNA Duplamente Marcados
Uma forma de realização preferencial do método compreende: incubar o DNA-alvo na reação de transposição in vitro com ο pelo menos um transpossoma em condições e durante um período de tempo suficiente para gerar uma população de fragmentos de DNA com marcação 5' emparelhados, e depois incubar a população de fragmentos de dsDNA com marcação 5' emparelhados com uma DNA ligase dependente do modelo (ou homóloga) e um oligodesoxinucleótido de marcação de ligação que compreende ou consiste numa porção 3' e uma porção 5', em que a porção 3' exibe um segundo marcador que exibe qualquer sequência que é desejado unir à extremidade 3' da população de fragmentos de DNA com marcação 5' emparelhados (por exemplo, uma sequência arbitrária) e a porção 5' tem um grupo 5'-monofosfato e exibe uma sequência aleatória, em condições e durante um período de tempo suficiente em que o segundo marcador é unido aos fragmentos de DNA com marcação 51 emparelhados, desse modo gerando uma biblioteca de fragmentos de DNA compreendendo fragmentos de DNA duplamente marcados emparelhados. Nalgumas formas de realização preferenciais, o método compreende adicionalmente o passo de desnaturar a biblioteca de fragmentos de DNA compreendendo fragmentos de DNA duplamente marcados emparelhados (por exemplo, por aquecimento para 95 graus C e arrefecimento rápido), desse modo gerando uma biblioteca de fragmentos de DNA compreendendo fragmentos de ssDNA duplamente marcados.
Nalgumas formas de realização preferenciais, o oligonucleótido de marcação de ligação compreende uma porção 5' que exibe uma sequência aleatória consistindo em cerca de três até cerca de oito nucleótidos. Nalgumas formas de realização preferenciais, o oligonucleótido de marcação de ligação compreende uma porção 5' que exibe uma sequência aleatória consistindo em quatro nucleótidos. Nalgumas formas de realização preferenciais, a ligase dependente do modelo é DNA ligase de E. coli. Numa versão preferencial desta forma de realização do método, a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA duplamente marcados é gerada a partir do DNA-alvo num único tubo sem conduzir quaisquer passos de purificação intervenientes.
Utilização de uma Composição de Extremidade de Transposão em Grampo e uma Ligase Dependente do Modelo para gerar uma Biblioteca de Fragmentos de DNA Marcados Compreendendo Fragmentos de DNA Circulares Marcados, Fragmentos de dsDNA de Cauda de Andorinha ou Fragmentos de DNA Duplamente Marcados
Numa forma de realização preferencial do método para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo numa reação de transposição in vitro, o método compreende: incubar o DNA-alvo com uma ou mais composições de transpossoma, em que cada uma compreende um complexo entre uma transposase e uma composição de extremidade de transposão em grampo com a qual a transposase forma um complexo de transposição, em que a composição de extremidade de transposão em grampo compreende ou consiste num oligonucleótido contendo 5'-fosfato que exibe uma sequência de extremidade de transposão não transferida na sua extremidade 5', uma sequência de extremidade de transposão transferida na sua extremidade 3' e uma sequência marcadora arbitrária interveniente entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida que é suficientemente longa para permitir a formação intramolecular de haste-alça; em condições e durante um período de tempo suficiente em que a inserção da composição de extremidade de transposão em grampo no DNA-alvo gera uma população de fragmentos de DNA com marcação 5' emparelhados; depois incubar a população de fragmentos de DNA com marcação 5' emparelhados com um ou mais oligonucleótidos de sequência aleatória contendo 5'-fosfato que, isoladamente ou em combinação, têm o mesmo comprimento dos hiatos de filamentação simples nos fragmentos de DNA com marcação 5' emparelhados resultantes após a reação de transposição in vitro, em condições e durante um período de tempo suficiente em que os hiatos de filamentação simples na população de fragmentos de DNA com marcação 5' emparelhados são preenchidos por emparelhamento dos oligonucleótidos de sequências aleatórias com o DNA-alvo nos hiatos de filamentação simples, e depois incubar a população de fragmentos de DNA com marcação 5' emparelhados com hiatos de filamentação simples preenchidos com uma ligase dependente do modelo em condições e durante um período de tempo suficiente em que os oligonucleótidos de sequências aleatórias emparelhados são ligados uns aos outros ou às extremidades 5' de fragmentos de DNA com marcação 5' adjacentes, desse modo gerando a biblioteca de fragmentos de DNA circulares marcados.
Noutras formas de realização preferenciais do método para gerar uma biblioteca de fragmentos de DNA marcados a partir de DNA-alvo numa reação de transposição in vitro, o método compreende: incubar o DNA-alvo com uma ou mais composições de transpossoma, em que cada uma compreende um complexo entre uma transposase e uma composição de extremidade de transposão em grampo com a qual a transposase forma um complexo de transposição, em que a composição de extremidade de transposão em grampo compreende ou consiste num oligonucleótido contendo 5'-fosfato que exibe uma sequência de extremidade de transposão não transferida na sua extremidade 5', uma sequência de extremidade de transposão transferida na sua extremidade 3' e uma sequência marcadora arbitrária interveniente entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida que é suficientemente longa para permitir a formação intramolecular de haste-alça; em condições e durante um período de tempo suficiente em que a inserção da composição de extremidade de transposão em grampo no DNA-alvo gera uma população de fragmentos de DNA com marcação 5' emparelhados; depois incubar a população de fragmentos de DNA com marcação 5' emparelhados com uma DNA polimerase que está desprovida de atividades de exonuclease 5' para 3' e nuclease 5' dependente da estrutura e de deslocamento de filamento, em condições e durante um período de tempo suficiente em que os hiatos de filamentação simples que estão presentes na população de fragmentos de DNA com marcação 5' emparelhados após a reação de transposição in vitro são preenchidos por extensão das extremidades 3' de cada fragmento de DNA com marcação 5' emparelhado pela DNA polimerase, e depois incubar a população de fragmentos de DNA com marcação 5' emparelhados com hiatos de filamentação simples preenchidos com uma ligase dependente do modelo em condições e durante um período de tempo suficiente em que as extremidades 3' dos produtos de extensão de DNA polimerase emparelhados são ligadas às extremidades 5' de fragmentos de DNA com marcação 5' emparelhados de modo adjacente, desse modo gerando a biblioteca de fragmentos de DNA circulares marcados.
Nalgumas formas de realização preferenciais deste método, a DNA polimerase e a ligase dependente do modelo são proporcionadas numa única mistura reacional e a extensão pela DNA polimerase e a ligação dependente do modelo são realizadas na mistura reacional única.
Nalgumas formas de realização de qualquer um destes métodos para gerar uma biblioteca de fragmentos de DNA circulares marcados, o método compreende adicionalmente, após o passo de incubação com a ligase dependente do modelo para gerar a biblioteca de fragmentos de DNA circulares marcados, um ou mais passos para remover ssDNA e dsDNA lineares não ligados (por exemplo, compreendendo os oligonucleótidos de sequências aleatórias, o DNA-alvo linear e/ou as composições de extremidade de transposão em grampo que não são unidas a DNA-alvo). Numa forma de realização preferencial para remover ssDNA e dsDNA lineares não ligados, o método compreende adicionalmente: tratar a mistura reacional contendo os fragmentos de DNA circulares marcados com exonuclease T5.
Nalgumas formas de realização preferenciais de qualquer um destes métodos para gerar uma biblioteca de fragmentos de DNA circulares marcados, o método compreende adicionalmente: clivar os fragmentos de DNA circulares marcados em cada uma das estruturas em alça derivadas das composições de extremidade de transposão em grampo para gerar fragmentos de dsDNA de cauda de andorinha, em que cada filamento tem uma porção do marcador na sua extremidade 5' e uma porção do marcador na sua extremidade 3'. Nalgumas formas de realização, o passo de clivagem dos fragmentos de DNA circulares marcados em cada uma das estruturas em alça compreende: contactar os fragmentos de DNA circulares marcados com uma composição de enzima de clivagem em condições e durante um período de tempo suficiente em que os fragmentos de DNA circulares marcados são clivados nos sítios aptos a serem clivados para gerar os fragmentos de dsDNA de cauda de andorinha. Nalgumas formas de realização, o passo de clivagem dos fragmentos de DNA circulares marcados em cada uma das estruturas em alça compreende: emparelhamento com os fragmentos de DNA circulares marcados de um oligodesoxirribonucleótido que emparelha com um sítio de restrição no marcador e depois incubação com a endonuclease de restrição que procede à clivagem no sítio de restrição de filamentação dupla em condições e durante um período de tempo suficiente para gerar a biblioteca dos fragmentos de dsDNA de cauda de andorinha. Nalgumas formas de realização preferenciais, o passo de clivar os fragmentos de DNA circulares marcados em cada uma das estruturas em alça compreende: contactar os fragmentos de DNA circulares marcados com uma DNA glicosilase e uma endonuclease AP, em que a DNA glicosilase remove a base de ácido nucleico de um nucleótido não canónico (por exemplo, um dUMP ou 8-oxo-dGMP) que está presente no marcador e a endonuclease AP procede à clivagem dos fragmentos de ssDNA circulares marcados no sitio abásico resultante; nalgumas formas de realização, a DNA glicosilase é selecionada de entre uracil-N-glicosilase e proteína FPG e a endonuclease AP é selecionada de entre endonuclease III ou endonuclease IV de E. coli.
Nalgumas formas de realização preferenciais de qualquer um dos métodos para gerar uma biblioteca de fragmentos de dsDNA de cauda de andorinha, o método compreende adicionalmente o passo de: desnaturar a biblioteca de fragmentos de dsDNA de cauda de andorinha para gerar uma biblioteca de fragmentos de ssDNA lineares duplamente marcados.
Utilização de uma Ligase Independente do Modelo para Gerar Fragmentos de DNA Marcados Compreendendo Fragmentos de ssDNA Circulares Marcados ou Fragmentos de ssDNA Lineares Duplamente Marcados
Uma forma de realização preferencial do método compreende: incubar o DNA-alvo na reação de transposição in vitro com ο pelo menos um transpossoma, em que a extremidade 5' do filamento transferido compreendendo o transpossoma tem um grupo 5'-fosfato, em condições e durante um período de tempo suficiente para gerar uma população de fragmentos de DNA com marcação 5' emparelhados; depois desnaturar os fragmentos de dsDNA com marcação 5' emparelhados para obter fragmentos de ssDNA com marcação 5' (por exemplo, por aquecimento para 95 graus C e arrefecimento rápido), e depois incubar os fragmentos de ssDNA com marcação 5' numa reação de ligação com uma ligase independente do modelo (ou não homóloga) em condições e durante um período de tempo suficiente em que os fragmentos de ssDNA com marcação 5' são ligados de modo intramolecular para gerar uma biblioteca de fragmentos de ssDNA circulares marcados, cada um dos quais exibe a sequência de uma porção do DNA-alvo e a sequência do marcador.
Numa versão preferencial desta forma de realização do método, a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA circulares marcados é gerada a partir do DNA-alvo num único tubo sem conduzir quaisquer passos de purificação intervenientes. Numa forma de realização preferencial, a ligase independente do modelo é selecionada de entre RNA ligase termoestável de bacteriófago TS2126 e uma RNA ligase de archaea (por exemplo, RNA ligase 1 de Methanobacterium thermoautotrophicum). Nalgumas formas de realização preferenciais, a ligase dependente do modelo é proporcionada numa forma adenilada e o passo de incubar os fragmentos de ssDNA com marcação 5' com a ligase independente do modelo é realizado sem adição de ATP ou NAD à reação de ligação.
Nalgumas formas de realização preferenciais, o método compreende adicionalmente: clivar os fragmentos de ssDNA circulares marcados num sítio no interior do marcador, desse modo gerando uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA lineares duplamente marcados. Nalgumas formas de realização, o passo de clivagem compreende emparelhamento de um oligodesoxirribonucleótido que é complementar a um sítio de restrição de filamentação simples no marcador dos fragmentos de ssDNA circulares marcados e depois clivar os fragmentos de ssDNA circulares marcados no sitio de restrição utilizando a endonuclease de restrição que reconhece o sitio de restrição. Nalgumas formas de realização diferentes, o passo de clivagem compreende contactar os fragmentos de ssDNA circulares marcados com uma DNA glicosilase e uma endonuclease, em que a DNA glicosilase remove a base de ácido nucleico de um nucleótido não canónico (por exemplo, um dUMP ou 8-oxo-dGMP) que está presente no marcador e a endonuclease procede à clivagem dos fragmentos de ssDNA circulares marcados no sitio abásico resultante; nalgumas formas de realização, a DNA glicosilase é selecionada de entre uracil-N-glicosilase e proteína FPG e a endonuclease AP é selecionada de entre endonuclease III ou endonuclease IV de E. coli.
Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de ssDNA circulares marcados ou fragmentos de ssDNA lineares duplamente marcados, desse modo gerando uma biblioteca amplificada de fragmentos de DNA marcados. Nalgumas formas de realização preferenciais, o passo de amplificação da biblioteca de fragmentos de DNA marcados compreende conduzir uma reação em cadeia de polimerase (PCR), desse modo gerando uma biblioteca amplificada de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados amplificados. Nalgumas formas de realização preferenciais, a reação de PCR é realizada utilizando um primeiro "primer" de PCR e um segundo "primer" de PCR, cada um tendo uma porção 3' e uma porção 5', em que a porção 3' do primeiro "primer" de PCR é complementar a uma sequência exibida pelo marcador nos fragmentos de DNA marcados e a porção 3' do segundo "primer" de PCR é complementar a uma sequência que é complementar ao marcador, e em que cada porção 5' compreende um domínio de marcador de sequenciação que compreende ou consiste num marcador de sequenciação apropriado que permite utilizar os fragmentos de DNA duplamente marcados amplificados gerados como modelos para sequenciação de geração seguinte utilizando uma plataforma particular de sequenciação de geração seguinte (por exemplo, os marcadores de sequenciação Roche 454A e 454B, os marcadores de sequenciação ILLUMINA™ SOLEXA™, os marcadores de sequenciação SOLID™ da Applied Biosystems, os marcadores de sequenciação SMRT™ da Pacific Biosciences, os marcadores de sequenciação Pollonator Polony ou os marcadores de sequenciação Complete Genomics). Métodos de Geração de Bibliotecas de Fragmentos de DNA com Representação Melhorada de Sequências nas Extremidades do DNA-Alvo
Os inventores observaram certos dados de sequências que indicaram que a representação de dados de sequências de geração seguinte das extremidades de DNA-alvo compreendendo moléculas de dsDNA com um tamanho menor do que 10 Kb era baixa em comparação com a representação de dados de sequências do meio desse DNA-alvo. Sem ficar restringido pela teoria, uma explicação possível para esta observação é que a probabilidade de encontrar fragmentos de DNA com duas composições de extremidade de transposão inseridas em orientações opostas nas extremidades de uma molécula de dsDNA linear é menor do que a probabilidade de encontrar fragmentos de DNA com duas composições de extremidade de transposão inseridas em orientações opostas no meio da molécula de dsDNA linear. Para resolver este problema, os inventores desenvolveram métodos adicionais para gerar uma biblioteca de fragmentos de DNA na qual há uma melhor representação de fragmentos de DNA que exibem as sequências nas extremidades das moléculas de dsDNA que compõem o DNA-alvo.
Uma forma de realização preferencial consiste num método para gerar uma biblioteca de fragmentos de DNA em que há uma melhor representação de fragmentos de DNA que exibem as sequências nas extremidades das moléculas de dsDNA que compõem o DNA-alvo, em que o método compreende: incubar o DNA-alvo com pelo menos uma composição de transpossoma compreendendo pelo menos uma transposase e pelo menos uma composição de extremidade de transposão com a qual forma um complexo de transposição, em que a composição de extremidade de transposão compreende um filamento transferido e um não filamento transferido, numa reação de transposição in vitro em condições e durante um período de tempo suficiente em que o filamento transferido é unido ao DNA-alvo, gerando fragmentos de dsDNA com marcação 5 ' compreendendo fragmentos de ssDNA com marcação 5' emparelhados, em que cada um tem um primeiro marcador compreendendo ou consistindo no filamento transferido na extremidade 5'; desnaturar os fragmentos de dsDNA com marcação 5' para libertar os fragmentos de ssDNA com marcação 5', e depois circularizar os fragmentos de ssDNA com marcação 5' por ligação intramolecular com uma ligase independente do modelo que liga ssDNA (por exemplo, RNA ligase de bacteriófago TS2126; por exemplo, ssDNA ligase termoestável CIRCLIGASE™, EPICENTRE, Madison, WI, EUA), desse modo gerando a biblioteca de fragmentos de ssDNA circulares marcados. Nalgumas formas de realização, a pelo menos uma transposase e a pelo menos uma composição de extremidade de transposão são adicionadas à reação como componentes separados em vez do componente único compreendendo a composição de transpossoma. Nalgumas formas de realização, os fragmentos de ssDNA circulares marcados são utilizados como modelos de sequenciação de geração seguinte ou, após etiquetagem, como alvo para emparelhamento com sondas numa série ou microssérie, ou para outras aplicações descritas noutro local do presente documento. Nalgumas formas de realização diferentes, o método compreende adicionalmente o passo de linearizar os fragmentos de ssDNA circulares marcados no primeiro marcador, desse modo gerando fragmentos de ssDNA lineares duplamente marcados. Nalgumas de quaisquer destas formas de realização que compreendem linearizar os fragmentos de ssDNA circulares marcados, o primeiro marcador compreende múltiplos domínios marcadores, em que o passo de linearização do primeiro marcador resulta numa porção do primeiro marcador na extremidade 5' e noutra porção do primeiro marcador na extremidade 3'. Por exemplo, nalgumas formas de realização, o filamento transferido da composição de extremidade de transposão transferida exibe o primeiro marcador que compreende múltiplos domínios marcadores (por exemplo, os dois domínios marcadores de sequenciação Roche 454A e Roche 454B) dos quais pelo menos um domínio marcador é unido à extremidade 3' dos fragmentos de ssDNA duplamente marcados gerados a partir do passo de linearização dos fragmentos de ssDNA circulares marcados. Por exemplo, nalgumas formas de realização, os fragmentos de DNA com marcação 5' são gerados utilizando uma composição de extremidade de transposão compreendendo um filamento transferido que contém um ou mais nucleótidos que permitem clivagem nos sítios dos referidos nucleótidos, e o passo de linearização dos fragmentos de ssDNA circulares marcados no marcador compreende clivagem dos fragmentos de ssDNA circulares marcados no referido um ou mais nucleótidos. Por exemplo, nalgumas formas de realização, o filamento transferido contém um ou mais nucleótidos desoxiuridina ou um ou mais nucleótidos 8-oxoguanina (por exemplo, sintetizados utilizando um sintetizador de oligonucleótidos) e o passo de linearização dos fragmentos de ssDNA circulares marcados no marcador compreende clivagem dos fragmentos de ssDNA circulares marcados por incubação dos fragmentos de ssDNA circulares marcados com uracil-DNA glicosilase ou formamidopirimidina-DNA glicosilase, respetivamente, e uma endonuclease que procede à clivagem de DNA num sítio abásico (por exemplo, endonuclease IV) . Por exemplo, nalgumas formas de realização diferentes, os fragmentos de ssDNA circulares marcados são linearizados no marcador por emparelhamento de um oligonucleótido complementar com o marcador e linearização utilizando uma endonuclease de restrição que reconhece um sítio de restrição no marcador de filamentação dupla. Nalgumas de quaisquer das formas de realização que compreendem linearizar os fragmentos de ssDNA circulares marcados, o método compreende adicionalmente purificar os fragmentos de ssDNA duplamente marcados (por exemplo, utilizando uma coluna de limpeza de PCR Qiagen); nalgumas destas formas de realização, os fragmentos de ssDNA duplamente marcados são utilizados como modelos de sequenciação de geração seguinte ou, após etiquetagem, como alvo para emparelhamento com sondas numa série ou microssérie, ou para outras aplicações descritas noutro local do presente documento.
Amplificação de Fragmentos de DNA Marcados e Outras Formas de Realização
Nalgumas formas de realização de qualquer um dos métodos da invenção para gerar a biblioteca de fragmentos de DNA marcados, o método compreende adicionalmente: amplificar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados, fragmentos de ssDNA circulares marcados ou fragmentos de DNA de cauda de andorinha.
Nalgumas formas de realização de qualquer um dos métodos, o método compreende adicionalmente passo de: amplificar a biblioteca de ssDNA linear duplamente marcado, os fragmentos de DNA circulares marcados ou os fragmentos de dsDNA de cauda de andorinha utilizando uma reação em cadeia de polimerase (PCR). Assim, nalgumas formas de realização, o método compreende adicionalmente (a) proporcionar (i) primeiro e segundo "primers" de PCR, em que pelo menos a extremidade 3' do primeiro "primer" de PCR é complementar a pelo menos uma porção da sequência marcadora dos fragmentos de DNA circulares marcados ou a pelo menos uma porção da sequência marcadora que é unida à extremidade 3' dos fragmentos de dsDNA de cauda de andorinha ou a pelo menos uma porção da sequência marcadora que é unida à extremidade 3' dos fragmentos de ssDNA lineares, e em que pelo menos a extremidade 3' do segundo "primer" de PCR é complementar a pelo menos uma porção do complemento da sequência marcadora dos fragmentos de DNA circulares marcados (isto é, em que pelo menos a extremidade 3' do segundo "primer" de PCR exibe uma sequência que é idêntica a pelo menos uma porção da sequência marcadora), ou em que pelo menos a extremidade 3' do segundo "primer" de PCR é complementar a pelo menos uma porção do complemento da sequência marcadora que é unida à extremidade 5' dos fragmentos de dsDNA de cauda de andorinha ou dos fragmentos de ssDNA lineares duplamente marcados (isto é, em que pelo menos a extremidade 3' do segundo "primer" de PCR exibe uma sequência que é idêntica a pelo menos uma porção da sequência marcadora que é unida à extremidade 5' dos fragmentos de dsDNA de cauda de andorinha ou dos fragmentos de ssDNA lineares duplamente marcados) e (ii) uma DNA polimerase termoestável que pode ser utilizada para PCR, e (b) incubar os fragmentos de DNA circulares marcados ou os fragmentos de dsDNA de cauda de andorinha ou os fragmentos de ssDNA lineares duplamente marcados com o respetivo primeiro e segundo "primers" de PCR e a DNA polimerase termoestável em condições de amplificação por PCR e durante um período de tempo suficiente em que são gerados fragmentos de dsDNA lineares duplamente marcados amplificados.
Nalgumas formas de realização em que o método compreende amplificar os fragmentos de DNA circulares marcados utilizando PCR, o primeiro "primer" de PCR é complementar a uma sequência marcadora em pelo menos uma porção da estrutura em alça da composição de extremidade de transposão em grampo que é inserida no DNA-alvo dos fragmentos de DNA circulares marcados e/ou o segundo "primer" de PCR exibe uma sequência que é idêntica a pelo menos uma porção da estrutura em alça da composição de extremidade de transposão em grampo que é inserida no DNA-alvo dos fragmentos de DNA circulares marcados. Nalgumas formas de realização, o primeiro "primer" de PCR é complementar a pelo menos uma porção da sequência de extremidade de transposão transferida ou da sequência de extremidade de transposão não transferida e o segundo "primer" de PCR é idêntico a pelo menos uma porção da sequência de extremidade de transposão transferida ou da sequência de extremidade de transposão não transferida.
Nalgumas formas de realização, a porção 5' do primeiro "primer" de PCR ou a porção 5' do segundo "primer" de PCR ou as porções 5' do primeiro e do segundo "primers" de PCR compreendem ou consistem em primeiro ou segundo marcadores de sequenciação, respetivamente, para a geração de modelos para sequenciação de geração seguinte para uma plataforma de sequenciação particular (por exemplo, marcadores de sequenciação para: uma plataforma de sequenciação ROCHE 454A ou 454B; para uma plataforma de sequenciação ILLUMINA SOLEXA; para uma plataforma de sequenciação SOLID™ da APPLIED BIOSYSTEMS; para uma plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES; para uma plataforma de sequenciação POLLONATOR POLONY; para uma plataforma de sequenciação HELICOS; para uma plataforma de sequenciação COMPLETE GENOMICS; para uma plataforma de sequenciação INTELLIGENT BIOSYSTEMS, ou para qualquer outra plataforma de sequenciação). Nalgumas formas de realização, a porção 5' do primeiro "primer" de PCR ou a porção 5' do segundo "primer" de PCR compreende ou consiste adicionalmente num domínio de marcador de endereço ou outro domínio marcador para uma finalidade particular. Noutras formas de realização, o marcador dos fragmentos de DNA circulares marcados compreende um marcador de sequenciação para sequenciação de geração seguinte utilizando uma plataforma particular.
Em formas de realização do método em que uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados é gerada utilizando uma DNA polimerase que tem atividade de nuclease 5' ou deslocamento de filamento, o passo de amplificar a biblioteca compreende utilizar apenas um único "primer" oligodesoxirribonucleotídico que é complementar ao segundo marcador para amplificar a biblioteca de fragmentos de DNA marcados por PCR. Nalgumas formas de realização, o "primer" único utilizado para PCR exibe pelo menos uma porção da sequência de extremidade de transposão transferida. Nalgumas formas de realização diferentes, o "primer" único utilizado para PCR exibe pelo menos uma porção da sequência da porção 5' do oligonucleótido de extremidade de transposão transferida. Nalgumas formas de realização preferenciais diferentes, o passo de amplificar a biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados utilizando um único "primer" oligonucleotídico compreende: proporcionar um único "primer" oligonucleotídico que é complementar ao segundo marcador na extremidade 3' dos fragmentos de DNA marcados e uma DNA polimerase termoestável que é adequada para PCR, e incubar a biblioteca de fragmentos de DNA marcados com o "primer" oligonucleotídico e a DNA polimerase termoestável em condições de amplificação por PCR durante um período de tempo suficiente em que a biblioteca de fragmentos de DNA marcados é amplificada por PCR, gerando uma biblioteca de fragmentos de DNA marcados amplificados.
Nalgumas formas de realização diferentes em que uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados não é gerada utilizando uma DNA polimerase que tem atividade de nuclease 5' ou deslocamento de filamento, o passo de amplificar a biblioteca compreende conduzir uma reação em cadeia de polimerase (PCR), em que o método compreende adicionalmente: (1) proporcionar (a) primeiro e segundo "primers" de PCR, em que pelo menos a extremidade 3' do primeiro "primer" de PCR é complementar a pelo menos uma porção do primeiro marcador na extremidade 3' dos fragmentos de DNA duplamente marcados ou dos fragmentos de DNA de cauda de andorinha ou a pelo menos uma porção do marcador nos fragmentos de ssDNA circulares marcados e pelo menos a extremidade 3' do segundo "primer" de PCR é complementar a pelo menos uma porção do complemento do segundo marcador dos fragmentos de DNA duplamente marcados ou dos fragmentos de DNA de cauda de andorinha ou a pelo menos uma porção do complemento do marcador nos fragmentos de ssDNA circulares marcados e (b) uma DNA polimerase termoestável que é adequada para PCR, e (2) incubar a biblioteca de fragmentos de DNA marcados com os "primers" de PCR e a DNA polimerase termoestável em condições de amplificação por PCR e durante um período de tempo suficiente em que a biblioteca de fragmentos de DNA marcados é amplificada para gerar uma biblioteca de fragmentos de DNA marcados amplificados. Nalgumas formas de realização, o primeiro ou o segundo "primer" de PCR compreende uma porção 5' e uma porção 3', em que a porção 5' não é complementar à sequência no respetivo marcador ou seu complemento nos fragmentos de DNA marcados e a porção 3' é complementar à sequência do respetivo marcador ou seu complemento. Nalgumas formas de realização, a porção 5' do primeiro e segundo "primers" de PCR compreendem ou consistem no primeiro e segundo marcadores de sequenciação apropriados que permitem a sua utilização para gerar modelos para sequenciação de geração seguinte (por exemplo, os marcadores de sequenciação Roche 454A e 454B ou o primeiro e segundo marcadores de sequenciação apropriados para outra plataforma de sequenciação; por exemplo, sem limitação, a plataforma Illumina Solexa ou Applied Biosystems Solid).
Está disponível uma grande variedade de enzimas e estojos para conduzir a reação de amplificação por PCR. Por exemplo, nalgumas formas de realização, a amplificação por PCR é realizada utilizando o Sistema de PCR FAILSAFE™ ou o Sistema de PCR Extra-Longo MASTERAMP™ da EPICENTRE Biotechnologies, Madison, WI, como descrito pelo fabricante. Estes sistemas permitem a otimização rápida das condições reacionais de PCR utilizando uma série de 2X Pré-Misturas de PCR proporcionadas com cada sistema para identificar a Pré-Mistura ótima para um modelo e par de "primers" particulares. No entanto, a divulgação não está limitada à utilização desses produtos ou condições para a reação de amplificação, e pode ser utilizada qualquer DNA polimerase termoestável e mistura reacional adequadas que permitam a amplificação da sequência entre o "primer" que emparelha com a sequência-alvo e o "primer" que emparelha com o transposão. A invenção também não está limitada à utilização de PCR para amplificar a biblioteca de fragmentos de DNA marcados. Qualquer método de amplificação adequado (por exemplo, amplificação por circulo rolante, amplificação por "riboprimer" (por exemplo, Patente U.S. No. 7,413,857), ICAN, UCAN, ribospia, marcação terminal (Pedido de Patente U.S. No. 20050153333), amplificação por aRNA do tipo Eberwine ou amplificação por deslocamento de filamento) que amplifique a mesma sequência e gere uma composição e quantidade de produto amplificação adequadas para a finalidade pretendida pode ser utilizado em formas de realização da presente invenção. Por exemplo, alguns métodos de deslocamento de filamento que podem ser utilizados são descritos nas Publicações de Patente PCT Nos. WO 02/16639; WO 00/56877; e AU 00/29742; da Takara Shuzo Company, Quioto, Japão; Patentes U.S. Nos. 5,523,204; 5,536,649; 5,624,825; 5,631,147; 5,648,211; 5,733,752; 5,744,311; 5,756,702; e 5,916,779 da Becton Dickinson and Company; Patentes U.S. Nos. 6,238,868; 6,309,833; e 6,326,173 da Nanogen/ Becton Dickinson Partnership; Patentes U.S. Nos. 5,849,547; 5,874,260; e 6,218,151 da Bio Merieux; Patentes U.S. Nos. 5,786, 183; 6, 087,133; e 6, 214,587 da Gen-Probe, Inc. ; Patente U.S. No. 6,063,604 de Wick et al.; Patente U.S. No. 6,251,639 de Kurn; Patente U.S. No. 6,410,278; e Publicação PCT No. WO 00/28082 de Eiken Kagaku Kabushiki Kaishi, Tóquio, Japão; Patentes U.S. Nos. 5,591,609; 5,614,389; 5,773,733; 5,834,202; e 6,448,017 de Auerbach; e Patentes U.S. Nos. 6,124,120; e 6,280,949 de Lizardi.
Em formas de realização preferenciais da invenção, não é necessário selecionar por tamanhos a biblioteca de fragmentos de DNA com marcação 5' gerados na reação de transposição in vitro ou a biblioteca final de fragmentos de DNA marcados. No caso de seleção por tamanhos ou purificação ser necessária para certas aplicações, os fragmentos de DNA com marcação 5' podem ser selecionados por tamanho por eletroforese em gel de agarose (por exemplo, utilizando um gel de agarose não desnaturante com baixa temperatura de fusão de uma percentagem de agarose apropriada para o intervalo de tamanhos desejado de fragmentos de DNA) e purificados (por exemplo, para remover os oligonucleótidos de extremidade de transposão não inseridos, outros produtos reacionais e gel de agarose; por exemplo, por digestão da porção do gel de agarose contendo o intervalo de tamanhos desejado de fragmentos de DNA com marcação 5' com enzima de digestão de gel de agarose GELase™, EPICENTRE Biotechnologies, Madison, WI, EUA, seguido de precipitação com álcool, e outros passos de limpeza de acordo com diretrizes com o produto GELase, ou utilizando qualquer método de purificação conhecido na área). Nalgumas formas de realização, utiliza-se um passo de purificação compreendendo precipitação com polietilenoglicol (PEG) para precipitar a biblioteca de fragmentos de DNA marcados sem precipitar substâncias contaminantes (por exemplo, sem limitação, oligonucleótidos de marcação de ligação não ligados ou outros componentes reacionais). Nalgumas formas de realização, utiliza-se uma coluna de rotação ou qualquer outro método de purificação conhecido na área.
Nalgumas formas de realização, os fragmentos de DNA circulares marcados são utilizados como modelos para sequenciação de DNA.
Nalgumas formas de realização, os fragmentos de DNA marcados são utilizados como modelos for sequenciação de DNA.
Nalgumas formas de realização, a biblioteca de fragmentos de DNA marcados é utilizada como modelo para uma reação de amplificação (por exemplo, uma reação de amplificação por PCR utilizando "primers" de PCR que são complementares ao primeiro e segundo marcadores de fragmentos de DNA marcados compreendendo fragmentos de DNA duplamente marcados ou fragmentos de DNA de cauda de andorinha ou que são complementares ao marcador de fragmentos de DNA marcados compreendendo fragmentos de ssDNA circulares marcados). Nalgumas formas de realização preferenciais, a biblioteca de fragmentos de DNA marcados amplificados compreende a maior parte ou aproximadamente todas as sequências exibidas pelo DNA-alvo. Nalgumas formas de realização em que o DNA-alvo compreende DNA genómico de um organismo, a reação de amplificação é uma reação de amplificação do genoma completo.
Nalgumas formas de realização do método que compreende amplificar os fragmentos de DNA marcados, os amplificados são etiquetados por incorporação de um nucleótido etiquetado durante um ou mais passos do método de amplificação (por exemplo, o método de amplificação por reação de PCR) . Nalgumas formas de realização, a biblioteca de fragmentos de DNA marcados amplificados que contêm a etiqueta é utilizada para detetar ou capturar ou para detetar e capturar os fragmentos de DNA marcados amplificados que contêm a etiqueta para uma aplicação particular.
Algumas formas de realização de qualquer um dos métodos da invenção para gerar uma biblioteca de fragmentos de DNA marcados (por exemplo, fragmentos de DNA duplamente marcados) compreendem gerar uma biblioteca de fragmentos de DNA marcados "etiquetados" que contêm uma ou múltiplas frações (por exemplo, uma ou múltiplas moléculas de ligação de afinidade) que permitem captura dos fragmentos de DNA marcados etiquetados numa superfície, ou uma ou múltiplas frações detetáveis que permitem deteção dos fragmentos de DNA marcados etiquetados (por exemplo, que emparelham com um DNA complementar, tal como DNA complementar num cromossoma). Além disso, algumas formas de realização de qualquer um dos métodos da invenção compreendendo amplificar adicionalmente a biblioteca de fragmentos de DNA marcados compreendem gerar uma biblioteca de fragmentos de DNA marcados amplificados "etiquetados" compreendendo uma ou múltiplas frações (por exemplo, uma ou múltiplas moléculas de ligação de afinidade) que permitem captura numa superfície, ou uma ou múltiplas frações detetáveis que permitem deteção dos fragmentos de DNA marcados etiquetados (por exemplo, que emparelham com um DNA complementar, tal como DNA complementar num cromossoma). Nalgumas formas de realização, a biblioteca de fragmentos de DNA marcados etiquetados ou fragmentos de DNA marcados amplificados etiquetados é gerada por utilização de pelo menos um oligonucleótido etiquetado (por exemplo, um oligonucleótido de extremidade de transposão transferida etiquetado, um oligonucleótido de marcação de ligação etiquetado ou pelo menos um "primer" de amplificação etiquetado, tal como pelo menos um (ou mais do que um) "primer" de PCR). Nalgumas formas de realização diferentes, uma biblioteca de fragmentos de DNA marcados amplificados etiquetados é gerada incluindo um dNTP etiquetado que é incorporado nos produtos de amplificação durante a reação de amplificação. 0 dNTP etiquetado pode ter qualquer etiqueta conhecida na área que possa ser utilizada para gerar fragmentos de DNA marcados amplificados etiquetados, seja por etiquetagem direta ou por etiquetagem indireta. Por "etiquetagem direta" significamos que a fração de captura ou etiqueta detetável é ligada diretamente aos fragmentos de DNA marcados amplificados sem qualquer outra fração entre a fração de captura ou detetável e o fragmento de DNA marcado ou fragmento de DNA marcado amplificado. Por "etiquetagem indireta" significamos que há pelo menos uma outra fração entre a fração de captura ou detetável e o fragmento de DNA marcado ou fragmento de DNA marcado amplificado. Um exemplo de etiquetagem direta é a incorporação de um nucleótido etiquetado com corante nos fragmentos de DNA marcados, ao passo que um exemplo de etiquetagem indireta é a incorporação de um nucleótido etiquetado com biotina nos fragmentos de DNA marcados e depois etiquetagem dos fragmentos de DNA marcados com uma fração detetável com corante por incubação com estreptavidina etiquetada com corante em condições em que a estreptavidina etiquetada com corante se liga aos nucleótidos etiquetados com biotina. A invenção compreende a utilização de qualquer método adequado para gerar a biblioteca de fragmentos de DNA marcados etiquetados ou fragmentos de DNA marcados amplificados etiquetados, em que a etiqueta é subsequentemente utilizada para captura ou deteção.
Nalgumas formas de realização diferentes, fragmentos de DNA marcados numa biblioteca preparada utilizando um método da invenção são subsequentemente etiquetados, direta ou indiretamente, por contacto da biblioteca de fragmentos de DNA marcados com uma molécula de corante reativa (por exemplo, qualquer um dos corantes fluorescentes reativos contendo um éster de N-hidroxissuccinimidilo ou "NHS" da Molecular Probes, Eugene, OR) ou com uma molécula de ligação de afinidade reativa (por exemplo, um reagente de biotinilação reativo, tal como um composto biotina-NHS, da Pierce Chemical Company, Rockford, IL). Por exemplo, nalgumas formas de realização, a biblioteca de fragmentos de DNA marcados amplificados etiquetados é gerada por incorporação de um dNTP que contém um grupo aminoalilo durante a reação de amplificação, e depois a biblioteca de fragmentos de DNA marcados amplificados contendo o grupo aminoalilo é contactada com o corante fluorescente etiquetado éster de NHS ou o éster de biotina-NHS para gerar fragmentos de DNA marcados amplificados e etiquetados com corante fluorescente ou fragmentos de DNA marcados amplificados etiquetados com biotina, respetivamente. Os peritos na área saberão ou sabem como encontrar muitos métodos e reagentes específicos adicionais, incluindo estojos, por exemplo, da Molecular Probes, para etiquetagem da biblioteca de fragmentos de DNA marcados amplificados para uma finalidade particular (por exemplo, para permitir captura numa superfície ou deteção). Por exemplo, Exemplos incluem um ou mais nucleótidos modificados que têm um grupo aminoalilo, um grupo propinilo, um grupo biotina, um corante fluorescente ou outro detetável ou qualquer outra molécula ou combinação de moléculas detetáveis conhecidas na área, incluindo pontos quânticos, uma enzima (por exemplo, uma fosfatase, uma peroxidase ou uma pirofosfatase) ou uma proteína detetável (por exemplo, ficobiliproteína, ficoeritrina). Nalgumas formas de realização diferentes, uma biblioteca de fragmentos de DNA marcados amplificados etiquetados é gerada por incorporação de um ou mais dNTPs modificados que são etiquetados com uma molécula de ligação de afinidade ou uma fração detetável durante a reação de amplificação, por exemplo, durante uma reação de amplificação por PCR, por exemplo, por incorporação de um ou mais dNTPs modificados que têm um grupo aminoalilo, um grupo biotina, um corante fluorescente ou outro detetável ou outra fração que permita a sua deteção, diretamente ou indiretamente após etiquetagem com qualquer outra molécula ou combinação de moléculas detetáveis conhecidas na área, incluindo pontos quânticos, ou uma enzima ou proteína detetável (por exemplo, ficobiliproteína, ficoeritrina) que é ligada a uma molécula de ligação de afinidade (por exemplo, como estreptavidina, um anticorpo) .
Nalgumas formas de realização, os fragmentos de DNA marcados (por exemplo, fragmentos de DNA duplamente marcados) são utilizados para a preparação de fragmentos de DNA etiquetados para hibridização com sondas ligadas a uma superfície (por exemplo, tal como DNA-alvo etiquetado para hibridização com sondas de DNA numa série ou microssérie). Nalgumas formas de realização, fragmentos de DNA marcados (por exemplo, compreendendo fragmentos de DNA duplamente marcados) são utilizados para hibridização com cromossomas ou partes de cromossomas em células ou secções de tecidos fixados (por exemplo, para hibridização in situ fluorescente ou FISH).
Nalgumas formas de realização, o método compreende gerar fragmentos de DNA marcados etiquetados ou fragmentos de DNA marcados amplificados etiquetados (por exemplo, fragmentos de DNA etiquetados duplamente marcados etiquetados ou fragmentos de DNA duplamente marcados amplificados etiquetados) para utilização em hibridização com cromossomas (por exemplo, em que os fragmentos de DNA marcados etiquetados são preparados a partir de DNA-alvo compreendendo DNA de um ou mais cromossomas específicos para utilização como "pinturas cromossómicas" (por exemplo, para hibridização com um ou mais cromossomas em células ou secções de tecidos fixados, por exemplo, utilizando hibridização in situ fluorescente ou FISH para aplicações tais como tipagem de cromossomas, ou para investigação, diagnóstico médico, identificação do sexo de um organismo ou outras aplicações biológicas celulares). Nalgumas formas de realização, o método compreende gerar fragmentos de DNA marcados etiquetados ou fragmentos de DNA marcados amplificados etiquetados a partir de DNA-alvo compreendendo partes de cromossomas (por exemplo, em que os fragmentos de DNA marcados são preparados a partir de DNA que codifica um ou mais genes ou loci específicos de um ou mais cromossomas (por exemplo, para hibridização com um ou mais cromossomas em células ou secções de tecidos fixados, por exemplo, utilizando hibridização in situ fluorescente ou FISH, ou para utilização como sondas específicas para genes ou específicas para loci em ensaios in vitro para aplicações tais como ensaios específicos para analitos ou testes de diagnóstico para aplicações de investigação médica, industrial, ambiental ou molecular ou de biologia celular) .
Nalgumas formas de realização, a hibridização de fragmentos de DNA marcados etiquetados com sondas numa superfície (por exemplo, uma série ou microssérie, uma tira reagente, um ponto quântico, uma esférula ou um microcanal num dispositivo microfluídico) é utilizada para detetar, quantificar, determinar quantidades relativas ou caracterizar uma ou mais moléculas de DNA ou suas porções que se encontram ou que provêm de uma fonte natural (por exemplo, DNA genómico de uma célula; por exemplo, DNA humano para avaliação da variação do número de cópias ou "CNV", ou DNA de uma célula patogénica bacteriana, fúngica, de micoplasma, virai ou de nemátodo que é um patogénio), ou de uma fonte in vitro (por exemplo, cDNA de filamentação dupla preparado por transcrição reversa de RNA, tal como mRNA ou RNA não codificador ou RNA virai, que é isolado de uma fonte natural ou que é amplificado de uma fonte natural utilizando um método de amplificação de ácido nucleico, tal como um método de amplificação de DNA ou RNA).
Nalgumas formas de realização diferentes em que o método compreende amplificar os fragmentos de DNA marcados, o método compreende gerar fragmentos de DNA marcados amplificados etiquetados por incorporação de um ou mais dNTPs modificados que têm uma molécula de ligação de afinidade ou uma fração detetável durante a reação de amplificação, por exemplo, durante uma reação de amplificação por PCR (por exemplo, por incorporação de um ou mais dNTPs modificados que têm um grupo aminoalilo, um grupo biotina, um corante fluorescente ou outro detetável ou outra fração que permita a sua deteção, diretamente ou indiretamente após etiquetagem com qualquer outra molécula ou combinação de moléculas detetáveis conhecidas na área, incluindo pontos quânticos, ou uma enzima ou proteína detetável (por exemplo, ficobiliproteína, ficoeritrina) que é ligada a uma molécula de ligação de afinidade (por exemplo, tal como estreptavidina, um anticorpo).
Nalgumas formas de realização diferentes, os fragmentos de DNA marcados ou fragmentos de DNA marcados amplificados preparados utilizando um método da invenção são etiquetados por incorporação de um ou mais dNTPs modificados que têm uma molécula de ligação de afinidade ou uma fração detetável durante a reação de amplificação (por exemplo, durante a respetiva transcrição, reação de RCR ou PCR, por exemplo, por incorporação de um ou mais dNTPs modificados que têm um grupo aminoalilo, um grupo biotina, um grupo digoxigenina, um corante fluorescente ou outro detetável ou outra fração que permita a sua deteção, diretamente ou indiretamente após etiquetagem com qualquer outra molécula ou combinação de moléculas detetáveis conhecidas na área, incluindo pontos quânticos, ou uma enzima ou proteína detetável (por exemplo, ficobiliproteína, ficoeritrina) que é ligada a uma molécula de ligação de afinidade (por exemplo, tal como estreptavidina, um anticorpo) . Nalgumas formas de realização diferentes, os respetivos produtos são utilizados para a preparação de fragmentos de ácidos nucleicos etiquetados para hibridização com sondas ligadas a uma superfície (por exemplo, tal como ácido nucleico-alvo etiquetado para hibridização com sondas de DNA numa série ou microssérie). Nalgumas formas de realização, os respetivos produtos etiquetados são utilizados para hibridização com cromossomas ou partes de cromossomas em células ou secções de tecidos fixados (por exemplo, para hibridização in situ fluorescente ou FISH). Nalgumas formas de realização, a hibridização de produtos etiquetados com sondas numa superfície é utilizada para detetar, quantificar, determinar quantidades relativas ou caracterizar uma ou mais porções de um DNA-alvo de uma fonte natural (por exemplo, DNA genómico de uma célula; por exemplo, para avaliação da variação do número de cópias ou "CNV") ou de uma fonte in vitro (por exemplo, cDNA de filamentação dupla preparado por transcrição reversa de RNA, tal como mRNA ou RNA não codificador (ncRNA), que é isolado de uma fonte natural ou que é amplificado de uma fonte natural utilizando um método de amplificação de RNA).
Nalgumas formas de realização de métodos que compreendem gerar uma biblioteca de fragmentos de DNA circulares marcados, o oligonucleótido de extremidade de transposão transferida, para além de exibir a sequência da extremidade de transposão transferida na sua porção 3', também exibe uma sequência de um filamento de um promotor de RNA polimerase de filamentação dupla na sua porção 5'. Nalgumas formas de realização de métodos que compreendem gerar uma biblioteca de fragmentos de DNA duplamente marcados utilizando um oligonucleótido de marcação de ligação e uma ligase dependente do modelo, o oligonucleótido de marcação de ligação exibe uma sequência de um filamento de um promotor de RNA polimerase de filamentação dupla na sua porção 3'. Nalgumas formas de realização de métodos em que o oligonucleótido de extremidade de transposão transferida ou o oligonucleótido de marcação de ligação não exibe uma sequência promotora de RNA polimerase, o método compreende adicionalmente amplificar por PCR os fragmentos de DNA duplamente marcados utilizando pelo menos um "primer" de PCR que é um ""primer" promotor". 0 "primer" promotor tem uma porção de "aba 5'" ou "cauda 5'" que não emparelha com os fragmentos de DNA duplamente marcados e que exibe a sequência de um filamento de um promotor de RNA polimerase de filamentação dupla, e uma porção 3' que emparelha com o primeiro ou segundo marcador dos fragmentos de DNA com marcação 5' e 3' ou seus complementos.
Nalgumas formas de realização preferenciais em que o oligonucleótido de extremidade de transposão transferida, o oligonucleótido de marcação de ligação ou um "primer" de PCR exibe uma sequência promotora de RNA polimerase, o promotor de RNA polimerase é um promotor de RNA polimerase do tipo T7 e o método compreende adicionalmente o passo de transcrever os fragmentos de DNA com marcação 5' e 3' in vitro utilizando uma RNA polimerase do tipo T7 que reconhece o promotor. Muito preferencialmente, a RNA polimerase e promotor são escolhidos de entre RNAP de T7, RNAP de T3 e RNAP de SP6 e os correspondentes promotores cognatos. No entanto, passos de transcrição de um método da invenção podem empregar qualquer RNAP para a qual é conhecida ou pode ser obtida uma sequência promotora adequada que permite transcrição com elevada especificidade. Estojos e enzimas para transcrição in vitro são disponibilizados comercialmente por muitos vendedores, e as misturas e condições reacionais apropriadas para conduzir passos da presente invenção compreendendo transcrição in vitro podem empregar aqueles produtos como descrito pelos fabricantes. Por exemplo, transcrição in vitro utilizando RNAP de T7 pode ser realizada utilizando o Estojo de Transcrição AMPLISCRIBE™ T7-Flash™ ou o Estojo Transcrição de Alto Rendimento de T7 AMPLISCRIBE™ da EPICENTRE Biotechnologies, Madison, WI, como descrito na literatura do produto. De modo semelhante, se RNAP de T3 ou RNAP de SP6 for utilizada num método da invenção para transcrição in vitro, um Estojo de Transcrição de Alto Rendimento AMPLISCRIBE™ T3-Flash™ ou o Estojo de Transcrição de Alto Rendimento de SP6 AMPLISCRIBE™ (EPICENTRE Biotechnologies, Madison, WI), respetivamente, pode ser utilizado como descrito.
Nalgumas formas de realização, o oligonucleótido de extremidade de transposão transferida, o oligonucleótido de marcação de ligação ou um "primer" de PCR exibe, para além da sequência promotora de RNA polimerase, sequências adicionais para tradução, tais como mas não se limitando a um sitio de ligação de ribossoma e um codão de inicio da tradução (também denominado "sinal de inicio da tradução") e o método compreende adicionalmente traduzir o RNA transcrito. Nalgumas destas formas de realização, o método compreende adicionalmente o passo de tradução in vitro dos transcritos de RNA resultantes. Sistemas e estojos para tradução in vitro dos transcritos de RNA também são disponibilizados comercialmente por muitas fontes e podem ser utilizados para a presente invenção. A titulo exemplificativo mas não de limitação, sistemas de lisado de reticulócitos de coelho, extrato de gérmen de trigo e extrato S30 de E. coli da PROMEGA Corporation, Madison, WI, podem ser utilizados para a presente invenção. Ainda adicionalmente, estojos para transcrição in vitro e tradução in vitro acopladas também são disponibilizados comercialmente e podem ser utilizados, tais como Sistemas de Transcrição/Tradução Acopladas TNT® Quick da Promega.
Nalgumas formas de realização preferenciais do método, a biblioteca de fragmentos de DNA duplamente marcados gerada a partir de DNA-alvo compreendendo amostra de DNA de um genoma completo de uma célula ou organismo é amplificada por PCR (isto é, o método compreende ou consiste num método para amplificação do genoma completo). Nalgumas formas de realização, o método para amplificação do genoma completo é utilizado para amplificar um genoma completo a partir de uma única célula. Nalgumas formas de realização preferenciais do método de amplificação do genoma completo no presente documento, a biblioteca de fragmentos de DNA marcados é gerada a partir de uma amostra de DNA de um genoma completo de uma célula ou organismo são amplificados por PCR utilizando o "primer" oligonucleotidico (ou "primer" de PCR) único que é complementar ao segundo marcador.
Nalgumas formas de realização, os fragmentos de DNA marcados gerados utilizando um método da invenção são gerados a partir de DNA-alvo que compreende ou consiste em genomas e/ou cDNA de filamentação dupla preparado a partir de RNA de todos os organismos (por exemplo, múltiplos organismos) que estão presentes numa amostra ambiental (por exemplo, para aplicações metagenómicas ou metatranscriptómicas, incluindo para aplicações industriais, médicas ou de investigação).
Nalgumas formas de realização diferentes do método, a biblioteca de fragmentos de DNA marcados é gerada a partir de DNA-alvo que compreende DNA compreendendo ou consistindo num único cromossoma ou numa porção de um cromossoma. Nalgumas destas formas de realização, o método compreende amplificar por PCR a biblioteca de fragmentos de DNA marcados gerada a partir do DNA-alvo compreendendo ou consistindo em DNA de um único cromossoma ou uma porção de um cromossoma, incluindo uma porção de um cromossoma compreendendo um ou mais genes ou loci genéticos em condições em que os produtos amplificados por PCR são etiquetados com a fração detetável (por exemplo, um corante fluorescente, fluorescente infravermelho, quimioluminescente, visível ou outro detetável; por exemplo, utilizando um dNTP etiquetado com corante na PCR. Nalgumas formas de realização, os produtos amplificados por PCR que são etiquetados com a fração detetável são utilizados para coloração de células fixadas in situ (por exemplo, os produtos de amplificação por PCR são utilizados como pinturas cromossómicas). Assim, nalgumas formas de realização preferenciais, o método compreende ou consiste num método de preparação de pinturas cromossómicas ou pinturas subcromossómicas ou marcadores cromossómicos.
Nalgumas formas de realização, os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados gerados utilizando o método são utilizados como DNA-alvo para uma segunda ronda de fragmentação e marcação utilizando um método da invenção. Nalgumas formas de realização, o mesmo transpossoma é utilizado na primeira e segunda rondas do método. Nalgumas formas de realização, uma segunda transposase diferente e diferentes extremidades de transposão são utilizadas para a segunda ronda.
Nalgumas formas de realização, os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados gerados utilizando o método são clonados num vetor (por exemplo, num vetor fosmidico COPYCONTROL™, EPICENTRE Biotechnologies, Madison, WI, EUA) . Nalgumas formas de realização em que o método compreende adicionalmente clonar os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados e em que os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados (por exemplo, fragmentos de DNA marcados amplificados por PCR) exibem um promotor de RNA polimerase, o método compreende adicionalmente transcrever pelo menos um filamento dos fragmentos de DNA marcados ou dos fragmentos de DNA marcados amplificados clonados. Nalgumas formas de realização, os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados clonados são transcritos in vitro utilizando uma RNA polimerase que reconhece o promotor de RNA polimerase. Nalgumas formas de realização, os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados clonados são transcritos in vivo numa célula hospedeira que é capaz de expressão indutível da RNA polimerase que reconhece o promotor de RNA polimerase e depois transcrevendo modelos de DNA que contêm o promotor ao qual se liga a RNA polimerase (por exemplo, o sistema pET é amplamente utilizado para expressão de proteínas in vivo a partir de uma RNA polimerase do tipo T7 induzida). Nalgumas formas de realização preferenciais, a RNA polimerase para expressão in vitro ou in vivo é uma RNA polimerase do tipo T7 e a transcrição é iniciada a partir de um respetivo promotor de RNAP do tipo T7 cognato. Nalgumas formas de realização preferenciais, a RNA polimerase do tipo T7 é selecionada de entre RNA polimerase de T7, RNA polimerase de T3 e RNA polimerase de SP6.
Nalgumas formas de realização de qualquer um dos métodos, o oligonucleótido de extremidade de transposão transferida, o oligonucleótido de marcação de ligação ou um "primer" de PCR contém ou é unido a uma molécula de afinidade (por exemplo, biotina ou digoxigenina) e o método compreende adicionalmente os passos de: proporcionar uma superfície sólida que é covalentemente ou não covalentemente revestida com uma substância de ligação de afinidade que é capaz de se ligar especificamente e formar um par de ligação específica com a molécula de afinidade (por exemplo, estreptavidina ou avidina para ligação de biotina, ou um anticorpo para ligação de digoxigenina) , e, antes ou após o passo em que está envolvida, contactar os produtos gerados utilizando o oligonucleótido de extremidade de transposão transferida, o oligonucleótido de marcação de ligação ou o "primer" de PCR que é quimicamente unido à molécula de afinidade em condições e durante um período de tempo suficiente em que se liga a substância de ligação de afinidade que é unida à superfície sólida. A invenção não está limitada a uma superfície sólida particular, que pode ser porosa ou não porosa, e de qualquer composição, tamanho ou forma que seja adequada para o método e aplicação particulares. A título exemplificativo, mas não de limitação, a superfície sólida pode ser selecionada do grupo que consiste em: esférulas magnéticas, esférulas revestidas, lâminas, as cavidades de uma placa de microtitulação, tubos e tiras reagentes que consistem em vidro, plástico (por exemplo, látex ou poliestireno), sílica, Teflon ou outro material adequado. A finalidade da superfície sólida que é revestida com a substância de ligação de afinidade é permitir a manipulação (por exemplo, captura e lavagem para remoção de outras moléculas numa mistura reacional), isolamento e captura do oligonucleótido de extremidade de transposão transferida, do oligonucleótido de marcação de ligação ou do "primer" de PCR que é quimicamente unido à molécula de afinidade, ou permitir a manipulação, isolamento e captura dos fragmentos de DNA com marcação 5', dos fragmentos de DNA com marcação 5' e 3' ou dos produtos de PCR daí gerados. Para prevenir ligação inespecífica, nalgumas formas de realização, o suporte sólido é tratado com um grande excesso de uma substância selecionada do grupo que consiste em: tRNA desprovido de DNA; proteína (por exemplo, BSA), polissacárido (por exemplo, glicogénio, sulfato de dextrano ou heparina). A invenção também não está limitada a uma molécula de afinidade ou substância de ligação de afinidade específica, desde que seja capaz de se ligar especificamente e formar um par de ligação específica.
Assim, nalgumas formas de realização, os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados são capturados, isolados, purificados ou utilizados noutro método por ligação à superfície sólida, em que o método compreende os passos seguintes: contactar os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados que contêm a molécula de afinidade com a superfície sólida na presença de reagentes e em condições que facilitam a sua ligação à substância de ligação de afinidade que é ligada à superfície sólida, em que os fragmentos de DNA marcados ou os fragmentos de DNA marcados amplificados são ligados à superfície.
Nalgumas formas de realização preferenciais, a molécula de afinidade é biotina e a substância de ligação de afinidade é avidina ou estreptavidina, ou em que a molécula de afinidade é digoxigenina e a substância de ligação de afinidade é um anticorpo que se liga especificamente a digoxigenina.
Como usados no presente documento, os termos "transposase" e "DNA polimerase" e "ligase" referem-se a moléculas proteicas ou agregados de moléculas proteicas que são responsáveis por catalisar reações químicas e biológicas específicas. Em geral, um método, composição ou estojo da invenção não está limitado à utilização de uma enzima transposase ou DNA polimerase particular de uma fonte particular. Ao invés, um método, composição ou estojo da presente invenção compreende qualquer enzima transposase ou DNA polimerase de qualquer fonte que tenha uma atividade enzimática equivalente à das enzimas particulares reveladas no presente documento relativamente ao método, composição ou estojo particular. Ainda adicionalmente, os métodos da presente invenção também incluem formas de realização em que qualquer enzima particular que seja proporcionada e utilizada num passo do método é substituída por uma combinação de duas ou mais enzimas que, quando utilizadas em combinação, utilizadas separadamente de um modo em passos ou utilizadas em conjunto ao mesmo tempo na mistura reacional, originam resultados que são idênticos aos resultados obtidos utilizando a uma enzima particular. Os métodos, tampões e condições reacionais apresentados no presente documento, incluindo nos exemplos, são presentemente preferenciais para as formas de realização dos métodos, composições e estojos da presente invenção. No entanto, outros tampões de armazenamento de enzimas, tampões reacionais e condições reacionais para utilização de algumas das enzimas da invenção são conhecidos na área, que também podem ser adequados para utilização na presente invenção, e são incluídos no presente documento.
Formas de realização de Composições e Estojos A invenção também compreende estojos e composições para um método da invenção. Um estojo é uma combinação de composições individuais úteis para implementar um método da invenção, em que as composições são otimizadas para utilização conjunta no método. Uma composição compreende um componente individual para pelo menos um passo de um método da invenção. A invenção compreende qualquer estojo que possa ser montado a partir de uma combinação de quaisquer duas composições ou estojos novos da divulgação, ou a partir de qualquer composição nova que seja utilizada num estojo. Nalgumas formas de realização, o estojo ou composição compreende ou consiste num subconjunto de qualquer estojo ou composição descrito no presente documento, em qualquer combinação apropriada e por qualquer motivo, tal como para dotar o utilizador de flexibilidade para adaptar o método para uma finalidade ou aplicação particular ou para permitir ao utilizador empregar outras composições juntamente com o estojo ou composição que compreende ou consiste no subconj unto.
Formas de realização de composições
Uma forma de realização de uma composição da invenção consiste numa composição de transpossoma que compreende (i) um filamento transferido que tem uma porção 3' que exibe a sequência de extremidade de transposão transferida e uma porção 5' que exibe a sequência de um domínio marcador e (ii) um filamento não transferido contendo 5'-fosfato que exibe apenas a sequência de extremidade de transposão não transferida, em que a transposase forma um complexo com a composição de extremidade de transposão que é ativa numa reação de transposição in vitro. Nalgumas formas de realização, o domínio marcador é um domínio marcador para utilização em sequenciação de geração seguinte ou amplificação. Nalgumas formas de realização, o domínio marcador é selecionado de entre um domínio de sítio de restrição, um domínio de marcador de captura, um domínio de marcador de sequenciação, um domínio de marcador de deteção, um domínio de marcador de endereço, um domínio de marcador de amplificação e um domínio de promotor de transcrição.
Uma outra composição da invenção é uma composição de extremidade de transposão transferida em que o filamento transferido compreende uma porção 3' e uma porção 5', em que a porção 3' exibe uma sequência de extremidade de transposão transferida e a porção 5' compreende um domínio de promotor de transcrição que exibe uma sequência promotora de RNA polimerase.
Outra composição da invenção é uma composição de extremidade de transposão em grampo que compreende ou consiste num oligonucleótido contendo 5'-fosfato que exibe uma sequência de extremidade de transposão não transferida na sua extremidade 5', uma sequência de extremidade de transposão transferida na sua extremidade 3' e uma sequência marcadora arbitrária interveniente entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida que é suficientemente longa para permitir a formação intramolecular de haste-alça. Nalgumas formas de realização preferenciais, a composição de extremidade de transposão em grampo compreende exibe as sequências de extremidade de transposão da transposase Tn 5 hiperativa. Nalgumas formas de realização diferentes, a composição de extremidade de transposão em grampo é adenilada na sua extremidade 5' em vez de ter um grupo 5'-fosfato.
A invenção também compreende composições para implementação dos métodos. Por exemplo, uma composição da invenção é um oligonucleótido compreendendo uma porção 3' e uma porção 5', em que a porção 3' exibe uma sequência de extremidade de transposão transferida e a porção 5' exibe um domínio de sítio de restrição (por exemplo, para uma endonuclease de restrição de cortes raros, como Notl ou Asei, ou para uma endonuclease de restrição do tipo II, como Fokl) . Por exemplo, uma outra composição da invenção é um oligonucleótido compreendendo uma porção 3' e uma porção 5', em que a porção 3' exibe uma sequência de extremidade de transposão transferida e a porção 5' exibe uma sequência promotora de RNA polimerase (por exemplo, para RNA polimerase do fago T7, T3, SP6 ou N4) . Nalgumas formas de realização preferenciais, a sequência promotora de RNA polimerase é uma sequência de promotor sentido para qualquer uma destas RNA polimerases. Nalgumas formas de realização diferentes, a sequência promotora de RNA polimerase é uma sequência de promotor antissentido para qualquer uma destas RNA polimerases. Uma outra composição da invenção é um oligonucleótido que compreende uma porção 3' e uma porção 5', em que a porção 3' exibe uma sequência de extremidade de transposão transferida e a porção 5' exibe um domínio marcador selecionado de entre um domínio de marcador de sequenciação, um domínio de marcador de amplificação, um domínio de marcador de captura, um domínio de marcador de endereço, um domínio de marcador de deteção e um domínio de marcador de sitio de restrição.
Nalgumas formas de realização preferenciais, a sequência de extremidade de transposão transferida é a composição de extremidade de transposão transferida MEDS ou pMEDS para a transposase EZ-Tn5™ (EPICENTRE) . Nalgumas formas de realização preferenciais, o domínio de marcador de sequência exibe um marcador de sequenciação que é apropriado para uma plataforma de sequenciação ROCHE 454, uma plataforma de sequenciação ILLUMINA™ SOLEXA ™, uma plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, uma plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, uma plataforma de sequenciação POLLONATOR Polony, uma plataforma de sequenciação COMPLETE GENOMICS, uma plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou uma plataforma de sequenciação HELICOS.
Formas de realização de estojos
Uma forma de realização da invenção consiste num estojo para gerar uma biblioteca de fragmentos de DNA com marcação 5' para utilização na preparação de modelos para amplificação de geração seguinte ou de ácidos nucleicos, em que o estojo compreende: uma composição de transpossoma compreendendo uma transposase e uma composição de extremidade de transposão que compreende (i) um filamento transferido que tem uma porção 3' que exibe a sequência de extremidade de transposão transferida e uma porção 5' que exibe a sequência para um domínio marcador para utilização numa sequenciação de geração seguinte ou reação de amplificação e (ii) um filamento não transferido contendo 5'-fosfato que exibe apenas a sequência de extremidade de transposão não transferida, em que a transposase forma um complexo com a composição de extremidade de transposão que é ativo numa reação de transposição in vitro, e um tampão reacional que contém dimetilformamida numa quantidade que faz com que esteja presente na reação de transposição in vitro a uma concentração final de 10 %.
Nalgumas formas de realização, o estojo compreende adicionalmente pelo menos um outro componente enzimático selecionado de entre: uma DNA polimerase que tem atividade de nuclease 5' ou deslocamento de filamento; uma DNA polimerase que está desprovida de atividade de nuclease 5', uma NAD ligase dependente do modelo e uma ligase independente do modelo. Nalgumas formas de realização, o pelo menos um outro componente enzimático é selecionado de entre: mistura de DNA polimerase FAILSAFE™; DNA polimerase Taq, DNA polimerase Tfl, DNA polimerase de T4, DNA ligase de E. coli, RNA ligase termoestável de bacteriófago TS2126, RNA ligase termoestável de Mth Rn 1 e ssDNA ligase termoestável CIRCLIGASE™.
Nalgumas formas de realização preferenciais em que a pelo menos uma enzima do estojo é uma ligase dependente do modelo (por exemplo, DNA ligase de E. coli), uma grande proporção das moléculas de ligase são adeniladas e ATP não é proporcionado no estojo. Nalgumas formas de realização em que a pelo menos uma enzima do estojo é uma ligase dependente do modelo (por exemplo, DNA ligase de E. coli), o estojo compreende adicionalmente um oligonucleótido de marcação de ligação compreendendo uma porção 3' e uma porção 5', em que a porção 3' exibe uma sequência de um domínio marcador e a porção 5' exibe uma sequência aleatória que consiste em cerca de três até cerca de oito nucleótidos. Nalgumas formas de realização preferenciais, o oligonucleótido de marcação de ligação compreende uma porção 5' que exibe uma sequência aleatória consistindo em quatro nucleótidos. Nalgumas formas de realização diferentes em que a pelo menos uma enzima do estojo é uma ligase dependente do modelo, o estojo compreende adicionalmente uma composição de extremidade de transposão em grampo. Nalgumas formas de realização em que a composição de extremidade de transposão em grampo tem uma extremidade 5' que é adenilada, menos do que 50 % das moléculas que compõem a ácido nucleico ligase dependente do modelo proporcionada no estojo são adeniladas e nenhum ATP ou NAD é proporcionado no estojo.
Nalgumas formas de realização preferenciais em que a pelo menos uma enzima do estojo é uma ligase independente do modelo, selecionada de entre RNA ligase termoestável de bacteriófago TS2126, RNA ligase termoestável de Mth Rn 1 e ssDNA ligase termoestável CIRCLIGASE™, a ligase independente do modelo é proporcionada numa forma altamente adenilada e ATP não é proporcionado no estojo.
Numa forma de realização preferencial do estojo, o transpossoma compreende uma transposase Tn5 ou transposase
MuA de tipo selvagem ou hiperativa que é proporcionada a uma concentração em que a concentração final do transpossoma na reação de transposição in vitro é pelo menos 250 nM. Nalgumas formas de realização diferentes, as concentrações finais de transpossoma Tn5 ou transpossoma MuA de tipo selvagem ou hiperativo são pelo menos 500 nM.
Uma forma de realização preferencial consiste num estojo para gerar fragmentos de ssDNA circulares marcados utilizando transposase EZ-Tn5™ e DNA ligase de E. coli, em que o estojo compreende: (1) uma forma de tipo selvagem ou mutante de transposase Tn5 (por exemplo, transposase EZ-Tn5™); (2) uma composição de extremidade de transposão que consiste num filamento transferido que exibe a sequência de extremidade de transposão transferida e um filamento não transferido que exibe a sequência de extremidade de transposão não transferida para EZ-transposase Tn5; (3) tampão reacional de EZ-transposase Tn5, e (4) uma ácido nucleico ligase independente do modelo que pode catalisar a ligação intramolecular de ssDNA na ausência de um modelo de ligação (por exemplo, selecionado de entre a RNA ligase do termófago TS2126 (Patente U.S. No. 7,303,901); ssDNA ligase termoestável CIRCLIGASE™ (EPICENTRE Biotechnologies, Madison, WI, EUA); e RNA ligase Mth 1) . Numa forma de realização preferencial, a transposase presente no estojo é uma forma de tipo selvagem ou mutante da transposase Tn5 (por exemplo, transposase EZ-Tn5™) a uma concentração maior ou igual a: cerca de 5 unidades por microlitro; cerca de 10-20 unidades por microlitro; cerca de 20-40 unidades por microlitro; cerca de 40-60 unidades por microlitro; cerca de 60-80 unidades por microlitro, ou cerca de 80-100 unidades por microlitro. Numa forma de realização preferencial do estojo compreendendo transposase EZ-Tn5™ e a ligase independente do modelo, a composição de extremidade de transposão EZ-Tn5 pMEDS compreende um filamento transferido EZ-Tn5 pMETS que tem um grupo 5'-monofosfato e um filamento não transferido EZ-Tn5 pMENTS que tem um grupo 5'-monofosfato.
Numa forma de realização preferencial, a transposase presente no estojo é uma forma de tipo selvagem ou mutante de transposase Tn5 (por exemplo, transposase EZ-Tn5™) a uma concentração maior ou igual a: cerca de 5 unidades por microlitro; cerca de 10-20 unidades por microlitro; cerca de 20-40 unidades por microlitro; cerca de 40-60 unidades por microlitro; cerca de 60-80 unidades por microlitro, ou cerca de 80-100 unidades por microlitro. Numa forma de realização preferencial do estojo compreendendo transposase EZ-Tn5™ e a ácido nucleico ligase independente do modelo, a composição de extremidade de transposão EZ-Tn5 pMEDS compreende um filamento transferido EZ-Tn5 METS que tem um grupo 5'-monofosfato e um filamento não transferido EZ-Tn5 pMENTS que tem um grupo 5'-monofosfato.
Os métodos, composições e estojos da invenção são úteis para gerar fragmentos de DNA circulares marcados ou fragmentos de dsDNA de cauda de andorinha ou fragmentos de ssDNA lineares duplamente marcados (e respetivos produtos de amplificação) a partir de DNA-alvo de qualquer fonte para análise genómica, subgenómica ou metagenómica (por exemplo, para utilização na preparação de um alvo etiquetado para análise por microssérie; por exemplo, para análise de variação do número de cópias, para deteção e análise de polimorfismos de um único nucleótido e para descobrir genes a partir de amostras ambientais, tais como fontes de solo ou água) . Os métodos são úteis numa variedade de processos, incluindo processos para amplificação do genoma completo de um ou mais organismos, incluindo um ou mais organismos microbianos ou ambientais para os quais são desconhecidas condições de cultura ou crescimento (por exemplo, amplificação do genoma completo ou WGA), PCR em tempo real, PCR de emulsão, hibridização genómica comparativa (CGH), sequenciação genómica comparativa (CGS) e para a preparação de sondas específicas para DNA (por exemplo, sondas específicas para cromossomas, por exemplo, pinturas cromossómicas) para aplicações tais como hibridização in situ fluorescente (FISH). Nalgumas formas de realização, os métodos também são utilizados para gerar modelos para sequenciação de DNA massivamente paralela (denominada "sequenciação de geração seguinte"). Cada um destes processos ou aplicações pode ser utilizado para fins de investigação e diagnóstico molecular.
DESCRIÇÃO PORMENORIZADA DE FORMAS DE REALIZAÇÃO DA INVENÇÃO A descrição pormenorizada de formas de realização exemplificativas da invenção é apresentada nas secções seguintes: I. Fragmentação E Dupla Marcação de DNA Utilizando Uma Transposase E Uma DNA Polimerase III. Fragmentação, Marcação E Amplificação Por "Primer" Único De DNA-Alvo II. Fragmentação e Marcação De DNA Utilizando Uma Transposase E Uma Ligase IV. Geração De Fragmentos De Ss-DNA Circulares Marcados A Partir De Ds-DNA-Alvo Utilizando Uma Transposase E Uma Ligase V. Fragmentação E Marcação De Ds-DNA Por Transposição In Vitro De Composições de Extremidade de Transposão Em Grampo I. Fragmentação E Dupla Marcação de DNA Utilizando Uma Transposase E Uma DNA Polimerase A presente invenção compreende métodos, composições e estojos para utilização de uma transposase para gerar fragmentos com marcação 5' de DNA-alvo compreendendo ou consistindo em uma ou mais moléculas de filamentação dupla (dsDNA) e depois unir um segundo marcador, que exibe uma sequência de DNA diferente da do primeiro marcador, às extremidades 3' dos referidos fragmentos de DNA com marcação 5'. 0 primeiro marcador exibe a sequência do filamento transferido da extremidade de transposão reconhecida pela transposase e, opcionalmente, também exibe uma ou mais sequências diferentes que estão a 5 ' da sequência da referida extremidade de transposão transferida. 0 segundo marcador é unido às extremidades 3' dos fragmentos de DNA com marcação 5' in vitro utilizando uma DNA polimerase sem conduzir uma reação de amplificação por PCR.
Um método da invenção compreende: incubar uma transposase e uma extremidade de transposão com a qual forma um complexo de transposição numa reação de transposição in vitro com DNA-alvo em condições e durante um período de tempo suficiente em que a extremidade de transposão transferida é unida ao DNA-alvo, gerando fragmentos de DNA com marcação 5' que têm um primeiro marcador nas suas extremidades 5' ; incubar os fragmentos de DNA com marcação 5' com uma DNA polimerase em condições de polimerização de DNA, cujas condições não compreendem aplicação de ciclos térmicos, durante um período de tempo suficiente em que um segundo marcador que exibe uma sequência que é diferente da do primeiro marcador é unido às extremidades 3' dos fragmentos de DNA com marcação 5' , gerando fragmentos de DNA com marcação 5' e 3'. Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar os fragmentos de DNA com marcação 5' e 3' utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao segundo marcador. 0 DNA-alvo pode compreender ou consistir em DNA de filamentação dupla de qualquer fonte in vivo ou in vitro, tal como DNA genómico, DNA subgenómico, DNA de derivação plasmídica ou outra epissomal ou DNA recombinante aí presente, ou cDNA de filamentação dupla preparado por transcrição reversa de RNA. DNA genómico pode compreender ou consistir em um ou mais genomas de uma fonte biológica ou ambiental. Assim, os métodos, composições e estojos da invenção são úteis para gerar fragmentos de DNA com marcação 5' e 3' e, opcionalmente, amplificar fragmentos de DNA com marcação 5' e 3' gerados a partir de DNA-alvo de qualquer fonte para utilização em métodos e aplicações conhecidos na área para análise genómica, subgenómica ou metagenómica (por exemplo, para análise de variação do número de cópias, polimorfismos de um único nucleótido ou outros métodos de análise genómica). Os métodos são úteis numa variedade de processos, incluindo mas não se limitando a análise metagenómica de genomas de um ou mais organismos, incluindo um ou mais organismos microbianos ou ambientais para os quais são desconhecidas condições de cultura ou crescimento, PCR em tempo real, PCR de emulsão, hibridização genómica comparativa (CGH), sequenciação genómica comparativa (CGS). Os métodos são particularmente úteis para gerar modelos para alguns tipos de sequenciação de DNA massivamente paralela (denominada "sequenciação de geração seguinte").
Utilização de uma DNA polimerase de Deslocamento de Filamento e/ou uma DNA polimerase com Atividade de Nuclease 5' Para Gerar Fragmentos de DNA Que têm Marcadores 5' e 3' que Exibem as Sequências de Diferentes Extremidades de Transposão
Nalgumas formas de realização preferenciais, a presente invenção proporciona um método para gerar uma biblioteca de fragmentos de DNA compreendendo fragmentos de DNA com marcação 5' e 3' a partir de DNA-alvo compreendendo ou consistindo numa ou mais moléculas de filamentação dupla (dsDNA), em que o método compreende:
Proporcionar: 1. DNA-alvo que compreende ou consiste em uma ou mais moléculas de filamentação dupla (dsDNA) (por exemplo, DNA genómico eucariótico e/ou procariótico ou cDNA de filamentação dupla preparado por transcrição reversa de RN A) , 2. uma transposase (por exemplo, uma transposase de tipo selvagem ou mutante; por exemplo, transposase Tn5 de tipo selvagem ou mutante, por exemplo, transposase EZ-Tn5™, ou, por exemplo, transposase MuA HYPERMU™, EPICENTRE Biotechnologies, Madison, WI, EUA), e 3. uma extremidade de transposão que é capaz de formar um complexo funcional com a transposase numa reação de transposição (por exemplo, a extremidade de transposão da extremidade externa ("OE"), extremidade de transposão da extremidade interna ("IE") ou extremidade de transposão da "extremidade em mosaico" ("ME") de 19 pb reconhecida por uma transposase Tn5 de tipo selvagem ou mutante, por exemplo, por transposase EZ-Tn5™, ou a extremidade de transposão Rl e R2, por exemplo, por transposase MuA HYPERMU™), em que a referida extremidade de transposão compreende DNA de filamentação dupla consistindo num filamento transferido e num filamento não transferido que, em combinação, exibem as sequências da extremidade de transposão de filamentação dupla, em que o filamento transferido exibe a sequência de um primeiro marcador, e 4. uma DNA polimerase que desloca o filamento ou digere DNA que é emparelhado com um filamento modelo a jusante da extremidade 3' da molécula de DNA que está a ser estendida pela referida DNA polimerase (isto é, a DNA polimerase tem atividade de deslocamento de filamento e/ou nuclease 5'; por exemplo, DNA polimerase Taq, DNA polimerase Tfl, mistura de DNA polimerase FAILSAFE™; DNA polimerase phi29, DNA polimerase I de E. coli e DNA polimerase DISPLACEACE™, todas disponibilizadas pela EPICENTRE Biotechnologies, Madison, WI, EUA) ;
Incubar o DNA-alvo com a transposase e a extremidade de transposão em condições e durante um período de tempo suficiente em que a inserção catalisada por transposase da extremidade de transposão em ambos os filamentos do DNA-alvo gera fragmentos de DNA com marcação 5', cada um dos quais tem o primeiro marcador na sua extremidade 5' (por exemplo, FIG. 2), e
Incubar fragmentos de DNA com marcação 5' gerados na reação de transposição in vitro com a DNA polimerase em condições e durante um período de tempo suficiente em que a DNA polimerase estende as extremidades 3' dos fragmentos de DNA com marcação 5', desse modo unindo um segundo marcador, que exibe pelo menos uma porção da sequência de extremidade de transposão não transferida, aos fragmentos de DNA com marcação 5' e gerando fragmentos de DNA com marcação 5' e 3 ' .
Nalgumas formas de realização preferenciais, o filamento transferido exibe apenas a sequência de extremidade de transposão transferida e, em consequência, o primeiro marcador que está presente nos fragmentos de DNA com marcação 5' exibe apenas a sequência de extremidade de transposão transferida. Nalgumas formas de realização diferentes, o filamento transferido compreende ou consiste numa porção 3' e numa porção 5' , em que a porção 3' exibe a sequência da extremidade de transposão transferida e a porção 5' exibe qualquer outra sequência desejada, em cujas formas de realização o primeiro marcador compreende ou consiste na porção 3' e na porção 5'. Em formas de realização em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', o filamento não transferido pode exibir, mas não é necessário, uma sequência que é complementar à porção 5' do filamento transferido.
Nalgumas formas de realização em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', a porção 5' exibe um marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454A; representado esquematicamente, por exemplo, na FIG. 10) e a porção 3' exibe a sequência do filamento transferido da extremidade de transposão. Isto gera fragmentos de DNA com marcação 5' com um primeiro marcador que compreende ou consiste num marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454A). Depois, a DNA polimerase é utilizada para unir um segundo marcador que compreende ou consiste no outro marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454B) aos fragmentos de DNA com marcação 5', desse modo gerando uma biblioteca de fragmentos de DNA compreendendo fragmentos de DNA com marcação 5' e 3' com ambos os marcadores de sequenciação (por exemplo, ο 454A e 454B; mostrado esquematicamente na FIG. 10). Os fragmentos de DNA com marcação 5' e 3' no intervalo de tamanhos desejado são utilizados como modelos para sequenciação de geração seguinte utilizando o Sistema FLX Sequenciador do Genoma Roche 454. Noutras formas de realização, os fragmentos de DNA com marcação 5' e 3' da biblioteca são gerados com primeiro e segundo marcadores que são apropriados como marcadores de sequenciação para sequenciação de geração seguinte utilizando quaisquer outras plataformas de sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS).
Nalgumas formas de realização são utilizadas múltiplas extremidades de transposão de filamentação dupla para uma transposase particular ou múltiplas extremidades de transposão diferentes reconhecidas por diferentes enzimas transposases. Nalgumas formas de realização preferenciais em que é utilizada uma DNA polimerase de deslocamento de filamento ou uma DNA polimerase que tem atividade de nuclease 5', duas extremidades de transposão diferentes são inseridas perto uma da outra em filamentos opostos do DNA-alvo e depois a DNA polimerase estende as extremidades 3' dos fragmentos de DNA com marcação 5' utilizando o filamento oposto como modelo, desse modo gerando uma biblioteca de fragmentos de DNA com marcação 5' e 3' com marcadores que exibem diferentes sequências de extremidade de transposão na extremidade 3' em vez da extremidade 5' (por exemplo, em que o filamento transferido da primeira extremidade de transposão e o filamento transferido da segunda extremidade de transposão são diferentes e são unidos a filamentos opostos do DNA-alvo (por exemplo, FIG. 7).
Assim, nalgumas formas de realização, o método compreende adicionalmente:
Proporcionar adicionalmente: 5. uma segunda transposase que reconhece uma extremidade de transposão diferente da extremidade de transposão reconhecida pela primeira transposase (denominada nesta forma de realização "primeira extremidade de transposão" reconhecida pela "primeira transposase"), e 6. uma segunda extremidade de transposão que é capaz de formar um complexo funcional com a segunda transposase numa reação de transposição, em que a referida extremidade de transposão compreende um filamento transferido e um filamento não transferido que, em combinação, exibem as sequências da extremidade de transposão de filamentação dupla, em que o filamento transferido exibe uma sequência que é complementar à sequência exibida pelo segundo marcador, e
Incubar o DNA-alvo com a primeira transposase e a primeira extremidade de transposão e a segunda transposase e a segunda extremidade de transposão em condições e durante um período de tempo suficiente em que a primeira e segunda inserções catalisadas por transposase da primeira e segunda extremidades de transposão no DNA-alvo geram fragmentos de DNA, cada um dos quais exibe a sequência do filamento transferido da primeira extremidade de transposão ou da segunda extremidade de transposão na sua extremidade 5', e
Incubar os fragmentos de DNA com marcação 5' com a DNA polimerase em condições de polimerização de DNA, cujas condições não compreendem desnaturação de dsDNA ou aplicação de ciclos térmicos, e durante um período de tempo suficiente em que a DNA polimerase estende a extremidade 3' dos fragmentos de DNA com marcação 5', desse modo unindo o segundo marcador aos fragmentos de DNA com marcação 5' e gerando uma biblioteca de fragmentos de DNA marcados (por exemplo, fragmentos de DNA com marcação 5' e 3') sem conduzir uma reação de amplificação.
Nalgumas formas de realização, o método compreende simultaneamente incubar o DNA-alvo com a primeira transposase e os primeiros oligonucleótidos de extremidade de transposão e a segunda transposase e os segundos oligonucleótidos de extremidade de transposão na mesma mistura reacional. Nalgumas formas de realização diferentes, o método é realizado sequencialmente em primeiro lugar por incubação do DNA-alvo com a primeira transposase e os primeiros oligonucleótidos de extremidade de transposão e depois incubação dos produtos dessa reação com a segunda transposase e os segundos oligonucleótidos de extremidade de transposão. Nalgumas das formas de realização em que o método é realizado sequencialmente, os produtos da reação do DNA-alvo com a primeira transposase e os primeiros oligonucleótidos de extremidade de transposão são purificados antes da incubação desses produtos com a segunda transposase e os segundos oligonucleótidos de extremidade de transposão.
Nalgumas formas de realização do método em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', a porção 5' exibe a sequência de um marcador de sequenciação (por exemplo, um primeiro marcador de sequenciação Roche 454, por exemplo, o Roche 454A) e a porção 3' exibe a sequência do filamento transferido da extremidade de transposão. Um "marcador de sequenciação", como usado no presente documento, significa um marcador que é unido à extremidade 5' ou extremidade 3' de um fragmento de DNA de filamentação simples gerado a partir da molécula de DNA-alvo, cujo marcador se destina à finalidade de facilitar a sequenciação do referido fragmento de DNA. Por exemplo, nalgumas formas de realização, o marcador de sequenciação proporciona um sítio para captura do referido filamento de fragmento de DNA numa superfície e/ou para iniciação da síntese de DNA do referido fragmento de DNA e/ou do complemento do referido fragmento de DNA (por exemplo, são utilizados os marcadores de sequenciação Roche 454A e 454B para o Sistema FLX Sequenciador de Genoma Roche 454). Assim, quando a porção 5' do filamento transferido exibe a sequência de um marcador de sequenciação, os fragmentos de DNA com marcação 5' têm um primeiro marcador que compreende ou consiste no marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454). Depois, a DNA polimerase une um segundo marcador, que compreende ou consiste num segundo marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454B), aos fragmentos de DNA com marcação 5', desse modo gerando uma biblioteca de fragmentos de DNA com marcação 5' e 3' com marcadores de sequenciação em cada extremidade (por exemplo, os marcadores de sequenciação 454A e Roche 454B). Os fragmentos de DNA com marcação 5' e 3' da biblioteca com o intervalo de tamanhos desejado são utilizados como modelos para sequenciação de geração seguinte utilizando o Sistema FLX Sequenciador de Genoma Roche 454. Noutras formas de realização, fragmentos de DNA com marcação 5' e 3' são gerados com primeiro e segundo marcadores que são marcadores de sequenciação para sequenciação de geração seguinte utilizando outras plataformas de sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS).
Nalgumas formas de realização, cada uma das diferentes extremidades de transposão de filamentação dupla compreende um filamento transferido diferente que tem uma porção 5' e uma porção 3', em que a porção 5' de cada filamento transferido diferente exibe uma sequência marcadora desejada diferente e a porção 3' exibe a respetiva sequência de extremidade de transposão transferida. Nalgumas formas de realização, por exemplo, como mostrado num exemplo apresentado na FIG. 8, os fragmentos de DNA com marcação 5' e 3' da biblioteca têm um primeiro marcador na sua extremidade 5' e um segundo marcador na sua extremidade 3'. As diferentes extremidades de transposão apresentadas na FIG. 8 foram inseridas em diferentes localizações durante eventos separados de transposição in vitro catalisados pela mesma transposase. No entanto, nalgumas formas de realização diferentes, são utilizadas transposases diferentes que formam complexos de transposição funcionais com diferentes extremidades de transposão. Os diferentes marcadores nas porções 5' do filamento transferido de cada extremidade de transposão podem exibir quaisquer sequências desejadas para qualquer finalidade desejada. A titulo exemplificativo, nalgumas formas de realização, o primeiro marcador e segundo marcador dos fragmentos de DNA com marcação 5' e 3' exibem as sequências dos marcadores de sequenciação Roche 454A e 454B e, após isolamento dos fragmentos no intervalo de tamanhos desejado, são utilizados como modelos para a geração seguinte utilizando o Sistema FLX Sequenciador de Genoma Roche 454. De modo semelhante, noutras formas de realização, os fragmentos de DNA com marcação 5' e 3', após isolamento daqueles que estão no intervalo de tamanhos desejado, são utilizados como modelos para a geração seguinte utilizando outra plataforma de sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS). Nalgumas formas de realização preferenciais, os fragmentos de DNA com marcação 5' e 3' são gerados utilizando este método a partir de DNA-alvo compreendendo um genoma completo de uma célula ou organismo.
Nalgumas formas de realização, o filamento transferido da primeira extremidade de transposão ou da segunda extremidade de transposão é etiquetado com uma molécula de ligação de afinidade (por exemplo, biotina) ou com uma molécula detetável (por exemplo, um corante fluorescente) que permite captura (por exemplo, utilizando uma superfície à qual está ligada estreptavidina para captura das moléculas biotiniladas) ou deteção de fragmentos de DNA com marcação 5' e 3' que têm um marcador com a molécula de ligação de afinidade ou a molécula detetável na extremidade 5'.
Adição de Um Domínio Marcador a Fragmentos de DNA com Marcação 5' e 3' : Nalgumas formas de realização, uma DNA polimerase e um oligonucleótido compreendendo um modelo para um domínio marcador são utilizados para adicionar um domínio marcador às extremidades 3' dos fragmentos de DNA com marcação 5' e 3' na biblioteca de fragmentos de DNA marcados (por exemplo, FIG. 19). Nalgumas formas de realização, a DNA polimerase utilizada para adicionar o domínio marcador é uma DNA polimerase termoestável e o oligonucleótido é um "primer" de PCR, e o domínio marcador é unido ao segundo marcador por realização de PCR. III. Fragmentação, Marcação E Amplificação Por "Primer" Único De DNA-Alvo
Um método preferencial da invenção compreende: incubar um complexo de transpossoma que consiste numa transposase e numa extremidade de transposão com a qual forma um complexo de transposição com DNA-alvo numa reação de transposição in vitro em condições e durante um período de tempo suficiente em que a extremidade de transposão transferida é inserida em múltiplos sítios em ambos os filamentos do DNA-alvo; incubar os produtos da reação de transposição in vitro com uma DNA polimerase que tem atividade de deslocamento de filamento e/ou nuclease 5' em condições e durante um período de tempo suficiente em que a extremidade 3' de cada filamento de DNA-alvo que tem a extremidade de transposão transferida unida à sua extremidade 5' é estendida utilizando o filamento oposto do DNA-alvo como modelo, em que cada uma das referidas extensões catalisadas por DNA polimerase desloca ou digere a extremidade de transposão não transferida que é emparelhada com a extremidade de transposão transferida adjacente seguinte que é unida ao filamento oposto do DNA-alvo, desse modo gerando uma biblioteca de fragmentos de DNA duplamente marcados em que cada um compreende uma porção diferente do DNA-alvo com um filamento transferido na sua extremidade 5' e um filamento não transferido na sua extremidade 3', em que a população de todos os fragmentos de DNA duplamente marcados é substancialmente representativa da sequência do DNA-alvo de onde foram gerados, e incubar a biblioteca de fragmentos de DNA duplamente marcados com uma DNA polimerase termoestável e um único "primer" que exibe pelo menos uma porção da sequência de extremidade de transposão transferida em condições de aplicação de ciclos térmicos em PCR, desse modo gerando uma biblioteca amplificada dos fragmentos de DNA duplamente marcados. Nalgumas formas de realização preferenciais, o método compreende gerar a biblioteca amplificada de fragmentos de DNA duplamente marcados na presença de um ou mais dNTPs etiquetados que são utilizados como substratos pela DNA polimerase termoestável, desse modo gerando uma biblioteca amplificada de fragmentos de DNA duplamente marcados etiquetados.
Assim, uma forma de realização da invenção consiste num método in vitro para amplificação por "primer" único de fragmentos de DNA gerados a partir de um DNA-alvo, em que o método compreende: realizar uma reação de transposição na presença de um DNA-alvo e na presença de uma extremidade de transposão consistindo num filamento transferido que exibe a sequência de extremidade de transposão transferida e um filamento não transferido que exibe a sequência de extremidade de transposão não transferida, em que a referida reação de transposição origina múltiplas inserções compreendendo união da extremidade de transposão transferida a cada filamento do DNA-alvo, desse modo gerando fragmentos de DNA com marcação 5' que são emparelhados uns com os outros, cada um dos quais tem um primeiro marcador na sua extremidade 5' que exibe a sequência de extremidade de transposão transferida; estender as extremidades 3' dos fragmentos de DNA com marcação 5' com a DNA polimerase que tem atividade de deslocamento de filamento e/ou nuclease 5' utilizando os filamentos opostos com os quais os fragmentos de DNA com marcação 5' são emparelhados como modelos, e conduzir uma reação de amplificação por PCR utilizando um único "primer" que exibe pelo menos uma porção da sequência de extremidade de transposão transferida, uma DNA polimerase termoestável e pelo menos um dNTP etiquetado que é utilizado como substrato pela DNA polimerase termoestável, desse modo gerando a biblioteca amplificada de fragmentos de DNA duplamente marcados que são representativos do DNA-alvo.
Nalgumas formas de realização preferenciais, o DNA-alvo é selecionado de entre DNA genómico eucariótico e/ou procariótico ou cDNA de filamentação dupla preparado por transcrição reversa de RNA.
Nalgumas formas de realização preferenciais, o transpossoma é um complexo de uma forma de tipo selvagem ou mutante hiperativa de uma transposase selecionada de entre transposase Tn5, transposase MuA, transposase Bela Adormecida, transposase Mariner, transposase Tn7, transposase TnlO, transposase Tyl e transposase Tn552 e uma extremidade de transposão com a qual a transposase forma um complexo que é ativo numa reação de transposição.
Nalgumas formas de realização preferenciais, uma única enzima ou mistura enzimática é utilizada como DNA polimerase que tem atividade de deslocamento de filamento e nuclease 5' e DNA polimerase termoestável, cuja DNA polimerase ou mistura é selecionada de entre formas de tipo selvagem ou recombinantes de DNA polimerase TAQ, DNA polimerase Tfl, DNA polimerase Tth e mistura de DNA polimerase FAILSAFE™.
Nalgumas formas de realização preferenciais, o pelo menos um dNTP etiquetado compreende uma etiqueta, por exemplo, uma cianina (por exemplo, Cy5.5, Cy5, Cy3, Cy2), FITC, Alexa Fluors (por exemplo, 647, 594), Texas Red, JOE, 5-FAM, 6-FAM, VIC, HEX, 6-ROX, Rodamina, Lissamina, Cyan 500, etc. (Ver, por exemplo, "Handbook of Molecular Probes", R. Haughland, Molecular Probe, Eugene OR).
Nalgumas formas de realização preferenciais, a biblioteca ou uma biblioteca amplificada de fragmentos de DNA com marcação 5' e 3' gerada utilizando este método provém de DNA-alvo que compreende ou consiste num genoma completo de uma célula ou organismo. Nalgumas formas de realização, a biblioteca ou uma biblioteca amplificada de fragmentos de DNA duplamente marcados gerada utilizando este método provém de DNA-alvo que compreende ou consiste em genomas e/ou cDNA de filamentação dupla de todos os organismos (por exemplo, múltiplos organismos) que estão presentes numa amostra ambiental (por exemplo, para investigação ou aplicações metagenómicas ou metatranscriptómicas).
Nalgumas formas de realização preferenciais do método, o filamento transferido exibe apenas a sequência de extremidade de transposão transferida e, em consequência, o primeiro marcador que está presente nos fragmentos de DNA com marcação 5' exibe apenas a sequência de extremidade de transposão transferida. Nalgumas formas de realização diferentes, o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', em que a porção 3' exibe a sequência de extremidade de transposão transferida e a porção 5' exibe qualquer outro nucleótido ou sequência de nucleótidos desejado, em cujas formas de realização o primeiro marcador compreende ou consiste na porção 3' e na porção 5'. Em formas de realização em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', o filamento não transferido pode exibir, mas não é necessário, uma sequência que é complementar à porção 5' do filamento transferido. Nalgumas formas de realização preferenciais em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', a porção 5' exibe pelo menos um nucleótido que compreende um domínio de captura (por exemplo, um nucleótido que compreende uma fração biotina, que pode ser capturada por uma fração estreptavidina que está ligada a uma superfície; ou, por exemplo, outra molécula de ligação de afinidade). II. Fragmentação e Marcação De DNA Utilizando Uma Transposase E Uma Ligase A presente invenção compreende métodos, composições e estojos para utilização de uma transposase para gerar fragmentos com marcação 5' de DNA-alvo compreendendo ou consistindo em uma ou mais moléculas de filamentação dupla (dsDNA) e depois unir um segundo marcador, que exibe uma sequência de DNA diferente da do primeiro marcador, às extremidades 3' dos referidos fragmentos de DNA com marcação 5'. 0 primeiro marcador exibe a sequência do filamento transferido da extremidade de transposão reconhecida pela transposase e, opcionalmente, também exibe uma ou mais sequências diferentes que estão a 5 ' da sequência da referida extremidade de transposão transferida. 0 segundo marcador é unido às extremidades 3' dos fragmentos de DNA com marcação 5' in vitro utilizando uma ácido nucleico ligase.
Um método da invenção compreende: incubar uma transposase e uma extremidade de transposão com a qual forma um complexo de transposição numa reação de transposição in vitro com DNA-alvo em condições e durante um período de tempo suficiente em que a extremidade de transposão transferida é unida ao DNA-alvo, gerando fragmentos de DNA com marcação 5' que têm um primeiro marcador nas suas extremidades 5' ; incubar os fragmentos de DNA com marcação 5' com uma ácido nucleico ligase e um oligonucleótido de marcação de ligação que compreende ou consiste num segundo marcador em condições e durante um período de tempo suficiente em que o oligonucleótido de marcação de ligação é unido às extremidades 3' dos fragmentos de DNA com marcação 5', gerando uma biblioteca de fragmentos de DNA com marcação 5' e 3'. Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar a biblioteca de fragmentos de DNA com marcação 5' e 3' utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao segundo marcador. Nalgumas formas de realização, o passo de amplificar a biblioteca de fragmentos de DNA com marcação 5' e 3' utilizando uma DNA polimerase compreende amplificação por PCR utilizando uma DNA polimerase termoestável, um primeiro "primer" de PCR que é complementar ao segundo marcador e um segundo "primer" de PCR que exibe uma sequência que é idêntica a pelo menos uma porção da sequência exibida pelo primeiro marcador.
Uma forma de realização preferencial da presente invenção consiste num método para gerar uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA com marcação 5' e 3' a partir de DNA-alvo que compreende ou consiste numa ou mais moléculas de filamentação dupla (dsDNA), em que o método compreende:
Proporcionar: 1. DNA-alvo que compreende ou consiste em uma ou mais moléculas de filamentação dupla (dsDNA) (por exemplo, DNA genómico eucariótico e/ou procariótico ou cDNA de filamentação dupla preparado por transcrição reversa de RN A) , 2. uma transposase (por exemplo, uma transposase de tipo selvagem ou mutante; por exemplo, transposase Tn5 de tipo selvagem ou mutante, por exemplo, transposase EZ-Tn5™, ou, por exemplo, transposase MuA HYPERMU™, EPICENTRE Biotechnologies, Madison, WI, EUA), e 3. uma extremidade de transposão que é capaz de formar um complexo funcional com a transposase numa reação de transposição (por exemplo, a extremidade de transposão da extremidade externa ("OE"), extremidade de transposão da extremidade interna ("IE") ou extremidade de transposão da "extremidade em mosaico" ("ME") de 19 pb reconhecida por uma transposase Tn5 de tipo selvagem ou mutante, por exemplo, por transposase EZ-Tn5™, ou a extremidade de transposão Rl e R2, por exemplo, por transposase MuA HYPERMU™), em que a referida extremidade de transposão compreende DNA de filamentação dupla consistindo num filamento transferido e num filamento não transferido que, em combinação, exibem as sequências da extremidade de transposão de filamentação dupla, em que o filamento transferido exibe a sequência de um primeiro marcador, 4. um oligonucleótido de marcação de ligação que tem uma extremidade 5' que é capaz de ser ligada ao 3' hidroxilo de uma molécula de DNA e que exibe uma sequência de um segundo marcador, e 5. uma ácido nucleico ligase;
Incubar o DNA-alvo com a transposase e a extremidade de transposão em condições e durante um período de tempo suficiente em que a inserção catalisada por transposase da extremidade de transposão no DNA-alvo gera fragmentos de DNA com marcação 5', cada um dos quais tem o primeiro marcador na sua extremidade 5' , e
Incubar os fragmentos de DNA com marcação 5' com a ácido nucleico ligase e o oligonucleótido de marcação de ligação em condições e durante um período de tempo suficiente em que o segundo marcador é unido às suas extremidades 3' e é gerada uma biblioteca de fragmentos de DNA com marcação 5' e 3', em que cada um dos fragmentos de DNA marcados tem o primeiro marcador na extremidade 5' e o segundo marcador na extremidade 3'.
Nalgumas formas de realização preferenciais, o filamento transferido exibe apenas a sequência de extremidade de transposão transferida e, em consequência, o primeiro marcador que está presente nos fragmentos de DNA marcados exibe apenas a sequência de extremidade de transposão transferida. Nalgumas formas de realização diferentes, o filamento transferido compreende ou consiste numa porção 3' e numa porção 5' , em que a porção 3' exibe a sequência de extremidade de transposão transferida e a porção 5' exibe qualquer outra sequência desejada, em cujas formas de realização o primeiro marcador compreende ou consiste na porção 3' e na porção 5'. Em formas de realização em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', o filamento não transferido pode exibir, mas não é necessário, uma sequência que é complementar à porção 5' do filamento transferido.
Nalgumas formas de realização em que o filamento transferido compreende ou consiste numa porção 3' e numa porção 5', a porção 5' exibe a sequência de um marcador de sequenciação (por exemplo, um primeiro marcador de sequenciação Roche 454, por exemplo, o Roche 454A) e a porção 3' exibe a sequência do filamento transferido da extremidade de transposão. Um "marcador de sequenciação", como usado no presente documento, significa um marcador que é unido à extremidade 5' ou extremidade 3' de um fragmento de DNA de filamentação simples gerado a partir da molécula de DNA-alvo, cujo marcador se destina à finalidade de facilitar a sequenciação do referido fragmento de DNA. Por exemplo, nalgumas formas de realização, o marcador de sequenciação proporciona um sítio para captura do referido filamento de fragmento de DNA numa superfície e/ou para iniciação da síntese de DNA do referido fragmento de DNA ou do complemento do referido fragmento de DNA (por exemplo, são utilizados os marcadores de sequenciação Roche 454A e 454B para o Sistema FLX Sequenciador de Genoma Roche 454) . Assim, quando a porção 5' do filamento transferido exibe a sequência de um marcador de sequenciação, os fragmentos de DNA com marcação 5' têm um primeiro marcador que compreende ou consiste no marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454) . Em seguida, a ácido nucleico ligase liga um oligonucleótido de marcação de ligação que tem um segundo marcador compreendendo ou consistindo num segundo marcador de sequenciação (por exemplo, o marcador de sequenciação Roche 454B) aos fragmentos de DNA com marcação 5', desse modo gerando a biblioteca de fragmentos de DNA com marcação 5' e 3' com marcadores de sequenciação em cada extremidade (por exemplo, os marcadores de sequenciação 454A e Roche 454B). Os fragmentos de DNA com marcação 5' e 3' são gerados de modo a terem um intervalo de tamanhos desejado apropriados para utilização como modelos para sequenciação de geração seguinte utilizando o Sistema FLX Sequenciador de Genoma Roche 454. Noutras formas de realização, é gerada uma biblioteca de fragmentos de DNA marcados compreendendo fragmentos de DNA marcados de um tamanho e com primeiro e segundo marcadores que são apropriados para utilização como marcadores de sequenciação para sequenciação de geração seguinte utilizando outra plataforma de sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS).
Ligação Dependente do Modelo do Segundo Marcador
Nalgumas formas de realização preferenciais, o método compreende proporcionar um oligonucleótido de marcação de ligação que compreende ou consiste numa porção 3' e numa porção 5', em que a porção 3' exibe um segundo marcador que compreende ou consiste em qualquer sequência que é desejado unir à extremidade 3' dos fragmentos de DNA com marcação 5' (isto é, uma sequência arbitrária) e a porção 5' tem um grupo 5' -monofosfato e exibe uma sequência aleatória (por exemplo, uma sequência aleatória consistindo em cerca de três até cerca de oito nucleótidos) na sua extremidade 5'. Nalgumas formas de realização preferenciais, o oligonucleótido de marcação de ligação tem uma porção 5' que exibe uma sequência aleatória de quatro nucleótidos (por exemplo, nalgumas formas de realização descritas no presente documento em que a transposase é uma transposase Tn5 de tipo selvagem ou mutante (por exemplo, transposase EZ-Tn5™ ou, por exemplo, transposase MuA HYPERMU™, EPICENTRE Biotechnologies, Madison, WI, EUA) e a ácido nucleico ligase é DNA ligase de E. coli). A invenção não está limitada a um oligonucleótido de marcação de ligação que tem uma porção 5' que exibe uma sequência aleatória consistindo em cerca de três até cerca de oito nucleótidos. Por exemplo, a invenção também inclui métodos em que o oligonucleótido de marcação de ligação tem uma porção 5' que: exibe uma sequência aleatória consistindo em apenas dois nucleótidos; exibe uma sequência aleatória consistindo em mais do que oito nucleótidos; exibe uma sequência semialeatória em vez de uma sequência totalmente aleatória, ou exibe uma sequência compreendendo um ou mais nucleótidos degenerados (por exemplo, um nucleótido inosina) em vez de uma sequência totalmente aleatória. No entanto, é preferencial um oligonucleótido de marcação de ligação que tem uma porção 5' que exibe uma sequência aleatória consistindo em cerca de três até cerca de oito nucleótidos.
Nalgumas formas de realização preferenciais, a ligação do oligonucleótido de marcação de ligação à extremidade 3' dos fragmentos de DNA com marcação 5' ocorre apenas na presença de um modelo de DNA que exibe uma sequência que é exatamente complementar à junção de ligação; em tais formas de realização, o modelo com o qual emparelham as duas moléculas de ácidos nucleicos que são ligadas é denominado no presente documento "modelo de ligação" e a ligação é denominada "ligação dependente do modelo". Nalgumas formas de realização em que a ligação ocorre apenas na presença de um modelo de ligação, a ácido nucleico ligase é uma DNA ligase que requer um modelo de ligação e é denominada no presente documento "ligase dependente do modelo" (por exemplo, uma DNA ligase dependente do modelo do tipo NAD, tal como mas não se limitando a DNA ligase de E. coli, DNA ligase Tth, DNA ligase Tfl ou DNA ligase AMPLIGASE®, que são disponibilizadas pela EPICENTRE Biotechnologies, Madison, WI, EUA). Nalgumas formas de realização diferentes em que a ligação ocorre apenas na presença de um modelo de ligação, a ácido nucleico ligase é uma DNA ligase que, apesar de não requerer um modelo de ligação para a ligação, catalisa a ligação mais eficientemente na presença do modelo de ligação do que na sua ausência (por exemplo, uma DNA ligase dependente do modelo do tipo ATP, tal como mas não se limitando a DNA ligase de T4 ou DNA ligase FASTLINK™, que são disponibilizadas pela EPICENTRE Biotechnologies, Madison, WI, EUA) . Se a ligação ocorrer num modelo de ligação, a ligação é denominada "ligação dependente do modelo" no presente documento, mesmo que a ligase também possa catalisar ligação independente do modelo. Em formas de realização preferenciais, a sequência aleatória do oligonucleótido de marcação de ligação é curta, em cujas formas de realização é preferencial um ácido nucleico que catalisa ligase dependente do modelo a uma temperatura mais baixa (por exemplo, menor ou igual a cerca de 40 °C, menor ou igual a cerca de 37 °C, menor ou igual a cerca de 30 °C, menor ou igual a cerca de 25 °C ou menor ou igual a cerca de 20 °C). Nalgumas formas de realização preferenciais, a ligase dependente do modelo é DNA ligase de E. coli. A invenção não está limitada no que se refere ao método de ligação utilizado com a exceção de que, relativamente a formas de realização compreendendo ligação dependente do modelo, a ligação deve ocorrer eficientemente na presença de uma sequência-alvo com a qual o oligonucleótido de marcação de ligação e os fragmentos de DNA com marcação 5' emparelham de modo contíguo e a ligação deve ocorrer raramente ou não deve ocorrer na ausência de uma sequência-alvo. Como usado no presente documento, "ligação dependente do modelo" refere-se a qualquer método adequado para unir extremidades 5' e 3' adjacentes de oligonucleótidos de marcação de ligação e fragmentos de DNA com marcação 5', respetivamente, que são adjacentes ou contíguos ou que confinam entre si quando emparelhados com uma sequência-alvo. A inserção catalisada por transposase da extremidade de transposão em ambos os filamentos do DNA-alvo origina fragmentação do DNA-alvo, união da extremidade de transposão transferida a cada filamento do DNA-alvo e geração de uma região de 9 bases de DNA-alvo de filamentação simples a 3' do sítio de união da extremidade de transposão transferida, o que origina uma região de hiato no filamento oposto do DNA-alvo (por exemplo, FIG. 3) . A região de filamentação simples de DNA-alvo a jusante da extremidade de transposão transferida pode servir de modelo de ligação para emparelhamento da porção aleatória do oligonucleótido de marcação de ligação. Entre todas as sequências representadas pelo oligonucleótido de marcação de ligação que exibe a sequência aleatória na sua porção 5' (o que inclui todas as sequências possíveis), pelo menos uma delas exibe uma sequência na sua extremidade 5 ' que é capaz de emparelhamento com cada região de filamentação simples no DNA-alvo de modo que a extremidade fosforilada em 5' desse oligonucleótido de marcação de ligação é adjacente e confina com a extremidade 3' do DNA-alvo que é complementar ao fragmento de DNA com marcação 5', em cujo caso a ácido nucleico ligase pode então catalisar a ligação dependente do modelo do oligonucleótido de marcação de ligação à referida extremidade 3'. Nalgumas formas de realização, o filamento transferido da extremidade de transposão é inserido em filamentos opostos do DNA-alvo em duas localizações que estão relativamente próximas, gerando dois fragmentos de DNA com marcação 5' como mostrado na FIG. 2 e dois fragmentos de DNA com marcação 5' e 3' como mostrado na FIG. 7. Por desnaturação dos dois fragmentos de DNA com marcação 5' e 3', podem ser utilizados para uma variedade de aplicações, incluindo para amplificação (por exemplo, por PCR utilizando um primeiro "primer" de PCR que é complementar ao segundo marcador e um segundo "primer" de PCR que é complementar ao primeiro marcador).
Nalgumas formas de realização do método que compreende utilizar uma ácido nucleico ligase e ligação dependente do modelo para unir um segundo marcador aos fragmentos de DNA com marcação 5', os fragmentos de DNA com marcação 5' e 3' compreendem um primeiro marcador 5' que exibe uma sequência de extremidade de transposão e um segundo marcador 3' que não exibe uma sequência de extremidade de transposão (apesar de a porção 3' do oligonucleótido de marcação de ligação poder compreender ou consistir num segundo marcador que exibe qualquer sequência desejada, incluindo, se desejado, uma sequência de extremidade de transposão). Por exemplo, nalgumas formas de realização, a porção 3' do oligonucleótido de marcação de ligação exibe a sequência do marcador de sequenciação Roche 454 ou de um marcador de sequenciação para outra plataforma de sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS). A titulo de exemplo adicional, nalgumas formas de realização, o segundo marcador na porção 3' do oligonucleótido de marcação de ligação exibe a sequência de um promotor de RNA polimerase (por exemplo, um promotor de RNA polimerase do tipo T7; por exemplo, um promotor de RNA polimerase de T7, T3, SP6 ou fago N4 MINI-V™; EPICENTRE Biotechnologies, Madison, WI, EUA); em geral, se a RNA polimerase necessitar de um promotor de RNA polimerase de filamentação dupla, o segundo marcador nestas formas de realização exibe a "sequência promotora sentido de RNA polimerase", significando a sequência promotora da RNA polimerase que é unida à extremidade 3' do filamento de DNA modelo que é transcrito pela RNA polimerase, em cujas formas de realização, a "sequência promotora antissentido de RNA polimerase" complementar também deve ser proporcionada ou sintetizada durante um passo do método para gerar um promotor de RNA polimerase de filamentação dupla que será reconhecido pela RNA polimerase. Nalgumas formas de realização, o segundo marcador na porção 3' do oligonucleótido de marcação de ligação também exibe a sequência de um "marcador de endereço", significando uma sequência que permite identificação de uma amostra especifica (por exemplo, por utilização de um marcador de endereço num oligonucleótido de marcação de ligação que exibe uma sequência diferente para cada amostra de DNA-alvo). Nalgumas formas de realização, a porção 3' do oligonucleótido de marcação de ligação também exibe a sequência de um ou mais marcadores diferentes para uma finalidade particular no método.
Nalgumas formas de realização preferenciais, a porção 5' do oligonucleótido de marcação de ligação é uma sequência aleatória de um comprimento que é capaz de emparelhamento com as porções de filamentação simples dos fragmentos de DNA com marcação 5' gerados a partir de inserção catalisada por transposase das extremidades de transposão em ambos os filamentos do DNA-alvo. A sequência aleatória na porção 5' do oligonucleótido de marcação de ligação emparelha com esta região de hiato de filamentação simples adjacente à extremidade 3' dos fragmentos de DNA com marcação 5 ' , que serve de modelo de ligação para ligação dependente do modelo do oligonucleótido de marcação de ligação às extremidades 3' do filamento complementar de DNA-alvo. Em formas de realização utilizando transposase EZ-Tn5™, a inserção dos oligonucleótidos de extremidade de transposão EZ-Tn5™ de 19 pb em ambos os filamentos do DNA-alvo gera fragmentos de DNA com marcação 5' que exibem hiatos de 9 bases consistindo em regiões de filamentação simples que são opostas aos sítios de inserção da extremidade de transposão transferida. No entanto, o tamanho do hiato onde o oligonucleótido de marcação de ligação pode emparelhar varia para diferentes enzimas transposase. Por exemplo, a transposase MuA gera uma região de filamentação simples de DNA-alvo a jusante do sítio de inserção da extremidade de transposão transferida que tem apenas cinco nucleótidos. Nalgumas formas de realização, a sequência aleatória do oligonucleótido de marcação de ligação compreende ou consiste em entre cerca de três e cerca de oito nucleótidos aleatórios. No entanto, o comprimento da porção da sequência aleatória do oligonucleótido de marcação de ligação pode variar para diferentes enzimas transposase com base no tamanho da região de filamentação simples gerada e outros fatores, tais como o comprimento da sequência aleatória que é mais eficientemente ligada à respetiva ácido nucleico ligase e condições de ligação utilizadas. Por exemplo, os Requerentes observaram que, utilizando fragmentos de DNA com marcação 5' gerados utilizando transposase EZ-Tn5™, um oligonucleótido de marcação de ligação com uma porção 5' consistindo numa sequência aleatória de quatro nucleótidos gerou bons rendimentos de fragmentos de DNA com marcação 5' e 3' utilizando DNA ligase de E. coli como ácido nucleico ligase. No entanto, este oligonucleótido de marcação de ligação com uma porção 5' consistindo numa sequência aleatória de quatro nucleótidos não foi eficientemente ligado por ligases termoestáveis dependentes de DNA, como ligase termoestável AMPLIGASE®, em condições de ligação semelhantes. Em formas de realização preferenciais, os fragmentos de DNA com marcação 5' e 3' compreendem ou consistem em todos os fragmentos de DNA gerados a partir da amostra de DNA.
Nalgumas formas de realização, a ácido nucleico ligase para ligação dependente do modelo é uma ligase que emprega NAD como cofator. Nalgumas formas de realização, a ácido nucleico ligase para ligação dependente do modelo é selecionada de entre as seguintes DNA ligases do tipo NAD: DNA ligase de E. coli, DNA ligase Tth, DNA ligase Tfl e DNA ligase Ampligase® (todas disponibilizadas pela EPICENTRE Biotechnologies, Madison, WI, EUA) e DNA ligase Tsc (Roche Applied Systems, Indianapolis, IN, EUA). Nalgumas formas de realização, a ácido nucleico ligase para ligação dependente do modelo é uma DNA ligase do tipo ATP. Nalgumas formas de realização, a DNA ligase do tipo ATP é selecionada de entre: DNA ligase de T4 e DNA ligase FASTLINK™ (EPICENTRE Biotechnologies, Madison, WI, EUA) . Nalgumas formas de realização preferenciais, a ácido nucleico ligase é selecionada de entre DNA ligase de E. coli ou outra DNA ligase bacteriana mesofílica que emprega NAD como cofator. Nalgumas formas de realização preferenciais, a seleção de tamanhos e purificação do fragmentos de DNA com marcação 5' de tamanho selecionado são realizados para melhorar a eficiência da ligação do oligonucleótido de marcação de ligação aos fragmentos de DNA com marcação 5' utilizando a DNA ligase dependente do modelo de DNA (por exemplo, DNA ligase de E. coli) .
Ligação Independente do Modelo do Segundo Marcador
Nalgumas formas de realização do método que compreende unir o segundo marcador à extremidade 3' dos fragmentos de DNA com marcação 5' utilizando uma ácido nucleico ligase, o oligonucleótido de marcação de ligação que exibe o segundo marcador é ligado diretamente à extremidade 3' dos fragmentos de DNA com marcação 5' sem emparelhamento do oligonucleótido de marcação de ligação a um modelo de ligação adjacente às extremidades 3' dos fragmentos de DNA com marcação 5'. Nestas formas de realização, o oligonucleótido de marcação de ligação não exibe uma sequência aleatória; ao invés, exibe apenas a sequência do segundo marcador que é desejado unir aos fragmentos de DNA com marcação 5' . Nestas formas de realização, o oligonucleótido de marcação de ligação é ligado diretamente às extremidades 3' de fragmentos de DNA com marcação 5' de filamentação simples sem utilização de um modelo de ligação. Nestas formas de realização do método, a ácido nucleico ligase é uma ácido nucleico ligase que é capaz de ligar uma molécula de DNA de filamentação simples que tem um grupo 3'-hidroxilo a uma molécula de DNA de filamentação simples que tem um grupo 5' -monofosfato na ausência de emparelhamento com uma complementar sequência na junção de ligação (por exemplo, selecionada de entre RNA ligase de T4 1, RNA ligase de T4 2, RNA ligase termoestável de bacteriófago TS2126 e DNA ligase CIRCLIGASE™, EPICENTRE Biotechnologies, Madison, WI, EUA), e o método compreende adicionalmente o passo seguinte: desnaturar dsDNA compreendendo os fragmentos de DNA com marcação 5' antes de incubar os fragmentos de DNA com marcação 5' com a ácido nucleico ligase e o oligonucleótido de marcação de ligação. A invenção não está limitada a uma ácido nucleico ligase particular e será entendido que os métodos que compreendem incubar os fragmentos de DNA com marcação 5' com uma ácido nucleico ligase em condições e durante um período de tempo suficiente em que o segundo marcador é unido às suas extremidades 3' e é gerada uma biblioteca de fragmentos de DNA com marcação 5' e 3' também compreendem a utilização de outras composições em vez da ácido nucleico ligase para união dependente do modelo ou independente do modelo. A título exemplificativo, podem ser utilizados outros métodos de ligação, tais como mas não se limitando a utilização de um oligonucleótido de marcação de ligação que compreende uma fração topoisomerase, em que a ligação compreende ligação mediada por topoisomerase (por exemplo, Patente U.S. No. 5,766,891), apesar de ligação mediada por topoisomerase não ser preferencial na maior parte das formas de realização. IV. Geração De Fragmentos De Ss-DNA Circulares Marcados A Partir De Ds-DNA-Alvo Utilizando Uma Transposase E Uma Ligase (30842) A presente invenção compreende métodos, composições e estojos para gerar uma biblioteca que compreende uma população de fragmentos de ssDNA circulares marcados a partir de DNA-alvo numa amostra para utilização como modelos em sequenciação de DNA ou reações de amplificação de ácidos nucleicos. Em geral, cada fragmento de ssDNA circular marcado na biblioteca exibe uma sequência contígua de uma porção do DNA-alvo e de um marcador.
Em resumo, em certas formas de realização, o método compreende: incubar o DNA-alvo, que geralmente é dsDNA, com uma transposase e uma composição de extremidade de transposão num reação de transposição in vitro para simultaneamente fragmentar e marcar o DNA-alvo, desse modo gerando uma população de fragmentos de DNA marcados; depois desnaturar os fragmentos de DNA marcados para gerar fragmentos de ssDNA com marcação 5' e então incubar os fragmentos de ssDNA com marcação 5' com uma ácido nucleico ligase independente do modelo ou não homóloga que é capaz de catalisar ligação intramolecular independente do modelo (isto é, circularização) de ssDNA para gerar uma biblioteca de fragmentos de ssDNA circulares marcados. Nalgumas formas de realização, os fragmentos de ssDNA circulares marcados são linearizados por emparelhamento de um oligodesoxirribonucleótido que emparelha com um sitio de restrição no marcador e depois tratamento com a endonuclease de restrição para gerar fragmentos de ssDNA lineares que têm uma porção do marcador nas suas extremidades 5' e a porção restante do marcador nas suas extremidades 3' (cujos fragmentos de ssDNA lineares são denominados no presente documento "fragmentos de ssDNA lineares duplamente marcados" ou simplesmente "fragmentos de ssDNA duplamente marcados").
Nalgumas formas de realização, os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados são utilizados como modelos de DNA na amplificação de ácido nucleico e/ou reações de sequenciação de DNA. Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar e/ou sequenciar a biblioteca dos fragmentos de ssDNA circulares marcados (por exemplo, para amplificar ou determinar a sequência do DNA-alvo) . Nalgumas formas de realização, o método compreende adicionalmente o passo de sequenciação de DNA que é complementar ao DNA-alvo obtido por amplificação dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados. Nalgumas formas de realização, pelo menos uma porção dos DNAs-alvo em cada um dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao marcador (por exemplo, para sequenciação por síntese) . Nalgumas formas de realização, pelo menos uma porção dos DNAs-alvo em cada um dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada utilizando uma ligase dependente do modelo para ligar pelo menos um oligodesoxirribonucleótido que é complementar ao marcador e pelo menos um outro oligodesoxirribonucleótido que emparelha com a porção da sequência-alvo (por exemplo, sequenciação por ligação). Nalgumas formas de realização, pelo menos uma porção do DNA-alvo em cada um dos fragmentos de ssDNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada por emparelhamento de oligodesoxirribonucleótidos que emparelham ou hibridizam com o marcador e com uma porção da sequência-alvo (por exemplo, sequenciação por hibridização). Nalgumas formas de realização, DNA que é complementar aos fragmentos de ssDNA circulares marcados ou aos fragmentos de ssDNA lineares duplamente marcados é sequenciado utilizando sequenciação por síntese, sequenciação por ligação ou sequenciação por hibridização.
Assim, uma forma de realização preferencial da presente invenção consiste num método para gerar uma biblioteca compreendendo uma população de fragmentos de ssDNA circulares marcados a partir de DNA-alvo numa amostra para utilização como modelos em sequenciação de DNA ou reações de amplificação de ácidos nucleicos, em que cada um desses fragmentos de ssDNA circulares marcados exibe a sequência de uma porção do DNA-alvo e a sequência de um marcador que é unido à porção da sequência-alvo, em que o método compreende:
Proporcionar: 1. DNA-alvo que compreende ou consiste numa ou mais moléculas de filamentação dupla (dsDNA) (por exemplo, DNA genómico eucariótico e/ou procariótico ou cDNA de filamentação dupla preparado por transcrição reversa de RNA utilizando uma DNA polimerase dependente de RNA ou transcriptase reversa para gerar cDNA de primeiro filamento e depois extensão de um "primer" emparelhado com o cDNA de primeiro filamento para gerar dsDNA), 2. uma transposase (por exemplo, uma transposase de tipo selvagem ou mutante; por exemplo, transposase Tn5 de tipo selvagem ou mutante, por exemplo, transposase EZ-Tn5™, por exemplo, transposase MuA HYPERMU™, EPICENTRE Biotechnologies, Madison, WI, EUA), e 3. uma composição de extremidade de transposão que é capaz de formar um complexo funcional com a transposase numa reação de transposição (por exemplo, compreendendo ou consistindo na extremidade de transposão da extremidade externa ("OE") de 19 pb, na extremidade de transposão da extremidade interna ("IE") de 19 pb ou na extremidade de transposão da "extremidade em mosaico" ("ME") de 19 pb reconhecida por uma transposase Tn5 de tipo selvagem ou mutante, por exemplo, por transposase EZ-Tn5™), em que a referida composição de extremidade de transposão compreende ou consiste num filamento transferido e num filamento não transferido que, em combinação, exibem as sequências da extremidade de transposão de filamentação dupla, em que o filamento transferido exibe a sequência do marcador, 4. uma ácido nucleico ligase independente do modelo ou não homóloga que é capaz de ligação intramolecular independente do modelo ou circularização de ssDNA que tem um grupo 5'-monofosfato e um 3'-hidroxilo (por exemplo, RNA ligase termoestável do fago TS2126, por exemplo, em que uma elevada proporção das moléculas de RNA ligase são adeniladas);
Incubar o DNA-alvo com a transposase e a composição de extremidade de transposão em condições e durante um período de tempo suficiente em que a inserção catalisada por transposase do filamento transferido no DNA-alvo gera fragmentos de DNA com marcação 5' (por exemplo, FIG. 2), e Desnaturar o DNA-alvo compreendendo fragmentos de DNA com marcação 5' para obter fragmentos de ssDNA com marcação 5', e
Incubar os fragmentos de ssDNA com marcação 5' com a ácido nucleico ligase em condições e durante um período de tempo suficiente em que os fragmentos de ssDNA com marcação 5' são ligados de modo intramolecular para gerar uma biblioteca de fragmentos de ssDNA circulares marcados, cada um dos quais exibe a sequência de uma porção do DNA-alvo e do marcador.
Nalgumas formas de realização, antes do passo de ligação, o método compreende adicionalmente um ou mais passos para remover DNA-alvo que não é marcado durante a reação de transposição e/ou para remover componentes da composição de extremidade de transposão que não são unidos a DNA-alvo.
Nalgumas formas de realização, o método compreende adicionalmente tratar a biblioteca contendo os fragmentos de ssDNA circulares marcados com exonuclease I para remover ssDNA linear não ligado. Nalgumas formas de realização, o método compreende adicionalmente o passo de tratar a mistura reacional com exonuclease I e exonuclease III (EPICENTRE Biotechnologies, Madison, WI) para remover ssDNA linear não ligado. A exonuclease III auxilia a remoção de algum ssDNA linear por digestão de regiões de filamentação dupla de moléculas de ssDNA lineares resultantes de emparelhamento intramolecular ou intermolecular. Nalgumas formas de realização preferenciais, o método compreende adicionalmente tratar a biblioteca de fragmentos de ssDNA circulares marcados com exonuclease T5 (EPICENTRE Biotechnologies, Madison, WI) para remover ssDNA e dsDNA lineares não ligados (por exemplo, fragmentos de DNA que são cortados e/ou contêm regiões de filamentação simples).
Nalgumas formas de realização, o método compreende adicionalmente amplificar os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados por transcrição, em que o método compreende: (a) emparelhamento com a sequência de promotor sentido de um oligodesoxirribonucleótido que exibe uma sequência de promotor antissentido complementar ou emparelhamento com os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados de um "primer" que é complementar aos mesmos e extensão do "primer" com uma DNA polimerase em condições em que é sintetizado um promotor de RN A polimerase de filamentação dupla, e (b) incubação dos produtos de dsDNA com uma RNA polimerase que se liga ao promotor de RNA polimerase em condições em que é sintetizado RNA.
Nalgumas formas de realização preferenciais em que o filamento transferido ou um "primer" de PCR exibe uma sequência promotora de RNA polimerase, o promotor de RNA polimerase é um promotor de RNA polimerase do tipo T7 e o método compreende adicionalmente o passo de transcrever os fragmentos de ssDNA circulares marcados in vitro utilizando uma RNA polimerase do tipo T7 que reconhece o promotor. Muito preferencialmente, a RNA polimerase e promotor são escolhidos de entre RNAP de T7, RNAP de T3 e RNAP de SP6 e os correspondentes promotores cognatos. No entanto, passos de transcrição de um método da invenção podem empregar qualquer RNAP para a qual é conhecida ou pode ser obtida uma sequência promotora adequada que permite transcrição com elevada especificidade. Estojos e enzimas para transcrição in vitro são disponibilizados comercialmente por muitos vendedores, e as misturas e condições reacionais apropriadas para conduzir passos da presente invenção compreendendo transcrição in vitro podem empregar aqueles produtos como descrito pelos fabricantes. Por exemplo, transcrição in vitro utilizando RNAP de T7 pode ser realizada utilizando o Estojo de Transcrição AMPLISCRIBE™ T7-Flash™ ou o Estojo Transcrição de Alto Rendimento de T7 AMPLISCRIBE™ da EPICENTRE Biotechnologies, Madison, WI, como descrito na literatura do produto. De modo semelhante, se RNAP de T3 ou RNAP de SP6 for utilizada num método da invenção para transcrição in vitro, um Estojo de Transcrição de Alto Rendimento AMPLISCRIBE™ T3-Flash™ ou o Estojo de Transcrição de Alto Rendimento de SP6 AMPLISCRIBE™ (EPICENTRE Biotechnologies, Madison, WI), respetivamente, pode ser utilizado como descrito.
Nalgumas formas de realização, o filamento transferido, o oligonucleótido de marcação de ligação ou um "primer" de PCR exibe, para além da sequência promotora de RNA polimerase, sequências adicionais para tradução, tais como mas não se limitando a um sitio de ligação de ribossoma e um codão de inicio da tradução (também denominado "sinal de inicio da tradução") e o método compreende adicionalmente traduzir o RNA transcrito. Nalgumas destas formas de realização, o método compreende adicionalmente o passo de tradução in vitro dos transcritos de RNA resultantes. Sistemas e estojos para tradução in vitro dos transcritos de RNA também são disponibilizados comercialmente por muitas fontes e podem ser utilizados para a presente invenção. Por exemplo, sistemas de lisado de reticulócitos de coelho, extrato de gérmen de trigo e extrato S30 de E. coli da Promega Corporation, Madison, WI, podem ser utilizados para a presente invenção. Ainda adicionalmente, estojos para transcrição in vitro e tradução in vitro acopladas também são disponibilizados comercialmente e podem ser utilizados, tais como Sistemas de Transcrição/Tradução Acopladas TNT® Quick da Promega.
Nalgumas formas de realização diferentes, o método compreende adicionalmente o passo de amplificar e/ou sequenciar o DNA-alvo nos fragmentos de ssDNA circulares marcados utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao marcador. Nalgumas formas de realização, o passo de amplificar os fragmentos de ssDNA circulares marcados utilizando uma DNA polimerase compreende replicação por circulo rolante. Nalgumas formas de realização, o passo de amplificar os fragmentos de ssDNA circulares marcados utilizando uma DNA polimerase compreende amplificação por PCR utilizando uma DNA polimerase termoestável e um primeiro "primer" de PCR que é complementar a pelo menos uma porção do marcador e um segundo "primer" de PCR que é complementar a pelo menos uma porção do complemento do marcador. Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar os fragmentos de ssDNA circulares marcados utilizando uma RNA polimerase.
Assim, nalgumas formas de realização diferentes, o método compreende adicionalmente amplificar os fragmentos de ssDNA circulares marcados por replicação por circulo rolante (RCR), em que o método compreende: (a) emparelhar um "primer" que é complementar aos fragmentos de ssDNA circulares marcados, e (b) estender o "primer" emparelhado aos fragmentos de ssDNA circulares marcados utilizando uma DNA polimerase de deslocamento de filamento (por exemplo, DNA polimerase phi29 ou fragmento grande da DNA polimerase rBst (EPICENTRE) ou DNA polimerase DISPLACEACE™ (EPICENTRE)). Nestas formas de realização, os produtos de amplificação por RCR são moléculas concataméricas de ssDNA que são complementares aos fragmentos de ssDNA circulares marcados. Nalgumas formas de realização em que os fragmentos de ssDNA circulares marcados exibem uma sequência de promotor antissentido, os produtos de amplificação de RCR concataméricos exibem uma sequência de promotor sentido e o método compreende adicionalmente dotar o promotor de RNA polimerase de filamentação dupla (por exemplo, por emparelhamento com a sequência de promotor sentido de um oligodesoxirribonucleótido complementar que exibe uma sequência de promotor antissentido) e depois transcrição do DNA concatamérico utilizando uma RNA polimerase que se liga ao promotor de RNA polimerase de filamentação dupla e a partir daí inicia a transcrição.
Nalgumas formas de realização preferenciais, a composição de extremidade de transposão compreende um filamento transferido que exibe apenas a sequência de extremidade de transposão transferida e, em consequência, o marcador exibe apenas a sequência de extremidade de transposão transferida. Nalgumas formas de realização diferentes, a composição de extremidade de transposão compreende um filamento transferido que compreende ou consiste numa porção 3' e numa porção 5', em que a porção 3' exibe a sequência de extremidade de transposão transferida e a porção 5' exibe qualquer outra sequência desejada, em cujas formas de realização o marcador compreende ou consiste na porção 3' e na porção 5'. Nalgumas formas de realização em que a composição de extremidade de transposão compreende um filamento transferido que compreende ou consiste numa porção 3' e numa porção 5', o filamento não transferido exibe uma sequência que é complementar à porção 5' do filamento transferido. No entanto, nalgumas formas de realização preferenciais da composição de extremidade de transposão, o filamento não transferido não exibe uma sequência que é complementar à porção 5' do filamento transferido. Nalgumas formas de realização preferenciais, o filamento não transferido exibe apenas a sequência de extremidade de transposão não transferida. Nalgumas formas de realização preferenciais, o filamento não transferido exibe uma sequência que não é complementar ao filamento transferido a 3' da sequência de extremidade de transposão não transferida.
Nalgumas formas de realização de qualquer um dos métodos compreendendo em que a composição de extremidade de transposão compreende um filamento transferido que compreende ou consiste numa porção 5' e numa porção 3', a porção 5' exibe a sequência de um domínio de marcador de sequenciação ou de um domínio de marcador de captura (por exemplo, um domínio de marcador de sequenciação ou um domínio de marcador de captura para o Sistema FLX Sequenciador de Genoma Roche 454, por exemplo, pois os marcadores Roche 454A e 454B são utilizados para sequenciação utilizando o Sistema FLX Sequenciador de Genoma Roche 454) e a porção 3' exibe a sequência de extremidade de transposão transferida. Assim, quando a composição de extremidade de transposão compreende um filamento transferido que tem um domínio de marcador de sequenciação ou um domínio de marcador de captura, os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados têm um marcador que compreende o domínio de marcador de sequenciação ou o domínio de marcador de captura (por exemplo, o marcador Roche 454A ou 454B utilizado para sequenciação utilizando o Sistema FLX Sequenciador de Genoma Roche 454) . Os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados gerados que têm o intervalo de tamanhos desejado são utilizados como modelos para sequenciação de geração seguinte utilizando o Sistema FLX Sequenciador de Genoma Roche 454. Noutras formas de realização, são gerados os fragmentos de ssDNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados que compreendem um ou mais domínios de sítio de restrição, domínios de marcador de sequenciação, domínios de marcador de captura, domínios de marcador de amplificação, domínios de marcador de deteção e/ou domínios de marcador de endereço para utilização em sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS). Não há nenhum limite para quais as sequências adicionais que são utilizadas para a uma ou mais sequências adicionais na porção 5' do filamento transferido ou na porção 3' do filamento não transferido, cujas sequências podem ser utilizadas para atingir qualquer finalidade desejada. Nalgumas formas de realização, a porção 5' do filamento transferido ou a porção 3' do filamento não transferido exibe uma ou mais sequências de domínio marcador.
Nalgumas formas de realização, o método compreende adicionalmente os passos de estender os filamentos transferidos compreendendo os fragmentos de DNA com marcação 5' gerados na reação de transposição utilizando uma DNA polimerase que está desprovida de atividade de deslocamento de filamento e exonuclease 5' para 3' (por exemplo, DNA polimerase de T4, EPICENTRE) e depois utilizar uma DNA ligase dependente do modelo (por exemplo, DNA ligase de E. coli) para ligar a extremidade 3' de cada produto de extensão de DNA à extremidade 5' de um filamento não transferido compreendendo os fragmentos de DNA marcados utilizando o filamento oposto como modelo de ligação; nestas formas de realização, as extremidades 5' dos filamentos não transferidos da composição de extremidade de transposão têm um grupo 5'-monofosfato. Esta forma de realização do método gera fragmentos de ssDNA duplamente marcados. 0 trabalho realizado durante o desenvolvimento de formas de realização da presente invenção conduziu à observação de que ocorre transposição para dsDNA. Em consequência, nalgumas formas de realização preferenciais, a composição de extremidade de transposão compreende ou consiste num filamento não transferido que exibe apenas a sequência de extremidade de transposão não transferida de modo que a porção 5' do filamento transferido é de filamentação simples (por exemplo, com a finalidade de minimizar a probabilidade ou frequência de inserção do filamento transferido em porções de filamentação dupla de si próprio durante a reação de transposição in vitro). Nalgumas formas de realização preferenciais em que o filamento não transferido exibe uma porção 3' que é complementar à porção 5' do filamento transferido, o tamanho da porção 5' do filamento transferido é minimizado com a finalidade de minimizar a probabilidade ou frequência de inserção do filamento transferido em si próprio durante a reação de transposição in vitro. Por exemplo, nalgumas formas de realização, o tamanho da porção 5' do filamento transferido (e da porção 3' complementar do filamento não transferido) é menor do que cerca de 150 nucleótidos, menor do que cerca de 100 nucleótidos, menor do que cerca de 75 nucleótidos, menor do que cerca de 50 nucleótidos, menor do que cerca de 25 nucleótidos ou menor do que cerca de 15 nucleótidos.
Nalgumas formas de realização preferenciais, a extremidade 5' do filamento transferido da composição de extremidade de transposão tem um grupo 5'-monofosfato. Nalgumas formas de realização preferenciais, a extremidade 5' do filamento não transferido tem um grupo 5'-monofosfato. Nalgumas formas de realização preferenciais, tanto o filamento transferido como o filamento não transferido têm um grupo 5'-monofosfato. Em formas de realização em que o filamento transferido não tem um grupo 5'-monofosfato, o método compreende adicionalmente o passo de fosforilar a extremidade 5' do oligonucleótido de extremidade de transposão transferida (por exemplo, utilizando polinucleótido quinase; por exemplo, polinucleótido quinase de T4) antes do passo de ligação do método. A inserção catalisada por transposase da extremidade de transposão no DNA-alvo origina união da extremidade de transposão transferida à extremidade 5' de um filamento do DNA-alvo e quebra ou fragmentação desse filamento no sítio onde a sequência de extremidade de transposão transferida é unida ao DNA-alvo, com geração concomitante de uma região de 9 bases de DNA-alvo de filamentação simples localizada a 3' do sitio de união da extremidade de transposão transferida ao DNA-alvo devido a uma região de hiato de 9 bases no filamento oposto do DNA-alvo. Por exemplo, a FIG. 1 mostra os resultados de dois eventos de inserção independentes da extremidade de transposão transferida em filamentos opostos do DNA-alvo. Como mostrado na FIG. 2, inserções independentes da extremidade de transposão transferida em filamentos opostos do DNA-alvo por vezes ocorrem em localizações no DNA-alvo que são relativamente próximas, gerando dois fragmentos de DNA com marcação 5' . Por desnaturação são libertados dois fragmentos de ssDNA com marcação 5'.
Ligação Independente do Modelo de Fragmentos de ssDNA com Marcação 5'
Nalgumas formas de realização, uma ácido nucleico ligase independente do modelo ou não homóloga (por exemplo, que efetua ligação intramolecular, isto é, circularização de ssDNA que tem um grupo 3'-hidroxilo e um 5'-monofosfato) é utilizada num método da invenção para circularizar fragmentos de ssDNA lineares com marcação 5' . Nalgumas formas de realização preferenciais, a ácido nucleico ligase é uma RNA ligase termoestável (por exemplo, selecionada de entre RNA ligase termoestável de bacteriófago TS2126 (Patente U.S No. 7,303,901 e Blondal et ai., Nucleic Acids Res 33: 135-142, 2005), ssDNA ligase CIRCLIGASE™ (EPICENTRE Biotechnologies, Madison, WI, EUA) e uma RNA ligase de archaea (por exemplo, RNA ligase 1 de Methanobacterium thermoautotroficum ou "MthRnl"; Torchia, C et ai., Nucleic Acids Res. 36:6218-6227, 2008). Por uma "ligase independente do modelo", ou "ligase não homóloga" pretende-se significar uma ligase que origina ligação de ssDNA na ausência de emparelhamento de uma sequência complementar com as extremidades do ssDNA a serem unidas ou ligadas (isto é, as duas extremidades não são emparelhadas com uma sequência complementar com a finalidade de mantê-las adjacentes entre si durante o passo de ligação). Nestas formas de realização, o método compreende o passo seguinte: desnaturar os fragmentos de DNA com marcação 5' emparelhados gerados na reação de transposição in vitro por incubação dos fragmentos de ssDNA lineares com marcação 5' com a ácido nucleico ligase. Por "intramolecular ligação" pretendemos significar que as duas extremidades de uma molécula de ssDNA são ligadas entre si para gerar fragmentos de ssDNA circulares, em vez de serem ligadas às extremidades de outras moléculas de DNA.
Nalgumas formas de realização preferenciais, a reação de ligação não homóloga é realizada numa "mistura reacional de ligação melhorada", que, no presente documento, significa uma mistura reacional de ligação que compreende: a) os fragmentos de ssDNA lineares marcados; b) um tampão que mantém o pH; b) catiões Mn2+, e (c) uma composição de moléculas de RNA ligase termoestável em que uma grande proporção das moléculas de RNA ligase termoestável são adeniladas; em que a concentração das moléculas de RNA ligase termoestável adeniladas pelo menos iguala a molaridade dos fragmentos de ssDNA lineares, e em que nenhum ATP ou catiões Mg2+ são adicionados à mistura reacional de ligação.
Com a frase "uma grande proporção das moléculas de RNA ligase termoestável são adeniladas" pretende-se significar que pelo menos aproximadamente 50 % de todas as moléculas de RNA ligase termoestável presentes na mistura reacional de ligação melhorada são adeniladas. Nalgumas formas de realização da mistura reacional de ligação melhorada, mais do que aproximadamente 60 % de todas as moléculas de RNA ligase termoestável são adeniladas. Nalgumas formas de realização da mistura reacional de ligação melhorada, mais do que aproximadamente 7 0% de todas as moléculas de RNA ligase termoestável são adeniladas. Nalgumas formas de realização da mistura reacional de ligação melhorada, mais do que aproximadamente 80% de todas as moléculas de RNA ligase termoestável são adeniladas. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, mais do que aproximadamente 90 % de todas as moléculas de RNA ligase termoestável são adeniladas. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, mais do que aproximadamente 95% de todas as moléculas de RNA ligase termoestável são adeniladas. Nalgumas formas de realização preferenciais, a RNA ligase termoestável é adenilada com a finalidade de preparar uma composição em que uma grande proporção das moléculas de RNA ligase termoestável são adeniladas por incubação da enzima com ATP durante ou após o processo de purificação. Por exemplo, um protocolo que pode ser utilizado para adenilar a RNA ligase termoestável consiste em incubar a enzima numa solução contendo Tris-HCl 50 mM, pH 8,0, MgCÍ2 2 mM, NaCl 100 mM e ATP 0,5 mM durante 15 minutos a 50 graus C; depois terminar a reação por adição de EDTA para uma concentração final de 5 mM, e depois remover os componentes reacionais por diálise ou filtração em gel. A percentagem de RNA ligase termoestável adenilada pode ser estimada por análise de SDS-PAGE. Nalgumas formas de realização preferenciais, a RNA ligase termoestável em que uma grande proporção das moléculas de RNA ligase termoestável são adeniladas é RNA ligase termoestável de bacteriófago TS2126. Nalgumas formas de realização da mistura reacional de ligação melhorada, o tampão mantém o pH entre pH 6,5 e 8,0. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, o tampão mantém o pH entre pH 7,0 e 8,0. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, o tampão que mantém o pH entre pH 7,0 e 8,0 é um tampão Tris. Nalgumas formas de realização da mistura reacional de ligação melhorada, a concentração de catiões Mn2+ está situada entre 0,5 e 10 mM. Nalgumas formas de realização da mistura reacional de ligação melhorada, a concentração de catiões Mn2+ está situada entre 1 e 10 mM. Nalgumas formas de realização da mistura reacional de ligação melhorada, a concentração de catiões Mn2+ está situada entre 1 e 5 mM. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, a concentração de catiões Mn2+ é 2,5 mM. Nalgumas formas de realização preferenciais da mistura reacional de ligação melhorada, os catiões Mn2+ são proporcionados na forma de MnCl2. Nalgumas formas de realização, a concentração das moléculas de RNA ligase termoestável adeniladas na mistura reacional de ligação melhorada é pelo menos duas vezes a molaridade dos fragmentos de ssDNA lineares. Nalgumas formas de realização, a concentração das moléculas de RNA ligase termoestável adeniladas na mistura reacional de ligação melhorada é pelo menos cinco vezes a molaridade dos fragmentos de ssDNA lineares. Nalgumas formas de realização, a concentração das moléculas de RNA ligase termoestável adeniladas na mistura reacional de ligação melhorada é pelo menos dez vezes a molaridade dos fragmentos de ssDNA lineares. Nalgumas formas de realização preferenciais, a mistura reacional de ligação melhorada compreende adicionalmente um sal, tal como cloreto de potássio ou acetato de potássio (por exemplo, a uma concentração de cerca de 50 até cerca de 100 mM) . Nalgumas formas de realização preferenciais, a mistura reacional de ligação melhorada compreende adicionalmente um agente redutor, tal como ditiotreitol (DTT) (por exemplo, a uma concentração de cerca de 0,5 ou 1 mM) . Nalgumas formas de realização, a mistura reacional de ligação melhorada compreende adicionalmente trimetilglicina (betaina) zwiteriónica a uma concentração entre 0,25 e 5,2 M. Nalgumas formas de realização, a mistura reacional de ligação melhorada compreende adicionalmente trimetilglicina (betaina) zwiteriónica a uma concentração entre 0,5 e 2 M. Nalgumas formas de realização, a mistura reacional de ligação melhorada compreende adicionalmente trimetilglicina (betaina) zwiteriónica a uma concentração de cerca de 1 M.
Nalgumas formas de realização preferenciais, a mistura reacional de ligação melhorada compreende: a) os fragmentos de ssDNA lineares que têm grupos 5'-fosforilo e 3'-hidroxilo (por exemplo, 0,5 micromolar) ; b) TRIS acetato 33 mM a pH 7,8; b) catiões Mn2+ 2,5 mM, e (c) uma composição de moléculas de RNA ligase termoestável em que >70 % das moléculas de RNA ligase termoestável são adeniladas; em que a concentração das moléculas de RNA ligase termoestável adeniladas pelo menos iguala a molaridade dos fragmentos de ssDNA lineares (por exemplo, cerca de 1 micromolar de RNA ligase termoestável adenilada para 0,5 micromolar dos fragmentos de ssDNA lineares marcados) e em que nenhum ATP ou catiões Mg2+ são adicionados à mistura reacional de ligação. Nalgumas formas de realização preferenciais, a concentração das moléculas de RNA ligase termoestável adeniladas é pelo menos 5 vezes, pelo menos 10 vezes ou pelo menos 20 vezes a molaridade dos fragmentos de ssDNA lineares (por exemplo, cerca de 2,5 micromolar, cerca de 5 micromolar ou cerca de 10 micromolar de RNA ligase termoestável adenilada para 0,5 micromolar dos fragmentos de ssDNA lineares marcados). Nalgumas formas de realização preferenciais, a mistura reacional de ligação melhorada compreende adicionalmente acetato de potássio 66 mM e DTT 0,5 mM. Nalgumas formas de realização preferenciais, a mistura reacional de ligação melhorada compreende adicionalmente betaina 1 M.
Nalgumas formas de realização preferenciais do método, a ligação intramolecular de fragmentos de ssDNA lineares com marcação 5' para sintetizar fragmentos de ssDNA circulares marcados é realizada na mistura reacional de ligação a uma temperatura entre cerca de 40 graus C e cerca de 70 graus C durante um período de tempo suficiente (por exemplo, desde cerca de uma hora até cerca de 72 horas) em que são sintetizados fragmentos de ssDNA circulares marcados. Nalgumas formas de realização preferenciais, a ligação intramolecular é realizada a uma temperatura reacional de cerca de 60 graus C durante um período de tempo suficiente em que são sintetizados fragmentos de ssDNA circulares. A invenção não está limitada apenas às ácido nucleico ligases particulares descritas no presente documento. Será entendido pelos peritos na área que a ligação intramolecular pode ser realizada utilizando qualquer ácido nucleico ligase que tenha atividade semelhante às descritas no presente documento, significando que origina ligação intramolecular não homóloga de ssDNA que tem um grupo 3'-hidroxilo e um 5'-monofosfato. V. Fragmentação E Marcação De Ds-DNA Por Transposição In Vitro De Extremidades de Transposão Em Grampo (30963)
Em resumo, nalgumas formas de realização, o método compreende: incubar o DNA-alvo, que é dsDNA, com uma transposase e uma composição de extremidade de transposão em grampo numa reação de transposição in vitro para simultaneamente fragmentar e marcar o DNA-alvo, desse modo gerando uma biblioteca compreendendo uma população de fragmentos de DNA com marcação 5'; depois unir a extremidade 3' de cada fragmento de DNA com marcação 5' compreendendo uma porção de um filamento de DNA-alvo à extremidade 5' de outro fragmento de DNA com marcação 5' compreendendo uma porção complementar (isto é, o filamento oposto do DNA-alvo), desse modo gerando uma biblioteca de fragmentos de DNA circulares marcados covalentemente fechados (por exemplo, que exibem estruturas de filamentação simples circulares ou em forma de haltere). Nalgumas formas de realização preferenciais, o passo de união compreende: estender as extremidades 3' dos fragmentos de DNA com marcação 5' com uma DNA polimerase que está desprovida de atividades de exonuclease 5' para 3' (incluindo nuclease 5' dependente da estrutura) e deslocamento de filamento para gerar produtos de extensão de fragmentos de DNA com marcação 5' e ligar a extremidade 3' de cada um dos referidos produtos de extensão de fragmentos de DNA com marcação 5' à extremidade 5' do produto de extensão de fragmentos de DNA com marcação 5' complementar utilizando uma DNA ligase dependente do modelo (por exemplo, DNA ligase de E. coli ou uma DNA ligase dependente do modelo de uma bactéria psicofrílica ou um bacteriófago psicofrílico) . Noutras formas de realização preferenciais, o passo de união compreende: incubar oligodesoxirribonucleótidos de sequência aleatória (por exemplo, oligodesoxirribonucleótidos de sequência aleatória ou sequência semialeatória que são 5'-monofosforilados ou 5' -adenilados) que têm um ou mais tamanhos adequados para preencher exatamente os hiatos de filamentação simples resultantes da reação de transposição in vitro (por exemplo, oligodesoxirribonucleótidos de sequência aleatória 5'-monofosforilados compreendendo ou consistindo num 9-meros de sequência aleatória ou sequência semialeatória ou num 4-meros de sequência aleatória e um 5-meros de sequência aleatória para preencher os hiatos de filamentação simples resultantes da transposição in vitro utilizando transposase EZ-Tn5™) e uma DNA ligase dependente do modelo (por exemplo, DNA ligase de E. coli ou uma DNA ligase dependente do modelo de uma bactéria psicofrílica ou um bacteriófago psicofrilico) com os fragmentos de DNA com marcação 5' em condições e durante um período de tempo suficiente em que os oligonucleótidos de sequências aleatórias emparelham de modo a preencher os hiatos de filamentação simples nos fragmentos de DNA com marcação 5' e são ligados, desse modo gerando uma população de moléculas de DNA circular marcado.
Assim, uma forma de realização preferencial da invenção consiste num método para gerar uma biblioteca compreendendo uma população de fragmentos de DNA circulares marcados de DNA-alvo de filamentação dupla para utilização como modelos em sequenciação de DNA ou reações de amplificação de ácidos nucleicos, em que cada um dos fragmentos de DNA circulares marcados exibe as sequências de ambos os filamentos de uma porção do DNA-alvo e a sequência do marcador, em que o método compreende:
Proporcionar: 1. DNA-alvo compreendendo ou consistindo numa ou mais moléculas de filamentação dupla (dsDNA) (por exemplo, dsDNA genómico, mitocondrial, de cloroplasto ou outro de uma célula eucariótica e/ou DNA genómico ou epissomal de uma célula procariótica, ou cDNA de filamentação dupla preparado por transcrição reversa de RNA de uma célula eucariótica e/ou procariótica para gerar cDNA de primeiro filamento e depois extensão de um "primer" emparelhado com o cDNA de primeiro filamento); 2. uma transposase (por exemplo, uma transposase de tipo selvagem ou mutante; por exemplo, transposase Tn5 de tipo selvagem ou mutante, por exemplo, transposase EZ-Tn5™, por exemplo, transposase MuA HYPERMU™, EPICENTRE Biotechnologies, Madison, WI, EUA), e 3. uma composição de extremidade de transposão em grampo que é capaz de formar um complexo funcional com a transposase numa reação de transposição e que exibe a sequência do marcador, em que a referida composição de extremidade de transposão em grampo compreende ou consiste num oligonucleótido contendo 5'-fosfato que exibe uma sequência de extremidade de transposão não transferida na sua extremidade 5' (por exemplo, no presente documento denominada "MENTS" relativamente à sequência de extremidade de transposão não transferida EZ-Tn5™), uma sequência de extremidade de transposão transferida na sua extremidade 3' (por exemplo, no presente documento denominada "METS" relativamente à sequência de extremidade de transposão transferida EZ-Tn5™) e uma sequência interveniente (por exemplo, para qualquer finalidade desejada, tal como para proporcionar um marcador) entre a sequência de extremidade de transposão não transferida e a sequência de extremidade de transposão transferida que é suficientemente longa para permitir a formação intramolecular de haste-alça, em que a haste exibe as sequências da extremidade de transposão de filamentação dupla com as quais a transposase forma um complexo que é funcional para transposição (por exemplo, em que a haste exibe as sequências da extremidade de transposão da extremidade externa ("OE") de 19 pb, a extremidade de transposão da extremidade interna ("IE") de 19 pb ou a extremidade de transposão da "extremidade em mosaico" ("ME") de 19 pb reconhecida por uma transposase Tn5 de tipo selvagem ou mutante, por exemplo, por transposase EZ-Tn5™) (ou, por exemplo, extremidades de transposão MuA Rl e R2 para a transposase MuA) e a alça exibe a sequência interveniente, que pode ser uma sequência arbitrária; 4. (a) uma DNA polimerase que está desprovida de atividades de nuclease 5' (incluindo atividade de exonuclease 5' para 3' e nuclease 5' dependente da estrutura) e deslocamento de filamento (por exemplo, DNA polimerase de T4), ou (b) um ou mais tamanhos de oligonucleótidos de sequências aleatórias que, isoladamente ou em combinação, têm o mesmo comprimento dos hiatos de filamentação simples nos fragmentos de DNA com marcação 5' resultantes após uma reação de transposição com a transposase e a composição de extremidade de transposão em grampo, e 5. uma ligase dependente do modelo (por exemplo, DNA ligase de E. coli ou uma ligase dependente do modelo de uma bactéria psicofrílica ou de um bacteriófago psicofrílico);
Incubar o DNA-alvo numa reação de transposição in vitro com a transposase e a composição de extremidade de transposão em grampo em condições e durante um período de tempo suficiente em que a inserção da composição de extremidade de transposão em grampo no DNA-alvo gera uma população de fragmentos de DNA com marcação 5' (ver, por exemplo, a FIG 2 e FIG 3);
Incubar os fragmentos de DNA com marcação 5' em condições e durante um período de tempo suficiente em que os hiatos de filamentação simples nos fragmentos de DNA são preenchidos e a extremidade 3' de cada fragmento de DNA com marcação 5' é estendida e unida à extremidade 5' de outro fragmento de DNA com marcação 5' que compreende uma porção complementar do DNA-alvo, desse modo gerando uma biblioteca de fragmentos de DNA circulares marcados, cada um dos quais exibe as sequências de ambos os filamentos de uma porção do DNA-alvo e a sequência do marcador.
Nalgumas formas de realização preferenciais do método (como representado esquematicamente, por exemplo, nas FIGS. 7 e 8), o passo de união compreende: (1) incubar os fragmentos de DNA com marcação 5' com a DNA polimerase que está desprovida de atividade de nuclease 5' em condições em que a extremidade 3' de cada fragmento de DNA com marcação 5' é estendida para gerar uma população de produtos de extensão de fragmentos de DNA com marcação 5', e (2) incubar os produtos de extensão de fragmentos de DNA com marcação 5' com a ligase dependente do modelo em condições e durante um período de tempo suficiente em que os produtos de extensão de fragmentos de DNA com marcação 5' são ligados, desse modo gerando a biblioteca de fragmentos de DNA circulares marcados. Nalgumas formas de realização, a DNA polimerase que está desprovida de atividades de nuclease 5' e deslocamento de filamento e a ligase dependente do modelo são proporcionadas numa mistura e o passo de união é realizado numa única mistura reacional.
Nalgumas formas de realização preferenciais diferentes do método, o passo de união compreende: incubar os fragmentos de DNA com marcação 5' com o um ou mais tamanhos de oligonucleótidos de sequências aleatórias e a ligase dependente do modelo em condições e durante um período de tempo suficiente em que os oligonucleótidos de sequências aleatórias emparelham e preenchem regiões de hiato de filamentação simples nos fragmentos de DNA com marcação 5' e em que os referidos oligonucleótidos de sequências aleatórias emparelhados são ligados uns aos outros ou a uma extremidade adjacente dos fragmentos de DNA com marcação 5', desse modo gerando os fragmentos de DNA circulares marcados.
Nalgumas formas de realização, o método compreende adicionalmente, após o passo de ligação, um ou mais passos para remover oligonucleótidos de sequências aleatórias, DNA-alvo linear e/ou as composições de extremidade de transposão em grampo que não são unidas a DNA-alvo.
Nalgumas formas de realização preferenciais, o método compreende adicionalmente: tratar a mistura reacional contendo os fragmentos de DNA circulares marcados com exonuclease T5 (EPICENTRE Biotechnologies, Madison, WI) para remover ssDNA e dsDNA lineares não ligados (por exemplo, fragmentos de DNA que são cortados e/ou contêm regiões de filamentação simples).
Nalgumas formas de realização, o método compreende adicionalmente: clivar os fragmentos de DNA circulares marcados em cada uma das estruturas em alça para gerar fragmentos de DNA de filamentação dupla lineares, em que cada filamento dos referidos fragmentos de DNA tem uma porção do marcador na sua extremidade 5' e uma porção do marcador na sua extremidade 3' (cujos fragmentos de DNA lineares são denominados no presente documento "fragmentos de dsDNA lineares duplamente marcados de cauda de andorinha" ou "fragmentos de dsDNA de cauda de andorinha").
Nalgumas formas de realização, o método de clivagem compreende: emparelhamento com os fragmentos de DNA circulares marcados de um oligodesoxirribonucleótido que emparelha com um sítio de restrição no marcador e depois incubação com a endonuclease de restrição que procede à clivagem no sítio de restrição de filamentação dupla para gerar os fragmentos de dsDNA de cauda de andorinha.
Nalgumas formas de realização diferentes, a composição de extremidade de transposão em grampo tem um ou mais sítios aptos a serem clivados (por exemplo, na estrutura em alça) que podem ser clivados utilizando uma composição de enzima de clivagem (por exemplo, um sítio apto a ser clivado que consiste num resíduo dUMP que pode ser clivado utilizando uma composição de enzima de clivagem compreendendo uracil-N-glicosilase e uma endonuclease AP, tal como endonuclease III ou endonuclease IV de E. coli; ou, por exemplo, um sítio apto a ser clivado que consiste num resíduo 8-oxo-guanina-2' -desoxirribonucleósido-monofosfato que pode ser clivado utilizando uma composição de enzima de clivagem compreendendo proteína FPG ± uma endonuclease AP, tal como endonuclease III ou endonuclease IV de E. coli), e o método de clivagem compreende: incubar os fragmentos de DNA circulares marcados com a composição de enzima de clivagem em condições e durante um período de tempo suficiente em que os fragmentos de DNA circulares marcados são clivados nos sítios aptos a serem clivados para gerar os fragmentos de dsDNA de cauda de andorinha. Nalgumas formas de realização do método, é utilizado um nucleótido não canónico diferente para proporcionar o sítio apto a ser clivado e é utilizada uma N-glicosilase diferente na composição de enzima de clivagem. A composição de extremidade de transposão em grampo é sintetizada (por exemplo, utilizando um sintetizador de oligonucleótidos) de modo a conter um sitio apto a ser clivado que consiste num nucleótido não canónico em vez do nucleótido canónico (por exemplo, dUMP como nucleótido não canónico em vez de TMP quando uracil-N-glicosilase é utilizada como componente da composição enzimática de clivagem, ou, por exemplo, 8-oxo-GMP como nucleótido não canónico em vez de GMP quando proteína FPG é utilizada como componente da composição enzimática de clivagem) no sítio ou sítios onde é desejado proceder à clivagem dos fragmentos de DNA circulares marcados na biblioteca (por exemplo, em que o sítio onde é desejado proceder à clivagem dos fragmentos de DNA circulares marcados se encontra no interior da estrutura em alça da composição de extremidade de transposão em grampo que insere nos fragmentos de DNA circulares marcados).
Assim, nalgumas formas de realização preferenciais em que a composição de extremidade de transposão tem um ou mais sítios aptos a serem clivados, a composição de enzima de clivagem emprega uma N-glicosilase (ou "DNA glicosilase") para gerar um sítio abásico ou apirimidínico/apurínico (AP). Como definido no presente documento, uma "N-glicosilase" é uma enzima que catalisa a hidrólise da ligação entre uma base de ácido nucleico não canónica e um açúcar em DNA para gerar um sítio abásico (AP). Tais enzimas estão presentes em muitas espécies. Um exemplo de Escherichia coli é uracil-N-glicosilase (UNG), também denominada uracil-DNA glicosilase (UDG). A UNG catalisa a clivagem da base uracilo do açúcar desoxirribose em DNA (Lindahl, Prog. Nucl. Acid Res. Mol. Biol. 22:135-192, 1979), mas não catalisa a clivagem de uracilo de dUTP livre, desoxiuridina livre ou RNA (Duncan, em "The Enzymes", Boyer editor, páginas 565-586, 1981) . Outros exemplos de N-glicosilases que podem ser utilizadas como enzimas de clivagem são descritos por Demple e Harison (Annu. Rev. Biochem. 63: 915-48, 1994) e por Duncan ("DNA Glycosylases", em "The Enzymes", Boyer editor, páginas 565-586, 1981). Por "N-glicosilase" ou "DNA-glicosilase" pretendemos significar uma enzima com atividade de N-glicosilase, independentemente de a enzima ser formalmente denominada glicosilase ou ter uma atividade de glicosilase combinada com outras atividades enzimáticas. Glicosilases são por vezes denominadas "glicosidases" e, em consequência, pretendemos que a definição de N-glicosilase abranja N-glicosidases. Por exemplo, a proteína FPG também é uma N-glicosilase como definido no presente documento. A proteína FPG (Formamidopirimidina DNA N-glicosilase) é uma enzima de reparação por excisão de bases que reconhece bases de ácido nucleico modificadas diversas mas estruturalmente relacionadas, tais como 8-hidroxiguanina (também conhecida como 7-hidro-8-oxoguanina ou 8-oxoguanina, com referência ao tautómero 6,8-diceto favorecido a pH fisiológico) (Tchou, et al. , Proc. Natl. Acad. Sei. USA 88: 4690-4694, 1991), derivados de anel aberto de imidazole de adenina ou guanina, denominados 4, 6-diamino-5-formamidopirimidina e 2,6-diamino-4-hidroxi-5-formamidopirimidina, respetivamente, (Chetsanga, et al. , Biochemistry 20: 5201-5207, 1981; e Breimer, Nucl. Acids Res. 12: 6359-6367, 1984), N.sub.7 -metilformamidopirimidinas, 5-hidroxiuracilo e 5-hidroxicitosina (Hatahet, et al., J. Biol. Chem. 269:18814-18820, 1994) e catalisa a clivagem da ligação N-glicosílica entre a base modificada e a cadeia principal de desoxirribose-fosfodiéster em DNA, gerando um sítio AP. Adicionalmente, a proteína FPG também possui uma atividade de AP liase. A atividade de AP-liase da enzima catalisa reações de eliminação beta, delta, deixando um hiato de um único nucleótido no DNA (Bailly, et al. , Biochem. J. 261: 707-713, 1989) . Foi mostrado que a proteína FPG e 8-hidroxiguanina DNA glicosilase são idênticas (Chung, MH et al. , Mutation Research 254: 1-12, 1991) . O tratamento de DNA com azul de metileno mais luz visível (Floyd, et al., Arch Biochem Biophys 273: 106-111, 1989) ou com rosa de Bengala mais luz ultravioleta (Friedmann e Brown, Nucleic Acids Research 5: 615-622, 1978) induz modificação específica para guanina que pode ser clivada por proteína FPG. Outras N-glicosilases específicas estarão disponíveis e serão conhecidas dos peritos na área. Para determinar se uma N-glicosilase é ou não adequada para a presente invenção, em primeiro lugar incorpora-se o nucleótido não canónico no DNA e determina-se se a base não canónica pode ou não ser especificamente removida pela N-glicosilase candidata de um modo semelhante à remoção de uracilo ou 8-oxo-guanina por UNG e proteína FPG, respetivamente. Depois de criado um sítio abásico ou AP, são conhecidos na área vários métodos para proceder à clivagem do sítio abásico. Calor e/ou condições básicas podem ser empregues para quebrar a molécula de DNA nos sítios abásicos. Por exemplo, pode ser utilizado o protocolo seguinte: Ácidos nucleicos contendo sítios abásicos (AP) após remoção de bases não canónicas são aquecidos numa solução tampão contendo uma amina, por exemplo, Tris-HCl 25 mM e iões magnésio 1 até 5 mM, durante um período de tempo de 10 até 30 minutos a 70 graus C até 95 graus C. Alternativamente, pode utilizar-se o seguinte tratamento para quebrar o DNA em sítios abásicos: adiciona-se piperidina 1,0 M, uma base, a DNA que foi precipitado com etanol e seco a vácuo. A solução é depois aquecida durante 30 minutos a 90 graus C e é liofilizada para remover a piperidina. Nalgumas formas de realização preferenciais, tratamento enzimático utilizando uma endonuclease apurínica/apirimidínica (endonuclease AP) conhecida na área (Lindahl, Prog. Nucl. Acid Res. Mol. Biol. 22: 135-192, 1979; Demple e Harison Annu. Rev. Biochem. 63: 915-48, 1994) é utilizado para quebrar o polímero de DNA no sítio abásico. Como definido no presente documento, uma endonuclease AP é qualquer enzima que catalisa a clivagem de DNA em sítios abásicos (AP). Tais enzimas estão presentes em muitas espécies. Exemplos de endonucleases AP de E. coli incluem mas não estão limitados a endonuclease III e endonuclease IV. Também exonuclease III de E. coli na presença de iões cálcio é uma endonuclease AP. Enzimas úteis na presente invenção incluem qualquer enzima com atividade do tipo endonuclease AP, seja denominada por esse nome ou por algum nome diferente.
Nalgumas formas de realização preferenciais, o método compreende adicionalmente: desnaturar os fragmentos de dsDNA de cauda de andorinha para gerar uma biblioteca de fragmentos de ssDNA lineares duplamente marcados (por exemplo, para utilização como modelos para sequenciação de DNA ou amplificação de DNA).
Nalgumas formas de realização, os fragmentos de DNA circulares marcados ou os fragmentos de ssDNA lineares duplamente marcados na biblioteca gerada utilizando os métodos são utilizados como modelos de DNA em reações de amplificação de ácidos nucleicos e/ou sequenciação de DNA. Nalgumas formas de realização, o método compreende adicionalmente o passo de amplificar e/ou sequenciar o DNA-alvo nos fragmentos de DNA circulares marcados ou nos fragmentos de ssDNA lineares duplamente marcados. Nalgumas formas de realização, o método compreende adicionalmente o passo de sequenciar DNA que é complementar ao DNA-alvo obtido por amplificação dos fragmentos de DNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados. Nalgumas formas de realização, pelo menos uma porção dos DNAs-alvo em cada um dos fragmentos de DNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao marcador (por exemplo, para sequenciação por síntese). Nalgumas formas de realização, pelo menos uma porção dos DNAs-alvo em cada um dos fragmentos de DNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada utilizando uma ligase dependente do modelo para ligar pelo menos um oligodesoxirribonucleótido que é complementar ao marcador e pelo menos um outro oligodesoxirribonucleótido que emparelha com a porção da sequência-alvo (por exemplo, para sequenciação por ligação). Nalgumas formas de realização, pelo menos uma porção do DNA-alvo em cada um dos fragmentos de DNA circulares marcados ou dos fragmentos de ssDNA lineares duplamente marcados é sequenciada por emparelhamento de oligodesoxirribonucleótidos que emparelham ou hibridizam com o marcador e com uma porção da sequência-alvo (por exemplo, para sequenciação por hibridização). Nalgumas formas de realização, DNA que é complementar aos fragmentos de DNA circulares marcados ou aos fragmentos de ssDNA lineares duplamente marcados é sequenciado utilizando sequenciação por síntese, sequenciação por ligação ou sequenciação por hibridização.
Por exemplo, nalgumas formas de realização preferenciais, a sequência de extremidade de transposão transferida exibida pela composição de extremidade de transposão em grampo que é proporcionada num estojo ou que é utilizada num método da presente divulgação é uma sequência de extremidade de transposão transferida reconhecida por uma transposase Tn5. Nalgumas formas de realização preferenciais, a sequência de extremidade de transposão transferida é uma sequência reconhecida por transposase EZ-Tn5™ (EPICENTRE Biotechnologies, Madison, WI, EUA).
Em geral, os fragmentos de DNA circulares marcados, os fragmentos de dsDNA de cauda de andorinha e os fragmentos de ssDNA lineares duplamente marcados gerados utilizando uma composição de extremidade de transposão em grampo nos métodos da presente divulgação exibem a sequência de extremidade de transposão transferida e a sequência de extremidade de transposão não transferida, e sequências adicionais que compreendem ou são derivadas da porção de alça não complementar da composição de extremidade de transposão em grampo. Assim, nalgumas formas de realização, a composição de extremidade de transposão em grampo exibe um ou mais sequências de nucleótidos diferentes a 5' da sequência de extremidade de transposão transferida e a 3' da sequência de extremidade de transposão não transferida, em que as referidas uma ou mais sequências de nucleótidos diferentes também são exibidas pelo marcador. Assim, para além das sequências de extremidade de transposão, o marcador da composição de extremidade de transposão em grampo pode ter uma ou mais porções marcadoras ou domínios marcadores diferentes.
Nalgumas formas de realização em que a composição de extremidade de transposão em grampo compreende um ou mais domínios de sítio de restrição, o método compreende adicionalmente: emparelhar um oligodesoxirribonucleótido que é complementar ao sítio de restrição de filamentação simples dos fragmentos de DNA circulares marcados e depois clivar os fragmentos de DNA circulares marcados no sítio de restrição utilizando a endonuclease de restrição que reconhece o sítio de restrição. Assim, nalgumas formas de realização, o método compreende linearizar os fragmentos de DNA circulares marcados para gerar fragmentos de dsDNA de cauda de andorinha ou, após desnaturação, fragmentos de ssDNA lineares duplamente marcados.
Nalgumas formas de realização, o método compreende adicionalmente o passo de ligar os fragmentos de ssDNA lineares marcados clivados com a endonuclease de restrição a uma ou mais moléculas de DNA diferentes (por exemplo, para unir um marcador).
Assim, nalgumas formas de realização, o método compreende adicionalmente: amplificar os fragmentos de DNA circulares marcados ou os fragmentos de dsDNA de cauda de andorinha ou os fragmentos de ssDNA lineares duplamente marcados por transcrição, em que o método compreende: (a) emparelhar com a sequência de promotor sentido um oligodesoxirribonucleótido que exibe uma sequência de promotor antissentido complementar, ou emparelhar com os fragmentos de DNA circulares marcados ou os fragmentos de dsDNA de cauda de andorinha ou os fragmentos de ssDNA lineares duplamente marcados um "primer" que é complementar aos mesmos e estender o "primer" com uma DNA polimerase em condições em que um dsDNA, incluindo um promotor de RNA polimerase de filamentação dupla, é sintetizado, e (b) incubar os produtos de dsDNA com uma RNA polimerase que se liga ao promotor de RNA polimerase em condições em que é sintetizado RNA.
Nalgumas formas de realização preferenciais em que a composição de extremidade de transposão em grampo ou um "primer" de PCR exibe uma sequência promotora de RNA polimerase, o promotor de RNA polimerase é um promotor de RNA polimerase do tipo T7 e o método compreende adicionalmente o passo de transcrever os fragmentos de DNA circulares marcados in vitro utilizando uma RNA polimerase do tipo T7 que reconhece o promotor. Muito preferencialmente, a RNA polimerase e promotor são escolhidos de entre RNAP de T7, RNAP de T3 e RNAP de SP6 e os correspondentes promotores cognatos. No entanto, passos de transcrição de um método da invenção podem empregar qualquer RNAP para a qual é conhecida ou pode ser obtida uma sequência promotora adequada que permite transcrição com elevada especificidade. Estojos e enzimas para transcrição in vitro são disponibilizados comercialmente por muitos vendedores, e as misturas e condições reacionais apropriadas para conduzir passos da presente invenção compreendendo transcrição in vitro podem empregar aqueles produtos como descrito pelos fabricantes. A título exemplificativo mas, transcrição in vitro utilizando RNAP de T7 pode ser realizada utilizando o Transcrição Estojo AMPLISCRIBE™ T7-FLASH™ ou o Transcrição Estojo de Alto Rendimento de T7 AMPLISCRIBE™ da EPICENTRE Biotechnologies, Madison, WI, como descrito na literatura do produto. De modo semelhante, se RNAP de T3 ou RNAP de SP6 for utilizada num método da invenção para transcrição in vitro, um Estojo de Transcrição de Alto Rendimento AMPLISCRIBE™ T3-Flash™ ou o Estojo de Transcrição de Alto Rendimento de SP6 AMPLISCRIBE™ (EPICENTRE Biotechnologies, Madison, WI), respetivamente, pode ser utilizado como descrito.
Nalgumas formas de realização diferentes, o método compreende adicionalmente o passo de amplificar e/ou sequenciar o DNA-alvo nos fragmentos de DNA circulares marcados utilizando uma DNA polimerase e pelo menos um "primer" que é complementar ao marcador. Nalgumas formas de realização, o método compreende adicionalmente: amplificar os fragmentos de DNA circulares marcados por replicação por círculo rolante utilizando uma DNA polimerase de deslocamento de filamento. Nalgumas formas de realização diferentes, o método compreende adicionalmente: amplificar os fragmentos de DNA circulares marcados por PCR utilizando uma DNA polimerase termoestável, um primeiro "primer" de PCR que é complementar a pelo menos uma porção do marcador e um segundo "primer" de PCR que é complementar a pelo menos uma porção do complemento do marcador.
Nalgumas formas de realização, o método compreende adicionalmente: amplificar os fragmentos de DNA circulares marcados por replicação por círculo rolante (RCR), em que o método compreende: (a) emparelhar um "primer" que é complementar aos fragmentos de DNA circulares marcados, e (b) estender o "primer" emparelhado para os fragmentos de DNA circulares marcados utilizando uma DNA polimerase de deslocamento de filamento (por exemplo, DNA polimerase phi29, fragmento grande de DNA polimerase rBst ou DNA polimerase DISPLACEACE™ (EPICENTRE). Nestas formas de realização, os produtos de amplificação de RCR são moléculas concataméricas de ssDNA que são complementares aos fragmentos de DNA circulares marcados. Nalgumas formas de realização em que os fragmentos de DNA circulares marcados exibem uma sequência de promotor antissentido, os produtos de amplificação de RCR concataméricos exibem uma sequência de promotor sentido e o método compreende adicionalmente dotar o promotor de RNA polimerase de filamentação dupla (por exemplo, por emparelhamento com a sequência de promotor sentido de um oligodesoxirribonucleótido complementar que exibe uma sequência de promotor antissentido e depois transcrever o DNA concatamérico utilizando uma RNA polimerase que se liga ao promotor de RNA polimerase de filamentação dupla e a partir daí inicia a transcrição.
Nalgumas formas de realização preferenciais, a porção de haste da composição de extremidade de transposão em grampo exibe apenas as sequências de extremidade de transposão transferida e não transferida e a alça é de filamentação simples (por exemplo, com a finalidade de minimizar a probabilidade ou frequência de inserção da composição de extremidade de transposão em grampo em porções de filamentação dupla de si própria durante a reação de transposição in vitro). Nalgumas formas de realização diferentes, a porção de haste da composição de extremidade de transposão em grampo exibe, para além das sequências de extremidade de transposão transferida e não transferida, sequências adicionais que estão imediatamente a 5' da sequência de extremidade de transposão transferida e imediatamente a 3' da sequência de extremidade de transposão não transferida. No entanto, nestas formas de realização, o tamanho das sequências adicionais na porção de haste da composição de extremidade de transposão em grampo é minimizado com a finalidade de minimizar a probabilidade ou frequência de inserção da composição de extremidade de transposão em grampo em si própria durante a reação de transposição in vitro. Por exemplo, nalgumas formas de realização, o comprimento da haste na composição de extremidade de transposão em grampo é menor do que cerca de 75 nucleótidos; menor do que cerca de 50 nucleótidos, ou menor do que cerca de 30 nucleótidos.
Nalgumas formas de realização, a porção de alça da composição de extremidade de transposão em grampo exibe a sequência de um domínio de marcador de sequenciação ou de um domínio de marcador de captura (por exemplo, um domínio de marcador de sequenciação e/ou um domínio de marcador de captura para o Sistema FLX Sequenciador de Genoma Roche 454, por exemplo, que exibem as sequências dos domínios de marcador de sequenciação dos marcadores Roche 454A e 454B que são utilizados para sequenciação utilizando o Sistema FLX Sequenciador de Genoma Roche 454). Nalgumas formas de realização em que a composição de extremidade de transposão em grampo tem um domínio de marcador de sequenciação ou um domínio de marcador de captura, os fragmentos de DNA circulares marcados ou os fragmentos de dsDNA de cauda de andorinha ou os fragmentos de ssDNA lineares duplamente marcados têm um marcador que compreende o domínio de marcador de sequenciação e/ou o domínio de marcador de captura (por exemplo, o marcador Roche 454A ou 454B utilizado para sequenciação utilizando o Sistema FLX Sequenciador de Genoma Roche 454). Após isolamento dos fragmentos de DNA circulares marcados ou dos fragmentos de dsDNA de cauda de andorinha ou dos fragmentos de ssDNA lineares duplamente marcados no intervalo de tamanhos desejado, são utilizados como modelos para sequenciação de geração seguinte utilizando o Sistema FLX Sequenciador de Genoma Roche 454. Noutras formas de realização, os fragmentos de DNA circulares marcados gerados ou os fragmentos de dsDNA de cauda de andorinha ou os fragmentos de ssDNA lineares duplamente marcados têm um ou mais domínios de sítio de restrição, domínios de marcador de sequenciação, domínios de marcador de amplificação, domínios de marcador de captura, domínios de marcador de deteção e/ou domínios de marcador de endereço para utilização em sequenciação (por exemplo, utilizando a plataforma de sequenciação ROCHE 454, a plataforma de sequenciação ILLUMINA™ SOLEXA™, a plataforma de sequenciação SOLID™ da LIFE TECHNOLOGIES / APPLIED BIOSYSTEMS, a plataforma de sequenciação SMRT™ da PACIFIC BIOSCIENCES, a plataforma de sequenciação POLLONATOR Polony, a plataforma de sequenciação COMPLETE GENOMICS, a plataforma de sequenciação da INTELLIGENT BIOSYSTEMS ou a plataforma de sequenciação HELICOS).
Nalgumas formas de realização, a composição de extremidade de transposão em grampo exibe uma ou mais sequências de domínio marcador, cujas sequências podem ser utilizadas para atingir qualquer finalidade desejada. Não há nenhum limite quanto às sequências adicionais que são utilizadas para a uma ou mais sequências adicionais na porção de alça da composição de extremidade de transposão em grampo.
Nalgumas formas de realização preferenciais, a extremidade 5' da composição de extremidade de transposão em grampo tem um grupo 5'-monofosfato. Em formas de realização em que a composição de extremidade de transposão em grampo não tem um grupo 5' -monofosfato, o método compreende adicionalmente o passo de fosforilar a extremidade 5' da composição de extremidade de transposão em grampo (por exemplo, utilizando polinucleótido quinase; por exemplo, polinucleótido quinase de T4) antes do passo de ligação do método. A inserção catalisada por transposase da extremidade de transposão no alvo origina união da extremidade 3' da sequência de extremidade de transposão transferida à posição 5' de um nucleótido num filamento do DNA-alvo, resultando em quebra ou fragmentação desse filamento no sitio onde a sequência de extremidade de transposão transferida é unida ao DNA-alvo e geração concomitante de uma região de 9 bases de DNA-alvo de filamentação simples localizada a 3' do sitio de união da extremidade de transposão transferida ao DNA-alvo devido a uma região de hiato de 9 bases no filamento oposto do DNA-alvo. Por exemplo, a FIG. 16 mostra um resultado possível de dois eventos de inserção independentes da composição de extremidade de transposão em grampo no DNA-alvo. Como mostrado na FIG. 16, por vezes ocorrem inserções independentes da extremidade de transposão em grampo em filamentos opostos do DNA-alvo em localizações no DNA-alvo, gerando dois fragmentos de DNA com marcação 5', como mostrado na FIG. 16. Por união é gerado um fragmento de DNA circular marcado. A invenção não está limitada apenas às ácido nucleico ligases particulares descritas no presente documento. Será entendido pelos peritos na área que qualquer ácido nucleico ligase dependente do modelo que tenha atividade semelhante à das enzimas descritas no presente documento, e métodos e condições para utilização de tais enzimas para ligação dependente do modelo são conhecidos e facilmente disponibilizados na área.
EXEMPLOS EXPERIMENTAIS A presente divulgação é adicionalmente definida nos Exemplos seguintes. Deve ser entendido que estes Exemplos, não obstante incluírem formas de realização preferenciais da invenção, são apresentados apenas a título ilustrativo. A partir do estudo apresentado acima e dos Exemplos que se seguem um perito na arte poderá comprovar as características essenciais da presente invenção e sem sair do espirito e âmbito da mesma poderá efetuar diversas alterações e modificações à invenção por forma a adaptá-la a utilizações e condições diversificadas.
As técnicas comuns utilizadas de biologia molecular são bem conhecidas na área e são descritas por Sambrook, J., Fritsch, E. F. e Maniatis, T. , "Molecular Cloning: A Laboratory Manual", Segunda Edição, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989).
Definições, Nomenclatura e Abreviaturas usadas nos Exemplos: "pMETS" refere-se ao oligonucleótido de extremidade de transposão de filamentação simples contendo 5'-fosfato de 19 bases que exibe a sequência de extremidade de transposão EZ-Tn5™: 5’ pAGA TGT GTA TAA GAG AGAG 3’ (SEQ ID NQ:1) "METS" refere-se ao oligonucleótido de extremidade de transposão de filamentação simples de 19 bases que exibe a sequência de extremidade de transposão EZ-Tn5™: 5! AGA TGT GTA TAA GAG ACAG 3* (SEQ ÍD NO:1) "pMENTS" refere-se ao oligonucleótido de extremidade de transposão de filamentação simples contendo 5'-fosfato de 19 bases que exibe a sequência de extremidade de transposão EZ-Tn5™: 5' pCTG TCT CTT ATA CAC ATCT 3’ (SEQ ÍD NO:2) "pMEDS" refere-se à extremidade de transposão EZ-Tn5™ de filamentação dupla de 19 pares de bases em que ambas as extremidades 5' contêm fosfatos: 5’ pAGA TGI GTA TAA GAG ACAG 3* (SEQ ID NO; 1) 3' TCT ACA CAT ATT CTC TGTCp 5’ (SEQ ID N:Q:2) A extremidade de transposão EZ-Tn5™ pMEDS é preparada por emparelhamento do oligonucleótido de extremidade de transposão pMETS com o oligonucleótido de extremidade de transposão pMENTS. "MEDS" refere-se à extremidade de transposão EZ-Tn5™ de filamentação dupla de 19 pares de bases em que apenas o filamento não transferido (pMENTS) contém um 5'-fosfato: 5' AGA TGT GTA TAA GAG ACAG 3’ (SEQ iD MG:1) 3’ TCT ACA CAI ATT CTC TGTCp 5* (SEQ ID NQ:2) A extremidade de transposão EZ-Tn5™ MEDS é preparada por emparelhamento do oligonucleótido de extremidade de transposão METS com o oligonucleótido de extremidade de transposão pMENTS. "p454.lMETS" refere-se ao filamento transferido de filamentação simples contendo 5'-fosfato de 36 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (pMETS) sublinhada: 5’pGCC TIG GCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3’ (SEQ Í0 NO:4) A composição de extremidade de transposão EZ-Tn5™ "p454.lMEDS" é preparada por emparelhamento do filamento transferido p454.lMETS (SEQ ID NO:4) com o filamento não transferido pMENTS (SEQ ID N0:2): 5’pGCC TIG CCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3 ' 3'T CTA CAC ATA TTC TCT GTCp 5' "pc454.1" refere-se ao oligonucleótido de filamentação simples contendo 5'-fosfato de 18 bases que é complementar à porção 5' de p454.lMETS e que tem a sequência: 5’ pIGA GCG GGC TGG CAA GGC 3’ (SEG ID MO:5) "A-METS" refere-se ao filamento transferido de filamentação simples de 38 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (METS) sublinhada: 5' GCC ICC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAC AG 3’ {SEQ ID NO:7) A composição de extremidade de transposão EZ-Tn5™ "A-MEDS" é preparada por emparelhamento do filamento transferido A-METS (SEQ ID N0:7) com o filamento não transferido pMENTS (SEQ ID NO:2): 5' GCC TCC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAG AG 3’ 3’TC TAG ACA TAT TCT CTG TCp 5’ "B-METS" refere-se ao filamento transferido de filamentação simples de 38 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (METS) sublinhada: 5: GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAG AG 3’ (SEQ ID NO:8) A composição de extremidade de transposão EZ-Tn5™ "B-MEDS" é preparada por emparelhamento do filamento transferido B-METS (SEQ ID NO:8) com o filamento não transferido pMENTS (SEQ ID NO:2) 5 GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAC AG 3’ 3' TC TAC ACA TAT TCT CTG TCp 5' "FLX-A" refere-se ao oligonucleótido de filamentação simples de 19 bases que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo: 5: GCC TCC CTC GCG CCA TCA G 3! (SEQ ID NO:9) "FLX-B" refere-se ao oligonucleótido de filamentação simples de 19 bases que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo: 5' GCC TTG CCA GCC CGC TCA G 3’ (SEQ iD NO:10) "A-MID2-METS" refere-se ao filamento transferido de filamentação simples de 48 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 e sequência de código de barras (MID2, itálico) que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (METS) sublinhada: 5' GCC TCC CTC GCG CCA TC A G ACGCTCGACA AG ATG TGT ATA AGA GAC AG 3’ {SEQ ID N0:11) "Ti A-METS" refere-se ao filamento transferido de filamentação simples de 49 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (METS) sublinhada:
5’ CCA TCT CAT CCC TGC GTG TCT CCG ACT CAG AGA TGT GTA TAA GAG ACA G 3* (SEQ ID NO:12) "Ti B-METS" refere-se ao filamento transferido de filamentação simples de 49 bases que tem uma porção 5' que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo, que é anexado à extremidade 5' da sequência de extremidade de transposão transferida EZ-Tn5™ de 19 bases (METS) sublinhada: 5’ CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG AGA TGT GTA TÃA GAG ACA G 3' (SEQ ID N0:13) "Ti A" refere-se ao oligonucleótido de filamentação simples de 26 bases que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo: 5’ CCA TCI CAT GCC TGC GTG TCI CCG AC 3’ {SEG !D NO 14) "Ti B" refere-se ao oligonucleótido de filamentação simples de 26 bases que consiste num marcador de sequenciação Roche 454 que exibe a sequência abaixo: 5’ CCT ATC CCG TGI GTG CCT TGG CAG TC 3' (SEO ID NO: 15) "BPl-A" refere-se ao oligonucleótido de filamentação simples de 48 bases que tem uma porção 5' que consiste num marcador de PCR Illumina bridge que exibe a sequência abaixo, que é anexado à sequência FLX-A (sublinhada abaixo): 5' AAT GAT ACG GCG ACC ACC GAG ATC TAC ACG CCT CCC TCG CGC CAT CAG 3' (SEQ ID NO :16) "BP2-B" refere-se ao oligonucleótido de filamentação simples de 49 bases que tem uma porção 5' que consiste num marcador de PCR Illumina bridge que exibe a sequência abaixo, que é anexado à sequência FLX-B (sublinhada abaixo): 5' CAA GCA GAA GAC GGC ATA CGA GAT CGG TCT GCC TTG CCA GCC CGC TCA G 3' (SEQ ID NO:17) "BP2-ID1-B" refere-se ao oligonucleótido de filamentação simples de 49 bases que tem uma porção 5' que consiste num marcador de PCR Illumina bridge e sequência de código de barras (ID2, itálico) que exibe a sequência abaixo, que é anexado à sequência FLX-B (sublinhada abaixo) : 5' CAA GCA GAA GAC GGC ATA CGA GAT GCATGT CGG TCT GCC TTG CCA GCC CGC TCA G 3’ {SEQ ID NO:18) "BPl" refere-se ao oligonucleótido de filamentação simples de 20 bases que consiste num marcador adaptador Illumina bPCR que exibe a sequência abaixo: 5’ AAT GAT ACG GCG ACC ACG GA 3' (SEQ ID NO: 19) "BP2" refere-se ao oligonucleótido de filamentação simples de 21 bases que consiste num marcador adaptador Illumina bPCR que exibe a sequência abaixo: 5’ CAA GCA GAA GAC GGC ATA CGA 3' {SEQ SD NO:20) "pMETS-N-MENTS" refere-se a uma composição de extremidade de transposão em grampo que compreende ou consiste em: um oligonucleótido contendo 5'-fosfato que exibe a sequência de extremidade de transposão não transferida EZ-Tn5™ na extremidade 5' e a sequência de extremidade de transposão transferida EZ-Tn5™ na extremidade 3', ligadas por uma sequência arbitrária interveniente representada por "(N)x". A sequência interveniente entre as sequências METS e MENTS consiste num número suficiente de nucleótidos para permitir a formação de haste-alça: 5’ PCTGTCTCTTATACACATCT-{N)X-AGATGTGTATÂAGAGACAG 3’ {SEQ !D NQ:3) O emparelhamento intramolecular da sequência de extremidade de transposão transferida pMETS com a sequência de extremidade de transposão não transferida pMENTS num oligonucleótido pMETS-N-MENTS origina uma composição de extremidade de transposão EZ-Tn5™ em Grampo. Por exemplo, se x=6;
NN N AGATGTGTATAAGAGACAG 3 * N TCTACACATATTCTCTGTCp 5» (SEQ ID NO:3)
NN "TSase" refere-se à transposase Tn5 EZ-Tn5™ hiperativa (EPICENTRE Biotechnologies, Madison, WI, EUA) em Tris cloreto 50 mM pH 7,5, glicerol 50 %, EDTA 0,1 mM, DTT 1 mM, Cloreto de sódio 500 mM, NP-40 0,5 % v/v, Tween-20 0,5 % v/v. "Transpossoma" refere-se à transposase Tn5 EZ-Tn5™ hiperativa (EPICENTRE Biotechnologies, Madison, WI, EUA) pré-incubada com DNA de transposão de filamentação dupla em condições que suportam formação de complexo não covalente. DNA de transposão de filamentação dupla pode consistir, sem limitação, em DNA Tn5, uma porção de DNA Tn5, uma composição de extremidade de transposão, uma mistura de composições de extremidade de transposão ou outros DNAs de filamentação dupla capazes de interagir com a transposase EZ-Tn5™ hiperativa.
Tampão Reacional 10X TA: Tris acetato 330 mM, pH 7,8
Acetato de magnésio 100 mM
Acetato de potássio 660 mM
Tampão Reacional 5X TA-DMF: Tris acetato 165 mM, pH 7,8
Acetato de magnésio 50 mM
Acetato de potássio 330 mM
Dimetilformamida 50 % v/v
Tampão Reacional 10X TMgCl: Tris cloreto 100 mM, pH 8,0
Cloreto de magnésio 50 mM
Tampão Reacional 5X TMgCl-DMF: Tris cloreto 50 mM, pH 8,0
Cloreto de magnésio 25 mM Dimetilformamida 50 % v/v
Tampão Reacional 10X TMgAc: Tris acetato 100 mM, pH 7,6
Cloreto de magnésio 50 mM
Tampão Reacional 5X TMgAc-DMF: Tris acetato 50 mM, pH 7,6
Cloreto de magnésio 25 mM Dimetilformamida 50 % v/v "DNA-alvo" refere-se ao DNA sujeito a transposição. No exemplo abaixo, DNA de bacteriófago T7D111 é utilizado como DNA-alvo. "TSase" refere-se à transposase Tn5 EZ-Tn5™ hiperativa (EPICENTRE Biotechnologies, Madison, WI, EUA).
Tampão Reacional 10X Transposase:
Tris acetato 330 mM, pH 7,8 Acetato de magnésio 100 mM Acetato de potássio 660 mM EXEMPLO 1
Fragmentação de DNA Mediada por Transposição In vitro e Marcação 5' utilizando Transposase EZ-Tn5™ e a Extremidade de Transposão EZ-Tn5™
Preparou-se a seguinte mistura reacional: x água até um volume final de 50 microlitros 5 microlitros 10X Tampão de Transposição EZ-Tn5™ 1 micrograma DNA-alvo em 1 até 40 microlitros 2 microlitros pMEDS (25 micromolar)* 2 microlitros Transposase EZ-Tn5™ (a 10 unidades por microlitro) 50 microlitros * Nalgumas formas de realização, duas extremidades de transposão pMEDS diferentes em que cada uma exibe adicionalmente uma sequência arbitrária diferente na sua respetiva porção 5' da extremidade de transposão transferida, a 5' da sequência de extremidade de transposão transferida (FIG. 4) .
Após mistura, a reação foi incubada durante 1 hora a 37 °C. A reação foi terminada com 10 microlitros de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252] e Proteinase K a 100 microgramas por mL) , foi misturada e aquecida a 50 °C durante 10 minutos.
O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Utilizou-se LMP agarose para isolar o DNA em classes de tamanhos. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. Tiras de gel para géis LMP foram incubadas a 70 °C durante 5 minutos para liquefazer o gel. Após 5 minutos a 37 °C, adicionou-se um centésimo do volume de solução de digestão de agarose Gelase™ (EPICENTRE
Biotechnologies). A reação foi misturada e foi incubada durante 1 hora a 37 °C. 0 DNA-alvo foi fragmentado numa extensão semelhante e num intervalo de tamanhos semelhante como descrito nos Exemplos 3 e 4 utilizando quantidades e concentrações comparáveis da transposase Tn 5 EZ-Tn5™ e das extremidades de transposão. 0 DNA do procedimento de dimensionamento foi utilizado no EXEMPLO 2 para marcação das extremidades 3' dos fragmentos de DNA com marcação 5'. EXEMPLO 2
Intervalo de Tamanhos de Produtos de Transposição de Fragmentos de DNA com Marcação 5' Utilizando Diferentes Concentrações de Transposase Tn5 EZ-Tn5™.
Transposase Tn5 EZ-Tn5™ hiperativa (EPICENTRE) a uma concentração de 90 unidades por microlitro foi diluída para concentrações finais de 45, 22,5, 11,3 e 9 unidades por microlitro. Dois microlitros da enzima a cada concentração foram incubados com 1 micrograma de DNA-alvo de fago T7 Dili (tendo um tamanho de cerca de 39 Kpb) e 1 micromolar da extremidade de transposão pMEDS em tampão TA num volume final da mistura reacional de 50 microlitros durante 1 hora a 37 °C.
As reações foram terminadas com 10 microlitros de uma solução de terminação contendo sucrose 15 %, EDTA 66 mM, Tris/HCl 20 mM pH 8,0, SDS 0,1 %, laranja G 0,9 % e 100 microgramas por mL de proteinase K. Após mistura e incubação a 50 °C durante 10 min, alíquotas de 10 microlitros foram submetidas a eletroforese num gel de agarose 1 % em tampão TAE durante 1 hora a 100 Volts. O gel foi corado com SYBR Gold e fotografado com transiluminação A340.
Uma concentração final de cerca de 0,9 unidades por microlitro de transposase Tn5 na mistura reacional originou fragmentação máxima do DNA-alvo de fago T7 Dili.
Concentrações mais elevadas da transposase Tn5 foram inibidoras e concentrações menores deslocaram positivamente o intervalo de tamanhos dos fragmentos. A uma concentração final de cerca de 0,9 unidades de transposase Tn5 por microlitro, a maior parte do DNA-alvo de fago T7 Dili foi fragmentada em DNA que migrou no gel a tamanhos entre cerca de 150 bp e cerca de 1,5 Kpb com base nas bandas marcadoras. A uma concentração final de cerca de 0,45 unidades de transposase Tn5 por microlitro, a maior parte do DNA-alvo de fago T7 Dili foi fragmentada em DNA que migrou no gel a tamanhos entre cerca de 400 bp e cerca de 3,5 Kpb com base nas bandas marcadoras. EXEMPLO 3
Intervalo de Tamanhos de Produtos de Transposição de Fragmentos de DNA com Marcação 5' Utilizando Diferentes Concentrações de Extremidade de Transposão pMEDS.
Um lote de 25 micromolar da extremidade de transposão pMEDS foi diluído em série 2, 4 e 8 vezes com tampão TioEi. Depois, 2 microlitros de cada diluição de extremidade de transposão e de um controlo de tampão não de extremidade de transposão foram incubados em reações de 50 microlitros contendo IX tampão TA, 1 micrograma de DNA-alvo de fago 7 Dili e 0,4 unidades por microlitro de transposase Tn5 hiperativa durante 1 hora a 37 °C.
As reações foram terminadas e amostras foram analisadas por eletroforese em gel de agarose 1 % como descrito no EXEMPLO 2 . A diluição 4 vezes do lote de 25 uM, que originou uma concentração final de 0,25 micromolar da extremidade de transposão pMEDS na mistura reacional, originou boa fragmentação do DNA-alvo e provavelmente foi mais eficiente em termos da utilização da extremidade de transposão pMEDS. A esta concentração, a maior parte do DNA-alvo de fago T7 Dili foi fragmentada em DNA que migrou no gel a tamanhos entre cerca de 400 bp e cerca de 3,5 Kpb com base nas bandas marcadoras. Às concentrações de 0,5 e 1 micromolar da extremidade de transposão pMEDS, os tamanhos do DNA fragmentado foram ligeiramente deslocados negativamente para entre cerca de 200-300 bp e cerca de 3 Kpb. EXEMPLO 4
Intervalo de Tamanhos de Produtos de Transposição de Fragmentos de DNA com Marcação 5' Utilizando Diferentes Concentrações de Transpossoma. "Transpossomas A-MEDS" e "Transpossomas B-MEDS" foram formados por pré-incubação de TSase 12,5 μΜ com composições de extremidade de transposão A-MEDS 12,5 μΜ ou B-MEDS 12,5 μΜ, respetivamente, durante 60 minutos a 37 °C. Os transpossomas A-MEDS e B-MEDS foram combinados em proporções iguais para formar "Transpossomas A/B".
Os transpossomas foram depois utilizados a 12,5 μΜ ou diluídos para 10 μΜ, 7,5 μΜ, 5 μΜ, 2,5 μΜ ou 1 μΜ com tampão de armazenamento TSase (Tris cloreto 50 mM pH 7,5, glicerol 50 %, EDTA 0,1 mM, DTT 1 mM, Cloreto de sódio 500 mM, NP-40 0,5 % v/v, Tween-20 0,5 % v/v). DNA genómico de E. coli foi marcado na extremidade 5' e fragmentado utilizando Transpossomas A/B nas reações seguintes:
As reações foram incubadas durante 5 minutos a 55 °C. Depois, as reações foram terminadas com 5 microlitros de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252] e Proteinase K a 100 microgramas por mL), foram misturadas e aquecidas a 70 °C durante 10 minutos. O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. O grau de fragmentação de DNA-Alvo é proporcional à quantidade de Transpossoma adicionado ao longo da diluição de 12,5 vezes do lote de Transpossoma de 12,5 μΜ. A concentrações elevadas de Transpossoma, a maior parte dos fragmentos de DNA migrou no gel a tamanhos menores do que 1000 pb (Figura 5, vias 3 e 9) . A concentrações baixas de transpossomas, os fragmentos de DNA migraram no gel predominantemente entre 500 pb e 6000 pb (Figura 5, vias 8 e 14) . A seta em bloco indica migração de composição de extremidade de transposão livre no gel. EXEMPLO 5
Fragmentação e Marcação 5' de DNA-Alvo a 55 °C e 37 °C na Presença de Dimetllformamlda.
Para testar o efeito da dimetilformamida na fragmentação e marcação 5' de DNA-alvo, DNA genómico HeLa foi fragmentado e marcado com transpossomas ME ou transpossomas A/B como se segue. "Transpossomas ME" foram formados por pré-incubação de TSase
12.5 μΜ com composições de extremidade de transposão MEDS 12.5 μΜ durante 60 minutos a 37 °C.
Reações em duplicado foram montadas como se segue:
"Transpossomas A-MEDS" e "Transpossomas B-MEDS" foram formados por pré-incubação de TSase 12,5 μΜ com composições de extremidade de transposão A-MEDS 12,5 μΜ ou B-MEDS 12,5 μΜ, respetivamente, durante 60 minutos a 37 °C. Os transpossomas A-MEDS e B-MEDS foram combinados em proporções iguais para formar "Transpossomas A/B".
Reações em duplicado foram montadas como se segue:
As reações foram incubadas durante 5 minutos a 37 °C ou durante 5 minutos a 55 °C. As reações foram terminadas com 5 microlitros de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252] e Proteinase K a 100 microgramas por mL) , foram misturadas e aquecidas a 70 °C durante 10 minutos. O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. A dimetilformamida melhorou a eficiência da fragmentação e reação de marcação 5', avaliado pelo decréscimo da distribuição de PM do produto reacional (Figura 6, comparar as vias 4, 6, 8, 10, 13, 15, 17 e 19 com as vias 3, 5, 7, 9, 12, 14, 16 e 18, respetivamente) . De modo semelhante, reações na presença de tampão reacional TMgCl foram mais eficientes do que reações na presença de tampão reacional TA. Por fim, reações a 55 °C aparentaram melhorar a eficiência global das reações em comparação com reações a 37 °C (Figura 6, comparar as vias 4-10 com as vias 12-19) . A seta em bloco indica a migração de composição de extremidade de transposão livre no gel. EXEMPLO 6
Fragmentação Marcação de DNA-Alvo Utilizando Transposase MuA.
Transposase MuA HiperMu™ (EPICENTRE) a uma concentração final de 1 unidade por microlitro, e depois um intervalo de concentrações de proteína transposase MuA entre cerca de 0,01 microgramas e cerca de 0,5 microgramas de proteína por microlitro de mistura reacional, foi incubada numa reação de 50 microlitros contendo tampão reacional de transposase MuA (EPICENTRE) , 1 micrograma de DNA-alvo de fago T7 Dill e 1 micromolar da extremidade de transposão MuA PR1R2 durante 1 hora a 37 °C. A reação foi terminada e os produtos foram analisados por eletroforese em gel de agarose como descrito no EXEMPLO 3. A fragmentação do DNA-alvo de fago T7 Dili foi muito menor do que foi observado utilizando a transposase Tn5 EZ-Tn5™ a todos os níveis de transposase MuA testados. Foi observada uma quantidade muito pequena de fragmentação apenas com a concentração mais elevada de transposase MuA testada. Assim, a utilização da transposase MuA e da extremidade de transposão MuA PR1R2 foi muito menos eficiente para fragmentação e marcação 5' de DNA-alvo do que a transposase Tn5 hiperativa EZ-Tn5™ e extremidade de transposão Tn5 ME EZ-Tn5™. EXEMPLO 7
Marcação das Extremidades 3' dos Fragmentos de DNA com Marcação 5' A. PCR de dois "primers"
Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, é conduzida a seguinte reação: 22 microlitros de produtos de transposição com marcação 5' com tamanhos selecionados de 0,5-1 Kpb 25 microlitros de Pré-Mistura C de PCR Failsafe™ 1 microlitro de DNA polimerase Failsafe™ (EPICENTRE) 2 microlitros de 5 micromolar de cada "primer" oligonucleotídico de PCR, dos quais um é complementar à porção 5' de cada de uma das porções 5' das duas extremidades de transposão transferidas diferentes. 50 microlitros de volume reacional total
Uma vez que a DNA polimerase FailSafe tem atividade de deslocamento de filamento e nuclease 5', a polimerização do método é efetuada por incubação da reação durante 10 minutos a 70 °C (passo de extensão de DNA polimerase 3'), desse modo gerando fragmentos de DNA com marcação 5' e 3' (FIG. 8).
Em seguida, a reação é incubada a 94 °C durante 5 minutos para desnaturar o DNA. A amplificação dos fragmentos de DNA com marcação 5' e 3' é realizada por amplificação por PCR dos fragmentos de DNA com marcação 5' e 3' utilizando os dois "primers" de PCR, cada um dos quais é complementar à porção 5' de uma das duas extremidades de transposão transferidas diferentes. A mistura da reação de PCR acima é sujeita a PCR durante 20 ciclos com as seguintes condições de aplicação de ciclos: 94 °C 10 seg. 55 °C 10 seg. 72 °C 2 min. A análise do gel indicou que foram produzidos os produtos de PCR com o intervalo de tamanhos esperado (0,5 - 1 Kpb).
Também são conduzidas reações de controlo: Se produtos de transposição de tamanho selecionado forem desnaturados termicamente antes de PCR e sem um passo de extensão de DNA polimerase 3' , não são produzidos produtos de PCR de 0,5 -1 Kpb. B. PCR de "Primer" Único
Para marcar as extremidades 3' dos fragmentos gerados por transposição e com marcação 5' ME com a sequência ME, foi conduzida a reação seguinte: 23 microlitros de produtos de transposição com marcação 5' com tamanhos selecionados de 0,5 - 1 Kpb 25 microlitros de Pré-Mistura C de PCR Failsafe™ 1 microlitro de DNA polimerase Failsafe™ (EPICENTRE) 1 microlitro de pMETS 5 micromolar como "primer" oligonucleotidico de PCR 50 microlitros
Uma vez que a DNA polimerase FailSafe tem atividade de deslocamento de filamento e nuclease 5', o método foi implementado por incubação da reação durante 10 minutos a 70 °C (passo de extensão de DNA polimerase 3' ) , desse modo gerando fragmentos de DNA com marcação 5' e 3' (FIG. 7).
Em seguida, a reação foi incubada a 94 °C durante 5 minutos para desnaturar o DNA. A amplificação dos fragmentos de DNA com marcação 5' e 3' foi realizada por amplificação por PCR dos fragmentos de DNA com marcação 5' e 3' utilizando o pMETs como único "primer" oligonucleotidico de PCR. A mistura da reação de PCR acima foi sujeita a PCR durante 20 ciclos com as seguintes condições de aplicação de ciclos: 94 °C 10 seg. 55 °C 10 seg. 72 °C 2 min. A análise do gel indicou que foram produzidos os produtos de PCR com o intervalo de tamanhos esperado (0,5 - 1 Kpb) .
Também foram conduzidas reações de controlo: Se produtos de transposição de tamanho selecionado fossem desnaturados termicamente antes de PCR e sem um passo de extensão de DNA polimerase 3', não seriam produzidos produtos de PCR de 0,5 - 1 Kpb. EXEMPLO 8
Amplificação e Sequenciação Profunda de uma Biblioteca de Fragmentos de DNA
Para gerar uma biblioteca de fragmentos de DNA não seletiva que possa ser amplificada antes da preparação da biblioteca, fragmentos de DNA foram gerados e marcados na extremidade 3' e na extremidade 5' utilizando "Transpossomas ME". "Transpossomas ME" foram formados por pré-incubação de TSase 10 μΜ com composições de extremidade de transposão MEDS 10 μΜ durante 10 minutos em gelo. Um DNA cosmídico de 43 kb foi fragmentado e dotado de marcação 5' na reação seguinte:
A reação foi incubada durante 2 horas minutos a 37 °C.
Adicionaram-se à reação mais 5 yL de Transpossoma ME 10 μΜ e o sistema foi incubado durante mais 2 horas a 37 °C.
Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs.
Uma porção dos fragmentos de DNA gerados por transposição e com marcação 5' foi diluída 1:10 antes da marcação da extremidade 3' e amplificação para caracterizar a amplificação de 4 ng de modelo de biblioteca de DNA. Para amplificar de modo não seletivo a totalidade da população de fragmentos de DNA marcados utilizando um único "primer" de PCR, a seguinte reação foi conduzida com o "primer" de PCR METS, que hibridiza apenas com a sequência de extremidade de transposão e não contém informações adicionais de sequência 3' .
A reação foi incubada como se segue: • 25 ciclos de (98 °C/0:10, 55 °C/0:10, 72 °C/1:00) • 4 °C manter *- Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs antes do passo de desnaturação (Ver FIG. 7).
Os produtos reacionais amplificados e não amplificados foram purificados utilizando uma coluna QIAGEN PCR-Clean-up seguindo as instruções do fabricante e foram utilizados como material de entrada para o passo 3.4 do protocolo comum de preparação de bibliotecas Roche/454 FLX seguindo as instruções do fabricante (USM00048.A, outubro 2008) . A sequenciação profunda das bibliotecas fragmentadas por transposão produziu uma única sequência contígua do tamanho esperado com comprimento de leitura, precisão e cobertura que foi comparável a uma biblioteca de controlo produzida utilizando nebulização (Figura 9) . Estes dados são consistentes com a amplificação não seletiva e massivamente paralela de uma biblioteca de fragmentos de DNA. EXEMPLO 9
Preparação de Bibliotecas de Sequenciação Compatíveis com Roche/454 FLX com Código de Barras por Adição de Mais Informação de Marcação de Sequenciação 5' e 3' utilizando PCR com Oligonucleótidos Adaptadores
Para gerar uma biblioteca de fragmentos de DNA com código de barras que possa ser utilizada diretamente em emPCR para sequenciação 454 GS FLX, DNA genómico de lambda foi fragmentado e dotado de marcação 5' com transpossomas ME. Utilizaram-se oligonucleótidos adaptadores não seletivos durante PCR para anexar à biblioteca de DNA emPCR 454 FLX e sequência de adaptador de sequenciação e código de barras (FIG. 10) . "Transpossomas ME" foram formados por pré-incubação de TSase
12.5 μΜ com composições de extremidade de transposão MEDS 12.5 μΜ durante 60 minutos a 37 °C. DNA genómico de lambda foi fragmentado e dotado de marcação 5' na reação seguinte:
A reação foi incubada durante 2 horas a 37 °C. Adicionaram-se à reação mais 2 pL de Transpossoma ME 12,5 μΜ e o sistema foi incubado durante mais 2 horas a 37 °C.
Os produtos reacionais foram purificados utilizando uma coluna QIAGEN PCR-Clean-Up seguindo as instruções do fabricante.
Para amplificar de modo não seletivo e anexar à biblioteca de fragmentos de DNA adaptadores compatíveis com emPCR
Roche/454 FLX e sequenciação, realizou-se PCR utilizando oligos adaptadores que hibridizam com a sequência de extremidade de transposão e não contêm informações adicionais de sequência 3' (FIG. 10).
A reação foi incubada como se segue: • 72 °C/5:00* • 98 °C/2:0 0 • 4 ciclos de (98 °C/0:10, 37°C/0:30, 72 °C/3:00) • 6 ciclos de (98 °C/0:10, 64 °C/3:00) • 4 °C manter *- Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs antes do passo de desnaturação (Ver FIG. 7).
Reações de controlo omitiram os "primers" de PCR A-MID2-METS e B-METS e continham 20 ng de Fragmentos de DNA com marcação 5' . A reação de PCR produziu uma biblioteca compatível com emPCR com a distribuição esperada de PM e foi semelhante à dos fragmentos de DNA gerados por transposição e com marcação 5' (Figura 11, vias 3 e 4). A ausência de produtos de amplificação detetáveis em reações desprovidas dos "primers" adaptadores (A-MID2-METS e B-METS) é consistente com amplificação específica de uma biblioteca de DNA com marcação FLX-A e FLX-B (Figura 11, via 5). EXEMPLO 10
Sequenciação Profunda de Biblioteca de Sequenciação Compatível com Roche/454 FLX Titanium a partir de 50 ng de cDNA de Amplificação Virai
Para gerar uma biblioteca não seletiva de fragmentos de DNA que possa ser utilizada diretamente em emPCR para sequenciação Roche/454 FLX Titanium, DNA de amplificação foi fragmentado e dotado de marcação 5' com transpossomas ME. Utilizaram-se oligonucleótidos adaptadores não seletivos para anexar à biblioteca de DNA sequência de emPCR Roche/454 FLX Titanium e de adaptador de sequenciação (FIG. 10).
Formaram-se "transpossomas ME" por pré-incubação de TSase
12.5 μΜ com composições de extremidade de transposão MEDS 12.5 μΜ durante 60 minutos a 37 °C. Este lote foi diluído para 7,5 μΜ em tampão de armazenamento de TSase (Tris cloreto 50 mM pH 7,5, glicerol 50 %, EDTA 0,1 mM, DTT 1 mM, Cloreto de sódio 500 mM, NP-40 0,5 % v/v, Tween-20 0,5 % v/v). cDNA de amplificação viral foi fragmentado e dotado de marcação 5' na reação seguinte:
A reação foi incubada durante 15 minutos a 55 °C. Adicionou-se à reação mais 1 yL de Transpossoma ME 7,5 μΜ e o sistema foi incubado durante mais 15 minutos a 55 °C.
Os produtos reacionais foram purificados utilizando uma coluna QIAGEN PCR-Clean-Up seguindo as instruções do fabricante utilizando duas eluições de 11 yL que foram reunidas.
Para amplificar de modo não seletivo e anexar à biblioteca de fragmentos de DNA adaptadores compatíveis com emPCR Roche/454 FLX Titanium e sequenciação, realizou-se PCR utilizando oligos adaptadores que hibridizam com a sequência de extremidade de transposão e não contêm informações adicionais de sequência 3' (FIG. 10).
A reação foi incubada como se segue: • 72 °C/5:00* • 98 °C/2:00 • 4 ciclos de (98 °C/0:10, 55 °C/0:30, 72 °C/3:00) • 6 ciclos de (98 °C/0:10, 64 °C/3:00) • 4 °C manter *- Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs antes do passo de desnaturação (Ver FIG. 7). A reação de PCR produziu uma biblioteca compatível com emPCR com a distribuição esperada de PM e foi semelhante à dos fragmentos de DNA gerados por transposição e com marcação 5' (Figura 12, vias 2 e 3). A sequenciação profunda da biblioteca em 1/8° de uma placa Roche/454 FLX Titanium proporcionou ~80 000 leituras, em que ~95 % das leituras mapearam o rendimento do genoma virai de referência com a cobertura esperada (dados não mostrados). Estes dados são consistentes com a amplificação não seletiva e massivamente paralela de uma biblioteca de fragmentos de DNA. EXEMPLO 11
Preparação de Bibliotecas de Sequenciação Compatíveis com Illumina GAII com Código de Barras por Adição de Mais Informação de Marcação de Sequenciação 5' e 3' utilizando PCR com Oligonucleótidos Adaptadores
Para gerar uma biblioteca de fragmentos de DNA que possa ser utilizada diretamente em bPCR para sequenciação Illumina GAII, DNA genómico de lambda foi fragmentado e dotado de marcação 5' com transpossomas A/B. Utilizaram-se oligonucleótidos adaptadores não seletivos para anexar à biblioteca de DNA adaptador de bPCR Illumina GAII e sequência de código de barras (FIG. 13). "Transpossomas A-MEDS" e "Transpossomas B-MEDS" foram formados por pré-incubação de TSase 12,5 μΜ com composições de extremidade de transposão A-MEDS 12,5 μΜ ou B-MEDS 12,5 μΜ, respetivamente, durante 60 minutos a 37 °C. DNA genómico de lambda foi fragmentado e dotado de marcação 5' na reação seguinte:
A reação foi incubada durante 2 horas a 37 °C. Adicionaram-se à reação mais 2 yL de Transpossoma A-MEDS 12,5 μΜ e 2 yL de Transpossoma B-MEDS 12,5 μΜ e o sistema foi incubado durante mais 2 horas a 37 °C.
Os produtos reacionais foram purificados utilizando uma coluna QIAGEN PCR-Clean-Up seguindo as instruções do fabricante.
Para amplificar de modo não seletivo e anexar à biblioteca de fragmentos de DNA adaptadores compatíveis com PCR Illumina GAII bridge e sequenciação, realizou-se PCR utilizando oligos adaptadores que hibridizam com a sequência de extremidade de transposão e não contêm informações adicionais de sequência 3' (FIG. 13).
A reação foi incubada como se segue: *- Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs antes do passo de desnaturação (Ver FIG. 8) .
Reações de controlo omitiram os "primers" de PCR BPl-A e BP2-ID1-B e continham 20 ng de Fragmentos de DNA com marcação 5' . A reação de PCR produziu uma biblioteca compatível com bPCR com a distribuição esperada de PM e foi semelhante à dos fragmentos de DNA gerados por transposição e com marcação 5' (Figura 14, vias 3 e 4). A ausência de produtos de amplificação detetáveis em reações desprovidas dos "primers" adaptadores (BPl-A e BP2-ID1-B) é consistente com amplificação específica de uma biblioteca de DNA com marcação BPl e BP2 (Figura 14, via 5). EXEMPLO 12
Sequenciação Profunda de uma Biblioteca de Sequenciação Compatível com Illumina GAII
Para gerar uma biblioteca de fragmentos de DNA não seletiva que possa ser utilizada diretamente em bPCR para sequenciação Illumina GAII, DNA genómico CC118 de E. coli foi fragmentado e dotado de marcação 5' com transpossomas A/B. Utilizaram-se oligonucleótidos adaptadores não seletivos para anexar à biblioteca de DNA adaptadores de bPCR Illumina GAII (FIG. 13) . DNA genómico CC118 de E. coli foi fragmentado, dotado de marcação 5' e purificado como descrito no EXEMPLO D2.
Para amplificar de modo não seletivo e anexar à biblioteca de fragmentos de DNA adaptadores compatíveis com PCR Illumina GAII bridge e sequenciação, realizou-se PCR utilizando oligos adaptadores que hibridizam com a sequência de extremidade de transposão e não contêm informações adicionais de sequência 3' .
A reação foi incubada como se segue: • 72 °C/5:00* • 98 °C/2:0 0 • 10 ciclos de (98 °C/0:10, 58°C/0:30, 72 °C/3:00) • 4 °C manter *- Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição e com marcação 5' com a sequência de extremidade de transposão transferida, os produtos reacionais foram incubados com uma mistura de polimerases de deslocamento de filamento (FailSafe™) e dNTPs antes do passo de desnaturação (Ver FIG. 8). A sequenciação profunda da biblioteca gerada atingiu cobertura do genoma de ~4,6 Mb com uma profundidade média de -115X (dados não mostrados). Estes dados são consistentes com a amplificação não seletiva e massivamente paralela de uma biblioteca de fragmentos de DNA que é compatível com emPCR Roche/454 FLX Titanium e sequenciação. EXEMPLO 13
Comparação de Métodos da Técnica Anterior com Formas de Realização da Presente Invenção e Protocolos para Estojos. 0 fluxo de trabalho e calendário para a preparação de uma biblioteca de fragmentos de DNA marcados pelos métodos da presente invenção são comparados com o fluxo de trabalho e calendário para a preparação de tais bibliotecas pelos métodos correntes tipicamente utilizados. Uma tabela que compara os passos dos processos e o tempo requerido em cada passo é apresentada na Figura 15. Os métodos da presente invenção requerem menos passos, menos tempo de manipulação e menos tempo global. EXEMPLO 14
Fragmentação e Marcação de DNA mediados por Transposição In vitro utilizando Transposase EZ-Tn5™ e uma Composição de Extremidade de Transposão EZ-Tn5™ em Grampo
Os seguintes componentes foram misturados para formar Transpossomas™ em Grampo (isto é, o complexo de composição de extremidade de transposão em grampo com a transposase) a uma concentração final de 25 micromolar (Ver FIG. 16):
Após mistura, a reação foi incubada durante 2 horas a 37 °C. A reação foi terminada com um volume igual de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252]), foi misturada e aquecida a 70 °C durante 10 minutos. O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. A fragmentação de DNA-Alvo é proporcional à quantidade de Transpossoma adicionado (FIG 17). EXEMPLO 15
Fragmentos de DNA Circulares Marcados São Resistentes a Exonuclease T5
Fragmentos de DNA com marcação 5' do EXEMPLO 14 foram isolados utilizando PCR Clean-up NucleoTraP®CR (Macherey-Nagel, GmbH) seguindo as instruções de fabrico. Para criar fragmentos de DNA circulares marcados, o DNA recuperado foi incubado com uma polimerase não de deslocamento de filamento desprovida de atividade de exonuclease 5' para 3' (por exemplo, DNA polimerase de T4) e uma ligase dependente do modelo (por exemplo, ligase de E. coli) na presença de dNTPS e β-NAD.
Preparou-se a seguinte mistura reacional:
A reação foi incubada durante 15 minutos à temperatura ambiente. As reações foram terminadas por incubação durante 20 minutos a 75 °C. Uma porção da reação (10 pL) foi incubada com 10 unidades de Exonuclease T5 durante 5 minutos a 37 °C para degradar fragmentos de DNA lineares (não circularizados).
Todas as reações foram tratadas com 2 pL de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252]), foram misturadas e aquecidas a 70 °C durante 5 minutos. O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. O tratamento com DNA polimerase de T4 e ligase de E. coli converteu uma porção dos fragmentos de DNA em moléculas de fragmentos de DNA circulares marcados resistentes a exonuclease T5 que são facilmente detetadas (FIG. 18, via 9). Além disso, a distribuição de pesos moleculares do DNA resistente a exonuclease T5 é comparável à do DNA de entrada, demonstrando uma ausência de desequilíbrio de pesos moleculares nesta reação.
Também foram conduzidas reações de controlo. Quando os fragmentos de DNA não foram tratados, foram tratados com DNA polimerase de T4 isoladamente ou tratados com ligase de E. coli isoladamente, não foram detetados fragmentos de DNA circulares marcados resistentes a exonuclease T5 (Figura 18; vias 3, 5, e 7) . EXEMPLO 16
Marcação das Extremidades 3' dos Fragmentos de DNA gerados por Transposição com Marcação 5' utilizando uma Ácido Nucleico Ligase e um Oligonucleótido de Marcação de Ligação. DNA fragmentado com marcação 5' do procedimento de dimensionamento acima (Exemplo 1) foi utilizado para marcação das extremidades 3' dos fragmentos de DNA com marcação 5' utilizando uma ácido nucleico ligase e um oligonucleótido de marcação de ligação (FIG. 21).
Para marcar as extremidades 3' dos fragmentos de DNA gerados por transposição com marcação 5' com um segundo marcador compreendendo o marcador de sequenciação Roche 454 (4N454B), foi conduzida a reação seguinte. 43 microlitros de fragmentos de DNA com marcação 5' de tamanhos selecionados de 0,5 - 1 Kb do EXEMPLO 1 5 microlitros de 10X Tampão Reacional de Ligase (Tris-HCl 0,2 M pH 8,3, MgCl2 100 mM, KC1 250 mM, β-NAD 5 mM)
1 micromolar de oligonucleótido 4N454B (5’ pISiNNNCTGAGCGGGCTGGCAAGGC 3’ (SEQ ID NO : 6)) 1 microiitro de DNA Ligase de E. coli (10 unidades por microlitro)
Após mistura, a reação foi incubada durante 1 hora à temperatura ambiente. Em seguida, a reação foi terminada, a ligase foi inativada e o DNA foi desnaturado por incubação a 95 °C durante 5 min. Depois, a reação foi imediatamente arrefecida num banho de água gelada.
Utilizou-se análise de PCR para mostrar que as extremidades 5' dos fragmentos de DNA exibiram a sequência de extremidade de transposão transferida da extremidade de transposão EZ-Tn5 e as extremidades 3' exibiram o marcador de sequenciação Roche 454 (4N454B). A seguinte reação de PCR foi conduzida como se segue: 21 microlitros água 1 microlitro fragmentos de DNA com marcação 5' e 3' com marcação dual 1 microlitro "Primer" de PCR 1 (pMETS) 5 micromolar 1 microlitro "Primer" de PCR 2 5 micromolar (5' ATA GGC GCG CCG CCT TGC CAG CCC GCT CAG 3' 0 (SEQ ID NO:21) 1 microlitro DNA polimerase FailSafe™ 25 microlitros 2X Pré-Mistura de PCR C FailSafe™ 50 microlitros
Foi conduzida PCR durante 20 ciclos, nas condições seguintes: 94 °C 10 seg. 55 °C 10 seg. 72 °C 2 min. A análise do gel indicou que foram produzidos os produtos de PCR com o intervalo de tamanhos esperado de 0,5 - 1,0 KB (dados não mostrados).
Também foram conduzidas reações de controlo. Quando a reação de ligação foi conduzida sem a ligase ou sem o marcador de sequenciação Roche 454 (4N454B), não foram produzidos produtos de PCR. Quando o "Primer" de PCR 1 pMETS ou o "Primer" de PCR 2 foi omitido da reação de PCR, não foram produzidos produtos de 0,5 - 1 KB. Quando uma reação de ligação foi conduzida sem a ligase ou sem o marcador de sequenciação Roche 454 (4N454B), não foram produzidos produtos de PCR. Quando o "Primer" de PCR 1 pMETS ou o "Primer" de PCR 2 foi omitido da reação de PCR, não foram produzidos produtos de 0,5 - 1 KB (dados não mostrados). EXEMPLO 17
Circularização de Fragmentos de ssDNA Marcados a partir de Fragmentação de DNA Mediada por Transposição In Vitro e Marcação 5' utilizando a Composição de Extremidade de Transposão p454.1MEDS e Transposase EZ-Tn5™ DNA genómico de T7 Dili foi marcado na extremidade 5' e fragmentado utilizando a composição de extremidade de transposão EZ-Tn5™ p454MEDS na reação seguinte:
Após mistura, a reação foi incubada durante 1 hora a 37 °C. Em seguida, a reação foi terminada com 10 microlitros de solução de terminação (sucrose 15 %, EDTA 66 mM, TRIS 20 mM, pH 8,0, SDS 0,1 %, Laranja G 0,9 % [Sigma 0-7252] e Proteinase K a 100 microgramas por mL), foi misturada e aquecida a 50 °C durante 10 minutos. O DNA foi analisado por eletroforese em gel de agarose 1 % em tampão TAE. Os géis foram corados com SYBR Gold e o DNA foi visualizado com luz não UV. O DNA-alvo foi fragmentado numa extensão semelhante e num intervalo de tamanhos semelhante como descrito no Exemplo 3, utilizando quantidades e concentrações comparáveis da transposase EZ-Tn5™ e da extremidade de transposão pMEDS (FIG. 22B, via 5) . Estes dados indicam que a extensão do oligo pMETS com o marcador de sequenciação Roche 454 adicional não altera significativamente a eficiência da fragmentação de DNA e marcação por transposase EZ-Tn5™. A omissão da composição de extremidade de transposão p454.lMEDS ou da transposase EZ-Tn5™ não originou fragmentação de DNA detetável (FIG. 22, vias 3 e 4). 0 DNA fragmentado com marcação 5' da FIG. 22, via 5 foi desnaturado termicamente e circularizado utilizando ligase independente do modelo (Ver FIG. 22A) na reação seguinte:
A reação foi incubada durante 2 horas a 60 °C. Em seguida, os produtos reacionais foram tratados com 18 unidades de Exo 1 e 20 unidades de Exo III durante 1 hora a 37 °C para eliminar DNA linear não circularizado. EXEMPLO 18
Análise de PCR de ssDNA Circular Marcado
Conduziu-se análise PCR utilizando pMETS e pc454.1 como "primers" para demonstrar circularização; ssDNA circular apenas ligado pode ser amplificado para gerar um produto de dsDNA linear que corresponde ao tamanho do ssDNA circular. A reação de PCR foi conduzida como se segue:
Foi conduzida PCR durante 29 ciclos, nas condições seguintes: 94 °C 10 seg. 50 °C 10 seg. 72 °C 1 min. A análise do gel indicou que o intervalo de tamanhos dos produtos de PCR produzidos foi comparável ao de DNA fragmentado com marcação 5' (FIG. 23).
Também foram conduzidas reações de controlo. Quando ssDNA Ligase CIRCLIGASE™ foi omitida da reação de ligação, foram gerados produtos de PCR que indicaram circularização do filamento transferido p454.lMETS, mas não dos fragmentos de ssDNA lineares com marcação 5' (FIG. 23, via 1) . Quando o oligonucleótido pMETS (como "primer" de PCR) ou o "Primer" de PCR pc454.1 foi omitido da reação de PCR, não foram produzidos produtos (dados não mostrados). 0 facto de os produtos de PCR terem a mesma distribuição de tamanhos dos fragmentos de ssDNA lineares com marcação 5' (comparar Figura 22, via 5 e Figura 23, via 2) indica que: 1) a composição de extremidade de transposão p454.lMEDS pode proceder eficientemente à marcação 5' e fragmentação de DNA-alvo; 2) os fragmentos de ssDNA lineares com marcação 5' complementares emparelhados podem ser desnaturados termicamente para gerar fragmentos de ssDNA lineares marcados desnaturados que são substratos para ligação independente do modelo, e 3) os fragmentos de ssDNA lineares com marcação 5' podem ser eficientemente convertidos em fragmentos de ssDNA circulares marcados sem um desequilíbrio detetável (confirmado por amplificação por PCR após tratamento com exonuclease I e exonuclease III).
LISTAGEM DE SEQUÊNCIAS <110> Epicentre Technologies Corporation Jendrisak, Jerome Dahl, Gary
Grunenwald, Haiying Li Caruccio, Nicholas <120> Composições de Extremidade de Transposão e Métodos de Modificação de Ácidos Nucleicos
<130> EPICE-3705/US-2/ORD <140> US 12/605,337 <141> 2009-10-24 <150> US 61/108,321 <151> 2008-10-24 <150> US 61/108,326 <151> 2008-10-24 <150> US 61/108,329 <151> 2008-10-24 <150> US 61/155,431 <151> 2009-02-25 <150> US 61/184,530 <151> 2009-06-05 <160> 21 <170> Patentln versão 3.5
<210> 1 <211> 19 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 1 agatgtgtat aagagacag 19
<210> 2 <211> 19 <212> DNA <213> Sequência Artificial <223> Sintético <400> 2 <22 0> ctgtctctta tacacatct 19
<210> 3 <211> 44 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <22 0> <221> carateristica_mista <222> (20) . . (25) <223> n é a, c, g, ou t <400> 3 ctgtctctta tacacatctn nnnnnagatg tgtataagag acag 44
<210> 4 <211> 36 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 4 gccttgccag cccgctcaga tgtgtataag agacag 36
<210> 5 <211> 18 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 5 tgagcgggct ggcaaggc 18
<210> 6 <211> 23 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <220> <221> carateristica_mista <222> (1)..(4) <223> n é a, c, g, ou t <400> 6 nnnnctgagc gggctggcaa ggc 23
<210> 7 <211> 38 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 7 gcctccctcg cgccatcaga gatgtgtata agagacag 38
<210> 8 <211> 38 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 8 gccttgccag cccgctcaga gatgtgtata agagacag 38
<210> 9 <211> 19 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 9 gcctccctcg cgccatcag 19
<210> 10 <211> 19 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 10 gccttgccag cccgctcag 19
<210> 11 <211> 48 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 11 gcctccctcg cgccatcaga cgctcgacaa gatgtgtata agagacag 48
<210> 12 <211> 49 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 12 ccatctcatc cctgcgtgtc tccgactcag agatgtgtat aagagacag 49
<210> 13 <211> 49 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 13 cctatcccct gtgtgccttg gcagtctcag agatgtgtat aagagacag 49
<210> 14 <211> 26 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 14 ccatctcatc cctgcgtgtc tccgac 26
<210> 15 <211> 26 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 15 cctatcccct gtgtgccttg gcagtc 26
<210> 16 <211> 48 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 16 aatgatacgg cgaccaccga gatctacacg cctccctcgc gccatcag 48
<210> 17 <211> 49 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 17 caagcagaag acggcatacg agatcggtct gccttgccag cccgctcag 49
<210> 18 <211> 55 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 18 caagcagaag acggcatacg agatgcatgt cggtctgcct tgccagcccg ctcag 55
<210> 19 <211> 20 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <4 0 0> 19 aatgatacgg cgaccaccga 20
<210> 20 <211> 21 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 20 caagcagaag acggcatacg a 21
<210> 21 <211> 30 <212> DNA <213> Sequência Artificial <22 0> <223> Sintético <400> 21 ataggcgcgc cgccttgcca gcccgctcag 30

Claims (9)

  1. REIVINDICAÇÕES
    1. Um método in vitro de fragmentação e marcação do DNA-alvo, que compreende a incubação do DNA-alvo com: (i) uma transposase; e (ii) uma composição de extremidade de transposão compreendendo um filamento transferido que exibe, na sua porção 5', a sequência de um domínio de marcador que não é uma extremidade de transposão e, na sua porção 3', a sequência da extremidade de transposão transferida, em que: a) o referido DNA-alvo está fragmentado; e b) o referido filamento transferido da referida composição de extremidade de transposão é unido a uma extremidade 5' de um fragmento do referido DNA-alvo para produzir um fragmento de DNA-alvo com marcação 5'.
  2. 2. Um método de acordo com a reivindicação 1, em que a referida incubação é realizada na presença de iões Mg+2.
  3. 3. Um método de acordo com a reivindicação 2, em que a referida incubação é realizada na presença de iões Mg+2 a uma concentração de cerca de 5 mM ou cerca de 10 mM.
  4. 4. Um método de acordo com qualquer uma das reivindicações 1-3, em que a transposase é uma transposase Tns ou uma transposase Mu, ou uma sua combinação.
  5. 5. Um método de acordo com a reivindicação 4, em que a transposase é um mutante de uma transposase de ocorrência natural.
  6. 6. Um método de acordo com qualquer uma das reivindicações 1-5, em que o domínio de marcador é um domínio de marcador de captura.
  7. 7. Um método de acordo com qualquer uma das reivindicações 1-6, em que a transposase e a composição de extremidade de transposão formam um complexo estável entre si, antes da referida incubação com o DNA-alvo.
  8. 8. Um método de acordo com qualquer uma das reivindicações 1-7, em que um filamento transferido é unido a cada filamento do fragmento de DNA-alvo para produzir um fragmento de DNA-alvo que é dotado de marcação 5' em ambas as extremidades.
  9. 9. Um método de acordo com a reivindicação 8, em que o domínio de marcador no filamento transferido unido ao primeiro filamento do fragmento de DNA-alvo é diferente do domínio de marcador no filamento transferido unido ao segundo filamento do fragmento de DNA-alvo.
PT151793395T 2008-10-24 2009-10-24 Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos PT2963709T (pt)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US10832108P 2008-10-24 2008-10-24
US10832608P 2008-10-24 2008-10-24
US10832908P 2008-10-24 2008-10-24
US15286809P 2009-02-16 2009-02-16
US15543109P 2009-02-25 2009-02-25
US18453009P 2009-06-05 2009-06-05

Publications (1)

Publication Number Publication Date
PT2963709T true PT2963709T (pt) 2017-08-21

Family

ID=42119714

Family Applications (2)

Application Number Title Priority Date Filing Date
PT151793395T PT2963709T (pt) 2008-10-24 2009-10-24 Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos
PT141710772T PT2787565E (pt) 2008-10-24 2009-10-24 Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos

Family Applications After (1)

Application Number Title Priority Date Filing Date
PT141710772T PT2787565E (pt) 2008-10-24 2009-10-24 Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos

Country Status (13)

Country Link
EP (6) EP2508529B1 (pt)
JP (1) JP5794572B2 (pt)
CN (2) CN105018548B (pt)
CA (1) CA2750054C (pt)
DK (4) DK2376517T3 (pt)
ES (5) ES2515065T3 (pt)
HK (6) HK1163107A1 (pt)
HU (1) HUE027961T2 (pt)
LT (1) LT2963709T (pt)
PL (1) PL2963709T3 (pt)
PT (2) PT2963709T (pt)
SI (1) SI2963709T1 (pt)
WO (1) WO2010048605A1 (pt)

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2009205523A1 (en) 2008-01-14 2009-07-23 Applied Biosystems, Llc Compositions, methods, and kits for detecting ribonucleic acid
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
CA2750879C (en) 2009-01-30 2018-05-22 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
EP2539450B1 (en) * 2010-02-25 2016-02-17 Advanced Liquid Logic, Inc. Method of making nucleic acid libraries
WO2011112718A1 (en) 2010-03-10 2011-09-15 Ibis Biosciences, Inc. Production of single-stranded circular nucleic acid
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
EP2635679B1 (en) * 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US10457936B2 (en) 2011-02-02 2019-10-29 University Of Washington Through Its Center For Commercialization Massively parallel contiguity mapping
US9005935B2 (en) * 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
EP2721154B1 (en) * 2011-06-15 2019-01-02 Gen9, Inc. Methods for preparative in vitro cloning
US20130017978A1 (en) 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US9145623B2 (en) 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
CN103827320B (zh) 2011-07-25 2017-04-26 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
CA2844056A1 (en) * 2011-08-04 2013-02-07 Sage Science, Inc. Systems and methods for processing fluids
US10689643B2 (en) * 2011-11-22 2020-06-23 Active Motif, Inc. Targeted transposition for use in epigenetic studies
US9938524B2 (en) 2011-11-22 2018-04-10 Active Motif, Inc. Multiplex isolation of protein-associated nucleic acids
EP2783001B1 (en) * 2011-11-22 2018-01-03 Active Motif Multiplex isolation of protein-associated nucleic acids
NO2694769T3 (pt) * 2012-03-06 2018-03-03
CN102703426A (zh) * 2012-05-21 2012-10-03 吴江汇杰生物科技有限公司 构建核酸库的方法、试剂及试剂盒
WO2013181265A1 (en) * 2012-05-29 2013-12-05 The Johns Hopkins University Eukaryotic transposase mutants and transposon end compositions for modifying nucleic acids and methods for production and use in the generation of sequencing libraries
CN102703432A (zh) * 2012-07-11 2012-10-03 烟台博诺生物科技有限公司 构建核酸库的方法、试剂及试剂盒
EP2875154B1 (en) 2012-07-19 2017-08-23 Oxford Nanopore Technologies Limited SSB method for characterising a nucleic acid
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
CA2881685C (en) 2012-08-14 2023-12-05 10X Genomics, Inc. Microcapsule compositions and methods
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9644199B2 (en) 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
EP2906935B1 (en) 2012-10-12 2018-04-04 Sage Science, Inc. Side-eluting molecular fractionator
WO2014071178A1 (en) * 2012-11-05 2014-05-08 Icahn School Of Medicine At Mount Sinai Method of isolating pure mitochondrial dna
CN103849672B (zh) * 2012-12-06 2017-06-06 中国科学院上海生命科学研究院 一组糖基转移酶及其应用
CA2892646A1 (en) * 2012-12-10 2014-06-19 Resolution Bioscience, Inc. Methods for targeted genomic analysis
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9683230B2 (en) * 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
EP2954065B1 (en) 2013-02-08 2021-07-28 10X Genomics, Inc. Partitioning and processing of analytes and other species
GB201314695D0 (en) * 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
JP6408494B2 (ja) 2013-03-08 2018-10-17 オックスフォード ナノポール テクノロジーズ リミテッド 酵素停止法
US10557133B2 (en) * 2013-03-13 2020-02-11 Illumina, Inc. Methods and compositions for nucleic acid sequencing
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
EP2986741B1 (en) * 2013-04-17 2019-07-24 Agency For Science, Technology And Research Method for generating extended sequence reads
DK2999784T4 (en) * 2013-05-22 2023-02-20 Active Motif Inc Målrettet transposition til anvendelse i epigenetiske studier
JP6618894B2 (ja) 2013-05-23 2019-12-11 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 個別的エピゲノミクスのための天然クロマチンへの転移
US9217167B2 (en) * 2013-07-26 2015-12-22 General Electric Company Ligase-assisted nucleic acid circularization and amplification
US10655167B2 (en) 2013-07-26 2020-05-19 General Electric Company Ligase-assisted nucleic acid circularization and amplification
US10287622B2 (en) 2013-11-07 2019-05-14 Agilent Technologies, Inc. Plurality of transposase adapters for DNA manipulations
WO2015085274A1 (en) * 2013-12-05 2015-06-11 Centrillion Technology Holdings Corporation Methods for sequencing nucleic acids
CN103710342A (zh) * 2013-12-18 2014-04-09 浙江农林大学 人工诱导的mle转座子试剂盒及其应用
AU2014364926B2 (en) 2013-12-20 2017-12-14 Illumina, Inc. Preserving genomic connectivity information in fragmented genomic DNA samples
US20190194718A1 (en) * 2014-01-14 2019-06-27 Qiagen Gmbh Generation of tagged dna fragments
US11136576B2 (en) 2014-02-03 2021-10-05 Thermo Fisher Scientific Baltics Uab Method for controlled DNA fragmentation
WO2015113725A1 (en) * 2014-02-03 2015-08-06 Thermo Fisher Scientific Baltics Uab Method for controlled dna fragmentation
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
US20170114333A1 (en) * 2014-04-11 2017-04-27 The Johns Hopkins University Improvements to eukaryotic transposase mutants and transposon end compositions for modifying nucleic acids and methods for production and use in the generation of sequencing libraries
TWI682997B (zh) 2014-04-15 2020-01-21 美商伊路米納有限公司 用於改善插入序列傾向及增加dna輸入耐受度之經修飾的轉位酶
EP3680333A1 (en) 2014-04-29 2020-07-15 Illumina, Inc. Multiplexed single cell expression analysis using template switch and tagmentation
CN107075509B (zh) 2014-05-23 2021-03-09 数字基因公司 通过数字化转座子的单倍体组测定
CN106715693A (zh) * 2014-06-13 2017-05-24 伊卢米纳剑桥有限公司 用于制备序列文库的方法和组合物
CN106795553B (zh) 2014-06-26 2021-06-04 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
AU2015284464B2 (en) * 2014-06-30 2021-06-17 Illumina, Inc. Methods and compositions using one-sided transposition
CN106715713B (zh) * 2014-09-12 2020-11-03 深圳华大智造科技有限公司 试剂盒及其在核酸测序中的用途
EP3192869B1 (en) * 2014-09-12 2019-03-27 MGI Tech Co., Ltd. Isolated oligonucleotide and use thereof in nucleic acid sequencing
CN105525357B (zh) * 2014-09-30 2018-08-21 深圳华大基因股份有限公司 一种测序文库的构建方法及试剂盒和应用
JP2017534297A (ja) * 2014-10-14 2017-11-24 ビージーアイ シェンヂェン カンパニー リミテッドBgi Shenzhen Co., Limited トランスポゼースによる核酸の切断及びリンカー付加の方法及び試薬
US10093955B2 (en) 2014-10-14 2018-10-09 Covaris, Inc. Acoustic energy mediation of genetic fragmentation
US20180080092A1 (en) * 2014-10-14 2018-03-22 Bgi Shenzhen Co., Limited One-stop treatment method for breaking nucleic acid by means of transposase, and reagent
GB201418159D0 (en) * 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
WO2016061416A1 (en) 2014-10-15 2016-04-21 Sage Science, Inc. Apparatuses, methods and systems for automated processing of nucleic acids and electrophoretic sample preparation
SG11201703139VA (en) 2014-10-17 2017-07-28 Illumina Cambridge Ltd Contiguity preserving transposition
PT3207134T (pt) * 2014-10-17 2019-09-17 Illumina Cambridge Ltd Transposição que preserva a contiguidade
KR20170073667A (ko) 2014-10-29 2017-06-28 10엑스 제노믹스, 인크. 표적화 핵산 서열 분석을 위한 방법 및 조성물
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
ES2947757T3 (es) 2014-11-05 2023-08-18 Illumina Inc Composiciones de transposasas para reducir el sesgo de inserción
AU2015346514B2 (en) 2014-11-11 2021-04-08 Illumina, Inc. Polynucleotide amplification using CRISPR-Cas systems
CN112126675B (zh) 2015-01-12 2022-09-09 10X基因组学有限公司 用于制备核酸测序文库的方法和系统以及用其制备的文库
CN105985945B (zh) * 2015-01-30 2019-04-23 深圳华大智造科技有限公司 mRNA片段化方法及基于其构建测序文库的方法
WO2016137973A1 (en) 2015-02-24 2016-09-01 10X Genomics Inc Partition processing methods and systems
EP3262188B1 (en) 2015-02-24 2021-05-05 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
US20180195060A1 (en) * 2015-04-20 2018-07-12 Bgi Shenzhen Method for constructing long fragment dna library
WO2016189331A1 (en) 2015-05-28 2016-12-01 Illumina Cambridge Limited Surface-based tagmentation
WO2016196358A1 (en) 2015-05-29 2016-12-08 Epicentre Technologies Corporation Methods of analyzing nucleic acids
WO2017004083A1 (en) * 2015-06-29 2017-01-05 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
US10894980B2 (en) 2015-07-17 2021-01-19 President And Fellows Of Harvard College Methods of amplifying nucleic acid sequences mediated by transposase/transposon DNA complexes
WO2017027367A1 (en) 2015-08-07 2017-02-16 Massachusetts Institute Of Technology Nanoscale imaging of proteins and nucleic acids via expansion microscopy
CA3172078A1 (en) 2015-08-28 2017-03-09 Illumina, Inc. Nucleic acid sequence analysis from single cells
WO2017087979A1 (en) 2015-11-20 2017-05-26 Washington University Preparative electrophoretic method for targeted purification of genomic dna fragments
US10774370B2 (en) 2015-12-04 2020-09-15 10X Genomics, Inc. Methods and compositions for nucleic acid analysis
CN105524920B (zh) * 2016-01-21 2018-10-02 深圳华大基因研究院 用于Ion Proton测序平台的TN5建库的引物组、试剂盒和建库方法
WO2017197027A1 (en) 2016-05-11 2017-11-16 Illumina, Inc. Polynucleotide enrichment and amplification using argonaute systems
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
US10240196B2 (en) * 2016-05-27 2019-03-26 Agilent Technologies, Inc. Transposase-random priming DNA sample preparation
JP6943376B2 (ja) * 2016-08-30 2021-09-29 国立大学法人九州大学 Dna結合タンパク質の結合領域の近傍に所望のdna断片を挿入する方法
EP3555290B1 (en) * 2016-12-19 2022-11-02 Bio-Rad Laboratories, Inc. Droplet tagging contiguity preserved tagmented dna
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN110140051B (zh) * 2017-01-05 2021-03-05 深圳迈瑞生物医疗电子股份有限公司 网织红细胞模拟粒子、血小板模拟粒子制备方法及质控物
CN106801044B (zh) * 2017-01-09 2021-03-23 北京全式金生物技术有限公司 一种环状转座子复合物及其应用
US10995361B2 (en) 2017-01-23 2021-05-04 Massachusetts Institute Of Technology Multiplexed signal amplified FISH via splinted ligation amplification and sequencing
WO2018140966A1 (en) 2017-01-30 2018-08-02 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
JP7164276B2 (ja) 2017-02-21 2022-11-01 イルミナ インコーポレイテッド リンカーを用いた固定化トランスポソームを使用するタグメンテーション
WO2018157048A1 (en) 2017-02-24 2018-08-30 Massachusetts Institute Of Technology Methods for examining podocyte foot processes in human renal samples using conventional optical microscopy
AU2018250330A1 (en) 2017-04-07 2019-09-19 Sage Science, Inc. Systems and methods for detection of genetic structural variation using integrated electrophoretic DNA purification
EP3630972B1 (en) * 2017-05-23 2021-07-07 Bio-Rad Laboratories, Inc. Molecular barcoding
US11530436B2 (en) * 2017-05-23 2022-12-20 President And Fellows Of Harvard College Multiplex end-tagging amplification of nucleic acids
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
EP4230746A3 (en) 2017-05-26 2023-11-01 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
WO2019023214A1 (en) * 2017-07-25 2019-01-31 Massachusetts Institute Of Technology ATAC IN SITU SEQUENCING
CN107586835B (zh) * 2017-10-19 2020-11-03 东南大学 一种基于单链接头的下一代测序文库的构建方法及其应用
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP4180534A1 (en) 2017-11-02 2023-05-17 Bio-Rad Laboratories, Inc. Transposase-based genomic analysis
EP3954782A1 (en) 2017-11-15 2022-02-16 10X Genomics, Inc. Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11873374B2 (en) 2018-02-06 2024-01-16 Massachusetts Institute Of Technology Swellable and structurally homogenous hydrogels and methods of use thereof
WO2019157318A1 (en) * 2018-02-08 2019-08-15 Universal Sequencing Technology Corporation Methods and compositions for tracking nucleic acid fragment origin for nucleic acid sequencing
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
CN110219054B (zh) * 2018-03-04 2020-10-02 清华大学 一种核酸测序文库及其构建方法
CN112262218A (zh) 2018-04-06 2021-01-22 10X基因组学有限公司 用于单细胞处理中的质量控制的系统和方法
US20210071240A1 (en) 2018-04-19 2021-03-11 Massachusetts Institute Of Technology Single-stranded break detection in double-stranded dna
EP4234717A3 (en) * 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
CN108774640B (zh) * 2018-06-20 2021-06-11 深圳海普洛斯医学检验实验室 一种单分子标签及其应用
CN112689673A (zh) * 2018-07-11 2021-04-20 埃克斯基因美国公司 转座体使能的dna/rna测序(ted rna-seq)
CN112359090A (zh) * 2018-08-07 2021-02-12 深圳市真迈生物科技有限公司 一种核酸片段的连接方法、测序文库的构建方法及其应用
WO2020043803A1 (en) 2018-08-28 2020-03-05 Sophia Genetics S.A. Methods for asymmetric dna library generation and optionally integrated duplex sequencing
EP3859014A4 (en) * 2018-09-27 2022-04-27 BGI Shenzhen METHOD OF CONSTRUCTING SEQUENCING LIBRARY, OBTAINED SEQUENCING LIBRARY AND METHOD OF SEQUENCING
AU2019390388A1 (en) 2018-11-30 2021-05-06 Illumina, Inc. Analysis of multiple analytes using a single assay
CA3115155A1 (en) 2018-12-17 2020-06-25 Illumina, Inc. Methods and means for preparing a library for sequencing
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
SG11202108788TA (en) 2019-02-12 2021-09-29 10X Genomics Inc Methods for processing nucleic acid molecules
US20230242989A1 (en) * 2019-04-11 2023-08-03 University Of Virginia Patent Foundation Tagmentation to open up circles of dna and detect extrachromosomal circles of dna for diagnosis
CN110257479A (zh) * 2019-06-25 2019-09-20 北京全式金生物技术有限公司 一种快速构建rna 3’端基因表达文库的方法
EP3997224A1 (en) 2019-07-12 2022-05-18 Illumina Cambridge Limited Nucleic acid library preparation using electrophoresis
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
US20220282233A1 (en) * 2019-08-22 2022-09-08 New England Biolabs, Inc. Cleavage of Single Stranded DNA Having a Modified Nucleotide
WO2021048444A1 (en) 2019-09-12 2021-03-18 Thermo Fisher Scientific Baltics Uab Recombinant transposon ends
CN110564705A (zh) * 2019-09-30 2019-12-13 苏州璞瑞卓越生物科技有限公司 一种用于转座酶片段化的试剂及其应用
CA3131632A1 (en) 2019-12-04 2021-06-10 Tong Liu Preparation of dna sequencing libraries for detection of dna pathogens in plasma
WO2021113505A1 (en) 2019-12-05 2021-06-10 Massachusetts Institute Of Technology Method for preparing a specimen for expansion microscopy
WO2021252617A1 (en) * 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022143221A1 (zh) * 2020-12-31 2022-07-07 中国科学院北京基因组研究所(国家生物信息中心) 用于标记核酸分子的方法和试剂盒
EP4294933A1 (en) * 2021-02-19 2023-12-27 Nuclear RNA Networks, Inc. Compositions and methods for modulating gene transcription networks based on shared high identity transposable element remnant sequences and nonprocessive promoter and promoter-proximal transcripts
JP2024511766A (ja) 2021-03-29 2024-03-15 イルミナ インコーポレイテッド 改善されたライブラリ調製方法
WO2023018730A1 (en) 2021-08-11 2023-02-16 Illumina, Inc. Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
WO2023175024A1 (en) 2022-03-15 2023-09-21 Illumina, Inc. Paired-end sequencing
WO2024061799A1 (en) 2022-09-19 2024-03-28 Illumina, Inc. Deformable polymers comprising immobilised primers
CN115386622B (zh) * 2022-10-26 2023-10-27 北京寻因生物科技有限公司 一种转录组文库的建库方法及其应用

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US5834202A (en) 1992-08-04 1998-11-10 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
WO1994003624A1 (en) 1992-08-04 1994-02-17 Auerbach Jeffrey I Methods for the isothermal amplification of nucleic acid molecules
US6261808B1 (en) 1992-08-04 2001-07-17 Replicon, Inc. Amplification of nucleic acid molecules via circular replicons
US5614389A (en) 1992-08-04 1997-03-25 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
US5422252A (en) 1993-06-04 1995-06-06 Becton, Dickinson And Company Simultaneous amplification of multiple targets
CA2122203C (en) 1993-05-11 2001-12-18 Melinda S. Fraiser Decontamination of nucleic acid amplification reactions
WO1995003430A1 (en) 1993-07-23 1995-02-02 Gen-Probe Incorporated Methods for enhancing nucleic acid amplification
FR2708288B1 (fr) 1993-07-26 1995-09-01 Bio Merieux Procédé d'amplification d'acides nucléiques par transcription utilisant le déplacement, réactifs et nécessaire pour la mise en Óoeuvre de ce procédé.
US5523204A (en) 1993-12-10 1996-06-04 Becton Dickinson And Company Detection of nucleic acids in cells by strand displacement amplification
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
FR2726277B1 (fr) 1994-10-28 1996-12-27 Bio Merieux Oligonucleotide utilisable comme amorce dans une methode d'amplification basee sur une replication avec deplacement de brin
US5766891A (en) 1994-12-19 1998-06-16 Sloan-Kettering Institute For Cancer Research Method for molecular cloning and polynucleotide synthesis using vaccinia DNA topoisomerase
US5631147A (en) 1995-09-21 1997-05-20 Becton, Dickinson And Company Detection of nucleic acids in cells by thermophilic strand displacement amplification
US5916779A (en) 1995-09-21 1999-06-29 Becton, Dickinson And Company Strand displacement amplification of RNA targets
WO1997035026A1 (en) 1996-03-18 1997-09-25 Molecular Biology Resources, Inc. Target nucleic acid sequence amplification
US5773733A (en) 1996-04-12 1998-06-30 National Science Council Alumina-aluminum nitride-nickel composites
US5925545A (en) * 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US5849546A (en) 1996-09-13 1998-12-15 Epicentre Technologies Corporation Methods for using mutant RNA polymerases with reduced discrimination between non-canonical and canonical nucleoside triphosphates
US6197557B1 (en) * 1997-03-05 2001-03-06 The Regents Of The University Of Michigan Compositions and methods for analysis of nucleic acids
FI103809B (fi) * 1997-07-14 1999-09-30 Finnzymes Oy In vitro -menetelmä templaattien tuottamiseksi DNA-sekventointia varten
US6124120A (en) 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
US6159736A (en) 1998-09-23 2000-12-12 Wisconsin Alumni Research Foundation Method for making insertional mutations using a Tn5 synaptic complex
EP2287338B1 (en) 1998-11-09 2012-09-05 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
NO986133D0 (no) * 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US6155972A (en) 1999-02-02 2000-12-05 Acorn Cardiovascular, Inc. Cardiac constraint jacket construction
ATE362532T1 (de) 1999-03-19 2007-06-15 Takara Bio Inc Verfahren zur amplifizierung einer nukleinsäuresequenz unter verwendung eines chimären primers
US6309833B1 (en) 1999-04-12 2001-10-30 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences on a bioelectronic microchip using asymmetric structures
US6326173B1 (en) 1999-04-12 2001-12-04 Nanogen/Becton Dickinson Partnership Electronically mediated nucleic acid amplification in NASBA
US6238868B1 (en) 1999-04-12 2001-05-29 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences using ligation-dependant strand displacement amplification and bioelectronic chip technology
CA2384838C (en) 1999-09-13 2006-07-18 Nugen Technologies, Inc. Methods and compositions for linear isothermal amplification of polynucleotide sequences
JP4128074B2 (ja) 2000-08-23 2008-07-30 タカラバイオ株式会社 核酸の増幅方法
EP1339863A2 (en) * 2000-12-05 2003-09-03 Wisconsin Alumni Research Foundation Double transposition methods for manipulating nucleic acids
FR2822164B1 (fr) 2001-03-19 2004-06-18 Centre Nat Rech Scient Polypeptides derives des arn polymerases, et leurs utilisations
FI20020746A (fi) * 2002-04-18 2003-10-19 Finnzymes Oy Menetelmä ja materiaalit polypeptidien deleetiojohdannaisten tuottamiseksi
US7108976B2 (en) * 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
DE60320119D1 (en) 2002-09-20 2008-05-15 Prokaria Ehf Thermostabile ligase aus thermus phage
US20070059692A1 (en) * 2002-10-28 2007-03-15 Xiaolian Gao Array oligomer synthesis and use
ATE411400T1 (de) 2002-11-21 2008-10-15 Epict Technologies Verfahren zur verwendung von riboprimern zur strangverdrängungsreplikation von zielsequenzen
AU2004254552B2 (en) 2003-01-29 2008-04-24 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US20050153333A1 (en) 2003-12-02 2005-07-14 Sooknanan Roy R. Selective terminal tagging of nucleic acids
SG162795A1 (en) 2005-06-15 2010-07-29 Callida Genomics Inc Single molecule arrays for genetic and chemical analysis
AU2006320275B2 (en) * 2005-12-02 2012-06-07 Synthetic Genomics, Inc. Synthesis of error-minimized nucleic acid molecules
US20070172839A1 (en) * 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
SG10201405158QA (en) 2006-02-24 2014-10-30 Callida Genomics Inc High throughput genome sequencing on dna arrays
CN101432439B (zh) 2006-02-24 2013-07-24 考利达基因组股份有限公司 Dna阵列上的高通量基因组测序
US7910354B2 (en) 2006-10-27 2011-03-22 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US20090111705A1 (en) 2006-11-09 2009-04-30 Complete Genomics, Inc. Selection of dna adaptor orientation by hybrid capture
US20080242560A1 (en) 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays

Also Published As

Publication number Publication date
ES2403756T3 (es) 2013-05-21
CA2750054C (en) 2018-05-29
HK1217032A1 (zh) 2016-12-16
HK1169659A1 (en) 2013-02-01
CN105018548B (zh) 2019-03-12
HK1163107A1 (en) 2012-09-07
DK2376517T3 (da) 2013-02-11
EP2963709B1 (en) 2017-05-24
JP2012506704A (ja) 2012-03-22
WO2010048605A1 (en) 2010-04-29
ES2743029T3 (es) 2020-02-18
HK1219806A1 (zh) 2017-04-13
CA2750054A1 (en) 2010-04-29
EP2664678B1 (en) 2014-10-08
DK2963709T3 (en) 2017-09-11
CN102264914B (zh) 2015-08-12
EP3272879A1 (en) 2018-01-24
EP2376517A4 (en) 2012-06-27
EP2376517B1 (en) 2013-01-16
EP2376517A1 (en) 2011-10-19
SI2963709T1 (sl) 2017-10-30
ES2637843T3 (es) 2017-10-17
ES2550237T3 (es) 2015-11-05
HK1197498A1 (en) 2015-01-16
LT2963709T (lt) 2017-09-25
EP2664678A1 (en) 2013-11-20
EP3272879B1 (en) 2019-08-07
EP2508529A1 (en) 2012-10-10
HK1249765B (zh) 2020-04-17
ES2743029T8 (es) 2020-02-27
CN102264914A (zh) 2011-11-30
ES2515065T3 (es) 2014-10-29
HUE027961T2 (en) 2016-11-28
JP5794572B2 (ja) 2015-10-14
PL2963709T3 (pl) 2017-11-30
EP2787565B1 (en) 2015-09-16
EP2963709A1 (en) 2016-01-06
EP2787565A1 (en) 2014-10-08
DK3272879T3 (da) 2019-08-26
EP2508529B1 (en) 2013-08-28
DK2787565T3 (en) 2015-10-12
PT2787565E (pt) 2015-11-17
CN105018548A (zh) 2015-11-04

Similar Documents

Publication Publication Date Title
US20220042007A1 (en) Transposon end compositions and methods for modifying nucleic acids
JP5794572B2 (ja) 核酸を修飾するためのトランスポゾン末端組成物及び方法
JP6895753B2 (ja) 二本鎖dnaライブラリー作出法およびメチル化シトシンの同定のためのシーケンシング法
EP2585593B1 (en) Methods for polynucleotide library production, immortalization and region of interest extraction
US20110224105A1 (en) Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid
EP2432899A1 (en) Sorting asymmetrically tagged nucleic acids by selective primer extension
EP2922965A1 (en) Method for preventing carry-over contamination in nucleic acid amplification reactions