BR112021010425A2 - Método de amplificação e identificação de ácido nucleico - Google Patents
Método de amplificação e identificação de ácido nucleico Download PDFInfo
- Publication number
- BR112021010425A2 BR112021010425A2 BR112021010425-9A BR112021010425A BR112021010425A2 BR 112021010425 A2 BR112021010425 A2 BR 112021010425A2 BR 112021010425 A BR112021010425 A BR 112021010425A BR 112021010425 A2 BR112021010425 A2 BR 112021010425A2
- Authority
- BR
- Brazil
- Prior art keywords
- elongation
- sequence
- nucleic acid
- template
- stopper
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 144
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 140
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 140
- 230000003321 amplification Effects 0.000 title claims abstract description 77
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000012634 fragment Substances 0.000 claims abstract description 77
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 60
- 238000006243 chemical reaction Methods 0.000 claims abstract description 48
- 239000013615 primer Substances 0.000 claims description 139
- 125000003729 nucleotide group Chemical group 0.000 claims description 60
- 239000002773 nucleotide Substances 0.000 claims description 57
- 238000000137 annealing Methods 0.000 claims description 34
- 238000009739 binding Methods 0.000 claims description 27
- 102000003960 Ligases Human genes 0.000 claims description 26
- 108090000364 Ligases Proteins 0.000 claims description 26
- 230000027455 binding Effects 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 20
- 239000003155 DNA primer Substances 0.000 claims description 13
- 102100034343 Integrase Human genes 0.000 claims description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- SIIZPVYVXNXXQG-KGXOGWRBSA-N [(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-4-[[(3s,4r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-3-hydroxyoxolan-2-yl]methyl [(2r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(phosphonooxymethyl)oxolan-3-yl] hydrogen phosphate Polymers C1=NC2=C(N)N=CN=C2N1[C@@H]1O[C@H](COP(O)(=O)OC2[C@@H](O[C@H](COP(O)(O)=O)[C@H]2O)N2C3=NC=NC(N)=C3N=C2)[C@@H](O)[C@H]1OP(O)(=O)OCC([C@@H](O)[C@H]1O)OC1N1C(N=CN=C2N)=C2N=C1 SIIZPVYVXNXXQG-KGXOGWRBSA-N 0.000 claims description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 8
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 6
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 claims description 6
- 229920000642 polymer Polymers 0.000 claims description 5
- 238000002844 melting Methods 0.000 claims description 4
- 230000008018 melting Effects 0.000 claims description 4
- 229920002113 octoxynol Polymers 0.000 claims description 4
- 229920000136 polysorbate Polymers 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 claims description 3
- 229920001223 polyethylene glycol Polymers 0.000 claims description 3
- 229940066429 octoxynol Drugs 0.000 claims description 2
- 229950008882 polysorbate Drugs 0.000 claims description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 239000002253 acid Substances 0.000 abstract description 3
- 239000000047 product Substances 0.000 description 62
- 230000000295 complement effect Effects 0.000 description 18
- 238000003752 polymerase chain reaction Methods 0.000 description 17
- 238000010839 reverse transcription Methods 0.000 description 17
- 239000002299 complementary DNA Substances 0.000 description 16
- 238000002360 preparation method Methods 0.000 description 13
- 238000012163 sequencing technique Methods 0.000 description 13
- 108090000623 proteins and genes Proteins 0.000 description 12
- 238000007792 addition Methods 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 238000000746 purification Methods 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 239000003446 ligand Substances 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 101100447432 Danio rerio gapdh-2 gene Proteins 0.000 description 6
- 101150112014 Gapdh gene Proteins 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 108010061982 DNA Ligases Proteins 0.000 description 5
- 102000012410 DNA Ligases Human genes 0.000 description 5
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 5
- 101710086015 RNA ligase Proteins 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000007790 solid phase Substances 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 108010060248 DNA Ligase ATP Proteins 0.000 description 3
- 102000008158 DNA Ligase ATP Human genes 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000007086 side reaction Methods 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000009966 trimming Methods 0.000 description 3
- 241000724328 Alfalfa mosaic virus Species 0.000 description 2
- 101001095872 Enterobacteria phage T4 RNA ligase 2 Proteins 0.000 description 2
- 101710113864 Heat shock protein 90 Proteins 0.000 description 2
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000002516 radical scavenger Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108010063905 Ampligase Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- -1 PEG Chemical compound 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 101710188535 RNA ligase 2 Proteins 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 101710204104 RNA-editing ligase 2, mitochondrial Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108091012456 T4 RNA ligase 1 Proteins 0.000 description 1
- 241001522143 Thermus scotoductus Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007169 ligase reaction Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/107—RNA dependent DNA polymerase,(i.e. reverse transcriptase)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/501—Ligase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/161—Modifications characterised by incorporating target specific and non-target specific sites
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
MÉTODO DE AMPLIFICAÇÃO E
IDENTIFICAÇÃO DE ÁCIDO NUCLEICO.
A presente invenção refere-se a um método para gerar fragmentos de
amplificação rotulados de um modelo de ácido nucleico compreendendo as
etapas de prover o dito de ácido nucleico modelo; anelar pelo menos um
primer de oligonucleotídeo ao dito ácido nucleico modelo; alongar pelo
menos um primer de oligonucleotídeo de uma maneira específica de modelo,
criando assim um produto de alongamento, em que a dita reação de
alongamento para quando o produto de alongamento atinge a extremidade 5'
do ácido nucleico modelo ou um stopper de alongamento de ácido
nucleico, que é anelado ao ácido nucleico modelo a jusante do produto de
alongamento;
prover um ácido nucleico adaptador que compreende uma sequência de
identificação em sua extremidade 5', em que a dita sequência de
identificação não hibridiza com o stopper de alongamento quando em
contato com ele e ligar o ácido nucleico adaptador em sua extremidade 5'
à extremidade 3' do produto de alongamento, gerando assim um fragmento
de amplificação rotulado.
Description
Relatório Descritivo da Patente de Invenção para "MÉTODO DE AMPLIFICAÇÃO E IDENTIFICAÇÃO DE ÁCIDO NUCLEICO".
[0001] A presente invenção refere-se ao campo da análise e amplificação do ácido nucleico. Fundamentos
[0002] US 2010/0273219 A1 descreve um método de amplificação multiprimer para ácidos nucleicos alvo de codificação de barras.
[0003] WO 2012/134884 A1 descreve ácidos nucleicos de modelo de codificação de barras em uma reação de amplificação multiplex.
[0004] WO 2013/038010 A2 descreve um método para gerar uma parte de ácido nucleico amplificado de um ácido nucleico modelo usando primers e stoppers de oligonucleotídeos para evitar o deslocamento de fita e leitura por uma polimerase que é usada para gerar as partes de ácido nucleico para sequenciamento. Este método removerá vieses durante a amplificação do ácido nucleico.
[0005] WO 2014/071361 A1 descreve um método para fazer ácidos nucleicos de código de barras duplos, usando ácidos nucleicos adaptadores de código de barras.
[0006] US 2014/0274729 A1 descreve um método para gerar bibliotecas de cDNA usando DNA polimerases com atividade de deslocamento de fita.
[0007] EP 3 119 886 B1 descreve um método quantitativo para gerar produtos de ácido nucleico a partir de RNA modelo.
[0008] US 2018/163201 A1 refere-se a um método de transcrição reversa no qual uma cauda C é adicionada à extremidade 3' da fita de cDNA.
[0009] WO 2016/138500 A1 descreve um método para codificar ácidos nucleicos de codificação de barras para sequenciamento. Códigos de barras estocásticos, ou seja, aleatórios, são usados como rótulos moleculares.
[0010] Rótulos moleculares ou identificadores moleculares únicos (UMIs), também chamados de códigos de barras moleculares, foram desenvolvidos para identificar duplicatas de PCR, para reduzir vieses de PCR específicos de sequência e para detectar mutações raras. Anexar identificadores moleculares únicos às moléculas de RNA, antes de qualquer amplificação PCR de uma preparação de biblioteca de sequenciamento, estabelece uma identidade distinta para cada molécula de entrada. Isso torna possível eliminar os efeitos de um viés de amplificação de PCR subsequente, que é especialmente importante onde muitos ciclos de PCR são necessários, por exemplo, ao gerar bibliotecas de sequenciamento a partir de baixas quantidades de entrada de modelos como em estudos de célula única. Após a PCR, as moléculas que compartilham a mesma sequência e também a mesma UMI são consideradas cópias idênticas, derivadas da mesma molécula de entrada (Sena et al., Scientific Reports (2018) 8:13121). Sumário da Invenção
[0011] Um objetivo da invenção é prover um método melhorado de gerar fragmentos de sequência de um ácido nucleico modelo, que facilita a alocação e montagem dos fragmentos da dita sequência para uma sequência unida, que corresponde à sequência do ácido nucleico modelo. Uma melhoria desejada também reduziria o viés de sequência durante a geração de fragmentos e aumentaria a cobertura de fragmentos de sequência ao longo de toda a duração do modelo para aumentar a confiança na sequência unida gerada.
[0012] Por conseguinte, a invenção prove um método para gerar fragmentos de amplificação rotulados de um ácido nucleico modelo, compreendendo as etapas de prover o dito de ácido nucleico modelo; anelar pelo menos um primer de oligonucleotídeo ao dito ácido nucleico modelo; alongar pelo menos um primer de oligonucleotídeo de uma maneira específica de modelo, criando assim um produto de alongamento, em que a dita reação de alongamento parapara quando o produto de alongamento atinge aextremidade 5' do ácido nucleico modelo ou um stopper de alongamento de ácido nucleico, que é anelado ao modelo ácido nucleico a jusante do produto de alongamento; prover um ácido nucleico adaptador que compreende uma sequência de identificação em sua extremidade 5', em que a dita sequência de identificação não hibridiza com o stopper de alongamento quando em contato com ele e preferencialmente também não com o modelo; ligar o ácido nucleico adaptador em sua extremidade 5' à extremidade 3' do produto de alongamento, gerando assim um fragmento de amplificação rotulado.
[0013] A invenção também provê um método para gerar fragmentos de amplificação rotulados de um ácido nucleico modelo compreendendo as etapas de prover o dito ácido nucleico modelo; anelar pelo menos um primer de oligonucleotídeos ao dito ácido nucleico modelo; alongar o pelo menos um primer de oligonucleotídeo de uma maneira específica, criando assim um produto de alongamento; prover um adaptador de ácido nucleico que compreende uma sequência de identificação, em que a dita sequência de identificação não hibridiza com o modelo; ligar o ácido nucleico adaptador preferencialmente na sua extremidade 5' à extremidade 3'do produto de alongamento, gerando assim um fragmento de amplificação rotulado.
[0014] A invenção ainda provê um kit adequado para a realização do método. Um kit da invenção pode incluir pelo menos um primer de oligonucleotídeo capaz de hibridizar a um ácido nucleico modelo e preparar uma reação de alongamento em sua extremidade 3'; um ou mais stoppers de alongamento, capazes de hibridizar a um ácido nucleico modelo, preferivelmente capaz de preparar uma reação de alongamento em sua extremidade 3'; um ou mais ácidos nucleicos adaptadores que compreendem uma sequência de identificação em sua extremidade 5', em que a dita sequência de identificação não hibridiza ao stopper de alongamento, preferivelmente em que o ácido nucleico adaptador está ligado, hibridizado ou não ligado ao stopper de alongamento; uma transcriptase reversa e uma ligase de oligonucleotídeo. Os diferentes componentes do kit podem ser fornecidos em diferentes recipientes, tais como frascos.
[0015] A divulgação detalhada a seguir lê em todos os aspectos, incluindo métodos e kits, e personificações da presente invenção. Ou seja, descrições de métodos podem ser uma adequação do kit. Quaisquer componentes descritos nos métodos podem fazer parte dos kits. Os componentes do kit podem ser utilizados nos métodos inventivos. Descrição Detalhada da Invenção
[0016] A presente invenção provê um método para gerar fragmentos de amplificação rotulados de um ácido nucleico modelo, em que uma sequência de identificação é introduzida como rótulo antes de amplificar esses fragmentos. Um ácido nucleico modelo pode estar presente em várias cópias. De acordo com a invenção, a fragmentação é geralmente um processo que ocorre durante a amplificação, ou seja, a partir de um modelo de um determinado comprimento, um ou mais (geralmente mais) fragmentos são gerados durante a amplificação de partes do modelo. As sequências de fragmentos gerados podem se sobrepor quando cópias de modelos geram ao mesmo tempo fragmentos e os primers para sintetizar esses fragmentos complementares de ácido nucleico anelados em diferentes locais em diferentes cópias de modelo. Embora os conceitos inventivos funcionem para um único fragmento por modelo, preferivelmente muitos fragmentos são gerados a partir de uma molécula de modelo, geralmente usando vários primers que se ligam em diferentes locais ao modelo.
[0017] A invenção melhora os métodos anteriores, ligando uma sequência de identificação a um fragmento gerado.
As sequências de identificação podem ser introduzidas com o primer ou após o alongamento, a síntese do fragmento de ácido nucleico complementar.
Então a sequência de identificação é introduzida por ligação do produto de alongamento com um ácido nucleico adaptador.
Surpreendentemente, a reação de ligação ocorre com sequências de identificação de fita, únicas, ou seja, as partes das sequências de identificação que têm uma extremidade 5' não hibridizada (ou "livre") podem ligar-se à extremidade 3' do produto alongado.
A reação de ligação geralmente envolve um resíduo de fosfato que é preferencialmente fornecido na extremidade 5' da sequência de identificação.
Surpreendentemente, não é necessária nenhuma sequência de modelo ou stopper dependente, suportada pela hibridização, proximidade do ácido nucleico adaptador à extremidade 3' do produto de alongamento (como mostrado nos exemplos). Embora tal vizinhança possa ser suportada fornecendo ao adaptador ácido nucleico uma parte de sequência complementar (à jusante, ou seja, direção 3', da sequência de identificação), para hibridização com um oligonucleotídeo que está ligado ao modelo (também referido aqui como stoppers de alongamento ou apenas stoppers, que também podem ser ainda primers no caso de mais de um fragmento por modelo ser gerado, uma vizinhança dirigida não é necessária e pode ser o resultado de um processo de difusão simples, não direcionado.
Particularmente, foi demonstrado que o ácido nucleico adaptador pode ser ligado a um produto de alongamento que atingiu a extremidade 5' do ácido nucleico modelo e onde não está presente mais stopper de alongamento a jusante.
Tal reação de ligação pode ocorrer a esta extremidade do produto de alongamento diretamente ou depois de uma polimerase ter adicionado um ou mais nucleotídeos não modelos, com base em sua atividade de transferência terminal, que alguns polímeros possuem. Essa ligação ao produto de alongamento que corresponde à extremidade 5' do modelo, tem algumas vantagens surpreendentes e benéficas: ela aumenta a ocorrência de fragmentos na extremidade 5' do modelo e, portanto, a cobertura de sequência aumenta fundamentalmente, o que faltava aos métodos do estado da arte anteriores. Em métodos anteriores, a distribuição do local de início do fragmento é constante, o que leva a uma alta distribuição de cobertura por fragmentos no meio de modelos com cobertura muito menor, aproximando-se de zero, em suas extremidades 3' e 5' (que é um resultado de cópias de modelo de número, o tamanho médio do fragmento e o comprimento de leitura de sequenciamento). Esse efeito na extremidade 5' é mitigado pelo método inventivo. Além disso, a invenção também provê modalidades para aumentar a cobertura na extremidade 3' do modelo também.
[0018] Os fragmentos de amplificação (gerados como uma molécula de fragmento por reação de alongamento) são geralmente amplificados ainda mais, ou seja, copiados. Isso significa que a sequência de identificação ligada é amplificada, portanto copiada como tal. Normalmente, as sequências de identificação são tão múltiplas, que um processo de seleção aleatória é capaz de identificar exclusivamente um único fragmento que carrega a mesma sequência, mas resulta de cópias diferentes de um modelo. Em todas as modalidades da invenção, a sequência de identificação ajuda a determinar se as cópias do fragmento após o sequenciamento vêm de cópias diferentes do modelo porque elas têm sequências de identificação diferentes, ou se vêm da mesma molécula modelo e são apenas cópias feitas durante a dita amplificação adicional.
[0019] Outro método provê a geração de fragmentos de amplificação rotulados de um ácido nucleico modelo compreendendo as etapas de prover o dito de ácido nucleico modelo; anelar pelo menos um primer de oligonucleotídeo ao dito ácido nucleico modelo; alongar pelo menos um primer de oligonucleotídeo de maneira específica, criando assim um produto de alongamento; prover um ácido nucleico adaptador que compreende uma sequência de identificação, em que a dita sequência de identificação não hibridiza ao modelo; ligar o ácido nucleico adaptador preferencialmente ao sua extremidade 5' à extremidade do produto de alongamento, gerando assim um fragmento de amplificação rotulado. Este método é essencialmente o mesmo que acima e todas as modalidades preferidas descritas aqui se aplicam também, salvo pelo fato de que um stopper não é usado. Vários primers, possivelmente sem função de stopper, podem ser usados. Os ácidos nucleicos adaptadores ainda podem ser ligados aos produtos de alongamento após um processo de difusão. Para ligação, os produtos de alongamento ainda podem ser hibridizados ao modelo ou como fita simples. No entanto, preferencialmente são utilizados stoppers.
[0020] O método inventivo começa com a etapa de prover ácidos nucleicos modelo. A molécula modelo é tornada acessível, a um profissional qualificado, para uso no método inventivo. Normalmente, o modelo é fornecido em uma amostra de moléculas de ácido nucleico. Tais ácidos nucleicos modelo podem ser isolados de uma célula, tais como células eucarióticas ou procarióticas. Especialmente em modalidades preferidas, o modelo é RNA. O RNA total ou uma fração de RNA, tal como mRNA ou RNA esgotado de rRNA de uma célula, podem ser providos. Quantidades de RNA que são fáceis de manusear, são, por exemplo, 0,1 pg a 500 ng, 1 pg a 200 ng, 10 pg a 100 ng, ou 0,1 ng – 100 ng de RNA esgotado de rRNA ou 0,1 ng a 1000 ng total de RNA. Em algumas modalidades, a quantidade de RNA total pode, por exemplo, 10 pg, e a quantidade de RNA não rRNA pode ser inferior a 1 pg. Primers, stoppers e adaptadores são preferencialmente DNA.
[0021] O método ainda compreende anelar pelo menos um primer de oligonucleotídeo ao dito ácido nucleico modelo. Um primer de oligonucleotídeo é uma molécula de oligonucleotídeo, preferivelmente DNA que se anela ao modelo e é capaz de preparar uma reação de alongamento, como é uma prática padrão na arte. O primer de oligonucleotídeo (ou simplesmente "primer") de preferência, se anela ao modelo em pelo menos uma parte de seu comprimento de, por exemplo, 4 nucleotídeos a 30 nucleotídeos (nt) de comprimento. O anelamento é por hibridização. O primer pode ter uma parte que não se anela ao modelo. Essas outras partes podem ser usadas para se anelar a outros oligonucleotídeos e/ou serem usadas para a amplificação adicional mencionada acima, quando fragmentos de amplificação são ainda mais amplificados para produzir cópias dele. Tais partes ou porções adicionais podem, portanto, ter uma sequência à qual outros primers se ligam para esta reação de amplificação/cópia. Tal parte também é aqui referida como sequência de primer ligante. Uma sequência de primer ligante, preferivelmente tem 4 nt a 30 nt de comprimento.
[0022] Voltando ao método inventivo principal, o pelo menos um primer de oligonucleotídeo é alongado de uma maneira específica de modelo, criando assim um produto de alongamento (sequência complementar). Tais reações são padrão na arte e geralmente fazem uso de uma polimerase. Se o modelo for RNA, então uma polimerase dependente de RNA é usada, tal como uma transcriptase reversa. Se o modelo é DNA, então uma polimerase dependente de DNA é usada. A reação de alongamento para quando atinge um stopper de alongamento de ácido nucleico, que está anelado ao modelo ácido nucleico à jusante do produto de alongamento, ou quando o produto de alongamento atinge a extremidade 5' do ácido nucleico modelo. Obviamente, quando a reação de alongamento atinge a extremidade 5' do modelo e, portanto,
cai fora do modelo, ele para.
Alguma polimerase pode adicionar um ou mais nucleotídeos não modelo neste ponto ao produto de alongamento, o que é aceitável ou pode até ser benéfico ao selecionar o produto de cobertura 5' na análise sequencial dos fragmentos amplificados rotulados produzidos.
No entanto, essa adição de nucleotídeos não modelos não é necessária.
As reações de alongamento também param quando a reação de alongamento atinge um stopper de alongamento de ácido nucleico, que está anelado ao ácido nucleico modelo a jusante do produto de alongamento.
Tal reação parada é descrita em sua extensão em WO 2013/038010 A2 (incorporada aqui por referência). Neste documento WO, o stopper de alongamento é referido como "stopper de oligonucleotídeo" ou "primer de oligonucleotídeo adicional". De acordo com a presente invenção, um termo é usado, ou seja, stopper de alongamento de ácido nucleico ou apenas "stoppers de alongamento" ou apenas "stopper". Este stopper inventivo também pode ser um primer e, portanto, corresponde ao "primer de oligonucleotídeo adicional" de WO 2013/038010 A2. Em essência, tal stopper interrompe a reação de alongamento de uma reação de alongamento à montante (portanto, o stoppers está a jusante do produto de alongamento) apresentando um obstáculo no modelo.
O stopper está anelado ou hibridizado ao modelo e a reação de alongamento não desloca o stopper e assim aborta.
Leia- se, ou seja, o deslocamento de um stopper seria uma reação lateral.
Medidas para evitar o deslocamento do stopper são descritas em sua extensão em WO 2013/038010 A2 e estas podem ser usadas de acordo com a invenção.
Brevemente, métodos e meios preferenciais para evitar o deslocamento do stopper (devido à atividade de deslocamento de fita) estão usando um stopper de alongamento que compreende um ou mais nucleotídeos modificados, que aumentam a temperatura de fusão em uma sequência de anelamento, para anelar ao modelo (uma parte do stopper anela/hibridiza ao modelo). O aumento da temperatura de fusão refere-se a um ácido nucleico natural, não modificado, tal como DNA ou RNA. Tais modificações são, por exemplo, LNA (ácido nucleico bloqueado), ZNA (ácidos nucleicos zip), 2' fluoro nucleosídeos/fluoronucleotídeos 2' ou PNA (ácido nucleico peptídico ou peptídeo). Outras medidas são o uso de uma polimerase que não tem atividade de deslocamento de fita ou uso de intercaladores. Preferencialmente, são modificados 1, 2, 3, 4, 5 ou 6 nucleotídeos. Preferencialmente, os ácidos nucleicos modificados estão no lado 5' da parte sequência do stopper que hibridiza o modelo. Pode haver outras partes do stopper na direção 5' que não hibridizem – tais como sequências de amplificação que agem da mesma forma descrita para o primer de oligonucleotídeo descrito acima, para amplificação/cópia em uma nova reação de amplificação ("sequência de primer ligante") – na verdade, tal parte adicional é preferida para ligação/hibridização ao ácido nucleico adaptador – veja abaixo. O adaptador pode ligar/hibridizar à "sequência de primer ligante" ou a outra parte do stopper de oligonucleotídeo. Em modalidades preferidas, o stopper de alongamento e, preferencialmente, também o primer de oligonucleotídeo compreendem um ou mais nucleotídeos modificados que aumentam a temperatura de fusão em uma sequência de anelamento (ligante) para se anelar ao modelo.
[0023] De preferência, após a reação de alongamento, os primers e stoppers que não estão ligados ao modelo são removidos em uma etapa de purificação. Ou seja, os produtos de alongamento hibridizados ao modelo são purificados e retidos para posterior processamento. Outras modalidades da invenção são feitas em um único volume, sem purificação. Tal purificação pode ser feita por métodos conhecidos na arte, por exemplo, a imobilização do modelo ou produtos de alongamento para uma fase sólida (por exemplo, contas) e lavagem para remover quaisquer primers e stoppers não ligados. Um método de exemplo é a imobilização reversa de fase sólida (SPRI; DeAngelis et al., Nucleic Acids Research, 1995, 23(22): 4742-4743).
[0024] O método inventivo compreende a etapa de prover um ácido nucleico adaptador que compreende uma sequência de identificação em sua extremidade 5'. Outras tags de sequência, tais como sequências para amplificação (sequências de amplificação) também podem fazer parte do ácido nucleico adaptador. A extremidade 5' é a extremidade destinada à ligação com a extremidade 3' do produto de alongamento para a rotulagem deste último pela sequência de identificação. A sequência de identificação não hibridizará o stopper de alongamento nem ao modelo. Assim, ela geralmente é de fita única e não hibridizada. Aqui o termo "sequência de identificação" é usado para a parte terminal 5' do ácido nucleico adaptador que não está hibridizando ou anelando – mesmo que apenas partes da sequência de identificação fossem posteriormente utilizadas para identificação. Outras partes do ácido nucleico adaptador podem formar um híbrido com, ou anelar ao stopper de alongamento. O ácido nucleico adaptador também pode compreender uma sequência de primer complementar, que é o alvo para uma nova reação de amplificação dos fragmentos de amplificação rotulados como mencionado acima (chamada sequência de ligante adaptador). A sequência de identificação pode ser impedida de hibridização ao stopper de alongamento ou ao modelo, selecionando uma sequência para a sequência de identificação que não tem complemento no stopper de alongamento. Também é possível selecionar a sequência de identificação para que não tenha complemento no modelo. Isso pode ser facilmente feito se a sequência do modelo for conhecida. Se não for desconhecido, mas de uma fonte biológica, a sequência de identificação pode ser selecionada a partir de sequências que não ocorrem ou raramente ocorrem em ácidos nucleicos biológicos. Tais sequências são conhecidas a partir de ácidos nucleicos "spike-in", como sequências ERCC (External RNA Control Consor-tium) ou sequências SIRV (spike-In RNA) (ver, por exemplo, ERCC, BMC Genômica 2005 6: 150; Jiang et al., Genome Res. 2011, 21(9): 1543-1551; WO 2016/005524 A1, todos aqui incorporados por referência). Se a sequência de identificação se anelasse ao modelo em uma reação lateral, então essa situação normalmente evitaria a ligação na etapa seguinte e, portanto, não levaria a um fragmento rotulado e, portanto, não seria visto como resultado. Tais reações laterais podem ser toleradas, mas não são preferidas. O método mais fácil e preferido para evitar anelamento da sequência de identificação (e preferencialmente o ácido nucleico adaptador inteiro) ao modelo é simplesmente prover o ácido nucleico adaptador após a reação de alongamento. Após a reação de alongamento, o modelo está na forma de uma fita dupla com os produtos de alongamento (e o primer e stoppers). Nesta forma, o ácido nucleico adaptador não pode mais se ligar ao modelo, uma vez que o modelo já está coberto por parceiros de hibridização. Neste método preferido, a sequência de identificação pode até ter uma sequência que é um complemento ao modelo e pode ser capaz de hibridizar ao modelo, mas é impedida a fazê-lo pela sucessão de etapas do método. Portanto, nenhuma consideração para sequências de modelo é necessária nesta modalidade.
[0025] A opção mais preferida para evitar o anelamento da sequência de identificação ao stopper é que partes do stopper e partes do adaptador carregam sequências complementares entre si. Porque em uma aproximação do adaptador ao stopper, as sequências complementares hibridizam primeiro e a sequência de identificação permanece de fita única.
[0026] O método inventivo ainda compreende ligar o ácido nucleico adaptador na extremidade 5' à extremidade 3' do produto de alongamento, gerando assim um fragmento de amplificação rotulado. A ligação é geralmente realizada usando uma enzima ligase. O tipo de ligação depende da natureza dos oligonucleotídeos a serem ligados e podem ser selecionados por um profissional qualificado. Exemplos de ligases incluem uma liga DNA ligase ou uma RNA ligase. A ligase também pode ser uma RNA ligase, especialmente uma RNA ligase que tem atividade de ligação de DNA, tal como T4 RNA ligase 2. Outras ligases são T4 DNA ligase, T4 RNA ligase 1, DNA ligase I, DNA ligase III, DNA ligase IV, E. coli DNA ligase, ampligase DNA ligase, Rnl2 truncada, Rnl2 truncada K227Q, Thermus scotoductus ligase, Methanobacterium thermoautotrophicum RNA ligase, App-ligase termostável (NEB), DNA ligase de vírus clororella ou splintR ligase. A ligase pode ser uma ligase de fita única ou uma ligase de fita dupla. Também são possíveis combinações de ligases para diferentes reações em um volume de reação a serem realizadas em paralelo, por exemplo, quando diferentes produtos de alongamento e/ou moléculas de ácido nucleico adaptador estiverem presentes e devem ser ligados ao mesmo tempo. As combinações preferidas são DNA ligase e RNA ligase ou uma ligase de fita única e uma liga ligase de fita dupla. A reação de ligase geralmente envolve um resíduo de fosfato que é preferencialmente provido na extremidade 5' da sequência de identificação do ácido nucleico adaptador. Além disso, outras unidades (moieties) de 5' podem ser usadas para ligação, por exemplo, ligação de extremidades adeniladas. Isso pode ser ligado com ligases truncadas ou App-ligases.
[0027] Os fragmentos de amplificação rotulados gerados terão a estrutura de 5' a 3' após a ligadura de: sequência de primer – sequência de produto de alongamento – sequência do adaptador com sequência de identificação que beira a sequência do produto de alongamento. A sequência de primer pode ter uma "sequência de primer ligante" e/ou a sequência do adaptador pode ter uma "sequência de adaptador ligante". Os produtos do método inventivo, ou seja, os fragmentos de amplificação rotulados gerados, são preferencialmente ainda mais amplificados. Tal amplificação adicional produz cópias dos fragmentos de amplificação rotulados gerados por métodos conhecidos na arte, tais como PCR (reação em cadeia de polimerase) ou amplificação linear. Tal amplificação adicional geralmente envolve o uso de primers adicionais que se ligam aos fragmentos de amplificação rotulados, de preferência em sequências de ligante, especialmente sequências de ligante localizadas nas extremidades dos fragmentos, ou seja, dentro das partes da sequência do primer e da sequência do adaptador, em particular preferivelmente na extremidade l 5' da sequência de primer e na extremidade 3' da sequência de adaptador. Como mencionado acima em relação a esses primers e adaptadores, eles podem ter regiões de sequência conhecida para ligar tais primers da amplificação adicional ("sequência de primer ligante" e "sequência de adaptador ligante"). Essas regiões (ou "partes") podem ser tão longas e específicas para não se ligarem ao modelo; podem ser locais de ligação de primer universais, ou seja, não seletivos entre diferentes adaptadores/primers – ao contrário da sequência de identificação, que é preferencialmente única.
[0028] A sequência de identificação fornece um rótulo único para um fragmento de amplificação e, portanto, também é aqui referido como identificador molecular único (UMI). As sequências de identificação podem identificar réplicas da amplificação adicional (por exemplo, PCR) e reduzir os efeitos do viés de amplificação dependente da sequência. Em modalidades preferidas, as sequências de identificação são oligonucleotídeos com, principalmente, distribuição aleatória de nucleotídeos em cada posição que estejam ligadas a produtos de extensão (fragmentos) antes de uma amplificação adicional. Se as sequências de identificação forem distribuídas uniformemente e seu número for consideravelmente maior do que o número de produtos de extensão idênticos, então é improvável que a mesma sequência de identificação esteja ligada a dois produtos de extensão idênticos (cópias diferentes). Neste caso, o número de sequências de identificação distintas após uma amplificação adicional é o mesmo que o número antes de uma amplificação adicional. As sequências de identificação da invenção também podem ser utilizadas como descrito para UMIs em Sena et al. (Scientific Reports (2018) 8:13121). A sequência inteira ou partes da sequência inteira do fragmento rotulado podem ser consideradas como uma "leitura" nos métodos de sequenciamento da próxima geração e análise de sequências adicionais. Uma ou mais leituras são montadas durante a análise de dados para obter uma sequência de conjunto do modelo. Posteriormente, a análise de dados também pode se tornar uma análise quantitativa de moléculas e fragmentos do modelo, que podem fornecer insights se cópias de modelos particulares estiverem sobre- ou sub-representadas, cujas, por exemplo, dicas são diferentes taxas de expressão das variantes de emendas RNA. Em modalidades preferidas, a presente invenção ainda compreende a etapa de montar as sequências de fragmentos de amplificação, que são únicos, em que os rótulos são usados para identificar fragmentos de amplificação únicos. Diferentes sequências de identificação nos fragmentos de amplificação rotulados amplificados identificam fragmentos de amplificação únicos. As sequências de identificação permitem duplicar e replicar identificação e remoção no conjunto ou em qualquer outra etapa de análise de dados.
[0029] Em modalidades preferidas, a sequência de identificação é de 3 nt (nucleotídeos) ou mais de comprimento, de preferivelmente 3 nt a 20 nt, especialmente preferido, 4 nt a 15 nt ou 5 nt a 10 nt, tais como 3 nt, 4 nt, 5 nt, 6 nt, 7 nt, 8 nt, 9 nt, 10 nt, 11 nt, 12 nt, 13 nt, 14 nt, 15 nt ou mais de comprimento. Tais comprimentos são suficientemente pequenos para fácil manuseio e reações eficientes de ligação, mas ainda fornecem uma quantidade suficientemente grande de sequência de identificação diferente, devido a permutações nucleotídicas em seus nucleotídeos, para fornecer a identificação desejada de fragmentos amplificados únicos, de preferência para fornecer rótulos únicos destes.
[0030] Em modalidades preferidas, no caso em que o produto de alongamento atinja a extremidade 5' do ácido nucleico modelo, é permitido adicionar nucleotídeos não modelos ao produto de alongamento, preferivelmente por uma atividade de transferência terminal da polimerase, e/ou preferivelmente em que 1 a 15 nucleotídeos não modelos são adicionados em pelo menos 70% dos produtos de extensão. Como dito acima, tal adição de nucleotídeos não modelo é uma propriedade de algumas polimerases (ver Chen et al. Biotechniques 2001, 30(3):574-582). Essa atividade é mais proeminente em transcriptases reversas, tal como m-MLV (vírus da leucemia murina) transcriptase reversa ou AMV (vírus de mosaico alfafa) transcriptase reversa. Estes nucleotídeos não modelos são geralmente de qualquer tipo de nucleotídeo (A, T(U), G, C) e podem parecer aleatórios. Isso significa que produtos de alongamento de extremidade 5', de diferentes modelos, podem compartilhar a mesma sequência correspondente à extremidade 5', mas, então, podem continuar por nucleotídeos diferentes, aparentemente aleatórios, que são o produto de tal adição de não modelo. Essas diferentes adições podem ser usadas para identificar a posição exata da sequência de modelo de extremidade 5' na transição entre a sequência de repetição do modelo e as adições aleatórias de não modelo. Após os nucleotídeos de não modelos, o fragmento rotulado continua com a sequência de identificação, que pode ser usada conforme descrito acima. Caso a sequência de identificação seja (também) aleatória, os nucleotídeos aleatórios de não modelo, podem ser tratados como uma parte da sequência de identificação. A posição da sequência de identificação em relação à parte constante da sequência do adaptador identifica inequivocamente a sequência de identificação.
[0031] Em modalidades especialmente preferidas, uma pluralidade de ácidos nucleicos adaptadores é provida e usada na etapa de ligação. Esses adaptadores da pluralidade podem ter diferentes sequências de identificação. Isso permite identificação única dos adaptadores e dos fragmentos gerados aos quais estão ligados. Preferivelmente pelo menos 10, mais preferivelmente pelo menos 50, ou mesmo 100 ou mais ou mais, ou 200 ou mais, ácidos nucleicos adaptadores, com diferentes sequências de identificação, são providos e usados na etapa de ligação. Especialmente preferidos, como muitos adaptadores com diferentes sequências de identificação, são usados com diferentes fragmentos gerados com a mesma sequência são esperados – ou preferencialmente mais adaptadores com diferentes sequências de identificação. A expectativa do número de cópias de modelo pode ser baseada no tipo de amostra, por exemplo, RNA celular inteiro, mRNA celular inteiro (transcriptoma), quantidade do RNA e a complexidade da amostra (quantas variantes de transcrição diferentes são direcionadas que podem ser tanto todo o transcriptoma, como apenas genes ou transcrições selecionadas, como é o caso em painéis genéticos) etc.
[0032] Especialmente preferido, a sequência de identificação é uma sequência aleatória. "Sequência aleatória" deve ser entendida como uma mistura de diferentes sequências com uma alta variância, devido a uma síntese aleatória de pelo menos uma parte da sequência de identificação. Sequências aleatórias potencialmente cobrem toda a área combinatória para a dita sequência para 4 nucleotídeos de ocorrência natural (A, T(U), G, C). A sequência aleatória pode cobrir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 ou mais nucleotídeos que são selecionados aleatoriamente de A, G, C ou T (U). Em termos de capacidade de hibridizar, sequências de nucleotídeos T e U são usadas intercambiavelmente aqui. A área possível combinatória completa para uma porção de sequência aleatória é mn, onde m é o número de tipos de nucleotídeos utilizados (de preferência todos os quatro de A, G, C, T(U)) e n é o número de nucleotídeos aleatórios. Portanto, um hexamer aleatório, onde cada sequência possível é representada, consiste em 46 = 4096 sequências diferentes. A sequência de identificação não deve se ligar ao modelo. Em todos os casos, mas especialmente para sequências de identificação aleatórias, é preferível adicionar o adaptador de ácido(s) nucleico(s) após a reação de alongamento. Quando o produto de alongamento atinge o stopper (ou extremidade do modelo) e essencialmente todo o modelo está então na forma de uma fita dupla com os produtos de alongamento, então o adaptador de ácido(s) nucleico(s) é impedido de se ligar ao modelo.
[0033] Em outras modalidades da invenção, os primers e stoppers são selecionados para se ligar a uma ou mais sequências alvo de interesse especial em um ácido nucleico modelo (com stopper estando a jusante para um produto de alongamento), de modo que uma sequência de alongamento de uma determinada parte do modelo seja obtida. Esse direcionamento de regiões específicas é preferencialmente usado para transcrições (RNA) ou genes (gDNA) como modelos. Sequências de identificação são especialmente úteis quando usadas em painéis de genes. Tal como para a análise de variantes sequenciais de diferentes espécies de modelos, tais como variantes de emenda ou outras sequências de modelos variadas.
[0034] Em modalidades especialmente preferidas da invenção, para todas as suas modalidades e aspectos, o stopper de alongamento tem atividade de primer e também é alongada durante a etapa de alongamento. Isso significa que mais de um primer é usado e a maioria tem função de stopper (ou seja, evitar deslocamentos – veja acima). Usar vários primers significa que um modelo produz muitos fragmentos gerados, ou seja, a cobertura é melhorada. Embora os primers se liguem a um modelo cada um, eles fornecerão cobertura abrangente quando diferentes primers se ligam a diferentes locais no modelo. O método inventivo usando uma pluralidade de primers (que de preferência também são stoppers) aumentará a cobertura, uma vez que um novo produto de extensão começará em uma posição no modelo onde um produto de alongamento a montante acabou de parar. Isso rende muitos fragmentos que cobrem todo o modelo. Além disso, significa também que stoppers/primers (nesta configuração usada como sinônimo) são usados para se ligar a diferentes partes de uma molécula de modelo. Em geral, a ligação à molécula do modelo é determinada pelas sequências de anelamento dos primers e stoppers. Esta sequência hibridiza com o modelo e pode ser variada para se ligar a diferentes locais no modelo. Preferivelmente pelo menos 9, pelo menos 10, mais preferivelmente pelo menos 49, pelo menos 50, por exemplo, 100 ou mais, ou 200 mais ou mais, stoppers de alongamento são usados, os quais têm sequências de anelamento diferentes para anelar o modelo. Assim, eles potencialmente se anelam a diferentes locais no ácido nucleico modelo. De preferência, a sequência de anelamento é uma sequência aleatória. Sequências aleatórias são descritas acima, em relação à sequência de identificação e o mesmo se aplica à sequência de anelamento do primer, stopper e stoppers com função de primer também. Preferencialmente, a sequência aleatória da sequência de anelamento pode cobrir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 ou mais nucleotídeos que são selecionados aleatoriamente de A, G, C ou T (U).
[0035] Preferencialmente, o(s) ácido(s) nucleico(s) adaptador(es) é/são ligado(s) a, hibridizado(s) a, ou não é/são ligado(s) ao stopper(s) de alongamento. Tal reação de ligação, por exemplo, por reação química, formação de complexo ou hibridização, facilita o posicionamento do ácido nucleico adaptador perto da extremidade 3' do produto de alongamento a montante, ao qual sua sequência de identificação, que em si não é hibridizada, stopper ou modelo, e que surpreendentemente não é necessária para que a reação de ligação funcione.
De preferência quando os ácidos nucleicos adaptadores sãi lig-ados a ou hibridizados aos stoppers de alongamento, então a sequência de identificação é selecionada independente de uma sequência de anelamento do stopper de alongamento para anelar o stopper de alongamento ao modelo.
Tanto a sequência de anelamento, quanto a sequência de identificação podem ser sequências aleatórias, preferivelmente selecionadas independentemente umas das outras.
Isso geralmente é garantido quando as partes de ácido nucleico do stopper e do adaptador são sequências universais, ou seja, qualquer adaptador pode se ligar a qualquer stopper (que é o preferido para todas as modalidades da invenção) e ainda um ácido nucleico adaptador não é fornecido ligado ao stopper, por exemplo, quando o adaptador é fornecido somente após a reação de alongamento.
Em outras modalidades ou outras partes da reação, eles não estão ligados, tal como quando a reação de alongamento atinge a extremidade 5' do modelo, onde nenhum stopper é geralmente hibridizado a, porque o stopper precisa de pelo menos uma sequência de anelamento mínima no modelo, que move a posição de parada mais a jusante vários nucleotídeos a montante da extremidade 5'. O adaptador também é capaz de ser ligado ao produto de alongamento sem ligação ou hibridização ao stopper de alongamento.
No entanto, é preferível em todas as modalidades que, quando o ácido nucleico adaptador é ligado ao produto de alongamento, o dito stopper de alongamento e/ou produto de alongamento, preferiu especialmente sua extremidade 3', ainda é hibridizado ao modelo.
Também é preferível que os ácidos nucleicos adaptadores sejam hibridizados ao stoppers de alongamento,
especialmente preferido, após a reação de alongamento e/ou - especialmente preferido – à ligação.
[0036] Em preferências do método inventivo e do kit, o primer de oligonucleotídeo - e preferencialmente, mas não necessariamente também o stopper de alongamento - compreende uma sequência de amplificação universal ("sequência de ligante de primer ", veja acima) e/ou onde o ácido nucleico adaptador compreende uma sequência de amplificação do adaptador universal ("sequência de ligante de adaptador", veja acima). Tal sequência de amplificação ou "ligante" pode ser usado para ligar primers para uma amplificação adicional, como já mencionado acima. Uma sequência universal significa que ela é a mesma para todos os primers, stoppers ou adaptadores, respectivamente. Isso permite a ligação do mesmo tipo de primer a esses oligonucleotídeos. Em modalidades especialmente preferidas, a sequência de amplificação universal (sequência de ligante) também é a mesma para os primers, stoppers e adaptadores, ou seja, um primer de amplificação adicional pode se ligar a primers de oligonucleotídeos, stoppers de alongamento e ácidos nucleicos adaptadores, da mesma forma. Isso facilita o manuseio fácil, uma vez que apenas um tipo de primer é necessário para uma amplificação adicional. Em outras modalidades, os primers, stoppers e adaptadores têm diferentes sequências de amplificação universais (sequências de ligante), ou seja, um primer de amplificação adicional pode somente se ligar a primers de oligonucleotídeos, outro primer de amplificação adicional só pode se ligar ao stopper de alongamento e um primer de amplificação adicional só pode se ligar a ácidos nucleicos adaptadores. Dentro desses grupos, os primers são preferencialmente universais. Isso ainda permite o fácil manuseio, mas também melhor controle, uma vez que os primers para ambas as extremidades de fragmento rotulado serão diferentes e podem ser selecionadas especificamente.
[0037] Em modalidades preferidas, um primer de oligonucleotídeo especial é usado para selecionar e anelar a uma sequência selecionada do modelo, preferivelmente na extremidade 3' do modelo.
No caso de mRNA, ou qualquer outro tipo de RNA que compreenda uma cauda oligo(A), tal extremidade 3' pode ser anelada a comum primer de oligonucleotídeo complementar, por exemplo, que compreende uma sequência de anelamento oligo(dT), que é complementar à dita cauda oligo(A). Preferivelmente, pelo menos um primer de oligonucleotídeo compreende uma sequência de anelamento para anelar a uma sequência selecionada do modelo, que pode estar na extremidade ou próximo da extremidade 3' do modelo.
Tal sequência selecionada é qualquer sequência conhecida do modelo, como uma cauda oligo(A), mas qualquer outra sequência quando conhecida pode ser usada também.
Preferencialmente, o primer de oligonucleotídeo para a sequência selecionada compreende uma sequência de oligo(dT) para anelar-se a uma sequência de oligo(A) no modelo.
Preferencialmente, a dita sequência de oligo(dT) compreende um ou mais nucleotídeos de ancoragem 3', diferentes da sequência de oligo(dT). Isso permite a localização adequada e a ligação à extremidade 5' da sequência de modelo oligo(A). O nucleotídeo de ancoragem será anelado ao próximo não A (por exemplo, T, G, C) no modelo próximo a parte oligo(A). Se o próximo nucleotídeo não A for desconhecido, é possível usar uma mistura de primer de oligonucleotídeo com diferentes primers de ancoragem, por exemplo, usando três primers de oligonucleotídeos com cada nucleotídeo não T (por exemplo, G, C) (complementar ao próximo não A (por exemplo, T, G, C) no modelo). Em modalidades preferidas, são utilizados dois nucleotídeos de ancoragem.
O nucleotídeo de ancoragem próximo ao dito nucleotídeo não T pode ser selecionado de qualquer tipo de nucleotídeo (A, T(U), G, C) pois não está beirando o oligo(T). O dito primer de oligonucleotídeo especial pode não ser stop-
per e pode não compreender uma sequência para hibridização a um adaptador, uma vez que estes não são necessários, se o primer especial de oligonucleotídeos se anelar a ou próximo à extremidade 3' do modelo – isso significa que nenhum produto de alongamento a montante chegará à sua posição. Para facilitar ou ter unidade na fabricação de primer/stopper tal sequência e/ou função de stopper pode estar presente.
[0038] Preferivelmente, a reação de ligação é na presença de um agente de aglomeração. Um agente de aglomeração aumenta a probabilidade do produto adaptador e alongamento interagirem um com o outro, diminuindo o volume reativo efetivo, ver Zimmerman et al., Proc Natl Acad Sci U S A. 1983; 80(19):5852-6. Outros agentes de aglomeração são, por exemplo, divulgados em US 5.554.730, US
8.017.339 e WO 2013/038010 A2. Preferivelmente, o agente de aglomeração é uma macromolécula, polímero ou composto compreendendo polímero, como um polialquil glicol, preferivelmente PEG, Octoxinol ou Triton X, ou um polissorba-to, preferivelmente Tween. Nas modalidades preferidas, o agente de aglomeração é usado em concentrações de 5% a 35% (v/v), especialmente preferido de 10% a 25% (v/v). Preferencialmente, o agente de aglomeração tem um peso molecular de 200 até 35000 g/mol, de preferência 1000 a 10000 g/mol. Especialmente preferido é um polialquil glicol, como PEG, especialmente com o dito peso molecular. Um agente de aglomeração é preferencialmente fornecido no kit inventivo, de preferência em um tampão de ligação.
[0039] Outros ingredientes para o kit, em qualquer componente, são tampões, sais, cofatores enzimáticos e metais, tais como Mn2+ e Mg2+ para polimerases e ligases, solventes, recipientes.
[0040] A presente invenção provê um kit para a execução do método inventivo. Tal kit pode compreender qualquer um dos compostos e meios descritos até agora.
De preferência, o kit compreende: (i) pelo menos um primer de oligonucleotídeo capaz de hibridizar a um ácido nucleico modelo e preparar uma reação de alongamento em sua extremidade 3'; (ii) uma ou mais stoppers de alongamento capazes de hibridizar a um ácido nucleico modelo, de preferência capaz de preparar uma reação de alongamento em sua extremidade 3'; (iii) um ou mais ácidos nucleicos adaptadores que compreendem uma sequência de identificação em sua extremidade 5', em que essa sequência de identificação não hibridiza ao stopper de alongamento, de preferência em que o ácido nucleico adaptado, hibridizado ou não está ligado a um stopper de alongamento; (iv) uma transcriptase reversa; e (v) uma ligase de oligonucleotídeo; (iv) e (v) pode ser opcional, uma vez que podem estar disponíveis para muitos laboratórios independentemente da presente invenção.
As partes importantes são os desenhos adaptador/stopper, especialmente as sequências de identificação nos adaptadores.
Preferencialmente, uma pluralidade de adaptadores com diferentes sequências de identificação é fornecida no kit – como descrito acima.
Todos esses componentes do kit foram descritos acima e qualquer configuração preferencial destes também se aplica ao kit.
Preferivelmente o kit compreende pelo menos 10, mais preferivelmente pelo menos 50, ácidos nucleicos adaptadores com diferentes sequências de identificação.
As razões para tal configuração preferencial foram dadas acima.
Preferencialmente, o primer de oligonucleotídeo compreende uma sequência de anelamento para anelar ao modelo, que compreende uma sequência de oligo(dT) para anelar a uma sequência de oligo(A) no modelo, de preferência em que a dita sequência oligo(dT) compreende um ou mais nucleotídeos de ancoragem 3' diferentes da sequência oligo (dT). O kit também pode compreender uma fase sólida para purificação, como contas, preferencialmente contas magnéticas (veja detalhes do método acima,
que também conferem aos componentes do kit sustentabilidade e modalidades.
[0041] Todas as modalidades preferidas descritas acima podem ser combinadas. Tal método usa um primer aleatório (com uma sequência de ligante) que também é um stopper (também chamado de "Primer que para o deslocamento de fita"). Após a reação de alongamento, preferivelmente é feita uma purificação dos produtos de alongamento (hibridizados ao modelo) para remover primers e stoppers não ligados. Em seguida, os adaptadores com suas sequências de ligantes e de identificação são ligadas ao produto de alongamento. A sequência de identificação tem uma sequência aleatória com um comprimento de preferência entre 4 e 12 nt. Uma opção preferida é usar misturas de sequências de identificação diferentemente longas, porque ligases tendem a impor vieses de ligação favorecendo certos nucleotídeos localizados em 5' na última e penúltima posição. Uma vez que esses vieses podem afetar a qualidade da leitura no sequenciamento dessas misturas, equalizam a distribuição de nucleotídeos ao sequenciamento em toda a região de junções de ligação. No entanto, a sequência de identificação variável fornece uma ligação muito mais imparcial que qualquer outra sequência determinada e serve, ao mesmo tempo, também como um UMI (Unique Molecular Index). Uma sequência de identificação, tal como UMI, permite determinar se leituras de sequenciamento, que possuem uma sequência idêntica, ou que mapa para uma posição idêntica em uma anotação de referência, que explica pequenos erros de sequenciamento, vêm de diferentes moléculas de modelo ou de uma molécula de modelo e são apenas o resultado de uma amplificação adicional (duplicação do PCR). O adaptador é hibridizado ao primer, quando presente.
[0042] Sequências de identificação, como UMIs, também podem distinguir entre SNPs reais (polimorfismos de nucleotídeos únicos) entre indivíduos e erros (mutações) introduzidos durante a transcrição reversa ou nos ciclos iniciais de PCR, que são amplificados posteriormente. Todos aqueles erros que ocorrem aleatoriamente e amplificados devem ter o mesmo identificador, enquanto os "SNPs reais" em uma amostra têm vários identificadores diferentes. Ou os eventos de edição de RNA que introduzem bases modificadas levando à incorporação errada e, portanto, erros durante RT poderiam ser quantificados de forma mais confiável.
[0043] Sequências de identificação, como UMIs, também poderiam ser usadas para determinar e quantificar, de forma confiável, as frequências de alelo em populações, marcadores moleculares e mutações causais em doenças hereditárias. Preferencialmente, modelos de DNA são usados para esta configuração.
[0044] Outra combinação preferida é um método da invenção em que pelo menos um, preferivelmente pelo menos 9, stoppers de alongamento tem atividade de primer e também é alongado durante a etapa alongamento e pelo menos dois, de preferência pelo menos 10, ácidos nucleicos adaptadores que compreendem diferentes sequências de identificação são usados, pelo menos dois, preferivelmente pelo menos 10, diferentes fragmentos rotulados são gerados, amplificando opcionalmente os fragmentos rotulados, ainda compreendendo a montagem das sequências de fragmentos de amplificação únicos, onde os rótulos são usados para identificar fragmentos de amplificação únicos. Os diferentes rótulos nos fragmentos rotulados amplificados podem ser usados para identificar fragmentos de amplificação únicos.
[0045] Outro método preferido usa stoppers com funções de primer. Preferivelmente é utilizada uma pluralidade de tais primers. Em tal método, sem diferenciar entre stoppers e primers, uma modalidade pode ser definida da seguinte forma: Um método para gerar fragmentos de amplificação rotulados de um ácido nucleico modelo, compreendendo as etapas de fornecer o dito ácido nucleico modelo; anelar uma pluralidade de primers de oligonucleotídeos ao referido ácido nucleico modelo, alongando os primers oligonucleotídeos de forma específica, criando assim uma pluralidade de produtos de alongamento, no qual as ditas reações de alongamento param quando os produtos de alongamento atingem a extremidade 5' do ácido nucleico modelo ou um primer de oligonucleotídeo que está anelado ao ácido nucleico modelo a jusante de tal produto de alongamento, provendo uma pluralidade de ácidos nucleicos adaptadores que compreendem uma sequência de identificação em suas extremidades 5', em que as ditas sequências de identificação não hibridizam ao primer de oligonucleotídeo ou ao modelo, ligando os ácidos nucleicos adaptadores da pluralidade em suas respectivas extremidades 5' à extremidade 3' dos produtos de alongamento, gerando assim pluralidade de fragmentos de amplificação rotulados.
Esta é uma configuração preferida, que pode ser combinada com quaisquer aspectos particularmente descritos nas reivindicações e descritos acima.
Tudo descrito acima para stoppers se aplica aos primers nesta configuração, uma vez que estes primers são stoppers com função de primer.
O termo "pluralidade" é usado para primers de oligonucleotídeos, produtos de alongamento (que são o resultado do alongamento dos primers), ácidos nucleicos adaptadores e fragmentos de amplificação rotulados (que são o resultado de alongamento e ligação de adaptador). Como indicado, a quantidade de algumas dessas pluralidades é um resultado do método.
As quantidades de primers oligonucleotídeos e ácidos nucleicos adaptadores podem ser selecionadas – como descrito acima.
Seus valores podem ser selecionados independentemente, mas são de preferência, aproximadamente os mesmos para associação em pares com um determinado produto de alongamento. Preferivelmente, a pluralidade é, por exemplo, 10 ou mais, 50 ou mais, 100 ou mais, 200 ou mais, etc. Muitos primers de oligonucleotídeos diferentes e ácidos nucleicos adaptadores podem ser usados para: que os primers de oligonucleotídeos se liguem a vários locais diferentes no modelo, para que os ácidos nucleicos adaptadores tenham diferentes sequências de identificação, de preferência sequências de identificação únicas para os fragmentos de amplificação rotulados. Embora nesta configuração primers e stoppers sejam os mesmos, um primer especial que não precisa (mas pode ter) função de stopper também pode ser adicionado, tal como um primer de extremidade 5' específico, como um primer alvo oligo(A), como descrito acima.
[0046] A presente invenção é ainda descrita nas seguintes Figuras e exemplos, sem se limitar a essas modalidades da presente invenção. Figuras
[0047] Figura 1: Representação esquemática da criação de uma biblioteca de cDNA de ligante UMI curto etiquetado usando um primer com propriedades SDS e um oligo de ligante contendo UMI complementar e parcialmente dentro do corpo do RNA.
[0048] a) Primers de parada de deslocamento de fita gerais Pn são hibridizados para uma transcrição de RNA, com primer Pn+1 hibridizado para uma posição mais a montante (5') do RNA modelo do que o primer Pn. Quando a transcriptase reversa, enquanto a extensão Pn atinge um primer Pn+1, a reação de polimerase será interrompida pela tecnologia de parada de deslocamento de fita, descrita em WO 2013/038010 A2. Um oligo ligante contendo UMI, englobando L2, que é complementar ao L1 é hibridizado aos primers Pn e Pn+1. b) Durante a ligação, o produto de extensão está agora ligado ao UMI que precede a fita L2 do ligante. Desta forma, novamente, uma biblioteca cDNA é criada, tendo duas sequências de ligante (L1, L2) presentes em suas extremidades e contém identificadores moleculares únicos. c) Por fim, é realizado um PCR para amplificar essas bibliotecas. Figura 2: Geração de bibliotecas contendo UMI
[0049] A Figura 2 a) mostra bibliotecas geradas pela abordagem SDS + ligação.
[0050] A ligação do adaptador L2 parcialmente complementar contendo UMI (ver Fig. 1 para referência) pode ser realizada usando uma ss ligase como uma ds ligase (faixa 2, 3). Nenhuma biblioteca é gerada quando ligase é omitida (faixa 1). Após a ligação, os fragmentos de cDNA contendo ligantes L1 e L2 são amplificados por PCR e analisados. São mostradas imagens em gel de um teste de DNA HS executado em um Bioanalyzer (Agilent Technologies, Inc.). b) ilustração esquemática da geração de bibliotecas contendo UMI, utilizando a abordagem de ligadura SDS + com iniciador não hibridizador e oligos de adaptador. Neste caso, o oligo adaptador L2' não contém sequências complementares ao iniciador de alongamento Pn. c) Imagem em gel e eletroferograma de bibliotecas de replicação geradas utilizando iniciador de alongamento não hibridizador e oligos adaptador contendo UMI (SEQ ID Nº 10). As imagens são obtidas a partir de um teste de DNA HS executado em um Bioanalyzer (Agilent Technologies, Inc.). Figura 3: Cobertura da extremidade 5' melhorada de transcrições obtidas pela ligação dos ligantes L2 ao cDNA na extremidade 5' do modelo de RNA.
[0051] a) Representação esquemática da reação RT na extremidade 5' das transcrições. Sem SDS pelos primers Pn+1a jusante, a atividade da desoxinucleotidil transferase terminal (TdT) do RT adiciona nucleotídeos não modelos à extremidade3' do cDNA gerando uma saliência. b) Os nts não modelos podem servir como local de hibridização para L1 contendo primer Pn+1. Em conjunto com L2 parcialmente hibridizado, a ligação do ligante UMI-L2 pode ocorrer em uma fita dupla. c) Alternativamente, na ausência de preparação do ligante UMI-L2 pode ser ligado como uma fita único. d) Bibliotecas geradas como mostrados esquematicamente em Fig. 3 a-c) foram sequenciadas em um Illumina NextSeq 500 (leitura única, 75pb). São mostrados o mapeamento de leituras para a extremidade 5' do ERCC- 0130 (como presente no conjunto SIRV 3, Lexogen Catalog #051.0N). As leituras foram analisadas sem aparar bases adicionais e equivocadas. Nucleotídeos marcados em cinza correspondem à anotação do ERCC-0130, e os nucleotídeos mostrados em preto são derivados da adição não modelada pela atividade TdT da RT. Trinta sequências representativas das leituras obtidas para a extremidade 5' do ERCC-0130 são mostradas abaixo. As sequências de leitura são ID SEQ Nº.: 12 a 42, de cima para baixo. e) Cobertura da extremidade 5' melhorada da abordagem SDS/ligação, em comparação com os protocolos convencionais. As bibliotecas foram prepaadas usando um protocolo convencional (NEBNext® UltraTM II direc-tional Library Prep Kit for Illumina®, New England Biolabs, Catalog # E7760S) ou a abordagem SDS/ligação e sequenciadas em um Illumina NextSeq 500 (leitura de extremidade em pares, 150pb). Leituras mapeando o ERCC- 0130 foram sobrepostas e comparadas com a cobertura esperada mostrada como retângulos, à esquerda: protocolo convencional de preparação da biblioteca RNA, à direita: cobertura obtida pela nova tecnologia SDS/ligação. Figura 4: Representação esquemática da reação usada para melhorar a cobertura de extremidade 3' pela abordagem SDS/ligação e uma combinação de primers gerais (Pn) e oligo-dT (PdT).
[0052] a) O primer geral Pn é hibridizado ao modelo de RNA dentro do corpo do RNA. Além disso, os primers oligo-dT (PdT) presentes hibridizam para a cauda poli(A) da extremidade 3' das transcrições poliadeniladas. A RT estenderá o PdT até que um primer Pn a jusante seja atingido e pare o deslocamento da fita. b) Durante a ligação, o ligante L2 contendo UMI será ligado a fragmentos de cDNA abrangendo a extremidade 3', gerando bibliotecas de cDNA ligadas a L1 e L2, contendo UMI, cobrindo as extremidades 3' das transcrições. c) Gráfico de cobertura do corpo genético mostrando uma cobertura aprimorada da extremidade 3' das transcrições por todo o transcriptoma. As bibliotecas foram preparadas usando o protocolo de SDS + ligação, usando uma mistura de priming aleatório e primer de síntese de primeira fita oligo-dT, conforme descrito no exemplo 3. As bibliotecas foram sequenciadas em uma máquina NextSeq 500 e a cobertura do corpo genético sobre o transcriptoma foi plotada em comparação com o protocolo SDS + ligação anteriormente descrito. d) Cobertura exemplar sobre um gene de limpeza endógeno (HSP90) para um método convencional de preparação da biblioteca (painel superior) e o protocolo de SDS + ligação com titulação de oligo-dT (painel inferior), que resulta em uma cobertura de extremidade 3' melhorada. Figura 5: Melhoria global da cobertura 5' e 3' das transcrições.
[0053] Os locais de início de transcrição, ou seja, locais genuínos de extremidades 5' e de transcrição, ou seja, extremidades genuínas 3' de transcrições, são resolvidos usando o protocolo de SDS + ligação, mas não resolvidas ao usar dois métodos exemplares de preparação convencional da biblioteca. Bibliotecas geradas usando o protocolo SDS + ligação como mostrado esquematicamente em Fig. 3 a-c), foram sequenciadas em um Illumina NextSeq 500 (extremidade em pares, 150pb). Bibliotecas convencionais foram preparadas de acordo com as instruções do fabricante, usando a biblioteca de RNS total de fita Truseq prep. humano/camundongo/rato t, Illumina Catalog # 20020596 ou 20020597 (=Convencional 1) ou o kit de preparação de biblioteca direcionada NEBNext® UltraTM II para Illumina®, New England Biolabs, Catálogo # E7760S (Convencional= 2). a) São mostradas leituras mapeando extremidades genuínas 5' e 3' de ERCCs detectados (como presente no conjunto SIRV 3, Lexogen Catalog #051.0N). As leituras foram mapeadas para o pico ERCC em RNAs com sequência conhecida. A cobertura normalizada de leituras mapeadas acumuladas para todos os ERCCs detectados, é plotada para posições absolutas de nucleotídeos em relação ao início da transcrição (TSS) e transcrita aos locais finais de transcrição (TES) marcados por linhas pontilhadas. b) Cobertura estendida 5' revela TSS genérico. Painel superior: Perfil de cobertura para gapdh com visualização intron condensada, como gerado usando o protocolo SDS + ligação ou preparações de biblioteca convencionais, como descrito acima. b) Foram analisadas as leituras mapeando gapdh, sem aparar bases adicionais e de incompatibilidade. As sequências de leitura são os IDs SEQ Nº 43 a Nº 67, de cima para baixo. Nucleotídeos marcados em preto correspondem à anotação de gapdh e nucleotídeos mostrados em cinza são incompatibilidades ou derivados da adição de não modelos pela atividade TdT da RT. Os clusters dos locais iniciadores, gerados pelo empilhamento de leituras na extremidade 5' das transcrições, podem ser usados para reanotar TSS. O TSS anotado e manualmente determinado é indicado por setas na sequência de consenso anotada, mostrada em negrito.
EXEMPLOS Exemplo 1: Ligação de identificadores moleculares únicos (UMI) a fragmentos de CDNA de primeira fita.
[0054] Bibliotecas foram preparadas a partir de RNA de referência humana universal (Agilent Technologies, Catálogo # 740000), contendo SIRV Set de 3 picos no mix de controle (Lexogen, Catálogo # 051.0N) de acordo com a instrução do fabricante.
[0055] Após a síntese de CDNA, primers a jusante (Pn+1 (L2)), contendo um identificador molecular único, de comprimento entre 2 e 24 nucleotídeos, de preferência entre 6 e 12 nucleotídeos, podem ser ligados a fita de cDNA recém-transcrita, no híbrido com o RNA modelo. A transcrição reversa foi realizada utilizando oligos, modelo e condições como descritos em WO 2013/038010 A2. Várias ligases e combinações destas podem ser usadas para ligar oligos como: ID SEQ Nº.: 1: (Fos)(5'-NNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC- 3'(3InvdT)), ID SEQ Nº.: 2: (Fos)(5'-NNNNNNNNNNAGATCGGAAGAGCACACGTCTGAA-3'(3InvdT)), ID SEQ Nº.: 3: (Fos)(5'-NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG- 3'(3InvdT)), ID SEQ Nº.: 4: (Fos)(5'-NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3'(3InvdT)), ID SEQ Nº.: 5: (Fos)(5'-NNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG- 3'(3InvdT)), ID SEQ Nº.: 6: (Fos)(5'-NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG- 3'(3InvdT)), ID SEQ Nº.: 7: (Fos)(5'-NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3'(3InvdT)), ID SEQ Nº.: 8: (Fos)(5'-+NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3'(3InvdT)), ID SEQ Nº.: 9: (Fos)(5'-+NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG- 3'(3InvdT)).
[0056] Após transcrição reversa (RT), as amostras foram purificadas por imobilização reversa de fase sólida (SPRI) com contas de purificação magnética (AmPure Beads; Agentcourt), de acordo com as instruções do fabricante. Os híbridos cDNA:RNA foram eluidos em 20 μl de água ou 10 mM Tris, pH 8.0, antes que 17 μl dos sobrenadantes fossem transferidos para uma nova placa PCR. Em seguida, as reações de ligação foram realizadas em 60 μl com 20% PEG-8000, 50 mM Tris- HCl (pH 7,5 a 25°C), 10 mM MgCl2, 5 mM DTT, ATP de 0,4 mM, 0,01% Triton-x100, 50 μg/ml de BSA e 20 unidades de ligase, que pode ser uma ligase específica de fita única e/ou uma ligase específica de fita dupla. Pequenos fragmentos não ligados e oligos remanescentes foram removidos pela purificação SPRI. Todas as bibliotecas primárias de cDNA restantes foram amplificadas em uma reação PCR, usando uma polimerase de alta fidelidade e o seguinte programa: 98°C por 30 segundos, seguido por 10-25 ciclos PCR de 98°C, durante 10 segundos,
65°C por 20 segundos e 72°C por 30 segundos. A prorrogação final foi realizada a 72°C durante 60 segundos. A Figura 1 b) mostra o princípio geral subjacente à ligação do cDNA estendido ao oligo ligante contendo UMI (L2,) que tem uma sequência complementar ao primer de parada de deslocamento de fita (L1).
[0057] O exemplo na Figura 2 mostra que várias ligas podem realizar a reação de ligação de um nucleotídeo de oligo contendo UMI e assim produzir fragmentos de CDNA, que contêm ambos os ligantes PCR e são amplificados por PCR (Figura 2 a), faixa 2-3). Em contraste, o experimento de controle omitindo qualquer ligase, mostra que nenhuma biblioteca pode ser amplificada enfatizando a especificidade da reação (Figura 2 a), faixa 1). Exemplo 2: Geração de bibliotecas usando iniciador de alongamento não hibridizador e oligonucleotídeos adaptadores.
[0058] Bibliotecas foram preparadas a partir de RNA de referência humana universal (Agilent Technologies, Catálogo # 740000), contendo SIRV Set de 3 picos no mix de controle (Lexogen, Catálogo # 051.0N) de acordo com a instrução do fabricante.
[0059] A transcrição reversa (RT) foi realizada conforme descrito no Exemplo 1. Após a TR, as amostras foram purificadas por imobilização reversa de fase sólida (SPRI), com contas de purificação magnética (AmPure Beads; Agentcourt) de acordo com a instrução do fabricante, e os híbridos cDNA:RNA purificados foram eluidos em 20 μl 10 mM Tris, pH 8.0, antes que 17 μl do sobrenadante fossem transferidos para uma nova placa PCR. A ligação foi realizada utilizando-se as condições descritas no Exemplo 1, mas provendo um oligonucleotídeo adaptador que não contém complementaridade sequencial ao iniciador de alongamento usado para preparar a reação de transcrição reversa. Assim, o adaptador de oligonucleotídeo não pode hibridizar e, portanto, não são trazidos para as proximidades das extremidades 3' recém-
geradas dos produtos de alongamento, por recrutamento (Figura 2 b)). Oligos, tal como ID SEQ Nº. 10: (Fos)(5'- NNNNNNNNNNNNTGGAATTCTCGGGTGCCAAGG -3'(SpcC3)) não possuem complementaridade de sequência aos iniciadores de alongamento. Fragmentos contendo ambas as sequências de ligante foram amplificados após a limpeza, conforme descrito no Exemplo 1. A Figura 2 c) mostra imagens em gel e eletroferogramas de traços de biblioteca para duas bibliotecas de SDS + ligação replicadas, geradas com iniciadores de alongamento não hibridizador e oligos adaptadores. Exemplo 3: Cobertura de extremidade 5' melhorada como consequência da atividade de transferase terminal e da ligação ss de um ligante UMI a fragmentos de CDNA de primeira fita.
[0060] Bibliotecas foram preparadas a partir de RNA de referência humana universal (Agilent Technologies, Catálogo # 740000), contendo SIRV Set de 3 picos no mix de controle (Lexogen, Catálogo # 051.0N) de acordo com a instrução do fabricante.
[0061] A primeira síntese de cDNA de filamento para nas extremidades 5' das moléculas de RNA modelo. A atividade de transferência de terminais de transcriptases reversas, catalisa a adição não modelada de nucleotídeos na extremidade 3' do suporte de cDNA (Figura 3 a).
[0062] A ligação de oligos de ligante UMI (por exemplo, IDs SEQ 1- 9) após transcrição reversa, pode ocorrer em formação de fita dupla (Figura 3 b) e em saliências de fita única (Figura 3 c). Seguindo a purificação do SPRI e a amplificação PCR, as bibliotecas foram sequenciadas em um NextSeq 500, seja no modo de leitura única ou de extremidade emparelhada. As leituras mapeando aextremidade 5' do ERCC-0130 foram analisadas sem o recorte prévio de nucleotídeos mal correspondidos. As leituras que cobrem aextremidade 5' do ERCC-0130 são mostradas exemplarmente na Figura 3 d. A adição de nucleotídeos terminais e a ligação UMI em fitas únicas estendidas resultam em coberturas melhoradas de 5'. A comparação dos perfis de cobertura entre a preparação comum da biblioteca RNA-seq e a presente invenção são mostradas na Figura 3 e. As coberturas são vistas como superposição de todas as leituras alinhadas (traço mostrado em cinza) e comparadas com a cobertura uniforme esperada mostrada como retângulo. Considerando que, ao sequenciar dados derivados de protocolos convencionais, as extremidades 5' e 3' são menos eficientemente cobertas aparentes em uma inclinação em ambas as extremidades (Figura 3 e, à esquerda), o novo protocolo gera mais leituras de mapeando aextremidade 5' extrema das transcrições (Figura 3 e, à direita). Exemplo 4: Melhoria da cobertura de extremidade3' por titulação de primers de síntese de primeira fita de oligo-dT.
[0063] A cobertura das extremidades 3' de transcrição pode ser modificada, preferencialmente aumentada, usando primers de primeira fita contendo oligo-dT (Pn contendo L1), que são adicionados à mistura de oligos SDS de priming aleatório, que já contêm uma porção de sequências de priming rica em T e somente T (como ID SEQ Nº.: 11 5'- GTGACTGGAGTTCAGACGTGCTCTTCCGATCT +TTT TTT TTT TTT TTT+ V-3'), de acordo com a distribuição normal de nucleotídeos aleatórios, para aumentar a cobertura nas extremidades 3'. Dependendo da razão escolhida entre primers aleatórios e de poli-dT L1, a mudança na profundidade de sequenciamento nos locais de extremidade 3' pode ser em primeiro plano (Figura 4). As proporções de primers SDS aleatórios e primers dT oligo específicos, bem como o comprimento do primer e o conteúdo de LNA, podem variar e determinarão a quantidade de super-representação das extremidades 3'.
[0064] As bibliotecas foram preparadas por SDS + ligação usando apenas primers de parada de deslocamento de priming aleatório ou uma mistura com várias quantidades de primers de primeira fita oligo-dT (ID SEQ Nº.:11). As bibliotecas resultantes foram submetidas a sequenciamento em um NextSeq 500, os dados foram analisados e as parcelas de cobertura do corpo genético ao longo de todo o transcriptoma, foram geradas a partir de leituras mapeadas, usando o roteiro python de cobertura de corpo de gene disponível do rseqc (Figura 4 c). A cobertura de extremidades 3' pode ser significativamente aumentada após a adição de primers oligo-dT, durante a transcrição reversa.
[0065] Além disso, as coberturas genéticas foram visualizadas exemplarmente para genes endógenos, usando um roteiro personalizado para avaliar a cobertura em genes individuais. A Figura 4 d mostra a cobertura do gene de limpeza HSP90, obtido por um protocolo convencional de preparação de biblioteca RNA (painel superior), com notoriamente extremidades 5' e 3' sub-representadas. Em contraste, o protocolo SDS-ligação, com titulação oligo-dT, mostra uma cobertura melhorada de 5' e 3' (painel inferior). Exemplo 5: Melhorias na cobertura 5' e 3' facilitam a determinação de locais de início e fim de transcrições verdadeiras.
[0066] Bibliotecas SDS + Ligação foram preparadas em RNA de referência humana universal ribo-esgotado (Agilent Technologies, Catálogo # 740000), contendo SIRV Set de 3 picos no mix de controle (Lexogen, Catalog # 051.0N), conforme descrito nos Exemplos 3 e 4. A remoção do RNA ribossômico foi alcançada usando o RiboCop Lexogen, Catálogo # 037.96) de acordo com as instruções do fabricante. Como uma comparação, dois métodos convencionais de preparação da biblioteca foram usados no mesmo RNA de referência humana universal ribo-esgotado: o TruSeq Stranded Total RNA Library Prep Human/Mouse/Rat, Catálogo de Illumina # 20020596 ou 20020597
(=Convencional 1) ou o NEB-Next® UltraTM II directional Library Prep Kit para Illumina®, New England Biolabs, Catálogo # E7760S (= Convencional 2) seguindo as instruções do fabricante. As bibliotecas resultantes foram submetidas a sequenciamento em um NextSeq 500, e os dados foram analisados. Foram geradas parcelas de cobertura do corpo de gene para todos os ERCCs detectados presentes no CONJUNTO SIRV 3. A Figura 5 a) mostra a cobertura normalizada de leituras mapeadas, acumuladas sobre ERCCs, para posições absolutas de nucleotídeos, em relação aos locais conhecidos de início de transcrição (TSS) e locais de fim da transcrição (TES), ambos indicados por linhas pontilhadas. A cobertura em extremidades 5' e 3' é significativamente aumentada para amostras derivadas de bibliotecas SDS + Ligação, em comparação com ambas preparações da biblioteca convencionais, que mostram cobertura reduzida da extremidade 3' e falta de resolução da extremidade 5' exata.
[0067] Além disso, as coberturas genéticas foram visualizadas exemplarmente para um gene de limpeza endógeno, gapdh, usando um roteiro personalizado para avaliar a cobertura em genes individuais. A Figura 5 b) mostra o perfil de cobertura para gapdh, com visualização intron condensada. Foram analisadas leituras mapeando gapdh (IDs SEQ Nº. 43 a Nº. 67), sem aparar bases adicionais e incompatíveis. Nucleotídeos que correspondem à sequência de consenso (linha superior) são marcados em preto, e nucleotídeos que se desviam da sequência de consenso anotada ou derivados da adição de não modelos, são marcados em cinza. Com base no empilhamento das leituras observadas para amostras derivadas das preparações da biblioteca SDS + Ligação, locais de início de transcrição autênticos podem ser determinados e re-anotados para transcrições de interesse. No exemplo mostrado, na Figura 5 b) o TSS foi ajustado manualmente para a posição -15 (em relação à posição anotada +1). Da mesma forma, os locais de início e fim de transcrição genuínos, podem ser reavaliados para outras transcrições de interesse, permitindo uma análise abrangente da transcrição completa, incluindo resolução de nucleotídeos únicos no TSS genuíno, para experimentos de NGS de alto rendimento.
Isso pode ser conseguido simplesmente usando o método de preparação da biblioteca SDS + Ligação, em oposição a abordagens especializadas e mais complicadas, tais como técnicas de sequenciamento de captura de 5' (CAGE-Seq) ou metodologias de baixo rendimento, tal como 5' RACE (amplificação rápida de extremidades de cDNA).
Claims (16)
1. Método para gerar fragmentos de amplificação rotulados de um modelo de ácido nucleico, caracterizado pelo fato de que compreende as etapas de prover o dito ácido nucleico modelo, anelar pelo menos um primer de oligonucleotídeo ao dito ácido nucleico modelo, alongar pelo menos um primer de oligonucleotídeo de uma maneira específica de modelo, criando assim um produto de alongamento, em que a dita reação de alongamento para quando o produto de alongamento atinge (a) a extremidade 5' do ácido nucleico modelo ou (b) um stopper de alongamento de ácido nucleico que está anelado ao ácido nucleico modelo a jusante do produto de alongamento, prover um ácido nucleico adaptador que compreende uma sequência de identificação em sua extremidade 5', em que a dita sequência de identificação não hibridiza com o stopper de alongamento ou com o modelo, ligar o ácido nucleico adaptador em sua extremidade 5' à extremidade 3' do produto de alongamento, em que para ligação os produtos de alongamento são hibridizados ao modelo, gerando assim um fragmento de amplificação rotulado.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que, em caso do produto de alongamento atingir a extremidade 5' do ácido nucleico modelo, uma polimerase de nucleotídeo pode adicionar nucleotídeos não modelos ao produto de alongamento, preferivelmente por uma atividade de transferase terminal da polimerase, e/ou preferivelmente em que 1 a 15 nucleotídeos não modelos são adicionados em pelo menos 70% dos produtos de extensão.
3. Método, de acordo com a reivindicação 1 ou 2,
caracterizado pelo fato de que uma pluralidade de ácidos nucleicos adaptadores é provida e usada na etapa de ligação, em que os ditos adaptadores da pluralidade têm sequências de identificação diferentes, preferivelmente em que pelo menos 10, mais preferivelmente pelo menos 50 ácidos nucleicos adaptadores com sequências de identificação diferentes são providos e usados na etapa de ligação.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a sequência de identificação é uma sequência aleatória.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que o stopper de alongamento tem atividade de primer e é também alongado durante a etapa de alongamento, preferivelmente em que pelo menos 9, mais preferivelmente pelo menos 49, stoppers de alongamento são usados, tendo diferentes sequências de anelamento para anelar ao modelo e com isso anelar potencialmente a diferentes localizações no ácido nucleico modelo.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a sequência de anelamento é uma sequência aleatória.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que o(s) ácido(s) nucleico(s) adaptador(es) é/são ligado(s), hibridizado(s) ou não é/são ligado(s) ou não é/são hibridizados ao(s) stopper(s) de alongamento, preferivelmente quando os ácidos nucleicos adaptadores são ligados ou hibridizados aos stoppers de alongamento, então a sequência de identificação é independente de uma sequência de anelamento do stopper de alongamento para anelar o stopper de alongamento ao modelo.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que o modelo é RNA, preferivelmente em que uma transcriptase reversa é usada para alongamento.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o primer de oligonucleotídeo e preferivelmente também o stopper de alongamento compreendem uma sequência de amplificação universal, e/ou em que o ácido nucleico adaptador compreende uma sequência de amplificação de adaptador universal.
10. Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que o primer de oligonucleotídeo compreende uma sequência de anelamento para anelar ao modelo, que compreende uma sequência oligo (T) para anelar a uma sequência oligo (A) no modelo, preferivelmente em que a dita sequência oligo (T) compreende um ou mais nucleotídeos de ancoragem 3' diferentes da sequência oligo (T).
11. Método, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que a reação de ligação é na presença de um agente de aglomeração, preferivelmente um polímero ou composto compreendendo polímero, como um polialquil glicol, preferivelmente PEG, Octoxinol ou Triton X, ou um polissorbato, preferivelmente Tween; e/ou em que o stopper de alongamento e, preferivelmente também o primer de oligonucleotídeo compreende(m) um ou mais nucleotídeo(s) modificados, que aumentam a temperatura de fusão em uma sequência de anelamento para anelar ao modelo.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que pelo menos um, preferivelmente pelo menos 9, stopper de alongamento tem atividade de primer e também é alongado durante a etapa de alongamento e pelo menos dois, preferivelmente pelo menos 10, ácidos nucleicos adaptadores, que compreendem diferentes sequências de identificação, são usados, sendo que pelo menos dois, de preferência pelo menos 10, diferentes fragmentos de amplificação rotulados são gerados, amplificando opcionalmente os fragmentos de amplificação rotulados, ainda compreendendo montar as sequências de fragmentos de amplificação, que são únicas, em que os rótulos são usados para identificar fragmentos de amplificação únicos.
13. Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pelo fato de que pelo menos dois primers de oligonucleotídeo são anelados ao dito ácido nucleico modelo, alongando os pelo menos dois primers de oligonucleotídeo em uma maneira específica de modelo, com isto criando pelo menos dois produtos de alongamento, em que as ditas reações de alongamento param quando os produtos de alongamento atingem (a) a extremidade 5' do ácido nucleico modelo ou (b) um primer de oligonucleotídeo como stopper de alongamento de ácido nucleico, que está anelado ao ácido nucleico modelo a jusante do produto de alongamento
14. Kit para desempenhar um método, como definido em qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que compreende pelo menos um primer de oligonucleotídeo capaz de hibridizar a um ácido nucleico modelo e preparar uma reação de alongamento em sua extremidade 3'; um ou mais stoppers de alongamento, capazes de hibridizar a um ácido nucleico modelo, preferivelmente capaz de preparar uma reação de alongamento em sua extremidade 3'; um ou mais ácidos nucleicos adaptadores que compreendem uma sequência de identificação em sua extremidade 5', em que a dita sequência de identificação não hibridiza ao stopper de alongamento, preferivelmente em que o ácido nucleico adaptador está ligado a, hibridizado a ou é não ligado ou hibridizado a um stopper de alongamento; uma transcriptase reversa e uma ligase de oligonucleotídeo.
15. Kit, de acordo com a reivindicação 14, caracterizado pelo fato de que compreende pelo menos 10, mais preferivelmente pelo menos 50, ácidos nucleicos adaptadores com diferentes sequências de identificação.
16. Kit, de acordo com a reivindicação 14 ou 15, caracterizado pelo fato de que pelo menos um primer de oligonucleotídeo compreende uma sequência de anelação para anelar ao modelo que compreende uma sequência (T) oligo para anelar a uma sequência (A) oligo no modelo, preferivelmente em que a dita sequência (T) oligo compreende um ou mais nucleotídeos âncora 3' diferentes da sequência (T) oligo.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18212743.1 | 2018-12-14 | ||
EP18212743.1A EP3666904A1 (en) | 2018-12-14 | 2018-12-14 | Nucleic acid amplification and identification method |
PCT/EP2019/085095 WO2020120747A1 (en) | 2018-12-14 | 2019-12-13 | Nucleic acid amplification and identification method |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112021010425A2 true BR112021010425A2 (pt) | 2021-08-24 |
Family
ID=64665702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112021010425-9A BR112021010425A2 (pt) | 2018-12-14 | 2019-12-13 | Método de amplificação e identificação de ácido nucleico |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220042089A1 (pt) |
EP (2) | EP3666904A1 (pt) |
JP (1) | JP7645182B2 (pt) |
KR (1) | KR20210104108A (pt) |
CN (1) | CN113795594B (pt) |
AU (1) | AU2019396663A1 (pt) |
BR (1) | BR112021010425A2 (pt) |
CA (1) | CA3122905A1 (pt) |
WO (1) | WO2020120747A1 (pt) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014093535A1 (en) * | 2012-12-13 | 2014-06-19 | Synthetic Genomics, Inc. | Peg-mediated assembly of nucleic acid molecules |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5554730A (en) | 1993-03-09 | 1996-09-10 | Middlesex Sciences, Inc. | Method and kit for making a polysaccharide-protein conjugate |
US7399590B2 (en) | 2002-02-21 | 2008-07-15 | Asm Scientific, Inc. | Recombinase polymerase amplification |
EP2789694A1 (en) | 2009-04-02 | 2014-10-15 | Fluidigm Corporation | Microfluidic device with reaction product recovery system |
US20120252686A1 (en) | 2011-03-31 | 2012-10-04 | Good Start Genetics | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
CA2848240C (en) * | 2011-09-16 | 2020-09-29 | Lexogen Gmbh | Nucleic acid transcription method |
JP6454281B2 (ja) | 2012-11-05 | 2019-01-16 | タカラ バイオ ユーエスエー, インコーポレイテッド | バーコード化する核酸 |
US10612088B2 (en) * | 2013-03-14 | 2020-04-07 | The Broad Institute, Inc. | Massively multiplexed RNA sequencing |
US20140274729A1 (en) | 2013-03-15 | 2014-09-18 | Nugen Technologies, Inc. | Methods, compositions and kits for generation of stranded rna or dna libraries |
EP3626866B1 (en) * | 2013-08-19 | 2021-03-24 | Abbott Molecular Inc. | Next-generation sequencing libraries |
EP2921556A1 (en) * | 2014-03-21 | 2015-09-23 | Lexogen GmbH | Copy number preserving RNA analysis method |
DK3167076T3 (da) | 2014-07-09 | 2022-02-21 | Lexogen Gmbh | Fremgangsmåder og produkter til kvantificering af RNA-transkriptvarianter |
US20160257993A1 (en) | 2015-02-27 | 2016-09-08 | Cellular Research, Inc. | Methods and compositions for labeling targets |
US10144962B2 (en) | 2016-06-30 | 2018-12-04 | Grail, Inc. | Differential tagging of RNA for preparation of a cell-free DNA/RNA sequencing library |
EP4357455A3 (en) * | 2016-12-12 | 2024-07-24 | Grail, LLC | Methods for tagging and amplifying rna template molecules for preparing sequencing libraries |
CA3059370C (en) * | 2017-04-12 | 2022-05-10 | Karius, Inc. | Methods for concurrent analysis of dna and rna in mixed samples |
-
2018
- 2018-12-14 EP EP18212743.1A patent/EP3666904A1/en not_active Withdrawn
-
2019
- 2019-12-13 WO PCT/EP2019/085095 patent/WO2020120747A1/en unknown
- 2019-12-13 JP JP2021533570A patent/JP7645182B2/ja active Active
- 2019-12-13 EP EP19816800.7A patent/EP3894595A1/en active Pending
- 2019-12-13 BR BR112021010425-9A patent/BR112021010425A2/pt unknown
- 2019-12-13 CA CA3122905A patent/CA3122905A1/en active Pending
- 2019-12-13 CN CN201980082605.0A patent/CN113795594B/zh active Active
- 2019-12-13 AU AU2019396663A patent/AU2019396663A1/en active Pending
- 2019-12-13 KR KR1020217022198A patent/KR20210104108A/ko active Pending
- 2019-12-13 US US17/413,181 patent/US20220042089A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN113795594A (zh) | 2021-12-14 |
US20220042089A1 (en) | 2022-02-10 |
JP2022512414A (ja) | 2022-02-03 |
CN113795594B (zh) | 2025-05-02 |
EP3666904A1 (en) | 2020-06-17 |
WO2020120747A1 (en) | 2020-06-18 |
AU2019396663A1 (en) | 2021-06-10 |
KR20210104108A (ko) | 2021-08-24 |
EP3894595A1 (en) | 2021-10-20 |
JP7645182B2 (ja) | 2025-03-13 |
CA3122905A1 (en) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220267845A1 (en) | Selective Amplfication of Nucleic Acid Sequences | |
CN110036117B (zh) | 通过多联短dna片段增加单分子测序的处理量的方法 | |
CN102648295B (zh) | 用于多重基因分型的多样品索引 | |
JP7203276B2 (ja) | メチル化されたdnaの標的領域に基づいてシーケンシングライブラリーを構築する方法及びキット | |
US20220127597A1 (en) | Haplotagging - haplotype phasing and single-tube combinatorial barcoding of nucleic acid molecules using bead-immobilized tn5 transposase | |
CN106103743A (zh) | 用于产生双链dna文库的方法和用于鉴定甲基化胞嘧啶的测序方法 | |
US20180223350A1 (en) | Duplex adapters and duplex sequencing | |
US20200299764A1 (en) | System and method for transposase-mediated amplicon sequencing | |
JP2020536525A (ja) | プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法 | |
CN108138175A (zh) | 用于分子条形码编码的试剂、试剂盒和方法 | |
US20140336058A1 (en) | Method and kit for characterizing rna in a composition | |
US20210017596A1 (en) | Sequential sequencing methods and compositions | |
BR112021010425A2 (pt) | Método de amplificação e identificação de ácido nucleico | |
US20210054451A1 (en) | Optimizing high-throughput sequencing capacity | |
RU2811465C2 (ru) | Способ амплификации и идентификации нуклеиновых кислот | |
CN107988219B (zh) | 用于多重pcr文库构建的连接序列及其设计方法 | |
Zmienko et al. | Transcriptome sequencing: next generation approach to RNA functional analysis | |
CN116685696A (zh) | 从两端对多核苷酸片段进行测序的方法 |