CN112689673A - 转座体使能的dna/rna测序(ted rna-seq) - Google Patents
转座体使能的dna/rna测序(ted rna-seq) Download PDFInfo
- Publication number
- CN112689673A CN112689673A CN201980059589.3A CN201980059589A CN112689673A CN 112689673 A CN112689673 A CN 112689673A CN 201980059589 A CN201980059589 A CN 201980059589A CN 112689673 A CN112689673 A CN 112689673A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- tag
- sequence
- cases
- transposase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003559 RNA-seq method Methods 0.000 title description 10
- 238000001712 DNA sequencing Methods 0.000 title description 3
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 479
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 458
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 458
- 108010020764 Transposases Proteins 0.000 claims abstract description 319
- 102000008579 Transposases Human genes 0.000 claims abstract description 319
- 239000000203 mixture Substances 0.000 claims abstract description 198
- 230000003321 amplification Effects 0.000 claims abstract description 127
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 127
- 102100034343 Integrase Human genes 0.000 claims description 234
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 232
- 108020004414 DNA Proteins 0.000 claims description 201
- 238000006243 chemical reaction Methods 0.000 claims description 197
- 230000000295 complement effect Effects 0.000 claims description 135
- 108090000623 proteins and genes Proteins 0.000 claims description 127
- 239000000523 sample Substances 0.000 claims description 88
- 108091034117 Oligonucleotide Proteins 0.000 claims description 84
- 108091005804 Peptidases Proteins 0.000 claims description 69
- 239000004365 Protease Substances 0.000 claims description 69
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims description 67
- 229920001184 polypeptide Polymers 0.000 claims description 35
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 35
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 102000053602 DNA Human genes 0.000 claims description 33
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 27
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 27
- 239000013614 RNA sample Substances 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 9
- 108090000790 Enzymes Proteins 0.000 claims description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 9
- 229920002477 rna polymer Polymers 0.000 claims description 8
- 102000003960 Ligases Human genes 0.000 claims description 5
- 108090000364 Ligases Proteins 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 288
- 238000012545 processing Methods 0.000 abstract description 14
- 239000012634 fragment Substances 0.000 description 288
- 108020004999 messenger RNA Proteins 0.000 description 260
- 239000002299 complementary DNA Substances 0.000 description 244
- 239000000047 product Substances 0.000 description 86
- 125000003729 nucleotide group Chemical group 0.000 description 69
- 235000019419 proteases Nutrition 0.000 description 65
- 210000004027 cell Anatomy 0.000 description 62
- 239000002773 nucleotide Substances 0.000 description 62
- 238000012163 sequencing technique Methods 0.000 description 61
- 230000002441 reversible effect Effects 0.000 description 52
- 239000011541 reaction mixture Substances 0.000 description 42
- 238000010839 reverse transcription Methods 0.000 description 40
- 238000003752 polymerase chain reaction Methods 0.000 description 38
- 102000040430 polynucleotide Human genes 0.000 description 34
- 108091033319 polynucleotide Proteins 0.000 description 34
- 239000002157 polynucleotide Substances 0.000 description 34
- 239000011324 bead Substances 0.000 description 26
- 210000001519 tissue Anatomy 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 22
- 238000002372 labelling Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 22
- 230000007017 scission Effects 0.000 description 22
- 230000017105 transposition Effects 0.000 description 20
- 108700028369 Alleles Proteins 0.000 description 17
- 230000027455 binding Effects 0.000 description 16
- 238000009396 hybridization Methods 0.000 description 14
- 230000000415 inactivating effect Effects 0.000 description 14
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 238000003860 storage Methods 0.000 description 11
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000002194 synthesizing effect Effects 0.000 description 10
- 241000589596 Thermus Species 0.000 description 9
- 238000000137 annealing Methods 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 241000713869 Moloney murine leukemia virus Species 0.000 description 8
- 241000700605 Viruses Species 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 239000005547 deoxyribonucleotide Substances 0.000 description 8
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 239000000178 monomer Substances 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000004925 denaturation Methods 0.000 description 7
- 230000036425 denaturation Effects 0.000 description 7
- 239000000539 dimer Substances 0.000 description 7
- 238000011049 filling Methods 0.000 description 7
- 230000002779 inactivation Effects 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- 108091028664 Ribonucleotide Proteins 0.000 description 6
- 241000589499 Thermus thermophilus Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 150000001768 cations Chemical class 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 239000003112 inhibitor Substances 0.000 description 6
- 239000002336 ribonucleotide Substances 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 5
- 235000011180 diphosphates Nutrition 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- -1 e.g. Proteins 0.000 description 5
- 230000001605 fetal effect Effects 0.000 description 5
- 238000010438 heat treatment Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 4
- 108010017826 DNA Polymerase I Proteins 0.000 description 4
- 102000004594 DNA Polymerase I Human genes 0.000 description 4
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 108010061833 Integrases Proteins 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108010012306 Tn5 transposase Proteins 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 3
- 102000007079 Peptide Fragments Human genes 0.000 description 3
- 108010033276 Peptide Fragments Proteins 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 241000205188 Thermococcus Species 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000833 heterodimer Substances 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000011901 isothermal amplification Methods 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 102200023384 rs587777213 Human genes 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 2
- 241001156002 Anthonomus pomorum Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000714197 Avian myeloblastosis-associated virus Species 0.000 description 2
- 101100167280 Caenorhabditis elegans cin-4 gene Proteins 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108091092584 GDNA Proteins 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- 108010002459 HIV Integrase Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 241000713824 Rous-associated virus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 241000589500 Thermus aquaticus Species 0.000 description 2
- 241000868182 Thermus thermophilus HB8 Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 241000607618 Vibrio harveyi Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 230000000536 complexating effect Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- BHMLFPOTZYRDKA-IRXDYDNUSA-N (2s)-2-[(s)-(2-iodophenoxy)-phenylmethyl]morpholine Chemical compound IC1=CC=CC=C1O[C@@H](C=1C=CC=CC=1)[C@H]1OCCNC1 BHMLFPOTZYRDKA-IRXDYDNUSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010004103 Chylomicrons Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241001663880 Gammaretrovirus Species 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000405147 Hermes Species 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 238000010867 Hoechst staining Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001053270 Homo sapiens Insulin gene enhancer protein ISL-2 Proteins 0.000 description 1
- 101100523829 Homo sapiens RBPMS gene Proteins 0.000 description 1
- 101900297506 Human immunodeficiency virus type 1 group M subtype B Reverse transcriptase/ribonuclease H Proteins 0.000 description 1
- 102100024390 Insulin gene enhancer protein ISL-2 Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000551546 Minerva Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 108010021713 Pyrococcus sp GB-D DNA polymerase Proteins 0.000 description 1
- 102000009609 Pyrophosphatases Human genes 0.000 description 1
- 108010009413 Pyrophosphatases Proteins 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241001522143 Thermus scotoductus Species 0.000 description 1
- 101000905444 Thermus thermophilus Glycerol kinase Proteins 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 206010060872 Transplant failure Diseases 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000003916 acid precipitation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001879 gelation Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L magnesium chloride Substances [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000011880 melting curve analysis Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 208000025113 myeloid leukemia Diseases 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
Abstract
本文提供了用于产生核酸文库的方法、组合物和试剂盒。在本文提供的各种实施方案中,包含转座酶的转座体用于形成双端标签化的核酸分子,用于下游扩增和核酸分子处理步骤。
Description
相关申请的交叉引用
本申请要求于2018年7月11日提交的美国临时申请序列号62/696,681的优先权,该美国临时申请的内容通过引用全文并入本文。
序列表
本申请包含序列表,该序列表已经以ASCII格式电子提交,并且由此通过引用全文并入本文。所述ASCII副本创建于2019年7月4日,名为53081-702_601_SL.txt,大小为958字节。
背景技术
转座酶介导的核酸分子的片段化和标签化可用于核酸分子的制备中,例如在测序文库的产生中。标签化(tagmentation)提供的优点在于样品制备和工作流程简化,其中可在单个反应中将待测序的核酸分子进行片段化和标签化。可在测序之前将这些所产生的核酸分子进一步扩增和/或进行序列特异性选择。核酸分子的序列信息可用于鉴定用于诊断、治疗、司法鉴定和许多其他应用的序列变体。
简单而快速的样品制备可用于分析核酸分子样品。核酸分子样品可以并行或批量处理,例如,以高通量复用的方式处理。然而,现有的制备核酸样品的方法经常受许多缺点的困扰。其中包括从目标RNA或转录物获得核酸文库的时间和处理量,以及样品中长核酸分子的全长覆盖不足。
发明内容
鉴于上述情况,需要用于加工核酸分子的改进方法。本文提供的方法、组合物、反应混合物和试剂盒满足了这一需求,并且还提供了另外的优点。该方法、组合物、反应混合物和试剂盒可包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶以及包含镶嵌端和第二标签的寡核苷酸的组合物。使包含核酸分子的样品与该组合物接触,以产生在5’端具有第一或第二标签的DNA/RNA杂交体分子以及用于进一步处理和测序的核酸文库。
本文提供了包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸的组合物。在一些情况下,第一标签和第二标签共享共同的核酸序列。在一些情况下,第一标签和第二标签包含不同的核酸序列。在一些情况下,该组合物包含具有多肽转座酶和包含镶嵌端和第二标签的核酸的转座体。在一些情况下,该组合物还包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体。在一些情况下,包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。在一些情况下,识别反应批次的标签包含UMI。在一些情况下,该寡核苷酸包含聚T区段。在一些情况下,该寡核苷酸包含基因特异性区段。在一些情况下,该组合物包含核糖核酸样品。在一些情况下,该组合物包含脱氧核糖核酸样品。在一些情况下,该组合物包含核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。在一些情况下,该组合物包含模板转换寡核苷酸(TSO)。在一些情况下,TSO包含第一标签和镶嵌端。在一些情况下,该组合物包含蛋白酶。在一些情况下,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。在一些情况下,该组合物包含聚合酶。在一些情况下,聚合酶是DNA聚合酶。在一些情况下,聚合酶是热稳定的聚合酶。在一些情况下,该组合物包含连接酶。在一些情况下,该组合物包含用于核酸分子的扩增反应的酶。在一些情况下,该组合物包含寡核苷酸,该寡核苷酸包含与第一标签或第二标签的一部分互补的区段。在一些情况下,该寡核苷酸包含序列衔接子。在一些情况下,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些情况下,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些情况下,该组合物包含双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。在一些情况下,该组合物包含平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。在一些情况下,该组合物包含平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。在一些情况下,该组合物包含序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。
本文提供了包括使样品与组合物接触的方法,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。在一些情况下,该方法包括向组合物中添加蛋白酶以使转座酶多肽失活。在一些情况下,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。在一些情况下,该方法包括向样品和组合物中添加聚合酶。在一些情况下,聚合酶是DNA聚合酶。在一些情况下,聚合酶是热稳定的聚合酶。在一些情况下,该方法包括添加包含序列衔接子的寡核苷酸以进行扩增反应并产生包含扩增产物的序列文库。在一些情况下,第一标签和第二标签包含不同的核酸序列。在一些情况下,该方法包括使样品与具有转座酶多肽和包含镶嵌端和第二标签的核酸的转座体接触。在一些情况下,该方法包括第一标签和第二标签共享共同的核酸序列。在一些情况下,该方法包括第一标签和第二标签包含不同的核酸序列。在一些情况下,包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。在一些情况下,包含镶嵌端和第二标签的核酸还包含识别反应批次的标签。在一些情况下,识别反应批次的标签包含UMI。在一些情况下,该寡核苷酸包含聚T区段。在一些情况下,该寡核苷酸包含基因特异性区段。在一些情况下,样品包括核糖核酸样品。在一些情况下,样品包括脱氧核糖核酸样品。在一些情况下,接触产生核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。在一些情况下,该组合物包含模板转换寡核苷酸(TSO)。在一些情况下,TSO包含第一标签和镶嵌端。在一些情况下,包含序列衔接子的寡核苷酸包含细胞条形码和唯一分子标识符(UMI)并与珠粒结合。在一些情况下,转座酶多肽是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些情况下,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些情况下,接触产生双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。在一些情况下,该方法产生平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。在一些情况下,该方法产生平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。在一些情况下,该方法产生序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。
本文提供了在单个腔室中产生cDNA文库的方法,该方法包括:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子;和(e)在平端DNA/RNA杂交体分子的末端添加序列衔接子。在一些情况下,该方法包括在步骤(a)期间使用模板转换寡核苷酸(TSO)延伸cDNA的3’端。在一些情况下,该方法包括将互补的切割位点引入样品中的DNA分子中;在切割位点5’端附接5’突出端标签的群体;合成具有5’突出端标签的第二群体的平端DNA分子和与具有5’突出端标签的DNA分子互补的区段;和在平端DNA分子的末端添加序列衔接子。在一些情况下,使用逆转录酶和包含镶嵌端和第二标签的寡核苷酸进行步骤(a)的逆转录。在一些情况下,该寡核苷酸包含聚T区段。在一些情况下,该寡核苷酸包含基因特异性区段。在一些情况下,步骤(b)和(c)通过具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体来进行。在一些情况下,第一标签和第二标签共享共同的核酸序列。在一些情况下,第一标签和第二标签包含不同的核酸序列。在一些情况下,包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。在一些情况下,识别反应批次的标签包含UMI。在一些情况下,步骤(d)包括延伸反应。在一些情况下,步骤(e)包括聚合酶链反应(PCR)。在一些情况下,使用蛋白酶使转座酶多肽失活。在一些情况下,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。在一些情况下,步骤(d)和(e)包括添加聚合酶。在一些情况下,该聚合酶是DNA聚合酶。在一些情况下,该聚合酶是热稳定的聚合酶。在一些情况下,步骤(e)包括添加包含序列衔接子的寡核苷酸以进行扩增反应并产生包含扩增产物的cDNA文库。在一些情况下,该方法产生核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。在一些情况下,TSO包含第一标签和镶嵌端。在一些情况下,该方法产生双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。在一些情况下,该方法包括产生平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。在一些情况下,该方法产生平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。在一些情况下,该方法产生序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。
本文提供了产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在不超过2小时内产生。在一些情况下,cDNA文库是通过使mRNA样品与组合物接触而产生的,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。在一些情况下,cDNA文库是通过以下项而产生的:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;和(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子。在一些情况下,文库在不超过1小时内产生。在一些情况下,文库在不超过45分钟内产生。在一些情况下,该方法进一步包括将序列衔接子添加至平端DNA/RNA杂交体分子的末端。在一些情况下,该方法耗时不超过10小时。在一些情况下,该方法耗时不超过8小时。在一些情况下,该方法耗时不超过6小时。在一些情况下,该方法耗时不超过4小时。在一些情况下,该方法耗时不超过2小时。
本文提供了产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在单个腔室内产生。在一些情况下,cDNA文库是通过使mRNA样品与组合物接触而产生的,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。在一些情况下,cDNA文库是通过以下项而产生的:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子;和(e)在平端DNA/RNA杂交体分子的末端添加序列衔接子。
本文提供了从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括:(a)使mRNA分子与组合物接触,该组合物包含:(i)包含转座酶多肽和第一转座子核酸的第一转座体,(ii)逆转录酶和(iii)包含第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在5’端包含第一转座子序列的突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一转座子序列或第一转座子序列的互补序列。在一些情况下,步骤(a)在单个腔室中进行。在一些情况下,该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些情况下,该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。在一些情况下,第一转座子序列和第二转座子序列是相同的。在一些情况下,第一转座子序列和第二转座子序列不相同。在一些情况下,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些情况下,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些情况下,各个扩增产物还包含序列衔接子。在一些情况下,逆转录酶引物包含聚T区段。在一些情况下,逆转录酶引物包含与目标基因互补的区段。在一些情况下,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些情况下,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。在一些情况下,蛋白酶降解转座酶。
本文提供了从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括(a)使mRNA链与组合物接触,该组合物包含:(i)包含转座酶和第一转座子序列的第一转座体、(ii)包含转座酶和第二转座子序列的第二转座体、(iii)逆转录酶和(iv)包含第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一和第二转座子序列。在一些实施方案中,步骤(a)在单个腔室中进行。在一些实施方案中,该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。在一些实施方案中,第一转座子序列和第二转座子序列是相同的。在一些实施方案中,第一转座子序列和第二转座子序列不相同。在一些实施方案中,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些实施方案中,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些实施方案中,逆转录酶引物包含聚T区段。在一些实施方案中,逆转录酶引物包含与目标基因互补的区段。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,各个扩增产物还包含序列衔接子。在一些实施方案中,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。在一些实施方案中,蛋白酶降解转座酶。
本文提供了组合物,该组合物包含(a)包含RNA链和DNA链的双链多核苷酸;和(b)包含转座酶和转座子序列的转座体,其中多核苷酸与转座体接触以产生标签化的片段,该片段包含在5’端包含转座子序列的突出端。
本文提供了组合物,该组合物包含(a)包含转座酶和第一转座子序列的转座体;(b)逆转录酶;(c)包含第二转座子序列的逆转录酶引物;和(d)在不超过65℃的温度下有活性的蛋白酶。在一些实施方案中,逆转录酶引物包含聚T序列。在一些实施方案中,逆转录酶引物包含与目标基因互补的区段。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些实施方案中,该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。在一些实施方案中,第一转座子序列和第二转座子序列是相同的。在一些实施方案中,第一转座子序列和第二转座子序列不相同。在一些实施方案中,蛋白酶在大于65℃的温度下失活。在一些实施方案中,蛋白酶降解转座酶。
本文提供了由样品产生基因组合(gene panel)的方法,该方法包括(a)使来自样品的双链多核苷酸和mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶和(iii)包含基因特异性序列和第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;以及多个标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子序列的突出端;(b)添加包含基因特异性序列和第二转座子序列的第一引物,和包含该基因特异性序列和该第二转座子序列的互补序列的第二引物,以接触多个标签化的双链DNA片段以产生多个双标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子序列的突出端和在第二5’端包含第二转座子序列的突出端;(c)对多个标签化的mRNA-cDNA片段和多个标签化的双链DNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段以产生扩增产物,其中各个扩增产物包含第一和第二转座子序列,并且其中基因组合包含扩增产物。在一些实施方案中,步骤(a)在单个腔室中进行。在一些实施方案中,基因组合由不超过10小时的单个腔室反应产生。在一些实施方案中,基因组合由不超过8小时的单个腔室反应产生。在一些实施方案中,基因组合由不超过6小时的单个腔室反应产生。在一些实施方案中,基因组合由不超过4小时的单个腔室反应产生。在一些实施方案中,基因组合由不超过2小时的单个腔室反应产生。在一些实施方案中,多核苷酸包含基因组DNA。在一些实施方案中,多核苷酸和mRNA来自单个细胞。在一些实施方案中,多核苷酸和mRNA获自福尔马林固定的石蜡包埋的(FFPE)组织样品。在一些实施方案中,多核苷酸和mRNA获自冷冻的组织样品。在一些实施方案中,该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些实施方案中,该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。在一些实施方案中,第一转座子序列和第二转座子序列是相同的。在一些实施方案中,第一转座子序列和第二转座子序列不相同。在一些实施方案中,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些实施方案中,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些实施方案中,逆转录酶引物包含聚T区段。在一些实施方案中,逆转录酶引物包含与目标基因互补的区段。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,各个扩增产物还包含序列衔接子。
本文提供了产生核酸文库的方法,该方法包括(a)使mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)包含转座酶和第二转座子序列的第二转座体、(iii)逆转录酶、(iv)包含第二转座子序列的逆转录酶引物和(v)包含第一转座子序列的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段,以产生扩增产物,其中各个扩增产物包含第一和第二转座子序列。
本文提供了产生核酸文库的方法,该方法包括(a)使mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶、(iii)包含第一转座子序列的逆转录酶引物和(iv)包含第一转座子序列的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第一转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个第一平端片段;(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物扩增第一多个平端片段,以产生第一扩增产物,其中各个第一扩增产物包含第一转座子序列;(e)使第一扩增产物与包含第二转座体的组合物接触,该第二转座体包含转座酶和第二转座子序列,以产生多个标签化的片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(f)对多个标签化的片段进行延伸反应,以产生多个第二平端片段;和(g)使用包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个第二平端片段,以产生第二扩增产物,其中各个第二扩增产物包含第一和第二转座子序列。在一些实施方案中,步骤(a)在单个腔室中进行。在一些实施方案中,TSO的使用提供了mRNA链的5’端的完全覆盖。在一些实施方案中,基因组合由不超过4小时的单个腔室反应产生。在一些实施方案中,mRNA链来自单个细胞。在一些实施方案中,mRNA链获自福尔马林固定的石蜡包埋的(FFPE)组织样品。在一些实施方案中,mRNA链获自冷冻的组织样品。在一些实施方案中,该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些实施方案中,该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。在一些实施方案中,第一转座子序列和第二转座子序列是相同的。在一些实施方案中,第一转座子序列和第二转座子序列不相同。在一些实施方案中,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些实施方案中,Tn转座酶选自Tn3、Tn5、Tn7和Tn10。在一些实施方案中,转座体包含单体的二聚体,其中各个单体包含与转座子序列复合的转座酶。在一些实施方案中,逆转录酶引物包含聚T区段。在一些实施方案中,逆转录酶引物包含与目标基因互补的区段。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,各个扩增产物还包含序列衔接子。
本文提供了反应混合物,该反应混合物包含(a)来自样品的mRNA链;(b)组合物,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶和(iii)包含第二转座子序列的逆转录酶引物。在一些实施方案中,反应混合物包含双链多核苷酸,该双链多核苷酸包含来自样品的基因组DNA。在一些实施方案中,该组合物还包含(iv)包含基因特异性序列和第二转座子序列的第一引物和(v)包含该基因特异性序列和该第二转座子序列的互补序列的第二引物。在一些实施方案中,该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些实施方案中,第一和第二转座子序列是相同的。在一些实施方案中,第一和第二转座子序列不相同。在一些实施方案中,转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些实施方案中,反应混合物包含选自Tn3、Tn5、Tn7和Tn10的Tn转座酶。在一些实施方案中,逆转录酶引物包含聚T区段。在一些实施方案中,逆转录酶引物包含与目标基因互补的区段。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,该组合物还包含模板转换寡核苷酸(TSO)。在一些实施方案中,TSO包含第一转座子序列和镶嵌端。在一些实施方案中,该组合物还包含蛋白酶,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。
本文提供了试剂盒,该试剂盒包含(a)一组第一转座体,各个第一转座体包含第一转座子序列;(b)一组第二转座体,各个第二转座体包含第二转座子序列;(c)逆转录酶;(d)包含第一转座子序列的逆转录酶引物;和(e)用于实施本文所述方法的说明。
本文提供了试剂盒,该试剂盒包含:(a)一组转座体,该转座体包含(i)包含第一转座子序列的同二聚体转座酶、(ii)包含第二转座子序列的同二聚体转座酶以及任选的(iii)包含第一转座子序列和第二转座子序列的异二聚体转座酶;(b)逆转录酶;(c)包含第一转座子序列的逆转录酶引物;和(d)用于实施本文所述方法的说明。在一些实施方案中,该试剂盒还包含模板转换寡核苷酸(TSO)。在一些实施方案中,TSO包含第一转座子序列和镶嵌端。在一些实施方案中,转录酶引物包含聚T区段。在一些实施方案中,该试剂盒还包含引物,该引物包含基因特异性序列。在一些实施方案中,逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。在一些实施方案中,该试剂盒还包含基因特异性序列的引物互补区段。在一些实施方案中,该试剂盒还包含蛋白酶,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。
援引并入
本说明书中提及的所有出版物、专利和专利申请都通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被明确地并单独地指出通过引用并入。
附图说明
在所附权利要求中具体阐述了本公开内容的新颖特征。通过参考以下对说明性实施方式进行阐述的详细描述以及附图(本文中也称为“图”),将会更好地理解本公开内容的特征和优点,其中:
图1示出了从双端标签化的RNA-DNA杂交体片段产生mRNA分子的cDNA文库的示例方法。
图2示出了从双端标签化的核酸片段产生核酸分子的文库的示例方法。
图3示出了从双端标签化的RNA-DNA杂交体片段产生mRNA分子的cDNA文库的示例方法。
图4示出了从双端标签化的RNA-DNA杂交体片段产生mRNA分子的cDNA文库的示例方法。
图5示出了从双端标签化的RNA-DNA杂交体片段产生mRNA分子的cDNA文库的示例方法。
具体实施方式
转座酶介导的核酸分子的片段化和标签化可用于制备核酸分子。转座酶介导的片段化和标签化(也称为标签化或转座)具有简化样品制备和工作流程的优势,其中目标核酸分子可以在单个反应中片段化和标签化。在包含RNA分子的样品中,该样品可以进行逆转录以产生双链RNA-cDNA杂交体,并进行标签化以产生标签化的双链RNA-cDNA杂交体。逆转录和标签化可以在单个腔室中进行,例如孔、表面上的点、单独的液滴或在乳液中的液滴,或其他隔室。在一些情况下,除了核酸分子与本文所述的组合物的初始接触外,无需用户进一步处理就可进行逆转录和标签化。标签化的核酸分子可以允许核酸文库中核酸分子的全长或几乎全长覆盖。可在测序之前将标签化的核酸分子进一步扩增或针对特定序列进行选择。进一步的处理步骤可以利用由标签化产生的在标签化的核酸分子上的标签来辅助扩增、选择、测序或其他步骤。例如,所产生的核酸分子的序列信息可用于鉴定用于诊断、治疗、司法鉴定和许多其他应用的序列变体。如本文所述的标签化过程可在产生核酸文库方面提供较短的处理时间、较少的处理以及对样品中长核酸分子的接近全长覆盖。
本文描述了用于产生核酸文库的方法、组合物、反应混合物和试剂盒。方法、组合物、反应混合物和试剂盒差异地包含组合物,该组合物具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶以及包含镶嵌端和第二标签的寡核苷酸,其中寡核苷酸可以是逆转录酶引物。在一些情况下,可以使包含mRNA分子的样品与组合物接触以产生核糖核酸-脱氧核糖核酸(RNA-DNA)杂交体分子,然后将该杂交体分子用于产生在5’端具有第一或第二标签的双端标签化的RNA-DNA杂交体。在一些情况下,在产生双端标签化的RNA-DNA杂交体之后,通过蛋白酶使多肽转座酶失活。双端标签化的RNA-DNA杂交体可以具有包含第一标签或第二标签的5’突出端片段。在一些情况下,可以使具有突出端标签的双端标签化的RNA-DNA杂交体进行延伸反应以产生平端双端标签化的DNA-RNA杂交体,该杂交体包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。在一些情况下,可以将包含双链核酸分子的样品与组合物接触以产生在5’端具有第一或第二标签的双端标签化的核酸分子。可以对双端标签化的RNA-DNA杂交体或双端标签化的核酸分子进行扩增和/或选择步骤,以产生用于进一步处理和测序的核酸文库。
本文描述了组合物,其包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。
本文描述了包括使样品与组合物接触的方法,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。
本文还描述了在单个腔室中产生cDNA文库的方法,该方法包括以下至少一项:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;和(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子。
本文进一步描述了产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在不超过2小时内产生。
本文还描述了产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在单个腔室内产生。
本文描述了从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括使mRNA分子与包含以下至少一项的组合物接触:(i)包含转座酶多肽和第一转座子核酸的第一转座体、(ii)逆转录酶和(iii)包含第二转座子核酸的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在5’端包含第一转座子核酸的突出端;使用蛋白酶使转座酶失活;对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和使用包含第一转座子核酸或第一转座子核酸的一部分的第一引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一转座子核酸或第一转座子核酸的互补序列。
本文描述了从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括使mRNA链与组合物接触,该组合物包含:(i)包含转座酶和第一转座子核酸的第一转座体、(ii)包含转座酶和第二转座子核酸的第二转座体、(iii)逆转录酶和(iv)包含第二转座子核酸的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子核酸的第一突出端和在第二5’端包含第二转座子核酸的第二突出端;使用蛋白酶使转座酶失活;对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和使用包含第一转座子核酸或第一转座子核酸的一部分的第一引物和包含第二转座子核酸或第二转座子核酸的一部分的第二引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一和第二转座子核酸。
本文进一步描述了一种组合物,该组合物包含:包含RNA链和DNA链的双链核酸分子;和包含转座酶和转座子核酸的转座体,其中核酸分子与转座体接触以产生标签化的片段,该片段包含在5’端包含转座子核酸的突出端。
本文还描述了一种组合物,该组合物包含:包含转座酶和第一转座子核酸的转座体;逆转录酶;包含第二个转座子核酸的逆转录酶引物;和在不超过65℃的温度下有活性的蛋白酶。
本文描述了由样品产生基因组合的方法,该方法包括使来自样品的双链核酸分子和mRNA链与组合物接触,该组合物包含以下至少一项:(i)包含转座酶和第一转座子核酸的第一转座体、(ii)逆转录酶和(iii)包含基因特异性序列和第二转座子核酸的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子核酸的第一突出端和在第二5’端包含第二转座子核酸的第二突出端;以及多个标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子核酸的突出端;添加包含基因特异性序列和第二转座子核酸的第一引物,和包含该基因特异性序列和该第二转座子核酸的互补序列的第二引物,以接触多个标签化的双链DNA片段以产生多个双标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子核酸的突出端和在第二5’端包含第二转座子核酸的突出端;对多个标签化的mRNA-cDNA片段和多个标签化的双链DNA片段进行延伸反应,以产生多个平端片段;和使用包含第一转座子核酸或第一转座子核酸的一部分的第一引物和包含第二转座子核酸或第二转座子核酸的一部分的第二引物扩增多个平端片段以产生扩增产物,其中各个扩增产物包含第一和第二转座子核酸,并且其中基因组合包含扩增产物。
本文进一步描述了产生核酸文库的方法,该方法包括使mRNA链与组合物接触,该组合物包含以下至少一项:(i)包含转座酶和第一转座子核酸的第一转座体、(ii)包含转座酶和第二转座子核酸的第二转座体、(iii)逆转录酶、(iv)包含第二转座子核酸的逆转录酶引物和(v)包含第一转座子核酸的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子核酸的第一突出端和在第二5’端包含第二转座子核酸的第二突出端;使用蛋白酶使转座酶失活;对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和使用包含第一转座子核酸或第一转座子核酸的一部分的第一引物和包含第二转座子核酸或第二转座子核酸的一部分的第二引物扩增多个平端片段,以产生扩增产物,其中各个扩增产物包含第一和第二转座子核酸。
本文还描述了产生核酸文库的方法,该方法包括以下至少一项:使mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子核酸的第一转座体、(ii)逆转录酶、(iii)包含第一转座子核酸的逆转录酶引物和(iv)包含第一转座子核酸的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子核酸的第一突出端和在第二5’端包含第一转座子核酸的第二突出端;使用蛋白酶使转座酶失活;对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个第一平端片段;使用包含第一转座子核酸或第一转座子核酸的一部分的第一引物扩增第一多个平端片段,以产生第一扩增产物,其中各个第一扩增产物包含第一转座子核酸;使第一扩增产物与包含第二转座体的组合物接触,该第二转座体包含转座酶和第二转座子核酸,以产生多个标签化的片段,该片段包含在第一5’端包含第一转座子核酸的第一突出端和在第二5’端包含第二转座子核酸的第二突出端;对多个标签化的片段进行延伸反应,以产生多个第二平端片段;以及使用包含第二转座子核酸或第二转座子核酸的一部分的第二引物扩增多个第二平端片段,以产生第二扩增产物,其中各个第二扩增产物包含第一和第二转座子核酸。
本文进一步描述了反应混合物,该反应混合物包含来自样品的mRNA链;和组合物,该组合物包含以下至少一项:(i)包含转座酶和第一转座子核酸的第一转座体、(ii)逆转录酶和(iii)包含第二转座子核酸的逆转录酶引物。
本文还描述了一种试剂盒,该试剂盒包含一组第一转座体,各个第一转座体包含第一转座子核酸;一组第二转座体,各个第二转座体包含第二转座子核酸;逆转录酶;包含第一转座子核酸的逆转录酶引物;和用于实施本文所述方法的说明。
本文进一步描述了一种试剂盒,该试剂盒包含:一组转座体,该转座体包括包含第一转座子核酸的同二聚体转座酶、包含第二转座子核酸的同二聚体转座酶以及任选的包含第一转座子核酸和第二转座子核酸的异二聚体转座酶;逆转录酶;包含第一转座子核酸的逆转录酶引物;和用于实施本文所述方法的说明。
样品制备
本公开内容提供了用于产生核酸分子文库的方法、组合物、反应混合物、试剂盒和系统。核酸分子可以是核酸分子样品的一部分。有时核酸分子是分离的核酸分子。通常,核酸分子来自基于细胞的样品。在一些情况下,核酸分子来自单个细胞。在一些情况下,核酸分子来自福尔马林固定的石蜡包埋的(FFPE)样品。在一些情况下,核酸分子来自冷冻的组织样品。核酸分子可包含核糖核酸。核酸分子可包含脱氧核糖核酸。本文所述的方法、组合物、反应混合物、试剂盒和系统可用于由核酸分子制备文库,该核酸分子例如但不限于RNA、mRNA、核酸转录物、无细胞DNA和基因组DNA。
多种核酸分子中的任何一种都可以通过本公开内容的方法表征。在一些实施方案中,表征的核酸分子可以是RNA。在一些实施方案中,表征的核酸分子可以是mRNA。在一些实施方案中,表征的核酸分子可以是基因组核酸分子。在一些情况下,基因组核酸分子可以包含基因组DNA、基因组RNA或基因组DNA和基因组RNA的混合物。在一些情况下,基因组核酸分子可以表现出高完整性,例如高分子量核酸分子。在一些情况下,基因组核酸分子可以进一步结合至蛋白质,例如组蛋白。在一些情况下,基因组核酸分子可以被片段化。在一些情况下,核酸分子可以是甲基化的(例如,部分地或全部地),例如5-甲基胞嘧啶。在一些情况下,核酸分子可以是未甲基化的。在一些情况下,基因组核酸分子包含染色体。染色体可以是真核细胞或原核细胞的任何染色体。在一些实施方案中,表征的核酸分子是无细胞核酸分子。在一些实施方案中,无细胞核酸分子是无细胞DNA(cfDNA)或无细胞RNA(cfRNA)。例如,无细胞核酸分子可以是循环肿瘤DNA、循环肿瘤RNA、循环胎儿DNA或循环胎儿RNA。
核酸分子可以来自完整的细胞或组织。核酸分子可以来自单个细胞。在一些情况下,核酸分子可获自体液,例如血液、唾液、尿液、羊水、血浆、粘液、脑脊髓液、眼泪、滑液、淋巴液、乳糜管(lactal duct)液和精液等。在某些实施方案中,核酸分子是从新鲜组织分离的。在其他情况下,可以从冷冻组织分离核酸分子样品。在又一些其他情况下,可以从固定的组织,例如福尔马林固定的石蜡包埋(FFPE)组织中分离核酸分子样品。核酸分子样品来源的其他示例包括但不限于从组织解离的细胞、血细胞、细菌、病毒、线粒体、叶绿体、体外组装的蛋白质DNA复合物和嗜中性粒细胞胞外捕获物。在一些情况下,核酸分子可获自细胞培养物,例如细胞系。可以将核酸分子片段化以产生适用于下游测定的片段。
无细胞核酸分子包括源自细胞但不是直接获自细胞来源(例如组织样品)的核酸分子。可以从中产生无细胞核酸分子的来源的非限制性示例是正常细胞和组织、异常细胞和组织(例如,患病细胞或组织,例如癌细胞或组织)、胎儿细胞和组织以及病原体。存在于非细胞来源中的无细胞核酸分子可以由细胞死亡(例如,凋亡或坏死)或细胞脱落产生。无细胞核酸分子的序列分析可用于表征衍生出无细胞核酸分子的细胞或细胞群,例如肿瘤细胞(例如,在癌症检测中)、胎儿细胞(例如,在产前诊断中)、来自移植组织的细胞(例如,在移植失败的早期检测中)或病原体(例如细菌或病毒)。
许多核酸分子与本公开内容的各种实施方案相容。核酸分子可获自受试者,例如任何动物或活生物体。受试者的非限制性示例是哺乳动物,例如人、非人灵长类动物、啮齿动物例如小鼠和大鼠、狗、猫、猪、羊、兔等。在一些实施方案中,受试者是健康的,并且从受试者获得的核酸分子可以不包含与疾病或病症相关的序列变体。在一些实施方案中,受试者疑似患有疾病或病症,并且从该受试者获得的核酸分子可以包含与该疾病或病症相关的序列变体。在一些实施方案中,受试者是怀孕的,并且从受试者获得的核酸分子包含胎儿核酸分子。
靶核酸分子差异地包含RNA例如mRNA或病毒基因组RNA,或DNA例如基因组DNA。在一些实施方案中,核酸分子或靶核酸分子源自RNA,例如mRNA、基因组DNA或另一种核酸来源。可以使用各种方法和市售试剂盒(例如Qiagen RNeasy Mini试剂盒或Qiagen DNeasy组织试剂盒)从细胞或组织样品中获得RNA(例如mRNA)或基因组DNA。可以使用先前在本文其他地方描述的任何提取、分离和纯化方法从样品中获得RNA、mRNA或基因组DNA并进行纯化。提取技术的其他非限制性示例包括:(1)有机提取然后乙醇沉淀,例如使用苯酚/氯仿有机试剂(Ausubel等人,1993),使用或不使用自动核酸提取器(例如,可从Applied Biosystems(Foster City,Calif)获得的341型DNA提取器);(2)固定相吸附法(美国专利号5,234,809;Walsh等人,1991);和(3)盐诱导的核酸沉淀方法(Miller等人,(1988),这种沉淀方法通常被称为“盐析”方法)。核酸分离和/或纯化的另一个示例包括使用可以与核酸特异性或非特异性结合的磁性颗粒,然后使用磁铁分离珠粒,并从珠粒洗涤和洗脱核酸(例如,参见美国专利号5,705,628)。例如,可以使用固相可逆固定化(SPRI)珠粒(Agencourt AMPure XP)分离和纯化核酸。在一些实施方案中,在上述分离方法之前可以进行酶消化步骤,以帮助从样品中消除不需要的蛋白质,例如,用蛋白酶K或其他类似的蛋白酶消化。如果需要,可以将核糖核酸酶抑制剂添加到裂解缓冲液中。对于某些细胞或样品类型,可能需要向方案中添加蛋白质变性/消化步骤。纯化方法可以针对分离DNA、RNA或两者。当在提取过程期间或提取过程之后一起分离DNA和RNA两者时,可以采用其他步骤将其中之一或两者分别从另一者中纯化。也可以产生提取的核酸的亚级分,例如,通过大小、序列或其他物理或化学特征进行纯化。除了初始的核酸分离步骤外,还可以在公开方法的任何步骤之后进行核酸纯化,例如以去除过量或不需要的试剂、反应物或产物。可以使用多种方法来确定样品中核酸的量和/或纯度,例如通过吸光度(例如260nm、280nm的光的吸光度及其比率)和检测标记(例如荧光染料和嵌入剂,如SYBR绿、SYBR蓝、DAPI、碘化丙啶、Hoechst染色、SYBR金、溴化乙锭)。
在一些实施方案中,核酸分子或靶核酸分子包含片段化的RNA、片段化的mRNA、片段化的无细胞DNA或片段化的基因组DNA。在一些情况下,由于诸如福尔马林固定、石蜡包埋或冷冻等先前的样品处理步骤而发生片段化。在一些情况下,将核酸分子片段化以产生较短的片段。
在一些实施方案中,基因组DNA被片段化成较短长度的核酸分子。在一些实施方案中,基因组DNA片段的长度近似均匀。在一些实施方案中,基因组DNA片段的长度不是近似均匀的。在一些实施方案中,基因组DNA片段的平均长度为约50个核苷酸至约100个核苷酸。在一些实施方案中,基因组DNA片段的平均长度为约50个核苷酸至250个核苷酸。在一些实施方案中,基因组DNA片段的平均长度为约50个核苷酸至500个核苷酸。在一些实施方案中,基因组DNA片段的平均长度为约50个核苷酸至750个核苷酸。在一些实施方案中,基因组DNA片段的平均长度为约100个核苷酸至1000个核苷酸。
逆转录
本文描述了方法、组合物、反应混合物、试剂盒和系统,其包括使用用于RNA分子逆转录的逆转录酶来产生RNA模板的互补DNA(cDNA),这通常作为核酸序列测定的一部分。通常,逆转录酶具有RNA指引的DNA聚合酶活性和DNA指引的DNA聚合酶活性两者。RNA分子通常是mRNA分子、rRNA分子、非编码RNA分子、病毒基因组RNA分子或其他RNA分子。在逆转录中,逆转录酶引物与RNA模板退火,以通过逆转录酶从引物的3’OH开始DNA合成。在一些情况下,逆转录酶可允许形成匹配的DNA/RNA杂交体。逆转录的cDNA产物通常用于后续的cDNA分析,例如cDNA测序、实时聚合酶链反应(PCR)和碱性琼脂糖凝胶电泳等。
许多逆转录酶与本文的公开内容相容,用于产生本文公开的cDNA文库。相容的酶包括病毒逆转录酶。在一些情况下,逆转录酶源自病毒、禽病毒、人病毒、鼠病毒、逆转录病毒、慢病毒或γ逆转录病毒(gammateretrovirus)。在一些情况下,病毒逆转录酶源自莫洛尼鼠白血病病毒(M-MLV)逆转录酶、劳氏肉瘤病毒(RSV)逆转录酶、禽类成髓细胞性白血病病毒(AMV)逆转录酶、成髓细胞过多症相关病毒(MAV)逆转录酶、劳氏相关病毒(RAV)逆转录酶或人类免疫缺陷病毒1(HIV-1)逆转录酶。在一些情况下,逆转录酶的聚合酶是DNA聚合酶。在一些情况下,逆转录酶的聚合酶是RNA依赖性DNA聚合酶。在一些实施方案中,逆转录酶的聚合酶是DNA依赖性DNA聚合酶。在一些情况下,病毒逆转录酶是莫洛尼鼠白血病病毒(M-MLV)逆转录酶。在一些实施方案中,病毒逆转录酶是HIV-1逆转录酶。在一些情况下,逆转录酶是非天然逆转录酶。
许多另外的逆转录酶与本文的公开内容一致。通常,逆转录酶以其任何组合的方式包含至少一个源自逆转录病毒(例如,M-MLV、MLV、AMV)的结构域或序列和至少一个源自细菌(例如,嗜极端生物细菌、栖热菌属(Thermus)细菌、嗜热栖热菌(T.thermophilus)、嗜热栖热菌HB8)的结构域或序列。例如,逆转录酶可包含M-MLV结构域(例如,M-MLV DNA聚合酶结构域)和嗜极端生物结构域(例如,来自嗜极端生物细菌的核糖核酸酶);或者,逆转录酶可包含MLV结构域(例如,MLV DNA聚合酶结构域)和栖热菌属细菌结构域(例如,来自嗜热栖热菌的核糖核酸酶)。通常,本文提供的逆转录酶以任何组合的方式包含至少一个源自逆转录病毒(例如,M-MLV、MLV、AMV)的结构域或序列和至少一个源自古菌(例如,嗜极端生物古菌、T.litoralis)的结构域或序列。一般地,DNA聚合酶结构域(或多个结构域)源自病毒。一般地,核糖核酸酶结构域(或多个结构域)源自细菌或古菌生物体。
本文公开的单个逆转录和标签化反应使用逆转录酶引物(RT引物)通过逆转录酶将cDNA合成至RNA模板。RT引物是核酸分子,典型地是寡核苷酸。对于mRNA分子的逆转录,RT引物与mRNA分子3’端的聚A尾杂交,逆转录酶合成从RT引物的3’OH延伸的与mRNA模板互补的cDNA分子。RT引物可以不限于特定序列,只要该引物的核苷酸序列与模板RNA的核苷酸序列互补(例如,部分或全部互补)并且可以在期望的反应条件下与模板RNA退火即可。RT引物通常包含可与mRNA分子3’端的聚A尾杂交的聚T区段。在一些情况下,RT引物是具有与目标基因互补的区段的基因特异性引物。在一些情况下,RT引物是具有随机序列的寡核苷酸(例如,随机引物)。有时RT引物包含第一标签(N1)或第二标签(N2)中的至少一个。在一些情况下,RT引物还包含与第一或第二标签连接的镶嵌端(ME)。在一些情况下,RT引物是N1ME-T20VN。
在本文所述的各种实施方案中,逆转录酶是SuperScript IV逆转录酶。在一些实施方案中,使用SuperScript IV的一些示例性逆转录反应在50℃下进行30分钟,尽管温育温度、温育时间或温育时间和温度两者的变化也在考虑内。
本文提供的公开内容可任选地使用模板转换寡核苷酸(TSO)以在所得cDNA文库中提供mRNA分子的完全覆盖。TSO与通常包含聚脱氧胞苷区段的cDNA的3’端杂交。在一些情况下,TSO连接至mRNA分子的5’端。在一些情况下,TSO包含聚胍核糖核苷酸区段。在一些情况下,TSO还在5’端包含镶嵌端和第一标签(N1)。在一些情况下,TSO在5’端包含镶嵌端和第二标签(N2)。在逆转录和标签化反应中添加TSO允许mRNA分子的全长捕获。具有TSO的mRNA-cDNA杂交体分子在同一反应腔室内通过转座体进行标签化反应。
在本文公开的各种实施方案中,不具有TSO的逆转录和标签化反应在由本文的公开内容产生的cDNA文库中提供了mRNA分子的几乎全长覆盖。在一些情况下,几乎全长覆盖是指模板分子全长的至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%。在一些情况下,几乎全长覆盖是指模板分子全长的约75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些情况下,使用TSO的逆转录和标签化反应提供mRNA分子的全长覆盖或模板分子全长的约100%覆盖。
转座体
本文描述了使用转座体(transposome),也称为转座体(transpososome),对来自样品的核酸分子标签化以由标签化的核酸分子产生核酸文库的方法、组合物、反应混合物、试剂盒和系统。在标签化或转座过程中,通过使双链核酸分子与转座体接触而形成在5’端包含第一转座子核酸的突出端片段。通常,转座体是具有或结合至转座子核酸的转座酶的复合物。转座子核酸包含转座子元件,该元件也可以称为转座酶元件。转座酶是指能够与至少一个转座子核酸复合并催化该转座子核酸插入或转座至核酸分子中以产生修饰的或“标签化的”核酸分子的多肽。一般地,转座酶可以通过剪切和粘贴机制或复制性转座机制催化转座子核酸插入或转座至核酸分子。在一些情况下,转座体是单体的二聚体,各个单体包含转座酶和转座子核酸。转座体二聚体可以是同二聚体或异二聚体。在一些情况下,同二聚体的转座子核酸是相同的转座子核酸。在一些情况下,异二聚体的转座子核酸是不同的转座子核酸。有时可通过添加一种或多种阳离子来促进和/或触发转座反应。在一些情况下,阳离子是二价阳离子,例如Ca2+、Mg2+和Mn2+。
本文所述的转座酶是指可以催化转座子核酸插入至核酸分子中以产生标签化的核酸分子的酶。转座酶可以是任何天然存在的转座酶或经工程化的(例如突变的或突变体转座酶)。转座酶是指能够与至少一个转座子核酸复合并催化该转座子核酸插入或转座至靶核酸分子中的酶。转座酶可以是原核或真核来源的。示例性转座酶包括但不限于整合酶、HERMES和HIV整合酶。可用于本文实施方案中的转座酶的非限制性示例包括Tn转座酶(例如Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuA转座酶、Vibhar转座酶(例如来自哈氏弧菌(Vibrioharveyi))、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、F元件、hobo、Hsmarl、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、P元件、Tam3、Tc1、Tc3、Tel、THE-1、Tn/O、TnA、Tol1、Tol2、TnlO、Tyl、任何原核转座酶或与本文公开的那些转座酶相关和/或衍生自本文公开的那些转座酶的任何转座酶。在一些实施方案中,主题方法使用Tn转座酶、MuA转座酶或Vibhar转座酶。在一些情况下,主题方法中使用的转座酶是Tn转座酶,例如选自Tn3、Tn5、Tn7和Tn10的转座酶。在一些情况下,转座酶是Tn5。
在一些情况下,转座酶是工程化转座酶。相对于其衍生自的亲本转座酶,工程化转座酶可以具有不同的特性。在一些情况下,转座酶是高活性的转座酶。在一些情况下,工程化转座酶能够结合包含修饰的核苷酸或核苷酸类似物的核酸分子。例如,本公开内容的转座酶可以是以无偏的方式结合任何核酸分子序列的工程化转座酶。在一些情况下,本公开内容的转座酶是工程化转座酶或突变体转座酶,其包含与亲本转座酶的相应肽片段具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的氨基酸序列同一性的肽片段。肽片段的长度可以是至少约10、约15、约20、约25、约30、约35、约40、约45、约50、约60、约70、约80、约90、约100、约150、约200、约250、约300、约400或约500个氨基酸。与亲本转座酶相比,本公开内容的工程化转座酶或突变体转座酶可具有增加的转座活性。在一些情况下,工程化转座酶或突变体转座酶具有比亲本转座酶高至少约5%、10%、15%、20%、25%、30%、35%、40%、45%或50%的活性。与亲本转座酶相比,本公开内容的工程化转座酶或突变体转座酶可具有降低的转座活性。在一些情况下,工程化转座酶或突变体转座酶具有比亲本转座酶低至少约5%、10%、15%、20%、25%、30%、35%、40%、45%或50%的活性。
在本文各方面的各种实施方案中,转座子核酸可以是DNA、RNA或逆转录RNA(例如,cDNA)。转座子核酸的转座子元件可以被转座酶识别,并且可以被称为识别序列。识别序列可以包括整个转座子核酸或其任何部分。在一些情况下,转座子核酸的两端或单端可被转座酶识别。例如,Tn5转座酶可以识别转座子核酸任何一端的19bp序列。
转座子在本文中也称为标签、转座子核酸、转座子序列或转座子区段,是可以通过转座酶插入至另一个核酸分子中的核酸分子。在一些情况下,转座子是单链核酸或双链核酸中的至少一种。转座子可以是双链核酸分子,例如完全双链的或部分双链的,例如具有单链突出端、具有空泡、具有环等。转座子通常包括转座子元件或转座酶元件。转座子元件或转座酶元件可以是指包括与转座酶或整合酶形成转座体的核苷酸序列的核酸分子或其一部分。在一些情况下,转座子元件能够在转座反应中与转座酶形成功能复合物(例如,转座体)。转座子元件的非限制性示例包括19-bp外端(“OE”)转座子末端、内端(“IE”)转座子末端或“镶嵌末端”(“ME”)转座子末端(例如,由野生型或突变体Tn5转座酶识别),或由MuA转座酶识别的R1和R2转座子末端。在一些情况下,本文实施方案中使用的转座子的转座子元件或转座酶元件是ME转座子末端。转座子元件可包含适合与转座酶或整合酶形成功能复合物的核酸或核酸类似物。例如,转座子元件可包含DNA、RNA、修饰的碱基、非天然碱基、修饰的主链,或可在一条或两条链中包含缺口。
在一些情况下,转座子核酸可以以序列依赖性的方式连接至核酸分子。例如,转座子Passport、Himar1、Hsmar1、Frog Prince和Sleeping Beauty可以优先连接至富含“TA”的核酸分子序列。类似地,转座子PiggyBac和PiggyBat可以优先连接至富含“TTAA”的核酸分子序列。在一些情况下,转座子核酸可以以序列独立性的方式或基本上以序列独立性的方式连接至核酸分子序列。例如,转座子Tol2和TcBuster可以连接至任何8bp长的核酸分子序列。转座子可以是基本上甲基化的、部分甲基化的、半甲基化的或基本上未甲基化的。
在一方面,本公开内容提供一种组合物,该组合物包括包含第一转座子核酸(N1)的转座酶和包含第二转座子核酸(N2)的转座酶的混合物。在一些情况下,该组合物中N1和N2转座子核酸的相对比例为约1:19、2:18、3:17、4:16、5:15、6:14、7:13、8:12、9:11、10:10、11:9、12:8、13:7、14:6、15:5、16:4、13:7、12:8或19:1。在一些情况下,该组合物中N1和N2转座子核酸的相对比例为约1:9、2:8、3:7、4:6、5:5、6:4、7:3、8:2或9:1。在一些情况下,该组合物中N1和N2转座子核酸的相对比例为至少约1:19、2:18、3:17、4:16、5:15、6:14、7:13、8:12、9:11、10:10、11:9、12:8、13:7、14:6、15:5、16:4、13:7、12:8或19:1。在一些情况下,该组合物中N1和N2转座子核酸的相对比例为至少约1:9、2:8、3:7、4:6、5:5、6:4、7:3、8:2或9:1。在一些实施方案中,N1的摩尔浓度小于N2的摩尔浓度。在一些实施方案中,N2的摩尔浓度小于N1的摩尔浓度。
在本文公开的各种实施方案中,由样品中的核酸分子产生的双链核酸分子在与包含转座体的组合物接触后经历转座或标签化。在转座或标签化过程中,双链转座子核酸的一条链通常与双链核酸分子的一条链共价连接(例如,转座子核酸的“转移链”)。在一些情况下,转移链与双链核酸分子的一条链的5’端共价连接。转座子核酸的另一条链可以称为“非转移链”。非转移链可以不与双链核酸分子的一条链连接。在用于标签化的靶核酸分子是双链核酸分子的情况下,可以由第一转座酶通过标签化将双链核酸分子的上链与转座子核酸接合,同时可以由另一转座酶通过标签化将同一双链核酸分子的下链在其5’端与另一转座子核酸接合。双链核酸分子的上链在其5’端与转座子核酸的接合以及双链核酸分子的下链在其相应5’端与转座体序列的接合可以产生突出端片段。
本文所述的转座或标签化步骤使用转座体。在一些情况下,转座体将双链核酸分子断裂成片段,同时将转座子核酸共价转移至核酸分子片段的第一链。在一些情况下,转座酶通过剪切和粘贴机制催化转座子核酸插入或转座至靶核酸分子,并且靶核酸分子被片段化为较短的核酸分子(例如,片段)。在一些情况下,转座反应可包括在用转座子核酸标签化核酸分子之前的片段化。在一些情况下,片段化和标签化可以同时发生或基本同时发生。在一些情况下,转座酶切割核酸分子以产生会生成突出端的交错切口。突出端的长度可以是1个碱基对(bp)、2bp、3bp、4bp、5bp、6bp、7bp、8bp、9bp、10bp或更长。例如,Tn5可以切割核酸分子,以在双链序列的5’端产生9bp的突出端。在一些情况下,转座酶切割核酸分子以产生平端切口。
在本文公开的各种实施方案中,转座子核酸通过转座酶的插入可以是在双链核酸分子中的随机或基本上随机的位点。在一些情况下,在标签化之后,转座子核酸的转移链可以保持与非转移链杂交。在一些实施方案中,在非转移链和双链靶核酸分子的一条链之间形成间隙。在一些实施方案中,间隙由聚合酶和/或连接酶填充。在一些实施方案中,转座子核酸的非转移链不保持与转移链的杂交。在一些实施方案中,转座子核酸的非转移链例如由于热变性而从转移链解离。在一些实施方案中,转座子核酸的非转移链例如通过链置换聚合酶的作用从转移链置换。在一些实施方案中,在延伸反应之前将非转移链与转移链分离。在一些实施方案中,聚合酶和/或连接酶不填补该间隙。
本文所述的双链核酸分子可以是多种长度中的任何一种。在一些情况下,双链核酸分子的长度为至少约1千碱基(kb)、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1兆碱基(Mb)、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb、10Mb、20Mb、30Mb、40Mb、50Mb、60Mb、70Mb、80Mb、90Mb、100Mb、200Mb、300Mb、400Mb、500Mb、600Mb、700Mb、800Mb或900Mb。在一些情况下,双链核酸分子的长度为约1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb、10Mb、20Mb、30Mb、40Mb、50Mb、60Mb、70Mb、80Mb、90Mb、100Mb、200Mb、300Mb、400Mb、500Mb、600Mb、700Mb、800Mb或900Mb。在一些情况下,双链核酸分子的长度为至多约900Mb、800Mb、700Mb、600Mb、500Mb、400Mb、300Mb、200Mb、100Mb、90Mb、80Mb、70Mb、60Mb、50Mb、40Mb、30Mb、20Mb、10Mb、9Mb、8Mb、7Mb、6Mb、5Mb、4Mb、3Mb、2Mb、1Mb、900kb、800kb、700kb、600kb、500kb、400kb、300kb、200kb、100kb、90kb、80kb、70kb、60kb、50kb、40kb、30kb、20kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb或1kb。
本文所述的所得突出端片段的大小可以是多种长度中的任何一种。在一些情况下,所得突出端片段的大小可能取决于起始核酸分子的长度。在一些情况下,突出端片段的大小可能取决于标签化过程中转座酶的浓度。在一些情况下,突出端片段包含长度为至少50个碱基、75个碱基、100个碱基、125个碱基、150个碱基、175个碱基、200个碱基、225个碱基、250个碱基、275个碱基、300个碱基、325个碱基、350个碱基、375个碱基、400个碱基、425个碱基、450个碱基、475个碱基、500个碱基、525个碱基、550个碱基、575个碱基、600个碱基、625个碱基、650个碱基、675个碱基、700个碱基、725个碱基、750个碱基、775个碱基、800个碱基、825个碱基、850个碱基、875个碱基、900个碱基、925个碱基、950个碱基、975个碱基、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb或100kb的片段。在一些情况下,突出端片段包含长度为约50个碱基、75个碱基、100个碱基、125个碱基、150个碱基、175个碱基、200个碱基、225个碱基、250个碱基、275个碱基、300个碱基、325个碱基、350个碱基、375个碱基、400个碱基、425个碱基、450个碱基、475个碱基、500个碱基、525个碱基、550个碱基、575个碱基、600个碱基、625个碱基、650个碱基、675个碱基、700个碱基、725个碱基、750个碱基、775个碱基、800个碱基、825个碱基、850个碱基、875个碱基、900个碱基、925个碱基、950个碱基、975个碱基、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb或100kb的片段。在一些情况下,突出端片段包含长度为至多约100kb、90kb、80kb、70kb、60kb、50kb、40kb、30kb、20kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb、975个碱基、950个碱基、925个碱基、900个碱基、875个碱基、850个碱基、825个碱基、800个碱基、775个碱基、750个碱基、725个碱基、700个碱基、675个碱基、650个碱基、625个碱基、600个碱基、575个碱基、550个碱基、525个碱基、500个碱基、475个碱基、450个碱基、425个碱基、400个碱基、375个碱基、350个碱基、325个碱基、300个碱基、275个碱基、250个碱基、225个碱基、200个碱基、175个碱基、150个碱基、125个碱基、100个碱基、75个碱基或50个碱基的片段。
本文所述的方法、组合物、反应混合物、试剂盒和系统使用转座子核酸来产生包含转座子核酸的标签或其一部分的双端标签化的核酸分子。在一些情况下,转座子核酸除转座子元件外还包括其他核酸分子。在一些情况下,附加核酸分子通过转座反应插入靶核酸分子中。附加核酸分子可以包括引物结合位点,例如测序引物位点和/或扩增引物位点。附加核酸分子还可以包括切割位点、锚定位点、报道分子标签、条形码、细胞条形码、唯一分子标识符(UMI)或镶嵌端区段。引物结合位点可包括用于测序引物与测序反应或其他延伸反应中的核酸进行退火的序列。这样的附加核酸分子也可用于下游核酸分子操作步骤。
在本公开内容的各种实施方案中,在进行转座后的下一步反应之前,可以失活或去除转座酶。转座酶的失活或去除可用于最小化对下游反应的抑制,例如使用标签化片段作为模板的延伸反应或扩增反应。有时,通过蛋白酶使转座酶失活。在一些情况下,用于失活的蛋白酶是热不稳定的。在一些情况下,蛋白酶在不超过65℃的温度下有活性。在一些情况下,蛋白酶在大于65℃的温度下无活性。在一些情况下,该蛋白酶在不超过40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃的温度下有活性。在一些情况下,该蛋白酶在不低于40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃的温度下无活性。在一些情况下,蛋白酶与转座体一起提供并且通过温度和/或缓冲液条件的改变而激活。在一些情况下,在转座体接触核酸分子之后添加蛋白酶。在一些情况下,在转座之后添加蛋白酶。替代地或组合地,通过多种合适的方法中的任何一种去除转座酶,包括纯化或失活,例如通过变性或酶处理。有时,采用化学处理去除转座酶。在一些情况下,化学处理包括用去污剂溶液,例如SDS溶液处理标签化的片段。在一些情况下,未对标签化的片段进行处理以去除转座酶。
延伸反应
在本文公开的各种实施方案中,双端标签化的核酸分子可具有包含标签或转座子核酸的5’突出端片段。可对突出端片段进行延伸反应以产生第一多个平端片段。延伸反应可用于填充突出端以产生平端。在延伸反应中,突出端片段的一条链可以用作引物,而另一条链可以用作模板。延伸反应可涉及使用聚合酶。聚合酶可以是能够置换非转移链的链置换聚合酶。
在一些情况下,突出端片段在上链的5’端具有第一转座子核酸,并在下链的5’端具有第一转座子核酸。在延伸以填充突出端后,各个上链和下链可在5’端包含第一转座子核酸,并在3’端包含第一转座子核酸的反向互补序列。由于序列互补性,各个上链或下链的5’端可以与其自身的3’端碱基配对,从而形成茎环或发夹结构。
在一些情况下,突出端片段在上链的5’端具有第一转座子核酸,并在下链的5’端具有第二转座子核酸。在延伸以填充突出端后,各个上链和下链可在5’端包含第一转座子核酸,并在3’端包含第二转座子核酸的反向互补序列,或者在5’端包含第二转座子核酸,并在3’端包含第一转座子核酸的反向互补序列。
可以进行引物指引的延伸反应或扩增,以产生本文所述的平端双标签化的核酸分子或平端片段的拷贝。可以用包含第一转座子核酸或其一部分的引物进行引物延伸。替代地或组合地,可以用包含第二转座子核酸或其一部分的引物进行引物延伸。引物可以在5’端有一区段,且在3’端有一区段。在一些情况下,引物可以具有插在5’端和3’端之间或在5’端和/或3’端侧面的附加区段。3’端的区段可表现出与平端片段的序列互补性。5’端的区段也可表现出与平端片段的序列互补性。3’端的区段可表现出与第一或第二转座子核酸或其片段的序列互补性。5’端的区段也可表现出与第一或第二转座子核酸或其片段的序列互补性。3’端的区段可以不表现出与第一或第二转座子核酸的序列互补性,而是表现出与核酸分子序列的序列互补性。5’端的区段也可以不表现出与第一或第二转座子核酸的序列互补性,而是表现出与核酸分子序列的序列互补性。引物的核酸分子的序列可以是目标基因的区段或其互补区段。5’端的区段可以不表现出与平端片段的任何部分的序列互补性,并且可以包含在生成拷贝时附加到平端片段的序列上的附加序列。
在本文所述的各种实施方案中,引物包含第一转座子核酸或其一部分。使用包含第一转座子核酸或其一部分的引物可允许产生包含第一转座子核酸的任何平端片段的拷贝。在一些情况下,引物包含第二转座子核酸或其一部分。使用包含第二转座子核酸或其一部分的引物可允许产生包含第二转座子核酸的任何平端片段的拷贝。在一些情况下,产生每个平端片段的拷贝。在一些情况下,产生大部分平端片段的拷贝。在一些情况下,产生大多数平端片段的拷贝。在一些实施方案中,在引物指引的延伸期间产生了至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%的平端片段的拷贝。在一些情况下,此过程可以称为单引物扩增。在一些情况下,无论转座子核酸之间的核酸分子序列如何,都产生平端片段的拷贝。在一些情况下,使用包含第一转座子核酸的引物可以允许平端片段的无偏扩增。在一些情况下,使用包含第二转座子核酸的引物可以允许平端片段的无偏扩增。
在本文所述的各种实施方案中,引物在3’端的区段包含基因特异性序列。例如,在需要用于下游分析的包含特定基因序列的引物延伸产物的情况下,引物可以在3’端包含能够充当基因特异性引物(例如,具有基因特异性序列)的区段。引物的基因特异性序列可与基因特异性的标签化片段杂交并启动引物延伸。延伸反应可以从多个平端片段中选择并在一些情况下富集靶序列。在一些情况下,可以组合使用具有对应于多个基因的基因特异性序列的引物,以选择并在一些情况下富集多个基因特异性平端片段。例如,为了产生对应于两个基因序列(例如,基因1和基因2)的标签化片段的延伸产物,一半的引物可以具有序列对基因1具有特异性的3’区段,一半的引物可以具有序列对基因2具有特异性的3’区段。还例如,为了生成对应于三个基因序列(例如,基因1、基因2和基因3)的标签化片段的延伸产物,三分之一的引物可以具有带有对基因1具有特异性的序列的3’区段,三分之一的引物可以具有带有对基因2具有特异性的序列的3’区段,并且三分之一的引物可以具有带有对基因3具有特异性的序列的3’区段。可以根据需要优化和/或调节混合物中引物的比例。
在一些情况下,基因特异性序列包含靶向癌症特异性基因的序列或与癌症有关的序列。在一些情况下,使用多个引物,每个引物对一个靶基因具有特异性。在一些情况下,主题方法的引物包含基因特异性引物的混合物,并且该混合物例如用于多重加工。在一些情况下,基因特异性引物的混合物靶向至少5个基因(例如,至少10个基因、15个基因、20个基因、25个基因、50个基因、100个基因、200个基因、300个基因、400个基因、500个基因、600个基因、700个基因、800个基因、900个基因或1,000个基因)。
在本文所述的各种实施方案中,延伸引物在5’端的区段可以缺乏与标签化片段的序列互补性。在一些情况下,延伸引物的5’端包含可用于下游样品处理步骤的序列。例如,延伸引物在5’端的区段包含一个或多个扩增引物退火序列或其互补序列;一个或多个测序引物退火序列或其互补序列;一个或多个条形码序列;在多个不同引物之间共有的一个或多个共同序列;一个或多个限制酶识别位点;一个或多个探针结合位点或测序衔接子(例如,用于附接至测序平台,例如用于大规模平行测序的流动池);一个或多个随机或接近随机的序列(例如,从一个或多个位置处的一组两个或多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个表现在包含随机序列的引物池中);及其组合。引物通常包含序列衔接子。在一些情况下,序列衔接子包括测序引物结合序列(例如,读取1或读取2)、唯一分子标识符或条形码序列(例如,i5、i7)和/或流动池结合序列(例如,P5、P7)中的至少一个。在一些情况下,将衔接子附接或附加至引物的5’和/或3’端,例如通过连接、扩增或其组合。
可将第一多个平端片段或其片段与第二组转座体复合物接触,以产生可在5’端包含第二转座子核酸的第二多个突出端片段。第二组的各个转座体复合物可包含第二转座子核酸。在一些实施方案中,第二组转座体复合物是同二聚体转座体复合物的混合物,并且还包含具有第一转座子核酸的转座体复合物。在一些实施方案中,根据需要,该混合物还包含具有第三转座子核酸、第四转座子核酸、第五转座子核酸等的转座体复合物。在一些实施方案中,第二组转座体复合物包含异二聚体转座体复合物,各个转座体复合物包含第一转座子核酸和第二转座子核酸。通过使用具有不同转座子核酸的同二聚体转座体复合物或具有至少两种转座子核酸的异二聚体转座体复合物的混合物,所得的第二多个突出端片段中的各个突出端片段可以在5’端具有第一转座子核酸、第二转座子核酸、第三转座子核酸或第四转座子核酸等。第二多个突出端片段可包含具有不同转座子末端的多个片段。在一些实施方案中,第二组转座体复合物包含具有与第一转座子核酸不同的转座子核酸的同二聚体转座体复合物。
突出端片段的大小可以是多种长度中的任何一种。在一些情况下,突出端片段的大小可能取决于平端片段的长度。在一些情况下,突出端片段的大小可能取决于标签化过程中转座酶的浓度。在一些情况下,突出端片段包含长度为至少10个碱基、20个碱基、30个碱基、40个碱基、50个碱基、75个碱基、100个碱基、125个碱基、150个碱基、175个碱基、200个碱基、225个碱基、250个碱基、275个碱基、300个碱基、325个碱基、350个碱基、375个碱基、400个碱基、425个碱基、450个碱基、475个碱基、500个碱基、525个碱基、550个碱基、575个碱基、600个碱基、625个碱基、650个碱基、675个碱基、700个碱基、725个碱基、750个碱基、775个碱基、800个碱基、825个碱基、850个碱基、875个碱基、900个碱基、925个碱基、950个碱基、975个碱基或1kb的片段。在一些情况下,突出端片段包含长度为至多1kb、975个碱基、950个碱基、925个碱基、900个碱基、875个碱基、850个碱基、825个碱基、800个碱基、775个碱基、750个碱基、725个碱基、700个碱基、675个碱基、650个碱基、625个碱基、600个碱基、575个碱基、550个碱基、525个碱基、500个碱基、475个碱基、450个碱基、425个碱基、400个碱基、375个碱基、350个碱基、325个碱基、300个碱基、275个碱基、250个碱基、225个碱基、200个碱基、175个碱基、150个碱基、125个碱基、100个碱基、75个碱基、50个碱基、40个碱基、30个碱基、20个碱基或10个碱基的片段。
可以使突出端片段进行另外的延伸反应以产生第二多个平端片段。另外的延伸反应可用于填充突出端以产生平端。在另外的延伸反应中,突出端片段的一条链可以充当引物,而另一条链充当模板。延伸反应可涉及使用聚合酶。聚合酶可以是能够置换非转移链的链置换聚合酶。
可以对第二平端片段或其衍生物进行测序以产生序列读取,从而表征样品中的双链核酸分子。在一些情况下,对第二平端片段进行进一步的核酸加工,以准备进行测序分析。在一些情况下,将测序引物结合序列(例如,读取1或读取2)、唯一分子标识符或条形码序列(例如,i5、i7)和/或流动池结合序列(例如,P5、P7)附接或附加至片段的5’端和/或3’端,例如通过连接、扩增或其组合。
本公开内容的一些实施方案包括引物延伸和扩增反应,例如产生延伸产物和扩增延伸产物。引物延伸反应可涉及温度变化(热循环)或恒定温度(等温)。在一些实施方案中,引物延伸反应包括聚合酶链反应(PCR)。PCR涉及循环进行多个阶段的变性、引物对与相反链退火以及用于以指数方式增加靶序列的拷贝数的引物延伸,这些阶段中的至少一些通常发生在不同的反应温度下。PCR扩增技术的非限制性示例是定量PCR(qPCR或实时PCR)、逆转录PCR(RT-PCR)、数字PCR(dPCR或dePCR)、靶标特异性PCR和定量逆转录PCR(qRT-PCR)、双引物PCR(dpPCR)、单引物PCR(spPCR)。可以用于PCR的聚合酶的示例是热稳定性聚合酶,包括但不限于嗜热栖热菌(Thermus thermophilus)HB8;奥飞氏栖热菌(Thermus oshimai)突变体;水管致黑栖热菌(Thermus scotoductus);嗜热栖热菌1B21;嗜热栖热菌GK24;水生栖热菌(Thermus aquaticus)聚合酶(FS或Taq(G46D;F667Y)、Taq(G46D;F667Y;E6811)和Taq(G46D;F667Y;T664N;R660G));激烈热球菌(Pyrococcus furiosus)聚合酶;戈氏栖热球菌(Thermococcus gorgonarius)聚合酶;热球菌菌种GB-D聚合酶;栖热球菌菌种(菌株9°N-7)聚合酶;嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)聚合酶;Tsp聚合酶;ThermalAceTM聚合酶(Invitrogen);黄栖热菌(Thermus flavus)聚合酶;海滨栖热菌(Thermus litoralis)聚合酶;栖热菌属Z05聚合酶;δZ05聚合酶(例如,δZ05 Gold DNA聚合酶);和它们的突变体、变体及衍生物。可以用于PCR的聚合酶的其他示例是非热稳定性聚合酶,包括但不限于DNA聚合酶I;DNA聚合酶I突变体,包括但不限于,Klenow片段和Klenow片段(无3’-5’核酸外切酶活性);T4 DNA聚合酶;突变体T4 DNA聚合酶;T7 DNA聚合酶;突变体T7 DNA聚合酶;phi29 DNA聚合酶;和突变体phi29 DNA聚合酶。
在一些实施方案中,引物延伸和扩增反应包括等温反应。等温扩增技术的非限制性示例是连接酶链反应(LCR);转录介导的扩增(TMA);基于核酸序列的扩增(NASBA);信号介导的RNA扩增技术(SMART);链置换扩增(SDA);嗜热SDA;滚环扩增(RCA);环介导的DNA等温扩增(LAMP);解旋酶依赖性扩增(HDA);单引物等温扩增(SPIA);和环状解旋酶依赖性扩增(cHDA)。
在本文各方面的各种实施方案中,热启动聚合酶用于延伸和/或扩增。术语“热启动”通常是指当反应混合物保持在第一温度(通常为较低温度)时限制必需反应组分(例如聚合酶)的可用性的手段,直到达到第二温度(通常为较高温度)才能允许必需组分参与反应。热启动反应通常涉及在第一(例如较低)温度下温育,然后升高至允许进行期望反应的第二(例如较高)温度。通过在等于或高于引物杂交(退火)温度的温度下温育反应混合物,可以实现热启动反应的激活。使用等于或高于引物杂交温度的温度可以确保引物结合特异性。恢复酶活性所需的温育时长取决于反应混合物的温度和pH值以及酶的稳定性。可以使用宽范围的温育条件;可以根据经验确定每个反应的最佳条件。可以可选地将溶液加热至第一温度并在第一温度下保持适于核酸聚合酶的热启动活化的第一时间段。
非限制性示例性热启动机制包括但不限于,在较低温度下阻断核酸聚合酶活性并在升高的温度下与聚合酶解离的抗体或抗体组合;亲和体或亲和体组合,有时称为抗体模拟物;在较低温度下阻断核酸聚合酶活性并在升高的温度下与聚合酶解离的寡核苷酸;使得核酸聚合酶的活性在较低温度下被阻断的对核酸聚合酶的可逆化学修饰,并且该修饰在升高的温度下逆转或解离;核酸聚合酶的氨基酸突变,其在较低温度下提供降低的活性;包括超稳定的DNA结合域和拓扑异构酶的核酸聚合酶融合蛋白;以温度依赖性方式抑制核酸聚合酶的配体;在低温下隔离引物的单链结合蛋白;在升高的温度下水解无机焦磷酸盐的热稳定性焦磷酸酶;热不稳定性阻断剂,例如聚合酶阻断蛋白;引物竞争序列;修饰的引物构建体;修饰的引物,其可提高杂交选择性;具有3’修饰的引物,其可通过3’-5’核酸外切酶活性去除;具有修饰的核碱基的引物,其可通过紫外线照射去除;可通过热脱保护去除的引物修饰;或具有热不稳定性的修饰基团的dNTP的修饰。用作热启动机制的试剂,例如但不限于抗体、寡核苷酸、亲和体、化学修饰等,可以被称为“热启动抑制剂”。
在一些实施方案中,热启动组合物包含对聚合酶具有特异性的抗体。在一些实施方案中,热启动组合物包含对聚合酶具有特异性的抗体,该抗体与聚合酶结合。在一些实施方案中,热启动组合物包含对聚合酶具有特异性的抑制剂,该抑制剂与聚合酶结合。在一些实施方案中,抑制剂包括亲和体。在一些实施方案中,抑制剂包含寡核苷酸。在一些实施方案中,抑制剂包含化学修饰。许多热启动聚合酶可从各种商业来源获得,例如AppliedBiosystems;Bio-Rad;eEnzyme LLC;Eppendorf North America;Finnzymes Oy;GeneChoice,Inc.;Invitrogen;Jena Bioscience GmbH;MTDSCI;Minerva Biolabs GmbH;New England Biolabs;Novagen;Promega;QIAGEN;Roche Applied Science;Sigma-Aldrich;Stratagene;Takara Minis Bio;USB Corp.;Yorkshire Bioscience Ltd等。
在本公开内容的各个方面的任何一个的一些实施方案中,引物可以包含一个或多个部分。例如,引物可包含一个或多个扩增引物退火序列或其互补序列;一个或多个测序引物退火序列或其互补序列;一个或多个条形码序列;在多个不同引物之间共有的一个或多个共同序列;一个或多个限制酶识别位点;一个或多个探针结合位点或测序衔接子(例如,用于附接至测序平台,例如用于大规模平行测序的流动池);一个或多个随机或接近随机的序列(例如,从一个或多个位置处的一组两个或多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个表现在包含随机序列的引物池中);及其组合。
下一代测序方法的非限制性示例是单分子实时测序、离子半导体测序、焦磷酸测序、合成测序、连接测序和链终止。用于流动池附接的测序衔接子可以包含与下一代测序系统,例如454测序、Ion Torrent Proton或PGM以及Illumina X10兼容的任何合适的序列。用于下一代测序方法的测序衔接子的非限制性示例包括适用于Illumina测序系统的P5和P7衔接子;TruSeq通用衔接子;和TruSeq索引衔接子。在一些实施方案中,测序衔接子可用于例如通过扩增如聚合酶链反应(PCR)富集包含衔接子序列的核酸分子。测序衔接子可还包含条形码序列和/或样品索引序列。
在一些实施方案中,引物包含条形码序列。条形码序列是指已知的核酸序列,其允许鉴别与条形码相关联的核酸分子的某些特征。条形码各自的长度可以在5个核苷酸至35个核苷酸、6个核苷酸至30个核苷酸或8个核苷酸至20个核苷酸的范围内。在一些实施方案中,条形码的长度为至少3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸。在一些实施方案中,条形码的长度小于6个核苷酸。在一些实施方案中,与一些靶核酸分子相关联的条形码的长度可以不同于与其他靶核酸分子相关联的条形码的长度。一组内条形码的解链温度可以在彼此的±10℃内、在彼此的±5℃内或在彼此的±2℃内。条形码可以是最小交叉杂交组的组分。例如,该组的每个组分的核苷酸序列可以与该组的每个其他组分的核苷酸序列充分不同,使得在中等或严格杂交条件下,没有组分可以与任何其他组分的互补序列形成稳定的双链体。最小交叉杂交组的每个组分的核苷酸序列可以与每个其他组分的核苷酸序列相差至少两个核苷酸。一些条形码技术描述于Winzeler等人(1999)Science 285:901;Brenner(2000)Genome Biol.1:1Kumar等人(2001)Nature Rev.2:302;Giaever等人(2004)Proc.Natl.Acad.Sci.USA 101:793;Eason等人(2004)Proc.Natl.Acad.Sci.USA 101:11046;和Brenner(2004)Genome Biol.5:240,其各自通过引用全文并入本文。
扩增产物
可以通过测序来分析根据本文的方法产生的扩增产物(也称为扩增子)。多种测序方法可用于扩增产物的测序。在一些实施方案中,使用高通量测序方法。可以使用的测序方法的非限制性示例包括由Illumina制造的测序系统(测序系统,如和)、由Life Technologies制造的测序系统(Ion等)、Roche’s 454Life Sciences系统、Pacific Biosciences系统等。在一些实施方案中,测序包括使用和系统来产生长度为约或大于约50、75、100、125、150、175、200、250、300个核苷酸或更长的读取。在一些实施方案中,测序包括合成测序过程,其中当将各个核苷酸添加到生长的引物延伸产物中时,迭代地鉴定各个核苷酸。焦磷酸测序是合成测序过程的示例,其通过测定所得合成混合物中测序反应副产物即焦磷酸盐的存在来鉴定核苷酸的掺入。特别地,使引物/模板/聚合酶复合物与单一类型的核苷酸接触。如果掺入该核苷酸,则聚合反应在三磷酸链的α磷酸和β磷酸之间裂解三磷酸核苷,从而释放焦磷酸。然后使用化学发光酶报告系统鉴定释放的焦磷酸的存在,该系统将焦磷酸与AMP转换为ATP,然后使用萤光素酶测量ATP以产生可测量的光信号。在检测到光的情况下,则并入了碱基,而在未检测到光的情况下,则未并入碱基。在适当的洗涤步骤后,使各种碱基与复合物循环接触,以依次鉴定模板序列中的后续碱基。参见,例如,美国专利号6,210,891。
在本公开内容的各种实施方案中,在测序之前纯化扩增产物。可以通过各种方法纯化扩增产物。可以纯化扩增产物以除去过量或不需要的试剂、反应物或产物。还可以通过大小、序列或其他物理或化学特性来纯化扩增产物。在一些实施方案中,可以对扩增子进行尺寸排阻色谱法。在一些实施方案中,可以对扩增产物进行从凝胶中的片段切除和凝胶过滤(例如以富集长度大于约300、400、500个或更多个核苷酸的片段);以及通过微调结合缓冲液浓度来进行SPRI磁珠(Agencourt AMPure XP)大小选择。例如,在与DNA片段混合期间使用0.6x结合缓冲液可用于优先结合大于约500个碱基对(bp)的DNA片段。
反应时间
在本文提供的各种方法、组合物、反应混合物和试剂盒中,逆转录和标签化可以在单个腔室中的单个步骤中进行,并且提供了产生cDNA文库的更快方式。如本文所述,cDNA文库可以是通过以下项产生的:将样品中的RNA样品逆转录;将互补的切割位点引入DNA/RNA杂交体分子中;在切割位点5’端附接5’突出端标签的群体;和合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子。在一些情况下,cDNA文库在不超过5小时、41/2小时、4小时、31/2小时、3小时、21/2小时、2小时、11/2小时、1小时、55分钟、50分钟、45分钟、40分钟、35分钟、30分钟、25分钟、20分钟、15分钟、10分钟或5分钟内产生。在一些情况下,cDNA文库在至少5小时、41/2小时、4小时、31/2小时、3小时、21/2小时、2小时、11/2小时、1小时、55分钟、50分钟、45分钟、40分钟、35分钟、30分钟、25分钟、20分钟、15分钟、10分钟或5分钟内产生。在一些情况下,cDNA文库在不超过2小时内产生。在一些情况下,cDNA文库在不超过45分钟内产生。
本文所述的各种实施方案可通过在单个腔室中的单个步骤中进行逆转录和标签化而提供产生测序文库的更快方式。通常,测序文库是在索引PCR步骤之后产生的。在一些情况下,测序文库在不超过10小时、91/2小时、9小时、81/2小时、8小时、71/2小时、7小时、61/2小时、6小时、51/2小时、5小时、41/2小时、4小时、31/2小时、3小时、21/2小时、2小时、11/2小时、1小时、55分钟、50分钟、45分钟、40分钟、35分钟或30分钟内产生。在一些情况下,测序文库在至少5小时、41/2小时、4小时、31/2小时、3小时、21/2小时、2小时、11/2小时、1小时、55分钟、50分钟、45分钟、40分钟、35分钟、30分钟、25分钟、20分钟或15分钟内产生。在一些情况下,测序文库在不超过2小时内产生。在一些情况下,测序文库在cDNA文库产生时间之外的不超过30分钟的时间内产生。在一些情况下,测序文库在cDNA文库产生时间之外的不超过15分钟的时间内产生。
图1示出了本文提供的公开内容的示例。如图1所示,来自样品的大量总mRNA分子在单个腔室中进行逆转录和标签化反应。使mRNA分子与逆转录酶和逆转录酶引物接触,该引物包含第一标签(表示为N1)、镶嵌端(表示为ME)和聚T区段。通常,第一标签是第一转座子区段。如图所示,逆转录酶引物在其5’端包含N1,其后是ME,并且在接近其3’端处包含聚T区段。在一些情况下,逆转录酶引物可以是N1ME-T20VN。逆转录酶引物与mRNA分子3’端的聚A尾杂交,并且逆转录酶合成沿5’至3’方向从逆转录酶引物延伸的与mRNA分子互补的cDNA分子。cDNA分子的合成在图1中以短划线示出。在一些情况下,逆转录酶是SuperScript IV逆转录酶,并且逆转录反应在50℃下进行30分钟。使mRNA-cDNA杂交体与转座体接触以进行转座或标签化反应。转座体包含转座酶和至少第一标签或第二标签,其中第二标签(表示为N2)包含第二转座子区段。有时转座体包含Tn5和第一标签(N1)或第二标签(N2)或两者。在一些情况下,第一或第二标签可以进一步包含与标签连接的ME区段。在标签化反应中,转座体将N1或N2标签插入mRNA-cDNA杂交体的经切割的5’端,以产生多个具有N1、N2或两者的突出端标签的双端标签化的mRNA-cDNA杂交体片段。标签在图1中被示为灰线和点虚线,其中点虚线代表包含N1的第一标签,并且代表不间断的连续分子,而灰线代表包含N2的第二标签。双端标签化的mRNA-cDNA杂交体片段包含双链mRNA-cDNA杂交体的双链mRNA-cDNA片段,该双链mRNA-cDNA杂交体具有从mRNA链的5’端延伸的5’突出端标签和从cDNA链的5’端延伸的5’突出端标签,其中5’突出端标签包含N1或N2中的至少一个。在一些情况下,一个片段上的5’突出端标签是不同的标签。在一些情况下,5’突出端标签还包含ME区段。逆转录和标签化反应后,使转座酶失活。在一些情况下,将蛋白酶引入反应腔室以使转座酶失活。在一些情况下,蛋白酶在不超过65℃的温度下具有活性,并且可以在转座酶失活后通过加热到至少65℃的温度来失活。然后,使多个具有突出端标签的双端标签化的mRNA-cDNA杂交体片段进行间隙填充或延伸反应,以产生多个平端双端标签化的mRNA-cDNA杂交体片段。在延伸反应中,合成来自mRNA-cDNA杂交体片段的3’凹端的与5’突出端标签互补的区段以形成平端mRNA-cDNA杂交体片段。在一些情况下,延伸反应利用DNA聚合酶和脱氧核糖核苷酸合成与突出端标签互补的区段。平端双端标签化的mRNA-cDNA杂交体片段包含两条个体链,其中一条个体链包含在该片段的5’端的标签、mRNA或cDNA片段和在该片段的3’端的另一标签的反向互补序列。在一些情况下,该个体链包含在5’端的第一标签和ME区段(N1ME)、mRNA或cDNA片段和在3’端的第二标签的反向互补序列和ME区段(N2’ME),其分别由图1中的一系列点虚线、黑线和灰线表示。在一些情况下,该个体链包含在5’端的第二标签和ME区段(N2ME)、mRNA或cDNA片段和在3’端的第一标签的反向互补序列和ME区段(N1’ME),其分别由图1中的一系列灰线、黑线和点虚线表示。随后进行引物指引的延伸反应或扩增反应以产生多个平端cDNA片段的拷贝。包含第一标签或其一部分的引物或包含第二标签或其一部分的引物的使用可分别产生包含第一标签或第二标签的任何平端片段的拷贝。在一些情况下,引物包含序列衔接子,其在图1中显示为黑线。在一些情况下,引物是P5-I5-N1、P7-i7、N2、P5和P7。在一些情况下,引物指引的延伸反应是索引PCR。在一些情况下,进行16个循环的索引PCR。在一些情况下,进行至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个循环的索引PCR。扩增后,多个平端cDNA片段包含个体链,该个体链包含在cDNA片段的5’端的标签、cDNA片段、在cDNA片段的3’端的另一标签的反向互补序列和在5’或3’端的序列衔接子。在一些情况下,该个体链包含在cDNA片段的5’端的第一标签(N1)、cDNA片段和在cDNA片段的3’端的第二标签的反向互补序列(N2’)和在N2’的3’端的序列衔接子,其分别由图1中的一系列点虚线、黑线、灰线和黑线表示。在一些情况下,该个体链包含在第二标签的5’端的序列衔接子、在cDNA片段的5’端的第二标签(N2)、cDNA片段和在cDNA片段的3’端的第一标签的反向互补序列(N1’),其分别由图1中的一系列黑线、灰线、黑线和点虚线表示。
本文所述的各种实施方案在产生cDNA文库方面提供了各种能力和优点。本文提供的公开内容提供了在单个步骤中使用基因特异性寡核苷酸作为逆转录引物获得mRNA或特异性转录物的能力。本文提供的公开内容允许缩短预扩增过程中的延伸时间,从而实现更简化的工作流程和更快的周转时间。在一些情况下,预扩增过程中的延伸时间与SMART-seq方法的6分钟相比,改善至3分钟。在一些情况下,预扩增过程中的延伸时间改善至1分钟、2分钟、3分钟、4分钟或5分钟。在一些情况下,预扩增过程中的延伸时间改善1分钟、2分钟、3分钟、4分钟、5分钟或6分钟。在一些情况下,预扩增过程中的延伸时间改善至少1分钟、2分钟、3分钟、4分钟、5分钟或6分钟。本文提供的公开内容提供了mRNA的几乎全长覆盖。在一些情况下,mRNA覆盖的程度取决于逆转录酶的延伸、时间、Tn5和mRNA的表达水平。
本文所述的实施方案在产生cDNA或其他文库方面提供各种优点。在一些实施方案中,标签化和逆转录在单个步骤中进行。在一些情况下,Tn5插入和逆转录在单个步骤中进行。标签化使用DNA-RNA杂交体作为模板。在一些情况下,标签化包含Tn5插入,该插入使用DNA-RNA杂交体作为模板。本文提供的公开内容不需要TSO寡核苷酸或第二链合成。
在图1-图5中,短划线和点虚线表示连续分子,而不是分子中的断裂。在本文提供的附图中,连续分子由点虚线、短划线、黑线和灰线描绘。本文附图中的灰线和点虚线代表核酸分子的转座体使能的标签,该核酸分子是连续分子。
从基因组DNA和mRNA分子进行的转座体使能的DNA-RNA测序示于图2。此示例提供了具有通用数字计数的DNA-RNA测序,以从来自单个FFPE样品的基因组DNA和mRNA产生多重基因组合。使用基因特异性引物进行逆转录以及使用具有UMI的转座子提高了定量精度。如图2所示,使来自FFPE样品的基因组DNA分子经历标签化而没有间隙填充。在一些情况下,标签化利用包含转座酶和包含与ME区段连接的第一标签(N1)的核酸分子的转座体。在一些情况下,标签化利用包含Tn5和包含P5-UMI-N1ME的核酸分子的转座体(Tn5-P5-UMI-N1ME)。标签在图2中被示为灰线和点虚线,其中点虚线代表包含N1的第一标签,而灰线代表包含N2的第二标签。在图2以及整个附图中,连续的灰色线和黑色点虚线均表示连续的核酸链,并且点之间的空白不旨在表示核酸中的断裂点。基因组DNA的标签化会产生多个标签化的双链DNA片段,其中各个标签化的双链DNA片段具有5’端突出端片段,该片段包含识别反应批次的UMI或标签和N1标签。将标签化的双链DNA片段置于95℃的温度下2分钟,然后将基因特异性引物添加到反应混合物中用于引物指引的延伸反应。在一些情况下,引物包含连接至ME区段的第二标签(N2)和在正向或反向方向上的基因特异性区段。在一些情况下,引物包含N2ME和在正向或反向方向上的基因特异性区段。在一些情况下,在正向或反向方向上包含基因特异性区段的引物称为基因特异性引物(GSP)。所得的双端标签化的双链DNA片段包含第一标签的5’突出端片段和第二标签的5’突出端片段。随后进行引物指引的延伸反应以产生平端双端标签化的DNA片段的拷贝。在一些情况下,引物包含序列衔接子,其在图2中核酸分子末端显示为黑线。在一些情况下,引物是P5、P7-i7-N2和P7。在一些情况下,引物二聚体可以形成稳定的环。在一些情况下,引物指引的延伸反应是索引PCR。在一些情况下,进行15个循环的索引PCR。在一些情况下,进行至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个循环的索引PCR。
来自同一FFPE样品的mRNA分子在单个腔室中进行逆转录和标签化。使mRNA分子与逆转录酶和逆转录酶引物接触,该引物包含第二标签(N2)、镶嵌端(ME)和基因特异性区段。逆转录酶引物与具有基因特异性区段的互补序列的mRNA分子杂交,并且逆转录酶合成从逆转录酶引物延伸的与mRNA分子互补的cDNA分子。在一些情况下,逆转录酶是SuperScriptIV逆转录酶,并且逆转录反应在50℃下进行30分钟,但如上所述,也可以考虑使用其他方法。mRNA-cDNA杂交体经历标签化反应。转座体包含转座酶和第一标签(N1)。有时,转座体包含Tn5和包含第一标签(N1)、ME区段、P5区段和UMI区段的核酸分子。在一些情况下,转座体包含Tn5-P5-UMI-N1ME。标签化反应产生多个双端标签化的双链mRNA-cDNA片段,其中各个双标签化的mRNA-cDNA片段具有5’端突出端片段,该片段包含识别反应批次的UMI或标签和在经切割的5’端的N1标签。然后,使多个具有5’突出端标签的双端标签化的mRNA-cDNA片段进行间隙填充或延伸反应,以产生多个平端双端标签化的mRNA-cDNA片段。随后进行引物指引的延伸反应以从平端双端标签化的mRNA-cDNA片段产生平端双端标签化的DNA片段的拷贝。在一些情况下,引物包含序列衔接子。在一些情况下,引物是P5、P7-i7-N2和P7。在一些情况下,引物指引的延伸反应是索引PCR。在一些情况下,进行15个循环的索引PCR。在一些情况下,进行至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个循环的索引PCR。
扩增后,来自基因组DNA和mRNA分子的多个平端DNA片段包含个体链,该个体链包含在DNA片段的5’端的标签、DNA片段、在DNA片段的3’端的另一标签的反向互补序列和在5’或3’端的序列衔接子。在一些情况下,该个体链包含在cDNA片段的5’端的第一标签(N1)、DNA片段、基因特异性区段或其互补序列和在cDNA片段的3’端的第二标签的反向互补序列(N2’)。在一些情况下,该个体链包含在cDNA片段的5’端的第二标签(N2)、基因特异性区段或其互补序列、cDNA片段和在cDNA片段的3’端的第一标签的反向互补序列(N1’)。
图3示出了通过本文提供的公开内容仅捕获mRNA分子的3’端读数用于cDNA文库的能力。这提供了用于10k单个细胞mRNA谱分析的数字计数的能力。在一些实施方案中,可以通过扩增mRNA的3’端来获得10k单个细胞mRNA谱分析。来自单个细胞的mRNA分子在单个步骤中在单个腔室中进行逆转录和标签化。使来自单个细胞的mRNA分子与逆转录酶和逆转录酶引物接触,该引物包含第二标签(表示为N2)、镶嵌端(表示为ME)、细胞条形码(cBC)、UMI区段和聚T区段,其中逆转录酶引物在5’端与珠粒结合。如图所示的逆转录酶引物包含珠粒-N2ME-cBC-UMI-聚T区段。在一些情况下,使用Tn5N1ME和N2ME-cBC-UMI-T20VN进行逆转录和标签化步骤,然后使用N1ME/N2ME进行双引物PCR(dpPCR)以扩增仅3’端,然后进行索引PCR步骤。在一些情况下,cBC是12聚体,而UMI是8N聚体。在一些情况下,使用UMI将不同的单个细胞和转录物条形码化。有时N2ME-cBC-UMI-T20VN引物可以通过在珠粒上的DNA合成的裂分-合并(split-and-pool)循环来产生,以获得4^12(约1,680万)个具有逆转录引物的条形码化的珠粒。在一些情况下,逆转录引物包含cBC和UMI并在珠子上杂交。逆转录酶引物与mRNA分子3’端的聚A尾杂交,并且逆转录酶合成从逆转录酶引物延伸的与mRNA分子互补的cDNA分子。在一些情况下,逆转录酶是SuperScript IV逆转录酶,并且逆转录反应在50℃下进行30分钟。mRNA-cDNA杂交体分子在同一反应腔室内通过转座体进行标签化反应。转座体包含转座酶和包含第一标签(N1)和镶嵌端区段的核酸分子。有时转座体包含Tn5-N1ME。标签在图3中被示为灰线和点虚线,其中点虚线代表包含N2的标签,并且代表不间断的连续分子,而灰线代表包含N1的标签,如以上在图2的上下文中所述。在标签化反应中,转座体将N1标签插入mRNA-cDNA杂交体的经切割的5’端,以产生多个在经切割的5’端具有N1ME的5’突出端标签的双端标签化的mRNA-cDNA杂交体片段。双端标签化的mRNA-cDNA杂交体片段包含双链mRNA-cDNA杂交体的双链mRNA-cDNA片段,该双链mRNA-cDNA杂交体具有从mRNA链的5’端延伸的5’突出端标签和从cDNA链的5’端延伸的5’突出端标签,其中5’突出端标签包含N1ME。逆转录和标签化反应后,使转座酶失活。在一些情况下,将蛋白酶引入反应腔室以使转座酶失活。在一些情况下,蛋白酶在不超过65℃的温度下具有活性,并且可以在转座酶失活后通过加热到高于65℃的温度来失活。然后,使多个具有突出端标签的双端标签化的mRNA-cDNA杂交体片段进行间隙填充或延伸反应,以产生多个平端双端标签化的mRNA-cDNA杂交体片段。在延伸反应中,合成来自mRNA-cDNA杂交体片段的3’凹端的与5’突出端标签互补的区段以形成平端mRNA-cDNA杂交体片段。在一些情况下,延伸反应利用DNA聚合酶来合成与突出端标签互补的区段。平端双端标签化的mRNA-cDNA杂交体片段包含两条个体链,其中一条个体链包含在该片段的5’端的标签、mRNA或cDNA片段和在该片段的3’端的另一标签的反向互补序列。在一些情况下,该个体链包含在5’端的N1ME、mRNA片段和在3’端的UMI-cBC-MEN2的反向互补序列。在一些情况下,该个体链包含在5’端的珠粒-N2ME-cBC-UMI-聚T、cDNA片段和在3’端的N1ME的反向互补序列。随后进行引物指引的延伸反应或扩增反应,以选择性地产生与mRNA分子的3’端相对应的平端cDNA片段的拷贝。在一些实施方案中,扩增是使用包含N1ME和N2ME的引物的双引物PCR(dpPCR)。在一些情况下,dpPCR之后是索引PCR。在一些情况下,进行16个循环的索引PCR。在一些情况下,进行至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个循环的索引PCR。扩增后,多个平端cDNA片段包含个体链,该个体链包含在cDNA片段的5’端的标签、在mRNA分子的3’端的cDNA片段、在cDNA片段的3’端的另一标签的反向互补序列和在5’或3’端的序列衔接子。在一些情况下,该个体链包含在5’端的第二标签(N2)、在mRNA分子3’端的cDNA片段和在3’端的第一标签的反向互补序列(N1’)和在N1’的3’端的序列衔接子。在一些情况下,该个体链包含在5’端的序列衔接子、第一标签(N1)、在mRNA分子3’端的cDNA片段和在3’端的第二标签的反向互补序列(N2’)。
图4示出了通过本文提供的公开内容从大于100ng总RNA的大量mRNA分子产生cDNA文库的能力。大量mRNA样品在单个步骤中在单个腔室中进行逆转录和标签化。使mRNA分子与逆转录酶和逆转录酶引物接触,该引物包含第二标签(表示为N2)、镶嵌端(表示为ME)和聚T区段。在一些情况下,使用Tn5N1ME和N2ME-T20VN进行逆转录和标签化步骤。逆转录酶引物与mRNA分子3’端的聚A尾杂交,并且逆转录酶合成从逆转录酶引物延伸的与mRNA分子互补的cDNA分子。在一些情况下,逆转录酶是SuperScript IV逆转录酶,并且逆转录反应在50℃下进行30分钟。mRNA-cDNA杂交体分子也与模板转换寡核苷酸(TSO)接触。TSO与通常包含聚脱氧胞苷区段的cDNA的3’端杂交。在一些情况下,TSO包含聚胍核糖核苷酸区段、ME和在5’端的第一标签(N1)。在逆转录和标签化反应中添加TSO允许mRNA分子的全长捕获。具有TSO的mRNA-cDNA杂交体分子在同一反应腔室内通过转座体进行标签化反应。转座体包含转座酶和第一标签(N1)或第二标签(N2)。标签在图4中被示为灰线和点虚线。通常转座体包含Tn5-N1、Tn5-N2或Tn5-N1N2中的至少一种。在标签化反应中,转座体将第一或第二标签插入mRNA-cDNA杂交体的经切割的5’端,以产生多个在经切割的5’端具有5’突出端标签的双端标签化的mRNA-cDNA杂交体片段。双端标签化的mRNA-cDNA杂交体片段包含双链mRNA-cDNA杂交体的双链mRNA-cDNA片段,该双链mRNA-cDNA杂交体具有从mRNA链的5’端延伸的5’突出端标签和从cDNA链的5’端延伸的5’突出端标签,其中5’突出端标签包含N1或N2。逆转录和标签化反应后,使转座酶失活。在一些情况下,将蛋白酶引入反应腔室以使转座酶失活。在一些情况下,蛋白酶在不超过65℃的温度下具有活性,并且可以在转座酶失活后通过加热到高于65℃的温度来失活。然后,使多个具有突出端标签的双端标签化的mRNA-cDNA杂交体片段进行间隙填充或延伸反应,以产生多个平端双端标签化的mRNA-cDNA杂交体片段。在延伸反应中,合成来自mRNA-cDNA杂交体片段的3’凹端的与5’突出端标签互补的区段以形成平端mRNA-cDNA杂交体片段。在一些情况下,延伸反应利用DNA聚合酶来合成与突出端标签互补的区段。平端双端标签化的mRNA-cDNA杂交体片段包含两条个体链,其中一条个体链包含在该片段的5’端的标签、mRNA或cDNA片段和在该片段的3’端的另一标签的反向互补序列。在一些情况下,该个体链包含在5’端的第一标签和ME区段(N1ME)、mRNA或cDNA片段和在3’端的第二标签的反向互补序列和ME区段(N2’ME)。在一些情况下,该个体链包含在5’端的第二标签和ME区段(N2ME)、mRNA或cDNA片段和在3’端的第一标签的反向互补序列和ME区段(N1’ME)。随后进行引物指引的延伸反应或扩增反应以产生多个平端cDNA片段的拷贝。包含第一标签或其一部分的引物或包含第二标签或其一部分的引物的使用可分别产生包含第一标签或第二标签的任何平端片段的拷贝。在一些情况下,引物包含序列衔接子。在一些情况下,进行18个循环的索引PCR。扩增后,多个平端cDNA片段包含个体链,该个体链包含在cDNA片段的5’端的标签、cDNA片段、在cDNA片段的3’端的另一标签的反向互补序列和在5’或3’端的序列衔接子。在一些情况下,该个体链包含在5’端的第一标签(N1)、cDNA片段和第二标签的反向互补序列(N2’)和在3’端的序列衔接子。在一些情况下,该个体链包含在第二标签的5’端的序列衔接子、第二标签(N2)、cDNA片段和在3’端的第一标签的反向互补序列(N1’)。
图5示出了通过本文提供的公开内容从单个细胞捕获mRNA的全长和基因组DNA。如图5所示,逆转录和标签化反应之后是单引物PCR(spPCR)预扩增反应。本文提供的公开内容允许以下至少一种:在单个步骤中获得mRNA和基因组DNA,在预扩增过程中缩短延伸时间和对mRNA的全长覆盖。来自单个细胞的mRNA分子在单个步骤中在单个腔室中进行逆转录和标签化。使mRNA分子与逆转录酶和逆转录酶引物接触,该引物包含第一标签(N1)、镶嵌端(ME)和聚T区段。在一些情况下,逆转录酶引物是N1ME-T20VN。逆转录酶引物与mRNA分子3’端的聚A尾杂交,并且逆转录酶合成从逆转录酶引物延伸的与mRNA分子互补的cDNA分子。在一些情况下,逆转录酶是SuperScript IV逆转录酶,并且逆转录反应在50℃下进行30分钟。mRNA-cDNA杂交体分子也与TSO接触,该TSO与cDNA的3’端杂交,该cDNA通常包含聚脱氧胞苷区段并与mRNA分子的5’端连接。在一些情况下,TSO包含聚胍核糖核苷酸区段、ME和在5’端的第一标签(N1)。在逆转录和标签化反应中添加TSO允许mRNA分子的全长捕获。具有TSO的mRNA-cDNA杂交体分子在同一反应腔室内通过转座体进行标签化反应。转座体包含转座酶和包含N1和ME的核酸分子。在一些情况下,转座体是Tn5-N1ME。在标签化反应中,转座体将第一标签插入mRNA-cDNA杂交体的经切割的5’端,以产生多个在经切割的5’端具有包含N1的5’突出端标签的双端标签化的mRNA-cDNA杂交体片段。标签在图5中被示为灰线和点虚线,其中点虚线代表包含N2的标签,并且代表不间断的连续分子,而灰线代表包含N1的标签,如以上在图2的上下文中所述。逆转录和标签化反应后,使转座酶失活。在一些情况下,将蛋白酶引入反应腔室以使转座酶失活。在一些情况下,蛋白酶在不超过65℃的温度下具有活性,并且可以在转座酶失活后通过加热到高于65℃的温度来失活。然后,使多个具有突出端标签的双端标签化的mRNA-cDNA杂交体片段进行间隙填充或延伸反应,以产生多个平端双端标签化的mRNA-cDNA杂交体片段。在延伸反应中,合成来自mRNA-cDNA杂交体片段的3’凹端的与5’突出端标签互补的区段以形成平端mRNA-cDNA杂交体片段。在一些情况下,延伸反应利用DNA聚合酶合成与突出端标签互补的区段。平端双端标签化的mRNA-cDNA杂交体片段包含两条个体链,其中一条个体链包含在该片段的5’端的N1标签、mRNA或cDNA片段和在该片段的3’端的N1标签的反向互补序列。随后进行引物指引的延伸反应或扩增反应以产生多个具有N1标签的平端双端标签化的cDNA片段的拷贝。使用包含N1ME的引物进行18个循环的spPCR扩增。然后,通过包含Tn5和第二标签(N2)的第二转座体使具有N1标签的平端双端标签化的cDNA片段的扩增产物进行第二标签化反应。第二标签化得到多个具有包含N2的5’突出端标签的双端标签化的cDNA片段。然后,使多个具有N2突出端标签的双端标签化的cDNA片段进行间隙填充反应,以产生多个具有N1和N2标签的平端双端标签化的mRNA-cDNA杂交体片段。在一些情况下,所得的具有N1和N2标签的平端双端标签化的mRNA-cDNA杂交体片段包含个体链,该个体链包含在5’端的第一标签和ME区段(N1ME)、cDNA片段和在3’端的第二标签的反向互补序列和ME区段(N2’ME)。在一些情况下,所得的具有N1和N2标签的平端双端标签化的mRNA-cDNA杂交体片段包含个体链,该个体链包含在5’端的第二标签和ME区段(N2ME)、cDNA片段和在3’端的第一标签的反向互补序列和ME区段(N1’ME)。随后进行引物指引的延伸反应或扩增反应以产生多个平端cDNA片段的拷贝。在一些情况下,引物包含序列衔接子。在一些情况下,进行10个循环的索引PCR。扩增后,多个平端cDNA片段包含个体链,该个体链包含在cDNA片段的5’端的标签、cDNA片段、在cDNA片段的3’端的另一标签的反向互补序列和在5’或3’端的序列衔接子。在一些情况下,该个体链包含在5’端的第一标签(N1)、cDNA片段和第二标签的反向互补序列(N2’)和在3’端的序列衔接子。在一些情况下,该个体链包含在第二标签的5’端的序列衔接子、第二标签(N2)、cDNA片段和在3’端的第一标签的反向互补序列(N1’)。
本文所述的各种实施方案在产生转座体使能的DNA/RNA-seq(tedRNA-Seq)以产生cDNA文库方面提供了优势。本文提供的公开内容允许通过使用使得逆转录和Tn5插入在同一反应中起作用的反应条件,在单个反应腔室中在单个步骤反应中通过使用逆转录酶引物和包含转座子标签的Tn5转座体从mRNA模板产生双端标签化的RNA-DNA杂交体片段。逆转录酶引物通常具有聚T区段。逆转录酶引物有时具有基因特异性区段。在一些情况下,本公开内容提供了一种处理许多单个个体细胞以捕获具有不同条形码化片段的mRNA的方法。
本文的公开内容使得能够在单个反应中捕获和标签化来自单个样品的mRNA和基因组DNA,其中样品可以是单个细胞或来自许多细胞的大量裂解物。在一些情况下,细胞经过裂解,而且来自裂解的细胞的样品会在单个步骤中进行逆转录和标签化。在一些情况下,许多单个个体细胞经过处理以捕获具有不同条形码化片段的mRNA和基因组DNA。
本文公开了将逆转录、第二链合成和标签化反应以在单个步骤反应中捕获全长mRNA相结合的方法。在一些情况下,该方法在反应中包括TSO作为用于第二链合成的引物。在一些情况下,方法包括通过将逆转录酶引物和Tn5的标签化转座体两者条形码化,从1k-10k细胞中获取全长RNA。
本文提供的公开内容提供了基于OnePot反应的转座体使能的DNA/RNA-Seq(tedRNA-Seq),用于在一个反应步骤中实现a)细胞裂解、b)逆转录酶、c)Tn5标签化和d)模板转换,然后接下来进行文库索引PCR。
本文还提供了允许进行RNA-seq而无需在反应前去除gDNA的方法。在一些情况下,RNA-seq以聚T为逆转录酶引物获取3’端区段。在一些情况下,用基因特异性引物对目标区域进行RNA-seq而不去除gDNA。
反应混合物
本公开内容还提供了用于执行任何主题方法的反应混合物。用于执行主题方法的反应混合物可以包含涉及各个方面中的任一个或任意组合的本文所公开的一个或多个元素。在一方面,本公开内容提供了反应混合物,该反应混合物包含来自样品的mRNA链;和组合物,该组合物包含(i)包含转座酶和第一转座子核酸的第一转座体、(ii)逆转录酶和(iii)包含第二转座子核酸的逆转录酶引物。在一些情况下,反应混合物包含双链多核苷酸,该双链多核苷酸包含来自样品的基因组DNA。在一些情况下,反应混合物包括包含基因特异性序列和第二转座子序列的第一引物和包含该基因特异性序列和该第二转座子序列的互补序列的第二引物。在一些情况下,反应混合物包含第二转座体,该第二转座体包含转座酶和第二转座子序列。在一些情况下,反应混合物包含逆转录酶引物,该逆转录酶引物具有聚T区段、目标基因的互补区段以及细胞条形码和唯一分子标识符(UMI)中的至少一种。在一些情况下,反应混合物包含与珠粒结合的逆转录酶引物。在一些情况下,反应混合物包含模板转换寡核苷酸(TSO)。在一些情况下,TSO包含第一转座子序列和镶嵌端。在一些情况下,反应混合物包含使转座酶失活的蛋白酶。
试剂盒
本公开内容还提供了用于执行任何主题方法的试剂盒。试剂盒可包含涉及各个方面中的任一个或任意组合的本文所公开的一个或多个元素。试剂盒可包含转座酶,例如Tn转座酶。试剂盒可包含转座子核酸。试剂盒可包含至少一个用于进行延伸反应的酶。试剂盒可包含至少一个用于进行引物指引的延伸反应的引物。试剂盒可包含至少一个用于进行引物指引的延伸反应的条形码化的引物。
本文描述了试剂盒,该试剂盒包含:具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸和用于实施本文所述的方法的说明书。在一些情况下,该寡核苷酸用作逆转录酶引物。
在一些情况下,试剂盒包含一组转座体,该转座体包含:包含第一转座子序列的同二聚体转座酶、包含第二转座子序列的同二聚体转座酶以及任选的包含第一转座子序列和第二转座子序列的异二聚体转座酶;逆转录酶;包含第一转座子序列的逆转录酶引物;和用于实施如本文所述的方法的说明。
试剂盒的内容物可以在任何合适的腔室中使用。在一些情况下,腔室是孔、板、管、腔室、流动池或芯片。在一些情况下,腔室是珠粒、液滴或乳液中限定的水性空间。
试剂盒的内容物可以被容纳在任何合适的容器中。可以将每种组分包装到不同的容器中,或者在交叉反应性和保质期允许的情况下,可以在容器中提供组分的组合。容器的非限制性示例包括孔、板、管、腔室、流动池或芯片。
试剂盒的内容物可立即用于执行本文所述的方法。在一些情况下,在用于本文所述的方法之前,将试剂盒的内容物与试剂盒中的其他试剂或由用户提供的试剂组合。例如,可以在使用前稀释浓缩的组合物,或者可以在使用前重构冻干的组合物。
试剂盒可以提供缓冲液,其非限制性示例包括碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。试剂盒可包含对照样品,例如用作阳性对照或定量标准的纯化DNA。
在各种实施方案中,试剂盒还包含核苷酸。核苷酸可以是核糖核苷酸、脱氧核糖核苷酸、合成核苷酸或其组合。通常核苷酸是脱氧核糖核苷酸。
在一些实施方案中,试剂盒还包含衔接子寡核苷酸。衔接子寡核苷酸可以是单链或双链的。衔接子可以附接到核酸分子的5’端或3’端。在一些情况下,衔接子寡核苷酸包含条形码序列、扩增引物结合序列、测序引物结合序列或其组合。
试剂盒中提供的转座酶可以是本文所述的任何转座酶,包括但不限于整合酶、HERMES或HIV整合酶。转座酶可以是Tn转座酶(例如Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuA转座酶、Vibhar转座酶(例如来自哈氏弧菌)、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、F元件、hobo、Hsmarl、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、P元件、Tam3、Tc1、Tc3、Tel、THE-1、Tn/O、TnA、Tol1、Tol2、TnlO、Tyl、任何原核转座酶或与以上所列转座酶有关和/或源自以上所列转座酶的任何转座酶。在一些实施方案中,试剂盒中提供的转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。在一些情况下,试剂盒中提供的转座酶是选自Tn3、Tn5、Tn7和Tn10的Tn转座酶。在一些情况下,转座体包含单体的二聚体,各个单体包含转座酶和转座子核酸。转座体二聚体可以是同二聚体或异二聚体。在一些情况下,试剂盒包含一种或多种阳离子以促进和/或触发转座反应。阳离子可以是二价阳离子,例如Ca2+、Mg2+和Mn2+。
试剂盒中提供的转座子核酸可与核酸分子连接。试剂盒中提供的转座子核酸可以是单链、双链或部分双链的核酸分子序列。在一些情况下,转座子核酸可以是双链序列或部分双链序列。试剂盒中提供的转座子核酸可包含适合与转座酶形成功能复合物的任何核酸或核酸类似物。转座子核酸可包含DNA、RNA、修饰的碱基、非天然碱基、修饰的骨架,或可在一条或两条链中包含缺口。
本文公开的试剂盒差异地具有本文公开的任何逆转录酶。在一些情况下,该试剂盒还包含引物以启动逆转录,从而合成cDNA分子。在一些情况下,引物包含聚T区段。在一些情况下,试剂盒还包含dNTP。在一些实施方案中,试剂盒还包含反应缓冲液。在一些情况下,反应缓冲液包含二价金属离子。该二价金属离子通常为Mg2+或Mn2+。
本文提供的试剂盒可任选地使用TSO以提供mRNA分子在所得cDNA文库中的完全覆盖。TSO与cDNA的3’端杂交,该cDNA通常包含聚脱氧胞苷区段并与mRNA分子的5’端连接。在一些情况下,TSO包含聚胍核糖核苷酸区段。在一些情况下,TSO还在5’端包含镶嵌端和第一标签(N1)。在一些情况下,TSO在5’端包含镶嵌端和第二标签(N2)。具有TSO的mRNA-cDNA杂交体分子在同一反应腔室内通过转座体进行标签化反应。
在一些情况下,该试剂盒具有用于使转座酶失活的蛋白酶。在一些情况下,该蛋白酶是热不稳定的蛋白酶。替代地或组合地,该试剂盒可包括用于使转座酶失活的SDS溶液。例如,试剂盒中可以包含具有0.1%、0.2%或更多SDS的SDS溶液。
试剂盒中提供的热启动聚合酶可用于延伸反应和/或扩增反应。可以通过在升高的温度下温育足够的时间长度(例如95度持续1分钟)来激活热启动聚合酶,例如高保真PCR聚合酶。
系统
在一方面,本公开内容提供了一种用于执行本文公开的方法的系统。该系统可以包括:(a)计算机,其被配置为接收用户请求以表征核酸分子或生成核酸文库;(b)一个或多个处理器,其被配置为响应于用户请求而执行在单个腔室中进行逆转录和标签化反应以及在核酸分子或其一部分上进行一个或多个延伸反应(包括引物指引的延伸反应)的命令;和/或(c)能够产生序列读取的测序系统。在一些实施方案中,计算机包括一个或多个处理器。处理器可以与计算机系统的一个或多个控制器、计算单元和/或其他单元相关联,或者根据需要植入固件中。如果以软件实现,则例程可以被存储在任何计算机可读存储器,例如硬盘驱动器、固态存储驱动器、RAM、ROM、闪存、磁盘、激光盘或其他存储介质中。在一些情况下,计算机可读存储器在云或远程服务器中提供。同样,可以通过任何已知的传递方法将该软件传递给计算设备,该传递方法包括例如,通过诸如电话线、互联网、无线连接等通信信道,或者通过诸如计算机可读盘、闪盘驱动器等可传输介质。各个步骤可以被实现为各种块、操作、工具、模块或技术,而这些块、操作、工具、模块或技术又可以以硬件、固件、软件或其任意组合来实现。当以硬件实现时,一些或全部块、操作、技术等可以例如以定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或可编程逻辑阵列(PLA)等来实现。在一些实施方案中,计算机被配置成接收客户请求以设计用于扩增指定靶序列(其也可以由客户提供)的引物。计算机可以直接地(例如,通过由客户或录入客户请求的用户操作的输入设备,如键盘、鼠标、触摸屏,或通过用户给出的语音命令)或间接地(例如,通过有线或无线连接,包括通过互联网)接收客户请求。
在一些实施方案中,该系统包括报告生成器,该报告生成器将报告发送给接收者,其中该报告包含关于样品中的核酸分子的信息。例如,该报告可以包含单倍型信息或核酸分子中结构变异的鉴定。该报告可以包含关于低频等位基因或序列变体的信息。该报告可以包含关于被选择性采样的核酸分子区域的子集的信息。报告生成器可以响应于客户请求自动发送报告。可替选地,报告生成器可以响应于来自操作者的指令发送报告。可以使用任何适当的通信介质将报告发送到本地或远程位置的接收者。例如,通信介质可以是网络连接、无线连接或互联网连接。可以通过这样的网络或连接(或用于发送信息的任何其他合适的方式,包括但不限于邮寄实体报告,例如打印件)来发送报告,以供接收者接收和/或查看。接收者可以是但不限于客户或电子系统(例如一台或多台计算机和/或一台或多台服务器)。在一些实施方案中,报告生成器将报告发送到接收者的设备,例如个人计算机、电话、平板电脑或其他设备。该报告可以被在线查看、保存在接受者的设备上或打印。
在一方面,本公开内容提供一种包括代码的计算机可读介质,该代码在被一个或多个处理器执行时,实现根据本文公开的任何方法的方法。计算机可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机中的任何存储设备和/或存储器设备等,例如可用于实施延伸反应和/或扩增反应等。存储和/或存储器设备是一个或多个物理装置,用于临时或永久地存储数据或程序。在一些实施方案中,该设备是非易失性存储器,并且在数字处理设备不通电时保留所存储的信息。在进一步的实施方案中,非易失性存储器包括闪存。在一些实施方案中,非易失性存储器包括动态随机存取存储器(DRAM)。在一些实施方案中,非易失性存储器包括铁电随机存取存储器(FRAM)。在一些实施方案中,非易失性存储器包括相变随机存取存储器(PRAM)。在其他实施方案中,该设备是存储设备,作为非限制性示例,其包括CD-ROM、DVD、闪存设备、磁盘驱动器、磁带驱动器、光盘驱动器、打孔卡纸带、任何其他带有孔图案的物理存储介质、RAM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、用于传输数据或指令的载波、用于传输此类载波的电缆或链路,或计算机可以从中读取编程代码和/或数据的任何其他介质,以及基于云计算的存储。在进一步的实施方案中,存储和/或存储器设备是诸如本文公开的那些设备的组合。在一些实施方案中,该设备是易失性存储器,并且需要电力来维持存储的信息。易失性存储介质包括动态存储器,例如计算机的主存储器。有形的传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内的总线的电线。载波传输介质可以采用电信号或电磁信号或声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间生成的那些。这些形式的计算机可读介质中的许多可涉及将一个或多个指令的一个或多个序列载送给处理器以用于执行。
定义
除非另有说明,否则本文公开的一些方法的实践采用在本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术。参见例如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012);Current Protocols in Molecular Biology系列(F.M.Ausubel等人著);Methods InEnzymology系列(AcademicPress,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor著(1995));Harlow和Lane著(1988)Antibodies,A LaboratoryManual;以及Culture of Animal Cells:A Manual of Basic Technique andSpecialized Applications,第6版(R.I.Freshney著(2010))。
术语“约”和“大约”意指在特定值的可接受误差范围内,如本领域普通技术人员所确定的那样,这将部分取决于如何测量或确定该值,例如测量系统的局限性。例如,按照本领域的实践,“约”可以意指在1个或超过1个标准偏差之内。可替选地,“约”可以意指给定值的至多20%、至多10%、至多5%或至多1%的范围。可替选地,特别是关于生物系统或过程,该术语可以意指在数值的数量级内,优选在5倍以内,更优选在2倍以内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,否则应假设术语“约”意指在该特定值的可接受的误差范围内。
术语“多核苷酸”、“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸聚合形式,即脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区、根据连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。多核苷酸可以包含一个或多个经修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。对核苷酸结构的修饰如果存在,可以在聚合物组装之前或之后赋予。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可在聚合后被进一步修饰,例如通过与标记组分缀合。
如本文所用,术语“链”是指由通过共价键例如磷酸二酯键而共价连接在一起的核苷酸组成的核酸。在细胞中,DNA通常以双链形式存在,因此具有两条互补的核酸链,该两条互补的核酸链在本文中被称为“上”链和“下”链。在一些情况下,染色体区域的互补链可以被称为“正”链和“负”链、“第一”链和“第二”链、“编码”链和“非编码”链、“沃森”链和“克里克”链、或“有义”链和“反义”链。将链指定为上链或下链是任意的,并不意味着任何特定的取向、功能或结构。
多核苷酸可具有5’端和3’端,指多核苷酸或核酸的单链的端对端化学取向。在线性DNA或RNA的单链中,在核苷酸糖环上命名碳原子的化学约定意指,通常存在5’端和3’端,该5’端经常包含附接到5’碳上的磷酸基团,而该3’端通常是未从核糖-OH取代基(羟基)修饰的。在一些情况下,多核苷酸在5’端可具有-OH取代基或羟基,且在3’端可具有-P基团或磷酸基团。附接到5’端的磷酸基团允许两个核苷酸连接,例如5’-磷酸与另一个核苷酸的3’-羟基共价结合,形成磷酸二酯键。去除5’-磷酸可抑制或阻止连接。3’-羟基也很重要,因为它在连接中与5’-磷酸接合。
如本文所用,术语“标签”是指提供鉴定与其附接的多核苷酸的手段的核酸分子。例如,标签可包含多核苷酸序列,该多核苷酸序列允许对与其附接的靶多核苷酸进行鉴定、识别和/或分子或生化操作(例如,通过提供用于与寡核苷酸退火的位点,该寡核苷酸是例如用于通过DNA聚合酶延伸的引物,或用于捕获或用于连接反应的寡核苷酸)。将标签附接至多核苷酸分子的过程有时在本文中称为“标签化”,而经历了标签化或包含标签的多核苷酸被称为“标签化的”(例如,“标签化的多核苷酸”或“标签化的片段”)。例如,标签化的多核苷酸片段(例如,标签化的片段)可以包含具有作为标签的转座子核酸的转座子。
当提及等位基因或序列时,术语“野生型”通常是指编码特定自然群体中最常见的表型的等位基因或序列。在一些情况下,野生型等位基因可以指群体中出现频率最高的等位基因。在一些情况下,野生型等位基因或序列是指相对于异常状态(例如疾病状态),与正常状态相关的等位基因或序列。
当提及等位基因或序列时,术语“突变体”或“变体”通常是指不编码在特定自然群体中最常见的表型的等位基因或序列。在一些情况下,突变体等位基因可以指相对于野生型等位基因在群体中以较低频率存在的等位基因。在一些情况下,突变体等位基因或序列可以指从野生型序列突变为呈现与疾病状态相关的表型的突变体序列的等位基因或序列。突变体等位基因和序列可以与野生型等位基因和序列仅相差一个碱基,但也可以相差多达多个碱基。当提及基因时,术语突变体通常指基因中的一个或多个序列突变,包括点突变、单核苷酸多态性(SNP)、插入、缺失、置换、转座、易位、拷贝数变异、另一种遗传突变、替换或序列变异。
如本文所用,术语“杂交”和“退火”通常是其中指一个或多个核酸分子反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键键合被稳定。氢键键合可以通过沃森克里克碱基配对、霍格斯坦(hoogstein)结合或以任何其他序列特异性方式发生。该复合物可包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、一条自杂交链或它们的任意组合。杂交反应可以构成更广泛过程中的一个步骤,例如PCR的启动或核酶对核酸分子的酶促切割。可以通过与第二序列的核苷酸残基中的碱基的氢键键合来稳定的第一序列被称为与第二序列“可杂交”。在这种情况下,第二序列也可以说是与第一序列可杂交。
如本文所用,术语“互补”、“互补序列”和“互补性”通常是指与给定序列完全互补且可杂交的序列。在一些情况下,如果给定核酸在给定区域上的碱基序列能够互补地结合其结合配偶体的碱基序列,使得形成例如A-T、A-U、G-C和G-U碱基对,则与给定核酸杂交的序列被称为该给定分子的“互补序列”或“反向互补序列”。通常,可与第二序列杂交的第一序列可以与第二序列特异性或选择性地杂交,从而在杂交反应期间,与第二序列或第二序列的组杂交(例如在给定一组条件,例如本领域常用的严格条件下,在热力学上更稳定)优先于与非靶序列杂交。通常,可杂交序列在其各自长度的全部或部分上享有一定程度的序列互补性,例如25%-100%的互补性,包括至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和100%的序列互补性。序列同一性(例如出于评估百分比互补性的目的)可以通过任何合适的比对算法进行测量,包括但不限于Needleman-Wunsch算法(参见例如www.ebi.ac.uk/Tools/psa/e Mboss_needle/nucleotide.html上的EMBOSS Needle比对器,可选地采用默认设置)、BLAST算法(参见例如blast.ncbi.nlm.nih.gov/Blast.cgi上可用的BLAST比对工具,可选地采用默认设置)或Smith-Waterman算法(例如,参见例如www.ebi.ac.uk/Tools/psa/e Mboss_water/nucleotide.html上的EMBOSS Water比对器,可选地采用默认设置)。可以使用所选算法的任何合适参数(包括默认参数)来评估最佳比对。
如本文所用,术语“突出端片段”是指在核酸分子的一个或两个末端具有未配对的核苷酸的双链核酸分子,例如较长双链核酸分子的片段。在不存在突出端的情况下,双链核酸分子可以被称为具有“平端”。
如本文所用,术语“茎-环产物”和“茎-环结构”通常是指其中在核酸分子的部分之间发生分子内杂交的核酸分子的二级结构。当单个核酸分子链的两个区域杂交形成双链部分(可以称为“茎”)和未配对的单链环(可以被称为环)时,可以形成茎环。茎可以是任何可变长度的碱基对,并且沿着茎的碱基配对可以在内部被参与茎的一个或两个部分上的一个或多个未配对碱基的间隙内部中断。该环可以是任何可变长度的非配对碱基。在一些情况下,该环的长度至少为3个碱基。在一些情况下,形成“茎”的两个区域是完全互补的。在一些情况下,形成“茎”的两个区域是部分互补的。在一些情况下,单个核酸分子可包含一个茎环结构。在一些情况下,单个核酸分子可包含多于一个的茎环结构。茎环结构的茎部分可以终止为不具有突出端的双链节段、具有包含5’突出端的单链节段、具有包含3’突出端的单链节段、或具有从5’端和3’端两者延伸的单链部分。茎环结构也可以被称为“发夹”或“发夹结构”。
如本文所用,术语“衔接子”通常是指可以附接至另一核酸分子的核酸。例如,衔接子可以指可以附接至单链核酸分子的单链核酸分子(例如,无细胞核酸分子、无细胞核酸分子的片段、基因组DNA或基因组DNA的片段)。在一些情况下,衔接子可以指可以附接至另一个双链核酸的双链核酸(例如,无细胞核酸分子、无细胞核酸分子的片段、基因组DNA或基因组DNA的片段)。衔接子可以附接至核酸分子的5’端或3’端。在一些情况下,衔接子可以附接至核酸分子的两端,即每端附接一个衔接子。
如本文所用,术语“引物”通常是指天然的或合成的寡核苷酸,其在与核酸分子模板形成双链体后能够充当核酸合成的起始点并能够沿模板从其3’端延伸,从而形成延伸的双链体。在延伸反应期间添加的核苷酸的序列可以由模板核酸分子的序列确定。通常,引物由DNA聚合酶延伸。有时,引物由逆转录酶延伸。引物的长度通常与其在引物延伸产物的合成中的用途相兼容,并且长度通常在8至100个核苷酸的范围内,例如10至75、15至60、15至40、18至30、20至40、21至50、22至45、25至40等,更通常在18-40、20-35、21-30个核苷酸长的范围内,以及在所述范围之间的任何长度。典型的引物的长度可以在10-50个核苷酸的范围内,例如15-45、18-40、20-30、21-25等,以及在所述范围之间的任何长度。在一些实施方案中,引物长度通常不超过约10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65或70个核苷酸。
引物通常是单链的,以便最大化扩增效率,但可替选地可以是双链的。如果引物是双链的,则在用于制备引物延伸产物(或简称为延伸产物)之前,可先对其进行处理以分离其链。该变性步骤可以通过加热来进行,但可替选地也可以使用碱和随后的中和来进行。因此,“引物”与核酸分子模板互补,并通过氢键键合或与模板杂交形成复合物,以提供用于通过聚合酶引发合成的引物/模板复合物,该引物/模板复合物通过在DNA合成过程中添加与模板互补的在其3’端连接的共价键合碱基进行延伸。
如本文所用,术语“延伸产物”通常是指其中核苷酸引物通过核苷酸的共价添加而延伸的反应的产物。在一些情况下,核苷酸掺入可以由模板引导。在一些情况下,核苷酸掺入可在没有模板的情况下发生(例如,“模板独立性”)。在一些情况下,延伸产物是扩增产物,例如来自PCR扩增、滚环扩增(RCA)或等温扩增的扩增产物。
如本文所用,术语“扩增”和“扩增的”通常是指藉此由靶核酸分子或其一部分制成一个或多个拷贝的任何过程。可以使用各种扩增核酸分子(例如DNA和/或RNA)的方法,本文描述了其一些示例。扩增可以是线性的、指数性的,或在多相扩增过程中可以包括线性相和指数性相。扩增方法可以涉及温度变化,例如热变性步骤,或者可以是不需要热变性的等温过程。在一些情况下,使用一对引物通过PCR进行扩增。可以对扩增的产物进行后续分析,包括但不限于解链曲线分析、核苷酸测序、单链构象多态性测定、等位基因特异性寡核苷酸杂交、Southern印迹分析和限制性核酸内切酶消化。
关于核酸分子或核酸分子复合物,包括但不限于标签化产物和延伸产物,术语“分离的”和“分离”通常是指制备不含至少某些其他组分的物质(例如,核酸分子、核酸分子复合物、其标签化产物及延伸产物),这些其他组分也可存在于天然存在或最初获得该物质或类似物质之处(例如,生物样品、样品反应体积,例如标签化反应体积、延伸反应体积等)。例如,可以使用纯化技术从源混合物中制备分离的物质,从而将其富集。可以基于绝对量或以浓度(例如以每体积溶液的重量、每体积溶液的分子数)或任何其他适当的量度来测量富集。
如本文所用,术语“RNA-DNA”、“DNA-RNA”、“RNA-DNA杂交体”或“DNA-RNA杂交体”通常是指包含核糖核苷酸和脱氧核糖核苷酸的核酸分子。在一些情况下,RNA-DNA具有核糖核苷酸链和脱氧核糖核苷酸链,其中脱氧核糖核苷酸链与核糖核苷酸链互补。通常RNA-DNA是RNA链和与RNA链互补的DNA链。有时RNA-DNA具有包含核糖核苷酸和脱氧核糖核苷酸两者的链。
示例性实施方案
在示例性实施方案中的是:1.一种组合物,包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。2.实施方案1的组合物,其中第一标签和第二标签共享共同的核酸序列。3.实施方案1的组合物,其中第一标签和第二标签包含不同的核酸序列。4.实施方案1的组合物,该组合物包含具有多肽转座酶和包含镶嵌端和第二标签的核酸的转座体。5.实施方案4的组合物,该组合物还包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体。6.实施方案1的组合物,其中包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。7.实施方案5的组合物,其中识别反应批次的标签包含UMI。8.实施方案1的组合物,其中该寡核苷酸包含聚T区段。9.实施方案1的组合物,其中该寡核苷酸包含基因特异性区段。10.实施方案1的组合物,该组合物包含核糖核酸样品。11.实施方案1的组合物,该组合物包含脱氧核糖核酸样品。12.实施方案1的组合物,该组合物包含核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。13.实施方案1的组合物,该组合物包含模板转换寡核苷酸(TSO)。14.实施方案13的组合物,其中TSO包含第一标签和镶嵌端。15.实施方案1的组合物,该组合物包含蛋白酶。16.实施方案15的组合物,其中蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。17.实施方案1的组合物,该组合物包含聚合酶。18.实施方案17的组合物,其中聚合酶是DNA聚合酶。19.实施方案17的组合物,其中聚合酶是热稳定的聚合酶。20.实施方案1的组合物,该组合物包含连接酶。21.实施方案1的组合物,该组合物包含用于核酸分子的扩增反应的酶。22.实施方案1的组合物,该组合物包含寡核苷酸,该寡核苷酸包含与第一标签或第二标签的一部分互补的区段。23.实施方案1的组合物,其中该寡核苷酸包含序列衔接子。24.实施方案1的组合物,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。25.实施方案24的组合物,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。26.实施方案1的组合物,该组合物包含双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。27.实施方案13的组合物,该组合物包含平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。28.实施方案27的组合物,该组合物包含平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。29.实施方案27的组合物,该组合物包括序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。30.一种方法,包括使样品与组合物接触,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。31.实施方案30的方法,该方法包括向组合物中添加蛋白酶以使转座酶多肽失活。32.实施方案31的组合物,其中蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。33.实施方案30的方法,该方法包括向样品和组合物中添加聚合酶。34.实施方案33的组合物,其中聚合酶是DNA聚合酶。35.实施方案33的组合物,其中聚合酶是热稳定的聚合酶。36.实施方案33的方法,该方法包括添加包含序列衔接子的寡核苷酸以进行扩增反应并产生包含扩增产物的cDNA文库。37.实施方案30的方法,其中第一标签和第二标签包含不同的核酸序列。38.实施方案30的方法,该方法包括使样品与具有转座酶多肽和包含镶嵌端和第二标签的核酸的转座体接触。39.实施方案30的方法,其中第一标签和第二标签共享共同的核酸序列。40.实施方案30的方法,其中第一标签和第二标签包含不同的核酸序列。41.实施方案30的方法,其中包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。42.实施方案30的方法,其中包含镶嵌端和第二标签的核酸还包含识别反应批次的标签。43.实施方案41或42的方法,其中识别反应批次的标签包含UMI。44.实施方案30的方法,其中该寡核苷酸包含聚T区段。45.实施方案30的方法,其中该寡核苷酸包含基因特异性区段。46.实施方案30的方法,其中样品包括核糖核酸样品。47.实施方案30的方法,其中样品包括脱氧核糖核酸样品。48.实施方案30的方法,其中接触产生核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。49.实施方案30的方法,该组合物包含模板转换寡核苷酸(TSO)。50.实施方案49的组合物,其中TSO包含第一标签和镶嵌端。51.实施方案30的方法,其中包含序列衔接子的寡核苷酸包含细胞条形码和唯一分子标识符(UMI)并与珠粒结合。52.实施方案30的方法,其中转座酶多肽是Tn转座酶、MuA转座酶或Vibhar转座酶。53.实施方案52的方法,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。54.实施方案30的方法,其中接触产生双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。55.实施方案30的方法,其中该方法产生平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。56.实施方案30的方法,其中该方法产生平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。57.实施方案30的方法,其中该方法产生序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。58.在单个腔室中产生cDNA文库的方法,该方法包括:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子;和(e)在平端DNA/RNA杂交体分子的末端添加序列衔接子。59.实施方案58的方法,该方法包括在步骤(a)期间使用模板转换寡核苷酸(TSO)延伸cDNA的3’端。60.实施方案58的方法,该方法包括将互补的切割位点引入样品中的DNA分子中;在切割位点5’端附接5’突出端标签的群体;合成具有5’突出端标签的第二群体的平端DNA分子和与具有5’突出端标签的DNA分子互补的区段;以及在平端DNA分子的末端添加序列衔接子。61.实施方案58的方法,其中使用逆转录酶和包含镶嵌端和第二标签的寡核苷酸进行步骤(a)的逆转录。62.实施方案61的方法,其中该寡核苷酸包含聚T区段。63.实施方案61的方法,其中该寡核苷酸包含基因特异性区段。64.实施方案61的方法,其中步骤(b)和(c)通过具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体来进行。65.实施方案62的方法,其中第一标签和第二标签共享共同的核酸序列。66.实施方案62的方法,其中第一标签和第二标签包含不同的核酸序列。67.实施方案62的方法,其中包含镶嵌端和第一标签的核酸还包含识别反应批次的标签。68.实施方案67的方法,其中识别反应批次的标签包含UMI。69.实施方案58的方法,其中步骤(d)包括延伸反应。70.实施方案58的方法,其中步骤(e)包括聚合酶链反应(PCR)。71.实施方案62的方法,其中使用蛋白酶使转座酶多肽失活。72.实施方案71的组合物,其中蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。73.实施方案58的方法,其中步骤(d)和(e)包括添加聚合酶。74.实施方案73的组合物,其中聚合酶是DNA聚合酶。75.实施方案73的组合物,其中聚合酶是热稳定的聚合酶。76.实施方案58的方法,其中步骤(e)包括添加包含序列衔接子的寡核苷酸以进行扩增反应并产生包含扩增产物的cDNA文库。77.实施方案58的方法,其中该方法产生核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。78.实施方案58的方法,其中TSO包含第一标签和镶嵌端。79.实施方案58的方法,其中该方法产生双端标签化的RNA/DNA杂交体分子,该杂交体分子在5’端包含5’突出端标签,其中各个5’突出端标签包含第一标签或第二标签。80.实施方案58的方法,其中该方法产生平端DNA/RNA杂交体分子,该杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。81.实施方案58的方法,其中该方法产生平端DNA/RNA杂交体分子,在平端DNA/RNA杂交体分子的末端包含序列衔接子。82.实施方案58的方法,其中该方法产生序列文库,该序列文库包含多个平端DNA分子,在平端DNA分子的末端包含序列衔接子。83.产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在不超过2小时内产生。84.实施方案83的方法,其中cDNA文库是通过使mRNA样品与组合物接触而产生的,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。85.实施方案83的方法,其中cDNA文库是通过以下项而产生的:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;和(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子。86.实施方案83的方法,其中该文库在不超过1小时内产生。87.实施方案83的方法,其中该文库在不超过45分钟内产生。88.实施方案83的方法,该方法进一步包括将序列衔接子添加至平端DNA/RNA杂交体分子的末端。89.实施方案88的方法,其中该方法耗时不超过10小时。90.实施方案89的方法,其中该方法耗时不超过8小时。91.实施方案90的方法,其中该方法耗时不超过6小时。92.实施方案91的方法,其中该方法耗时不超过4小时。93.实施方案92的方法,其中该方法耗时不超过2小时。94.产生具有接近全长mRNA覆盖的cDNA文库的方法,该文库包含双端标签化的批次标记的cDNA区段,其中该文库在单个腔室内产生。95.实施方案94的方法,其中cDNA文库是通过使mRNA样品与组合物接触而产生的,该组合物包含具有转座酶多肽和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。96.实施方案94的方法,其中cDNA文库是通过以下项而产生的:(a)将样品中的RNA样品逆转录;(b)将互补的切割位点引入DNA/RNA杂交体分子中;(c)在切割位点5’端附接5’突出端标签的群体;(d)合成来自DNA/RNA杂交体分子的3’凹端的与5’突出端标签互补的区段,以形成平端DNA/RNA杂交体分子;和(e)在平端DNA/RNA杂交体分子的末端添加序列衔接子。97.从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括:(a)使mRNA分子与组合物接触,该组合物包含:(i)包含转座酶多肽和第一转座子核酸的第一转座体、(ii)逆转录酶和(iii)包含第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在5’端包含第一转座子序列的突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一转座子序列或第一转座子序列的互补序列。98.实施方案97的方法,其中步骤(a)在单个腔室中进行。99.实施方案97的方法,其中该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。100.实施方案97的方法,其中该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。101.实施方案97的方法,其中第一转座子序列和第二转座子序列是相同的。102.实施方案97的方法,其中第一转座子序列和第二转座子序列不相同。103.实施方案97的方法,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。104.实施方案103的方法,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。105.实施方案97的方法,其中各个扩增产物还包含序列衔接子。106.实施方案97的方法,其中逆转录酶引物包含聚T区段。107.实施方案97的方法,其中逆转录酶引物包含与目标基因互补的区段。108.实施方案97的方法,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。109.实施方案97的方法,其中蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。110.实施方案97的方法,其中蛋白酶降解转座酶。111.从双端标签化的RNA-DNA片段产生测序文库的方法,该方法包括:(a)使mRNA链与组合物接触,该组合物包含:(i)包含转座酶和第一转座子序列的第一转座体、(ii)包含转座酶和第二转座子序列的第二转座体、(iii)逆转录酶和(iv)包含第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段,以产生包含扩增产物的测序文库,其中各个扩增产物包含第一和第二转座子序列。112.实施方案111的方法,其中步骤(a)在单个腔室中进行。113.实施方案111的方法,其中该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。114.实施方案111的方法,其中第一转座子序列和第二转座子序列是相同的。115.实施方案111的方法,其中第一转座子序列和第二转座子序列不相同。116.实施方案111的方法,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。117.实施方案116的方法,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。118.实施方案111的方法,其中逆转录酶引物包含聚T区段。119.实施方案111的方法,其中逆转录酶引物包含与目标基因互补的区段。120.实施方案111的方法,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。121.实施方案111的方法,其中各个扩增产物还包含序列衔接子。122.实施方案111的方法,其中蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。123.实施方案111的方法,其中蛋白酶降解转座酶。124.一种组合物,该组合物包含(a)包含RNA链和DNA链的双链多核苷酸;和(b)包含转座酶和转座子序列的转座体,其中多核苷酸与转座体接触以产生标签化的片段,该片段包含在5’端包含转座子序列的突出端。125.一种组合物,该组合物包含(a)包含转座酶和第一转座子序列的转座体;(b)逆转录酶;(c)包含第二转座子序列的逆转录酶引物;和(d)在不超过65℃的温度下有活性的蛋白酶。126.实施方案124或125的组合物,其中逆转录酶引物包含聚T序列。127.实施方案124或125的组合物,其中逆转录酶引物包含与目标基因互补的区段。128.实施方案124或125的组合物,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。129.实施方案124或125的组合物,其中该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。130.实施方案124或125的组合物,其中该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。131.实施方案124或125的组合物,其中第一转座子序列和第二转座子序列是相同的。132.实施方案124或125的组合物,其中第一转座子序列和第二转座子序列不相同。133.实施方案125的组合物,其中蛋白酶在大于65℃的温度下失活。134.实施方案125的组合物,其中蛋白酶降解转座酶。135.由样品产生基因组合的方法,该方法包括(a)使来自样品的双链多核苷酸和mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶和(iii)包含基因特异性序列和第二转座子序列的逆转录酶引物,其中接触产生包含cDNA链的双链mRNA-cDNA中间体,该cDNA链包含逆转录酶引物并且与mRNA链互补;多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;以及多个标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子序列的突出端;(b)添加包含基因特异性序列和第二转座子序列的第一引物,和包含该基因特异性序列和该第二转座子序列的互补序列的第二引物,以接触多个标签化的双链DNA片段以产生多个双标签化的双链DNA片段,该片段包含在第一5’端包含第一转座子序列的突出端和在第二5’端包含第二转座子序列的突出端;(c)对多个标签化的mRNA-cDNA片段和多个标签化的双链DNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段以产生扩增产物,其中各个扩增产物包含第一和第二转座子序列,并且其中基因组合包含扩增产物。136.实施方案135的方法,其中步骤(a)在单个腔室中进行。137.实施方案135的方法,其中基因组合由不超过10小时的单个腔室反应产生。138.实施方案137的方法,其中基因组合由不超过8小时的单个腔室反应产生。139.实施方案138的方法,其中基因组合由不超过6小时的单个腔室反应产生。140.实施方案139的方法,其中基因组合由不超过4小时的单个腔室反应产生。141.实施方案140的方法,其中基因组合由不超过2小时的单个腔室反应产生。142.实施方案135的方法,其中多核苷酸包含基因组DNA。143.实施方案135的方法,其中多核苷酸和mRNA来自单个细胞。144.实施方案135的方法,其中多核苷酸和mRNA获自福尔马林固定的石蜡包埋的(FFPE)组织样品。145.实施方案135的方法,其中多核苷酸和mRNA获自冷冻的组织样品。146.实施方案135的方法,其中该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。147.实施方案135的方法,其中该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。148.实施方案135的方法,其中第一转座子序列和第二转座子序列是相同的。149.实施方案135的方法,其中第一转座子序列和第二转座子序列不相同。150.实施方案135的方法,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。151.实施方案150的方法,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。152.实施方案135的方法,其中逆转录酶引物包含聚T区段。153.实施方案135的方法,其中逆转录酶引物包含与目标基因互补的区段。154.实施方案135的方法,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。155.实施方案135的方法,其中各个扩增产物还包含序列衔接子。156.产生核酸文库的方法,该方法包括(a)使mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)包含转座酶和第二转座子序列的第二转座体、(iii)逆转录酶、(iv)包含第二转座子序列的逆转录酶引物和(v)包含第一转座子序列的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个平端片段;和(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物和包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个平端片段,以产生扩增产物,其中各个扩增产物包含第一和第二转座子序列。157.产生核酸文库的方法,该方法包括(a)使mRNA链与组合物接触,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶、(iii)包含第一转座子序列的逆转录酶引物和(iv)包含第一转座子序列的模板转换寡核苷酸(TSO),其中接触产生双链mRNA-cDNA中间体,该中间体包含在5’端具有TSO的mRNA链和在cDNA链的3’端具有逆转录酶引物并且与该mRNA和TSO互补的cDNA链;以及多个标签化的mRNA-cDNA片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第一转座子序列的第二突出端;(b)使用蛋白酶使转座酶失活;(c)对多个标签化的mRNA-cDNA片段进行延伸反应,以产生多个第一平端片段;(d)使用包含第一转座子序列或第一转座子序列的一部分的第一引物扩增第一多个平端片段,以产生第一扩增产物,其中各个第一扩增产物包含第一转座子序列;(e)使第一扩增产物与包含第二转座体的组合物接触,该第二转座体包含转座酶和第二转座子序列,以产生多个标签化的片段,该片段包含在第一5’端包含第一转座子序列的第一突出端和在第二5’端包含第二转座子序列的第二突出端;(f)对多个标签化的片段进行延伸反应,以产生多个第二平端片段;和(g)使用包含第二转座子序列或第二转座子序列的一部分的第二引物扩增多个第二平端片段,以产生第二扩增产物,其中各个第二扩增产物包含第一和转座子序列。158.实施方案156或157的方法,其中步骤(a)在单个腔室中进行。159.实施方案156或157的方法,其中TSO的使用提供了mRNA链的5’端的完全覆盖。160.实施方案156或157的方法,其中基因组合由不超过4小时的单个腔室反应产生。161.实施方案156或157的方法,其中mRNA链来自单个细胞。162.实施方案156或157的方法,其中mRNA链获自福尔马林固定的石蜡包埋的(FFPE)组织样品。163.实施方案156或157的方法,其中mRNA链获自冷冻的组织样品。164.实施方案157的方法,其中该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。165.实施方案156或157的方法,其中该组合物还包含第三转座体,该第三转座体包含转座酶、第一转座子序列和第二转座子序列。166.实施方案156或157的方法,其中第一转座子序列和第二转座子序列是相同的。167.实施方案156或157的方法,其中第一转座子序列和第二转座子序列不相同。168.实施方案156或157的方法,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。169.实施方案156或157的方法,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。170.实施方案156或157的方法,其中转座体包含单体的二聚体,其中各个单体包含与转座子序列复合的转座酶。171.实施方案156或157的方法,其中逆转录酶引物包含聚T区段。172.实施方案156或157的方法,其中逆转录酶引物包含与目标基因互补的区段。173.实施方案156或157的方法,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。174.实施方案156或157的方法,其中各个扩增产物还包含序列衔接子。175.一种反应混合物,该反应混合物包含(a)来自样品的mRNA链;和(b)组合物,该组合物包含(i)包含转座酶和第一转座子序列的第一转座体、(ii)逆转录酶和(iii)包含第二转座子序列的逆转录酶引物。176.实施方案175的反应混合物,该反应混合物包含双链多核苷酸,该双链多核苷酸包含来自样品的基因组DNA。177.实施方案175的反应混合物,其中该组合物还包含(iv)包含基因特异性序列和第二转座子序列的第一引物和(v)包含该基因特异性序列和该第二转座子序列的互补序列的第二引物。178.实施方案175的反应混合物,其中该组合物还包含第二转座体,该第二转座体包含转座酶和第二转座子序列。179.实施方案175的反应混合物,其中第一和第二转座子序列是相同的。180.实施方案175的反应混合物,其中第一和第二转座子序列不相同。181.实施方案175-178中任一项的反应混合物,其中转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。182.实施方案181的反应混合物,其中Tn转座酶选自Tn3、Tn5、Tn7和Tn10。183.实施方案175的反应混合物,其中逆转录酶引物包含聚T区段。184.实施方案175的反应混合物,其中逆转录酶引物包含与目标基因互补的区段。185.实施方案175的方法,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。186.实施方案175的反应混合物,其中该组合物还包含模板转换寡核苷酸(TSO)。187.实施方案186的反应混合物,其中TSO包含第一转座子序列和镶嵌端。188.实施方案175的反应混合物,其中该组合物还包含蛋白酶,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。189.试剂盒,该试剂盒包含(a)一组第一转座体,各个第一转座体包含第一转座子序列;(b)一组第二转座体,各个第二转座体包含第二转座子序列;(c)逆转录酶;(d)包含第一转座子序列的逆转录酶引物;和(e)用于实施实施方案97、111、135、156或157的方法的说明。190.试剂盒,该试剂盒包含:(a)一组转座体,该转座体包含(i)包含第一转座子序列的同二聚体转座酶、(ii)包含第二转座子序列的同二聚体转座酶以及任选的(iii)包含第一转座子序列和第二转座子序列的异二聚体转座酶;(b)逆转录酶;(c)包含第一转座子序列的逆转录酶引物;和(d)用于实施实施方案97、111、135、156或157的方法的说明。191.实施方案189或190的试剂盒,该试剂盒还包含模板转换寡核苷酸(TSO)。192.实施方案191的试剂盒,其中TSO包含第一转座子序列和镶嵌端。193.实施方案189或190的试剂盒,其中逆转录酶引物包含聚T区段。194.实施方案189或190的试剂盒,该试剂盒还包含引物,该引物包含基因特异性序列。195.实施方案189或190的试剂盒,其中逆转录酶引物包含细胞条形码和唯一分子标识符(UMI),并且其中逆转录酶引物与珠粒结合。196.实施方案189或190的试剂盒,该试剂盒还包含基因特异性序列的引物互补区段。197.实施方案189或190的试剂盒,该试剂盒还包含蛋白酶,该蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。
实施例
给出以下实施例是为了说明本公开内容的各种实施方案,并不意味着以任何方式限制本公开。本实施例以及本文描述的方法是示例,并且不意图限制本公开内容的范围。
实施例1
本文提供了从双端标签化的RNA-DNA杂交体片段产生mRNA分子的cDNA文库的示例性方法。
为了产生含N1-ME的转座体复合物,在1x STE(10mM Tris pH8.0,50mM NaCl,1mMEDTA)的存在下通过在95℃下温育1分钟然后冷却至室温,将等摩尔的DNA寡核苷酸转座子N1-ME:GTAGGTGTGAGTGATGGTTGAGGTAGT-AGATGTGTATAAGAGACAG(SEQ ID NO:1)和ME’:(5phos)-CTGTCTCTTATACACATCT(SEQ ID NO:2)退火。然后将双链转座子与Tn5转座酶以1.2:1的摩尔比在室温下温育30分钟,以形成转座体复合物(Tn5-N1-ME)。
为了产生含N2-ME的转座体复合物,在1x STE(10mM Tris pH8.0,50mM NaCl,1mMEDTA)的存在下通过在95℃下温育1分钟然后冷却至室温,将等摩尔的DNA寡核苷酸转座子N2-ME:GTGAGTGATGGTTGAGGTAGTGTGGAG-AGATGTGTATAAGAGACAG(SEQ ID NO:3)和ME’:(5phos)-CTGTCTCTTATACACATCT(SEQ ID NO:2)退火。然后将双链转座子与Tn5转座酶以1.2:1的摩尔比在室温下温育30分钟,以形成转座体复合物(Tn5-N2-ME)。
将30pg mRNA与SuperScript IV逆转录酶、N1ME-T20VN的逆转录酶引物、dNTP、转座体复合物Tn5-N1-ME和转座体复合物Tn5-N2-ME在5mM MgCl2存在下于55℃温育30分钟。随后将1uL的2mg/ml蛋白酶加入反应中。然后将反应在50℃下温育10分钟,然后在72℃下温育15分钟。
在索引扩增中,将片段化的双链mRNA-cDNA杂交体与1x Q5反应缓冲液、0.02U/uLQ5热启动高保真DNA聚合酶(New England BioLabs Inc)、200uM dNTP和0.5uM索引引物混合物在20uL反应中温育。反应在以下条件下进行:72℃持续3分钟;98℃持续2分钟,然后进行16个98℃持续15秒和72℃持续3分30秒的循环。
将得到的扩增产物纯化以用作在Illumina HiSeq X或NovaSeq测序仪上测序以用于配对末端读取的文库。
尽管本文已经示出和描述了本公开内容的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本公开内容的情况下,本领域技术人员此时将想到许多变化、改变和替换。应当理解,本文所述的本公开内容的实施方案的各种可替选方案可用于实施本公开内容。意图是所附权利要求限定本公开内容的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同方案。
序列表
<110> 埃克斯基因美国公司
<120> 转座体使能的DNA/RNA测序(TED RNA-SEQ)
<130> 53081-703.601
<140>
<141>
<150> 62/696,681
<151> 2018-07-11
<160> 3
<170> PatentIn版本3.5
<210> 1
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<400> 1
gtaggtgtga gtgatggttg aggtagtaga tgtgtataag agacag 46
<210> 2
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<400> 2
ctgtctctta tacacatct 19
<210> 3
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<400> 3
gtgagtgatg gttgaggtag tgtggagaga tgtgtataag agacag 46
Claims (29)
1.一种组合物,包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体、逆转录酶、包含镶嵌端和第二标签的寡核苷酸。
2.根据权利要求1所述的组合物,其中所述第一标签和所述第二标签共享共同的核酸序列。
3.根据权利要求1所述的组合物,其中所述第一标签和所述第二标签包含不同的核酸序列。
4.根据权利要求1所述的组合物,所述组合物包含具有多肽转座酶和包含镶嵌端和第二标签的核酸的转座体。
5.根据权利要求4所述的组合物,所述组合物还包含具有多肽转座酶和包含镶嵌端和第一标签的核酸的转座体。
6.根据权利要求1所述的组合物,其中包含镶嵌端和第一标签的所述核酸还包含识别反应批次的标签。
7.根据权利要求6所述的组合物,其中识别反应批次的所述标签包含UMI。
8.根据权利要求1所述的组合物,其中所述寡核苷酸包含聚T区段。
9.根据权利要求1所述的组合物,其中所述寡核苷酸包含基因特异性区段。
10.根据权利要求1所述的组合物,所述组合物包含核糖核酸样品。
11.根据权利要求1所述的组合物,所述组合物包含脱氧核糖核酸样品。
12.根据权利要求1所述的组合物,所述组合物包含核糖核酸/脱氧核糖核酸(RNA/DNA)杂交体分子。
13.根据权利要求1所述的组合物,所述组合物包含模板转换寡核苷酸(TSO)。
14.根据权利要求13所述的组合物,其中所述TSO包含第一标签和镶嵌端。
15.根据权利要求1所述的组合物,所述组合物包含蛋白酶。
16.根据权利要求15所述的组合物,其中所述蛋白酶在不超过65℃的温度下有活性,而在超过65℃的温度下无活性。
17.根据权利要求1所述的组合物,所述组合物包含聚合酶。
18.根据权利要求17所述的组合物,其中所述聚合酶是DNA聚合酶。
19.根据权利要求17所述的组合物,其中所述聚合酶是热稳定的聚合酶。
20.根据权利要求1所述的组合物,所述组合物包含连接酶。
21.根据权利要求1所述的组合物,所述组合物包含用于核酸分子的扩增反应的酶。
22.根据权利要求1所述的组合物,所述组合物包含寡核苷酸,所述寡核苷酸包含与所述第一标签或所述第二标签的一部分互补的区段。
23.根据权利要求1所述的组合物,其中所述寡核苷酸包含序列衔接子。
24.根据权利要求1所述的组合物,其中所述转座酶是Tn转座酶、MuA转座酶或Vibhar转座酶。
25.根据权利要求24所述的组合物,其中所述Tn转座酶选自Tn3、Tn5、Tn7和Tn10。
26.根据权利要求1所述的组合物,所述组合物包含双端标签化的RNA/DNA杂交体分子,所述杂交体分子在5’端包含5’突出端标签,其中各个所述5’突出端标签包含第一标签或第二标签。
27.根据权利要求13所述的组合物,所述组合物包含平端DNA/RNA杂交体分子,所述杂交体分子包含来自双端标签化的RNA/DNA杂交体分子的3’凹端的与5’突出端标签互补的区段。
28.根据权利要求27所述的组合物,所述组合物包含所述平端DNA/RNA杂交体分子,在所述平端DNA/RNA杂交体分子的末端包含序列衔接子。
29.根据权利要求27所述的组合物,所述组合物包括序列文库,所述序列文库包含多个平端DNA分子,在所述平端DNA分子的末端包含序列衔接子。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862696681P | 2018-07-11 | 2018-07-11 | |
US62/696,681 | 2018-07-11 | ||
PCT/US2019/041121 WO2020014303A1 (en) | 2018-07-11 | 2019-07-10 | Transposome enabled dna/rna-sequencing (ted rna-seq) |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112689673A true CN112689673A (zh) | 2021-04-20 |
Family
ID=69142494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980059589.3A Pending CN112689673A (zh) | 2018-07-11 | 2019-07-10 | 转座体使能的dna/rna测序(ted rna-seq) |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210222163A1 (zh) |
EP (1) | EP3821011B1 (zh) |
CN (1) | CN112689673A (zh) |
DK (1) | DK3821011T3 (zh) |
WO (1) | WO2020014303A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108728477A (zh) * | 2017-04-24 | 2018-11-02 | 华东理工大学 | 一种高效的转座突变系统及构建方法 |
CN112501249A (zh) * | 2019-09-16 | 2021-03-16 | 深圳市真迈生物科技有限公司 | Rna文库的制备方法、测序方法和试剂盒 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2504240B (en) | 2012-02-27 | 2015-05-27 | Cellular Res Inc | Compositions and kits for molecular counting of nucleic acids |
KR102536833B1 (ko) | 2013-08-28 | 2023-05-26 | 벡톤 디킨슨 앤드 컴퍼니 | 대량의 동시 단일 세포 분석 |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
SG11201901733PA (en) | 2016-09-26 | 2019-04-29 | Cellular Res Inc | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
CN112805389A (zh) | 2018-10-01 | 2021-05-14 | 贝克顿迪金森公司 | 确定5’转录物序列 |
US11939622B2 (en) | 2019-07-22 | 2024-03-26 | Becton, Dickinson And Company | Single cell chromatin immunoprecipitation sequencing assay |
CN114981409A (zh) | 2019-09-03 | 2022-08-30 | 美洛德生物医药公司 | 用于基因组整合的方法和组合物 |
US11773436B2 (en) | 2019-11-08 | 2023-10-03 | Becton, Dickinson And Company | Using random priming to obtain full-length V(D)J information for immune repertoire sequencing |
CN115244184A (zh) | 2020-01-13 | 2022-10-25 | 贝克顿迪金森公司 | 用于定量蛋白和rna的方法和组合物 |
CN111188094B (zh) * | 2020-02-24 | 2020-10-16 | 南京诺唯赞生物科技股份有限公司 | 一种用于病原微生物检测的测序文库构建方法和试剂盒 |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
EP4247967A1 (en) | 2020-11-20 | 2023-09-27 | Becton, Dickinson and Company | Profiling of highly expressed and lowly expressed proteins |
WO2023044307A1 (en) * | 2021-09-14 | 2023-03-23 | Becton, Dickinson And Company | Full length single cell rna sequencing |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040197793A1 (en) * | 2002-08-30 | 2004-10-07 | Arjang Hassibi | Methods and apparatus for biomolecule detection, identification, quantification and/or sequencing |
US20100120098A1 (en) * | 2008-10-24 | 2010-05-13 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
CN102264914A (zh) * | 2008-10-24 | 2011-11-30 | 阿霹震中科技公司 | 用于修饰核酸的转座子末端组合物和方法 |
CA2898456A1 (en) * | 2013-03-13 | 2014-09-18 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
CN106103713A (zh) * | 2014-02-03 | 2016-11-09 | 赛默飞世尔科技波罗的海封闭股份公司 | 用于经控制dna片段化的方法 |
WO2017004083A1 (en) * | 2015-06-29 | 2017-01-05 | The Regents Of The University Of California | Methods of producing nucleic acid libraries and compositions and kits for practicing same |
WO2018027048A1 (en) * | 2016-08-05 | 2018-02-08 | Bio-Rad Laboratories, Inc. | Second strand direct |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
US9249460B2 (en) * | 2011-09-09 | 2016-02-02 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for obtaining a sequence |
WO2015168161A2 (en) * | 2014-04-29 | 2015-11-05 | Illumina, Inc. | Multiplexed single cell gene expression analysis using template switch and tagmentation |
US10017759B2 (en) * | 2014-06-26 | 2018-07-10 | Illumina, Inc. | Library preparation of tagged nucleic acid |
EP3286326A1 (en) * | 2015-04-23 | 2018-02-28 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
EP3350732A4 (en) * | 2015-09-15 | 2019-02-27 | Takara Bio USA, Inc. | METHOD FOR GENERATING A LIBRARY WITH SEQUENCING OF THE NEXT GENERATION (NGS) FROM A RIBONUCLEIC ACID (RNA) SAMPLE AND COMPOSITIONS FOR IMPLEMENTING THEREOF |
US10676734B2 (en) * | 2016-07-12 | 2020-06-09 | Life Technologies Corporation | Compositions and methods for detecting nucleic acid regions |
-
2019
- 2019-07-10 US US17/257,991 patent/US20210222163A1/en active Pending
- 2019-07-10 EP EP19834769.2A patent/EP3821011B1/en active Active
- 2019-07-10 CN CN201980059589.3A patent/CN112689673A/zh active Pending
- 2019-07-10 DK DK19834769.2T patent/DK3821011T3/da active
- 2019-07-10 WO PCT/US2019/041121 patent/WO2020014303A1/en unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040197793A1 (en) * | 2002-08-30 | 2004-10-07 | Arjang Hassibi | Methods and apparatus for biomolecule detection, identification, quantification and/or sequencing |
US20100120098A1 (en) * | 2008-10-24 | 2010-05-13 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
CN102264914A (zh) * | 2008-10-24 | 2011-11-30 | 阿霹震中科技公司 | 用于修饰核酸的转座子末端组合物和方法 |
CA2898456A1 (en) * | 2013-03-13 | 2014-09-18 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
CN106103713A (zh) * | 2014-02-03 | 2016-11-09 | 赛默飞世尔科技波罗的海封闭股份公司 | 用于经控制dna片段化的方法 |
WO2017004083A1 (en) * | 2015-06-29 | 2017-01-05 | The Regents Of The University Of California | Methods of producing nucleic acid libraries and compositions and kits for practicing same |
WO2018027048A1 (en) * | 2016-08-05 | 2018-02-08 | Bio-Rad Laboratories, Inc. | Second strand direct |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108728477A (zh) * | 2017-04-24 | 2018-11-02 | 华东理工大学 | 一种高效的转座突变系统及构建方法 |
CN112501249A (zh) * | 2019-09-16 | 2021-03-16 | 深圳市真迈生物科技有限公司 | Rna文库的制备方法、测序方法和试剂盒 |
CN112501249B (zh) * | 2019-09-16 | 2024-01-26 | 深圳市真迈生物科技有限公司 | Rna文库的制备方法、测序方法和试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
EP3821011B1 (en) | 2023-04-26 |
EP3821011A1 (en) | 2021-05-19 |
DK3821011T3 (da) | 2023-07-24 |
WO2020014303A1 (en) | 2020-01-16 |
US20210222163A1 (en) | 2021-07-22 |
EP3821011A4 (en) | 2022-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3821011B1 (en) | Transposome enabled dna/rna-sequencing (ted rna-seq) | |
CN113383083A (zh) | 用于制备多核苷酸的方法和组合物 | |
US20210254134A1 (en) | Methods and compositions for forming ligation products | |
US20180363039A1 (en) | Methods and compositions for forming ligation products | |
JP4773338B2 (ja) | Dna重合プロセスにより生成される全ゲノムおよび全トランスクリプトームライブラリーの増幅および分析 | |
US20230167493A1 (en) | Method of improved sequencing by strand identification | |
CN109689888B (zh) | 无细胞核酸标准品及其用途 | |
WO2016160965A1 (en) | Methods and compositions for repair of dna ends by multiple enzymatic activities | |
EP2807292A1 (en) | Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation | |
EP3436596A1 (en) | Use of transposase and y adapters to fragment and tag dna | |
US20130123117A1 (en) | Capture probe and assay for analysis of fragmented nucleic acids | |
US11203782B2 (en) | Compositions and methods comprising asymmetric barcoding | |
US20190169603A1 (en) | Compositions and Methods for Labeling Target Nucleic Acid Molecules | |
CA3095837A1 (en) | Compositions and methods for preparing nucleic acid libraries | |
WO2015050501A1 (en) | Amplification paralleled library enrichment | |
WO2019023243A1 (en) | METHODS AND COMPOSITIONS FOR SELECTING AND AMPLIFYING DNA TARGETS IN A SINGLE REACTION MIXTURE | |
CA3213037A1 (en) | Blocking oligonucleotides for the selective depletion of non-desirable fragments from amplified libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230309 Address after: Room 101, No. 29, Kechuangqi Street, Beijing Economic Development Zone, Daxing District, Beijing Applicant after: Peking University Address before: California, USA Applicant before: Exgene USA |
|
TA01 | Transfer of patent application right |