CN114450401A - 可用于对用于制备下一代测序文库的核酸进行标记的拴系有寡聚核苷酸的三磷酸核苷酸 - Google Patents
可用于对用于制备下一代测序文库的核酸进行标记的拴系有寡聚核苷酸的三磷酸核苷酸 Download PDFInfo
- Publication number
- CN114450401A CN114450401A CN202080051974.6A CN202080051974A CN114450401A CN 114450401 A CN114450401 A CN 114450401A CN 202080051974 A CN202080051974 A CN 202080051974A CN 114450401 A CN114450401 A CN 114450401A
- Authority
- CN
- China
- Prior art keywords
- oligonucleotide
- tethered
- polymerase
- nucleic acid
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002773 nucleotide Substances 0.000 title claims abstract description 387
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 384
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 371
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 370
- -1 nucleotide triphosphates Chemical class 0.000 title claims description 60
- 239000001226 triphosphate Substances 0.000 title claims description 25
- 235000011178 triphosphate Nutrition 0.000 title claims description 24
- 238000002372 labelling Methods 0.000 title description 35
- 238000007481 next generation sequencing Methods 0.000 title description 20
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 413
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 380
- 238000000034 method Methods 0.000 claims abstract description 264
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 243
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 242
- 210000004027 cell Anatomy 0.000 claims description 153
- 239000005546 dideoxynucleotide Substances 0.000 claims description 95
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 83
- 230000003321 amplification Effects 0.000 claims description 80
- 239000012634 fragment Substances 0.000 claims description 73
- 125000000304 alkynyl group Chemical group 0.000 claims description 57
- 125000002947 alkylene group Chemical group 0.000 claims description 56
- 238000000137 annealing Methods 0.000 claims description 53
- 230000000295 complement effect Effects 0.000 claims description 51
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 claims description 48
- 238000002360 preparation method Methods 0.000 claims description 45
- 125000000524 functional group Chemical group 0.000 claims description 43
- 238000012650 click reaction Methods 0.000 claims description 40
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 claims description 38
- 125000003342 alkenyl group Chemical group 0.000 claims description 35
- 125000004419 alkynylene group Chemical group 0.000 claims description 32
- 150000003573 thiols Chemical class 0.000 claims description 30
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 29
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 29
- 150000003839 salts Chemical class 0.000 claims description 29
- 125000000217 alkyl group Chemical group 0.000 claims description 28
- 150000002148 esters Chemical class 0.000 claims description 28
- 125000004450 alkenylene group Chemical group 0.000 claims description 27
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 26
- OTXOHOIOFJSIFX-POYBYMJQSA-N [[(2s,5r)-5-(2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(=O)NC(=O)C=C1 OTXOHOIOFJSIFX-POYBYMJQSA-N 0.000 claims description 26
- 125000000640 cyclooctyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 claims description 25
- 125000003368 amide group Chemical group 0.000 claims description 24
- 239000011230 binding agent Substances 0.000 claims description 23
- 150000008064 anhydrides Chemical class 0.000 claims description 22
- 150000002576 ketones Chemical class 0.000 claims description 22
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 claims description 20
- 239000004202 carbamide Substances 0.000 claims description 18
- 125000000623 heterocyclic group Chemical group 0.000 claims description 18
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 claims description 17
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 17
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 claims description 16
- 125000004432 carbon atom Chemical group C* 0.000 claims description 14
- 239000002771 cell marker Substances 0.000 claims description 14
- 150000003949 imides Chemical class 0.000 claims description 14
- 125000004433 nitrogen atom Chemical group N* 0.000 claims description 14
- 125000004434 sulfur atom Chemical group 0.000 claims description 14
- 150000003568 thioethers Chemical class 0.000 claims description 14
- 125000003277 amino group Chemical group 0.000 claims description 12
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 11
- 229940124530 sulfonamide Drugs 0.000 claims description 11
- 150000003456 sulfonamides Chemical class 0.000 claims description 11
- 229910052799 carbon Inorganic materials 0.000 claims description 10
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 claims description 9
- 125000000565 sulfonamide group Chemical group 0.000 claims description 9
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 9
- 125000005462 imide group Chemical group 0.000 claims description 8
- SQDFHQJTAWCFIB-UHFFFAOYSA-N n-methylidenehydroxylamine Chemical compound ON=C SQDFHQJTAWCFIB-UHFFFAOYSA-N 0.000 claims description 8
- 229910052757 nitrogen Inorganic materials 0.000 claims description 8
- 229910052717 sulfur Inorganic materials 0.000 claims description 8
- 125000003545 alkoxy group Chemical group 0.000 claims description 7
- 125000004430 oxygen atom Chemical group O* 0.000 claims description 7
- 108091023037 Aptamer Proteins 0.000 claims description 6
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 claims description 6
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 claims description 6
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 claims description 6
- 125000002252 acyl group Chemical group 0.000 claims description 6
- 150000001408 amides Chemical class 0.000 claims description 6
- 230000001413 cellular effect Effects 0.000 claims description 6
- 125000001841 imino group Chemical group [H]N=* 0.000 claims description 6
- 150000004713 phosphodiesters Chemical class 0.000 claims description 6
- 125000006294 amino alkylene group Chemical group 0.000 claims description 4
- JRZBPELLUMBLQU-UHFFFAOYSA-N carbonazidic acid Chemical compound OC(=O)N=[N+]=[N-] JRZBPELLUMBLQU-UHFFFAOYSA-N 0.000 claims description 4
- 125000001475 halogen functional group Chemical group 0.000 claims description 3
- 239000012954 diazonium Substances 0.000 claims description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-O diazynium Chemical compound [NH+]#N IJGRMHOSHXDMSA-UHFFFAOYSA-O 0.000 claims description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 abstract description 68
- 238000003203 nucleic acid sequencing method Methods 0.000 abstract 1
- 239000013615 primer Substances 0.000 description 284
- 238000006243 chemical reaction Methods 0.000 description 151
- 102000053602 DNA Human genes 0.000 description 112
- 108020004414 DNA Proteins 0.000 description 112
- 238000012163 sequencing technique Methods 0.000 description 104
- 239000000523 sample Substances 0.000 description 103
- 239000000047 product Substances 0.000 description 99
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 79
- 102100034343 Integrase Human genes 0.000 description 76
- 229920002477 rna polymer Polymers 0.000 description 69
- 238000010348 incorporation Methods 0.000 description 61
- 125000005647 linker group Chemical group 0.000 description 61
- 239000002157 polynucleotide Substances 0.000 description 61
- 102000040430 polynucleotide Human genes 0.000 description 61
- 108091033319 polynucleotide Proteins 0.000 description 61
- 239000000203 mixture Substances 0.000 description 55
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 52
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 52
- 238000005516 engineering process Methods 0.000 description 51
- 238000003752 polymerase chain reaction Methods 0.000 description 50
- 239000011324 bead Substances 0.000 description 37
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical group OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 33
- 239000002299 complementary DNA Substances 0.000 description 32
- 238000009739 binding Methods 0.000 description 31
- 238000003786 synthesis reaction Methods 0.000 description 30
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 29
- 239000007795 chemical reaction product Substances 0.000 description 28
- 238000010839 reverse transcription Methods 0.000 description 28
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 28
- 239000010949 copper Substances 0.000 description 27
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 27
- 238000012986 modification Methods 0.000 description 27
- 230000004048 modification Effects 0.000 description 27
- 108010006785 Taq Polymerase Proteins 0.000 description 26
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 26
- 239000000872 buffer Substances 0.000 description 26
- 230000001419 dependent effect Effects 0.000 description 25
- 108020004999 messenger RNA Proteins 0.000 description 25
- 150000001875 compounds Chemical class 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 23
- 238000002474 experimental method Methods 0.000 description 23
- 230000015572 biosynthetic process Effects 0.000 description 22
- 229920001223 polyethylene glycol Polymers 0.000 description 22
- 108090000623 proteins and genes Proteins 0.000 description 21
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 20
- 239000003054 catalyst Substances 0.000 description 20
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 20
- 229920001515 polyalkylene glycol Polymers 0.000 description 20
- 150000003852 triazoles Chemical group 0.000 description 20
- 210000004940 nucleus Anatomy 0.000 description 19
- 239000011541 reaction mixture Substances 0.000 description 19
- 239000002202 Polyethylene glycol Substances 0.000 description 18
- 238000004140 cleaning Methods 0.000 description 18
- 230000004927 fusion Effects 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- 101710137500 T7 RNA polymerase Proteins 0.000 description 17
- 150000001540 azides Chemical class 0.000 description 17
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 17
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 16
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 16
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 16
- 229910052802 copper Inorganic materials 0.000 description 16
- 102000004594 DNA Polymerase I Human genes 0.000 description 15
- 108010017826 DNA Polymerase I Proteins 0.000 description 15
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 14
- 150000001345 alkine derivatives Chemical class 0.000 description 14
- 239000003638 chemical reducing agent Substances 0.000 description 14
- 229940104302 cytosine Drugs 0.000 description 14
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 14
- 238000004925 denaturation Methods 0.000 description 14
- 230000036425 denaturation Effects 0.000 description 14
- 238000009396 hybridization Methods 0.000 description 14
- 239000003446 ligand Substances 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- 229940113082 thymine Drugs 0.000 description 14
- 229930024421 Adenine Natural products 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 229960000643 adenine Drugs 0.000 description 13
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 13
- 239000000543 intermediate Substances 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- VMQMZMRVKUZKQL-UHFFFAOYSA-N Cu+ Chemical compound [Cu+] VMQMZMRVKUZKQL-UHFFFAOYSA-N 0.000 description 12
- 108060002716 Exonuclease Proteins 0.000 description 12
- 238000010461 azide-alkyne cycloaddition reaction Methods 0.000 description 12
- 102000013165 exonuclease Human genes 0.000 description 12
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 12
- 229910052697 platinum Inorganic materials 0.000 description 12
- 229940035893 uracil Drugs 0.000 description 12
- 229910019142 PO4 Inorganic materials 0.000 description 11
- 108010066717 Q beta Replicase Proteins 0.000 description 11
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 11
- 108010017842 Telomerase Proteins 0.000 description 11
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 11
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 11
- 230000037452 priming Effects 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 10
- 108010001132 DNA Polymerase beta Proteins 0.000 description 10
- 108050009160 DNA polymerase 1 Proteins 0.000 description 10
- 102100022302 DNA polymerase beta Human genes 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 101900297506 Human immunodeficiency virus type 1 group M subtype B Reverse transcriptase/ribonuclease H Proteins 0.000 description 10
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 10
- 229930010555 Inosine Natural products 0.000 description 10
- 108010019653 Pwo polymerase Proteins 0.000 description 10
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 10
- 229960003786 inosine Drugs 0.000 description 10
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 10
- 239000010452 phosphate Substances 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 9
- 241000713869 Moloney murine leukemia virus Species 0.000 description 9
- 241000205160 Pyrococcus Species 0.000 description 9
- 108010090804 Streptavidin Proteins 0.000 description 9
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 9
- 125000005842 heteroatom Chemical group 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 239000011535 reaction buffer Substances 0.000 description 9
- 238000011222 transcriptome analysis Methods 0.000 description 9
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 9
- AZQWKYJCGOJGHM-UHFFFAOYSA-N 1,4-benzoquinone Chemical compound O=C1C=CC(=O)C=C1 AZQWKYJCGOJGHM-UHFFFAOYSA-N 0.000 description 8
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 8
- QIGBRXMKCJKVMJ-UHFFFAOYSA-N Hydroquinone Chemical compound OC1=CC=C(O)C=C1 QIGBRXMKCJKVMJ-UHFFFAOYSA-N 0.000 description 8
- 108091028664 Ribonucleotide Proteins 0.000 description 8
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 235000020958 biotin Nutrition 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 238000011049 filling Methods 0.000 description 8
- 229910052742 iron Inorganic materials 0.000 description 8
- 230000005291 magnetic effect Effects 0.000 description 8
- 229910052759 nickel Inorganic materials 0.000 description 8
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 8
- 238000001668 nucleic acid synthesis Methods 0.000 description 8
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 239000002336 ribonucleotide Substances 0.000 description 8
- 125000002652 ribonucleotide group Chemical group 0.000 description 8
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 8
- QWENRTYMTSOGBR-UHFFFAOYSA-N 1H-1,2,3-Triazole Chemical compound C=1C=NNN=1 QWENRTYMTSOGBR-UHFFFAOYSA-N 0.000 description 7
- VAKXPQHQQNOUEZ-UHFFFAOYSA-N 3-[4-[[bis[[1-(3-hydroxypropyl)triazol-4-yl]methyl]amino]methyl]triazol-1-yl]propan-1-ol Chemical compound N1=NN(CCCO)C=C1CN(CC=1N=NN(CCCO)C=1)CC1=CN(CCCO)N=N1 VAKXPQHQQNOUEZ-UHFFFAOYSA-N 0.000 description 7
- 238000011529 RT qPCR Methods 0.000 description 7
- 230000000903 blocking effect Effects 0.000 description 7
- 239000005547 deoxyribonucleotide Substances 0.000 description 7
- 125000005980 hexynyl group Chemical group 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- JPVYNHNXODAKFH-UHFFFAOYSA-N Cu2+ Chemical compound [Cu+2] JPVYNHNXODAKFH-UHFFFAOYSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 6
- 125000002355 alkine group Chemical group 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 229960003180 glutathione Drugs 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002987 primer (paints) Substances 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- WKGZJBVXZWCZQC-UHFFFAOYSA-N 1-(1-benzyltriazol-4-yl)-n,n-bis[(1-benzyltriazol-4-yl)methyl]methanamine Chemical compound C=1N(CC=2C=CC=CC=2)N=NC=1CN(CC=1N=NN(CC=2C=CC=CC=2)C=1)CC(N=N1)=CN1CC1=CC=CC=C1 WKGZJBVXZWCZQC-UHFFFAOYSA-N 0.000 description 5
- 108020004465 16S ribosomal RNA Proteins 0.000 description 5
- 125000002373 5 membered heterocyclic group Chemical group 0.000 description 5
- 101100208307 Acidithiobacillus ferrooxidans (strain ATCC 23270 / DSM 14882 / CIP 104768 / NCIMB 8455) tth gene Proteins 0.000 description 5
- 238000006736 Huisgen cycloaddition reaction Methods 0.000 description 5
- VQTUBCCKSQIDNK-UHFFFAOYSA-N Isobutene Chemical group CC(C)=C VQTUBCCKSQIDNK-UHFFFAOYSA-N 0.000 description 5
- 108060004795 Methyltransferase Proteins 0.000 description 5
- 239000013614 RNA sample Substances 0.000 description 5
- 241000589499 Thermus thermophilus Species 0.000 description 5
- IYABWNGZIDDRAK-UHFFFAOYSA-N allene Chemical group C=C=C IYABWNGZIDDRAK-UHFFFAOYSA-N 0.000 description 5
- 229940072107 ascorbate Drugs 0.000 description 5
- 235000010323 ascorbic acid Nutrition 0.000 description 5
- 239000011668 ascorbic acid Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 150000001721 carbon Chemical group 0.000 description 5
- IAQRGUVFOMOMEM-ARJAWSKDSA-N cis-but-2-ene Chemical group C\C=C/C IAQRGUVFOMOMEM-ARJAWSKDSA-N 0.000 description 5
- 238000006352 cycloaddition reaction Methods 0.000 description 5
- WJTCGQSWYFHTAC-UHFFFAOYSA-N cyclooctane Chemical compound C1CCCCCCC1 WJTCGQSWYFHTAC-UHFFFAOYSA-N 0.000 description 5
- 239000004914 cyclooctane Substances 0.000 description 5
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000001962 electrophoresis Methods 0.000 description 5
- 125000004836 hexamethylene group Chemical group [H]C([H])([*:2])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[*:1] 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000003100 immobilizing effect Effects 0.000 description 5
- YWAKXRMUMFPDSH-UHFFFAOYSA-N pentene Chemical group CCCC=C YWAKXRMUMFPDSH-UHFFFAOYSA-N 0.000 description 5
- 238000006116 polymerization reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 150000003242 quaternary ammonium salts Chemical class 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 125000000383 tetramethylene group Chemical group [H]C([H])([*:1])C([H])([H])C([H])([H])C([H])([H])[*:2] 0.000 description 5
- 108020004635 Complementary DNA Proteins 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- 108091092584 GDNA Proteins 0.000 description 4
- 108010024636 Glutathione Proteins 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- 241000589500 Thermus aquaticus Species 0.000 description 4
- 108010001244 Tli polymerase Proteins 0.000 description 4
- 229930003448 Vitamin K Natural products 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 229910052793 cadmium Inorganic materials 0.000 description 4
- 229910052804 chromium Inorganic materials 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 229960002433 cysteine Drugs 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 4
- 239000000975 dye Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 235000003969 glutathione Nutrition 0.000 description 4
- 125000003827 glycol group Chemical group 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229960004337 hydroquinone Drugs 0.000 description 4
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 229910052749 magnesium Inorganic materials 0.000 description 4
- 229910052748 manganese Inorganic materials 0.000 description 4
- 229910052753 mercury Inorganic materials 0.000 description 4
- 108091070501 miRNA Proteins 0.000 description 4
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 4
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 4
- 229910052763 palladium Inorganic materials 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 4
- SHUZOJHMOBOZST-UHFFFAOYSA-N phylloquinone Natural products CC(C)CCCCC(C)CCC(C)CCCC(=CCC1=C(C)C(=O)c2ccccc2C1=O)C SHUZOJHMOBOZST-UHFFFAOYSA-N 0.000 description 4
- 229920002859 polyalkenylene Polymers 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 125000000714 pyrimidinyl group Chemical group 0.000 description 4
- 150000003254 radicals Chemical class 0.000 description 4
- 239000000376 reactant Substances 0.000 description 4
- 229910052703 rhodium Inorganic materials 0.000 description 4
- 229910052707 ruthenium Inorganic materials 0.000 description 4
- 229910052709 silver Inorganic materials 0.000 description 4
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 4
- 235000010378 sodium ascorbate Nutrition 0.000 description 4
- 229960005055 sodium ascorbate Drugs 0.000 description 4
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 4
- DHCDFWKWKRSZHF-UHFFFAOYSA-N sulfurothioic S-acid Chemical compound OS(O)(=O)=S DHCDFWKWKRSZHF-UHFFFAOYSA-N 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 229910052721 tungsten Inorganic materials 0.000 description 4
- 235000019168 vitamin K Nutrition 0.000 description 4
- 239000011712 vitamin K Substances 0.000 description 4
- 150000003721 vitamin K derivatives Chemical class 0.000 description 4
- 229940046010 vitamin k Drugs 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 229910052725 zinc Inorganic materials 0.000 description 4
- 229910052726 zirconium Inorganic materials 0.000 description 4
- 125000004070 6 membered heterocyclic group Chemical group 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 229930040373 Paraformaldehyde Natural products 0.000 description 3
- 101710124239 Poly(A) polymerase Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- DKGAVHZHDRPRBM-UHFFFAOYSA-N Tert-Butanol Chemical compound CC(C)(C)O DKGAVHZHDRPRBM-UHFFFAOYSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- 229920004890 Triton X-100 Polymers 0.000 description 3
- 150000001336 alkenes Chemical class 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 238000001816 cooling Methods 0.000 description 3
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 238000012869 ethanol precipitation Methods 0.000 description 3
- 150000002430 hydrocarbons Chemical group 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000002934 lysing effect Effects 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 3
- 229920002866 paraformaldehyde Polymers 0.000 description 3
- 230000008823 permeabilization Effects 0.000 description 3
- 125000003386 piperidinyl group Chemical group 0.000 description 3
- 150000003222 pyridines Chemical class 0.000 description 3
- 239000003161 ribonuclease inhibitor Substances 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 3
- 125000004209 (C1-C8) alkyl group Chemical group 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 2
- HFKVKGYQGDZBTJ-UHFFFAOYSA-N 3-[4-[[bis[(1-tert-butyltriazol-4-yl)methyl]amino]methyl]triazol-1-yl]propan-1-ol Chemical compound N1=NN(C(C)(C)C)C=C1CN(CC=1N=NN(C=1)C(C)(C)C)CC1=CN(CCCO)N=N1 HFKVKGYQGDZBTJ-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000607528 Aeromonas hydrophila Species 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 101000661812 Arabidopsis thaliana Probable starch synthase 4, chloroplastic/amyloplastic Proteins 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 2
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- 241000205188 Thermococcus Species 0.000 description 2
- YTPLMLYBLZKORZ-UHFFFAOYSA-N Thiophene Chemical compound C=1C=CSC=1 YTPLMLYBLZKORZ-UHFFFAOYSA-N 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- LVTQIVFSMGDIPF-IVZWLZJFSA-N [[(2r,3s,5r)-5-[4-amino-5-(3-aminoprop-1-ynyl)-2-oxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C#CCN)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 LVTQIVFSMGDIPF-IVZWLZJFSA-N 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 125000004103 aminoalkyl group Chemical group 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 2
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 229940125773 compound 10 Drugs 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 125000000532 dioxanyl group Chemical group 0.000 description 2
- JZGVJEDMSGTYSM-UHFFFAOYSA-L disodium;2-[7-(2-sulfonatophenyl)-1,10-phenanthrolin-4-yl]benzenesulfonate Chemical compound [Na+].[Na+].[O-]S(=O)(=O)C1=CC=CC=C1C1=CC=NC2=C1C=CC1=C(C=3C(=CC=CC=3)S([O-])(=O)=O)C=CN=C21 JZGVJEDMSGTYSM-UHFFFAOYSA-L 0.000 description 2
- 125000005883 dithianyl group Chemical group 0.000 description 2
- 239000010459 dolomite Substances 0.000 description 2
- 229910000514 dolomite Inorganic materials 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 125000002541 furyl group Chemical group 0.000 description 2
- 150000002334 glycols Chemical class 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 125000000842 isoxazolyl group Chemical group 0.000 description 2
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- BQJCRHHNABKAKU-KBQPJGBKSA-N morphine Chemical compound O([C@H]1[C@H](C=C[C@H]23)O)C4=C5[C@@]12CCN(C)[C@@H]3CC5=CC=C4O BQJCRHHNABKAKU-KBQPJGBKSA-N 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 125000001715 oxadiazolyl group Chemical group 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 230000005298 paramagnetic effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- UKODFQOELJFMII-UHFFFAOYSA-N pentamethyldiethylenetriamine Chemical compound CN(C)CCN(C)CCN(C)C UKODFQOELJFMII-UHFFFAOYSA-N 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 125000004193 piperazinyl group Chemical group 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 2
- 125000004309 pyranyl group Chemical group O1C(C=CC=C1)* 0.000 description 2
- 125000003373 pyrazinyl group Chemical group 0.000 description 2
- 125000002098 pyridazinyl group Chemical group 0.000 description 2
- 125000004076 pyridyl group Chemical group 0.000 description 2
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 2
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 2
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 2
- 125000000335 thiazolyl group Chemical group 0.000 description 2
- 125000001544 thienyl group Chemical group 0.000 description 2
- 229930192474 thiophene Natural products 0.000 description 2
- 150000003918 triazines Chemical class 0.000 description 2
- 125000004306 triazinyl group Chemical group 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- RLLPVAHGXHCWKJ-IEBWSBKVSA-N (3-phenoxyphenyl)methyl (1s,3s)-3-(2,2-dichloroethenyl)-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)[C@H](C=C(Cl)Cl)[C@@H]1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 RLLPVAHGXHCWKJ-IEBWSBKVSA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- DKYBVKMIZODYKL-UHFFFAOYSA-N 1,3-diazinane Chemical class C1CNCNC1 DKYBVKMIZODYKL-UHFFFAOYSA-N 0.000 description 1
- YQIGEJHOYBUSLR-UHFFFAOYSA-N 1-(1h-benzimidazol-2-yl)-n,n-bis(1h-benzimidazol-2-ylmethyl)methanamine Chemical compound C1=CC=C2NC(CN(CC=3NC4=CC=CC=C4N=3)CC=3NC4=CC=CC=C4N=3)=NC2=C1 YQIGEJHOYBUSLR-UHFFFAOYSA-N 0.000 description 1
- VXNZUUAINFGPBY-UHFFFAOYSA-N 1-Butene Chemical compound CCC=C VXNZUUAINFGPBY-UHFFFAOYSA-N 0.000 description 1
- LIKMAJRDDDTEIG-UHFFFAOYSA-N 1-hexene Chemical compound CCCCC=C LIKMAJRDDDTEIG-UHFFFAOYSA-N 0.000 description 1
- 125000006017 1-propenyl group Chemical group 0.000 description 1
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 125000004493 2-methylbut-1-yl group Chemical group CC(C*)CC 0.000 description 1
- BKOOMYPCSUNDGP-UHFFFAOYSA-N 2-methylbut-2-ene Chemical group CC=C(C)C BKOOMYPCSUNDGP-UHFFFAOYSA-N 0.000 description 1
- 101100239622 Arabidopsis thaliana MYB11 gene Proteins 0.000 description 1
- 102000040350 B family Human genes 0.000 description 1
- 108091072128 B family Proteins 0.000 description 1
- 241000701897 Bacillus virus B103 Species 0.000 description 1
- 241000701844 Bacillus virus phi29 Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- WMEZDVILBKIODK-UHFFFAOYSA-N C(C)(C)(C)N1N=NC(=C1)CN(CC=1N=NN(C=1)C(C)(C)C)CC=1N=NN(C=1)CCCS(=O)(=O)O Chemical compound C(C)(C)(C)N1N=NC(=C1)CN(CC=1N=NN(C=1)C(C)(C)C)CC=1N=NN(C=1)CCCS(=O)(=O)O WMEZDVILBKIODK-UHFFFAOYSA-N 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 229910021589 Copper(I) bromide Inorganic materials 0.000 description 1
- 229910021595 Copper(I) iodide Inorganic materials 0.000 description 1
- OHOQEZWSNFNUSY-UHFFFAOYSA-N Cy3-bifunctional dye zwitterion Chemical compound O=C1CCC(=O)N1OC(=O)CCCCCN1C2=CC=C(S(O)(=O)=O)C=C2C(C)(C)C1=CC=CC(C(C1=CC(=CC=C11)S([O-])(=O)=O)(C)C)=[N+]1CCCCCC(=O)ON1C(=O)CCC1=O OHOQEZWSNFNUSY-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 108010043461 Deep Vent DNA polymerase Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000940250 Homo sapiens Collagen alpha-1(XXV) chain Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000978570 Homo sapiens Noelin Proteins 0.000 description 1
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101100545180 Mus musculus Zc3h12d gene Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 1
- 241000736843 Pyrobaculum aerophilum Species 0.000 description 1
- 241001061294 Pyrobaculum calidifontis Species 0.000 description 1
- 101900232935 Pyrococcus furiosus DNA polymerase Proteins 0.000 description 1
- 239000013616 RNA primer Substances 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000579741 Sphaerotheca <fungi> Species 0.000 description 1
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- 241001235254 Thermococcus kodakarensis Species 0.000 description 1
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- ZCHPKWUIAASXPV-UHFFFAOYSA-N acetic acid;methanol Chemical compound OC.CC(O)=O ZCHPKWUIAASXPV-UHFFFAOYSA-N 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003289 ascorbyl group Chemical group [H]O[C@@]([H])(C([H])([H])O*)[C@@]1([H])OC(=O)C(O*)=C1O* 0.000 description 1
- 238000007846 asymmetric PCR Methods 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 238000010462 azide-alkyne Huisgen cycloaddition reaction Methods 0.000 description 1
- 230000003592 biomimetic effect Effects 0.000 description 1
- 239000001045 blue dye Substances 0.000 description 1
- BMRWNKZVCUKKSR-UHFFFAOYSA-N butane-1,2-diol Chemical compound CCC(O)CO BMRWNKZVCUKKSR-UHFFFAOYSA-N 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000005081 chemiluminescent agent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 1
- NKNDPYCGAZPOFS-UHFFFAOYSA-M copper(i) bromide Chemical compound Br[Cu] NKNDPYCGAZPOFS-UHFFFAOYSA-M 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 150000004891 diazines Chemical class 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 150000002012 dioxanes Chemical class 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 125000005678 ethenylene group Chemical group [H]C([*:1])=C([H])[*:2] 0.000 description 1
- 125000001301 ethoxy group Chemical group [H]C([H])([H])C([H])([H])O* 0.000 description 1
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 238000005558 fluorometry Methods 0.000 description 1
- 150000002240 furans Chemical class 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- 150000002460 imidazoles Chemical class 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 125000001972 isopentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000000555 isopropenyl group Chemical group [H]\C([H])=C(\*)C([H])([H])[H] 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 150000003854 isothiazoles Chemical class 0.000 description 1
- 150000002545 isoxazoles Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229960005181 morphine Drugs 0.000 description 1
- 125000006606 n-butoxy group Chemical group 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000003506 n-propoxy group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])O* 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 150000004866 oxadiazoles Chemical class 0.000 description 1
- 150000004893 oxazines Chemical class 0.000 description 1
- 150000002916 oxazoles Chemical class 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- RGSFGYAAUTVSQA-UHFFFAOYSA-N pentamethylene Natural products C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 1
- 125000004817 pentamethylene group Chemical group [H]C([H])([*:2])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[*:1] 0.000 description 1
- 125000003538 pentan-3-yl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 150000004885 piperazines Chemical class 0.000 description 1
- 150000003053 piperidines Chemical class 0.000 description 1
- 229920001281 polyalkylene Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001451 polypropylene glycol Polymers 0.000 description 1
- 159000000001 potassium salts Chemical class 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 229960004063 propylene glycol Drugs 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- 125000004219 purine nucleobase group Chemical group 0.000 description 1
- 150000003216 pyrazines Chemical class 0.000 description 1
- 150000003217 pyrazoles Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 150000003233 pyrroles Chemical class 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 125000006853 reporter group Chemical group 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010027322 single cell proteins Proteins 0.000 description 1
- 238000012174 single-cell RNA sequencing Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- UIIMBOGNXHQVGW-UHFFFAOYSA-M sodium bicarbonate Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 150000003527 tetrahydropyrans Chemical class 0.000 description 1
- RAOIDOHSFRTOEL-UHFFFAOYSA-N tetrahydrothiophene Chemical class C1CCSC1 RAOIDOHSFRTOEL-UHFFFAOYSA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000008334 thiadiazines Chemical class 0.000 description 1
- 150000004867 thiadiazoles Chemical class 0.000 description 1
- 150000004897 thiazines Chemical class 0.000 description 1
- 150000003557 thiazoles Chemical class 0.000 description 1
- 150000003577 thiophenes Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 150000004882 thiopyrans Chemical class 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 238000012049 whole transcriptome sequencing Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 229960000523 zalcitabine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/115—Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3517—Marker; Tag
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开内容描述了拴系有寡核苷酸的核苷酸、制备所述拴系有寡核苷酸的核苷酸的方法和使用所述拴系有寡核苷酸的核苷酸的方法。在一些实施例中,所述拴系有寡核苷酸的核苷酸包括与长度为约3个到约100个核苷酸的寡核苷酸连接的核苷酸。这些拴系有寡核苷酸的核苷酸可以用于在多种不同情形下用已知寡核苷酸来标记多种不同类型的核酸,在一些实施例中,所述已知的寡核苷酸可以充当条形码。所产生的寡核苷酸标记的核酸寡核苷酸可以用于各种核酸测序方法。
Description
相关申请的交叉引用
本申请要求于2019年6月21日提交的题为“所拴系寡核苷酸和其用途(TetheredOligos and Uses Thereof)”的序列号为62/864,589的美国临时申请和于2020年5月29日提交的题为“所拴系寡核苷酸和其用途”的序列号为63/032,297的美国临时申请的优先权权益。
序列表
本申请含有序列表,所述序列表已经以ASCII格式电子提交,并且通过引用以其整体在此并入。创建于2020年6月22日的所述ASCII副本命名为“LT01475PCT_SL_EA.txt”,并且大小为14,318字节。
技术领域
本公开涉及拴系有寡核苷酸的核苷酸和使用所述拴系有寡核苷酸的核苷酸进行核酸加标签的方法。本公开进一步涉及下一代测序,并且具体地但不排他地涉及用于制备下一代测序文库的组合物、方法和试剂盒。
背景技术
操纵和修饰DNA分子的能力形成了现代分子生物学的基础。下一代测序(NGS)的兴起,尤其是在单细胞水平下应用时,带来了对DNA修饰和合成工具包的新的需求。最大的核酸修饰效率、最小的偏差、易于自动化和微型化是当前方法无法充分满足的重要需求的实例。
核酸文库制备是下一代测序工作流中的重要步骤。所述核酸文库制备包含连接平台特异性衔接子,在不同供应商之间,所述平台特异性衔接子相差大于10倍,其中一些连接效率太低,以至于所述一些连接效率可能会损害原始文库的复杂性并减少测序结果。虽然对微量或甚至单个的DNA分子进行测序是可能的,但是目前这需要预扩增技术。在等温条件下通过进行性DNA聚合酶进行的多重置换反应(MDA)提供了高基因组覆盖率,但会导致序列依赖性偏差,从而导致某些基因组区的过度扩增和其它区的扩增不足。cDNA的预扩增,通常是在单细胞或超低输入RNA测序文库制备的情况下进行的,可能会导致某些序列丢失或以其它方式扭曲转录组的原始组成。这指示需要新的方法来克服基因组和单细胞DNA和RNA测序中的挑战。
典型的NGS文库制备工作流包含:对DNA或cDNA样品进行随机片段化,然后进行5'和3'衔接子连接。通常,片段化和衔接子添加是作为单独的步骤进行的。然后,将衔接子连接的片段任选地用PCR扩增并纯化。文库扩增步骤需要高度复杂的分子群的无偏差复制。极高保真度扩增限制了可能会导致错误的基因变体调用的PCR误差。可替代地,“标签化”将片段化和连接反应组合到单个步骤中,所述单个步骤简化了文库制备过程。可替代地,衔接子可以添加有转座子。
提供了本公开以解决上文所描述的问题中的一个或多个问题并且以提供用于制备用于下一代测序平台的核酸文库的进一步改进的方法。
发明内容
本公开提供了用于制备用于下一代测序的文库的改进的核酸标记技术和方法。
因此,一些实施例提供了一种用于用寡核苷酸对核酸进行加标签的方法,所述方法包含以下步骤:a.提供要加标签的所述核酸;b.使所述核酸与聚合酶和至少一个式(A)的拴系有寡核苷酸的核苷酸:
或其盐接触,其中:
NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;
Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且
CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代,由此产生第一带标签的核酸。
在一些实施例中,所述接触可以包含使所述核酸与至少一个拴系有寡核苷酸的核苷酸、至少一个未拴系到寡核苷酸的核苷酸以及聚合酶接触。
在一些实施例中,所述方法进一步包含使引物退火到所述核酸的步骤。
在一些实施例中,所述拴系有寡核苷酸的核苷酸是双脱氧核苷酸,任选地其中所述双脱氧核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
在一些实施例中,所述方法包含以下另外的步骤:在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的引物退火;使所述第一带标签的核酸链和经退火的引物与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及允许聚合酶从退火到所述所拴系寡核苷酸的所述引物的3'羟基延伸以形成第二核酸链。
在一些实施例中,所述方法包含以下另外的步骤:在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的夹板寡核苷酸(退火;使所述第一带标签的核酸链和经退火的夹板寡核苷酸与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及允许聚合酶从所述所拴系寡核苷酸的3'羟基跨所述夹板寡核苷酸延伸。
还提供了用于由包括一个或多个核酸的样品产生核酸文库的方法。因此,一些实施例提供了一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞。所述方法可以包含以下步骤:使与所述一个或多个核酸至少部分互补的第一引物退火;使所述一个或多个核酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多条核酸链,所述多条核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;使与所拴系寡核苷酸至少部分互补的第二引物退火;以及允许所述聚合酶从退火到所述所拴系寡核苷酸的所述第二引物的3'羟基延伸,由此产生核酸文库。
一些实施例提供了一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞或细胞核,所述方法包含以下步骤:使与所述一个或多个核酸至少部分互补的第一引物退火;使所述一个或多个核酸与第一核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多个第一延伸产物,所述多个第一延伸产物在3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;使与所述第一延伸产物的所述所拴系寡核苷酸至少部分互补的夹板寡核苷酸退火;以及使所述第一延伸产物与核酸聚合酶和一个或多个核苷酸接触,以允许所述聚合酶从所述所拴系寡核苷酸的3'羟基跨经退火的夹板延伸以产生第二延伸产物,由此产生核酸文库。
在一些实施例中,所述核酸文库是双链核酸文库。
在一些实施例中,所述核酸文库是第一延伸产物文库,所述第一延伸产物在5'端处包括通用手柄,并且其中所述第一延伸产物在3'端处包括通用手柄或被进一步操纵成在所述3'端处添加所述通用手柄,其中所述通用手柄能使扩增引物退火。
在一些实施例中,所述样品中的所述一个或多个核酸包括拴系有寡核苷酸的结合剂(OTBA)的寡核苷酸。在一些实施例中,所述OTBA的所述所拴系寡核苷酸包括细胞标志物结合剂索引,并且其中所述OTBA的结合剂包括适配体或抗体或其功能片段。
在其中所述样品与夹板寡核苷酸接触并且其中所述样品包括多于一种细胞或细胞核的一些实施例中,所述细胞或细胞核的亚群可以包括一个或多个细胞标志物。
所述样品可以在使所述第一引物退火到所述一个或多个核酸的步骤之前分成两个或更多个第一部分,并且其中每个第一部分包括原始样品的细胞或细胞核亚群。所述第一引物包含第一通用手柄序列和第一条形码,所述第一条形码在每个第一部分中的所述第一引物中是共用的,但与存在于其它第一部分中的所述第一引物中的所述第一条形码有所不同;并且其中所述拴系有寡核苷酸的双脱氧核苷酸的所述寡核苷酸包括第二通用手柄序列。所述方法还可以包含在所述夹板寡核苷酸退火之前进行以下另外的步骤:在形成所述第一核延伸产物后将所述第一部分组合;以及将经组合的第一部分分成两个或更多个第二部分,其中所述第二部分包括所述夹板寡核苷酸;其中所述夹板寡核苷酸包括:退火到所述所拴系寡核苷酸上的所述第二通用手柄的寡核苷酸序列;第二条形码的模板序列,其中每个第二部分的第二条形码是共用的,但与其它第二部分的所述第二条形码有所不同;以及第三通用手柄的模板序列。因此产生了包括第二延伸产物的核酸文库,所述第二延伸产物在所述第一延伸产物的所述3'端处包含所述第二条形码和所述第三通用手柄。
在一些实施例中,所述方法可以包含以下另外的步骤:将所述第二部分组合;将经组合的第二部分分成两个或更多个第三部分;使每个第三部分与扩增引物接触,其中所述扩增引物能与所述第一通用手柄和所述第三通用手柄杂交并且能够从所述第一通用手柄和所述第三通用手柄延伸以扩增所述第二延伸产物。所述扩增引物任选地分别包括第三条形码和/或第四条形码并且分别包括第一衔接子序列和/或第二衔接子序列。所述扩增产物的所述第一条形码序列、所述第二条形码序列和所述第三条形码序列(或其补体)的组合对于源自单个细胞或细胞核的所述扩增产物来说是唯一的。
在用于对核酸进行加标签的方法和/或由包括一个或多个核酸的样品产生核酸文库的方法的一些实施例中,所述引物、所述所拴系寡核苷酸或两者包括随机序列、靶特异性序列或两者。
在用于对核酸进行加标签的方法和/或由包括一个或多个核酸的样品产生核酸文库的方法的一些实施例中,所述引物、所述所拴系寡核苷酸或所述夹板寡核苷酸中的一个或多个包括通用手柄、通用序列、唯一分子标识符、衔接子序列、启动子序列、条形码序列、索引序列或其任何组合。
在用于对核酸进行加标签的方法和/或由包括一个或多个核酸的样品产生核酸文库的方法的一些实施例中,所述聚合酶是DNA依赖性DNA聚合酶、RNA依赖性DNA聚合酶、非模板依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性RNA聚合酶或非模板依赖性RNA聚合酶。
在用于对核酸进行加标签的方法和/或由包括一个或多个核酸的样品产生核酸文库的方法的一些实施例中,所述核酸是DNA或RNA。
本文还提供了一种式(A)的拴系有寡核苷酸的核苷酸:
或其盐
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;
Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且
CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代。
在一些实施例中,CXN是Click,并且其中Click是以下官能团对中的一个官能团对之间的点击反应的产物:
i)炔基和叠氮基;
ii)硫醇和炔基;
iii)硫醇和烯基;
iv)叠氮基和环辛烷基;以及
v)环辛烷基和硝酮。
本文还提供了如本文所描述的拴系有寡核苷酸的核苷酸在制备核酸文库中的用途或用于对核酸进行加标签的用途。
在一些实施例中,本文所使用的所述拴系有寡核苷酸的核苷酸通常具有根据式(A)的结构或其盐:
其中NB是核碱基;Oligo是由3到100个核苷酸构成的寡核苷酸;X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;Z和Y中每一个独立地选自键、氨基、酰胺基、亚烷基、亚烯基、亚炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代。
在一些实施例中,式(A)的化合物的盐是季铵盐。
在一些实施例中,X选自H、OH、F、N3和氨基。在其它实施例中,X选自H、N3和OH。在一些实施例中,X是OH。在其它实施例中,X是H。
在一些实施例中,Q是H、OH、F、Cl、Br、I和N3。在其它实施例中,Q是H。
在一些实施例中,CXN选自各自具有1到3个杂原子的5元杂环和6元杂环。在一些实施例中,CXN选自吡咯并、苯硫基、呋喃基、吡咯烷基、硫代乙酰基、四氢呋喃基、异噁唑基、噁唑并、吡唑并、咪唑基、异噻唑并、噻唑基、三唑并、噁二唑并、噻二唑并、吡喃基、硫代吡喃基、吡啶基、四氢吡喃基、四氢硫代吡喃基、哌啶基、哒嗪基、嘧啶基、吡嗪基、六氢哒嗪基、六氢嘧啶基、哌嗪基、二噁烷基、吗啉代、噻嗪基、噁嗪并、二噻烷基、三嗪基、二噻嗪并、噻二嗪并、三嗪烷基和噁三唑并。
在其它实施例中,CXN是Click,其中Click是点击反应的产物。在一些实施例中,Click是以下官能团对中的一个官能团对之间的点击反应的产物:i)炔基和叠氮基;ii)硫醇和炔基;iii)硫醇和烯基;iv)叠氮基和环辛烷基;以及v)环辛烷基和硝酮
在一些实施例中,Z和Y各自是接头或连接部分,所述接头或连接部分是指可以变化以在ddNTP或dNTP与具有期望性质的寡核苷酸之间提供整体拴系的某些官能团。
在一些实施例中,Z和Y中每一个独立地选自键、氨基、酰胺基、亚烷基、亚烯基、亚炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合。在一些实施例中,每个Z和Y独立地选自氨基、酰胺基、亚烷基、亚烯基、亚炔基、醚、酮、羰基、酸酐、酯、酰亚胺或其任何组合。在其它实施例中,Y是亚烷基或亚炔基。
在一些实施例中,式(A)的化合物选自式(B1)-(B4)的化合物:
和其盐,其中Oligo*是来自Oligo基团的其余2到99个核苷酸,并且NB2是核碱基;L1选自亚烷基、亚烯基、亚炔基和聚亚烷基二醇;L2是亚烷基或亚炔基。。
在其它实施例中,L1是C1-C12亚烷基、C2-C12亚烯基、C2-C12亚炔基和具有2到8个二醇单元的聚亚烷基二醇。在其它实施例中,L1选自具有2个乙二醇单元的聚乙二醇(PEG2)、具有4个乙二醇单元的聚乙二醇(PEG4)或具有6个乙二醇单元的聚乙二醇(PEG6)、亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基和亚己基。在又其它实施例中,L1选自-CH2-、-(CH2)3-、-(CH2)5-、PEG2和PEG4。
在一些实施例中,连接基团Y包括选自亚烷基或亚炔基的L2亚组。在其它实施例中,L2是C1-C12亚烷基或C1-C12亚炔基。在其它实施例中,L2-Oligo的组合选自-(CH2)4-Oligo或-(CH2)4C≡C-Oligo。
在一些实施例中,Oligo通过dNTP或ddNTP的核碱基的其5'-磷酸拴系到核苷酸。在一些实施例中,Oligo通过核碱基(NB2)拴系。
在一些实施例中,NB和NB2独立地是核碱基。在一些实施例中,所述核碱基选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷。
在一些实施例中,NB是嘧啶,并且所述嘧啶在核碱基的第5位处拴系到寡核苷酸。在其它实施例中,NB是嘌呤,并且其中所述嘌呤在核碱基的第7位处拴系到寡核苷酸。
在一些实施例中,提供了式(I)的拴系有寡核苷酸的核苷酸或其盐:
其中X是H、N3或OH;
NB表示选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷的核碱基;
Z和Y是接头,其中Z和Y各自独立包括选自以下的至少一个连接部分:氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯和其任何组合;
Click是点击反应的产物;并且
Oligo是长度为3到100个核苷酸的寡核苷酸。
在一些实施例中,“Click”是以下官能团对中的一个官能团对之间的点击反应的产物:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
在一些实施例中,提供了式(II)的拴系有寡核苷酸的核苷酸或其盐:
其中X是H、OH、N3;
NB表示选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷的核碱基;
Z和Y是接头,其中Z和Y各自独立包括选自以下的至少一个连接部分:氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯和其任何组合;以及
Oligo是长度为3到100个核苷酸的寡核苷酸。
在所述式(I)或(II)的拴系有寡核苷酸的核苷酸的一些实施例中,X是OH。在其它实施例中,X是H。
在一些实施例中,所述亚烷基是C1-C6亚烷基。在一些实施例中,所述亚烯基是C2-C6亚烯基。
在一些实施例中,所述亚炔基是C2-C6亚炔基。
在一些实施例中,所述聚亚烷基二醇具有2到8个乙二醇单元。
在一些实施例中,所述寡核苷酸在其5'端处拴系到所述核苷酸。
在一些实施例中,Z和Y中的一个与三唑环的第1位共价结合,并且Z和Y中的另一个与所述三唑环的第4位共价结合。在一些实施例中,Z与三唑环的第1位共价结合,并且Y与所述三唑环的第1位共价结合。在其它实施例中,Z与三唑环的第4位共价结合,并且Y与所述三唑环的第1位共价结合。
在一些实施例中,提供了式(III)的拴系有寡核苷酸的核苷酸或其盐:
其中
L1是包括亚烷基、聚亚烷基二醇或其组合的接头,并且
L2是包括亚炔基的接头。
在一些实施例中,L1包括具有2个、4个或6个亚烯基二醇基团的聚亚烯基二醇。在一些实施例中,所述聚亚烯基二醇是聚乙二醇。
在一些实施例中,L1包括具有1到12个碳原子的亚烷基。在一些实施例中,所述亚烷基是亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基或亚己基。
在一些实施例中,L2是己炔基。
在一些实施例中,所述核碱基是嘧啶,并且其中所述嘧啶在所述核碱基的第5位处拴系到所述寡核苷酸。在其它实施例中,所述核碱基是嘌呤,并且所述嘌呤在所述核碱基的第7位处拴系到所述寡核苷酸。
在所述式(I)、(II)或(III)的拴系有寡核苷酸的核苷酸的一些实施例中,所述盐是季铵盐。
在一些实施例中,所述寡核苷酸包括条形码序列、衔接子序列、唯一分子标识符或其任何组合。
在一些实施例中,提供了一种用于用寡核苷酸对核酸进行加标签的方法,所述方法包括:
提供要加标签的所述核酸;
使所述核酸与至少一个拴系有寡核苷酸的核苷酸以及聚合酶接触,由此产生带标签的核酸。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括使所述核酸与至少一个拴系有寡核苷酸的核苷酸、至少一个未拴系到寡核苷酸的核苷酸以及聚合酶接触。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括使引物退火到所述核酸。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括使夹板寡核苷酸退火到所述带标签的核酸。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述核酸在5'端、3'端或两者处进行加标签。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述核酸在多个位置处进行加标签。
在如本文所描述的核苷酸加标签反应的一些实施例中,在切口平移或缺口填补反应期间用所述拴系有寡核苷酸的核苷酸对所述核酸进行加标签。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括例如通过连接或聚合反应将衔接子序列添加到所述核酸的所述3'端。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括例如通过连接或聚合反应将一个或多个序列(例如,条形码序列、通用序列、唯一分子标识符序列、索引序列、启动子序列、序列、衔接子序列等)添加到所述拴系有寡核苷酸的核苷酸的寡核苷酸的3'端。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括使所述带标签的核酸经历PCR。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括:使所述带标签的核酸与夹板寡核苷酸接触,所述夹板寡核苷酸与所述带标签的核酸的所拴系寡核苷酸上的通用手柄序列部分互补;以及允许所述聚合酶通过所述所拴系的寡核苷酸的3'OH跨所述夹板寡核苷酸延伸。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述核酸是DNA,而在其它实施例中,所述核酸是RNA。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述聚合酶是A型DNA聚合酶、B型DNA聚合酶、X型DNA聚合酶或逆转录酶。在其它实施例中,所述聚合酶是Taq DNA聚合酶、DNA聚合酶、Deep VentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTMIV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段(Klenow fragment)、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HSDNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、TflDNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述聚合酶是TdT。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述核苷酸所述拴系有寡核苷酸的核苷酸是脱氧核苷酸,任选地其中所述脱氧核苷酸选自脱氧腺苷三磷酸、脱氧鸟苷三磷酸、脱氧胸苷三磷酸、脱氧尿苷三磷酸、脱氧胞苷三磷酸和其任何组合。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述核苷酸所述拴系有寡核苷酸的核苷酸是双脱氧核苷酸,任选地其中所述双脱氧核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法中的所述拴系有寡核苷酸的核苷酸的浓度的范围为1fmol到10nmol。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述拴系有寡核苷酸的核苷酸与对应的天然核苷酸(即,至少一个未拴系到寡核苷酸的核苷酸或缺少拴系的寡核苷酸的核苷酸,但包含天然存在的核苷酸和不具有拴系的核苷酸的其它经过修饰的核苷酸两者)的摩尔比的范围为1:1到1:1000。
在如本文所描述的核苷酸加标签反应的一些实施例中,所述方法进一步包括进行至少一个清理步骤。
在一些实施例中,提供了一种用于用寡核苷酸对核酸进行加标签的方法,所述方法包括:提供要加标签的所述核酸;使所述核酸与第一末端脱氧核苷酸转移酶和至少一个拴系有寡核苷酸的核苷酸接触,由此产生第一带标签的核酸链。在一些实施例中,所述方法进一步包括:在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的引物退火;使所述第一带标签的核酸链和经退火的引物与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及允许聚合酶从退火到所述所拴系寡核苷酸的所述引物上的3'羟基延伸以形成第二核酸链。在一些实施例中,所述方法任选地进一步包括在形成所述第二核酸链之后,使所述带标签的核酸链与核酸外切酶接触,其中所述第一核酸链被所述核酸外切酶降解。在一些实例中,当所述第一核酸链具有5'-磷酸时,可以使用λ核酸外切酶来降解所述第一核酸链。
在一些实施例中,提供了一种用于由包括一个或多个核酸的样品产生核酸文库的第一方法,所述方法包括:
a.使与所述一个或多个核酸至少部分互补的第一引物退火;
b.使所述一个或多个核酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成一条或多条第一核酸链,所述一条或多条第一核酸链在其3'端处包括第一拴系有寡核苷酸的双脱氧核苷酸;
c.使与所拴系寡核苷酸至少部分互补的第二引物退火;以及
d.允许所述聚合酶从退火到所述所拴系寡核苷酸的所述发送引物的3'羟基延伸,由此产生核酸文库。
在一些实施例中,提供了一种用于由包括一个或多个核酸的样品产生核酸文库的第二方法,任选地其中所述样品包括多个细胞或细胞核,所述方法包括:
a.使与所述一个或多个核酸至少部分互补的第一引物退火;
b.使所述一个或多个核酸与第一核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以多个第一延伸产物,所述多个第一延伸产物在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;
c.使与所述第一延伸产物的所拴系寡核苷酸至少部分互补的夹板寡核苷酸退火;以及
d.使所述第一延伸产物与第二核酸聚合酶接触,并且允许所述聚合酶从所述所拴系寡核苷酸的3'羟基跨经退火的夹板寡核苷酸延伸,由此产生核酸文库,以产生第二延伸产物,由此产生所述核酸文库。
在用于产生核酸文库的所述第一方法或所述第二方法的一些方面,一个或多个多核苷酸包括在使所述第一引物退火之前产生的多个多核苷酸片段。
在用于产生核酸文库的所述第一方法的一些方面,使所述第二经退火的引物与所述核酸聚合酶接触是在存在至少一个未拴系到寡核苷酸的核苷酸和第二拴系有寡核苷酸的双脱氧核苷酸的情况下进行的,并且所述第二核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸。在用于产生核酸文库的方法的一些实施例中,所述第一拴系有寡核苷酸的双脱氧核苷酸中的所述所拴系的寡核苷酸和所述第二拴系有寡核苷酸的双脱氧核苷酸中的所述所拴系的寡核苷酸是不同的。
在用于产生核酸文库的所述第二方法的一些方面,所述样品中的所述一个或多个核酸是拴系有寡核苷酸的结合剂(OTBA)的寡核苷酸。在一些实施例中,所述OTBA的所述寡核苷酸包括细胞标志物结合剂索引,其中所述OTBA的结合剂包括适配体或抗体或其功能片段。在一些实施例中,抗体是功能抗体片段。例如,抗体片段可以是抗体的一部分,如F(ab')2、Fab'、Fab、Fv、sFv等。例如,抗体片段可以与全长抗体所识别的相同抗原结合。抗体片段可以包含由抗体的可变区组成的分离的片段,如由重链和轻链的可变区以及重组单链多肽分子组成的“Fv”片段,其中轻可变区和重可变区通过肽接头(“scFv蛋白”)连接。示例性抗体可以包含但不限于癌症细胞的抗体、病毒的抗体、与细胞表面受体结合的抗体(例如,CD8、CD34和CD45)和治疗性抗体。如本文所用,“索引”或“细胞标志物结合剂索引”是指鉴定细胞标志物结合剂并且对细胞标志物结合剂具有特异性的寡核苷酸序列(即,对于每个细胞标志物结合剂来说是唯一的通用序列)。
在用于产生核酸文库的所述第二方法的一些方面,包括一个或多个核酸的所述样品包括多于一种细胞或细胞核,并且其中所述细胞或细胞核(或其亚群)可以包括一个或多个细胞标志物。在一些方面,所述细胞标志物由所述样品中的一部分细胞表达。在一些方面,所述细胞标志物是细胞表面标志物。
在用于产生核酸文库的所述第二方法的一些方面,所述样品在使与所述样品的所述一个或多个核酸至少部分互补的所述第一引物退火之前分成两个或更多个第一部分,所述两个或更多个第一部分各自包括原始样品的所述细胞或细胞核的亚群。所述第一引物可以包含第一通用手柄和第一条形码,并且所述所拴系寡核苷酸可以包含第二通用手柄。所述第一条形码序列是每个部分中的所述第一引物中是共用的,但与其它第一部分中的其它第一引物的第一条形码序列有所不同,其中所述第一部分是在使得所述经退火的第一引物能够延伸以形成第一核酸延伸产物的条件下接触的。所述方法可以包含以下另外的步骤:在形成所述第一核延伸产物之后将所述第一部分组合,并且将经组合的第一部分分成两个或更多个第二部分。每个第二部分可以与夹板寡核苷酸、聚合酶和一个或多个核苷酸(例如,dNTP)接触。所述夹板寡核苷酸可以包含:(i)退火到所述所拴系寡核苷酸的所述第二通用手柄的寡核苷酸序列;(ii)第二条形码的模板序列,其中每个第二部分中的夹板寡核苷酸的第二条形码是共用的,但与其它第二部分的夹板寡核苷酸的第二条形码有所不同;和(iii)第三通用手柄的模板序列。所述聚合酶使所述所拴系寡核苷酸的3'OH跨所述夹板寡核苷酸延伸,由此产生包括5'到3'的第二核酸延伸产物:第一通用手柄、第一条形码、样品核酸序列的拷贝、第二通用手柄、第二条形码和第三通用手柄。所述方法可以进一步包含以下步骤:将所述第二部分组合,并且将经组合的第二部分分成两个或更多个第三部分。
所述第三部分可以与扩增引物、聚合酶和核苷酸(例如,dNTP)接触,以便产生包括所述扩增产物的核酸文库,所述扩增引物与所述第二延伸产物的5'和3'端的所述第一通用序列和所述第三通用序列杂交。所述扩增引物可以包含例如测序衔接子或任何其它期望的序列。所述扩增产物的所述第一条形码序列、所述第二条形码序列和所述第三条形码序列(或其补体)的组合对于源自单个细胞的样品核酸的所述扩增产物来说是唯一的。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述拴系有寡核苷酸的核苷酸是具有式(A)、(I)、(II)或(III)中任一个的拴系有寡核苷酸的核苷酸。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述引物、所述所拴系寡核苷酸或两者包括随机序列、靶特异性序列或两者。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述引物、所述所拴系寡核苷酸或所述夹板寡核苷酸包括通用手柄、通用序列、唯一分子标识符、衔接子序列、启动子序列、条形码序列、索引序列或其任何组合。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述拴系有寡核苷酸的核苷酸或所述夹板寡核苷酸或两者进一步包括亲和标签。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述聚合酶是A型DNA聚合酶、B型DNA聚合酶、X型DNA聚合酶或逆转录酶。B型聚合酶的实例包含火球菌(Pyrococcus)属和热球菌(Thermococcus)属的那些聚合酶,如属于以下的DeepVent聚合酶和家族B聚合酶:激烈火球菌(P.furiosus)、泉古菌(P.calidifontis)、嗜气菌(P.aerophilum)、海洋异养古菌(T.kodakarensis)、极端嗜热古菌(T.gorgonarms)和热球菌(Phermococcus sp.)9°N-7。
在如本文所描述的产生核酸文库的方法的一些实施例中,所述聚合酶选自TaqDNA聚合酶、DNA聚合酶、Deep VentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、Thermo SequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、PlatinumTaq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMY逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述核苷酸选自脱氧腺苷三磷酸、双脱氧腺苷三磷酸、脱氧鸟苷三磷酸、双脱氧鸟苷三磷酸、脱氧胸苷三磷酸、双脱氧胸苷三磷酸、脱氧胞苷三磷酸、双脱氧胞苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,所述方法进一步包括扩增所述文库。
在如本文所描述的产生核酸文库的所述第一方法和所述第二方法的一些方面,并且在如本文所描述的对核酸进行加标签的所述方法的一些实施例中,步骤(a)中的所述拴系有寡核苷酸的核苷酸的浓度的范围为1fmol到10μmol。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述拴系有寡核苷酸的核苷酸与对应的天然核苷酸的摩尔比的范围为1:1到1:1000。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述方法进一步包括进行至少一个清理步骤。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述核酸是DNA,例如基因组DNA等。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述核酸是RNA。在一些实施例中,所述方法进一步包括对所述RNA进行逆转录以产生对应的cDNA。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述方法进一步包括在使第一引物退火和/或拆分样品之前固定和透化所述细胞。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述方法进一步包括在产生一种或多种延伸产物后裂解所述细胞。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,在产生所述第一核酸延伸产物之后,所述第一部分或经组合的第一部分与阻断性寡核苷酸接触,其中所述阻断性寡核苷酸阻止第一延伸引物与细胞核酸杂交。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述方法进一步包括以下步骤:在产生所述第二核酸延伸产物之后和在所述第三部分与第二延伸引物接触之前将所述夹板寡核苷酸去除。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述夹板寡核苷酸包括结合部分,所述方法包括以下步骤:使所述第二部分或经组合的第二部分与包括捕获部分的化合物接触,所述捕获部分促进包括同源结合部分的夹板寡核苷酸的结合和去除。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述结合部分和所述同源捕获部分是选自以下的结合对:链霉亲和素和生物素的结合对、麦芽糖和麦芽糖结合蛋白的结合对、谷胱甘肽和谷胱甘肽S-转移酶的结合对、几丁质和几丁质结合蛋白的结合对或适配体和其抗原的结合对。
在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述捕获部分固定在固体支持物上。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述固体支持物包括珠。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述珠是磁性珠或顺磁性珠。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述第一延伸引物包括能在延伸条件下与所关注的mRNA杂交的序列。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述第一延伸引物在3'端处包括poly(T)。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述第一延伸引物在3'端处包括随机六聚体序列。在如本文所描述的产生核酸文库的所述方法的一些实施例中,所述第一部分与延伸引物的混合物接触,其中至少一个第一延伸引物在3'端处包括poly(T)序列,并且至少一个第一延伸引物包括随机六聚体序列。在如本文所描述的产生核酸文库的所述方法的一些实施例中,任选的第一衔接子和第二衔接子包括用于在如Illumina平台、ION Torrent平台等各种NGS平台上进行测序的衔接子。
在一些实施例中,提供了一种用于制备式(A)、(I)、(II)或(III)的拴系有寡核苷酸的核苷酸的方法,所述方法包括:
a.提供与第一官能团共价结合的核苷酸,所述第一官能团能与第二官能团进行点击反应;提供与所述第二官能团共价结合的寡核苷酸,所述第二官能团能进行点击反应以形成三唑环;使所述核苷酸与所述寡核苷酸接触以形成点击反应产物,
其中所述第一官能团和所述第二官能团分别选自:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
在一些实施例中,所述第一官能团和所述第二官能团分别选自:i)炔基和叠氮基;和ii)叠氮基和炔基。在一些实施例中,所述核苷酸是脱氧核苷酸或双脱氧核苷酸。
在一些实施例中,步骤(c)包括在存在铜催化剂和铜(I)配体的情况下使所述核苷酸与所述寡核苷酸接触以形成1,2,3-三唑。在一些实施例中,所述铜催化剂包括铜(I)或铜(II),其中当所述催化剂是铜(II)时,存在还原剂。在一些实施例中,所述铜催化剂是Cu(NO3)2、Cu(OAc)、CuSO4或其任何组合。
在一些实施例中,所述还原剂包括抗坏血酸盐、三(2-羧乙基)膦(TCEP)、2.4.6-三氯苯酚(TCP)、NADH、NADPH、硫代硫酸盐、金属铜、醌、对苯二酚、维生素K、谷胱甘肽、半胱氨酸、2-巯基乙醇、二硫苏糖醇、Fe(II)、Co(II)、施加的电位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W或其任何组合。在一些实施例中,所述还原剂包括抗坏血酸钠。在一些实施例中,所述配体包括三(苄基三唑基甲基)胺或三(3-羟丙基三唑基甲基)胺。
在一些实施例中,提供了一种用于产生测序文库的试剂盒,所述试剂盒包括:
a.拴系有寡核苷酸的核苷酸;以及以下中的至少一个:
(i)A、C、G、U和/或T核苷酸或其组合;
(ii)聚合酶;
(iii)引物和/或衔接子序列;
(iv)缓冲液;或
(v)盐。
在一些实施例中,所述试剂盒包括A、C、G、U和/或T核苷酸。
在一些实施例中,所述试剂盒可以包含聚合酶。在一些实施例中,所述聚合酶是野生型聚合酶、经过修饰的聚合酶、突变型聚合酶、工程化聚合酶或其组合。
在一些实施例中,所述聚合酶是Taq DNA聚合酶、DNA聚合酶、DeepVentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、Thermo SequenaseTM、SequenaseTMV2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase IIFusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
在一些实施例中,所述试剂盒包括一个或多个引物序列、衔接子序列、条形码序列或唯一分子标识符序列。
在一些实施例中,所述试剂盒包括至少一种缓冲液。
在一些实施例中,所述试剂盒包括至少一种盐。
本文所提供的一些实施例包含一种用于组合条形码编码的试剂盒。所述试剂盒可以包含:
a.拴系有寡核苷酸的核苷酸;以及以下中的至少一个:
(i)A、C、G、U和/或T核苷酸或其组合;
(ii)聚合酶;
(iii)引物和/或衔接子序列;
(iv)缓冲液;或
(v)盐。
在一些实施例中,所述组合条形码编码试剂盒中提供有以下聚合酶中的一种或多种聚合酶:Taq DNA聚合酶、DNA聚合酶、Deep VentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、Thermo SequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM 聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6RNA聚合酶、DNA聚合酶1、克列诺片段(Klenow fragment)、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。例如,在优选实施例中,所述组合条形码编码试剂盒可以包含逆。举例来说,所述组合条形码编码试剂盒可以包含SuperscriptTM逆转录酶和Pfusion-exo-聚合酶。
在一些实施例中,所述试剂盒进一步包含提供多个隔室的容器,其中每个隔室包含包括隔室特定条形码的引物。例如,在一些实施例中,所述
现在将详细参照本公开的某些实施例,在附图中展示所述实施例的实例。尽管将结合所展示的实施例描述本公开,但是应当理解其不旨在将本公开限于那些实施例。相反,本公开旨在涵盖所有替代方案、修改和等同物,所述替代方案、修改和等同物可以包含在如所附权利要求书所定义的本公开内。
附图说明
图1示出了拴系有寡核苷酸的脱氧核苷酸三磷酸(dNTP)在NGS文库制备中的应用的示意图。在此实施例中,拴系有寡核苷酸的dNTP掺入核酸中的多个位置中(图1A)。图1B示出了退火到所拴系寡核苷酸的引物的延伸以及通过非天然接头对聚合酶进行的随后的通读。
图2提供了拴系有寡核苷酸的双脱氧核苷酸三磷酸(ddNTP)在NGS文库制备中的应用的示意图。在此实施例中,末端脱氧核苷酸转移酶(TdT)以非模板依赖性方式将包括第一衔接子序列的单个拴系有寡核苷酸的ddNTP添加到核酸的3'端(图2A)。进一步地,使第二衔接子退火并将其连接以提供具有在两端处具有互补区和错配区的衔接子的多核苷酸文库(图2B)。
图3描绘了将预先设计的序列标签引入在所产生的DNA片段的两端上的引物延伸和通过掺入拴系有寡核苷酸的双脱氧核苷酸进行的随机DNA合成终止的基本原理。然后可以使用PCR引物对带标签的DNA片段的文库进行扩增,这进而引入平台特异性衔接子序列。任选地,所拴系寡核苷酸可以包括亲和标签(例如,生物素,左侧的方案),所述亲和标签可以用于核酸靶标富集。带标签的DNA片段的长度可以通过调整拴系有寡核苷酸的ddNTP相对于对应的天然脱氧核苷酸的浓度和/或比率来控制。
图4示出了在切口平移或缺口填补反应期间通过掺入拴系有寡核苷酸的ddNTP进行的DNA标记的原理。
图5示出了通过由(TdT)非模板依赖性地掺入拴系有寡核苷酸的ddNTP进行的DNA端标记的基本原理。如图36A中所示出的,可以对双链、单链和部分双链DNA的端进行标记。
图6示出了通过由poly(A)聚合酶或poly(U)聚合酶非模板依赖性地掺入拴系有寡核苷酸的ddNTP进行的RNA端标记的基本原理。
图7描绘了用于制备叠氮基修饰的dCTP的示例性合成方案和几种示例性接头的结构。
图8描绘了用于制备叠氮基修饰的dATP的示例性合成方案。
图9描绘了用于制备拴系有寡核苷酸的dCTP的示例性点击反应方案以及几种示例性接头的结构。
图10描绘了用于制备拴系有寡核苷酸的ddUTP的示例性点击反应方案。
图11A-11C描绘了对不同类型的聚合酶将拴系有寡核苷酸的核苷酸掺入的能力进行测试的实验的结果。箭头指示点击反应产物;K-泳道示出了反应前的Cy5标记的链,K+泳道示出了使用4种天然dNTP(A和B)或使用dCTP(C)得到的反应产物;C6-B1、PEG4-B1、C2-B1、C4-B1和PEG2-B1对应于如表1中所提供的点击反应产物,B1对应于SEQ ID NO:33。
图12A-12B示出了来自拴系有寡核苷酸的掺入实验的结果。具体地,图12A描绘了用于多个拴系有寡核苷酸的核苷酸掺入实验的核酸底物。箭头示出了可能的拴系有寡核苷酸的dCTP掺入位点。图12B是展示了拴系有寡核苷酸的核苷酸掺入在DNA/RNA底物上的凝胶的图像。K-泳道示出了反应前的Cy5标记的链,K+泳道示出了使用4种天然dNTP得到的反应产物,泳道2到5示出了在不存在天然dNTP的情况下掺入各种数量的拴系有寡核苷酸的核苷酸而产生的聚合反应产物(C2-B2表示由叠氮基-C2-dCTP与SEQ ID NO:23之间的点击反应产生的OTDN)。泳道8中的产物指示多个拴系有寡核苷酸的胞嘧啶掺入事件的发生。
图13示出了ddUTP的掺入和PAGE凝胶。即,提供了描绘通过TdT在双链和单链核酸上掺入ddUTP的方案。使用PAGE凝胶对结果进行分析。K-泳道示出了反应前的Cy5标记的链;ddUTP-p泳道示出了成功的拴系有寡核苷酸的ddUTP(SEQ ID NO:2)掺入。
图14示出了RNA的3'端的poly(U)聚合酶标记的实验结果。此实验确认了poly(U)聚合酶将拴系有寡核苷酸的ddUTP掺入。
图15A-15E示出了用几种不同聚合酶进行的拴系有寡核苷酸的核苷酸掺入实验的结果。箭头指示成功的掺入事件。K-泳道示出了反应前的Cy5标记的链,K+泳道示出了在使用天然dTTP和dCTP时得到的反应产物。“ddUTP”泳道示出了ddUTP的掺入,“OTDDN”泳道示出了拴系有寡核苷酸的ddUTP(SEQ ID NO:1)的掺入。
图16描绘了用于确认在PCR中使用特异性引物的情况下的拴系有聚合酶寡核苷酸的引物延伸通读事件的原理验证实验模型的方案。首先,使第一引物退火到模板,使得要掺入的第一核苷酸是拴系有寡核苷酸的脱氧核苷酸(拴系有寡核苷酸的dC)(步骤I)。然后,使第二引物(步骤II中的虚线)退火,并添加Pfu DNA聚合酶以进行引物延伸。弯曲箭头示出了通读位置。然后,对经延伸的DNA片段进行PCR扩增(步骤III)。为了确认正确的通读事件,对所产生的PCR片段进行克隆并进行Sanger测序(数据未示出)。
图17A-17B示出了用于确认正确的通读产物形成的另一个实验的方案。图17B是展示了结果的凝胶的图像(图17B)。来自图12中的方案的引物延伸产物用作起始模板(SEQ IDNO30和31)。实心圆表示Cy5染料,空心圆圈表示Cy3染料。
图18A-18B示出了比对结果。图18A示出了在对通过两个M13mp18特异性引物的延伸以及通过掺入拴系有寡核苷酸的ddNTP进行的随机终止产生的扩增子文库进行测序时获得的读段的比对。比对(图18B)指示两个M13mpl8基因组基因座的覆盖率,其中两个插入物的5'端定位于对应于引发位点的固定位置处,而3'端出现在对应于拴系有寡核苷酸的ddNTP掺入位点的随机区处。
图19示出了在对通过随机引物的延伸以及通过掺入拴系有寡核苷酸的ddNTP进行的终止产生的扩增子文库进行测序时获得的读段的比对。比对指示完整的大肠杆菌K-12染色体的覆盖率。
图20A-20C示出了对16S rRNA基因的基因组上下文进行分析的原理。图20A示出了16SrRNA基因图谱和采用拴系有寡核苷酸的ddNTP终止的半靶向片段文库制备的策略,即从单个面向外的引物开始。图20B和20C是对应的安捷伦(Agilent)2100生物分析仪电泳图。V1-V9表示16S rRNA基因内的可变序列区。
图21描绘了根据图20中所描绘的原理进行的ATCCTM MSA-1002TM微生物组标准测序的结果。
图22示出了包含通过随机引物的延伸以及通过掺入拴系有寡核苷酸的双脱氧核苷酸进行的DNA合成终止产生覆盖完整的转录物长度的片段文库的链特异性mRNA测序文库制备的基本原理。在第二链合成期间进行带标签的片段文库的产生。然后可以使用PCR引物对带标签的DNA片段的文库进行扩增,这进而引入平台特异性衔接子序列。带标签的DNA片段的长度可以通过调整拴系有寡核苷酸的双脱氧核苷酸相对于对应的天然脱氧核苷酸的浓度和/或比率来控制。图22公开了作为SEQ ID NO:41的“TTTTTTTTTTTTTT”。
图23示出了针对根据图22中所描绘的原理制备的mRNA测序文库所计算的基因体覆盖率。
图24示出了包含通过oligo(dT)逆转录引物的延伸以及通过掺入拴系有寡核苷酸的双脱氧核苷酸进行的cDNA合成终止产生覆盖转录物的3'端的片段文库的链特异性mRNA测序文库制备的基本原理。然后可以通过与缀合到双脱氧核苷酸的寡核苷酸互补的引物的线性延伸来对带标签的cDNA片段的文库进行预扩增。采用具有高通读接头活性的聚合酶进行的此程序可以提高转录物检测的灵敏度。然后使用引入平台特异性衔接子序列的引物通过PCR进行最终扩增。带标签的cDNA片段的长度可以通过在逆转录步骤处调整拴系有寡核苷酸的双脱氧核苷酸相对于对应的天然脱氧核苷酸的浓度和比率来控制。拴系有寡核苷酸的双脱氧核苷酸相对于对应的天然脱氧核苷酸的浓度和比率可以产生跨宽范围的RNA输入量具有类似大小的插入物。图24公开了作为SEQ ID NO:41的“TTTTTTTTTTTTTT”。
图25示出了针对根据图24中所描绘的原理制备的mRNA测序文库所计算的基因体覆盖率。
图26A-26B示出了使用拴系有寡核苷酸的核苷酸进行的3'mRNA-seq文库制备的结果。(图26A)示出了所产生的文库的安捷伦2100生物分析仪电泳图,并且(图26B)示出了从拴系有寡核苷酸的核苷酸掺入位点开始的测序读段的碱基组成。第一位置处的“A”对应于ddUTP掺入位点。
图27A-27D示出了概念验证实验的结果,所述实验将拴系有寡核苷酸的核苷酸技术并入单细胞RNA测序文库制备工作流中。图27A示出了所制备的文库的安捷伦2100生物分析仪电泳图,图27B示出了检测到的转录物生物型的分布,图27C和27D分别示出了对每细胞条形码的平均基因计数和唯一分子标识符(UMI)计数的估计。
图28示出了包含通过第二链合成引物的延伸以及通过掺入拴系有寡核苷酸的双脱氧核苷酸进行的DNA合成终止产生覆盖转录物的5'端的片段文库的链特异性mRNA测序文库制备的基本原理。然后可以使用PCR引物对带标签的DNA片段的文库进行扩增,这进而引入平台特异性衔接子序列。带标签的DNA片段的长度可以通过调整拴系有寡核苷酸的双脱氧核苷酸相对于对应的天然脱氧核苷酸的浓度和/或比率来控制。图28公开了作为SEQ IDNO:41的“TTTTTTTTTTTTTT”。
图29示出了针对根据图28中所描绘的原理制备的mRNA测序文库所计算的基因体覆盖率。
图30示出了由包含在拴系有寡核苷酸的核苷酸序列中的T7 RNA聚合酶启动子产生的体外转录产物。约49nt的RNA片段峰表示合成在接头位点处终止的转录产物,并且约95nt的RNA片段峰表示受二级结构影响的相同转录物的迁移。长度为约61nt的RNA片段峰表示在具有接头跳跃的情况下合成的转录产物。~138nt RNA片段峰表示受二级结构影响的相同转录物的迁移。结果指示,拴系有寡核苷酸的核苷酸中包含的T7启动子序列是功能性的并且可以用作体外转录起始位点。
图31描绘了示出了SEQ ID NO:24(Cy5标记的)和27的比对的双链体。
图32描绘了示出了SEQ ID NO:24(Cy5标记的和生物素化的)和28的比对的双链体。
图33描绘了示出了SEQ ID NO:31和32的比对的双链体。
图34A-34E描绘了几个示例性抗反向帽类似物的结构。
图35A-35G示出了使用含有全长测序衔接子修饰的拴系有寡核苷酸的双脱氧核苷酸进行的无PCR的RNA文库制备的基本原理。在对所产生的文库进行测序时,预期结构的读段对应于cDNA片段并覆盖转录物的预期部分。图35A公开了作为SEQ ID NO:42的“AAAAAAAAAA”。
图36A和36B示出了通过末端脱氧核苷酸转移酶(TdT)用拴系有寡核苷酸的双脱氧核苷酸进行非模板依赖性DNA端标记的原理;(A)在没有在第二标记步骤前去除模板DNA寡核苷酸的情况下进行的标记方案和标记的结果;和(B)通过核酸外切酶处理去除模板链后进行的标记方案和标记的结果。
图37A-37C示出了用在两个末端处产生多个具有已知序列的DNA片段的拴系有寡核苷酸的双脱氧核苷酸(OTDDN)进行的模板依赖性DNA端标记的原理(图37A)。结果指示,此种双重加标签原理可以用于测序文库制备(图37B-37C)。
图38示出了通过拴系有寡核苷酸的双脱氧核苷酸(OTDDN)的模板定向延伸的3'端标记核酸的原理。
图39是示出了在用于完整的单细胞转录组分析的组合条形码编码工作流中使用拴系有寡核苷酸的双脱氧核苷酸的示例性工作流的示意图。BC=条形码;B=生物素;SA=链霉亲和素。
图40汇总了来自Rosenberg等人,《科学(Science)》360,176—182(2018)的SPLiT-seq方案。P5和P7表示与Illumina平台上的测序相关的序列。RT=逆转录;SPRI=固相可逆固定化;Tn5=转座酶Tn5;TSO=模板转换寡核苷酸。图40按出现顺序分别公开了SEQ ID NO43、44、43、44、43、44、44和44。
图41汇总了本发明组合条形码编码方案,与传统的SPLiT-seq方案(“原始工作流”)相比,本发明组合条形码编码方案使用了拴系有寡核苷酸的双脱氧核苷酸(“OTDDN工作流”)。S5和S7序列表示用于在扩增期间添加衔接子的手柄序列。P5、P7、索引5和索引7表示与Illumina平台上的测序相关的序列。ME=嵌合端。
图42A和42B是在第一(A)和第二(B)扩增反应后使用本文根据实例9所描述的拴系有寡核苷酸的双脱氧核苷酸(OTDDN)组合条形码编码工作流由诱导性多能干细胞(iPSC)制备的RNA的NGS文库制备的安捷伦2100生物分析仪电泳图。
图43是使用本文根据实例9所描述的拴系有寡核苷酸的双脱氧核苷酸(OTDDN)组合条形码编码工作流由外周血单核细胞(PBMC)制备的RNA的文库制备的安捷伦2100生物分析仪电泳图。。
图44示出了用于制备包括与寡核苷酸连接的抗体的拴系有寡核苷酸的细胞标志物结合剂(OTBA)的示例性方案。寡核苷酸在5'到3'方向上包含5'手柄(5'Handle)、细胞结合剂索引(Ab索引)和具有3'OH的Poly(A)序列(PolyA30,SEQ ID NO:46)。还示出了用作模板以促进拴系到抗体的5'手柄序列的模板定向延伸的夹板。图48公开了作为SEQ ID NO:40的“PolyT30”。
图45示出了在使用本文所描述的组合条形码编码工作流由HEK-293细胞和NIH-3T3细胞制备核酸文库时的单细胞分辨率。将HEK-293文库和NIH-3T3文库混合在一起进行处理。经映射的读段按条形码排序并按物种绘制。X轴上的条形码是人序列的读段(人读段),而Y轴上的条形码是小鼠序列的读段(小鼠读段)。轴外条形码归因于共享相同条形码(即,缺乏单个细胞分辨率)的2个或更多个细胞。
序列描述
下表提供了本文所引用的某些序列的列表。
具体实施方式
本公开内容提供了拴系有寡核苷酸的核苷酸、制备所述拴系有寡核苷酸的核苷酸的方法和使用所述拴系有寡核苷酸的核苷酸的方法。所述拴系有寡核苷酸的核苷酸包括与长度为约3个到约100个核苷酸的寡核苷酸连接的核苷酸。这些拴系有寡核苷酸的核苷酸可以用于在多种不同的应用中用已知的寡核苷酸对多种不同类型的核酸进行标记或加标签,所述已知的寡核苷酸可以携带唯一的序列并充当条形码(例如,细胞或细胞核条形码、隔室条形码、索引UMI等)、延伸引物或退火位点,或对在下游应用中使用的特异性启动子进行编码的序列(例如,T7启动子序列)。
在一个实施例中,聚合酶将拴系有寡核苷酸的核苷酸掺入核酸链中,以为核酸合成的启动提供新的引物位点。提供了与所拴系寡核苷酸至少部分互补的引物,并且允许所述引物退火到所拴系寡核苷酸。聚合酶可以通过拴系有寡核苷酸的核苷酸上的非天然接头延伸经退火的引物,由此产生新的核酸链。
在其它实施例中,聚合酶将拴系有寡核苷酸的核苷酸掺入核酸链中,以提供用于使夹板寡核苷酸退火的通用手柄序列。夹板寡核苷酸包含(i)能够退火到所拴系核苷酸的通用手柄序列的序列和(ii)期望的序列的模板。聚合酶可以通过模板定向聚合使所拴系寡核苷酸的3'OH跨经退火的夹板寡核苷酸延伸,由此掺入任何期望的序列(条形码、唯一分子标识符、通用序列、随机序列、唯一分子标识符、启动子等)并且产生新的核酸链。
可以对所产生的新的核酸链进行进一步操纵(例如,使用随后的扩增、延伸、连接或其它处理)。举例来说,可以对所产生的新的核酸链进行扩增和/或使其经历衔接子添加反应以提供下一代测序文库。测序文库可用于多种测序方法并且可跨各种平台使用。
在一些实施例中,寡核苷酸可以通过dNTP核碱基拴系到dNTP。当寡核苷酸拴系到dNTP时,核苷酸多次掺入核酸中是可能的(参见例如图1和12)。可替代地,寡核苷酸通过ddNTP核碱基拴系到ddNTP(OTDDN)。在寡核苷酸拴系到ddNTP的实施例中,拴系有寡核苷酸的核苷酸的掺入使核酸合成终止(参见图3)。
在一些实施例中,可以使用“点击”化学来制备拴系有寡核苷酸的核苷酸。例如,寡核苷酸作为点击反应的结果而拴系到dNTP或ddNTP的核碱基,如叠氮化物与炔烃基团之间的(3+2)环加成反应,由此形成将寡核苷酸和dNTP或ddNTP以化学方式连接的1,2,3-三z唑环。
在一些实施例中,所拴系寡核苷酸可以用作核酸聚合酶合成核酸的引发位点。与所拴系寡核苷酸互补的引物可以具有用于添加用于进行测序的衔接子和/或条形码的加尾序列(例如,用于与Illumina流动细胞杂交的P5和P7序列)。
在本文所描述的实施例中,可以用亲和标签修饰拴系有寡核苷酸的核苷酸以促进靶标产物富集。
I.拴系有寡核苷酸的核苷酸
本发明方法是基于将寡核苷酸修饰的核苷酸掺入到核酸中。各种核酸聚合酶具有将带有与经修饰核苷酸的核碱基连接的大体积基团的所述经修饰核苷酸掺入的能力,并且预期此种经修饰核苷酸可能会在从例如随机六聚体启动的核酸拷贝过程期间由核酸聚合酶掺入到生长的核酸链,或将通过如末端转移酶等非模板依赖性聚合酶添加到单链或双链核酸的3'端(例如参见图1和2)。当经修饰核苷酸在其糖部分上具有3'-羟基时,预期带有寡核苷酸的核苷酸至少一次和任选地多次掺入所拷贝核酸中。例如,在此种新合成的核酸上具有多个引发位点将有助于使用与连接到所掺入核苷酸(图1)作为延伸引物的所拴系寡核苷酸互补的随机六聚体和寡核苷酸两者进行无偏差等温扩增。用末端转移酶(TdT)在3'端处掺入双链DNA结构中的带有寡核苷酸的核苷酸可以用于将完全或部分互补的寡核苷酸添加到相对DNA链(互补和错配的衔接子区,参图2)。通过使用适当设计的寡核苷酸,可以产生与各种平台,包含但不限于Illumina平台上的测序兼容的DNA端。
虽然不受理论约束,但据信在核酸合成期间,经修饰核苷酸的有效掺入高度依赖于所连接标签的大小。例如,核苷酸杂环碱与标签之间的连接基团(或基团)(即,式(A)的-Y-CXN-Z-基团)的长度可能对掺入有重大影响。接头应足够长以减少标记空间位阻和核苷酸空间结构的变化。同时,所述接头应该足够短以避免折叠回到核酸链上。此外,接头的末端官能团必须被核酸聚合酶所耐受。合理设计的接头将允许掺入带有大标记的核苷酸。
当拴系有寡核苷酸的核苷酸具有3'-H而不是3'-羟基时(例如,二脱氧修饰的核苷酸),掺入此种拴系有寡核苷酸的核苷酸将使核酸合成终止(图3)。当在合成反应中使用拴系有寡核苷酸的双脱氧核苷酸(OTDDN)时,会产生一组随机终止的片段。
通过在合成反应中调整OTDDN例如相对于对应的天然核苷酸的浓度,可以操纵合成(和合成的链的长度)。在一些实施例中,合成反应包含例如单一类型的OTDDN(例如,OTddATP、OTddTTP、OTddCTP、OTddCTP、OTddUTP)。在一些实例中,合成反应包含例如两种或更多种OTDDN的组合(例如,OTddTTP和OTddCTP;或其它组合)。在反应中存在单一类型的OTDDN(伴随着其它天然核苷酸)的一些实施例中,反应不含例如对应的天然核苷酸。在反应中存在单一类型的OTDDN的一些实施例中,与对应的天然核苷酸相比,反应含有相对较多的所存在的OTDDN,反应含有大约等量的OTDDN和对应的天然核苷酸,或与对应的天然核苷酸相比,反应含有相对较少的所存在的OTDDN。
可以对来自延伸反应(例如,来自与所拴系寡核苷酸杂交的延伸引物或来自所拴系寡核苷酸跨夹板寡核苷酸的延伸)或来自使用OTDDN的扩增反应的所产生的核酸进行进一步操纵(例如,使用随后的扩增、延伸、连接或其它处理)。举例来说,然后可以对掺入OTDDN的延伸产物进行如上所述的下游操纵(例如,进一步的延伸反应、扩增反应等)。在一些实例中,可以在下游延伸或扩增(例如,PCR)反应中使用具有所掺入OTDDN的延伸产物以用于平台特异性全长测序衔接子的引入。在一些实施例中,这种方法还可以用于克服对核酸片段化的需要。
本文所描述的拴系有寡核苷酸的核苷酸可以任选地包括亲和标记(例如,进行生物素修饰)以促进富集。可替代地,拴系有寡核苷酸的核苷酸可以包括其它标记。
本公开的方法有利地允许将寡核苷酸拴系到任何核苷酸,然后将所述寡核苷酸掺入核酸序列中,同时用核酸聚合酶进行链合成。因此,本文所提供的方法有利地允许寡核苷酸与任何核酸序列构成的任何最终(即,末端,例如3'端)核苷酸连接。
在一些实施例中,本文所使用的所述拴系有寡核苷酸的核苷酸通常具有根据式(A)的结构或其盐:
其中NB是核碱基;Oligo是由3到100个核苷酸构成的寡核苷酸;X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;Z和Y中每一个独立地选自键、氨基、酰胺基、亚烷基、亚烯基、亚炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代。
在一些实施例中,式(A)的化合物的盐是季铵盐。
在一些实施例中,X选自H、OH、F、N3和氨基。在其它实施例中,X选自H、N3和OH。在一些实施例中,X是OH。在其它实施例中,X是H。
在一些实施例中,Q是H、OH、F、Cl、Br、I和N3。在其它实施例中,Q是H。
在一些实施例中,X和Q是H。
寡核苷酸“Oligo”可以通过如以下C1中所示出的到dNTP或ddNTP的核碱基的5'-磷酸或通过如以下C2中所示出的核碱基(NB2)拴系到核苷酸。
结构C1和C2提供了式(A)的Oligo如何拴系到dNTP或ddNTP的更详细的视图,因此Oligo*表示式(A)的化合物中存在的原始Oligo序列的除一个单元以外的所有单元。
“CXN”是由中间体上的官能团之间的反应形成的基团,所述基团导致中间体偶联以形成本文所公开的拴系有寡核苷酸的核苷酸。
在其它实施例中,所述反应可以形成含有一到四个N原子、O原子、S原子或其组合的杂环基团,其中所述杂环基团任选地在碳原子、氮原子或硫原子处被取代。在一些实施例中,所述反应可以形成选自以下的杂环基团:i)具有一个杂原子的5元杂环(例如,吡咯类、噻吩类、呋喃类、吡咯烷、噻吩、四氢呋喃);ii)在1,2或1,3位置处带有两个杂原子的5元杂环(例如:异噁唑类、噁唑类、吡唑类、咪唑、异噻唑类、噻唑类);iii)带有三个杂原子的5元杂环(例如,三唑类、噁二唑类、噻二唑类);iv)带有一个杂原子的6元杂环(例如,吡啶类、噻喃类、吡啶类、四氢吡喃类、四氢噻吩类、哌啶类);v)带有两个杂原子的6元杂环(例如,吡啶类、嘧啶类、吡嗪类、六氢吡啶类、六氢嘧啶类、哌嗪类、二氧杂环己烷、吗啡类、噻嗪类、氧杂环己烷、二硫类);和vi)带有三个杂原子的6元杂环(例如,三嗪类、二嗪类、噻二嗪类、三嗪类、噁嗪类)。
在一些实施例中,CXN选自各自具有1到3个杂原子的5元杂环和6元杂环。在一些实施例中,CXN选自吡咯并、苯硫基、呋喃基、吡咯烷基、硫代乙酰基、四氢呋喃基、异噁唑基、噁唑并、吡唑并、咪唑基、异噻唑并、噻唑基、三唑并、噁二唑并、噻二唑并、吡喃基、硫代吡喃基、吡啶基、四氢吡喃基、四氢硫代吡喃基、哌啶基、哒嗪基、嘧啶基、吡嗪基、六氢哒嗪基、六氢嘧啶基、哌嗪基、二噁烷基、吗啉代、噻嗪基、噁嗪并、二噻烷基、三嗪基、二噻嗪并、噻二嗪并、三嗪烷基和噁三唑并。
在一些实施例中,Z和Y各自是接头或连接部分,所述接头或连接部分是指可以变化以在ddNTP或dNTP与具有期望性质的寡核苷酸之间提供整体拴系的某些官能团。在一些实施例中,Z和Y中每一个独立地选自键、氨基、酰胺基、亚烷基、亚烯基、亚炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合。在一些实施例中,每个Z和Y独立地选自氨基、酰胺基、亚烷基、亚烯基、亚炔基、醚、酮、羰基、酸酐、酯、酰亚胺或其任何组合。在其它实施例中,Y是亚烷基或亚炔基。在其它实施例中,Z是亚炔基、亚烷基、醚和酰胺基中的一个或多个的组合。在其它实施例中,Z是-(CH-CH)C(O)(CH2CH2)NHC(O)(CH2)5-或-HN-。在仍其它实施例中,-NB-Z-的组合是或NB-HN-L1-、-NB-(CH-CH)C(O)(CH2CH2)NHC(O)-L1),其中L1选自亚烷基、亚烯基、亚炔基和聚亚烷基二醇。
在一些实施例中,式(A)的化合物选自式(B1)-(B4)的化合物
和其盐,其中Oligo*是来自Oligo基团的其余2到99个核苷酸,并且NB2是核碱基;L1选自亚烷基、亚烯基、亚炔基和聚亚烷基二醇;L2是亚烷基或亚炔基。
在一些实施例中,CXN包含使用点击化学制备的本文所述的基团中的一个或多个基团。
在一些实施例中,连接基团Z包括选自亚烷基、亚烯基、亚炔基和聚亚烷基二醇的L1的亚组。在其它实施例中,L1是C1-C12亚烷基、C2-C12亚烯基、C2-C12亚炔基和具有2到8个二醇单元的聚亚烷基二醇。在其它实施例中,L1选自具有2个乙二醇单元的聚乙二醇(PEG2)、具有4个乙二醇单元的聚乙二醇(PEG4)或具有6个乙二醇单元的聚乙二醇(PEG6)、亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基和亚己基。在又其它实施例中,L1选自-CH2-、-(CH2)3-、-(CH2)5-、PEG2和PEG4。
在一些实施例中,连接基团Y包括选自亚烷基或亚炔基的L2亚组。在其它实施例中,L2是C1-C12亚烷基或C1-C12亚炔基。在在其它实施例中,L2-Oligo的组合选自-(CH2)4-Oligo或-(CH2)4C≡C-Oligo。寡核苷酸“Oligo”可以通过到dNTP或ddNTP的核碱基的5'-磷酸或通过核碱基(NB2)拴系到核苷酸。
NB和NB2独立地是核碱基。在一些实施例中,核碱基选自腺嘌呤、7-脱氮腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷。NB2是Oligo基团的单个核苷酸,使得NB-Oligo*的组合是Oligo。
在一些实施例中,NB是嘧啶,并且所述嘧啶在核碱基的第5位处拴系到寡核苷酸。在其它实施例中,NB是嘌呤,并且其中所述嘌呤在核碱基的第7位处拴系到寡核苷酸。
本文所使用的拴系有寡核苷酸的核苷酸通常具有根据式(I)的结构或其盐:
其中X是H、OH或N3,NB表示核碱基,Z和Y是接头,Oligo表示长度为3到100个核苷酸的寡核苷酸,并且Click表示将Z接头和Y接头共价结合的点击反应的反应产物。在一些实施例中,核碱基选自腺嘌呤、7-脱氮腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷。在一些实施例中,Z和Y各自独立包括选自以下的至少一个连接部分:键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯或其任何组合或其任何组合。
可替代地,拴系有寡核苷酸的核苷酸可以是无环的(I')。
点击反应产物包含如但不限于以下的反应的产物:铜催化的叠氮化物-炔烃环加成(CuAAC);应变促进的叠氮化物-炔烃环加成(SPAAC),其也被称为无铜点击化学;应变促进的炔烃-硝酮环加成(SPANC);炔烃氢硫醇化(hydrothiolation);和烯烃氢硫醇化。
在一些实施例中,点击反应是叠氮化物和炔烃的(3+2)环加成反应,从而产生1,2,3-三唑。反应产物提供了三唑产物,由此提供了式(II)的拴系有寡核苷酸的核苷酸或其盐:
其中X、NB、Z、Y和Oligo是如上文所定义的。在式(II)中,Z和Y中的一个与三唑的第1位共价结合,并且Z和Y中的另一个与三唑的第4或5位共价结合。在一个实施例中,X是OH,并且在另一个实施例中,X是H,并且在又另一个实施例中,X是N3。
在一些实施例中,接头Z和/或Y包含基于碳的链,例如可以是直链或支链的具有1到12个碳原子的烷基链。在一些实施例中,亚烷基是直链或支链C1-C6亚烷基。接头Z和/或Y还可以包含具有2到12个碳的直链或支链亚烯基。可替代地,亚烯基是直链或支链C2-C6亚烯基。在一些实施例中,接头Z和Y包含由2到12个碳构成的直链或支链亚炔基链。在一些实施例中,亚炔基是直链或支链C2到C6亚炔基。
在一些实施例中,Z和/或Y包含具有2到20个亚烷基二醇单元的聚亚烷基二醇,而在其它实施例中,聚亚烷基二醇具有2到8个亚烷基二醇单元。在一些实施例中,聚亚烷基二醇具有2、4或6到8个乙二醇单元。合适的亚烷基二醇单元包含乙二醇、1,2-丙二醇、1,2-丁二醇等。
更具体地,拴系有寡核苷酸的核苷酸可以具有式(III)的结构或其盐:
其中L1和L2各自独立地是包括亚烷基、亚炔基、聚亚烷基二醇或其组合的接头。
在一些实施例中,拴系有寡核苷酸的核苷酸可以具有式(III)的结构或其盐的拴系有寡核苷酸的核苷酸,其中L1是包括亚烷基、聚亚烷基二醇或其组合的接头,并且L2是具有2到12个碳的亚炔基的接头。更具体地,L2是己炔基。聚亚烷基二醇可以是具有2到6个乙二醇单元的聚乙二醇。在另一个实施例中,L1包括具有1到12个碳原子的亚烷基。更具体地,亚烷基是亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基或亚己基。
可替代地,当使用也被称为无铜点击化学的应变促进的叠氮化物-炔烃环加成(SPAAC)来产生拴系有寡核苷酸的核苷酸时,本文所描述的所产生的拴系有寡核苷酸的核苷酸通常具有根据式(IV)的结构或其盐:
其中X是H或OH或N3,NB表示核碱基,Z和Y是接头,Oligo表示长度为3到100个核苷酸的寡核苷酸。在一些实施例中,核碱基选自腺嘌呤、7-脱氮腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷。在一些实施例中,Z和Y各自独立包括选自以下的至少一个连接部分:氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯或其任何组合或其任何组合。
可替代地,在一些实施例中,可以在核苷酸的3'位置处引入叠氮化物修饰,并且因此,寡核苷酸可以共价拴系到核苷酸的3'位置(V和VI)。
NB表示核碱基,Y是接头,Oligo表示长度为3到100个核苷酸的寡核苷酸。在一些实施例中,核碱基选自腺嘌呤、7-脱氮腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷。在一些实施例中,Z和Y各自独立地包括选自以下的至少一个连接部分:-C(O)NH-、-C(O)C)-、-NH-、-S-、-O-、烷基、烯基、炔基或其任何组合。
在一些实施例中,本公开的拴系有寡核苷酸的核苷酸包括嘧啶核碱基。在这些实施例中,嘧啶核碱基在嘧啶的第5位处与寡核苷酸结合(参见例如化合物E1)。可替代地,当拴系有寡核苷酸的核苷酸包括嘌呤碱基时,嘌呤核碱基在核碱基的第7位处与寡核苷酸结合。在其它实施例中,使用在5'端处在磷酸酯基上具有C6(己炔基)-炔烃基序的寡核苷酸获得拴系有寡核苷酸的核苷酸(参见例如化合物E2)。
本公开的拴系有寡核苷酸的核苷酸的盐包含季铵盐、钠盐、钾盐等。
在一些实施例中,拴系有寡核苷酸的核苷酸的寡核苷酸在其5'端处拴系到所述核苷酸。在一些实施例中,炔烃修饰通过8个碳原子的间隔子添加到寡核苷酸核碱基并且被称为“辅助”修饰,或者可替代地,炔烃基团通过己炔基接头与寡核苷酸的5'端的磷酸酯连接。如贯穿当前描述所使用的,当指示拴系有寡核苷酸的核苷酸具有“辅助”(例如,ddUTP-AldU-[寡核苷酸序列])时,应当理解,寡核苷酸已经在通过8个碳原子的间隔子与寡核苷酸的核碱基连接的炔烃基团的反应期间拴系到核苷酸(与所述核苷酸共价连接)。可替代地,当指示拴系有寡核苷酸的核苷酸具有“己炔基”(例如,ddUTP-己炔基-[寡核苷酸序列])时,应当理解,寡核苷酸已经在通过己炔基接头与寡核苷酸的5'端的磷酸酯连接的炔烃基团的反应期间拴系到核苷酸(与所述核苷酸共价连接)。在一些实例中,寡核苷酸例如在其3'端具有修饰。在一些实例中,所述修饰是生物素修饰、磷酸酯修饰、胺修饰或硫代磷酸酯修饰。
在一些实施例中,拴系有寡核苷酸的核苷酸的寡核苷酸包括脱氧核糖核苷酸。在一些实施例中,拴系有寡核苷酸的核苷酸的寡核苷酸包括核糖核苷酸。在一些实施例中,拴系有寡核苷酸的核苷酸的寡核苷酸包括脱氧核糖核苷酸和核糖核苷酸。
拴系的寡核苷酸的长度取决于使用拴系有寡核苷酸的核苷酸的方法。在一些实例中,寡核苷酸为3到100个核苷酸、10到100个核苷酸、10到50个核苷酸或20到40个核苷酸。在一些实例中,寡核苷酸的长度可以为多于100个核苷酸,例如至多1000nt。
本文所描述的拴系有寡核苷酸的核苷酸的寡核苷酸不限于任何特异性序列。相反,本文所描述的拴系有寡核苷酸的核苷酸的寡核苷酸可以包括条形码序列、衔接子序列、唯一分子标识符、索引序列、聚合酶的退火位点、手柄序列、通用手柄、通用序列等、随机序列、靶特异性序列或其任何组合。
在一些实例中,拴系有寡核苷酸的核苷酸选自式B1和B3的化合物,其中X是OH,Q是H,L1是C1亚烷基、C3亚烷基、C5亚烷基、具有2个乙二醇单元的聚乙二醇(PEG2)或具有4个乙二醇单元的聚乙二醇(PEG4),并且L2是C1-C12亚烷基或C1-C12亚炔基。在一些实例中,L2-Oligo的组合是(CH2)4C≡C-Oligo。
在一些实例中,拴系有寡核苷酸的核苷酸选自式B2和B4的化合物,其中X是OH,Q是H,L1是C1亚烷基、C3亚烷基、C5亚烷基、具有2个乙二醇单元的聚乙二醇(PEG2)或具有4个乙二醇单元的聚乙二醇(PEG 4),并且L2是C1-C12亚烷基或C1-C12亚炔基。在一些实例中,L2-Oligo的组合是-(CH2)4-Oligo。
在一些实例中,拴系有寡核苷酸的核苷酸选自式B1和B3的化合物,其中X是H,Q是H,L1是C1亚烷基、C3亚烷基、C5亚烷基、具有2个乙二醇单元的聚乙二醇(PEG2)或具有4个乙二醇单元的聚乙二醇(PEG4),并且L2是C1-C12亚烷基或C1-C12亚炔基。在一些实例中,L2-Oligo的组合是(CH2)4C≡C-Oligo。
在一些实例中,拴系有寡核苷酸的核苷酸选自式B2和B4的化合物,其中X是H,Q是H,L1是C1亚烷基、C3亚烷基、C5亚烷基、具有2个乙二醇单元的聚乙二醇(PFG2)或具有4个乙二醇单元的聚乙二醇(PEG4),并且L2是C1-C12亚烷基或C1-C12亚炔基。在一些实例中,L2-Oligo的组合是-(CH2)4-Oligo。
另外的示例性拴系有寡核苷酸的核苷酸选自式B1和B3的化合物,其中X是H,Q是H,L1是C1亚烷基,L2-Oligo的组合是(CH2)4C≡C-Oligo,并且NB和NB2独立地选自胸腺嘧啶、腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶。另外的示例性拴系有寡核苷酸的核苷酸选自式B2和B4的化合物,其中X是H,Q是H,L1是C1亚烷基,L2-Oligo的组合是-(CH2)4-Oligo,并且NB和NB2独立地选自胸腺嘧啶、腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶。
以下列表提供了一些另外的代表性拴系有寡核苷酸的核苷酸。
II.制备拴系有寡核苷酸的核苷酸的方法
可以使用各种策略来制备拴系有寡核苷酸的核苷酸,并且要求保护的组合物和使用所述组合物的方法不受制备这些有用化合物的方法的任何描述的限制。
A.核酸修饰中的点击化学
术语“点击化学”在本领域中是众所周知的并且通常是指易于纯化和区特异性的快速反应。点击化学是一类允许所选择的底物与特异性分子连接的反应。点击化学不是单一的特异性反应,而是描述了一种按照自然界的实例产生产物的方式,所述方式也通过连接小的模块化单元来产生物质。在许多应用中,点击反应将生物分子和报告分子连接。点击化学不限于生物条件:“点击”反应的概念已用于药理学和各种仿生应用。然而,所述应用在生物分子的检测、定位和鉴定方面特别有用。典型的点击反应是经典的点击反应是形成5元杂原子环的铜催化的叠氮化物与炔烃的反应:Cu(I)催化的叠氮化物-炔烃环加成(CuAAC)。包含以下的另外的反应:应变促进的叠氮化物-炔烃环加成(SPAAC)或无铜反应;应变促进的炔烃-硝酮环加成(SPANC);炔烃氢硫醇化;和烯烃氢硫醇化是本领域中已知的并且可用于产生本公开的CXN基团。
如本文所用,并且除非另有说明,否则术语“接触”、“添加”、“反应”、“处理”等意指使一种反应物、试剂、溶剂、催化剂、反应性基团等与另一种反应物、试剂、溶剂、催化剂、反应性基团等接触。可以单独、同时或分开添加并且可以以实现期望结果的任何顺序添加反应物、试剂、溶剂、催化剂、反应性基团等。可以在存在或不存在加热或冷却设备的情况下添加并且可以任选地在惰性气氛下添加所述反应物、所述试剂、所述溶剂、所述催化剂、所述反应性基团等。
在本申请的情况下,对核苷酸进行点击反应以产生拴系有寡核苷酸的核苷酸,这消除了去除未反应的点击反应前体和可能干扰进一步应用的其它残基的需要。本文提出的方法还具有简化工作流的优点,因为DNA合成终止(其也具有与片段化类似的效果,合成终止反应的结果是一组不同的较短DNA片段)和加标签是在单个步骤中进行的。
在一些实施例中,根据本公开的用于制备拴系有寡核苷酸的核苷酸的方法包括:提供与第一官能团共价结合的核苷酸,所述第一官能团能够与第二官能团进行点击反应;提供与所述第二官能团共价结合的寡核苷酸,所述第二官能团能够进行点击反应,其中所述第一官能团和所述第二官能团分别选自以下对:炔基和叠氮基;叠氮基和炔基;硫醇和炔基;炔基和硫醇;硫醇和烯基;烯基和硫醇;叠氮基和环辛烷基;环辛烷基和叠氮基;硝酮和环辛烷基;环辛烷基和硝酮;在存在铜催化剂和铜(I)配体的情况下使核苷酸与寡核苷酸接触以形成点击反应产物。
在特定实施例中,所述方法包括使叠氮化物和炔烃进行点击反应以产生1,2,3-三唑。叠氮化物和末端或内部炔烃可以进行1,3-偶极环加成(Huisgen环加成)反应以得到1,2,3-三唑。然而,此反应需要较长的反应时间和升高的温度。可替代地,叠氮化物和末端炔烃可以在室温下进行铜(I)催化的叠氮化物-炔烃环加成(CuAAC)。也被称为“点击化学”的此种铜(I)催化的叠氮化物-炔烃环加成是Huisgen 1,3-偶极环加成的变体,其中有机叠氮化物和末端炔烃反应以得到1,2,3-三唑的1,4-区异构体。“点击”化学反应的实例由Sharpless等人(2005年10月6日出版的美国专利申请公开号20050222427,PCT/US03/17311;Lewis W.G.等人,《应用化学(Angewandte Chemie)》-国际版本41(6):1053;在Kolb,H.C.等人,《应用化学》国际版本2001,40:2004-2021中综述的方法)进行了描述,所述文献开发出了可以高产率地彼此反应并且在杂原子键(与碳-碳键相对)中几乎没有副反应的试剂以便产生化学化合物文库。
用作在本文所描述的方法中使用的“点击化学”反应的催化剂以将标记(报告基团、固体支持物或载体分子)与核酸缀合的铜处于Cu(I)还原状态。在此种铜催化的叠氮化物-炔烃环加成中使用的铜(I)的来源可以是任何亚铜盐,包含但不限于卤化亚铜,如溴化亚铜或碘化亚铜。然而,这种区选择性环加成也可以在存在金属催化剂和还原剂的情况下进行。
在某些实施例中,可以在存在还原剂的情况下提供处于Cu(II)还原状态(例如,作为盐,如但不限于Cu(NO3)2、Cu(OAc)2、或CuSO4)的铜,其中Cu(I)是通过Cu(II)的还原原位形成的。此类还原剂包含但不限于抗坏血酸盐、三(2-羧乙基)膦(TCEP)、2.4.6-三氯苯酚(TCP)、NADH、NADPH、硫代硫酸盐、金属铜、醌、对苯二酚、维生素K、谷胱甘肽、半胱氨酸、2-巯基乙醇、二硫苏糖醇、Fe(II)、Co(II)、施加的电位。在其它实施例中,所述还原剂包含选自以下的金属:Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh和W。在特定实施例中,所述还原剂是抗坏血酸盐。
在一些实施例中,在存在配体的情况下进行叠氮化物和炔烃的(3+2)环加成。虽然不受理论束缚,但是据信配体使Cu(I)离子稳定,由此防止所述离子氧化成Cu(II)离子。例如,配体可以选自:3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]丙醇(BTTP);3-[4-({双[(1-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-1-基]硫酸氢丙酯(BTTPS);2-[4-({双[(l-叔丁基-1H-1,2,3-三唑-4-基)甲基]氨基}甲基)-1H-1,2,3-三唑-l-基]硫酸氢乙酯(BTTES);红菲咯啉二磺酸二钠盐(BTTAA);Nε-((lR,2R)-2-叠氮基环戊氧基)羰基)-L-赖氨酸(BPS);五甲基二亚乙基三胺(PMDETA);三(2-苯并咪唑基甲基)胺((BimH)3);三-(苄基三唑基甲基)胺(TBTA);或三(3-羟基丙基三唑基甲基)胺(THPTA)。在特定实施例中,所述配体是THPTA。
用于标记核酸的铜(I)催化的叠氮化物-炔烃环加成可以在水和各种溶剂中进行,包含水和包含醇、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、叔丁醇(tBuOH)和丙酮在内的各种(部分)可溶混的有机溶剂的混合物。
在一些实施例中,形成CXN的点击反应是i)炔基与叠氮基之间的反应。
可以使用图7和图8中所示出的方法来制备叠氮化物中间体。各种dNTP和ddNTP起始材料可商购获得。在一些实施例中,提供了以下D1和D2的叠氮化物中间体,其中NB、L1、X和Q是如本文所描述的。
可以使用适当结构的起始材料例如使用图7和8中所示出的方法的原理方案制备D2的叠氮化物中间体。
示例中间体炔烃化合物C3和C4可商购获得
其中NB2、L2和Oligo*是如本文所描述的。
可以使用例如图9和图10中所示出的方法由上文所描述的叠氮化物中间体和中间体炔烃化合物制备拴系有寡核苷酸的核苷酸。各种dNTP和ddNTP起始材料可商购获得。图9和10示出了在使用中间体炔烃化合物C4和D1的叠氮化物中间体时的示例性制备方法。
可替代地,中间体炔烃化合物C3和D1的叠氮化物中间体、或C3和D2或C4和D2的组合可以在如所例示的反应中使用,以制备拴系有寡核苷酸的核苷酸。
在一些实施例中,本文提供了用于制备如本文所公开的拴系有寡核苷酸的核苷酸的方法,其中所述方法包含:
a.提供与第一官能团共价结合的核苷酸,所述第一官能团能与第二官能团进行点击反应;提供与所述第二官能团共价结合的寡核苷酸,所述第二官能团能进行点击反应以形成三唑环;使所述核苷酸与所述寡核苷酸接触以形成点击反应产物,
其中所述第一官能团和所述第二官能团分别选自:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
在一些实施例中,所述第一官能团和所述第二官能团分别选自:i)炔基和叠氮基;和ii)叠氮基和炔基。
在一些实施例中,步骤(c)包括在存在铜催化剂和铜(I)配体的情况下使所述核苷酸与所述寡核苷酸接触以形成1,2,3-三唑。
在一些实施例中,所述核苷酸是脱氧核苷酸或双脱氧核苷酸。在一些实施例中,所述核苷酸是核糖核苷酸或3'-脱氧核糖核苷酸。
在一些实施例中,所述铜催化剂包括铜(I)或铜(II),其中当所述催化剂是铜(II)时,存在还原剂。在其它实施例中,所述铜催化剂是Cu(NO3)2、Cu(OAc)、CuSO4或其任何组合。
在一些实施例中,所述还原剂包括抗坏血酸盐、三(2-羧乙基)膦(TCEP)、2.4.6-三氯苯酚(TCP)、NADH、NADPH、硫代硫酸盐、金属铜、醌、对苯二酚、维生素K、谷胱甘肽、半胱氨酸、2-巯基乙醇、二硫苏糖醇、Fe(II)、Co(II)、施加的电位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W或其任何组合。在其它实施例中,所述还原剂包括抗坏血酸钠。
在一些实施例中,铜(I)配体的配体包括三(苄基三唑基甲基)胺。
III.使用拴系有寡核苷酸的核苷酸的方法
拴系有寡核苷酸的核苷酸可以用作核酸合成反应中的试剂,使得拴系有寡核苷酸的核苷酸可以掺入由合成反应(例如,延伸反应、扩增反应、TdT反应等)形成的核酸中。有利地,这允许直接地,即在拴系有寡核苷酸的核苷酸的寡核苷酸提供了功能性序列时或间接地,例如通过提供如下文进一步描述的使得能够添加各种功能性序列的序列掺入各种类型的功能性序列(例如,测序衔接子、启动子序列、条形码、唯一分子标识符、手柄序列等)。
因此,本文所提供的各方面公开了拴系有寡核苷酸的核苷酸用于直接用特异性核苷酸序列对核酸,例如样品核酸或样品多核苷酸进行加标签的用途。
例如,提供了用于由多核苷酸样品产生核酸文库的方法。此种方法可以包含以下步骤:
a.使第一延伸引物退火到一个或多个样品多核苷酸或样品核酸;
b.使所述一个或多个样品多核苷酸或样品核酸与核酸聚合酶、至少一个核苷酸和本文所描述的拴系有寡核苷酸的核苷酸接触以形成包括所述拴系有寡核苷酸的核苷酸的第一延伸产物;
c.使与所拴系寡核苷酸至少部分互补的第二引物退火以形成第二经退火的复合物;
d.使所述第二经退火的复合物与所述核酸聚合酶接触以由所述所拴系寡核苷酸产生核酸分子,
由此产生在其端中的至少一个端处包括所拴系寡核苷酸序列的多核苷酸文库。
在一些实施例中,第一延伸引物包括通用序列,由此产生在其端处包括通用序列和所拴系寡核苷酸序列的多核苷酸文库。(参见图3)。在一些实施例中,第一延伸引物包括通用序列,并且第二引物包括通用序列,由此产生在其端处包括通用序列和所拴系寡核苷酸序列的多核苷酸文库。在一些实施例中,第一引物和第二引物包括不同的通用序列。
在一些方面,在使第一延伸引物退火到样品多核苷酸的步骤之前,将多核苷酸片段化。
在上文所描述的方法中,可以通过使用拴系有寡核苷酸的核苷酸和其对应的未经修饰天然核苷酸的组合在预定位置或随机位置处用特异性寡核苷酸序列对核酸进行加标签。拴系有寡核苷酸的核苷酸随机掺入的频率可以通过调节拴系有寡核苷酸的核苷酸和对应的天然核苷酸的摩尔比来控制。
在第一延伸引物包含通用序列和随机序列的一些方面,所述方法可以可用于全基因组或全转录组测序。在第一引物包括特异性引物的其它实施例中,所述方法可以可用于靶向DNA/RNA测序。
在其它实例中,拴系有寡核苷酸的核苷酸可以用于促进例如以模板依赖性方式添加如条形码、唯一分子标识符、手柄和/或测序衔接子等信息。因此,在一些实施例中,提供了一种以模板依赖性方式向样品多核苷酸添加核酸序列的方法。所述方法可以包含以下步骤:(a)使第一引物退火到一个或多个样品多核苷酸或样品核酸;(b)使所述一个或多个样品多核苷酸或样品核酸与核酸聚合酶、至少一个核苷酸和本文所描述的拴系有寡核苷酸的双脱氧核苷酸(OTDDN)接触以形成第一延伸产物,所述第一延伸产物在3'端处包括掺入有所述OTDDN的一个或多个样品多核苷酸或样品核酸中的至少一部分的拷贝。可以通过在存在聚合酶和核苷酸(其可能存在或可能不存在于第一延伸反应中)的情况下使延伸产物与包括(i)与OTDDN的寡核苷酸部分杂交的序列和(ii)期望的另外的序列的模板的夹板寡核苷酸接触来将期望的信息添加到第一延伸产物的3'端,由此产生第二延伸产物。通过这种方式,将如条形码、索引、唯一分子标识符、衔接子(例如,测序衔接子)、手柄序列、启动子序列或其任何组合等期望的另外的序列或任何其它期望的序列添加到第一延伸产物的所拴系寡核苷酸的3'端。
在一些实例中,夹板寡核苷酸可以包含防止从夹板的3'端延伸的封闭基团。例如,夹板可以包含3'氨基、3'磷酸酯、双脱氧或防止延伸的其它修饰。在一些实例中,夹板寡核苷酸可以包含能够纯化夹板寡核苷酸的功能性部分(例如,与同源捕获部分特异性结合的结合部分,如生物素/链霉亲和素等)。
样品多核苷酸可以是RNA分子、DNA分子等。在一些实施例中,样品多核苷酸是mRNA分子。在一些实施例中,样品多核苷酸是DNA分子。在一些实施例中,样品多核苷酸是拴系到所关注分子(例如,细胞结合剂,如抗体或其片段、适配体等)(例如,与所述所关注分子共价或非共价连接)的寡核苷酸。
退火到样品核酸或样品多核苷酸的第一引物可以包含能够在延伸条件下退火到样品多核苷酸的杂交序列。例如,在一些实施例中,杂交序列可以是能够使第一延伸引物与mRNA结合的poly(T)尾。在一些实施例中,杂交序列可以是能够使第一延伸引物与样品多核苷酸非选择性结合的随机序列(例如,随机六聚体等)。在一些实施例中,杂交序列可以是例如使得能够与特异性靶核酸序列杂交的靶特异性序列。在一些实施例中,样品核酸或样品多核苷酸与包含多于一种类型的杂交序列(例如,具有poly(T)杂交序列的第一延伸引物和具有如随机六聚体等随机杂交序列的第一延伸引物的混合物)的第一引物接触。
图38描绘了示出了示例性工作流的方案,所述工作流展示了可以如何使用本文所描述的拴系有oligo的核苷酸来促进在终止的引物延伸产物的3'端上添加基因信息。虽然图38例示了如上文所描述的其中样品多核苷酸是mRNA的工作流,但是所述工作流可以在样品核苷酸是DNA(例如,gDNA)、拴系到所关注分子(例如,如图44中所示出的细胞标志物结合剂)的寡核苷酸等的上下文中使用。
在一些实施例中,本发明方法任选地包含执行至少一个清理步骤。
在上文和本文所描述的方法中使用的拴系有寡核苷酸的核苷酸的范围可以为1fmol到10nmol。在某些情形下,拴系有寡核苷酸的核苷酸与对应的天然核苷酸的比率的范围为1:1到1:1000。例如,拴系有寡核苷酸的核苷酸与对应的天然核苷酸的比率为1:10、1:50或1:100。在一些实施例中,样品与拴系有寡核苷酸的胸腺嘧啶核苷酸、腺嘌呤核苷酸、鸟嘌呤核苷酸、胞嘧啶核苷酸或尿嘧啶核苷酸中的两种或更多种接触。
在上文的方法中,可以使用单个聚合酶。可替代地,可以使用两种不同的聚合酶,第一种聚合酶用于将拴系有寡核苷酸的核苷酸掺入,并且第二种聚合酶用于引物延伸/通读。在其期间聚合酶将拴系有寡核苷酸的核苷酸掺入、通读掺入的拴系有寡核苷酸的核苷酸的非天然接头和/或使引物/寡核苷酸延伸的聚合酶反应可以在适于聚合酶活性的条件下进行。例如,引物/模板系统、聚合酶反应缓冲液、温育温度和温育时间可以是如通常推荐用于对应的聚合酶的引物/模板系统、聚合酶反应缓冲液、温育温度和温育时间。
在另一个实施例中,TdT以非模板依赖性方式将单个拴系有寡核苷酸的双脱氧核苷酸掺入到单个单链或双链DNA/RNA的3'端。通过此种方式,可以将例如用于NGS等的衔接子添加到样品核酸上。在一些实施例中,OTDDN的寡核苷酸序列可以包含第一衔接子序列。可以使与第一衔接子序列部分互补的第二衔接子退火并连接到模板核酸。(参见例如图2)。所产生的文库在两端都具有衔接子,所述衔接子具有互补区和错配区。可以对所述文库进行进一步扩增。
在一些实施例中,在本文描述的方法中的拴系到核苷酸的寡核苷酸(或如本文所描述的间接添加到样品多核苷酸的寡核苷酸)包括T7启动子序列。因此,本文提供了将体外转录起始位点引入样品核酸或多核苷酸的方式。
上文所描述的方法也可以用于单细胞或核测序应用。拴系有寡核苷酸的双脱氧核苷酸的使用可以例如通过消除对衍生自单细胞或核的核酸的预扩增的需要来改进没有在如孔或管等传统隔室中进行的单细胞或核测序方法。例如,拴系有寡核苷酸的双脱氧核苷酸可以用于改进用于空间解析组织样品中的转录组学数据、基因组学数据和蛋白质组学数据的方法。
在一些实施例中,本文所公开的方法可以可用于分析大基因组。可以设计靶向基因端并面向外的特异性引物以采用拴系有寡核苷酸的核苷酸技术以对基因组上下文进行分析。所述原理适用于旨在研究已知特异性基因座附近的未知序列区的任何实验系统。
作为另一个实例,拴系有寡核苷酸的核苷酸可以在用于用寡核苷酸对核酸进行加标签的方法中使用,所述方法包括:
e.使引物退火到所述核酸;
使所述核酸与如本文所描述的拴系有寡核苷酸的核苷酸和聚合酶接触,由此产生带标签的核酸。
在一些实施例中,所述接触包括使所述核酸与至少一个拴系有寡核苷酸的核苷酸、至少一个未拴系到寡核苷酸的核苷酸以及聚合酶接触。
在一些实施例中,进行掺入单一类型的拴系有寡核苷酸的核苷酸。在其它实施例中,掺入多个不同的拴系有寡核苷酸的核苷酸是令人期望的。
在一些应用中,所述方法包括将衔接子序列添加(例如,连接)到核酸的5'端和/或3'端。所述方法还可以进一步包括例如通过PCR,如索引化PCR使带标签的核酸经历扩增。
可以在包含RNA、DNA或两者在内的不同类型的核酸的合成反应中采用拴系有寡核苷酸的核苷酸。在一些实例中,在缺口填补反应或切口平移期间用拴系有寡核苷酸的核苷酸对核酸进行加标签。例如,通过在切口平移或缺口填补反应期间掺入拴系有寡核苷酸的双脱氧核苷酸来由预先设计的特异性序列标签对双链DNA进行随机标记(图4)。寡核苷酸掺入的频率可以通过调整DNA切口速率(例如,通过改变DNA酶I处理时间)来控制。所产生的多核苷酸文库将在3'端具有预先设计的标签。由于平均片段长度是通过切口速率控制的,因此可以通过在切口平移或缺口填补反应混合物中用拴系有寡核苷酸的核苷酸完全取代单个天然核苷酸来进行加标签。
DNA端标记:用任何预先设计的序列进行非模板依赖性DNA 3'端标记是通过由末端脱氧核苷酸转移酶(TdT)掺入拴系有寡核苷酸的双脱氧核苷酸实现的。出于此目的,拴系到双脱氧核苷酸的寡核苷酸可以具有封闭的3'端(例如,带有3'磷酸酯修饰或3'氨基修饰或双脱氧核苷酸),使得所述端不延伸。在第一轮标记之后,在通过任何能够通读缀合接头的聚合酶从与双脱氧核苷酸缀合的寡核苷酸进行引物延伸后,互补链合成。然后,进行第二轮DNA端标记,因为新合成的链将具有可接近的3'端(图5)。
RNA端标记。用任何预先设计的序列进行的非模板依赖性RNA 3'端标记可以是通过由poly(A)或poly(U)聚合酶掺入拴系有寡核苷酸的双脱氧核苷酸实现的(用酵母poly(A)聚合酶和各种核苷酸对RNA进行加尾和3'端标记)。G.Martin和W.Keller.《RNA》(1998),4:226—230,剑桥大学出版社)。然后,掺入的寡核苷酸可以充当逆转录的通用引发位点并有可能通过逆转录酶的模板转换活性对5'端进行标记。所产生的带标签的cDNA通过PCR转化为测序就绪文库,所述测序就绪文库进而引入平台特异性全长衔接子(图6)。
无PCR的DNA和RNA测序就绪文库制备。只要整合到测序平台中的聚合酶能够通读非天然接头,就可以由DNA样品和RNA样品两者制备无PCR的测序就绪文库。使用具有对应于全长衔接子的5'锚的引物进行的一步引物延伸和通过掺入带有第二全长平台特异性衔接子序列的拴系有寡核苷酸的双脱氧核苷酸进行的终止使得能够产生测序就绪单链文库,所述测序就绪单链文库可以在没有任何其它酶促操纵的情况下经历测序。这提供了需要较少文库制备步骤的优点。当使用RNA样品时,此种策略提供了另外的优点,因为仅需要合成第一链cDNA即可实现在5'端和3'端处包括衔接子的测序就绪单链DNA。
将序列模板定向添加到所拴系核苷酸。一旦所拴系核苷酸掺入核酸中,所拴系寡核苷酸就可以用于以模板依赖性方式促进添加如条形码、索引、唯一分子标签、手柄、启动子和/或测序衔接子等信息。所拴系寡核苷酸可以包含为夹板寡核苷酸提供退火位点的3'手柄。使夹板寡核苷酸退火到所拴系寡核苷酸形成第二经退火的复合物。当在延伸条件下与聚合酶和核苷酸接触时,所拴系寡核苷酸的3'端以模板依赖性方式延伸以掺入由夹板寡核苷酸的5'端提供的期望的信息。通过这种方式,本文所公开的方法可以用于掺入衔接子序列并且通过极大地简化工作流而有利地改进用于制备NGS文库的传统工作流。
A.能够将经修饰核苷酸掺入的聚合酶
为了将拴系有寡核苷酸的核苷酸掺入核酸合成产物中,可以使用聚合酶。
已经示出DNA聚合酶、RNA聚合酶、逆转录酶和端粒酶接受经修饰核苷酸三磷酸作为酶底物。例如,经修饰核苷酸三磷酸为通常用于引物延伸和扩增方案的DNA聚合酶,例如热稳定DNA聚合酶,如Taq聚合酶、Vent聚合酶、Pfx聚合酶、Two聚合酶或Therminator聚合酶所接受。可替代地,经修饰核苷酸三磷酸为例如嗜温聚合酶,如MMLV逆转录酶、T7 DNA聚合酶、末端脱氧核苷酸转移酶所接受。
能够将经修饰核苷酸,特别是如本文所描述的拴系有寡核苷酸的核苷酸掺入的聚合酶可以选自DNA和RNA聚合酶。在一些实施例中,DNA聚合酶是DNA依赖性DNA聚合酶、RNA依赖性DNA聚合酶或非模板依赖性DNA聚合酶。在一些实施例中,RNA聚合酶是DNA依赖性RNA聚合酶、RNA依赖性RNA聚合酶或非模板依赖性RNA聚合酶。这些聚合酶包含野生型突变同种型、嵌合体形式和如外切聚合酶等基因工程化变体以及例如耐受经修饰核苷酸并且能够更有效地将所述经修饰核苷酸掺入核酸链中的其它突变体。
在一些实施例中,聚合酶选自以下:A家族DNA聚合酶;B家族DNA聚合酶;X家族聚合酶和RT家族聚合酶;和其变体和衍生物。
在一些实施例中,聚合酶是非模板依赖性RNA聚合酶,如polyA聚合酶(PAP)或polyU聚合酶(PUP)。在一些实施例中,核酸聚合酶是模板依赖性RNA聚合酶。在一些实例中,RNA聚合酶是DNA依赖性RNA聚合酶,如T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶和来自T7型噬菌体的其它RNA聚合酶。在其它实例中,RNA聚合酶是RNA依赖性RNA聚合酶,如Q-β复制酶。这些聚合酶包含野生型突变同种型、嵌合体形式和基因工程化变体以及例如容忍经修饰核苷酸并且能够更有效地将所述经修饰核苷酸掺入核酸链中的突变体。
在一些实施例中,A家族DNA聚合酶是嗜热或嗜温聚合酶。在一些实施例中,B家族DNA聚合酶是嗜热(例如,古细菌)或嗜温聚合酶。
在一些实施例中,DNA聚合酶是选自以下的A家族DNA聚合酶:Pol I型DNA聚合酶,如大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶的克列诺片段、来自水生栖热菌(T.aquaticus)的聚合酶(Taq DNA聚合酶)、来自嗜热栖热菌(T.thermophilus)的聚合酶(Tth DNA聚合酶)、来自嗜热脂肪芽孢杆菌(bacillus stearothermophilus)的聚合酶(Bst DNA聚合酶)、来自如T3或T7等噬菌体的聚合酶(T3 DNA聚合酶或T7 DNA聚合酶);和其变体和衍生物。A家族DNA聚合酶的变体和衍生物可以是例如Thermo SequenaseTM(能够更有效地将经修饰核苷酸,如双脱氧核苷酸掺入的突变型Taq DNA聚合酶)、CycleSeqTM(能够更有效地将经修饰核苷酸,如双脱氧核苷酸掺入的Taq DNA聚合酶突变体的组合)、Stoeffel片段(Taq DNA聚合酶的截短版本)、SequenaseTM V2.0(能够更有效地将经修饰核苷酸,如双脱氧核苷酸掺入的T7 DNA聚合酶突变体)。
在其它实施例中,DNA聚合酶是选自以下的B家族DNA聚合酶:Tli聚合酶、Pfu聚合酶、Pwo聚合酶、KOD聚合酶、Sac聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、噬菌体Phi29聚合酶和噬菌体B103聚合酶、来自火球菌(Pyrococcus)和热球菌(Phermococcus)的B型聚合酶,如来自火球菌菌株GB-D的聚合酶(Deep Vent聚合酶)、来自激烈火球菌的聚合酶(Pfu DNA聚合酶)、来自泉古菌的聚合酶(Pea DNA聚合酶)、来自嗜气菌的聚合酶、来自海洋异养古菌的聚合酶(KOD DNA聚合酶)、来自极端嗜热古菌的聚合酶(Tgo DNA聚合酶)聚合酶和来自热球菌9°N-7的聚合酶(9°N DNA聚合酶);和其变体和衍生物。在一些实施例中,B型DNA聚合酶是经修饰激烈火球菌DNA聚合酶。在一些实施例中,DNA聚合酶是与dsDNA结合结构域融合的嵌合体火球菌样DNA聚合酶,例如Phusion DNA聚合酶、SuperFi DNA聚合酶、Q5 DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶。在一些实施例中,DNA聚合酶是如2017年1月13日提交的美国专利申请第15/405,574号中所描述的Phusion exo-或其它火球菌样DNA聚合酶,所述美国专利申请特此通过引用并入。核酸外切酶负修饰包括核酸外切酶结构域中的修饰(D141A和E143A)或其它相应修饰以抑制核酸外切酶活性的。B家族DNA聚合酶的其它变体和衍生物可以是例如Therminator聚合酶(将经修饰核苷酸,如双脱氧核苷酸掺入的能力增强的9°NTM DNA聚合酶变体)。
在其它实施例中,DNA聚合酶是选自以下的X型聚合酶:末端脱氧核苷酸转移酶(TdT)、poly(A)聚合酶和poly(U)聚合酶;和其变体和衍生物。
在其它实施例中,聚合酶是选自以下的RT聚合酶:HIV逆转录酶、M-MLV逆转录酶和AMV逆转录酶;和其变体和衍生物。
在一些实例中,所述聚合酶选自Taq DNA聚合酶、DNA聚合酶、DeepVentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV(突变型MMLV RT)、SuperscriptTM II(突变型MMLV RT)、SuperscriptTM III(突变型MMLV RT)、MaximaTM(突变型MMLV RT)、RevertAidTM(突变型MMLV RT)逆转录酶、Thermo SequenaseTM、SequenaseTMV2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H(突变型MMLVRT)、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段(Klenow fragment)、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、PlatinumTaq DNA聚合酶、Herculase II、Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、和HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
在一些实例中,聚合酶选自Taq DNA聚合酶、SuperscriptTM IV(突变型MMLV RT)、Thermo SequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、Maxima H(突变型MMLVRT)、TherminatorTM聚合酶、T7 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、Phusion(exo-)DNA聚合酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
在一些实施例中,聚合酶是野生型聚合酶、经修饰聚合酶(例如,具有化学修饰的聚合酶)、突变型聚合酶、嵌合体聚合酶、核酸外切酶负聚合酶、工程化聚合酶或其组合。可以使用如exo-聚合酶等基因工程化变体和耐受经修饰核苷酸并将所述经修饰核苷酸掺入核酸链中的其它突变体。
在一些实施例中,聚合酶能够通读缀合接头。与能够将拴系有寡核苷酸的核苷酸掺入的聚合酶相比,在掺入拴系有寡核苷酸的核苷酸后提供的能够通读非天然接头的聚合酶可以是相同的或不同的。在一些实施例中,使用通常用于引物延伸和/或扩增方案的DNA聚合酶。在一些实施例中,能够通读非天然接头的聚合酶选自DNA依赖性DNA聚合酶、RNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶和RNA依赖性RNA聚合酶。
B.核酸测序
在一些实施例中,本公开内容涉及制备要在核酸测序中使用的核酸文库。在一些实施例中,模板核酸序列是DNA或RNA。在一些实施例中,模板核酸序列来自双链DNA并且可以是基因组DNA。可替代地,模板核酸序列可以是单链DNA。在其它实施例中,模板核序列是总RNA、mRNA或miRNA。在一些实施例中,模板核酸是由拴系有寡核苷酸的结合剂(OTBA)提供的核苷酸序列。在一些实施例中,测序是大规模平行核酸测序。
在一些实施例中,用于测序的文库制备是使用拴系有寡核苷酸的核苷酸通过以下步骤进行的。首先,使互补引物退火到模板核酸链,与拴系有寡核苷酸的核苷酸和聚合酶接触,以掺入到合成的互补核酸链。在使用拴系有寡核苷酸的核苷酸的脱氧版本的一些实施例中,可以通过掺入常规的核苷酸和拴系有寡核苷酸的核苷酸使核酸链进一步延伸。在使用拴系有寡核苷酸的核苷酸的双脱氧版本的一些实施例中,由聚合酶对链进行的进一步延伸受到掺入的拴系有寡核苷酸的核苷酸上的终止基团的封闭。在一些实施例中,然后使链经历基于引物延伸的反应,例如PCR,包含但不限于不对称PCR、索引化PCR或逆转录反应,并且在各种测序方法中使用所述链。在一些中,通过掺入包含通用手柄序列的所拴系寡核苷酸并且使夹板寡核苷酸退火到所述通用手柄序列来制备测序文库,其中所述夹板寡核苷酸包括测序衔接子。
扩增核酸片段的方法是本领域技术人员众所周知的。在一些实施例中,可以通过聚合酶链反应(PCR)或任何等温DNA扩增方法,包含但不限于MDA、RCA、NASBA、LAMP、HDA、ICAN、NEAR和EXPAR来实现扩增。可以使用定量聚合酶链反应、微阵列、荧光测定或分光光度分析来定量核酸片段。
本文所描述的技术不限于任何特定的测序平台,而是普遍适用且非平台依赖性的。在一些实施例中,所述技术适用于基于乳化PCR的方法、基于珠的方法和非基于珠的方法。
对所产生的核酸分子进行测序的合适的方法是本领域技术人员众所周知的。例如,可以使用本领域已知的任何适当技术对核酸片段进行测序,如Maxam-Gilbert、Sanger、焦磷酸测序、合成测序、连接测序、单分子实时测序、质谱法、大规模平行特征标签测序、聚合酶克隆测序、Illumina(Solexa)测序、半导体测序、DNA纳米球测序、Fleliscope和单分子测序。
C.用于单个细胞或单个细胞核分析的组合条形码编码
可以使用拴系有寡核苷酸的双脱氧核苷酸(OTDDN)来极大地简化和改进组合条形码编码方法。在单个细胞和单个细胞核分析的上下文中,基于所关注生物分子(例如,细胞表面分子、蛋白质、包含DNA、RNA、miRNA等的核酸)的组合条形码编码的单个细胞/细胞核分析方案的质量有所改进。
组合条形码编码工作流
本文提供了用于改进在细胞水平下的全转录组分析的方法,如图39中所描绘的。虽然图39描绘了全转录组分析,但是本文所描述的组合条形码编码工作流可以容易地调整适应和多路复用,以便例如通过使用具有靶特异性序列(如所关注靶mRNA或DNA序列或拴系到所关注生物分子的核苷酸,如所描述的OTBA)的第一延伸引物对一个或多个特异性核酸和/或蛋白质靶标进行分析。类似地,本文所描述的组合条形码编码工作流可以适用于通过用如本文其它地方所描述的OTDDN随机地对gDNA进行加标签并且遵循本文所提供的组合条形码编码工作流进行的全基因组分析(WGA)。在本文所描述的方法中,将单个的样品细胞的生物分子固定,并且随后将样品细胞透化。当使用本文所提供的组合工作流通过使用如下文进一步描述的拴系有寡核苷酸的细胞结合剂对蛋白质进行分析时,用OTBA对样品细胞进行处理以允许在固定前进行结合。
可用于本文所公开的方法中的固定和透化是本领域众所周知的。举例来说,可以用于本文所公开的方法中的固定剂包含但不限于甲醛、福尔马林、甲醇、多聚甲醛、甲醇乙酸等。例如,在一些方面,可以通过使细胞例如在磷酸盐缓冲盐水中与例如1%、2%、3%、4%、5%、6%、7%、8%、9%、10%(v/v)或更多的或介于以上数值之间的任何范围的甲醛或多聚甲醛接触来使细胞固定。
可用于本文所公开的实施例中的用于使细胞透化的药剂包含但不限于triton100、皂苷、Tween 20和如甲醇、丙酮等有机溶剂。例如,在一些方面,可以用例如0.01到10%(v/v)tntonX100,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多的甲醛对细胞进行处理。
将要分析的经固定和经透化的样品细胞群分成多个第一部分。举例来说,可以将第一部分中的每个第一部分添加到不同的微孔或管中,使得每个单个的细胞随机分布到第一部分。使第一部分中的每个第一部分经历第一延伸反应以产生第一延伸产物。例如,逆转录酶(RT)可以用于进行第一延伸反应以产生第一延伸产物,即cDNA。将第一部分中的每个第一部分与以下接触:(i)聚合酶(例如,用于对RNA样品核酸/多核苷酸进行分析的逆转录酶);(iii)包含对于不同的第一部分中的每个第一部分来说是唯一的第一条形码(即,第一延伸条形码或第1孔特定条形码)的第一引物(例如,逆转录酶(RT)延伸引物);(iv)核苷酸;和(v)包含通用手柄的至少一个拴系有寡核苷酸的ddNTP。可以在延伸条件(例如,在延伸步骤中使用的针对聚合酶的典型条件)下进行接触步骤。
对于全转录组分析,第一延伸引物可以包含实现mRNA的无偏差扩增的序列。因此,第一延伸引物可以包含poly(T)以实现mRNA的无偏差引发。可替代地,第一延伸引物可以包含促进细胞RNA的随机引发的序列(例如,随机六聚体)。在一些实施例中,在第一延伸引物的3'端处包括poly(T)或随机引物。在又其它方法中,在延伸反应中使用具有poly(T)的引物和包含促进随机引发的序列的引物的组合。
可以在对如靶mRNA、靶DNA、靶蛋白质等靶生物分子进行分析的上下文中使用本文所描述的改进的组合条形码编码工作流。在用于靶向核酸和蛋白质分析的工作流中,第一延伸引物可以包含靶特异性序列。在靶mRNA或DNA的上下文中,例如,第一延伸引物可以包含与所关注靶序列特异性杂交的序列。在对靶蛋白质(或细胞标志物)进行分析的上下文中,允许(i)与所关注蛋白质、生物分子或细胞标志物特异性结合并且(ii)包含鉴定结合剂的相关的寡核苷酸序列的拴系有寡核苷酸的结合剂在固定之前与样品细胞结合。因此,OTBA以与用于对靶核酸进行分析的靶特异性序列相同的方式起作用。以这种方式,OTBA可以结合蛋白质并且可以用于将有关蛋白质表达的数据转化成可以使用对核酸进行测序所使用的设备和方法来进行分析的格式。使用荧光团标记的抗体的方法可能会有荧光团光谱重叠的问题,将蛋白质信号转化成可以使用对核酸进行测序所使用的设备和方法进行分析的格式可以允许多个蛋白质信号的分辨率更大。而且,可以在不需要使用荧光团和用于对荧光团进行分析(如将用于FACS分选)的设备的情况下进行用OTBA的方法。
技术人员将容易理解,可以容易地多路复用下文所描述的组合工作流。例如,通过多路复用本文所描述的组合条形码编码工作流,可以同时处理和分析转录组和一个或多个靶生物分子(例如,靶蛋白质等)。例如,如下文所描述的,可以使细胞群与包含包括结合剂索引和3'poly(A)尾的寡核苷酸的一种或多种OTBA(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种OTBA)接触。(参见图44)。可以将经固定和经透化的细胞分入第一隔室中并以与对细胞进行处理以进行全转录组分析相同的方式进行处理,即使用包括3'poly(T)序列的第一延伸引物。
在第一隔室是微孔或管的方法中,可以提供各自包含第一延伸引物和拴系有寡核苷酸ddNTP的微孔或管。任选地,微孔或管可以进一步包含聚合酶、核苷酸或两者。例如,在一些实施例中,微孔或管可以包含预装载的(例如,经干燥的或在溶液中)第一延伸引物等。
第一延伸导致拴系有寡核苷酸的ddNTP随机掺入第一延伸产物(例如,在要分析的样品核酸为RNA时为cDNA)中,由此产生每个第一核酸延伸产物的随机终止点。每个延伸产物的“停止”点可以有利地用作确定每个第一延伸产物的后代的标识符。每个第一核酸延伸产物(在其5'端处)包含对于每个单个的第一部分内的所有核酸延伸产物来说是共有的并且相对于其它隔室中的第一条形码/在其它隔室中产生的第一延伸产物是唯一的第一条形码,并且在3'端处包含提供可以在随后的反应中延伸的3'OH的第二通用手柄。
将多个第一部分组合或汇集到例如单个管或孔中,并且随后例如在单个的微孔、管等内分成多个第二部分。单个的细胞因此再次随机分布在单个的第二部分之间。
使第二部分与夹板寡核苷酸、聚合酶和核苷酸接触。夹板寡核苷酸在3'端包含退火到第一核酸延伸产物上的第二通用手柄的序列。夹板寡核苷酸还可以在3'端含有修饰(例如,3'氨基、3'磷酸酯、3'双脱氧核苷酸等),以防止夹板延伸。第三通用手柄序列的模板序列存在于夹板寡核苷酸的5'端处。在与第二通用手柄和第三通用手柄杂交的序列之间,夹板寡核苷酸包含对于每个第二部分来说是唯一的第二条形码的模板序列。因此,使第二部分内的第一延伸产物进一步延伸以产生第二延伸产物,所述第二延伸产物从5'到3'方向包括第一通用手柄序列、cDNA、双脱氧核苷酸、第二通用手柄、第二条形码和第三通用手柄。
在一些实例中,可以将第三条形码和第四个通用手柄添加到样品的核酸样品中。具体地,可以将第二部分组合/汇集,并且例如在单个的微孔、管等内分成多个第三部分。单个的细胞因此随机分布在单个的第三部分之间。可以多次进行使用第二组夹板寡核苷酸在汇集和拆分后添加对于每个部分来说是唯一的条形码的延伸反应,每次迭代都会导致对于每个部分来说是唯一的另一个条形码(但对于分布到特定部分的所有细胞来说是共有的)添加到核酸。
在一些实施例中,所述方法包含例如在产生第二核酸延伸产物之后和在使第三部分与第二延伸引物接触之前去除、封闭或消化夹板寡核苷酸的步骤。在一些实施例中,夹板寡核苷酸包括结合部分,所述方法包括以下步骤:使第二部分或经组合的第二部分与包括捕获部分的化合物接触,所述捕获部分促进包括同源结合部分的夹板寡核苷酸的结合和去除。在一些实施例中,结合部分和同源捕获部分是选自以下的结合对:链霉亲和素和生物素的结合对、麦芽糖和麦芽糖结合蛋白的结合对、谷胱甘肽和谷胱甘肽S-转移酶的结合对、几丁质和几丁质结合蛋白的结合对或适配体和其抗原的结合对。在一些实施例中,将捕获部分固定在固体支持物上。在一些实施例中,固体支持物包括珠。在一些实施例中,珠是磁性珠或顺磁性珠。
在已经将期望数量的条形码添加到每个细胞内的核酸延伸产物后,可以在裂解条件下接触最终部分,以裂解细胞并释放核酸延伸产物。例如,一种方法可以包括将第二部分组合、将经组合的第二部分拆分、分成第三部分并产生第三核苷酸延伸产物,其中第一条形码序列、第二条形码序列和第三条形码序列(或其补体)的组合在每个第三核苷酸延伸产物内对于源自单个细胞的每个核酸延伸产物来说都是唯一的。“唯一的”是指第一条形码序列、第二条形码序列和第三条形码序列的组合可能几乎完全是唯一的,但此术语不排除一个或多个条形码的偶然重复。
在一些实施例中,可以将OTDDN掺入如全转录组分析、全基因组分析、定向mRNA分析、短RNA(例如,miRNA)等单个细胞或单个细胞核工作流和这些工作流的组合中。仅举例来说,本文提供了用于分析细胞群内的单个细胞或细胞核的转录组的工作流(参见图39)。
在一些实施例中,本文提供的组合条形码编码方法进一步包含用于固定和透化细胞群内的细胞或细胞核的步骤,使得细胞或细胞核内的核酸、蛋白质和其它生物分子保持完整并固定在所述核酸、所述蛋白质和所述其它生物分子的起源细胞内。同时,透化步骤的作用是使试剂(例如,聚合酶、核苷酸、引物等)能够进入细胞或细胞核,其中所述试剂可以在例如逆转录、扩增反应等中起作用。固定和透化细胞和细胞核的许多方法是本领域已知的。举例来说,可用于本文所公开的实施例中的用于固定和透化细胞的方法包含但不限于Rosenberg等人(2018)《科学》(360)176-182、补充材料、美国专利申请公开号U.S.2016/0138086和国际专利申请公开号WO 2014/060843中所描述的那些方法。
在一些实施例中,本文提供的组合条形码编码方法可以进一步包括在产生一个或多个延伸产物后将细胞裂解。另外,本文提供的组合条形码编码方法还可以包含在添加最后一个条形码之后进行一个或多个扩增反应。在一些实施例中,扩增引物可以退火到存在于延伸产物的3'端和5'端处的通用手柄。扩增引物可以任选地包含衔接子序列(例如,测序衔接子,以使核酸文库能够在如本文其它地方所描述的期望的NGS平台上进行处理和分析)。
组合条形码编码方法还可以包含一个或多个样品制备步骤,所述一个或多个样品制备步骤包含但不限于在裂解步骤后纯化远离细胞碎片的核酸等。
D.所关注生物分子的空间分辨率
本文所描述的改进的核酸加标签和核酸文库制备方法也可以用于对组织样品中的所关注生物分子进行空间解析。
在一些方法中,可以将组织样品与可寻址引物阵列接触,所述可寻址引物阵列在5'到3'方向上包含可寻址条形码结构域(例如,对阵列上的位置信息进行编码的第一条形码)和杂交结构域(即,能够使可寻址引物与组织样品的多核苷酸杂交的结构域)。可寻址条形码可以包含与阵列上的x坐标和y坐标有关的信息。可用于本文所描述的实施例中的可寻址条形码结构域阵列是本领域已知的。
如本文所用,术语“阵列”是指可以根据相对位置彼此区分开来的特征或位点的群。位于阵列的不同位点处的不同分子可以根据阵列中的位点的位置彼此区分开来。阵列的单个的位点可以包含一个或多个特定类型的分子。例如,位点可以包含具有特定序列的单个靶核酸分子,或位点可以包含具有同一序列(和/或其互补序列)的若干核酸分子。可以用于本文所描述的实施例中的可寻址条形码阵列的非限制性实例包含国际专利申请号WO2016/168825、WO 2012/140224、WO 2014/060483、WO 2016/162309等中所描述的阵列。在一些实施例中,将可寻址引物与固体表面共价连接。
组织样品的多核苷酸可以是RNA(例如,mRNA)、与组织样品结合的OTBA的寡核苷酸等。因此,杂交结构域可以促进与所关注序列(例如,poly(T)或随机序列)的无偏差杂交,或能够与特异性靶序列(例如,特异性mRNA序列)杂交,或能够与OTBA的寡核苷酸杂交。
可以使组织样品与可寻址引物阵列接触以在存在拴系有寡核苷酸的双脱氧核苷酸、非栓系的核苷酸和聚合酶的情况下产生第一经退火的复合物。第一经退火的复合物的延伸导致拴系有寡核苷酸的核苷酸(例如,拴系有寡核苷酸的双脱氧核苷酸)掺入第一延伸产物中。可以如本文其它地方所描述的对包括掺入的OTDDN的第一延伸产物进行操作,例如以产生适合于NGS测序的核酸文库。
可寻址引物可以与阵列上的不同特征共价连接。可寻址引物可以进一步包含提供从阵列上的特征释放可寻址引物中的至少一部分的方式的切割结构域,其中所释放的部分将包括位置条形码和杂交序列。例如,可寻址引物可以包含促进例如在可寻址引物在存在组织核酸的情况下延伸时由限制酶进行切割的序列。
在形成第一延伸产物之前或之后,可以对组织切片进行可视化或成像,例如染色和拍照。因此,在一些方面,可寻址条形码与组织样品内的位置相关。在一些实施例中,可以对多个连续的组织切片进行本文所描述的方法,以产生所分析的生物分子(例如,RNA、DNA、蛋白质)的三维轮廓。因此,在一些实施例中,可寻址引物中的条形码进一步包含z坐标。
IV.试剂盒
还提供了包括本文所描述的拴系有寡核苷酸的核苷酸和/或拴系有oligo的细胞标志物结合剂的试剂盒。在一些实施例中,所述试剂盒用于产生核酸测序文库,所述核酸测序文库包括:如上文所描述的拴系有寡核苷酸的核苷酸和/或拴系有oligo的细胞标志物结合剂(OTBA);以及以下两项中的至少一项:(i)A、C、G、U和/或T核苷酸、(ii)聚合酶、引物和缓冲液。
所述试剂盒中可以包含的聚合酶可以选自Taq DNA聚合酶、DNA聚合酶、Deep VentTM DNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV、SuperscriptTMII、SuperscriptTM III、Superscript IV、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶I、克列诺片段、水生栖热菌DNA聚合酶、TthDNA聚合酶、PhusionTM DNA聚合酶、SuperFiTM DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶和HIV-1逆转录酶以及其各种衍生物或突变体。
一些实施例涉及用于组合条形码编码的试剂盒。所述试剂盒可以包含如本文所描述的拴系有寡核苷酸的双脱氧核苷酸和以下中的一个或多个:聚合酶、一个或多个核苷酸、包括多个第一条形码的多个第一延伸引物、包括多个第二条形码的多个第二延伸引物、包括多个第三条形码的多个扩增引物和至少一个夹板寡核苷酸或其组合。
V.定义
虽然详细描述了本发明的教导,但是应当理解,本公开不限于具体的组合物或工艺步骤,因为此类组合物或工艺步骤可以变化。必须指出的是,如在本说明书以及所附权利要求书中所使用的,单数形式的“一个(a)”、“一种(an)”和“所述(the)”包含复数指示物,除非上下文另外清楚地指出。因此,例如,对“染料”的提及包含多种染料,并且对“细胞”的提及包含多个细胞等。
考虑到有效数字和与测量相关的误差,测得值和可测量值被理解为近似值。在没有明确排除的情况下,如“不包含端点”,所有范围应解释为包括端点;因此,例如,“在10-15内”包含值10和15。“包括(comprise/comprises/comprising)”、“含有(contain/contains/containing)”和“包含(include/includes/including)”的使用并不旨在是限制性的。应当理解,上述的一般描述和详细描述均仅是示例性和解释性的,并且不限制本教导。除非说明书中特别指出,否则说明书中叙述“包括”各个组分的实施例也被考虑是“由所述组分组成”或“基本上由所述组分组成”。
本文所使用的章节标题仅仅是出于组织的目的并且不应被解释为以任何方式限制期望的主题。在通过引用并入的任何文献与本说明书中所定义的任何术语相矛盾的情况下,以本说明书为准。虽然结合各个实施例对本发明教导进行了描述,但是本发明教导不旨在受限于此类实施例。相反,本发明教导涵盖各种替代方案、修改和等同物,如本领域的技术人员将理解的。
本申请中所引用的所有文献和类似材料,包含但不限于专利、专利申请、论文、书籍、专著和互联网网页,出于任何目的通过引用整体明确地并入。除非另外规定,否则本文所使用的所有技术和科学术语具有与本文所描述的各种实施例所属领域的一般技术人员通常所理解相同的含义。当所并入的参考文献中的术语的定义出现与本教导中所提供的定义有所不同时,应以本教导中所提供的定义为准。
为了便于理解本发明技术,下文对多个术语和短语进行了定义。另外的定义贯穿详细描述而阐述。
尽管如本文所用的短语“在一个实施例中”虽然可以,但是不一定指代相同的实施例。此外,如本文所用的短语“在另一个实施例中”虽然可以,但是不一定指代不同的实施例。因此,如下文所描述的,在不脱离本公开的范围或精神的情况下,可以容易地组合本公开的各个实施例。
如本说明书中所使用的,除非上下文另外明确说明,否则单数形式“一个/一种(a/an)”和“所述”包含复数指示物。因此,例如,对“一部分”的引用包含多个此类部分等。本说明书中所使用的术语“包括”和其语法等效物意指,除了具体标识的特征之外,任选地存在其它特征。在本说明书中提及包括两个或更多个定义的步骤的方法的情况下,所述定义的步骤可以以任何顺序或同时执行(除非上下文排除了这种可能性),并且所述方法可以任选地包含在所述定义的步骤中的任何定义的步骤之前、在所述定义的步骤中的两个定义的步骤之间或在所有定义的步骤之后执行的一个或多个其它步骤(除非上下文排除了这种可能性)。在本文中提及“第一”和“第二”特征的情况下,这通常是出于标识目的而进行的;除非上下文另有要求,否则第一特征和第二特征可以是相同的或不同的,并且提及第一特征并不意指必然存在第二特征(尽管所述第二特征可能存在)。在本文中提及“一个(a)”或“一种(an)”特征的情况下,这包含存在两个或更多个此种特征的可能性。
根据本公开的术语“核苷酸”具体地是指核糖核苷酸、2'-脱氧核糖核苷酸或2',3'-双脱氧核糖核苷酸。核苷酸类似物可以选自糖或主链修饰的核苷酸,具体地可以酶促掺入到核酸中的核苷酸类似物。在糖修饰的核苷酸的一些实施例中,核糖的2'-OH或H-基团被选自以下的基团替代:OR、R、卤基、SH、SR、NH2、NHR、NR2或CN,其中R是C1-C6烷基、烯基或炔基,并且卤基是F、Cl、Br或I。核糖本身可以被如环戊烷或环己烯基团等其它碳环或杂环5或6元基团替代。在主链修饰的核苷酸的一个实施例中,磷酸(三)酯基团可以被经修饰基团替代,例如被硫代磷酸酯基团或H-膦酸酯基团替代。在另外的实施例中,核苷酸类似物包含用于合成如吗啉代核酸、肽核酸或锁核酸等核酸类似物的结构单元。
术语“核碱基”是指天然或非天然嘌呤或嘧啶碱基。核碱基包含腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶、次黄嘌呤、黄嘌呤、7-脱氮-腺嘌呤和7-脱氮鸟嘌呤、肌苷。
如本文所用,短语“dNTP”意指2'-脱氧核苷酸三磷酸,其中核苷酸包括天然或非天然核碱基。
如本文所用,短语“ddNTP”意指2',3'-双脱氧核苷酸三磷酸,其中核苷酸包括天然或非天然核碱基。
如本文所用,术语“寡核苷酸”被定义为包括两个或更多个脱氧核糖核苷酸和/或核糖核苷酸的分子。所述寡核苷酸的确切大小将取决于许多因素,所述许多因素进而取决于寡核苷酸的最终功能或用途。可以合成或通过克隆衍生出寡核苷酸。
如本文所用,术语“多核苷酸”是指由共价键合在链中的核苷酸单体组成的聚合物分子。DNA(脱氧核糖核酸)和RNA(核糖核酸)是多核苷酸的实例。如本文所用的多核苷酸是指双链或单链核酸,如DNA、RNA、线性或环状dsDNA/ssDNA、片段化的dsDNA/RNA、线性或环状RNA和其它已知形式或核酸。
如本文所用,术语“拴系有寡核苷酸的核苷酸”是指与核苷酸核碱基共价连接的包含两个或更多个脱氧核糖核苷酸和/或核糖核苷酸的分子。例如,两个或更多个脱氧核糖核苷酸和/或核糖核苷酸通过三唑环与核苷酸核碱基共价连接。此种共价连接可能是“点击化学”过程的结果。在一些实例中,拴系有寡核苷酸的核苷酸可以被称为OTDN(拴系有寡核苷酸的脱氧核苷酸)或OTDDN(拴系有寡核苷酸的双脱氧核苷酸)。
如本文所用,术语“双链”在关于多核苷酸使用时意指多核苷酸的互补链之间的一些或所有核苷酸氢键合在一起以形成部分或完整的双螺旋。部分双链多核苷酸的至少10%、25%、50%、60%、70%、80%、90%或95%的核苷酸可以与互补核苷酸氢键合。
单链多核苷酸是指与另一个多核苷酸具有很少或没有氢键的多核苷酸,使得在给定的一组杂交条件下不会形成双螺旋或双螺旋不稳定。
“聚合酶”通常是指催化核苷酸、低聚物和其类似物中的3'-OH和5'-三磷酸酯之间的反应以形成核酸聚合物的酶。聚合酶包含但不限于DNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性DNA聚合酶、RNA依赖性RNA聚合酶、非模板依赖性DNA聚合酶、非模板依赖性RNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、水生栖热菌DNA聚合酶、Tth DNA聚合酶、PhusionDNA聚合酶、SuperFi DNA聚合酶、Vent DNA聚合酶、Deep Vent DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、TliDNA聚合酶、真核DNA聚合酶β、端粒酶、KOD FliFi、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶(TdT)、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、Thermo测序酶(赛默飞世尔科技公司(Thermo Fisher Scientific))。这些聚合酶包含野生型突变同种型、嵌合体形式和如外切聚合酶等基因工程化变体以及例如耐受经修饰核苷酸并且将所述经修饰核苷酸掺入核酸链中的其它突变体。
如本文所用,术语“条形码”是指允许标识条形码与之相关的核酸的某个特征的已知核酸序列。在一些实施例中,要标识的核酸的特征是所述核酸所衍生自的样品或来源。仅举例来说,本文所描述的一些实施例描述了将多个条形码(例如,2个、3个、4个、5个、6个或更多个)添加到存在于细胞群中的单个细胞中的所关注核酸。添加到每个单个的细胞的核酸中的条形码的唯一组合可以有利地使得能够标识出所关注带标签的核酸所衍生自的细胞。在一些实施例中,条形码的长度为至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个核苷酸。在一些实施例中,条形码的长度短于10个、9个、8个、7个、6个、5个或4个核苷酸。在一些实施例中,与一些核酸相关的条形码的长度不同于与其它核酸相关的条形码的长度。通常,条形码具有足够的长度并且包括足够不同的序列以允许基于与所述序列与之相关的条形码来标识样品。在一些实施例中,在条形码序列中的一个或多个核苷酸发生突变、插入或缺失,如突变、插入或缺失之后,可以准确地标识出条形码和所述条形码与之相关的样品来源。在一些实施例中,在两个或更多个核苷酸位置,如在2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个位置处,多个条形码中的每个条形码与所述多个条形码中的每一个其它条形码有所不同。在一些实施例中,一个或多个衔接子包括多个条形码序列中的至少一个条形码序列。在一些实施例中,所述技术的方法进一步包括基于靶核酸所连接的条形码序列来标识所述靶核酸所衍生自的样品或来源。在一些实施例中,所述技术的方法进一步包括基于靶核酸所连接的条形码序列来标识所述靶核酸。所述方法的一些实施例进一步包括通过确定条形码核苷酸序列来标识靶核苷酸序列的来源或样品。所述方法的一些实施例进一步包括分子计数应用(例如,数字条形码枚举和/或分箱(binning))以确定期望的靶标的表达水平或拷贝数状态。通常,条形码可以包括核酸序列,所述核酸序列在与靶核酸连接时充当靶多核苷酸所衍生自的样品的标识符。
如本文所用,术语“引物”或“延伸引物”是指在被置于适当的条件下时,例如在存在含核苷酸三磷酸和聚合酶(例如,热稳定聚合酶)的适当的缓冲液(“缓冲液”包含适当的pH、离子强度、辅因子等)的情况下以及合适的温度下能够作为核酸合成的起始点的寡核苷酸,无论是天然存在的还是合成产生的。在一些实施例中,引物可以是单链的,以获得最大的扩增效率,但可以可替代地是双链的。如果是双链的,则在用于制备延伸产物之前,首先对引物进行处理以分离出所述引物的链。在一些实施例中,引物是寡脱氧核苷酸。引物必须足够长以引发延伸产物的合成。引物的确切长度取决于许多因素,包含温度、引物来源、聚合酶(例如,所述聚合酶是否是热稳定的)以及方法的使用。如本文所用,术语“衔接子”通常是指可以添加,例如连接到核酸分子,由此产生可以在测序平台上进行测序的核酸产物的任何线性寡核苷酸。在一些实施例中,衔接子包含形成双链结构的两个反向互补寡核苷酸。
在一些实施例中,如引物、衔接子等寡核苷酸包括“通用”序列。通用序列是例如使用已知序列(例如,与通用序列互补)的引物或探针用作引物或探针结合位点的已知序列。虽然引物的模板特异性序列、引物的条形码序列和/或衔接子的条形码序列在技术的实施例中可能有所不同,例如从片段到片段、从样品到样品、从来源到来源或从所关注区到所关注区有所不同,但是所述技术的实施例提供了从片段到片段、从样品到样品、从来源到来源或从所关注区到所关注区是相同的通用序列,使得可以使用类似的方法或技术(例如,使用相同的引物或探针)以相同或类似的方式对包括通用序列的所有片段进行操作和/或处理,例如扩增、标识、测序、分离等。
如本文所用,术语“手柄”(可与术语“扩增手柄”或“PCR手柄”互换使用)是指功能性组分寡核苷酸序列,所述功能性组分本身是为对构建体寡核苷酸序列的扩增提供退火位点的寡核苷酸或多核苷酸序列。本发明实施例中所使用的手柄可以由DNA、RNA、PNA、经修饰碱基或这些碱基的组合的聚合物或聚酰胺等形成。在一些实施例中,本文所公开的实施例中使用的通用手柄的长度为约10个此种单体组分,例如核苷酸碱基。在其它实施例中,通用手柄的长度为至少约5到100个单体组分,例如核苷酸。因此,在各个实施例中,本文所描述的通用手柄为至少5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、80个、91个、92个、93个、94个、95个、96个、97个、98个、99个或至多100个单体组分,例如核酸。因此,本文所描述的“通用手柄”可以是适合作为退火位点以通过如本文其它地方所描述的聚合酶,例如逆转录酶、DNA聚合酶等进行延伸的通用序列,或可以含有延伸引物结合位点、测序引物结合位点等。
术语“唯一分子索引”(UMI)意指可以用于使单个的DNA分子彼此区分开来的应用于DNA分子或在DNA分子中标识的核苷酸序列。由于UMI用于标识DNA分子,因此它们也被称为唯一分子标识符。UMI可以与其与之相关的DNA分子一起进行测序,以确定读段序列是一种来源DNA分子的读段序列还是另一种来源DNA分子的读段序列。
如本文所用,术语“夹板寡核苷酸”是指用作模板以促进核酸序列以模板依赖性方式延伸或连接到现有核酸产物以形成延伸的核酸产物、但未延伸或掺入核酸产物中的寡核苷酸。仅举例来说,在本文所描述的一些实施例中,夹板寡核苷酸可以包含以下组分:(i)使得能够与存在于要延伸的核酸产物中的同源手柄序列杂交的序列;(ii)条形码序列;和(iii)作为用于将不同于(i)中的手柄的手柄序列掺入如图38中所示出的经延伸的核酸产物中的模板的序列。夹板寡核苷酸任选地包含促进从反应混合物中去除例如生物素部分等的方式。在一些方面,夹板寡核苷酸还包含防止夹板寡核苷酸从3'端延伸的修饰(例如,3'氨基、3'磷酸酯、3'双脱氧等)。
如本文所用,术语“核酸合成”是指用于制备新的多核苷酸链或使现有多核苷酸(即,DNA或RNA)伸长的任何体外方法。根据本公开,合成包含使用聚合酶增加多核苷酸模板序列的拷贝数的扩增。多核苷酸合成导致核苷酸掺入多核苷酸(即,引物)中,由此形成与多核苷酸模板互补的新的多核苷酸分子。所形成的多核苷酸分子和其模板可以用作用于合成另外的多核苷酸分子的模板。
如本文所用,术语“模板DNA分子”是指例如在引物延伸反应中通过DNA聚合酶由其合成互补核酸链的核酸的链。
如本文所用,术语“模板依赖性方式”是指涉及引物分子的模板依赖性延伸的过程(例如,通过DNA聚合酶合成DNA、通过逆转录酶合成cDNA等)。术语“模板依赖性方式”通常是指RNA或DNA的多核苷酸合成,其中新合成的多核苷酸链的序列是由众所周知的互补碱基配对规则决定的。
如本文所用,术语“互补”是指两个多核苷酸链的区之间或两个核苷酸之间通过碱基配对的序列互补性的广义概念。已知腺嘌呤核苷酸能够与胸腺嘧啶或尿嘧啶核苷酸形成特异性氢键(“碱基配对”)。类似地,已知胞嘧啶核苷酸能够与鸟嘌呤核苷酸碱基配对。
“标签”或“寡核苷酸标签”意指文库的寡核苷酸部分,所述寡核苷酸部分的至少一部分对信息进行编码。“标签”可以是用拴系有寡核苷酸的核苷酸添加到核酸的任何核苷酸序列。此类信息的非限制性实例包含添加(例如,通过结合反应)组分(即,支架或结构单元,如分别在支架标签或结构单元标签中)、文库中的头片、文库的身份(即,如在身份标签中)、文库的使用(即,如在使用标签中)和/或文库成员的来源(即,如在来源标签中)。
如本文所用,术语“文库”在关于核酸使用时旨在意指具有不同化学组成(例如,不同序列、不同长度等)的核酸的集合。通常,文库中的核酸将是具有某个属或类的共同特征或特性的不同物种,但在其它方面在某种程度上有所不同。例如,文库可以包含核苷酸序列不同、但在具有糖-磷酸酯主链方面类似的核酸物种。可以使用本领域已知的技术创建文库。本文所例示的核酸可以包含从任何来源,包含例如基因组(例如,人基因组)或基因组混合物的消化获得的核酸。在另一个实例中,核酸可以是从特定环境或生态系统的宏基因组研究中获得的那些核酸。所述术语还包含人工创建的核酸文库,如DNA文库。
术语“点击化学”和“点击反应”在本文中可互换使用并且旨在与其在本领域中的使用一致。通常,点击化学反应是快速的(例如,快速完成反应)、简单的、易于纯化的且具有区特异性。点击化学包含如但不限于以下的反应:铜催化的叠氮化物-炔烃环加成(CuAAC);应变促进的叠氮化物-炔烃环加成(SPAAC),其也被称为无铜点击化学;应变促进的炔烃-硝酮环加成(SPANC);炔烃氢硫醇化;和烯烃氢硫醇化。使用铜作为催化剂的点击化学通常包含不稳定的Cu(I)稳定配体。在不受任何特定理论束缚的情况下,配体可以使Cu(I)离子稳定或保护所述离子免于因反应性Cu(I)而氧化为Cu(II)并且还可以充当减少或消除反应中对碱基的需求的质子受体。在一些实施例中,可以通过使用使两个反应配偶体足够接近以进行反应的部分来辅助多核苷酸之间的点击化学。
如本文所用,并且除非另有规定,否则术语“叠氮化物”或“叠氮基”是指N3或-N=N+=N-或-N-N+≡N。
如本文所用,并且除非另有规定,否则术语“约”或“大约”意指如本领域的普通技术人员确定的特定值的可接受误差,这将部分取决于如何测量或确定值。在某些实施例中,术语“约”或“大约”意指在1个、2个、3个或4个标准偏差内。在某些实施例中,术语“约”或“大约”意指在给定值或范围的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%或0.05%内。
如本文所用,“标记”是用于对核酸进行标记的化学或生物化学部分。“标记”包含例如荧光剂、化学发光剂、亲和剂、封闭基团、发色剂、猝灭剂、放射性核苷酸、酶、底物、辅因子、抑制剂、纳米颗粒、磁性颗粒和本领域已知的其它部分。标记能够产生可测量的信号并且可以与寡核苷酸或核苷酸共价或非共价连接。在一些实例中,如本文所公开的寡核苷酸或拴系有寡核苷酸的核苷酸的寡核苷酸的一部分可以充当标记。
如本文所用,如本文所用的术语“接头”是指掺入选自C、N、O、S和P的非氢原子的单个共价键或一系列稳定的共价键。示例性连接成员包含选自-C(O)NH-、-C(O)C)-、-NH-、-S-、-O-、烷基、烯基和炔基链的至少一个部分。接头还可以包括2个或更多个连接成员的组合。
如本文所用,术语“烷基”或“亚烷基”是指衍生自例如1到12个碳原子或1到6个碳原子、1到4个碳原子或2到3个碳原子的饱和的直链或支链烃链的基团。烷基的实例包含甲基、乙基、丙基、异丙基、正丁基、异丁基、叔丁基、正戊基、2-戊基、3-戊基、2-甲基丁基、3-甲基丁基和正己基以及任何异构体、亚甲基、亚乙基、亚丙基、异亚丙基、正丁烯、亚戊基等。
如本文所用,术语“烯基”和“亚烯基”是指衍生自含有至少一个碳-碳双键的由2到10个碳原子构成的直链或支链烃链的基团。实例包含乙烯基(ethenyl/vinyl)、1-丙烯基、2-丙烯基(烯丙基)、异丙烯基、丁烯基、丁-1,4-二烯基、戊烯基、己烯、亚乙烯基、亚丙烯基、亚丁烯基、亚己烯基等。
如本文所用,术语“炔基”和“亚炔基”是指衍生自含有至少一个碳-碳三键的由2到10个碳原子构成的直链或支链烃链的二价基团。
术语“氨基”是指NR1R2类型,其中R1和R2独立地选自氢和C1-C8烷基。
如本文所用,术语“聚亚烷基二醇”是指直链或支链聚亚烷基二醇聚合物,如聚乙二醇、聚丙二醇和聚丁二醇。示例性聚亚烷基二醇具有2到10个亚烷基二醇单元。术语“亚烷基二醇亚单元”是指单个亚烷基二醇单元。例如,乙二醇亚单元是-O-CEE-CEE-。示例性聚亚烷基二醇包含具有2到10个乙二醇单元的聚乙二醇,并且在具体实施例中,还包含具有2个、4个或6个乙二醇单元的分别被称为PEG2、PEG4和PEG6的聚乙二醇。
术语“烷氧基”或基团-OR3是指其中R3是C1-8烷基。实例包含OC1-8烷基,如-OMe(甲氧基)、-OEt(乙氧基)、-O(nPr)(正丙氧基)、-O(iPr)(异丙氧基)、-O(nBu)(正丁氧基)、-O(iBu)(异丁氧基)、-O(tBu)(叔丁氧基)等。
应当理解,本文所公开的化学结构为可能的共振结构之一的可以表示每种给定结构的表示。进一步地,将理解的是,通过定义,共振结构仅仅是本领域的技术人员用来表示电子离域的图形表示,并且本公开不通过示出任何给定结构的一个特定共振结构以任何方式进行限制
术语“分离的”在本文中关于核酸聚合物使用时意指核酸聚合物由于其来源或操纵与至少一些与之天然相关或在最初获得时与之相关的组分分离。可替代地或另外,“分离的”意指所关注核酸聚合物由人工产生或合成。
现在将参考以下实施例和相关附图仅通过举例进一步详细描述本公开。
实例
以下是本文所公开的方法、用途和组合物的实例。应当理解,鉴于上文提供的一般描述和详细描述,可以实践各个其它实施例。以下实例出于说明本发明教导的目的而给出并且不应被解释为是对本公开或权利要求的范围的限制。
实例1.拴系有寡核苷酸的核苷酸的制备
A.叠氮化物修饰的核苷酸的制备
可从耶拿生物科学公司(Jena Bioscience)(SKU NU-1611-1和NU-809)商购获得如5-炔丙基氨基-dCTP(化合物6)或7-脱氮-7-炔丙基氨基-dATP(化合物7)等氨基修饰的核苷酸。使用具有叠氮基-NHS-酯的不同接头,通过2-叠氮基-化合物与期望的2,5-二氧吡咯烷-1-基在Na2CO3/NaHCO3的pH 9溶液中进行反应来合成对应的叠氮基取代的dCTP(图7),从而得到在50-90%区间内的产率。
根据相同的反应条件合成叠氮基-C2-dATP(图8)。
B.炔烃修饰的寡核苷酸的制备
低聚物:
可从各种商业供应商处以炔烃修饰商购获得(AldU)TT AT ATTT ATTGG AG ACT GACT AC C AG AT GT AAC A(SEQ ID NO:33)。最初在Stasevskij等人,2017年中公开了这种寡核苷酸的序列,然而在此实例中,首先将炔烃修饰添加到寡核苷酸的5'端碱基。可从各种商业供应商处商购获得在其5'-末端核碱基或5'-末端磷酸酯处被炔烃修饰的寡核苷酸。
C.点击反应-拴系有寡核苷酸的dCTP的合成
对于所有点击叠氮化物-炔烃环加成反应,根据制造商的说明使用“CuAAC生物分子反应缓冲液试剂盒(基于THPTA)”(目录号CLK-072,耶拿生物科学公司)。反应条件如下:42μM低聚物(SEQ ID NO:33或SEQ ID NO:23)、2mM Q1SO4、10mM THPTA、0.1M抗坏血酸钠、78mM磷酸钠缓冲液(pH 7)、84μM叠氮化物前体。
使用点击反应合成五个不同的拴系有寡核苷酸的脱氧核苷酸(图9)。对反应混合物进行分析,并通过液相色谱法进行纯化。这些反应的结果汇总于表1中。
例如,当寡核苷酸被Alxyl(Metabion)修饰时,也可以使用叠氮基修饰的核苷酸和通过己炔基接头(如式C1的化合物中所示出的)在寡核苷酸的5'端的磷酸酯连接有炔烃基团的所述寡核苷酸进行产生拴系有寡核苷酸的核苷酸的点击反应。提供式E2化合物作为实例。
D.点击反应-拴系有寡核苷酸的ddUTP的合成
随后在寡核苷酸(SEQ ID NO:33或SEQ ID NO:23)的环加成(点击)反应中使用化合物9(图10)。将来自耶拿生物科学公司的“CuAAC生物分子反应缓冲液试剂盒(基于THPTA)”用于点击反应。通过反相色谱法纯化并通过质谱法确认产物化合物10。可替代地,在与化合物9的点击反应中使用将通过己炔基接头在寡核苷酸的5'端的磷酸酯连接有炔烃基团的所述寡核苷酸。
实例2.由不同的聚合酶掺入拴系有寡核苷酸的dNTP
已经对一系列不同聚合酶将拴系有寡核苷酸的dNTP掺入合成链中的能力进行了测试。根据文献,预期来自家族A、家族B、逆转录酶(RT)家族和末端脱氧核苷酸转移酶(TdT)的酶能够将大体积核苷酸类似物掺入。然而,这可能取决于核苷酸类似物本身(Anderson等人,2005年;Tauraite等人,2017年)。
A.拴系有寡核苷酸的脱氧核苷酸的掺入
表2:
粗体T表示生物素修饰。
实验系统基于引物和寡核苷酸的双链体(例如SEQ ID NO:24和27的双链体,图31)中的突出5'端的延伸。与天然dNTP的反应导致突出端的完全填补和引物延伸,而掺入单个拴系有寡核苷酸的脱氧/双脱氧核苷酸导致引物标记有寡核苷酸。在每种经过测试的聚合酶的最优缓冲液和温度下进行引物延伸反应。然后在15%TBE-尿素PAGE上对反应产物进行解析。在延伸引物SEQ ID NO:24具有5'-Cy5荧光标记时检测到引物延伸产物。
将A型聚合酶(推荐Taq DNA聚合酶):2pmol Cy5-29||49底物(SEQ ID NOS:24和27,图31)、20pmol OTDN、1x Taq缓冲液、2.5U Taq DNA聚合酶(赛默飞世尔科技公司,#EP0405)、25mM MgCh在95℃下温育10秒并且然后在60℃下温育10分钟。
将B型聚合酶(Phusion exo-,赛默飞世尔科技公司):2pmol Cy5-29||49底物、20pmol OTDN在95℃下温育10秒并且然后在60℃下温育10分钟。
将RT型聚合酶(Maxima H-):5pmol Cy5-B29||30底物(SEQ ID NOS:24和28,图32)、50pmol OTDN、200U Maxima H-RT(赛默飞世尔科技公司,#EP0752)、1x RT缓冲液在50℃下温育20分钟(图11A-11C)。
如从图11A-11C可以看到的,在对于对应的酶而言是典型的和推荐的反应条件(如缓冲液和反应温度)下,所有经过测试的聚合酶都能够将拴系有寡核苷酸的核苷酸掺入。而且,包括各种接头的拴系有寡核苷酸的核苷酸是由经过测试的聚合酶中的每种聚合酶掺入的。
而且,证实了RT聚合酶能够进行拴系有寡核苷酸的脱氧核苷酸的多次掺入。将112nt RNA片段(SEQ ID NO:30)退火到Cy5标记的互补DNA引物(SEQ ID NO:29)并用RT聚合酶使所述片段经历引物延伸反应条件(图12A,箭头示出了拴系有寡核苷酸的dCTP掺入位点)。反应混合物含有拴系有寡核苷酸的脱氧胞苷和未经修饰(天然的)dATP、dTTP和dGTP。然后在20%TBE-尿素PAGE上对反应产物进行解析(图12B)。泳道8中的多个条带确认了多个拴系有寡核苷酸的核苷酸掺入事件。因此,在典型的反应条件(如缓冲液和反应温度)下,Maxima H-RT能够将拴系有寡核苷酸的核苷酸掺入合成的DNA链的多个位置中。而且,当使用DNA/DNA或DNA/RNA引物/模板系统时,逆转录酶能够将拴系有寡核苷酸的核苷酸掺入并使核酸链进一步延伸。
B.拴系有寡核苷酸的双脱氧核苷酸的掺入
使用与拴系有寡核苷酸的脱氧核苷酸的实验系统类似的实验系统。对两个经退火的寡核苷酸的双链体中突出5'端进行填补。与dTTP进行反应导致突出端的完全填补和引物延伸10个寡核苷酸,而将单个拴系有寡核苷酸的双脱氧核苷酸掺入导致引物标记有23nt的寡核苷酸(SEQ ID NO:2用于末端脱氧核苷酸转移酶(TdT)和poly(U)聚合酶,并且SEQ IDNO:1用于其它聚合酶反应)。
在每种经过测试的聚合酶的最优缓冲液和温度下进行引物延伸反应。每反应使用2pmol底物寡核苷酸双链体(SEQ ID NO:31和32,图33)和20pmol dTTP或拴系有寡核苷酸的ddUTP(对应于化合物10结构)。然后在15%TBE-尿素PAGE上对反应产物进行解析(TdT(赛默飞世尔科技公司)结果提供于图13中,其它聚合酶的结果提供于15A-15E中)。在延伸引物具有5'-Cy5荧光标记时检测到引物延伸产物。在合成的100nt转录物上对poly(U)聚合酶(美国马萨诸塞州的新英格兰生物实验室(New England Biolabs,MA,USA))通过将拴系有寡核苷酸的双脱氧核苷酸掺入来对RNA 3'端进行标记的能力进行了测试。在根据制造商的建议进行的加尾反应中使用1pmol RNA和10pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:2)。使用CollibriTM文库清理试剂盒(赛默飞世尔科技公司)对反应产物进行纯化,并使用小RNA试剂盒在安捷伦2100生物分析仪上对所述反应产物进行分析(图14)。此实验的结果确认了,poly(U)聚合酶将拴系有寡核苷酸的ddUTP掺入。
能够将拴系有寡核苷酸的ddUTP掺入的经鉴定的聚合酶包含SuperscriptTM IV、SuperscriptTM II、MaximaTM、RevertAidTM逆转录酶、Thermo SequenaseTM、SequenaseTMV2.0、CycleSeqTM和Phusion exo-(图15A-15E)、末端脱氧核苷酸转移酶(TdT)(图13)和poly(U)聚合酶(图14)。如本实例和图13到15中所提供的结果示出,有利地,可以使用各种类型的聚合酶,包含A型、B型、X型聚合酶和逆转录酶来将本公开的拴系有寡核苷酸的双脱氧核苷酸掺入。另外,非模板依赖性RNA聚合酶,如PolyU聚合酶能够将拴系有寡核苷酸的双脱氧核苷酸掺入。而且,掺入可以在对于对应的聚合酶来说是典型的反应条件,如缓冲液和温度下进行。
实例3.通读评价实验
如Stasevskij等人证实的非自然连接的聚合酶通读在实验模型中得到了确认(图16中的过程方案)。简而言之,将特异性引物设计为仅在聚合酶成功通读掺入的拴系有寡核苷酸的核苷酸的情况下才产生PCR产物。首先,使第一引物退火到模板,使得要掺入的第一核苷酸是拴系有寡核苷酸的脱氧核苷酸,在此具体实例中,由Phusion exo-DNA聚合酶掺入。然后将15%的反应混合物转移到另一个反应混合物中,其中使第二个引物退火并添加Pfu DNA聚合酶以进行引物延伸。然后用2x Maxima HS MasterMix(赛默飞世尔科技公司;包括热启动Taq DNA聚合酶)对经延伸的片段进行PCR扩增。为了确认正确的通读事件,对所产生的PCR片段进行克隆并进行Sanger测序(数据未示出)。结果示出了预期的拴系有寡核苷酸的核苷酸掺入位置,以及聚合酶通读了所拴系寡核苷酸的5'-核苷酸与所述寡核苷酸所拴系到的核苷酸之间的接头。
在含有与通读产物的3'端互补的单链Cy5 29nt引物的另一个短PCR(图17A)中使用来自上文所描述的方案(图16)的步骤III的所掺入的拴系有寡核苷酸的核苷酸的聚合酶引物延伸/通读产物。如在泳道6(图17B)中所观察到的,Cy5延伸的引物的大小与Cy3引物相匹配(观察到两种染料),这得出以下结论:聚合酶在使退火到所拴系寡核苷酸的引物延伸时可以正确地通读由所拴系核苷酸形成的非天然接头。在一个实施例中,所述聚合酶是Phusion exo-。
实例4.NGS文库制备
A.通过引物延伸和随机终止进行测序就绪文库制备
使用M13mp18单链基因组DNA和大肠杆菌基因组DNA以及ATCCTM MSA-1002TM 20菌株交错的混合基因组材料(ATCCTM MSA-1002TM 20 Strain Even Mix Genomic Material,美国弗吉尼亚州马纳萨斯的ATCC)作为样品输入来进行概念验证(图3)实验。将靶向M13mp18基因座的两个特异性引物设计为如在其5'端处含有通用引发位点(SEQ ID NO:8和9的1-21nt)(图18A);
SEQ ID NO 8:5'-TACACGACGCTCTTCCGATCTAACGGTA
CGCCAGAATCTTG-3'
SEQ ID NO:9:5'TACACGACGCTCTTCCGATCTAGAG
CCACCACCGGAAC-3'
将两个引物与M13mp18 DNA混合在以下反应混合物中:125fmol每个SEQ ID NO:8和SEQ ID NO:9引物、100fmol M13mpl8 DNA、1.8pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:1)、18pmol dTTP、20pmol dATP、20pmol dCTP、20pmol dGTP、40U Thermo SequenaseTM(美国马萨诸塞州的赛默飞世尔科技公司)、2μL反应缓冲液以及达到20μL的最终反应体积的无核酸酶的水。进行引物延伸反应:在95℃下进行15个变性循环持续30秒,并在60℃下退火/延伸持续2分钟,然后在60℃下最终延伸持续30分钟。根据制造商针对核酸固定化的说明,通过用DynabeadsTM M-270链霉亲和素磁珠(美国马萨诸塞州的赛默飞世尔科技公司)进行纯化,使反应产物富集含有拴系有寡核苷酸的ddUTP的分子。除了PCR循环数量在本实验中为30之外,根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件,使用来自IlluminaTM系统(美国马萨诸塞州的赛默飞世尔科技公司)的CollibriTM链式RNA文库制备试剂盒的10X索引引物混合物,使经纯化的引物延伸产物经历索引化PCR,以引入与IlluminaTM仪器兼容的全长测序衔接子。可替代地,在不进行中间体纯化步骤的情况下将一半的引物延伸反应体积直接转移到索引化PCR中。索引化PCR后,使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对文库进行纯化。根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的样品中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂纳米试剂盒v2,300个循环(MiSeq Reagent Nano Kit v2,300-cycles)(美国加利福尼亚州依诺米那公司(Illumina,CA,USA))对所产生的文库进行测序;进行2×75bp双端测序(paired-endreads)。测序读段与M13mp18参考的比对示出了两个基因组基因座的预期覆盖率,所述两个基因组位点的5'端开始于固定位置处,而3'端——对应于拴系有寡核苷酸的ddUTP掺入基因座——出现在随机位点处(图18B)。引物延伸反应后在进行纯化或未进行纯化的情况下扩增的样品之间的测序结果没有显著差异。
将随机十聚体设计用于在全基因组测序应用中测试拴系有寡核苷酸的双脱氧核苷酸:SEQ ID NO:10:5'-TACACGACGCTCTTCCGATCTNNNNNNNNNN-3'
将SEQ ID NO:10引物与大肠杆菌gDNA混合在以下反应混合物中:350μg-100ng大肠杆菌gDNA、10-100pmol随机十聚体、1.8pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:1)、18pmol dTTP、20pmol dATP、20pmol dCTP、20pmol dGTP、40U Thermo SequenaseTM(美国马萨诸塞州的赛默飞世尔科技公司)、2μL反应缓冲液以及达到20μL的最终反应体积的无核酸酶的水。如下进行引物延伸反应:在92℃下变性持续3分钟,然后冷却到16℃并在16℃下温育5分钟,然后以0.1℃/秒斜变速率将温度升高至68℃并在68℃下温育15分钟,然后在92℃下进行25个变性循环持续30秒并在68℃下退火/延伸持续5分钟,然后在68℃下最终延伸持续30分钟。除了PCR循环数量在本实验中为35之外,根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件,使用来自IlluminaTM系统(美国马萨诸塞州的赛默飞世尔科技公司)的CollibriTM链式RNA文库制备试剂盒的10X索引引物混合物,使引物延伸产物经历索引化PCR,以引入与IlluminaTM仪器兼容的全长测序衔接子。索引化PCR后,使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对文库进行纯化。根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的样品中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂纳米试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行2×100bp双端测序。测序读段与大肠杆菌K-12参考的比对示出了比对率>75%,其中读段沿全大肠杆菌染色体分布(图19)。
将靶向细菌16S rRNA基因端并面向外的特异性引物设计成证实拴系有寡核苷酸的核苷酸技术用于对16S rRNA基因组上下文进行分析的适用性(图20A-C)。所述原理适用于旨在研究已知特异性基因座附近的未知序列区的任何实验系统。
SEQ ID NO:11:
CTCTTTCCCTACACGACGCTCTTCCGATCTAAGTCGTAACAAGGTAACCG
SEQ ID NO:12:
CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAGCCAKRATCAAAACTCT
SEQ ID NO:13:
CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAACCAAGATCAAATTCT
SEQ ID NO:14:
CTCTTTCCCTACACGACGCTCTTCCGATCTCTAAGCCAGGATCAAACTCT
SEQ ID NO:15:
CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAGCCAGAATCGAACCCT
将引物SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15分别以4:1:1:1的摩尔比混合。将多重引物延伸反应组装:1μL ATCCTM MSA-1002TM 20菌株交错的混合基因组材料(美国弗吉尼亚州马纳萨斯的ATCC)、12.5pmol SEQ ID NO:11引物、12.5pmolSEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15引物混合物、1.8pmol寡核苷酸连接的ddUTP(SEQ1),0.18pmol拴系有寡核苷酸的ddCTP(SEQ ID NO:3)、18pmol dTTP、18pmol dCTP、20pmol dGTP、20pmol dATP、40U Thermo SequenaseTM(美国马萨诸塞州的赛默飞世尔科技公司)、2μL反应缓冲液以及达到20μL最终反应体积的无核酸酶的水。反应条件如下:在95℃下初始变性持续4分钟,15个线性延伸/终止循环(在95℃下1分钟,在45℃下30秒,在72℃下1分钟),在60℃下最终延伸持续5分钟。使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对反应产物进行纯化。除了PCR循环数量在本实验中为20之外,根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件,使用来自IlluminaTM系统(美国马萨诸塞州的赛默飞世尔科技公司)的CollibriTM链式RNA文库制备试剂盒的10X索引引物混合物,进行全长IlluminaTM兼容衔接子的最终扩增和引入。索引化PCR后,使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对文库进行纯化。
根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所有所产生的文库中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行2×150bp双端测序。
结果指示,面向外的文库能够表征复杂的细菌群:在面向外的片段文库样品中鉴定出20个预期物种中的17个预期物种(图21)。
B.覆盖全转录物长度的测序就绪文库制备
使用人总RNA作为样品输入进行概念验证(图22)实验。首先,根据SuperscriptTMIV逆转录酶(美国马萨诸塞州的赛默飞世尔科技公司)的标准方案使用oligo(dT)30引物对总共1μl的通用人参考RNA(美国马萨诸塞州的赛默飞世尔科技公司)样品进行逆转录。使用CollibriTM文库清理试剂盒根据片段化RNA的清理方案(在CollibriTM链式RNA文库制备试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)手册中有所描述)对所产生的cDNA进行纯化。对于第二链合成,将以下反应混合物组装:经纯化的cDNA、1pmol随机引物(SEQ ID NO:10)、18pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:1)、180pmol dTTP、200pmol dATP、200pmol dCTP、200pmol dGTP、40U Thermo SequenaseTM(美国马萨诸塞州的赛默飞世尔科技公司)、2μL反应缓冲液以及达到20μL的最终反应体积的无核酸酶的水。反应条件:在95℃下变形持续3分钟,冷却到16℃并在16℃下温育持续5分钟,在50℃下进行引物延伸持续30分钟。在随机引物延伸单个循环后,根据制造商针对核酸固定化的说明,通过用DynabeadsTMM-270链霉亲和素磁珠(美国马萨诸塞州的赛默飞世尔科技公司)进行纯化,使反应产物富集含有拴系有寡核苷酸的ddUTP的分子。根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件(PCR循环数量为20),使用来自IlluminaTM系统(美国马萨诸塞州的赛默飞世尔科技公司)的CollibriTM链式RNA文库制备试剂盒的10X索引引物混合物,使经纯化的引物延伸产物经历索引化PCR,以引入与IlluminaTM仪器兼容的全长测序衔接子。根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的样品中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂纳米试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行2×75bp双端测序。数据分析揭示了与人基因组的比对率为94.4-97.2%、链特异性为97.8-98.7%以及跨整个转录物的基因体覆盖略微偏向对于mRNA测序文库而言是典型的3'端(图23)。
C.覆盖转录物的3'端的测序就绪文库制备
使用人总RNA作为样品输入进行概念验证(图24)实验。使用oligo(dT)引物SEQ IDNO:16:5'-AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTT TTTTTTTTTTTTTTTTTTTT 3'对总通用人参考RNA(美国马萨诸塞州的赛默飞世尔科技公司)样品进行逆转录。
逆转录反应混合物:20μg-1μg总RNA、ERCC ExFold RNA Spike-In(任选的,根据制造商的说明选择用量;美国马萨诸塞州的赛默飞世尔科技公司)、50pmol逆转录引物(SEQID NO:16)、10pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:1)、10pmol dTTP、20pmol dATP、20pmol dCTP、20pmol dGTP、1μL 100mM DTT、4μL 5X SuperscriptTM Iv(美国马萨诸塞州的赛默飞世尔科技公司)的RT缓冲液、200U SuperscriptTM IV(美国马萨诸塞州的赛默飞世尔科技公司)以及达到20μL的最终反应体积的无核酸酶的水。在50℃下进行反应持续30分钟。根据制造商针对核酸固定化的说明,通过用DynabeadsTM M-270链霉亲和素磁珠(美国马萨诸塞州的赛默飞世尔科技公司)进行纯化,使反应产物富集含有拴系有寡核苷酸的ddUTP的分子。然后可以根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件使带标签的cDNA直接经历索引化PCR。PCR循环数量在本实验中为20-25,这取决于起始输入量,并且索引引物如下:
SEQ ID NO:17:5'-AATGATACGGCGACCACCGAGATCTACACGCCTGTCCGCGGAAGCAGTGGTATCAACGCAGAGTAC-3'
SEQ ID NO:18:5'-CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'
可替代地,可以使用通读典型接头的效率比用于扩增的聚合酶的通读典型接头的效率高的聚合酶对样品进行线性预扩增。在这种情况下,使经纯化的带标签的cDNA经历以下反应:cDNA、4μL 5X PhusionTM HF缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)、1pLdNTP混合物(各自2mM)、1.2pmol与缀合到ddUTP的寡核苷酸互补的引物(SEQ ID NO:18)、2.5U Phusion exo-(美国马萨诸塞州的赛默飞世尔科技公司)以及达到20μL的最终反应体积的无核酸酶的水。进行引物延伸:在95℃下10个变性循环持续1分钟,在60℃下退火持续1分钟,并在72℃下延伸持续1分钟。然后,使用CollibriTM文库清理试剂盒根据片段化RNA的清理方案(在CollibriTM链式RNA文库制备试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)手册中有所描述)对反应产物进行纯化。在线性预扩增后,以不对称方式对样品进行PCR扩增,以完成全长测序衔接子的引入:20μL经纯化的线性扩增产物、25μL CollibriTM文库扩增主混合物、46pmol SEQ ID NO:17引物、4.6pmol SEQ ID NO:19:5'-CAAGCAGAAGACGGCATACGA-3'引物以及达到50μL的最终反应体积的无核酸酶的水。PCR条件是如标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)方案中所推荐的,不同之处在于PCR循环数量在本实验中为20-25,这取决于起始输入量。PCR后,使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对文库进行纯化。根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的样品中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行双端测序(R1为10bp并且R2为75bp)。数据分析示出,与人基因组的比对率>90%,链特异性>99%,并且基因体覆盖显著偏向3'端(图25)。
可替代地,使用SEQ ID NO:4的拴系有寡核苷酸的核苷酸获得当量的测序数据,所述拴系有寡核苷酸的核苷酸是使用具有5'己炔基修饰的寡核苷酸合成的。3'mRNA-seq文库的逆转录反应条件和下游加工如上所述。所产生的文库在从拴系有寡核苷酸的核苷酸掺入位点开始的测序读段中表现出预期的碱基组成(图26A-26B)。
也可以由多个单个细胞制备覆盖mRNA的3'端的测序就绪文库。根据用于共囊封细胞和条形码珠的NadiaTM仪器(英国罗伊斯顿的Blacktrace控股有限公司的Dolomite Bio公司(Dolomite Bio,Blacktrace Holdings Ltd,Royston,UK))的建议来制备HEK293细胞和BALB/3T3细胞的混合物。按照Dolomite Bio公司所建议的制备带有oligo(dT)30引物(SEQID NO:40)的条形码珠(美国马萨诸塞州的ChemGenes公司(ChemGenes,MA,USA))、珠特定条形码以及充当唯一分子标识符(UMI)的随机化区,并使用所述条形码珠、所述珠特定条形码和所述随机化区来引发cDNA合成和引入隔室特异性和分子特异性标签。
囊封后,按照NadiaTM方案的标准Drop-seq中所建议的,破坏乳液并洗涤珠。然后使珠经历如下进行的逆转录反应:44μL 5X Superscript IV缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)、344pmol拴系有寡核苷酸的ddCTP(SEQ ID NO:3)、50nmol dATP、50nmoldCTP、50nmol dGTP、50nmol dTTP、11μL 100mM DTT、44μL 20%FicollTM PM400(美国密苏里州西格玛奥德里奇公司(Sigma-Aldrich,MO,USA))、220U RNaseOUTTM重组核糖核酸酶抑制剂(美国马萨诸塞州的赛默飞世尔科技公司)、2200U Superscript IV(美国马萨诸塞州的赛默飞世尔科技公司)以及达到220μL的最终体积的无核酸酶的水。将珠悬浮在200μL逆转录反应混合物中,并在室温下温育30分钟,然后在50℃下第二次温育1小时。然后根据NadiaTM方案的标准Drop-seq说明洗涤珠,并使其经历线性扩增:-2000个珠,10μL 5XPhusion HF缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)、5nmol dATP、5nmol dCTP、5nmol dGTP、5nmol dTTP、300pmol SEQ18的寡核苷酸、6.25U Phusion exo-(美国马萨诸塞州的赛默飞世尔科技公司)以及达到50μL的最终反应体积的无核酸酶的水。进行线性扩增:95℃下进行10个变性循环1分钟,在60℃下退火1分钟、在72℃下延伸1分钟。然后使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对反应产物进行纯化,在此步骤处将珠丢弃。然后使用CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)、46pmol SEQ17引物和4.6pmol SEQ19引物对经纯化的线性扩增产物进行扩增。PCR循环数量为25。
根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的文库中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对文库进行测序;进行了双端测序(R1为21bp并且R2为75bp)。数据分析示出,细胞转录组的蛋白质编码部分的预期捕获(图27A-27D)。
可替代地,可以用条形码珠和RT/裂解混合物将细胞囊封在液滴中,并且在逆转录反应后可以破坏乳液。
D.覆盖转录物的5'端的测序就绪文库制备
使用人总RNA作为样品输入进行概念验证(图28)实验。首先,使用oligo(dT)引物(SEQ ID NO:9)和以下序列的模板转换寡核苷酸对总通用人参考RNA(美国马萨诸塞州的赛默飞世尔科技公司)样品进行逆转录,其中“G”后面的“r”指示核糖核苷酸碱基:
SEQ ID NO:20:5'-CCAGGACCAGCGATTCNNNNNNNNrGrGrG-3'
反应混合物:1μg总RNA,50pmol逆转录引物(SEQ ID NO:16)、4μL 5XSuperscriptTM IV的RT缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)、1μL dNTP混合物(各自10mM)、1μL 100mAT DTT、3μL 50%(w/v)PEG-8000、200U SuperscriptTM IV(美国马萨诸塞州的赛默飞世尔科技公司)以及达到19μL的最终体积的无核酸酶的水。在50℃下进行逆转录反应持续10分钟。然后向反应混合物补充20pmol模板转换寡核苷酸(SEQ ID NO:20)并在50℃下温育另外15分钟。然后,使用CollibriTM文库清理试剂盒根据片段化RNA的清理方案(在CollibriTM链式RNA文库制备试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)手册中有所描述)对cDNA进行纯化。使用与对应于SEQ ID NO:20寡核苷酸的cDNA区互补的引物SEQ ID NO:21(下划线)进行第二链合成,所述第二链合成对转录物的5'端进行了加标签:
SEQ ID NO:21:5'-CAGTGGTATCAACGCAGAGTACCCAGGA CCAGCGATTC-3'
第二链合成反应混合物:经纯化的cDNA、1pmol SEQ ID NO:21引物、1.8pmol拴系有寡核苷酸的ddUTP(SEQ ID NO:1)、18pmol dTTP、20pmol dATP、20pmol dCTP、20pmoldGTP、40U Thermo SequenaseTM(美国马萨诸塞州的赛默飞世尔科技公司)、2μL反应缓冲液以及达到20μL的最终反应体积的无核酸酶的水。进行引物延伸反应:在95℃下进行1个变性循环持续3分钟,然后在95℃下进行10个变性循环持续30秒,并在60℃下退火/延伸持续2分钟,然后在60℃下最终延伸持续5分钟。根据制造商针对核酸固定化的说明,通过用DynabeadsTM M-270链霉亲和素磁珠(美国马萨诸塞州的赛默飞世尔科技公司)进行纯化,使反应产物富集含有拴系有寡核苷酸的ddUTP的分子。除了PCR循环数量在本实验中为25之外,根据标准CollibriTM文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)反应条件,使用引物SEQ ID NO:17或SEQ ID NO:18,使经纯化的引物延伸产物经历索引化PCR,以引入与IlluminaTM仪器兼容的全长测序衔接子。索引化PCR后,使用CollibriTM文库清理试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)对文库进行纯化。根据标准CollibriTM文库定量试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)方案,通过qPCR确认所产生的样品中存在测序就绪分子。在Illumina MiSeqTM上使用MiSeq试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行双端测序(R1为100bp并且R2为75bp)。数据分析揭示,与人基因组的比对率为83%,链特异性为91.1%,并且基因体覆盖偏向5'端(图29)。
E.无PCR的测序就绪文库制备
只要整合到测序平台中的聚合酶能够通读缀合接头,就可以由DNA样品和RNA样品两者制备无PCR的测序就绪文库。使用具有对应于全长衔接子的5'锚的引物进行的一步引物延伸和通过掺入带有第二全长平台特异性衔接子序列的拴系有寡核苷酸的双脱氧核苷酸进行的终止使得能够产生测序就绪单链文库,所述测序就绪单链文库可以在没有扩增步骤的情况下经历测序。这提供了需要较少文库制备步骤的优点。当使用RNA样品时,此种策略提供了另外的优点,因为仅需要合成第一链cDNA即可实现在5'端和3'端处包括衔接子的测序就绪单链DNA。
使用通用人参考RNA(赛默飞世尔科技公司)作为输入来进行以下实验(图35A中提供了对应的方案)。使用包括全长Illumina P5衔接子(SEQ ID NO:34的1-57个核苷酸)的逆转录引物(SEQ ID NO:34)对500ng RNA进行逆转录。
SEQ ID NO:34:
5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCT
CTTCCGATCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-3'
将RNA与50pmol逆转录引物、20pmol dNTP混合物、2pmol拴系有寡核苷酸的ddCTP(SEQ ID NO:35)、200U Superscript IV逆转录酶混合在补充有5mM DTT的1X SuperscriptIV RT缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)中;反应体积为20μL。在50℃下进行反应持续30分钟,然后在80℃下失活持续10分钟。
SEQ ID NO:35:
ddCTP-AldU-AGATCGGAAGAGCACACGTCTGAACTCCAGTCACATGCCTAAATCTCGTATGCCGTCTTCTGCTTG-3'-生物素
灭活后,将RNA酶H(美国马萨诸塞州的赛默飞世尔科技公司)添加到反应混合物中以从RNA:cDNA双链体中降解出RNA链。将与RNA酶H的反应在37℃下温育20分钟。根据制造商针对核酸固定化的说明,通过用DynabeadsTM M-270链霉亲和素磁珠(美国马萨诸塞州的赛默飞世尔科技公司)对用拴系有寡核苷酸的双脱氧核苷酸标记的cDNA进行纯化。使用MiSeq纳米试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)使经纯化的cDNA片段直接在Illumina MiSeq仪器上经历测序(有利地,不需要NaOH变性步骤,因为片段文库已经呈ssDNA形式);进行25bp R1和100bp R2双端测序。数据分析揭示,存在结构正确的读段(即,R2从与拴系有寡核苷酸的双脱氧核苷酸内的AldU修饰相对应的AG核苷酸以及ddCTP掺入位点开始,图35B)。93%的此类读段对应于蛋白质编码基因并覆盖了转录物的3'端,如实验设计所预期的(图35C)。
类似的原理可以用于由DNA样品中制备无PCR文库。可以将全长衔接子手柄添加到可以通过能够掺入拴系有寡核苷酸的双脱氧核苷酸的DNA聚合酶进行延伸的任何随机引物或序列特异性引物的5'区。作为实例,可以使用Thermo Sequenase或Phusion exo-DNA聚合酶。
F.DNA线性扩增和测序就绪文库制备
线性DNA扩增是通过使用从T7启动子SEQ ID NO:5开始特异性地启动RNA合成的T7RNA聚合酶的体外转录进行的。通过掺入拴系有寡核苷酸的核苷酸来实现用T7启动子序列进行DNA加标签,所述拴系有寡核苷酸的核苷酸包含此种序列。
从拴系有寡核苷酸的核苷酸(SEQ ID NO:22)进行体外转录,以测试此类复合物充当RNA合成的起始位点的能力。将SEQ ID NO:22拴系有寡核苷酸脱氧核苷酸通过SEQ IDNO:24寡核苷酸的延伸掺入寡核苷酸双链体SEQ ID NO:24+SEQ ID NO:25中。
SEQ ID NO:24:5'-TGCAGACATGGGTAGGCATCCTTGGCGTA-3'
SEQ ID NO:25:5'-GTACGCCAAGGATGCCTACCCATGTCTGCA-3'
然后添加互补链(SEQ ID NO:26)以确保T7 RNA聚合酶启动子是双链的。
SEQ ID NO:26:5'-CTAATACGACTCACTATAGGTGTTACATCTGOTAGTCAGTCTCCAATAAATATATAAA-3'
根据建议的TranscriptAidTM T7高产率转录试剂盒(美国马萨诸塞州的赛默飞世尔科技公司)反应条件进行体外转录,在37℃下进行温育过夜。然后用DNA酶I对转录产物进行处理以去除模板,并使用Agencourt AMPureXPTM磁珠(美国加你福尼亚州贝克曼库尔特公司(Beckman Coulter,CA,USA))对RNA进行纯化。使用RNA Pico 6000试剂盒在安捷伦2100生物分析仪上对所产生的转录物进行分析。结果指示,存在RNA转录物(图30)。结果指示,拴系有寡核苷酸的核苷酸中所包含的T7启动子序列是功能性的并且可以充当体外转录起始位点,并且T7 RNA聚合酶能够通读拴系有寡核苷酸的核苷酸的非天然接头。
实例5.DNA端标记
A.核酸的5'端的加标签
在一些实施例中,寡核苷酸可以与抗反向帽类似物(ARCA)或类似结构连接(图34)。在这种情况下,寡核苷酸通过其3'端与核苷酸缀合。此类拴系有寡核苷酸的加帽核苷酸在其通过体外转录从头合成期间可用于对核酸的5'端进行加标签。拴系有寡核苷酸的加帽核苷酸可以通过如T7 RNA聚合酶、T3 RNA聚合酶等RNA聚合酶或此类聚合酶的工程化突变型变体掺入RNA、DNA或嵌合体转录物中。
在某些情形下,寡核苷酸在5'端提供预先设计的引发位点用于后续的扩增。可以通过用拴系有寡核苷酸的核苷酸加标签、使用TdT、PAP或PUP添加均聚的尾或连接单链衔接子在3'端处添加另外的引发位点。
B.非模板依赖性DNA端标记
可以通过由末端脱氧核苷酸转移酶(TdT)掺入拴系有寡核苷酸的双脱氧核苷酸(OTDDN)实现用任何预先设计的序列进行非模板依赖性DNA 3'端标记。在第一轮标记之后,在通过任何能够通读缀合接头的聚合酶从与双脱氧核苷酸缀合的寡核苷酸进行引物延伸后,互补链可以合成。然后,可以进行第二轮DNA端标记,因为新合成的链将具有可接近的3'端。
使用以下序列的模板寡核苷酸(SEQ ID NO:36)进行实验:
SEQ ID NO:36:
磷酸-5'-GCGGCGACCAAATCGTTGTAAAGATCGGAAGAGCGTCGTGTA-3'
使用2pmol模板寡核苷酸(SEQ ID NO:36)、100pmol SEQ ID NO:4的拴系有寡核苷酸的核苷酸、40U含TdT酶(美国马萨诸塞州的赛默飞世尔科技公司)的1X TdT缓冲液进行第一次3'端标记;并且反应体积为30μL。将反应混合物在37℃下温育1.5小时,然后在70℃下终止反应10分钟。通过乙醇沉淀纯化带标签的模板寡核苷酸,并将其用于第二链合成。将经纯化的DNA与30U Phusion exo-DNA聚合酶(美国马萨诸塞州的赛默飞世尔科技公司)、与拴系有寡核苷酸的双脱氧核苷酸互补的4pmol经标记的引物(SEQ ID NO:37)和16pmol未经标记的引物(SEQ ID NO:38)和0.2mM dNTP混合物混合在Phusion GC缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)中。
SEQ ID NO:37:Cy5-5'-CAGACGTGTGCTCTTCCGATCT-3'
SEQ ID NO:38:5'-CAGACGTGTGCTCTTCCGATCT-3'
使用以下循环条件将反应混合物在热循环仪中温育:在98℃下进行20个变性循环持续1分钟,在60℃下退火持续1分钟,并在72℃下延伸持续1分钟。将反应产物通过乙醇沉淀纯化或用Exo I(美国马萨诸塞州的赛默飞世尔科技公司)在37℃下处理30分钟。用λ核酸外切酶(美国马萨诸塞州的赛默飞世尔科技公司)对一部分样品进行处理(图36B)持续2分钟、10分钟或30分钟。通过在80℃下加热10分钟来使λ核酸外切酶失活。使用Zeba旋转脱盐柱,7K A1WCO(美国马萨诸塞州的赛默飞世尔科技公司)将游离核苷酸去除,并通过乙醇沉淀对样品进行纯化。
λ核酸外切酶处理去除了模板链,仅留下第二链用于后续的标记。在没有进行λ核酸外切酶处理的情况下,使双链双链体经历第二轮标记(图36A)。将第一标记反应的产物与100pmol拴系有寡核苷酸的双脱氧核苷酸SEQ ID NO:4和30U含TdT酶的1X TdT缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)混合;反应体积为16μL。将反应混合物在37℃下温育1.5小时,然后在70℃下灭活10分钟。然后在15%TBE-尿素PAGE上对反应产物进行解析。
在所有情况下都可以看到双标记产物。由于ssDNA是更好的TdT底物,当在第二标记反应中使用单链的第二链作为模板时,标记更加有效(图36B)。
C.模板依赖性DNA端标记
在两个末端处产生由拴系有寡核苷酸的双脱氧核苷酸标记的多个DNA片段可以是模板依赖性的,并且所产生的片段可以用于制备测序就绪文库。
实验是根据图37A中所描绘的原理进行的。将大肠杆菌基因组DNA用作模板。将5ngDNA与20U Phusion exo-酶z(美国马萨诸塞州的赛默飞世尔科技公司)、12.5pmol特异性引物(SEQ ID NO:39)、0.4pmol拴系有寡核苷酸的双脱氧核苷酸SEQ ID NO:4、4nmol dNTP混合物混合在20μL 1X Phusion HF缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)中。
SEQ ID NO:39:5'-AAGTCGTAACAAGGTAACCG-3'
如下进行引物延伸和终止反应:在98℃下初次变性持续30秒,然后在98℃下进行15个变性循环持续1分钟,在45℃下退火持续30秒,在72℃下延伸持续3分钟;在72℃下进行最终延伸持续10分钟。使用Dynabeads清理珠(美国马萨诸塞州的赛默飞世尔科技公司)对反应产物进行纯化。通过引物延伸和终止从第一拴系有寡核苷酸的双脱氧核苷酸区对经纯化的DNA进行第二轮标记。将纯化产物与20U Phusion exo-(美国马萨诸塞州的赛默飞世尔科技公司)、10pmol引物SEQ ID NO:18、10pmol拴系有寡核苷酸的双脱氧核苷酸SEQ ID NO:6、10nmol dNTP混合物混合在50μL IX Phusion HF缓冲液(美国马萨诸塞州的赛默飞世尔科技公司)中。除引物退火步骤是在60℃下进行的以外,反应条件与先前的反应相同。使用Dynabeads清理珠(美国马萨诸塞州的赛默飞世尔科技公司)对反应产物进行纯化。通过在1X Collibri文库扩增主混合物(美国马萨诸塞州的赛默飞世尔科技公司)中用50pmol引物SEQ ID NO:17和50pmol引物SEQ ID NO:19进行扩增而富集带双重标签的DNA片段。循环条件如下:在98℃下初次变性持续30秒,然后在98℃下进行25个变性循环持续10秒,在60℃下退火持续30秒,在72℃下延伸持续30秒,在72℃下进行最终延伸持续1分钟。使用Dynabeads清理珠(美国马萨诸塞州的赛默飞世尔科技公司)对反应产物进行纯化。在Illumina MiSeq仪器上使用MiSeq试剂盒v2,300个循环(美国加利福尼亚州依诺米那公司)对所产生的文库进行测序;进行2×150bp双端测序。数据分析揭示,存在结构正确的读段,即,所述读段在R1中的第9位处具有A核苷酸并且在R2中的第一位处具有A核苷酸(图37A-37B)。将那些读段与大肠杆菌基因组进行比对。
上文所描述的原理可以用能够掺入拴系有寡核苷酸的双脱氧核苷酸并通读缀合接头的DNA聚合酶的任何组合,包含但不限于与Thermo Sequenase的组合来实现。可以对在每个标记步骤处使用的OTDDN量进行修改,从而对可获得的DNA片段大小进行调节。
实例6.用于产生核酸文库以进行单个细胞分析的改进的工作流。
在一些实施例中,可以在组合条形码编码反应中使用一个或多个拴系有寡核苷酸的双脱氧核苷酸(OTddNTP),例如以促进用细胞或细胞核进行的单个细胞分析工作流有所改进。在一些实施例中,可以将OTddNTP掺入如全转录组分析、全基因组分析、定向mRNA分析、短RNA(例如,miRNA)分析、单个细胞蛋白质分析等单个细胞工作流中。仅举例来说,本文提供了用于分析细胞群内的单个细胞的转录组的工作流(参见图38)。在一些实施例中,所述方法可以包含用于固定和透化细胞群内的细胞的步骤,使得细胞内的核酸和蛋白质保持完整并固定在所述核酸和所述蛋白质的起源细胞内。同时,透化步骤的作用是使试剂(例如,聚合酶、核苷酸、引物等)能够进入细胞,其中所述试剂可以在例如逆转录、引物延伸、连接扩增反应等中起作用。固定和透化细胞的许多方法是本领域已知的。举例来说,可用于本文所公开的实施例中的用于固定和透化细胞的方法包含但不限于Rosenberg等人(2018)《科学》(360)176-182、补充材料、美国专利申请公开号U.S.2016/0138086和国际专利申请公开号WO 2014/060843中所描述的那些方法。
在一些实施例中,改进的组合条形码编码可以包含将经固定/经透化的细胞分成多于一个第一部分(例如,96个、384个或任何其它数量的部分)的步骤。可以使每个第一部分与第一延伸引物接触。第一延伸引物可以包含第一通用手柄序列。如本文所用,术语“通用序列”是指存在于所有引物中的序列。因此,存在于第一延伸引物中的术语“第一通用手柄序列”是指存在于所有第一延伸引物中的手柄序列。
第一(例如,正向)延伸引物可以包含第一条形码序列。除第一条形码之外,引物还可以包含能够随机引发到所关注多核苷酸的3'序列(例如,随机引物、poly(T)序列(例如,T的30聚体))或靶特异性序列。在一些实施例中,第一引物是逆转录引物,包含包括第一条形码和3'poly(T)的引物和包括第一条形码和随机引物序列的引物的组合。在一些实施例中,逆转录引物可以在5'端包含通用手柄。在一些实施例中,逆转录引物可以包含唯一分子标签。
在一些实施例中,逆转录引物包含如本文所描述的拴系有寡核苷酸的核苷酸。
除了逆转录引物之外,经固定/经透化的细胞可以在允许逆转录发生的条件下与逆转录酶、dNTP和一个或多个拴系有寡核苷酸的ddNTP接触。拴系有寡核苷酸的ddNTP可以沿着cDNA随机地并入第一链cDNA合成步骤中,使得cDNA的终止点对于每个mRNA信息来说是随机的。因此,如果随后对cDNA进行扩增,则可以使用随机终止点来确定哪些扩增产物源自单个mRNA/cDNA。
在一些实施例中,拴系到ddNTP的寡核苷酸在3'端处包含通用手柄。在一些实施例中,可以随后使细胞与一种或多种能够结合(例如,通过互补核苷酸序列)并抑制未结合的逆转录引物的结合和/或延伸的阻断性寡核苷酸接触。在一些实施例中,细胞随后不与一种或多种阻断性寡核苷酸接触。
在逆转录反应之后,可以将经固定/经透化的细胞的部分汇集并再次分成多于一个部分(例如,96个、384个或任何其它数量的部分)用于第二轮条形码添加。
实例7.OTDDN工作流对SPLiT-seq工作流的比较。SPLiT-seq工作流是用于使用交联、模板转换、通过连接掺入条形码和Nextera片段化的单个细胞或细胞核转录组分析的众所周知的方法,如图39中所总结的(参见Rosenberg等人,《科学》360,176—182(2018))。Rosenberg等人中所公开的方案可能需要10个小时以上来制备用于核酸测序和转录组分析的核苷酸文库。此外,通过聚合添加条形码(OTDDN上存在的3'oligo的延伸)比使用T4 DNA连接酶将条形码添加到cDNA和DNA序列上更加有效,如Rosenberg等人中所描述的协议。因此,与Rosenberg方案相比,本文所描述的工作流减少了所需的时间量和操纵量,并提供了显著提高灵敏度的潜力。拴系有寡核苷酸的双脱氧核苷酸工作流(OTDDN工作流,如实例6和图40中所描述的工作流)可以避免多个工作流步骤(例如模板转换步骤和Nextera片段化步骤),以将工作流时间显著减少至大约4.5小时。因此,与传统的SPLiT-seq方案所需的10小时以上相比,OTDDN组合条形码编码可以显著减少工作流时间。
在这种OTDDN工作流中,第一个S7-ME-RT条形码-T30引物可以与mRNA的polyA尾结合并允许逆转录(RT)。S7序列充当用于在扩增期间添加衔接子的手柄,并且嵌合端(ME)序列用于在Illumina平台上进行测序。进一步,在图40的代表性方法中,添加了特定于Illumina测序方法的衔接子(P7、P5、索引7和索引5)以允许进行Illumina测序。然而,本发明方法不需要添加特异性Illumina衔接子,并且所述方法对于任何测序平台来说都是灵活的。
实例8.用唯一条形码进行拆分和汇集方法
可以用多种方法,如通过流式细胞术或液滴方法进行分离在文库制备中实现单个细胞分辨率。本文所公开的组合物和方法提供了经改进的组合条形码编码方法以产生单个细胞分辨率,其中对来自样品的细胞或细胞核进行多次拆分、条形码编码和汇集。以此方式,来自给定单个细胞的样品可以基于通过多轮拆分、条形码编码和汇集引入不同的条形码来接收多个条形码。与同一原始样品中的其它单个细胞相比,此过程导致来自单个细胞的样品具有唯一的一组多个条形码(即,条形码的组合)。
本发明的拆分-汇集方法的强大之处在于,条形码可直接随着可用条形码的数量进行缩放。拆分汇集还允许批量处理细胞,并且可以进行如本文所描述的多路复用。
实例9.单个细胞或细胞核分辨率的代表性的基于OTDDN的组合条形码编码工作流
此实例描述了使用基于OTDDN的组合条形码编码来制备NGS就绪核酸文库以用于来自HEK293细胞、NI1T-3T3细胞、诱导性多能干细胞(iPSC)和外周血单核细胞(PBMC)的单个细胞分析的实验。
步骤1-细胞制备。通过在存在RNA酶抑制剂的情况下将细胞与1%或2.5%多聚甲醛/1%TrixtonX 100一起温育30分钟来固定1TEK-293、NIH-3T3、iPSC或PBMC。将细胞稀释至大约5-10×105个细胞/mL,并用FlowmiTM 40μm细胞滤网过滤到含有1%Triton X100和200U或RNA酶抑制剂kkkkfjf的细胞稀释缓冲液中。使用II细胞计数器一式两份地对细胞进行计数(15μL细胞+15μL台盼蓝染料0.4%)。如果细胞密度大于1×106个细胞/mL,则将细胞稀释至约5×105个,并且然后过滤。
步骤2:逆转录(RT)。如表3中所描述的在冰/冰冷的块上制备RT主混合物(RTmaster mix)。
表3:RT主混合物
将RT主混合物以每孔20μL等分到96孔红色MicroAmp EnduraPlate中。将EnduraPlate的每个孔都预装载50皮摩尔的第一延伸引物。第一延伸引物包含唯一条形码(即孔特定条形码)和通用第1手柄序列。将板密封、短暂涡旋并离心以收集液体。存在与RT主混合物中的OTDDN的oligo部分含有第2通用手柄序列。
在50℃下进行逆转录持续30分钟,然后保持在4℃下。
步骤3-拴系有Oligo的延伸将来自步骤2的RT反应组合/汇集到干净的预先冷却的25-mL储存器中,充分混合,并转移到2×l.5ml Eppendorf管中。将管以800x g离心3分钟,之后去除上清液。
将每个管的内容物用含有1X SSIV缓冲液和1%Triton X100的1mL洗涤缓冲液重新悬浮并通过移液混合。将样品以800x g离心3分钟,然后去除上清液。重复洗涤总共两次。
将每个管的内容物用1mL RT洗涤缓冲液重新悬浮并通过移液混合。使用FlowmiTM40μm细胞滤网将细胞过滤到单个预先冷却的25mL储存器中。将表5中列出的Oligo延伸主混合物添加导经过滤的细胞混合物中并通过移液充分混合。
表5:Oligo延伸主混合物:
组分 | 体积 |
5x RT缓冲液 | 120μL |
100mM DTT | 120μL |
10mM dNTP混合物 | 120μL |
SSIV RT | 120μL |
将含20μL经汇集细胞的引物延伸主混合物添加到96孔蓝色MicroAmpEnduraPlate的每个孔中,所述每个孔都预装载有50皮摩尔的含有与第二通用手柄序列互补的区、唯一条形码(即,孔特定条形码)和通用第3手柄序列的夹板寡核苷酸。在50℃下进行跨夹板的Oligo延伸持续20分钟,然后保持在4℃下。
步骤4:细胞裂解。将2X裂解缓冲液预温热到37℃持续至少10分钟。通过将2μL0.5MEDTA添加到每个孔并充分混合来停止延伸反应。将细胞汇集在预先冷却的储存器中,充分混合,并然后转移到两个1.5mL Eppendorf管中。通过以800x g离心3分钟使细胞沉淀,然后去除上清液。将细胞沉淀物重新悬浮在含有1%Triton X100的1mL细胞洗涤缓冲液中并通过移液混合。重复细胞洗涤,并将沉淀物组合在700μL细胞洗涤缓冲液中。将样品混合并通过FlowmiTM 40μm细胞滤网过滤到新的1.5-mL管中。将25μL经过滤的细胞等分到含有l00μg蛋白酶K和25μL 2X裂解缓冲液的96孔板中的每个孔中。
步骤5:用AmpureTM珠(一种类型的SPRI珠)对经延伸的引物进行纯化。将Ampure珠置于室温并彻底混合。对于每个反应,将45μL珠移液到每个孔中,并根据制造商的方案进行纯化。将珠用25μL低TE缓冲液重新悬浮并在室温下温育2分钟,放置回到磁架中。采集上清液用于文库扩增。
步骤6:文库的扩增。将补充有20U PfusionTM exo-聚合酶的25μL CollibriTM文库扩增主混合物(马萨诸塞州沃尔瑟姆赛默飞世尔科技公司)等分到96孔板的每个孔中。将24μL LTE洗脱的cDNA添加到含有PCR主混合物的每个孔中。将1μL 50pM经条形码编码的PCR引物添加到每个孔中。经过条形码编码的PCR引物包含在5'端处具有测序衔接子和与第1手柄序列相匹配的序列的正向引物以及在5'到3'方向上包含测序衔接子、唯一(孔特异性)条形码和与第3手柄序列相匹配的序列的反向PCR引物。如表8中所描述的进行PCR。表8:PCR扩增方案
步骤7:文库纯化。将40μL AmpureTM珠移液到每个孔中,并且根据制造商的方案对反应混合物进行纯化,并洗脱到最终体积为28μL LTE中。
步骤8:文库扩增和定量。如果所产生的文库产率如生物分析仪所测量的超过2nM(250-550个碱基对),就跳过文库扩增,并使所述方法直接移动到测序。
如表9中所描述的制备文库扩增主混合物。表9:文库扩增主混合物的组分
组分 | 1RXN | 24Rxn |
5x HiFi扩增混合物 | 8μL | 208 |
10X文库扩增引物 | 4μL | 104 |
将12μL主混合物从上等分到每个孔文库孔中(经洗脱的文库不需要转移到新的孔中进行循环)。使用表10中所描述的程序进行扩增。
表10:扩增方案
步骤9:文库纯化。将Ampure珠置于室温并彻底混合。对于每个反应,将32μL珠移液到每个孔中,并根据制造商的说明进行纯化,并洗脱到25μL低TE缓冲液中。在生物分析仪上对产率和文库谱进行评估。
此时,文库已准备好进行测序,这可以通过多种测序方法进行。在cDNA扩增期间添加的衔接子可能对测序平台具有特异性。
图43A和43B示出了在第一次扩增(分别为1.2nM和350个碱基对)和第二次扩增(45nM和350-400个碱基对)之后按照上述方案由iPSC制备的核酸文库的如通过生物分析仪确定的平均产率和平均大小。
图44示出了按照上述方案由PBMC制备的核酸文库的平均产率和平均大小。
图45示出了也用主混合物和经干燥的板对PBMC进行了测试。在第二次PCR扩增后,其中所有反应都进行了扩增,产物大小和形状似乎是正确。为了测试本文所描述的OTDDN组合条形码编码方法的单个细胞分辨率,将由NIH-3T3小鼠细胞和HEK-293人细胞制备的核酸文库混合并根据制造商的说明在Illumina MiSeqTM上进行分析。经映射的读段按条形码排序并按物种绘制。如图45中所示出的,X轴上的条形码是人序列的读段(人读段),而Y轴上的条形码是小鼠序列的读段(小鼠读段)。因此,轴上的条形码可以是单个细胞,而轴外的任何条形码归因于共享相同条形码的2个或更多个细胞。
来自图45的数据指示,非单个细胞率在1,000个细胞时为大约0.5%。这些值有利于其它方法所要求的非单个细胞率,如10X要求的在1,000个细胞时为0.9%和BD要求的在1,000个细胞时为0.6%。
还使用经组合的PBMC和iPSC样品示出了单个细胞分辨率。表14中示出的结果示出了两种细胞类型之间的转录物之间几乎没有重叠,并且来自每种细胞类型的数据示出了存在已知在那些细胞中进行表达的转录物。
表14:来自经组合的PBMC和iPSC样品的结果
转录物 | PBMC | iPSC |
POU5F1(OCT4) | 0 | 318 |
NANOG | 2 | 34 |
SOX2 | 0 | 66 |
LIN28A | 2 | 1502 |
CD4 | 3591 | 241 |
CD44 | 4320 | 0 |
实例14.实施例
以下是本文所描述的不同实施例的代表性项目的列表。
项目1.一种式(I)的拴系有寡核苷酸的核苷酸:
或其盐,
其中X是H、N3或OH;
NB表示选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷的核碱基;
Z和Y是接头,其中Z和Y各自独立包括选自以下的至少一个连接部分:氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯和其任何组合;
Click是点击反应的产物;并且
Oligo是长度为3到100个核苷酸的寡核苷酸。
项目2.根据项目1所述的拴系有寡核苷酸的核苷酸,其中Click是以下官能团对中的一个官能团对之间的点击反应的产物:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
项目3.一种式(II)的拴系有寡核苷酸的核苷酸:
或其盐,
其中X是H、OH、N3;
NB表示选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷的核碱基;
Z和Y是接头,其中Z和Y各自独立地包括选自以下的至少一个连接部分:
氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺、脲、氨基甲酸酯和其任何组合;并且Oligo是长度为3到100个核苷酸的寡核苷酸。
项目4.根据项目1到3中任一项所述的拴系有寡核苷酸的核苷酸,其中X是OH。
项目5.根据项目1到3中任一项所述的拴系有寡核苷酸的核苷酸,其中X是H。
项目6.根据项目1到5中任一项所述的拴系有寡核苷酸的核苷酸,其中所述亚烷基是C1-C6亚烷基。
项目7.根据项目1到6中任一项所述的拴系有寡核苷酸的核苷酸,其中所述亚烯基是C2-C6亚烯基。
项目8.根据项目1到7中任一项所述的拴系有寡核苷酸的核苷酸,其中所述亚炔基是C2-C6亚炔基。
项目9.根据项目1到8中任一项所述的拴系有寡核苷酸的核苷酸,其中所述聚亚烷基二醇具有2到8个乙二醇单元。
项目10.根据项目1到9中任一项所述的拴系有寡核苷酸的核苷酸,其中所述寡核苷酸在其5'端处拴系到所述核苷酸。
项目11.根据项目1到9中任一项所述的拴系有寡核苷酸的核苷酸,其中Z和Y中的一个与三唑环的第1位共价结合,并且Z和Y中的另一个与所述三唑环的第4位共价结合。
项目12.根据项目11所述的拴系有寡核苷酸的核苷酸,其中Z与所述三唑环的第1位共价结合,并且Y与所述三唑环的第1位共价结合。
项目13.根据项目11所述的拴系有寡核苷酸的核苷酸,其中Z与所述三唑环的第4位共价结合,并且Y与所述三唑环的第1位共价结合。
项目14.根据项目11所述的拴系有寡核苷酸的核苷酸,所述拴系有寡核苷酸的核苷酸具有式(III)
或其盐,其中
L1是包括亚烷基、聚亚烷基二醇或其组合的接头,并且
L2是包括亚炔基的接头。
项目15.根据项目14所述的拴系有寡核苷酸的核苷酸,其中L1包括具有2个、4个或6个亚烯基二醇基团的聚亚烯基二醇。
项目16.根据项目14或15所述的拴系有寡核苷酸的核苷酸,其中所述聚亚烯基二醇是聚乙二醇。
项目17.根据项目14所述的拴系有寡核苷酸的核苷酸,其中L1包括具有1到12个碳原子的亚烷基。
项目18.根据项目17所述的拴系有寡核苷酸的核苷酸,其中所述亚烷基是亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基或亚己基。
项目19.根据项目14所述的寡核苷酸,其中L2是己炔基。
项目20.根据项目1到19中任一项所述的拴系有寡核苷酸的核苷酸,其中所述核碱基是嘧啶,并且其中所述嘧啶在所述核碱基的第5位处拴系到所述寡核苷酸。
项目21.根据项目1到19中任一项所述的拴系有寡核苷酸的核苷酸,其中所述核碱基是嘌呤,并且其中所述嘌呤在所述核碱基的第7位处拴系到所述寡核苷酸。
项目22.根据项目1到21中任一项所述的拴系有寡核苷酸的核苷酸,其中所述盐是季铵盐。
项目23.根据项目1到22中任一项所述的拴系有寡核苷酸的核苷酸,其中所述寡核苷酸包括条形码序列、衔接子序列、唯一分子标识符或其任何组合。
项目24.一种用于使用寡核苷酸对核酸进行加标签的方法,所述方法包括:
提供要加标签的所述核酸;
使所述核酸与至少一个根据项目1到23中任一项所述的拴系有寡核苷酸的核苷酸、至少一个核苷酸和聚合酶接触,由此产生带标签的核酸。
项目25.根据项目24所述的方法,其进一步包括使引物退火到所述核酸。
项目26.根据项目24或25所述的方法,其中所述核酸在5'端、3'端或两者处进行加标签。
项目27.根据项目26所述的方法,其中所述核酸在多个位置处进行加标签。
项目28.根据项目24到27中任一项所述的方法,其中在切口平移或缺口填补反应期间用所述拴系有寡核苷酸的寡核苷酸对所述核酸进行加标签。
项目29.根据项目24到28中任一项所述的方法,其进一步包括将衔接子序列连接到所述核酸的所述3'端。
项目30.根据项目24到29中任一项所述的方法,其进一步包括使所述带标签的核酸经历PCR。
项目31.根据项目24到31中任一项所述的方法,其中所述核酸是DNA或RNA。
项目32.根据项目24到31中任一项所述的方法,其中所述聚合酶是A型DNA聚合酶、B型DNA聚合酶、X型DNA聚合酶或逆转录酶。
项目33.根据项目24到32中任一项所述的方法,其中所述聚合酶是Taq DNA聚合酶、DNA聚合酶、Deep VentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTMIV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
项目34.根据项目24到32中任一项所述的方法,其中所述聚合酶是TdT。
项目35.根据项目24到34中任一项所述的方法,其中所述核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
项目36.根据项目24到35中任一项所述的方法,其中步骤c中的所述拴系有寡核苷酸的核苷酸的浓度的范围为1fmol到10nmol。
项目37.根据项目24到36中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸与对应的天然核苷酸的摩尔比的范围为1:1到1:1000。
项目38.根据项目24到37中任一项所述的方法,其进一步包括进行至少一个清理步骤。
项目39.一种用于由多核苷酸样品产生核酸文库的方法,所述方法包括:
任选地使所述多核苷酸样品片段化以产生多个多核苷酸片段;
使第一引物退火到所述多核苷酸片段;
使所述多个多核苷酸片段与核酸聚合酶、至少一个核苷酸和拴系有寡核苷酸的寡核苷酸接触以形成包括所述拴系有寡核苷酸的核苷酸的核酸链;
使第二引物退火到所拴系寡核苷酸以形成第二经退火的复合物;以及
使所述第二经退火的复合物与所述核酸聚合酶接触以由所述所拴系寡核苷酸产生核酸分子。
项目40.根据项目39所述的方法,其中所述拴系有寡核苷酸的核苷酸是根据项目1到23中任一项所述的拴系有寡核苷酸的核苷酸。
项目41.根据项目39或40所述的方法,其中所述第二引物包括衔接子序列、条形码序列或两者。
项目42.根据项目39到41中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸进一步包括亲和标签。
项目43.根据项目39到42中任一项所述的方法,其中所述第二引物与所述所拴系寡核苷酸至少部分互补。
项目44.根据项目39到43中任一项所述的方法,其中所述第一引物、所述第二引物或两者包括通用序列。
项目45.根据项目39到44中任一项所述的方法,其中所述所拴系寡核苷酸包括衔接子序列、T7启动子序列、条形码、通用分子标识符或其任何组合。
项目46.根据项目39到45中任一项所述的方法,其中所述聚合酶是A型DNA聚合酶、B型DNA聚合酶、X型DNA聚合酶或逆转录酶。
项目47.根据项目39到46中任一项所述的方法,其中所述聚合酶选自Taq DNA聚合酶、DNA聚合酶、Deep VentTMDNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTMIV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
项目48.根据项目39到47中任一项所述的方法,其中所述核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
项目49.根据项目39到48中任一项所述的方法,其进一步包括扩增所述文库。
项目50.根据项目39到41中任一项所述的方法,其中步骤(a)中的所述拴系有寡核苷酸的核苷酸的浓度的范围为1fmol到10μmol。
项目51.根据项目39到50中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸与对应的天然核苷酸的摩尔比的范围为1:1到1:1000。
项目52.根据项目39到51中任一项所述的方法,其进一步包括在步骤(c)之后进行至少一个清理步骤。
项目53.根据项目39到52中任一项所述的方法,其中所述核酸是DNA。
项目54.根据项目39到53中任一项所述的方法,其中所述核酸是RNA。
项目55.根据项目54所述的方法,其进一步包括对所述RNA进行逆转录以产生对应的cDNA。
项目56.一种用于制备根据项目1到23中任一项所述的拴系有寡核苷酸的核苷酸的方法,所述方法包括:
提供与第一官能团共价结合的核苷酸,所述第一官能团能与第二官能团进行点击反应;
提供与所述第二官能团共价结合的寡核苷酸,所述第二官能团能进行点击反应以形成三唑环;
使所述核苷酸与所述寡核苷酸接触以形成点击反应产物,其中所述第一官能团和所述第二官能团分别选自:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
项目57.根据项目56所述的方法,其中所述第一官能团和所述第二官能团分别选自:i)炔基和叠氮基;和ii)叠氮基和炔基。
项目58.根据项目57所述的方法,其中步骤(c)包括在存在铜催化剂和铜(I)配体的情况下使所述核苷酸与所述寡核苷酸接触以形成1,2,3-三唑。
项目59.根据项目56到58中任一项所述的方法,其中所述核苷酸是脱氧核苷酸或双脱氧核苷酸。
项目60.根据项目58或59中任一项所述的方法,其中所述铜催化剂包括铜(I)或铜(II),其中当所述催化剂是铜(II)时,存在还原剂。
项目61.根据项目58到60中任一项所述的方法,其中所述铜催化剂是Cu(NO3)2、Cu(OAc)、CuSCb或其任何组合。
项目62.根据项目60或61中任一项所述的方法,其中所述还原剂包括抗坏血酸盐、三(2-羧乙基)膦(TCEP)、2.4.6-三氯苯酚(TCP)、NADH、NADPH、硫代硫酸盐、金属铜、醌、对苯二酚、维生素K、谷胱甘肽、半胱氨酸、2-巯基乙醇、二硫苏糖醇、Fe(II)、Co(II)、施加的电位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W或其任何组合。
项目63.根据项目62所述的方法,其中所述还原剂包括抗坏血酸钠。
项目64.根据项目58到63中任一项所述的方法,其中所述配体包括三(苄基三唑基甲基)胺。
项目65.一种用于产生测序文库的试剂盒,所述试剂盒包括:
根据项目1到21中任一项所述的拴系有寡核苷酸的核苷酸;以及以下中的至少一个:
(i)A、C、G、U和T核苷酸;
(ii)聚合酶;
(iii)引物和/或衔接子序列;
(iv)缓冲液;或
(v)盐。
项目66.根据项目65所述的试剂盒,其中所述试剂盒包括A、C、G、U和T核苷酸。
项目67.根据项目65或66所述的试剂盒,其中所述试剂盒包括聚合酶。
项目68.根据项目67所述的试剂盒,其中所述聚合酶是野生型聚合酶、经过修饰的聚合酶、突变型聚合酶、工程化聚合酶或其组合。
项目69.根据项目65到68中任一项所述的试剂盒,其中所述聚合酶是Taq DNA聚合酶、DNA聚合酶、Deep VentTM DNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTMIV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
项目70.根据项目65到69中任一项所述的试剂盒,其中所述试剂盒包括一个或多个引物序列、衔接子序列、条形码序列或唯一分子标识符序列。
项目71.根据项目65到70中任一项所述的试剂盒,其中所述试剂盒包括至少一种缓冲液。
项目72.根据项目65到71中任一项所述的试剂盒,其中所述试剂盒包括至少一种盐。
项目73.一种制备核酸文库的方法,所述方法包括:使包括通用序列的第一引物退火到核酸样品;使所述核酸样品与核酸聚合酶、至少一个核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多条核酸链,所述多条核酸链包括终止所述链的所述拴系有寡核苷酸的双脱氧核苷酸;
使与所拴系寡核苷酸至少部分互补的第二引物退火;以及
允许所述聚合酶延伸所述第二经退火的引物,
由此产生包括以下的核苷酸文库:所述通用序列和在所述通用序列的端处的所拴系寡核苷酸序列。
实例15.另外的实施例
以下是本文所描述的不同实施例的另外的代表性实施例的列表。实施例可以根据以下编号的条款中的任一个编号的条款。
条款1.一种用于使用寡核苷酸对核酸进行加标签的方法,所述方法包括:
a.提供要加标签的所述核酸;
b.使所述核酸与聚合酶和至少一个式(A)的拴系有寡核苷酸的核苷酸:
或其盐
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代,由此产生第一带标签的核酸。
条款2.根据条款1所述的方法,其中所述接触包括使所述核酸与至少一个拴系有寡核苷酸的核苷酸、至少一个未拴系到寡核苷酸的核苷酸以及聚合酶接触。
条款3.根据条款1或2所述的方法,其进一步包括使引物退火到所述核酸。
条款4.根据条款1到3中任一项所述的方法,其中所述核酸在5'端、3'端或两者处进行加标签。
条款5.根据条款2到4中任一项所述的方法,其中所述核酸在多个位置处进行加标签。
条款6.根据条款1到5中任一项所述的方法,其中在切口平移或缺口填补反应期间用所述拴系有寡核苷酸的核苷酸对所述核酸进行加标签。
条款7.根据条款1到6中任一项所述的方法,其进一步包括将衔接子序列添加到所述核酸的所述3'端。
条款8.根据条款1到7中任一项的方法,其中所述核酸是双链核酸,并且所述方法进一步包括使所述带标签的核酸经历PCR。
条款9.根据条款1到8中任一项所述的方法,其中所述聚合酶是末端脱氧核苷酸转移酶。
条款10.根据条款1到9中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸是双脱氧核苷酸,任选地其中所述双脱氧核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
条款11.根据条款1到10中任一项所述的方法,其进一步包括执行至少一个清理步骤。
条款12.根据条款1到11中任一项所述的方法,其进一步包括:
a.在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的引物退火;以及
b.使所述第一带标签的核酸链和经退火的引物与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及
c.允许聚合酶从退火到所述所拴系寡核苷酸的所述引物上的3'羟基延伸以形成第二核酸链。
条款13.根据条款12所述的方法,其进一步包括在形成所述第二核酸链之后,使所述带标签的核酸链与核酸外切酶接触,其中所述第一核酸链被所述核酸外切酶降解。
条款14.根据条款12所述的方法,其进一步包括在形成所述第二核酸链之后,使所述带标签的核酸链与核酸外切酶接触,其中所述第一核酸链是链具有5'-磷酸,并且所述核酸外切酶是λ核酸外切酶。
条款15.根据条款12到14中任一项所述的方法,其进一步包括:
a.提供至少一条第二核酸链;
b.使所述第二核酸链与末端脱氧核苷酸转移酶和至少一个第二式(A)的拴系有寡核苷酸的核苷酸:
或其盐接触,
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代,由此产生在5'端和3'端处具有不同标签的带标签的核酸。
条款16.一种用于由包括一个或多个多核苷酸的样品产生核酸文库的方法,所述方法包括:
a.使第一引物退火到一个或多个多核苷酸;
b.使所述一个或多个多核苷酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和第一拴系有寡核苷酸的核苷酸接触以形成包括第一拴系有寡核苷酸的核苷酸的一条或多条第一核酸链;
c.使第二引物退火到所拴系寡核苷酸以形成第二经退火的复合物;以及
d.使所述第二经退火的复合物与所述核酸聚合酶和任选地至少一个未拴系到寡核苷酸的核苷酸接触以产生第二核酸链。
条款17.一种用于由包括一个或多个多核苷酸的样品产生核酸文库的方法,所述方法包括:
a.使第一引物退火到一个或多个多核苷酸;
b.使所述一个或多个多核苷酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和第一拴系有寡核苷酸的核苷酸接触以形成包括第一拴系有寡核苷酸的核苷酸的一条或多条第一核酸链;
c.使夹板寡核苷酸退火到所拴系寡核苷酸以形成第二经退火的复合物;以及
d.使所述第二经退火的复合物与所述核酸聚合酶和任选地至少一个未拴系到寡核苷酸的核苷酸接触以产生第二核酸链。
条款18.如条款16或17所述的方法,其中,所述一个或多个多核苷酸包括在使所述第一引物退火之前产生的多个多核苷酸片段。
条款19.根据条款16或18中任一项所述的方法,其中所述一个或多个多核苷酸包括mRNA。
条款20.根据条款16到19中任一项所述的方法,其中所述一个或多个多核苷酸包括拴系有寡核苷酸的结合剂(OTBA)。
条款21.根据条款16到20中任一项所述的方法,其中所述一个或多个多核苷酸包括mRNA和一种或多种OTBA的组合。
条款22.根据条款16到21中任一项所述的方法,其中在使所述第二经退火的复合物与所述核酸聚合酶接触之后,所述聚合酶从所述所拴系寡核苷酸的3'羟基跨所述夹板寡核苷酸延伸。
条款23.根据条款12到22中任一项所述的方法,其中所述引物包括通用序列、随机序列和/或靶特异性序列。
条款24.根据条款16到23中任一项所述的方法,其中所述第一拴系有寡核苷酸的核苷酸是拴系有寡核苷酸的双脱氧核苷酸,并且所述第一核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸。
条款25.根据条款16和18到23中任一项所述的方法,其中使所述第二经退火的复合物与所述核酸聚合酶接触是在存在至少一个未拴系到寡核苷酸的核苷酸和第二拴系有寡核苷酸的双脱氧核苷酸的情况下进行的,并且所述第二核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸。
条款26.根据条款16和18到24中任一项所述的方法,其中所述第一拴系有寡核苷酸的双脱氧核苷酸中的所拴系的寡核苷酸和所述第二拴系有寡核苷酸的双脱氧核苷酸中的所拴系的寡核苷酸是不同的。
条款27.一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞,所述方法包括:
a.使第一引物退火到所述一个或多个核酸;
b.使所述一个或多个核酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多条核酸链,所述多条核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;
c.使与所拴系寡核苷酸至少部分互补的第二引物退火;以及
d.允许所述聚合酶从退火到所述所拴系寡核苷酸的所述第二引物的3'羟基延伸,由此产生双链核酸文库。
条款28.一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞,所述方法包括:
a.使第一引物退火到所述一个或多个核酸;
b.使所述一个或多个核酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多条核酸链,所述多条核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;
c.使与所拴系寡核苷酸至少部分互补的夹板寡核苷酸退火;以及
d.允许所述聚合酶从所述所拴系寡核苷酸的3'羟基延伸,由此产生核酸文库。
条款29.如条款27或28所述的方法,其中,所述第一引物包括通用序列、随机序列和/或靶特异性序列。
条款30.根据条款27到29中任一项所述的方法,其中所述样品中的所述一个或多个核酸包括poly(A)mRNA。
条款31.根据条款27到29中任一项所述的方法,其中所述样品中的所述一个或多个核酸包括OTBA的所拴系寡核苷酸。
条款32.如条款31所述的方法,其中,所述OTBA的所述所拴系寡核苷酸包括细胞标志物结合剂索引。
条款33.根据条款27到29或32所述的方法,其中所述样品中的所述一个或多个核酸包括mRNA和OTBA。
条款34.根据条款27到32中任一项所述的方法,其中所述细胞标志物由所述样品中的一部分细胞表达。
条款35.如条款34所述的方法,其中,所述细胞标志物是细胞表面标志物。
条款36.根据条款20、21或31到35中任一项所述的方法,其中所述OTBA的所述结合剂包括适配体或抗体或其功能片段。
条款37.根据条款28到36中任一项所述的方法,其中包括一个或多个核酸的样品包括多于一种细胞或细胞核,其中所述细胞或细胞核或其亚群可以包括一个或多个细胞标志物,其中所述样品在使所述第一引物退火之前分成两个或更多个第一部分,并且其中每个第一部分包括原始样品的细胞或细胞核亚群。
条款38.根据37所述的方法,其中所述第一引物是第一延伸引物,所述第一延伸引物包括5'端上的第一通用手柄序列以及第一条形码,所述第一条形码在每个第一部分中的所述第一引物中是共用的,但与存在于其它第一部分中的所述延伸引物中的所述第一条形码有所不同;并且
并且其中所述拴系有寡核苷酸的双脱氧核苷酸的寡核苷酸包括通用手柄序列;并且
其中所述第一部分在能够使所述第一延伸引物延伸以形成包括所述拴系有寡核苷酸的双脱氧核苷酸的第一核酸延伸产物的条件下接触,并且其中所述第一核酸延伸产物的延伸以所述拴系有寡核苷酸的双脱氧核苷酸的掺入终止。
条款39.根据条款38所述的方法,其进一步包括:
a.在形成所述第一核延伸产物后将所述第一部分组合;
b.将经组合的第一部分分成两个或更多个第二部分;以及
c.使每个第二部分与聚合酶、至少一个不是拴系有寡核苷酸的核苷酸的核苷酸和夹板寡核苷酸接触,其中所述夹板寡核苷酸包括:
i.能够在延伸条件下退火到所述第一通用手柄的寡核苷酸序列;
ii.作为第二条形码的模板的序列,其中每个第二部分的第二条形码是共用的,但与其它第二部分的所述第二条形码有所不同;以及
iii.作为第三通用手柄的模板的序列,其中所述第一延伸产物的所拴系寡核苷酸的3'OH跨所述夹板寡核苷酸延伸以产生包括所述第二条形码序列和所述第三通用手柄序列的第二核酸延伸产物。
条款40.根据条款39所述的方法,其进一步包括:
a.将所述第二部分组合;
b.将经组合的第二部分分成两个或更多个第三部分;
c.使每个第三部分与扩增引物接触,其中所述扩增引物退火到所述第一通用手柄和所述第三通用手柄并从所述第一通用手柄和所述第三通用手柄跨所述第二延伸产物或其补体延伸,并且其中所述扩增引物任选地分别包括第三条形码和/或第四条形码并且分别包括第一衔接子序列和/或第二衔接子序列以产生所述核酸文库,其中所述第一条形码序列、所述第二条形码序列和所述第三条形码序列(或其补体)的组合对于源自单个细胞的扩增产物来说是唯一的。
条款41.根据条款16到40中任一项所述的方法,其中所述第一引物、所述第二引物、所述扩增引物或所述夹板寡核苷酸包括衔接子序列、条形码序列、唯一分子标识符、索引序列、启动子序列、通用手柄、通用序列、随机序列、靶特异性序列或其任何组合。
条款42.根据条款1到41中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸进一步包括亲和标签。
条款43.根据条款16、18到27或29到39中任一项所述的方法,其中所述第二引物与所述所拴系寡核苷酸至少部分互补。
条款44.根据条款16到43中任一项所述的方法,其中所述第一引物、所述第二引物或两者包括通用序列。
条款45.根据条款1到44中任一项所述的方法,其中所述所拴系寡核苷酸包括衔接子序列、T7启动子序列、条形码、通用分子标识符、通用手柄、通用序列、衔接子序列、随机序列、靶特异性序列、启动子序列、索引序列或其任何组合。
条款46.根据条款1到45中任一项的方法,其中所述聚合酶是A型DNA聚合酶、B型DNA聚合酶、X型DNA聚合酶或逆转录酶。
条款47.根据条款1到46中任一项所述的方法,其中所述聚合酶选自Taq DNA聚合酶、DNA聚合酶、Deep VentTM DNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTMIV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、ThermoSequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HS DNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、和HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
条款48.根据条款1到47中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸或其任何组合。
条款49.根据条款26到48中任一项所述的方法,其进一步包括扩增所述文库。
条款50.根据条款26到49中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸的浓度的范围为1fmol到10μmol。
条款51.根据条款26到50中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸与对应的未拴系到寡核苷酸的核苷酸的摩尔比的范围为1:1到1:1000。
条款52.根据条款26到51中任一项所述的方法,其进一步包括在形成一个或多个核酸延伸产物或核酸扩增产物之后进行至少一个清理步骤。
条款53.根据条款1到52中任一项所述的方法,其中所述核酸是DNA。
条款54.根据条款1到53中任一项所述的方法,其中所述核酸是RNA。
条款55.根据条款54所述的方法,其进一步包括在使第一引物退火之前或在产生多个多核苷酸片段之前对所述RNA进行逆转录以产生对应的cDNA。
条款56.根据条款26到55中任一项所述的方法,其进一步包括在使所述第一引物退火和/或拆分所述样品之前固定和透化所述细胞。
条款57.根据条款26到56中任一项所述的方法,其进一步包括在产生一个或多个延伸和/或扩增产物之后裂解所述细胞。
条款58.根据条款37到57中任一项所述的方法,其中在产生第一核酸延伸产物之后,所述第一部分或经组合的第一部分与阻断性寡核苷酸接触,其中所述阻断性寡核苷酸阻止第一延伸引物与细胞核酸杂交。
条款59.根据条款37到58中任一项所述的方法,进一步包括以下步骤:在产生所述第二核酸延伸产物之后和在使所述第三部分与第二延伸引物接触之前将所述夹板寡核苷酸去除。
条款60.根据条款37到59中任一项所述的方法,其中所述夹板寡核苷酸包括结合部分,所述方法包括以下步骤:使所述第二部分或经组合的第二部分与包括同源捕获部分的化合物接触。
条款61.根据条款60所述的方法,其中所述结合部分和所述同源捕获部分是选自以下的结合对:链霉亲和素和生物素的结合对、麦芽糖和麦芽糖结合蛋白的结合对、谷胱甘肽和谷胱甘肽S-转移酶的结合对、几丁质和几丁质结合蛋白的结合对或适配体和其抗原的结合对。
条款62.如条款60或61所述的方法,其中,所述同源捕获部分固定在固体支持物上。
条款63.根据条款62所述的方法,其中所述固体支持物包括珠。
条款64.根据条款63所述的方法,其中所述珠是磁性珠或顺磁性珠。
条款65.根据条款37到64中任一项所述的方法,其中所述第一引物包括能在延伸条件下与mRNA杂交的序列。
条款66.如条款65所述的方法,其中,所述第一引物在其3'端处包括poly(T)。
条款67.如条款65所述的方法,其中,所述第一引物在其3'端处包括随机序列。
条款68.如条款65所述的方法,其中,所述第一部分与第一引物的混合物接触,其中至少一个第一引物在3'端处包括poly(T)序列,并且至少一个第一引物包括随机序列。
条款69.一种式(A)的拴系有寡核苷酸的核苷酸:
或其盐,
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;
Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且
CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代。
条款70.一种根据条款68所述的拴系有寡核苷酸的核苷酸,其中Oligo是
条款71.根据条款69或条款70所述的拴系有寡核苷酸的核苷酸,其中CXN选自各自具有1到3个杂原子的5元杂环和6元杂环。
条款72.根据条款69到71中任一项所述的拴系有寡核苷酸的核苷酸,其中CXN选自吡咯并、苯硫基、呋喃基、吡咯烷基、硫代乙酰基、四氢呋喃基、异噁唑基、噁唑并、吡唑并、咪唑基、异噻唑并、噻唑基、三唑并、噁二唑并、噻二唑并、吡喃基、硫代吡喃基、吡啶基、四氢吡喃基、四氢硫代吡喃基、哌啶基、哒嗪基、嘧啶基、吡嗪基、六氢哒嗪基、六氢嘧啶基、哌嗪基、二噁烷基、吗啉代、噻嗪基、噁嗪并、二噻烷基、三嗪基、二噻嗪并、噻二嗪并、三嗪烷基或噁三唑并。
条款73.根据条款69到72中任一项所述的拴系有寡核苷酸的核苷酸,其中CXN是Click,其中Click是点击反应的产物。
条款74.根据条款69到73中任一项所述的拴系有寡核苷酸的核苷酸,其中CXN是Click,并且其中Click是以下官能团对中的一个官能团对之间的点击反应的产物:
i)炔基和叠氮基;
ii)硫醇和炔基;
iii)硫醇和烯基;
iv)叠氮基和环辛烷基;以及
v)环辛烷基和硝酮。
条款75.根据条款69到74中任一项所述的拴系有寡核苷酸的核苷酸,
条款76.根据条款69到75中任一项所述的拴系有寡核苷酸的核苷酸,其中Z和Y各自独立地选自键、氨基、酰胺基、亚烷基、亚烯基、亚炔基、醚、酮、羰基、酸酐、酯、酰亚胺或其任何组合。
条款77.根据条款69到76中任一项所述的拴系有寡核苷酸的核苷酸,其中Y是亚烷基或亚炔基。
条款78.根据条款69到77中任一项所述的拴系有寡核苷酸的核苷酸,其中Z是亚炔基、亚烷基、醚和酰胺基中的一个或多个的组合。
条款79.根据条款69到78中任一项所述的拴系有寡核苷酸的核苷酸,其中-NB-Z-是NB-HN-L1-、NB-(CH-CH)C(O)(CH2CH2)NHC(O)(CH2)5-L1、
条款80.根据条款69所述的拴系有寡核苷酸的核苷酸,其中所述式(A)的化合物选自式(B1)-(B4)的化合物
和其盐,其中Oligo*是来自Oligo基团的其余2到99个核苷酸,并且NB2是核碱基;Click是点击反应的产物;L1选自亚烷基、亚烯基、亚炔基和聚亚烷基二醇;L2是亚烷基或亚炔基。
条款81.根据条款79或80所述的拴系有寡核苷酸的核苷酸,其中L1选自C1-C12亚烷基、C2-C12亚烯基、C2-C12亚炔基和具有2到8个二醇单元的聚亚烷基二醇。
条款82.根据条款79到81中任一项所述的拴系有寡核苷酸的核苷酸,其中L1选自具有2个乙二醇单元的聚乙二醇(PEG2)、具有4个乙二醇单元的聚乙二醇(PEG4)或具有6个乙二醇单元的聚乙二醇(PEG6)、亚甲基、亚乙基、正亚丙基、异亚丙基、1-亚丁基、顺式-2-亚丁基、反式-2-亚丁基、异亚丁基、1-亚戊基、顺式-2-亚戊基、反式-2-亚戊基、异亚戊基和亚己基。
条款83.根据条款79到82中任一项所述的拴系有寡核苷酸的核苷酸,其中L1选自-CH2-、-(CH2)3-、-(CH2)5-、PEG2和PEG4。
条款84.根据条款80到83中任一项所述的拴系有寡核苷酸的核苷酸,其中L2是C1-C12亚烷基或C1-C12亚炔基。
条款85.根据条款80到84中任一项所述的拴系有寡核苷酸的核苷酸,其中L2-Oligo是-(CH2)4-Oligo或-(CH2)4C≡C-Oligo。
条款86.根据条款69到85中任一项所述的拴系有寡核苷酸的核苷酸,其中X选自H、OH、F、N3、和氨基。
条款87.根据条款69到86中任一项所述的拴系有寡核苷酸的核苷酸,其中X选自H、N3和OH。
条款88.根据条款69到87中任一项所述的拴系有寡核苷酸的核苷酸,其中X是OH。
条款89.根据条款69到87中任一项所述的拴系有寡核苷酸的核苷酸,其中X是H。
条款90.根据条款69到89中任一项所述的拴系有寡核苷酸的核苷酸,其中Q是H、OH、F、Cl、Br、I和N3。
条款91.根据条款69到90中任一项所述的拴系有寡核苷酸的核苷酸,其中Q是H。
条款92.根据条款69到91中任一项所述的拴系有寡核苷酸的核苷酸,其中Oligo或Oligo*在其5'端与Y键合。
条款93.根据条款69到92中任一项所述的拴系有寡核苷酸的核苷酸,其中NB和NB2独立地是选自腺嘌呤、7-脱氮-腺嘌呤、胞嘧啶、鸟嘌呤、7-脱氮鸟嘌呤、胸腺嘧啶、尿嘧啶和肌苷的核碱基。
条款94.根据条款69到93中任一项所述的拴系有寡核苷酸的核苷酸,其中NB是嘧啶,并且其中所述嘧啶在所述核碱基的第5位处拴系到所述寡核苷酸。
条款95.根据条款69到93中任一项所述的拴系有寡核苷酸的核苷酸,其中NB是嘌呤,并且其中所述嘌呤在所述核碱基的第7位处拴系到所述寡核苷酸。
条款96.根据条款69到95中任一项所述的拴系有寡核苷酸的核苷酸,其中所述式(A)的化合物的所述盐是季铵盐。
条款97.根据条款69到96中任一项所述的拴系有寡核苷酸的核苷酸,其中Oligo是包括条形码序列、衔接子序列、唯一分子标识符、随机序列、靶特异性序列、通用手柄、通用序列、启动子序列、索引序列或其任何组合的寡核苷酸。
条款98.根据条款1到68中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸选自根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸。
条款99.一种用于产生测序文库的试剂盒,所述试剂盒包括:
a.根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸;以及
b.以下中的至少一个:
(i)A、C、G、U和/或T核苷酸;
(ii)聚合酶;
(iii)引物和/或衔接子序列;
(iv)缓冲液;或
(v)盐。
条款100.根据条款99所述的试剂盒,其中所述试剂盒包括A、C、G、U和/或T核苷酸。
条款101.根据条款99或100所述的试剂盒,其中所述试剂盒包括聚合酶。
条款102.根据条款101所述的试剂盒,其中所述聚合酶是野生型聚合酶、经过修饰的聚合酶、突变型聚合酶、工程化聚合酶或其组合。
条款103.根据条款99到102中任一项所述的试剂盒,其中所述聚合酶是Taq DNA聚合酶、DNA聚合酶、Deep VentTM DNA聚合酶、Pfx DNA聚合酶、Pwo聚合酶、SuperscriptTM IV、SuperscriptTM II、SuperscriptTM III、MaximaTM、RevertAidTM逆转录酶、Thermo SequenaseTM、SequenaseTM V2.0、CycleSeqTM、Phusion exo-、末端脱氧核苷酸转移酶(TdT)、Maxima H、TherminatorTM聚合酶、Q5 DNA聚合酶、AccuTaq DNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、克列诺片段、Tth DNA聚合酶、DNA聚合酶、SuperFi DNA聚合酶、Platinum Taq DNA聚合酶、Herculase II Fusion DNA聚合酶、PfuUltra Fusion II HSDNA聚合酶、Bst DNA聚合酶大片段、Stoeffel片段、9°NTM DNA聚合酶、Pfu DNA聚合酶、TflDNA聚合酶、Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、KOD HiFi DNA聚合酶、KOD DNA聚合酶、Q-β复制酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、和HIV-1逆转录酶、polyA聚合酶(PAP)、polyU聚合酶(PUP)和其变体和衍生物。
条款104.根据条款99到103中任一项所述的试剂盒,其中所述试剂盒包括一个或多个引物序列、衔接子序列、条形码序列或唯一分子标识符序列。
条款105.根据条款99到104中任一项所述的试剂盒,其中所述试剂盒包括至少一种缓冲液。
条款106.根据条款96到105中任一项所述的试剂盒,其中所述试剂盒包括至少一种盐。
条款107.一种用于对核酸进行组合条形码编码的试剂盒,所述试剂盒包括:
a.根据条款71到99中任一项所述的拴系有寡核苷酸的核苷酸;以及
b.以下中的至少一个:
(i)A、C、G、U和/或T核苷酸;
(ii)聚合酶;
(iii)引物和/或衔接子序列;
(iv)缓冲液;
(v)多个核酸条形码;以及
(vi)一个或多个细胞标志物结合剂。
条款108.根据条款107所述的试剂盒,其中所述拴系有寡核苷酸的核苷酸的核苷酸是双脱氧核苷酸。
条款109.根据条款107到108中任一项所述的试剂盒,其中所述拴系有寡核苷酸的核苷酸的寡核苷酸包括通用手柄序列。
条款110.根据条款107到109中任一项所述的试剂盒,其中所述聚合酶是逆转录酶、DNA聚合酶或两者。
条款111.根据条款107到110中任一项所述的试剂盒,其中所述多个核酸条形码包括在单个的隔室中提供的第一多个核酸条形码。
条款112.根据条款111所述的试剂盒,其进一步包括在单个的隔室中提供的第二和任选地第三、第四、第五或第六多个核酸条形码。
条款113.根据条款111到112中的任一项所述的试剂盒,其中所述单个的隔室设置于多孔板中。
条款114.根据条款111到113中任一项所述的试剂盒,其中所述多个核酸条形码呈冻干形式。
条款115.根据条款111到114中任一项所述的试剂盒,其中所述多个核酸条形码呈溶液形式。
条款116.根据条款111到115中任一项所述的试剂盒,其中所述第一多个条形码的所述核酸条形码包括延伸引物,其中每个延伸引物在5'到3'方向上包括第一通用手柄和第一核酸条形码。
条款117.根据条款112到115中任一项所述的试剂盒,其中所述第二多个条形码上的所述核酸条形码包括夹板寡核苷酸,其中所述夹板寡核苷酸在5'到3'方向上包括退火到第二通用手柄的序列、作为第二核酸条形码的模板的序列和作为第三通用手柄的模板的序列。
条款118.根据条款112到116中任一项所述的试剂盒,其中所述第三多个条形码上的所述核酸条形码包括延伸引物,并且其中所述延伸引物任选地包括测序衔接子序列。
条款119.根据条款107到118中任一项所述的试剂盒,其进一步包括一个或多个细胞标志物结合剂。
条款120.根据条款119所述的试剂盒,其中每个细胞标志物结合剂是包括拴系到细胞标志物结合剂的寡核苷酸的拴系有寡核苷酸的OTBA。
条款121.一种用于制备根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸的方法,所述方法包括:
a.提供与第一官能团共价结合的核苷酸,所述第一官能团能与第二官能团进行点击反应;
b.提供与所述第二官能团共价结合的寡核苷酸,所述第二官能团能进行点击反应以形成三唑环;
c.使所述核苷酸与所述寡核苷酸接触以形成点击反应产物,
其中所述第一官能团和所述第二官能团分别选自:
i)炔基和叠氮基;
ii)叠氮基和炔基;
iii)硫醇和炔基;
iv)炔基和硫醇;
v)硫醇和烯基;
vi)烯基和硫醇;
vii)叠氮基和环辛烷基;
viii)环辛烷基和叠氮基;
xi)硝酮和环辛烷基;以及
xii)环辛烷基和硝酮。
条款122.根据条款121所述的方法,其中所述第一官能团和所述第二官能团分别选自:i)炔基和叠氮基;和ii)叠氮基和炔基。
条款123.根据条款121所述的方法,其中步骤(c)包括在存在铜催化剂和铜(I)配体的情况下使所述核苷酸与所述寡核苷酸接触以形成1,2,3-三唑。
条款124.根据条款121到123中任一项所述的方法,其中所述核苷酸是脱氧核苷酸或双脱氧核苷酸。
条款125.根据条款123或124中任一项所述的方法,其中所述铜催化剂包括铜(I)或铜(II),其中当所述催化剂是铜(II)时,存在还原剂。
条款126.根据条款123到125中任一项所述的方法,其中所述铜催化剂是Cu(NO3)2、Cu(OAc)、CuSO4或其任何组合。
条款127.如条款125或126所述的方法,其中,所述还原剂包括抗坏血酸盐、三(2-羧乙基)膦(TCEP)、2.4.6-三氯苯酚(TCP)、NADH、NADPH、硫代硫酸盐、金属铜、醌、对苯二酚、维生素K、谷胱甘肽、半胱氨酸、2-巯基乙醇、二硫苏糖醇、Fe(II)、Co(II)、施加的电位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、
Ru、Fe、Co、Pt、Pd、Ni、Rh、W或其任何组合。
条款128.如条款127所述的方法,其中,所述还原剂包括抗坏血酸钠。
条款129.根据条款123到128中任一项所述的方法,其中所述铜(I)配体的所述配体包括三(苄基三唑基甲基)胺或三(3-羟丙基三唑基甲基)胺。
条款130.一种根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸在制备核酸文库中的用途。
条款131.一种根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸在对核酸进行加标签中的用途。
条款132.一种根据条款69到97中任一项所述的拴系有寡核苷酸的核苷酸在用条形码的组合对核酸进行加标签中的用途。
从上文所描述的实例中,本领域技术人员可以容易地确定本公开的基本原理,并且在不脱离其精神和范围的情况下,可以对本公开进行各种修改和改变以使其适应具体用途和条件。
序列表
<110> 赛默飞世尔科技波罗的海UAB(THERMO FISHER SCIENTIFIC BALTICS UAB)
生命技术公司(LIFE TECHNOLOGIES CORPORATION)
<120> 拴系有寡核苷酸的核苷酸
<130> LT01475PCT
<140>
<141>
<150> 63/032,297
<151> 2020-05-29
<150> 62/864,589
<151> 2019-06-21
<160> 46
<170> PatentIn 3.5版
<210> 1
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 1
uagatcggaa gagcacacgt ctg 23
<210> 2
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 2
uagatcggaa gagcacacgt ctg 23
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 3
uagatcggaa gagcacacgt ctg 23
<210> 4
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 4
agatcggaag agcacacgtc tg 22
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 5
taatacgact cactatag 18
<210> 6
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<220>
<221> modified_base
<222> (2)..(8)
<223> a、c、t、g、未知或其它
<400> 6
unnnnnnnna gatcggaaga gcgtcgtgta 30
<210> 7
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 7
uagatcggaa gagcacacgt ctgaactcca gtcacatgcc taaatctcgt atgccgtctt 60
ctgcttg 67
<210> 8
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 8
tacacgacgc tcttccgatc taacggtacg ccagaatctt g 41
<210> 9
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 9
tacacgacgc tcttccgatc tagagccacc accggaac 38
<210> 10
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<220>
<221> modified_base
<222> (22)..(31)
<223> a、c、t、g、未知或其它
<400> 10
tacacgacgc tcttccgatc tnnnnnnnnn n 31
<210> 11
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 11
ctctttccct acacgacgct cttccgatct aagtcgtaac aaggtaaccg 50
<210> 12
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 12
ctctttccct acacgacgct cttccgatct ctgagccakr atcaaactct 50
<210> 13
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 13
ctctttccct acacgacgct cttccgatct ctgaaccaag atcaaattct 50
<210> 14
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 14
ctctttccct acacgacgct cttccgatct ctaagccagg atcaaactct 50
<210> 15
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 15
ctctttccct acacgacgct cttccgatct ctgagccaga atcgaaccct 50
<210> 16
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 16
aagcagtggt atcaacgcag agtacttttt tttttttttt tttttttttt ttttt 55
<210> 17
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 17
aatgatacgg cgaccaccga gatctacacg cctgtccgcg gaagcagtgg tatcaacgca 60
gagtac 66
<210> 18
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 18
caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatct 58
<210> 19
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 19
caagcagaag acggcatacg a 21
<210> 20
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> source
<223> /注释=“组合的DNA/RNA分子的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (17)..(24)
<223> a、c、t、g、未知或其它
<400> 20
ccaggaccag cgattcnnnn nnnnggg 27
<210> 21
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 21
cagtggtatc aacgcagagt acccaggacc agcgattc 38
<210> 22
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 22
utttatatat ttattggaga ctgactacca gatgtaacac ctatagtgag tcgtattag 59
<210> 23
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (2)..(2)
<223> 炔烃修饰的dU
<400> 23
tuatatattt attggagact gactaccaga tgtaaca 37
<210> 24
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 24
tgcagacatg ggtaggcatc cttggcgta 29
<210> 25
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 25
gtacgccaag gatgcctacc catgtctgca 30
<210> 26
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 26
ctaatacgac tcactatagg tgttacatct ggtagtcagt ctccaataaa tatataaa 58
<210> 27
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 27
gtcgctcaac tcagctacag tacgccaagg atgcctaccc atgtctgca 49
<210> 28
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 28
gtacgccaag gatgcctacc catgtctgca 30
<210> 29
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 29
ccggggatcc catgtg 16
<210> 30
<211> 112
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成多核苷酸”
<400> 30
gggaaagcuu uuacauuuuc gcgauaccgu ccagcgacau ucuuccucgg uacauaaucu 60
ccuuuggcgu uucccgaugu ccgucacgca caugggaucc ccggguaccg ag 112
<210> 31
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 31
aaaaaaaaaa tacgccaagg atgcctaccc atgtctgca 39
<210> 32
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 32
tgcagacatg ggtaggcatc cttggcgta 29
<210> 33
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 33
uttatatatt tattggagac tgactaccag atgtaaca 38
<210> 34
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 34
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatcttt 60
tttttttttt tttttttttt tttttttt 88
<210> 35
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (1)..(1)
<223> 炔烃修饰的dU
<400> 35
uagatcggaa gagcacacgt ctgaactcca gtcacatgcc taaatctcgt atgccgtctt 60
ctgcttg 67
<210> 36
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 36
gcggcgacca aatcgttgta aagatcggaa gagcgtcgtg ta 42
<210> 37
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 37
cagacgtgtg ctcttccgat ct 22
<210> 38
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 38
cagacgtgtg ctcttccgat ct 22
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成引物”
<400> 39
aagtcgtaac aaggtaaccg 20
<210> 40
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 40
tttttttttt tttttttttt tttttttttt 30
<210> 41
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 41
tttttttttt tttt 14
<210> 42
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 42
aaaaaaaaaa 10
<210> 43
<211> 269
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成多核苷酸”
<220>
<221> misc_feature
<222> (20)..(269)
<223> /注释=“此区可以涵盖80-250个核苷酸”
<400> 43
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 269
<210> 44
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<220>
<221> modified_base
<222> (17)..(17)
<223> a、c、t、g、未知或其它
<400> 44
tttttttttt tttttvn 17
<210> 45
<211> 256
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成多核苷酸”
<220>
<221> misc_feature
<222> (7)..(256)
<223> /注释=“此区可以涵盖80-250个核苷酸”
<400> 45
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240
aaaaaaaaaa aaaaaa 256
<210> 46
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> source
<223> /注释=“人工序列的描述:合成寡核苷酸”
<400> 46
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 30
Claims (21)
1.一种用于使用寡核苷酸对核酸进行加标签的方法,所述方法包括:
a.提供要加标签的所述核酸;
b.使所述核酸与聚合酶和至少一个式(A)的拴系有寡核苷酸的核苷酸:
或其盐接触,
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;
Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且
CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代,由此产生第一带标签的核酸。
2.根据权利要求1所述的方法,其中所述接触包括使所述核酸与至少一个拴系有寡核苷酸的核苷酸、至少一个未拴系到寡核苷酸的核苷酸以及聚合酶接触。
3.根据权利要求1到2中任一项所述的方法,其进一步包括使引物退火到所述核酸。
4.根据权利要求1到3中任一项所述的方法,其中所述拴系有寡核苷酸的核苷酸是双脱氧核苷酸,任选地其中所述双脱氧核苷酸选自双脱氧腺苷三磷酸、双脱氧鸟苷三磷酸、双脱氧胸苷三磷酸、双脱氧尿苷三磷酸、双脱氧胞苷三磷酸和其任何组合。
5.根据权利要求1到4中任一项所述的方法,其进一步包括:
a.在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的引物退火;
b.使所述第一带标签的核酸链和经退火的引物与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及
c.允许聚合酶从退火到所述所拴系寡核苷酸的所述引物的3'羟基延伸以形成第二核酸链。
6.根据权利要求1到4中任一项所述的方法,其进一步包括:
a.在产生第一带标签的核酸链后,使与所拴系寡核苷酸至少部分互补的夹板寡核苷酸退火;
b.使所述第一带标签的核酸链和经退火的夹板寡核苷酸与核酸聚合酶和至少一个未拴系到寡核苷酸的核苷酸接触;以及
c.允许聚合酶从所述所拴系寡核苷酸的3'羟基跨所述夹板寡核苷酸延伸。
7.一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞,所述方法包括:
a.使与所述一个或多个核酸至少部分互补的第一引物退火;
b.使所述一个或多个核酸与核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多条核酸链,所述多条核酸链在其3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;
c.使与所拴系寡核苷酸至少部分互补的第二引物退火;以及
d.允许所述聚合酶从退火到所述所拴系寡核苷酸的所述第二引物的3'羟基延伸,由此产生核酸文库。
8.一种用于由包括一个或多个核酸的样品产生核酸文库的方法,任选地其中所述样品包括多个细胞或细胞核,所述方法包括:
a.使与所述一个或多个核酸至少部分互补的第一引物退火;
b.使所述一个或多个核酸与第一核酸聚合酶、至少一个未拴系到寡核苷酸的核苷酸和至少一个拴系有寡核苷酸的双脱氧核苷酸接触以形成多个第一延伸产物,所述多个第一延伸产物在3'端处包括所述拴系有寡核苷酸的双脱氧核苷酸;
c.使与所述第一延伸产物的所拴系寡核苷酸至少部分互补的夹板寡核苷酸退火;以及
d.使所述第一延伸产物与核酸聚合酶和一个或多个核苷酸接触,以允许所述聚合酶从所述所拴系寡核苷酸的3'羟基跨经退火的夹板延伸以产生第二延伸产物,由此产生核酸文库。
9.根据权利要求8所述的方法,其中所述样品中的所述一个或多个核酸包括拴系有寡核苷酸的结合剂(OTBA)的寡核苷酸。
10.根据权利要求9所述的方法,其中所述OTBA的所拴系寡核苷酸包括细胞标志物结合剂索引,并且其中所述OTBA的结合剂包括适配体或抗体或其功能片段。
11.根据权利要求7到10中任一项所述的方法,其中包括一个或多个核酸的样品包括多于一个细胞或细胞核,其中所述细胞或细胞核可以包括一个或多个细胞标志物,其中所述样品在步骤a之前分成两个或更多个第一部分,并且其中每个第一部分包括原始样品的细胞或细胞核亚群。
12.根据权利要求11所述的方法,其中所述第一引物包括第一通用手柄序列和第一条形码,所述第一条形码在每个第一部分中的所述第一引物中是共用的,但与存在于其它第一部分中的所述第一引物中的所述第一条形码有所不同;并且其中所述拴系有寡核苷酸的双脱氧核苷酸的所述寡核苷酸包括第二通用手柄序列。
13.根据权利要求12所述的方法,其进一步包括,在步骤c之前:
a.在形成所述第一核延伸产物后将所述第一部分组合;以及
b.将经组合的第一部分分成两个或更多个第二部分,其中所述第二部分包括所述夹板寡核苷酸,其中所述夹板寡核苷酸包括:
i.退火到所述所拴系寡核苷酸上的所述第二通用手柄的寡核苷酸序列;
ii.第二条形码的模板序列,其中每个第二部分的所述第二条形码是共用的,但与其它第二部分的所述第二条形码有所不同;以及
iii.第三通用手柄的模板序列;
其中所述第二延伸产物包括所述第二条形码和所述第三通用手柄。
14.根据权利要求13所述的方法,其进一步包括:
a.将所述第二部分组合;
b.将经组合的第二部分分成两个或更多个第三部分;
c.使每个第三部分与扩增引物接触,其中所述扩增引物能与所述第一通用手柄和所述第三通用手柄杂交并且能够从所述第一通用手柄和所述第三通用手柄延伸,并且其中所述扩增引物任选地分别包括第三条形码和/或第四条形码并且分别包括第一衔接子序列和/或第二衔接子序列以产生扩增产物,其中所述扩增产物的所述第一条形码序列、所述第二条形码序列和所述第三条形码序列(或其补体)的组合对于源自单个细胞或细胞核的所述扩增产物来说是唯一的。
15.根据权利要求1到14中任一项所述的方法,其中所述引物、所述所拴系寡核苷酸或两者包括随机序列、靶特异性序列或两者。
16.根据权利要求1到15中任一项所述的方法,其中所述引物、所述所拴系寡核苷酸或所述夹板寡核苷酸中的一个或多个包括通用手柄、通用序列、唯一分子标识符、衔接子序列、启动子序列、条形码序列、索引序列或其任何组合。
17.根据权利要求1到16中任一项所述的方法,其中所述聚合酶是DNA聚合酶或RNA聚合酶。
18.根据权利要求1到17中任一项所述的方法,其中所述核酸是DNA或RNA。
19.一种式(A)的拴系有寡核苷酸的核苷酸:
或其盐,
其中NB是核碱基;
Oligo是由3到100个核苷酸构成的寡核苷酸;
X和Q中的每一个独立地选自H、OH、N3、卤基、烷基、烷氧基、烷基、烯基、炔基、酰基、氰基、氨基、酯和酰胺基;
Z和Y中每一个独立地选自键、氨基、酰胺基、烷基、烯基、炔基、硫醚、磺酰基、磺酰胺基、醚、酮、羰基、酸酐、酯、酰亚胺基、脲、氨基甲酸酯和其组合;并且
CXN选自亚烷基、亚烯基、亚炔基、酮、碳酸酯、酯、醚、酸酐、酰胺基、氨基、氨基亚烷基、亚氨基、酰亚胺基、重氮、氨基甲酸酯、磷酸二酯、硫化物、二硫化物、磺酰基、磺酰胺基和含有一到四个N原子、O原子、S原子或其组合的杂环基,其中杂环基任选地在碳原子、氮原子或硫原子处被取代。
20.根据权利要求19所述的拴系有寡核苷酸的核苷酸,其中CXN是Click,并且其中Click是以下官能团对中的一个官能团对之间的点击反应的产物:
i)炔基和叠氮基;
ii)硫醇和炔基;
iii)硫醇和烯基;
iv)叠氮基和环辛烷基;以及
v)环辛烷基和硝酮。
21.一种根据权利要求19或20所述的拴系有寡核苷酸的核苷酸在制备核酸文库中的用途或用于对核酸进行加标签的用途。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962864589P | 2019-06-21 | 2019-06-21 | |
US62/864,589 | 2019-06-21 | ||
US202063032297P | 2020-05-29 | 2020-05-29 | |
US63/032,297 | 2020-05-29 | ||
PCT/US2020/039009 WO2020257797A1 (en) | 2019-06-21 | 2020-06-22 | Oligonucleotide-tethered triphosphate nucleotides useful for labelling nucleic acids for preparing next-generation sequencing libraries |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114450401A true CN114450401A (zh) | 2022-05-06 |
Family
ID=71670396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080051974.6A Pending CN114450401A (zh) | 2019-06-21 | 2020-06-22 | 可用于对用于制备下一代测序文库的核酸进行标记的拴系有寡聚核苷酸的三磷酸核苷酸 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11739316B2 (zh) |
EP (1) | EP3986907A1 (zh) |
JP (2) | JP2022537069A (zh) |
KR (1) | KR20220024778A (zh) |
CN (1) | CN114450401A (zh) |
WO (1) | WO2020257797A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022263489A1 (en) * | 2021-06-17 | 2022-12-22 | F. Hoffmann-La Roche Ag | Nucleoside-5 -oligophosphates having a cationically-modified nucleobase |
WO2022268932A1 (en) | 2021-06-24 | 2022-12-29 | Thermo Fisher Scientific Geneart Gmbh | Systems and methods for single cell analysis |
WO2024006832A1 (en) * | 2022-06-29 | 2024-01-04 | 10X Genomics, Inc. | Click chemistry-based dna photo-ligation for manufacturing of high-resolution dna arrays |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015026853A2 (en) * | 2013-08-19 | 2015-02-26 | Abbott Molecular Inc. | Next-generation sequencing libraries |
WO2015026845A2 (en) * | 2013-08-19 | 2015-02-26 | Abbott Molecular Inc. | Nucleotide analogs |
CN109154024A (zh) * | 2016-04-29 | 2019-01-04 | 欧姆尼欧美公司 | 核酸序列测定方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1671673B (zh) | 2002-05-30 | 2010-05-26 | 斯克里普斯研究学院 | 铜催化的叠氮化物和乙炔的连接 |
US9096856B2 (en) | 2007-07-19 | 2015-08-04 | Georgia State University Research Foundation, Inc. | Nucleotides and aptamers containing boronic acid groups having biased binding to glycosylated proteins, and uses thereof |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
GB201119903D0 (en) | 2011-11-17 | 2011-12-28 | Univ Vilnius | Nucleic acid production and sequence analysis |
US20140105466A1 (en) | 2012-10-16 | 2014-04-17 | Ocean Images UK Ltd. | Interactive photography system and method employing facial recognition |
EP2909337B1 (en) | 2012-10-17 | 2019-01-09 | Spatial Transcriptomics AB | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
GB201403216D0 (en) | 2014-02-24 | 2014-04-09 | Cambridge Epigenetix Ltd | Nucleic acid sample preparation |
WO2015148402A1 (en) | 2014-03-24 | 2015-10-01 | The Trustees Of Columbia Univeristy In The City Of New York | Chemical methods for producing tagged nucleotides |
GB201408841D0 (en) | 2014-05-19 | 2014-07-02 | Univ Southampton | Nucleic acid processing |
US10900065B2 (en) | 2014-11-14 | 2021-01-26 | University Of Washington | Methods and kits for labeling cellular molecules |
ES2972835T3 (es) | 2015-04-10 | 2024-06-17 | 10X Genomics Sweden Ab | Análisis multiplex de especímenes biológicos de ácidos nucleicos espacialmente distinguidos |
WO2016168825A1 (en) | 2015-04-17 | 2016-10-20 | Centrillion Technology Holdings Corporation | Methods for performing spatial profiling of biological molecules |
CN114874337A (zh) | 2016-06-24 | 2022-08-09 | 加利福尼亚大学董事会 | 使用栓系的核苷三磷酸的核酸合成和测序 |
WO2018075785A1 (en) | 2016-10-19 | 2018-04-26 | Illumina, Inc. | Methods for chemical ligation of nucleic acids |
US20200190581A1 (en) | 2017-01-04 | 2020-06-18 | The University Of Chicago | Methods for detecting cytosine modifications |
-
2020
- 2020-06-22 WO PCT/US2020/039009 patent/WO2020257797A1/en unknown
- 2020-06-22 JP JP2021576459A patent/JP2022537069A/ja active Pending
- 2020-06-22 EP EP20742978.8A patent/EP3986907A1/en active Pending
- 2020-06-22 US US16/908,567 patent/US11739316B2/en active Active
- 2020-06-22 KR KR1020227002007A patent/KR20220024778A/ko unknown
- 2020-06-22 CN CN202080051974.6A patent/CN114450401A/zh active Pending
-
2023
- 2023-06-30 US US18/345,856 patent/US20240102003A1/en active Pending
-
2024
- 2024-04-25 JP JP2024071690A patent/JP2024105356A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015026853A2 (en) * | 2013-08-19 | 2015-02-26 | Abbott Molecular Inc. | Next-generation sequencing libraries |
WO2015026845A2 (en) * | 2013-08-19 | 2015-02-26 | Abbott Molecular Inc. | Nucleotide analogs |
CN109154024A (zh) * | 2016-04-29 | 2019-01-04 | 欧姆尼欧美公司 | 核酸序列测定方法 |
Non-Patent Citations (2)
Title |
---|
ANNA BACCARO 等: ""Barcoded Nucleotides"", 《ANGEWANDTE CHEMIE INTERNATIONAL EDITION》, vol. 51, pages 15 - 16 * |
MICHAL HOCEK: ""Synthesis of Base-Modified 2′-Deoxyribonucleoside Triphosphates and Their Use in Enzymatic Synthesis of Modified DNA for Applications in Bioanalysis and Chemical Biology"", 《THE JOURNAL OF ORGANIC CHEMISTRY》, pages 1 - 3 * |
Also Published As
Publication number | Publication date |
---|---|
US11739316B2 (en) | 2023-08-29 |
US20240102003A1 (en) | 2024-03-28 |
JP2022537069A (ja) | 2022-08-23 |
KR20220024778A (ko) | 2022-03-03 |
EP3986907A1 (en) | 2022-04-27 |
WO2020257797A1 (en) | 2020-12-24 |
US20200399633A1 (en) | 2020-12-24 |
JP2024105356A (ja) | 2024-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6886962B2 (ja) | Rnaシークエンシングライブラリーを生成する方法 | |
EP2464755B1 (en) | Methods and kits for 3'-end-tagging of rna | |
CN106460052B (zh) | 双链核酸的合成 | |
US20240102003A1 (en) | Oligonucleotide-tethered nucleotides | |
JP6219944B2 (ja) | 5’保護に依存した増幅 | |
EP3494214B1 (en) | Method for preparing cdna libaries | |
CN105579592B (zh) | 用于制备dna文库的dna接头分子以及生产它们的方法和用途 | |
US20190271034A1 (en) | Primer technology | |
JP6876785B2 (ja) | 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法 | |
CN113557298B (zh) | 核酸的生成和扩增 | |
US20240287502A1 (en) | Oligonucleotide-tethered nucleotides | |
US20200385791A1 (en) | Multiple Beads Per Droplet Resolution | |
AU2022407332B2 (en) | A method of capturing crispr endonuclease cleavage products | |
Kapustina | The utility of modified nucleotides for high-throughput nucleic acid analysis | |
CN118318038A (zh) | 改良的文库制备方法 | |
JP2023545400A (ja) | 転写核酸の生成方法及び手段 | |
WO2024146937A1 (en) | Methods for obtaining correctly assembled nucleic acids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |