CN117385014A - 测序核酸的方法和系统 - Google Patents
测序核酸的方法和系统 Download PDFInfo
- Publication number
- CN117385014A CN117385014A CN202311235787.5A CN202311235787A CN117385014A CN 117385014 A CN117385014 A CN 117385014A CN 202311235787 A CN202311235787 A CN 202311235787A CN 117385014 A CN117385014 A CN 117385014A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- nucleotide
- polymerase
- template nucleic
- optionally
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 687
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 674
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 674
- 238000000034 method Methods 0.000 title claims abstract description 170
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 143
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 1032
- 239000002773 nucleotide Substances 0.000 claims abstract description 988
- 238000010348 incorporation Methods 0.000 claims abstract description 243
- 238000009739 binding Methods 0.000 claims abstract description 149
- 230000027455 binding Effects 0.000 claims abstract description 145
- 230000003993 interaction Effects 0.000 claims abstract description 132
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 93
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 72
- 239000011541 reaction mixture Substances 0.000 claims description 214
- 230000003197 catalytic effect Effects 0.000 claims description 152
- 229910021645 metal ion Inorganic materials 0.000 claims description 128
- 238000012360 testing method Methods 0.000 claims description 56
- 239000000126 substance Substances 0.000 claims description 55
- 230000002441 reversible effect Effects 0.000 claims description 54
- 230000000295 complement effect Effects 0.000 claims description 44
- 230000002829 reductive effect Effects 0.000 claims description 18
- 230000000087 stabilizing effect Effects 0.000 claims description 18
- 230000000368 destabilizing effect Effects 0.000 claims description 10
- 150000004713 phosphodiesters Chemical class 0.000 claims description 2
- 238000004378 air conditioning Methods 0.000 claims 6
- 238000003556 assay Methods 0.000 abstract description 126
- 238000012544 monitoring process Methods 0.000 abstract description 57
- 239000000203 mixture Substances 0.000 abstract description 25
- 230000001965 increasing effect Effects 0.000 abstract description 10
- 238000006243 chemical reaction Methods 0.000 description 150
- 230000009918 complex formation Effects 0.000 description 67
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 64
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 59
- 238000005406 washing Methods 0.000 description 55
- 235000002639 sodium chloride Nutrition 0.000 description 52
- 150000002500 ions Chemical class 0.000 description 47
- 150000003839 salts Chemical class 0.000 description 47
- 150000001768 cations Chemical class 0.000 description 44
- 239000003112 inhibitor Substances 0.000 description 44
- 239000002105 nanoparticle Substances 0.000 description 36
- -1 glutamate anion Chemical class 0.000 description 35
- 238000010494 dissociation reaction Methods 0.000 description 34
- 230000005593 dissociations Effects 0.000 description 34
- 108020004414 DNA Proteins 0.000 description 33
- 229940123066 Polymerase inhibitor Drugs 0.000 description 32
- 210000004027 cell Anatomy 0.000 description 32
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 31
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 31
- 229910052751 metal Inorganic materials 0.000 description 30
- 239000002184 metal Substances 0.000 description 30
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 29
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 29
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 29
- 239000011777 magnesium Substances 0.000 description 28
- 238000001514 detection method Methods 0.000 description 27
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 27
- 230000008859 change Effects 0.000 description 26
- 238000006116 polymerization reaction Methods 0.000 description 25
- 239000000975 dye Substances 0.000 description 22
- 229930195712 glutamate Natural products 0.000 description 22
- 230000003287 optical effect Effects 0.000 description 22
- 239000000243 solution Substances 0.000 description 21
- 230000006641 stabilisation Effects 0.000 description 21
- 238000011105 stabilization Methods 0.000 description 21
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 20
- 239000003381 stabilizer Substances 0.000 description 19
- 239000007787 solid Substances 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 17
- 108090000790 Enzymes Proteins 0.000 description 17
- 239000000872 buffer Substances 0.000 description 17
- 102000053602 DNA Human genes 0.000 description 16
- 230000005945 translocation Effects 0.000 description 16
- 238000007792 addition Methods 0.000 description 15
- 235000018417 cysteine Nutrition 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 229910052749 magnesium Inorganic materials 0.000 description 15
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 12
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 12
- 238000005286 illumination Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 230000036963 noncompetitive effect Effects 0.000 description 12
- 229910019142 PO4 Inorganic materials 0.000 description 11
- 238000001069 Raman spectroscopy Methods 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 239000002738 chelating agent Substances 0.000 description 11
- 239000010452 phosphate Substances 0.000 description 11
- 239000003419 rna directed dna polymerase inhibitor Substances 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 241000205188 Thermococcus Species 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 230000000903 blocking effect Effects 0.000 description 10
- WDRWZVWLVBXVOI-QTNFYWBSSA-L dipotassium;(2s)-2-aminopentanedioate Chemical compound [K+].[K+].[O-]C(=O)[C@@H](N)CCC([O-])=O WDRWZVWLVBXVOI-QTNFYWBSSA-L 0.000 description 10
- 210000003811 finger Anatomy 0.000 description 10
- 238000003384 imaging method Methods 0.000 description 10
- 235000013919 monopotassium glutamate Nutrition 0.000 description 10
- 108010017826 DNA Polymerase I Proteins 0.000 description 9
- 102000004594 DNA Polymerase I Human genes 0.000 description 9
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 9
- 101900297506 Human immunodeficiency virus type 1 group M subtype B Reverse transcriptase/ribonuclease H Proteins 0.000 description 9
- 238000006664 bond formation reaction Methods 0.000 description 9
- 150000001945 cysteines Chemical class 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 9
- 229910052737 gold Inorganic materials 0.000 description 9
- 239000010931 gold Substances 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 8
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 8
- 230000002860 competitive effect Effects 0.000 description 8
- 238000004132 cross linking Methods 0.000 description 8
- 230000005669 field effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000005855 radiation Effects 0.000 description 8
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 7
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 7
- 238000007385 chemical modification Methods 0.000 description 7
- 239000003431 cross linking reagent Substances 0.000 description 7
- 229960002433 cysteine Drugs 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000007850 fluorescent dye Substances 0.000 description 7
- 230000002401 inhibitory effect Effects 0.000 description 7
- 230000000977 initiatory effect Effects 0.000 description 7
- 238000005305 interferometry Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 239000002086 nanomaterial Substances 0.000 description 7
- 229910052759 nickel Inorganic materials 0.000 description 7
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 7
- ZJAOAACCNHFJAH-UHFFFAOYSA-N phosphonoformic acid Chemical compound OC(=O)P(O)(O)=O ZJAOAACCNHFJAH-UHFFFAOYSA-N 0.000 description 7
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 125000005605 benzo group Chemical class 0.000 description 6
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 235000011180 diphosphates Nutrition 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 102000051965 human ALK Human genes 0.000 description 6
- 239000011572 manganese Substances 0.000 description 6
- 238000001668 nucleic acid synthesis Methods 0.000 description 6
- 239000001103 potassium chloride Substances 0.000 description 6
- 235000011164 potassium chloride Nutrition 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 229940048084 pyrophosphate Drugs 0.000 description 6
- 150000003384 small molecules Chemical class 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 229910052712 strontium Inorganic materials 0.000 description 6
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 6
- 150000003573 thiols Chemical class 0.000 description 6
- 210000003813 thumb Anatomy 0.000 description 6
- NOLHRFLIXVQPSZ-UHFFFAOYSA-N 1,3-thiazolidin-4-one Chemical compound O=C1CSCN1 NOLHRFLIXVQPSZ-UHFFFAOYSA-N 0.000 description 5
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 229910017052 cobalt Inorganic materials 0.000 description 5
- 239000010941 cobalt Substances 0.000 description 5
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 239000010949 copper Substances 0.000 description 5
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 5
- 239000011521 glass Substances 0.000 description 5
- 125000001475 halogen functional group Chemical group 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000011859 microparticle Substances 0.000 description 5
- 239000004038 photonic crystal Substances 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 239000011535 reaction buffer Substances 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- 125000000437 thiazol-2-yl group Chemical group [H]C1=C([H])N=C(*)S1 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 239000011701 zinc Substances 0.000 description 5
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 4
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 4
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 4
- 229940122313 Nucleoside reverse transcriptase inhibitor Drugs 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 229910052804 chromium Inorganic materials 0.000 description 4
- 239000011651 chromium Substances 0.000 description 4
- 238000013270 controlled release Methods 0.000 description 4
- 229910052802 copper Inorganic materials 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- WHBIGIKBNXZKFE-UHFFFAOYSA-N delavirdine Chemical compound CC(C)NC1=CC=CN=C1N1CCN(C(=O)C=2NC3=CC=C(NS(C)(=O)=O)C=C3C=2)CC1 WHBIGIKBNXZKFE-UHFFFAOYSA-N 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 125000003963 dichloro group Chemical group Cl* 0.000 description 4
- 239000005546 dideoxynucleotide Substances 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229920001519 homopolymer Polymers 0.000 description 4
- 229910052748 manganese Inorganic materials 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 150000002739 metals Chemical class 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 230000010355 oscillation Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 239000004033 plastic Substances 0.000 description 4
- 229920003023 plastic Polymers 0.000 description 4
- 229910001414 potassium ion Inorganic materials 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 229910001415 sodium ion Inorganic materials 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 230000007067 DNA methylation Effects 0.000 description 3
- XQSPYNMVSIKCOC-NTSWFWBYSA-N Emtricitabine Chemical compound C1=C(F)C(N)=NC(=O)N1[C@H]1O[C@@H](CO)SC1 XQSPYNMVSIKCOC-NTSWFWBYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 229910052693 Europium Inorganic materials 0.000 description 3
- GYHNNYVSQQEPJS-UHFFFAOYSA-N Gallium Chemical compound [Ga] GYHNNYVSQQEPJS-UHFFFAOYSA-N 0.000 description 3
- 108010001584 Human immunodeficiency virus 2 reverse transcriptase Proteins 0.000 description 3
- 241000203353 Methanococcus Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 229910052771 Terbium Inorganic materials 0.000 description 3
- 102000002933 Thioredoxin Human genes 0.000 description 3
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 230000003281 allosteric effect Effects 0.000 description 3
- 229940125528 allosteric inhibitor Drugs 0.000 description 3
- 229940126575 aminoglycoside Drugs 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229910052785 arsenic Inorganic materials 0.000 description 3
- RQNWIZPPADIBDY-UHFFFAOYSA-N arsenic atom Chemical compound [As] RQNWIZPPADIBDY-UHFFFAOYSA-N 0.000 description 3
- 239000012148 binding buffer Substances 0.000 description 3
- 230000009920 chelation Effects 0.000 description 3
- 150000001844 chromium Chemical class 0.000 description 3
- 229910001429 cobalt ion Inorganic materials 0.000 description 3
- XLJKHNWPARRRJB-UHFFFAOYSA-N cobalt(2+) Chemical compound [Co+2] XLJKHNWPARRRJB-UHFFFAOYSA-N 0.000 description 3
- 239000005289 controlled pore glass Substances 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 230000001687 destabilization Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- XPOQHMRABVBWPR-ZDUSSCGKSA-N efavirenz Chemical compound C([C@]1(C2=CC(Cl)=CC=C2NC(=O)O1)C(F)(F)F)#CC1CC1 XPOQHMRABVBWPR-ZDUSSCGKSA-N 0.000 description 3
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 3
- OGPBJKLSAFTDLK-UHFFFAOYSA-N europium atom Chemical compound [Eu] OGPBJKLSAFTDLK-UHFFFAOYSA-N 0.000 description 3
- 229960005102 foscarnet Drugs 0.000 description 3
- 229910052733 gallium Inorganic materials 0.000 description 3
- 229910052732 germanium Inorganic materials 0.000 description 3
- GNPVGFCGXDBREM-UHFFFAOYSA-N germanium atom Chemical compound [Ge] GNPVGFCGXDBREM-UHFFFAOYSA-N 0.000 description 3
- 238000013537 high throughput screening Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 230000002427 irreversible effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 239000002071 nanotube Substances 0.000 description 3
- NQDJXKOVJZTUJA-UHFFFAOYSA-N nevirapine Chemical compound C12=NC=CC=C2C(=O)NC=2C(C)=CC=NC=2N1C1CC1 NQDJXKOVJZTUJA-UHFFFAOYSA-N 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 230000005257 nucleotidylation Effects 0.000 description 3
- 230000010287 polarization Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000000159 protein binding assay Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000010791 quenching Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229910052703 rhodium Inorganic materials 0.000 description 3
- 239000010948 rhodium Substances 0.000 description 3
- MHOVAHRLVXNVSD-UHFFFAOYSA-N rhodium atom Chemical compound [Rh] MHOVAHRLVXNVSD-UHFFFAOYSA-N 0.000 description 3
- 229910052706 scandium Inorganic materials 0.000 description 3
- SIXSYDAISGFNSX-UHFFFAOYSA-N scandium atom Chemical compound [Sc] SIXSYDAISGFNSX-UHFFFAOYSA-N 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 229910052711 selenium Inorganic materials 0.000 description 3
- 239000011669 selenium Substances 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 229910052709 silver Inorganic materials 0.000 description 3
- 239000004332 silver Substances 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 229910001631 strontium chloride Inorganic materials 0.000 description 3
- AHBGXTDRMVNFER-UHFFFAOYSA-L strontium dichloride Chemical compound [Cl-].[Cl-].[Sr+2] AHBGXTDRMVNFER-UHFFFAOYSA-L 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 229910052718 tin Inorganic materials 0.000 description 3
- 239000010936 titanium Substances 0.000 description 3
- 229910052719 titanium Inorganic materials 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- 229910052720 vanadium Inorganic materials 0.000 description 3
- GPPXJZIENCGNKB-UHFFFAOYSA-N vanadium Chemical compound [V]#[V] GPPXJZIENCGNKB-UHFFFAOYSA-N 0.000 description 3
- HBOMLICNUCNMMY-XLPZGREQSA-N zidovudine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](N=[N+]=[N-])C1 HBOMLICNUCNMMY-XLPZGREQSA-N 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 2
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 241000701386 African swine fever virus Species 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 2
- 108010076499 DNA polymerase X Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- XPOQHMRABVBWPR-UHFFFAOYSA-N Efavirenz Natural products O1C(=O)NC2=CC=C(Cl)C=C2C1(C(F)(F)F)C#CC1CC1 XPOQHMRABVBWPR-UHFFFAOYSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 2
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 2
- 241000205091 Sulfolobus solfataricus Species 0.000 description 2
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 2
- 241000223257 Thermomyces Species 0.000 description 2
- 241000204666 Thermotoga maritima Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- 241000589500 Thermus aquaticus Species 0.000 description 2
- 241000589498 Thermus filiformis Species 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- WREGKURFCTUGRC-POYBYMJQSA-N Zalcitabine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)CC1 WREGKURFCTUGRC-POYBYMJQSA-N 0.000 description 2
- XLOMVQKBTHCTTD-UHFFFAOYSA-N Zinc monoxide Chemical compound [Zn]=O XLOMVQKBTHCTTD-UHFFFAOYSA-N 0.000 description 2
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 2
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008850 allosteric inhibition Effects 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000149 argon plasma sintering Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 229910052788 barium Inorganic materials 0.000 description 2
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 2
- 230000009137 competitive binding Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000008876 conformational transition Effects 0.000 description 2
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 2
- 229960005319 delavirdine Drugs 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 229940124447 delivery agent Drugs 0.000 description 2
- 239000003398 denaturant Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 229960003804 efavirenz Drugs 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 238000000572 ellipsometry Methods 0.000 description 2
- 230000001036 exonucleolytic effect Effects 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000003100 immobilizing effect Effects 0.000 description 2
- 229940097275 indigo Drugs 0.000 description 2
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 150000008040 ionic compounds Chemical class 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000011898 label-free detection Methods 0.000 description 2
- JTEGQNOMFQHVDC-NKWVEPMBSA-N lamivudine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)SC1 JTEGQNOMFQHVDC-NKWVEPMBSA-N 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 229910044991 metal oxide Inorganic materials 0.000 description 2
- 150000004706 metal oxides Chemical class 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000002061 nanopillar Substances 0.000 description 2
- 239000002073 nanorod Substances 0.000 description 2
- 239000002077 nanosphere Substances 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 238000000059 patterning Methods 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- VCMJCVGFSROFHV-WZGZYPNHSA-N tenofovir disoproxil fumarate Chemical compound OC(=O)\C=C\C(O)=O.N1=CN=C2N(C[C@@H](C)OCP(=O)(OCOC(=O)OC(C)C)OCOC(=O)OC(C)C)C=NC2=C1N VCMJCVGFSROFHV-WZGZYPNHSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 229960000523 zalcitabine Drugs 0.000 description 2
- 229960002555 zidovudine Drugs 0.000 description 2
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical group N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical compound C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- FTBBGQKRYUTLMP-UHFFFAOYSA-N 2-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C1=CC=CN1 FTBBGQKRYUTLMP-UHFFFAOYSA-N 0.000 description 1
- VOTMYTYTEYCEAN-UHFFFAOYSA-N 2-phosphonoacetic acid Chemical compound P(=O)(O)(O)CC(=O)O.P(=O)(O)(O)CC(=O)O VOTMYTYTEYCEAN-UHFFFAOYSA-N 0.000 description 1
- 125000000175 2-thienyl group Chemical group S1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- UDGUGZTYGWUUSG-UHFFFAOYSA-N 4-[4-[[2,5-dimethoxy-4-[(4-nitrophenyl)diazenyl]phenyl]diazenyl]-n-methylanilino]butanoic acid Chemical compound COC=1C=C(N=NC=2C=CC(=CC=2)N(C)CCCC(O)=O)C(OC)=CC=1N=NC1=CC=C([N+]([O-])=O)C=C1 UDGUGZTYGWUUSG-UHFFFAOYSA-N 0.000 description 1
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LHCOVOKZWQYODM-CPEOKENHSA-N 4-amino-1-[(2r,5s)-2-(hydroxymethyl)-1,3-oxathiolan-5-yl]pyrimidin-2-one;1-[(2r,4s,5s)-4-azido-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)SC1.O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](N=[N+]=[N-])C1 LHCOVOKZWQYODM-CPEOKENHSA-N 0.000 description 1
- TZEXGCXFOXXFKH-UHFFFAOYSA-N 5-methyl-1-(4-nitrophenyl)-2-oxopyrido[3,2-b]indole-3-carbonitrile Chemical compound O=C1C(C#N)=CC=2N(C)C3=CC=CC=C3C=2N1C1=CC=C([N+]([O-])=O)C=C1 TZEXGCXFOXXFKH-UHFFFAOYSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- IXQPRUQVJIJUEB-UHFFFAOYSA-N 7-(diethylamino)-n-[2-(2,5-dioxopyrrol-1-yl)ethyl]-2-oxochromene-3-carboxamide Chemical compound O=C1OC2=CC(N(CC)CC)=CC=C2C=C1C(=O)NCCN1C(=O)C=CC1=O IXQPRUQVJIJUEB-UHFFFAOYSA-N 0.000 description 1
- 239000007991 ACES buffer Substances 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 108020004634 Archaeal DNA Proteins 0.000 description 1
- 108020005174 Archaeal RNA Proteins 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 241000713838 Avian myeloblastosis virus Species 0.000 description 1
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N CMP group Chemical group P(=O)(O)(O)OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C(=O)N=C(N)C=C1)O)O IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- PCDQPRRSZKQHHS-XVFCMESISA-N CTP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-XVFCMESISA-N 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 108091008102 DNA aptamers Proteins 0.000 description 1
- 230000030933 DNA methylation on cytosine Effects 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- QGWNDRXFNXRZMB-UUOKFMHZSA-K GDP(3-) Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-K 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000007987 MES buffer Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 241000203375 Methanococcus voltae Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 101100496858 Mus musculus Colec12 gene Proteins 0.000 description 1
- DBXNUXBLKRLWFA-UHFFFAOYSA-N N-(2-acetamido)-2-aminoethanesulfonic acid Chemical compound NC(=O)CNCCS(O)(=O)=O DBXNUXBLKRLWFA-UHFFFAOYSA-N 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- 229940124821 NNRTIs Drugs 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- VEQPNABPJHWNSG-UHFFFAOYSA-N Nickel(2+) Chemical compound [Ni+2] VEQPNABPJHWNSG-UHFFFAOYSA-N 0.000 description 1
- 229910021586 Nickel(II) chloride Inorganic materials 0.000 description 1
- 102000013901 Nucleoside diphosphate kinase Human genes 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 101900050251 Pyrococcus horikoshii DNA polymerase Proteins 0.000 description 1
- 108010021713 Pyrococcus sp GB-D DNA polymerase Proteins 0.000 description 1
- 241001467519 Pyrococcus sp. Species 0.000 description 1
- 241000205192 Pyrococcus woesei Species 0.000 description 1
- 241000204670 Pyrodictium occultum Species 0.000 description 1
- 102000017143 RNA Polymerase I Human genes 0.000 description 1
- 108010013845 RNA Polymerase I Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 238000001237 Raman spectrum Methods 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 206010042618 Surgical procedure repeated Diseases 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 102100032938 Telomerase reverse transcriptase Human genes 0.000 description 1
- 241000204103 Thermococcus fumicolans Species 0.000 description 1
- 241001237851 Thermococcus gorgonarius Species 0.000 description 1
- 241001235254 Thermococcus kodakarensis Species 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- 241001495444 Thermococcus sp. Species 0.000 description 1
- 108010085671 Thermus thermophilus DNA polymerase Proteins 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 101710100179 UMP-CMP kinase Proteins 0.000 description 1
- 101710119674 UMP-CMP kinase 2, mitochondrial Proteins 0.000 description 1
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 description 1
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 1
- 108700002693 Viral Replicase Complex Proteins Proteins 0.000 description 1
- UGWQMIXVUBLMAH-IVVFTGHFSA-N [(1s,4r)-4-[2-amino-6-(cyclopropylamino)purin-9-yl]cyclopent-2-en-1-yl]methanol;4-amino-1-[(2r,5s)-2-(hydroxymethyl)-1,3-oxathiolan-5-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)SC1.C=12N=CN([C@H]3C=C[C@@H](CO)C3)C2=NC(N)=NC=1NC1CC1 UGWQMIXVUBLMAH-IVVFTGHFSA-N 0.000 description 1
- LNUFLCYMSVYYNW-ZPJMAFJPSA-N [(2r,3r,4s,5r,6r)-2-[(2r,3r,4s,5r,6r)-6-[(2r,3r,4s,5r,6r)-6-[(2r,3r,4s,5r,6r)-6-[[(3s,5s,8r,9s,10s,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-3-yl]oxy]-4,5-disulfo Chemical compound O([C@@H]1[C@@H](COS(O)(=O)=O)O[C@@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1[C@@H](COS(O)(=O)=O)O[C@@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1[C@@H](COS(O)(=O)=O)O[C@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1C[C@@H]2CC[C@H]3[C@@H]4CC[C@@H]([C@]4(CC[C@@H]3[C@@]2(C)CC1)C)[C@H](C)CCCC(C)C)[C@H]1O[C@H](COS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@H](OS(O)(=O)=O)[C@H]1OS(O)(=O)=O LNUFLCYMSVYYNW-ZPJMAFJPSA-N 0.000 description 1
- 241000193445 [Clostridium] stercorarium Species 0.000 description 1
- OTXOHOIOFJSIFX-POYBYMJQSA-N [[(2s,5r)-5-(2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(=O)NC(=O)C=C1 OTXOHOIOFJSIFX-POYBYMJQSA-N 0.000 description 1
- MCGSCOLBFJQGHM-SCZZXKLOSA-N abacavir Chemical compound C=12N=CN([C@H]3C=C[C@@H](CO)C3)C2=NC(N)=NC=1NC1CC1 MCGSCOLBFJQGHM-SCZZXKLOSA-N 0.000 description 1
- 229960000531 abacavir sulfate Drugs 0.000 description 1
- WMHSRBZIJNQHKT-FFKFEZPRSA-N abacavir sulfate Chemical compound OS(O)(=O)=O.C=12N=CN([C@H]3C=C[C@@H](CO)C3)C2=NC(N)=NC=1NC1CC1.C=12N=CN([C@H]3C=C[C@@H](CO)C3)C2=NC(N)=NC=1NC1CC1 WMHSRBZIJNQHKT-FFKFEZPRSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000008856 allosteric binding Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000011218 binary composite Substances 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000012575 bio-layer interferometry Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000002772 conduction electron Substances 0.000 description 1
- 238000010226 confocal imaging Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229960000956 coumarin Drugs 0.000 description 1
- 235000001671 coumarin Nutrition 0.000 description 1
- WGHKKEJHRMUKDK-UHFFFAOYSA-N cyclohexa-2,5-dien-1-one Chemical compound O=C1C=CCC=C1 WGHKKEJHRMUKDK-UHFFFAOYSA-N 0.000 description 1
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 1
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 1
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 1
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 1
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 230000008846 dynamic interplay Effects 0.000 description 1
- 238000000835 electrochemical detection Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 229960000366 emtricitabine Drugs 0.000 description 1
- 229940001018 emtriva Drugs 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 229940072253 epivir Drugs 0.000 description 1
- 229940019131 epzicom Drugs 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 125000000219 ethylidene group Chemical group [H]C(=[*])C([H])([H])[H] 0.000 description 1
- PYGWGZALEOIKDF-UHFFFAOYSA-N etravirine Chemical compound CC1=CC(C#N)=CC(C)=C1OC1=NC(NC=2C=CC(=CC=2)C#N)=NC(N)=C1Br PYGWGZALEOIKDF-UHFFFAOYSA-N 0.000 description 1
- 238000000105 evaporative light scattering detection Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000005189 flocculation Methods 0.000 description 1
- 230000016615 flocculation Effects 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 238000002189 fluorescence spectrum Methods 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960000789 guanidine hydrochloride Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000012145 high-salt buffer Substances 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000002847 impedance measurement Methods 0.000 description 1
- 238000001566 impedance spectroscopy Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- AMGQUBHHOARCQH-UHFFFAOYSA-N indium;oxotin Chemical compound [In].[Sn]=O AMGQUBHHOARCQH-UHFFFAOYSA-N 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 229940115474 intelence Drugs 0.000 description 1
- 238000000025 interference lithography Methods 0.000 description 1
- 229960001627 lamivudine Drugs 0.000 description 1
- MHCFAGZWMAWTNR-UHFFFAOYSA-M lithium perchlorate Chemical compound [Li+].[O-]Cl(=O)(=O)=O MHCFAGZWMAWTNR-UHFFFAOYSA-M 0.000 description 1
- 229910001486 lithium perchlorate Inorganic materials 0.000 description 1
- 238000001459 lithography Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000010358 mechanical oscillation Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- DZVCFNFOPIZQKX-LTHRDKTGSA-M merocyanine Chemical compound [Na+].O=C1N(CCCC)C(=O)N(CCCC)C(=O)C1=C\C=C\C=C/1N(CCCS([O-])(=O)=O)C2=CC=CC=C2O\1 DZVCFNFOPIZQKX-LTHRDKTGSA-M 0.000 description 1
- 239000002082 metal nanoparticle Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000002159 nanocrystal Substances 0.000 description 1
- 239000002113 nanodiamond Substances 0.000 description 1
- 239000002107 nanodisc Substances 0.000 description 1
- 229960000689 nevirapine Drugs 0.000 description 1
- QMMRZOWCJAIUJA-UHFFFAOYSA-L nickel dichloride Chemical compound Cl[Ni]Cl QMMRZOWCJAIUJA-UHFFFAOYSA-L 0.000 description 1
- 229910001453 nickel ion Inorganic materials 0.000 description 1
- LQNUZADURLCDLV-UHFFFAOYSA-N nitrobenzene Substances [O-][N+](=O)C1=CC=CC=C1 LQNUZADURLCDLV-UHFFFAOYSA-N 0.000 description 1
- 229910000510 noble metal Inorganic materials 0.000 description 1
- 230000006959 non-competitive inhibition Effects 0.000 description 1
- 229940042402 non-nucleoside reverse transcriptase inhibitor Drugs 0.000 description 1
- QGLKJKCYBOYXKC-UHFFFAOYSA-N nonaoxidotritungsten Chemical compound O=[W]1(=O)O[W](=O)(=O)O[W](=O)(=O)O1 QGLKJKCYBOYXKC-UHFFFAOYSA-N 0.000 description 1
- 239000002726 nonnucleoside reverse transcriptase inhibitor Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 238000010534 nucleophilic substitution reaction Methods 0.000 description 1
- 229940042404 nucleoside and nucleotide reverse transcriptase inhibitor Drugs 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 238000001139 pH measurement Methods 0.000 description 1
- 229910052763 palladium Inorganic materials 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- NMHMNPHRMNGLLB-UHFFFAOYSA-N phloretic acid Chemical compound OC(=O)CCC1=CC=C(O)C=C1 NMHMNPHRMNGLLB-UHFFFAOYSA-N 0.000 description 1
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical compound OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 description 1
- 239000001007 phthalocyanine dye Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- JEXVQSWXXUJEMA-UHFFFAOYSA-N pyrazol-3-one Chemical compound O=C1C=CN=N1 JEXVQSWXXUJEMA-UHFFFAOYSA-N 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003380 quartz crystal microbalance Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000029219 regulation of pH Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 229940064914 retrovir Drugs 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000011896 sensitive detection Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002109 single walled nanotube Substances 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- OSQUFVVXNRMSHL-LTHRDKTGSA-M sodium;3-[(2z)-2-[(e)-4-(1,3-dibutyl-4,6-dioxo-2-sulfanylidene-1,3-diazinan-5-ylidene)but-2-enylidene]-1,3-benzoxazol-3-yl]propane-1-sulfonate Chemical compound [Na+].O=C1N(CCCC)C(=S)N(CCCC)C(=O)C1=C\C=C\C=C/1N(CCCS([O-])(=O)=O)C2=CC=CC=C2O\1 OSQUFVVXNRMSHL-LTHRDKTGSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 229910001427 strontium ion Inorganic materials 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- FIAFUQMPZJWCLV-UHFFFAOYSA-N suramin Chemical compound OS(=O)(=O)C1=CC(S(O)(=O)=O)=C2C(NC(=O)C3=CC=C(C(=C3)NC(=O)C=3C=C(NC(=O)NC=4C=C(C=CC=4)C(=O)NC=4C(=CC=C(C=4)C(=O)NC=4C5=C(C=C(C=C5C(=CC=4)S(O)(=O)=O)S(O)(=O)=O)S(O)(=O)=O)C)C=CC=3)C)=CC=C(S(O)(=O)=O)C2=C1 FIAFUQMPZJWCLV-UHFFFAOYSA-N 0.000 description 1
- 229960005314 suramin Drugs 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 229940054565 sustiva Drugs 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- UVAAUIDYGIWLMB-HGNFPZBQSA-N tagetitoxin Chemical compound C1S[C@@](O)(C(N)=O)[C@H]2[C@H](OC(=O)C)[C@H](N)[C@@H](OP(O)(O)=O)[C@]1(C(O)=O)O2 UVAAUIDYGIWLMB-HGNFPZBQSA-N 0.000 description 1
- UVAAUIDYGIWLMB-UHFFFAOYSA-N tagetitoxin Natural products C1SC(O)(C(N)=O)C2C(OC(=O)C)C(N)C(OP(O)(O)=O)C1(C(O)=O)O2 UVAAUIDYGIWLMB-UHFFFAOYSA-N 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 229960004556 tenofovir Drugs 0.000 description 1
- 229960004693 tenofovir disoproxil fumarate Drugs 0.000 description 1
- GZCRRIHWUXGPOV-UHFFFAOYSA-N terbium atom Chemical compound [Tb] GZCRRIHWUXGPOV-UHFFFAOYSA-N 0.000 description 1
- 239000011206 ternary composite Substances 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- VOBWLFNYOWWARN-UHFFFAOYSA-N thiophen-3-one Chemical class O=C1CSC=C1 VOBWLFNYOWWARN-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229910001432 tin ion Inorganic materials 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000004929 transmission Raman spectroscopy Methods 0.000 description 1
- 239000012780 transparent material Substances 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229940008349 truvada Drugs 0.000 description 1
- 229910001930 tungsten oxide Inorganic materials 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 229940098802 viramune Drugs 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 239000011787 zinc oxide Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/101—DNA polymerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/50—Detection characterised by immobilisation to a surface
- C12Q2565/518—Detection characterised by immobilisation to a surface characterised by the immobilisation of the nucleic acid sample or target
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本发明提供了使用基于聚合酶的结合测序程序确定模板核酸的序列的组合物、方法和系统。检验步骤包括监测在存在一或多种核苷酸条件下聚合酶与模板核酸之间的相互作用。确定序列中下一个正确核苷酸的身份,而不需要通过形成磷酸二酯键在引物结构中掺入任何核苷酸。在检验步骤之后可以使用任选的掺入步骤以使引物延伸一或多个核苷酸,从而增加在随后的检验步骤中可以检验的模板核苷酸。结合测序程序不要求使用标记的核苷酸或聚合酶,但任选可以使用这些试剂。
Description
本申请是2017年8月15日提交的题为“测序核酸的方法和系统”的中国专利申请201780063633.9的分案申请。
相关申请
本申请要求2017年1月17日提交的美国临时申请号62/447,319和2016年8月15日提交的美国临时申请号62/375,379的权益。这些早期申请的公开内容在此以其全部内容并入作参考。
技术领域
本发明公开一般涉及生物技术领域。更特别地,本发明公开涉及核酸测序技术。更特别地,本发明公开涉及结合测序(sequencing-by-binding)技术,其不依赖于核苷酸掺入鉴定下一个正确核苷酸。
发明背景
核酸序列信息的确定现在是生物学和医学研究的重要部分。例如,核酸序列信息有助于鉴别与某些疾病和表型相关的基因,鉴别潜在的药物靶标,以及了解疾病发生和发展的机制。序列信息也是个性化医疗的重要部分,其可用于优化特定对象的疾病的诊断、治疗或预防。
高通量、成本效益好的核酸测序具有开创研究和个性化医疗新时代的潜力。目前有几种商业测序平台可供使用,但对于大众市场的遗传分析仍然非常昂贵。
目前,多种测序技术利用也被称为“合成测序”(SBS)或“掺入测序”的方法。这种方法通常使用聚合酶合成与待测序的模板链互补的DNA链。这种方法可包括提供经用鉴别标签修饰的核苷酸或短寡核苷酸,由此随着合成的进行而检测掺入的核苷酸或寡核苷酸的碱基类型。检测可以是实时检测,其中核苷酸在掺入时被检测到。遗憾的是,实时检测程序有时会存在不准确读取包含高度重复序列和同聚物序列节段的区域的情况。检测也可以在停止和进行步骤中反复进行,其中控制的反应条件和/或试剂在合成期间在指定时间可逆地停止和开始反应。
由于许多合成测序技术基于荧光检测,因此需要对核苷酸进行荧光标记。必要的照射和光学系统可增加系统的复杂性和费用。例如,SBS方法通常需要荧光标记的dNTP用于检测掺入的核苷酸及鉴别模板核酸序列。然而,使用标记的核苷酸在准确性方面具有局限性,因为目前使用标记的核苷酸的SBS反应在几百个碱基之后变得易于出错。当分析整个基因组时,即使1%的误差率也可能损害测序结果的意义。当单个标记的检测失败导致删除错误时或者当检测到杂散分子导致插入误差时,可以降低准确度。脱色的荧光团会导致假阴性。此外,未标记的dNTP(例如杂质或水解产物)对标记的dNTP的污染也可导致假阴性。此外,来自非特异性地结合到结构化表面上的标记的dNTP的杂散信号导致插入误差或高信噪比。使用修饰的核苷酸显著减慢酶动力学,从而使测序反应非常缓慢。SBS程序中标记的核苷酸的另一个挑战是所述标记在掺入和检测后需要被除去或失活,以便可以在没有背景信号的情况中观测下一次加入。因此,为了获得长的读取长度,每次加入之后必须进行几乎100%的化学、酶促或光解步骤以解封底物或者除去染料以进行下一次加入。
下文揭示了一种克服了通常与先前测序技术相关的许多问题的技术方法。
附图简述
图1是示出使用未标记的光学检测方法的实验结果图,其中在结合或检验步骤期间存在或不存在镁
图2是示出使用Bst酶结合动力学测序以使用Bst2.0酶和dNTP确定正确碱基的图。
图3是示出在octet设备(Menlo Park,CA)上使用生物层干涉测量法测定盐浓度对匹配和错配碱基区分效应的影响的图。
图4是示出在洗涤步骤期间,即在聚合酶解离期间,使用phiX_matchC和FP2引物和klenow或Bst2.0酶和SrCl2的碱基区分的图。
图5是示出使用不同浓度的SrCl2(0mM-14mM)洗涤对核酸聚合酶复合物稳定化的影响的图。
图6是示出DNA pol I的3'-5'核酸外切酶活性对测序的影响的图。
图7A和7B是示出使用HIV-1逆转录酶、NNRTI化合物7和指定的dNTP对人ALK门控区域进行测序的图。图7A是示出连续测序循环的时程图。图7B是示出从前一循环中减去背景后各组的循环1-12的图。预期的序列读数是CAGCAGGA(SEQ ID NO:1),观测到的序列读数是CAGCAGG(SEQ ID NO:2)。
图8是示出使用HIV-1逆转录酶、NNRTI化合物18和各种dNTP对人ALK门控区域进行测序的图。
图9是示出使用SPRi生物传感器对phiX_matchA模板测序的传感图。灰色区域相应于正确的碱基call。虚线表示用于确定正确Klenow/dNTP组合结合的强度变化阈值。
图10A、10B和10C是示出使用来自嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)的Bst DNA聚合酶通过切口平移测序dsDNA的图。在结合缓冲液中将具有一个碱基缺口的双链DNA用有或无指定dNTP的Bst DNA Pol处理。将生物传感器移至反应缓冲液中以进行dNTP掺入,然后转移至含有Bst DNA Pol而不含dNTP的反应缓冲液中反应120秒(图10A)或60秒(图10B),用于非模板链的5'-3'核酸外切裂解。作为对照,使用Bst DNA Pol用于结合测序引发的ssDNA模板,掺入dNTP,随后进行5'-3'核酸外切处理60秒(图10C)。
图11A、11B和11C是示出使用大肠杆菌(E.coli)DNA聚合酶的Klenow(3'→5'exo(-))片段通过链置换测序具有5'-flap的dsDNA的图。在没有MgCl2的结合缓冲液中,用有或无指定dNTP的Klenow exo(-)DNA Pol处理DNA模板。将生物传感器移至具有MgCl2的洗涤缓冲液中催化,随后在不含酶或dNTP的结合缓冲液中重新平衡。如所示,对每个单独的dNTP重复进行循环。图11A:单链DNA。图11B:具有一个碱基缺口的双链DNA。图11C:在一个碱基对缺口下游具有5'-寡-dT flap的双链DNA。
图12A、12B和12C是示出通过大肠杆菌聚合酶的Klenow(3′→5′exo(-))片段测序ssDNA由盐组分促进的图。结合缓冲液含有200mM谷氨酸(图12A)、100mM谷氨酸(图12B)和50mM谷氨酸(图12C)。反应缓冲液含无谷氨酸的MgCl2。每个循环使用的dNTP(“dNTP”)在图12A、12B和12C顶部文本行中示出(SEQ ID NO:14)。Klenow(exo(-))的结合表示在图12A(SEQ ID NO:15)、12B(SEQ ID NO:17)和12C(SEQ ID NO:19)的第二行中的观测序列(“观测”)。基于模板的“预期”序列示于图12A(SEQ ID NO:16)、12B(SEQ ID NO:18)和12C(SEQID NO:20)的第三个文本行中。
图13A、13B和13C是通过Klenow exo(-)DNA聚合酶在ALK野生型背景中对人ALKC4493A突变体的有义链的测序图。图13A是表明野生型和C4493A突变体的ssDNA混合物中测序的传感图。图13B是示出在ssDNA混合物中,循环4(T)中所示的C4493A突变体的线性量化及循环3(G)中所示的野生型ALK的线性量化的图。图13C是示出在dsDNA-flap混合物中,循环4(T)示出C4493A突变体的线性量化,循环3(G)示出野生型ALK的粗略线性量化的图。
图14A和14B是二价阳离子介导的Klenow exo(-)和dCTP与人ALK C4493A突变体的结合以及在有或没有催化金属(MgCl2)条件下解离的图。图14A是示出在存在非催化金属条件下与引物/模板结合和解离的图。图14B是示出在存在催化金属条件下与引物/模板结合和解离的图。
图15是人ALK C4493A突变体的Klenow exo(-)测序图,其中结合由低浓度的CoCl2介导,掺入由高浓度的CoCl2介导。
图16是人ALK C4493A突变体的Klenow exo(-)测序图,其中结合由Ni(II)SO4介导,通过MgCl2实现掺入。到基线的解离仅在存在核苷二磷酸激酶和ADP(其清除游离dNTP,从而防止dNTP重新结合到Klenow exo(-)和引物/模板的复合物中)的条件下观测到。
图17A和17B是示出人ALK C4493A突变体的Bsu Pol I(大片段)测序期间的同聚物分辨的图。结合由Ni(II)SO4介导,通过MgCl2掺入,且在dNDP存在或不存在条件下解离。图17A是使用Octet QK系统的测序传感图。图17B是示出两个连续G峰的分辨取决于反应缓冲液中dNDP浓度的图。
图18A、18B、18C、18D和18E是示出人野生型ALK的Bsu Pol I(大片段)测序期间的同聚物分辨的图。图18A是模板ALK-G1、ALK-G2和ALK-G3上Ni增强的聚合酶结合的传感图。图18B是在模板ALK-G4上Ni增强的聚合酶结合的传感图。图18C是加入含有Ni和Mg的反应缓冲液后的掺入/解离时间的传感图。图18D是示出检验相参数相对于填充模板的C同聚物所需的引物链中G核苷酸数目的图。对照是单一G掺入(G),“**”表示有统计学意义的结果,p<0.01。图18E是示出在掺入/解离阶段期间观测的对于指定Bsu聚合酶浓度绘制的初始速率图。对照是单一G掺入(G)。
图19是示出聚合酶结合程度(垂直轴)与反应进程(水平轴)关系的图形干涉测量痕迹。痕迹表示在聚合酶输送剂(PDR)中使用不同浓度的非固定的引发的模板核酸时,与四种不同的生物传感器芯片的结合。在二元复合物形成期结束时测量的信号进展较低,因为PDR中未固定的引发的模板核酸分子浓度增加(即相应于0nM,10nM,100nM和1,000nM浓度的痕迹)。
图20是示出在PDR中使用指定浓度的非固定的引发的模板核酸获得的二元复合物和三元复合物信号量级差异的条形图。包含100nM非固定的引发的模板核酸分子的PDR在信号量级上产生最明显的差异。
图21是例证采用可检测标记的聚合酶的结合测序方案的工作流程图。
图22是呈现荧光强度(垂直轴)与循环次数(水平轴)关系的条形图,其中每次循环均包括每次标记的聚合酶和一个核苷酸的结合。
发明概述
本文提供了用于确定模板核酸分子的序列的方法,其中所述方法基于在特定条件下进行的结合反应。所述方法通常包括在掺入核苷酸之前的检验步骤。检验步骤包括提供用引物引发的模板核酸分子;将引发的模板核酸分子与包含聚合酶和至少一个核苷酸分子的第一反应混合物接触;监测聚合酶与引发的模板核酸分子在所述核苷酸分子存在下的相互作用,在引发的模板核酸中没有化学掺入所述核苷酸分子;及使用监测到的聚合酶与引发的模板核酸分子在所述核苷酸分子存在下的相互作用鉴别模板核酸中的下一个碱基。在这种方法中,三元复合物稳定化和二元复合物去稳定化有利地增强了正确和不正确核苷酸之间的区分。
本发明还提供了确定引发的模板核酸分子的下一个正确核苷酸的身份(identity)的方法。所述方法可包括以下步骤:(a)提供用引物引发的模板核酸分子;(b)在稳定包含引发的模板核酸分子、聚合酶和下一个正确核苷酸的三元复合物的条件下,将引发的模板核酸分子与包含聚合酶和两或三种不同测试核苷酸的不同组合的反应混合物连续接触,同时阻止任何核苷酸掺入引物中;(c)检测聚合酶与引发的模板核酸分子的相互作用,在引发的模板核酸分子的引物中没有化学掺入任何核苷酸,以确定是否形成三元复合物;及(d)使用检测到的相互作用确定至少两种反应混合物中共有的测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。任选地,所述方法进一步包括(e)在步骤(c)之后在引物的3'末端掺入核苷酸。在另一种选择中,掺入的核苷酸是未标记的核苷酸或者是未标记的可逆终止子核苷酸。任选地,可以重复步骤(b)至(e)以对引发的模板核酸分子进行测序。
在一些实施方案中,上述方法的步骤(d)包括使用检测到的相互作用确定两种反应混合物共有的测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。在这个实施方案中,在步骤(b)中,可以将四种不同的反应混合物与引发的模板核酸分子连续接触,其中总计每种不同的核苷酸存在于两种反应混合物中。
在其它实施方案中,上述方法的步骤(d)包括使用检测到的相互作用确定三种反应混合物共有的测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。在这个实施方案中,在步骤(b)中可以将六种不同的反应混合物与引发的模板核酸分子连续接触,其中总计每种不同的核苷酸存在于三种反应混合物中。
在特定实施方案中,步骤(b)的条件还使包含引发的模板核酸分子和聚合酶但不包含下一个正确的核苷酸的二元复合物不稳定。
步骤(b)的三元复合物可以通过在引物的3'末端核苷酸上存在可逆终止子部分而稳定。任选地,在步骤(c)之后,所述方法可包括去除引物3'末端核苷酸上的可逆终止子部分的步骤。在上述确定引发的模板核酸分子的下一个正确核苷酸的身份的方法的一些实施方案中,每种测试核苷酸均是未标记的核苷酸。任选地,聚合酶包括在步骤(c)中被检测的外源标记。可选地或另外,下一个正确的核苷酸包含在步骤(c)中被检测的外源标记。
本发明进一步提供了对引发的模板核酸进行测序的方法。所述方法可包括以下步骤:(a)在聚合酶、引发的模板核酸及与引发的模板核酸的下一个碱基互补的测试核苷酸之间形成稳定的三元复合物的条件下,将引发的模板核酸与聚合酶及两或三种类型的测试核苷酸的第一组合接触;(b)检测所述三元复合物,同时阻止测试核苷酸掺入引物中;(c)使用引发的模板核酸、聚合酶及两或三种类型的测试核苷酸的第二组合重复步骤(a)和(b),其中第二组合不同于第一组合;(d)在步骤(c)之后将与下一个碱基互补的核苷酸掺入引物中;及(e)重复步骤(a)至(d)以鉴别引发的模板核酸的序列。
在上述测序方法的一些实施方案中,第一组合包括两种且仅两种类型的测试核苷酸。任选地,第二组合也可包括两种且仅两种类型的测试核苷酸。
在上述测序方法的一些实施方案中,针对两种类型的测试核苷酸的四个不同组合连续进行步骤(a)和(b),其中将每种不同的核苷酸类型与引发的模板核酸总计接触两次。或者,针对两种类型的测试核苷酸的六个不同组合连续进行步骤(a)和(b),其中每种不同的核苷酸总计呈现三次。
本发明进一步提供了确定引发的模板核酸分子的下一个正确核苷酸的身份的方法。所述方法包括以下步骤:(a)提供用引物引发的模板核酸分子;(b)将来自步骤(a)的引发的模板核酸分子与包含聚合酶和至少一种测试核苷酸的第一反应混合物在以下条件下接触:(i)稳定包含引发的模板核酸分子、聚合酶和下一个正确核苷酸的三元复合物,同时阻止任何核苷酸掺入引物中,和(ii)使包含引发的模板核酸分子和聚合酶但不包含下一个正确核苷酸的二元复合物不稳定;(c)检测(例如监测)聚合酶与引发的模板核酸分子的相互作用,而无任何核苷酸化学掺入引发的模板核酸分子的引物中,以确定步骤(b)中是否形成三元复合物;及(d)使用步骤(c)的结果确定任何测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。根据一个通常优选的实施方案,稳定三元复合物同时阻止任何核苷酸掺入引物的条件可通过在第一反应混合物中包含抑制聚合的非催化金属离子而提供。根据另一个通常优选的实施方案,稳定三元复合物同时阻止任何核苷酸掺入引物中的条件可通过在第一反应混合物中包含聚合酶抑制剂而提供,所述聚合酶抑制剂选自变构聚合酶抑制剂、反竞争性聚合酶抑制剂、竞争性聚合酶抑制剂和非竞争性聚合酶抑制剂。根据另一个通常优选的实施方案,稳定三元复合物同时阻止任何核苷酸掺入引物中的条件可通过在进行步骤(b)之前用可逆终止子核苷酸终止引物而提供。根据另一个通常优选的实施方案,步骤(b)中使二元复合物不稳定的条件可包括浓度为50mM至1,500mM的提供一价阳离子的盐,所述盐包含在第一反应混合物中。更优选地,在步骤(b)中稳定三元复合物及使二元复合物不稳定的反应条件可以使三元复合物的形成较二元络合物的形成增强至少两倍。更优选地,在步骤(b)中稳定三元复合物及使二元复合物不稳定的反应条件可以使三元复合物形成较二元复合物形成增强至少五倍。或者,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-1,500mM的盐时,所述提供一价阳离子的盐可进一步提供谷氨酸阴离子。或者,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-1,500mM的盐时,所述提供一价阳离子的盐的浓度可以为50mM-500mM。更优选地,提供一价阳离子的盐的浓度可以为100mM-300mM。或者,当步骤(b)包括在第一反应混合物中提供一价阳离子的盐浓度为50mM-500mM时,所述第一反应混合物可进一步包括浓度为10mM-1.6M的谷氨酸盐。在这种情况中,谷氨酸盐的浓度可以为80mM-320mM。或者,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-500mM的盐时,所述盐可以是谷氨酸盐。或者,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-500mM的盐时,所述盐可以选自NaCl、KCl、NH2(SO4)和谷氨酸钾。根据另一个实施方案,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-1,500mM的盐时,稳定三元复合物同时阻止任何核苷酸掺入引物的条件可以是由抑制聚合的非催化金属离子提供。根据另一个实施方案,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-1,500mM的盐时,稳定三元复合物同时阻止任何核苷酸掺入引物的条件可以是通过在进行步骤(b)之前用可逆终止子核苷酸终止引物而提供。根据另一个实施方案,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-500mM的盐时,步骤(b)中使二元复合物不稳定的条件可包括200mM的提供一价阳离子的盐。更优选地,所述盐可以选自NaCl、KCl、NH2(SO4)和谷氨酸钾。或者,稳定三元复合物同时阻止任何核苷酸掺入引物的条件可以由抑制聚合的非催化金属离子提供。更优选地,第一反应混合物可包括浓度在10mM和1.6M之间的谷氨酸钾。根据另一个实施方案,当步骤(b)包括在第一反应混合物中提供一价阳离子的浓度为50mM-500mM的盐时,及当步骤(b)中使二元复合物不稳定的条件包括200mM的提供一价阳离子的盐时,稳定三元复合物同时阻止任何核苷酸掺入引物的条件可以通过在进行步骤(b)之前用可逆终止子核苷酸终止引物而提供。根据另一个通常优选的实施方案,第一反应混合物的每个测试核苷酸是不同的未标记的核苷酸。更优选地,每个不同的未标记核苷酸可以是不同的天然核苷酸。或者,聚合酶可包含外源可检测标记。例如,外源可检测标记可包括荧光标记。根据一个不同的优选实施方案,当第一反应混合物的每个测试核苷酸是不同的未标记的核苷酸时,聚合酶可以包含发射信号的可检测标记,且当聚合酶在存在或不存在任何核苷酸的情况中与引发的模板核酸分子复合时,可检测标记的信号发射基本上是一致的。根据另一个通常优选的实施方案,步骤(a)的引发的模板核酸分子固定在固体支持物上的位点上,聚合酶包含发射信号的可检测标记,其中当聚合酶在存在或不存在任何核苷酸的情况中与引发的模板核酸分子复合时,可检测标记的信号发射基本上是一致的,步骤(c)包括测量固体支持物上位点处信号的强度,以及步骤(b)中三元复合物的形成增加是通过在所述位点处信号强度的增加而示出。在这种情况中,固体支持物可以包含在流动池内,可检测标记可以是荧光可检测标记。或者,所述方法可以进一步包括以下步骤:(e)用包含聚合酶、一或多个核苷酸和催化性阳离子的第二反应混合物置换第一反应混合物,由此将一或多个核苷酸至少之一掺入引物中。更优选地,第二反应混合物的一或多个核苷酸包括至少一个可逆终止子核苷酸。更优选地,固体支持物包含在流动池内,及步骤(e)包括通过液体流经流动池而置换第一反应混合物。根据另一个优选的实施方案,当步骤(a)的引发的模板核酸分子固定在固体支持物上的位点时,当聚合酶包括发射信号的可检测标记时,当聚合酶在存在或不存在任何核苷酸条件下与引发的模板核酸分子复合时,可检测标记的信号发射基本上是一致的,当步骤(c)包括测量固体支持物上位点处信号的强度时,当步骤(b)中三元复合物的形成增加通过位点处信号强度增强示出时,及当所述方法进一步包括步骤(e)用包含聚合酶、一或多个核苷酸和催化阳离子的第二反应混合物置换第一反应混合物时,其中一或多个核苷酸中至少之一掺入引物中,所述第二反应混合物可包含均少于100mM的NaCl和KCl。根据另一个优选的实施方案,当步骤(a)的引发的模板核酸分子固定在固体支持物上的位点时,当聚合酶包含发射信号的可检测标记时,当聚合酶与引发的模板核酸分子在存在或不存在任何核苷酸条件下时复合时可检测标记的信号发射是基本上一致的时,当步骤(c)包括测量固体支持物上位点处信号的强度时,当步骤(b)中三元复合物的形成增加通过位点处信号强度的增加示出时,及当所述方法进一步包括步骤(e)用包含聚合酶、一或多个核苷酸和催化阳离子的第二反应混合物置换第一反应混合物时,其中一或多个核苷酸中至少一个掺入引物中,所述第二反应混合物的聚合酶可以是与第一反应混合物的聚合酶不同的聚合酶。在一些实施方案中,可逆终止子核苷酸不包括荧光标记。根据另一个通常优选的实施方案,步骤(a)的引发的模板核酸分子可以固定在流动池内包含的固体支持物的位点上,并且所述方法进一步包括步骤(e)通过液体流经流动池,将第一反应混合物用包含聚合酶、一或多个核苷酸和催化阳离子的第二反应混合物置换,其中一或多个核苷酸中至少一个掺入引物中。根据一个优选的实施方案,第二反应混合物的一或多个核苷酸可包括至少一个可逆终止子核苷酸。根据不同的优选实施方案,第二反应混合物包含均少于100mM的NaCl和KCl。根据不同的优选实施方案,所述方法进一步包括在步骤(c)和步骤(e)之间洗涤固定的引发的模板核酸分子以除去第一反应混合物的至少一种组分的步骤。根据又一个优选的实施方案,第二反应混合物的聚合酶是与第一反应混合物的聚合酶不同的聚合酶。在一些实施方案中,可逆终止子核苷酸不包含荧光标记。根据另一个通常优选的实施方案,步骤(a)的引发的模板核酸分子固定在固体支持物上的位点上,步骤(c)包括测量表示聚合酶与固体支持物的位点上的引发的模板核酸分子相互作用的信号的强度,及步骤(d)包括当测量的信号强度超过预定阈值时,确定第一反应混合物的测试核苷酸之一是引发的模板核酸分子的下一个正确核苷酸。更优选地,在步骤(c)之后和步骤(e)之前包括洗涤固定的引发的模板核酸分子以除去第一反应混合物的至少一种组分的步骤。根据另一个通常优选的实施方案,步骤(a)的引发的模板核酸分子固定在流动池内包含的固体支持物的位点上,所述方法进一步包括以下步骤:在步骤(c)之后洗涤固定的引发的模板核酸分子以除去第一反应混合物的至少一种测试核苷酸的一或多个;在洗涤步骤之后检测(例如监测)聚合酶与固定的引发的模板核酸分子的相互作用,以确定是否仍然存在可能在步骤(b)中形成的任何三元复合物。
本发明进一步提供了将聚合酶和核苷酸输送至固定的核酸特征群的方法,其中每个特征均包括引发的模板核酸分子。所述方法包括以下步骤:(a)将固定的核酸特征群与第一试剂接触,所述第一试剂包含聚合酶、第一核苷酸和至少一种非固定的引发的模板核酸分子,其中第一核苷酸不是第一试剂的任何非固定的引发的模板核酸分子的下一个正确核苷酸,其中所述接触在稳定三元复合物及抑制或阻止聚合酶催化磷酸二酯键形成的条件下进行,且与在不存在第一试剂的非固定的引发的模板核酸分子条件下使用包含聚合酶和第一核苷酸的试剂相比,与引发的模板核酸分子的核苷酸非依赖性聚合酶结合降低。在一些实施方案中,在步骤(a)之后,包括进一步的步骤(b):用包含第一试剂的聚合酶、第二核苷酸和至少一种非固定的引发的模板核酸分子的第二试剂置换第一试剂,其中第一和第二核苷酸彼此不同,其中第二核苷酸不是第二试剂的任何非固定的引发的模板核酸分子的同源核苷酸,其中置换在稳定三元复合物及抑制或阻止聚合酶催化磷酸二酯键形成的条件下进行,及与在不存在第二试剂的非固定的引发的模板核酸分子的条件下使用包含聚合酶和第二核苷酸的试剂相比,与引发的模板核酸分子的核苷酸非依赖性聚合酶结合降低。在一些实施方案中,第一和第二试剂的非固定的引发的模板核酸分子彼此不同。
本发明进一步提供了反应混合物,其包括:(a)多个固定的核酸特征,每个特征包括固定的引发的模板核酸;(b)聚合酶;(c)非固定的引发的模板核酸分子;及(d)核苷酸,其中所述核苷酸不是非固定的引发的模板核酸分子的同源核苷酸,及其中由于存在非固定的引发的模板核酸分子而降低聚合酶与固定的引发的模板核酸的核苷酸非依赖性结合。在一些实施方案中,聚合酶、固定的引发的模板核酸和核苷酸形成稳定的三元复合物,其被抑制或阻止核苷酸掺入固定的引发的模板核酸中。
本发明进一步提供了聚合酶输送试剂,其包括:(a)聚合酶;(b)至少一种非固定的引发的模板核酸分子;及(c)至少一种核苷酸,其中无一核苷酸是任何非固定的引发的模板核酸分子的下一个正确核苷酸。在一些实施方案中,聚合酶输送试剂进一步包括(d)三元复合物稳定剂,其抑制溶液相聚合酶形成磷酸二酯键。在一些实施方案中,所述至少一种核苷酸包含至少一种天然核苷酸。在一些实施方案中,溶液相引发的模板核酸分子包括不超过三种不同类型的引发的模板核酸分子,每种分子具有不同的3'末端核苷酸。在一些实施方案中,所述聚合酶是在Mg2+离子存在下没有催化磷酸二酯键形成活性的突变体聚合酶。
本发明进一步提供了鉴别引发的模板核酸分子的下一个正确核苷酸的方法。所述方法包括步骤(a):提供用引物引发的模板核酸分子,其中所述引物包含附着于其3'末端核苷酸的可逆终止子部分。所述方法还可以包括步骤(b):在催化性金属离子存在下将引发的模板核酸分子与多种聚合酶-核苷酸组合连续接触,且不掺入任何核苷酸。每种组合可包括聚合酶和不同的核苷酸。作为连续接触的结果,形成三元复合物,其包含聚合酶、与聚合酶组合输送的不同核苷酸之一,以及当不同核苷酸之一是下一个正确核苷酸时的引发的模板核酸分子。所述方法还包括步骤(c)检测三元复合物,从而鉴别引发的模板核酸分子的下一个正确核苷酸是组合聚合酶与引发的模板核酸分子接触形成三元复合物的不同核苷酸之一。根据一个通常优选的实施方案,步骤(b)可包括在催化金属离子存在下及不存在抑制掺入的任何非催化离子的条件下将引发的模板核酸分子与多个聚合酶-核苷酸组合连续接触。在一些实施方案中,催化金属离子是镁离子。在一些实施方案中,聚合酶是标记的聚合酶,其包含产生信号的外源可检测标记,其中由标记的聚合酶的标记产生的信号在存在或不存在任何核苷酸时基本上不改变,以及步骤(c)可包括通过检测标记的聚合酶的外源可检测标记而检测所述三元复合物。例如,标记的聚合酶的外源可检测标记不必是构象敏感标记。在此,步骤(b)中所述组合的每个不同核苷酸可以是例如不同的天然核苷酸。在一些实施方案中,当步骤(b)包括在存在催化金属离子及不存在抑制掺入的任何非催化离子的条件下将引发的模板核酸分子与多个聚合酶-核苷酸组合连续接触时,所述组合的每个不同核苷酸可以是具有产生信号的外源可检测标记的不同的标记的核苷酸,其中由不同的标记的核苷酸产生的信号在三元复合物形成之前和之后基本相同。在一些其它实施方案中,当步骤(b)包括在存在催化金属离子及不存在抑制掺入的任何非催化离子的条件下将引发的模板核酸分子与多个聚合酶-核苷酸组合连续接触时,引发的模板核酸分子可以包含在流动池内,及步骤(b)可包括通过一次将多种试剂溶液之一流经流动池以接触引发的模板核酸分子,每种试剂溶液包含多个聚合酶-核苷酸组合之一。在一个优选的实施方案中,引发的模板核酸分子置于流动池内包含的珠上。根据不同的优选实施方案,所述方法进一步包括流经流动池的步骤,在多种试剂溶液的每种试剂流经之间,洗涤缓冲液流经流动池,所述洗涤缓冲液除去不与引发的模板核酸分子组合形成三元复合物的任何聚合酶和不同的核苷酸。根据不同的优选实施方案,所述方法进一步包括步骤(d)剥离缓冲液流经流动池,所述剥离缓冲液解离三元复合物以从引发的模板核酸分子中除去聚合酶和不同核苷酸之一。优选地,本发明公开的方法进一步包括除去附着于引发的模板核酸分子的引物的3'末端核苷酸的可逆终止子部分,以产生包含可延伸引物的引发的模板核酸分子。更优选地,所述方法进一步包括步骤(e)将核苷酸掺入可延伸引物中。在这种情况中,步骤(e)可以包括用不同于步骤(a)的聚合酶的聚合酶掺入。或者,掺入可延伸引物中的核苷酸可包含可逆终止子部分,所述掺入产生封闭的引发的模板核酸分子。根据另一个通常优选的实施方案,聚合酶是包含外源可检测标记的标记的聚合酶。根据另一个通常优选的实施方案,所述组合的每个不同核苷酸是不同的天然核苷酸,或者是不含任何外源荧光部分的不同的未标记的核苷酸类似物。根据另一个通常优选的实施方案,所述组合的每个不同核苷酸是包含产生信号的外源可检测标记的不同的标记的核苷酸,其中由每个不同的标记的核苷酸产生的信号在三元复合物形成之前和之后基本相同。根据另一个通常优选的实施方案,所述多个聚合酶-核苷酸组合由四个聚合酶-核苷酸组合组成。根据另一个通常优选的实施方案,引发的模板核酸分子包含在流动池内,及其中步骤(b)包括通过一次将多种试剂溶液之一流经流动池以连续接触引发的模板核酸分子,每种试剂溶液包含所述多个聚合酶-核苷酸组合之一。根据另一个通常优选的实施方案,所述方法可以进一步包括从引发的模板核酸分子的引物的3'核苷酸去除可逆终止子部分以产生包含可延伸引物的引发的模板核酸分子的步骤。根据另一个通常优选的实施方案,所述方法进一步包括步骤(d)将剥离缓冲液流经流动池,所述剥离缓冲液解离三元复合物以从引发的模板核酸分子中除去聚合酶和不同核苷酸之一。更优选地,所述方法进一步包括以下步骤:(e)除去附着于引发的模板核酸分子的引物的3'末端核苷酸的可逆终止子部分,以产生包含可延伸引物的引发的模板核酸分子。更优选地,所述方法还包括以下步骤:(f)将核苷酸掺入可延伸引物中。更优选地,掺入可延伸引物中的核苷酸可包含可逆终止子部分。更优选地,所述方法可以进一步包括将步骤(a)-(f)重复至少一次以获得模板核酸分子的序列信息。
发明详述
本发明揭示了可用于确定引发的模板核酸分子的核苷酸序列的技术,其中序列中下一个正确核苷酸的鉴别完全不依赖于核苷酸掺入。更特别地,本发明揭示的结合测序方法依赖于三元复合物的形成和检测以鉴别下一个正确的核苷酸。这种方法不同于依赖于鉴别掺入的核苷酸以确定序列信息的合成测序程序。
结合测序程序包括识别下一个模板碱基的“检验”步骤,及将一个或多个互补核苷酸加入至引物3'末端的任选“掺入”步骤。掺入步骤与检验步骤可同时或单独进行。检验步骤包括监测在核苷酸存在下聚合酶与待测序核酸(模板核酸)之间的相互作用。任选地,所述相互作用可以在稳定剂存在下,由此聚合酶-核酸相互作用在下一个正确的核苷酸存在下是稳定的。或者,可以使用具有封闭的3'末端核苷酸的引物稳定三元复合物及阻止掺入反应进行。引发的模板核酸和聚合酶之间的二元复合物可以通过许多不同的方法方便地去稳定化,例如提供高一价阳离子浓度、谷氨酸离子浓度及其组合的条件。
有利地,所述技术可以使用各种类型的核苷酸实施,包括未标记的(例如天然的)核苷酸、具有可检测标记的核苷酸(例如荧光或其它光学可检测标记)或者标记的或未标记的核苷酸类似物(例如含有可逆终止子部分的修饰的核苷酸)。此外,所述技术提供了控制的反应条件、明确的序列测定、低试剂总成本以及低仪器成本。
本发明揭示的技术可以应用于通过任何方式和出于任何原因确定引发的模板核酸的下一碱基的身份的结合反应。所述技术可用于监测DNA聚合酶与互补于引发的模板核酸的下一个正确核苷酸(例如dNTP)的特异性结合,及区分特异性结合与非特异性结合。所述技术可以应用于单核苷酸测定(例如SNP测定),或者任选地应用于使用一次鉴定一个核苷酸的重复循环的更广泛的核酸测序程序。
本发明提供的组合物、系统和方法克服或减少了与目前合成测序方法相关的一或多个问题。本发明提供的方法甚至可以使用没有任何外源可检测标记的天然核苷酸进行。任选地,所述方法在(例如在核苷酸、聚合酶或被测序的模板上)不存在任何可检测标记的情况中进行。当然,标记的核苷酸和/或标记的聚合酶也可用于本发明揭示的方法中。
定义
除非另外定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的含义相同的含义。为清楚起见,以下特定术语具有指定的含义。其它术语在本文的其它部分中定义。
除非上下文另有明确规定,否则单数形式“一个”、“一种”和“所述”包括复数指示物。如在说明书和权利要求中所用,近似的语言可以用于修改任何可以允许变化的定量表示而不会导致与其相关的基本功能的变化。因此,由如术语“大约”修饰的值不限于指定的精确值。除非另有说明,否则在说明书和权利要求中使用的表示成分的数量、性质如分子量、反应条件等的所有数字应理解为在所有情况中均由术语“大约”修饰。因此,除非另有说明,在以下说明书和所附权利要求书中列出的数值参数是近似值,其可以根据本发明寻求获得的所需性质而变化。至少每个数值参数应该至少根据报告的有效数字的个数并通过应用普通的舍入技术来解释。
如本文所使用的,术语“每个”在关于项目集合中使用时,旨在描述集合中的单个项目,但不一定指代集合中的每个项目。如果明确揭示或语境明确另有规定,则可例外。
如本文所用,“结合测序”是指这样的测序技术,其中聚合酶和同源核苷酸与引发的模板核酸的特异性结合用于鉴别待掺入到引发的模板核酸的引物链中的下一个正确核苷酸。特异性结合相互作用不需要导致所述核苷酸化学掺入引物中。在一些实施方案中,特异性结合相互作用先于所述核苷酸化学掺入引物链,或者先于类似的下一个正确核苷酸化学掺入引物。因此,可以在不掺入下一个正确核苷酸的情况中鉴别下一个正确核苷酸。
如本文所用,“稳定”及其语法变化用语意味着保持稳定或限制变动。“稳定”三元复合物是指促进三元复合物存在和防止核苷酸掺入的过程。该术语可以应用于任何多种复合物,包括但不限于二元复合物或三元复合物。例如,稳定的复合物可以是聚合酶、引发的模板核酸分子和同源核苷酸之间的三元复合物。通常,三元复合物的稳定会阻止三元复合物的核苷酸成分掺入三元复合物的引发的核酸成分中。因此,稳定三元复合物可以指促进或延长结合三元复合物成分的非共价相互作用,或者抑制结合三元复合物成分的非共价相互作用的破坏。
如本文所用,“使……不稳定”及其语法变化用语意味着使某物不能继续存在或以其通常的方式活动。使二元复合物“不稳定”是指促进二元复合物的解离或分解的过程。“使……不稳定”还包括抑制或阻止二元复合物形成的过程。
如本文所用,“提供一价阳离子的盐”是离子化合物,其在水溶液中解离以产生具有单正电荷的阳离子。例如,阳离子可以是金属阳离子,其中氧化态为+1。
如本文所用,“谷氨酸盐”是在水溶液中解离以产生谷氨酸阴离子的离子化合物。
如本文所用,提供较二元复合物形成“增强”三元复合物形成的反应条件是指提供使三元复合物与二元复合物信号比率大于1的条件。增强两倍意味着与三元复合物形成相关的信号是与二元复合物形成相关的信号的两倍。
如本文所用,“核酸”或“寡核苷酸”或“多核苷酸”意指共价连接在一起的至少两个核苷酸或其类似物。因此,“核酸”包括DNA、RNA或其任何组合,其可在核酸合成期间被聚合酶作用。该术语包括单链、双链或多链DNA、RNA及其类似物(衍生物)。双链核酸有利地使可能阻碍核酸合成的二级结构最小化。双链核酸可具有切口或单链缺口。核酸可以代表单个、多个或克隆扩增的核酸分子群。
如本文所用,“模板核酸”是待使用任何揭示的方法检测、测序、评估或以其它方式分析的核酸。
如本文所用,“引发的模板核酸”是用引物引发的(即杂交)的模板核酸,其中引物是3'末端具有与模板核酸的至少一部分互补的序列的寡核苷酸。所述引物可任选地具有游离的5'-末端(例如引物与模板非共价结合),或者引物与模板可以是连续的(例如通过发夹结构)。引发的模板核酸包括与模板核酸结合的互补引物。
如本文所用,“下一个模板核苷酸”(或“下一个模板碱基”)是指模板核酸中直接位于杂交的引物3'末端下游的下一个核苷酸(或碱基)。换句话说,下一个模板核苷酸(或碱基)直接位于与引物3'末端杂交的模板链中碱基5'末端的模板链中。
如本文所用,“下一个正确核苷酸”(有时称为“同源”核苷酸)是具有与直接位于杂交的引物的3'末端下游的下一个模板碱基互补的碱基的核苷酸。具有与下一个模板碱基不互补的碱基的核苷酸被称为“不正确”(或“非同源”)核苷酸。
如本文所用,“封闭的引发的模板核酸”是经修饰以防止或阻止在引物的3'末端形成磷酸二酯键的引发的模板核酸。例如,可以通过在引物3'末端的五碳糖的3'或2'位置用封闭基团进行化学修饰来完成封闭。可选地或另外,也可以对核苷酸的氮碱基进行防止或阻止磷酸二酯键形成的化学修饰。包含每种这些类型的封闭基团的可逆终止子核苷酸类似物对于本领域普通技术人员而言是熟知的。在引物的3'末端掺入这些类似物导致封闭的引发的模板核酸。
如本文所用,“核苷酸”是包含氮碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团的分子。该术语包括核糖核苷酸、脱氧核糖核苷酸、经修饰为包含外源标记或可逆终止子的核苷酸,以及核苷酸类似物。
如本文所用,“测试核苷酸”是正在研究其参与三元复合物形成的能力的核苷酸,所述三元复合物还包括引发的模板核酸和聚合酶。
如本文所用,“天然”核苷酸是指天然存在的核苷酸,其不包含外源标记(例如荧光染料或其它标记)或者化学修饰如可以鉴定为核苷酸类似物。可用于进行本发明所述结合测序程序的天然核苷酸的实例包括:dATP(2'-脱氧腺苷-5'-三磷酸),dGTP(2'-脱氧鸟苷-5'-三磷酸),dCTP(2'-脱氧胞苷-5'-三磷酸),dTTP(2'-脱氧胸苷-5'-三磷酸)和dUTP(2'-脱氧尿苷-5'-三磷酸)。
如本文所用,“核苷酸类似物”具有修饰,例如化学部分,其置换和/或修饰天然核苷酸的任何成分(例如氮碱基,五碳糖或磷酸基团)。在核酸聚合反应中,核苷酸类似物可以是由聚合酶可掺入的或不可掺入的。任选地,核苷酸类似物的3'-OH基团用一种部分修饰。所述部分可以是3'可逆或不可逆终止子。核苷酸的碱基可以是任何的腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶或其类似物。任选地,核苷酸具有肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤、硝基吡咯(包括3-硝基吡咯)或硝基吲哚(包括5-硝基吲哚)碱基。核苷酸可包括但不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dUTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。核苷酸也可含有DNA聚合酶、双脱氧核苷酸或2',3'双脱氧核苷酸的终止抑制剂,其缩写为ddNTP(ddGTP,ddATP,ddTTP,ddUTP和ddCTP)。
如本文所用,当关于核苷酸类似物使用术语“封闭部分”时,其是在核酸聚合反应的掺入步骤期间抑制或阻止核苷酸的3'氧(例如当其存在于引物3'末端时通过核苷酸类似物的3'-氧)与第二核苷酸形成共价连接的核苷酸的一部分。可以从核苷酸类似物中除去“可逆终止子”核苷酸的封闭部分以允许核苷酸掺入。这种封闭部分在本文中称为“可逆终止子部分”。
如本文所用,“聚合酶”可以指核酸合成酶,包括但不限于DNA聚合酶、RNA聚合酶、逆转录酶、引发酶和转移酶。通常,聚合酶包括一或多个活性位点,在此可发生核苷酸结合和/或催化核苷酸聚合。聚合酶可以催化核苷酸聚合至与其互补核酸链结合的引物的3'末端。例如,聚合酶催化通过磷酸二酯键将下一个正确核苷酸加入到引物的3'-OH基团,从而将所述核苷酸化学掺入引物中。任选地,聚合酶例如由于如突变或化学修饰的修饰而缺少催化核苷酸聚合功能。任选地,在本发明提供的方法中使用的聚合酶是进行性聚合酶。任选地,本发明提供的方法中使用的聚合酶是分配式(distributive)聚合酶。
如本文所用,“提供”模板、引物、引发的模板核酸或者封闭的引发的模板核酸是指一或多种核酸聚合物的制备或输送例如至反应混合物或反应室中。
如本文所用,“监测”(或有时“测量”)是指检测两种分子种类之间可测量的相互作用或结合的方法。例如,监测可包括检测聚合酶与引发的模板核酸之间的可测量的相互作用,通常在整个过程的不同点。监测可以是间歇的(例如周期性的)或者连续的(例如没有中断),且可以包括获得定量结果。可以通过在结合事件期间的一段时间内检测多个信号进行监测,或者通过在结合事件期间或之后的单个时间点检测信号进行监测。
如本文所用,“接触”是指将试剂混合在一起(例如,混合固定的模板核酸及包含聚合酶的缓冲溶液,或者聚合酶与测试核苷酸的组合),使得可以发生物理结合反应或化学反应。
如本文所用,当用于提及引物和同源核苷酸时,“掺入”或“化学掺入”是指通过形成磷酸二酯键将同源核苷酸与引物连接的方法。
如本文所用,“二元复合物”是聚合酶与引发的模板核酸之间的复合物,其中所述复合物不包括下一个正确核苷酸。
如本文所用,“三元复合物”是聚合酶、引发的模板核酸(例如具有游离3'-OH或封闭的3'位置的引物)及下一个正确核苷酸之间的复合物,所述下一个正确核苷酸直接位于引物的下游并与引发的模板核酸的模板链互补。引发的模板核酸可包含例如具有游离3'-OH的引物或封闭的引物(例如,在3'末端核苷酸的碱基或糖部分上具有化学修饰的引物,其中所述修饰阻止酶促磷酸二酯键形成)。
如本文所用,“催化性金属离子”是指在核酸(例如引物)的3'-OH与进入的核苷酸的磷酸之间形成磷酸二酯键所需的金属离子。“二价催化性金属阳离子”是化合价为2的催化性金属离子。催化性金属离子可以以稳定聚合酶、核苷酸与引发的模板核酸之间形成复合物所需的浓度(称为金属离子的非催化浓度)存在。金属离子的催化浓度是指聚合酶催化核酸(例如引物)的3'-OH基团和进入的核苷酸的磷酸基团之间的反应所需的金属离子的量。
如本文所用,“非催化性金属离子”是指这样的金属离子,其在聚合酶存在下不促进将核苷酸化学掺入引物所需的磷酸二酯键形成。通常,非催化性金属离子是阳离子。非催化性金属离子可以通过聚合酶抑制磷酸二酯键形成,因此可以通过防止核苷酸掺入而稳定三元复合物。与催化性金属离子相比,非催化性金属离子例如可以通过竞争性结合与聚合酶相互作用。“二价非催化性金属离子”是化合价为2的非催化性金属离子。二价非催化性金属离子的实例包括但不限于Ca2+、Zn2+、Co2+、Ni2+和Sr2+。三价Eu3+离子是化合价为3的非催化性金属离子。
如本文所用,“外源标记”是指已被加入至测序试剂中的可检测的化学部分,例如核苷酸或聚合酶(例如DNA聚合酶)。虽然天然dNTP可具有特征性限制的荧光谱,但天然dNTP不包括任何加入的生色或荧光部分。相反,经修饰以包含化学连接子和附着于γ磷酸上的荧光部分的dATP(2'-脱氧腺苷-5'-三磷酸)分子被称作包含外源标记,因为附着的化学成分通常不是核苷酸的一部分。当然,向核苷酸碱基加入可检测标记的化学修饰也被认为是外源标记。同样,经修饰以包含荧光染料的DNA聚合酶(例如,通过附着于作为酶的一级序列一部分的cys残基)也可以称作包含外源标记,因为该标记通常不是聚合酶的一部分。
如本文所用,“聚合酶-核苷酸组合”是指一起使用的(例如,混合在一起及作为混合物或组合输送)聚合酶和核苷酸或核苷酸类似物,其中这两种组分均是组合必需的。
如本文所用,当用于描述聚合酶复合物时,“区分条件”是区分形成二元复合物(聚合酶与没有同源核苷酸的引发的模板核酸分子之间的复合物)和形成三元复合物(聚合酶、引发的模板核酸分子和同源核苷酸之间的复合物)的反应条件。区分条件可以通过多种途径提供,包括:使用盐(例如提供一价阳离子或谷氨酸阴离子的盐),使用经工程化以在非同源核苷酸存在下呈现出低背景结合的聚合酶,温度调节,和/或pH调节等。
如本文所用,“连续地”或“以连续方式”发生意味着一个接一个地顺序发生。在一些实施方案中,相继发生的两个步骤可允许中间步骤或作用(即不一定没有中断)。因此,“连续”或“以连续方式”使核酸分子与两个不同的聚合酶-核苷酸组合接触意指与第一组合接触,然后与第二组合接触。任选地,与引发的模板核酸连续接触的聚合酶-核苷酸组合不会彼此混合。
如本文所用,“流动池”是包含一或多个通道的反应室,其指导液体以预定方式进行所需反应。流动池可以与检测器连接,由此可以观测在反应室中发生的反应。例如,流动池可含有引发的模板核酸分子(或封闭的引发的模板核酸分子),例如附着于固体支持物上,核苷酸和辅助试剂反复应用于其并洗去。流动池可包括透明材料,其允许在发生期望的反应后对样品成像。例如,流动池可以包括含有小液体通道的载玻片,通过该载玻片可以泵送聚合酶、dNTP和缓冲液。通道内的玻璃用待测序的一或多个引发的模板核酸分子进行装饰。可以放置外部成像系统以检测玻璃表面上的分子。流动池中的试剂交换通过将不同的液体试剂经泵送、抽吸或以其它方式“流动”经过流动池而实现。举例的流动池、其制造方法及其使用方法在美国专利申请公开2010/0111768 A1或2012-0270305 A1或WO 05/065814中描述,所述专利均并入本文作参考。
如本文所用,“未标记的”是指不含加入的或外源的标记或标签的分子种类。天然核苷酸是未标记分子种类的实例。
结合测序
本发明描述的是基于聚合酶的核酸结合测序反应,其中聚合酶在反应的不连续步骤期间经历开放和闭合构象之间的构象转变。在一个步骤中,聚合酶与引发的模板核酸结合形成二元复合物,在本文中也称为插入前构象。在随后的步骤中,进入的核苷酸被结合,及聚合酶指闭合,形成包含聚合酶、引发的模板核酸和核苷酸的化学前构象;其中未掺入结合的核苷酸。这个步骤在本文中也称为检验步骤,之后可以是化学掺入步骤,其中形成磷酸二酯键,同时焦磷酸从核苷酸裂解(核苷酸掺入)。聚合酶、引发的模板核酸和新掺入的核苷酸产生化学后翻译前构象。由于化学前构象和易位前构象均包含聚合酶、引发的模板核酸和核苷酸,其中聚合酶处于闭合状态,所以任一构象在本文中可称为三元复合物。然而值得注意的是,磷酸二酯键形成可以通过本文所述的方法阻止,因此所提及的三元复合物必须处于化学前构象。在封闭的插入前状态,二价催化金属离子如Mg2+介导快速化学步骤,包括通过引物末端的3'-羟基亲核取代焦磷酸(PPi)。基于PPi释放,聚合酶回复开放状态,易位后步骤及易位开始下一轮反应。虽然三元复合物可以在不存在二价催化金属离子(例如Mg2 +)的情况中形成,但是其在二价金属离子存在下利于化学加入核苷酸。催化性金属离子(例如Mg2+)的低水平或不足水平趋于导致紧密三元复合物中的下一个正确核苷酸的非共价(物理)隔离。这种三元复合物可称为稳定的或者捕获的三元复合物。在上述任何反应步骤中,聚合酶构型和/或与核酸的相互作用可以在检验步骤期间监测,以鉴别核酸序列中的下一个正确碱基。在掺入之前或之后,可以改变反应条件以使聚合酶与引发的模板核酸脱离,并再次改变为从局部环境中除去任何抑制聚合酶结合的试剂。
一般而言,SBB程序包括识别下一个模板碱基的“检验”步骤,以及任选地将一或多个互补核苷酸加入至引发的模板核酸的引物成分的3'末端的“掺入”步骤。待加入的下一个正确核苷酸的身份在没有或在该核苷酸通过共价键与引物的3'末端化学连接之前确定。检验步骤可包括提供用于该过程的引发的模板核酸,并将引发的模板核酸与聚合酶(例如DNA聚合酶)及正研究可能作为下一个正确核苷酸的一或多个测试核苷酸接触。此外,还有一个步骤包括在存在测试核苷酸下监测或测量聚合酶与引发的模板核酸之间的相互作用。任选地,当引发的模板核酸分子的引物包含阻止进入的核苷酸经酶促掺入引物中的封闭基团时,可以发生相互作用。任选地,所述相互作用可以在存在稳定剂条件下发生,由此聚合酶-核酸相互作用在存在下一个正确核苷酸(即稳定三元复合物的稳定剂)条件下稳定。同样,检验步骤鉴别或确定下一个正确核苷酸的身份,而不需要掺入该核苷酸。换句话说,当使用标记或未标记的核苷酸进行一或多个检验循环时,可以确定下一个正确核苷酸的身份,而不用将所述核苷酸化学掺入引物中。同样,这个方法中使用的聚合酶可以是标记的或未标记的。
尽管为方便起见可描述涉及单一模板核酸分子的方法,但这些方法是示例性的。本发明提供的测序方法容易地包括多个模板核酸,其中多个核酸可以是单个核酸的克隆扩增拷贝,或者不同的核酸,包括组合,例如克隆扩增的不同核酸的群。
检验步骤
检验步骤通常包括以下子步骤:(1)提供引发的模板核酸(即与引物杂交的模板核酸分子,所述引物任选地在其3'末端被封闭以免延伸);(2)将引发的模板核酸与包含聚合酶和至少一种核苷酸的反应混合物接触;(3)在核苷酸存在且任何核苷酸未化学掺入引发的模板核酸的条件下监测聚合酶与引发的模板核酸分子的相互作用;及(4)根据监测的相互作用确定模板核酸中下一个碱基的身份(即下一个正确核苷酸)。任选地,在与任何核苷酸接触之前,引发的模板核酸分子在不存在核苷酸的情况中首先与聚合酶接触。引发的模板核酸的引物可以是可延伸引物。当测试核苷酸的碱基与引发的模板核酸分子的下一个碱基互补时,引发的模板核酸、聚合酶和测试核苷酸可以形成三元复合物。当测试核苷酸的碱基不与引发的模板核酸分子的下一个碱基互补时,引发的模板核酸和聚合酶能够形成二元复合物。任选地,在相对于形成二元复合物更有利于形成三元复合物的条件下进行接触。任选地,通过以下任一方式提供有利于或稳定三元复合物的条件:(1)在引发的模板核酸分子的引物的3'核苷酸上存在可逆终止子部分;或者(2)存在非催化性离子(例如二价非催化性金属离子)。任选地,不利于或者使二元复合物不稳定的条件通过在检验步骤期间在反应混合物中存在一或多种一价阳离子和/或谷氨酸阴离子而提供。确定或鉴别步骤可包括鉴别互补于引发的模板核酸的下一碱基的核苷酸的碱基。任选地,这包括将三元复合物与具有不同核苷酸组成的一或多种洗涤溶液接触,使得三元复合物选择性地维持或解离。
可以控制检验步骤,以便核苷酸掺入得以减弱或完成。如果核苷酸掺入被减弱,则可以进行单独的掺入步骤。所述单独掺入步骤可以不需要监测而完成,因为在检验步骤期间已经鉴别了碱基。如果在检验期间进行核苷酸掺入,则随后的核苷酸掺入可以通过稳定剂减弱,所述稳定剂在掺入后捕获核酸上的聚合酶。可以在掺入步骤中使用可逆终止的核苷酸,以防止在单个循环期间加入多于一个的核苷酸。
结合测序方法允许在不需要标记的核苷酸的情况中控制模板核酸碱基的确定,因为聚合酶与模板核酸之间的相互作用可以在核苷酸上不用标记而监测。控制的核苷酸掺入也可以提供重复和同聚区域的准确序列信息,而无需使用标记的核苷酸。此外,模板核酸分子可以在检验条件下测序,所述检验条件不需要将模板核酸或聚合酶附着于固相支持物上。然而,在某些优选的实施方案中,待测序的引发的模板核酸附着于固体支持物,例如流动池的内表面。本文所述的组合物、方法和系统提供了优于先前系统的许多优点,例如受控的反应条件、序列的明确确定、较长的读取长度、低试剂总成本和低设备成本。
本文进一步提供了用于对模板核酸分子进行测序的方法,包括检验步骤,其包括提供用引物引发的模板核酸分子(即引发的模板核酸分子),将引发的模板核酸分子与包含聚合酶和第一核苷酸分子的第一反应混合物接触,其中当第一核苷酸分子与引发的模板核酸分子的下一个碱基互补时,引发的模板核酸分子、聚合酶和第一核苷酸分子能够形成三元复合物,及其中当第一核苷酸分子与引发的模板核酸分子的下一个碱基不互补时,引发的模板核酸分子和聚合酶能够形成二元复合物。所述方法进一步包括在存在第一核苷酸分子及引发的模板核酸分子的引物中未化学掺入所述第一核苷酸分子的条件下监测聚合酶与引发的模板核酸分子的相互作用,及通过监测的相互作用确定与引发的模板核酸分子的下一个碱基互补的核苷酸的身份。任选地,所述接触在稳定三元复合物形成和使二元复合物形成不稳定的条件下发生。任选地,通过以下任一方式提供稳定三元复合物的条件:(1)在引发的模板核酸分子的引物的3'核苷酸存在可逆终止子部分;或者(2)存在非催化性离子(例如二价非催化性金属离子)。任选地,使二元复合物不稳定的条件通过在检验步骤期间在反应混合物中存在一或多种一价阳离子和/或谷氨酸阴离子而提供。这些步骤可以重复一或多次。例如,接触和监测步骤可以重复一或多次。任选地,使用第一反应混合物重复接触和监测步骤。任选地,使用包含聚合酶和第二核苷酸分子的第二反应混合物重复接触和监测步骤。任选地,使用包含聚合酶和第三核苷酸分子的第三反应混合物重复接触和监测步骤。任选地,使用包含聚合酶和第四核苷酸分子的第四反应混合物重复接触和监测步骤。
本发明还提供了对模板核酸分子进行测序的方法。所述方法包括检验步骤,包括提供用引物引发的模板核酸分子(即引发的模板核酸分子);将引发的模板核酸分子与包含聚合酶、第一核苷酸分子和第二核苷酸分子的反应混合物接触,第一和第二核苷酸分子彼此不同且任选地以不同的浓度同时存在于反应混合物中,其中当第一和/或第二核苷酸分子与引发的模板核酸分子的下一个碱基互补时,引发的模板核酸分子、聚合酶和第一和/或第二核苷酸分子能够形成三元复合物,其中当第一和/或第二核苷酸分子与引发的模板核酸分子的下一个碱基不互补时,引发的模板核酸分子和聚合酶能够形成二元复合物。任选地,所述接触在稳定三元复合物形成及使二元复合物形成不稳定的条件下发生。任选地,所述条件稳定三元复合物形成及使二元复合物形成不稳定。任选地,通过以下任一方式提供稳定三元复合物的条件:(1)在引发的模板核酸分子的引物的3'核苷酸存在可逆终止子部分;或者(2)存在非催化性离子(例如二价非催化性金属离子)。任选地,使二元复合物不稳定的条件通过在检验步骤期间在反应混合物中存在一或多种一价阳离子和/或谷氨酸阴离子而提供。所述方法还包括在存在第一和第二核苷酸分子及未将第一或第二核苷酸分子中的任一个化学掺入引发的模板核酸分子的引物中的条件下监测聚合酶与引发的模板核酸分子的相互作用;及通过监测的相互作用确定所述核苷酸任一是否包含与引发的模板核酸分子的下一个碱基互补的碱基。任选地,反应混合物进一步包括第三核苷酸分子,其中第三核苷酸分子不同于第一和第二核苷酸分子且以与第一和第二核苷酸分子不同的浓度存在于反应混合物中。任选地,反应混合物进一步包括第四核苷酸分子,其中第四核苷酸分子不同于第一、第二和第三核苷酸分子且以不同于第一、第二和第三核苷酸分子的浓度存在于反应混合物中。任选地,第一反应混合物包括一或多个能掺入引发的模板核酸分子的引物中的第一核苷酸分子和一或多个不能掺入引发的模板核酸分子引物中的第一核苷酸分子。任选地,第二反应混合物包含一或多个能掺入引发的模板核酸分子的引物中的第二核苷酸分子和一或多个不能掺入引发的模板核酸分子的引物中的第二核苷酸分子。任选地,第三反应混合物包含一或多个能掺入引发的模板核酸分子的引物中的第三核苷酸分子和一或多个不能掺入引发的模板核酸分子的引物中的第三核苷酸分子。任选地,第四反应混合物包含一或多个能掺入引发的模板核酸分子的引物中的第四核苷酸分子和一或多个不能掺入引发的模板核酸分子的引物中的第四核苷酸分子。
任选地,本发明提供的方法进一步包括洗涤步骤。洗涤步骤可以在该方法任何其它步骤之前或之后进行。任选地,洗涤步骤在监测步骤之前和/或在确定或鉴别步骤之前进行。任选地,洗涤步骤在稳定三元复合物的条件下进行。任选地,所述条件得自在引发的模板核酸分子的引物的3'核苷酸存在可逆终止子部分。任选地,所述条件包括稳定剂。任选地,所述稳定剂是非催化性金属离子(例如二价非催化性金属离子)。非催化性金属离子包括但不限于钙、锶、钪、钛、钒、铬、铁、钴、镍、铜、锌、镓、锗、砷、硒、铑、铕和铽离子。任选地,非催化性金属离子是锶、锡或镍离子中的任何一种。任选地,三元复合物具有半衰期,且洗涤步骤进行的持续时间短于当核苷酸分子提供与引发的模板核酸分子的下一碱基互补的碱基时形成的三元复合物的半衰期。
任选地,在监测步骤之后存在再加载步骤。所述再加载步骤包括在稳定三元复合物及使二元复合物形成不稳定的条件下将引发的模板核酸与包含聚合酶和第一或任选的第二、第三和第四种核苷酸分子的再加载混合物接触。
对检验步骤可以加以控制,部分是通过提供反应条件来防止核苷酸的化学掺入,同时允许确定引发的模板核酸分子的下一个正确碱基的身份。这种反应条件可以称为检验反应条件。任选地,三元复合物在检验条件下形成。任选地,稳定的三元复合物在检验条件下形成或者处于化学前构象。任选地,稳定的三元复合物处于易位前构象,其中内含(enclosed)的核苷酸已被掺入,但三元复合物不允许掺入后续核苷酸。
任选地,检验条件着重于在不同核苷酸存在下聚合酶与引发的模板核酸的亲和性的差异,例如通过使二元复合物不稳定。任选地,检验条件在不同核苷酸存在下导致聚合酶对引发的模板核酸的差异亲和性。例如,在不同核苷酸存在下导致聚合酶对引发的模板核酸的差异亲和性的检验条件包括但不限于高浓度盐和谷氨酸离子。例如,盐可以溶解在水溶液中产生一价阳离子,例如一价金属阳离子(例如钠离子或钾离子)。任选地,提供一价阳离子(例如一价金属阳离子)的盐进一步提供谷氨酸阴离子。谷氨酸离子的来源可以是谷氨酸钾。在一些情况中,可用于改变引发的模板核酸的聚合酶亲和性的谷氨酸钾的浓度为10mM至1.6M的谷氨酸钾,或者10mM至1.6M之间的任何量。任选地,如上所述,高盐是指50至1500mM盐的盐浓度。
检验通常包括检测聚合酶与模板核酸的相互作用。所述检测可包括光学、电学、热学、声学、化学和机械方式。任选地,在洗涤步骤后进行检验,其中洗涤步骤从观测区域除去任何未结合的试剂(例如未结合的聚合酶和/或核苷酸)。任选地,在洗涤步骤期间进行检验,由此聚合酶-核酸或者聚合酶-核酸-核苷酸复合物的解离动力学可用于确定下一碱基的身份。任选地,在加入检验反应混合物(或第一反应混合物)期间进行检验,由此聚合酶与核酸的结合动力学可用于确定核酸的下一个碱基的身份。任选地,检验包括将三元复合物与聚合酶和核酸的二元复合物区分开。任选地,在平衡条件下进行检验,其中测量的亲和性是平衡亲和性。可以相继进行包含不同或相似检验试剂的多个检验步骤,以确定下一个模板碱基的身份。多个检验步骤可用于其中在一个测序反应中同时测序多个模板核酸的情况中,其中不同的核酸对不同的检验试剂反应不同。任选地,多个检验步骤可以提高确定下一个碱基的准确性。
通常,检验步骤包括将聚合酶与包含一或多种核苷酸的反应混合物中的引发的模板核酸的聚合起始位点结合,并监测相互作用。任选地,在减弱或抑制通过聚合酶掺入内含核苷酸的条件下,将核苷酸隔离(sequester)在聚合酶-引发的模板核酸复合物中以形成三元复合物。任选地,通过在引物的3'末端核苷酸存在封闭部分(例如可逆终止子部分)而稳定三元复合物。任选地,加入稳定剂以在存在下一个正确核苷酸的情况中稳定三元复合物。所述三元复合物处于稳定的或聚合酶捕获的化学前构象中。允许掺入内含的核苷酸但不允许掺入后续核苷酸的三元复合物处于稳定或捕获的易位前构象。任选地,通过一或多种方式将聚合酶捕获在其三元复合物中的聚合位点,所述方式包括但不限于聚合酶结构域的交联、聚合酶与核酸的交联、小分子的变构抑制、反竞争性抑制剂、竞争性抑制剂、非竞争性抑制剂,以及变性;其中捕获的三元复合物的形成提供了关于核酸模板的下一个碱基的身份的信息。
一般而言,根据本发明提供的方法,聚合酶在存在至少一种核苷酸分子条件下与引发的模板核酸分子相互作用形成复合物。任选地,所述核苷酸分子是包含与模板核酸分子的碱基(其位于引发的模板核酸分子中引物的3'末端的下游)互补的碱基的核苷酸。任选地,所述核苷酸分子是下一个正确核苷酸(即包括与在引发的模板核酸分子中引物的3'末端下游的模板核酸分子的碱基互补的碱基),所述复合物是包含引发的模板核酸分子、聚合酶及下一个正确核苷酸的三元复合物。任选地,在引发的模板核酸与聚合酶之间形成三元复合物优于形成二元复合物。任选地,所述接触是在稳定三元复合物形成及使二元复合物形成不稳定的条件下进行。任选地,通过以下任一方式提供稳定三元复合物的条件:(1)在引发的模板核酸分子的引物的3'核苷酸存在可逆终止子部分;或者(2)存在非催化性离子(例如二价非催化性金属离子)。任选地,通过在检验步骤期间在反应混合物中存在一或多种一价阳离子和/或谷氨酸阴离子而提供使二元复合物不稳定的条件。在一个优选的实施方案中,当第一反应混合物包含高浓度的盐时,三元复合物的形成可优于二元复合物的形成。任选地,第一反应混合物包含50mM至1500mM的盐以使二元复合物形成不稳定。非常优选的盐浓度为100mM至1500mM,和200mM至1500mM。在某些实施方案中,用于使二元复合物不稳定的盐溶解产生一价离子,例如一价金属阳离子(例如钠离子或钾离子)。在某些情况中,所述盐是谷氨酸盐,其提供一价金属阳离子和谷氨酸阴离子。当第一反应混合物包含具有高pH的缓冲剂时,三元复合物的形成可优于二元复合物的形成。任选地,所述pH为7.4至9.0。对于从极端微生物环境中提取的某些聚合酶而言,当第一反应混合物包含低pH的缓冲剂时,三元复合物的形成可能优于二元复合物的形成。任选地,所述pH为4.0至7.0。反应温度和/或有机和无机添加剂也可用于调节聚合酶与引发的模板核酸分子之间的亲和性。
在本发明提供的测序方法中,在检验步骤中使用的反应混合物可包括1、2、3或4种类型的核苷酸分子。任选地,所述核苷酸选自dATP、dTTP(或dUTP)、dCTP和dGTP。任选地,反应混合物包含一或多种三磷酸核苷酸及一或多种二磷酸核苷酸。任选地,在引发的模板核酸、聚合酶和四种核苷酸分子中任一种之间形成三元复合物,由此可以形成四种类型的三元复合物。
接触步骤
在本发明提供的方法中,引发的模板核酸分子与包含聚合酶和一或多种核苷酸分子的反应混合物的接触优选在稳定三元复合物形成及使二元复合物形成不稳定的条件下进行。这些条件可以由最终用户选择的替代方法提供。
任选地,所述条件包括将引发的核酸分子与调节渗透压的缓冲液接触。任选地,用于检验步骤中的反应混合物包括调节渗透压的缓冲液。任选地,所述缓冲液是高盐缓冲液,其包含浓度为50至1500mM的一价离子,例如一价金属离子(例如钾离子或钠离子)。也非常优选的盐浓度范围为100至1500mM,以及200至1500mM。任选地,所述缓冲液进一步包含谷氨酸离子来源(例如谷氨酸钾)。任选地,稳定三元复合物形成的条件包括将引发的核酸分子与稳定剂接触。任选地,在检验步骤中使用的反应混合物包括稳定剂。任选地,所述稳定剂是非催化性金属离子(例如二价非催化性金属离子)。在这点上使用的非催化性金属离子包括但不限于钙、锶、钪、钛、钒、铬、铁、钴、镍、铜、锌、镓、锗、砷、硒、铑、铕和铽。任选地,在检验反应中提供Ni2+以促进三元复合物形成。任选地,在检验反应中提供Sr2+以促进三元复合物形成。任选地,所述非催化性金属离子是锶、锡或镍。任选地,第一反应混合物包含0.01mM至30mM氯化锶或氯化镍。
任选地,通过使用流动池或流动室(下文中的“流动池”)便于进行接触步骤。流体试剂流经流动池便利地允许试剂交换,所述流动池包含内部固体支持表面(例如平面表面)。固定在流动池内表面上的是待使用本文所述方法对其进行测序或查询的一或多种引发的模板核酸。典型的流动池包括微流体阀,其允许液体试剂(例如本文所论述的“反应混合物”的组分)输送至入口。液体试剂可以通过从出口流出而从流动池除去。
任选地,通过传感器从一个试剂容器经物理转移或转运至另一试剂容器而便于进行接触步骤。塑料多孔板可用作试剂容器。例如,在转运步骤期间,于其上具有固定的引发的模板核酸分子的光学传感器尖端可以从多孔平板的一个孔转运至多孔板的不同孔,连续或间歇监测。
监测步骤
在核苷酸分子的存在下监测或测量聚合酶与引发的模板核酸分子的相互作用可以通过许多不同方式完成。例如,监测可以包括测量引发的模板核酸、聚合酶及四种核苷酸分子中任一种之间的相互作用的结合动力学。在核苷酸分子的存在下监测聚合酶与引发的模板核酸分子的相互作用可以包括测量聚合酶与引发的模板核酸分子之间的平衡结合常数(即在存在四种核苷酸的任一种的条件下聚合酶与模板核酸的平衡结合常数)。因此,例如,所述监测包括测量在存在四种核苷酸中任一种的情况中聚合酶与引发的模板核酸的平衡结合常数。在存在核苷酸分子的情况中监测聚合酶与引发的模板核酸分子的相互作用包括测量在存在四种核苷酸中任一种的情况中聚合酶从引发的模板核酸的解离动力学。任选地,在存在核苷酸分子的情况中监测聚合酶与引发的模板核酸分子的相互作用包括测量闭合复合物解离的解离动力学(即引发的模板核酸、聚合酶与四种核苷酸中任一种的解离)。任选地,测量的结合动力学根据核苷酸分子的身份而不同。任选地,聚合酶对四种类型核苷酸分子的每一种具有不同的亲和性。任选地,聚合酶对于每种类型三元复合物中的四种类型核苷酸分子中的每一种具有不同的解离常数。结合动力学、平衡动力学和解离动力学为本领域已知,且可由本领域技术人员容易地确定。见例如Markiewicz et al.,NucleicAcids Research 40(16):7975-84(2012);Xia et al.,J.Am.Chem.Soc.135(1):193-202(2013);Brown et al.,J.Nucleic Acids,Article ID 871939,11pages(2010);Washington,et al.,Mol.Cell.Biol.24(2):936-43(2004);Walsh and Beuning,J.Nucleic Acids,Article ID 530963,17pages(2012);及Roettger,et al.,Biochemistry47(37):9718-9727(2008),所述文献以其全部内容并入本文作参考。
监测步骤可包括在第一核苷酸分子存在而第一核苷酸分子没有化学掺入引发的模板核酸分子的引物中的条件下监测聚合酶与引发的模板核酸分子的稳态相互作用。任选地,监测包括在第一核苷酸分子存在而第一核苷酸分子没有化学掺入引发的模板核酸分子的引物中的条件下监测聚合酶与引发的模板核酸分子的解离。任选地,所述监测包括在第一核苷酸分子存在而第一核苷酸分子没有化学掺入引发的模板核酸分子的引物中的条件下监测聚合酶与引发的模板核酸分子的结合。同样,这些方法中的测试核苷酸可以是天然核苷酸(即未标记的)、标记的核苷酸(例如荧光标记的核苷酸)或者是核苷酸类似物(例如经修饰以包含可逆终止子部分的核苷酸)。
在本发明提供的测序方法中,在引发的模板核酸分子的引物的3'核苷酸上的化学模块(例如核苷酸的碱基或糖上的可逆终止子部分),或者反应混合物中不存在催化性金属离子,或者聚合酶活性位点中不存在催化性金属离子,均阻止所述核苷酸化学掺入引发的模板核酸的引物中。任选地,在接触步骤的反应混合物中催化性金属离子的螯合阻止所述核苷酸化学掺入引发的模板核酸的引物中。任选地,在下一个正确核苷酸存在下非催化性金属离子作为三元复合物的稳定剂。任选地,接触步骤的反应混合物中的催化性金属离子用非催化性金属离子取代阻止所述核苷酸分子化学掺入引发的模板核酸中。任选地,催化性金属离子是镁。聚合酶的金属离子机制要求可能需要低浓度的金属离子以稳定聚合酶-核苷酸-DNA结合相互作用。见例如Section 27.2.2,Berg JM,Tymoczko JL,Stryer L,Biochemistry 5th Edition,WH Freeman Press,2002。
任选地,在检验步骤期间使用的反应混合物中的低浓度催化性离子阻止所述核苷酸分子化学掺入引发的模板核酸。任选地,低浓度为大约1μM至大约100μM。任选地,低浓度为大约0.5μM至大约5μM。任选地,在检验步骤中使用的反应混合物包括钴离子,掺入步骤包括与包含比第一反应混合物中的钴离子浓度更高浓度的钴离子的掺入反应混合物接触。
在示例的测序反应中,检验步骤包括形成和/或稳定包含聚合酶、引发的模板核酸及核苷酸的三元复合物。监测三元复合物的形成和/或释放的特征以鉴别内含的核苷酸并因此鉴别模板核酸的下一个碱基。三元复合物特征可取决于测序反应组分(例如聚合酶、引物、模板核酸、核苷酸)和/或反应混合物组分和/或条件。任选地,三元复合物处于化学前构象。任选地,三元复合物处于易位前构象。任选地,三元复合物处于易位后构象。
检验步骤包括在核苷酸存在下监测聚合酶与模板核酸的相互作用。可以监测三元复合物的形成。任选地,监测三元复合物形成的不存在。任选地,监测三元复合物的解离。任选地,掺入步骤包括监测核苷酸的掺入。任选地,掺入步骤包括监测不存在核苷酸掺入。
可以监测检验和/或掺入步骤的任何过程。任选地,聚合酶具有可检测标签。任选地,测序反应的组分没有是可检测标记的。任选地,聚合酶上的可检测标签或标记是可移除的。任选地,核苷酸或聚合酶具有可检测标记,然而在测序期间未检测标记。
在可允许或不允许掺入核苷酸的条件下,在正确和不正确核苷酸存在下监测聚合酶对模板核酸的亲和性的变化,可用于确定核酸的序列。可以监测在不同核苷酸包括修饰的或标记的核苷酸存在下聚合酶与模板核酸的亲和性,作为在各种核苷酸存在下聚合酶-核酸相互作用的解离速率。许多标准聚合酶对各种匹配/正确的、错配/不正确的和修饰的核苷酸的亲和性和解离速率为本领域已知。Klenow聚合酶的单分子成像表明模板核酸对于不同核苷酸类型(其中所述核苷酸类型被阻止掺入)的解离速率明显且可测量地不同。
任选地,在引发的模板核酸存在下将特定类型的核苷酸提供给聚合酶。监测反应,其中如果核苷酸是下一个正确核苷酸,则聚合酶可以被稳定以形成三元复合物。如果核苷酸是不正确核苷酸,则仍可形成三元复合物;然而,如果没有稳定剂或反应条件的额外辅助(例如不存在催化离子,聚合酶抑制剂,盐),则三元复合物可能解离。解离速率取决于聚合酶、模板核酸和核苷酸的特定组合的亲和性以及反应条件。任选地,亲和性以解离速率测量。任选地,不同核苷酸对于三元复合物的亲和性是不同的。例如,如果模板核酸中引物3'末端下游的下一个碱基是G,则预期作为解离速率测量的聚合酶-核酸亲和性基于加入的dATP、dCTP、dGTP或dTTP而不同。在这种情况中,dCTP具有最慢的解离速率,其它核苷酸对于相互作用提供不同的解离速率。任选地,解离速率可以根据反应条件而不同,例如稳定剂的存在(例如不存在镁或抑制性化合物)或反应条件(例如核苷酸修饰或修饰的聚合酶)。
一旦确定下一个正确核苷酸的身份,可以在特异性靶向三元复合物形成的条件下将1、2、3、4或更多种核苷酸类型同时导入反应混合物中。任选地,可以从反应混合物中除去过量的核苷酸,并调节反应条件以掺入三元复合物的下一个正确核苷酸。这种测序反应确保每个测序循环仅掺入一个核苷酸。优选地,在掺入步骤中使用可逆终止子核苷酸,及省略任选的洗涤步骤。
鉴别步骤
可以通过监测三元复合物的存在、形成和/或解离确定下一个正确碱基或核苷酸的身份。可以确定下一个碱基的身份,而不将所述下一个正确核苷酸化学掺入引物的3'末端。任选地,下一个碱基的身份通过在存在加入的核苷酸情况中监测聚合酶对引发的核酸模板的亲和性而确定。任选地,在下一个正确核苷酸存在下聚合酶与引发的模板核酸的亲和性可用于确定模板核酸的下一个正确碱基。任选地,在不正确的核苷酸存在下聚合酶对引发的核酸模板的亲和性可用于确定模板核酸的下一个正确碱基。
在某些实施方案中,在聚合酶和多个核苷酸的存在下形成包含引发的模板核酸(或封闭的引发的模板核酸)的三元复合物。参与三元复合物的同源核苷酸任选地通过观测当反应混合物中不存在所述同源核苷酸时发生的复合物的不稳定性而鉴别。这可以通过例如将一种反应混合物换成另一种反应混合物而方便地进行。在此,复合物的丧失是同源核苷酸身份的指征。当引发的模板核酸暴露于不包含所述同源核苷酸的反应混合物时,可发生结合信号(例如与固体支持物上特定位点相关的荧光结合信号)的丧失。任选地,在反应混合物中存在单一核苷酸的情况中,三元复合物的维持也可以表明所述同源核苷酸的身份。
掺入步骤
本文所述测序方法任选地包括掺入步骤。掺入步骤包括在与模板核酸结合的引物的3'末端化学掺入一或多个核苷酸。任选地,在引物的3'末端掺入一或多个核苷酸。在优选的实施方案中,在引物的3'末端仅掺入单一核苷酸。任选地,在引物的3'末端掺入相同种类的多个核苷酸。任选地,在引物的3'末端掺入不同种类的多个核苷酸。或者,掺入的核苷酸可以是未标记的核苷酸、可逆终止子核苷酸或者可检测标记的核苷酸类似物。聚合酶在核苷酸掺入后可以从聚合起始位点解离,或者可以在掺入后保留在聚合起始位点。
掺入反应混合物可以促进掺入反应。任选地,掺入反应混合物具有与检验反应不同的核苷酸组成。例如,检验反应可包括一种类型的核苷酸,掺入反应可包括另一种类型的核苷酸。例如,检验反应包括一种类型的核苷酸,掺入反应包括四种类型的核苷酸,反之亦然。任选地,检验反应混合物由掺入反应混合物改变或置换。任选地,掺入反应混合物包括催化性金属离子(例如二价催化性金属离子)、一价金属阳离子(例如钾离子或钠离子)、谷氨酸离子或其组合。
掺入步骤中使用的核苷酸的性质具有灵活性。例如,至少一个核苷酸可包括3'-羟基,其可以是例如游离的3'-羟基。任选地,至少一个核苷酸分子的3'位置被修饰以包括3'终止子部分。3'终止子部分可以是可逆终止子或者可以是不可逆终止子。任选地,在检验步骤之前或之后置换或除去至少一个核苷酸分子的可逆终止子。
存在于反应混合物中但在三元复合物中不隔离的核苷酸可导致多个核苷酸插入。在化学掺入步骤之前可以采用洗涤步骤,以确保在掺入步骤期间仅在捕获的三元复合物内隔离的核苷酸可用于掺入。任选地,游离核苷酸可以通过酶如磷酸酶除去。捕获的聚合酶复合物可以是三元复合物、稳定的三元复合物或者包含聚合酶、引发的模板核酸和下一个正确核苷酸的三元复合物。
任选地,在掺入步骤期间,将包含在检验步骤的三元复合物内的核苷酸掺入模板核酸引物的3'末端。例如,检验步骤的稳定的三元复合物包含掺入的下一个正确核苷酸。任选地,在检验步骤期间掺入包含在检验步骤的三元复合物内的核苷酸,但是三元复合物不允许掺入随后的核苷酸。在这种情况中,三元复合物在掺入步骤期间释放,从而允许随后的核苷酸掺入。
任选地,掺入步骤包括置换检验步骤中的核苷酸(例如核苷酸是不正确核苷酸)及将另一个核苷酸掺入模板核酸引物的3'末端。掺入步骤可包括释放三元复合物内的核苷酸(例如核苷酸是修饰的核苷酸或核苷酸类似物)及将不同种类的核苷酸掺入引发的模板核酸分子的引物的3'末端。任选地,释放的核苷酸被除去并用含有下一个正确核苷酸的掺入反应混合物置换。例如,掺入的核苷酸可以是可逆终止子核苷酸,例如不包含可检测荧光团的未标记的可逆终止子核苷酸。
合适的掺入反应条件可包括用掺入反应混合物置换检验反应混合物。任选地,将检验反应混合物中存在的核苷酸用掺入反应混合物中的一或多个核苷酸置换。任选地,在掺入步骤期间置换在检验步骤期间存在的聚合酶。通过这种方法,在检验和掺入步骤中可以使用不同类型的聚合酶。任选地,在掺入步骤期间修饰在检验步骤期间存在的聚合酶。任选地,在检验步骤期间存在的一或多种核苷酸在掺入步骤期间被修饰。在检验步骤中存在的反应混合物和/或反应条件在掺入步骤中可以通过任何方式改变。这些方式包括但不限于去除试剂,螯合剂,稀释剂,加入试剂,改变反应条件如电导率或pH,及其任何组合。包括聚合酶、引发的模板核酸和核苷酸的任何组合的反应混合物中的试剂均可在检验步骤和/或掺入步骤期间被修饰。
任选地,在掺入步骤中使用的反应混合物包括竞争性抑制剂,其中竞争性抑制剂降低多次掺入的发生。在一个实施方案中,竞争性抑制剂是不可掺入的核苷酸。在一个实施方案中,竞争性抑制剂是氨基糖苷。竞争性抑制剂能够置换活性位点中的核苷酸或催化性金属离子,由此在第一次掺入后,竞争性抑制剂占据活性位点,阻止第二次掺入。在一些实施方案中,在掺入步骤中导入可掺入核苷酸和竞争性抑制剂,由此可以调节可掺入核苷酸与抑制剂的比例以确保在引物的3'末端掺入单个核苷酸。
任选地,本发明提供的反应混合物包括掺入反应混合物包含至少一种核苷酸分子,其是不可掺入核苷酸或不能掺入核酸链的核苷酸。换句话说,本发明提供的反应混合物可包含一或多种不能掺入引发的模板核酸分子的引物中的核苷酸分子。这种不能掺入的核苷酸包括例如二磷酸核苷酸。例如,核苷酸可含有对三磷酸基团的修饰,使得该核苷酸不可掺入。不可掺入核苷酸的实例可见于美国专利7,482,120,其全部内容并入本文作参考。任选地,引物在其3'末端可不含游离羟基,由此使引物不能掺入任何核苷酸,及因此使任何核苷酸均不可掺入。
在检验步骤中,含有测试核苷酸的反应混合物可任选包含聚合酶抑制剂,以在结合下一个正确核苷酸时在核酸上捕获聚合酶。任选地,聚合酶抑制剂是焦磷酸盐类似物。任选地,聚合酶抑制剂是变构抑制剂。任选地,聚合酶抑制剂是DNA或RNA适体。任选地,聚合酶抑制剂与聚合酶中的催化离子结合位点竞争。任选地,聚合酶抑制剂是逆转录酶抑制剂。聚合酶抑制剂可以是HIV-1逆转录酶抑制剂或者HIV-2逆转录酶抑制剂。HIV-1逆转录酶抑制剂可以是(4/6-卤素/MeO/EtO-取代的苯并[d]噻唑-2-基)噻唑烷-4-酮。
本发明提供的方法可进一步包括在掺入步骤后制备引发的模板核酸分子用于下一个检验步骤。任选地,所述制备包括将引发的模板核酸或者核酸/聚合酶复合物经历一或多个洗涤步骤;温度变化;机械振动;pH变化;或者光学刺激。任选地,洗涤步骤包括将引发的模板核酸或引发的模板核酸/聚合酶复合物与一或多种缓冲剂、去污剂、蛋白质变性剂、蛋白酶、氧化剂、还原剂或者能释放聚合酶内内部交联或者聚合酶与核酸之间交联的其它试剂接触。
任选地,所述方法进一步包括重复检验步骤和掺入步骤以对模板核酸分子进行测序。在进行掺入步骤之前,检验步骤可以重复一或多次。任选地,两个连续检验步骤包括具有不同核苷酸分子的反应混合物。任选地,检验步骤包括使用包含不同核苷酸组合如成对的核苷酸组合的反应混合物。任选地,在将单个核苷酸掺入引发的模板核酸分子之前,将第一反应混合物用包含聚合酶和1、2、3或4种类型的核苷酸分子的第二反应混合物置换。任选地,所述核苷酸分子选自dATP、dTTP(或dUTP)、dCTP和dGTP。
在本发明提供的测序方法中,在掺入步骤之前鉴别下一个碱基,使得掺入步骤不需要标记的试剂和/或监测。因此,在本发明提供的方法中,核苷酸任选地不含有附着的可检测标签或标记。任选地,核苷酸含有可检测标记,但在所述方法中未检测标记。任选地,正确核苷酸不含可检测标记;然而不正确或者下一个碱基的非互补核苷酸含有可检测标记。
在掺入步骤之前,可以将测序反应的检验步骤重复1、2、3、4或更多次。可以重复检验步骤和掺入步骤直至获得希望的模板核酸序列。
三元复合物的形成或者稳定的三元复合物可用于确保每个测序循环仅将一个核苷酸加入模板核酸引物中,其中加入的核苷酸在三元复合物内隔离。每个测序循环的单个核苷酸的控制掺入增强了包含同聚物重复的核酸区域的测序准确度。
反应混合物
核酸测序反应混合物或简称“反应混合物”典型包含一般存在于基于聚合酶的核酸合成反应中的试剂。反应混合物试剂包括但不限于酶(例如聚合酶)、dNTP、模板核酸、引物核酸、盐、缓冲剂、小分子、辅因子、金属和离子。所述离子可以是催化离子、二价催化离子、非催化离子、非共价金属离子或其组合。反应混合物可包括盐,例如NaCl、KCl、乙酸钾、乙酸铵、谷氨酸钾、NH4Cl或(NH4HSO4),其在水溶液中电离产生一价阳离子。反应混合物可包括离子例如Mg2+或Mn2+,Co2+,Cd2+或Ba2+离子的来源。反应混合物可包括锡,Ca2+,Zn2+,Cu2+,Co2+,Fe(II)SO4或Ni2+,或其它二价非催化性金属阳离子,其通过抑制在引发的模板核酸分子与同源核苷酸之间形成磷酸二酯键以稳定三元复合物。
缓冲剂可包括Tris、Tricine、HEPES、MOPS、ACES、MES、基于磷酸盐的缓冲剂和基于乙酸盐的缓冲剂。反应混合物可包括螯合剂,如EDTA、EGTA等。任选地,反应混合物包括交联剂。本文提供了任选地在检验步骤中使用的第一反应混合物,以及在核苷酸掺入期间使用的掺入反应混合物,其可包含一或多种上述物质。在检验期间使用的第一反应混合物在本文中可称为检验反应混合物。任选地,第一反应混合物包含高浓度的盐,高pH值,1、2、3、4或更多种类型的核苷酸,谷氨酸钾,螯合剂,聚合酶抑制剂,催化性金属离子,非催化性金属离子,或其任何组合。第一反应混合物可包含10mM至1.6M的谷氨酸钾(包括10mM-1.6M之间的任何量)。任选地,掺入反应混合物包含催化性金属离子,1、2、3、4或更多种类型的核苷酸,氯化钾,非催化性金属离子,或其任何组合。
本发明提供的方法是在检验步骤期间调节三元复合物的形成和稳定的反应条件下进行。检验步骤的反应条件有利于包含核苷酸的三元复合物形成和/或稳定化,及阻碍二元复合物的形成和/或稳定化。聚合酶与模板核酸之间的二元相互作用可以通过调节测序反应参数如离子强度、pH、温度或其任何组合或者通过在反应中加入二元复合物去稳定剂而操纵。任选地,利用高盐(例如50至1500mM)和/或pH变化使二元复合物不稳定。任选地,无论核苷酸的存在如何,在测序反应的检验或掺入步骤期间,聚合酶与模板核酸之间可形成二元复合物。任选地,所述反应条件有利于三元复合物的稳定及使二元复合物不稳定。例如,检验反应混合物的pH可以从4.0调节到10.0,以有利于三元复合物的稳定和使二元复合物不稳定。任选地,检验反应混合物的pH为4.0至6.0。任选地,检验反应混合物的pH为6.0至10.0。
本发明提供的测序方法以揭示下一个碱基的身份及同时控制核苷酸的化学加入的方式促进聚合酶与核苷酸及模板核酸的相互作用。任选地,所述方法在不存在可检测标记的核苷酸的条件下进行,或在存在标记的核苷酸的条件下进行,其中不检测所述标记。
本发明提供了在检验反应条件下形成和/或稳定三元复合物的方法,所述三元复合物包含与引发的模板核酸结合的聚合酶和内含在聚合酶-模板核酸复合物内的核苷酸。检验反应条件可以抑制或减弱核苷酸掺入。任选地,抑制内含的核苷酸的掺入,将复合物稳定或捕获在化学前构象或三元复合物。任选地,掺入内含的核苷酸并抑制随后的核苷酸掺入。在这种情况中,复合物稳定或捕获在易位前构象。对于本发明提供的测序反应,在检验步骤期间稳定三元复合物,允许受控制的核苷酸掺入。任选地,稳定的三元复合物是这样的复合物,其中在检验步骤期间内含的核苷酸掺入被短暂(例如检验所述复合物,然后掺入所述核苷酸)或永久(例如仅用于检验)减弱。任选地,稳定的三元复合物允许掺入内含的核苷酸,但不允许掺入后续核苷酸。任选地,闭合复合物是稳定的,以便在核苷酸存在下监测聚合酶与模板核酸的任何相互作用,以鉴别模板核酸的下一个碱基。
任选地,内含的核苷酸与三元复合物中模板核酸的结合被明显降低或不能与其结合。任选地,内含的核苷酸在下一个碱基处与模板核酸碱基配对。任选地,聚合酶、核苷酸、引物、模板核酸或其任何组合的身份影响三元复合物中内含的核苷酸与模板核酸之间的相互作用。
任选地,内含的核苷酸与闭合复合物的聚合酶结合。任选地,内含的核苷酸与三元复合物的聚合酶弱相关。任选地,聚合酶、核苷酸、引物、模板核酸或其任何组合的身份影响三元复合物中内含的核苷酸与聚合酶之间的相互作用。对于给定的聚合酶,每个核苷酸对聚合酶的亲和性不同于另一个核苷酸。任选地,这种亲和性部分取决于模板核酸和/或引物。
三元复合物可以短暂形成。任选地,内含的核苷酸是下一个正确核苷酸。在一些方法中,下一个正确核苷酸的存在部分有助于三元复合物的稳定。任选地,内含的核苷酸不是下一个正确核苷酸。
任选地,检验反应条件包括多种引发的模板核酸、聚合酶、核苷酸或其任何组合。任选地,所述多种核苷酸包含1、2、3、4或更多种类型的不同核苷酸,例如dATP、dTTP(或dUTP)、dGTP和dCTP。任选地,所述多种模板核酸是模板核酸的克隆群。
检验反应混合物可包括其它分子,包括但不限于酶。任选地,检验反应混合物包含通常存在于核酸聚合反应中的任何试剂或生物分子。反应成分可包括但不限于盐、缓冲剂、小分子、洗涤剂、聚集剂(crowding agents)、金属和离子。任选地,可以例如通过电、磁和/或振动操纵反应混合物的性质。
核苷酸及核苷酸类似物
任选地,检验步骤的三元复合物包含天然核苷酸或核苷酸类似物或修饰的核苷酸以促进三元复合物的稳定。任选地,核苷酸类似物包含含氮碱基、五碳糖和磷酸基团;其中核苷酸的任何成分均可被修饰和/或置换。核苷酸类似物可以是不可掺入核苷酸。不可掺入核苷酸可以被修饰为在测序方法期间的任何时间点变得可掺入。
核苷酸类似物包括但不限于α-磷酸修饰的核苷酸,α-β核苷酸类似物,β-磷酸修饰的核苷酸,β-γ核苷酸类似物,γ-磷酸修饰的核苷酸,笼闭核苷酸(caged nucleotides)或ddNTP。核苷酸类似物的实例描述于美国专利8,071,755,其全部内容并入本文作参考。
核苷酸类似物可包括可逆地阻止核苷酸掺入在引物3'末端的终止子。一种类型的可逆终止子是3'-O-封闭的可逆终止子。在此,终止子部分与核苷酸的5-碳糖的3'-OH末端的氧原子连接。例如,U.S.7,544,794和U.S.8,034,923(这些专利的公开内容均并入本文作参考)描述了其3'-OH基团被3'-ONH2基团取代的可逆终止子dNTP。另一类型可逆终止子是3'-未封闭的可逆终止子,其中终止子部分与核苷酸的含氮碱基连接。例如,U.S.8,808,989(其公开内容并入本文作参考)揭示了碱基修饰的可逆终止子核苷酸的特定实例,其可以用于本文描述的方法。可以类似用于本文所述方法的其它可逆终止子包括在U.S.7,956,171、U.S.8,071,755和U.S.9,399,798中描述的那些(这些美国专利的公开内容均并入本文作参考)。关于具有终止子的核苷酸类似物的综述见例如Mu,R.,et al.,“The History andAdvances of Reversible Terminators Used in New Generations of SequencingTechnology,”Genomics,Proteomics&Bioinformatics 11(1):34-40(2013)。任选地,在检验步骤期间使用的一或多种天然核苷酸由在掺入步骤期间掺入的第二类型的核苷酸置换。例如,在检验步骤中使用的反应混合物中存在的核苷酸可以被包含可逆终止子部分(例如位于核苷酸分子的碱基或糖上)的核苷酸类似物置换。
任选地,核苷酸类似物具有不可逆地阻止核苷酸掺入引物3'末端的终止子部分。不可逆核苷酸类似物包括2',3'-双脱氧核苷酸、ddNTP(ddGTP,ddATP,ddTTP,ddCTP)。双脱氧核苷酸缺少对于聚合酶介导的合成必需的dNTP的3'-OH基团。
任选地,不可掺入核苷酸包含封闭部分,其在核酸聚合反应的掺入步骤期间抑制或阻止核苷酸与第二核苷酸(引物的3'-OH)形成共价连接。可以从核苷酸中除去封闭部分以允许核苷酸掺入。
任选地,存在于三元复合物中的核苷酸类似物使三元复合物稳定。任选地,核苷酸类似物是不可掺入的。任选地,释放核苷酸类似物及掺入天然核苷酸。任选地,释放三元复合物,修饰核苷酸类似物,及掺入修饰的核苷酸类似物。任选地,在修饰三元复合物中核苷酸类似物和/或使三元复合物中核苷酸类似物不稳定的反应条件下释放三元复合物。
任选地,掺入三元复合物中存在的核苷酸类似物及稳定三元复合物。所述三元复合物可以通过核苷酸类似物稳定,或者例如通过本文揭示的任何稳定方法稳定。任选地,核苷酸类似物不允许掺入后续核苷酸。三元复合物可例如通过本文描述的任何方法释放,及修饰核苷酸类似物。修饰的核苷酸类似物可以允许在其3'末端随后掺入核苷酸。
任选地,在检验步骤期间,核苷酸类似物存在于反应混合物中。例如,在检验步骤期间,反应混合物中存在1、2、3、4或更多种核苷酸类似物。任选地,核苷酸类似物在掺入步骤期间被置换、稀释或隔离。任选地,核苷酸类似物由天然核苷酸置换。天然核苷酸可包括下一个正确核苷酸。任选地,在掺入步骤期间修饰核苷酸类似物。修饰的核苷酸类似物与天然核苷酸可以是相似或相同的。
任选地,核苷酸类似物对聚合酶的结合亲和性不同于天然核苷酸。任选地,核苷酸类似物与天然核苷酸相比,对于下一个碱基具有不同的相互作用。核苷酸类似物和/或不可掺入核苷酸可以与模板核酸的互补碱基碱基配对。
任选地,核苷酸类似物是与聚合酶融合的经修饰的或天然核苷酸。任选地,多种核苷酸类似物包含与多种聚合酶的融合物,其中每种核苷酸类似物包含不同的聚合酶。
可以对核苷酸进行修饰以相对于二元复合物形成有利于形成闭合复合物。核苷酸修饰可以是遗传工程化的。可以选择或修饰核苷酸以对聚合酶具有高亲和性,其中聚合酶在结合模板核酸之前与核苷酸结合。
在三元复合物中捕获聚合酶的任何核苷酸修饰均可用于本文揭示的方法中。核苷酸可以永久或短暂捕获。任选地,核苷酸类似物不是稳定闭合复合物的方式。利用核苷酸类似物的反应中可以组合任何三元复合物稳定方法。
任选地,使得闭合复合物稳定的核苷酸类似物与通常释放三元复合物的反应条件组合。所述条件包括但不限于存在释放剂(例如催化性金属离子,如镁或锰)。任选地,即使存在催化性金属离子,三元配合物也是稳定的。任选地,甚至在核苷酸类似物存在下,释放三元复合物。任选地,闭合复合物的稳定部分取决于稳定试剂和/或释放试剂的浓度和/或身份,以及其任何组合。任选地,使用核苷酸类似物稳定三元复合物与其它用于稳定三元复合物的反应条件组合,包括但不限于隔离、去除、还原、省略和/或螯合催化性金属离子,存在聚合酶抑制剂、交联剂,及其任何组合。
任选地,可以用区分和/或可检测标签或标记对一或多个核苷酸进行标记,但是这种标签或标记在碱基的检验、鉴别或者碱基的掺入期间未检测,及这种标签或标记在本文揭示的测序方法期间未检测。标签可以通过其在荧光、Raman光谱、电荷、质量、折射率、发光、长度或任何其它可测量性质方面的差异来区分。所述标签可以附着于核苷酸上的一或多个不同位置,只要足够维持与聚合酶-核酸复合物结合的保真度以使得可以正确鉴别模板核酸上的互补碱基即可。任选地,所述标签附着于核苷酸的核碱基。在合适的反应条件下,经标签标记的核苷酸可以内含在具有聚合酶和引发的模板核酸的三元复合物中。或者,标签附着于核苷酸的γ磷酸位置。
在多个检验步骤中使用多个核苷酸增强核苷酸鉴别
在检验步骤的每个循环期间,可以使用一种以上的核苷酸进行本发明揭示的结合测序技术。例如,任选地可以使用两种、三种或甚至四种不同的核苷酸进行单一检验步骤。任选地,每个核苷酸是未标记的核苷酸,例如天然核苷酸(即dATP,dGTP,dCTP,dTTP或dUTP)。优选地,引发的模板核酸分子以连续方式与多种反应混合物接触,而不将任何核苷酸掺入引发的模板核酸中。任选地,每种不同的反应混合物包含聚合酶与两或三种不同核苷酸的不同组合。例如,可以有四种不同的反应混合物,其中每种不同的核苷酸(例如dATP,dGTP,dCTP和dTTP)总计存在两次。这可以通过例如使用以下四种核苷酸组合来实现:(dATP和dTTP),(dATP和dGTP),(dTTP和dCTP)和(dGTP和dCTP)。替代方案是组合:(dGTP和dCTP),(dGTP和dTTP),(dATP和dCTP)和(dATP和dTTP)。另一种替代方案是组合:(dATP和dGTP),(dATP和dCTP),(dGTP和dTTP)和(dCTP和dTTP)。检验步骤可以使用两种不同核苷酸的四种组合相继进行(即由此第一组合被第二组合置换,第二组合被第三组合置换,第三组合被第四组合置换)。在这种情况中以及当监测聚合酶与引发的模板核酸的相互作用产生确认结合相互作用的信号时,可以将下一个正确核苷酸鉴别是产生阳性结合信号的两种不同核苷酸组合共有的核苷酸。如果希望每个不同核苷酸在核苷酸组合集合中呈现三次,则示例的组合可以是:(dATP和dTTP),(dATP和dGTP),(dATP和dCTP),(dTTP和dGTP),(dTTP和dCTP),和(dGTP和dCTP)。检验步骤可以使用两种不同核苷酸的六种组合相继进行(即由此第一组合被第二组合置换,第二组合被第三组合置换,第三组合被第四组合置换,第四组合被第五组合置换,第五组合被第六组合置换)。在这种情况中以及当监测聚合酶与引发的模板核酸的相互作用产生确认结合相互作用的信号时,可以将下一个正确核苷酸鉴别是产生阳性结合信号的三种不同核苷酸组合共有的核苷酸。
在检验步骤期间使用一种以上核苷酸的一个优点是涉及可用于在结合测序程序中确立模板序列的确证。当出于这样或那样的原因,单个特定检验步骤仅产生代表结合相互作用的中等信号时,在多于一种核苷酸组合中使用相同核苷酸进行的测试提供了对于每个特定核苷酸一次以上的检测结合相互作用的机会。这样通过减少监测步骤中错误的低或假阴性结果的发生率来增强正确碱基识别。
聚合酶
可用于进行本发明揭示的技术的聚合酶包括天然存在的聚合酶及其任何修饰的变体,包括但不限于突变体、重组体、融合体、遗传修饰、化学修饰、合成物和类似物。天然存在的聚合酶及其修饰的变体不限于保留催化聚合反应能力的聚合酶。任选地,天然存在的和/或其修饰的变体保留催化聚合反应的能力。任选地,天然存在的和/或修饰的变体具有增强其测序DNA能力的特殊性质,包括增强的核酸结合亲和性,降低的核酸结合亲和性,增强的催化速率,降低的催化速率等。突变体聚合酶包括其中一或多个氨基酸由其它氨基酸(天然或非天然存在的氨基酸)置换以及插入或缺失一或多个氨基酸的聚合酶。
修饰的聚合酶包括含有外部标签(例如外源可检测标记)的聚合酶,其可用于监测聚合酶的存在和相互作用。任选地,来自聚合酶的内在信号可用于监测其存在和相互作用。因此,本发明提供的方法可包括通过检测聚合酶内在信号来监测聚合酶、核苷酸和模板核酸的相互作用。任选地,所述内在信号是光散射信号。例如,内在信号包括某些氨基酸如色氨酸的天然荧光,其中聚合酶内在信号的变化可指示三元复合物的形成。
任选地,在检验步骤期间使用的聚合酶是未标记的聚合酶,及在不存在与聚合酶相关的外源可检测标记的条件下进行监测。在特定反应条件下,一些修饰的聚合酶或天然存在的聚合酶可以仅掺入单一核苷酸,且在掺入单一核苷酸后可以保持与引物-模板结合。任选地,聚合酶的拇指和指状结构域由于其在闭合形式聚合酶中是物理接近的而可以形成瞬时或共价交联。交联可以例如通过在拇指和指状结构域上的合适位置的天然或工程化的半胱氨酸形成。
任选地,在检验步骤期间使用的聚合酶包含在使用蛋白质分离技术对聚合酶至少部分纯化之后通过共价键与聚合酶结构化学连接的外源可检测标记(例如荧光标记)。例如,外源可检测标记可以使用聚合酶的游离巯基或游离胺部分与聚合酶化学连接。这可以包括通过半胱氨酸残基的侧链或者通过N-末端的游离氨基与聚合酶的化学连接。在某些优选的实施方案中,附着于聚合酶的荧光标记可用于定位聚合酶,这可能对于确定聚合酶是否已定位于相应于固定的引发的模板核酸的阵列上斑点是重要的。荧光信号不需要且优选不会因为结合任何核苷酸而改变吸收或发射特征。换句话说,在存在和不存在任何被研究作为可能的下一个正确核苷酸的核苷酸的条件下,由标记的聚合酶发射的信号得以一致维持。
如本文所用,术语聚合酶及其变体还指包含彼此连接的至少两个部分的融合蛋白,例如,其中一部分包含可催化核苷酸聚合成核酸链的肽,所述肽与包含第二部分如报告酶或持续合成能力修饰结构域的另一部分连接。例如,T7 DNA聚合酶包含核酸聚合结构域和硫氧还蛋白结合结构域,其中硫氧还蛋白结合增强聚合酶的持续合成能力(processivity)。没有硫氧还蛋白结合,T7 DNA聚合酶是一种分配性聚合酶,具有只有一到几个碱基的持续合成能力。虽然DNA聚合酶的细节不同,但其具有相似的整体的手形形状,具有称为手指、手掌和拇指的特定区域;及在核酸合成期间相似的整体结构转变,包括拇指和/或指状结构域的运动。
DNA聚合酶包括但不限于细菌DNA聚合酶、真核生物DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶和噬菌体DNA聚合酶。细菌DNA聚合酶包括大肠杆菌DNA聚合酶I、II和III、IV和V,大肠杆菌DNA聚合酶的Klenow片段,粪堆梭菌(Clostridium stercorarium)(Cst)DNA聚合酶,热纤梭菌(Clostridium thermocellum)(Cth)DNA聚合酶和硫磺矿硫化叶菌(Sulfolobus solfataricus)(Sso)DNA聚合酶。真核生物DNA聚合酶包括DNA聚合酶α、β、γ、δ、€、η、ζ、λ、σ、μ和k,以及Rev1聚合酶(末端脱氧胞嘧啶转移酶)和末端脱氧核苷酸转移酶(TdT)。病毒DNA聚合酶包括T4 DNA聚合酶,phi-29DNA聚合酶,GA-1,phi-29样DNA聚合酶,PZA DNA聚合酶,phi-15DNA聚合酶,Cpl DNA聚合酶,Cp7 DNA聚合酶,T7 DNA聚合酶和T4聚合酶。其它DNA聚合酶包括热稳定和/或嗜热DNA聚合酶,如水生栖热菌(Thermusaquaticus)(Taq)DNA聚合酶,丝状栖热菌(Thermus filiformis)(Tfi)DNA聚合酶,Thermococcus zilligi(Tzi)DNA聚合酶,嗜热栖热菌(Thermus thermophilus)(Tth)DNA聚合酶,黄栖热菌(Thermus flavusu)(Tfl)DNA聚合酶,伍氏热球菌(Pyrococcus woesei)(Pwo)DNA聚合酶,激烈热球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶及Turbo Pfu DNA聚合酶,斜纹热球菌(Thermococcus litoralis)(Tli)DNA聚合酶,热球菌属(Pyrococcussp.)GB-D聚合酶,海栖热袍菌(Thermotoga maritima)(Tma)DNA聚合酶,嗜热脂肪芽胞杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶,Pyrococcus Kodakaraensis(KOD)DNA聚合酶,Pfx DNA聚合酶,热球菌属(Thermococcus sp.)JDF-3(JDF-3)DNA聚合酶,蛇发女怪热球菌(Thermococcus gorgonarius)(Tgo)DNA聚合酶,Thermococcus acidophilium DNA聚合酶,嗜酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶,热球菌属go N-7DNA聚合酶,隐蔽热网菌(Pyrodictium occultum)DNA聚合酶,沃氏甲烷球菌(Methanococcusvoltae)DNA聚合酶,热自养甲烷球菌(Methanococcus thermoautotrophicum)DNA聚合酶,詹氏甲烷球菌(Methanococcus jannaschii)DNA聚合酶,硫还原球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.Tok Pol),Pyrococcus abyssi DNA聚合酶,Pyrococcushorikoshii DNA聚合酶,岛热球菌(Pyrococcus islandicum)DNA聚合酶,烟生热球菌(Thermococcus fumicolans)DNA聚合酶,敏捷气热菌(Aeropyrum pernix)DNA聚合酶,以及异二聚体DNA聚合酶DP1/DP2。工程化和修饰的聚合酶也可用于本发明揭示的技术中。例如,可以使用修饰的极嗜热海洋古细菌热球菌物种9°N(例如Therminator DNA聚合酶,来自NewEngland BioLabs Inc.;Ipswich,MA)。其它合适的DNA聚合酶包括3PDX聚合酶在U.S.8,703,461中描述,所述专利以其全部内容并入本文作参考。
RNA聚合酶包括但不限于病毒RNA聚合酶如T7 RNA聚合酶,T3聚合酶,SP6聚合酶和Kll聚合酶,真核生物RNA聚合酶如RNA聚合酶I,RNA聚合酶II,RNA聚合酶III,RNA聚合酶IV和RNA聚合酶V,以及古细菌RNA聚合酶。
逆转录酶包括但不限于来自人免疫缺陷病毒1型(PDB 1HMV)的HIV-1逆转录酶,来自人免疫缺陷病毒2型的HIV-2逆转录酶,来自莫洛尼鼠白血病病毒的M-MLV逆转录酶,来自禽类成髓细胞瘤病毒的AMV逆转录酶及维持真核细胞染色体端粒的端粒酶逆转录酶。
任选地,用化学发光标签标记聚合酶,其中监测在适当的发光触发剂存在下以稳定的发光信号作为闭合复合物形成指征。与存在下一个正确核苷酸条件下形成的三元复合物相比,在存在不正确核苷酸条件下聚合酶与模板核酸的不稳定相互作用产生较弱的可测量信号。另外,在触发发光之前的任选洗涤步骤可以基本上除去在稳定的三元复合物中未结合的所有聚合酶分子。
任选地,用光学散射标签标记聚合酶,其中监测稳定的光学散射信号作为三元复合物形成指征。与存在下一个正确核苷酸条件下形成的三元复合物相比,在存在不正确核苷酸条件下聚合酶与核酸的不稳定相互作用产生较弱的可测量信号。
任选地,将聚合酶用等离子体纳米颗粒标签标记,其中监测与在不存在三元复合物或者存在包含不正确核苷酸的三元复合物条件下的等离子体共振不同的等离子体共振的变化,提示三元复合物形成。等离子体共振的变化可以是由于三元复合物中局部电介质环境的变化所致,或者可以是由于等离子体纳米粒子在一组克隆扩增的核酸分子上的同步聚集或者在闭合复合物构型中不同地影响等离子体的另一种方式所致。
任选地,将聚合酶用Raman散射标签标记,其中,监测稳定的Raman散射信号作为三元复合物形成指征。与存在下一个正确核苷酸条件下形成的三元复合物相比,在存在不正确核苷酸条件下聚合酶与核酸的不稳定相互作用产生较弱的可测量信号。
任选地,通过在选择或修饰的具有核苷酸高亲和性的聚合酶上的标签鉴别下一个正确核苷酸,其中聚合酶在结合模板核酸之前结合核苷酸。例如,来自非洲猪瘟病毒的DNA聚合酶X具有改变的底物结合顺序,其中聚合酶首先与核苷酸结合,然后与模板核酸结合。任选地,将聚合酶与每种类型的核苷酸在单独的区室中温育,其中每个区室含有不同类型的核苷酸及其中根据与之温育的核苷酸而用标签不同地标记聚合酶。在这些条件下,未标记的核苷酸与不同标记的聚合酶结合。聚合酶可以是与每种核苷酸类型结合的相同种类的聚合酶,或者与每种核苷酸类型结合的不同聚合酶。差异标记的聚合酶-核苷酸复合物可以同时加入测序反应的任何步骤中。每个聚合酶-核苷酸复合物均与其下一个碱基与聚合酶-核苷酸复合物中的核苷酸互补的模板核酸结合。下一个正确核苷酸通过携带所述核苷酸的聚合酶上的标签鉴别。在非掺入和/或检验条件下可以进行通过标记的聚合酶-核苷酸复合物对下一个模板碱基的询问,其中一旦确定了下一个模板碱基的身份,则该复合物不稳定并被除去、隔离和/或稀释,以确保仅掺入一个核苷酸的方式进行单独的掺入步骤。
在聚合酶上导入可检测标签的常用方法包括与聚合酶的非活性区域中存在的胺或半胱氨酸的化学缀合。这种缀合方法是本领域熟知的。作为非限制性实例,通常使用正-羟基琥珀酰亚胺酯(NHS酯)标记在酶上可能发现的胺基团。半胱氨酸易于与硫醇或马来酰亚胺基团反应,而羧基可通过用EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)活化而与胺反应。任选地,N-羟基琥珀酰亚胺(NHS)化学在其中仅N-末端胺是反应性的pH范围内(例如pH 7)使用,由此每个聚合酶仅加入单个标签。
任选地,附着于聚合酶的标签是电荷标签,由此可以通过测量模板核酸周围的局部电荷密度的变化以电学方式检测稳定的三元复合物的形成。用于检测电荷的方法在本领域中是熟知的,包括如场效应晶体管、介电谱、阻抗测量和pH测量等方法。场效应晶体管包括但不限于离子敏感性场效应晶体管(ISFET)、电荷调制的场效应晶体管、绝缘栅场效应晶体管、金属氧化物半导体场效应晶体管和使用半导体单层壁碳纳米管制造的场效应晶体管。
任选地,电荷标签是等电点低于大约4或高于大约10的肽标签。任选地,包含肽标签的聚合酶的总等电点低于大约5或高于大约9。电荷标签可以是带正电荷或带负电荷的任何部分。电荷标签可以包括其它部分,包括质量(mass)和/或标记如染料。任选地,电荷标签仅在某些反应条件下(例如pH变化)具有正电荷或负电荷。
聚合酶任选地可以用荧光团和/或猝灭剂标记。任选地,用荧光团和/或猝灭剂标记核酸。任选地,用荧光团和/或猝灭剂标记一或多种核苷酸。示例性荧光团包括但不限于荧光纳米晶体;量子点;d-罗丹明受体染料,包括二氯[R110],二氯[R6G],二氯[TAMRA],二氯[ROX]等;荧光素供体染料,包括荧光素,6-FAM等;酞菁染料,如Cy3B;Alexa染料,SETA染料,Atto染料如与Cy3B形成FRET对的atto 647N等。荧光团包括但不限于MDCC(7-二乙氨基-3-[([(2-马来酰亚胺基)乙基]氨基)羰基]香豆素),TET,HEX,Cy3,TMR,ROX,德克萨斯红,Cy5,LC red 705和LC red 640。荧光团及其使用包括附着于聚合酶和其它分子的方法在The MolecularHandbook(Life Technologies,Carlsbad Calif.)andFluorophores Guide(Promega,Madison,WI)中描述,所述文献以其全部内容在此并入本文作参考。示例的猝灭剂包括但不限于ZEN、IBFQ、BHQ-1、BHQ-2、DDQ-I、DDQ-11、Dabcyl、Qxl猝灭剂、Iowa Black RQ和IRDye QC-1。
任选地,构象敏感的染料可以附着在聚合酶活性位点附近而不影响聚合酶的聚合能力或保真性;其中由于三元复合物的形成所致构象变化或极性环境变化反映为染料的荧光或吸光度性质的变化。已知常见荧光团如cy3和荧光素对聚合酶结合和三元复合物形成具有强的溶剂致变色反应,其程度使得可以清晰区分三元复合物与二元聚合酶-核酸复合物的形成。任选地,基于来自构象敏感染料的荧光或吸光度信号的差异,可以区分三元复合物与二元复合物。任选地,可以使用溶剂致变色染料监测构象转变,其中由构象变化诱导的局部极性环境的变化可用作报告信号。溶剂致变色染料包括但不限于Reichart染料,IR44,部花青染料(例如部花青540),4-[2-N-取代-1,4-氢吡啶-4-亚基]亚乙基]环己-2,5-二烯-1-酮,红吡唑啉酮染料,甲亚胺染料,吲哚苯胺染料,二氮杂部花青染料,靛染料如靛蓝,及其它染料以及其混合物等。将染料或荧光团引入聚合酶的特定位点的方法是本领域熟知的。作为非限制性实例,用染料对T7 DNA聚合酶进行位点特异性标记的方法在Yu-ChihTsai,Zhinan Jin,and Kenneth A.Johnson,“Site-Specific Labeling of T7 DNAPolymerase with a Conformationally Sensitive Fluorophore and Its Use inDetecting Single-Nucleotide Polymorphisms,”Analytical Biochemistry 384,no.1(January1,2009):136-44中提供,所述文献以其全部内容并入本文作参考。
任选地,聚合酶在可以感测三元复合物形成的位置用荧光团标记而不干扰反应。聚合酶可以是天然或修饰的聚合酶。修饰的聚合酶包括具有一或多个氨基酸突变、添加和/或缺失的那些。任选地,一或多个但不是全部的半胱氨酸被突变为另一种氨基酸,如丙氨酸。在这种情况中,剩余的一或多个半胱氨酸用于与荧光团的位点特异性缀合。或者,将一或多个氨基酸突变为适于荧光团缀合的反应性氨基酸,如半胱氨酸或包含伯胺的氨基酸。
任选地,在正确核苷酸存在下聚合酶和模板核酸之间的结合可以诱导荧光减少,而与不正确核苷酸的结合导致荧光增加。在存在正确核苷酸下聚合酶和模板核酸之间的结合可以诱导荧光增加,而与不正确核苷酸的结合导致荧光减少。荧光信号可用于监测核苷酸诱导的构象变化的动力学及鉴别模板核酸序列中的下一个碱基。
任选地,聚合酶/核酸相互作用可以通过源自聚合酶或附着于聚合酶的标签例如纳米颗粒标签的散射信号而监测。
如上所述,可以修饰聚合酶以在本文所述测序方法的检验步骤期间促进三元复合物形成和/或稳定。因此,修饰的聚合酶可用于本发明提供的方法中。聚合酶的修饰可包括使三元复合物内的成员与交联剂交联或者在聚合酶内形成二硫键以维持三元复合物。
任选地,半胱氨酸残基被定位以使得当三元复合物形成时,半胱氨酸非常接近以形成至少一个二硫键以将聚合酶捕获在闭合构象中。任选地,聚合酶的手指和拇指结构域被工程化为均含有一或多个半胱氨酸,由此在闭合复合物中,相对手指的半胱氨酸相互作用,形成二硫键并将聚合酶捕获在其闭合构象中。将半胱氨酸导入聚合酶上合适位置以诱导二硫键形成可以使用蛋白质工程领域的技术人员已知的方法完成。可以使用还原剂如2-巯基乙醇(BME)、半胱氨酸-HCl、二硫苏糖醇(DTT)、三(2-羧乙基)膦(TCEP)或其任何组合还原二硫键并释放聚合酶。任选地,在单独的检验步骤中,相继加入核苷酸(一次一种)与半胱氨酸修饰的聚合酶,其中需要利于三元复合物形成和/或稳定的其它检验反应条件是任选的。任选地,在一个检验步骤中组合加入1、2、3、4或更多种核苷酸(例如dATP,dTTP,dCTP和dGTP)以及半胱氨酸修饰的聚合酶,其中需要利于三元复合物形成和/或稳定的其它检验反应条件是任选的。
任选地,半胱氨酸修饰的聚合酶结合模板核酸而不掺入正确核苷酸,同时形成三元复合物。在三元复合物中,聚合酶的半胱氨酸在空间中足够接近以形成至少一个二硫键,从而稳定三元复合物。在这个实例中,聚合酶被捕获并防止核苷酸掺入。
任选地,检验反应混合物中存在的核苷酸是下一个正确核苷酸,且半胱氨酸修饰的聚合酶结合模板核酸并掺入下一个正确核苷酸,形成三元复合物;其中在闭合复合物中,聚合酶的半胱氨酸在空间上足够接近以形成至少一个二硫键,从而稳定三元复合物。在三元复合物稳定和监测后,可以进行掺入步骤,其中还原剂破坏二硫键,从三元复合物释放聚合酶。然后可以除去、稀释或隔离还原剂,及可以进行另一检验步骤。
任选地,二硫化物稳定的三元复合物的核苷酸在三元复合物稳定之前或期间掺入。可以通过还原二硫键进行掺入步骤,以允许随后的核苷酸掺入和/或另外的检验步骤。
任选地,在检验步骤期间将一个核苷酸加入反应混合物中。任选地,在检验步骤期间将1、2、3、4或更多种核苷酸加入反应混合物中。任选地,下一个正确核苷酸包含在三元复合物中。任选地,在三元复合物内包含不正确核苷酸。
任选地,聚合酶可在形成三元复合物后自身形成二硫键。在形成三元复合物后,聚合酶可与引发的模板核酸形成二硫键。三元复合物可包含与引发的模板核酸的下一个碱基配对的和/或掺入引发的模板核酸引物中的下一个正确核苷酸。任选地,三元复合物包含不正确核苷酸,其中与下一碱基的结合和/或掺入是减弱的。
任选地,通过涉及三元复合物的聚合酶的交联方法稳定聚合酶。交联方法不需要是可逆的,因为可以使用其它手段使聚合酶与核酸解除结合,例如酶促或化学裂解、变性或其任何组合。变性剂包括但不限于酸,例如乙酸或三氯乙酸;溶剂如乙醇或甲醇;离液剂,如尿素、盐酸胍、高氯酸锂等;表面活性剂如十二烷基硫酸钠;或其任何组合。化学裂解包括使用一或多种天然的、修饰的或可商购的蛋白酶。用于释放交联的聚合酶的其它方法包括但不限于改变pH、温度、离子强度或其任何组合。
在反应的检验步骤期间形成三元复合物而不掺入内含的核苷酸。任选地,在任何时间点的检验反应混合物包含交联剂,其中三元复合物是交联的。在这个实例中,聚合酶被捕获并防止核苷酸掺入。任选地,检验反应混合物中存在的核苷酸是下一个正确核苷酸,聚合酶与模板核酸结合并掺入下一个正确核苷酸,形成三元复合物;其中,在三元复合物中,交联剂可用于捕获三元复合物。在三元复合物稳定和监测之后,可以进行掺入步骤,其中三元复合物从其闭合构象中释放。任选地,形成三元复合物,及将下一个正确核苷酸掺入模板核酸引物中。交联抑制聚合酶易位至下一个碱基位置,且不能加入下一个核苷酸直至聚合酶不再交联。任选地,交联稳定的三元复合物的核苷酸在三元复合物稳定之前或期间掺入。掺入步骤可以通过裂解键连和/或使聚合酶变性进行,以允许随后的核苷酸掺入和/或另外的检验步骤。
任选地,聚合酶可在形成三元复合物后自身交联因此,聚合酶可在形成三元复合物后与引发的模板核酸交联。三元复合物可包含下一个正确核苷酸,其与引发的模板核酸的下一个碱基碱基配对和/或掺入引发的模板核酸的引物。任选地,三元复合物包含其与下一个碱基的结合和/或掺入被减弱的不正确核苷酸。
任选地,修饰聚合酶以相对于形成二元复合物有利于形成闭合复合物。聚合酶修饰可以是基因工程的。可以基于聚合酶与模板核酸的选择性结合亲和性加以选择聚合酶。可以选择或修饰聚合酶以对核苷酸具有高亲和性,其中聚合酶在结合模板核酸之前与核苷酸结合。例如,来自非洲猪瘟病毒的DNA聚合酶X具有改变的底物结合顺序,其中聚合酶首先与核苷酸结合,然后与模板核酸结合。首先与核苷酸结合的聚合酶可用于开发新的测序方案。可以设计聚合酶修饰以在本发明公开的方法中将聚合酶捕获在三元复合物中。聚合酶可以永久或短暂捕获。
任选地,允许稳定三元复合物的修饰聚合酶与反应条件组合,通常释放三元复合物,包括但不限于存在释放试剂(例如催化性金属离子,如镁或锰)。任选地,即使在催化性金属离子存在下,三元复合物也是稳定的。任选地,即使在交联剂存在下也释放三元复合物。任选地,闭合复合物的稳定部分地依赖于稳定试剂和/或释放试剂的浓度和/或特性,以及其任何组合。任选地,使用一或多种修饰的聚合酶稳定三元复合物与另外的反应条件组合以稳定三元复合物,包括但不限于隔离、除去、减少、省略和/或螯合催化性金属离子;存在聚合酶抑制剂或不可掺入核苷酸;及其任何组合。
聚合酶输送试剂
一方面,本发明揭示的技术涉及将聚合酶和核苷酸递送至固定的核酸特征群的方法,其中每个特征包括一或多种引发的模板核酸分子。所述方法包括使固定的核酸特征群与第一试剂接触的步骤,所述第一试剂包括聚合酶、第一核苷酸和至少一种在溶液中游离的非固定的引发的模板核酸分子。第一试剂的第一核苷酸不是第一试剂的任何非固定的引发的模板核酸分子的下一个正确核苷酸。同样,接触步骤在稳定三元复合物及抑制或阻碍聚合酶催化磷酸二酯键形成的条件下进行。通过这个程序,与在不存在所述第一试剂的所述非固定的引发的模板核酸分子的条件下使用含有聚合酶和第一核苷酸的试剂相比,与引发的模板核酸分子的核苷酸非依赖性聚合酶结合以形成二元复合物是降低的。在该技术的一个实施方案中,具有用第二试剂置换第一试剂的进一步的步骤,所述第二试剂包含第一试剂的相同类型的聚合酶、第二核苷酸和至少一种在溶液中游离的非固定的引发的模板核酸分子。在此第一和第二核苷酸彼此不同。第二核苷酸不是第二试剂的任何非固定的引发的模板核酸分子的同源核苷酸。同样,置换步骤在稳定三元复合物并抑制或阻碍聚合酶催化磷酸二酯键形成的条件下进行。在这种情况中,与在不存在所述第二试剂的非固定的引发的模板核酸分子的情况中使用包含聚合酶和第二核苷酸的试剂相比,与引发的模板核酸分子的核苷酸非依赖性聚合酶结合(形成二元复合物)是降低的。任选地,第一和第二试剂的非固定的引发的模板核酸分子彼此不同。
另一方面,本发明揭示了反应混合物。所述反应混合物包含:多个固定的核酸特征,其中每个特征包括固定的引发的模板核酸;聚合酶;非固定的引发的模板核酸分子(即在溶液中游离);及核苷酸。所述核苷酸不是非固定的引发的模板核酸分子的同源核苷酸。同样,由于非固定的引发的模板核酸分子的存在,降低了聚合酶与固定的引发的模板核酸的核苷酸非依赖性结合(形成二元复合物)。在一个优选的实施方案中,聚合酶、固定的引发的模板核酸和核苷酸形成稳定的三元复合物,其被抑制或阻碍将所述核苷酸掺入固定的引发的模板核酸。
另一方面,本发明揭示了一种聚合酶输送剂,其包含聚合酶、至少一种非固定的引发的模板核酸分子及至少一种核苷酸。在此,无一核苷酸是任何非固定的引发的模板核酸分子的下一个正确核苷酸。任选地,聚合酶输送剂还包含三元复合物稳定剂,其抑制通过溶液相聚合酶的磷酸二酯键形成。任选地,所述至少一种核苷酸包括至少一种天然核苷酸。任选地,溶液相引发的模板核酸分子包括不超过三种不同类型的引发的模板核酸分子,每种分子具有不同的3'末端核苷酸。例如,聚合酶任选地是在存在Mg2+离子条件下没有催化磷酸二酯键形成活性的突变体聚合酶。
稳定三元复合物的聚合酶抑制剂的应用
通过在检验反应混合物中加入聚合酶抑制剂形成和/或稳定三元复合物。抑制剂分子膦酰基乙酸酯(膦酰基乙酸)和膦酰基甲酸酯(膦酰甲酸,通用名Foscarnet)、Suramin、氨基糖苷、INDOPY-1和Tagetitoxin是聚合酶活性的非竞争性或反竞争性抑制剂的非限制性实例。在酶的活性位点附近的抑制剂分子的结合在核苷酸掺入循环的易位前或易位后步骤中捕获聚合酶,在核苷酸掺入之前或之后将聚合酶稳定在其三元复合构象,及使聚合酶与模板核酸结合直至所述抑制剂分子在反应混合物中通过去除、稀释或螯合而不可得。
因此,本发明提供了一种用于对模板核酸分子进行测序的方法,包括检验步骤,包括提供用引物引发的模板核酸分子,使引发的模板核酸分子与包含聚合酶、聚合酶抑制剂和至少一种未标记的核苷酸分子的第一反应混合物接触,监测在未标记的核苷酸分子存在下聚合酶与引发的模板核酸分子的相互作用,所述核苷酸没有掺入引发的模板核酸分子的引物中,并通过监测的相互作用鉴别与引发的模板核酸分子的下一个碱基互补的核苷酸。聚合酶抑制剂阻止未标记的核苷酸分子掺入引物模板核酸的引物中。任选地,所述抑制剂是非竞争性抑制剂、变构抑制剂或反竞争性变构抑制剂。任选地,聚合酶抑制剂与聚合酶中的催化离子结合位点竞争。
氨基糖苷通过置换Klenow聚合酶中镁结合位点而非竞争性地抑制聚合酶活性。关于核苷酸结合的相互作用的非竞争性质使得聚合酶与模板核酸和核苷酸相互作用,仅影响核苷酸掺入的催化步骤。
一种抑制剂分子是药物依法韦仑,其作为HIV-1逆转录酶的非竞争性抑制剂。这种药物对聚合酶的闭合复合构型具有高亲和性和低解离速率,由此一旦聚合酶掺入下一个正确核苷酸,则所述药物与聚合酶结合,阻止聚合酶打开其指状物以允许结合和/或掺入后续核苷酸。如果反应在相对于形成二元复合物有利于形成三元复合物的条件下发生,则可以消除非特异性聚合酶-模板核酸相互作用,其中聚合酶的结合表示加入的核苷酸与模板上下一个碱基互补。如果反应在检验反应条件下发生,则聚合酶与含有下一个正确核苷酸的模板核酸的高亲和性结合可用于区分三元复合物与聚合酶与模板核酸的随机非特异性相互作用。任选地,高亲和性聚合酶结合表明核苷酸掺入,且不需要单独的掺入步骤。一旦聚合酶结合及检测到结合,则可以从反应混合物中除去或隔离过量的核苷酸和聚合酶。可以在检验反应条件下加入下一个核苷酸,对于所有核苷酸类型循环重复该程序或者以随机或预定的顺序循环重复直到完成所需读取长度的测序。
可以选择任何聚合酶,且可以使用高通量筛选(HTS)程序揭示合适的非竞争性抑制剂。聚合酶抑制剂的HTS程序的许多实例见文献描述,其中特定的筛选标准是针对非竞争性聚合酶抑制剂。一般而言,可以筛选这些抑制剂以具有仅在聚合酶处于其闭合构象时才暴露的结合位点,且其以高亲和性和极低的解离速率结合,由此抑制剂的结合稳定处于闭合构象的聚合酶。这种抑制剂使得可以掺入单一碱基,之后抑制剂的结合阻止聚合酶开放以接收另一核苷酸。在开始测序反应下一步骤(检验或掺入步骤)之前,可以洗掉整个系统,包括聚合酶。
任选地,发现有效抑制HIV-1逆转录酶聚合酶的聚合酶抑制剂用于稳定三元复合物。任选地,所述抑制剂是HIV-2逆转录酶的抑制剂。HIV-1逆转录酶抑制剂包括核苷/核苷酸逆转录酶抑制剂(NRTI)和非核苷逆转录酶抑制剂(NNRTI)。NRTI包括但不限于COMBIVIR(拉米夫定和齐多夫定;GlaxoSmithKline,Middlesex,UK),EMTRIVA(恩曲他滨;GileadSciences,Foster City,CA),EPIVIR(拉米夫定;GlaxoSmithKline,Middlesex,UK),EPZICOM(硫酸阿巴卡韦和拉米夫定;GlaxoSmithKline,Middlesex,UK),HIVID(扎西他滨;Hoffmann-La Roche,Nutley,N.J.),RETROVIR(齐多夫定;GlaxoSmithKline,Middlesex,UK),TRIZIVIR(硫酸阿巴卡韦,齐多夫定,拉米夫定;GlaxoSmithKline,Middlesex,UK),TRUVADA(恩曲他滨/替诺福韦地索普西富马酸酯(tenofovir disoproxil fumarate);Gilead Sciences,Foster City,CA),VIDEX EC(肠溶地达诺新(didanosine);BristolMyers-Squibb,New York,N.Y.),VIDEX(地达诺新;Bristol Myers-Squibb,New York,N.Y.),VIREAD(替诺福韦地索普西富马酸酯;Gilead Sciences,Foster City,CA),ZERIT(司他夫定;Bristol Myers-Squibb,New York,N.Y.)及ZIAGEN(硫酸阿巴卡韦;GlaxoSmithKline,Middlesex,UK)。NNRTI的实例包括但不限于VIRAMUNE(奈韦拉平;Boehringer Ingelheim,Rhein,Germany),SUSTIVA(依法韦伦,Bristol Myers-Squibb,NewYork,N.Y.),DELAVIRDINE(地拉韦啶;Pfizer,New York,N.Y.)及INTELENCE(依曲韦林;Tibotec Therapeutics,Eastgate Village,Ireland)。任选地,NNRTI是结合位于亚基p66上RNA聚合酶活性位点附近的变构中心的非竞争性聚合酶抑制剂。
任选地,HIV-1逆转录酶聚合酶抑制剂是(4/6-卤素/MeO/EtO-取代的苯并[d]噻唑-2-基)噻唑烷-4-酮。表1包括19种(4/6-卤素/MeO/EtO-取代的苯并[d]噻唑-2-基)噻唑烷-4-酮抑制剂的列表(摘自E.Pitta et.al.,Synthesis and HIV-1RT inhibitoryaction of novel(4/6-substituted benzo[d]thiazol-2-yl)thiazolidin-4-ones.Divergence from the non-competitive inhibition mechanism,Journal ofEnzyme Inhibition and Medicinal Chemistry,February 2013,Vol.28,No.1,Pages113-122)。(4/6-卤素/MeO/EtO-取代的苯并[d]噻唑-2-基)噻唑烷-4-酮抑制剂具有如下化学式:
表1:(4/6-卤素/MeO/EtO-取代的苯并[d]噻唑-2-基)噻唑烷-4-酮抑制剂
/>
可以使用聚合酶抑制剂和聚合酶突变体的任何合适组合,只要其捕获/稳定三元复合物及任选阻止每个循环多个核苷酸掺入即可。
本发明提供的反应混合物可包含100nM至1mM的聚合酶抑制剂,或者100nM至1mM之间任何量的抑制剂。任选地,本发明提供的反应混合物可包含1至200μM或其间的任何量的聚合酶抑制剂。任选地,反应混合物包含30至150μM的聚合酶抑制剂。任选地,反应混合物包含30至70μM的聚合酶抑制剂。任选地,反应混合物包含60至140μM的聚合酶抑制剂。
任选地,通过使用焦磷酸盐类似物或其它相关分子,阻止三元复合物的聚合酶打开其指状结构域及易位至下一个模板核酸位置。焦磷酸盐类似物通过占据聚合酶活性口袋中接近三磷酸结合位点的位点而构建三元复合物中的聚合酶。焦磷酸(PPi)的释放对于聚合酶呈现开放构象、易位至下一个模板核酸位置及接受下一个核苷酸是至关重要的。非竞争性抑制剂例如Foscarnet(膦酰甲酸酯)、膦酰基乙酸酯或其它焦磷酸类似物捕获指状闭合构型的聚合酶。任选地,PPi类似物的结合是可逆的,通过洗涤、稀释或隔离反应混合物中的抑制剂使聚合酶活性完全恢复。总体而言,在测序反应期间可以使用任何非竞争性聚合酶活性抑制剂。
任选地,将稳定三元复合物的聚合酶抑制剂与通常释放三元复合物的反应条件组合,所述反应条件包括但不限于存在催化性金属离子,例如镁或锰。任选地,即使在催化性金属离子存在下,三元配合物也是稳定的。任选地,即使在聚合酶抑制剂存在下,三元复合物也得以释放。任选地,三元复合物的稳定部分地依赖于浓度、稳定试剂的特性、释放试剂的特性及其任何组合。任选地,使用聚合酶抑制剂稳定三元复合物与另外的反应条件组合,所述反应条件也起到稳定三元复合物的作用,包括但不限于隔离、除去、减少、省略和/或螯合催化性金属离子,在三元复合物中存在修饰的聚合酶,在三元复合物中的不可掺入核苷酸,及其任何组合。
形成和操纵三元复合物的条件
如本文所用,三元复合物包括聚合酶、引发的模板核酸和核苷酸。三元复合物可以处于化学前构象,其中核苷酸被隔离但未掺入。任选地,可以通过在引发的模板核酸分子的引物的3'核苷酸上存在化学嵌段以稳定三元复合物(例如核苷酸的碱基或糖上的可逆终止子部分)。三元复合物可以处于易位前构象,其中通过在引发的模板核酸中的引物的3'末端形成磷酸二酯键掺入核苷酸。三元复合物可以在不存在催化性金属离子或者在催化性金属离子水平不足条件下形成,从而在聚合酶活性位点内物理地隔离下一个正确核苷酸而不化学掺入。任选地,隔离的核苷酸可以是不可掺入核苷酸。三元复合物可以在存在催化性金属离子条件下形成,其中三元复合物包含掺入的核苷酸类似物,但PPi不能释放。在这种情况中,三元复合物以易位前构象稳定。任选地,通过化学交联聚合酶稳定易位前构象。任选地,可以通过外部手段稳定三元复合物。在一些情况中,三元复合物可以通过小分子的变构结合而稳定。任选地,三元复合物可以通过焦磷酸类似物稳定,所述焦磷酸类似物包括但不限于膦酰甲酸酯,其以高亲和性结合接近活性位点,阻止聚合酶的易位。
如本文所用,稳定的三元复合物是指通过一种或多种方式的组合在引发的模板核酸的聚合起始位点(引物的3'末端)捕获的聚合酶,所述方式包括但不限于交联在闭合构象中的拇指和指状结构域、阻止聚合酶恢复到开放构象的变构抑制剂的结合,在易位前步骤中捕获聚合酶的焦磷酸类似物的结合,在聚合酶活性位点中不存在催化性金属离子,及加入非催化性金属离子如镍、钡、锡和锶取代催化性金属离子。由此,即使在掺入核苷酸后,聚合酶也可以被捕获在聚合起始位点。因此,聚合酶可以化学前构象、易位前步骤、易位后步骤或其任何中间步骤捕获,从而使得可以充分检验和鉴别下一个正确核苷酸或碱基。
如本文所述,基于聚合酶的结合测序反应通常包括提供引发的模板核酸,提供引发的模板核酸与聚合酶和一或多种类型的核苷酸,其中核苷酸与引发的模板核酸的下一个碱基可以互补或不互补,检验聚合酶与引发的模板核酸在其中在化学前构象中核苷酸化学掺入引发的模板核酸中被禁止或严重抑制的、或者在引物的3’末端发生一或多个互补核苷酸掺入的条件下的相互作用。任选地,当在核苷酸掺入之前,化学前构象是稳定的时,优选使用稳定剂或3'可逆终止的引物,在检验步骤之后的一个单独的掺入步骤可以在引物的3'末端掺入单个核苷酸。任选地,在发生单一核苷酸掺入的情况中,可以稳定易位前构象以便于检验和/或阻止随后的核苷酸掺入。
虽然为了便于阐述可以描述单个模板核酸分子,但本发明提供的测序方法易涵盖多个模板核酸,其中多个核酸可以是单个核酸的克隆扩增拷贝,或者是不同的核酸,包括组合,如克隆扩增的不同核酸的群。
任选地,三元复合物在本发明提供的测序方法的检验步骤期间短暂形成。任选地,三元复合物在检验步骤期间稳定。稳定的三元复合物在检验步骤期间不允许在聚合反应中掺入核苷酸,包括掺入所述内含的核苷酸和/或在内含的核苷酸之后掺入随后的核苷酸。调节三元复合物稳定性的反应条件包括但不限于催化性金属离子、次优或抑制性金属离子的可用性,离子强度,pH,温度,聚合酶抑制剂,交联剂及其任何组合。反应试剂调节三元复合物的稳定性,包括但不限于不可掺入核苷酸,不正确核苷酸,核苷酸类似物,修饰的聚合酶,具有不可延伸的聚合起始位点的模板核酸,及其任何组合。
任选地,三元复合物从其捕获或稳定的构象释放,这使得可以在引物-模板核酸双链体中的引物的3'末端掺入核苷酸。通过调整反应条件可以使三元复合物不稳定和/或释放。此外,三元复合物可通过电、磁和/或机械手段去稳定。机械手段包括机械振荡,例如通过使用超声振荡。机械振动使闭合复合物不稳定及抑制聚合酶与DNA的结合。因此,不是通过其中用掺入混合物置换检验反应混合物的洗涤步骤,而是可以使用机械振荡从模板核酸中除去聚合酶,使得可以通过连续的掺入步骤循环,每个步骤加入单个核苷酸。
可以组合三元复合物稳定或三元复合物释放反应条件和/或方法的任何组合。例如,稳定三元复合物的聚合酶抑制剂可以与催化离子存在于检验反应中,其起到释放三元复合物的作用。在前述实例中,根据聚合酶抑制剂性质和浓度、催化性金属离子的浓度、反应混合物的其它试剂和/或条件以及其任何组合,可以稳定或释放闭合复合物。
三元复合物可以在其中核苷酸与引发的模板核酸中的引物的3'末端的共价连接被减弱的反应条件下稳定。任选地,三元复合物处于化学前构象。任选地,三元复合物处于易位前构象。这种三元复合物的形成可以通过调节催化性金属离子的可用性而起始和/或稳定,所述催化性金属离子使得三元复合物释放和/或核苷酸化学掺入反应混合物的引物中。示例的金属离子包括但不限于镁、锰、钴和钡。催化性离子(例如二价催化性金属离子)可以来自任何化学结构,例如盐如MgCl2、Mg(C2H3O2)2和MnCl2。
催化性金属离子的选择和/或浓度可基于测序反应中的聚合酶和/或核苷酸。例如,HIV逆转录酶利用镁进行核苷酸掺入(N Kaushik 1996Biochemistry 35:11536-11546和H P Patel 1995Biochemistry 34:5351-5363,以其全部内容并入本作参考文)。使用镁和锰形成三元复合物的速度根据聚合酶和核苷酸的身份而不同。因此,闭合复合物的稳定性根据催化性金属离子、聚合酶和/或核苷酸身份而不同。此外,三元复合物稳定必需的催化性离子的浓度根据催化性金属离子、聚合酶和/或核苷酸身份而变化,可以使用本发明提供的指导容易地确定。例如,核苷酸掺入可以在一种金属离子的高催化离子浓度下发生,但不在相同金属离子的低浓度下发生,反之亦然。因此,修饰金属离子特性、金属离子浓度、聚合酶特性和/或核苷酸特性可以控制检验反应条件。
在测序反应的检验步骤期间,可以通过隔离、去除、减少、省略和/或螯合催化性金属离子形成和/或稳定三元复合物,由此不发生三元复合物释放和/或化学掺入。螯合包括使催化性金属离子不能用于核苷酸掺入的任何过程,包括使用EDTA和/或EGTA。减少包括稀释反应混合物中催化性金属离子的浓度。
检验步骤中使用的反应混合物可以用包含非催化性离子的溶液稀释或替换,其允许三元复合物形成,但抑制核苷酸掺入。任选地,非催化性金属离子和催化性金属离子均存在于反应混合物中,其中一种离子以较另一种离子高的有效浓度存在。在本发明提供的方法中,非催化性离子如钴可以在高浓度变成催化性的,即促进核苷酸掺入。
非催化性离子可以加入或者包含于在检验条件下所用的反应混合物中。所述反应可以已经包含核苷酸。任选地,非催化性离子与一或多个核苷酸复合,及将复合的核苷酸加入到反应混合物中。通过在升高的温度(约80℃)将核苷酸与非催化性离子混合而将非催化性离子与核苷酸复合。例如,可以将铬核苷酸复合物加入混合物中以促进三元复合物形成和稳定。任选地,铬核苷酸复合物是单配位、双配位或三配位铬复合物。任选地,铬核苷酸复合物是α-单配位或者β-γ-双配位核苷酸。
任选地,在包含Sr2+的反应条件下在聚合酶、引发的模板核酸和核苷酸之间形成三元复合物,其中Sr2+诱导三元复合物的形成。Sr2+的存在可以相对于形成包含不正确核苷酸的复合物而有利于形成包含下一个正确核苷酸的三元复合物。Sr2+可以大约0.01mM至大约30mM的浓度存在。任选地,Sr2+作为10mM SrCl2存在。在检验条件下监测三元复合物的形成,以鉴别三元复合物的模板核酸中的下一个碱基。在Sr2+存在下,聚合酶(例如大肠杆菌DNA聚合酶I的Klenow片段,Bst)对每种dNTP(例如dATP,dTTP,dCTP,dGTP)的亲和性可以是不同的。因此,检验可包括测量聚合酶-模板核酸与dNTP的结合亲和性,其中结合亲和性示出模板核酸中的下一个碱基。任选地,结合相互作用可以在使聚合酶与引发的模板核酸之间的二元相互作用不稳定的条件下进行。任选地,结合相互作用可以在稳定聚合酶、引发的模板核酸和下一个正确核苷酸之间的三元相互作用的条件下进行。任选地,在检验后,洗涤步骤除去未结合的核苷酸,将Mg2+加入反应中以诱导核苷酸掺入和焦磷酸(PPi)释放。任选地,洗涤步骤包含Sr2+以维持三元复合物的稳定性,阻止三元复合物的解离。可以重复该反应直至获得所需的序列读数长度。
任选地,在包含Ni2+的反应条件下在聚合酶、引发的模板核酸与核苷酸之间形成三元复合物,其中Ni2+诱导三元复合物的形成。Ni2+的存在可相对于形成包含不正确核苷酸的复合物而有利于形成包含下一个正确核苷酸的三元复合物。Ni2+可以以大约0.01mM至大约30mM的浓度存在。任选地,Ni2+以10mM NiCl2存在。在检测条件下监测三元复合物的形成,以鉴别三元复合物的模板核酸中的下一个碱基。在Sr2+存在下,聚合酶(例如大肠杆菌DNA聚合酶I的Klenow片段,Bst)对每个dNTP(例如dATP,dTTP,dCTP,dGTP)的亲和性可以不同。因此,检验可包括测量聚合酶-模板核酸与dNTP的结合亲和性,其中结合亲和性表示模板核酸中的下一个碱基。任选地,结合相互作用可以在使聚合酶与引发的模板核酸之间的二元相互作用不稳定的条件下进行。任选地,结合相互作用可以在稳定聚合酶、引发的模板核酸和下一个正确核苷酸之间的三元相互作用的条件下进行。任选地,在检验后,洗涤除去未结合的核苷酸和聚合酶,并将Mg2+加入反应中以诱导核苷酸掺入和焦磷酸盐释放。任选地,洗涤缓冲液包含Ni2+以维持三元复合物的稳定性,阻止三元复合物的解离。可以重复该反应直至获得所需的序列读数长度。
任选地,在包含非催化浓度的Co2+的反应条件下在聚合酶、引发的模板核酸和核苷酸之间形成三元复合物,其中Co2+诱导三元复合物的形成。非催化浓度的Co2+的存在可相对于形成包含不正确核苷酸的复合物而有利于形成包含下一个正确核苷酸的三元复合物。Co2+可以以大约0.01mM至大约0.5mM的浓度存在。任选地,Co2+以0.5mM CoCl2存在。在检验条件下监测三元复合物的形成,以鉴别三元复合物的模板核酸中的下一个碱基。在Co2+存在下,聚合酶(例如大肠杆菌DNA聚合酶I的Klenow片段,Bst)对每个dNTP(例如dATP,dTTP,dCTP,dGTP)的亲和性可以不同。因此,检验可包括测量聚合酶-模板核酸与dNTP的结合亲和性,其中结合亲和性表示模板核酸中的下一个碱基。任选地,结合相互作用可以在使聚合酶与引发的模板核酸之间的二元相互作用不稳定的条件下进行。任选地,结合相互作用可以在稳定聚合酶、引发的模板核酸和下一个正确核苷酸之间的三元相互作用的条件下进行。检验后,洗涤除去未结合的核苷酸和聚合酶,并将催化浓度的Co2+加入反应中以诱导核苷酸掺入和焦磷酸释放。任选地,洗涤缓冲液包含非催化量的Co2+以维持三元复合物的稳定性,阻止三元复合物的解离。可以重复该反应直至获得所需的序列读数长度。
任选地,催化性金属离子(例如二价催化性金属离子)可促进闭合复合物的形成,而不促进后续核苷酸掺入和三元复合物释放。任选地,在反应混合物中浓度为0.5、1、2、3、4、5、6、7、8、9或10μM的Mg2+可以诱导聚合酶的构象变化以形成三元复合物而没有后续核苷酸掺入、PPi和三元复合物释放。任选地,Mg2+的浓度为大约0.5μM至大约10μM,大约0.5μM至大约5μM,大约0.5μM至大约4μM,大约0.5μM至大约3μM,大约1μM至大约5μM,大约1μM至大约4μM,及大约1μM至大约3μM。
任选地,测序反应中使得核苷酸掺入所必需的催化性金属离子(例如二价催化性金属离子)的浓度为大约0.001mM至大约10mM,大约0.01mM至大约5mM,大约0.01mM至大约3mM,大约0.01至大约2mM,大约0.01mM至大约1mM,大约0.05至大约10mM,大约0.05mM至大约5mM,大约0.05mM至大约3mM,大约0.05至大约2mM,或者大约0.05mM至大约1mM。任选地,催化性金属离子的浓度为5至50mM。任选地,催化性金属离子的浓度为5至15mM,或者大约10mM。
可以在任何阶段包括在任何以下反应步骤之前、期间或之后将非催化性离子(例如二价非催化性金属离子)加入反应混合物中:提供引发的模板核酸,提供聚合酶,二元复合物形成,提供核苷酸,化学前三元复合物形成,核苷酸掺入,易位前三元复合物形成,以及易位后构象形成。非催化性离子可以在洗涤步骤期间加入反应混合物中。非催化性离子可以通过反应混合物中的反应存在。例如,催化性离子以稀释非催化性金属离子的浓度加入反应混合物中,允许核苷酸掺入。
催化性和非催化性离子调节核苷酸掺入的能力可取决于反应混合物中的条件,包括但不限于pH、离子强度、螯合剂、化学交联、修饰的聚合酶、不可掺入核苷酸、机械或振动能和电场。
任选地,测序反应中允许三元复合物形成而不掺入核苷酸所需的非催化性金属离子(例如二价非催化性金属离子)的浓度为大约0.1mM至大约50mM,大约0.1mM至大约40mM,大约0.1mM至大约30mM,大约0.1mM至大约20mM,大约0.1mM至大约10mM,大约0.1mM至大约5mM,大约0.1至大约1mM,大约1mM至大约50mM,大约1至大约40mM,大约1mM至大约30mM,大约1mM至大约20mM,大约1mM至大约10mM,大约1mM至大约5mM,大约2mM至大约30mM,大约2mM至大约20mM,大约2mM至大约10mM,或者这些范围内的任何浓度。可用于这方面的非催化性离子包括但不限于:钙,锶,钪,钛,钒,铬,铁,钴,镍,铜,锌,镓,锗,砷,硒,铑,铕和铽离子。任选地,在检验反应中提供Ni2+以促进三元复合物形成。任选地,在检验反应中提供Sr2+以促进三元复合物形成。在某些实施方案中,在检验步骤期间,反应混合物可以包含上述浓度的一或多种非催化性离子,而排除其它非催化性离子。例如,可以包含镍或锶,而排除钙。
检测平台:检测三元复合物的设备
在存在核苷酸条件下可以通过使用或不使用标签标记的标记监测聚合酶与模板核酸之间的相互作用。例如,测序反应可以通过检测折射率的变化、电荷检测、Raman散射检测,椭圆测量法、pH检测、大小检测、质量检测、表面等离子共振、导模共振、纳米孔光学干涉测量、回音壁模式共振、纳米粒子散射、光子晶体、石英晶体微量天平、生物层干涉测量、振动检测、压力检测以及检测由于三元复合物中聚合酶结合模板核酸而增加的质量或折射率的其它无标记检测方案监测。
任选地,利用聚合酶的Raman信特征检测在本发明公开的测序方法的一或多个步骤期间发生的聚合酶构象变化,例如三元复合物形成或释放。任选地,在本文所述的核酸测序方法的一或多个步骤中,将光以可见光、近红外或近紫外范围导向测序反应混合物。光与反应中的分子振动或其它激发相互作用,导致光的能量偏移。能量偏移提供了关于反应的振动模式的信息,因此提供了关于反应成分(例如聚合酶)的构型的信息。可以利用表面增强Raman、共振Raman、尖端增强Raman、偏振Raman、受激Raman、传输Raman、空间偏移Raman和超Raman光谱检测本发明的测序方法。
任选地,检测折射率的变化是通过一种或多种手段的组合实现,包括但不限于表面等离子体共振传感、局部等离子体共振传感、等离子体-光子耦合传感、通过亚波长纳米孔的传输传感(增强的光学传输)、光子晶体传感、干涉测量传感、折射传感、导模共振传感、环形共振器传感或椭圆测量传感。任选地,核酸分子可以位于表面,其中在各种核苷酸存在下聚合酶与核酸的相互作用可以根据局部折射率的变化加以测量。
任选地,模板核酸被适当束缚(tether)在或定位在表面上或附近,由此聚合酶和模板核酸在核苷酸存在下的相互作用改变透过表面传输或从表面反射的光。所述表面可包含纳米结构。任选地,所述表面能够维持等离子体或等离子共振。任选地,所述表面是光子底物,不限于共振腔、共振环或光子晶体板。任选地,所述表面是导模共振传感器。任选地,核酸被适当束缚或定位在纳米孔阵列、纳米颗粒或微粒之上或附近,由此聚合酶和模板核酸在核苷酸存在下的相互作用改变了与微粒或者纳米粒子相互作用的光的吸收、散射、反射或共振。
任选地,在金表面上的纳米孔阵列用作折射率传感器。模板核酸可以通过标准硫醇化学附着于金属表面,将巯基掺入扩增DNA的PCR反应中使用的引物之一。当纳米孔阵列的大小适当地调整适合入射光时,可以根据透过纳米孔传输的光的变化监测在核苷酸存在下聚合酶与模板核酸的结合。对于标记和无标记方案,简单和直接测量平衡信号强度可以揭示稳定闭合复合物的形成。
任选地,核酸分子定位于能够维持表面等离子体的表面,其中由聚合酶与定位的核酸的相互作用引起的折射率的变化可以通过表面等离子体性质的变化而监测,其中所述表面等离子体的性质可包括表面等离子体共振。表面等离子体、局部表面等离子体(LSP)或表面等离子体偏振子(SPP)源自电磁波与表面电荷的等离子体振荡的耦合。LSP被限制在纳米颗粒表面,而SPP被限制在高电子密度表面,在高电子迁移率表面和电介质之间的界面。表面等离子体可以沿着界面的方向传播,而其仅以衰逝方式渗透到电介质中。当入射电磁辐射的频率与表面电子的自然振荡频率匹配时,确立表面等离子共振条件。界面处的介电性质的变化,例如由于结合或分子拥挤所致变化,影响表面电子的振荡,从而改变表面等离子体共振波长。能够表面等离子体共振的表面非限制性包括纳米颗粒、纳米颗粒簇和聚集体、连续平面表面、纳米结构表面和微结构表面。材料如金、银、铝、高导电性金属氧化物(例如氧化铟锡,氧化锌,氧化钨)能够在其表面支持表面等离子体共振。
任选地,将单个核酸分子或核酸的多个克隆拷贝附着于纳米颗粒上,由此聚合酶与核酸的结合导致局部表面等离子体共振(LSPR)的偏移。入射在纳米颗粒上的光诱导其中的传导电子以共振频率共同振荡,共振频率取决于纳米颗粒的尺寸、形状和组成。感兴趣的纳米颗粒可呈现不同的形状,包括球形纳米颗粒、纳米棒、纳米锥、纳米钻石和纳米圆盘。作为这些LSPR模式的结果,纳米颗粒如此强烈地吸收和散射光,使得单个纳米颗粒可以通过使用暗场(光散射)显微镜通过肉眼容易地观察到。例如,单个80-nm银纳米球散射445nm蓝光,散射截面为(3×10-2)m2,比荧光素分子的荧光截面大百万倍,比填充有至自淬灭极限的荧光素的相似尺寸的纳米球的截面大千倍。任选地,纳米颗粒是等离子体共振颗粒,配置为超亮、纳米大小的光学散射体,在可见光谱中的任何地方均具有散射峰。等离子体共振颗粒是有利的,因为其不会猝灭。任选地,制备等离子体共振颗粒,用模板核酸包被,并提供在包含聚合酶和一或多种核苷酸的反应混合物中,其中检测聚合酶-模板核酸-颗粒相互作用。一或多个前述步骤可基于或来自如下文章中揭示的一或多种方法:Sheldon Schultz etal.,“Single-Target Molecule Detection with Nonbleaching Multicolor OpticalImmunolabels,”Proceedings of the National Academy of Sciences 97,no.3(February 1,2000):996-1001,所述文章以其全部内容并入本文作参考。
在共振波长的极大消光系数使得贵金属纳米颗粒可以用作近表面相互作用的极强标记。任选地,聚合酶与纳米颗粒定位的DNA相互作用导致共振波长的偏移。由于结合或结合相互作用所致共振波长的变化可以通过许多方式之一测量。任选地,通过一系列波长扫描照射以鉴别在成像装置观测到最大散射的波长。任选地,宽频照射与成像装置附近的色散元件联合使用,由此通过分光光谱鉴别共振峰。任选地,纳米颗粒系统可以在其共振波长或近其共振波长照射,随着新的共振波长偏离照射波长出现的散射的光强度下降,可以观测到任何结合相互作用。根据照射波长的定位,相互作用甚至可以表现为随着共振峰偏向照射波长出现的纳米颗粒散射的增加。任选地,DNA附着的纳米颗粒可以定位于表面,或者DNA附着的纳米颗粒可以悬浮在溶液中。使用纳米颗粒的生物传感的综述在JeffreyN.Anker et al.,“Biosensing with Plasmonic Nanosensors,”Nature Materials 7,no.6(June 2008):442-53中描述,所述文章以其全部内容并入本文作参考。
任选地,能进行LSPR的纳米特征在平面基质上光刻图案。纳米特征的二维图案在多重和高通量分析大量不同核酸分子方面具有优势。任选地,金纳米柱是用于聚合酶-模板核酸相互作用的表面等离子共振成像检测的基质,其中核酸附着于纳米柱。纳米结构大小和周期可以影响表面等离子体共振信号增强,任选地,与对照膜相比,提供2、3、4、5、6、7、8倍或更高的信号放大。
任选地,表面等离子体共振可以在平面表面中维持。在市场上很容易获得许多基于Kretschmann配置(例如Biacore,Uppsala,Sweden)和表面等离子体共振成像(例如GWCTechnologies,Madison,WI或Horiba,Kyoto,Japan)的商业仪器,且具有充分确立的方案以单点和多路复用阵列模式将DNA附着于其表面。在Kretschmann配置中,金属膜(通常是金)被蒸发至棱镜的侧面,入射辐射以一定角度发射以激发表面等离子体。倏逝波透过金属膜激发另一侧的等离子体,在此其可用于监测金膜附近的近表面和表面相互作用。在共振角,从棱镜-金界面反射的光严重衰减。假设固定波长照射,可以通过监测在接近共振角的固定角度的反射光强度以及通过监测建立表面等离子体共振条件(最小反射率)所需的入射角的变化检验结合相互作用。当利用如CCD或CMOS相机等2D成像装置监测反射光时,可以以高分辨率对整个照射区域成像。这种方法称为表面等离子体共振成像(SPRi)。这种方法可以同时对表面上的独立区域进行高通量分析。还可以以固定角度配置使用宽频照射,其中通过寻找反射光谱中的倾斜通过分光光谱法鉴别耦合表面等离子体共振的波长。通过共振波长的变化监测表面相互作用。
表面等离子体共振已经充分确立用于监测蛋白质-核酸相互作用,有许多关于核酸附着以及分析数据的标准方案。示例的参考文献包括Bongsup Cho et al.,“BindingKinetics of DNA-Protein Interaction Using Surface Plasmon Resonance,”ProtocolExchange,May 22,2013及Jennifer M.Brockman,Anthony G.Frutos,and Robert M.Corn,“A Multistep Chemical Modification Procedure To Create DNA Arrays on GoldSurfaces for the Study of Protein-DNA Interactions with Surface PlasmonResonance Imaging,”Journal of the American Chemical Society 121,no.35(September 1,1999):8044-51,所述文献均以其全部内容并入本文作参考。
可以在能维持定位的(localized)表面等离子体的纳米结构表面上监测聚合酶/核酸相互作用。任选地,可以在能维持表面等离子体偏振子的纳米结构表面上监测聚合酶/核酸相互作用。
任选地,可以在能维持定位的表面等离子体的纳米结构表面上监测聚合酶/核酸相互作用。任选地,可以在能维持表面等离子体偏振子的纳米结构表面上监测聚合酶/核酸相互作用。
任选地,通过纳米孔阵列的超强光透射(EOT)可用于监测核酸/聚合酶相互作用。在等离子体金属膜中透过亚波长纳米孔传输的光高于传统电磁理论的预期。这种增强的光传输可以通过考虑与入射辐射耦合的等离子体共振解释,由此在共振波长,大于预期部分的光传输透过金属纳米孔。增强的光学透射取决于纳米孔的尺寸和间距、金属的性质以及在承载纳米孔的金属膜的任一侧的介质的介电性质。在生物传感器的情况中,金属纳米孔阵列的透射率取决于接触金属膜的介质的折射率,由此例如聚合酶与附着于金属表面的核酸的相互作用可以根据穿过纳米孔阵列的光的强度变化进行监测。EOT/等离子体纳米孔阵列方法的优势在于表面等离子共振的仪器和排列要求可以由非常紧凑的光学和成像元件代替。例如,仅低功率LED照射和廉价CMOS或CCD相机可足以实施稳健的EOT等离子体传感器。示例的基于纳米孔阵列的表面等离子共振传感装置在C.Escobedo et al.,“Integrated Nanohole Array Surface Plasmon Resonance Sensing Device Using aDualWavelength Source,”Journal of Micromechanics and Microengineering 21,no.11(November 1,2011):115001中描述,以其全部内容并入本文作参考。
等离子体纳米孔阵列可以在置于玻璃表面上的光学不透明的金层(厚度大于50nm)上图案化。任选地,等离子体纳米孔阵列可以在置于在玻璃上的铝或银的光学厚膜上图案化。任选地,纳米孔阵列在置于低折射率塑料上的光学厚金属层上图案化。在低折射率塑料上图案化等离子体纳米孔阵列通过更好地匹配金属层两侧的折射率来增强装置对折射率变化的灵敏度。任选地,通过增加孔之间的距离来增加纳米孔阵列的折射率灵敏度。任选地,纳米孔阵列通过复制制造,例如通过压印、浇铸、压印光刻或模板剥离制成。任选地,纳米孔阵列通过使用胶体的自组装制成。任选地,纳米孔阵列通过投影直接图案化制成,例如激光干涉光刻。
纳米桶配置可优于纳米孔配置。在纳米孔配置中,纳米特征的底部是玻璃或塑料或其它适当的电介质,而在纳米桶配置中,纳米特征的底部包括等离子体金属。纳米棒阵列配置可以更容易以批量生产方式制造,同时保持对局部折射率的透射灵敏度。
任选地,纳米孔阵列等离子体传感与无透镜全息成像组合以便以低廉方式进行大面积成像。任选地,等离子体生物传感平台包括包含纳米孔阵列的等离子体芯片,配置为照射芯片的发光二极管源,以及记录纳米孔的衍射模式的CMOS成像器芯片,其由表面上的分子结合事件调节。所述结合事件可以是在核苷酸存在下聚合酶与模板核酸之间三元复合物的形成。
使表面等离子体共振传感的表面(用于核酸附着)功能化的方法可以直接应用于EOT纳米孔阵列,因为这两种传感方案均使用需要附着核酸的相似金属表面。
任选地,可以在不支持等离子体的纳米结构表面上监测与聚合酶/核酸相互作用相关的折射率变化。任选地,可以使用导模共振来监测聚合酶/核酸相互作用。导模共振或波导模共振是这样一种现象,其中通过导入相位匹配元件如衍射光栅或棱镜,可以激发及同时提取光学波导的引导模式。这种引导模式也称为“泄漏模式”,因为其不保持被引导且已经在一维和二维光子晶体板中观测到。导模共振可以被认为是彼此相邻或置于顶部放置的两个光学结构的衍射模式与波导模式的耦合。例如,对于放置在光学波导顶部的衍射光栅,衍射模式之一可以精确地耦合于光学波导的引导模式中,导致该模式沿波导传播。对于偏共振条件,没有光耦合到波导中,因此该结构可能看起来完全透明(如果使用介电波导)。在共振时,共振波长强烈耦合波导,及可以根据来自光栅-波导界面的下游元件与所述结构耦合脱离(couple out)。在光栅耦合器在波导的整个表面上延伸的情况下,光不能被引导,因为耦合进入的任何光在下一个光栅元件处耦合脱离。因此,在光栅波导结构中,观察到作为强反射峰的共振,而该结构对于偏共振条件是透明的。共振条件取决于入射光的角度、光栅特性、偏振和波长。对于其中不存在导模传播的情况,例如由于光栅耦合到波导的整个表面,鉴于从波导层的横向中强光学限制和辐射的倏逝传播,共振模式也可称为泄漏模式共振。例如由于生物分子的结合所致光栅附近的介电特性的变化影响与波导的耦合,从而改变共振条件。任选地,当核酸分子附着于光栅波导结构的表面时,聚合酶/核酸相互作用可以根据泄漏模式共振的波长的变化进行监测。
衍射元件可以直接用在透明基底上,而不直接需要波导元件。可以根据反射或透射辐射中的共振波长偏移而监测由于光栅纳米结构附近的相互作用引起的共振条件的变化。
来自核酸附着的导模共振传感器的反射光可用于监测聚合酶/核酸相互作用。可以使用宽频照射源照射,反射光的分光光谱检验可以揭示由于聚合酶结合引起的局部折射率的变化。
任选地,可以使用宽频照射,及可以检验透射光以鉴别由于聚合酶相互作用引起的共振偏移。可以使用线性偏振的窄频照射,及可以通过交叉偏振光镜过滤透射光;其中由于交叉偏振光镜导致透射光被完全减弱,除了其偏振被修改的泄漏振型之外。这种实施方式将折射率监测转换为可在廉价成像系统上监测的简单透射测定。有公开材料描述了光学元件的组装。见Yousef Nazirizadeh et al.,“Low-Cost Label-Free Biosensors UsingPhotonic Crystals Embedded between Crossed Polarizers,”Optics Express 18,no.18(August30,2010):19120-28,以其全部内容并入本文作参考。
除纳米结构表面之外,平面的非结构化表面也可有利地用于监测折射率调制。任选地,可以采用干扰测量法监测聚合酶与结合至非结构化的光学透明底物的核酸的相互作用。核酸分子可以附着在载玻片的顶部表面上(通过本领域已知的任何方法),所述系统从载玻片的底表面照射。在这个配置中存在两个反射表面,一个来自载玻片的底表面的反射,另一个来自其上有附着核酸分子的顶部表面。两个反射波可能相互干扰,导致基于路径长度差异的相长干扰或相消干扰,从顶面反射的波由于结合的核酸分子引起的介电常数的变化而调节(及随后由聚合酶与结合的核酸分子的相互作用调节)。由于来自底部表面的反射不变,与核酸分子的任何结合均可以反映在从顶部和底部表面反射的光束之间的相差,这反过来影响观测的干扰图案。任选地,生物层干扰测量法用于监测核酸/聚合酶相互作用。生物层干扰测量法可以在商业设备上进行,例如由Pall Forte Bio公司(Menlo Park,CA)出售的那些设备。
任选地,通过使用聚焦光学器件选择性地选择来自顶部表面的反射光。来自底面的反射光被忽略,因为其不在焦平面中。仅聚焦于核酸附着的顶部表面,由聚焦透镜收集的光包括相应于部分反射的入射辐射的平面波和相应于在焦平面由分子在集合方向散射的辐射的散射波。如果入射辐射是相干的,则可以使这两个成分相干扰。这种基于散射的干扰检测非常灵敏,可用于检测低至单个蛋白质分子。
任选地,场效应晶体管(FET)配置为用于检测三元复合物的生物传感器。FET的栅极端子通过加入模板核酸修饰。包含带电标签的聚合酶的结合导致电化学信号的变化。具有下一个正确核苷酸的聚合酶与模板核酸的结合提供了与在其它不正确核苷酸存在下聚合酶与模板核酸结合不同的信号,其中每个不正确核苷酸也可提供不同的信号。任选地,使用FET监测聚合酶与模板核酸的相互作用,而不使用聚合酶、引发的模板核酸或核苷酸上的标记标签。任选地,使用FET检测在掺入反应期间由于H+离子释放而发生的pH变化。任选地,聚合酶包含由FET检测的产生持续H+离子的标签。任选地,持续H+离子产生标签是ATP合酶。任选地,持续H+离子产生标签是钯、铜或另一种催化剂。任选地,使用FET检测核苷酸掺入后PPi的释放。例如,可以为反应一次提供一种类型的核苷酸。一旦加入下一个正确核苷酸且条件允许掺入,PPi裂解、释放及使用FET检测,从而鉴别下一个正确核苷酸和下一个碱基。任选地,模板核酸与纳米管壁结合。任选地,聚合酶与纳米管壁结合。FET由于其小尺寸和低重量而有利地用作测序传感器,使其适合用作便携式测序监测组件。关于FET检测分子相互作用的详细描述见Dong-Sun Kim et al.,“An FET-Type Charge Sensor for HighlySensitive Detection of DNA Sequence,”Biosensors and Bioelectronics,Microsensors and Microsystems 2003,20,no.1(July 30,2004):69-74,doi:10.1016/j.bios.2004.01.025及Alexander Star et al.,“Electronic Detection of SpecificProtein Binding Using Nanotube FET Devices,”Nano Letters 3,no.4(April 1,2003):459-63,doi:10.1021/nl0340172,所述文章以其全部内容并入本文作参考。
举例来说,聚合酶包含荧光标签。为高信噪比监测聚合酶-核酸相互作用,可以使用倏逝波照射或共焦成像。例如,与背景相比,可以随着荧光增加而观测定位的模板核酸上的三元复合物的形成,而在一些情况下,由于猝灭或局部极性环境的变化,也可以观测到荧光减少。任选地,一部分聚合酶分子可以用荧光团标记,而另一部分可以用相同反应混合物中的猝灭剂标记;其中,在定位的核酸克隆群上形成三元复合物以与背景相比荧光的减少来显示。核酸克隆群可以附着于支持物表面,例如平面基质、微粒或纳米颗粒。任选地,聚合酶用荧光团、发光团、化学发光团、生色团或生物发光团标记。
任选地,将多个模板核酸连系在表面,依次流动一个(或多个)dNTP。亲和性谱揭示了下一个正确核苷酸的身份,因此揭示了模板核酸中的下一个碱基。任选地,测量亲和性而无需除去和替换反应混合物条件,即洗涤步骤。例如,测量的结合相互作用强度的自相关可以易于揭示相互作用的动力学,从而揭示亲和性而不需要洗涤步骤以测量解离速率。
可以测量聚合酶与核酸之间的动态相互作用的任何技术均可用于测量亲和性及能够实现本发明揭示的测序反应方法。
检测核苷酸特异性三元复合物形成的系统
本发明提供的方法可以在平台上进行,其中核酸聚合反应的任何组分均定位于表面。任选地,模板核酸附着于平面基底、纳米孔阵列、微粒或纳米颗粒。任选地,所有反应组分自由悬浮在反应混合物中。
任选地,将模板核酸固定在表面上。所述表面可以是平面基底、水凝胶、纳米孔阵列、微粒或纳米颗粒。任选地,第一反应混合物包含多种克隆扩增的模板核酸分子。任选地,第一反应混合物包含多种可区分的模板核酸。
本发明提供的是进行测序反应的系统,包括在核苷酸存在下检验聚合酶与引发的模板核酸之间的相互作用以鉴别模板核酸序列的下一个碱基或者鉴别在测序期间填充遇到的同聚物区所需的核苷酸数目。任选地,检验包括监测在核苷酸存在下聚合酶对引发的模板核酸的亲和性。任选地,聚合酶与核酸短暂结合,结合动力学和亲和性提供了关于模板核酸上下一碱基的身份的信息。任选地,闭合复合物形成,其中参与闭合复合物形成的反应条件提供关于核酸上下一碱基的信息。任选地,通过一种或多种手段的组合将聚合酶捕获在其三元复合物中的聚合位点,所述手段不限于聚合酶结构域的交联、聚合酶与核酸的交联、通过小分子的变构抑制、反竞争性抑制剂、竞争性抑制剂、非竞争性抑制剂及变性;其中捕获的聚合酶复合物的形成提供了关于核酸模板上下一个碱基的身份的信息。
本发明还提供了用于执行本发明揭示的任何测序方法的一或多个步骤的系统。任选地,所述系统包括在核苷酸存在下进行聚合酶和模板核酸结合测定所需的成分和试剂,其中模板核酸在纳米结构上提供。任选地,所述系统包含将模板DNA分子结合在纳米结构上所需的一或多种试剂和说明书。例如,所述系统提供纳米结构,例如芯片,配置用于表面等离子体共振以确定结合动力学。这种芯片的一个例子是CM5传感器S芯片(GE Healthcare,Piscatawany,NJ)。所述系统可以提供设备如SPR设备(例如Biacore)。所述系统可以提供链霉抗生物素蛋白和/或生物素。任选地,所述系统提供用于制备生物素化模板DNA的生物素-DNA、DNA连接酶、缓冲液和/或DNA聚合酶。任选地,所述系统提供凝胶或试剂(例如苯酚:氯仿),用于生物素化的DNA纯化。或者,所述系统提供用于生物素化模板DNA鉴定例如质谱或HPLC的试剂。任选地,所述系统包含链霉抗生物素蛋白、芯片、试剂、设备和/或将链霉抗生物素蛋白固定在芯片上的说明书。任选地,芯片提供在为模板DNA包被配置的系统中,其中芯片用能结合模板核酸或修饰的模板核酸(例如生物素化的模板DNA)的试剂固定。任选地,所述系统提供了用于芯片再生的试剂。
本发明还提供了用于执行本发明揭示的任何测序方法的一或多个步骤的系统。任选地,所述系统包括在核苷酸存在下进行聚合酶和模板核酸结合测定所需的成分和试剂,其中模板核酸在纳米颗粒上提供。任选地,所述系统包含将模板DNA分子结合在纳米颗粒上所需的一或多种试剂和说明书。纳米颗粒可以配置用于核酸-聚合酶相互作用的电化学检测,例如通过使用金纳米颗粒进行。任选地,DNA-纳米颗粒缀合物在水相金胶体溶液与模板DNA分子之间形成,所述模板DNA分子在其末端包含游离硫醇或二硫化物基团。所述缀合物可以包含克隆扩增的DNA分子群,其可以包含或不包含相同的核酸序列。任选地,纳米颗粒缀合物在高温(例如>60℃)和高离子强度(例如1M Na+)条件下稳定以防止絮凝和沉淀。任选地,所述系统提供制备用于纳米颗粒附着的模板DNA分子的试剂,包括用二硫化物或硫醇产生模板DNA分子。可以使用例如3'-硫醇改性剂可控孔玻璃(CPG)或通过以通用载体CPG开始及加入二硫化物改性剂亚磷酰胺作为序列中的第一单体来合成含二硫化物的模板核酸。所述系统可以提供用于获得二硫化物修饰的模板核酸的核酸合成试剂和/或说明书。含有硫醇的模板核酸也可以在核酸合成期间用5'-三苯甲基硫醇改性剂亚磷酰胺产生。所述系统可以提供使用例如电泳或离心进行纳米颗粒缀合物纯化的试剂和/或说明书。任选地,使用纳米颗粒缀合物经比色监测聚合酶-模板核酸相互作用。在这种情况中,纳米颗粒缀合物的熔融温度在存在强聚合酶结合情况中升高。因此,DNA结合的强度可以通过经颜色变化观察到的这种熔融转变的改变而确定。
本发明还提供了用于执行本发明揭示的任何测序方法的一或多个步骤的系统。任选地,所述系统包括使用可检测聚合酶在核苷酸存在下进行聚合酶和模板核酸结合测定所需的成分和试剂。任选地,聚合酶被可检测地标记。任选地,使用聚合酶的固有性质检测聚合酶,例如芳族氨基酸。任选地,聚合酶和模板核酸被配置用于溶液中,而不与支持物缀合。聚合酶上的可检测标记可以是荧光团,其中荧光用于监测聚合酶-模板核酸结合事件。任选地,可检测聚合酶可以与溶液中的模板核酸组合使用,或者与缀合于支持物结构的模板核酸组合使用。任选地,将聚合酶的一或多个半胱氨酸残基用Cy3-马来酰亚胺或Cy3-碘乙酰胺标记。任选地,所述系统包含制备荧光标记的聚合酶分子所需的试剂和/或说明书。所述该系统可包括用于纯化荧光标记的聚合酶的试剂和/或说明书。
本发明方法的程序特征
在检验步骤之后,其中已经通过形成三元复合物鉴别下一碱基的身份,反应条件可以适当地重置、再补给或修改,以备用于任选的掺入步骤或另外的检验步骤。任选地,已经鉴别下一碱基的身份而没有化学掺入核苷酸。任选地,鉴别了下一碱基的身份,及化学掺入核苷酸,其中后续核苷酸掺入被抑制。任选地,除去或洗去除了待测序的模板核酸之外的检验步骤的所有成分,使系统返回到检验前条件。任选地,除去检验步骤的部分成分。任选地,在检验步骤中加入其它成分。
任选地,在掺入步骤中使用可逆终止子核苷酸以确保每个循环掺入一个且仅一个核苷酸(即仅单一核苷酸)。可逆终止子核苷酸上不需要标记,因为从检验步骤中已知碱基身份。非荧光标记的可逆终止子可容易地从商业供应商处获得。与标记的可逆终止子相比,预期未标记的可逆终止子核苷酸具有更快的掺入动力学,这是因为其较小的空间足迹和与天然核苷酸的相似大小。
本发明部分揭示了试剂循环测序方法,其中对于每个检验和/或掺入循环,一个接一个地导入测序试剂。任选地,测序反应混合物包含聚合酶、引发的模板核酸和至少一种类型的核苷酸。任选地,将核苷酸和/或聚合酶循环导入测序反应混合物中。任选地,测序反应混合物包含多种聚合酶、引发的模板核酸和核苷酸。任选地,将多种核苷酸和/或多种聚合酶循环导入测序反应混合物中。任选地,测序反应的检验步骤与测序反应的掺入步骤具有不同的组成。
如本发明提供,聚合酶是指单一聚合酶或多种聚合酶。如本发明提供,引发的模板核酸或模板核酸是指单一引发的模板核酸或单一模板核酸,或者多个引发的模板核酸或多个模板核酸。如本发明所提供,核苷酸是指一个核苷酸或多个核苷酸。如本发明所提供,单一核苷酸是一个核苷酸。任选地,测序反应核苷酸包括但不限于以下核苷酸中的1、2、3或4种:dATP,dGTP,dCTP和dTTP(或dUTP)。任选地,试剂循环包括将模板核酸固定在平台上,洗去当前的反应混合物,及将新的反应混合物加入模板核酸中。
任选地,将一或多个核苷酸依次加入测序反应中并从中除去。任选地,将1、2、3、4或更多种类型的核苷酸加入反应混合物中及从中除去。例如,将一种类型的核苷酸加入测序反应中,除去,及用另一种类型的核苷酸替换。任选地,在检验步骤期间存在的核苷酸类型不同于在掺入步骤期间存在的核苷酸类型。任选地,在一个检验步骤期间存在的核苷酸类型不同于在相继检验步骤期间存在的核苷酸类型(即相继检验步骤在掺入步骤之前进行)。任选地,在检验反应混合物中存在1、2、3、4或更多种类型的核苷酸,在掺入反应混合物中存在1、2、3、4或更多种类型的核苷酸。
任选地,将聚合酶循环加入到测序反应中并从中除去。可以将一或多种不同类型聚合酶循环加入测序反应中及从中除去。任选地,在检验步骤期间存在的聚合酶类型不同于在掺入步骤期间存在的聚合酶类型。在一个检验步骤中存在的聚合酶类型可以与在相继检验步骤期间存在的聚合酶类型不同(即相继检验步骤在掺入步骤之前进行)。
任选地,在整个测序反应中改变试剂条件,例如试剂的存在、pH、温度和离子强度。任选地,将金属循环加入测序反应中及从中除去。例如,在检验步骤期间可以不存在催化性金属离子及在掺入步骤期间存在催化性金属离子。或者,在检验步骤期间存在聚合酶抑制剂及在掺入步骤期间不存在。任选地,在测序反应期间消耗的反应成分可以在测序反应期间的任何时间点加入新成分补充。
可以在有利于三元复合物形成及使二元复合物形成不稳定的反应条件下,一次加入一种类型的核苷酸,以及加入聚合酶。如果存在下一个正确核苷酸,聚合酶仅与模板核酸结合。每次加入核苷酸后的洗涤步骤确保从反应混合物中除去所有过量的不包含在三元复合物中的聚合酶和核苷酸。如果核苷酸以已知顺序一次加入一个,则当加入的核苷酸是下一个正确核苷酸时,通过三元复合物形成确定模板核酸上的下一个碱基。三元复合物可以通过构象变化和聚合酶-模板核酸-核苷酸相互作用的稳定性增加而鉴别。任选地,在下一个正确核苷酸存在下形成的三元复合物的稳定性比不正确核苷酸存在下聚合酶与模板核酸的不稳定相互作用高至少一个数量级。洗涤步骤的使用确保不存在未结合的核苷酸和聚合酶,反应中存在的唯一核苷酸是在具有聚合酶和模板核酸的三元复合物中隔离的那些核苷酸。一旦确定模板核酸上的下一个碱基,在闭合复合物中隔离的下一个正确核苷酸可以通过试剂交换(例如流经流动池)掺入,其提供有利于三元复合物的解离或不稳定的反应条件,及将模板核酸引物链延伸一个碱基(掺入)。因此,洗涤步骤确保掺入的唯一核苷酸是来自三元复合物的下一个正确核苷酸。可以重复这种试剂循环方法并确定核酸序列。这种试剂循环方法可以应用于单个模板核酸分子,或应用于克隆群集合,例如PCR产物或滚环扩增的DNA。如果许多不同模板在例如固体支持物上阵列排列,则可以对其平行测序。任选地,洗涤步骤使二元复合物形成不稳定。任选地,洗涤进行一段时间,确保除去二元复合物,将稳定的闭合复合物留在反应混合物中。任选地,洗涤步骤包括用高离子强度或高pH溶液洗涤反应。
任选地,掺入步骤是三阶段过程。在第一阶段,在有利于形成三元复合物的反应条件下将所有四种核苷酸类型导入包含引发的模板核酸和高保真聚合酶的反应中,使得下一个正确核苷酸可以与模板核酸形成稳定的三元复合物。在第二阶段,任选地洗去过量的核苷酸和未结合的聚合酶。在第三阶段,改变反应条件,使得三元复合物不稳定,及三元复合物内隔离的核苷酸变成掺入引发的模板核酸的引物的3'末端。在掺入步骤中紧密聚合酶-核酸复合物的形成可以通过标准技术实现,例如融合非特异性DNA结合结构域与聚合酶(例如Phusion聚合酶),及利用高浓度的核苷酸以确保正确的核苷酸总是存在于闭合复合物中。
即使在不存在聚合酶合成反应通常需要的二价金属离子的条件下,聚合酶分子在下一个正确核苷酸存在下以指状闭合构象与引发的核酸分子结合。构象变化将与下一个模板碱基互补的核苷酸捕获在聚合酶活性位点内。任选地,三元复合物的形成可用于确定模板核酸上下一碱基的身份。任选地,在不存在催化性二价金属离子的情况下,可以将引发的模板核酸在聚合酶存在下与不同核苷酸连续接触;其中闭合复合物的形成表明当前与模板核酸接触的核苷酸是核酸上下一个碱基的互补核苷酸。已知与模板核酸接触的核苷酸顺序(在聚合酶存在下,不存在催化性金属离子)确保容易地基于诱导三元复合物形成的顺序的特定位置鉴别互补核苷酸。任选地,在每个核苷酸加入后进行适当的洗涤步骤,以确保除去所有过量的酶和核苷酸,仅留下与三元复合物中的核酸结合的聚合酶,在其活性位点具有下一个正确核苷酸。三元复合物可以通过揭示闭合构象的聚合酶的构象变化或者通过揭示聚合酶/核酸/下一个正确核苷酸复合物与二元聚合酶-核酸复合物相比或者与聚合酶、引发的模板核酸和不正确核苷酸之间的不稳定相互作用相比增加的稳定性而鉴别。
任选地,鉴别下一个互补核苷酸的方法(检验步骤)包括以下步骤:将固定的引发的模板核酸与包含聚合酶和一种核苷酸的检验混合物在抑制所述核苷酸化学掺入的条件下接触,任选通过洗涤步骤除去未结合的试剂,检测固定的核酸上聚合酶三元复合物的存在,连续地用不同种类的核苷酸重复这些步骤,直至形成并检测到三元复合物。三元复合物可以通过聚合酶/核酸/下一个正确核苷酸复合物的构象变化和增加的稳定性加以鉴别。连续核苷酸加入之间的洗涤步骤可以通过使用可以检测高保真度闭合复合物形成的检测机制而消除,例如倏逝波传感方法或选择性地监测来自三元复合物的信号的方法。上述检验步骤之后可以进行掺入步骤,掺入步骤包括将三元复合物与催化性金属离子接触以将在三元复合物中隔离的核苷酸共价加入到引物的3'末端。任选地,掺入步骤可包括将固定的核酸与包含多种类型核苷酸和聚合酶组合的掺入前混合物在抑制所述核苷酸化学掺入的条件下接触;其中掺入前混合物可含有添加剂及溶液条件以确保高效三元复合物形成(例如低盐条件)。所述方法还可包括进行洗涤步骤以除去未结合的试剂,及为固定的复合物提供包含催化性金属离子的掺入混合物,以化学掺入在聚合酶活性位点隔离的核苷酸。掺入前混合物确保高效的三元复合物形成,而洗涤步骤和掺入混合物确保在引物的3'末端加入单个核苷酸。任选地,掺入步骤可在检验加入了一种类型的核苷酸后直接进行。例如,用于测序的重复模式可包括以下流程模式:(i)dATP+/聚合酶,(ii)洗涤,(iii)Mg2+,(iv)洗涤,(v)dTTP+/聚合酶,(vi)洗涤,(vii)Mg2+,(viii)洗涤,(ix)dCTP+/聚合酶,(x)洗涤,(xi)Mg2+,(xii)洗涤,(xiii)dGTP+/聚合酶,(xiv)洗涤,(xv)Mg2+,(xvi)洗涤。任选地,用于测序的重复模式可包括(i)dATP+/聚合酶,(ii)洗涤,(iii)dTTP+/聚合酶,(iv)洗涤,(v)dGTP+/聚合酶,(vi)洗涤,(vii)dCTP+/聚合酶,(viii)洗涤,(ix)掺入前混合物,(x)洗涤,(xi)Mg2+,(xii)洗涤。洗涤步骤通常含有金属离子螯合剂和其它小分子,以防止在检验步骤中的意外掺入。在掺入步骤后,引物链通常延伸一个碱基。重复该过程,可以鉴别核酸的连续核碱基,有效地确定核酸序列。任选地,检测步骤在高盐条件下进行,例如在50mM至1500mM盐(即提供一价阳离子的盐,例如一价金属阳离子)条件下。
对于测序应用,最小化或消除流体和试剂交换是有利的。除去泵、阀门和试剂容器可以使得设备更小和更简单。本发明揭示的部分地是“全内置(all-in)”测序方法,其中不需要对于每个检验和/或掺入循环一个接一个地引入试剂。试剂仅在反应中加入一次,通过操纵已经包含在测序反应中的试剂来进行合成测序。这种方案需要一种区分不同核苷酸的方法,一种跨越核酸克隆群和/或不同核酸分子的同步掺入核苷酸的方法,及确保每个循环仅加入一个核苷酸的方法。任选地,测序反应混合物包括聚合酶、引发的模板核酸和至少一种类型的核苷酸。任选地,测序反应混合物包含多种的聚合酶、引发的模板核酸和核苷酸。如本发明所提供,聚合酶是指单一聚合酶或多种聚合酶。如本发明提供,引发的模板核酸或模板核酸是指单一引发的模板核酸或单一模板核酸,或者多个引发的模板核酸或多个模板核酸。如本发明所提供,核苷酸是指一个核苷酸或多个核苷酸。如本发明所提供,单一核苷酸是一个核苷酸。任选地,测序反应核苷酸包括但不限于以下核苷酸中的1、2、3或4种:dATP,dGTP,dCTP和dTTP(或dUTP)。
任选地,检验步骤和掺入步骤在一个测序反应混合物中进行。
任选地,1、2、3、4或更多种类型核苷酸(例如dATP,dGTP,dCTP,dTTP)一起同时存在于反应混合物中,其中一种类型的核苷酸是下一个正确核苷酸。反应混合物还包含至少一种聚合酶和至少一种引发的模板核酸。任选地,模板核酸是模板核酸的克隆群。任选地,聚合酶、引发的模板核酸和核苷酸在检验反应条件下形成三元复合物。
在本发明提供的方法中,四种类型的核苷酸可以独特和不同的浓度存在,其中由于四种核苷酸的浓度不同,对于四种核苷酸中的每一种而言,如果其是下一个正确核苷酸,扩散和聚合酶与模板核酸的结合时间是不同的。例如,最高浓度的核苷酸以较快时间与模板核酸上其互补碱基结合,最低浓度的核苷酸以较慢时间与模板核酸上其互补碱基结合;其中结合模板核酸上的互补碱基是指聚合酶结合三元复合物中具有下一个正确核苷酸的模板核酸。因此,通过监测聚合酶与三元复合物中模板核酸结合的速率或时间确定下一个正确核苷酸的身份。任选地,这四种类型核苷酸可以通过其浓度加以区分,其中不同浓度的核苷酸导致聚合酶与核酸结合的可测的不同的结合速率。任选地,这四种类型的核苷酸可以通过其浓度加以区分,其中不同浓度的核苷酸导致对于稳定的三元复合物形成的可测的不同的结合速率。
任选地,标记聚合酶。在一些情况中,聚合酶未被标记,使用本发明揭示的或本领域已知的任何无标记检测方法。任选地,通过聚合酶的可检测特征监测聚合酶与核酸的结合。任选地,通过聚合酶的可检测特征监测稳定的三元复合物的形成。聚合酶的可检测特征可包括但不限于光学、电学、热学、比色、质量及其任何组合。
任选地,将1、2、3、4或多种核苷酸类型(例如dATP,dTTP,dCTP,dGTP)连系(tether)于1、2、3、4或更多种不同聚合酶;其中每种核苷酸类型连系于不同的聚合酶,每种聚合酶具有与其它聚合酶不同的标签或特征以使其能被鉴别。可以将所有连系的核苷酸类型一起加入到测序反应混合物中,形成包含连系的核苷酸-聚合酶的三元复合物;监测所述三元复合物以鉴别聚合酶,从而鉴别聚合酶连系的下一个正确核苷酸。所述连系可以通过多个磷酸基团和接头分子在核苷酸的γ磷酸处发生。这种γ-磷酸连接方法是本领域的标准方法,其中荧光团附着于γ磷酸接头。所述标签包括但不限于光学、电学、热学、比色、质量或任何其它可检测特征。任选地,不同的核苷酸类型通过可区分标签鉴别。任选地,可区分标签附着于每个核苷酸的γ磷酸位置。
任选地,测序反应混合物包含催化性金属离子。任选地,催化性金属离子可以在测序反应中的任何点以瞬时方式与聚合酶反应。为确保稳健的测序,催化性金属离子可在短时间内可获得,使得与模板核酸的下一个碱基互补的单个核苷酸在掺入步骤期间掺入引物的3'末端。在这种情况中,不掺入其它核苷酸,例如与模板核酸中下一碱基下游的碱基互补的核苷酸。任选地,催化性金属离子镁以光笼闭复合物(例如DM-硝基苯)存在于测序反应混合物中,由此定位UV照射释放镁,使其可为聚合酶所用于核苷酸掺入。此外,测序反应混合物可含有EDTA,其中镁在催化核苷酸掺入后从聚合酶活性位点释放及被测序反应混合物中的EDTA捕获,从而使镁不能催化随后的核苷酸掺入。
因此,在本发明提供的方法中,催化性金属离子可以以螯合或笼闭的形式存在于测序反应中,其可以通过触发剂从这种形式中释放。例如,催化性金属离子催化下一个正确核苷酸掺入三元复合物,及随着催化性金属离子从活性位点释放,其被第二螯合剂或笼闭剂隔离,使金属离子不能催化随后的掺入。通过使用定位解笼闭或非螯合方案,例如倏逝波照射或结构化照射,保证催化性金属离子从其螯合或笼闭复合物的定位释放。催化性金属离子的受控释放可以例如通过热方式发生。催化性金属离子从其光笼闭复合物中的受控释放可以通过受限的光场在模板核酸附近被局部释放,例如通过倏逝波照射如波导或全内反射显微镜。催化性金属离子的受控释放可以例如通过改变模板核酸附近的溶液pH来进行。螯合剂如EDTA和EGTA是pH依赖性的。在低于5的pH,EDTA不能有效螯合二价阳离子Mg2+和Mn2 +。可控地操纵模板核酸附近pH的方法使得可以从螯合剂控制释放催化性金属离子。任选地,通过在核酸附着的表面施加电压诱导局部pH变化。所述pH方法的优点在于当pH恢复到螯合范围时,金属回到其螯合形式。
任选地,催化性金属离子与聚合酶的活性位点强力结合,使其必须在单一核苷酸掺入后从模板核酸中除去聚合酶。聚合酶的去除可以通过使用高分布性聚合酶完成,所述聚合酶在加入每个核苷酸后从合成的(引物)链的3'末端脱落。未结合的聚合酶可以进一步经历电场或磁场处理以将其从核酸分子附近除去。与聚合酶结合的任何金属离子可以通过存在于测序反应混合物中的螯合剂隔离,或者通过与金属离子竞争结合聚合酶活性位点而不干扰闭合复合物形成的分子隔离。可以终止从模板核酸移除或移动聚合酶的力(例如电场,磁场和/或螯合剂),使得聚合酶接近模板核酸进行另一轮测序(即检验和掺入)。在非限制性实例中,下一轮测序包括形成三元复合物,从模板核酸和/或三元复合物附近除去未结合的聚合酶,控制催化性金属离子释放以掺入在三元复合物中隔离的单一核苷酸,从模板核酸附近去除在单一核苷酸掺入后从模板核酸解离的聚合酶,通过使用螯合剂或竞争性结合剂隔离任何游离的催化性金属离子,及使得聚合酶接近模板核酸以进行下一个测序循环。
上文描述了用于鉴别核酸序列的聚合酶-核酸结合反应。核酸序列鉴别可包括关于核酸修饰的信息。核酸修饰包括甲基化和羟甲基化。甲基化可以发生在模板核酸的胞嘧啶碱基上。DNA甲基化可以稳定地改变基因表达。DNA甲基化也表现在各种类型的癌症、动脉粥样硬化和衰老的发展中。因此,DNA甲基化可以作为人类疾病的表观遗传生物标志物。
任选地,在本发明提供的结合测序方法期间鉴别模板核酸上的一或多个胞嘧啶甲基化。可以在测序之前克隆扩增模板核酸,其中扩增子包含与其模板核酸相同的甲基化。模板核酸的扩增可包括使用DNA甲基转移酶实现扩增子甲基化。将模板核酸或扩增的模板核酸提供给包含聚合酶和一或多种核苷酸类型的反应混合物,其中监测聚合酶与核酸之间的相互作用。任选地,在甲基化胞嘧啶存在下聚合酶与模板核酸之间的相互作用不同于存在未修饰胞嘧啶下的相互作用。因此,基于聚合酶-核酸相互作用的检验,确定修饰的核苷酸的身份。
本发明提供了对于多种可能的核苷酸和下一碱基组合产生聚合酶-核酸亲和性表的方法。因为这些亲和性主要受聚合酶活性位点处相互作用的影响,仅核苷酸和核酸模板上的下一碱基参与其中,所以可忽略背景特异性影响(context specific effect)。背景特异性影响可包括核酸的二级结构及从模板核酸上下一个碱基进一步向下序列的碱基贡献。亲和性表使得可以确定天然或修饰的核苷酸,其诱导对于不同模板碱基的亲和性的最宽和最易测量的分散。任选地,模板碱基是碱基dATP、dTTP、dCTP和dGTP其中的1、2、3或4种。应理解,对于与核苷酸互补的碱基存在最强的亲和性。如本文所用,分散特别是指其它三个不正确非互补碱基的亲和性差异。任选地,每种亲和性是在抑制核苷酸掺入和使二元复合物形成不稳定的检验条件下测量的。任选地,修饰或选择聚合酶以提供广泛的亲和性分散。工程化或天然聚合酶可能具有不利的错误模式或作为测序酶的其它不利特性,这是不重要的,因为这种聚合酶仅在非掺入条件下使用。对聚合酶可以根据其为不同的模板碱基提供易测量和独特亲和性的能力加以特别选择。具有所需性质的聚合酶的演化或筛选是本领域的标准方法(例如筛选对修饰的核苷酸具有高亲和性的聚合酶)。任选地,用高保真聚合酶替换聚合酶用于掺入步骤。任选地,选择为模板碱基提供最适合的亲和性的聚合酶和核苷酸组合,从而使得可以执行测序方法测量在选择的核苷酸存在下选择的聚合酶对于模板核酸的亲和性。核酸的下一个碱基通过测量的亲和性确定,对于模板碱基的亲和性谱在构建的亲和性表中提供。所述亲和性可以是聚合酶核酸相互作用的结合速率、解离速率或者结合速率与解离速率的组合。
在核苷酸存在下聚合酶对模板核酸的亲和性可以用本领域技术人员已知的多种方法测量。任选地,根据解离速率测量亲和性,其中通过监测随着用洗涤缓冲液洗涤反应而发生的聚合酶从模板核酸的释放而测量解离速率。任选地,以解离速率测量亲和性,其中通过在平衡结合条件尤其是聚合酶结合速率较低或扩散有限的平衡结合条件下,监测聚合酶从模板核酸的释放而测量解离速率。聚合酶结合速率在足够低浓度的聚合酶下扩散受限,其中如果聚合酶从DNA聚合酶复合物上脱落,其不会立即再加载,从而有足够时间检测聚合酶已从复合物中释放。对于较高亲和性相互作用,聚合酶从核酸中缓慢释放,而低亲和性相互作用导致聚合酶更快速释放。在这种情况中,亲和性谱解释为不同的解离速率,在动态洗涤条件或在平衡时测量的解离速率。最小的解离速率相应于与加入的核苷酸互补的碱基,而其它解离速率根据选择的聚合酶和核苷酸组合而以已知方式变化。
任选地,根据在反应混合物中提供聚合酶和核苷酸之后的平衡信号强度测量解离速率,其中与最低解离速率(最高亲和性)核苷酸的相互作用产生最强信号,而与其它不同解离速率核苷酸的相互作用产生可测量的不同强度的信号。作为非限制性实例,优选在全内反射(TIRF)条件下测量的荧光标记的聚合酶根据在适当选择的时间窗口中与表面固定的核酸分子结合的聚合酶分子的数量而产生不同的测量的荧光强度。也可以利用聚合酶的内在荧光,例如色氨酸荧光。高解离速率相互作用产生低测量强度,因为在选择的时间窗口中结合的聚合酶分子数量非常少,其中高解离速率表明大部分聚合酶未与核酸结合。可以采用任何表面定位的测量方案,包括但不限于标记或荧光方案。在平衡条件下测量亲和性的合适测量方案包括但不限于结合质量、折射率、表面电荷、介电常数和本领域已知的方案。任选地,在所提出的方案中组合结合速率和解离速率工程化产生更高的保真度检测。作为非限制性实例,一致的低结合速率、碱基依赖性、变化的解离速率导致未结合的聚合酶长时间保持未结合,使得可以增强区分解离速率和测量强度的变化。可以通过降低加入的聚合酶、核苷酸或者聚合酶与核苷酸两者的浓度控制结合速率。
任选地,聚合酶和核酸之间的相互作用通过附着于聚合酶的可检测标签加以监测。可以通过包括但不限于光学、电学、热学、质量、大小、电荷、振动和压力等检测方法监测标签。所述标签可以是磁性的、荧光的或带电荷的。对于外部和内部标记方案,荧光各向异性可用于确定三元复合物中聚合酶与核酸的稳定结合。
举例来说,用荧光团标记聚合酶,其中根据稳定的荧光信号监测闭合复合物形成。与存在下一个正确核苷酸时形成的三元复合物相比,在不正确核苷酸存在下聚合酶与模板核酸的不稳定相互作用导致可测量的较弱信号。
任选地,利用来自聚合酶的内在信号监测聚合酶和模板核酸在核苷酸存在下的相互作用,所述信号包括但不限于Raman特征、色氨酸、2-氨基嘌呤或其它内在荧光。可以利用聚合酶氨基酸的内在荧光检测在本发明揭示的测序方法的一或多个步骤期间发生的聚合酶构象变化,例如三元复合物形成或释放。具有内在荧光的氨基酸包括色氨酸、酪氨酸和苯丙氨酸。任选地,突变一或多个聚合酶氨基酸以包含色氨酸、酪氨酸或苯丙氨酸残基。聚合酶可以通过任何手段修饰,包括遗传或化学修饰,以包含具有内在荧光的其它氨基酸。任选地,内在荧光受到可引起荧光猝灭的其它氨基酸的接近度的影响,例如那些具有质子化基团的氨基酸(例如天冬氨酸,谷氨酸)。任选地,当聚合酶构建为三元复合物时,聚合酶的色氨酸残基埋在疏水核心中,当聚合酶被释放或不参与闭合复合物构象时,其暴露于水相环境。色氨酸的发射光谱根据环境(亲水或疏水)而不同,使得可以检测三元复合物。任选地,聚合酶的内在荧光用于鉴别测序反应期间的构象变化。在一个实例中,使用类似于如下文章中提及的技术监测来自聚合酶的色氨酸残基的内在荧光发射:Yu-Chih Tsai,ZhinanJin,and Kenneth A.Johnson,“Site-Specific Labeling of T7DNA Polymerase with aConformationally Sensitive Fluorophore and Its Use in Detecting SingleNucleotide Polymorphisms,”Analytical Biochemistry 384,no.1(January 1,2009):136-44,所述文章以其全部内容并入本文作参考。
任选地,在本发明提供的方法中,在一或多个检验和/或掺入步骤之后,加入一小组核苷酸以减少或重置相位。因此,所述方法可包括一或多个步骤,即将待测序的模板核酸分子与包含一小组核苷酸和酶的组合物接触,以将核苷酸掺入与所述核酸分子的模板链相对的链中。所述接触可以在减少核酸分子中的固定相位(phasing)的条件下发生。任选地,接触模板核酸分子的步骤发生在掺入步骤之后和/或在检验步骤之后。任选地,接触在1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、65、70、75、80、85、90、95或100或更多次测序循环(即检验和掺入循环)之后进行。任选地,接触在30-60次测序循环后进行。任选地,在每次测序循环后,即在一次检验和掺入步骤后,进行接触。任选地,在每次测序循环后进行多个接触步骤,其中每个接触步骤可包含不同小组的核苷酸。任选地,所述方法还包括在接触后的一或多个洗涤步骤。任选地,所述小组包含两或三种核苷酸。任选地,所述小组包含三种核苷酸。任选地,核苷酸小组选自dATP、dGTP、dCTP、dTTP(或dUTP)或其衍生物中的三种。任选地,所述三种核苷酸包含腺苷、胞嘧啶和鸟嘌呤。任选地,所述三种核苷酸包含腺苷、胞嘧啶和胸腺嘧啶。任选地,所述三种核苷酸包含胞嘧啶、鸟嘌呤和胸腺嘧啶。任选地,所述三种核苷酸包含腺苷、鸟嘌呤和胸腺嘧啶。任选地,每次接触循环包含相同或不同小组的核苷酸。任选地,监测核酸模板的测序,在检测相位时发生与核苷酸小组的接触。还参见例如美国专利号8,236,532,所述专利以其全文并入本文作参考。
任选地,测序反应包括多个模板核酸、聚合酶和/或核苷酸,其中监测多种三元复合物。可以将克隆扩增的模板核酸一起测序,其中所述克隆位置非常接近以使得在测序期间可以增强监测。任选地,三元复合物的形成确保越过多个克隆扩增的模板核酸的碱基延伸的同步性。碱基延伸的同步性使得可以在每个测序循环仅加入一个碱基。
实施例
实施例1描述了在检验步骤中研究包含或省略二价催化性阳离子的结果的程序。使用无标记系统和Klenow聚合酶进行这个程序。
实施例1:结合步骤中含镁或不含镁的碱基序列确定
在这个程序中使用的材料和方法如下。聚合酶缓冲液:20mM Tris缓冲液,pH 8.0,300mM NaCl,5mM DTT,100μM dNTP,150nM Klenow,0.01% BSA,0.02% Tween-20,10mMMgCl2。检验缓冲液:20mM Tris缓冲液(pH 8.0),300mM NaCl,5mM DTT,100μM dNTP,150nMKlenow,0.01% BSA,0.02% Tween-20。掺入缓冲液:20mM Tris缓冲液(pH 8),300mMNaCl,5mM DTT,0.01% BSA,0.02% Tween-20,10mM MgCl2。洗涤缓冲液:20mM Tris缓冲液(pH 8),300mM NaCl,5mM DTT,0.01% BSA,0.02%Tween-20。
图1示出使用未标记的光学检测方法的实验结果,其中在检验步骤期间存在或不存在镁。第一列包括dCTP(C:T错配),第二列包括dATP(A:T匹配)。图1中的实线示出使用聚合酶缓冲液获得的结果。对于匹配A和错配C步骤,稳态前速率常数分别为0.0106和0.0084。差异太小以至于无法准确区分同源碱基。图1中的虚线表示检验缓冲液中的无镁检验步骤,然后浸泡在掺入缓冲液中。1.1nm的信号阈值准确地确定了正确碱基。这些结果表明,传感平台无法捕获可以区分匹配与错配碱基的瞬时动力学,当检测期间在缓冲液中包含镁时无法进行序列测定(聚合酶缓冲液,实线,图1)。相反,在没有镁的情况中结合提供了在正确和不正确碱基之间极大区分(检验缓冲液,虚线,图1)。这个程序中正确碱基序列通过信号阈值而不是结合速率确定。
实施例2描述了在检验步骤期间(即在聚合酶、DNA模板和核苷酸之间形成三元复合物期间)如何使用结合动力学确定正确碱基或核苷酸的程序。当呈现正确碱基时,Bst酶显示双峰结合曲线,当呈现不正确碱基时,Bst酶显示基本的指数结合行为,从而可以在该程序期间区分和检测正确碱基或核苷酸。
实施例2:使用Bst酶结合动力学测序
在这个程序中使用的材料和方法如下。(Menlo Park,CA)Octet仪器(Red384或QK)使用生物层干涉法测量在光纤尖端表面的结合反应。将尖端用链霉抗生物素蛋白(SA)功能化以使得能够结合与引物杂交的5'生物素标记的DNA模板,所述引物与模板的3'末端附近的序列互补。PhiX_matchC和phiX_matchA加样于各个尖端上。将引物-模板以在含有0.01-0.02% BSA和0.01-0.02% Tween-20的1-2x PBS(加样缓冲液)中100-500nM加样于尖端上。FP2引物比模板过量1.25-2倍。通过信号变化监测加样,通常在30℃下5分钟内达到平台。将尖端在加样缓冲液中浸泡1-5分钟以除去未结合的DNA材料。对于碱基读出,通常将尖端浸在含有1X Taq缓冲液(10mM Tris-HCl(pH 8.3),50mM KCl,25℃,无镁)的溶液中,所述溶液中补加了0.01-0.02% BSA和0.01-0.02%Tween-20(LS缓冲液),100nM聚合酶,100μM核苷酸和50-300mM不同浓度的额外NaCl。在这个实验中,为确定正确碱基,使用30nM Bst2.0酶,100μM dNTP和含有150mM NaCl的LS缓冲液。phiX_matchC双链体将形成三元复合物且因为存在正确的下一个核苷酸(同源核苷酸)而示出结合信号增加。phiX_matchA应该不是这样,因为其是不正确核苷酸(非同源核苷酸)。在检验步骤之后,将传感器浸在含有5mM Mg2+的LS缓冲液中,以使聚合酶掺入核苷酸,然后用含有150mM NaCl的LS缓冲液洗涤。
这个方法的结果示于图2。迭代循环示出这个方法可用于序列测定。表2示出通过这个检验方法正确鉴别前三个碱基。第四个碱基通过所述检验方法“无读出”,可以反映多个加入。与此一致,随后的碱基被正确鉴别。总体而言,正确鉴定了6个碱基中的5个。此外,未观察到不正确碱基的错误掺入。
表2:碱基鉴别
预期的碱基 | A | G | C | T | 注解 |
C | x | x | C | ||
G | x | G | |||
C | x | x | C | ||
C | x | x | ? | 难以读出 | |
T | x | x | x | T | |
T | X | x | x | T |
实施例3描述了测序反应,其中使用高盐条件的检验步骤之后是掺入步骤。
实施例3:结合测序
这个程序中使用的材料和方法如下。在这种情况中使用的结合/检验缓冲液是具有250mM NaCl、100μM dGTP、dCTP、dATP或dTTP、1.5mM Sr2+、100nM Klenow exo(-)聚合酶的LS缓冲液。掺入缓冲液是含有50mM NaCl、50mM MgCl2的LS缓冲液,洗涤缓冲液是含有250mMNaCl的LS缓冲液。使用Octet Red384系统(Menlo Park,CA),使用生物素phiX_matchC模板和附着于SA传感器尖端的FP2引物序列进行测序循环。测序步骤包括以下:(a)用dATP检验,(b)掺入,(c)洗涤,(d)用dGTP检验,(e)掺入,(f)洗涤,(g)用dCTP检验,(h)掺入,(i)洗涤,(j)用dTTP检验,(k)掺入,(l)洗涤,随后从(a)开始重复这些步骤。对于碱基读出,检验步骤产生的可检测信号高于在先前洗涤步骤和/或相对于对照序列的基线。
这个程序的结果表明正确鉴别12个碱基。有2个碱基由于结合信号太低而未被鉴别。这个实验正确鉴别了12/14碱基,如下表3示出。
表3:序列鉴别
预期碱基 | G | C | T | A | 注解 |
C | C | ||||
G | G | ||||
C | C | ||||
C | 未读出 | ||||
T | T | ||||
T | T | ||||
C | C | ||||
G | G | ||||
T | T | ||||
A | A | ||||
T | 未读出 | ||||
G | G | ||||
T | T | ||||
T | T |
实施例4描述了最初用于确定含有一价阳离子的盐对聚合酶匹配/错配区分的影响的程序。在该程序中使用的Octet仪器(Red384或QK)(Menlo Park,CA)使用生物层干涉测量法测量光纤尖端表面的结合反应。尖端已经用链霉抗生物素蛋白(SA)功能化,以使得能结合与引物杂交的5'生物素标记的DNA模板,所述引物与模板的3'末端附近的序列互补。
实施例4:区分匹配/错配碱基的盐浓度
这个程序中使用的材料和方法如下。将PhiX_matchC和phiX_matchA加样于各个尖端。将在含有0.01-0.02% BSA和0.01-0.02% Tween-20(加样缓冲液)的1-2x PBS中100-500nM的引物-模板加样于尖端上。FP2引物比模板过量1.25-2倍。通过信号变化监测加样,通常在30℃下5分钟内达到平台。将尖端浸在加样缓冲液中1-5分钟以除去未结合的DNA材料。对于碱基读出,通常将尖端浸在含有1X Taq缓冲液(10mM Tris-HCl,50mM KCl,pH8.3,25℃,无镁)的溶液中,所述溶液补加了0.01-0.02% BSA和0.01-0.02% Tween-20(LS缓冲液)、100nM聚合酶、100μM dNTP以及50-300mM的不同浓度的额外NaCl。phiX_matchC双链体将形成三元复合物,且由于存在正确的下一个核苷酸(同源核苷酸)而示出结合信号增加。phiX_matchA应该不导致结合信号增加,因为其是不正确的(非同源)核苷酸。
结果表明这两种模板在标准反应条件下均结合聚合酶。然而,随着盐浓度增加,非同源复合物的结合亲和性降低,而同源复合物的结合亲和性仍然很高。因此,区分碱基的信噪比(SNR)增加,由此在这个检验步骤期间可以容易地鉴别下一个正确碱基(参见图3)。尽管在这个实施例中使用NaCl作为含有一价阳离子的模型盐,但也可以使用其它盐如KCl、NH2(SO4)、谷氨酸钾以及本领域已知的其它盐。显示正确和不正确核苷酸之间结合亲和性差异的聚合酶包括Klenow聚合酶、Bst2.0、Bsu和Taq。
实施例5描述了表明在结合反应的结合和解离阶段期间的检验如何用于改良序列保真度的方法。在这种情况中,可以通过三元复合物的解离(即丧失)鉴别同源核苷酸。
实施例5:在解离/洗涤步骤期间的碱基区分
在这个程序中使用的材料和方法如下。在这个实验中,如上所述将phiX_matchC和FP2引物加样于SA传感器尖端。在含有100μM的dGTP、dCTP、dATP或dTTP和100nM Klenow或Bst2.0酶和1mM SrCl2的LS缓冲液中形成聚合酶复合物。
结果表明,在低盐条件下,无论是否存在同源核苷酸,聚合酶均有效地与引发的模板核酸的DNA结合。在洗涤缓冲液(LS缓冲液+50mM或100mM加入的NaCl)中,所有复合物解离。当存在额外的NaCl时,甚至SrCl2也不能稳定复合物。然而,当在洗涤缓冲液中包含与在结合缓冲液中相同的50μM dNTP时,则仅具有不正确核苷酸的复合物解离,正确的三元复合物是稳定的(见图4)。此外,发现在结合步骤中不需要dNTP,可以在洗涤期间包括dNTP。当随后导入正确的dNTP时,结合的二元复合物仍可以使得正确碱基进入并形成三元复合物。另外,保真度不受存在不正确核苷酸的影响。因此,聚合酶的解离速率也可用于确定dNTP混合物(例如在将以不同速率解离的不同浓度)中的正确碱基。
实施例6:核酸:聚合酶复合物在洗涤缓冲液中的稳定
为了最小化在同聚物区域多次掺入的可能性,可以在掺入之前进行洗涤步骤。金属阳离子如钙和锶可以稳定聚合酶复合物(如镁),但不能支持催化导致核苷酸掺入的磷酸二酯键。在这个实验中,将不同浓度的SrCl2(0mM-14mM)加入洗涤缓冲液(LS缓冲液)中。在洗涤缓冲液中存在少至3.5mM Sr2+离子(最低浓度)时,聚合酶复合物更稳定得多。此外,当在结合步骤期间存在正确或不正确核苷酸时,复合物的稳定性没有明显受到影响,表明聚合酶的Sr2+相关稳定性不限于三元复合物。结果如图5所示。
实施例7描述了研究DNA Pol I的3'-5'核酸外切酶活性作用的程序。核酸外切酶活性增加保真度,因为通过聚合酶的核酸外切酶活性提供的校正功能除去了不正确的碱基或瓣(flap)。但是,这种活性可能会切割正确碱基并导致错误的序列读出。
实施例7:无3’-5’核酸外切酶活性的DNApol I的使用
这个程序中使用的材料和方法如下。将具有3'末端错配的引物与模板杂交,产生翻口端或瓣构建体。Klenow exo(-)聚合酶无法延伸这个末端。然而,DNA pol I大片段具有核酸外切酶活性及可以除去错配碱基。一旦去除,引物可以通过klenow exo(-)聚合酶或DNA聚合酶正常延伸。将具有固定的瓣结构的两个传感器暴露于DNA聚合酶或Klenow exo(-)用于测序。然后以正确顺序将传感器暴露于模板序列。DNA聚合酶传感器能加入碱基,而Klenow片段传感器由于瓣结构而无法加入任何碱基。DNA聚合酶的任何3'-5'外切活性均导致碱基加入与序列不同步。
这个程序的结果如图6所示。DNA聚合酶切割错配碱基使得随后碱基加入。碱基在4个周期是正确的。没有核酸外切酶活性,Klenow exo(-)无法延伸模板。在虚假核酸外切酶活性是有害的情况下,核酸外切酶可被竞争性、反竞争性或非竞争性化合物或类似物抑制。例如,NaF是DNA聚合酶核酸外切酶功能的竞争性抑制剂(Potapova et al.,FEBS Letters,277(1-2):109-111(1990))。
表4:核酸序列
实施例8描述了使用HIV-1逆转录酶组合酶抑制剂的程序。作为这个实施例中使用的靶序列的背景,在4-5%的非小细胞肺癌患者中发现EML4-ALK融合(Soda et al.,Nature448:561-6(2007);Mano,Cancer Sci.99:2349-55(2008);及Horn and Pao,J.Clin.Oncol.27:4232-5(2009))。已经在临床肺肿瘤中鉴别了ALK C4493A突变,其导致ALK蛋白中的L1196M“门控”突变并赋予对化疗药物克唑替尼(crizotinib)的抗性(Choi etal.,N.Engl.J.Med.18:1734-9(2010))。4496-4509AS引物能进入具有门控突变的区域中测序。模板寡核苷酸序列衍生自野生型人ALK基因(核苷酸编号4460-4509)。引物序列与人ALK基因的一部分互补(核苷酸编号4496-4509)。
实施例8:使用HIV逆转录酶(RT)和非核苷逆转录酶抑制剂(NNRTI)化合物7和18进
行测序
这个程序中使用的材料和方法如下。具有3'反向dT的模板寡核苷酸Btn-4460-4509S的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCC CCGGTTCATCCTGCTGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:9)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGAGCTC-3’(SEQ ID NO:10)。模板寡核苷酸Btn-4460-4509S和引物寡核苷酸4496-4509AS由Integrated DNA Technologies(Coralville,IA)合成并分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸为100μM。将引物和模板寡核苷酸组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH8.0),0.1mM EDTA,80mM KCl)的试管中。将含有引物-模板溶液的试管加样于干热模块上(95℃,5分钟),将模块移至工作台上面,通过逐渐冷却至环境温度使链退火。反竞争性NNRTI化合物(Pitta et al.,J.Enzyme Inhib.Med.Chem.28(10):113-22(2013)),以其全文并入本文作参考)来自Epigen Biosciences,Inc.(San Diego,CA)。将NNRTI化合物7(3-4-氯-苯并[d]噻唑-2-基)-2-(2-氯-6-氟苯基)噻唑烷-4-酮)和18(3-(6-乙氧基-苯并[d])噻唑-2-基)-2-(2-氯-6-氟苯基)噻唑烷-4-酮)分别溶解在二甲基亚砜(DMSO)中,浓度分别为25.0mM和15.0mM。重组纯化的HIV逆转录酶(HIV RT)得自Worthington BiochemicalCorp(Lakewood,NJ)。超纯牛血清白蛋白(BSA)得自Ambion(Foster City,CA)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100μM)。在即将使用之前,将HIV逆转录酶预先在酶稀释剂(50mM Tris缓冲液(pH 8.0),8mM MgCl2)中稀释。结合缓冲液(50mM Tris缓冲液(pH 8.0),160mM KCl,0.5mM EDTA,11mM MgCl2,0.3%(v/v)Triton X-100,5.3mM二硫苏糖醇(DTT),100μg/mL牛血清白蛋白(BSA),100μM dNTP(dATP,dTTP,dGTP或dCTP),100nM HIV RT)。NNRTI化合物在即将加入结合缓冲液之前用DMSO预稀释。反应缓冲液是不含NNRTI、dNTP或HIV RT酶的结合缓冲液。将含有引物-模板(PT)的缓冲液、PT洗涤缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液加样(200μL/孔)于Greiner96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)。将链霉抗生物素蛋白(SA)生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5019)在退火缓冲液中再水合约10分钟,之后再使用。将Octet QK生物传感器系统(Pall ForteBio Corp.,Menlo Park,CA)设定为30℃操作,编程为用引物-模板包被生物传感器及用PT洗涤缓冲液洗去未结合的引物-模板。将生物传感器移至含有HIV RT和dCTP±NNRTI的结合缓冲液(结合阶段),然后移至反应缓冲液(dCTP掺入和解离阶段)。类似地,如所示,将生物传感器以循环方式移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。重复多次结合和掺入的循环。将Octet干涉测量仪生成的监测数据输入Microsoft Excel和Prism软件(GraphPadSoftware,San Diego,CA)进行显示。通过在19.4秒窗口内平均或者通过Prism软件(19.4秒窗口和6阶平滑多项式)平滑结合和解离反应的进程。
这个程序的结果在图7A-7B和图8中示出。具有报道的反竞争性抑制模式的非核苷类逆转录酶抑制剂(NNRTI)用于通过HIV逆转录酶的DNA依赖性DNA聚合酶活性进行DNA测序。在结合用引物-模板包被的生物传感器的测定中,HIV逆转录酶、正确dNTP和NNRTI化合物7(40μM)的组合在结合阶段呈现出明显的结合峰,随后在解离阶段在洗涤缓冲液中结合降低(图7A,圆形)。与NNRTI稳定的HIV RT-dNTP混合物不同,含有HIV RT和正确dNTP的反应不产生明显结合峰(图7A,三角形),对照组也不产生明显结合峰(具有或不具有40μMNNRTI化合物7的HIV RT;图7A,实线和虚线)。结合和解离的时程表明图7A中前6个测序循环(核苷酸序列CAGCAG)。具有不正确核苷酸dCTP和dATP的第7个循环和第8个循环分别不产生结合峰。具有正确核苷酸dGTP的第九个循环(图7A)。图7B中示出每个循环的结合(0-5分钟)和解离(5-10分钟)时程。类似地,使用HIV RT和NNRTI化合物18的测序也产生测序结果。在结合用引物-模板包被的生物传感器的测定中,HIV逆转录酶、正确dNTP和NNRTI化合物18(80μM)的组合在结合阶段呈现出明显结合峰,随后在解离阶段在洗涤缓冲液中结合降低(图8,钻石形)。与NNRTI稳定的HIV RT-dNTP混合物不同,含有HIV RT和正确dNTP的反应不产生明显结合峰(图8,三角形),对照组也如此(具有80μM NNRTI化合物18的HIV RT;图8,虚线)。在第1-3个循环中,结合峰表示具有正确核苷酸和化合物18的HIV RT与序列CAG的结合(图8)。具有HIV RT、不正确核苷酸dTTP和化合物18的第4个循环未示出结合峰(图8)。随后的循环未示出用于测序分析的其它峰。
实施例9描述了表明另一种无标记测序系统的效用的方法。更具体地,结果表明在SPRi生物传感器上使用Klenow/dNTP结合测定精确测序DNA的能力。SPRi生物传感器具有足够的灵敏度和持久性以检测在多次检验/掺入循环中进行DNA测序所需的不同步骤。下面示出在60bp链内三个碱基对的测序。这种技术可以扩展为任意次数的测序循环。
实施例9:表面等离子体共振(SPR)成像生物传感器上的DNA测序
这个程序中使用的材料和方法如下。SPR传感器芯片:20mm×20mm×1mm高折射率(1.61)载玻片(NanoSPR,Chicago,IL)。烷基硫醇,PEG6:单硫代烷烃(C11)PEG6-OH(11-巯基十一烷基六乙二醇(目录号,SPT-0011P6),及BAT:生物素化烷烃PEG硫醇(目录号,SPT-0012D),得自Sensopath technologies(Bozeman,MT)。基础缓冲液(洗涤):300mM KCl,20mMTris HCl(pH8.0),0.01%Tween-20,1mM SrCl2。检验缓冲液:基础缓冲液加上50nM Klenow片段和100nM dNTP。掺入缓冲液:基础缓冲液加上10mM MgCl2。在实验之前,将金包被的SPR载玻片用在100% EtOH中稀释至最终组合浓度为1×10-4M的18% BAT加上82% PEG6混合的SAM包被。将SPR载玻片在室温下在烷硫醇溶液中保温过夜。温育后,将SPR载玻片在新鲜的100% EtOH中漂洗,然后用在去离子水中50% EtOH及用去离子水漂洗。然后将载玻片在空气中干燥。将载玻片安装在定制的SPR成像系统上,该系统提供流体控制、图像采集和数据量化。将含有在基础缓冲液中的10μg/mL链霉抗生物素蛋白的溶液注入流动池中。所得链霉抗生物素蛋白层的结合通过测量大约180秒从SPR芯片反射的光的变化而监测。然后用过量的基础缓冲液洗涤。然后将预杂交的引物FP2/PhiX_matchA模板DNA注入流动池中,使其与链霉抗生物素蛋白层结合大约180秒,然后用过量的基础缓冲液洗涤。为了测序,在含有100nM任一dATP、dCTP、dTTP或dGTP的基础缓冲液中制备含有50nM Klenow片段的溶液。将dNTP溶液分别注入流动池(按G,A,A,T,C,G的顺序)并温育大约180秒以检验SPRi反应。如果没有/低信号变化,则用过量的基础缓冲液洗涤流动池。如果SPR信号指示碱基匹配,则用掺入缓冲液(含有10mM Mg2+)洗涤流动池30秒以掺入正确dNTP,然后用基础缓冲液洗涤。重复所述检验、掺入和洗涤步骤。
图9示出鉴别三个错配碱基和三个正确碱基记录的传感图。在退火的引物序列之后的phiX_matchA模板的前三个正确共轭碱基是A、T和G。流过传感器的第一溶液含有聚合酶和dGTP,其对应于碱基对错配。所得传感器迹线示出基线反射比几乎没有变化,表明聚合酶分子不与引发的模板链结合。流过传感器的下一个溶液含有聚合酶和dATP,其对应于正确共轭碱基。所得迹线(在灰色框中高光示出)示出反射光的强增加,表明聚合酶已与引发的模板链结合,从而改变SPR的位置。在将聚合酶溶液温育大约180秒(以确保可用结合位点饱和)之后,将含有10mM Mg2+的掺入溶液导入流动池中。Mg2+的导入使得聚合酶将结合的dATP掺入与模板结合的引物链中。为确保成功掺入dATP,将聚合酶-dATP溶液再次流过传感器芯片。然而,这一次反射光的量没有像之前那样强烈地增加,表明聚合酶不与模板链结合,因为正确同源碱基不再是A。为检验下一个正确碱基,将聚合酶与dTTP的溶液流过传感器。正如期望的,反射光的强度再次增加高于阈值,表明dATP的掺入成功及下一个正确碱基是T。将掺入缓冲液流过传感器芯片以掺入碱基。使用错配(聚合酶-dCTP)、随后匹配(聚合酶-dGTP)将该过程再重复两次。在两种情况下,观测到预期反应,表明下一个正确共轭碱基实际上是G。
实施例10描述了表明对双链DNA模板测序的程序。
实施例10:通过切口平移测序双链DNA
在这个程序中使用的材料和方法如下。具有3'反向dT的模板寡核苷酸Btn-4460-4509S的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGCTGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:9)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGAGCTC-3’(SEQ ID NO:10)。寡核苷酸4460-4494AS的DNA序列是:5’-AGCAGGATGAACCGGG/i5NitInd/CAGGGATTGCAGGCTCAC-3’(SEQ ID NO:11),其中“/i5NitInd/”是5-硝基吲哚-2'-脱氧核糖残基。5-硝基吲哚旨在在这种情况下阻止鸟嘌呤四联体形成以及用作通用碱基。在TE缓冲液(10mM Tris pH 8.0,0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸Btn-4460-4509S和4496-4509AS组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA,80mM KCl)的试管中。为制备具有1-碱基对缺口的dsDNA引物/模板,将寡核苷酸Btn-4460-4509S、4496-4509AS和4460-4494AS组合(每条链10μM)在含有退火缓冲液的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将该模块移至台面上通过逐渐冷却至室温以使链退火。由嗜热脂肪芽孢杆菌编码的全长DNA聚合酶(“Bst DNA聚合酶”,从大肠杆菌中纯化的重组酶)购自New England Biolabs(Ipswich,MA,目录号M0328L)。超纯牛血清白蛋白(BSA)购自Ambion(Foster City,CA)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100μM)。结合缓冲液是50mM Tris缓冲液(pH 8.0)、300mM KCl、0.1%(v/v)Triton-X100、100μg/mL牛血清白蛋白。反应缓冲液是含有10mM MgCl2的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液加样(200μL/孔)于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO,目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO,目录号M8662)(75μL/孔)。在使用前,将链霉抗生物素蛋白(SA)生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5019)在退火缓冲液中再水合约10分钟。将Octet QK生物传感器系统(Pall ForteBio Corp.,Menlo Park,CA)设定为在30℃操作及编程为用引物-模板包被生物传感器以及用结合缓冲液洗去未结合的引物-模板。如所示,将生物传感器移至含有136单位/mL Bst DNA聚合酶和200μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后移至反应缓冲液中以进行dNTP掺入。将生物传感器转移至含有Bst DNA聚合酶(136单位/mL)但不含dNTP的反应缓冲液中,通过5'-3'核酸外切酶活性促进切口平移。将生物传感器转移至不含酶或镁的反应缓冲液中(解离阶段)。类似地,如所示,将生物传感器以循环方式移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。重复多次结合和掺入及5'-3'核酸外切酶解循环以评估测序。将Octet干涉测量仪生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果示于图10A-10C。在结合用引物-模板包被的生物传感器的测定中,Bst DNA聚合酶和正确的2'-脱氧核糖核苷三磷酸(dCTP)的组合在结合阶段示出明显结合峰(图10A、10B和10C,dCTP“C”)。循环1表明在dsDNA模板结合和掺入一个碱基对缺口(图10A和10B)和在对照ssDNA模板中在引物下游掺入正确核苷酸(图10C)。缺乏dNTP的对照示出最小结合(图10A,10B和10C,第1-7循环)。循环2示出聚合酶与dsDNA模板组合下一个正确核苷酸dATP的结合(图10A和10B,dATP“A”),其小于无阻碍的ssDNA模板的结合(图10C,dATP“A”),表明互补链的核酸外切裂解不完全。结合和解离的时程表明dsDNA(图10A和10B)和ssDNA(图10C)的前三个循环(核苷酸序列CAG)的测序。如所预期,具有不正确核苷酸dTTP的第4个循环不产生结合峰(图10A,10B和10C)。这些结果表明使用DNA聚合酶和Bst DNA聚合酶的5'-3'核酸外切酶活性通过切口平移对双链DNA进行测序的能力。
实施例11描述了用于表明双链DNA模板测序的其它程序。
实施例11:通过链置换测序双链DNA
这个程序中使用的材料和方法如下。具有3'反向dT的模板寡核苷酸Btn-4460-4509S的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGCTGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:9)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGAGCTC-3’(SEQ ID NO:10)。寡核苷酸4460-4494AS的DNA序列是:5’-AGCAGGATGAACCGGG/i5NitInd/CAGGGATTGCAGGCTCAC-3’(SEQ ID NO:11),其中“/i5NitInd/”是5-硝基吲哚-2'-脱氧核糖残基。5-硝基吲哚旨在在这种情况下防止鸟嘌呤四联体形成及用作通用碱基。寡核苷酸4460-4494AS-T8的DNA序列是:5’-TTTTTTTTAGCAGGATGAACCGGG/i5NitInd/CAGGGATTGCAGGCTCAC-3’(SEQ ID NO:12),其中“/i5NitInd/”是是5-硝基吲哚-2'-脱氧核糖残基。5-硝基吲哚旨在在这种情况下防止鸟嘌呤四联体形成及用作通用碱基。寡核苷酸Btn-4460-4509S、4460-4494AS、4496-4509AS和4460-4494AS-T8由Integrated DNA Technologies(Coralville,IA)合成并分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mMEDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸Btn-4460-4509S和4496-4509AS组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH 8.0),0.1mMEDTA,80mM KCl)的试管中。为制备具有1-碱基缺口的dsDNA引物/模板,将寡核苷酸Btn-4460-4509S、4496-4509AS和4460-4494AS组合(每条链10μM)在含有退火缓冲液的试管中。为制备具有5'-oligo-dT flap和1-碱基缺口的dsDNA引物/模板,将寡核苷酸Btn-4460-4509S、4496-4509AS和4460-4494-AS-T8组合(每条链10μM)在含有退火缓冲液的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将该模块移至台面上,通过逐渐冷却至环境温度使链退火。Klenow(大肠杆菌DNA聚合酶的3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。超纯牛血清白蛋白(BSA)购自Ambion(Foster City,CA)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体稀释(50nM)到退火缓冲液中。结合缓冲液是20mM Tris,pH 8.0,300mM KCl,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。反应缓冲液是含有50mM KCl和10mM MgCl2的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液加样(200μL/孔)于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将链霉抗生物素蛋白(SA)生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5019)在退火缓冲液中再水合约10分钟。将Octet QK生物传感器系统(Pall ForteBio Corp.,MenloPark,CA)设定为在30℃操作及编程为用引物-模板包被生物传感器以及用结合缓冲液洗去未结合的引物-模板。如所示出,将生物传感器移至含有Klenow exo(-)(68单位/mL)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后移至反应缓冲液中进行dNTP掺入。将生物传感器移至不含酶或镁的反应缓冲液中(解离阶段)。类似地,如所示出,将生物传感器循环转移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。重复多次结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图11A-11C中示出。在结合用ssDNA引物-模板包被的生物传感器的测定中,Klenow exo(-)在正确的各个dNTP存在下产生结合峰,但不正确的dTTP核苷酸存在下不产生结合峰(图11A,深色迹线)。相反,阴性对照(没有dNTP的酶)不能结合,如一致的平坦结合反应所示(图11A,灰色迹线)。因此,Klenow exo(-)产生CAGCAG(C?)A序列(SEQID NO:13),其与预期序列(CAGCAGGA(SEQ ID NO:1))具有88%相同性。在与用在反义引物和下游反义链之间具有1-碱基缺口的dsDNA引物-模板包被的生物传感器结合的测定中,Klenow exo(-)仅在存在第一个正确的各个dCTP核苷酸时产生结合峰(图11B,深色迹线)。阴性对照(没有dNTP的酶)不能结合,如一致的平坦结合反应所示(图11B,灰色迹线)。因此,Klenow exo(-)产生“C”序列,其中缺口的第一碱基用正确核苷酸填充。然而,在随后的循环中,进一步结合或聚合成双链DNA区域被阻断。进一步测序被阻断可能是由于Klenow exo(-)的5'-3'核酸外切酶结构域(用于切口平移)的固有缺失或者不能破坏DNA的下游双链螺旋(链置换)。因此,导入5'-oligo-dT flap以为Klenow exo(-)提供更好的底物用于链置换。用带有在反义引物和下游反义链之间具有1-碱基缺口的5'-oligo-dT flap的dsDNA引物-模板包被生物传感器。Klenow exo(-)在循环#1的1-碱基缺口(C)产生结合峰,在dsDNA区域中观察到其它结合峰,为循环2、3和5提供序列AGC(图11C,深色迹线)。具有不正确dNTP的循环#4、6、7和8不能使酶与固定的DNA结合(图11C)。阴性对照(没有dNTP的酶)不能结合,如平坦结合反应所示(图11C,灰色迹线)。因此,Klenow exo(-)产生100%正确的序列“CAGC”,其中缺口的第一个碱基用正确核苷酸填充,观测到其它3个碱基进一步结合或聚合为双链DNA区域。与双链DNA区域相邻的5'-flap使得Klenow exo(-)能够通过链置换进行测序(图11C),而缺少5'-flap阻断对dsDNA区域的测序(图11B)。这些结果表明使用DNA聚合酶的Klenow exo(-)片段通过链置换机制对双链DNA进行测序的能力。
实施例12描述了研究谷氨酸阴离子对于测序反应的影响的程序。
实施例12:阴离子对于单链DNA测序的影响
为制备ssDNA引物/模板,将寡核苷酸Btn-4460-4509S(SEQ ID NO:9)和4496-4509AS(SEQ ID NO:10)组合(每条链10μM)在含有退火缓冲液(10mM Tris pH 8.0,0.1mMEDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将该模块移至台面上,通过逐渐冷却至环境温度使链退火。大肠杆菌DNA聚合酶的Klenow(3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。谷氨酸钾购自(Teknova,Hollister,CA;目录号P2000)。超纯牛血清白蛋白(BSA)购自Ambion(FosterCity,CA)。所有试剂和溶液均为分子生物学级别。结合缓冲液是20mM Tris缓冲液(pH8.0),300mM KCl,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。反应缓冲液是含有50mM KCl和10mM MgCl2的结合缓冲液。对于测试的每个水平的谷氨酸钾,制备结合缓冲液以含有0、50、100或200mM谷氨酸钾。反应缓冲液不含谷氨酸钾。如实施例11中所述设置Octet QK生物传感器系统。如所示,将生物传感器移至含有Klenow exo(-)(68单位/mL)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后移至反应缓冲液中进行dNTP掺入。将生物传感器移至含有镁不含酶的反应缓冲液中(解离阶段)。将生物传感器转移至不含酶或dNTP但含有各个浓度的谷氨酸钾的结合缓冲液中以重新平衡。类似地,如所示,将生物传感器以循环方式移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。重复多次结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据输入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图12A-12C中示出。在结合用ssDNA引物-模板包被的生物传感器的测定中,Klenow exo(-)(不含谷氨酸的KCl)产生结合峰,用于使用正确核苷酸的测序,如在含有200mM谷氨酸的KCl中的酶一样(图12A,分别见虚线和实线所示)。然而,与具有200mM谷氨酸的制剂相比(图12A),没有谷氨酸的缓冲剂呈现出降低的结合峰幅度和增加的背景。根据含有酶和正确dNTP(而不是不正确dNTP)的混合物在8.25小时时程的相对峰高,在KCl和200mM谷氨酸制剂中观测正确序列(图12A)。在这些条件下,同聚物似乎以单峰被检测(图12A,12B和12C)。在含有KCl和100mM谷氨酸的缓冲液中,观测7小时时程,正确序列具有酶和正确dNTP的强峰信号,而对照(没有dNTP的酶)不产生峰及背景逐渐增加(图12B)。含有KCl和50mM谷氨酸的缓冲液在7小时时程示出正确序列,而没有dNTP的对照酶没有产生结合峰及具有平坦稳定的背景(图12C)。这些结果表明使用DNA聚合酶的Klenow exo(-)片段测序单链DNA的能力通过谷氨酸钾得以增强及通过矿物油覆盖免于蒸发。
实施例13描述了用于证实使用ssDNA或dsDNA模板在相似序列存在下检测少量突变序列的程序。
实施例13:通过测序单链DNA和双链5'-Flap DNA在野生型背景中检测点突变
这个程序中使用的材料和方法如下。具有3’反向dT的模板寡核苷酸Btn-4460-4509S的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGCTGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:9)。具有3’反向dT的模板寡核苷酸Btn-4460-4509S C4493A的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGATGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:21)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGAGCTC-3’(SEQ ID NO:10)。寡核苷酸4460-4494AS-T8的DNA序列是:5’-TTTTTTTTAGCAGGATGAACCGGG/i5NitInd/CAGGGATTGCAGGCTCAC-3’(SEQ ID NO:12),其中“/i5NitInd/”是5-硝基吲哚-2'-脱氧核糖残基。5-硝基吲哚旨在在这种情况中防止鸟嘌呤四联体形成及用作通用碱基。寡核苷酸Btn-4460-4509S、Btn-4460-4509SC4493A、4496-4509AS和4460-4494AS-T8由Integrated DNA Technologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸Btn-4460-4509S(或C4493A)和4496-4509AS组合(每条链10μM)在含有退火缓冲液(10mMTris缓冲液(pH8.0),0.1mM EDTA,80mM KCl)的试管中。为制备具有5'-oligo-dT flap和1-碱基缺口的dsDNA引物/模板,将寡核苷酸Btn-4460-4509S(或C4493A)、4496-4509AS和4460-4494-AS-T8(每条链10μM)组合在含有退火缓冲液的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将模块移至台面上并通过逐渐冷却至环境温度以使链退火。大肠杆菌DNA聚合酶的Klenow(3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自Life Technologies(Foster City,CA)。硫酸镍(II)六水合物(目录号467901)、dCDP、dGDP和dTDP购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(50nM)。洗涤缓冲液是20mM Tris,pH 8.0,200mM KCl,200mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是含有2.0mM Ni(II)SO4的洗涤缓冲液。反应缓冲液是20mM Tris,pH 8.0,50mM KCl,MgCl2(10mM),0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。EDTA洗涤缓冲液是含有100μM EDTA的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液加样于(200μL/孔)Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将Octet QK生物传感器系统(Pall ForteBioCorp.,Menlo Park,CA)设定为在30℃操作并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。如所示,将生物传感器转移至含有Klenow exo(-)(68单位/mL),Ni(II)SO4(1.5mM)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后在含有MgCl2(10mM)的反应缓冲液中进行dNTP掺入(解离阶段)。将生物传感器移至EDTA洗涤缓冲液中,然后在不含酶、核苷酸或二价阳离子的反应缓冲液中重新平衡。类似地,如所示,将生物传感器以循环方式移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。对每个dNTP重复结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图13A-13C中示出。在结合用ssDNA引物-模板包被的生物传感器的测定中,Klenow exo(-)酶在第1-2循环中在正确dNTP存在下与生物传感器强力结合(图13A)。循环3中的“G”峰示出在含有增加浓度的ALK野生型模板的混合物中峰高增加(图13A)。循环4中的“T”峰示出在含有增加浓度的ALK C4493A突变的混合物中峰高增加。循环4的“T”读数对应于C4493A突变体的反义核苷酸。ALK野生型和C4493A模板均在第5和6循环中产生“C”和“A”的全高峰。峰值表示图13A中ALK野生型(CAGCA)和ALK C4493A(CATCA)的正确序列。测序期间的峰强度使得可以定量具有野生型序列的混合物中的突变等位基因。循环4的峰(T)强度与针对ssDNA(图13B)和dsDNA-flap(图13C)的ALK野生型背景中的ALK C4493A突变序列的数量成比例。类似地,循环3的峰(G)随着ssDNA模板中突变体浓度的增加而线性下降(图13B),峰3强度随着dsDNA-flap模板的突变体浓度而降低(图13C)。在野生型背景中,在ssDNA或dsDNA-flap模板中可检测到少至5%的突变序列。
实施例14描述了用于证明不同二价阳离子稳定三元配合物的程序。
实施例14:二价阳离子对于稳定三元复合物和聚合酶催化的影响
这个程序中使用的材料和方法如下。具有3’反向dT的模板寡核苷酸Btn-4460-4509S C4493A的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGATGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:21)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGA GCTC-3’(SEQ ID NO:10)。寡核苷酸Btn-4460-4509S C4493A和4496-4509AS由Integrated DNA Technologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸Btn-4460-4509S C4493A和4496-4509AS组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将模块移至台面并通过逐渐冷却至环境温度以使链退火。大肠杆菌DNA聚合酶的Klenow(3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自Life Technologies(Foster City,CA)。氯化锶、氯化钙、氯化锰、氯化钡、氯化钴、氯化锌、氯化铜(II)、硫酸亚铁铵、硫酸铵、六水合硫酸镍(II)、dCDP、dGDP和dTDP购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100nM)。洗涤缓冲液是20mM Tris缓冲液(pH 8.0),50mM KCl,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是20mM Tris缓冲液(pH 8.0),200mM KCl,200mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。反应缓冲液是20mM Tris缓冲液(pH 8.0),50mM KCl,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇和指定的二价阳离子。EDTA洗涤缓冲液是含有100μMEDTA的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液加样于(200μL/孔)Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,并且施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将Octet QK生物传感器系统(PallForteBio Corp.,Menlo Park,CA)设定为在30℃操作并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。为测量未掺入的引物/模板的初始水平,将生物传感器移到含有Klenow exo(-)(68单位/mL)、SrCl2(2.0mM)和100μM dCTP的结合缓冲液中(结合阶段),然后移至含有SrCl2(2.0mM)和鲑精DNA捕获剂(500μg/mL)而不含MgCl2的洗涤缓冲液中。将传感器移至含有鲑精DNA捕获剂(500μg/mL)不含MgCl2的洗涤缓冲液中,然后移至EDTA洗涤缓冲液中及在结合缓冲液中重新平衡。测量与未掺入的引物/模板的结合并监测三元复合物在无二价阳离子的结合缓冲液中的稳定性。将生物传感器移至含有Klenow exo(-)(68单位/mL)、CoCl2(1.0mM)或指定的二价阳离子(2.0mM)和100μM dCTP的结合缓冲液中(结合阶段),然后移至含有相同浓度相同二价阳离子和鲑精DNA捕获剂(500μg/mL)而不含MgCl2的洗涤缓冲液中。将传感器移至含有鲑精DNA捕获剂(500μg/mL)及不含MgCl2的洗涤缓冲液中,然后移至EDTA洗涤缓冲液中及在结合缓冲液中重新平衡。测量含有各种二价阳离子而不含dNTP的结合缓冲液中三元复合物的稳定性。将生物传感器移至含有Klenow exo(-)(68单位/mL)、CoCl2(1.0mM)或指定的二价阳离子(2.0mM)和100μM dCTP的结合缓冲液中(结合阶段),然后移至含有相同二价阳离子和鲑精DNA捕获剂(500μg/mL)而不含MgCl2的洗涤缓冲液中。将传感器移至含有鲑精DNA捕获剂(500μg/mL)和10mM MgCl2的洗涤缓冲液中,然后移至EDTA洗涤缓冲液中及在结合缓冲液中重新平衡。最后,通过测量剩余的未掺入的引物/模板确定核苷酸掺入。将生物传感器移至含有Klenow exo(-)(68单位/mL)、SrCl2(2.0mM)和100μM dCTP的结合缓冲液中(结合阶段),然后移至含有SrCl2(2.0mM)和鲑精DNA捕获剂(500μg/mL)而不含MgCl2的洗涤缓冲液中。将传感器移至含有鲑精DNA捕获剂(500μg/mL)而无MgCl2的洗涤缓冲液中,随后移至EDTA洗涤缓冲液中及在结合缓冲液中再平衡。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图14A-14B中示出。测定聚合酶和dCTP与用ssDNA引物-模板包被的生物传感器的结合。在第一个非催化循环中,Klenow exo(-)酶在正确核苷酸(dCTP)和SrCl2存在下与生物传感器强力结合,然后通过洗涤返回基线(图14A,峰#1)。在第二个(非催化)循环中,在Ni(II)SO4、BaCl2和SrCl2存在而不存在EDTA情况下,传感器与酶和dCTP强力结合(图14A,峰#2-3)。含有Ni(II)SO4的洗涤缓冲液在10分钟时程稳定三元复合物(图14A,峰#2-3)。信号在Mg2+存在下降低(图14A,峰#3解离),这对应于掺入,如通过Klenow exo(-)和dCTP的低水平Sr2+介导的结合所证明(图14A,峰#4)。这些结果表明Ni2+在缺乏dNTP的缓冲液中稳定Klenow exo(-)、dNTP与ssDNA引物/模板的三元复合物的能力,这种稳定与DNA聚合酶的酶促掺入核苷酸相容。Klenow exo(-)在存在除镁离子之外的替代二价阳离子下呈现出聚合酶活性。测定聚合酶和dCTP与用ssDNA引物-模板包被的生物传感器的结合。在第一个非催化循环中,Klenow exo(-)酶在正确核苷酸(dCTP)和SrCl2存在下与生物传感器强力结合,然后通过洗涤返回基线(图14B,峰#1)。在第二个结合循环中,传感器在SrCl2或硫酸铵存在下由酶和dCTP强力结合(图14B,峰#2-3)。然而,几种二价阳离子(Cu2+,Ca2+,Co2+,Fe2+,Zn2+)呈现出在结合缓冲液中通过Klenow exo(-)和dCTP结合固定的引物/模板的瞬时峰(图14B,峰2)。瞬时峰(Ca2+,Co2+,Fe2+,Zn2+)或平峰(Mn2+)消失后,含有相同二价阳离子和鲑精DNA捕获剂或单独捕获剂的洗涤缓冲液未进一步降低结合信号(Ca2+降低至基线除外),如图14A(峰#2)所示。在循环3中,生物传感器对酶、dCTP和二价阳离子Ca2+、Co2+、Fe2+、Zn2+的第二次暴露未呈现出明显结合(图14B,峰3),标准Sr2+介导的结合对照也没有(图14B,峰4)。在较小程度上,Cu2+似乎也通过Klenow exo(-)增强聚合酶活性,因为第二次暴露于Cu2+(图14B,峰3)小于第一次Cu2+结合(图14B,峰2)。在第一次暴露于酶和dNTP之后,二价阳离子(Ca2+,Co2+,Fe2+,Zn2+,Mn2+)的结合信号缺乏,以及Sr2+介导的对照条件不能支持结合,提示使用某些二价阳离子(Ca2+,Co2+,Fe2+,Zn2+,Mn2+)在没有Mg2+的情况下实现了完全核苷酸掺入,这些瞬时峰可用于DNA测序。
实施例15描述了应用Co2+二价阳离子的程序
实施例15:通过使用CoCl2介导的结合和催化对单链DNA测序的长读取长度
这个程序中使用的材料和方法如下。模板寡核苷酸phiX_100mismatch的DNA序列是:生物素-5’-GGCAAATCACCAGAAGGCGGTTCCTGAATGAATGGGAAGCCTTCAAGAA-GGTGATAAGCAGGAGAAACATACGAAGCATCATAACGATACCACTGACCC-3’(SEQ ID NO:22)。引物寡核苷酸FP2的DNA序列是:5’-GAGGGTCAGTGGTATCGTTATG-3’(SEQ ID NO:5)。寡核苷酸由Integrated DNATechnologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris pH 8.0,0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸“phiX_100mismatch”和“FP2”组合(每条链10μM)在含有退火缓冲液(10mMTris pH 8.0,0.1mM EDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将模块移至台面上,通过逐渐冷却至环境温度以使链退火。大肠杆菌DNA聚合酶的Klenow(3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自Life Technologies(Foster City,CA)。酿酒酵母(Saccharomyces cerevisiae)核苷二磷酸激酶(NDPK)酶(目录号N0379)、二磷酸腺苷(ADP)和氯化钴(II)六水合物(目录号255599)购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100nM)。洗涤缓冲液是20mM Tris,pH 8.0,200mM KCl,200mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是含有低浓度CoCl2(0.050mM)的洗涤缓冲液。反应缓冲液是含有高浓度CoCl2(15mM)的结合缓冲液。EDTA洗涤缓冲液是含有1.0mM EDTA的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液(200μL/孔)加样于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将Octet QK生物传感器系统(Pall ForteBioCorp.,Menlo Park,CA)设定为在30℃操作,并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。如所示,将生物传感器转移至含有Klenow exo(-)(68单位/mL)、CoCl2(100μM)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后在含有CoCl2(15mM)、NDPK、ADP(1mM)和鲑精DNA(500μg/mL)的反应缓冲液中进行dNTP掺入(解离阶段)。将生物传感器移至EDTA洗涤缓冲液中,然后在不含酶、核苷酸或二价阳离子的反应缓冲液中重新平衡。类似地,如所示,将生物传感器循环移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。对每个dNTP一式两份重复结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图15中示出。在结合ssDNA引物-模板包被的生物传感器的测定中,Klenow(exo(-))酶在不存在dNTP的情况下与生物传感器结合不良(图15,阴影线条)。在存在正确的各个dNTP的情况下,在前40个循环中观察到强峰(图15,黑色条),其对应于前30个核苷酸的100%正确DNA序列,假设每个同聚物被压缩成单峰。此后,在循环41中观察到小的峰值高度,其不对应于可辨别的序列。这些结果表明使用DNA聚合酶的Klenow exo(-)片段测序双链DNA的能力,其中在低浓度Co2+介导的检验阶段,酶-dNTP-引物/模板三元复合物结合,随后在存在高浓度Co2+下dNTP掺入。
实施例16描述了用于证实扩展序列确定的程序。如下所示,结果表明使用DNA聚合酶(Klenow exo(-)片段)对单链DNA进行测序的能力,其中在检验阶段,酶-dNTP-引物/模板三元复合物的结合由二价非催化性阳离子(即Ni2+)稳定。随后通过与二价催化性阳离子(即MgCl2)交换将同源dNTP掺入引发的模板核酸分子的引物中。
实施例16:在聚合酶捕获剂和dNTP清除酶存在下,通过使用镍增强的结合、镁置换
和催化测序单链DNA的长读取长度
这个程序中使用的材料和方法如下。具有3’反向dT的模板寡核苷酸Btn-4460-4509S C4493A的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGATGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:21)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGA GCTC-3’(SEQ ID NO:10)。寡核苷酸由Integrated DNA Technologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸“Btn-4460-4509S C4493A”和“4496-4509AS”组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将模块移至台面上,通过逐渐冷却至环境温度以使链退火。大肠杆菌DNA聚合酶的Klenow(3'→5'exo(-))片段购自Enzymatics(Beverly,MA;目录号P7010-LC-L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自LifeTechnologies(Foster City,CA)。酿酒酵母核苷二磷酸激酶(NDPK)酶(目录号N0379)、二磷酸腺苷(ADP)和硫酸镍(II)六水合物(目录号467901)购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100nM)。洗涤缓冲液是20mM Tris缓冲液(pH 8.0),200mM KCl,200mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是含有2.0mM Ni(II)SO4的洗涤缓冲液。反应缓冲液是含有MgCl2(10mM)的结合缓冲液。EDTA洗涤缓冲液是含有1.0mM EDTA的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液(200μL/孔)加样于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将QK生物传感器系统(Pall ForteBio Corp.,Menlo Park,CA)设定为在30℃操作并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。如所示,将生物传感器移至含有Klenow exo(-)(68单位/mL)、Ni(II)SO4(2.0mM)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),随后在含有MgCl2(10mM)、NDPK、ADP(1mM)和鲑精DNA(500μg/mL)的反应缓冲液中掺入dNTP(解离阶段)。将生物传感器移至EDTA洗涤缓冲液中,然后在不含酶、核苷酸或二价阳离子的反应缓冲液中重新平衡。类似地,如所示,将生物传感器循环移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。对每个dNTP一式两份重复结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPadSoftware,San Diego,CA)进行显示。
这个程序的结果在图16中示出。在结合ssDNA引物-模板包被的生物传感器的测定中,Klenow(exo(-))酶在不存在dNTP的情况下与生物传感器结合不良(图16,“Klenow”)。在存在正确的各个dNTP的情况下,观察到强峰(图16,“Klenow+dNTP”),其对应于前32个核苷酸的100%正确DNA序列(CATCAGGATGAACCGGGGCAGGGATTGCAGGC(SEQ ID NO:23)),假设每个同聚物被压缩成单峰。750分钟后,信号最小且不产生最终四个核苷酸(TCAC)的可辨别序列。同聚物压缩可能是由于聚合酶在反应缓冲液中掺入一个以上的dNTP所致。采用两种方法通过旨在支持单一周转掺入的条件来防止同聚物压缩。首先,为阻止游离Klenow重新结合引物/模板及掺入第二个dNTP,一些反应缓冲液含有过量的鲑精DNA作为聚合酶捕获剂。第二,为防止反应缓冲液中游离dNTP重新结合Klenow-引物/模板复合物及酶促掺入新生链,含有NDPK和ADP的反应缓冲液旨在将游离dNTP转化为dNDP和ATP,以便dNDP不能通过聚合酶掺入。三元复合物在(结合阶段)形成,然后在反应缓冲液中解离。含有聚合酶捕获剂的反应缓冲液表明在生物传感器尖端积累,通过结合幅度超过解离幅度而证明(图16,“Klenow+dNTP”)。相反,含有NDPK和ADP的反应缓冲液在解离后产生基线分辨,提示解离阶段完成(图16,“NDPK+ADP+Klenow+dNTP”)。这些结果表明dNTP在重新结合聚合酶-引物/模板复合物中的作用,所述重新结合可导致测序的加帽、非生产性终止。含有NDPK和ADP的反应缓冲剂似乎通过在催化过程中耗竭游离dNTP集合而防止这些非生产性加帽产物。由于甚至在鲑精DNA、NDPK和ADP存在下观察到同聚物压缩,因此未实现单一周转掺入;预期序列(CATCAGGATGAACCGGGGCAGGGAT TGCAGGCTCAC(SEQ ID NO:24))被检测是CATCAGATGACGCAGATGC AGC(SEQ ID NO:25),没有连续的二联核苷酸(GG,AA,CC或TT)、三联核苷酸(GGG)或四联核苷酸(GGGG),如图16所示。
实施例17描述了用于证明使用与前述实施例中使用的聚合酶不同的聚合酶进行延伸序列测定的方法。如下所示,结果表明了使用Bsu Pol I(大片段)测序单链DNA的能力,其中酶-dNTP-引物/模板三元复合物在检验阶段的结合通过二价非催化性阳离子(即Ni2+)稳定。随后通过与二价催化性阳离子(即MgCl2)交换将同源dNTP掺入引发的模板核酸分子的引物中。通过在反应缓冲液中使用竞争性dNDP改善了同聚物分辨率。
实施例17:在聚合酶捕获剂和2'-脱氧核糖核苷二磷酸存在下,使用镍(II)-增强
结合、镁交换和催化测序单链DNA的同聚物分辨率
这个程序中使用的材料和方法如下。具有3’反向dT的模板寡核苷酸Btn-4460-4509S C4493A的DNA序列是:生物素-5’-GTGAGCCTGCAATCCCTGCCCCGGTTCATCCTGATGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:21)。引物寡核苷酸4496-4509AS的DNA序列是:5’-CCCGCCATGA GCTC-3’(SEQ ID NO:10)。寡核苷酸由Integrated DNA Technologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸“Btn-4460-4509S C4493A”和“4496-4509AS”组合(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块上(95℃,5分钟),将模块移至台面上,通过逐渐冷却至环境温度以使链退火。来自缺乏核酸外切酶活性的枯草芽孢杆菌的Bsu DNA聚合酶I(大片段)购自New England Biolabs(Ipswich,MA;目录号M0330L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自Life Technologies(Foster City,CA)。硫酸镍(II)六水合物(目录号467901)、dCDP、dGDP和dTDP购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100nM)。洗涤缓冲液是20mM Tris,pH 8.0,200mM KCl,200mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是含有2.0mM Ni(II)SO4的洗涤缓冲液。反应缓冲液是20mM Tris缓冲液(pH 8.0),50mM KCl,MgCl2(10mM),0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。EDTA洗涤缓冲液是含有1.0mM EDTA的结合缓冲液。将含有引物-模板(PT)的缓冲液、含有一种dNTP的结合缓冲液和反应缓冲液(200μL/孔)加样于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBio Corp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将Octet QK生物传感器系统(Pall ForteBio Corp.,Menlo Park,CA)设定为在30℃操作并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。如所示,将生物传感器移至含有Bsu Pol I(68单位/mL)、Ni(II)SO4(1.0mM)和100μM dNTP(dATP,dTTP,dGTP或dCTP)的结合缓冲液中(结合阶段),然后在含有MgCl2(10mM)、鲑精DNA(500μg/mL)和相应dNDP(未使用的dADP除外)的反应缓冲液掺入dNTP(解离阶段)。将生物传感器移至EDTA洗涤缓冲液中,然后在不含酶、核苷酸或二价阳离子的反应缓冲液中重新平衡。类似地,如所示,将生物传感器循环移至含有各个脱氧核糖核苷三磷酸(dATP,dGTP,dCTP或dTTP)的溶液中。对每个dNTP重复结合和掺入循环以评估测序。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,San Diego,CA)进行显示。
这个程序的结果在图17A-17B中示出。在结合ssDNA引物-模板包被的生物传感器的测定中,Bsu Pol I酶在正确dNTP存在下与生物传感器强力结合(图17A)。其中反应缓冲液含有过量dNDP(3.0mM)的信号峰对应于CATCAGG的正确DNA序列,其中同聚物的两个GG以检测到两个不同的峰分辨(图17A,箭头)。相反,对于在反应缓冲液中缺乏dNDP的对照组信号峰中观测到不能分辨同聚物,这对应于CATCAGGAT的正确DNA序列,假设GG同聚物被压缩成单个G峰(图17A,“对照”)。dNDP对同聚物分辨率的影响通过两种方式验证:(1)GG二核苷酸的第二个G峰的高度取决于反应缓冲液中dNDP的浓度(图17A,第二个箭头);及(2)GG同聚物后的下一个核苷酸(A和T)与反应缓冲液中的dNDP浓度成反比。同聚物压缩可能是由聚合酶掺入反应缓冲液中一种以上的dNTP所致。采用两种方法通过旨在支持单一周转掺入的条件来防止同聚物压缩。首先,为阻止游离Bsu Pol I重新结合引物/模板及掺入第二个dNTP,反应缓冲液含有过量的鲑精DNA作为聚合酶捕获剂。第二,为防止反应缓冲液中的游离dNTP重新结合Bsu Pol-引物/模板复合物及酶促掺入新生链,含有与游离dNTP竞争聚合酶结合的dNDP的反应缓冲液预期结合Bsu Pol-引物/模板复合物并阻止进一步掺入,因此阻断同聚物压缩。由于GG同聚物的第二个峰是第一个G峰的60.1%(图17B),且由于同聚物压缩而结合接下来的两个核苷酸(A和T)分别减少了73.4%和92.0%(图17B),因此单一周转掺入的目标接近于实现。
实施例18描述了用于证明同聚物序列的动力学分辨的程序。如下所示,结果证实使用两步法定量检测单一和多次掺入同聚物模板的能力。首先,与多次掺入(ALK-G2,ALK-G3,ALK-G4)相比,三元复合物结合的动力学参数对于单次掺入(ALK-G1)是不同的。其次,在将三元复合物包被的生物传感器尖端移至反应缓冲液中后,初始解离速率(0-8秒)使得可以在同聚物模板中掺入两个、三个或四个核苷酸(ALK-G2,ALK-G3,ALK-G4)以定量识别。
实施例18:在2'-脱氧核糖核苷二磷酸和竞争底物存在下,使用镍(II)-增强结合、
镁交换和催化对单链DNA进行测序的同聚物分辨的动力学方法
这个程序中使用的材料和方法如下。具有3’反向dT的野生型ALK模板寡核苷酸Btn-4460-4509S的DNA序列是:生物素-5’-GTGAGCCTGCAAT CCCTGCCCCGGTTCATCCTGCTGGAGCTCATGGCGGG-3’-(3’-dT-5’)(SEQ ID NO:7)。ALK-G1引物寡核苷酸4494-4509AS的DNA序列是:5’-CCCGCCATGAGCTCCA-3’(SEQ ID NO:26)。ALK-G2引物寡核苷酸4491-4509AS的DNA序列是:5’-CCCGCCATGAGCTCCAGCA-3’(SEQ ID NO:27)。ALK-G3引物寡核苷酸4476-4509AS的DNA序列是:5’-CCCGCCATGAGCTCCAGCAGGATGAACC/ideoxyI/GGGCA-3’(SEQ ID NO:28),其中“/ideoxyI/”是2’-脱氧肌苷残基。ALK-G4引物寡核苷酸4482-4509AS的DNA序列是:5’-CCCGCCATGAGCTCCAGCAGGATGAA CC-3’(SEQ ID NO:29)。寡核苷酸由Integrated DNATechnologies(Coralville,IA)合成和分析(液相色谱-质谱(LC-MS)和电喷雾电离(ESI))。在TE缓冲液(10mM Tris缓冲液(pH 8.0),0.1mM EDTA)中制备寡核苷酸至100μM。为制备ssDNA引物/模板,将寡核苷酸“Btn-4460-4509S”与任一“4494-4509AS”、“4491-4509AS”、“4476-4509AS”或“4482-4509AS”组合(分别为ALK-G1、ALK-G2、ALK-G3或ALK-G4双链体)(每条链10μM)在含有退火缓冲液(10mM Tris缓冲液(pH8.0),0.1mM EDTA,80mM KCl)的试管中。将含有寡核苷酸溶液的试管加样于干热模块(95℃,5分钟),将模块移至台面上,通过逐渐冷却至环境温度以使链退火。来自缺乏核酸外切酶活性的枯草芽孢杆菌的Bsu DNA聚合酶I(大片段)购自New England Biolabs(Ipswich,MA;目录号M0330L)。超纯牛血清白蛋白(BSA)和超纯鲑精DNA溶液购自Life Technologies(Foster City,CA)。底物类似物2'-脱氧腺苷-5'-O-(1-硫代三磷酸)(α-S-dATP)、2'-脱氧胞苷-5'-O-(1-硫代三磷酸)(α-S-dCTP)、2'-脱氧鸟苷-5'-O-(1-硫代三磷酸)(α-S-dGTP)和2'-脱氧胸苷-5'-O-(1-硫代三磷酸)(α-S-dTTP)购自TriLink Biotechnologies,Inc.(San Diego,CA)。硫酸镍(II)六水合物(目录号467901)购自Sigma(St.Louis,MO)。所有试剂和溶液均为分子生物学级别。将引物-模板双链体在退火缓冲液中稀释(100nM)。洗涤缓冲液是30mM Tris,pH 8.0,160mM KCl,160mM谷氨酸钾,0.01%(v/v)Tween-20,100μg/mL牛血清白蛋白,1.0mM二硫苏糖醇。结合缓冲液是含有Bsu Pol I(68单位/mL)100μM dGTP+1.0mM Ni(II)SO4的洗涤缓冲液。反应缓冲液是含有Bsu(1U/mL)、MgCl2(80μM)、dGTP(28.1μM)、α-S-dGTP(162μM)的洗涤缓冲液。EDTA洗涤缓冲液是不含Ni(II)SO4但含有1.0mM EDTA的洗涤缓冲液。将含有引物-模板(PT)的缓冲液、结合缓冲液和反应缓冲液(200μL/孔)加样于Greiner 96孔黑色微板(Sigma-Aldrich,St.Louis,MO;目录号M9685)中,施用PCR级矿物油(Sigma-Aldrich,St.Louis,MO;目录号M8662)(75μL/孔)。在使用前,将高精度链霉抗生物素蛋白生物传感器(Pall ForteBioCorp.,Menlo Park,CA;目录号18-5117)在退火缓冲液中再水合大约10分钟。将Octet QK生物传感器系统(Pall ForteBio Corp.,Menlo Park,CA)设定为在30℃操作并编程为用引物-模板包被生物传感器以及用洗涤缓冲液洗去未结合的引物-模板。将生物传感器移至结合缓冲液中(结合阶段),然后在反应缓冲液中掺入dNTP(解离阶段)。将生物传感器移至EDTA洗涤缓冲液中,然后在不含酶、核苷酸或MgCl2的反应缓冲液中重新平衡。将Octet干涉测量仪器生成的监测数据导入Microsoft Excel和Prism软件(GraphPad Software,SanDiego,CA)进行显示。使用Prism软件将结合阶段时间数列拟合为单指数结合等式。通过InStat统计软件(GraphPad Software,San Diego,CA)使用Dunnett测试分析结合阶段动力学参数(kobs和幅度),其中单一掺入G作为对照条件。使用Prism软件将解离阶段时间数列拟合为双指数解离等式。
这个程序的结果图18A-18E中示出。在结合ssDNA引物-模板包被的生物传感器的测定中,Bsu Pol I酶在正确dGTP存在下与引物/模板包被的生物传感器强力结合(图18A和18B)。结合ALK-G1的信号(图18A)高于与ALK-G2、ALK-G3和ALK-G4的结合(图18A和18B)。在将三元复合物包被的生物传感器移到含有聚合酶、dGTP和α-S-dGTP、Ni2+和Mg2+的掺入缓冲液中后,根据ALK模板,观测到不同的解离时程(图18C)。分析形成三元复合物的结合阶段的结合动力学参数如何受到掺入引物/模板的同聚物中的核苷酸数量的影响。具有多个(2-4个)核苷酸掺入同聚物中的引物/模板与对照单一掺入相比具有较低的结合幅度(图18D),其通过Dunnett检验具有统计学显著性(p<0.01)。类似地,具有多个(2-4个)核苷酸掺入同聚物中的引物/模板与对照单一掺入相比具有较高的表观动力学结合常数(kobs)(图18D),通过Dunnett检验具有统计学显著性(p<0.01)。这个发现表明在同聚物模板中单一掺入与多次掺入在动力学上可加以区别。最后,观测到的解离速率(在移至反应缓冲液中后0-8秒)随着掺入的核苷酸数量的增加以ALK-G2<ALK-G3<ALK-G4~ALK-G1顺序而增加,其中Bsu聚合酶浓度在0.13-1U/mL之间(图18E)。
实施例19描述了在没有将任何核苷酸化学掺入引发的模板核酸分子的引物中时,用于优化聚合酶区分正确和不正确核苷酸的程序。这个程序专注于滴定在水溶液中溶解以提供一价阳离子的盐。在同源或非同源核苷酸的存在下,监测聚合酶与引发的模板核酸分子的结合。这个程序专注于在优先使二元复合物形成不稳定的条件下核苷酸区分的增强。
实施例19:通过优先使二元复合物形成不稳定而增强聚合酶区分同源和非同源核
苷酸
这个程序中使用的材料和方法如下。采用生物层干涉法测量光纤尖端表面结合反应的(Menlo Park,CA)/>仪器以多孔板形式使用,以研究二元和三元复合物的稳定性差异。根据标准程序,使用在其5'末端生物素化的模板链将引发的模板核酸固定在用链霉抗生物素蛋白(SA)功能化的光纤尖端上。从生物素化的模板DNA读取的预期序列具有86个核苷酸的潜在读长,其中加入到引物中的下一个正确核苷酸是dCTP。在开始循环方案之前,首先将尖端在含有30mM Tris-HCl(pH 8.0)和0.1mM EDTA的Tris缓冲溶液中平衡。在浓度为50mM-500mM的NaCl、KCl或谷氨酸钾存在下进行两种测试核苷酸(即同源和非同源核苷酸)的单独结合反应。使用固定的160mM浓度的谷氨酸钾进行第四次试验,而KCl的浓度在50mM-500mM之间变化。在所有情况中,在检验步骤中使用的反应混合物包含Tris-HCl(pH 8.0),0.01% Tween-20,100μg/mL BSA,2mM NiSO4,350U/mL Bsu DNA聚合酶大片段,以及浓度为100μM的核苷酸之一(dCTP用作同源核苷酸,dGTP用作非同源核苷酸)。在每个检验步骤后,将尖端暴露于含有30mM Tris-HCl(pH 8.0)、500mM KCl、2mM EDTA和0.05% Tween-20的缓冲液20秒,以从引发的模板核酸中剥离酶复合物。在剥离步骤之后,暴露于没有酶、dNTP或二价阳离子的检验缓冲液15秒,以再生用于下一检验循环的尖端。当使用单个接触步骤实现聚合酶和核苷酸与引发的模板核酸结合时,结合步骤为45秒长,持续监测结合相互作用。这通过将引发的模板核酸与包含聚合酶和测试核苷酸的单一溶液接触而实现。分析干涉测量监测的结果以鉴别三元复合物(即鉴别同源核苷酸)或二元复合物(即鉴别非同源核苷酸)的形成。干涉测量的数值结果在表5-8中示出。一些舍入的二元复合物测量值太低,以致在表中显示为0.00,但允许计算增强倍数。
表5:在结合测序方法中确立最佳区分条件
表6:在结合测序方法中确立最佳区分条件
/>
表7:在结合测序方法中确立最佳区分条件
表8:在结合测序方法中确立最佳区分条件
表5-8中示出的结果表明提供一价阳离子的盐如何优先使二元复合物形成不稳定,及在排除核苷酸掺入的条件下增强聚合酶区别能力。结合反应混合物中基本上所有的一价阳离子和谷氨酸根离子均是由加入的盐提供的,因此来自缓冲液和其它来源的一价阳离子的贡献被认为对于这个分析是不重要的。测量结合信号,及在同源或非同源核苷酸存在下比较聚合酶与引发的模板核酸的相互作用。同样,这些结果用于区分正确和不正确核苷酸的结合反应,而不依赖于核苷酸掺入作为读数。当然,这个方法中使用的核苷酸可以是标记的或未标记的。然而,优选核苷酸是未标记的天然核苷酸。
在检验步骤中使用的条件下使二元复合物形成不稳定。对提供一价阳离子的模型盐(例如NaCl,KCl和谷氨酸钾)的剂量-应答滴定相似地表明二元复合物和三元复合物对加入的盐的敏感度不同。随着盐浓度增加,二元配合物相对于相应的三元配合物逐渐变得更不稳定。用于增强区分三元复合物(表示存在同源核苷酸)与二元复合物(表示存在非同源核苷酸)的示例性浓度范围是200mM-500mM的提供一价阳离子的盐。这些值可用于其中聚合酶与引发的模板核酸分子结合作为核苷酸身份的指示(即同源与非同源)的方法中。对谷氨酸钾的剂量-应答滴定相似地表明二元复合物和三元复合物的稳定性差异。同样,随着加入的谷氨酸盐浓度增加,二元复合物相对于相应的三元复合物逐渐变得更不稳定。由于谷氨酸钾对于每个谷氨酸根离子包含两个钾离子,因此对反应混合物中钾离子浓度的贡献是加入的谷氨酸盐浓度的两倍。
在所述方法的非掺入条件下,及在不存在谷氨酸来源的情况下,低于200mM的含有一价阳离子的盐的浓度提供了同源和非同源核苷酸结合之间的适度区分。然而,在这些条件下聚合酶保持高结合能力。单独滴定KCl或NaCl均示出二元复合物形成的不稳定,以及在高于250mM的浓度下达到成倍区分,尽管聚合酶结合活性存在一些损失。谷氨酸钾也使二元复合物形成不稳定,基本上在测试的全部浓度范围内增强了区分能力。为使用结合测序方法获得长读取长度,必须在目标模板的许多碱基上维持从不正确碱基读出区分正确碱基读出的高信号。为保持高结合能力和改良的倍数区分,使用恒定水平的谷氨酸(例如0mM,80mM,160mM和320mM),同时滴定KCl为50mM-500mM。
在阻止聚合的条件下,组合提供一价阳离子的盐与谷氨酸盐使得聚合酶区分能力增强。例如,150mM的KCl或者150mM的谷氨酸钾适度地区分三元复合物和二元复合物的形成。然而,组合这两种制剂则增强区分能力。这个效果不能单独归因于增加的一价阳离子浓度或谷氨酸根离子浓度。在检验步骤期间使二元复合物形成不稳定的优选条件包括提供一价阳离子的盐,其中盐的浓度在50mM-1500mM范围内,更优选在50mM-500mM范围。
进行与前述一致的其它程序,以及对表5-8的结果进一步分析,以更好地确定可用于在检验步骤中使二元复合物不稳定的条件。当盐浓度范围为约300mM-350mM时,用提供一价金属阳离子的盐(例如KCl)滴定产生示出三元复合物和二元复合物信号(与结合测序程序相关的参数)之间最大差异的图表(参见表5)。然而,当还包括谷氨酸盐(例如谷氨酸钾)时,实现向较低浓度范围的移动。在此,当包含浓度为80mM-320mM的谷氨酸盐时,信号之间的差异在提供一价阳离子(例如一价金属阳离子)的盐在大约100mM-300mM的范围内最明显。实际上,信号之间的差异在以下范围内最明显:在320mM谷氨酸盐时在100mM-200mM;在160mM谷氨酸盐时在150mM-250mM(参见表8),以及在80mM谷氨酸盐时在175mM-300mM。当在不存在谷氨酸盐的情况下进行滴定时,三元复合物与二元复合物的最大信号比(测量区分效力的不同参数)出现在提供一价金属阳离子的盐在大约450mM时。当提供一价金属阳离子的盐在如下范围时,组合滴定的比率最明显:在320mM谷氨酸盐时在200mM-250mM,在160mM谷氨酸盐时在350mM-450mM以及在80mM谷氨酸盐时在275mM-350mM。在所有情况中,产生最大区分比的提供一价阳离子的盐的浓度基本上高于实现表示三元和二元复合物的信号之间最大差异所需的浓度。值得注意的是,单独使用上述浓度(即75mM,150mM和325mM)的谷氨酸盐(即没有加入KCl)进行检测示出区分能力基本上没有增强,或者仅非常轻微的增强(见表7)。在不存在加入的盐的情况下,在检验步骤中产生有用条件所需的谷氨酸盐浓度优选高于325mM。
使用Bst和Klenow聚合酶进行的进一步检测表明,包含谷氨酸盐和/或提供一价阳离子(例如一价金属阳离子)的盐的检验条件优先使二元复合物形成不稳定。一般而言,随着谷氨酸钾浓度增加,使二元复合物不稳定的KCl的浓度可以降低,同时仍然可以产生良好的区分结果。当谷氨酸钾浓度高达500mM时,可以完全省略加入的KCl(即加入的KCl的浓度为0mM),同时仍然可以良好区分正确和不正确核苷酸。同样地,当谷氨酸钾浓度为320mM时,KCl浓度为25mM时使用Klenow聚合酶产生优异结果。当使用Bst酶时,需要稍高浓度的KCl以获得最佳结果。
因此,尽管不同聚合酶之间的最佳区分条件有所不同,但通常真实的是提供一价阳离子(例如一价金属阳离子)的盐单独或与另一种谷氨酸盐组合优先使二元复合物不稳定,从而增强区分正确和不正确核苷酸结合。甚至表明谷氨酸盐可以作为提供一价金属阳离子的盐。
基于前述内容及进一步鉴于实施例所述方法的其它检测,使二元复合物形成不稳定的优选条件如下。检验步骤中使用的反应混合物应含有一价阳离子优选一价金属阳离子(例如氧化态为+1的金属阳离子)来源。这可以通过在反应混合物中加入提供一价阳离子的盐便利地实现,其中加入的盐浓度为大约50mM-1500mM。优选地,加入的盐浓度为大约50mM-500mM。更优选地,加入的盐浓度为大约100mM-300mM。任选地,提供一价阳离子的盐也提供谷氨酸根阴离子(即盐是谷氨酸盐)。当在这些浓度范围使用的盐是谷氨酸盐以外的盐时,含有所述盐的反应混合物任选地可以进一步包含浓度为大约10mM-1600mM、更优选范围为10mM-500mM或更优选范围为80mM-320mM的谷氨酸盐。一般而言,在检验步骤中用于将引发的模板核酸分子与反应混合物接触的反应条件优选相对于二元复合物形成有利于三元复合物形成至少两倍、至少五倍或甚至更多。值得注意的是,在结合测序程序的检验步骤中可以适应减少的三元复合物形成,因为掺入反应可以在促进聚合酶和引发的模板核酸分子之间相互作用(例如包括允许或有利于形成二元复合物的相互作用)的不同反应条件下高效地进行。
降低或最小化由于得自二元复合物形成的信号的影响的另一种方法涉及用于将聚合酶输送至引发的模板核酸分子的试剂和方法。在此,专用语句“聚合酶输送试剂”(PDR)可用于结合测序程序,对核苷酸检验进行某些限制。PDR有利地有助于最小化不需要的二元复合物形成,同时仍允许有效形成三元复合物。所揭示的PDR可用于各种平台(例如无标记的SPR,流动池中荧光pol等)以获得改善的结果。一般而言,在采用PDR和监测聚合酶结合作为同源和非同源核苷酸身份的指征的程序中,信噪比得到改善,这有助于正确的碱基读出和扩展读取。
在开发PDR之前,在不存在游离核酸分子的情况下,将聚合酶试剂输送至固定的引发的模板核酸分子。由于聚合酶在不存在同源核苷酸的情况下与引发的模板核酸分子的结合,因此总是检测到至少一些水平的背景信号。实际上,可以鉴别这样的条件,其中背景结合很广泛以至于当加入正确碱基时检测到无可检测的差异。这种背景信号归因于二元复合物形成,其中聚合酶在不存在同源核苷酸的情况下与引发的模板核酸分子结合。
如本文别处所述,用于减少由二元复合物形成产生的信号的替代方法专注于盐的浓度和组合。例如,KCl和谷氨酸钾的浓度范围示出有效且足以抑制二元复合物形成。然而,PDR的替代使用有利地允许改变用于最佳降低二元复合物形成的盐条件-而仍然具有优异结果。这进一步例证了可以使用多种不同方法抑制二元复合物形成或使其“不稳定”。
实施例20描述了证明如何使用PDR有利地减少由二元复合物形成产生的信号及同时允许正确的三元复合物形成的程序。聚合酶输送试剂包括:(a)DNA聚合酶,和(b)引发的模板核酸。包含的引发的模板核酸在溶液中游离,且可以与聚合酶相互作用以形成复合物(例如二元复合物)。
实施例20:聚合酶输送试剂(PDR)在结合测序方法中降低二元复合物形成
将四个链霉抗生物素蛋白包被的Octet尖端与含有与引物杂交的生物素化模板DNA链的结合缓冲溶液接触,以制备固定的引发的模板核酸分子。在这个程序中,结合缓冲液是包含KCl、谷氨酸钾、TbCl3、Tween-80和BSA的ACES缓冲的(pH7.5)溶液。此后,使用不包含核酸的结合缓冲液洗涤生物传感器尖端。通过将生物传感器尖端与含有1μM被工程化为含有加入的半胱氨酸残基的Bst DNA聚合酶以及0nM、10nM、100nM或1000nM的可溶性或溶液相(即在溶液中游离)未生物素化的引发的模板核酸的结合缓冲液接触,以实现二元复合物形成。用于形成代表背景信号的二元复合物的溶液不包含同源核苷酸。值得注意的是,溶液相引发的模板核酸具有与固定在生物传感器尖端的引发的模板核酸的序列不同的序列。最后,通过将生物传感器尖端与结合缓冲溶液接触形成三元复合物,所述结合缓冲溶液包含0nM、10nM、100nM或1000nM的可溶或溶液相(即在溶液中游离的)引发的模板核酸以及100μM核苷酸,所述核苷酸是固定的引发的模板核酸分子的下一个正确核苷酸。包含在结合缓冲液中的溶液相核苷酸不是溶液相引发的模板核酸的同源核苷酸。当使用含有待检测的溶液相核苷酸的不同试剂作为固定的核酸特征(例如直接或间接固定在流动池内的表面的引发的模板核酸)的同源核苷酸时,溶液相核苷酸不应该是溶液相引发的模板核酸的同源核苷酸。以这种方式,在溶液相核苷酸和溶液相引发的模板核酸分子之间仅形成二元复合物而非三元复合物。任选地,在含有溶液相核苷酸的试剂溶液中可以存在多于一种的溶液相引发的模板核酸分子。更具体地,在含有溶液相核苷酸的单一试剂溶液中可存在多达三种不同的溶液相引发的模板核酸,其中溶液相核苷酸不是任何溶液相引发的模板核酸的同源核苷酸。
这些方法的结果在图19中示出,表明了输送聚合酶与溶液相核苷酸和溶液相引发的模板核酸的组合,其中溶液相核苷酸不是溶液相引发的模板核酸的同源核苷酸,有利地抑制二元复合物形成或使其不稳定,同时仍允许三元复合物形成。更具体地,随着溶液相引发的模板核酸的浓度增加,在不存在核苷酸的情况下,聚合酶结合信号的量级相应降低。在此只能形成二元复合物。此后,包含是固定于生物传感器尖端的引发的模板核酸的同源核苷酸的核苷酸产生增加的结合信号。对比这个程序的结果,表明当溶液相引发的模板核酸以100nM浓度存在时,发生信号量值的最佳差异(参见图20)。因此,可以遵循常规程序以优化获得良好结果所需的溶液相引发的模板核酸的浓度。
总之,这些结果示出怎样使用PDR试剂以先前不可能的方式改良区分二元复合物和三元复合物形成。使用两种单独的DNA聚合酶获得相似的良好结果。这证实这种方法的通用性。
在一些实施方案中,在进行任何掺入反应之前完成多个单独的检验反应。根据不同的优选方法,这可以包括使用可检测标记的聚合酶或者使用一或多种可检测标记的核苷酸进行检验反应。
在一种方法中,可以使用少至单个标记的聚合酶而不是一组可区分标记的聚合酶进行检验反应。引发的模板核酸(例如一组间隔的特征,例如固定的RCA产物或展示引发的模板核酸的珠)可以与标记的聚合酶及一或多种核苷酸的组合接触。在使得可以结合一段时间及任选洗涤步骤以从结合反应混合物中除去任何未复合的材料(例如标记的聚合酶)之后,评估标记的聚合酶与引发的模板核酸分子的相互作用。在完成第一次检验反应,及从引发的模板核酸分子中去除或剥离聚合酶-核苷酸组合后,通过将引发的模板核酸分子与第二聚合酶-核苷酸组合接触进行第二次检验反应。然后重复检测和去除程序。在这个程序中使用的核苷酸不需要携带任何可检测标记,因为聚合酶对引发的模板核酸分子的定位就是在这个程序中作为同源核苷酸身份的指征而检测或监测。同样,可检测标记的聚合酶优先产生这样的信号,其由于与任何核苷酸相互作用的结果而基本上不变。更具体地,信号基本上是一致的。通过这种方法,与信号的产生相反,可以监测信号的定位,以评估三元复合物形成。可以使用非催化性金属离子或者在引发的模板核酸分子中的可逆封闭的引物进行所述程序来稳定三元复合物。因此,在重复或迭代测试不同核苷酸或核苷酸组合的促进三元复合物形成的能力的程序中,可以使用少至单一类型的可检测标记的聚合酶进行系列检验反应。
在另一种方法中,可以使用可检测标记的核苷酸代替可检测标记的聚合酶。任选地,标记的核苷酸具有荧光部分、Raman活性部分等。任选地,在程序中使用的多个标记的核苷酸中的每个不同的标记的核苷酸包含相同类型的荧光部分。或者,在程序中使用的多个标记核苷酸中的每个不同的标记的核苷酸可包含不同的荧光部分,这些荧光部分在程序期间通过其光学性质彼此不能区分。例如,单个或共同的检测通道或波长范围可用于检测三元复合物中的不同的标记的核苷酸。优选地,当标记的核苷酸在溶液中游离(即不包含在三元复合物中)或参与三元复合物时,标记的核苷酸的荧光部分的光学性质(例如激发或发射光谱)基本保持不变。因此,当核苷酸参与三元复合物时,标记的核苷酸不需要用任何构象敏感的标记物标记或者用发出独特光信号的嵌入染料标记。同样,这种技术的成功不要求可检测标记参与与任何其它荧光染料或猝灭剂部分的能量转移关系(例如可检测部分优选不需要是FRET配偶体)。在一些实施方案中,聚合酶-核苷酸组合可以以连续方式一次一个地输送至引发的模板核酸分子(例如固定在流动池内的引发的模板核酸分子)。同源核苷酸鉴别可包括通过检测与核苷酸附着的标记部分而检测三元复合物。例如,这可以包括将同源核苷酸身份与和组合聚合酶的引发的模板核酸分子接触的核苷酸的身份相关联,其中形成三元复合物。对其中聚合酶-核苷酸组合以已知顺序(例如以连续方式)输送至引发的模板核酸的三元复合物进行简便检测,可足以鉴别下一个正确核苷酸。
在一些优选的方法中,包括将聚合酶与一或多种核苷酸组合与引发的模板核酸分子(例如固定的引发的模板核酸分子)接触的步骤可以使用封闭的引发的模板核酸分子在催化性金属离子(例如镁离子或锰离子)存在下进行。如本文所述,封闭的引发的模板核酸分子可包含3'末端核苷酸具有可逆终止子部分的引物。实际上,含有不同聚合酶-核苷酸组合的试剂或溶液也可包含催化性金属离子。当与封闭的引发的模板核酸分子接触时,通过在与引发的模板核酸分子的模板链杂交的引物链的3'末端核苷酸上存在可逆终止子部分,可以阻止同源核苷酸的掺入。无论聚合酶的催化能力如何,包含封闭的引发的模板核酸分子的三元复合物都可以有效地形成而不掺入。虽然不希望受任何特定操作理论的限制,但一种可能性是催化性金属离子的存在有助于保持聚合酶的完整性及其识别和区分同源和非同源核苷酸的能力。或者,包含催化性金属离子可有益地影响三元复合物自身的结构。尽管存在潜在的机制,但进行本发明揭示的技术的一些优选方法可包括在存在催化性金属离子(例如镁离子和锰离子中的一或两种)条件下,将封闭的引发的模板核酸分子(例如具有在其3'末端核苷酸附着可逆终止子部分的引物)与聚合酶-核苷酸组合接触。优选地,接触步骤在存在催化性金属离子而不存在抑制核苷酸掺入的非催化性金属离子的条件下进行。
图21示例了使用单一类型的可检测标记的聚合酶的迭代测序程序的简化工作流程;图22示例了使用基本如本文所述的程序和方案获得的结果。在此,对于Alk-C2靶序列,将标记的聚合酶和一次一种核苷酸与具有可逆封闭的引发的模板核酸的珠接触,其中预期的核苷酸序列是CGGG。所有结合反应均在Mg2+离子存在下进行,尽管包含这个催化性金属离子是任选的。在以连续方式检验四种不同核苷酸的每个循环中,正确核苷酸与最高结合信号相关。这表明可检测标记的聚合酶与封闭的引发的模板核酸分子结合以预期方式形成三元复合物。
以下实施例例证了结合测序技术的一个实施方案,其中使用单一类型的可检测标记的聚合酶评估天然核苷酸的结合。
实施例21:标记的聚合酶测序
使用展示已知序列的合成的引发的模板核酸的磁性1μM微珠制备流动池。简而言之,将链霉生物素蛋白包被的MyOne C1磁珠(ThermoFisher Scientific;Waltham,MA)用与链霉抗生物素蛋白上的游离胺部分反应的TCO-PEG4-NHS(反式环辛烯-聚乙二醇-N-羟基琥珀酰亚胺)部分官能化。然后将TCO-修饰的珠在含有浓度为100nM的希望的引发的模板核酸分子的溶液中温育。然后将珠导入用氨基硅烷包被的盖玻片构建的流动池中,所述盖玻片已经用NHS-四嗪酯试剂修饰以共价结合TCO修饰的珠。将所述珠置于表面并结合大约15分钟,通过光学显微镜检验珠密度。如果需要更高的珠密度,则流入更多的珠并使其结合。用SuperBlock(ThermoFisher Scientific)“封闭”流动池的内容物以使试剂与珠子或背景表面的非特异性结合最小化。
在开始测序运行之前,将试剂加样于15mL锥形管中并连接于具有导向流动池的试剂路径的流体歧管。将含有珠阵列的流动池安置在配备20X物镜的显微镜上,然后连接于流体歧管。用洗涤试剂净化流动池以使珠和引发的模板核酸与起始反应条件平衡。使用自动化方案启动测序以控制试剂输送的顺序和时间。图21示出概述示例工作流程的流程图。在这个方法中,将标记的聚合酶和一次一个核苷酸与固定的引发的模板核酸分子接触。这个方法中使用的聚合酶是BSU聚合酶,其被工程化含有与荧光Cy5标记物化学附着的半胱氨酸。
图22示出所得的荧光标记的聚合酶平衡结合时的最大荧光强度,其中聚合酶结合引发的模板核酸分子组合一次一个天然核苷酸。同样,在荧光部分和核苷酸之间没有能量转移以进行检测。同样,聚合酶上的标记仅用于提供跟踪聚合酶位置的方式,其中聚合酶的荧光由于反应混合物中存在不同的核苷酸而基本上保持不变。每个循环的最大结合信号被认为是正确碱基读出。图中表示的每个循环特征的碱基读出对应于一组模板中包含的Alk基因片段之一的前四个碱基。在每种情况中,被测序的特征示出对每个检验步骤的独特反应。这表明使用荧光标记的聚合酶的少至一次一个核苷酸的重复检验循环如何用于测序模板核酸。
以上揭示的是这样的材料、组合物和成分,其可以用于本发明揭示的方法和组合物,可与其联合使用,可用于制备其或者是其产物。应理解,当揭示这些材料的组合、小组、相互作用、基团等时,以及虽然可能未明确揭示这些化合物的每个不同的单独和集体组合和排列,但是每一项均是特别涵盖及在此描述的。例如,如果揭示和讨论了一种方法并且讨论了可以对包括该方法的许多分子进行的许多修改,除非特别相反指出,则可以特别考虑该方法的每个组合和排列以及可能的修改。同样地,还特别涵盖和公开了这些的任何子集或组合。这个概念适用于本发明揭示的所有方面,包括使用揭示的组合物的方法中的步骤。因此,如果存在可以执行的各种附加步骤,则应理解这些附加步骤中的每一步骤均可以利用所揭示方法的任何特定方法步骤或方法步骤组合来执行,并且特别涵盖每个这样的组合或组合子集且应该被认为是公开的。
本文引用的出版物以及其引用的材料在此以全部内容并入本文作参考。本说明书中提及的所有出版物、专利和专利申请均以如同每个单独的出版物、专利或专利申请特别及单独指出并入本文作参考的程度并入本文作参考。
应理解,本文使用的标题仅用于组织文章目的,不意味着限制说明书或权利要求。
本文描述了许多实施方案例。然而,应该理解可以对其进行各种修改。因此,其它实施方案包含在权利要求的范围内。
Claims (7)
1.一种确定引发的模板核酸分子的下一个正确核苷酸的身份的方法,所述方法包括:
(a)提供用引物引发的模板核酸分子;
(b)将引发的模板核酸分子与多种反应混合物在稳定包含引发的模板核酸分子、聚合酶和下一个正确核苷酸的三元复合物,同时阻止任何核苷酸掺入引物的条件下连续接触,每种反应混合物均包含聚合酶和两或三种不同测试核苷酸的不同组合;
(c)检测聚合酶与引发的模板核酸分子的相互作用,而没有任何核苷酸化学掺入引发的模板核酸分子的引物,以确定是否形成三元复合物;及
(d)使用检测到的相互作用确定至少两种反应混合物共有的测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。
2.对引发的模板核酸进行测序的方法,包括:
(a)在聚合酶、引发的模板核酸和互补于引发的模板核酸的下一个碱基的测试核苷酸之间形成稳定的三元复合物的条件下,使引发的模板核酸与聚合酶及两或三种类型的测试核苷酸的第一组合接触;
(b)检测所述三元复合物,同时阻止测试核苷酸掺入引物;
(c)使用引发的模板核酸、聚合酶和两或三种类型的测试核苷酸的第二组合重复步骤(a)和(b),其中第二组合不同于第一组合;
(d)在步骤(c)之后,在引物中掺入与下一碱基互补的核苷酸;及
(e)重复步骤(a)-(d)以鉴别引发的模板核酸的序列。
3.鉴别引发的模板核酸分子的下一个正确核苷酸的方法,所述方法包括如下步骤:
(a)提供引物引发的模板核酸分子,所述引物包含附着于其3’末端核苷酸的可逆终止子部分;
(b)将引发的模板核酸分子与多个聚合酶-核苷酸组合在存在催化性金属离子而不掺入的条件下连续接触,
其中每个所述组合均包含聚合酶和不同的核苷酸,及
由此当与聚合酶组合输送的不同核苷酸之一是下一个正确核苷酸时,形成三元复合物,其包含聚合酶、所述不同核苷酸之一和引发的模板核酸分子;及
(c)检测所述三元复合物,从而将引发的模板核酸分子的下一个正确核苷酸鉴别为与聚合酶组合与引发的模板核酸分子接触形成三元复合物的所述不同核苷酸之一。
4.确定引发的模板核酸分子的下一个正确核苷酸的身份的方法,所述方法包括:
(a)提供用引物引发的模板核酸分子;
(b)将来自步骤(a)的引发的模板核酸分子与包含聚合酶和至少一种测试核苷酸的第一反应混合物在以下条件下接触:
(i)稳定包含引发的模板核酸分子、聚合酶及下一个正确核苷酸的三元复合物,同时阻止任何核苷酸掺入引物,及
(ii)使包含引发的模板核酸分子和聚合酶而不包含下一个正确核苷酸的二元复合物不稳定;
(c)检测聚合酶与引发的模板核酸分子的相互作用,而没有任何核苷酸化学掺入引发的模板核酸分子的引物,以确定步骤(b)中是否形成三元复合物;及
(d)使用步骤(c)中检测到的相互作用确定任何测试核苷酸是否是引发的模板核酸分子的下一个正确核苷酸。
5.一种将聚合酶和核苷酸输送至固定的核酸特征群的方法,每个特征均包含引发的模板核酸分子,所述方法包括以下步骤:
(a)将固定的核酸特征群与包含聚合酶、第一核苷酸和至少一种非固定的引发的模板核酸分子的第一试剂接触,
其中第一核苷酸不是第一试剂的任何所述非固定的引发的模板核酸分子的下一个正确核苷酸,
其中所述接触是在稳定三元复合物并抑制或阻止聚合酶催化磷酸二酯键形成的条件下进行,及
因此,与使用包含所述聚合酶和第一核苷酸的试剂而不存在所述第一试剂的非固定的引发的模板核酸分子相比,聚合酶与引发的模板核酸分子的核苷酸非依赖性结合降低。
6.一种反应混合物,包含:
(a)多个固定的核酸特征,每个特征均包含固定的引发的模板核酸;
(b)聚合酶;
(c)非固定的引发的模板核酸分子;及
(d)核苷酸,
其中所述核苷酸不是非固定的引发的模板核酸分子的同源核苷酸,及
其中通过存在非固定的引发的模板核酸分子降低所述聚合酶与固定的引发的模板核酸的核苷酸非依赖性结合。
7.聚合酶输送试剂,包含:
(a)聚合酶;
(b)至少一种非固定的引发的模板核酸分子;及
(c)至少一种核苷酸,
其中所述核苷酸无一是任何所述非固定的引发的模板核酸分子的下一个正确核苷酸。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662375379P | 2016-08-15 | 2016-08-15 | |
US62/375,379 | 2016-08-15 | ||
US201762447319P | 2017-01-17 | 2017-01-17 | |
US62/447,319 | 2017-01-17 | ||
CN201780063633.9A CN109844136A (zh) | 2016-08-15 | 2017-08-15 | 测序核酸的方法和系统 |
PCT/US2017/046976 WO2018035134A1 (en) | 2016-08-15 | 2017-08-15 | Method and system for sequencing nucleic acids |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780063633.9A Division CN109844136A (zh) | 2016-08-15 | 2017-08-15 | 测序核酸的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117385014A true CN117385014A (zh) | 2024-01-12 |
Family
ID=59772700
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311235787.5A Pending CN117385014A (zh) | 2016-08-15 | 2017-08-15 | 测序核酸的方法和系统 |
CN201780063633.9A Pending CN109844136A (zh) | 2016-08-15 | 2017-08-15 | 测序核酸的方法和系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780063633.9A Pending CN109844136A (zh) | 2016-08-15 | 2017-08-15 | 测序核酸的方法和系统 |
Country Status (8)
Country | Link |
---|---|
US (4) | US10443098B2 (zh) |
EP (2) | EP4039824A1 (zh) |
JP (2) | JP6828140B2 (zh) |
KR (1) | KR102230444B1 (zh) |
CN (2) | CN117385014A (zh) |
AU (1) | AU2017313718B2 (zh) |
CA (1) | CA3033741A1 (zh) |
WO (1) | WO2018035134A1 (zh) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014171898A2 (en) | 2013-04-17 | 2014-10-23 | Agency For Science, Technology And Research | Method for generating extended sequence reads |
US10077470B2 (en) * | 2015-07-21 | 2018-09-18 | Omniome, Inc. | Nucleic acid sequencing methods and systems |
SG11201807069XA (en) * | 2016-04-22 | 2018-09-27 | Omniome Inc | Nucleic acid sequencing method and system employing enhanced detection of nucleotide-specific ternary complex formation |
JP6828140B2 (ja) * | 2016-08-15 | 2021-02-10 | オムニオム インコーポレイテッドOmniome, Inc. | 核酸をシーケンシングするための方法及びシステム |
JP2020508037A (ja) | 2017-01-04 | 2020-03-19 | エムジーアイ テック カンパニー リミテッドMGI Tech Co., Ltd. | 非標識リバーシブルターミネーターまたは天然ヌクレオチドによる段階的シークエンシング |
US10975427B2 (en) | 2017-01-20 | 2021-04-13 | Omniome, Inc. | Process for cognate nucleotide detection in a nucleic acid sequencing workflow |
US10161003B2 (en) * | 2017-04-25 | 2018-12-25 | Omniome, Inc. | Methods and apparatus that increase sequencing-by-binding efficiency |
CA3070407C (en) | 2017-07-18 | 2022-08-09 | Omniome, Inc. | Method of chemically modifying plastic surfaces |
US10858701B2 (en) | 2017-08-15 | 2020-12-08 | Omniome, Inc. | Scanning apparatus and method useful for detection of chemical and biological analytes |
CA3079411C (en) | 2017-10-19 | 2023-12-05 | Omniome, Inc. | Simultaneous background reduction and complex stabilization in binding assay workflows |
AU2019217824A1 (en) * | 2018-02-06 | 2020-07-30 | Omniome, Inc. | Compositions and techniques for nucleic acid primer extension |
WO2019161253A1 (en) | 2018-02-16 | 2019-08-22 | Ultima Genomics, Inc. | Methods for sequencing with single frequency detection |
EP3775259A4 (en) * | 2018-03-26 | 2022-01-05 | Ultima Genomics, Inc. | NUCLEIC ACID MOLECULES SEQUENCING PROCESSES |
US20190338352A1 (en) | 2018-04-19 | 2019-11-07 | Omniome, Inc. | Accuracy of base calls in nucleic acid sequencing methods |
US10400272B1 (en) | 2018-04-26 | 2019-09-03 | Omniome, Inc. | Methods and compositions for stabilizing nucleic acid-nucleotide-polymerase complexes |
US11180794B2 (en) | 2018-05-31 | 2021-11-23 | Omniome, Inc. | Methods and compositions for capping nucleic acids |
EP3802874A1 (en) * | 2018-05-31 | 2021-04-14 | Omniome, Inc. | Increased signal to noise in nucleic acid sequencing |
EP3827097A1 (en) * | 2018-07-24 | 2021-06-02 | Omniome, Inc. | Serial formation of ternary complex species |
WO2020060811A1 (en) | 2018-09-17 | 2020-03-26 | Omniome, Inc. | Engineered polymerases for improved sequencing |
US10768173B1 (en) | 2019-09-06 | 2020-09-08 | Element Biosciences, Inc. | Multivalent binding composition for nucleic acid analysis |
US20240011086A1 (en) * | 2018-11-15 | 2024-01-11 | Omniome, Inc. | Electronic detection of nucleic acid structure |
GB2578528B (en) | 2018-12-04 | 2021-02-24 | Omniome Inc | Mixed-phase fluids for nucleic acid sequencing and other analytical assays |
WO2020132350A2 (en) | 2018-12-20 | 2020-06-25 | Omniome, Inc. | Temperature control for analysis of nucleic acids and other analytes |
US11499189B2 (en) | 2019-02-14 | 2022-11-15 | Pacific Biosciences Of California, Inc. | Mitigating adverse impacts of detection systems on nucleic acids and other biological analytes |
US11680950B2 (en) | 2019-02-20 | 2023-06-20 | Pacific Biosciences Of California, Inc. | Scanning apparatus and methods for detecting chemical and biological analytes |
EP3977119A4 (en) * | 2019-03-07 | 2022-12-28 | The Trustees of Columbia University in the City of New York | HIGH PRECISION NANOPORES-BASED SINGLE MOLECULE SEQUENCING BY SYNTHESIS WITH LABELED NUCLEOTIDES |
US11644406B2 (en) | 2019-06-11 | 2023-05-09 | Pacific Biosciences Of California, Inc. | Calibrated focus sensing |
US10656368B1 (en) | 2019-07-24 | 2020-05-19 | Omniome, Inc. | Method and system for biological imaging using a wide field objective lens |
US11180520B2 (en) | 2019-09-10 | 2021-11-23 | Omniome, Inc. | Reversible modifications of nucleotides |
US11287422B2 (en) | 2019-09-23 | 2022-03-29 | Element Biosciences, Inc. | Multivalent binding composition for nucleic acid analysis |
EP4045683A1 (en) | 2019-10-18 | 2022-08-24 | Omniome, Inc. | Methods and compositions for capping nucleic acids |
EP4055155A1 (en) | 2019-11-08 | 2022-09-14 | Pacific Biosciences of California, Inc. | Engineered polymerases for improved sequencing by binding |
DE202019106694U1 (de) | 2019-12-02 | 2020-03-19 | Omniome, Inc. | System zur Sequenzierung von Nukleinsäuren in Fluidschaum |
US20230054204A1 (en) | 2020-02-04 | 2023-02-23 | Pacific Biosciences Of California, Inc. | Flow cells and methods for their manufacture and use |
CN115516104A (zh) | 2020-03-03 | 2022-12-23 | 加利福尼亚太平洋生物科学股份有限公司 | 用于对双链核酸进行测序的方法和组合物 |
WO2021225886A1 (en) | 2020-05-05 | 2021-11-11 | Omniome, Inc. | Compositions and methods for modifying polymerase-nucleic acid complexes |
US20230279483A1 (en) | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Double-stranded splint adaptors and methods of use |
US11200446B1 (en) | 2020-08-31 | 2021-12-14 | Element Biosciences, Inc. | Single-pass primary analysis |
US20230279382A1 (en) | 2022-03-04 | 2023-09-07 | Element Biosciences, Inc. | Single-stranded splint strands and methods of use |
TW202243733A (zh) | 2021-01-13 | 2022-11-16 | 美商加州太平洋生物科學公司 | 經膠態組裝之表面結構化 |
US20220356519A1 (en) | 2021-05-10 | 2022-11-10 | Pacific Biosciences Of California, Inc. | Single-molecule seeding and amplification on a surface |
US20220356515A1 (en) | 2021-05-10 | 2022-11-10 | Pacific Biosciences Of California, Inc. | Dna amplification buffer replenishment during rolling circle amplification |
US11859241B2 (en) | 2021-06-17 | 2024-01-02 | Element Biosciences, Inc. | Compositions and methods for pairwise sequencing |
US11236388B1 (en) | 2021-06-17 | 2022-02-01 | Element Biosciences, Inc. | Compositions and methods for pairwise sequencing |
IL309440A (en) | 2021-06-18 | 2024-02-01 | Element Biosciences Inc | engineered polymerases |
WO2023081485A1 (en) | 2021-11-08 | 2023-05-11 | Pacific Biosciences Of California, Inc. | Stepwise sequencing of a polynucleotide with a homogenous reaction mixture |
US20230392144A1 (en) | 2022-06-03 | 2023-12-07 | Element Biosciences, Inc. | Compositions and methods for reducing base call errors by removing deaminated nucleotides from a nucleic acid library |
WO2023240093A1 (en) | 2022-06-06 | 2023-12-14 | Element Biosciences, Inc. | Methods for assembling and reading nucleic acid sequences from mixed populations |
WO2024011145A1 (en) | 2022-07-05 | 2024-01-11 | Element Biosciences, Inc. | Pcr-free library preparation using double-stranded splint adaptors and methods of use |
WO2024015962A1 (en) | 2022-07-15 | 2024-01-18 | Pacific Biosciences Of California, Inc. | Blocked asymmetric hairpin adaptors |
WO2024040058A1 (en) | 2022-08-15 | 2024-02-22 | Element Biosciences, Inc. | Methods for preparing nucleic acid nanostructures using compaction oligonucleotides |
US20240052398A1 (en) | 2022-08-15 | 2024-02-15 | Element Biosciences, Inc. | Spatially resolved surface capture of nucleic acids |
WO2024059550A1 (en) | 2022-09-12 | 2024-03-21 | Element Biosciences, Inc. | Double-stranded splint adaptors with universal long splint strands and methods of use |
WO2024124008A2 (en) | 2022-12-07 | 2024-06-13 | Element Biosciences, Inc. | Cyanine derivatives and related uses |
CN116287167B (zh) * | 2023-02-20 | 2024-06-25 | 深圳市大道测序生物科技有限公司 | 核酸分子的测序方法 |
Family Cites Families (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8910880D0 (en) | 1989-05-11 | 1989-06-28 | Amersham Int Plc | Sequencing method |
US5302509A (en) | 1989-08-14 | 1994-04-12 | Beckman Instruments, Inc. | Method for sequencing polynucleotides |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
US5614365A (en) | 1994-10-17 | 1997-03-25 | President & Fellow Of Harvard College | DNA polymerase having modified nucleotide binding site for DNA sequencing |
US6165765A (en) | 1995-10-18 | 2000-12-26 | Shanghai Institute Of Biochemistry, Chinese Academy Of Sciences | DNA polymerase having ability to reduce innate selective discrimination against fluorescent dye-labeled dideoxynucleotides |
US6828094B2 (en) | 1996-12-20 | 2004-12-07 | Roche Diagnostics Gmbh | Method for the uncoupled, direct, exponential amplification and sequencing of DNA molecules with the addition of a second thermostable DNA polymerase and its application |
RU2198221C2 (ru) | 1997-07-28 | 2003-02-10 | Медикал Биосистемз Лтд. | Способ секвенирования полинуклеотида и устройство для его осуществления |
US6248539B1 (en) | 1997-09-05 | 2001-06-19 | The Scripps Research Institute | Porous semiconductor-based optical interferometric sensor |
ATE423314T1 (de) | 1998-06-24 | 2009-03-15 | Illumina Inc | Dekodierung von matrixartig-angeordneten sensoren durch mikropartikel |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
US6982146B1 (en) | 1999-08-30 | 2006-01-03 | The United States Of America As Represented By The Department Of Health And Human Services | High speed parallel molecular nucleic acid sequencing |
WO2001016375A2 (en) | 1999-08-30 | 2001-03-08 | The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | High speed parallel molecular nucleic acid sequencing |
US6908736B1 (en) | 1999-10-06 | 2005-06-21 | Medical Biosystems, Ltd. | DNA sequencing method |
GB9923644D0 (en) | 1999-10-06 | 1999-12-08 | Medical Biosystems Ltd | DNA sequencing |
CA2415897A1 (en) | 2000-07-07 | 2002-01-17 | Susan H. Hardin | Real-time sequence determination |
DE60127162T2 (de) | 2000-10-06 | 2008-04-24 | The Trustees Of Columbia University In The City Of New York | Massives Parallelverfahren zur Dekodierung von DNA und RNA |
AU2002241803A1 (en) | 2000-10-20 | 2002-06-18 | The Board Of Trustees Of The Leland Stanford Junior University | Transient electrical signal based methods and devices for characterizing molecular interaction and/or motion in a sample |
US7371562B2 (en) | 2000-10-30 | 2008-05-13 | Sru Biosystems, Inc. | Guided mode resonant filter biosensor using a linear grating surface structure |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
US7414116B2 (en) | 2002-08-23 | 2008-08-19 | Illumina Cambridge Limited | Labelled nucleotides |
GB2398383B (en) * | 2003-02-12 | 2005-03-09 | Global Genomics Ab | Method and means for nucleic acid sequencing |
ATE432365T1 (de) | 2003-02-21 | 2009-06-15 | Geneform Technologies Ltd | Verfahren, kits und reagenzien zur nukleinsäuresequenzierung |
GB0317343D0 (en) | 2003-07-24 | 2003-08-27 | Medical Biosystems Ltd | Polynucleotide sequencing |
AU2003269991A1 (en) | 2003-08-20 | 2005-03-10 | Applera Corporation | Polymerase compositions |
EP1701785A1 (en) | 2004-01-07 | 2006-09-20 | Solexa Ltd. | Modified molecular arrays |
US8071755B2 (en) | 2004-05-25 | 2011-12-06 | Helicos Biosciences Corporation | Nucleotide analogs |
US7264934B2 (en) | 2004-06-10 | 2007-09-04 | Ge Healthcare Bio-Sciences Corp. | Rapid parallel nucleic acid analysis |
DE602005020011D1 (de) | 2004-06-10 | 2010-04-29 | Ge Healthcare Bio Sciences | Verfahren zur nukleinsäureanalyse |
GB0413082D0 (en) | 2004-06-11 | 2004-07-14 | Medical Biosystems Ltd | Method |
CN101914620B (zh) | 2004-09-17 | 2014-02-12 | 加利福尼亚太平洋生命科学公司 | 核酸测序的方法 |
US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
US7544794B1 (en) | 2005-03-11 | 2009-06-09 | Steven Albert Benner | Method for sequencing DNA and RNA by synthesis |
US7449297B2 (en) | 2005-04-14 | 2008-11-11 | Euclid Diagnostics Llc | Methods of copying the methylation pattern of DNA during isothermal amplification and microarrays |
US20070009925A1 (en) | 2005-05-05 | 2007-01-11 | Applera Corporation | Genomic dna sequencing methods and kits |
CN101415839B (zh) * | 2006-02-08 | 2012-06-27 | 亿明达剑桥有限公司 | 对多核苷酸模板进行测序的方法 |
US8241573B2 (en) | 2006-03-31 | 2012-08-14 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
GB2457402B (en) | 2006-12-01 | 2011-10-19 | Univ Columbia | Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators |
US7678894B2 (en) | 2007-05-18 | 2010-03-16 | Helicos Biosciences Corporation | Nucleotide analogs |
US8617811B2 (en) | 2008-01-28 | 2013-12-31 | Complete Genomics, Inc. | Methods and compositions for efficient base calling in sequencing reactions |
CN101434988B (zh) | 2007-11-16 | 2013-05-01 | 深圳华因康基因科技有限公司 | 一种高通量寡核苷酸测序方法 |
US8652781B2 (en) | 2008-02-12 | 2014-02-18 | Pacific Biosciences Of California, Inc. | Cognate sampling kinetics |
US8628940B2 (en) | 2008-09-24 | 2014-01-14 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
US8999676B2 (en) | 2008-03-31 | 2015-04-07 | Pacific Biosciences Of California, Inc. | Recombinant polymerases for improved single molecule sequencing |
WO2009145820A2 (en) | 2008-03-31 | 2009-12-03 | Pacific Biosciences Of California, Inc. | Generation of modified polymerases for improved accuracy in single molecule sequencing |
US8133672B2 (en) | 2008-03-31 | 2012-03-13 | Pacific Biosciences Of California, Inc. | Two slow-step polymerase enzyme systems and methods |
US20100092960A1 (en) | 2008-07-25 | 2010-04-15 | Pacific Biosciences Of California, Inc. | Helicase-assisted sequencing with molecular beacons |
TWI408888B (zh) * | 2008-08-07 | 2013-09-11 | Ind Tech Res Inst | 超音波線性馬達 |
US20110294116A1 (en) | 2008-12-11 | 2011-12-01 | The Regents of the Unicersity of California | Methods and systems for direct sequencing of single dna molecules |
WO2010075188A2 (en) | 2008-12-23 | 2010-07-01 | Illumina Inc. | Multibase delivery for long reads in sequencing by synthesis protocols |
WO2010111686A2 (en) | 2009-03-27 | 2010-09-30 | Life Technologies Corp | Labeled enzyme compositions, methods & systems |
US8034923B1 (en) | 2009-03-27 | 2011-10-11 | Steven Albert Benner | Reagents for reversibly terminating primer extension |
US20120156728A1 (en) * | 2010-12-17 | 2012-06-21 | Life Technologies Corporation | Clonal amplification of nucleic acid on solid surface with template walking |
WO2010141390A2 (en) | 2009-06-05 | 2010-12-09 | Life Technologies Corporation | Nucleotide transient binding for sequencing methods |
WO2011038241A1 (en) | 2009-09-25 | 2011-03-31 | President And Fellows Of Harvard College | Nucleic acid amplification and sequencing by synthesis with fluorogenic nucleotides |
US8911972B2 (en) | 2009-12-16 | 2014-12-16 | Pacific Biosciences Of California, Inc. | Sequencing methods using enzyme conformation |
US8603741B2 (en) | 2010-02-18 | 2013-12-10 | Pacific Biosciences Of California, Inc. | Single molecule sequencing with two distinct chemistry steps |
WO2011159942A1 (en) | 2010-06-18 | 2011-12-22 | Illumina, Inc. | Conformational probes and methods for sequencing nucleic acids |
WO2012009206A2 (en) | 2010-07-12 | 2012-01-19 | Pacific Biosciences Of California, Inc. | Sequencing reactions with alkali metal cations for pulse width control |
BE1019015A5 (nl) * | 2010-12-13 | 2012-01-10 | Luxafoil | Energiewerende kunststoffolie. |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
CA2837486C (en) | 2011-05-27 | 2020-10-27 | Genapsys, Inc. | Systems and methods for nucleic acid sequencing |
US20150087537A1 (en) | 2011-08-31 | 2015-03-26 | Life Technologies Corporation | Methods, Systems, Computer Readable Media, and Kits for Sample Identification |
AU2012308518B2 (en) | 2011-09-13 | 2017-08-17 | Agilent Technologies, Inc. | 5-methoxy, 3'-oh unblocked, fast photocleavable terminating nucleotides and methods for nucleic acid sequencing |
WO2013044018A1 (en) | 2011-09-23 | 2013-03-28 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
WO2013096692A1 (en) | 2011-12-21 | 2013-06-27 | Illumina, Inc. | Apparatus and methods for kinetic analysis and determination of nucleic acid sequences |
CN102634586B (zh) | 2012-04-27 | 2013-10-30 | 东南大学 | 一种两核苷酸实时合成dna解码测序方法 |
WO2013166303A1 (en) | 2012-05-02 | 2013-11-07 | Ibis Biosciences, Inc. | Dna sequencing |
GB201301178D0 (en) | 2013-01-23 | 2013-03-06 | Dynamic Biosensors Gmbh | Method for sequencing a template nucleic acid immobilized on a substrate |
ES2724824T3 (es) | 2013-03-13 | 2019-09-16 | Illumina Inc | Métodos para la secuenciación de ácidos nucleicos |
WO2014142981A1 (en) | 2013-03-15 | 2014-09-18 | Illumina, Inc. | Enzyme-linked nucleotides |
US8808989B1 (en) | 2013-04-02 | 2014-08-19 | Molecular Assemblies, Inc. | Methods and apparatus for synthesizing nucleic acids |
CN109112193A (zh) | 2013-07-03 | 2019-01-01 | 伊鲁米那股份有限公司 | 正交合成测序 |
EP3084002A4 (en) | 2013-12-16 | 2017-08-23 | Complete Genomics, Inc. | Basecaller for dna sequencing using machine learning |
CN107849605B (zh) | 2015-07-21 | 2021-08-20 | 欧姆尼欧美公司 | 核酸测序方法和系统 |
US10077470B2 (en) | 2015-07-21 | 2018-09-18 | Omniome, Inc. | Nucleic acid sequencing methods and systems |
US10253352B2 (en) | 2015-11-17 | 2019-04-09 | Omniome, Inc. | Methods for determining sequence profiles |
SG11201807069XA (en) * | 2016-04-22 | 2018-09-27 | Omniome Inc | Nucleic acid sequencing method and system employing enhanced detection of nucleotide-specific ternary complex formation |
WO2017190012A1 (en) * | 2016-04-29 | 2017-11-02 | Omniome, Inc. | Method of nucleic acid sequence determination |
AU2017258619B2 (en) | 2016-04-29 | 2020-05-14 | Pacific Biosciences Of California, Inc. | Sequencing method employing ternary complex destabilization to identify cognate nucleotides |
JP6828140B2 (ja) * | 2016-08-15 | 2021-02-10 | オムニオム インコーポレイテッドOmniome, Inc. | 核酸をシーケンシングするための方法及びシステム |
US9951385B1 (en) | 2017-04-25 | 2018-04-24 | Omniome, Inc. | Methods and apparatus that increase sequencing-by-binding efficiency |
US10161003B2 (en) | 2017-04-25 | 2018-12-25 | Omniome, Inc. | Methods and apparatus that increase sequencing-by-binding efficiency |
-
2017
- 2017-08-15 JP JP2019508256A patent/JP6828140B2/ja active Active
- 2017-08-15 CA CA3033741A patent/CA3033741A1/en active Pending
- 2017-08-15 US US15/677,870 patent/US10443098B2/en active Active
- 2017-08-15 CN CN202311235787.5A patent/CN117385014A/zh active Pending
- 2017-08-15 CN CN201780063633.9A patent/CN109844136A/zh active Pending
- 2017-08-15 EP EP21206020.6A patent/EP4039824A1/en active Pending
- 2017-08-15 EP EP17761630.7A patent/EP3497236B1/en active Active
- 2017-08-15 AU AU2017313718A patent/AU2017313718B2/en active Active
- 2017-08-15 WO PCT/US2017/046976 patent/WO2018035134A1/en unknown
- 2017-08-15 KR KR1020197007695A patent/KR102230444B1/ko active IP Right Grant
- 2017-10-04 US US15/724,570 patent/US10246744B2/en active Active
-
2019
- 2019-09-13 US US16/570,873 patent/US11168364B2/en active Active
-
2021
- 2021-01-20 JP JP2021006893A patent/JP7198295B2/ja active Active
- 2021-10-06 US US17/495,739 patent/US20220162690A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2017313718A1 (en) | 2019-02-28 |
AU2017313718B2 (en) | 2023-09-14 |
JP6828140B2 (ja) | 2021-02-10 |
US10443098B2 (en) | 2019-10-15 |
CN109844136A (zh) | 2019-06-04 |
US20180044727A1 (en) | 2018-02-15 |
EP3497236B1 (en) | 2021-11-03 |
EP4039824A1 (en) | 2022-08-10 |
US20200002762A1 (en) | 2020-01-02 |
WO2018035134A1 (en) | 2018-02-22 |
US20180080073A1 (en) | 2018-03-22 |
JP7198295B2 (ja) | 2022-12-28 |
US11168364B2 (en) | 2021-11-09 |
JP2019530436A (ja) | 2019-10-24 |
EP3497236A1 (en) | 2019-06-19 |
US10246744B2 (en) | 2019-04-02 |
KR20190034344A (ko) | 2019-04-01 |
CA3033741A1 (en) | 2018-02-22 |
JP2021072816A (ja) | 2021-05-13 |
KR102230444B1 (ko) | 2021-03-23 |
US20220162690A1 (en) | 2022-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11168364B2 (en) | Method and system for sequencing nucleic acids | |
US20240035082A1 (en) | Nucleic acid sequencing methods and systems | |
CN107849605B (zh) | 核酸测序方法和系统 | |
US11976323B2 (en) | Method of nucleic acid sequence determination | |
CN109072297B (zh) | 使用增强的核苷酸特异性三元复合物形成检测的核酸测序方法和系统 | |
US10633692B2 (en) | Sequencing method employing ternary complex destabilization to identify cognate nucleotides | |
WO2018034780A1 (en) | Sequencing method for rapid identification and processing of cognate nucleotide pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |