CN117980474A - 工程化聚合酶 - Google Patents
工程化聚合酶 Download PDFInfo
- Publication number
- CN117980474A CN117980474A CN202280054380.XA CN202280054380A CN117980474A CN 117980474 A CN117980474 A CN 117980474A CN 202280054380 A CN202280054380 A CN 202280054380A CN 117980474 A CN117980474 A CN 117980474A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- polymerase
- nucleotide
- nucleic acid
- complex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 578
- 239000002773 nucleotide Substances 0.000 claims abstract description 546
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 394
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 390
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 390
- 238000010348 incorporation Methods 0.000 claims abstract description 130
- 230000027455 binding Effects 0.000 claims abstract description 121
- 238000009739 binding Methods 0.000 claims abstract description 121
- 238000012163 sequencing technique Methods 0.000 claims abstract description 83
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 288
- 238000006467 substitution reaction Methods 0.000 claims description 264
- 238000000034 method Methods 0.000 claims description 143
- 239000000203 mixture Substances 0.000 claims description 89
- 235000000346 sugar Nutrition 0.000 claims description 59
- 108091028732 Concatemer Proteins 0.000 claims description 56
- 230000003197 catalytic effect Effects 0.000 claims description 53
- 150000001768 cations Chemical class 0.000 claims description 48
- -1 O-azidomethyl Chemical group 0.000 claims description 46
- 230000001965 increasing effect Effects 0.000 claims description 45
- 239000000758 substrate Substances 0.000 claims description 44
- 229910052799 carbon Inorganic materials 0.000 claims description 33
- 238000006116 polymerization reaction Methods 0.000 claims description 27
- 108020004635 Complementary DNA Proteins 0.000 claims description 25
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 25
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 25
- 102220491084 ADP-ribosylation factor 6_D141A_mutation Human genes 0.000 claims description 24
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 24
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 23
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 23
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 23
- 239000011248 coating agent Substances 0.000 claims description 21
- 238000000576 coating method Methods 0.000 claims description 21
- 125000003118 aryl group Chemical group 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 17
- 230000002401 inhibitory effect Effects 0.000 claims description 14
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 claims description 14
- 229910052788 barium Inorganic materials 0.000 claims description 13
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 claims description 13
- 239000003153 chemical reaction reagent Substances 0.000 claims description 13
- 230000000977 initiatory effect Effects 0.000 claims description 13
- 229910052712 strontium Inorganic materials 0.000 claims description 13
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 claims description 13
- 125000006850 spacer group Chemical group 0.000 claims description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 claims description 11
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 claims description 11
- 229910052749 magnesium Inorganic materials 0.000 claims description 11
- 239000011777 magnesium Substances 0.000 claims description 11
- 229910052748 manganese Inorganic materials 0.000 claims description 11
- 239000011572 manganese Substances 0.000 claims description 11
- 230000000717 retained effect Effects 0.000 claims description 11
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 10
- 229910019142 PO4 Inorganic materials 0.000 claims description 9
- 239000002202 Polyethylene glycol Substances 0.000 claims description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 9
- 239000010452 phosphate Substances 0.000 claims description 9
- 229920001223 polyethylene glycol Polymers 0.000 claims description 9
- DLMVDBDHOIWEJZ-UHFFFAOYSA-N isocyanatooxyimino(oxo)methane Chemical compound O=C=NON=C=O DLMVDBDHOIWEJZ-UHFFFAOYSA-N 0.000 claims description 8
- 229920001477 hydrophilic polymer Polymers 0.000 claims description 7
- 230000001737 promoting effect Effects 0.000 claims description 7
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims description 7
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 6
- 125000003342 alkenyl group Chemical group 0.000 claims description 6
- 125000000217 alkyl group Chemical group 0.000 claims description 6
- 125000000304 alkynyl group Chemical group 0.000 claims description 6
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 6
- 239000012530 fluid Substances 0.000 claims description 6
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 claims description 5
- 125000003368 amide group Chemical group 0.000 claims description 5
- 125000001931 aliphatic group Chemical group 0.000 claims description 4
- 125000003827 glycol group Chemical group 0.000 claims description 4
- 125000003808 silyl group Chemical group [H][Si]([H])([H])[*] 0.000 claims description 4
- 239000004251 Ammonium lactate Substances 0.000 claims description 3
- 108010010677 Phosphodiesterase I Proteins 0.000 claims description 3
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims 3
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims 3
- 239000004202 carbamide Substances 0.000 claims 3
- 125000002228 disulfide group Chemical group 0.000 claims 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims 3
- 241000203069 Archaea Species 0.000 abstract description 135
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 abstract description 42
- 229940035893 uracil Drugs 0.000 abstract description 21
- 230000001976 improved effect Effects 0.000 abstract description 19
- 238000006243 chemical reaction Methods 0.000 abstract description 18
- 241000894006 Bacteria Species 0.000 abstract description 5
- 241000206602 Eukaryota Species 0.000 abstract description 4
- 230000035772 mutation Effects 0.000 description 255
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 243
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 243
- 235000001014 amino acid Nutrition 0.000 description 188
- 108090000765 processed proteins & peptides Proteins 0.000 description 128
- 229920001184 polypeptide Polymers 0.000 description 127
- 102000004196 processed proteins & peptides Human genes 0.000 description 127
- 239000013615 primer Substances 0.000 description 119
- 229940024606 amino acid Drugs 0.000 description 83
- 150000001413 amino acids Chemical class 0.000 description 78
- 230000037430 deletion Effects 0.000 description 60
- 238000012217 deletion Methods 0.000 description 60
- 230000037431 insertion Effects 0.000 description 59
- 238000003780 insertion Methods 0.000 description 59
- 102000004190 Enzymes Human genes 0.000 description 58
- 108090000790 Enzymes Proteins 0.000 description 58
- 229940088598 enzyme Drugs 0.000 description 58
- 238000003203 nucleic acid sequencing method Methods 0.000 description 57
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 28
- 125000005647 linker group Chemical group 0.000 description 25
- 229910052698 phosphorus Inorganic materials 0.000 description 23
- 229910052717 sulfur Inorganic materials 0.000 description 23
- 229910052757 nitrogen Inorganic materials 0.000 description 22
- 125000000539 amino acid group Chemical group 0.000 description 19
- 229910052721 tungsten Inorganic materials 0.000 description 19
- 229910052727 yttrium Inorganic materials 0.000 description 19
- FXEDECJAXCCXOU-UHFFFAOYSA-N 1-(2-(diphenylmethoxy)ethyl)-4-(2-(4-azido-3-iodophenyl)ethyl)piperazine Chemical compound C1=C(N=[N+]=[N-])C(I)=CC(CCN2CCN(CCOC(C=3C=CC=CC=3)C=3C=CC=CC=3)CC2)=C1 FXEDECJAXCCXOU-UHFFFAOYSA-N 0.000 description 18
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 18
- 235000004279 alanine Nutrition 0.000 description 18
- 239000000975 dye Substances 0.000 description 18
- 235000004400 serine Nutrition 0.000 description 18
- 239000004471 Glycine Substances 0.000 description 17
- 150000001540 azides Chemical class 0.000 description 17
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 17
- 238000010494 dissociation reaction Methods 0.000 description 17
- 230000005593 dissociations Effects 0.000 description 17
- 108090000623 proteins and genes Proteins 0.000 description 17
- 238000002864 sequence alignment Methods 0.000 description 17
- 239000000243 solution Substances 0.000 description 17
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 15
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 15
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 15
- 239000004473 Threonine Substances 0.000 description 15
- 235000018102 proteins Nutrition 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- 235000008521 threonine Nutrition 0.000 description 15
- 235000002374 tyrosine Nutrition 0.000 description 15
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 15
- 238000003776 cleavage reaction Methods 0.000 description 14
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 14
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 14
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 13
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 13
- 235000005772 leucine Nutrition 0.000 description 13
- 239000001733 1,4-Heptonolactone Substances 0.000 description 12
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 12
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 12
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 12
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 12
- 229960000310 isoleucine Drugs 0.000 description 12
- 235000014705 isoleucine Nutrition 0.000 description 12
- 239000004474 valine Substances 0.000 description 12
- 235000014393 valine Nutrition 0.000 description 12
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 11
- 150000001412 amines Chemical class 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 11
- 102000040350 B family Human genes 0.000 description 10
- 108091072128 B family Proteins 0.000 description 10
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 10
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 10
- 229910052791 calcium Inorganic materials 0.000 description 10
- 239000011575 calcium Substances 0.000 description 10
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 10
- 235000008729 phenylalanine Nutrition 0.000 description 10
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 9
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 239000004472 Lysine Substances 0.000 description 9
- 235000003704 aspartic acid Nutrition 0.000 description 9
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- 235000018977 lysine Nutrition 0.000 description 9
- 239000002777 nucleoside Substances 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 8
- 229930024421 Adenine Natural products 0.000 description 8
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 8
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 229960000643 adenine Drugs 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 235000006109 methionine Nutrition 0.000 description 8
- 108010043461 Deep Vent DNA polymerase Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 7
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 7
- 229940104302 cytosine Drugs 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 235000014304 histidine Nutrition 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 7
- 229940113082 thymine Drugs 0.000 description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 6
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical class O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 6
- 125000004437 phosphorous atom Chemical group 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 5
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 5
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 5
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 5
- 235000017899 Spathodea campanulata Nutrition 0.000 description 5
- 108010001244 Tli polymerase Proteins 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 5
- CZPLANDPABRVHX-UHFFFAOYSA-N cascade blue Chemical compound C=1C2=CC=CC=C2C(NCC)=CC=1C(C=1C=CC(=CC=1)N(CC)CC)=C1C=CC(=[N+](CC)CC)C=C1 CZPLANDPABRVHX-UHFFFAOYSA-N 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- 210000003813 thumb Anatomy 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 description 4
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 241001478240 Coccus Species 0.000 description 4
- 229920000089 Cyclic olefin copolymer Polymers 0.000 description 4
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 4
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 4
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 4
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine group Chemical group N1=CCC2=CC=CC=C12 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- PTMHPRAIXMAOOB-UHFFFAOYSA-N phosphoramidic acid Chemical compound NP(O)(O)=O PTMHPRAIXMAOOB-UHFFFAOYSA-N 0.000 description 4
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 4
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- HZNVUJQVZSTENZ-UHFFFAOYSA-N 2,3-dichloro-5,6-dicyano-1,4-benzoquinone Chemical compound ClC1=C(Cl)C(=O)C(C#N)=C(C#N)C1=O HZNVUJQVZSTENZ-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 239000002970 Calcium lactobionate Substances 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 241000626621 Geobacillus Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 3
- 108091093105 Nuclear DNA Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 3
- 241000205160 Pyrococcus Species 0.000 description 3
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 3
- 241000723792 Tobacco etch virus Species 0.000 description 3
- 241001478283 Variovorax Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 235000011054 acetic acid Nutrition 0.000 description 3
- 238000001261 affinity purification Methods 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000006555 catalytic reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000002738 chelating agent Substances 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- KDLHZDBZIXYQEI-UHFFFAOYSA-N palladium Substances [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000001384 succinic acid Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- HKOZVRHVBWKDTJ-UHFFFAOYSA-N 3-diphenylphosphanylbenzene-1,2-disulfonic acid Chemical compound S(=O)(=O)(O)C=1C(=C(C=CC=1)P(C1=CC=CC=C1)C1=CC=CC=C1)S(=O)(=O)O HKOZVRHVBWKDTJ-UHFFFAOYSA-N 0.000 description 2
- PZOUSPYUWWUPPK-UHFFFAOYSA-N 4-methyl-1h-indole Chemical compound CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- 102220561506 Autophagy protein 5_K58M_mutation Human genes 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 2
- 239000004713 Cyclic olefin copolymer Substances 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 239000004214 Fast Green FCF Substances 0.000 description 2
- 102220582809 Glutathione S-transferase theta-2_Y10F_mutation Human genes 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000203353 Methanococcus Species 0.000 description 2
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical group [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 239000004698 Polyethylene Substances 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- VHRGRCVQAFMJIZ-UHFFFAOYSA-N cadaverine Chemical compound NCCCCCN VHRGRCVQAFMJIZ-UHFFFAOYSA-N 0.000 description 2
- 239000004227 calcium gluconate Substances 0.000 description 2
- 239000001175 calcium sulphate Substances 0.000 description 2
- 125000002837 carbocyclic group Chemical group 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical group OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000000295 emission spectrum Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000003811 finger Anatomy 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 229920001903 high density polyethylene Polymers 0.000 description 2
- 239000004700 high-density polyethylene Substances 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- KQNPFQTWMSNSAP-UHFFFAOYSA-N isobutyric acid Chemical compound CC(C)C(O)=O KQNPFQTWMSNSAP-UHFFFAOYSA-N 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- SXQCTESRRZBPHJ-UHFFFAOYSA-M lissamine rhodamine Chemical compound [Na+].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=C(S([O-])(=O)=O)C=C1S([O-])(=O)=O SXQCTESRRZBPHJ-UHFFFAOYSA-M 0.000 description 2
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 2
- 229940107698 malachite green Drugs 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- ZQAUNTSBAZCVIO-UHFFFAOYSA-N methoxyphosphonamidic acid Chemical group COP(N)(O)=O ZQAUNTSBAZCVIO-UHFFFAOYSA-N 0.000 description 2
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 229910017604 nitric acid Inorganic materials 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- NFHFRUOZVGFOOS-UHFFFAOYSA-N palladium;triphenylphosphane Chemical compound [Pd].C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 NFHFRUOZVGFOOS-UHFFFAOYSA-N 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 2
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 2
- 229920000573 polyethylene Polymers 0.000 description 2
- 229920000139 polyethylene terephthalate Polymers 0.000 description 2
- 239000005020 polyethylene terephthalate Substances 0.000 description 2
- 239000004926 polymethyl methacrylate Substances 0.000 description 2
- 239000000249 polyoxyethylene sorbitan monopalmitate Substances 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Chemical compound [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 2
- 239000000473 propyl gallate Substances 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-O pyridinium Chemical compound C1=CC=[NH+]C=C1 JUJWROOIHBZHMG-UHFFFAOYSA-O 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000007928 solubilization Effects 0.000 description 2
- 238000005063 solubilization Methods 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000003774 sulfhydryl reagent Substances 0.000 description 2
- 239000004149 tartrazine Substances 0.000 description 2
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- 239000002478 γ-tocopherol Substances 0.000 description 2
- VQTBINYMFPKLQD-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 2-(3-hydroxy-6-oxoxanthen-9-yl)benzoate Chemical compound C=12C=CC(=O)C=C2OC2=CC(O)=CC=C2C=1C1=CC=CC=C1C(=O)ON1C(=O)CCC1=O VQTBINYMFPKLQD-UHFFFAOYSA-N 0.000 description 1
- ILKQVTIMOGNSAS-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 2-(7-amino-4-methyl-2-oxochromen-3-yl)acetate Chemical compound O=C1OC=2C=C(N)C=CC=2C(C)=C1CC(=O)ON1C(=O)CCC1=O ILKQVTIMOGNSAS-UHFFFAOYSA-N 0.000 description 1
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- DTMMZESZHTZRSO-UHFFFAOYSA-N 1-[(3-acetyloxy-4-methyl-2-oxochromen-7-yl)amino]-2,5-dioxopyrrolidine-3-sulfonic acid Chemical compound C1=C2OC(=O)C(OC(=O)C)=C(C)C2=CC=C1NN1C(=O)CC(S(O)(=O)=O)C1=O DTMMZESZHTZRSO-UHFFFAOYSA-N 0.000 description 1
- LNETULKMXZVUST-UHFFFAOYSA-N 1-naphthoic acid Chemical compound C1=CC=C2C(C(=O)O)=CC=CC2=C1 LNETULKMXZVUST-UHFFFAOYSA-N 0.000 description 1
- SIKJAQJRHWYJAI-UHFFFAOYSA-O 1H-indol-1-ium Chemical compound C1=CC=C2[NH2+]C=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-O 0.000 description 1
- HIYWOHBEPVGIQN-UHFFFAOYSA-N 1h-benzo[g]indole Chemical compound C1=CC=CC2=C(NC=C3)C3=CC=C21 HIYWOHBEPVGIQN-UHFFFAOYSA-N 0.000 description 1
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 1
- FAQVDANXTSFXGA-UHFFFAOYSA-N 2,3-dihydro-1h-benzo[g]indole Chemical compound C1=CC=CC2=C(NCC3)C3=CC=C21 FAQVDANXTSFXGA-UHFFFAOYSA-N 0.000 description 1
- FZPOQECWSUNQMC-UHFFFAOYSA-N 2-(3-methylbut-3-enyl)-2-methylsulfanylpurin-6-amine Chemical compound NC1=NC(SC)(CCC(C)=C)N=C2N=CN=C21 FZPOQECWSUNQMC-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical compound N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- KYZUDXYWLHVWCQ-UHFFFAOYSA-N 2-ethenyl-7h-purin-6-amine Chemical compound NC1=NC(C=C)=NC2=C1NC=N2 KYZUDXYWLHVWCQ-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical compound C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- FTBBGQKRYUTLMP-UHFFFAOYSA-N 2-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C1=CC=CN1 FTBBGQKRYUTLMP-UHFFFAOYSA-N 0.000 description 1
- QCPFFGGFHNZBEP-UHFFFAOYSA-N 4,5,6,7-tetrachloro-3',6'-dihydroxyspiro[2-benzofuran-3,9'-xanthene]-1-one Chemical compound O1C(=O)C(C(=C(Cl)C(Cl)=C2Cl)Cl)=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 QCPFFGGFHNZBEP-UHFFFAOYSA-N 0.000 description 1
- VEJHUGGPLQWGPR-UHFFFAOYSA-N 4,7-bis(3-chloro-2-sulfophenyl)-1,10-phenanthroline-2,9-dicarboxylic acid Chemical compound C=12C=CC3=C(C=4C(=C(Cl)C=CC=4)S(O)(=O)=O)C=C(C(O)=O)N=C3C2=NC(C(=O)O)=CC=1C1=CC=CC(Cl)=C1S(O)(=O)=O VEJHUGGPLQWGPR-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 1
- NBAKTGXDIBVZOO-UHFFFAOYSA-N 5,6-dihydrothymine Chemical compound CC1CNC(=O)NC1=O NBAKTGXDIBVZOO-UHFFFAOYSA-N 0.000 description 1
- YERWMQJEYUIJBO-UHFFFAOYSA-N 5-chlorosulfonyl-2-[3-(diethylamino)-6-diethylazaniumylidenexanthen-9-yl]benzenesulfonate Chemical compound C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=C(S(Cl)(=O)=O)C=C1S([O-])(=O)=O YERWMQJEYUIJBO-UHFFFAOYSA-N 0.000 description 1
- GSPMCUUYNASDHM-UHFFFAOYSA-N 5-methyl-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound CC1=CNC(=O)N=C1S GSPMCUUYNASDHM-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical group N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 108091029845 Aminoallyl nucleotide Proteins 0.000 description 1
- 239000001715 Ammonium malate Substances 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000883801 Candidatus Altiarchaeales Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 239000003109 Disodium ethylene diamine tetraacetate Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102220506701 Endogenous retrovirus group K member 104 Pro protein_I63T_mutation Human genes 0.000 description 1
- 101100037309 Enterobacteria phage T4 Y10A gene Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- PIICEJLVQHRZGT-UHFFFAOYSA-N Ethylenediamine Chemical compound NCCN PIICEJLVQHRZGT-UHFFFAOYSA-N 0.000 description 1
- 229910052693 Europium Inorganic materials 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000684503 Homo sapiens Sentrin-specific protease 3 Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 241001534815 Hypsizygus marmoreus Species 0.000 description 1
- RAXXELZNTBOGNW-UHFFFAOYSA-O Imidazolium Chemical compound C1=C[NH+]=CN1 RAXXELZNTBOGNW-UHFFFAOYSA-O 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102220617354 Leucine-rich repeat-containing protein 34_V91W_mutation Human genes 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 239000004145 Methyl glucoside-coconut oil ester Substances 0.000 description 1
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 1
- PYUSHNKNPOHWEZ-YFKPBYRVSA-N N-formyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC=O PYUSHNKNPOHWEZ-YFKPBYRVSA-N 0.000 description 1
- 102220639488 NTPase KAP family P-loop domain-containing protein 1_M84L_mutation Human genes 0.000 description 1
- MRWXACSTFXYYMV-UHFFFAOYSA-N Nebularine Natural products OC1C(O)C(CO)OC1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 102220500387 Neutral and basic amino acid transport protein rBAT_M41Y_mutation Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- NWUTZAVMDAGNIG-UHFFFAOYSA-N O(4)-methylthymine Chemical compound COC=1NC(=O)N=CC=1C NWUTZAVMDAGNIG-UHFFFAOYSA-N 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 102220499350 Palmitoyl-protein thioesterase 1_I72F_mutation Human genes 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102220470557 Proteasome subunit beta type-3_E27R_mutation Human genes 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102220543895 Protocadherin-10_A35E_mutation Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical group C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical group N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102220576534 Regulatory solute carrier protein family 1 member 1_Q54L_mutation Human genes 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- RJFAYQIBOAGBLC-BYPYZUCNSA-N Selenium-L-methionine Chemical compound C[Se]CC[C@H](N)C(O)=O RJFAYQIBOAGBLC-BYPYZUCNSA-N 0.000 description 1
- RJFAYQIBOAGBLC-UHFFFAOYSA-N Selenomethionine Natural products C[Se]CCC(N)C(O)=O RJFAYQIBOAGBLC-UHFFFAOYSA-N 0.000 description 1
- 102100023645 Sentrin-specific protease 3 Human genes 0.000 description 1
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 229910052771 Terbium Inorganic materials 0.000 description 1
- 241001074959 Thermococci Species 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102220481255 Thymocyte selection-associated high mobility group box protein TOX_Y10A_mutation Human genes 0.000 description 1
- GYDJEQRTZSCIOI-UHFFFAOYSA-N Tranexamic acid Chemical compound NCC1CCC(C(O)=O)CC1 GYDJEQRTZSCIOI-UHFFFAOYSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241000238583 Vargula hilgendorfii Species 0.000 description 1
- HOUJZQLNVOLPOY-FCDQGJHFSA-N [(e)-(3',6'-dihydroxyspiro[2-benzofuran-3,9'-xanthene]-1-ylidene)amino]thiourea Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11O/C(=N/NC(=S)N)C2=CC=CC=C21 HOUJZQLNVOLPOY-FCDQGJHFSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 229940107666 astragalus root Drugs 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 102220355701 c.133C>T Human genes 0.000 description 1
- 102220357893 c.152A>G Human genes 0.000 description 1
- 102220360723 c.251T>C Human genes 0.000 description 1
- 102220359404 c.261G>T Human genes 0.000 description 1
- 102220401482 c.31A>T Human genes 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 125000001951 carbamoylamino group Chemical group C(N)(=O)N* 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003756 cervix mucus Anatomy 0.000 description 1
- VYXSBFYARXAAKO-WTKGSRSZSA-N chembl402140 Chemical compound Cl.C1=2C=C(C)C(NCC)=CC=2OC2=C\C(=N/CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-WTKGSRSZSA-N 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000011855 chromosome organization Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229960000956 coumarin Drugs 0.000 description 1
- 235000001671 coumarin Nutrition 0.000 description 1
- 150000004775 coumarins Chemical class 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000004195 dipotassium inosinate Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- OGPBJKLSAFTDLK-UHFFFAOYSA-N europium atom Chemical compound [Eu] OGPBJKLSAFTDLK-UHFFFAOYSA-N 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000005350 fused silica glass Substances 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001046 green dye Substances 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- SMWDFEZZVXVKRB-UHFFFAOYSA-O hydron;quinoline Chemical compound [NH+]1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-O 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 150000002475 indoles Chemical class 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 229910052747 lanthanoid Inorganic materials 0.000 description 1
- 150000002602 lanthanoids Chemical class 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- UATCLPJEZJKNHE-UHFFFAOYSA-N n-(3',6'-dihydroxy-3-oxospiro[2-benzofuran-1,9'-xanthene]-5-yl)-2-iodoacetamide Chemical compound O1C(=O)C2=CC(NC(=O)CI)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 UATCLPJEZJKNHE-UHFFFAOYSA-N 0.000 description 1
- GWVCIJWBGGVDJJ-UHFFFAOYSA-N n-(4-aminophenyl)sulfonyl-n-(3-methoxypyrazin-2-yl)acetamide Chemical compound COC1=NC=CN=C1N(C(C)=O)S(=O)(=O)C1=CC=C(N)C=C1 GWVCIJWBGGVDJJ-UHFFFAOYSA-N 0.000 description 1
- WIXAQXKQLNRFDF-UHFFFAOYSA-N n-[4-[7-(diethylamino)-4-methyl-2-oxochromen-3-yl]phenyl]-2-iodoacetamide Chemical compound O=C1OC2=CC(N(CC)CC)=CC=C2C(C)=C1C1=CC=C(NC(=O)CI)C=C1 WIXAQXKQLNRFDF-UHFFFAOYSA-N 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- MRWXACSTFXYYMV-FDDDBJFASA-N nebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-FDDDBJFASA-N 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- FDIKHVQUPVCJFA-UHFFFAOYSA-N phosphohistidine Chemical compound OP(=O)(O)NC(C(=O)O)CC1=CN=CN1 FDIKHVQUPVCJFA-UHFFFAOYSA-N 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 108060006184 phycobiliprotein Proteins 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 102000035123 post-translationally modified proteins Human genes 0.000 description 1
- 108091005626 post-translationally modified proteins Proteins 0.000 description 1
- 229910000027 potassium carbonate Inorganic materials 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- JKANAVGODYYCQF-UHFFFAOYSA-N prop-2-yn-1-amine Chemical compound NCC#C JKANAVGODYYCQF-UHFFFAOYSA-N 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 239000011253 protective coating Substances 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- HBCQSNAFLVXVAY-UHFFFAOYSA-N pyrimidine-2-thiol Chemical compound SC1=NC=CC=N1 HBCQSNAFLVXVAY-UHFFFAOYSA-N 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000001044 red dye Substances 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229940043267 rhodamine b Drugs 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102200074797 rs111033564 Human genes 0.000 description 1
- 102200078978 rs121907888 Human genes 0.000 description 1
- 102200115315 rs121918084 Human genes 0.000 description 1
- 102220309550 rs1296437426 Human genes 0.000 description 1
- 102220265708 rs1555054052 Human genes 0.000 description 1
- 102220285590 rs1555055119 Human genes 0.000 description 1
- 102200084466 rs17819126 Human genes 0.000 description 1
- 102220327688 rs200016139 Human genes 0.000 description 1
- 102220046348 rs200632093 Human genes 0.000 description 1
- 102220005406 rs28928875 Human genes 0.000 description 1
- 102220005392 rs34259907 Human genes 0.000 description 1
- 102220036433 rs35389822 Human genes 0.000 description 1
- 102220046361 rs587782865 Human genes 0.000 description 1
- 102200050013 rs59536457 Human genes 0.000 description 1
- 102220058447 rs730882133 Human genes 0.000 description 1
- 102220095193 rs745439506 Human genes 0.000 description 1
- 102220062282 rs750708224 Human genes 0.000 description 1
- 102200153188 rs756928158 Human genes 0.000 description 1
- 102220248953 rs756928158 Human genes 0.000 description 1
- 102220062286 rs786201782 Human genes 0.000 description 1
- 102200078381 rs8179206 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 229960002718 selenomethionine Drugs 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229910000077 silane Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000000661 sodium alginate Substances 0.000 description 1
- 239000001540 sodium lactate Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- GZCRRIHWUXGPOV-UHFFFAOYSA-N terbium atom Chemical compound [Tb] GZCRRIHWUXGPOV-UHFFFAOYSA-N 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229960003087 tioguanine Drugs 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供古菌、原核生物和真核生物聚合酶的工程化变体,相对于野生型聚合酶,所述工程化变体在聚合酶催化的核苷酸延伸反应中表现出增强的热稳定性、增强的3'修饰的核苷酸的掺入和改善的尿嘧啶耐受性。本文还提供工程化聚合酶用于形成复合聚合酶、形成结合复合物和形成三元复合物的用途以及用于进行核酸测序反应的用途。
Description
序列表
本申请含有序列表,所述序列表以电子形式以ASCII格式提交并且以全文引用的方式并入本文。所述ASCII拷贝创建于2022年6月15日,命名为52269WO_CRF_sequencelisting并且大小为2,585,266字节。
相关申请的交叉参考
本申请要求以下美国申请的权益和优先权:2022年3月25日提交的美国申请号17/705,011、2022年3月25日提交的美国申请号17/705,020、2022年3月25日提交的美国申请号17/705,043和2021年6月18日提交的美国临时申请号63/212,540,各案以全文引用的方式并入本文中用于所有目的。
在本申请通篇,参考各种出版物、专利和/或专利申请。所述出版物、专利和/或专利申请的公开内容以全文引用的方式并入本文中,以便更充分地描述本公开所涉及的技术现状。
技术领域
本公开提供突变型聚合酶,其被工程化以具有改善的热稳定性,表现出改善的核苷酸类似物结合和/或改善的核苷酸类似物结合和掺入,以及改善的尿嘧啶耐受性。示例性核苷酸类似物包括含3'链终止部分的核苷酸。与野生型聚合酶相比,所述突变型聚合酶表现出增加的掺入率。
背景技术
下一代测序(NGS)技术已变为获取分子生物学技术、分类学、农业科学、医学诊断和新疗法开发中使用的测序数据的一个强大工具。本公开提供可用于进行采用标记或未标记的链终止核苷酸的任何核酸测序方法的工程化聚合酶,其中所述链终止核苷酸在糖3'位置处包含3'-O-叠氮基(或3'-O-甲基叠氮基)或任何其他类型的大体积封端基团。举例而言,可使用工程化聚合酶,使用标记的多价分子和未标记的链终止核苷酸进行亲合力测序(sequencing-by-avidity,SBA)方法。另外,工程化聚合酶还可用于进行采用标记的链终止核苷酸的合成测序(sequencing-by-synthesis,SBS)方法,以及采用未标记的链终止核苷酸的结合测序(sequencing-by-binding,SBB)方法。
在仅一条DNA链中添加单一核苷酸无法产生容易检测的足够信号。当前可用的SBS技术通过增加核苷酸添加的信号噪声比联合具有足够灵敏度以进行准确碱基判读的检测方法来克服此问题。大部分商业上成功的平台均采用在空间受限的基质中进行的单克隆模板DNA扩增以产生含有查询序列的多个拷贝的分散的DNA岛。此扩增得到DNA拷贝的“群落”,由此使得在所有拷贝上添加单一DNA碱基以足以克服信号噪声比问题的方式集中检测模式。对DNA的多个空间受限的同一拷贝的测序进一步增加对控制性步进机制的依赖性以确保可添加一个且仅一个核苷酸碱基,从而确保DNA群落内的所有拷贝均相对于彼此保持在相同位置(N、N+1、N+2、N+3等)。
执行SBS所需的分子引擎为DNA聚合酶。在体内,此类酶负责DNA复制和维持基因组完整性。在原生条件下,DNA依赖性DNA聚合酶(dDdP)催化沿5'至3'方向将脱氧核苷酸三磷酸酯(dNTP)添加至DNA中,在引物DNA末端的3'羟基与输入核苷酸的5'α磷酸酯之间产生磷酸二酯键。归因于正确输入的dNTP与模板碱基之间的氢键结,此化学反应以高保真度发生而得到正确的沃森-克里克碱基对(Watson-Crick base pair)。此“正确”的碱基配对诱导酶的构形变化,由此对准催化性氨基酸以高效执行磷酸二酯键形成。新添加的dNTP还具有3'OH,其被用于下一轮催化中以进一步延伸DNA链。
为确保在每个SBS循环中仅一个dNTP添加至生长的DNA链,采用可逆地终止的dNTP。这些碱基含有阻断后续数轮掺入的针对dNTP的3'羟基的修饰。商业上最成功的可逆终止剂为3'甲基叠氮基,但还已使用其他终止剂,包括3'氨基烯丙基和3'氧胺。这些可逆终止的dNTP各自以相同方式起作用;一旦掺入,大体积的3'嵌段会因无3'羟基存在而抑制下一个核苷酸的添加。当暴露于催化剂时,3'嵌段反应而再生3'羟基,所述羟基能够在下一循环期间形成新磷酸二酯键。尽管有效,但这些大体积的3'修饰为聚合酶提出一个难题。
对于高保真度基因组复制和稳定性的进化需求使得聚合酶在每104-107个掺入事件中仅掺入一个非沃森-克里克碱基对。聚合酶通常还需要判别细胞环境中大量过量的核苷酸。核苷酸之间的判别通常经由空间闸(steric gate)进行,在此情况下,2'羟基的存在会在空间上与核苷酸结合位点处的氨基酸侧链发生冲突,由此选择对抗核苷酸结合和催化。另外,由于含有非活性3'羟基的碱基可充当抑制DNA合成的链终止剂,因此对核苷酸3'羟基的破坏或修饰也被所述酶感测到。这些不想要的碱基的判别经由动力学路径发生,其中不正确的核苷酸底物以较弱的总体亲和力结合且磷酸二酯键以变慢102-104个数量级的速率形成。发生此情况是因为缺少适当地对准催化性氨基酸以形成键的诱导拟合。因此,自然进化的聚合酶极少掺入可逆链终止剂核苷酸。
发明内容
本公开提供突变型聚合酶,其被工程化以具有改善的热稳定性,表现出改善的核苷酸类似物结合和/或改善的核苷酸类似物结合和掺入,以及改善的尿嘧啶耐受性。所述工程化聚合酶可以用于多种情况并且可具有各种特征,下文将更详细地描述。
本公开提供结合复合物(例如三元复合物),其各自包含核苷酸。本公开提供多个三元复合物,其各自包含:与核酸双链体结合的突变型或野生型DNA聚合酶和核苷酸,其中所述核酸双链体包含与核酸引物杂交的核酸模板分子,其中在所述三元复合物中,所述核苷酸结合至所述核酸引物的3'端与所述核酸模板分子中的互补核苷酸相对的位置处。在一些实施方案中,在所述三元复合物中,所述核苷酸结合至所述核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至所述核酸双链体并且已经历聚合酶催化的掺入。在一些实施方案中,野生型DNA聚合酶包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,突变型DNA聚合酶包含与SEQ ID NO:1具有至少85%同一性的氨基酸序列。
在一些实施方案中,突变型DNA聚合酶来自候选深层古细菌目(CandidatusAltiarchaeales)古菌并且包含SEQ ID NO:2-274或288-375或和385-397中的任一者的氨基酸序列。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A(Asp141Ala和Glu143Ala)。在一些实施方案中,所述三元复合物保持稳定并且突变型或野生型聚合酶不会从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。在一些实施方案中,所述多个三元复合物还包含多个非催化性二价阳离子或多个催化性二价阳离子。在一些实施方案中,所述多个非催化性二价阳离子包括锶、钡和/或钙。在一些实施方案中,催化性二价阳离子包括镁和/或锰。
在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含与SEQ IDNO:1、393或391具有至少85%序列同一性、至少90%序列同一性、或至少95%序列同一性、或至少96%序列同一性、或至少97%序列同一性、或至少98%序列同一性、或至少99%序列同一性、或至少99.1%序列同一性、或至少99.2%序列同一性、或至少99.3%序列同一性、或至少99.4%序列同一性、或至少99.5%序列同一性、或至少99.6%序列同一性、或至少99.7%序列同一性、或至少99.8%序列同一性、或更高百分比序列同一性的氨基酸序列,其中所述突变型DNA聚合酶包含在选自由以下组成的组的任一位置或两个或更多个位置的任何组合处的氨基酸取代:Leu416、Tyr417、Pro418、Ala493、Arg515、Ile529和Asn567。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A,其可赋予无外切核酸酶活性。在一些实施方案中,与具有野生型氨基酸主链序列(例如SEQ ID NO:1或391)的聚合酶相比,突变型聚合酶表现出所希望的特征。举例而言,突变型聚合酶表现出增加的热稳定性(Tm)。在另一实例中,突变型聚合酶表现出增加的在糖2'位置处和/或在3'糖位置处包含链终止部分(例如封端部分)的核苷酸类似物的掺入率。在另一实例中,突变型聚合酶表现出增加的尿嘧啶耐受性。本段中所描述的一个或多个特征可出现在本公开所描述的各个实施方案中的任何示例突变型聚合酶中。本段中所描述的特征在本公开通篇称为“示例突变型聚合酶特征”。
在一些实施方案中,在包含核苷酸的三元复合物中,多个固定的复合聚合酶包含具有相同的感兴趣靶序列或不同的感兴趣靶序列的核酸模板分子。
在一些实施方案中,在包含核苷酸的三元复合物中,所述核苷酸包含芳族碱基、五碳糖和1-10个磷酸酯基,其中所述核苷酸的芳族碱基包含腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。核苷酸包含dATP、dGTP、dCTP、dTTP或dUTP。核苷酸可用荧光团标记。核苷酸可没有荧光团。
在一些实施方案中,在包含核苷酸的三元复合物中,所述核苷酸包含链终止部分。在一些实施方案中,链终止部分可经由可裂解部分附接至3'-OH糖位置。在一些实施方案中,链终止部分可在引物延伸反应期间抑制聚合酶催化的新生链中后续核苷酸单元或游离核苷酸的掺入。在一些实施方案中,链终止部分附接至3'糖羟基位置,其中所述糖包含核糖或脱氧核糖糖部分。在一些实施方案中,链终止部分可从3'糖羟基位置移除/裂解以产生具有3'OH糖基团的核苷酸,其可在聚合酶催化的核苷酸掺入反应中以后续核苷酸延伸。在一些实施方案中,链终止部分包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基。在一些实施方案中:链终止部分烷基、烯基、炔基和烯丙基可用四(三苯基膦)钯(0)(Pd(PPh3)4)、用哌啶或用2,3-二氯-5,6-二氰基-1,4-苯醌(DDQ)裂解/移除;链终止部分芳基和苯甲基可用H2 Pd/C裂解/移除;链终止部分胺、酰胺、酮基、异氰酸酯、磷酸酯、硫基、二硫化物可用硫醇试剂裂解/移除,所述试剂包括β-巯基乙醇或二硫苏糖醇(DTT);链终止部分胺、酰胺、酮基、异氰酸酯、磷酸酯、硫基、二硫化物可用膦试剂裂解/移除,所述试剂包括三(2-羧基乙基)膦(TCEP)、双磺基三苯基膦(BS-TPP)或三(羟基丙基)膦(THPP);链终止部分胺、酰胺、酮基、异氰酸酯、磷酸酯、硫基、二硫化物可用4-二甲氨基吡啶(4-DMAP)裂解/移除;链终止部分碳酸酯可用在MeOH中的碳酸钾(K2CO3)、用在吡啶中的三乙胺或用在乙酸(AcOH)中的锌裂解/移除;并且链终止部分脲和甲硅烷基可用氟化四丁铵、吡啶-HF、用氟化铵或用三氢氟化三乙胺裂解。在一些实施方案中,链终止部分可用亚硝酸裂解。在一些实施方案中,链终止部分可使用包含亚硝酸盐,诸如包含亚硝酸盐与酸(诸如乙酸、硫酸或硝酸)的组合的溶液裂解。在一些其他实施方案中,所述溶液可包含有机酸。本段中所描述的一个或多个特征可出现在本公开所描述的各个实施方案中的任何示例链终止部分中。本段中所描述的特征在本公开通篇称为“链终止部分实施方案”。
在一些实施方案中,在包含核苷酸的三元复合物中,所述核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分,并且其中所述链终止部分包含叠氮化物、叠氮基或叠氮基甲基。举例而言,在一些实施方案中,链终止部分包含3'-O-叠氮基或3'-O-叠氮基甲基。在一些实施方案中:链终止部分叠氮化物、叠氮基和叠氮基甲基可用膦化合物裂解/移除,所述膦化合物包含衍生化的三烷基膦部分、衍生化的三芳基膦部分、三(2-羧基乙基)膦(TCEP)、双磺基三苯基膦(BS-TPP)或三(羟基丙基)膦(THPP);并且链终止部分叠氮化物、叠氮基和叠氮基甲基可用4-二甲氨基吡啶(4-DMAP)裂解/移除。在一些实施方案中,在所述系统中,核苷酸类似物包含链终止部分,所述链终止部分选自由以下组成的组:3'-脱氧核苷酸、2',3'-双脱氧核苷酸、3'-甲基、3'-叠氮基、3'-叠氮基甲基、3'-O-叠氮基烷基、3'-O-乙炔基、3'-O-氨基烷基、3'-O-氟烷基、3'-氟甲基、3'-二氟甲基、3'-三氟甲基、3'-磺酰基、3'-丙二酰基、3'-氨基、3'-O-氨基、3'-巯基、3'-氨基甲基、3'-乙基、3'丁基、3'-叔丁基、3'-芴基甲氧基羰基、3'叔丁氧基羰基、3'-O-烷基羟氨基、3'-硫代磷酸酯和3-O-苯甲基或其衍生物。在一些实施方案中,包含3'-O-氨基、3'-O-氨基甲基、3'-O-甲基氨基或其衍生物中的一者或多者的链终止部分可用亚硝酸,经由利用亚硝酸或使用包含亚硝酸的溶液的机制裂解。在一些实施方案中,包含3'-O-氨基、3'-O-氨基甲基、3'-O-甲基氨基或其衍生物中的一者或多者的链终止部分可使用包含亚硝酸盐的溶液裂解。在一些实施方案中,例如,亚硝酸盐可与酸组合或与酸接触,所述酸诸如为乙酸、硫酸或硝酸。在一些其他实施方案中,例如,亚硝酸盐可与有机酸组合或与有机酸接触,所述有机酸诸如为甲酸、乙酸、丙酸、丁酸、异丁酸或类似物。当提及所述群组的子集时,此短语还可陈述为“包含叠氮化物的链终止部分”或“包含叠氮基的链终止部分”或“包含叠氮基甲基的链终止部分”,而且仍可包括本段中所列的实施方案。短语“链终止部分包含叠氮化物、叠氮基或叠氮基甲基”在本公开通篇用于指本段中所描述的一个或多个链终止部分特征中的任一者。
在一些实施方案中,在包含核苷酸的三元复合物中,野生型或突变型DNA聚合酶可被或可不被荧光标记。在一些实施方案中,野生型或突变型DNA聚合酶包含荧光标记的DNA聚合酶。在一些实施方案中,野生型或突变型DNA聚合酶没有荧光团。在一些实施方案中,DNA聚合酶包含荧光标记的DNA聚合酶并且核苷酸没有荧光团。在一些实施方案中,DNA聚合酶没有荧光团并且核苷酸包含荧光标记的核苷酸。在一些实施方案中,DNA聚合酶包含荧光标记的DNA聚合酶并且核苷酸包含荧光标记的核苷酸。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例荧光团分子中。本段中所描述的特征在本公开通篇称为“荧光团实施方案”。
在一些实施方案中,在包含核苷酸的三元复合物,核酸模板分子可呈各种形式。举例而言,核酸模板分子包含线性核酸分子、或环形核酸分子、或线性核酸分子与环形核酸分子的混合物。在一些实施方案中,核酸模板分子包含克隆扩增的模板分子。在一些实施方案中,核酸模板分子包含感兴趣靶序列的一个拷贝。在一些实施方案中,多个核酸模板分子中的核酸模板分子包含相同的感兴趣靶序列或不同的感兴趣靶序列。在一些实施方案中,核酸模板分子包含感兴趣靶序列的两个或更多个串联拷贝(例如多联体)。在一些实施方案中,核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何核酸模板中。本段中所描述的特征在本公开通篇称为“核酸模板实施方案”。
在一些实施方案中,在包含核苷酸的三元复合物中,多个三元复合物被固定。举例而言,三元复合物可固定至支撑物或固定至支撑物上的涂层。在一些实施方案中,支撑物上的涂层包含至少一个亲水性聚合物涂层,其包含具有至少4个分支的分支聚乙二醇(PEG),并且其中所述涂层具有不超过45度的水接触角(water contact angle)。在一些实施方案中,支撑物包括经由支撑物上的化学基团至少共价结合至支撑物的一部分的官能化聚合物涂层、移植至官能化聚合物涂层上的寡核苷酸引物以及在所述引物和所述官能化聚合物涂层上的水溶性保护涂层。在一些实施方案中,固定至支撑物的多个三元复合物的密度为102-106个/平方毫米。在一些实施方案中,多个三元复合物固定至支撑物上的预定位点。在一些实施方案中,多个三元复合物固定至支撑物上的随机位点。在一些实施方案中,多个固定的三元复合物彼此流体连通以允许试剂溶液流动至支撑物上,由此使所述多个固定的三元复合物与试剂溶液以大规模平行方式反应,并且其中所述试剂包含可溶性引物、DNA聚合酶、核苷酸、二价阳离子和/或缓冲剂。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例三元复合物中。本段中所描述的特征在本公开通篇称为“固定实施方案”。
本公开提供多个结合复合物(例如多个三元复合物),其各自包含多价分子。包含多价分子的多个结合复合物或三元复合物可包括以上关于结合复合物或三元复合物所描述的所述特征中的任一者。在一些实施方案中,在包含多价分子的三元复合物中可呈各种形式。举例而言,在包含多价分子的三元复合物中,多个多价分子中的个别多价分子可包含(a)核心;和(b)多个核苷酸臂,其包含(i)核心附接部分、(ii)包含PEG部分之间隔区、(iii)接头和(iv)核苷酸单元,其中所述核心经由其核心附接部分附接至所述多个核苷酸臂,其中所述间隔区附接至所述接头,并且其中所述接头附接至所述核苷酸单元。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分并且核心附接部分包含生物素。在一些实施方案中,所述接头包含具有2-6个亚基的脂族链或具有2-6个亚基的寡聚乙二醇链。在一些实施方案中,接头还包含芳族部分。示例性间隔区示出于图16A(顶图)中,并且示例性接头示出于图16A(底图)和图16B中。示例性核苷酸臂示出于图15B中。示例性多价分子示出于图14A、图14B和图15A中。在一些实施方案中,核苷酸单元包含芳族碱基、五碳糖和1-10个磷酸酯基。在一些实施方案中,接头经由碱基附接至核苷酸单元。在一些实施方案中,附接至核心的多个核苷酸臂具有相同类型的核苷酸单元,并且其中所述类型的核苷酸单元选自由以下组成的组:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个多价分子包含一种类型的多价分子,其中所述多个多价分子中的各多价分子具有选自由以下组成的组的相同类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个多价分子包含两种或更多种类型的多价分子的任何组合的混合物,各类型具有选自由以下组成的组的核苷酸单元:dATP、dGTP、dCTP、dTTP和/或dUTP。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例多价分子中。本段中所描述的特征在本公开通篇称为“多价分子实施方案”。
在一些实施方案中,在包含多价分子的三元复合物中,所述多个多价分子包含荧光标记的多价分子。在一些实施方案中,个别荧光标记的多价分子的核心附接至荧光团,其对应于附接至给定多价分子中的核苷酸臂的核苷酸单元。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。在一些实施方案中,多价分子没有荧光团。
在一些实施方案中,在包含多价分子的三元复合物中,多个多价分子中的至少一个多价分子包含具有链终止部分的核苷酸单元,所述链终止部分经由可裂解部分附接至3'-OH糖位置,并且可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在包含多价分子的三元复合物中,野生型或突变型DNA聚合酶可被或可不被荧光标记。在一些实施方案中,野生型或突变型DNA聚合酶可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在包含多价分子的三元复合物中,核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在包含多价分子的三元复合物中,所述多价分子可根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在包含多价分子的三元复合物中,所述多个三元复合物包含至少第一三元复合物和第二三元复合物,其具有单一多价分子,所述单一多价分子结合至所述第一三元复合物和所述第二三元复合物而形成第一亲合力复合物。在一些实施方案中,第一三元复合物包含结合至与多联体模板分子的第一部分杂交的第一引物的第一DNA聚合酶(例如第一突变型或野生型DNA聚合酶)并且单一多价分子的第一核苷酸单元结合至所述第一引物,由此形成第一三元复合物。在一些实施方案中,第二三元复合物包含结合至与同一多联体模板分子的第二部分杂交的第二引物的第二DNA聚合酶(例如第二突变型或野生型DNA聚合酶)并且单一多价分子的第二核苷酸单元结合至所述第二引物,由此形成第二三元复合物。结合至多价分子的第一三元复合物和第二三元复合物形成第一亲合力复合物。在一些实施方案中,所述第一三元复合物和/或第二三元复合物在不解离情况下保持稳定超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在包含多价分子的三元复合物中,第一亲合力复合物还包含至少第三三元复合物和第四三元复合物,其中单一多价分子结合至所述第一三元复合物、第二三元复合物、第三三元复合物和第四三元复合物。在一些实施方案中,第三三元复合物包含结合至与多联体模板分子的第三部分杂交的第三引物的第三DNA聚合酶(例如第三突变型或野生型DNA聚合酶)并且单一多价分子的第三核苷酸单元结合至所述第三引物,由此形成第三三元复合物。在一些实施方案中,第四三元复合物包含结合至与同一多联体模板分子的第四部分杂交的第四引物的第四DNA聚合酶(例如第四突变型或野生型DNA聚合酶)并且单一多价分子的第四核苷酸单元结合至所述第四引物,由此形成第四三元复合物。在一些实施方案中,结合至多价分子的第一三元复合物、第二三元复合物和第三三元复合物形成第一亲合力复合物。在一些实施方案中,结合至多价分子的第一三元复合物、第二三元复合物、第三三元复合物和第四三元复合物形成第一亲合力复合物。在一些实施方案中,所述第三三元复合物和/或第四三元复合物在不解离情况下保持稳定超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
本公开提供核酸测序方法,所述方法采用来自候选深层古细菌目古菌的DNA聚合酶形成包含核苷酸的结合复合物(例如三元复合物)。本公开提供用于核酸测序的方法,其包括:(a)使(i)多个野生型或突变型DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个复合聚合酶的条件下进行,所述多个复合聚合酶各自包含与核酸双链体结合的野生型或突变型DNA聚合酶,其中所述多个野生型DNA聚合酶包含与SEQ ID NO:1具有100%同一性的氨基酸序列,或其中所述多个突变型DNA聚合酶包含与SEQ ID NO:1具有至少85%同一性(例如与SEQ ID NO:2-274或288-375或385-397的氨基酸序列中的任一者具有至少85%同一性)的氨基酸序列;(b)使所述多个复合聚合酶与(iii)多个核苷酸和(iv)多个催化性二价阳离子接触,其中所述接触在适用于形成多个三元复合物的条件下进行,所述多个三元复合物各自包含与核酸双链体结合的野生型或突变型DNA聚合酶和核苷酸,其中在所述三元复合物中,所述核苷酸结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述条件适用于促进聚合酶催化的与核酸引物3'端结合的核苷酸的掺入;以及(c)检测所述多个三元复合物;以及(d)鉴别所述多个三元复合物中的多个掺入的核苷酸。在一些实施方案中,在步骤(b)的个别三元复合物中,所述核苷酸结合至所述核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至所述核酸双链体并且已经历聚合酶催化的掺入。在一些实施方案中,所述三元复合物保持稳定并且突变型或野生型聚合酶不会从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。在一些实施方案中,催化性二价阳离子包括镁和/或锰。在一些实施方案中,多个复合聚合酶包含具有相同的感兴趣靶序列或不同的感兴趣靶序列的核酸模板分子。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A。
在一些实施方案中,在采用包含核苷酸的三元复合物的核酸测序方法中,所述方法包括:(a)使(i)多个野生型或突变型DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个复合聚合酶的条件下进行,所述多个复合聚合酶各自包含与核酸双链体结合的野生型或突变型DNA聚合酶,其中所述多个野生型DNA聚合酶包含与SEQ ID NO:1具有100%同一性的氨基酸序列,或其中所述多个突变型DNA聚合酶包含与SEQ ID NO:2-274或288-375或385-397具有至少85%同一性的氨基酸序列;(b)使所述多个复合聚合酶与(iii)多个核苷酸和(iv)多个非催化性二价阳离子接触,其中所述接触在适用于形成多个三元复合物的条件下进行,所述多个三元复合物各自包含与核酸双链体结合的野生型或突变型DNA聚合酶和核苷酸,其中在所述三元复合物中,所述核苷酸结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述条件适用于抑制聚合酶催化的与核酸引物3'端结合的核苷酸的掺入;以及(c)检测所述多个三元复合物;以及(d)鉴别所述多个三元复合物中的多个结合的核苷酸。在一些实施方案中,非催化性二价阳离子包括锶、钡和/或钙。在一些实施方案中,多个复合聚合酶包含具有相同的感兴趣靶序列或不同的感兴趣靶序列的核酸模板分子。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A。
在一些实施方案中,在采用可包含核苷酸单元的三元复合物的核酸测序方法中。核苷酸单元可包含芳族碱基、五碳糖(例如核糖或脱氧核糖)和一个或多个磷酸酯基(例如1-10个磷酸酯基),其中所述核苷酸的芳族碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。在一些实施方案中,所述多个核苷酸包含选自由以下组成的组的一种类型的核苷酸:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个核苷酸包含选自由以下组成的组的两种或更多种类型的核苷酸的任何组合的混合物:dATP、dGTP、dCTP、dTTP和/或dUTP。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸用荧光团标记。在一些实施方案中,所述多个核苷酸没有荧光团标记。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例核苷酸单元中。本段中所描述的特征在本公开通篇称为“示例核苷酸单元特征”。
在一些实施方案中,在采用包含核苷酸的三元复合物的核酸测序方法中,所述多个DNA聚合酶可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,所述多个DNA聚合酶包含多个核苷酸。
在一些实施方案中,在采用包含核苷酸的三元复合物的核酸测序方法中,所述多个核苷酸中的至少一个核苷酸包含链终止部分,所述链终止部分可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用包含核苷酸的三元复合物的核酸测序方法中,所述多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用包含核苷酸的三元复合物的核酸测序方法中,所述三元复合物可根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供采用包含多价分子的结合复合物(例如三元复合物)的核酸测序方法。本公开提供用于核酸测序的方法,其包括:(a)使(i)多个野生型或突变型DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个复合聚合酶的条件下进行,所述多个复合聚合酶各自包含与核酸双链体结合的突变型DNA聚合酶,其中所述多个野生型DNA聚合酶包含与SEQ ID NO:1具有100%同一性的氨基酸序列,或其中所述多个突变型DNA聚合酶包含与SEQ ID NO:1具有至少85%同一性(例如与SEQ ID NO:2-274或288-375或385-397的氨基酸序列中的任一者具有至少85%同一性)的氨基酸序列;(b)使所述多个复合聚合酶与(iii)多个多价分子和(iv)多个非催化性二价阳离子接触,其中所述多个多价分子各自包含附接至多个核苷酸臂的核心,其中各核苷酸臂包含核苷酸单元,其中所述接触在适用于形成多个三元复合物的条件下进行,所述多个三元复合物各自包含与核酸双链体结合的突变型DNA聚合酶和多价分子,其中在所述三元复合物中,所述多价分子的一个核苷酸单元结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,其中所述多个三元错合物在不解离情况下保持稳定超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间,并且其中所述接触在适用于抑制聚合酶催化的所述多价分子的结合的核苷酸单元的掺入的条件下进行;(c)检测所述多个三元复合物;以及(d)鉴别所述多个三元复合物中与核酸引物的3'端结合的多个核苷酸单元,由此确定所述多个核酸模板分子的序列。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A。
在另一实例中,突变型聚合酶表现出上文所论述的示例突变型聚合酶特征中的一个或多个特征。替代地或另外地,突变型聚合酶表现出增加的尿嘧啶耐受性(例如SEQ IDNO:361、362、363、364、366、367、374或375中的任一者,或SEQ ID NO:385-397中的任一者)。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述三元复合物保持稳定且突变型或野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。在一些实施方案中,所述多个非催化性二价阳离子包括锶、钡和/或钙。在一些实施方案中,多个复合聚合酶包含具有相同的感兴趣靶序列或不同的感兴趣靶序列的核酸模板分子。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,在所述三元复合物中,多价分子的核苷酸单元结合至核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸单元结合至核酸双链体并且已经历聚合酶催化的掺入。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述方法还包括形成亲合力复合物,其包括以下步骤:(1)使多个野生型或突变型DNA聚合酶和多个核酸引物与多联体核酸模板分子的不同部分接触以在同一多联体模板分子上形成至少第一复合聚合酶和第二复合聚合酶;(2)使多个多价分子与在同一多联体模板分子上的至少第一复合聚合酶和第二复合聚合酶在适用于使来自多个多价分子的单一多价分子与所述第一复合聚合酶和第二复合聚合酶结合的条件下接触,其中所述单一多价分子的至少第一核苷酸单元结合至包含与多联体模板分子的第一部分杂交的第一引物的第一复合聚合酶,由此形成第一三元复合物,并且其中所述单一多价分子的至少第二核苷酸单元结合至包含与多联体模板分子的第二部分杂交的第二引物的第二复合聚合酶,由此形成第二三元复合物,并且其中所述接触在适用于抑制聚合酶催化的所述第一三元复合物和所述第二三元复合物中结合的第一核苷酸单元和第二核苷酸单元掺入的条件下进行,并且其中结合至同一多价分子的第一三元复合物和第二三元复合物形成亲合力复合物;以及(3)检测在同一多联体模板分子上的所述第一三元复合物和第二三元复合物;以及(4)鉴别所述第一三元复合物中的第一核苷酸单元,由此确定所述多联体模板分子的第一部分的序列,并鉴别所述第二三元复合物中的第二核苷酸单元,由此确定所述多联体模板分子的第二部分的序列。在一些实施方案中,在用于形成亲合力复合物的方法中,步骤(4)的鉴别包括:鉴别第一三元复合物中与第一引物的3'端结合的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二三元复合物中与第二引物的3'端结合的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述多价分子可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述多价分子可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,个别多价分子的核心附接至核苷酸单元,所述核苷酸单元附接至核苷酸臂,可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,多个多价分子中的至少一个多价分子包含具有链终止部分的核苷酸单元,所述链终止部分经由可裂解部分附接至3'-OH糖位置,并且可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,多个DNA聚合酶包含荧光标记的DNA聚合酶。在一些实施方案中,所述多个DNA聚合酶没有荧光团。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用包含多价分子的三元复合物的核酸测序方法中,所述多价分子可根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供两阶段核酸测序方法,所述方法采用来自候选深层古细菌目古菌的聚合酶、多价分子和核苷酸。本公开提供用于核酸测序的方法,其包括:(a)使(i)多个第一野生型或突变型DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个第一复合聚合酶的条件下进行,所述多个第一复合聚合酶各自包含与核酸双链体结合的第一野生型或突变型DNA聚合酶,其中所述多个第一野生型DNA聚合酶包含与SEQ ID NO:1具有100%同一性的氨基酸序列,或其中多个第一突变型DNA聚合酶包含与SEQ ID NO:1具有至少85%同一性(例如与SEQID NO:2-274或288-375或385-397的氨基酸序列中的任一者具有至少85%同一性)的氨基酸序列;(b)使所述多个第一复合聚合酶与(iii)多个多价分子和(iv)多个非催化性二价阳离子接触,其中所述多个多价分子各自包含附接至多个核苷酸臂的核心并且其中各核苷酸臂包含核苷酸单元,其中所述接触在适用于形成多个第一三元复合物的条件下进行,所述多个第一三元复合物各自包含与核酸双链体结合的第一野生型或突变型DNA聚合酶和多价分子,其中在第一三元复合物中,多价分子的核苷酸单元结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述接触在适用于抑制聚合酶催化的多价分子的结合的核苷酸单元掺入的条件下进行;(c)检测所述多个第一三元复合物并鉴别与核酸引物的3'端结合的核苷酸单元,由此确定核酸模板分子的序列;(d)通过移除多个第一野生型或突变型聚合酶和多个多价分子并保留多个核酸双链体来解离多个第一三元复合物;(e)使步骤(d)保留的核酸双链体与(i)多个第二野生型或突变型DNA聚合酶、(ii)多个核苷酸和(iii)多个催化性二价阳离子接触,其中所述多个第二野生型DNA聚合酶包含与SEQ IDNO:1具有100%同一性的氨基酸序列,或其中所述多个第二突变型DNA聚合酶包含与SEQ IDNO:1具有至少85%同一性(例如与SEQ ID NO:2-274或288-375或385-397的氨基酸序列中的任一者具有至少85%同一性)的氨基酸序列,其中步骤(e)的接触在适用于形成多个第二三元复合物的条件下进行,所述多个第二三元复合物各自包含与步骤(d)保留的核酸双链体结合的第二野生型或突变型DNA聚合酶和核苷酸,其中在所述第二三元复合物中,核苷酸结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述条件适用于促进聚合酶催化的与核酸引物3'端结合的核苷酸的掺入;以及(f)检测所述多个第二三元复合物并鉴别所述第二三元复合物中掺入的核苷酸。在一些实施方案中,步骤(f)的检测为任选的。在一些实施方案中,步骤(f)的鉴别为任选的。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A。
在一些实施方案中,在采用来自候选深层古细菌目古菌的两阶段核酸测序方法中,在第一三元复合物中,多价分子的核苷酸单元结合至核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸单元结合至核酸双链体并且已经历聚合酶催化的掺入。在一些实施方案中,在第二三元复合物中,所述核苷酸结合至所述核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至所述核酸双链体并且已经历聚合酶催化的掺入。
在一些实施方案中,在采用来自候选深层古细菌目古菌的两阶段核酸测序方法中,第一突变型DNA聚合酶包含上文所列的一个或多个特征以及示例突变型聚合酶特征。在另一实例中,第一突变型聚合酶表现出增加的尿嘧啶耐受性(例如SEQ ID NO:361、362、363、364、366、367、374或375中的任一者,或SEQ ID NO:385-397中的任一者)。
在一些实施方案中,第一野生型或突变型DNA聚合酶包含荧光标记的DNA聚合酶。在一些实施方案中,第一野生型或突变型DNA聚合酶没有荧光团。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,第二突变型DNA聚合酶包含上文所列的一个或多个特征以及示例突变型聚合酶特征。在另一实例中,第二突变型聚合酶表现出增加的尿嘧啶耐受性(例如SEQ ID NO:361、362、363、364、366、367、374或375中的任一者,或SEQ ID NO:385-397中的任一者)。
在一些实施方案中,第二野生型或突变型DNA聚合酶包含荧光标记的DNA聚合酶。在一些实施方案中,第二突变型DNA聚合酶没有荧光团。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,步骤(b)中的多个非催化性二价阳离子包括锶、钡和/或钙。在一些实施方案中,步骤(e)中的多个催化性二价阳离子包括镁和/或锰。在一些实施方案中,步骤(b)中的多个第一三元复合物保持稳定并且突变型野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。在一些实施方案中,步骤(e)中的多个第二三元复合物保持稳定并且突变型野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法还包括:(g)移除多个第二野生型或突变型DNA聚合酶并保留步骤(f)的多个核酸双链体;(h)使步骤(g)保留的核酸双链体与多个第一野生型或突变型DNA聚合酶、多个多价分子和多个非催化性二价阳离子接触,其中所述接触在适用于形成另一多个第一三元复合物的条件下进行,并且其中所述接触在适用于抑制聚合酶催化的多价分子的结合的核苷酸单元掺入的条件下进行;(i)检测步骤(h)中形成的多个第一三元复合物并鉴别与核酸引物3'端结合的核苷酸单元,由此确定核酸模板分子的序列;(j)通过移除多个第一野生型或突变型聚合酶和多个多价分子并保留多个核酸双链体,将步骤(h)中形成的多个第一三元复合物解离;(k)使步骤(j)的多个保留的核酸双链体与多个第二野生型或突变型DNA聚合酶、多个核苷酸和多个催化性二价阳离子接触,其中所述接触在适用于形成另一多个第二三元复合物的条件下进行,并且其中所述条件适用于促进聚合酶催化的与核酸引物3'端结合的核苷酸掺入;(l)检测步骤(k)中形成的多个第二三元复合物并鉴别所述第二三元复合物中多个掺入的核苷酸;以及(m)重复步骤(g)-(l)至少一次。在一些实施方案中,步骤(l)的检测为任选的。在一些实施方案中,步骤(l)的鉴别为任选的。在一些实施方案中,步骤(h)中的多个第一三元复合物保持稳定并且突变型或野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。在一些实施方案中,步骤(k)中的多个第二三元复合物保持稳定并且突变型或野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,非催化性二价阳离子包括锶、钡和/或钙,并且催化性二价阳离子包括镁或锰。
在一些实施方案中,采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法还包括形成亲合力复合物,其包括以下步骤:(1)使多个野生型或突变型DNA聚合酶和多个核酸引物与多联体核酸模板分子的不同部分接触以在同一多联体模板分子上形成至少第一复合聚合酶和第二复合聚合酶;(2)使多个多价分子与在同一多联体模板分子上的至少第一复合聚合酶和第二复合聚合酶在适用于使来自多个多价分子的单一多价分子与所述第一复合聚合酶和第二复合聚合酶结合的条件下接触,其中所述单一多价分子的至少第一核苷酸单元结合至包含与多联体模板分子的第一部分杂交的第一引物的第一复合聚合酶,由此形成第一多联体-三元复合物,并且其中所述单一多价分子的至少第二核苷酸单元结合至包含与多联体模板分子的第二部分杂交的第二引物的第二复合聚合酶,由此形成第二多联体-三元复合物,并且其中所述接触在适用于抑制聚合酶催化的所述第一多联体-三元复合物和所述第二多联体-三元复合物中结合的第一核苷酸单元和第二核苷酸单元掺入的条件下进行,并且其中结合至同一多价分子的第一多联体-三元复合物和第二多联体-三元复合物形成亲合力复合物;(3)检测在同一多联体模板分子上的所述第一多联体-三元复合物和第二多联体-三元复合物;以及(4)鉴别所述第一多联体-三元复合物中的第一核苷酸单元,由此确定所述多联体模板分子的第一部分的序列,并鉴别所述第二多联体-三元复合物中的第二核苷酸单元,由此确定所述多联体模板分子的第二部分的序列。在一些实施方案中,步骤(4)的鉴别包括:鉴别第一多联体-三元复合物中与第一引物的3'端结合的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二多联体-三元复合物中与第二引物的3'端结合的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,可存在多价分子,所述多价分子可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,多价分子没有荧光团。在一些实施方案中,多价分子用荧光团标记。在一些实施方案中,步骤(b)的多个多价分子为荧光标记的多价分子,并且步骤(c)包含检测来自多个第一三元复合物的荧光信号并鉴别与核酸引物的3'端结合的核苷酸单元,由此确定核酸模板分子的序列。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,多价分子的至少一个核苷酸单元包含经由可裂解部分附接至3'-OH糖位置的链终止部分,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,步骤(e)和/或(k)的核苷酸包含核苷酸单元,所述核苷酸单元包括如上文所论述的一个或多个示例核苷酸单元特征。在一些实施方案中,步骤(e)的多个核苷酸没有荧光团。在一些实施方案中,步骤(e)的多个核苷酸中的至少一个核苷酸用荧光团标记。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,步骤(e)和/或(k)的多个核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,步骤(e)中的多个核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分,并且步骤(f)还包括使掺入核酸引物中的链终止核苷酸与裂解剂接触以移除链终止部分,由此产生多个具有3'可延伸端的核酸引物。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,多个第二野生型或突变型DNA聚合酶可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,所述多个第二野生型或突变型DNA聚合酶包含多个核苷酸,所述多个核苷酸可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中包括核酸模板分子,其可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用来自候选深层古细菌目古菌的聚合酶的两阶段核酸测序方法中,多个第一复合聚合酶根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供重组突变型9°N DNA聚合酶。如本说明书内所使用,“重组突变型9°NDNA”可包括本段和以下段落中所描述的特征中的任一者。举例而言,重组突变型9°N DNA聚合酶可包含:SEQ ID NO:280或281或282的主链氨基酸序列并且具有包括以下的至少一个氨基酸取代突变或两个或更多个氨基酸取代突变的任何组合:(1)在位置408处的亮氨酸(L)被丝氨酸(S)、苯丙氨酸(F)、酪氨酸(Y)、缬氨酸(V)、甘氨酸(G)、苏氨酸(T)、丙氨酸(A)、异亮氨酸(I)、苯丙氨酸(F)或甲硫氨酸(M)取代;(2)在位置409处的酪氨酸(Y)被丙氨酸(A)、苏氨酸(T)、丝氨酸(S)、甘氨酸(G)、缬氨酸(V)、异亮氨酸(I)或酪氨酸(Y)取代;(3)在位置410处的脯氨酸(P)被甘氨酸(G)、丝氨酸(S)、缬氨酸(V)、半胱氨酸(C)、赖氨酸(K)、异亮氨酸(I)、苏氨酸(T)或丙氨酸(A)取代;(4)在位置485处的丙氨酸(A)被丝氨酸(S)或缬氨酸(V)取代;(5)在位置492处的丝氨酸(S)被甘氨酸(G)取代;(6)在位置507处的赖氨酸(K)被亮氨酸(L)、色氨酸(W)、酪氨酸(Y)、脯氨酸(P)或苯丙氨酸(F)取代;(7)在位置521处的异亮氨酸被组氨酸(H)、苏氨酸(T)、缬氨酸(V)、丝氨酸(S)、甘氨酸(G)、丙氨酸(A)、亮氨酸(L)或苯丙氨酸(F)取代;和/或(8)在位置559处的赖氨酸(K)被天冬氨酸(D)取代。在一些实施方案中,突变型9°N DNA聚合酶还包含氨基酸取代D141A和E143A。
在一些实施方案中,重组突变型9°N DNA聚合酶包含:SEQ ID NO:280或281或282的主链氨基酸序列并且具有包括以下的氨基酸取代突变的组合:(i)在位置408处的亮氨酸(L)被丝氨酸(S)、苯丙氨酸(F)或酪氨酸(Y)取代;和(ii)在位置409处的酪氨酸(Y)被丙氨酸(A)取代,在位置410处的脯氨酸(P)被甘氨酸(G)取代,在位置485处的丙氨酸(A)被丝氨酸(S)取代,在位置507处的赖氨酸(K)被亮氨酸(L)取代,在位置521处的异亮氨酸被组氨酸(H)取代,和在位置559处的赖氨酸(K)被天冬氨酸(D)取代。突变型9°N DNA聚合酶基于SEQID NO:280的主链序列并且具有取代突变L408S、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ ID NO:376)。突变型9°N DNA聚合酶基于SEQ ID NO:281的主链序列并且具有取代突变L408S、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ ID NO:379)。突变型9°N DNA聚合酶基于SEQ ID NO:282的主链序列并且具有取代突变L408S、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ ID NO:382)。突变型9°N DNA聚合酶基于SEQ ID NO:280的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ ID NO:377)。突变型9°N DNA聚合酶基于SEQ ID NO:281的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ ID NO:380)。突变型9°N DNA聚合酶基于SEQ ID NO:282的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、K507L、I521H和K559D(SEQ IDNO:383)。在一些实施方案中,突变型9°N DNA聚合酶还包含氨基酸取代D141A和E143A。
在一些实施方案中,重组突变型9°N DNA聚合酶包含:SEQ ID NO:280或281或282的主链氨基酸序列并且具有包括以下的氨基酸取代突变的组合:(i)在位置408处的亮氨酸(L)被丝氨酸(S)苯丙氨酸(F)或酪氨酸(Y)取代;和(ii)在位置409处的酪氨酸(Y)被丙氨酸(A)取代,在位置410处的脯氨酸(P)被甘氨酸(G)取代,在位置485处的丙氨酸(A)被丝氨酸(S)取代,在位置492处的丝氨酸(S)被甘氨酸(G)取代,在位置507处的赖氨酸(K)被亮氨酸(L)取代,在位置521处的异亮氨酸被组氨酸(H)取代,和在位置559处的赖氨酸(K)被天冬氨酸(D)取代。突变型9°N DNA聚合酶基于SEQ ID NO:280的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、S492G、K507L、I521H和K559D(SEQ ID NO:378)。突变型9°N DNA聚合酶基于SEQ ID NO:281的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、S492G、K507L、I521H和K559D(SEQ ID NO:381)。突变型9°N DNA聚合酶基于SEQ ID NO:282的主链序列并且具有取代突变L408F、Y409A、P418G、A485S、S492G、K507L、I521H和K559D(SEQ IDNO:384)。在一些实施方案中,突变型9°N DNA聚合酶还包含氨基酸取代D141A和E143A。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点。核酸模板分子可包括核酸模板实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点;以及至少一个核苷酸,其中所述至少一个核苷酸包含核苷酸单元,所述核苷酸单元包括一个或多个如上文所论述的示例核苷酸单元特征。
在一些实施方案中,重组突变型9°N DNA聚合酶为三元复合物的一部分,所述三元复合物包含:重组突变型9°N DNA聚合酶,其结合核酸模板分子,所述核酸模板分子与核酸引物杂交;和至少一个核苷酸,其结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处。在一些实施方案中,在所述三元复合物中,所述核苷酸结合至所述核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至所述核酸双链体并且已经历聚合酶催化的掺入。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点;以及至少一个核苷酸,所述至少一个核苷酸用荧光团标记或所述至少一个核苷酸没有荧光团标记。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点;以及至少一个核苷酸,其包含经由可裂解部分附接至3'-OH糖位置的链终止部分,所述链终止部分可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,重组突变型9°N DNA聚合酶包含可被或可未被荧光标记并且可包括以上描述的荧光团实施方案中的任一者的重组突变型9°N DNA聚合酶。在一些实施方案中,重组突变型9°NDNA聚合酶包含至少一个核苷酸,其可被或可未被荧光标记。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含至少一个多价分子,其可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含至少一个多价分子,如上文所描述,其可被或可未被荧光标记,并且包括至少一个荧光标记的多价分子。在一些实施方案中,所述至少一个多价分子包含用荧光团标记的核心。在一些实施方案中,所述至少一个多价分子包含一个或多个核苷酸臂,所述一个或多个核苷酸臂具有附接至荧光团的接头和/或核苷酸单元。在一些实施方案中,重组突变型9°N DNA聚合酶还包含没有荧光团的多价分子。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含至少一个多价分子,其包括具有链终止部分的核苷酸单元,所述链终止部分经由可裂解部分附接至3'-OH糖位置,并且可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,重组突变型9°N DNA聚合酶包含聚合酶,其可被或可未被荧光标记并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,重组突变型9°N DNA聚合酶包含聚合酶并且还包含至少一个多价分子,其可被或可未被荧光标记并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点;以及多个促进聚合酶催化的核苷酸掺入的催化性二价阳离子,其中所述催化性二价阳离子包括镁和/或锰。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:核酸模板分子;和具有3'可延伸端的核苷酸聚合起始位点;以及多个抑制聚合酶催化的核苷酸掺入的非催化性二价阳离子,其中所述非催化性二价阳离子包括锶、钡和/或钙。
在一些实施方案中,重组突变型9°N DNA聚合酶还包含:多个突变型DNA聚合酶,其与多个核酸模板分子和多个核苷酸聚合起始位点结合,形成多个复合突变型DNA聚合酶,所述多个复合突变型DNA聚合酶各自包含与核酸双链体结合的突变型DNA聚合酶,其中所述双链体包含与寡核苷酸引物杂交的核酸模板分子。在一些实施方案中,多个复合突变型DNA聚合酶根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供采用突变型9°N DNA聚合酶和核苷酸的核酸测序方法。本公开提供核酸测序方法,其包括:(a)使(i)多个突变型9°N DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个复合聚合酶的条件下进行,所述多个复合聚合酶各自包含与核酸双链体结合的突变型9°N DNA聚合酶;(b)使所述多个复合聚合酶与(iii)多个核苷酸和(iv)多个催化性或非催化性二价阳离子接触,其中所述接触在适用于形成多个三元复合物的条件下进行,所述多个三元复合物各自包含与核酸双链体结合的突变型DNA聚合酶和核苷酸,其中在所述三元复合物中,所述核苷酸结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述条件适用于促进聚合酶催化的与核酸引物的3'端结合的核苷酸掺入,或所述条件适用于抑制聚合酶催化的与核酸引物的3'端结合的核苷酸掺入;以及(c)检测所述多个三元复合物;以及(d)鉴别所述多个三元复合物中多个掺入的核苷酸。先前(例如以上关于突变型9°N DNA聚合酶的段落)描述的突变型聚合酶的描述也适用于此处。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个三元复合物保持稳定并且突变型或野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,所述核苷酸结合至核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至核酸双链体并且经历聚合酶催化的掺入。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个催化性二价阳离子包括镁和/或锰。在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个非催化性二价阳离子包括锶、钡和/或钙。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个突变型9°N DNA聚合酶包含多个荧光标记的聚合酶,或多个突变型9°N DNA聚合酶没有荧光团。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个核苷酸中的个别核苷酸包含核苷酸单元,其包括如上文所论述的一个或多个示例核苷酸单元特征。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,这些可被或可未被荧光标记并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个核苷酸中的至少一个核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分,所述链终止部分可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和核苷酸的测序方法中,多个复合聚合酶根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供采用突变型9°N DNA聚合酶和多价分子的核酸测序方法,所述DNA聚合酶和多价分子各自已于前文描述,所述描述也适用于此处。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,多个三元复合物保持稳定并且突变型或野生型聚合酶不从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,在所述三元复合物中,多价分子的核苷酸单元结合至核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸单元结合至核酸双链体并且已经历聚合酶催化的掺入。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中还包括形成亲合力复合物,用于形成亲合力复合物的方法涉及与先前关于采用来自候选深层古细菌目的聚合酶的两阶段核酸测序方法所描述的步骤(步骤(1)-(4))类似的步骤,其还包括形成亲合力复合物,所述步骤包括:(a)使多个突变型9°N DNA聚合酶和多个核酸引物与多联体核酸模板分子的不同部分接触以在同一多联体模板分子上形成至少第一复合聚合酶和第二复合聚合酶;(b)使多个多价分子与在同一多联体模板分子上的至少第一复合聚合酶和第二复合聚合酶在适用于使来自多个多价分子的单一多价分子与第一复合聚合酶和第二复合聚合酶结合的条件下接触,其中所述单一多价分子的至少第一核苷酸单元结合至包含与多联体模板分子的第一部分杂交的第一引物的第一复合聚合酶,由此形成第一三元复合物,并且其中所述单一多价分子的至少第二核苷酸单元结合至包含与多联体模板分子的第二部分杂交的第二引物的第二复合聚合酶,由此形成第二三元复合物,其中所述接触在适用于抑制聚合酶催化的第一三元复合物和第二三元复合物中的结合的第一核苷酸单元和第二核苷酸单元(分别)掺入的条件下进行,并且其中结合至同一多价分子的第一三元复合物和第二三元复合物形成亲合力复合物;以及(c)检测在同一多联体模板分子上的第一三元复合物和第二三元复合物;以及(d)鉴别第一三元复合物中的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二三元复合物中的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。在一些实施方案中,步骤(d)的鉴别包括:鉴别第一三元复合物中与第一引物的3'端结合的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二三元复合物中与第二引物的3'端结合的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,非催化性二价阳离子包括锶、钡和/或钙。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,个别多价分子可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,多个多价分子可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,多个多价分子中的至少一个多价分子包含具有链终止部分的核苷酸单元,所述链终止部分经由可裂解部分附接至3'-OH糖位置,并且可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,所述DNA聚合酶和多价分子中的任一者可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N DNA聚合酶和多价分子的测序方法中,多个复合聚合酶根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
本公开提供采用突变型9°N DNA聚合酶、多价分子和核苷酸的两阶段核酸测序方法。本公开提供核酸测序方法,其包括:(a)使(i)多个第一突变型9°N DNA聚合酶与(ii)多个核酸双链体接触,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板分子,其中所述接触在适用于形成多个第一复合聚合酶的条件下进行,所述多个第一复合聚合酶各自包含与核酸双链体结合的第一突变型9°N DNA聚合酶;(b)使所述多个第一复合聚合酶与(iii)多个多价分子和(iv)多个非催化性二价阳离子接触,其中所述多个多价分子各自包含附接至多个核苷酸臂的核心且其中各核苷酸臂包含核苷酸单元,其中所述接触在适用于形成多个第一三元复合物的条件下进行,所述多个第一三元复合物各自包含与核酸双链体结合的第一突变型9°N DNA聚合酶和多价分子,其中在所述第一三元复合物中,多价分子的核苷酸单元结合至核酸引物的3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述接触在适用于抑制聚合酶催化的多价分子的结合的核苷酸单元掺入的条件下进行;(c)检测所述多个第一三元复合物并鉴别与核酸引物的3'端结合的核苷酸单元,由此确定核酸模板分子的序列;(d)通过移除多个第一突变型9°N聚合酶和多个多价分子并保留多个核酸双链体来解离多个第一三元复合物;(e)使步骤(d)保留的核酸双链体与(i)多个第二突变型9°N DNA聚合酶、(ii)多个核苷酸和(iii)多个催化性二价阳离子接触,其中步骤(e)的接触在适用于形成多个第二三元复合物的条件下进行,所述多个第二三元复合物各自包含与步骤(d)保留的核酸双链体结合的第二突变型9°N DNA聚合酶和核苷酸,其中在所述第二三元复合物中,核苷酸结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处,并且其中所述条件适用于促进聚合酶催化的与核酸引物的3'端结合的核苷酸掺入;以及(f)检测所述多个第二三元复合物并鉴别所述第二三元复合物中掺入的核苷酸。在一些实施方案中,步骤(f)的检测为任选的。在一些实施方案中,步骤(f)的鉴别为任选的。在一些实施方案中,非催化性二价阳离子包括锶、钡和/或钙,并且催化性二价阳离子包括镁或锰。
在一些实施方案中,采用突变型9°N聚合酶的两阶段核酸测序方法还包括:(g)移除多个第二突变型9°N DNA聚合酶并保留步骤(f)的多个核酸双链体;(h)使步骤(g)保留的核酸双链体与多个第一突变型9°N DNA聚合酶、多个多价分子和多个非催化性二价阳离子接触,其中所述接触在适用于形成另一多个第一三元复合物的条件下进行,并且其中所述接触在适用于抑制聚合酶催化的多价分子的结合的核苷酸单元掺入的条件下进行;(i)检测步骤(h)中形成的多个第一三元复合物并鉴别与核酸引物3'端结合的核苷酸单元,由此确定核酸模板分子的序列;(j)通过移除多个第一突变型9°N聚合酶和多个多价分子并保留多个核酸双链体,将步骤(h)中形成的多个第一三元复合物解离;(k)使步骤(j)的多个保留的核酸双链体与多个第二突变型9°N DNA聚合酶、多个核苷酸和多个催化性二价阳离子接触,其中所述接触在适用于形成另一多个第二三元复合物的条件下进行,并且其中所述条件适用于促进聚合酶催化的与核酸引物3'端结合的核苷酸掺入;(l)检测步骤(k)中形成的多个第二三元复合物并鉴别所述第二三元复合物中多个掺入的核苷酸;以及(m)重复步骤(g)-(l)至少一次。在一些实施方案中,步骤(l)的检测为任选的。在一些实施方案中,步骤(l)的鉴别为任选的。在一些实施方案中,非催化性二价阳离子包括锶、钡和/或钙,并且催化性二价阳离子包括镁或锰。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,所述聚合酶中的任一者可如先前所描述突变。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个第一突变型9°N DNA聚合酶在步骤(b)中形成多个第一三元复合物,所述第一三元复合物保持稳定并且第一突变型9°N DNA聚合酶不会从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个第二突变型9°N DNA聚合酶在步骤(e)中形成多个第二三元复合物,所述第二三元复合物保持稳定并且第二突变型9°N DNA聚合酶不会从核酸双链体解离(或表现出减少的解离),并且稳定的三元复合物表现出超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,在第一三元复合物中,多价分子的核苷酸单元结合至核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸单元结合至核酸双链体并且已经历聚合酶催化的掺入。在一些实施方案中,在第二三元复合物中,所述核苷酸结合至所述核酸双链体并且未经历聚合酶催化的掺入,或所述核苷酸结合至所述核酸双链体并且已经历聚合酶催化的掺入。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,所述方法还包括如先前关于来自候选深层古细菌目的聚合酶所描述形成亲合力复合物,包括类似步骤(步骤(1)-(4)),所述方法包括以下步骤:(a)使多个野生型或突变型DNA聚合酶和多个核酸引物与多联体核酸模板分子的不同部分接触以在同一多联体模板分子上形成至少第一复合聚合酶和第二复合聚合酶;(b)使多个多价分子与在同一多联体模板分子上的至少第一复合聚合酶和第二复合聚合酶在适用于使来自多个多价分子的单一多价分子与所述第一复合聚合酶和第二复合聚合酶结合的条件下接触,其中所述单一多价分子的至少第一核苷酸单元结合至包含与多联体模板分子的第一部分杂交的第一引物的复合聚合酶,由此形成第一多联体-三元复合物,并且其中所述单一多价分子的至少第二核苷酸单元结合至包含与多联体模板分子的第二部分杂交的第二引物的复合聚合酶,由此形成第二多联体-三元复合物,其中所述接触在适用于抑制聚合酶催化的第一多联体-三元复合物和第二多联体-三元复合物中结合的第一核苷酸单元和第二核苷酸单元掺入的条件下进行,并且其中结合至同一多价分子的第一多联体-三元复合物和第二多联体-三元复合物形成亲合力复合物;(c)检测在同一多联体模板分子上的第一多联体-三元复合物和第二多联体-三元复合物;以及(d)鉴别第一多联体-三元复合物中的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二多联体-三元复合物中的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。在一些实施方案中,步骤(d)的鉴别包括:鉴别第一多联体-三元复合物中与第一引物的3'端结合的第一核苷酸单元,由此确定多联体模板分子的第一部分的序列,并鉴别第二多联体-三元复合物中与第二引物的3'端结合的第二核苷酸单元,由此确定多联体模板分子的第二部分的序列。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个第一突变型9°N DNA聚合酶包含多个荧光标记的第二突变型9°N DNA聚合酶。在一些实施方案中,多个第一突变型9°NDNA聚合酶没有荧光团。在一些实施方案中,多个第二突变型9°NDNA聚合酶包含多个荧光标记的第一突变型9°N DNA聚合酶。在一些实施方案中,多个第二突变型9°N DNA聚合酶没有荧光团。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,多价分子可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,多个多价分子包含多个荧光标记的多价分子。在一些实施方案中,多个多价分子中的个别多价分子的核心附接至荧光团,所述荧光团对应于附接至核苷酸臂的核苷酸单元。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。在一些实施方案中,步骤(b)的多个多价分子为荧光标记的多价分子,并且其中步骤(c)包括检测来自多个第一三元复合物的荧光信号并鉴别与核酸引物的3'端结合的核苷酸单元,由此确定核酸模板分子的序列。在一些实施方案中,所述多个多价分子没有荧光团。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:所述多个多价分子中的一个或多个多价分子的至少一个核苷酸单元包含经由可裂解部分附接至3'-OH糖位置的链终止部分,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中,多个核苷酸中的个别核苷酸包含核苷酸单元,所述核苷酸单元包括如上文所论述的一个或多个示例核苷酸单元特征。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:所述多个核苷酸中的至少一个核苷酸包含荧光标记的核苷酸。在一些实施方案中,所述多个核苷酸没有荧光团标记。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个第二突变型9°N DNA聚合酶包含多个聚合酶,所述多个聚合酶可被或可未被荧光标记并且可包括以上描述的荧光团实施方案中的任一者。在一些实施方案中,所述多个聚合酶包含一个或多个核苷酸,所述一个或多个核苷酸中的任一者可被或可未被荧光标记,并且可包括以上描述的荧光团实施方案中的任一者。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个核苷酸中的至少一个核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:当步骤(e)中的多个核苷酸包含经由可裂解部分附接至3'-OH糖位置的链终止部分时,则步骤(f)还包括使掺入核酸引物中的链终止核苷酸与裂解剂接触以移除链终止部分,由此产生多个具有3'可延伸端的核酸引物。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在采用突变型9°N聚合酶的两阶段核酸测序方法中:多个第一复合聚合酶根据固定实施方案固定,包括上文所列的潜在特征中的任一者。
附图说明
专利或申请文件含有至少一个彩制附图。在提出请求并支付必要费用后,美国专利和商标局将提供带有彩色附图的本专利或专利申请公开的复本。
本文所公开的组合物和方法的新颖优势和特征在所附权利要求书中细致地陈述。以下参照阐述示例性实施方案和附图的详细描述将获得对本公开组合物和方法的特征和优势的更好理解,在附图中:
图1为比较在3′甲基叠氮基dCTP存在下来自候选深层古细菌目古菌的纯化的野生型和突变型DNA聚合酶在各种核苷酸浓度下的产物形成速率的图。所述图显示具有SEQ IDNO:105、129、130、134、141、149、151和155的氨基酸序列的突变型聚合酶的数据。
图2为显示Bst聚合酶的变体(例如来自嗜热脂肪地芽孢杆菌(Geobacillusstearothermophilus)的DNA聚合酶I)的3′-甲基叠氮基核苷酸的相对掺入百分比的图。
图3A-图3H:(8页,呈现为图3A至图3H)为表1(8页),列出来自候选深层古细菌目古菌的野生型DNA聚合酶(SEQ ID NO:1)和突变型DNA聚合酶变体(SEQ ID NO:2-157)在42℃下在延伸的多核苷酸链的N+1位置处掺入3′甲基叠氮基核苷酸的相对掺入活性。变体存在于来自表达菌株的澄清溶解产物中。表1中所列的所有突变型聚合酶(SEQ ID NO:2-157)均包含取代突变D141A和E143A,甚至当基因型未列出表1中的这些取代突变时亦如此。
图4A至图4E为表2,列出来自候选深层古细菌目古菌的DNA聚合酶突变型变体(SEQID NO:158-255)在42℃下在延伸的多核苷酸链的N+1位置处掺入3′甲基叠氮基核苷酸的相对掺入活性。变体存在于来自表达菌株的澄清溶解产物中。表2中所列的所有突变型聚合酶(SEQ ID NO:158-255)均包含取代突变D141A和E143A,甚至当基因型未列出表2中的这些取代突变时亦如此。
图5A至图5E为表3,列出来自候选深层古细菌目古菌的DNA聚合酶突变型变体(SEQID NO:288-375和385-390以及394-397)在42℃下在延伸的多核苷酸链的N+1位置处掺入3′甲基叠氮基核苷酸的相对掺入活性。变体存在于来自表达菌株的澄清溶解产物中。具有氨基酸序列SEQ ID NO:353、354和386的突变型聚合酶为截短突变体,其中截短位点用星号(*)指示。表3中所列的所有突变型聚合酶(SEQ ID NO:288-375和385-390)均包含取代突变D141A和E143A,甚至当基因型未列出表3中的这些取代突变时亦如此。
图6A至图6C为表4,列出来自候选深层古细菌目古菌的DNA聚合酶中的各种氨基酸取代突变(相对于SEQ ID NO:1)以及9°N DNA聚合酶(相对于SEQ ID NO:280)、VENT DNA聚合酶(相对于SEQ ID NO:283)、DEEP VENT DNA聚合酶(相对于SEQ ID NO:284)、嗜热脂肪地芽孢杆菌DNA聚合酶(相对于SEQ ID NO:275)、Pfu DNA聚合酶(相对于SEQ ID NO:285)和深海火球菌(Pyrococcus abyssi)DNA聚合酶(SEQ ID NO:286)中的等效氨基酸取代突变。
图7A至图7B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与9°N DNA聚合酶(相对于SEQ ID NO:280)之间的氨基酸序列比对。
图8A至图8C为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与VENT DNA聚合酶(相对于SEQ ID NO:283)之间的氨基酸序列比对。
图9A至图9B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与DEEP VENT DNA聚合酶(相对于SEQ ID NO:284)之间的氨基酸序列比对。
图10A至图10B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与嗜热脂肪地芽孢杆菌DNA聚合酶(相对于SEQ ID NO:275)之间的氨基酸序列比对。
图11A至图11B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与Pfu DNA聚合酶(相对于SEQ ID NO:285)之间的氨基酸序列比对。
图12A至图12B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与深海火球菌聚合酶(相对于SEQ ID NO:286)之间的氨基酸序列比对。
图13A至图13B为来自候选深层古细菌目古菌的野生型DNA聚合酶(相对于SEQ IDNO:1)与RB69聚合酶(相对于SEQ ID NO:287)之间的氨基酸序列比对。
图14A为包含附接至多个核苷酸臂的通用核心的多价分子的示意图。
图14B为包含附接至多个核苷酸臂的树状体核心的多价分子的示意图。
图15A显示包含附接至多个核苷酸臂的核心的多价分子的示意图,其中核苷酸臂包含生物素、间隔区、接头和核苷酸单元。
图15B为包含核心附接部分、间隔区、接头和核苷酸单元的核苷酸臂的示意图。
图16A显示示例性间隔区的化学结构,以及包括11个原子的接头、16个原子的接头、23个原子的接头和N3接头在内的各种示例性接头的化学结构。
图16B显示包括接头1-9的各种示例性接头的化学结构。
图17A显示接合/附接至核苷酸单元的各种示例性接头的化学结构。
图17B显示接合/附接至核苷酸单元的各种示例性接头的化学结构。
图17C显示接合/附接至核苷酸单元的各种示例性接头的化学结构。
图18显示示例性核苷酸臂的化学结构。在此实例中,核苷酸单元在嘧啶碱基的5位处或嘌呤碱基的7位处经由炔丙基胺附接而联接至接头。此核苷酸臂显示示例性生物素化核苷酸臂。
图19为条形图,比较在3′甲基叠氮基dCTP存在下来自候选深层古细菌目古菌的纯化的野生型和突变型DNA聚合酶的产物形成速率。所述图显示具有SEQ ID NO:39、297、27、164或225的氨基酸序列的突变型聚合酶的数据。
图20为一系列图,显示使用工程化聚合酶(例如SEQ ID NO:27)在固定至流通池的聚合酶群落(polony)上进行的引物延伸反应的结果,其中延伸产物的长度通过毛细管电泳监测。
具体实施方式
定义:
本文提供的标题并不限制本公开的各种方面,所述方面可参照整个说明书来理解。
除非另外定义,否则本文所使用的技术和科学术语具有本领域普通技术人员通常所理解的含义。一般而言,本文所描述的关于分子生物学、核酸化学、蛋白质化学、遗传学、微生物学、转基因细胞制造和杂交的技术的术语为本领域中熟知且常用的术语。本文所描述的技术和程序一般为根据本领域中熟知的常规方法并且如本说明书通篇所引用和论述的各种一般性和更具体的参考文献中所描述执行。举例而言,参见Sambrook等人,Molecular Cloning:A Laboratory Manual(第三版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.2000)。还参见Ausubel等人,Current Protocols inMolecular Biology,Greene Publishing Associates(1992)。结合本文所描述的实验程序和技术使用的命名法以及所述实验程序和技术为本领域中熟知的且常用者。
除非本文上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。除非清楚地且明确地限于一个提及物,否则单数形式“一个/种(a/an)”和“所述”以及单数形式使用的任何词语均包括多个提及物。
应理解,使用替代术语(例如“或”)应意谓替代方案中的一者或两者或其任何组合。
本文所使用的术语“和/或”应意谓在存在或不存在其他特征或组分的情况下具体地公开指定特征或组分中的各者。举例而言,如本文在短语诸如“A和/或B”中所使用,术语“和/或”意欲包括:“A和B”;“A或B”;“A”(单独A);和“B”(单独B)。按类似方式,如在短语诸如“A、B和/或C”中所使用,术语“和/或”意图涵盖以下方面中的各者:“A、B和C”;“A、B或C”;“A或C”;“A或B”;“B或C”;“A和B”;“B和C”;“A和C”;“A”(单独A);“B”(单独B);和“C”(单独C)。
如本文和所附权利要求书中所使用,本文所使用的术语“包含”、“包括”、“具有”和“含有”和其文法变化形式意欲为非限制性的,因此列表中的一个项目或多个项目不排除可取代或添加至所列项目中的其他项目。应理解,每当本文中用语言“包含”描述方面时,则还另外提供用术语“由......组成”和/或“基本上由......组成”所描述的类似方面。
如本文所使用,术语“约”和“大约”是指由本领域普通技术人员测定,在特定值或组成的可接受的误差范围内的值或组成,此将部分取决于如何测量或测定所述值或组成,即,测量系统的限制。举例而言,根据本领域中的实践,“约”或“大约”可意谓在一个或大于一个标准差内。或者,根据测量系统的限制,“约”或“大约”可意谓至多10%(即,±10%)或更高百分比的范围。举例而言,约5mg可包括在4.5mg与5.5mg之间的任何数值。此外,特别是就生物系统或方法而言,所述术语可意谓一个值的至多一个数量级或至多5倍。当本公开提供特定值或组成时,除非另外说明,否则“约”或“大约”的含义应假定在所述特定值或组成的可接受的误差范围内。另外,在提供值的范围和/或子范围时,所述范围和/或子范围可包括所述范围和/或子范围的端点。
本文使用的术语“肽”、“多肽”和“蛋白质”以及其他相关术语可互换使用并且是指氨基酸聚合物并且不限于任何特定长度。多肽可包含天然和非天然氨基酸。多肽包括重组形式或化学合成形式。多肽还包括尚未经历翻译后修饰的前体分子,所述翻译后修饰为诸如蛋白水解裂解、由核糖体跳跃引起的裂解、羟基化、甲基化、脂质化、乙酰化、类小泛素化、泛素化、糖基化、磷酸化和/或二硫键形成。这些术语涵盖天然和人造蛋白质、蛋白质片段和具有蛋白质序列的多肽类似物(诸如突变蛋白、变体和融合蛋白)以及翻译后或以其他方式共价或非共价修饰的蛋白质。
如本文所使用,术语“聚合酶”和其变体包含可催化核苷酸(包括其类似物)聚合形成核酸链的任何酶。通常但非必需地,所述核苷酸的聚合可以模板依赖性方式进行。通常,聚合酶包含一个或多个活性位点,在所述一个或多个活性位点处可发生核苷酸结合和/或核苷酸聚合的催化。在一些实施方案中,聚合酶包含其他酶活性,诸如3'至5'外切核酸酶活性或5'至3'外切核酸酶活性。在一些实施方案中,聚合酶具有链置换活性。聚合酶可包括但不限于天然存在的聚合酶以及其任何亚基和截短形式、突变型聚合酶、变异型聚合酶、重组聚合酶、融合聚合酶或以其他方式工程化的聚合酶、化学修饰的聚合酶、合成分子或组装体,和其保持催化核苷酸聚合的能力的任何类似物、衍生物或片段(例如催化活性片段)。在一些实施方案中,聚合酶可从细胞分离,或使用重组DNA技术或化学合成方法产生。在一些实施方案中,聚合酶可在原核生物、真核生物、病毒或噬菌体生物体中表达。在一些实施方案中,聚合酶可为翻译后修饰的蛋白质或其片段。聚合酶可来源于原核生物、真核生物、病毒或噬菌体。聚合酶包含DNA指导的DNA聚合酶和RNA指导的DNA聚合酶。
如本文所使用,术语“保真度”是指模板依赖性DNA聚合酶进行的DNA聚合的准确度。DNA聚合酶的保真度通常由错误率(掺入不准确核苷酸,即不与模板核苷酸互补的核苷酸的频率)测量。DNA聚合的准确度或保真度通过DNA聚合酶的聚合酶活性和3'-5'外切核酸酶活性维持。
如本文所使用,术语“结合复合物”是指通过将核酸双链体、聚合酶和游离核苷酸或多价分子的核苷酸单元结合在一起形成的复合物,其中所述核酸双链体包含与核酸引物杂交的核酸模板分子。在结合复合物中,游离核苷酸或核苷酸单元可结合至或可不结合至核酸引物3'端与核酸模板分子中的互补核苷酸相对的位置处。“三元复合物”通过将核酸双链体、聚合酶和游离核苷酸或多价分子的核苷酸单元结合在一起形成的结合复合物的一个实例,其中所述游离核苷酸或核苷酸单元结合至核酸引物(作为核酸双链体的一部分)3'端与核酸模板分子中的互补核苷酸相对的位置处。
术语“持续时间”和相关术语是指结合复合物保持稳定而任何组分不解离的时间长度,其中结合复合物的组分包括核酸模板和核酸引物、聚合酶、多价分子的核苷酸单元或游离(例如未结合)核苷酸。核苷酸单元或游离核苷酸可与模板分子中的核苷酸残基互补或不互补。核苷酸单元或游离核苷酸可结合至核酸引物3'端与核酸模板分子中的互补核苷酸残基相对的位置处。持续时间指示结合复合物的稳定性和结合相互作用的强度。持续时间可通过观察结合复合物的发生和/或持续时间测量,诸如通过观察来自结合复合物的标记的组分的信号测量。举例而言,标记的核苷酸或包含一个或多个核苷酸的标记的试剂可存在于结合复合物中,由此允许在结合复合物的持续时间期间检测来自标记的信号。一个示例性标记为荧光标记。结合复合物(例如三元复合物)保持稳定,直至经历引起聚合酶、模板分子、引物中的任一者和/或核苷酸单元或核苷酸之间的相互作用解离的条件。举例而言,解离条件包括使结合复合物与洗涤剂、EDTA和/或水中的任一者或任何组合接触。在一些实施方案中,结合复合物在不解离情况下保持稳定超过0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒的持续时间。
本文所使用的术语“核酸”、“多核苷酸”和“寡核苷酸”以及其他相关术语可互换使用且是指核苷酸的聚合物且不限于任何特定长度。核酸包括重组形式和化学合成形式。核酸包括DNA分子(例如cDNA或基因组DNA)、RNA分子(例如mRNA)、使用核苷酸类似物(例如肽核酸和非天然存在的核苷酸类似物)所产生的DNA或RNA类似物,以及含有DNA和RNA的嵌合形式。核酸可为单链或双链的。核酸包含核苷酸的聚合物,其中核苷酸包含天然或非天然碱基和/或糖。核酸包含天然存在的核苷间键联,例如磷酸二酯键。核酸包含非天然核苷间键联,包括硫代磷酸酯、硫代磷酸酯或肽核酸(PNA)键联。在一些实施方案中,核酸包含一种类型的多核苷酸或者两种或更多种不同类型的多核苷酸的混合物。
本文所使用的术语“引物”和相关术语是指能够与DNA和/或RNA多核苷酸模板杂交形成双链体分子的天然或合成寡核苷酸。引物可具有任何长度,但通常在4-50个核苷酸范围内。典型引物包含5'端和3'端。引物的3'端可包含3'OH部分,所述部分充当聚合酶介导的引物延伸反应中的核苷酸聚合起始位点。或者,引物的3'端可没有3'OH部分,或可包含末端3'封端基团,所述基团抑制聚合酶介导的反应中的核苷酸聚合。沿引物长度的任一个核苷酸或超过一个核苷酸可用可检测的报导因子部分标记。引物可呈溶液形式(例如可溶性引物)或可固定至支撑物上(例如捕捉引物)。
术语“模板核酸”、“模板多核苷酸”、“靶核酸”、“靶多核苷酸”、“模板链”和其他变化形式是指充当产生互补核酸链的基础核酸分子的核酸链。模板核酸的序列可与互补链的序列部分或完全互补。模板核酸可从天然存在的来源获得,可为重组形式或可被化学合成以包括任何类型的核酸类似物。模板核酸可为线性、环形或其他形式。模板核酸可以任何形式分离,包括染色体、基因组、细胞器(例如粒线体、叶绿体或核糖体)、重组分子、克隆的核酸、扩增的核酸、cDNA、RNA(诸如前体mRNA或mRNA)、寡核苷酸、全基因组DNA、获自新鲜冷冻的石蜡包埋的组织、针刺活检物、无细胞循环DNA或任何类型的核酸库。模板核酸分子可从任何来源分离,包括从以下分离:生物体,诸如原核生物、真核生物(例如人类、植物和动物)、真菌和病毒;细胞;组织;正常或病变细胞或组织、体液,包括血液、尿液、血清、淋巴液、肿瘤、唾液、肛门和阴道分泌物、羊膜样品、汗液和精液;环境样品;培养物样品;或使用重组分子生物学化学合成方法制备的合成核酸分子。模板核酸可经历核酸分析,包括测序和组成分析。
当用于核酸分子时,术语“杂交(hybridize/hybridizing/hybridization)”或其他相关术语是指两个不同核酸之间发生氢键结而形成双链体核酸。杂交还包括单个核酸分子的两个不同区域之间发生氢键结而形成具有双链体区的自杂交分子。杂交可包含沃森-克里克或胡格斯坦(Hoogstein)结合以形成双链体双链核酸,或核酸分子内的双链区。双链核酸或单一核酸的两个不同区可为完全互补或部分互补的。互补核酸链无需在其整个长度上彼此杂交。互补碱基配对可为标准的A-T或C-G碱基配对,或可为其他形式的碱基配对相互作用。双链体核酸可包括错配的碱基配对核苷酸。
术语“核苷酸”和相关术语是指包含芳族碱基、五碳糖(例如核糖或脱氧核糖)和至少一个磷酸酯基的分子。标准或非标准核苷酸均符合所述术语的使用。在一些实施方案中,磷酸酯包含单磷酸酯、二磷酸酯或三磷酸酯,或相应磷酸酯类似物。在一些实施方案中,核苷酸包含1、2、3、4、5、6、7、8、9或10个磷酸酯基。术语“核苷”是指包含芳族碱基和糖的分子。
核苷酸(和核苷)通常包含通常见于核酸中的包含取代或未取代的含氮母杂芳族环的杂环碱基,包括天然存在的核苷酸(和核苷)、取代的核苷酸(和核苷)、修饰的核苷酸(和核苷)或工程化变体,或其类似物。核苷酸(或核苷)的碱基能够与适当互补碱基形成沃森-克里克和/或胡格斯坦氢键。示例性碱基包括但不限于嘌呤和嘧啶,诸如:2-氨基嘌呤、2,6-二氨基嘌呤、腺嘌呤(A)、乙烯基腺嘌呤、N6-Δ2-异戊烯基腺嘌呤(6iA)、N6-Δ2-异戊烯基-2-甲基硫代腺嘌呤(2ms6iA)、N6-甲基腺嘌呤、鸟嘌呤(G)、异鸟嘌呤、N2-二甲基鸟嘌呤(dmG)、7-甲基鸟嘌呤(7mG)、2-硫代嘧啶、6-硫代鸟嘌呤(6sG)、次黄嘌呤和O6-甲基鸟嘌呤;7-去氮嘌呤,诸如7-去氮腺嘌呤(7-deaza-A)和7-去氮鸟嘌呤(7-deaza-G);嘧啶,诸如胞嘧啶(C)、5-丙炔基胞嘧啶、异胞嘧啶、胸腺嘧啶(T)、4-硫代胸腺嘧啶(4sT)、5,6-二氢胸腺嘧啶、O4-甲基胸腺嘧啶、尿嘧啶(U)、4-硫代尿嘧啶(4sU)和5,6-二氢尿嘧啶(二氢尿嘧啶;D);吲哚,诸如硝基吲哚和4-甲基吲哚;吡咯,诸如硝基吡咯;水粉蕈素(nebularine);肌苷;羟甲基胞嘧啶;5-甲基胞嘧啶;碱基(Y);以及甲基化、糖基化和酰化碱基部分;和类似物。另外的示例性碱基可见于Fasman,1989,“Practical Handbook of Biochemistry andMolecular Biology”,第385-394页,CRC Press,Boca Raton,Fla。
核苷酸(和核苷)通常包含糖部分,诸如碳环部分(Ferraro和Gotor2000Chem.Rev.100:4319-48)、无环部分(Martinez等人,1999 Nucleic Acids Research 27:1271-1274;Martinez等人,1997 Bioorganic&Medicinal Chemistry Letters第7卷:3013-3016)和其他糖部分(Joeng等人,1993 J.Med.Chem.36:2627-2638;Kim等人,1993J.Med.Chem.36:30-7;Eschenmosser 1999 Science 284:2118-2124;和美国专利号5,558,991)。糖部分包含:核糖基;2'-脱氧核糖基;3'-脱氧核糖基;2',3'-二脱氧核糖基;2',3'-二脱氢二脱氧核糖基;2'-烷氧基核糖基;2'-叠氮基核糖基;2'-氨基核糖基;2'-氟核糖基;2'-巯基核糖基;2'-烷基硫代核糖基;3'-烷氧基核糖基;3'-叠氮基核糖基;3'-氨基核糖基;3'-氟核糖基;3'-巯基核糖基;3'-烷基硫代核糖基;碳环、无环或其他修饰的糖。
在一些实施方案中,核苷酸包含具有一个、两个或三个磷原子的链,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
当用于核酸时,术语“延伸(extend/extending/extension)”和其他变化形式是指将一个或多个核苷酸掺入核酸分子中。核苷酸掺入包含一个或多个核苷酸聚合至核酸链的末端3'端中,引起核酸链的延伸。核苷酸掺入可用天然核苷酸和/或核苷酸类似物进行。通常但非必需的,核苷酸掺入以模板依赖性方式发生。使核酸分子延伸的任何适合方法均可使用,包括由DNA聚合酶或RNA聚合酶催化的引物延伸。
术语“报导因子部分(reporter moiety/reporter moieties)”或相关术语是指产生或使得产生可检测信号的化合物。报导因子部分有时称为“标记”。任何适合的报导因子部分均可使用,包括发光部分、光致发光部分、电致发光部分、生物发光部分、化学发光部分、荧光部分、磷光部分、发色团、放射性同位素、电化学部分、质谱、拉曼(Raman)、半抗原、亲和标签、原子或酶。报导因子部分由于化学或物理变化(例如热、光、电、pH、盐浓度、酶活性或邻近事件)而产生可检测信号。邻近事件包括两个报导因子部分彼此接近、或彼此缔合、或彼此结合。本领域技术人员熟知选择报导因子部分以使得各自在可与其他报导因子部分相区分的波长下吸收激发放射线和/或发射荧光,由此允许监测在相同反应中或不同反应中不同报导因子部分的存在。选择的两个或更多个不同报导因子部分可具有在光谱上不同的发射谱,或具有重叠最少的频谱发射谱。报导因子部分可连接(例如可操作地连接)至核苷酸、核苷、核酸、酶(例如聚合酶或反转录酶)或支撑物(例如表面)。
报导因子部分(或标记)包含荧光标记或荧光团。可充当荧光标记或荧光团的示例性荧光部分包括但不限于荧光素和荧光素衍生物,诸如羧基荧光素、四氯荧光素、六氯荧光素、羧基萘荧光素、异硫氰酸荧光素、NHS-荧光素、碘代乙酰氨基荧光素、荧光素顺丁烯二酰亚胺、SAMSA-荧光素、荧光素氨基硫脲、碳酰肼基甲基硫代乙酰基-氨基荧光素;罗丹明(rhodamine)和罗丹明衍生物,诸如TRITC、TM R、丽丝胺罗丹明(lissamine rhodamine)、得克萨斯红(Texas Red)、罗丹明B、罗丹明6G、罗丹明10、NHS-罗丹明、TMR-碘代乙酰胺、丽丝胺罗丹明B磺酰氯、丽丝胺罗丹明B磺酰肼、得克萨斯红磺酰氯、得克萨斯红酰肼;香豆素和香豆素衍生物,诸如AMCA、AMC A-NHS、AMCA-磺基-NHS、AMCA-HPDP、DCIA、AMCE-酰肼;BODIPY和衍生物,诸如BODIPY FL C3-SE、BODIPY 530/550 C3、BODIPY 530/550 C3-SE、BODIPY530/550 C3酰肼、BODIPY 493/503 C3酰肼、BODIPY FL C3酰肼、BODIPY FL IA、BODIPY530/551 IA、Br-BODIPY 493/503;Cascade Blue和衍生物,诸如Cas cade Blue乙酰叠氮化物、Cascade Blue尸胺、Cascade Blue乙二胺、Cascade Blue酰肼;荧光黄和衍生物,诸如荧光黄碘代乙酰胺、荧光黄CH;花青和衍生物,诸如吲哚鎓类花青染料、苯并吲哚鎓类花青染料、吡啶鎓类花青染料、噻唑鎓类花青染料、喹啉鎓类花青染料、咪唑鎓类花青染料、Cy3、Cy5;镧系螯合剂和衍生物,诸如BCPDA、TBP、TMT、BHHCT、BCOT、铕螯合剂、铽螯合剂;AlexaFluor染料、DyLight染料、Atto染料、LightCycler Red染料、CAL Flour染料、JOE和其衍生物、俄勒冈绿(Oregon Green)染料;WellRED染料;IRD染料;藻红素和藻胆素染料;孔雀绿(Malachite green);芪;DEG染料;NR染料;近红外染料和本领域中已知的其他染料,诸如Haugland,Molecular Probes Handbook,(Eugene,Oreg.)第6版;La kowicz,Principlesof Fluorescence Spectroscopy,第2版,Plenum Pr ess New York(1999);或Hermanson,Bioconjugate Techniques,第2版中所描述者,或其衍生物或其任何组合。花青染料可以磺酸化或非磺酸化形式存在,并且由被两个氮原子之间的聚甲炔桥隔开的两个假吲哚(indolenin)、苯并吲哚鎓、吡啶鎓、噻唑鎓和/或喹啉鎓基团组成。可商购获得的花青荧光团包括例如Cy3(其可包含1-[6-(2,5-二氧代吡咯烷-1-基氧基)-6-氧代己基]-2-(3-{1-[6-(2,5-二氧代吡咯烷-1-基氧基)-6-氧代己基]-3,3-二甲基-1,3-二氢-2H-亚吲哚-2-基}丙-1-烯-1-基)-3,3-二甲基-3H-吲哚鎓或1-[6-(2,5-二氧代吡咯烷-1-基氧基)-6-氧代己基]-2-(3-{1-[6-(2,5-二氧代吡咯烷-1-基氧基)-6-氧代己基]-3,3-二甲基-5-磺基-1,3-二氢-2H-亚吲哚-2-基}丙-1-烯-1-基)-3,3-二甲基-3H-吲哚鎓-5-磺酸盐)、Cy5(其可包含1-(6-((2,5-二氧代吡咯烷-1-基)氧基)-6-氧代己基)-2-((1E,3E)-5-((E)-1-(6-((2,5-二氧代吡咯烷-1-基)氧基)-6-氧代己基)-3,3-二甲基-5-亚吲哚啉-2-基)戊-1,3-二烯-1-基)-3,3-二甲基-3H-吲哚-1-鎓或1-(6-((2,5-二氧代吡咯烷-1-基)氧基)-6-氧代己基)-2-((1E,3E)-5-((E)-1-(6-((2,5-二氧代吡咯烷-1-基)氧基)-6-氧代己基)-3,3-二甲基-5-磺基亚吲哚啉-2-基)戊-1,3-二烯-1-基)-3,3-二甲基-3H-吲哚-1-鎓-5-磺酸盐)和Cy7(其可包含1-(5-羧基戊基)-2-[(1E,3E,5E,7Z)-7-(1-乙基-1,3-二氢-2H-亚吲哚-2-基)庚-1,3,5-三烯-1-基]-3H-吲哚鎓或1-(5-羧基戊基)-2-[(1E,3E,5E,7Z)-7-(1-乙基-5-磺基-1,3-二氢-2H-亚吲哚-2-基)庚-1,3,5-三烯-1-基]-3H-吲哚鎓-5-磺酸盐),其中“Cy”表示‘花青’,并且第一个数字标识两个假吲哚基团之间的碳原子数。Cy2为唑衍生物而非假吲哚,并且苯并衍生化的Cy3.5、Cy5.5和Cy7.5为此规则的例外情形。
在一些实施方案中,报导因子部分可为FRET对,由此可在单个激发和成像步骤中执行多次分类。如本文所使用,FRET可包含激发交换(Forster)转移或电子交换(Dexter)转移。
术语“连接(linked)”、“接合(joined)”、“附接(attached)”和其变化形式包含化合物或分子的任何组合之间的任何类型的融合、键结、粘附或缔合,其具有足够稳定性以经受住在特定程序中的使用。所述程序可包括但不限于:核苷酸短暂结合;核苷酸掺入;解封端;洗涤;移除;流动;检测;成像和/或鉴别。所述键联可包括例如共价、离子、氢、偶极-偶极、亲水性、疏水性或亲和力键结、涉及范德华力的键或缔合、机械键结和类似键联。在一些实施方案中,此类键联在分子内发生,例如将单链或双链线性核酸分子的两端连接在一起形成环形分子。在一些实施方案中,此类键联可在不同分子的组合之间发生,或在分子与非分子之间发生,包括但不限于:核酸分子与固体表面之间的键联;蛋白质与可检测的报导因子部分之间的键联;核苷酸与可检测的报导因子部分之间的键联;和类似键联。键联的一些实例可见于例如Hermanson,G.,“Bioconjugate Techniques”,第二版(2008);Aslam,M.,Dent,A.,“Bioconjugation:Protein Coupling Techniques for the BiomedicalSciences”,London:Macmillan(1998);Aslam,M.,Dent,A.,“Bioconjugation:ProteinCoupling Techniques for the Biomedical Sciences”,London:Macmillan(1998)。
如本文所使用,术语“可操作地连接”和“可操作地接合”或相关术语是指组分的并接。并接的组分可共价连接在一起。举例而言,两个核酸组分可在酶作用下连接在一起,其中将两个组分接合在一起的键联包含磷酸二酯键联。第一核酸组分与第二核酸组分可连接在一起,其中第一核酸组分可赋予第二核酸组分功能。举例而言,引物结合序列与感兴趣序列之间键联形成具有可结合至引物的部分的核酸库分子。在另一实例中,转基因(例如编码多肽的核酸或感兴趣核酸序列)可连接至载体,其中键联允许所述载体中所包含的转基因序列的表达或功能。在一些实施方案中,转基因可操作地连接至影响转基因的表达的宿主细胞调控序列(例如启动子序列)。在一些实施方案中,载体包含至少一个宿主细胞调控序列,包括启动子序列、增强子、转录和/或翻译起始序列、转录和/或翻译终止序列、多肽分泌信号序列和类似序列。在一些实施方案中,宿主细胞调控序列控制转基因的表达量、时序和/或定位。
在一些实施方案中,支撑物为固体、半固体或两者的组合。在一些实施方案中,支撑物为多孔、半多孔、无孔或孔隙率的任何组合。在一些实施方案中,支撑物可为实质上平面的、凹形的、凸形的或其任何组合。在一些实施方案中,支撑物可为圆柱形的,例如包括毛细管或毛细管的内表面。
在一些实施方案中,支撑物的表面可为实质上光滑的。在一些实施方案中,支撑物可为规则地或不规则地纹理化的,包括凸块、蚀刻、孔、三维支架或其任何组合。
在一些实施方案中,支撑物包括具有任何形状的珠粒,所述形状包括球形、半球形、圆柱形、筒形、环形、圆盘形、棒状、圆锥形、三角形、立方形、多边形、管状或线状。
支撑物可以由任何材料制造,包括但不限于玻璃、熔融二氧化硅、硅、聚合物(例如聚苯乙烯(PS)、大孔聚苯乙烯(MPPS)、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、环状烯烃聚合物(COP)、环状烯烃共聚物(COC)、聚对苯二甲酸亚乙酯(PET))或其任何组合。涵盖玻璃和塑胶基材两者的各种组合物。
在一些实施方案中,支撑物的表面涂有一种或多种化合物以在支撑物上产生钝化层。在一些实施方案中,支撑物包括使得支撑物上的核酸杂交和扩增效能能够改善的低非特异性结合表面。一般而言,支撑物可包括一层或多层共价或非共价附接的低结合、化学改质层,例如硅烷层、聚合物膜;以及一个或多个共价或非共价附接的寡核苷酸,其可用于将多个核酸模板分子固定至所述支撑物。
在一些实施方案中,表面涂层的亲水度(或用水溶液的“湿润性”)可例如经由测量水接触角评估,其中将一小滴水置放于表面上并且使用例如光学表面张力计测量其与表面接触的角度。在一些实施方案中,可以测定静态接触角。在一些实施方案中,可以测定前进或后退接触角。在一些实施方案中,本文所公开的亲水性低结合支撑物表面的水接触角可以在约0度至约30度的范围内。在一些实施方案中,本文所公开的亲水性低结合支撑物表面的水接触角可以不超过50度、40度、30度、25度、20度、18度、16度、14度、12度、10度、8度、6度、4度、2度或1度。在许多情况下,接触角不超过40度。本领域技术人员将认识到,本公开的给定亲水性低结合支撑物表面可表现出的水接触角具有在此范围内的任何处的值。
本公开提供固定至支撑物的多个(例如两个或更多个)核酸模板。在一些实施方案中,固定的多个核酸模板具有相同序列或具有不同序列。在一些实施方案中,多个核酸模板中的个别核酸模板分子固定至支撑物上的不同位点。在一些实施方案中,多个核酸模板中的两个或更多个的个别核酸模板分子固定至支撑物上的位点。在一些实施方案中,支撑物包括布置成阵列的多个位点。术语“阵列”是指包含定位于支撑物上预定部位(location)处形成位点阵列的多个位点的支撑物。所述位点可为分散的并且通过空隙区隔开。在一些实施方案中,支撑物上的预定位点可在一个维度中布置成一列或一行,或在二个维度中布置成数列和数行。在一些实施方案中,多个预定位点以组织方式布置于支撑物上。在一些实施方案中,多个预定位点以任何组织图案布置,包括长方体、六边形图案、栅格图案、具有反射对称性的图案、具有旋转对称性的图案或类似图案。不同位点对之间之间距可相同或可不同。在一些实施方案中,支撑物可具有固定于表面密度为约102-1015个位点或更多位点/平方毫米的多个位点处的核酸模板分子,以形成核酸模板阵列。在一些实施方案中,支撑物包括至少个102个位点、至少103个位点、至少104个位点、至少105个位点、至少106个位点、至少107个位点、至少108个位点、至少109个位点、至少1010个位点、至少1011个位点、至少1012个位点、至少1013个位点、至少1014个位点、至少1015个位点或更多个位点,其中所述位点定位于支撑物上的预定部位处。在一些实施方案中,支撑物上的多个预定位点(例如102-1015个位点或更多)固定有核酸模板以形成核酸模板阵列。在一些实施方案中,核酸模板在多个预定位点处通过杂交固定至固定的表面捕捉引物,或核酸模板共价附接至表面捕捉引物。在一些实施方案中,核酸模板固定于多个预定位点处,例如固定于102-1015个位点或更多位点处。在一些实施方案中,在支撑物上的多个位点处固定的核酸模板包含线性或环形核酸模板分子或线性与环形分子的混合物。在一些实施方案中,固定的核酸模板被克隆扩增以在多个预定位点处产生固定的核酸聚合酶群落。在一些实施方案中,个别固定的核酸模板分子包含感兴趣靶序列的一个拷贝,或包含具有感兴趣靶序列的两个或更多个串联拷贝的多联体。
在一些实施方案中,包含定位于支撑物上的随机部位处的多个位点的支撑物在本文中称为上面具有随机定位的位点的支撑物。支撑物上随机定位的位点的部位并非预定的。多个随机定位的位点以无序和/或不可预测的方式布置于支撑物上。在一些实施方案中,支撑物包括至少102个位点、至少103个位点、至少104个位点、至少105个位点、至少106个位点、至少107个位点、至少108个位点、至少109个位点、至少1010个位点、至少1011个位点、至少1012个位点、至少1013个位点、至少1014个位点、至少1015个位点或更多位点,其中所述位点随机定位于支撑物上。在一些实施方案中,支撑物上的多个随机定位的位点(例如102-1015个位点或更多位点)固定有核酸模板以形成固定有核酸模板的支撑物。在一些实施方案中,核酸模板在多个随机定位的位点处通过杂交固定至固定的表面捕捉引物,或核酸模板共价附接至表面捕捉引物。在一些实施方案中,核酸模板固定于多个随机定位的位点处,例如固定于102-1015个位点或更多位点处。在一些实施方案中,在支撑物上多个位点处固定的核酸模板包含核酸模板分子,其可包括核酸模板实施方案,包括上文所列潜在特征中的任一者,在一些实施方案中,固定的核酸模板被克隆扩增以产生在多个随机定位的位点处固定的核酸聚合酶群落。
在一些实施方案中,就固定至支撑物上的预定位点或随机位点的核酸模板分子而言,在支撑物上的多个固定的核酸模板分子彼此流体连通以允许试剂(例如包括聚合酶在内的酶、多价分子、核苷酸、二价阳离子和/或缓冲液,和类似物)的溶液流动至支撑物上,由此使支撑物上的多个固定的核酸模板分子可与所述试剂以大规模平行方式反应。在一些实施方案中,多个固定的核酸模板分子的流体连通可用于进行核苷酸结合分析和/或在多个固定的核酸模板分子上进行核苷酸聚合反应(例如引物延伸或测序),以及进行检测和成像以供大规模平行测序。在一些实施方案中,术语“固定”和相关术语是指核酸分子或酶(例如聚合酶)附接至支撑物的预定或随机部位处,其中所述核酸分子或酶经由共价键或非共价相互作用直接附接至支撑物,或所述核酸分子或酶附接至支撑物上的涂层。
如本文所使用,术语“测序”和其变化形式包括从核酸链获得序列信息,通常通过确定核酸模板分子内至少一些核苷酸(包括其核碱基组分)的身份进行。在一些实施方案中,对核酸分子的给定区域“测序”包括鉴别测序区域内的每一个核苷酸,而在一些实施方案中,“测序”包括确定所述区域中仅一些核苷酸的身份,而一些核苷酸的身份不确定或不正确地确定的方法。任何适合的测序方法均可使用。在一个示例性实施方案中,测序可包括无标记或基于离子的测序方法。在一些实施方案中,测序可包括标记的或含染料的核苷酸或基于荧光的核苷酸测序方法。在一些实施方案中,测序可包括基于聚合酶群落的测序或桥式测序方法。在一些实施方案中,测序包括大规模平行测序平台,其采用合成测序、杂交测序或结合测序程序。大规模平行合成测序程序的实例包括聚合酶群落测序、焦磷酸测序(例如来自454Life Sciences;美国专利号7,211,390、7,244,559和7,264,929)、链终止剂测序(例如来自Illumina;美国专利号7,566,537;Bentley 2006Current OpinionGenetics and Development 16:545-552;和Bentley等人,2008Nature 456:53-59)、离子敏感性测序(例如来自Ion Torrent)、探针-锚连接测序(例如Complete Genomics)、DNA纳米球测序、纳米孔DNA测序。单分子测序的实例包括Heliscope单分子测序和单分子实时(SMRT)测序。杂交测序的实例包括SOLiD测序(例如来自Life Technologies;WO 2006/084132)。结合测序的实例包括Omniome测序(例如美国专利第10,246,744号)。
工程化聚合酶
本公开提供包含具有氨基酸取代和/或截短的氨基酸序列的突变型聚合酶的组合物、编码所述突变型聚合酶的核酸以及包含突变型聚合酶的系统和试剂盒。本文进一步提供使用突变型聚合酶的方法,包括用于结合核酸双链体、结合互补核苷酸或结合具有互补核苷酸单元的多价分子、掺入互补核苷酸或掺入互补核苷酸单元、延伸引物和核酸测序的方法,其中所述方法采用本文所描述的突变型聚合酶中的任一者。突变型聚合酶被工程化以表现出所希望的特征,包括与野生型聚合酶相比增加的核苷酸类似物掺入。在一个实施方案中,突变型聚合酶包含由新近鉴别的新颖B家族和A家族聚合酶定向进化得到的多肽或其片段,其中所述突变型聚合酶表现出其特异性的改善,同时维持对于正确沃森-克里克碱基配对的高判别性。一种示例性聚合酶源自于候选深层古细菌目古菌物种(例如SEQ IDNO:1或391),所述物种最早于2018年鉴别。此酶与9°N、Pfu、VENT、DEEP VENT和深海火球菌含有低于42%的序列同一性,指示极高的进化分歧,此可通过以下事实进一步证实:9°N、Pfu、VENT、DEEP VENT和深海火球菌聚合酶在高温(例如>95℃)下具有热稳定性,而候选深层古细菌目古菌聚合酶在低温(例如<75℃)下具有热稳定性并且最佳催化温度为约68℃。在低于75℃的温度下表现出活性的另一示例性聚合酶源自于嗜热脂肪地芽孢杆菌(例如SEQ ID NO:275)。候选深层古细菌目古菌聚合酶在约25-50℃、或约45-75℃、或约65-75℃的温度范围内表现出核苷酸结合和掺入活性。候选深层古细菌目古菌聚合酶在约65-75℃的温度范围内表现出最佳的核苷酸结合和掺入活性。候选深层古细菌目古菌聚合酶为具有中等热稳定性的聚合酶(例如中温聚合酶)。具有含一个或多个突变的候选深层古细菌目古菌序列主链的工程化聚合酶可以用于在约25-50℃、或约45-75℃、或约50-65℃、或约50-60℃温度范围内进行核苷酸结合、核苷酸单元结合、核苷酸掺入、核苷酸单元掺入和/或核酸测序反应。热稳定性聚合酶,诸如9°N、Pfu、VENT、DEEP VENT和深海火球菌聚合酶适用于PCR反应,其中典型循环步骤在超过90-95℃的温度或更高温度下进行。本领域技术人员应了解,本文所描述的热稳定性聚合酶可能不适用于在较低温度范围内,诸如在约25-50℃、或约45-75℃范围内进行的核苷酸结合、核苷酸掺入和/或核酸测序反应。
聚合酶不同地包含DNA聚合酶、RNA聚合酶、模板非依赖性聚合酶、反转录酶或能够催化核苷酸掺入的其他酶。古菌聚合酶通常来源于嗜热生物体,并且因此可表示热稳定性或耐热性酶种类。因此,来源于古菌聚合酶的多肽主链提供所希望的蛋白质工程化靶以进一步增强可通过应用具有增强的热稳定性或另外对诸如反覆暴露于高温、缓冲液条件变化等引起的降解具有增强的抗性的酶来改善的应用中可逆终止剂核苷酸(防止核酸延伸的可移除的化学基团)的掺入。
出人意料地发现,具有候选深层古细菌目古菌序列主链并包含一个或多个突变的工程化聚合酶表现出与野生型聚合酶相比增大的核苷酸类似物掺入率。与野生型候选深层古细菌目古菌聚合酶相比,一些工程化聚合酶表现出一种或多种所希望的特征,包括对具有3'链终止基团的核苷酸类似物增加的结合亲和力、改善的在与含尿嘧啶模板分子相对处掺入dATP核苷酸的能力(例如尿嘧啶耐受性突变型聚合酶)、改善的结合多价分子的互补核苷酸单元的能力和增加的对至多约75℃的热稳定性。还展示,基于嗜热脂肪地芽孢杆菌主链(例如Bst聚合酶)并且包含突变序列的工程化聚合酶表现出改善的核苷酸类似物掺入。
本公开提供工程化聚合酶,其可用于进行采用标记的或未标记的链终止核苷酸的任何核酸测序方法,其中所述链终止核苷酸在糖3'位置处包括3'-O-叠氮基(或3'-O-甲基叠氮基)或任何其他类型的大体积封端基团。举例而言,可使用工程化聚合酶,使用标记的多价分子和未标记的链终止核苷酸进行亲合力测序(SBA)方法。另外,工程化聚合酶还可用于进行采用标记的链终止核苷酸的合成测序(SBS)方法,以及采用未标记的链终止核苷酸的结合测序(SBB)方法。
DNA的亲合力测序(SBA)在理想情况下需要(a)检测n+1个碱基并且需要靶核酸序列的2个或更多个拷贝、与所述靶核酸序列的一个或多个区互补的两个或更多个引物核酸分子以及使所述组合物与多价分子(例如聚合物-核苷酸缀合物)在足以允许所述聚合物-核苷酸缀合物与所述组合物中所述靶核酸序列的所述两个或更多个拷贝之间形成多价结合复合物的条件下接触的两种以上聚合酶,其中聚合物-核苷酸缀合物包含两个或更多个核苷酸部分;随后将检测底物洗掉,并且(b)确保仅单个掺入发生,需要未标记核苷酸的结构改变(‘封端基团’)以确保单个核苷酸掺入,而且接着防止任何其他核苷酸掺入多核苷酸链中。接着,必须在不干扰测序DNA的完整性的反应条件下移除封端基团。测序循环接着可通过N+1次检测接下来的多价聚合酶-缀合物-DNA复合物继续等等。为了实际使用,亲合力步骤需要(a)保持足够长时间以成像>30秒的稳定底物和(b)步进步骤,由此整个方法应由高产率、高度特异性化学和酶步骤组成以便于进行多个循环的测序。
DNA的合成测序(SBS)在理想情况下需要在与测序寡核苷酸相对处控制性(即,一次一个地)掺入正确互补核苷酸。此允许在一次一个地对各核苷酸残基测序时,通过分多个循环添加核苷酸来进行准确测序,由此防止发生不受控制的连续掺入。掺入的核苷酸使用与的附接的适当标记读取,随后移除标记部分且随后进行下一轮测序。为确保仅发生单一掺入,需要对正在测序的核苷酸进行结构改变(‘封端基团’)以确保单个核苷酸掺入,而且接着阻止任何其他核苷酸掺入多核苷酸链中。接着,必须在不干扰测序DNA的完整性的反应条件下移除封端基团。接着,测序循环可通过掺入下一个封端的、标记的核苷酸继续。为便于实际使用,整个方法应由高产率、高度特异性的化学和酶步骤组成以便于进行多个循环的测序。
结合测序(SBB)需要包括以下步骤的核酸测序方法:(a)使引发的模板核酸与依序至少两种独立混合物在三元复合物稳定性条件下接触,其中所述至少两种独立混合物各自包括聚合酶和核苷酸,其中所述依序接触使得引发的模板核酸在三元复合物稳定性条件下与模板中第一、第二和第三碱基类型的核苷酸同源物接触;(b)检查所述至少两种独立混合物以确定是否形成三元复合物;以及(c)鉴别用于所述引发的模板核酸分子的下一个正确核苷酸,其中如果在步骤(b)中检测到三元复合物,则所述下一个正确核苷酸为鉴别为所述第一、第二或第三碱基类型的同源物,并且其中基于步骤(b)中不存在三元复合物,则所述下一个正确核苷酸作为第四碱基类型的核苷酸同源物输入;(d)在步骤(b)之后,将下一个正确核苷酸添加至引发的模板核酸的引物中,由此产生延伸的引物;以及(e)对包含延伸的引物的引发的模板核酸重复步骤(a)至(d)。
本文所描述的多肽包括但不限于具有酶活性,诸如具有聚合酶活性多肽,并且通常以家族描述。通常,聚合酶为DNA聚合酶、RNA聚合酶、模板非依赖性聚合酶、反转录酶或能够进行核苷酸结合和核苷酸掺入(例如引物延伸)的其他酶。许多DNA聚合酶为本领域中已知的,并且在一些情况下,所述酶突变产生本文所描述的组合物。DNA聚合酶家族的成员通常以聚合酶活性、活性位点结构、结构域同源性/功能或与其他已知DNA聚合酶家族成员的序列同源性定义。举例而言,DNA聚合酶包括但不限于大肠杆菌DNA聚合酶I、大肠杆菌DNA聚合酶II或DNA聚合酶家族的其他成员。已知的热稳定性DNA聚合酶包括Taq聚合酶、Pfu聚合酶和9°N聚合酶或DNA聚合酶家族的其他成员。野生型DNA聚合酶为或可获自多种来源,诸如真核、原核或病毒来源,并且在一些实施方案中,出于本公开的目的,来自古菌来源。在一些实施方案中,包含SEQ ID NO:1-274和288-375和385-397中的任一者的氨基酸序列的聚合酶为DNA聚合酶家族的成员。
本文进一步提供包含与SEQ ID NO:1或391具有至少85%同一性并且根据SEQ IDNO:1或391中的残基编号在多肽序列的位置403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567处具有至少一个突变的序列的多肽。在一些情况下,本文所描述的多肽包含与SEQ ID NO:1或391具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性的序列。在一些情况下,本文所描述的多肽包含与SEQ ID NO:1或391具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性并且根据SEQ ID NO:1的编号在位置403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567处具有至少一个突变的序列。在一些实施方案中,本文公开与SEQ ID NO:1或2-268或288-375或385-397中的任一者具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性并且在与SEQ ID NO:1、393或391的位置403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567中的一者或多者类似的位置处具有至少一个突变的多肽。
本文进一步提供包含与SEQ ID NO:1或391具有至少85%同一性并且根据SEQ IDNO:1或391中的残基编号在多肽序列的位置G403、H405、D406、R414、S415、L416、Y417、P418、R468、A493、K495、N499、M501、Y502、F507、R515、I529和/或N567处具有至少一个突变的序列的多肽。在一些情况下,本文所描述的多肽包含与SEQ ID NO:1或391具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性的序列。在一些情况下,此多肽还根据SEQ ID NO:1、393或391的编号在位置G403、H405、D406、R414、S415、L416、Y417、P418、R468、A493、K495、N499、M501、Y502、F507、R515、I529和/或N567处具有至少一个突变。在一些实施方案中,本文公开与SEQ ID NO:1或2-268或288-375或385-397中的任一者具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性并且在与SEQ ID NO:1或391的位置G403、H405、D406、R414、S415、L416、Y417、P418、R468、A493、K495、N499、M501、Y502、F507、R515、I529和/或N567中的一者或多者类似的位置处具有至少一个突变的多肽。在一些实施方案中,突变多肽根据SEQ ID NO:1、393或391中的氨基酸残基编号在多肽序列的以下位置处还包含至少一个突变:D9、Y10、I11、E14、E27、F37、M41、H48、P45、L50、K51、Q54、K58、K61、I63、I68、E73、D75、E77、M84、Q87、V91、G96、E102、K105、V107、A115、E116、L124、P126、N132、M142、R170、E179、D191、E205、K225、V239、R256、I272、E291、D305、E308、E310、E328、I343、T344、S372、E434、Y448、V465、R467、G474、N480、R483、D488、A498、S500、M501、Y502、R509、E516、S520、K538、F539、D560、V564、M565、A568、E569、D573、K574、S577、E578、E581、M583、K610、T618、D636、N657、T675、K682、V689、E700、N705、S717、E730、S746、E758、K762、G763、L764、G765、K766、Q767和/或F773。
本公开提供包含与聚合酶相关的突变多肽的组合物和方法,所述聚合酶表现出与野生型聚合酶相比增加的结合和判别核苷酸类似物的能力,和改善的核苷酸类似物掺入。核苷酸类似物包括例如包含附接至糖2'或3'位置的链终止基团的核苷酸。链终止基团包含叠氮化物、叠氮基或叠氮基甲基、或另一类型的链终止基团。与具有SEQ ID NO:1或391的氨基酸序列的野生型聚合酶相比,工程化DNA聚合酶表现出增加的核苷酸类似物掺入率。表1(图3A至图3H)中所示的数据提供表现出增加的核苷酸类似物掺入率的多种示例性突变型聚合酶。
本公开提供包含突变型聚合酶的组合物和方法,所述突变型聚合酶与具有SEQ IDNO:1或391的氨基酸序列的野生型聚合酶相比具有增加的热稳定性。
本公开提供包含突变型聚合酶的组合物和方法,所述突变型聚合酶可用于对含尿嘧啶的核酸模板分子测序。突变型聚合酶可表现出尿嘧啶耐受性,其具有增加的将dATP掺入核酸引物3'端与核酸模板分子中的尿嘧啶碱基相对的位置处的能力。突变型聚合酶还能够在与核酸模板分子中的尿嘧啶碱基相对的位置处结合多价分子的带有腺嘌呤的核苷酸单元。表现出尿嘧啶耐受性的示例性突变型聚合酶包含SEQ ID NO:361、362、363、364、366、367、374或375中的任一者或SEQ ID NO:385-397中的任一者的氨基酸序列。
本文所描述的聚合酶中的突变不同地包含多肽中存在的氨基酸残基的一个或多个变化。添加、取代或缺失为用于产生突变多肽的突变的所有实例。在一些实施方案中,取代包含一个氨基酸交换为替代性氨基酸,并且所述替代氨基酸在大小、形状、构形或化学结构方面均不同于原始氨基酸。在一些实施方案中,突变为保守性或非保守性的。保守性突变包含一个氨基酸被具有类似化学特性的氨基酸取代。添加通常包含在多肽的N末端、C末端或内部位置插入一个或多个氨基酸。在一些情况下,添加包含融合多肽,其中一个或多个额外多肽联接至所述多肽。在一些实施方案中,所述额外多肽包含具有额外活性的结构域、或具有额外功能(例如改善表达、帮助纯化、改善溶解度、附接至固体支撑物或其他功能)的序列。通常,本文所描述的多肽包含一个或多个非氨基酸基团。融合多肽任选地包含联接一种或多种蛋白质的氨基酸或其他化学接头。可将任何数目的突变引入本文所描述的多肽或多肽的部分中,诸如1、2、3、4、5、6、7、8、9、10、20、50个或超过50个突变。
在一些实施方案中,完整结构域(具有确定功能的多肽的部分)为添加、缺失或被来自其他多肽的结构域取代。示例性结构域包括DNA/RNA结合结构域、核苷酸结合结构域、核酸酶结构域、亚细胞定位结构域(诸如核定位结构域)或其他结构域。在一些实施方案中,本公开的方法和组合物包含充当间隔区或标记的附接结构域,和/或提供接头(诸如SNAP标签、抗生物素蛋白部分、链霉抗生物素蛋白部分、抗原决定基标签、荧光蛋白、亲和标签、金属结合(即,His6(SEQ ID NO:398)或聚组氨酸标签),或类似物)的附接。在一些实施方案中,催化位点或结合结构域中存在一个或多个突变。举例而言,多肽包含如SEQ ID NO:1中所公开的核酸结合结构域。在一些情况下,结构域包含DNA或RNA结合位点,例如其包含在SEQ ID NO:1的位置354-773处的残基、或者残基249-253、392-396、598-601、613-615、673-676和/或681-683。在将其他序列与SEQ ID NO:1比对之后,可在类似位置发现所述位点(例如参见图7A至图7B、图8A至图8C、图9A至图9B、图10A至图10B、图11A至图11B、图12A至图12B和图13A至图13B)。在一些实施方案中,结构域包括含在SEQ ID NO:1的位置1-135、136-347、348-454、455-504、505-624或625-773处的残基或其位置等效物的聚合酶结构域(例如参见图6A至图6C的表4,以及图7A至图7B、图8A至图8C、图9A至图9B、图10A至图10B、图11A至图11B、图12A至图12B和图13A至图13B)。在一些情况下,多肽包含活性位点。多肽的活性位点可包含SEQ ID NO:1的残基D412、D547和/或D549或其位置等效物(例如参见图6A至图6C的表4,以及图7A至图7B、图8A至图8C、图9A至图9B、图10A至图10B、图11A至图11B、图12A至图12B和图13A至图13B)。通常在其他结构域中的类似位置处发现所述位点(例如通过比对供比较的两个或更多个序列所鉴别)并且包含所述结构域的多肽与本文所描述的方法和组合物相符。
如本文所使用,术语氨基酸残基或序列位置“周围”具有其在本领域中的普通含义,包括且掺入在距指定残基1、2、3、4、5、6、7、8、9、10、11或12个或更多个残基远(即,在指定残基N末端或C末端)的残基处的修饰,诸如取代、缺失、插入或翻译后修饰。在一些情况下,本领域普通技术人员应理解,基于序列或结构(即,3维)背景,在指定残基N或C末端超过12个残基或序列位置的残基可被视为在指定残基“周围”。
应理解,本文所描述的残基的取代或修饰还可掺入或可包括本领域中已知的非标准氨基酸,包括但不限于羟脯氨酸、N-甲酰甲硫氨酸、硒代甲硫氨酸、硒代半胱氨酸、磷酸酪氨酸、磷酸组氨酸和类似氨基酸。本文所描述的突变、修饰、截短、取代和类似处理可通过本领域中已知的任何方法,特别是分子生物学和/或蛋白质工程技术中已知的任何方法进行。所述方法可包括使用突变诱发和/或部分简并的引物进行的定点突变诱发、活体外基因组装、基因编辑(诸如通过CRISPR或相关方法)和类似方法。本文所描述的突变型蛋白质或工程化蛋白质可另外通过如本领域中已知的任何手段表达、分离和/或纯化。相关方法描述于以下中:Green,M.和Sambrook,J.,Molecular Cloning:A Laboratory Manual(第四版),所述文献整体并且尤其是其有关修饰、转移和表达重组、修饰的和工程化基因序列以及提取、分离和/或纯化工程化蛋白质的方法的公开内容以引用的方式并入本文中。
已显示,本文所公开的多肽用作核苷酸聚合酶,所述核苷酸聚合酶表现出与野生型酶相比较高的热稳定性、较高的3'-O-叠氮基甲基衍生化核苷掺入率和/或增加的尿嘧啶耐受性。本文所公开的多肽可用于在复制或合成期间伸长核酸,或可通过例如使用不可掺入或封端的核苷酸而滞留在核苷酸添加位点处,或可在不存在所需盐或辅因子的条件下使用。本文所公开的多肽可用于例如多核苷酸测序应用,诸如合成测序和结合测序应用。
本公开提供包含B家族聚合酶的氨基酸序列主链的工程化DNA聚合酶,其通常包括表现出改善的核苷酸类似物掺入的复制性聚合酶。B家族型聚合酶的实例包括B家族古菌DNA聚合酶和Phi29聚合酶。在一些实施方案中,工程化DNA聚合酶包含B家族古菌DNA聚合酶,其可选自热球菌属(Thermococcus)、火球菌属(Pyrococcus)、甲烷球菌属(Methanococcus)或候选菌(Candidatus)。在一些实施方案中,工程化DNA聚合酶包含来自候选深层古细菌目古菌DNA聚合酶、9°N聚合酶(包括THERMINATOR聚合酶)、VENT聚合酶、DEEP VENT聚合酶、Pfu聚合酶、深海火球菌聚合酶或RB69聚合酶的氨基酸序列主链。在一些实施方案中,工程化DNA聚合酶可基于包括地芽孢杆菌属(例如嗜热脂肪地芽孢杆菌)在内的A家族型聚合酶的氨基酸序列主链。
工程化DNA聚合酶可通过将一个或多个突变引入感兴趣DNA聚合酶(例如野生型或突变型聚合酶)的氨基酸序列中来设计和制备并且可确定由此得到的工程化聚合酶的表型。任一个突变位点或者两个或更多个突变位点的任何组合可从一种类型聚合酶转移至另一种类型聚合酶的位置等效的位点上。举例而言,可将来自候选深层古细菌目古菌DNA聚合酶的任一个突变位点或者两个或更多个突变位点的任何组合引入9°N聚合酶(包括THERMINATOR聚合酶)、VENT聚合酶、DEEP VENT聚合酶、Pfu聚合酶、深海火球菌聚合酶和/或RB69聚合酶中位置等效的位点中(例如参见图6A至图6C的表4)。所述突变包括任一个氨基酸取代、插入、缺失和/或截短,或两个或更多个氨基酸取代、插入、缺失和/或截短的任何组合。
残基的功能等效物包含占据酶(例如DNA聚合酶)的序列(例如序列比对)和/或三维结构中类似位置的一个或多个氨基酸残基,并且执行与已知酶中的已知氨基酸残基实质上相同的功能。功能等效的氨基酸取代包括在另一多肽中具有相同功能作用的基础多肽中的特定位置处的一个或多个氨基酸残基。功能等效的氨基酸取代包括保守性和/或非保守性氨基酸取代中的任一者或任何组合。图6A至图6C的表4列出在候选深层古细菌目古菌DNA聚合酶中的位点以及例如在9°N DNA聚合酶(相对于SEQ ID NO:280或281)、THERMINATOR(相对于SEQ ID NO:282)、VENT DNA聚合酶(相对于SEQ ID NO:283)、DEEP VENT DNA聚合酶(相对于SEQ ID NO:284)、Pfu DNA聚合酶(相对于SEQ ID NO:285)、深海火球菌DNA聚合酶(相对于SEQ ID NO:286)和嗜热脂肪地芽孢杆菌DNA聚合酶(相对于SEQ ID NO:275)中的功能等效的氨基酸位点处的氨基酸残基的实例。
野生型多肽序列通常为蛋白质或酶工程化以产生突变多肽的起点。在一些实施方案中,突变多肽与野生型多肽的不同之处为至少一个氨基酸残基。通常,突变多肽与最接近的野生型多肽的不同之处为至少一个氨基酸残基。在一些实施方案中,突变多肽与野生型多肽的不同之处为至少两个氨基酸残基。在一些实施方案中,突变多肽与野生型多肽的不同之处为至少三个、四个、五个或至少六个氨基酸残基。通常,野生型序列通过在野生型序列内比对包含至少一个突变的多肽所鉴别的最接近的野生型序列。在一些实施方案中,野生型多肽序列包括天然存在的多肽的序列。
氨基酸取代是指将多肽中所选位置处的氨基酸残基置换为具有类似或不同生物化学特性,诸如具有类似大小、形状、构形、化学结构、电荷和/或疏水性的不同氨基酸。氨基酸取代可为保守性或非保守性氨基酸置换。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有极性侧链的氨基酸置换。具有极性侧链的氨基酸的实例包括精氨酸、天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、丝氨酸和苏氨酸。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有非极性侧链的氨基酸置换。具有非极性侧链的氨基酸的实例包括丙氨酸、半胱氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、色氨酸、酪氨酸和缬氨酸。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有疏水性侧链的氨基酸置换。具有疏水性侧链的氨基酸的实例包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、酪氨酸和色氨酸。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有不带电侧链的氨基酸置换。具有不带电侧链的氨基酸的实例包括甘氨酸、丝氨酸、半胱氨酸、天冬酰胺、谷氨酰胺、酪氨酸和苏氨酸。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有带正电侧链的氨基酸置换。具有带正电侧链的氨基酸的实例包括精氨酸、组氨酸和赖氨酸。在一些实施方案中,在多肽中所选位置处的氨基酸残基可被具有带负电侧链的氨基酸置换。具有带负电侧链的氨基酸的实例包括天冬氨酸和谷氨酸。
本公开提供来自候选深层古细菌目古菌的突变型聚合酶,其包含SEQ ID NO:1或391的主链氨基酸序列并且在包括以下的一个或多个位置处具有氨基酸取代突变:F22、E26、V34、A35、K52、K58、I72、E79、M84、C104、I112、C130、E150、S162、C269、I272、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、M501、Y502、F507、C514、R515、C517、T522、I529、N567、E569、S577、R608、K610、L611、D622、K633、V651、D653、T660、A669、Q673、T683、R697、S717、R723、I750、L751和/或E760。在一些实施方案中,氨基酸取代突变还可包括位置D141和E143。在一些实施方案中,突变型聚合酶根据SEQ ID NO:1、393或391中的残基编号在多肽序列的以下位置处还包含至少一个突变:D9、Y10、I11、E14、E27、F37、M41、P45、H48、L50、K51、Q54、K61、I63、I68、E73、D75、E77、M84、Q87、V91、G96、E102、K105、V107、A115、E116、L124、P126、N132、M142、R170、E179、D191、E205、K225、V239、R256、I272、E291、D305、E308、E310、E328、I343、T344、S372、E434、Y448、V465、R467、G474、N480、R483、D488、A498、S500、Y502、R509、E516、S520、K538、F539、D560、V564、M565、A568、D573、K574、E578、E581、M583、D680、T618、D636、N657、T675、E680、K682、V689、E700、N705、S717、E730、S746、E758、K762、G763、L764、G765、K766、Q767和/或F773。在一些实施方案中,突变型聚合酶在C末端还包含额外氨基酸,其包含如SEQ ID NO:391中所示的序列QGSYT(单字母代码)。
在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含具有包括以下的任一个氨基酸取代或者两个或更多个氨基酸取代的任何组合的SEQ ID NO:1或391的氨基酸序列:F22L、E26G、V34I、A35E、A35T、K58M、I72F、E79K、E79V、M84T、C104S、I112F、C130S、C130R、E150K、S162S、C269S、C269V、I272N、P335Q、G355S、E370D、D381Y、G403A、H405P、H405S、D406H、R414S、S415A、S415G、S415V、L416V、L416G、L416T、L416A、L416S、L416I、L416F、L416Y、L416M、Y417T、Y417S、Y417G、Y417A、Y417V、Y417I、P418S、P418G、P418V、P418C、P418K、P418I、P418T、P418A、D439S、S440N、S443N、C450S、R468A、R468V、R468S、R468K、R468H、R468G、K473A、V489I、Q492R、492C、Q492F、Q492A、Q492G、A493V、A493S、L494V、K495G、K495A、K495Q、K495S、K495V、L496A、L496G、L496S、L496R、L496H、L496N、L496I、L496M、L496C、L496Y、N499G、N499A、N499S、N499V、M501I、Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H、Y502F、F507S、C514S、R515L、R515W、R515Y、R515P、R515F、C517S、T522S、T522A、I529H、I529T、I529V、I529S、I529G、I529A、I529L、I529F、N567D、E569G、S577I、R608K、K610E、L611S、D622T、K633R、V651M、D653G、T660S、T683A、A669D、Q673I、R697G、S717G、R723H、I750V、L751M和/或E760G。在一些实施方案中,氨基酸取代突变还可包含D141A和E143A。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶还包含包括以下的任一个氨基酸取代或者两个或更多个氨基酸取代的任何组合(根据SEQ ID NO:1、393或391编号):D9N、Y10F、I11F、E14K、E14G、E27R、F37S、M41L、P45S、H48R、L50P、K51R、Q54L、K58R、K61E、I63T、I63V、I68V、E73K、D75N、E77G、M84L、Q87H、V91Q、G96S、E102R、K105R、V107I、A115V、E116G、L124Q、P126S、N132S、M142L、R170H、E179R、D191G、E205K、K225E、V239I、R256H、R256K、I272V、E291R、D305N、E308R、E310R、E328Q、I343V、T344I、S372N、E434R、Y448H、V465M、R467C、G474S、G474D、N480I、R483H、D488N、A498G、S500G、M501V、Y502F、R509H、E516G、S520N、S520G、K538R、F539Y、D560G、D560E、V564I、M565V、A568V、D573N、K574R、E578N、E581G、M583K、T618A、D636G、N657D、T675A、E680D、K682I、V689A、E700K、N705D、N705S、S717N、E730R、S746C、E758R、K762R、G763V、G763S、L764W、G765A、K766S、Q767K和/或F773S。在一些实施方案中,突变型聚合酶在C末端还包含额外氨基酸,其包含如SEQ ID NO:391中所示的序列QGSYT(单字母代码)。
本文进一步描述较大多肽的区段或部分。任选地,区段具有催化活性,诸如核苷酸掺入和核酸延伸活性,特别是在如本文所描述的反转录酶结构域或聚合酶结构域的情形中。本文描述包含来源于SEQ ID NO:1-391的任何子集的任一个区段和在N末端或C末端的至少一个额外残基(例如+1个残基)的多肽。
在一些实施方案中,N和C末端具有至少一个额外残基、两个、三个、四个、五个、六个、七个、八个、九个、十个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个或超过100个额外残基。举例而言,本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端天冬氨酸、相邻C末端精氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端谷氨酰胺、相邻C末端组氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端缬氨酸、相邻C末端半胱氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端苏氨酸、相邻C末端半胱氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ IDNO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端天冬氨酸、相邻C末端亮氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端天冬氨酸、相邻C末端精氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端苏氨酸、相邻C末端苏氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端苏氨酸、相邻C末端天冬酰胺或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ ID NO:1所鉴别的残基。本文描述的多肽包含SEQ ID NO:1和2-391中的任一者(+1个残基),诸如相邻N末端苏氨酸、相邻C末端丝氨酸或其组合,或额外残基,诸如在考虑贡献至包含SEQ ID NO:1的多肽的单一突变残基或其他残基情况下,经由比对SEQ ID NO:1和2-391中的任一者与SEQ IDNO:1所鉴别的残基。
本公开提供来自嗜热脂肪地芽孢杆菌(例如SEQ ID NO:275-279)的聚合酶。在一些实施方案中,本公开提供一种或多种多肽,其在或在约SEQ ID NO:275的位置314、332、334、368、381、385、417、434、454、471、528、601、615、635、649、654、655、656、657、658、659、665、680、682、702、706、707、710、714、758、760和/或829或其任何组合处具有一个或多个突变,诸如取代、缺失或插入。本文进一步提供多肽,其包含与SEQ ID NO:275具有至少85%同一性并且根据SEQ ID NO:275中的残基编号在多肽序列的以下位置处具有至少一个突变的序列:314、332、334、368、381、385、417、434、454、471、528、601、615、635、649、654、655、656、657、658、659、665、680、682、702、706、707、710、714、758、760和/或829。在一些情况下,本文所描述的多肽包含与SEQ ID NO:275具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性的序列。在一些情况下,本文所描述的多肽包含与SEQ ID NO:275具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性并且根据SEQ IDNO:275的编号在以下位置处具有至少一个突变的序列:314、332、334、368、381、385、417、434、454、471、528、601、615、635、649、654、655、656、657、658、659、665、680、682、702、706、707、710、714、758、760和/或829。
在一些实施方案中,本文公开一种多肽,其与SEQ ID NO:1-257、288-375和385-397中的任一者具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性并且在与SEQ ID NO:1的位置403、405、406、414、415、416、417、418、468、493、495、499、501、502、507和/或529中的一者或多者类似的位置处具有至少一个突变。
本文进一步提供多肽,其包含与SEQ ID NO:275具有至少85%同一性并且根据SEQID NO:275中的残基编号在多肽序列的以下位置处具有至少一个或更多个突变的序列:R615、Y654、S655、Q656、I657、E658、L659、D680、H682、R702、K706、A707、F710、Y714、H829、D314、I332、I334、K368、K381、I385、K417、K434、I454、D471、I528、K601、K635、I649、I665、K758和/或K760。在一些情况下,本文所描述的多肽包含与SEQ ID NO:275具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%或99.8%同一性的序列。
本文所描述的示例性多肽突变体列于表1(图3A至图3H)、表2(图4A至图4E)和表3(图5A至图5E)中。在一些实施方案中,本文所描述的多肽具有与SEQ ID NO:1或391具有至少85%同一性并且进一步表现出表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)中所示突变中的至少一者的序列。在一些实施方案中,本文所描述的多肽具有与SEQ IDNO:1或2-274或288-375或385-397中的任一者具有显著同一性、或至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或更高序列同一性并且进一步表现出表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)中所示突变中的至少一者的序列。本文涵盖和公开的额外多肽包含DNA聚合酶结构域,其在与表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)中的至少一个位置,直至并包括表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)中指示的所有位置类似的位置处具有至少一个突变,在一些情况下达到在同源位置处具有表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)中所示突变中的一者或多者的多肽。
表1、表2和表3以不同符号表示各种突变型变体相对于来自候选深层古细菌目古菌的野生型(SEQ ID NO:1)DNA聚合酶的相对掺入活性。符号“0”表示基于实验数据,突变型变体与野生型相比具有不显著的掺入活性或不具有明显增强的掺入活性。符号“+”表示基于实验数据,突变型变体与野生型相比具有一定程度增强的掺入活性。符号“++”表示基于实验数据,突变型变体与野生型相比具有高度增强的掺入活性。
在一些实施方案中,一种或多种突变型变体表现出增加的平均掺入率,其平均掺入率是具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少5倍。在一些实施方案中,一种或多种突变型变体表现出增加的平均掺入率,其平均掺入率是具有SEQ IDNO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少10倍。在一些实施方案中,一种或多种突变型变体表现出增加的平均掺入率,其平均掺入率是具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少20倍。在一些实施方案中,一种或多种突变型变体表现出增加的平均掺入率,其平均掺入率是具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少50倍。
本公开提供来自候选深层古细菌目古菌的聚合酶,其在某些结构域中被突变以改善核苷酸类似物的结合和/或掺入。举例而言,参见SEQ ID NO:269-274。
举例而言,包含SEQ ID NO:269的氨基酸序列的N末端结构域可在以下一个或多个位置处突变:Y10、K58、V91、C104和/或C130。在一些实施方案中,包含SEQ ID NO:269的氨基酸序列的结构域包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:Y10F、Y10A、Y10V、Y10I、Y10L、Y10M、Y10W、K58M、V91Q、V91A、V91I、V91L、V91M、V91F、V91Y、V91W、V91S、V91T、V91N、C104S、C130S和/或C130R。
包含SEQ ID NO:270的氨基酸序列的外切核酸酶结构域可在以下一个或多个位置处突变:D141、E143、C269和/或P335Q。在一些实施方案中,包含SEQ ID NO:270的氨基酸序列的结构域包含氨基酸取代D141A、E143A、C269S和/或P335中的任一者或者两者或更多者的任何组合。在一些实施方案中,氨基酸取代突变可包括D141A和E143A以敲除3'至5'外切核酸酶活性(例如校正活性)。
在一些实施方案中,包含SEQ ID NO:271的氨基酸序列的掌型(palm)(1)结构域(例如第一掌型结构域)可在以下一个或多个位置处突变:G355、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443和/或C450。在一些实施方案中,包含SEQ ID NO:271的氨基酸序列的结构域(例如第一掌型结构域)包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:G355S、E370、D381Y、G403A、H405P、H405S、D406H、R414S、S415A、L416V、L416G、L416T、L416A、L416S、L416I、L416F、L416Y、L416M、Y417T、Y417S、Y417G、Y417A、Y417V、Y417I、P418S、P418G、P418V、P418C、P418K、P418I、P418T、P418A、D439S、S440N、S443N和/或C450S。
在一些实施方案中,包含SEQ ID NO:272的氨基酸序列的指结构域(例如指结构域(finger domain))可在以下一个或多个位置处突变:R468、K473、V489、Q492、A493、L494、K495、N499、M501和/或Y502。在一些实施方案中,包含SEQ ID NO:272的氨基酸序列的结构域(例如指结构域)包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:R468A、R468V、R468S、R468K、R468H、R468G、K473A、V489I、Q492R、Q492C、Q492F、Q492A、Q492G、A493V、A493S、L494V、K495G、K495A、K495Q、K495S、K495V、N499G、N499A、N499S、N499V、M501I、Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H和/或Y502F。在一些实施方案中,包含SEQ ID NO:272的氨基酸序列的结构域(例如指结构域)还包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:G474S、G474D、N480I、R483H、D488N、A498G、S500G、M501V和/或Y502F。
在一些实施方案中,包含SEQ ID NO:273的氨基酸序列的掌型(2)结构域(例如第二掌型结构域)可在F507、C514、R515、C517、I529、N567、E569、S577、R608、K610和/或L611的一个或多个位置处突变。在一些实施方案中,包含SEQ ID NO:273的氨基酸序列的域(例如第二掌型结构域)包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:F507S、C514S、R515L、R515W、R515Y、R515P、R515F、C517S、I529H、I529T、I529V、I529S、I529G、I529A、I529L、I529F、N567D、E569G、S577I、R608K、K610E、L611S和/或D622。在一些实施方案中,包含SEQ ID NO:273的氨基酸序列的域(例如第二掌型结构域)还包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:E516G、S520N、S520G、K538R、F539Y、D560G、D560E、V564I、M565V、A568V、D573N、K574R、E578N、E581G、M583K和/或D622T。
在一些实施方案中,包含SEQ ID NO:274的氨基酸序列的拇指结构域(thumbdomain)(例如拇指结构域)可在以下一个或多个位置处突变:V651、D653、A669、Q673、E680、R697、S717、R723、I750和/或E760。在一些实施方案中,包含SEQ ID NO:274的氨基酸序列的域(例如拇指结构域)包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:V651M、D653G、E680D、A669D、Q673I、R697G、S717G、R723H、I750V和/或E760G。在一些实施方案中,包含SEQ ID NO:274的氨基酸序列的结构域(例如拇指结构域)还包含以下氨基酸取代中的任一者或者两者或更多者的任何组合:D636G、T675A、K682I、V689A、N705D、S717N、E730R、S746C和/或E758R。
本公开提供来自候选深层古细菌目古菌的聚合酶,其在两个或更多个位置处突变以增加核苷酸类似物的掺入率。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含SEQ ID NO:1或391的氨基酸序列,其具有一个或多个选自由以下组成的组的氨基酸取代突变:L416、Y417、P418、A493和/或I529(例如参见表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)。在一些实施方案中,在位置L416处的氨基酸取代突变包含非极性氨基酸或极性不带电氨基酸。在一些实施方案中,在位置L416处的氨基酸取代突变包含缬氨酸、甘氨酸、苏氨酸、丙氨酸、丝氨酸、异亮氨酸、亮氨酸、苯丙氨酸、酪氨酸或甲硫氨酸。在一些实施方案中,在位置Y417处的氨基酸取代突变包含非极性氨基酸或极性不带电氨基酸。在一些实施方案中,在位置Y417处的氨基酸取代突变包含苏氨酸、丝氨酸、甘氨酸、丙氨酸、缬氨酸、异亮氨酸或酪氨酸。在一些实施方案中,在位置P418处的氨基酸取代突变包含极性不带电氨基酸、非极性氨基酸或带正电氨基酸。在一些实施方案中,在位置P418处的氨基酸取代突变包含丝氨酸、甘氨酸、缬氨酸、半胱氨酸、赖氨酸、异亮氨酸、苏氨酸或脯氨酸。在一些实施方案中,在位置A493处的氨基酸取代突变包含非极性氨基酸或极性不带电氨基酸。在一些实施方案中,在位置A493处的氨基酸取代突变包含缬氨酸或丝氨酸。在一些实施方案中,在位置I529处的氨基酸取代突变包含带正电氨基酸、极性不带电氨基酸或非极性氨基酸。在一些实施方案中,在位置I529处的氨基酸取代突变包含组氨酸、苏氨酸、缬氨酸、丝氨酸、甘氨酸、丙氨酸、亮氨酸、苯丙氨酸。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含具有在位置L416S、Y417A、P418G、A493S和I529H处的氨基酸取代突变的SEQ ID NO:1或391的氨基酸序列。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含具有在位置L416F、Y417A、P418G、A493S和I529H处的氨基酸取代突变的SEQ ID NO:1的氨基酸序列。在一些实施方案中,氨基酸取代突变还可包括D141A和E143A。
在一些实施方案中,根据本公开的多肽可包含单点突变(例如参见表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E))。在一些实施方案中,SEQ ID NO:1或391中的单点突变可包括以下一者或多者:G403A、H405P、H405S、D406H、R414S、S415A、S415G、S415V、L416V、L416G、L416T、L416A、L416S、L416I、L416L、Y417T、Y417S、Y417G、Y417A、Y417V、Y417I、P418S、P418G、P418V、P418C、P418K、P418I、P418T、R468A、R468V、R468S、R468K、R468H、R468G、A493V、K495G、K495A、K495Q、K495S、K495V、N499G、N499A、N499S、N499V、S500G、M501I、Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H、Y502F、F507S、I529H、I529T、I529V、I529S、I529G、I529A、I529L和/或I529F或其任何组合。在一些实施方案中,SEQ ID NO:1或391中的单点突变可包括以下一者或多者:Y502V、Y502S、Y502Q、Y502P、Y502H、Y502G、Y502、Y502A、S415V、S415G、S415A、R468V、R468S、R468K、R468H、R468G、R468A、R414S、L416V、L416S、L416A、I529V、I529S、I529H、I529G、I529A、I529H或其任何组合。
在一些实施方案中,根据本公开的多肽可包含SEQ ID NO:1或391的氨基酸序列,并且所述氨基酸序列包含多个突变,诸如(例如参见表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)),例如以下中的两个或更多个突变:G403A、H405P、H405S、D406H、R414S、S415A、S415G、S415V、L416V、L416G、L416T、L416A、L416S、L416I、L416L、Y417T、Y417S、Y417G、Y417A、Y417V、Y417I、P418S、P418G、P418V、P418C、P418K、P418I、P418T、R468A、R468V、R468S、R468K、R468H、R468G、A493V、K495G、K495A、K495Q、K495S、K495V、N499G、N499A、N499S、N499V、M501I、Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H、Y502F、F507S、I529H、I529T、I529V、I529S、I529G、I529A、I529L和/或I529F或其任何组合。
在一些实施方案中,根据本公开的多肽可包含SEQ ID NO:1或391的氨基酸序列,并且所述氨基酸序列具有双重突变(例如参见表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)),包括例如以下一者或多者:Y417V_P418V、Y417V_P418S、Y417V_P418A、Y417T_P418K、Y417S_P418S、Y417S_P418G、Y417S_P418A、Y417G_P418V、Y417G_P418S、Y417G_P418G、Y417G_P418C、Y417G_P418A、Y417A_P418V、Y417A_P418S、Y417A_P418G、Y417A_P418A、S415V_Y417S、S415V_Y417A、S415V_P418V、S415V_P418S、S415V_P418G、S415V_L416V、S415V_L416S、S415G_Y417V、S415G_Y417S、S415G_P418V、S415G_P418S、S415G_P418G、S415G_P418A、S415G_L416V、S415G_L416S、S415G_L416G、S415G_L416A、S415A_Y417G、S415A_Y417A、S415A_P418G、S415A_L416S、L416V_P418S、L416V_P418G、L416S_Y417G、L416S_Y417A、L416S_P418V、L416S_P418G、L416G_Y417G、L416G_Y417A、L416G_P418G、L416G_P418A、L416A_Y417S、L416A_P418S、L416A_P418G和/或L416A_P418A或其任何组合。
在一些实施方案中,根据本公开的多肽可包含具有三重突变的SEQ ID NO:1或391的氨基酸序列。在一些示例性实施方案中,三重突变(例如参见表1(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)可包含以下一者或多者:Y417V_P418V_Y502S、Y417V_P418G_Y502G、Y417V_P418A_Y502R、Y417S_P418V_Y502R、Y417S_P418G_Y502S、Y417G_P418G_Y502V、Y417G_P418A_Y502N、Y417G_P418A_Y502G、Y417A_P418S_Y502R、G403A_H405S_D406H、A493V_K495V_N499S、A493V_K495V_N499G、A493V_K495V_N499A、A493V_K495S_N499V、A493V_K495S_N499S、A493V_K495S_N499G、A493V_K495Q_N499V、A493V_K495Q_N499G、A493V_K495Q_N499A、A493V_K495G_N499V、A493V_K495G_N499S、A493V_K495G_N499G、A493V_K495G_N499A、A493V_K495A_N499G、A493V_K495A_N499A、A493V_K495S_N499G、L416A_Y417A_P418A、L416A_Y417A_P418G、L416A_Y417A_P418I、L416A_Y417S_P418A、L416A_Y417S_P418G、L416A_Y417S_P418S、L416G_Y417G_P418G、L416I_Y417A_P418G、L416I_Y417A_P418S、L416I_Y417G_P418A、L416I_Y417I_P418V、L416S_Y417A_P418G、L416S_Y417G_P418A、L416T_Y417A_P418A、L416T_Y417G_P418A、L416V_Y417A_P418A、L416V_Y417G_P418G、L416I_Y417S_P418S和/或L416V_Y417V_P418G或其任何组合。
在一些实施方案中,根据本公开的多肽可包含具有四重突变(例如参见(图3A至图3H)、表2(图4A至图4E)或表3(图5A至图5E)的SEQ ID NO:1或391的氨基酸序列。在一些示例性实施方案中,四重突变可包括以下一者或多者:H405P_A493V_K495G_N499A、A493V_K495S_N499A_Y502T、A493V_K495Q_N499G_F507S、A493V_K495G_N499G_M501I、L416A_Y417A_P418A_I529L、L416A_Y417A_P418A_I529H、L416A_Y417A_P418S_I529H、L416A_Y417G_P418A_I529H、L416A_Y417G_P418G_I529H、L416A_Y417G_P418S_I529H、L416G_Y417T_P418S_I529H、L416I_Y417A_P418A_I529L、L416I_Y417A_P418G_I529F、L416I_Y417A_P418S_I529H、L416I_Y417G_P418A_I529L、L416I_Y417S_P418G_I529H、L416L_Y417Y_P418P_I529H、L416S_Y417A_P418G_I529H、L416S_Y417A_P418G_I529F、L416S_Y417A_P418T_I529H、L416S_Y417G_P418G_I529H、L416S_Y417G_P418V_I529H、L416T_Y417A_P418A_I529H、L416T_Y417A_P418G_I529H、L416T_Y417G_P418A_I529H、L416V_Y417A_P418A_I529H、L416V_Y417A_P418G_I529S、L416V_Y417A_P418G_I529T、L416V_Y417A_P418G_I529H、L416V_Y417A_P418S_I529、L416V_Y417G_P418A_I529H、L416V_Y417G_P418G_I529H、L416V_Y417G_P418S_I529H和/或L416V_Y417T_P418S_I529H或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567中的一者或多者处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用19种其他天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。
本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置403处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代G403A。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置405处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代H405P或H405S。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置406处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代D406H。在一些实施方案中,所述一个或多个突变可包括在SEQ IDNO:1、393或391或其任何组合、或其同源物或直向同源物的位置414处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代R414S。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置415处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代S415A、S415G或S415V。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置416处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代L416V、L416G、L416T、L416A或L416S。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置417处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代Y417T、Y417S、Y417G、Y417A、Y417V或Y417I。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置418处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代P418S、P418G、P418V、P418C、P418K、P418I或P418T。在一些实施方案中,所述一个或多个突变可包括在SEQID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置468处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代R468A、R468V、R468S、R468K、R468H或R468G。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置493处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代A493V或A493S。在一些实施方案中,所述一个或多个突变可包括在SEQ IDNO:1、393或391或其任何组合、或其同源物或直向同源物的位置495处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代K495G、K495A、K495Q、K495S或K495V。在一些实施方案中,所述一个或多个突变可包括在SEQID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置499处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代N499G、N499A、N499S或N499V。在一些实施方案中,所述一个或多个突变可包括在SEQ IDNO:1、393或391或其任何组合、或其同源物或直向同源物的位置501处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代M501I。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置502处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H或Y502F。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置507处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代F507S。在一些实施方案中,所述一个或多个突变可包括在SEQ IDNO:1、393或391或其任何组合、或其同源物或直向同源物的位置515处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代R515L、R515W、R515Y、R515P或R515F。在一些实施方案中,所述一个或多个突变可包括在SEQID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置529处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代I529H、I529T、I529V、I529S、I529G、I529A、I529L或I529F。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置567处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括取代N567D。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ IDNO:1、393或391或其任何组合、或其同源物或直向同源物的位置405处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代H405P或H405S。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、406、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置406处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代D406H。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、414、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置414处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代R414S。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、415、416、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置415处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代S415A、S415G或S415V。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、416、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置416处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代L416V、L416G、L416T、L416A、L416S、L416I或L416L。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、417、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置417处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代Y417T、Y417S、Y417G、Y417A、Y417V、Y417I或Y417Y。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、418、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置418处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代P418S、P418G、P418V、P418C、P418K、P418I、P418T或P418P。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、468、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置468处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代R468A、R468V、R468S、R468K、R468H或R468G。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、493、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置493处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代A493V或A493S。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、495、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置495处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代K495G、K495A、K495Q、K495S或K495V。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、499、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置499处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代N499G、N499A、N499S或N499V。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、501、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置501处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代M501I。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、502、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置502处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代Y502T、Y502V、Y502S、Y502R、Y502G、Y502N、Y502A、Y502Q、Y502P、Y502H或Y502F。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、507、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置507处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代F507S。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、502、515、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置515处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代R515L、R515W、R515Y、R515P或R515F。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、529和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置529处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代I529H、I529T、I529V、I529S、I529G、I529A、I529L或I529F。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515和/或567或其任何组合。
在一些实施方案中,本公开的组合物和方法包括一个或多个突变,所述一个或多个突变可影响酶的热稳定性和/或酶接受修饰的底物,诸如本文所公开的3'或5'修饰的底物的能力。在一些实施方案中,所述一个或多个突变可包括在SEQ ID NO:1、393或391或其任何组合、或其同源物或直向同源物的位置567处或其周围位置或部位处的一个或多个取代、缺失或插入。在一些实施方案中,所述一个或多个突变可包括用20种天然氨基酸(即,W、I、M、P、F、G、A、V、L、H、E、R、K、D、N、Y、C、S、T或Q)中的任一者或用本领域技术人员已知的非天然氨基酸进行的所述残基的取代。在一些实施方案中,所述一个或多个突变可包括取代N567D。在一些实施方案中,所述突变可与在其他位置处的一个或多个突变,诸如在以下位置中的任一者处或在其周围位置或部位处的一个或多个取代、缺失或插入组合:403、405、406、414、415、416、417、418、468、493、495、499、501、502、507、515和/或529或其任何组合。
在一些实施方案中,所述方法和组合物提供具有增加的热稳定性并且尤其是增加的对非标准核苷酸(诸如3'-封端核苷酸)掺入的耐受性的聚合酶变体。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性并且具有一个或多个选自以下的突变的多肽:R615K、Y654A、Y654D、Y654E、Y654F、Y654G、S655A、S655G、S655V、Q656A、Q656G、Q656N、Q656S、Q656V、I657A、I657G、I657S、I657V、E658A、E658D、E658G、E658S、E658V、L659A、L659G、L659P、L659S、L659V、D680A、D680G、D680I、D680L、D680N、D680S、D680V、H682A、H682G、H682N、H682Q、H682S、H682V、R702A、R702G、R702H、R702K、R702S、R702V、K706H、K706K、K706R、A707G、A707S、A707T、F710A、F710D、F710E、F710G、F710Q、F710S、F710T、F710V、Y714A、Y714D、Y714E、Y714F、Y714G、Y714S、Y714W、H829A和/或H829G或其任何组合。
在一些实施方案中,所述方法和组合物提供具有增加的对非标准核苷酸(诸如3'-封端核苷酸)掺入的耐受性且尤其是增强的热稳定性的聚合酶变体。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性并且具有一个或多个选自以下的突变的多肽:D314E、I332L、I334L、K368R、K381R、I385L、K417R、K434R、I454L、D471E、I528L、K601R、K635R、I649L、I665L、K758R和/或K760R或其任何组合。
在一些实施方案中,所述方法和组合物提供具有增加的热稳定性并且尤其是增加的对非标准核苷酸(诸如3'-封端核苷酸)掺入的耐受性的聚合酶变体。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性的多肽。在一些实施方案中,本公开的方法和组合物包含一种或多种与SEQ ID NO:2-274或288-375或385-397中的任一者具有100%、至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%、至少98%、至少97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%序列同一性并且具有一个或多个选自以下的突变的多肽:R615K、Y654A、Y654D、Y654E、Y654F、Y654G、S655A、S655G、S655V、Q656A、Q656G、Q656N、Q656S、Q656V、I657A、I657G、I657S、I657V、E658A、E658D、E658G、E658S、E658V、L659A、L659G、L659P、L659S、L659V、D680A、D680G、D680I、D680L、D680N、D680S、D680V、H682A、H682G、H682N、H682Q、H682S、H682V、R702A、R702G、R702H、R702K、R702S、R702V、K706H、K706K、K706R、A707G、A707S、A707T、F710A、F710D、F710E、F710G、F710Q、F710S、F710T、F710V、Y714A、Y714D、Y714E、Y714F、Y714G、Y714S、Y714W、H829A、H829G D314E、I332L、I334L、K368R、K381R、I385L、K417R、K434R、I454L、D471E、I528L、K601R、K635R、I649L、I665L、K758R和/或K760R或其任何组合。
本公开提供来自候选深层古细菌目古菌的聚合酶,其为表现出增加的热稳定性的截短的多肽,例如具有SEQ ID NO:353或354的氨基酸序列的聚合酶。
本公开提供来自候选深层古细菌目古菌的聚合酶,其在两个或更多个位置处突变以增加核苷酸类似物的掺入率。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含SEQ ID NO:1或391的氨基酸序列,所述氨基酸序列具有一个或多个选自由L416、Y417、P418、A493和/或I529组成的组的氨基酸取代突变,并且还包含一个或多个选自由K58、R515、N567、E569、S577、K610和/或S717组成的组的氨基酸取代突变。在一些实施方案中,在位置K58处的氨基酸取代突变包含极性不带电氨基酸。在一些实施方案中,在位置K58处的氨基酸取代突变包含甲硫氨酸。在一些实施方案中,在位置R515处的氨基酸取代突变包含非极性氨基酸或极性不带电氨基酸。在一些实施方案中,在位置R515处的氨基酸取代突变包含亮氨酸、色氨酸、酪氨酸、脯氨酸或苯丙氨酸。在一些实施方案中,在位置N567处的氨基酸取代突变包含带负电氨基酸。在一些实施方案中,在位置N567处的氨基酸取代突变包含天冬氨酸。在一些实施方案中,在位置E569处的氨基酸取代突变包含非极性氨基酸。在一些实施方案中,在位置E569处的氨基酸取代突变包含甘氨酸。在一些实施方案中,在位置S577处的氨基酸取代突变包含非极性氨基酸。在一些实施方案中,在位置S577处的氨基酸取代突变包含异亮氨酸。在一些实施方案中,在位置K610处的氨基酸取代突变包含带负电氨基酸。在一些实施方案中,在位置K610处的氨基酸取代突变包含谷氨酸。在一些实施方案中,在位置S717处的氨基酸取代突变包含非极性氨基酸。在一些实施方案中,在位置S717处的氨基酸取代突变包含甘氨酸。在一些实施方案中,氨基酸取代突变还可包括D141A和E143A。
本公开提供来自候选深层古细菌目古菌的聚合酶,与包含SEQ ID NO:1或391的野生型聚合酶相比,其在两个或更多个位置处突变以增加核苷酸类似物的掺入率。在一些实施方案中,与具有SEQ ID NO:1或391的氨基酸序列的野生型聚合酶相比,突变型聚合酶表现出增加的热稳定性。举例而言,突变型聚合酶在约25-50℃或约45-75℃的温度范围内表现出增加的热稳定性。在一些实施方案中,突变型聚合酶包含与SEQ ID NO:1或2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。突变型聚合酶可包括本段中所描述的特征中的任一者。举例而言,在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含与SEQ ID NO:1、393或391具有至少85%序列同一性、至少90%序列同一性或至少95%序列同一性、或至少96%序列同一性、或至少97%序列同一性、或至少98%序列同一性、或至少99.8%、至少99.7%、至少99.6%、至少99.5%、至少99.4%、至少99.3%、至少99.2%、至少99.1%、至少99%序列同一性或更高百分比序列同一性的氨基酸序列,其中所述突变型DNA聚合酶在选自由以下组成的组的任一个位置或者两个或更多个位置的任何组合处包含氨基酸取代:Leu416、Tyr417、Pro418、Ala493、Arg515、Ile529和Asn567。在一些实施方案中,突变型聚合酶包含氨基酸取代D141A和E143A,其可赋予无外切核酸酶活性。在一些实施方案中,与具有野生型氨基酸主链序列(例如SEQ ID NO:1或391)的聚合酶相比,突变型聚合酶表现出所希望的特征。举例而言,突变型聚合酶表现出增加的热稳定性(Tm)。在另一实例中,突变型聚合酶表现出增加的在糖2'位置处和/或在3'糖位置处包含链终止部分(例如封端部分)的核苷酸类似物的掺入率。在另一实例中,突变型聚合酶表现出增加的尿嘧啶耐受性。本段中所描述的一个或多个特征可出现在本公开所描述的各个实施方案中的任何示例突变型聚合酶中。本段中所描述的特征在本公开通篇称为“示例突变型聚合酶特征”。
本公开提供来自候选深层古细菌目古菌的聚合酶,其在一个或多个位置中突变以增加核苷酸类似物的掺入率。在一些实施方案中,来自候选深层古细菌目古菌的突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397的氨基酸序列中的任一者具有至少80%、85%、90%、95%或更高百分比序列同一性的氨基酸序列。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括9°N DNA聚合酶和THERMINATOR聚合酶。在一些实施方案中,突变型9°N和THERMINATOR聚合酶与SEQ IDNO:280、281或282包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、T55、V106、D132、I264、Y291、P328、S348、L352、K363、E374、G395、W397、D398、R406、S407、L408、Y409、P410、Y431、D432、P435、C442、R460、R465、Y481、R484、A485、I486、K487、I488、N491、F493、Y494、Y499、C506、K507、C509、I521、K559、K561、P569、E600、K602、I603、D614、V643、E645、V661、Q665、R689、R709、I715、I744和/或D754。在一些实施方案中,SEQ ID NO:280的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:Y7、K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及9°N聚合酶、VENT聚合酶、DEEP VENT聚合酶、嗜热脂肪地芽孢杆菌聚合酶、Pfu聚合酶和深海火球菌聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图7A至图7B、图8A至图8C、图9A至图9B、图10A至图10B、图11A至图11B、图12A至图12B和图13A至图13B的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括9°N DNA聚合酶。在一些实施方案中,突变型9°N DNA聚合酶与SEQ ID NO:280包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、T55、V106、D132、I264、Y291、P328、S348、L352、K363、E374、G395、W397、D398、R406、S407、L408、Y409、P410、Y431、D432、P435、C442、R460、R465、Y481、R484、A485、I486、K487、I488、N491、F493、Y494、Y499、C506、K507、C509、I521、K559、K561、P569、E600、K602、I603、D614、V643、E645、V661、Q665、D672、R689、R709、I715、I744和/或D754。在一些实施方案中,在位置129处的氨基酸可为甲硫氨酸或丙氨酸。在一些实施方案中,SEQ ID NO:280的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及9°N聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图7A至图7B的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括9°N DNA聚合酶。在一些实施方案中,突变型9°N DNA聚合酶与SEQ ID NO:281包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、T55、V106、D132、I264、Y291、P328、S348、L352、K363、E374、G395、W397、D398、R406、S407、L408、Y409、P410、Y431、D432、P435、C442、R460、R465、Y481、R484、A485、I486、K487、I488、N491、F493、Y494、Y499、C506、K507、C509、I521、K559、K561、P569、E600、K602、I603、D614、V643、E645、V661、Q665、D672、R689、R709、I715、I744和/或D754。在一些实施方案中,在位置129处的氨基酸可为甲硫氨酸或丙氨酸。在一些实施方案中,SEQ ID NO:281的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及9°N聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图7A至图7B的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括THERMINATORDNA聚合酶。在一些实施方案中,突变型THERMINATOR聚合酶与SEQ ID NO:282包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、T55、V106、D132、I264、Y291、P328、S348、L352、K363、E374、G395、W397、D398、R406、S407、L408、Y409、P410、Y431、D432、P435、C442、R460、R465、Y481、R484、A485、I486、K487、I488、N491、F493、Y494、Y499、C506、K507、C509、I521、K559、K561、P569、E600、K602、I603、D614、V643、E645、V661、Q665、D672、R689、R709、I715、I744和/或D754。在一些实施方案中,在位置129处的氨基酸可为甲硫氨酸或丙氨酸。在一些实施方案中,SEQ ID NO:282的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶和THERMINATOR聚合酶的位置等效的氨基酸位置对应于图6A至图6C中所示的表4中所列的9°N聚合酶的位置。还参见图7A至图7B的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括VENT DNA聚合酶。在一些实施方案中,突变型VENT DNA聚合酶与SEQ ID NO:283包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、K61、V106、D132、V266、G293、P330、S350、L354、A365、E376、G398、W400、E401、R409、S410、L411、Y412、P413、Y434、D435、P438、C445、R463、K468、Y484、R487、A488、I489、K490、L491、N494、I496、Y1035、Y1040、S1047、K1048、C1050、I1062、K1490、K1492、S1500、E1531、R1533、I1534、D1545、V1574、D1576、V1592、Q1596、D1604、R1620、K1640、I1646、I1675和/或D1685。在一些实施方案中,SEQ ID NO:283的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及VENT聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图8A至图8C的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括DEEP VENTDNA聚合酶。在一些实施方案中,突变型DEEP VENT DNA聚合酶与SEQ ID NO:284包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、K61、V106、D132、I264、Y291、P328、S348、L352、E363、E374、G396、W398、E399、R407、S408、L409、Y410、P411、Y432、D433、P436、C443、R461、R466、Y482、R485、A486、I487、K488、I489、N492、I494、Y1032、Y1037、C1044、K1045、C1047、I1059、K1097、L1099、A1107、E1138、K1140、I1141、D1152、V1181、E1183、V1199、Q1203、E1210、R1227、P1247、I1253、I1282和/或D1292。在一些实施方案中,SEQ ID NO:284的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及DEEP VENT聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图9A至图9C的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括Pfu DNA聚合酶。在一些实施方案中,突变型Pfu DNA聚合酶与SEQ ID NO:285包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、K61、V106、E150、I264、Y291、P328、S348、L352、E363、E374、G396、W398、E399、R407、S408、L409、Y410、P411、Y432、D433、P436、C443、R461、T466、Y482、K485、A486、I487、K488、L489、N492、F494、Y495、Y500、C507、K508、C510、I522、K560、L562、S570、E601、K603、V604、D615、V644、E646、A662、Q666、E673、K690、P710、I716、I745和/或D755。在一些实施方案中,SEQ ID NO:285的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及Pfu聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图11A至图11B的序列比对。
本公开提供在一个或多个位置中突变的古菌B家族DNA聚合酶,包括深海火球菌DNA聚合酶。在一些实施方案中,突变型深海火球菌DNA聚合酶与SEQ ID NO:286包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:Y7、K61、V106、N132、I264、Y291、P328、S348、L352、E363、E374、G396、W398、E399、R407、S408、L409、Y410、P411、Y432、D433、P436、C443、R461、K466、Y482、R485、A486、I487、K488、I489、N492、Y494、Y495、Y500、C507、K508、C510、I522、K559、L561、S569、E600、K602、I603、D614、V643、E645、V661、Q665、E672、K689、P709、I715、I744和/或D754。在一些实施方案中,SEQ ID NO:286的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:2-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及深海火球菌聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图12A至图12B的序列比对。
本公开提供在一个或多个位置中突变的古菌A家族DNA聚合酶,包括嗜热脂肪地芽孢杆菌DNA聚合酶。在一些实施方案中,突变型嗜热脂肪地芽孢杆菌DNA聚合酶与SEQ IDNO:275包含至少80%、85%、90%、95%或更高百分比序列同一性,包括在以下位置处的一个或多个氨基酸取代突变:G10、D59、A97、Q123、S240、G277、E325、G342、R343、E349、A359、G384、E386、L387、L394、L395、L396、A397、A398、E420、A421、S424、K431、K450、W455、K476、Q479、P480、L481、A482、A483、A486、M488、E489、V493、G504、S505、L507、N527、N573、L575、S585、E632、R634、K635、D647、I689、H691、A707、G711、D718、P744、Y772、S799、V828和/或E840。在一些实施方案中,SEQ ID NO:275的一个或多个氨基酸取代分别在位置上等效于在包含SEQ ID NO:1-274或288-375或385-397中任一者的氨基酸序列的候选深层古细菌目古菌聚合酶的以下位置处的氨基酸取代:K58、C104、C130、C269、R296、P335、G355、R359、E370、D381、G403、H405、D406、R414、S415、L416、Y417、P418、D439、S440、S443、C450、R468、K473、V489、Q492、A493、L494、K495、L496、N499、S500、M501、Y502、F507、C514、R515、C517、I529、N567、E569、S577、R608、K610、L611、D622、V651、D653、A669、Q673、R697、S717、R723、I750和E760。在一些实施方案中,候选深层古细菌目古菌聚合酶以及嗜热脂肪地芽孢杆菌聚合酶的位置等效的氨基酸位置列于图6A至图6C中所示的表4中。还参见图10A至图10B的序列比对。
本公开提供可操作地连接至可检测的报导因子部分的聚合酶。本文所描述的聚合酶中的任一者均可用可检测的报导因子部分标记,包括具有本文所描述的任何聚合酶的野生型或突变型氨基酸序列主链的聚合酶,包括候选深层古细菌目古菌DNA聚合酶(例如SEQID NO:1-274或288-375或385-397中的任一者)、地芽孢杆菌DNA聚合酶(例如SEQ ID NO:275-279)、9°N DNA聚合酶(例如SEQ ID NO:280和281)、THERMINATOR DNA聚合酶(例如SEQID NO:282)、VENT DNA聚合酶(例如SEQ ID NO:283)、DEEP VENT DNA聚合酶(例如SEQ IDNO:284)、Pfu DNA聚合酶(例如SEQ ID NO:285)、深海火球菌DNA聚合酶(例如SEQ ID NO:286)和RB69 DNA聚合酶(例如SEQ ID NO:287)。在一些实施方案中,可检测的报导因子部分由于化学或物理变化(例如热、光、电、pH、盐浓度、酶活性或邻近事件诸如FRET)而产生可检测的信号。在一些实施方案中,可检测的报导因子部分包含发光部分、荧光部分或淬灭剂。在一些实施方案中,可检测部分包含行为表达如同FRET供体或受体的荧光部分。可检测的报导因子部分可附接至聚合酶的N末端、C末端或任何内部位置。可检测的报导因子部分以不干扰聚合酶结合核酸模板分子、核酸引物或核苷酸的能力的方式附接至聚合酶。可检测的报导因子部分以不干扰聚合酶的催化活性(包含核苷酸掺入)的方式附接至聚合酶。
本公开提供重组融合多肽,其包括可操作地连接至用于亲和纯化、裂解或溶解的外源氨基酸序列中的任一者或者两个或更多个外源氨基酸序列的任何组合的本文所描述的DNA聚合酶中的任一者。在一些实施方案中,重组融合多肽包含本文所描述的野生型和突变型聚合酶中的任一者,和在作为与本文所描述的表4(图6A至图6C)中所示位点位置上等效的突变位点的位点处具有取代突变的聚合酶,包括具有候选深层古细菌目古菌DNA聚合酶(例如SEQ ID NO:1-274或288-375或385-397中的任一者)、地芽孢杆菌DNA聚合酶(例如SEQ ID NO:275-279)、9°N DNA聚合酶(例如SEQ ID NO:280和281)、THERMINATOR DNA聚合酶(例如SEQ ID NO:282)、VENT DNA聚合酶(例如SEQ ID NO:283)、DEEP VENT DNA聚合酶(例如SEQ ID NO:284)、Pfu DNA聚合酶(例如SEQ ID NO:285)、深海火球菌DNA聚合酶(例如SEQ ID NO:286)和RB69 DNA聚合酶(例如SEQ ID NO:287)的氨基酸主链序列的聚合酶。
在一些实施方案中,重组融合多肽包含在N和/或C末端处可操作地连接到至少一个亲和纯化标签序列的本文所描述的野生型和突变型聚合酶中的任一者,其中亲和纯化标签序列包括组氨酸标签(例如六组氨酸标签(SEQ ID NO:398))、FLAG标签、T7标签、StrepII标签、S标签(例如来自胰脏核糖核酸酶A)、HA标签(例如来自人流行性感冒红血球凝集素蛋白质)和/或c-Myc标签。
在一些实施方案中,重组融合多肽包含在N和/或C末端处可操作地连接到至少一个多肽裂解序列的本文所描述的野生型和突变型聚合酶中的任一者,或多肽裂解序列可位于亲和标签序列与聚合酶序列的N末端或C末端之间。在一些实施方案中,多肽裂解序列可用蛋白酶或还原条件识别和裂解。在一些实施方案中,多肽裂解序列包含凝血酶裂解序列、TEV裂解序列(例如来自烟草蚀纹病毒(tobacco etch virus),包括AcTEV和ProTEV)、因子Xa裂解序列、肠激酶裂解序列和SUMO裂解序列(例如小泛素样修饰蛋白,包括Ulp1、Senp2和SUMOstar)。
在一些实施方案中,重组融合多肽包含在N和/或C末端处可操作地连接到至少一个用于改善溶解的外源氨基酸序列的本文所描述的野生型和突变型聚合酶中的任一者,所述外源氨基酸序列包括麦芽糖结合蛋白(MBP)、小泛素样修饰蛋白(SUMO)和麸胱甘肽S-转移酶(GST)。
包含聚合酶的系统
本公开提供一种系统,其包含:一种或多种突变型聚合酶和至少一个具有自引发3'端的核酸模板分子。在一些实施方案中,所述一种或多种突变型聚合酶可结合至或可不结合至所述至少一个具有自引发3'端的核酸模板分子。在一些实施方案中,模板分子的自引发3'端提供核苷酸聚合的起始位点。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
本公开提供一种系统,其包含:一种或多种突变型聚合酶以及至少一个核酸模板分子和至少一个核酸引物。在一些实施方案中,所述一种或多种突变型聚合酶可结合至或可不结合至所述至少一个核酸模板分子和至少一个核酸引物。在一些实施方案中,引物提供核苷酸聚合的起始位点。在一些实施方案中,引物包含聚合酶催化的核苷酸掺入反应的3'可延伸端,或引物包含3'不可延伸端。在一些实施方案中,核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,所述系统包含一种或多种突变型聚合酶,其结合至核酸双链体,所述核酸双链体各自包含与核酸引物杂交的核酸模板,由此形成复合聚合酶。在一些实施方案中,引物提供核苷酸聚合的起始位点。在一些实施方案中,突变型聚合酶结合至具有自引发3'端的核酸模板分子以形成没有独立引物分子的复合聚合酶。在一些实施方案中,核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,所述系统包含一种或多种突变型聚合酶、至少一个核酸模板分子和核苷酸聚合的起始位点,其中所述突变型聚合酶呈溶液形式,所述核酸模板分子呈溶液形式,并且起始位点(例如引物)呈溶液形式。在一些实施方案中,所述系统包含一种或多种突变型聚合酶、至少一个核酸模板分子和核苷酸聚合的起始位点,其中所述系统包含呈溶液形式的突变型聚合酶、呈溶液形式或固定至支撑物的核酸模板分子和呈溶液形式或固定至支撑物的起始位点(例如引物)的任何组合。在一些实施方案中,所述系统包含一种或多种突变型聚合酶、至少一个核酸模板分子和核苷酸聚合的起始位点,其中所述系统包含呈溶液形式或固定至支撑物的突变型聚合酶、呈溶液形式或固定至支撑物的核酸模板分子和呈溶液形式或固定至支撑物的起始位点(例如引物)的任何组合。
在一些实施方案中,在所述系统中,突变型聚合酶表现出与具有SEQ ID NO:1或391的氨基酸序列的野生型聚合酶相比增加的热稳定性。举例而言,突变型聚合酶在约25-50℃或约45-75℃的温度范围内表现出增加的热稳定性。
在一些实施方案中,在所述系统中,突变型聚合酶表现出与包含SEQ ID NO:1或391的野生型聚合酶相比增加的核苷酸类似物掺入率,其中所述核苷酸类似物在糖2'位置和/或在3'糖位置处包含链终止部分(例如封端部分)。
在一些实施方案中,所述系统包含:一种或多种突变型聚合酶,和多个核酸双链体,所述多个核酸双链体各自包含与核酸引物杂交的核酸模板。在一些实施方案中,所述一种或多种聚合酶和所述核酸双链体还包含多个核苷酸。所述一种或多种突变型聚合酶可结合至或可不结合至核酸双链体。所述一种或多种突变型聚合酶可结合至或可不结合至所述核苷酸中的一者。在一些实施方案中,所述一种或多种突变型聚合酶结合至核酸双链体,所述核酸双链体包含与核酸引物杂交的核酸模板,由此形成复合聚合酶,并且所述系统还包含多个核苷酸。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,在所述系统中,核苷酸可在不掺入的情况下结合至复合聚合酶。在一些实施方案中,互补核苷酸可在不经历聚合酶催化的掺入情况下结合复合聚合酶以形成三元复合物,其中所述互补核苷酸结合引物3'端与模板链中的互补核苷酸相对的位置处。
在一些实施方案中,在所述系统中,多个核苷酸中的至少一个核苷酸包含碱基、糖和至少一个磷酸酯基。举例而言,核苷酸单元可包括芳族碱基、五碳糖(例如核糖或脱氧核糖)和一个或多个磷酸酯基(例如1-10个磷酸酯基),其中所述核苷酸的芳族碱基包含腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。在一些实施方案中,所述多个核苷酸包含选自由以下组成的组的一种类型的核苷酸:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个核苷酸包含选自由以下组成的组的两种或更多种类型的核苷酸的任何组合的混合物:dATP、dGTP、dCTP、dTTP和/或dUTP。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸用荧光团标记。在一些实施方案中,所述多个核苷酸没有荧光团标记。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例核苷酸单元中。本段中所描述的特征在本公开通篇称为“示例核苷酸单元特征”。
在一些实施方案中,在所述系统中,多个核苷酸中的至少一个核苷酸包含具有一个、两个或三个磷原子的链,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,多个核苷酸中的至少一个核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在所述系统中,多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的核苷酸类似物。在一些实施方案中,链终止部分可在引物延伸反应期间抑制聚合酶催化的新生链中后续核苷酸单元或游离核苷酸的掺入。在一些实施方案中,链终止部分附接至3'糖羟基位置,其中所述糖包含核糖或脱氧核糖糖部分。在一些实施方案中,链终止部分可从3'糖羟基位置移除/裂解以产生具有3'OH糖基团的核苷酸,其可在聚合酶催化的核苷酸掺入反应中以后续核苷酸延伸。在一些实施方案中,链终止部分包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基。在一些实施方案中,链终止部分为可例如通过使链终止部分化学试剂反应、pH变化、光或热而从核苷酸裂解/移除的。在一些实施方案中,链终止部分烷基、烯基、炔基和烯丙基可用(三苯基膦)钯(0)(Pd(PPh3)4)、用哌啶或用2,3-二氯-5,6-二氰基-1,4-苯醌(DDQ)裂解。在一些实施方案中,链终止部分芳基和苯甲基可用H2 Pd/C裂解。在一些实施方案中,链终止部分胺、酰胺、酮基、异氰酸酯、磷酸酯、硫基、二硫化物可用膦或用包括β-巯基乙醇或二硫苏糖醇(DTT)在内的硫醇基裂解。在一些实施方案中,链终止部分碳酸酯可用在MeOH中的碳酸钾(K2CO3)、用在吡啶中的三乙胺或用在乙酸(AcOH)中的Zn裂解。在一些实施方案中,链终止部分脲和甲硅烷基可用氟化四丁铵、吡啶-HF、用氟化铵或用三氢氟化三乙胺裂解。本段中描述的包括链终止部分的核苷酸类似物的一个或多个特征可出现在本公开中描述的各个实施方案中的任何示例核苷酸类似物中。本段中所描述的核苷酸类似物的特征在本公开通篇称为“示例核苷酸类似物特征”。同样,本段中描述的一个或多个链终止部分特征可出现在本公开中描述的各个实施方案中的任何示例链终止部分中。短语“链终止部分实施方案”在本公开通篇用于指本段中所描述的一个或多个链终止部分特征中的任一者。
在一些实施方案中,在所述系统中,多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基。在一些实施方案中,链终止部分包含3'-O-叠氮基或3'-O-叠氮基甲基。在一些实施方案中,链终止部分叠氮化物、叠氮基和叠氮基甲基可用膦化合物裂解/移除。在一些实施方案中,膦化合物包含衍生化的三烷基膦部分或衍生化的三芳基膦部分。在一些实施方案中,膦化合物包含三(2-羧基乙基)膦(TCEP)或双磺基三苯基膦(BS-TPP)或三(羟基丙基)膦(THPP)。在一些实施方案中,裂解剂包括4-二甲氨基吡啶(4-DMAP)。在一些实施方案中,在所述系统中,核苷酸类似物包含链终止部分,所述链终止部分选自由以下组成的组:3'-脱氧核苷酸、2',3'-双脱氧核苷酸、3'-甲基、3'-叠氮基、3'-叠氮基甲基、3'-O-叠氮基烷基、3'-O-乙炔基、3'-O-氨基烷基、3'-O-氟烷基、3'-氟甲基、3'-二氟甲基、3'-三氟甲基、3'-磺酰基、3'-丙二酰基、3'-氨基、3'-O-氨基、3'-巯基、3'-氨基甲基、3'-乙基、3'丁基、3'-叔丁基、3'-芴基甲氧基羰基、3'叔丁氧基羰基、3'-O-烷基羟氨基、3'-硫代磷酸酯和3-O-苯甲基,或其衍生物。本段中描述的一个或多个特征可出现在本公开中描述的各个实施方案中包括叠氮化物、叠氮基或叠氮基甲基的任何链终止部分中。短语“链终止部分包含叠氮化物、叠氮基或叠氮基甲基”在本公开通篇用于指本段所描述的一个或多个链终止部分特征中的任一者。
在一些实施方案中,在所述系统中,多个核苷酸包含多个没有可检测的报导因子部分(例如荧光团)的核苷酸。在一些实施方案中,在所述系统中,多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。
在一些实施方案中,在所述系统中,碱基上的可裂解接头包含可裂解部分,其包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基。在一些实施方案中,碱基上的可裂解接头可通过可裂解部分与化学试剂反应、pH变化、光或热而从碱基裂解/移除。在一些实施方案中,可裂解部分烷基、烯基、炔基和烯丙基可用(三苯基膦)钯(0)(Pd(PPh3)4)、用哌啶或用2,3-二氯-5,6-二氰基-1,4-苯醌(DDQ)裂解。在一些实施方案中,可裂解部分芳基和苯甲基可用H2 Pd/C裂解。在一些实施方案中,可裂解部分胺、酰胺、酮基、异氰酸酯、磷酸酯、硫基、二硫化物可用膦或用包括β-巯基乙醇或二硫苏糖醇(DTT)在内的硫醇基裂解。在一些实施方案中,可裂解部分碳酸酯可用在MeOH中的碳酸钾(K2CO3)、用在吡啶中的三乙胺或用在乙酸(AcOH)中的Zn裂解。在一些实施方案中,可裂解部分脲和甲硅烷基可用氟化四丁铵、吡啶-HF、用氟化铵或用三氢氟化三乙胺裂解。
在一些实施方案中,在所述系统中,碱基上的可裂解接头包含可裂解部分,其包括叠氮化物、叠氮基或叠氮基甲基。在一些实施方案中,可裂解部分叠氮化物、叠氮基和叠氮基甲基可用膦化合物裂解/移除。在一些实施方案中,膦化合物包含衍生化的三烷基膦部分或衍生化的三芳基膦部分。在一些实施方案中,膦化合物包含三(2-羧基乙基)膦(TCEP)或双磺基三苯基膦(BS-TPP)或三(羟基丙基)膦(THPP)。在一些实施方案中,裂解剂包括4-二甲氨基吡啶(4-DMAP)。
在一些实施方案中,在所述系统中,链终止部分(例如在糖2'和/或糖3'位置处)和在碱基上的可裂解接头具有相同或不同的可裂解部分。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用相同化学试剂以化学方式裂解/移除。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用不同化学试剂以化学方式裂解/移除。
在一些实施方案中,所述系统包含:一种或多种突变型聚合酶和核酸双链体,所述核酸双链体各自包含与核酸引物杂交的核酸模板。在一些实施方案中,所述一种或多种聚合酶和所述核酸双链体还包含多个多价分子。所述一种或多种突变型聚合酶可结合至或可不结合至核酸双链体。所述一种或多种突变型聚合酶可结合至或可不结合至一个或多个多价分子。在一些实施方案中,所述一种或多种突变型聚合酶结合至核酸双链体,所述核酸双链体包含与核酸引物杂交的核酸模板,由此形成复合聚合酶,并且所述系统还包含多个多价分子。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含:(a)核心;和(b)多个核苷酸臂,其包含(i)核心附接部分、(ii)包含PEG部分之间隔区、(iii)接头和(iv)核苷酸单元,其中所述核心附接至多个核苷酸臂,其中所述间隔区附接至接头,其中所述接头附接至核苷酸单元。在一些实施方案中,核苷酸单元包含碱基、糖和至少一个磷酸酯基,并且接头经由碱基附接至核苷酸单元。示例性间隔区示出于图16A(顶图)中。各种示例性接头示出于图16A(底图)和图16B中。接合/附接至核苷酸单元的各种接头的实例示出于图17A至图17C中,其中嘧啶碱基的5位或嘌呤碱基的7位经由炔丙基胺附接而附接至接头(还参见图18)。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分且核心附接部分包含生物素。在一些实施方案中,所述接头包含具有2-6个亚基的脂族链或具有2-6个亚基的寡聚乙二醇链。在一些实施方案中,接头还包含芳族部分。在一些实施方案中,所述接头包含脂族链或寡聚乙二醇链,其中两个接头链均具有2-6个亚基。在一些实施方案中,接头还包括芳族部分。示例性间隔区示出于图16A(顶图)中,并且示例性接头示出于图16A(底图)和图16B中。示例性核苷酸臂示出于图15B中。示例性多价分子示出于图14A、图14B和图15A中。在一些实施方案中,核苷酸单元包含芳族碱基、五碳糖和1-10个磷酸酯基。在一些实施方案中,接头经由碱基附接至核苷酸单元。在一些实施方案中,附接至核心的多个核苷酸臂具有相同类型的核苷酸单元,并且其中所述类型的核苷酸单元选自由以下组成的组:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个多价分子包含一种类型的多价分子,其中所述多个多价分子中的各多价分子具有选自由以下组成的组的相同类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。在一些实施方案中,所述多个多价分子包含两种或更多种类型的多价分子的任何组合的混合物,各类型具有选自由以下组成的组的核苷酸单元:dATP、dGTP、dCTP、dTTP和/或dUTP。本段中所描述的一个或多个特征可出现在本公开中所描述的各个实施方案中的任何示例多价分子中。本段中所描述的特征在本公开通篇称为“多价分子实施方案”。
在一些实施方案中,在所述系统中,核苷酸臂被设计成使得核苷酸臂的核苷酸单元能够与聚合酶以与游离核苷酸类似的方式相互作用。核苷酸臂的核苷酸单元可结合聚合酶,所述聚合酶与核酸模板和核酸引物形成复合物(例如核苷酸缔合)。核苷酸单元还可从复合聚合酶解离并再结合同一复合聚合酶或结合邻近多价分子的不同复合聚合酶。由于多价分子包含多个核苷酸臂,所以单一多价分子的核苷酸单元可同时结合多个复合聚合酶。多价分子有效地增加核苷酸的局部浓度,由此可增强核苷酸结合反应中的信号。
在一些实施方案中,在所述系统中,多价分子的核苷酸单元可在不掺入情况下结合至复合聚合酶。在一些实施方案中,多价分子的互补核苷酸单元可在不经历聚合酶催化的掺入情况下结合复合聚合酶,其中所述互补核苷酸单元结合引物3'端与模板链中的互补核苷酸相对的位置处。
在一些实施方案中,在所述系统中,多价分子的核苷酸单元可结合至复合聚合酶,并通过掺入可延伸引物的3'端(例如与聚合酶形成复合物)中引起引物延伸而经历引物延伸。当核苷酸单元包括糖3'OH时,则后续核苷酸可掺入新生的延伸引物中。当核苷酸单元包含被封端基团取代的糖3'OH时,则后续核苷酸受到阻挡而不会掺入新生的延伸引物链中。核苷酸单元(多价分子的核苷酸单元)可结合引物3'端与模板链中的互补核苷酸相对的位置处。核苷酸单元可在聚合酶催化的反应中经历核苷酸掺入,由此使引物延伸一个核苷酸。
在一些实施方案中,在所述系统中,多价分子的核心单元可用可检测的报导因子部分(例如荧光团)以允许区别携带不同类型核苷酸单元的不同多价分子的方式标记。举例而言,第一多价分子的核心单元用第一荧光团标记,其中第一多价分子包含具有dGTP核苷酸单元的多个核苷酸臂。第二多价分子的核心单元用第二荧光团(其不同于第一荧光团)标记,其中第二多价分子包含具有dATP核苷酸单元的多个核苷酸臂。基于检测和鉴别核心上的可检测的报导因子部分,核苷酸单元的结合和掺入事件可得到检测,并且核苷酸单元(作为多价分子的一部分)的特定碱基可得到鉴别。
在一些实施方案中,在所述系统中,多价分子的核心可用可检测的报导因子部分(例如荧光团)以允许区别携带不同类型核苷酸单元的不同多价分子的方式标记。举例而言,第一多价分子的核心用第一荧光团标记,其中第一多价分子包含具有dGTP核苷酸单元的多个核苷酸臂。第二多价分子的核心用第二荧光团(其不同于第一荧光团)标记,其中第二多价分子包含具有dATP核苷酸单元的多个核苷酸臂。基于检测和鉴别第一和第二核心上的可检测的报导因子部分,核苷酸单元的结合和掺入事件可得到检测,并且核苷酸单元(作为多价分子的一部分)的特定碱基可得到鉴别。
在一些实施方案中,在所述系统中,多价分子的核苷酸臂的至少一个接头可用可检测的报导因子部分(例如荧光团)以允许区别携带不同类型核苷酸单元的不同多价分子的方式标记。举例而言,第一多价分子的至少一个接头用第一荧光团标记,其中第一多价分子包含具有dGTP核苷酸单元的多个核苷酸臂。第二多价分子的至少一个接头用第二荧光团(其不同于第一荧光团)标记,其中第二多价分子包含具有dATP核苷酸单元的多个核苷酸臂。基于检测和鉴别第一和第二接头上的可检测的报导因子部分,核苷酸单元的结合和掺入事件可得到检测,并且核苷酸单元(作为多价分子的一部分)的特定碱基可得到鉴别。
在一些实施方案中,在所述系统中,多价分子的核苷酸臂的至少一个核苷酸单元(例如核碱基)可用可检测的报导因子部分(例如荧光团)以允许区别携带不同类型核苷酸单元的不同多价分子的方式标记。举例而言,第一多价分子的至少一个核苷酸单元用第一荧光团标记,其中第一多价分子包含具有dGTP核苷酸单元的多个核苷酸臂。第二多价分子的至少一个核苷酸单元用第二荧光团(其不同于第一荧光团)标记,其中第二多价分子包含具有dATP核苷酸单元的多个核苷酸臂。基于检测和鉴别第一和第二核苷酸单元上的可检测的报导因子部分,核苷酸单元的结合和掺入事件可得到检测,并且核苷酸单元(作为多价分子的一部分)的特定碱基可得到鉴别。
在一些实施方案中,在所述系统中,附接至多价分子的核苷酸臂的至少一个核苷酸单元可用可检测的报导因子部分(例如荧光团)以允许区别携带不同类型核苷酸单元的不同多价分子的方式标记。举例而言,第一多价分子的核苷酸单元用第一荧光团标记,其中第一多价分子包含具有dGTP核苷酸单元的多个核苷酸臂。第二多价分子的核苷酸单元用第二荧光团(其不同于第一荧光团)标记,其中第二多价分子包含具有dATP核苷酸单元的多个核苷酸臂。基于检测和鉴别核苷酸单元上的可检测的报导因子部分,核苷酸单元的结合和掺入事件可得到检测,并且核苷酸单元(作为多价分子的一部分)的特定碱基可得到鉴别。
在一些实施方案中,在所述系统中,多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心,并且其中所述多个核苷酸臂具有相同类型的核苷酸单元,其选自由以下组成的组:dATP、dGTP、dCTP、dTTP和dUTP。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含具有含一个、两个或三个磷原子的链的核苷酸单元,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,至少一个核苷酸单元为具有磷链的核苷酸类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基团在内的类似物取代的磷酸酯基(例如1-10个磷酸酯基)。
在一些实施方案中,在所述系统中,多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心,并且其中个别核苷酸臂包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的核苷酸单元。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含核苷酸单元,所述核苷酸单元包含包括上文所论述的一个或多个示例核苷酸类似物特征的核苷酸类似物。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含核苷酸单元,所述核苷酸单元包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含附接至多个核苷酸臂的核心,其中所述核心用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。附接至给定核心的荧光团对应于核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。
在一些实施方案中,在所述系统中,多个多价分子中的至少一个多价分子包含附接至核苷酸臂的核苷酸单元,其中接头和/或核苷酸单元用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。附接至给定接头或核苷酸碱基的荧光团对应于核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶尿嘧啶)。
在一些实施方案中,在所述系统中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分并且核心附接部分包含生物素。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分,其包括抗生物素蛋白,以及可结合到至少一个生物素部分的抗生物素蛋白的任何衍生物、类似物和其他非天然形式。抗生物素蛋白部分的其他形式包括天然和重组抗生物素蛋白和链霉抗生物素蛋白,以及衍生化的分子,例如未糖基化的抗生物素蛋白和截短的链霉抗生物素蛋白。举例而言,抗生物素蛋白部分包括抗生物素蛋白的去糖基化形式、由链霉菌(Streptomyces)(例如阿维丁链霉菌(Streptomyces avidinii))产生的细菌链霉抗生物素蛋白以及衍生化形式,例如N-酰基抗生物素蛋白,例如N-乙酰基抗生物素蛋白、N-苯二甲酰基抗生物素蛋白和N-琥珀酰基抗生物素蛋白,和可商购获得的产品ExtrAvidinTM、CaptavidinTM、NeutravidinTM和Neutralite AvidinTM。示例性多价分子示出于图14A中,其中通用核心结合至多个核苷酸臂。多价分子的示例性设计示出于图15A中,其显示与多个核苷酸臂附接/结合的核心(例如链霉抗生物素蛋白核心),其中核苷酸臂包含核心附接部分(例如生物素)、间隔区、接头和核苷酸单元。包含生物素、间隔区、接头和核苷酸单元的示例性生物素化核苷酸臂示出于图15B中。
在一些实施方案中,所述系统包含:一种或多种突变型聚合酶,其结合至核酸双链体,所述核酸双链体各自包含与核酸引物杂交的核酸模板,由此形成复合聚合酶,并且所述系统还包含至少一个阳离子。在一些实施方案中,所述至少一个阳离子选自由以下组成的组:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,阳离子包括促进聚合酶催化的核苷酸掺入的催化性二价阳离子,其中所述催化性二价阳离子包括镁或锰。在一些实施方案中,阳离子包括抑制聚合酶催化的核苷酸掺入的非催化性二价阳离子,其中所述所述催化性二价阳离子包括锶、钡和/或钙。
在一些实施方案中,所述系统包含:一种或多种突变型聚合酶,其结合至核酸双链体,所述核酸双链体各自包含与核酸引物杂交的核酸模板分子,由此形成复合聚合酶。在一些实施方案中,核酸模板分子包含线性核酸分子、或环形核酸分子、或线性核酸分子与环形核酸分子的混合物。在一些实施方案中,多个核酸模板分子中的核酸模板分子包含相同的感兴趣靶序列或不同的感兴趣靶序列。在一些实施方案中,具有潜在特征分子中的任一者的核酸模板分子包含扩增的核酸分子。在一些实施方案中,核酸模板分子包含克隆扩增的模板分子或单一核酸模板分子。在一些实施方案中,核酸模板分子包含感兴趣靶序列的一个拷贝。在一些实施方案中,核酸模板分子包含感兴趣靶序列的两个或更多个串联拷贝(例如多联体)。在一些实施方案中,核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,引物提供核苷酸聚合的起始位点。在一些实施方案中,核酸引物包含可延伸的3'末端或不可延伸的3'末端。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,在所述系统中,复合聚合酶固定至支撑物,其中核酸模板、核酸引物和/或聚合酶中的任一者固定至支撑物。在一些实施方案中,所述系统包含多个固定至支撑物的复合聚合酶。在一些实施方案中,约102-1015个复合聚合酶在支撑物上的不同位点处固定至支撑物。在一些实施方案中,多个复合聚合酶固定至支撑物上的预定位点(例如部位)。在一些实施方案中,多个复合聚合酶固定至支撑物上的随机位点(例如部位)。在一些实施方案中,多个固定的复合突变型DNA聚合酶彼此流体连通以允许试剂(例如包括聚合酶在内的酶、多价分子、核苷酸和/或二价阳离子和类似物)的溶液流动至支撑物上以使得在所述支撑物上的多个固定的复合聚合酶可与试剂的溶液以大规模平行方式反应。
在一些实施方案中,在所述系统中,支撑物包括平面或非平面支撑物。支撑物可为固体或半固体。在一些实施方案中,支撑物可为多孔、半多孔或无孔的。在一些实施方案中,支撑物的表面可涂有一种或多种化合物以在支撑物上产生钝化层。在一些实施方案中,钝化层形成多孔或半多孔层。在一些实施方案中,核酸引物或模板、或聚合酶可附接至钝化层以将引物、模板和/或聚合酶固定至支撑物。在一些实施方案中,支撑物包括使得支撑物上的核酸杂交和扩增效能能够改善的低非特异性结合表面。一般而言,支撑物可包括一层或多层共价或非共价附接的低结合、化学改质层,例如硅烷层、聚合物膜,和一个或多个共价或非共价附接的寡核苷酸,其可用于将多个核酸模板分子固定至支撑物。在一些实施方案中,支撑物可包括经由支撑物上的化学基团至少共价结合至支撑物的一部分的官能化聚合物涂层、移植至官能化聚合物涂层上的引物以及在所述引物和所述官能化聚合物涂层上的水溶性保护涂层。在一些实施方案中,官能化聚合物涂层包含聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺(PAZAM)。在一些实施方案中,支撑物包括具有至少一个亲水性聚合物涂层的表面涂层和至少一层多个寡核苷酸。亲水性聚合物涂层可包含聚乙二醇(PEG)。亲水性聚合物涂层可包含具有至少4个分支的分支PEG。在一些实施方案中,低非特异性结合涂层具有不超过45度的水接触角。
在一些实施方案中,在所述系统中,多个复合DNA聚合酶还包含第一结合复合物和第二结合复合物以及多价分子,其形成亲合力复合物,其中(i)所述第一结合复合物包含第一核酸引物、第一DNA聚合酶和第一多价分子,其结合至多联体模板分子的第一部分,由此形成第一结合复合物,其中多价分子的第一核苷酸单元结合至第一DNA聚合酶;并且(ii)第二结合复合物包含第二核酸引物、第二DNA聚合酶和第一多价分子,其结合至同一多联体模板分子的第二部分,由此形成第二结合复合物,其中多价分子的第二核苷酸单元结合至第二DNA聚合酶,其中包括相同多价分子的第一结合复合物和第二结合复合物形成亲合力复合物。在一些实施方案中,第一聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第二聚合酶包含本文所描述的任何野生型或突变型聚合酶。多联体模板分子包含感兴趣序列的串联重复序列和至少一个通用测序引物结合位点。第一核酸引物和第二核酸引物可沿多联体模板分子结合至测序引物结合位点。
在一些实施方案中,在所述系统中,多个复合DNA聚合酶还包含第一结合复合物和第二结合复合物以及多价分子,其形成亲合力复合物,其中(i)所述第一结合复合物包含第一核酸引物、第一DNA聚合酶和第一多价分子,其结合至第一模板分子,由此形成第一结合复合物,其中多价分子的第一核苷酸单元结合至第一DNA聚合酶;并且(ii)第二结合复合物包含第二核酸引物、第二DNA聚合酶和第一多价分子,其结合至第二模板分子,由此形成第二结合复合物,其中多价分子的第二核苷酸单元结合至第二DNA聚合酶,其中包括相同多价分子的第一结合复合物和第二结合复合物形成亲合力复合物。在一些实施方案中,第一聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第二聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第一模板分子和第二模板分子为克隆扩增的模板分子。在一些实施方案中,第一模板分子和第二模板分子彼此紧密靠近地定位。举例而言,克隆扩增的第一模板分子和第二模板分子包含线性模板分子,其为经由桥式扩增产生并且固定至支撑物上的相同部位或特征。第一模板分子和第二模板分子包含感兴趣序列和至少一个通用测序引物结合位点。第一核酸引物第二核酸引物可分别结合至第一模板分子和第二模板分子上的测序引物结合位点。
在一些实施方案中,所述系统包含反应混合物,其包含:(a)一种或多种突变型聚合酶;(b)核酸模板分子;(c)具有3'可延伸端或3'不可延伸端的核酸引物;和(d)多个核苷酸或多个多价分子。在一些实施方案中,所述一种或多种突变型聚合酶不结合至核酸模板分子。在一些实施方案中,所述一种或多种突变型聚合酶不结合至核酸引物。在一些实施方案中,所述一种或多种突变型聚合酶结合至核酸双链体,所述核酸双链体包含与核酸引物杂交的核酸模板分子,由此形成复合聚合酶。在一些实施方案中,核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,多个核苷酸包括至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,反应混合物还包含(e1)至少一个非催化性二价阳离子,其允许至少一个核苷酸与复合聚合酶结合或允许至少一个多价分子与复合聚合酶结合,但非催化性二价阳离子抑制聚合酶催化的掺入。在一些实施方案中,非催化性二价阳离子包括锶、钡和/或钙。
在一些实施方案中,所述反应混合物还包含(e2)至少一个催化性二价阳离子,其允许至少一个核苷酸与复合聚合酶结合或允许至少一个多价分子与复合聚合酶结合,并且催化性二价阳离子促进聚合酶催化的掺入。在一些实施方案中,催化性二价阳离子包括镁和/或锰。在一些实施方案中,核酸模板和核酸引物呈溶液形式。在一些实施方案中,核酸模板和/或核酸引物固定至支撑物或固定至支撑物上的涂层。
在一些实施方案中,在所述系统中,反应混合物适用于进行核苷酸结合反应(或多价分子结合反应)。在一些实施方案中,反应混合物适用于进行核苷酸掺入反应(或多价分子的核苷酸单元的掺入反应)。在一些实施方案中,反应混合物适用于进行引物延伸反应,在所述反应中,核苷酸掺入可延伸引物的3'端中(或多价分子的核苷酸单元掺入可延伸引物的3'端中)。
在一些实施方案中,所述系统包含多个复合聚合酶,其具有至少第一复合聚合酶和第二复合聚合酶,其中:(a)所述第一复合聚合酶包含结合至第一核酸双链体的第一突变型聚合酶,所述第一核酸双链体包含与第一核酸引物杂交的第一核酸模板分子;(b)所述第二复合聚合酶包含结合至第二核酸双链体的第二突变型聚合酶,所述第二核酸双链体包含与第二核酸引物杂交的第二核酸模板分子。在一些实施方案中,第一核酸模板分子和第二核酸模板分子包含相同或不同序列。在一些实施方案中,第一核酸模板分子和第二核酸模板分子被克隆扩增。在一些实施方案中,第一核酸模板分子和/或第二核酸模板分子包含至少一个尿苷核苷酸或没有尿苷核苷酸。在一些实施方案中,第一引物和第二引物包含可延伸的3'端或不可延伸的3'端。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,在所述系统中,多个复合聚合酶(包括第一复合聚合酶和第二复合聚合酶)固定至支撑物。在一些实施方案中,多个复合聚合酶的密度包括约102-1015个固定至支撑物的复合聚合酶/平方毫米。在一些实施方案中,在所述系统中,第一核酸模板分子和第二核酸模板分子固定至支撑物上的不同位点。在一些实施方案中,支撑物包括布置成阵列的多个位点。在一些实施方案中,支撑物上的位点在一个维度中布置成一列或一行,或在二个维度中布置成数列和数行。在一些实施方案中,多个位点以随机或组织方式或两者的组合布置于支撑物上。在一些实施方案中,多个位点布置成任何图案,包括长方体或六边形图案。在一些实施方案中,支撑物包括约102-1015个或更多个位点/平方毫米,其固定有核酸模板以形成核酸模板阵列。在一些实施方案中,核酸模板在多个位点处固定,例如核酸模板分子以约102-1015个或更多个位点/平方毫米固定,其中固定的核酸模板被克隆扩增以产生在多个位点处固定的核酸聚合酶群落。在一些实施方案中,固定在支撑物上的多个核酸模板分子彼此流体连通以允许试剂(例如多个酶(例如聚合酶)、多个核苷酸和/或多个多价分子)的溶液流动至支撑物上以使得固定至支撑物上的多个核酸模板分子可与多种试剂以大规模平行方式反应。在一些实施方案中,固定至支撑物上的多个核酸聚合酶群落的流体连通可用于在多个核酸聚合酶群落上基本上同时进行核苷酸结合分析和/或进行核苷酸掺入分析(例如引物延伸或测序)。在一些实施方案中,固定至支撑物上的多个核酸聚合酶群落的流体连通可用于进行大规模平行测序的检测和成像。在一些实施方案中,术语“固定”和相关术语是指核酸分子或酶经由共价键或非共价相互作用直接附接至支撑物或附接至支撑物上的涂层。在一些实施方案中,涂层包含具有不超过45度的水接触角的低非特异性结合涂层。
试剂盒
本公开提供一种试剂盒,其包含如本文所描述的突变型聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。在一些实施方案中,所述试剂盒还包含至少一个阳离子。在一些实施方案中,所述至少一个阳离子选自由以下组成的组:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。
在一些实施方案中,所述试剂盒还包含多个具有可延伸的3'末端或不可延伸的3'末端的核酸引物。在一些实施方案中,所述引物中的至少一者可固定至支撑物。在一些实施方案中,固定的引物(例如捕捉引物)可用于与核酸模板杂交。在一些实施方案中,所述引物中的至少一者包含测序引物,其可与附接至模板分子的接头序列(例如通用接头序列)杂交。
在一些实施方案中,所述试剂盒还包含多个如上文所描述的核苷酸单元。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个核苷酸中的至少一个核苷酸包含具有一个、两个或三个磷原子的链,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,多个核苷酸中的至少一个核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个核苷酸中的至少一个核苷酸包含终止剂核苷酸类似物,其包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在所述系统或在所述试剂盒中,多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸,不过其还可没有可检测的报导因子部分。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。
在一些实施方案中,在所述试剂盒中,链终止部分(例如在糖2'和/或糖3'位置处)和在碱基上的可裂解接头具有相同或不同的可裂解部分。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用相同化学试剂以化学方式裂解/移除。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用不同化学试剂以化学方式裂解/移除。
本公开提供一种试剂盒或系统,其包含至少一种突变型聚合酶,所述突变型聚合酶包含与SEQ ID NO:1-268或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列,并且所述试剂盒还包含多个多价分子,其可包括多价分子实施方案中的任一者,包括上文所列潜在特征中的任一者。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个多价分子中的至少一个多价分子包含具有含一个、两个或三个磷原子的链的核苷酸单元,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,至少一个核苷酸单元为具有磷链的核苷酸类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心,并且其中个别核苷酸臂包含在糖2'位置处、所述糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的核苷酸单元。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个多价分子中的至少一个多价分子包含核苷酸单元,所述核苷酸单元包含终止剂核苷酸类似物,其包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个多价分子中的至少一个多价分子包含核苷酸单元,所述核苷酸单元包含在糖2'位置处、所述糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在所述系统中或在所述试剂盒中,多个多价分子中的至少一个多价分子包含附接至多个核苷酸臂的核心,其中所述核心用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,在所述试剂盒中,多个多价分子中的至少一个多价分子包含附接至多个核苷酸臂的核心,其中多价分子的至少一个核苷酸臂包括用可检测的报导因子部分标记的接头和/或碱基。在一些实施方案中,可检测的报导因子部分包含荧光团。
在一些实施方案中,在所述系统中或在所述试剂盒中,个别多价分子包含具有抗生物素蛋白样部分的核心且所述核心附接部分包含生物素。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分,其包括抗生物素蛋白,以及可结合到至少一个生物素部分的抗生物素蛋白的任何衍生物、类似物和其他非天然形式。抗生物素蛋白部分的其他形式包括天然和重组抗生物素蛋白和链霉抗生物素蛋白,以及衍生化的分子,例如未糖基化的抗生物素蛋白和截短的链霉抗生物素蛋白。举例而言,抗生物素蛋白部分包括抗生物素蛋白的去糖基化形式、由链霉菌(例如阿维丁链霉菌)产生的细菌链霉抗生物素蛋白以及衍生化形式,例如N-酰基抗生物素蛋白,例如N-乙酰基抗生物素蛋白、N-苯二甲酰基抗生物素蛋白和N-琥珀酰基抗生物素蛋白,和可商购获得的产品ExtrAvidinTM、CaptavidinTM、NeutravidinTM和Neutralite AvidinTM。
在一些实施方案中,在所述系统中或在所述试剂盒中包含一个或多个容器,其含有至少一种突变型聚合酶、阳离子、引物、多个核苷酸和/或多个多价分子。突变型聚合酶、阳离子、引物和/或多个核苷酸可以任何组合形式组合并且可包含在单一容器中,或可包含在独立容器中,或其任何组合。突变型聚合酶、阳离子、引物和/或多个多价分子可以任何组合形式组合且可包含在单一容器中,或可包含在独立容器中,或其任何组合。
所述试剂盒可包括关于使用多个核苷酸进行核苷酸结合反应、核苷酸掺入反应和/或核酸测序反应的所述试剂盒的使用说明书。所述试剂盒可包括关于使用多个多价分子进行多价分子结合反应、多价分子掺入反应和/或核酸测序反应的所述试剂盒的使用说明书。
编码突变型聚合酶的核酸、载体和宿主细胞
本公开提供编码本文所描述的突变型聚合酶中的任一者的核酸,所述突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。
本公开提供一种载体,其可操作地连接到至少一个编码本文所描述的突变型聚合酶中的任一者的核酸(例如转基因),所述突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。在一些实施方案中,载体包含至少一个宿主细胞调控序列,包括启动子序列、增强子、转录和/或翻译起始序列、转录和/或翻译终止序列、多肽分泌信号序列和类似序列。启动子序列可为组成型或诱导型启动子序列。在一些实施方案中,载体中的启动子序列可以可操作地连接至所述至少一个编码突变型聚合酶的核酸以控制宿主细胞对所述突变型聚合酶的表达。在一些实施方案中,载体包含表达载体。
本公开提供一种带有所述载体(例如表达载体)的宿主细胞,所述载体可操作地连接到至少一个编码本文所描述的突变型聚合酶中的任一者的核酸(例如转基因),所述突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。在一些实施方案中,载体包含可操作地连接至所述至少一个编码突变型聚合酶的核酸的启动子序列,其中所述启动子序列控制宿主细胞对所述突变型聚合酶的表达。
本公开提供多个宿主细胞,其中多个宿主细胞中的个别宿主细胞带有载体(例如表达载体),所述载体可操作地连接到至少一个编码本文所描述的突变型聚合酶中的任一者的核酸(例如转基因),所述突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。在一些实施方案中,载体包含可操作地连接至所述至少一个编码突变型聚合酶的核酸的启动子序列,其中所述启动子序列控制宿主细胞对所述突变型聚合酶的表达。
方法
本公开提供用于制备多个突变型聚合酶的方法,其包括:培养多个宿主细胞,其中所述多个宿主细胞中的个别宿主细胞带有载体(例如表达载体),所述载体可操作地连接到至少一个编码本文所描述的突变型聚合酶中的任一者的核酸(例如转基因),所述突变型聚合酶包含与SEQ ID NO:2-274或288-375或385-397中的任一者具有至少80%、85%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%同一性或更高水平序列同一性的氨基酸序列。在一些实施方案中,宿主细胞中的载体包含可操作地连接至所述至少一个编码突变型聚合酶的核酸的启动子序列,其中所述启动子序列控制宿主细胞对所述突变型聚合酶的表达。在一些实施方案中,将多个宿主细胞在适用于使多个宿主细胞表达多种突变型聚合酶的条件下培养。在一些实施方案中,所述方法还包括从多个宿主细胞回收(例如分离/富集)所述多个突变型聚合酶。
本文提供用于将修饰的核苷酸掺入核酸链中的组合物和方法。聚合酶不同地包含DNA聚合酶、RNA聚合酶、模板非依赖性聚合酶、反转录酶或能够进行核苷酸延伸的其他酶。野生型DNA聚合酶一般并不容许某些类型的核苷酸修饰,诸如对糖3'位置的修饰。此特性需要野生型DNA聚合酶被显著修饰以便促进可逆或不可逆终止剂(防止核酸延伸的可移除的化学基团)掺入以进行诸如测序的类应用。本文进一步提供采用掺入修饰的核苷酸的突变型聚合酶进行的测序方法。另外,使用工程化DNA聚合酶允许开发能够在不牺牲酶的热稳定性或酶在较高温度下起作用的能力的情况下,将修饰的核苷酸掺入伸长的核酸链中的酶。当基于古菌聚合酶主链并且更尤其是来源于嗜热性或耐热性古菌的DNA聚合酶序列的主链对DNA聚合酶进行工程化时,此特性尤其得到增强。工程化聚合酶可呈一种或多种本文所描述的聚合酶形式。
热稳定和/或高保真度的工程化DNA聚合酶可用于等温测序或伸长技术。等温技术包括SDA、LAMP、SMAP、ICAN、SMART等,并且可还包括如本文所公开的额外技术。在这些技术中,伸长反应在恒定温度下,例如使用链置换反应,或在一些额外示例性实施方案中从引发的单链模板(尤其包括引发的多价模板伸长)来进行。在一些实施方案中,工程化DNA聚合酶具有链置换能力。在扩增依赖性方法中,等温扩增可通过在恒定温度下孵育样品、引物、具有链置换活性的DNA聚合酶和底物的混合物,以单步骤完成。此减少所需步骤的数目,消除热升温步骤并减少各测序或伸长循环的总循环时间,同时缩短各循环所需的反应时间。在不扩增的方法中,等温方法允许在测序循环期间进行新生核酸链的结合、检测和伸长,而不会因温度上升或者关键组分或试剂上的额外热应力而造成时间损失。
可根据本公开的方法和组合物使用的DNA聚合酶包括病毒、细菌、古菌和真核生物聚合酶、以及其同源物和直向同源物。在一些实施方案中,DNA聚合酶包括但不限于古菌DNA聚合酶,诸如候选深层古细菌目古菌DNA聚合酶以及其同源物和直向同源物,和其工程化、突变和/或截短的变体;原核生物DNA聚合酶,诸如嗜热脂肪地芽孢杆菌聚合酶(例如Bst聚合酶)以及其同源物和直向同源物,和其工程化、突变和/或截短的变体;硫化叶菌属(Sulfolobus sp.)Dpo4聚合酶,包括芝田硫化叶菌(Sulfolobus shibatae)和硫磺矿硫化叶菌(Sulfolobus solfataricus)Dpo4聚合酶和相关Y家族聚合酶,以及其同源物和直向同源物,和其工程化、突变和/或截短的变体;其他热稳定性聚合酶,诸如水生栖热菌(Thermusaquaticus)DNA聚合酶以及其同源物和直向同源物,和其工程化、突变和/或截短的变体;激烈火球菌(Pyrococcus furiosus)DNA聚合酶以及其同源物和直向同源物,和其工程化、突变和/或截短的变体;和/或真核生物DNA聚合酶,诸如酿酒酵母(Saccharomycescerevisiae)PolB或智人(Homo Sapiens)PolB或其他真核生物X家族聚合酶以及其同源物和直向同源物,和其工程化、突变和/或截短的变体。其他DNA聚合酶和同源或直系同源聚合酶为本领域中已知的并且明确地涵盖在本公开内。
本文提供包含具有增强的热稳定性的突变多肽的组合物和方法。在一些实施方案中,此类突变多肽具有聚合酶活性(例如突变型核酸聚合酶)。在一些实施方案中,热稳定性包括相对于最接近的野生型酶(诸如包含最接近的野生型酶序列的野生型酶)增加的Tm、对降解的抗性和/或在高温下维持功能活性(例如掺入核苷酸)的能力。在一些实施方案中,突变型聚合酶包含相对于最接近的野生型酶增加约1、2、5、10、15、20、25或约30℃的Tm。在一些实施方案中,突变多肽包含相对于最接近的野生型酶增加至少1、2、5、10、15、20、25或至少30℃的Tm。突变型聚合酶通常包含相对于最接近的野生型酶增加至少1-10、5-15、4-20、2-10、4-15、20-30、10-60或25-35℃的Tm值。在一些实施方案中,聚合酶活性包含kcat、kcat/Km或在给定时段内掺入的核苷酸的产率。在一些实施方案中,聚合酶活性在一些实施方案中包含kcat、kcat/Km或在给定时段内掺入的修饰的核苷酸(诸如3'-O-叠氮基甲基修饰的核苷酸)的产率。在一些实施方案中,在高温下起作用的突变型聚合酶维持在低温下起作用的利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。举例而言,在约37℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在约42℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在约55℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在约60℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,至少在50℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,至少在60℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在37-95℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在37-95、37-60、37-55、37-42、40-60、50-80、42-55、55-60、55-95、60-95或40-80℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在42-95℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在40-80℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在37-55℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在50-95℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。在一些实施方案中,在60-95℃下起作用的突变型聚合酶维持利用未修饰的核苷酸的最接近的野生型酶的最佳活性的至少99%、98%、95%、90%、85%或至少80%。
在一些实施方案中,在至少37℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在至少42℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在至少55℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在至少60℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在至少80℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在至少90℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在37-95、37-60、37-55、37-42、40-60、50-80、42-55、55-60、55-95、60-95或40-80℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在37-55℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。在一些实施方案中,在35-80℃的温度下起作用的突变型聚合酶相对于最接近的相关野生型序列具有增加的kcat。
本文提供包含与表现出增加的掺入修饰的核苷酸的能力的酶相关的突变多肽的组合物和方法,所述修饰的核苷酸在糖2'和/或3'位置处被例如链终止部分(例如封端基团/部分)修饰。示例性修饰的核苷酸包括在掺入所述核苷酸(通常称为“终止剂”核苷酸)之后,在核酸合成期间减少或抑制额外(例如后续)核苷酸掺入生长的核酸链中的任何修饰。链终止部分可包括上文所列链终止部分实施方案的潜在特征中的任一者。还可能存在其他形式的3'修饰或“终止剂”核苷酸。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物为在糖2'或3'位置处未修饰的核苷酸。
在一些实施方案中,本公开提供一种在确定靶核酸中核苷酸的身份的方法中利用本文所公开的工程化聚合酶变体的方法,其包括以下步骤(不涉及任何特定操作次序):1)提供组合物,所述组合物包含:包含相同序列的两个或更多个重复序列的靶核酸;与所述靶核酸的一个或多个区互补的两个或更多个引物核酸;和两个或更多个聚合酶分子;2)使所述组合物与包含聚合物-核苷酸缀合物的多价结合组合物在足以允许所述聚合物-核苷酸缀合物与步骤(a)的组合物之间形成结合复合物的条件下接触,其中所述聚合物-核苷酸缀合物包含核苷酸的两个或更多个拷贝和任选的一个或多个可检测标记;以及3)检测所述结合复合物,由此确定靶核酸聚合物中所述核苷酸的身份。在一些其他实施方案中,本公开提供所述方法,其中所述靶核酸为DNA,和/或其中所述靶核酸已诸如通过任何通常实行的DNA复制或扩增方法,诸如滚环扩增、桥式扩增、解螺旋酶依赖性扩增、等温桥式扩增、滚环多重置换扩增(RCA/MDA)和/或基于重组酶的复制或扩增方法进行复制。在一些其他实施方案中,本公开提供所述方法,其中所述可检测标记为荧光标记和/或其中检测所述复合物包含荧光测量。在一些其他实施方案中,本公开提供所述方法,其中所述多价结合组合物包含一种类型的聚合物-核苷酸缀合物,其中所述多价结合组合物包含两种或更多种类型的聚合物-核苷酸缀合物,和/或其中所述两种或更多种类型的聚合物-核苷酸缀合物中的各类型包含不同类型的核苷酸。在一些实施方案中,本公开提供所述方法,其中所述结合复合物还包含封端的核苷酸,尤其是其中所述封端的核苷酸包含3'-O-叠氮基甲基、3'-O-烷基羟氨基或3'-O-甲基核苷酸。在一些其他实施方案中,本公开提供所述方法,其中所述接触在锶离子、钡离子、镁离子和/或钙离子存在下进行。在一些实施方案中,本公开提供所述方法,其中聚合酶分子为无催化活性的,诸如其中聚合酶分子因突变、因化学修饰或因不存在所需的离子或辅因子而呈现无催化活性。在一些实施方案中,本公开还提供所述方法,其中聚合酶分子有催化活性,和/或其中结合复合物不包含封端的核苷酸。在一些实施方案中,本公开提供所述方法,其中所述结合复合物的持续时间超过约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1秒。在一些实施方案中,本公开提供所述方法,其中所述结合复合物的持续时间超过约0.1-0.25秒、或约0.25-0.5秒、或约0.5-0.75秒、或约0.75-1秒、或约1-2秒、或约2-3秒、或约3-4秒、或约4-5秒,和/或其中所述方法在或可在等于或高于15℃、等于或高于20℃、等于或高于25℃、等于或高于35℃、等于或高于37℃、等于或高于42℃、等于或高于55℃、等于或高于60℃、或等于或高于72℃或在任何前述所界定的范围内的温度下进行。结合复合物可保持稳定,直至经历引起聚合酶、模板分子、引物中的任一者和/或核苷酸单元或核苷酸之间的相互作用解离的条件。举例而言,解离条件包括使结合复合物与洗涤剂、EDTA和/或水中的任一者或任何组合接触。在一些实施方案中,本公开提供所述方法,其中所述结合复合物沉积于表面上、附接至表面或与表面杂交,所述表面在检测步骤中显示出大于20的造影剂与噪声比。在一些实施方案中,本公开提供所述方法,其中所述组合物在掺入极性非质子性溶剂的缓冲液条件下沉积。在一些实施方案中,本公开提供所述方法,其中所述接触在所述核苷酸与所述靶核酸的下一个碱基互补时使所述结合复合物稳定且在所述核苷酸与所述靶核酸的所述下一个碱基不互补时使所述结合复合物不稳定的条件下执行。
在一些实施方案中,本公开提供所述方法,其中所述聚合物-核苷酸缀合物(例如多价分子)包含具有多个分支的聚合物且所述第一核苷酸的所述多个拷贝附接至所述分支(参见图14A和图14B,以及图15A),尤其是其中所述第一聚合物具有星形、梳状、交联、瓶刷状或树状体构型。在一些实施方案中,本公开提供所述方法,其中所述聚合物-核苷酸缀合物包含一个或多个选自由以下组成的组的结合基团:抗生物素蛋白、生物素、亲和标签和其组合。在一些实施方案中,本公开提供所述方法,其还包括解离步骤,所述解离步骤使(a)的组合物与聚合物-核苷酸缀合物之间形成的所述结合复合物不稳定以移除所述聚合物-核苷酸缀合物。在一些实施方案中,本公开提供所述方法,其还包括用于将与靶核酸的所述下一个碱基互补的核苷酸掺入所述引物核酸中的延伸步骤,并且任选地其中所述延伸步骤当前作为所述解离步骤或在所述解离步骤之后发生。
在一些实施方案中,本公开提供一种组合物,其包含具有两个或更多个分支的分支聚合物以及核苷酸(例如多价分子)的两个或更多个拷贝,其中所述核苷酸附接至第一多个所述分支或臂,并且任选地其中一个或多个相互作用部分附接至第二多个所述分支或臂。在一些实施方案中,所述组合物可还包含在聚合物上的一个或多个标记。在一些实施方案中,本公开提供所述组合物,其中所述核苷具有每个聚合物至少4个核苷酸的表面密度。在一些实施方案中,本公开提供所述组合物,其包含或掺入修饰的以便防止其在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,所述组合物可包含或掺入被可逆地修饰以便防止其在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,本公开提供所述组合物,其中一个或多个标记包含荧光标记、FRET供体和/或FRET受体。在一些实施方案中,所述组合物可包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或更多个分支或臂、或2、4、8、16、32、64个或更多个分支或臂。在一些实施方案中,所述分支或臂可从中央部分发散。在一些实施方案中,所述组合物可包含一个或多个相互作用部分,所述相互作用部分可包含抗生物素蛋白或链霉抗生物素蛋白;生物素部分;亲和标签;酶、抗体、微型抗体、受体或其他蛋白质;非蛋白质标签;金属亲和标签或其任何组合。在一些实施方案中,本公开提供所述组合物,其中所述聚合物包含聚乙二醇、聚丙二醇、聚乙酸乙烯酯、聚乳酸或聚乙醇酸。在一些实施方案中,本公开提供所述组合物,其中所述核苷酸或核苷酸类似物经由接头附接至分支或臂;并且尤其是其中接头包含PEG,并且其中PEG部分具有约1K、约2K、约3K、约4K、约5K、约10K、约15K、约20K、约50K、约100K、约150K或约200K、或大于约200K的平均分子量。在一些实施方案中,本公开提供所述组合物,其中所述接头包含PEG,并且其中所述PEG部分具有在约5K与约20K之间的平均分子量。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物包含脱氧核糖核苷酸、核糖核苷酸、脱氧核苷或核苷;和/或其中所述核苷酸或核苷酸类似物经由所述核苷酸或核苷酸类似物的5'端结合至接头。在一些实施方案中,本公开提供所述组合物,其中所述核苷酸或核苷酸类似物中的一者包含脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷、脱氧胞苷、腺苷、鸟苷、5-甲基-尿苷和/或胞苷;并且其中所述接头的长度在1与1,000nm之间。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物被修饰以在聚合酶反应或测序反应期间抑制伸长的核苷酸,诸如其中所述至少一个核苷酸或核苷酸类似物为没有3'羟基的核苷酸;修饰的成在3'位置处含有封端基团的核苷酸;和/或被3'-O-叠氮基、3'-O-叠氮基甲基、3'-O-烷基羟氨基、3'-硫代磷酸酯基、3'-O-丙二酰基或3'-O-苯甲基修饰的核苷酸。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物为在3'位置处未修饰的核苷酸。
在一些实施方案中,本公开提供一种确定核酸分子的序列的方法,其包括以下步骤(不涉及任何特定次序):1)提供突变型聚合酶和核酸分子,所述核酸分子包含模板链和与所述模板链至少部分互补的互补链;2)使核酸分子与一种或多种核酸结合组合物接触;3)检测所述核酸结合组合物与所述核酸分子的结合;以及4)确定掺入所述核酸分子的所述互补链中的末端核苷酸的身份。在一些实施方案中,本公开提供所述方法,其还包括将所述末端核苷酸掺入所述互补链中,并且再重复所述接触、检测和掺入步骤一次或多次迭代,由此确定所述核酸分子的所述模板链的序列。在一些实施方案中,本公开提供所述方法,其中所述核酸分子系栓至固体支撑物;并且尤其是其中所述固体支撑物包括玻璃或聚合物基板、至少一个亲水性聚合物涂层和多个附接到至少一个亲水性聚合物涂层的寡核苷酸分子。在一些实施方案中,本公开提供所述方法,其还包括其中至少一个亲水性聚合物涂层包含PEG;和/或其中至少一个亲水性聚合物层包含具有至少8个分支的分支亲水性聚合物的实施方案。在一些实施方案中,本公开提供所述方法,其中所述多个寡核苷酸分子以至少500个分子/平方毫米、至少1,000个分子/平方毫米、至少5,000个分子/平方毫米、至少10,000个分子/平方毫米、至少20,000个分子/平方毫米、至少50,000个分子/平方毫米、至少100,000个分子/平方毫米或至少500,000个分子/平方毫米的表面密度存在。在一些实施方案中,本公开提供所述方法,其中所述核酸分子已在固体支撑物上被克隆扩增。在一些实施方案中,本公开提供所述方法,其中克隆扩增包含使用聚合酶链反应(PCR)、多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、桥式扩增、等温桥式扩增、滚环扩增、环至环扩增(circle-to-circle amplification)、解螺旋酶依赖性扩增、重组酶依赖性扩增、单链结合(SSB)蛋白质依赖性扩增或其任何组合。在一些实施方案中,本公开提供所述方法,其中所述一种或多种核酸结合组合物用荧光团标记且所述检测步骤包括使用荧光成像;并且尤其是其中荧光成像包含双波长激发/四波长发射荧光成像。在一些实施方案中,本公开提供所述方法,其中使用各包含不同核苷酸或核苷酸类似物的四种不同核酸结合组合物来确定末端核苷酸的身份,其中所述四种不同核酸结合组合物用独立的各别荧光团标记,并且其中检测步骤包括在足以激发全部四个荧光团的波长下进行同时或单次激发和在足以检测每一各别荧光团的波长下进行荧光发射成像。在一些实施方案中,本公开提供所述方法,其中使用各包含不同核苷酸或核苷酸类似物的四种不同核酸结合组合物确定末端核苷酸的身份,其中所述四种不同核酸结合组合物分别用Cy3或者激发或发射特性类似的染料或荧光团、Cy3.5或者激发或发射特性类似的染料或荧光团、Cy5或者激发或发射特性类似的染料或荧光团和Cy5.5或者激发或发射特性类似的染料或荧光团标记,并且其中所述检测步骤包括在532nm、568nm和633nm中的任何两者下进行同时激发,以及分别在约570nm、592nm、670nm和702nm下进行荧光发射的成像;和/或其中荧光成像包含双波长激发/双波长发射荧光成像。在一些实施方案中,本公开提供所述方法,其中使用各包含不同核苷酸或核苷酸类似物的四种不同核酸结合组合物确定末端核苷酸的身份,其中一、二、三或四种不同核酸结合组合物各自分别用不同荧光团或荧光团集合标记,并且其中所述检测步骤包括在足以激发一、二、三或四个荧光团或者荧光团集合的波长下进行同时或单次激发,以及在足以检测每一各别荧光团的波长下进行荧光发射成像。在一些实施方案中,本公开提供所述方法,其中使用各包含不同核苷酸或核苷酸类似物的三种不同核酸结合组合物确定末端核苷酸的身份,其中一、二或三种不同核酸结合组合物各自分别用不同荧光团或荧光团集合标记,并且其中所述检测步骤包括在足以激发一、二或三个荧光团或者荧光团集合的波长下进行同时激发,以及在足以检测每一各别荧光团的波长下进行荧光发射成像,并且其中第四个核苷酸的检测为或可根据“黑暗”或未标记斑点靶核苷酸的部位确定。在一些实施方案中,本公开提供所述方法,其中所述多价结合组合物由三种类型的聚合物-核苷酸缀合物组成且其中三种类型的聚合物-核苷酸缀合物中的各类型包含不同类型的核苷酸。在一些实施方案中,本公开提供所述方法,其中所述结合复合物的检测在无未结合或基于溶液的聚合物核苷酸缀合物存在下执行。
在一些实施方案中,本公开提供所述方法,其中使用各包含不同核苷酸或核苷酸类似物的四种不同核酸结合组合物或三种不同核酸结合组合物确定末端核苷酸的身份,其中所述四种或三种不同核酸结合组合物中的一者用第一荧光团标记,一者用第二荧光团标记,一者用第一荧光团和第二荧光团两者标记且一者未标记的或不存在,并且其中所述检测步骤包括在第一激发波长和第二激发波长下进行同时激发并且在第一荧光发射波长和第二荧光发射波长下获取图像。在一些实施方案中,本公开提供所述方法,其中所述第一荧光团为Cy3或激发或发射特性类似的染料或荧光团,所述第二荧光团为Cy5或激发或发射特性类似的染料或荧光团,所述第一激发波长为532nm或568nm,所述第二激发波长为633nm,所述第一荧光发射波长为约570nm,并且所述第二荧光发射波长为约670nm。在一些实施方案中,本公开提供所述方法,其中检测标签可包含FRET对的一个或多个部分,由此使得可根据单一激发和成像步骤执行多次分类。在一些实施方案中,本公开提供所述方法,其中包括接触、检测和掺入/延伸步骤的测序反应循环在不到30分钟内、在不到20分钟内或在不到10分钟内执行。在一些实施方案中,本公开提供所述方法,其中关于测序操作内碱基判读准确性的平均Q评分大于或等于30分和/或大于或等于40分。在一些实施方案中,本公开提供所述方法,其中至少50%、至少60%、至少70%、至少80%或至少90%的鉴别的末端核苷酸具有大于30分和/或大于或等于40分的Q评分。在一些实施方案中,本公开提供所述方法,在本文中至少95%的鉴别的末端核苷酸具有大于30分的Q评分。
在一些实施方案中,本公开任选地提供如本文所公开的工程化聚合酶变体、包含一种或多种如本文所公开的核酸结合组合物的试剂和缓冲液。举例而言,在一些实施方案中,本公开提供一种试剂,其中所述试剂包含1、2、3、4种或更多种核酸结合组合物,其中各核酸结合组合物包含单一类型的核苷酸。在一些实施方案中,本公开的试剂包含1、2、3、4种或更多种核酸结合组合物,其中各核酸结合组合物包含单一类型的核苷酸或核苷酸类似物,并且其中所述核苷酸或核苷酸类似物可分别对应于来自由ATP、ADP、AMP、dATP、dADP和dAMP组成的组的一者或多者;来自由TTP、TDP、TMP、dTTP、dTDP、dTMP、UTP、UDP、UMP、dUTP、dUDP和dUMP组成的组的一者或多者;来自由CTP、CDP、CMP、dCTP、dCDP和dCMP组成的组的一者或多者;以及来自由GTP、GDP、GMP、dGTP、dGDP和dGMP组成的组的一者或多者。在一些其他实例或一些另外的实例中,本公开提供一种试剂,其包含或还包含1、2、3、4种或更多种核酸结合组合物,其中各核酸结合组合物包含单一类型的核苷酸或核苷酸类似物,并且其中所述核苷酸或核苷酸类似物可分别对应于来自由以下组成的组的一者或多者:ATP、ADP、AMP、dATP、dADP、dAMP、TTP、TDP、TMP、dTTP、dTDP、dTMP、UTP、UDP、UMP、dUTP、dUDP、dUMP、CTP、CDP、CMP、dCTP、dCDP、dCMP、GTP、GDP、GMP、dGTP、dGDP和dGMP。
在一些实施方案中,本公开提供一种用于执行本文所公开的一种或多种方法的系统,其包含如本文所公开的聚合酶变体、如本文所公开的核酸结合组合物和/或如本文所公开的试剂。在一些实施方案中,一种系统被配置用于迭代地执行所述系栓的核酸分子与所述核酸结合组合物和/或所述试剂的依序接触;和用于检测所述核酸结合组合物与一个或多个核酸分子的结合。
在一些实施方案中,本公开提供一组合物,其包含如本文所公开的工程化聚合酶变体,并且其还包含粒子,所述粒子包含多个酶或蛋白质结合底物,其中所述酶或蛋白质结合底物与一种或多种酶或蛋白质结合形成一种或多种结合复合物,并且其中所述结合可通过对一种或多种结合复合物的定位、存在或存留的观察来监测或鉴别。在一些实施方案中,所述粒子可包含聚合物、分支聚合物、树状体、脂质体、微胞、纳米粒子或量子点。在一些实施方案中,所述底物可包含核苷酸、核苷、核苷酸类似物或核苷类似物。在一些实施方案中,所述酶或蛋白质结合底物可包含可与聚合酶结合的试剂。在一些实施方案中,所述酶或蛋白质可包含聚合酶,尤其是如本文所公开的工程化聚合酶变体。在一些实施方案中,所述对一种或多种结合复合物的定位、存在或存留的观察可包含荧光检测。在一些实施方案中,本公开提供一种组合物,其包含多个不同的如本文所公开的粒子,其中各粒子包含单一类型的核苷或核苷类似物,并且其中各核苷或核苷类似物与可检测地不同的发射或激发波长相关。在一些实施方案中,本公开提供所述组合物,其还包含在所述粒子上的一个或多个标记。在一些实施方案中,本公开提供所述组合物,其中所述核苷或核苷类似物具有至少4个核苷或核苷类似物的表面密度。在一些实施方案中,本公开提供所述组合物,其中所述核苷或核苷类似物的表面密度在0.001与1,000,000个/平方微米之间、在0.01与1,000,000个/平方微米之间、在0.1与1,000,000个/平方微米之间、在1与1,000,000个/平方微米之间、在10与1,000,000个/平方微米之间、在100与1,000,000个/平方微米之间、在1,000与1,000,000个/平方微米之间、在1,000与100,000个/平方微米之间、在10,000与100,000个/平方微米之间或在50,000与100,000个/平方微米之间,或在前述值中的任何两者界定的范围内。在一些实施方案中,本公开提供所述组合物,其中核苷或核苷类似物存在于核苷酸或核苷酸类似物内。在一些实施方案中,本公开提供所述组合物,其中所述组合物包含或掺入修饰的以便防止其在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,本公开提供所述组合物,其中所述组合物包含或掺入被可逆地修饰以便防止其在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,本公开提供所述组合物,其中一个或多个标记包含荧光标记、FRET供体和/或FRET受体。在一些实施方案中,本公开提供所述组合物,其中所述底物经由接头附接至粒子。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物为被修饰以在聚合酶反应或测序反应期间抑制伸长的核苷酸,诸如没有3'羟基的核苷酸;修饰的成在3'位置处含有封端基团的核苷酸;被3'-O-叠氮基、3'-O-叠氮基甲基、3'-O-烷基羟氨基、3'-硫代磷酸酯基、3'-O-丙二酰基或3'-O-苯甲基修饰的核苷酸;和/或在3'位置处未修饰的核苷酸。
在一些实施方案中,本公开提供一种确定核酸分子的序列的方法,其包括以下步骤(不涉及次序):1)提供核酸分子,所述核酸分子包含模板链和与所述模板链至少部分互补的互补链;2)使所述核酸分子与如本文所公开的工程化聚合酶变体和一种或多种核酸结合组合物接触;3)检测所述核酸结合组合物与所述核酸分子的结合;4)确定掺入所述核酸分子的所述互补链中的末端核苷酸的身份。在一些实施方案中,所述方法可还包括将所述末端核苷酸掺入所述互补链中,并且再重复所述接触、检测和掺入步骤一次或多次迭代,由此确定所述核酸分子的所述模板链的序列。在一些实施方案中,本公开提供所述方法,其中所述核酸分子已在固体支撑物上被克隆扩增。在一些实施方案中,本公开提供所述方法,其中克隆扩增包含使用聚合酶链反应(PCR)、多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、桥式扩增、等温桥式扩增、滚环扩增、环至环扩增、解螺旋酶依赖性扩增、重组酶依赖性扩增、单链结合(SSB)蛋白质依赖性扩增或其任何组合。在一些实施方案中,本公开提供所述方法,其中包括接触、检测和掺入步骤的测序反应循环在不到30分钟内、在不到20分钟内或在不到10分钟内执行。在一些实施方案中,本公开提供所述方法,其中关于测序操作内碱基判读准确性的平均Q评分大于或等于30分、或大于或等于40分。在一些实施方案中,本公开提供所述方法,其中至少50%、至少60%、至少70%、至少80%或至少90%的鉴别的末端核苷酸具有大于30分或大于40分的Q评分。在一些实施方案中,本公开提供所述方法,其中至少95%的鉴别的末端核苷酸具有大于30分的Q评分。
在一些实施方案中,本公开提供一种试剂,其包含一种或多种如本文所公开的工程化聚合酶变体和任选的一种或多种如本文所公开的多价核酸结合组合物。
在一些实施方案中,本公开提供一种试剂盒,其包含本文所公开的组合物中的任一者;和/或本文所公开的试剂中的任一者;一种或多种缓冲液;和其使用说明书。
在一些实施方案中,本公开提供如本文所公开的组合物或试剂,其用于增加与表面结合或缔合的标记的核酸复合物的造影剂与噪声比(CNR)。
在一些实施方案中,本公开提供如本文所公开的组合物或试剂,其用于建立或维持对来自与表面结合或缔合的标记的核酸复合物的信号的持续时间的控制。
在一些实施方案中,本公开提供如本文所公开的组合物或试剂,其用于建立或维持对来自与表面结合或缔合的标记的核酸复合物的荧光、发光、电、电化学、比色、放射性、磁性或电磁信号的持续时间的控制。
在一些实施方案中,本公开提供如本文所公开的组合物或试剂,其用于增加核酸测序和/或基因分型应用或通过结合测序、合成测序、单分子测序或ensemble测序方法的特异性、准确性或读取长度。
本文所公开的确定靶核酸的序列的方法包括:a)使包含待测序的模板链和待延长的引物链的双链或部分双链的靶核酸分子与一种或多种所公开的核酸结合组合物和一种或多种工程化聚合酶变体接触;以及b)检测核酸结合组合物与所述核酸分子的结合,由此确定所述核酸分子上所述一种或多种核酸结合组合物中的一者的存在和掺入互补链中的下一个核苷酸(即,N+1或末端核苷酸)的身份。
测序方法可还包括将N+1或末端核苷酸掺入引物链中,并且接着再重复所述接触、检测和掺入步骤一次或多次迭代,由此确定所述核酸分子的模板链的序列。在检测三元结合复合物的步骤之后,使引发的靶核酸的引发的链延长一个碱基,随后执行另一轮分析。引发的靶核酸可使用附接至多价结合组合物中的聚合物的结合的核苷酸或使用在移除多价结合组合物之后提供的未结合或未系栓的游离核苷酸延长。
引发的靶核酸的延伸可因所述链上存在封端核苷酸(例如3'封端的核苷酸)或使用无催化活性的聚合酶来防止或抑制。当聚合物-核苷酸缀合物中的核苷酸具有防止所述核酸延伸的封端基团时,核苷酸的掺入可通过从所述核苷酸移除封端基团(诸如通过将所述核苷酸从其聚合物、分支聚合物、树状体、粒子或类似物分开)来实现。当引发的靶核酸的延伸因使用无催化活性的聚合酶而受到抑制时,核苷酸的掺入可通过提供辅因子或活化剂,诸如金属离子来实现。
三元复合物的检测在掺入核苷酸残基之前、同时或之后实现。在一些实施方案中,引发的靶核酸可包含具有多个用于附接聚合酶和/或核酸结合部分的引发的部位的靶核酸。在一些实施方案中,多种聚合酶可附接至单一靶核酸分子,诸如在靶核酸分子内的多个位点处。在一些实施方案中,多种聚合酶可结合至包含多个核苷酸的本文所公开的多价结合组合物。在一些实施方案中,靶核酸分子可为链置换合成、滚环扩增、串联或融合查询序列的多个拷贝、或者如本领域中已知或本文中别处所公开的其他此类方法的产物,由此产生包含同一序列的多个拷贝的核酸分子。因此,在一些实施方案中,多种聚合酶可在靶核酸内的多个同一或实质上同一的部位处附接,所述靶核酸包含查询序列的多个同一或实质上同一的拷贝。在一些实施方案中,所述多种聚合酶接着可涉及与一种或多种多价结合复合物的相互作用;然而,在一些实施方案中,靶核酸内结合位点的数目为至少两个,并且在粒子-核苷酸缀合物上,诸如在聚合物-核苷酸缀合物上存在的核苷酸或底物部分的数目还大于或等于两个。
在一些实施方案中,本文所公开的组合物和方法提供可用于在合成和/或测序反应期间伸长新生核酸链的工程化聚合酶变体,以及可用于在测序反应期间检测一个或多个碱基的工程化聚合酶变体。在一些实施方案中,本公开提供所公开的聚合酶变体在将3'-修饰的核苷酸掺入伸长的核酸链中;在伸长新生核酸链中;和/或在检测或鉴别伸长的核酸链内的特定碱基中的用途。
可能有利的是,提供多价结合组合物与其他成分的组合,诸如以提供最佳化信号,例如提供对在核酸序列中特定位置处的核苷酸的鉴别。在一些实施方案中,本文所公开的组合物为与提供低背景结合或低水平蛋白质结合的表面、尤其是亲水性或聚合物涂布的表面组合提供。代表性表面可见于例如2019年3月25日提交的美国专利申请号16/363,842,所述申请之内容特此以全文引用的方式掺入。
在一些实施方案中,核酸分子为例如经由模板链与系栓至固体支撑物的接头核酸序列或引物核酸序列杂交而系栓至固体支撑物的表面。在一些实施方案中,固体支撑物包括玻璃、熔融二氧化硅、硅或聚合物基板。在一些实施方案中,固体支撑物包括低非特异性结合涂层,其包含一个或多个亲水性聚合物层(例如PEG层),其中所述亲水性聚合物层中的至少一者包含分支聚合物分子(例如包含4、8、16或32个分支的分支PEG分子)。在一些实施方案中,低非特异性结合涂层具有不超过45度的水接触角。
固体支撑物包括以在约1,000个引物分子/平方微米至约1,000,000个引物分子/平方微米范围内的表面密度系栓到至少一个亲水性聚合物层的寡核苷酸接头或引物。在一些实施方案中,寡核苷酸引物的表面密度可为至少1,000个、至少10,000个、至少100,000个或至少1,000,000个分子/平方微米。在一些实施方案中,寡核苷酸引物的表面密度可为至多1,000,000个、至多100,000个、至多10,000个或至多1,000个分子/平方微米。本段中所描述的下限值和上限值中的任一者可组合形成本公开内所包括的范围,例如,在一些实施方案中,引物的表面密度可在约10,000个分子/平方微米至约100,000个分子/平方微米的范围内。本领域技术人员应认识到,引物分子的表面密度可具有在此范围内的任何值,例如约455,000个分子/平方微米。
普通技术人员将认识到,在一系列迭代测序反应中,有时会有一个或多个位点在给定循环期间未能掺入核苷酸,由此使得一个或多个位点与伸长的核酸链的主体不同步。在测序信号来源于在靶核酸的单一拷贝上发生的反应的情况下,这些掺入失败将在输出序列中产生分散的错误。本公开的一个靶为提供用于减少测序反应中的此类错误的方法。再例如,使用能够掺入伸长链中的多价底物,通过在三元聚合酶复合物提前解离时增加再结合的机率,可减小未掺入碱基的“跳过(skipped)”循环的频率。因此,在一些实施方案中,本公开涵盖使用单独或与如本文所公开的多价底物组合的如本文所公开的工程化聚合酶变体。本公开清楚地涵盖包含一种或多种如本文所公开的工程化聚合酶变体和一种或多种多价结合底物的实施方案,其中核苷部分包含在具有游离或可逆地修饰的5'磷酸酯、二磷酸酯或三磷酸酯部分的核苷酸内,并且其中核苷酸经由不稳定或可裂解键联来联接至如本文所公开的粒子或聚合物。在一些实施方案中,本公开涵盖通过使用本文所公开的工程化聚合酶变体和/或多价底物减小由跳过掺入引起的固有错误率。
本公开还涵盖测序反应,其中来自给定序列或与给定序列相关的测序信号为来源于或源自含有靶序列的多个拷贝的可界定区域内。掺入靶序列的多个拷贝的测序方法具有如下优势:信号可由于所界定区域内存在多个同时测序反应而放大,所述多个测序反应各提供其自身的信号。由于来自大量正确碱基判读的信号可覆盖来自较少量跳过或不正确碱基判读的信号的事实,所界定区域内多个信号的存在还减小任何单一跳过循环的影响。本公开进一步涵盖在伸长反应期间或在伸长循环的独立部分期间包括游离的、未标记的核苷酸,以便提供在先前循环中可能被跳过的位点处的掺入。举例而言,在掺入循环期间或之后,可添加未标记的封端的核苷酸,由此使其可在跳过的位点处掺入。未标记的封端的核苷酸可为一种或多种与附接至在特定循环期间存在的一种或多种多价结合底物的核苷酸相同的类型,或可包括1、2、3、4种或更多种类型未标记的封端核苷酸的混合物。
当各测序循环完美进行时,在所界定区域内进行的各反应将提供同一信号。然而,如本文中别处所述,在一系列迭代测序反应中,有时会有一个或多个位点在给定循环期间未能掺入核苷酸,由此使得一个或多个位点与伸长的核酸链的主体不同步。此问题称为“定相(phasing)”,会因为测序信号混杂有来自已跳过一个或多个循环的位点的虚假信号而导致测序信号的衰减。此又会产生在碱基鉴别中出现错误的可能。由于测序信号随各循环而进行性衰减,所以在多个循环中跳过循环的进行性积累还减小有效读取长度。本公开的另一靶为提供用于减少定相错误和/或以改善测序反应中的读取长度的方法。
测序方法可包括使包含靶序列的多个连接或未连接的拷贝的一个靶核酸或多个靶核酸与本文所描述的多价结合组合物接触。使所述包含靶序列的多个连接或未连接的拷贝的靶核酸或多个靶核酸与一种或多种粒子-核苷酸缀合物接触可显著增加在给定的测序循环中询问的正确核苷酸的局部浓度,由此抑制来自不当掺入或定相核酸链(即,具有一个或多个跳过循环的伸长的核酸链)的信号。
获得核酸序列信息的方法可包括使一个靶核酸或多个靶核酸与一种或多种粒子-核苷酸缀合物接触,其中所述模板核酸或多个靶核酸包含靶序列的多个连接或未连接的拷贝。在一些实施方案中,此方法使得平均读取长度与使用单价配体观察到的平均读取长度相比有5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%或更高百分比的增加,所述单价配体包括游离核苷酸、标记的游离核苷酸、蛋白质或肽结合的核苷酸、或者标记的蛋白质或肽结合的核苷酸。在一些实施方案中,此方法使得平均读取长度与使用野生型聚合酶或当前可用的聚合酶变体、单价配体所观察到的平均读取长度相比有10NT、20NT、25NT、30NT、50NT、75NT、100NT、125NT、150NT、200NT、250NT、300NT、350NT、400NT、500NT或更多增加,所述单价配体包括游离核苷酸、标记的游离核苷酸、蛋白质或肽结合的核苷酸、或者标记的蛋白质或肽结合的核苷酸。
获得核酸序列信息的方法可包括使一个靶核酸或多个靶核酸与一种或多种工程化聚合酶变体并且任选地与一种或多种粒子-核苷酸缀合物接触,其中所述靶核酸或多个靶核酸包含靶序列的多个连接或未连接的拷贝。根据碱基的错误鉴别、不存在的碱基的报告或报告正确碱基的失败减少所指示,此方法使得测序的错误率降低。在一些实施方案中,所述测序的错误率降低可包含与使用野生型酶或当前可用酶、或单价配体所观察到的错误率相比有5%、10%、15%、20%、25%、50%、75%、100%、150%、200%或更高百分比降低,所述单价配体包括游离核苷酸、标记的游离核苷酸、蛋白质或肽结合的核苷酸、或者标记的蛋白质或肽结合的核苷酸。
使用工程化聚合酶变体进行测序将提供更准确的碱基读出。所公开的用于核酸测序的组合物和方法将提供在约20分至约50分范围内的有关在测序操作内碱基判读准确性的平均Q评分。在一些实施方案中,平均Q评分为至少20分、至少25分、至少30分、至少35分、至少40分、至少45分或至少50分。本领域技术人员应认识到,平均Q评分可具有在此范围内的任何值,例如约32。
在一些实施方案中,所公开的用于核酸测序的组合物和方法将对至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的所鉴别的末端(或N+1)核苷酸提供大于30分的Q评分。在一些实施方案中,所公开的用于核酸测序的组合物和方法将对至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的所鉴别的末端(或N+1)核苷酸提供大于35分的Q评分。在一些实施方案中,所公开的用于核酸测序的组合物和方法将对至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的所鉴别的末端(或N+1)核苷酸提供大于40分的Q评分。在一些实施方案中,所公开的用于核酸测序的组合物和方法将对至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的所鉴别的末端(或N+1)核苷酸提供大于45分的Q评分。在一些实施方案中,所公开的用于核酸测序的组合物和方法将对至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的所鉴别的末端(或N+1)核苷酸提供大于50分的Q评分。
所公开的低非特异性结合支撑物以及相关核酸杂交和扩增方法可用于分析来源于本领域技术人员已知的多种不同细胞、组织或样品类型中的任一者的核酸分子。举例而言,核酸可以从来源于真核生物(诸如动物、植物、真菌、原生生物)、太古菌或真细菌的细胞或包含一种或多种类型的细胞的组织样品中提取。在一些情况下,核酸可以从原核或真核细胞,诸如粘附或非粘附真核细胞中提取。核酸不同地从例如初代或永生化啮齿动物、猪、猫、犬、牛、马、灵长类动物或人类细胞系中提取。核酸可以从多种不同细胞、器官或组织类型(例如白血球、红血球、血小板、上皮细胞、内皮细胞、神经元、胶细胞、星形胶质细胞、纤维母细胞、骨胳肌肉细胞、平滑肌细胞、配子或来自心脏、肺、脑、肝、肾、脾脏、胰脏、胸腺、膀胱、胃、结肠或小肠的细胞)中的任一者中提取。核酸可以从正常或健康细胞中提取。替代地或组合地,核酸从病变细胞,诸如癌细胞中提取,或从使宿主感染的致病细胞中提取。一些核酸可以从不同亚组的细胞类型,例如免疫细胞(诸如T细胞、细胞毒性(杀手)T细胞、辅助T细胞、αβT细胞、γδT细胞、T细胞祖细胞、B细胞、B细胞祖细胞、淋巴干细胞、骨髓祖细胞、淋巴球、粒细胞、自然杀伤细胞、浆细胞、记忆细胞、嗜中性白血球、嗜伊红白血球、嗜碱性球、肥大细胞、单核细胞、树突状细胞和/或巨噬细胞或其任何组合)、未分化型人类干细胞、已诱导分化的人类干细胞、稀有细胞(例如循环肿瘤细胞(CTC)、循环上皮细胞、循环内皮细胞、循环子宫内膜细胞、骨髓细胞、祖细胞、泡沫细胞、间叶细胞或滋养层)中提取。其他细胞涵盖在本文的公开内容中并且与本文的公开内容相符。
在一些实施方案中,本公开提供确定靶核酸中核苷酸的身份的方法,其包括以下步骤(不涉及任何特定操作次序):1)提供组合物,所述组合物包含:包含同一序列的两个或更多个重复序列的靶核酸;与所述靶核酸的一个或多个区互补的两个或更多个引物核酸;和两个或更多个聚合酶分子,其中所述聚合酶分子可包含一种或多种如本文所公开的工程化聚合酶变体;2)使所述组合物与包含聚合物-核苷酸缀合物的多价结合组合物在足以允许所述聚合物-核苷酸缀合物与步骤(a)的组合物之间形成结合复合物的条件下接触,其中所述聚合物-核苷酸缀合物包含核苷酸的两个或更多个拷贝和任选的一个或多个可检测标记;以及3)检测所述结合复合物,由此确定靶核酸聚合物中所述核苷酸的身份。在一些其他实施方案中,本公开提供所述方法,其中所述靶核酸为DNA,和/或其中所述靶核酸已诸如通过任何通常实行的DNA复制或扩增方法,诸如滚环扩增、桥式扩增、解螺旋酶依赖性扩增、等温桥式扩增、滚环多重置换扩增(RCA/MDA)和/或基于重组酶的复制或扩增方法进行复制。在一些其他实施方案中,本公开提供所述方法,其中所述可检测标记为荧光标记和/或其中检测所述复合物包含荧光测量。在一些其他实施方案中,本公开提供所述方法,其中所述多价结合组合物包含一种类型的聚合物-核苷酸缀合物,其中所述多价结合组合物包含两种或更多种类型的聚合物-核苷酸缀合物,和/或其中所述两种或更多种类型的聚合物-核苷酸缀合物中的各类型包含不同类型的核苷酸。在一些实施方案中,本公开提供所述方法,其中所述结合复合物还包含封端的核苷酸,尤其是其中所述封端的核苷酸为3'-O-叠氮基甲基、3'-O-烷基羟氨基或3'-O-甲基核苷酸。在一些其他实施方案中,本公开提供所述方法,其中所述接触在锶离子、钡离子、镁离子和/或钙离子存在下进行。在一些实施方案中,本公开提供所述方法,其中聚合酶分子无催化活性,诸如其中聚合酶分子因突变、因化学修饰或因不存在所需的离子或辅因子而呈现无催化活性。在一些实施方案中,本公开还提供所述方法,其中聚合酶分子有催化活性,和/或其中结合复合物不包含封端的核苷酸。在一些实施方案中,本公开提供所述方法,其中所述结合复合物具有超过约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1或2秒的持续时间和/或其中所述方法在或可在等于或高于15℃、等于或高于20℃、等于或高于25℃、等于或高于35℃、等于或高于37℃、等于或高于42℃、等于或高于55℃、等于或高于60℃或等于或高于72℃、或在前述任一者所界定的范围内的温度下进行。在一些实施方案中,本公开提供所述方法,其中所述结合复合物沉积于表面上、附接至表面或与表面杂交,所述表面在检测步骤中显示出大于20的造影剂与噪声比。在一些实施方案中,本公开提供所述方法,其中所述组合物在掺入极性非质子性溶剂的缓冲液条件下沉积。在一些实施方案中,本公开提供所述方法,其中所述接触在所述核苷酸与所述靶核酸的下一个碱基互补时使所述结合复合物稳定并在所述核苷酸与所述靶核酸的所述下一个碱基不互补时使所述结合复合物不稳定的条件下执行。在一些实施方案中,本公开提供所述方法,其中所述聚合物-核苷酸缀合物包含具有多个分支的聚合物且所述第一核苷酸的所述多个拷贝附接至所述分支,尤其是其中所述第一聚合物具有星形、梳状、交联、瓶刷状或树状体构型。在一些实施方案中,本公开提供所述方法,其中所述聚合物-核苷酸缀合物包含一个或多个选自由以下组成的组的结合基团:抗生物素蛋白、生物素、亲和标签和其组合。在一些实施方案中,本公开提供所述方法,其还包括解离步骤,所述解离步骤使(a)的组合物与聚合物-核苷酸缀合物之间形成的所述结合复合物不稳定以移除所述聚合物-核苷酸缀合物。在一些实施方案中,本公开提供所述方法,其还包括用于将与靶核酸的所述下一个碱基互补的核苷酸掺入所述引物核酸中的延伸步骤,并且任选地其中延伸步骤当前作为所述解离步骤或在所述解离步骤之后发生。在一些实施方案中,本公开提供一种组合物,其包含具有两个或更多个分支的分支聚合物和核苷酸的两个或更多个拷贝,其中所述核苷酸附接至第一多个所述分支或臂,并且任选地其中一个或多个相互作用部分附接至第二多个所述分支或臂。在一些实施方案中,所述组合物可还包含在聚合物上的一个或多个标记。在一些实施方案中,本公开提供所述组合物,其中所述核苷具有每个聚合物至少4个核苷酸的表面密度。在一些实施方案中,本公开提供所述组合物,其包含或掺入修饰的以便防止后续核苷酸(或核苷酸类似物)在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,所述组合物可包含或掺入被可逆地修饰以便允许后续核苷酸(或核苷酸类似物)在聚合酶反应期间掺入延伸的核酸链中的核苷酸或核苷酸类似物。在一些实施方案中,本公开提供所述组合物,其中一个或多个标记包含荧光标记、FRET供体和/或FRET受体。在一些实施方案中,所述组合物可包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或更多个分支或臂、或2、4、8、16、32、64个或更多个分支或臂。在一些实施方案中,所述分支或臂可从中央部分发散。在一些实施方案中,所述组合物可包含一个或多个相互作用部分,所述相互作用部分可包含抗生物素蛋白或链霉抗生物素蛋白;生物素部分;亲和标签;酶、抗体、微型抗体、受体或其他蛋白质;非蛋白质标签;金属亲和标签或其任何组合。在一些实施方案中,本公开提供所述组合物,其中所述聚合物包含聚乙二醇、聚丙二醇、聚乙酸乙烯酯、聚乳酸或聚乙醇酸。在一些实施方案中,本公开提供所述组合物,其中所述核苷酸或核苷酸类似物经由接头附接至分支或臂;并且尤其是其中接头包含PEG,并且其中PEG部分具有约1K、约2K、约3K、约4K、约5K、约10K、约15K、约20K、约50K、约100K、约150K或约200K、或大于约200K的平均分子量。在一些实施方案中,本公开提供所述组合物,其中所述接头包含PEG,并且其中所述PEG部分具有在约5K与约20K之间的平均分子量。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物包含脱氧核糖核苷酸、核糖核苷酸、脱氧核苷或核苷;和/或其中所述核苷酸或核苷酸类似物经由所述核苷酸或核苷酸类似物的5'端结合至接头。在一些实施方案中,本公开提供所述组合物,其中所述核苷酸或核苷酸类似物中的一者包含脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷、脱氧胞苷、腺苷、鸟苷、5-甲基-尿苷和/或胞苷;并且其中所述接头的长度在1与1,000nm之间。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物为被修饰以在聚合酶反应或测序反应期间抑制伸长的核苷酸,诸如其中所述至少一个核苷酸或核苷酸类似物为没有3'羟基的核苷酸;修饰的成在3'位置处含有封端基团的核苷酸;和/或被3'-O-叠氮基、3'-O-叠氮基甲基、3'-O-烷基羟氨基、3'-硫代磷酸酯基、3'-O-丙二酰基或3'-O-苯甲基修饰的核苷酸。在一些实施方案中,本公开提供所述组合物,其中至少一个核苷酸或核苷酸类似物为在3'位置处未修饰的核苷酸。
在一些实施方案中,封端基团可附接至一个或多个核苷酸。举例而言,封闭、移除或保护糖3'OH位置将防止DNA引物模板无意延伸超过单一碱基对以确保无信息损失。成功的3'封端基团标准已大体上概述如下:1)聚合酶应将携带3'封端基团的dNTP准确地且高效掺入伸长的核酸链中;2)用于快速且完全地解封端的温和条件应为可用的;和3)聚合酶应能够在3'基团解封端之后重新起始或恢复合成。
在一些实施方案中,3'封端基团包含可以模板依赖性方式掺入并且迅速解封端以产生可延伸的3'-OH基团者。代表性封端基团包括例如酯和醚。其他代表性3'封端基团包括但不限于-F、-NH2、-OCH3、-N3、-PO3、-NHCOCH3、2-硝基苯碳酸酯、2,4-二硝基苯次磺酰基和四氢呋喃基醚。在一些实施方案中,有用封端基团的特性包括掺入和链终止,其已用多个本文所公开的示例性封端基团展示。额外的示例性封端基团可包含低碳数(1-4个碳)烷酸和取代的低碳数烷酸酯,诸如甲酰基、乙酰基、异丙酰基、α氟代和α氯代乙酰基酯,和类似物;醚封端基团,诸如烷基醚;磷酸酯封端基团;碳酸酯封端基团,诸如2-硝基苯甲基;2-4二硝基苯次磺酰基;和四氢呋喃基醚封端基团。额外的示例性封端基团包括但不限于MOM(CH2OCH3)和烯丙基(CH2-CH=CH2),其可以高产率裂解。
本公开还涵盖一种标记核酸分子的方法,其中所述方法包括将核苷酸或核苷分子掺入所述核酸分子中,其中所述核苷酸或核苷分子具有经由可裂解接头连接至可检测标记的碱基。在一些实施方案中,掺入步骤可经由末端转移酶、聚合酶或反转录酶实现。在一些实施方案中,碱基可为嘌呤或嘧啶。在一些实施方案中,碱基可为去氮嘌呤。在一些实施方案中,核苷酸或核苷分子可具有核糖或脱氧核糖糖部分。在一些实施方案中,核糖或脱氧核糖可包括经由2'或3'氧原子附接的保护基。在一些实施方案中,保护基可被移除以暴露3'-OH基团。在一些实施方案中,所述分子可为脱氧核糖核苷酸三磷酸酯。在一些实施方案中,可检测标记可为荧光团、发色团、电化学标记或自旋标记。在一些实施方案中,接头可为酸不稳定性接头、光不稳定性接头,或可含有二硫化物键联。在一些实施方案中,可检测标记和/或可裂解接头可具有足以防止第二核苷酸或核苷掺入核酸分子中的大小或化学性质。
本公开提供用于形成多个复合聚合酶的方法,其包括步骤(a):使多个突变型聚合酶与(i)多个核酸模板分子和(ii)多个核酸引物在适用于使所述多个突变型聚合酶与所述多个核酸模板分子和所述多个核酸引物结合的条件下接触,由此形成多个复合聚合酶,其各自包含结合至核酸双链体的突变型聚合酶,其中所述核酸双链体包含与核酸引物杂交的核酸模板分子。在一些实施方案中,所述多个突变型聚合酶包含DNA聚合酶。在一些实施方案中,多个突变型聚合酶包含多个如本文所描述的重组突变型聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。在一些实施方案中,突变型DNA聚合酶在约25-50℃或约45-75℃的温度范围内表现出与包含SEQ ID NO:1的野生型聚合酶相比增加的热稳定性。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,引物包含3'可延伸端或3'不可延伸端。在一些实施方案中,多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个核酸模板分子和/或所述多个核酸引物呈溶液形式或固定至支撑物。在一些实施方案中,当所述多个核酸模板分子和/或所述多个核酸引物固定至支撑物时,与重组突变型聚合酶的结合产生多个固定的复合聚合酶。在一些实施方案中,所述多个核酸模板分子和/或核酸引物固定至支撑物上的102-1015个不同位点。在一些实施方案中,所述多个模板分子和核酸引物与所述多个重组突变型聚合酶结合产生固定至支撑物上的102-1015个不同位点的多个复合聚合酶。在一些实施方案中,在支撑物上的多个固定的复合聚合酶固定至支撑物上的预定位点或随机位点。在一些实施方案中,多个固定的复合聚合酶彼此流体连通以允许试剂(例如包括聚合酶在内的酶、多价分子、核苷酸和/或二价阳离子和类似物)的溶液流动至支撑物上以使得在所述支撑物上的多个固定的复合聚合酶可与试剂的溶液以大规模平行方式反应。
在一些实施方案中,用于形成多个复合聚合酶的方法大体上包含:(a)使多个突变型聚合酶与(i)多个核酸模板分子和(ii)多个核酸引物接触以形成多个复合聚合酶;(b1)使所述多个复合聚合酶与多个多价分子接触以形成多个多价-复合聚合酶。在一些实施方案中,所述方法还包括步骤(c1):检测结合至所述复合聚合酶的多价分子。在一些实施方案中,所述方法还包括步骤(d1):鉴别结合至所述复合聚合酶的多价分子的互补核苷酸单元。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(b1):使所述多个复合聚合酶与多个多价分子接触,其中所述多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心并且各核苷酸臂附接至核苷酸(例如核苷酸单元)。在一些实施方案中,多价分子的互补核苷酸单元与复合聚合酶结合形成多个多价-复合聚合酶。在一些实施方案中,步骤(b1)中的接触在适用于使所述多价分子中的至少一者的互补核苷酸单元与所述复合聚合酶中的至少一者结合的条件下进行。在一些实施方案中,所述条件适用于抑制互补核苷酸单元掺入多个多价-复合聚合酶的引物中。在一些实施方案中,步骤(b1)中的接触在适用于使所述多价分子中的至少一者的核苷酸与所述复合聚合酶中的至少一者结合,但结合的核苷酸不掺入核酸引物的3'端的条件下进行。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个多价分子中的个别多价分子可包括多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个复合DNA聚合酶与所述多个多价分子结合形成至少一种亲合力复合物,所述方法包括以下步骤:(a)使第一核酸引物、第一DNA聚合酶和第一多价分子与多联体模板分子的第一部分结合,由此形成第一结合复合物,其中第一多价分子的第一核苷酸单元结合至第一DNA聚合酶;以及(b)使第二核酸引物、第二DNA聚合酶和第一多价分子与同一多联体模板分子的第二部分结合,由此形成第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至第二DNA聚合酶,其中包含相同多价分子的第一结合复合物和第二结合复合物形成亲合力复合物。在一些实施方案中,第一聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第二聚合酶包含本文所描述的任何野生型或突变型聚合酶。多联体模板分子包含感兴趣序列的串联重复序列和至少一个通用测序引物结合位点。第一核酸引物和第二核酸引物可沿多联体模板分子结合至测序引物结合位点。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个复合DNA聚合酶与所述多个多价分子结合形成至少一种亲合力复合物,所述方法包括以下步骤:(a)使第一核酸引物、第一DNA聚合酶和第一多价分子与第一模板分子结合,由此形成第一结合复合物,其中第一多价分子的第一核苷酸单元结合至第一DNA聚合酶;以及(b)使第二核酸引物、第二DNA聚合酶和第一多价分子与第二模板分子结合,由此形成第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至第二DNA聚合酶,其中包括相同多价分子的第一结合复合物和第二结合复合物形成亲合力复合物。在一些实施方案中,第一聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第二聚合酶包含本文所描述的任何野生型或突变型聚合酶。在一些实施方案中,第一模板分子和第二模板分子为克隆扩增的模板分子。在一些实施方案中,第一模板分子和第二模板分子彼此紧密靠近地定位。举例而言,克隆扩增的第一模板分子和第二模板分子包含线性模板分子,其为经由桥式扩增产生并且固定至支撑物上的相同部位或特征。第一模板分子和第二模板分子包含感兴趣序列和至少一个通用测序引物结合位点。第一核酸引物第二核酸引物可分别结合至第一模板分子和第二模板分子上的测序引物结合位点。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个多价分子中的至少一个多价分子为用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,多价分子的核心用荧光团标记,并且其中附接至所述多价分子的给定核心的荧光团对应于核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,所述多个多价分子包含至少一个具有多个核苷酸臂的多价分子,所述多个核苷酸臂各自与核苷酸类似物(例如核苷酸类似物单元)附接,其中所述核苷酸类似物在糖2'和/或3'位置处包括链终止部分。在一些实施方案中,所述多个多价分子包含至少一个包含多个核苷酸臂的多价分子,所述多个核苷酸臂各自与没有链终止部分的核苷酸单元附接。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的接触在至少一个选自由以下组成的组的阳离子存在下进行:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b1)的接触在锶、钡和/或钙存在下进行。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(a)的接触在选自约25-51℃的温度范围的恒定温度下进行。在一些实施方案中,步骤(b1)的接触系在选自约25-51℃的温度范围的恒定温度下进行。在一些实施方案中,步骤(a)和(b1)的接触在选自约25-51℃温度范围的恒定温度(例如等温温度)下进行。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(c1):检测结合至复合聚合酶的多价分子。在一些实施方案中,所述检测包括检测结合至复合聚合酶的多价分子,其中所述多价分子的互补核苷酸单元结合至引物,但互补核苷酸单元的掺入受到抑制。在一些实施方案中,所述多价分子用可检测的报导因子部分标记以允许检测。在一些实施方案中,标记的多价分子包含附接至多价分子的核心、接头和/或核苷酸单元的碱基的荧光团。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(d1):鉴别结合至复合聚合酶的多价分子的互补核苷酸单元。在一些实施方案中,鉴别多价分子的互补核苷酸单元可用于确定核酸模板的序列。在一些实施方案中,所述多价分子用可检测的报导因子部分标记,所述可检测的报导因子部分对应于附接至核苷酸臂的特定核苷酸单元以允许鉴别结合至多个复合聚合酶的互补核苷酸单元(例如核苷酸碱基腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。在一些实施方案中,步骤(c1)的检测和步骤(d1)的鉴别可用于确定核酸模板分子的序列。
在一些实施方案中,用于形成多个复合聚合酶的方法大体上包含:(a)使多个突变型聚合酶与(i)多个核酸模板分子和(ii)多个核酸引物接触以形成多个复合聚合酶;(b2)使所述多个复合聚合酶与多个核苷酸接触以形成多个核苷酸-复合聚合酶。在一些实施方案中,所述方法还包括步骤(c2):检测掺入核苷酸-复合聚合酶的引物中的互补核苷酸。在一些实施方案中,所述方法还包括步骤(d2):鉴别掺入核苷酸-复合聚合酶的引物中的互补核苷酸的碱基。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(b2):使步骤(a)的多个复合聚合酶与多个核苷酸在适用于使来自所述多个核苷酸的互补核苷酸与来自所述多个复合聚合酶的复合聚合酶结合的条件下接触,由此形成核苷酸-复合聚合酶。在一些实施方案中,步骤(b2)的接触在适用于促进结合的互补核苷酸掺入核苷酸-复合聚合酶的引物中,由此形成多个核苷酸-复合聚合酶的条件下进行。在一些实施方案中,步骤(b2)中将核苷酸掺入引物的3'端中包含引物延伸反应。在一些实施方案中,步骤(b2)的接触在至少一个选自由以下组成的组的阳离子存在下进行:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b2)的接触在镁和/或锰存在下进行。在一些实施方案中,所述多个核苷酸中的个别核苷酸包含核苷酸单元,其包括一个或多个如上文所论述的示例核苷酸单元特征。在一些实施方案中,所述多个核苷酸包含天然核苷酸(例如非类似物核苷酸)或核苷酸类似物。在一些实施方案中,所述多个核苷酸中的个别核苷酸包含附接至2'和/或3'糖位置的链终止部分。在一些实施方案中,所述多个核苷酸包含可移除或不可移除的2'和/或3'链终止部分。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。在一些实施方案中,所述叠氮化物、叠氮基或叠氮基甲基可用膦化合物从核苷酸移除。本领域技术人员应认识到,其他可移除的链终止部分还为可能的。在一些实施方案中,所述多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除或不可从碱基移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(a)的接触在选自约25-51℃的温度范围的恒定温度下进行。在一些实施方案中,步骤(b2)的接触在选自约25-51℃的温度范围的恒定温度下进行。在一些实施方案中,步骤(a)和(b2)的接触在选自约25-51℃的温度范围的恒定温度(例如等温温度)下进行。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(c2):检测掺入核苷酸-复合聚合酶的引物中的互补核苷酸。在一些实施方案中,所述多个核苷酸用可检测的报导因子部分标记以允许检测。
在一些实施方案中,用于形成多个复合聚合酶的方法还包括步骤(d2):鉴别掺入核苷酸-复合聚合酶的引物的3'端中的互补核苷酸的碱基。在一些实施方案中,步骤(c2)的检测和步骤(d2)的鉴别可用于确定核酸模板分子的序列。
或者,用于形成多个复合聚合酶的方法还包括步骤(b2):使步骤(a)的多个复合聚合酶与多个核苷酸在适用于使来自所述多个核苷酸的互补核苷酸与来自所述多个复合聚合酶的复合聚合酶结合的条件下接触,由此形成核苷酸-复合聚合酶。在一些实施方案中,步骤(b2)的接触在适用于促进核苷酸结合但抑制结合的互补核苷酸掺入核苷酸-复合聚合酶的引物的3'端中的条件下进行。在一些实施方案中,步骤(b2)的接触在至少一个选自由以下组成的组的阳离子存在下进行:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。所述多个复合聚合酶可依序与至少两种独立混合物接触,其中各混合物包含工程化聚合酶和核苷酸。所述接触在适用于与模板中第一、第二和第三碱基类型的同源物形成稳定三元复合物的条件下进行。所述方法还包括步骤(c3)检查所述至少两种独立混合物以确定是否形成三元复合物。所述方法还包括步骤(d3)鉴别引发的模板核酸分子的下一个正确核苷酸,其中如果在步骤(c3)中检测到三元复合物,则将所述下一个正确核苷酸鉴别为第一、第二或第三碱基类型的同源物,并且其中基于步骤(c3)中不存在三元复合物,则插入所述下一个正确核苷酸作为第四碱基类型的核苷酸同源物。所述方法还包括步骤(e3)在步骤(c3)之后,将下一个正确核苷酸添加至引发的模板核酸的引物中,由此产生延伸的引物;和步骤(f3)对包含所述延伸的引物的引发的模板核酸重复步骤(a)至(e3)。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的至少一个多价分子可体现多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的至少一个多价分子包含具有含一个、两个或三个磷原子的链的核苷酸单元,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,至少一个核苷酸单元为具有磷链的核苷酸类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的个别多价分子包含附接至多核苷酸臂的核心并且其中个别核苷酸臂包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的核苷酸单元。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的至少一个多价分子包含含终止剂核苷酸类似物的核苷酸单元,所述终止剂核苷酸类似物包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的至少一个多价分子包含含终止剂核苷酸类似物的核苷酸单元,所述终止剂核苷酸类似物在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的至少一个多价分子包含附接至多个核苷酸臂的核心,其中所述核心用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,附接至多价分子的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸单元的碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。在一些实施方案中,至少一个多价分子没有荧光团。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多个多价分子中的多价分子的至少一个核苷酸臂具有附接至可检测的报导因子部分的核苷酸单元。在一些实施方案中,可检测的报导因子部分附接至核苷酸碱基。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,附接至多价分子的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸单元的碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b1)的多价分子的核心包含抗生物素蛋白样部分且核心附接部分包含生物素。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分,其包括抗生物素蛋白,以及可结合到至少一个生物素部分的抗生物素蛋白的任何衍生物、类似物和其他非天然形式。抗生物素蛋白部分的其他形式包括天然和重组抗生物素蛋白和链霉抗生物素蛋白,以及衍生化的分子,例如未糖基化的抗生物素蛋白和截短的链霉抗生物素蛋白。举例而言,抗生物素蛋白部分包括抗生物素蛋白的去糖基化形式、由链霉菌(例如阿维丁链霉菌)产生的细菌链霉抗生物素蛋白以及衍生化形式,例如N-酰基抗生物素蛋白,例如N-乙酰基抗生物素蛋白、N-苯二甲酰基抗生物素蛋白和N-琥珀酰基抗生物素蛋白,和可商购获得的产品ExtrAvidinTM、CaptavidinTM、NeutravidinTM和Neutralite AvidinTM。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含碱基、糖和至少一个磷酸酯基。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸单元,其包括一个或多个如上文所论述的示例核苷酸单元特征。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸不为核苷酸类似物。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸类似物。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含具有含一个、两个或三个磷原子的链的核苷酸单元,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,多个核苷酸中的至少一个核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含终止剂核苷酸类似物。核苷酸可呈包括一个或多个上文所论述的示例核苷酸类似物特征的终止剂核苷酸类似物形式。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含可检测的报导因子部分。在一些实施方案中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含标记的核苷酸。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含末端核苷酸类似物,其包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含在碱基上的可裂解接头,其包含可裂解部分,包括叠氮化物、叠氮基或叠氮基甲基。在一些实施方案中,可裂解部分叠氮化物、叠氮基和叠氮基甲基可用膦化合物裂解/移除。在一些实施方案中,膦化合物包含衍生化的三烷基膦部分或衍生化的三芳基膦部分。在一些实施方案中,膦化合物包含三(2-羧基乙基)膦(TCEP)或双磺基三苯基膦(BS-TPP)或三(羟基丙基)膦(THPP)。在一些实施方案中,裂解剂包括4-二甲氨基吡啶(4-DMAP)。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(b2)的多个核苷酸中的至少一个核苷酸包含所述糖2'和/或糖3'位置处的链终止部分和在碱基上的可裂解接头,其中在糖上的链终止部分和在碱基上的可裂解接头具有相同或不同的可裂解部分。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用相同化学试剂以化学方式裂解/移除。在一些实施方案中,链终止部分(例如在糖2'和/或糖3'位置处)和连接至碱基的可检测的报导因子部分可用不同化学试剂以化学方式裂解/移除。
在一些实施方案中,在用于形成多个复合聚合酶的方法中,步骤(a)的支撑物包括平面或非平面支撑物。支撑物可为固体或半固体。在一些实施方案中,支撑物可为多孔、半多孔或无孔的。在一些实施方案中,支撑物的表面可涂有一种或多种化合物以在支撑物上产生钝化层。在一些实施方案中,钝化层形成多孔或半多孔层。在一些实施方案中,核酸引物、模板和/或聚合酶可附接至钝化层以将引物、模板和/或聚合酶固定至支撑物。在一些实施方案中,支撑物包括使得支撑物上的核酸杂交和扩增效能能够改善的低非特异性结合表面。一般而言,支撑物可包括一层或多层共价或非共价附接的低结合、化学改质层,例如硅烷层、聚合物膜,和一个或多个共价或非共价附接的寡核苷酸,其可用于将多个核酸模板分子固定至支撑物。在一些实施方案中,支撑物可包括经由支撑物上的化学基团至少共价结合至支撑物的一部分的官能化聚合物涂层、移植至官能化聚合物涂层上的引物以及在所述引物和所述官能化聚合物涂层上的水溶性保护涂层。在一些实施方案中,官能化聚合物涂层包含聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺(PAZAM)。在一些实施方案中,支撑物包括具有至少一个亲水性聚合物涂层的表面涂层和至少一层多个寡核苷酸。亲水性聚合物涂层可包含聚乙二醇(PEG)。亲水性聚合物涂层可包含具有至少4个分支的分支PEG。在一些实施方案中,支撑物包括具有不超过45度的水接触角的低非特异性结合涂层。在一些实施方案中,固定至支撑物或固定至支撑物上的涂层的多个复合聚合酶的密度为约102-106个/平方毫米、或约106-109个/平方毫米、或约109-1012个/平方毫米、或约1012-1015个/平方毫米。在一些实施方案中,多个复合聚合酶固定至支撑物或在所述支撑物(或在支撑物上的涂层)上的预定位点处固定至支撑物上的涂层,或在所述支撑物(或在所述支撑物上的涂层)的随机位点处固定至支撑物上的涂层。本公开提供用于使突变型聚合酶结合至核苷酸的方法,其包括:(a)使突变型聚合酶与(i)核酸模板分子和(ii)核酸引物接触,其中所述接触在适用于使所述突变型聚合酶结合至与核酸引物杂交的核酸模板分子的条件下进行,其中与核酸引物杂交的核酸模板分子形成核酸双链体。在一些实施方案中,突变型聚合酶包含重组突变型聚合酶。在一些实施方案中,引物包含3'可延伸端或3'不可延伸端。在一些实施方案中,突变型聚合酶包含一个或多个上文所列的特征以及示例突变型聚合酶特征。
在一些实施方案中,所述用于使突变型聚合酶结合至核苷酸的方法还包括(b)使所述突变型聚合酶与多个核苷酸在适用于使至少一个核苷酸结合至与核酸双链体结合的突变型聚合酶的条件下接触。在一些实施方案中,突变型聚合酶在至少一个阳离子存在下与多个核苷酸接触,所述至少一个阳离子选自由以下组成的组:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b)的接触在锶、钡和/或钙存在下进行。在一些实施方案中,至少一个核苷酸结合突变型聚合酶且不掺入可延伸或不可延伸引物的3'端中。在一些实施方案中,所述多个核苷酸包含至少一个在糖2'或3'位置处具有链终止部分的核苷酸类似物。在一些实施方案中,所述多个核苷酸包含至少一个没有链终止部分的核苷酸。在一些实施方案中,所述方法还包括(c)检测结合至聚合酶但未掺入引物的3'端中的所述至少一个核苷酸。在一些实施方案中,所述方法还包括(d)鉴别结合至聚合酶但未掺入引物的3'端中的所述至少一个核苷酸。
本公开提供用于掺入核苷酸、核酸模板分子的序列或结合突变型聚合酶的方法,其包括:(a)使突变型聚合酶与(i)核酸模板分子和(ii)核酸引物接触,其中所述接触在适用于使所述突变型聚合酶结合至与核酸引物杂交的核酸模板分子的条件下进行,其中与核酸引物杂交的核酸模板分子形成核酸双链体。在一些实施方案中,聚合酶包含包括本文所描述的特征的重组突变型聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。在一些实施方案中,引物包含3'可延伸端。
在一些实施方案中,所述用于掺入核苷酸的方法还包括(b)使所述突变型聚合酶与多个核苷酸在适用于使至少一个核苷酸结合至与核酸双链体结合的突变型聚合酶的条件下接触。在一些实施方案中,突变型聚合酶在至少一个阳离子存在下与多个核苷酸接触,所述至少一个阳离子选自由以下组成的组:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b)的接触在锶、钡和/或钙存在下进行。在一些实施方案中,所述多个核苷酸包含至少一个在糖2'或3'位置处具有链终止部分的核苷酸类似物。在一些实施方案中,所述多个核苷酸包含至少一个没有链终止部分的核苷酸。在一些实施方案中,所述方法还包括(c)在适用于掺入至少一个核苷酸的条件下将所述至少一个核苷酸掺入可延伸引物的3'端中。在一些实施方案中,用于核苷酸结合突变型聚合酶与用于掺入核苷酸的适合条件可相同或不同。在一些实施方案中,适用于掺入核苷酸的条件包括包括至少一个选自由以下组成的组的阳离子:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,所述至少一个核苷酸结合突变型聚合酶并且掺入可延伸引物的3'端中。在一些实施方案中,步骤(c)中将核苷酸掺入引物的3'端中包含引物延伸反应。在一些实施方案中,所述方法还包括(d)重复步骤(c)的将至少一个核苷酸掺入可延伸引物的3'端中至少一次。在一些实施方案中,所述方法还包括检测至少一个在步骤(c)和/或(d)掺入的核苷酸。在一些实施方案中,所述方法还包括鉴别至少一个在步骤(c)和/或(d)掺入的核苷酸。在一些实施方案中,核酸模板分子的序列可通过检测和鉴别结合突变型聚合酶的核苷酸来确定。在一些实施方案中,核酸模板分子的序列可通过检测和鉴别掺入引物3'端中的核苷酸来确定。
本公开提供用于确定核酸模板分子的序列的方法,其包括:(a)使突变型聚合酶与(i)核酸模板分子和(ii)核酸引物接触,其中所述接触在适用于使所述突变型聚合酶结合至与核酸引物杂交的核酸模板分子的条件下进行,其中与核酸引物杂交的核酸模板分子形成核酸双链体。在一些实施方案中,突变型聚合酶包含重组突变型聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所列的特征以及示例突变型聚合酶特征。
在一些实施方案中,所述用于确定核酸模板分子的序列的方法还包括接触,即(b)使所述突变型聚合酶与多个核苷酸在适用于使至少一个核苷酸结合至与核酸双链体结合的突变型聚合酶的条件下接触。在一些实施方案中,突变型聚合酶在至少一个阳离子存在下与多个核苷酸接触,所述至少一个阳离子选自由以下组成的组:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b)的接触在锶、钡和/或钙存在下进行。在一些实施方案中,所述多个核苷酸包含至少一个在糖2'或3'位置处具有链终止部分的核苷酸类似物。在一些实施方案中,所述多个核苷酸包含至少一个没有链终止部分的核苷酸。在一些实施方案中,所述方法还包括(c)在适用于掺入至少一个核苷酸的条件下将所述至少一个核苷酸掺入可延伸引物的3'端中。在一些实施方案中,用于核苷酸结合突变型聚合酶与用于掺入核苷酸的适合条件可相同或不同。在一些实施方案中,适用于掺入核苷酸的条件包括包括至少一个选自由以下组成的组的阳离子:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,所述至少一个核苷酸结合突变型聚合酶并且掺入可延伸引物的3'端中。在一些实施方案中,步骤(c)中将核苷酸掺入引物的3'端中包含引物延伸反应。在一些实施方案中,所述方法还包括(d)重复步骤(c)的将至少一个核苷酸掺入可延伸引物的3'端中至少一次。在一些实施方案中,所述多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸。可检测的报导因子部分可或可不包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。在一些实施方案中,所述方法还包括检测至少一个在步骤(c)和/或(d)掺入的核苷酸。在一些实施方案中,所述方法还包括鉴别至少一个在步骤(c)和/或(d)掺入的核苷酸。在一些实施方案中,核酸模板分子的序列可通过检测和鉴别结合突变型聚合酶的核苷酸,由此确定核酸模板的序列来确定。在一些实施方案中,核酸模板分子的序列可通过检测和鉴别掺入引物3'端中的核苷酸,由此确定核酸模板的序列来确定。
在一些实施方案中,在用于确定核酸模板的序列的方法中,结合至核酸双链体的多个聚合酶包含多个复合聚合酶,其具有至少第一复合聚合酶和第二复合聚合酶,其中(a)第一复合聚合酶包含结合至第一核酸双链体的第一聚合酶,所述第一核酸双链体包含与第一核酸引物杂交的第一核酸模板;(b)第二复合聚合酶包含结合至第二核酸双链体的第二聚合酶,所述第二核酸双链体包含与第二核酸引物杂交的第二核酸模板;(c)第一核酸模板与第二核酸模板包含不同序列;(d)第一核酸模板和第二核酸模板被克隆扩增;(e)第一引物和第二引物包含可延伸3'端或不可延伸3'端;和(f)所述多个复合聚合酶固定至支撑物。在一些实施方案中,多个复合聚合酶的密度为约102-1015个固定至支撑物的复合聚合酶/平方毫米。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及使用核苷酸对核酸模板测序的方法中,多个核苷酸中的至少一个核苷酸包含碱基、糖和至少一个磷酸酯基。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸单元,其包括一个或多个如上文所论述的示例核苷酸单元特征。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸不为核苷酸类似物。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸类似物。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,多个核苷酸中的至少一个核苷酸包含具有一个、两个或三个磷原子的链,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,多个核苷酸中的至少一个核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,多个核苷酸中的至少一个核苷酸包含终止剂核苷酸类似物,其包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,碱基上的可裂解接头、链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,碱基上的可裂解接头包含可裂解部分,其包括叠氮化物、叠氮基或叠氮基甲基。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,链终止部分(例如糖2'和/或糖3'位置处)与碱基上的可裂解接头具有相同或不同的可裂解部分。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及使用核苷酸对核酸模板测序的方法中,突变型聚合酶结合至包含与核酸引物杂交的核酸模板的核酸双链体,由此形成复合聚合酶,其中核酸模板包含克隆扩增的模板分子或单一核酸模板分子。在一些实施方案中,核酸引物包含可延伸的3'末端或不可延伸的3'末端。在一些实施方案中,核酸模板、核酸引物和/或聚合酶中的任一者固定至支撑物。
在一些实施方案中,在用于结合核苷酸的方法中和用于掺入核苷酸的方法中以及用于对核酸模板测序的方法中,支撑物包括平面或非平面支撑物。支撑物可为固体或半固体。在一些实施方案中,支撑物可为多孔、半多孔或无孔的。在一些实施方案中,支撑物的表面可涂有一种或多种化合物以在支撑物上产生钝化层。在一些实施方案中,钝化层形成多孔或半多孔层。在一些实施方案中,核酸引物或模板、或聚合酶可附接至钝化层以将引物、模板和/或聚合酶固定至支撑物。在一些实施方案中,支撑物包括使得支撑物上的核酸杂交和扩增效能能够改善的低非特异性结合表面。一般而言,支撑物可包括一层或多层共价或非共价附接的低结合、化学改质层,例如硅烷层、聚合物膜,和一个或多个共价或非共价附接的寡核苷酸,其可用于将多个核酸模板分子固定至支撑物。在一些实施方案中,支撑物可包括经由支撑物上的化学基团至少共价结合至支撑物的一部分的官能化聚合物涂层、移植至官能化聚合物涂层上的引物以及在所述引物和所述官能化聚合物涂层上的水溶性保护涂层。在一些实施方案中,官能化聚合物涂层包含聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺(PAZAM)。在一些实施方案中,支撑物包括具有至少一个亲水性聚合物涂层的表面涂层和至少一层多个寡核苷酸。亲水性聚合物涂层可包含聚乙二醇(PEG)。亲水性聚合物涂层可包含具有至少4个分支的分支PEG。在一些实施方案中,支撑物包括具有不超过45度的水接触角的低非特异性结合涂层。
本公开提供用于确定一个或多个核酸模板分子的序列的方法,其包括:(a)使多个第一突变型聚合酶与多个核酸模板分子和(ii)多个核酸引物接触,其中接触在适用于使所述多个第一突变型DNA聚合酶与所述多个核酸模板分子和所述多个核酸引物结合,由此形成多个第一复合聚合酶的条件下进行,所述多个第一复合聚合酶各自包含结合至核酸双链体的第一突变型DNA聚合酶,其中所述核酸双链体包含与核酸引物杂交的核酸模板分子。在一些实施方案中,所述多个第一突变型聚合酶包含重组突变型聚合酶。在一些实施方案中,所述多个第一突变型聚合酶包含DNA聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,引物包含3'可延伸端或3'不可延伸端。在一些实施方案中,多个核酸模板分子可包括核酸模板实施方案,包括上文所列的潜在特征中的任一者。
在一些实施方案中,所述多个核酸模板分子和/或所述多个核酸引物呈溶液形式或固定至支撑物。在一些实施方案中,当所述多个核酸模板分子和/或所述多个核酸引物固定至支撑物时,与第一重组突变型聚合酶结合将产生多个固定的第一复合聚合酶。在一些实施方案中,所述多个核酸模板分子和/或核酸引物固定至支撑物上的102-1015个不同位点。在一些实施方案中,所述多个模板分子和核酸引物与多个第一重组突变型聚合酶结合将产生固定至支撑物上的102-1015个不同位点的多个第一复合聚合酶。在一些实施方案中,在支撑物上的多个固定的第一复合聚合酶固定至支撑物上的预定位点或随机位点。在一些实施方案中,所述多个固定的第一复合聚合酶彼此流体连通以允许试剂(例如包括聚合酶在内的酶、多价分子、核苷酸和/或二价阳离子)的溶液流动至支撑物上以使得所述支撑物上的多个固定的复合聚合酶与试剂的溶液以大规模平行的方式反应。
在一些实施方案中,所述用于确定一个或多个核酸模板分子的序列的方法还包括步骤(b):使所述多个第一复合聚合酶与多个多价分子接触以形成多个多价-复合聚合酶。在一些实施方案中,多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心且各核苷酸臂附接至核苷酸(例如核苷酸单元)。在一些实施方案中,步骤(b)的接触在适用于使多价分子的互补核苷酸单元与多个第一复合聚合酶中的至少两者结合,由此形成多个多价-复合聚合酶的条件下进行。在一些实施方案中,所述条件适用于抑制互补核苷酸单元掺入多个多价-复合聚合酶的引物中。在一些实施方案中,所述多个多价分子包含至少一个具有多个核苷酸臂的多价分子,所述多个核苷酸臂各自与核苷酸类似物(例如核苷酸类似物单元)附接,其中核苷酸类似物在糖2'和/或3'位置处包括链终止部分。在一些实施方案中,所述多个多价分子包含至少一个包含多个核苷酸臂的多价分子,所述多个核苷酸臂各自与没有链终止部分的核苷酸单元附接。在一些实施方案中,所述多个多价分子中的至少一个多价分子未用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,步骤(b)的接触在至少一个选自由以下组成的组的阳离子存在下进行:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(b)的接触在锶、钡和/或钙存在下进行。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列或用于形成多个复合聚合酶的方法还包括步骤(c):检测多个多价-复合聚合酶。在一些实施方案中,所述检测包括检测结合至复合聚合酶的多价分子,其中所述多价分子的互补核苷酸单元结合至引物,但互补核苷酸单元的掺入受到抑制。在一些实施方案中,所述多价分子用可检测的报导因子部分标记以允许检测。在一些实施方案中,标记的多价分子包含附接至多价分子的核心和/或核苷酸单元的碱基的荧光团。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列或用于形成多个复合聚合酶的方法还包括步骤(d):鉴别结合至多个第一复合聚合酶的互补核苷酸单元的碱基,由此确定核酸模板的序列。在一些实施方案中,所述多价分子用可检测的报导因子部分标记,所述可检测的报导因子部分对应于附接至核苷酸臂的特定核苷酸单元以允许鉴别结合所述多个第一复合聚合酶的互补核苷酸单元(例如核苷酸碱基腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列或用于形成多个复合聚合酶的方法中,
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,所述方法包括使多个第一复合聚合酶与多个多价分子结合以形成至少一种亲合力复合物,所述方法包括以下步骤:(a)使多个DNA聚合酶和所述多个核酸引物(其包括第一引物和第二引物)分别与第一模板分子和第二模板分子接触以在第一模板分子和第二模板分子上形成至少第一复合聚合酶和第二复合聚合酶;(b)使多个多价分子与所述至少第一复合聚合酶和第二复合聚合酶在适用于使来自所述多个的单一多价分子与所述第一复合聚合酶和第二复合聚合酶结合的条件下接触,其中所述单一多价分子的至少第一核苷酸单元结合至包含与所述第一模板分子杂交的第一引物的第一复合聚合酶,由此形成第一结合复合物(例如第一三元复合物),并且其中所述单一多价分子的至少第二核苷酸单元结合至包含与第二模板分子杂交的第二引物的第二复合聚合酶,由此形成第二结合复合物(例如第二三元复合物),其中所述接触在适用于抑制聚合酶催化的第一结合复合物和第二结合复合物中结合的第一核苷酸单元和第二核苷酸单元的掺入的条件下进行,并且其中结合至同一多价分子的第一结合复合物和第二结合复合物形成亲合力复合物;以及(c)分别检测第一模板分子和第二模板分子上的第一结合复合物和第二结合复合物;以及(d)鉴别第一结合复合物中的第一核苷酸单元,由此确定第一模板分子的序列,并鉴别第二结合复合物中的第二核苷酸单元,由此确定第二模板分子的序列。在一些实施方案中,多个DNA聚合酶包含本文所描述的任何野生型或突变型聚合酶。第一模板分子和第二模板分子为克隆扩增的模板分子。在一些实施方案中,第一模板分子和第二模板分子彼此紧密靠近地定位。举例而言,克隆扩增的第一模板分子和第二模板分子包含线性模板分子,其为经由桥式扩增产生且固定至支撑物上的相同部位或特征。第一模板分子和第二模板分子包含感兴趣序列和至少一个通用测序引物结合位点。第一核酸引物第二核酸引物可分别结合至第一模板分子和第二模板分子上的测序引物结合位点。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(e):解离多个多价-复合聚合酶并移除多个第一突变型DNA聚合酶和其结合的多价分子,并且保留多个核酸双链体。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(f):使步骤(e)的多个保留的核酸双链体与多个第二重组突变型DNA聚合酶接触,其中所述接触在适用于使所述多个第二突变型DNA聚合酶与所述多个保留的核酸双链体结合,由此形成多个第二复合聚合酶的条件下进行,所述多个第二复合聚合酶各自包含结合核酸双链体的第二突变型DNA聚合酶。在一些实施方案中,突变型聚合酶包含一个或多个上文所论述的示例突变型聚合酶特征。
在一些实施方案中,步骤(a)的多个第一突变型聚合酶具有与步骤(f)的多个第二突变型聚合酶的氨基酸序列具有100%同一性的氨基酸序列。在一些实施方案中,步骤(a)的多个第一突变型聚合酶具有与步骤(f)的多个第二突变型聚合酶的氨基酸序列不同的氨基酸序列。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(g):使多个第二复合聚合酶与多个核苷酸接触,其中所述接触在适用于使来自所述多个核苷酸的互补核苷酸与所述第二复合聚合酶中的至少两者结合,由此形成多个核苷酸-复合聚合酶的条件下进行。在一些实施方案中,步骤(g)的接触在适用于促进结合的互补核苷酸掺入核苷酸-复合聚合酶的引物中,由此形成多个核苷酸-复合聚合酶的条件下进行。在一些实施方案中,步骤(g)中将核苷酸掺入引物的3'端中包含引物延伸反应。在一些实施方案中,步骤(g)的接触在至少一个选自由以下组成的组的阳离子存在下进行:锶、钡、钠、镁、钾、锰、钙、锂、镍和钴。在一些实施方案中,步骤(g)的接触在镁和/或锰存在下进行。在一些实施方案中,所述多个核苷酸包含天然核苷酸(例如非类似物核苷酸)或核苷酸类似物。在一些实施方案中,所述多个核苷酸包含可移除或不可移除的2'和/或3'链终止部分。在一些实施方案中,所述多个核苷酸包含多个用可检测的报导因子部分标记的核苷酸。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除或不可从碱基移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(h):检测掺入核苷酸-复合聚合酶的引物中的互补核苷酸。在一些实施方案中,所述多个核苷酸用可检测的报导因子部分标记以允许检测。在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,检测步骤被省略。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(i):鉴别掺入核苷酸-复合聚合酶的引物中的互补核苷酸的碱基。在一些实施方案中,步骤(i)中掺入的互补核苷酸的鉴别可用于确认在步骤(d)中结合至多个第一复合聚合酶的多价分子的互补核苷酸的身份。在一些实施方案中,步骤(i)的鉴别可用于确定核酸模板分子的序列。在一些实施方案中,在确定一个或多个核酸模板分子的序列的方法中,鉴别步骤被省略。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(j):当步骤(g)通过使多个第二复合聚合酶与包含至少一个具有2'和/或3'链终止部分的核苷酸的多个核苷酸接触来进行时,从掺入的核苷酸移除所述链终止部分。
在一些实施方案中,用于确定一个或多个核酸模板分子的序列的方法还包括步骤(k):重复步骤(a)-(j)至少一次。在一些实施方案中,核酸模板分子的序列可通过在步骤(c)和(d)检测和鉴别结合突变型聚合酶但未掺入引物3'端中的多价分子来确定。在一些实施方案中,核酸模板分子的序列可通过在步骤(h)和(i)检测和鉴别掺入引物3'端中的核苷酸来确定(或确认)。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的至少一个多价分子可体现多价分子实施方案中的任一者,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的至少一个多价分子包含具有含一个、两个或三个磷原子的链的核苷酸单元,其中所述链通常经由酯磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,至少一个核苷酸单元为具有磷链的核苷酸类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的个别多价分子包含附接至多个核苷酸臂的核心,并且其中个别核苷酸臂包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的核苷酸单元。
在一些实施方案中,在确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的至少一个多价分子包含核苷酸单元,其包含包括一个或多个上文所论述的示例核苷酸类似物特征的终止剂核苷酸类似物。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的至少一个多价分子包含核苷酸单元,其包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。在一些实施方案中,链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的至少一个多价分子包含附接至多个核苷酸臂的核心,其中所述核心用可检测的报导因子部分标记。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,附接至多价分子的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸单元的碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。在一些实施方案中,多价分子的至少一个核苷酸臂包含附接至荧光团的接头和/或核苷酸碱基,并且其中附接至给定接头或核苷酸碱基的荧光团对应于所述核苷酸臂的核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶)。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多个多价分子中的多价分子的至少一个核苷酸臂具有附接至可检测的报导因子部分的核苷酸单元。在一些实施方案中,可检测的报导因子部分附接至核苷酸碱基。在一些实施方案中,可检测的报导因子部分包含荧光团。在一些实施方案中,附接至多价分子的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸单元的碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(b)的多价分子的核心包含抗生物素蛋白样部分且核心附接部分包含生物素。在一些实施方案中,核心包含链霉抗生物素蛋白型或抗生物素蛋白型部分,其包括抗生物素蛋白,以及可结合到至少一个生物素部分的抗生物素蛋白的任何衍生物、类似物和其他非天然形式。抗生物素蛋白部分的其他形式包括天然和重组抗生物素蛋白和链霉抗生物素蛋白,以及衍生化的分子,例如未糖基化的抗生物素蛋白和截短的链霉抗生物素蛋白。举例而言,抗生物素蛋白部分包括抗生物素蛋白的去糖基化形式、由链霉菌(例如阿维丁链霉菌)产生的细菌链霉抗生物素蛋白以及衍生化形式,例如N-酰基抗生物素蛋白,例如N-乙酰基抗生物素蛋白、N-苯二甲酰基抗生物素蛋白和N-琥珀酰基抗生物素蛋白,和可商购获得的产品ExtrAvidinTM、CaptavidinTM、NeutravidinTM和Neutralite AvidinTM。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(a)-(j)各自在选自约25-75℃的温度范围的温度下进行。在一些实施方案中,步骤(a)和(b)的接触在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(c)和(d)的检测和鉴别在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(e)的解离在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(f)和(g)的接触在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(h)和(i)的检测和鉴别在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(j)的移除在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。在一些实施方案中,步骤(a)-(j)在选自约25-75℃的温度范围的恒定温度(例如等温温度)下进行。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含碱基、糖和至少一个磷酸酯基。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸单元,其包括一个或多个如上文所论述的示例核苷酸单元特征。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸不为核苷酸类似物。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸包含核苷酸类似物。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含具有一个、两个或三个磷原子的链,其中所述链通常经由酯或磷酰胺键联附接至糖部分的5'碳。在一些实施方案中,多个核苷酸中的至少一个核苷酸为具有磷链的类似物,在所述磷链中,磷原子与插入的O、S、NH、亚甲基或亚乙基连接在一起。在一些实施方案中,链中的磷原子包括取代的侧基,包括O、S或BH3。在一些实施方案中,所述链包括被包括氨基磷酸酯基、硫代磷酸酯基、二硫代磷酸酯基和O-甲基氨基磷酸酯基在内的类似物取代的磷酸酯基。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含终止剂核苷酸类似物,其包括一个或多个上文所论述的示例核苷酸类似物特征。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含在糖2'位置处、在糖3'位置处或在糖2'和3'位置处具有链终止部分(例如封端部分)的终止剂核苷酸类似物。链终止部分可经由可裂解部分附接至3'-OH糖位置,其可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含可检测的报导因子部分(例如至少一个标记的核苷酸)。可检测的报导因子部分包含荧光团。在一些实施方案中,荧光团附接至核苷酸碱基。在一些实施方案中,荧光团用接头附接至核苷酸碱基,所述接头可从碱基裂解/移除。在一些实施方案中,所述多个核苷酸中的至少一个核苷酸未用可检测的报导因子部分标记。在一些实施方案中,附接至核苷酸的特定可检测的报导因子部分(例如荧光团)可对应于核苷酸碱基(例如dATP、dGTP、dCTP、dTTP或dUTP)以允许检测和鉴别核苷酸碱基。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,步骤(g)的多个核苷酸中的至少一个核苷酸包含在碱基上的可裂解接头,其包含经由可裂解部分附接至3'-OH糖位置的链终止部分,所述链终止部分可包括以上描述的链终止部分实施方案中的任一者。在一些实施方案中,链终止部分包含叠氮化物、叠氮基或叠氮基甲基,包括上文所列的潜在特征中的任一者。
在一些实施方案中,在用于确定一个或多个核酸模板分子的序列的方法中,支撑物包括平面或非平面支撑物。支撑物可为固体或半固体。在一些实施方案中,支撑物可为多孔、半多孔或无孔的。在一些实施方案中,支撑物的表面可涂有一种或多种化合物以在支撑物上产生钝化层。在一些实施方案中,钝化层形成多孔或半多孔层。在一些实施方案中,核酸引物、模板和/或聚合酶可附接至钝化层以将引物、模板和/或聚合酶固定至支撑物。在一些实施方案中,支撑物包括使得支撑物上的核酸杂交和扩增效能能够改善的低非特异性结合表面。一般而言,支撑物可包括一层或多层共价或非共价附接的低结合、化学改质层,例如硅烷层、聚合物膜,和一个或多个共价或非共价附接的寡核苷酸,其可用于将多个核酸模板分子固定至支撑物。在一些实施方案中,支撑物可包括经由支撑物上的化学基团至少共价结合至支撑物的一部分的官能化聚合物涂层、移植至官能化聚合物涂层上的引物以及在所述引物和所述官能化聚合物涂层上的水溶性保护涂层。在一些实施方案中,官能化聚合物涂层包含聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺(PAZAM)。在一些实施方案中,支撑物包括具有至少一个亲水性聚合物涂层的表面涂层和至少一层多个寡核苷酸。亲水性聚合物涂层可包含聚乙二醇(PEG)。亲水性聚合物涂层可包含具有至少4个分支的分支PEG。在一些实施方案中,支撑物包括具有不超过45度的水接触角的低非特异性结合涂层。在一些实施方案中,固定至支撑物或固定至支撑物上的涂层的多个第一复合聚合酶的密度为约102-106个/平方毫米、或约106-109个/平方毫米、或约109-1012个/平方毫米。在一些实施方案中,多个第一复合聚合酶固定至支撑物或在所述支撑物(或在支撑物上的涂层)上的预定位点处固定至支撑物上的涂层,或在所述支撑物(或在所述支撑物上的涂层)的随机位点处固定至支撑物上的涂层。
实施例
以下实施例意欲为说明性的并且可用于进一步了解本公开的实施方案,并且不应将其解释为以任何方式限制本教示的范围。
实施例1:突变型聚合酶的澄清溶解产物制备
使用定点突变诱发制备突变型聚合酶。突变型聚合酶的突变位点列于表1(图3A至图3H)、表2(图4A至图4E)和表3(图5A至图5E)中。
制备带有表达载体的宿主细胞,所述表达载体可操作地连接至编码所述突变型聚合酶中的一者的核酸。将宿主细胞在适用于表达所述突变型聚合酶的条件下培养。使宿主细胞在板格式中生长并在表达之后进行离心。通过用在缓冲液(20mM Tris-HCl(pH 8.8)、10mM KCl、10mM(NH4)2SO4))中的溶菌酶处理来将细胞集结粒溶解,并且再进行离心。将上清液转移至PCR板中并在60℃下使其热休克,保持30分钟。接着,用离心机使热休克的溶解产物变澄清,并将上清液转移至新板中用于核苷酸掺入分析。
实施例2:核苷酸掺入分析
使用Atto染料标记的DNA模板制备DNA双链体。将标记的DNA模板与引物在反应缓冲液(Tris-HCl(pH 7.5)、NaCl、EDTA)中粘接在一起。将双链体与澄清溶解产物(如实施例1中所述)混合并将其平衡至42℃。通过在模板上添加对应于下一个碱基的3'甲基叠氮基核苷酸(例如dCTP-N3)来起始核苷酸掺入反应。使反应在42℃下进行30秒并用EDTA和甲酰胺淬灭。通过毛细管电泳执行n+1对比n的分析。
表1(图3A至图3H)、表2(图4A至图4E)和表3(图5A至图5E)列出来自候选深层古细菌目古菌的DNA聚合酶变体在42℃下于延伸的多核苷酸链的N+1位置处掺入3'甲基叠氮基核苷酸的相对活性。
结果示出于表1(图3A至图3H)、表2(图4A至图4E)和表3(图5A至图5E)中。在表1(图3A至图3H)中,来自候选深层古细菌目古菌的野生型聚合酶命名为#1(例如SEQ ID NO:1)。来自候选深层古细菌目古菌的包含以下突变的突变型聚合酶克隆命名为#2-80(例如分别为SEQ ID NO:2-80;还参见表1,图3A至图3H):2:Y502V;3:Y502S;4:Y502Q;5:Y502P;6:Y502H;7:Y502G;8:Y502F;9:Y502A;10:S415V;11:S415G;12:S415A;13:R468V;14:R468S;15:R468K;16:R468H;17:R468G;18:R468A;19:R414S;20:L416V;21:L416S;22:L416A;23:I529V;24:I529S;25:I529H;26:I529G;27:I529A;28:Y417V_P418V;29:Y417V_P418S;30:Y417V_P418A;31:Y417T_P418K;32:Y417S_P418S;33:Y417S_P418G;34:Y417S_P418A;35:Y417G_P418V;36:Y417G_P418S;37:Y417G_P418G;38:Y417G_P418C;39:Y417G_P418A;40:Y417A_P418V;41:Y417A_P418S;42:Y417A_P418G;43:Y417A_P418A;44:S415V_Y417S;45:S415V_Y417A;46:S415V_P418V;47:S415V_P418S;48:S415V_P418G;49:S415V_L416V;50:S415V_L416S;51:S415G_Y417V;52:S415G_Y417S;53:S415G_P418V;54:S415G_P418S;55:S415G_P418G;56:S415G_P418A;57:S415G_L416V;58:S415G_L416S;59:S415G_L416G;60:S415G_L416A;61:S415A_Y417G;62:S415A_Y417A;63:S415A_P418G;64:S415A_L416S;65:L416V_P418S;66:L416V_P418G;67:L416S_Y417G;68:L416S_Y417A;69:L416S_P418V;70:L416S_P418G;71:L416G_Y417G;72:L416G_Y417A;73:L416G_P418G;74:L416G_P418A;75:L416A_Y417S;76:L416A_P418S;77:L416A_P418G;78:L416A_P418A;79:Y417V_P418V_Y502S;80:Y417V_P418G_Y502G。
在表1(图3A至图3H)中,来自候选深层古细菌目古菌的含有以下突变的突变型聚合酶克隆命名为#81-157(例如分别为SEQ ID NO:81-157):81:Y417V_P418A_Y502R;82:Y417S_P418V_Y502R;83:Y417S_P418G_Y502S;84:Y417G_P418G_Y502V;85:Y417G_P418A_Y502N;86:Y417G_P418A_Y502G;87:Y417A_P418S_Y502R;88:G403A_H405S_D406H;89:A493V_K495V_N499S;90:A493V_K495V_N499G;91:A493V_K495V_N499A;92:A493V_K495S_N499V;93:A493V_K495S_N499S;94:A493V_K495S_N499G;95:A493V_K495Q_N499V;96:A493V_K495Q_N499G;97:A493V_K495Q_N499A;98:A493V_K495G_N499V;99:A493V_K495G_N499S;100:A493V_K495G_N499G;101:A493V_K495G_N499A;102:A493V_K495A_N499G;103:A493V_K495A_N499A;104:A493V_K495S_N499G;105:L416A_Y417A_P418A;106:L416A_Y417A_P418G;107:L416A_Y417A_P418I;108:L416A_Y417S_P418A;109:L416A_Y417S_P418G;110:L416A_Y417S_P418S;111:L416G_Y417G_P418G;112:L416I_Y417A_P418G;113:L416I_Y417A_P418S;114:L416I_Y417G_P418A;115:L416I_Y417I_P418V;116:L416S_Y417A_P418G;117:L416S_Y417G_P418A;118:L416T_Y417A_P418A;119:L416T_Y417G_P418A;120:L416V_Y417A_P418A;121:L416V_Y417G_P418G;122:L416I_Y417S_P418S;123:L416V_Y417V_P418G;124:H405P_A493V_K495G_N499A;125:A493V_K495S_N499A_Y502T;126:A493V_K495Q_N499G_F507S;127:A493V_K495G_N499G_M501I;128:L416A_Y417A_P418A_I529L;129:L416A_Y417A_P418A_I529H;130:L416A_Y417A_P418S_I529H;131:L416A_Y417G_P418A_I529H;132:L416A_Y417G_P418G_I529H;133:L416A_Y417G_P418S_I529H;134:L416G_Y417T_P418S_I529H;135:L416I_Y417A_P418A_I529L;136:L416I_Y417A_P418G_I529F;137:L416I_Y417A_P418S_I529H;138:L416I_Y417G_P418A_I529L;139:L416I_Y417S_P418G_I529H;140:L416L_Y417Y_P418P_I529H;141:L416S_Y417A_P418G_I529H;142:L416S_Y417A_P418G_I529F;143:L416S_Y417A_P418T_I529H;144:L416S_Y417G_P418G_I529H;145:L416S_Y417G_P418V_I529H;146:L416T_Y417A_P418A_I529H;147:L416T_Y417A_P418G_I529H;148:L416T_Y417G_P418A_I529H;149:L416V_Y417A_P418A_I529H;150:L416V_Y417A_P418G_I529S;151:L416V_Y417A_P418G_I529T;152:L416V_Y417A_P418G_I529H;153:L416V_Y417A_P418S_I529H;154:L416V_Y417G_P418A_I529H;155:L416V_Y417G_P418G_I529H;156:L416V_Y417G_P418S_I529H;157:L416V_Y417T_P418S_I529H。
在表2(图4A至图4E)中,来自候选深层古细菌目古菌的含有以下突变的突变型聚合酶克隆命名为#158-255(例如分别为SEQ ID NO:158-255):158:Y502I;159:L416A_Y417G_P418A;160:L416I_Y417A_P418A;161:L416V_Y417A_P418G;162:L416A_Y417A_P418S;163:L416I_Y417S_P418G;164:L416V_Y417A_P418S;165:L416A_Y417I_P418T;166:L416S_Y417G_P418V;167:L416S_Y417G_P418G;168:L416V_Y417G_P418A;169:L416A_Y417A_P418V;170:L416V_Y417T_P418I;171:L416V_Y417V_P418A;172:S415V_Y417A_A493V_K495G_N499S;173:H405P_A493V_K495V_N499A;174:A493V_K495S_N499G_F507S;175:L416S_Y417A_P418G_I529H_R608K;176:L416S_Y417A_P418G_I529H_K473A;177:L416S_Y417A_P418G_I529H_L496A;178:L416S_Y417A_P418G_I529H_V489I;179:L416S_Y417A_P418G_I529H_R515L;180:L416S_Y417A_P418G_I529H_A493S;181:L416S_Y417A_P418G_I529H_D622T;182:L416S_Y417A_P418G_I529H_Q492R;183:L416S_Y417A_P418G_I529H_Q673I;184:L416S_Y417A_P418G_I529H_A493S_D622T;185:L416S_Y417A_P418G_I529H_A493S_Q492R;186:L416S_Y417A_P418G_I529H_K473A_L496A;187:L416S_Y417A_P418G_I529H_K473A_Q492R;188:L416S_Y417A_P418G_I529H_K473A_R515L;189:L416S_Y417A_P418G_I529H_L496A_A493S_Q492R;190:L416S_Y417A_P418G_I529H_L496A_A493S_V489I;191:L416S_Y417A_P418G_I529H_L496A_R515L;192:L416S_Y417A_P418G_I529H_L496A_V489I;193:L416S_Y417A_P418G_I529H_Q492R_P335Q;194:L416S_Y417A_P418G_I529H_Q492R_Q673I;195:L416S_Y417A_P418G_I529H_R515L_Q492R;196:L416S_Y417A_P418G_I529H_R515L_Q673I;197:L416S_Y417A_P418G_I529H_R608K_A493S;198:L416S_Y417A_P418G_I529H_R608K_L496A;199:L416S_Y417A_P418G_I529H_R608K_Q492R;200:L416S_Y417A_P418G_I529H_V489I_A493S;201:L416S_Y417A_P418G_I529H_V489I_Q492R;202:L416S_Y417A_P418G_I529H_V489I_R515L;203:L416S_Y417A_P418G_I529H_A493S_R515L;204:L416S_Y417A_P418G_A493S_I529H_K610E;205:L416S_Y417A_P418G_I529H_A493S_L496G;206:L416S_Y417A_P418G_I529H_A493S_R515L_L611S;207:L416S_Y417A_P418G_I529H_A493S_L496S_D439S;208:L416S_Y417A_P418G_I529H_A493S_R515W;209:L416S_Y417A_P418G_I529H_A493S_L496A;210:L416S_Y417A_P418G_I529H_A493S_Q492C_L496R;211:L416S_Y417A_P418G_I529H_A493S_R723H;212:L416S_Y417A_P418G_I529H_A493S_D653G_A669D_S717G_I750V;213:L416S_Y417A_P418G_I529H_A493S_L496S;214:L416S_Y417A_P418G_I529H_A493S_R515Y;215:L416S_Y417A_P418G_I529H_A493S_Q492G_L496A;216:L416S_Y417A_P418G_I529H_A493S_S443N_Q492F;217:L416S_Y417A_P418G_I529H_A493S_R697G;218:L416S_Y417A_P418G_I529H_A493S_L496H;219:L416S_Y417A_P418G_I529H_A493S_Q492A_L496S;220:L416S_Y417A_P418G_I529H_A493S_L494V_L496N;221:L416S_Y417A_P418G_I529H_A493S_V651M;222:L416S_Y417A_P418G_A493S_I529H_E569G;223:L416S_Y417A_P418G_I529H_A493S_R515L_S717G;224:L416S_Y417A_P418G_I529H_A493S_S717G;225:L416S_Y417A_P418G_I529H_A493S_R515L_N567D;226:L416S_Y417A_P418G_I529H_A493S_L496R;227:L416S_Y417A_P418G_I529H_A493S_Q492G;228:L416S_Y417A_P418G_I529H_A493S_R515L_S577I;229:L416S_Y417A_P418G_A493S_I529H_K58M;230:L416S_Y417A_P418G_I529H_A493S_R515P;231:L416S_Y417A_P418G_I529H_A493S_Q492G_L496I;232:L416S_Y417A_P418G_I529H_A493S_L496N;233:L416S_Y417A_P418G_I529H_A493S_R515F;234:L416S_Y417A_P418G_I529H_A493S_D381Y_Q492R_L496M;235:L416S_Y417A_P418G_I529H_A493S_S443N;236:L416S_Y417A_P418G_I529H_A493S_E370D;237:L416S_Y417A_P418G_I529H_A493S_E760G;238:L416S_Y417A_P418G_I529H_A493S_Q492T_L496S;239:L416S_Y417A_P418G_I529H_A493S_L496C;240:L416S_Y417A_P418G_I529H_A493S_L496I;241:L416S_Y417A_P418G_I529H_A493S_L496Y;242:L416S_Y417A_P418G_I529H_A493S_G355S_S440N_R515L;243:L416S_Y417A_P418G_I529H_A493S_Q492L_L496M;244:L416F_Y417A_P418G_A493S_I529H_R515L_N567D;245:L416Y_Y417A_P418G_A493S_I529H_R515L_N567D;246:L416S_Y417T_P418G_I529H_A493S_R515L_N567D;247:L416M_Y417A_P418G_A493S_I529H_R515L_N567D;248:L416A_Y417A_P418G_I529H_A493S_R515L_N567D;249:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C104S;250:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C514S;251:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C130S;252:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C130R;253:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C450S;254:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C517S;255:L416S_Y417A_P418G_I529H_A493S_R515L_N567D_C269S。
实施例3:来自嗜热脂肪地芽孢杆菌的突变型聚合酶
在Bst聚合酶(例如嗜热脂肪地芽孢杆菌)中个别地或以各种组合形式产生突变R615K、Y654A、Y654D、Y654E、Y654F、Y654G、S655A、S655G、S655V、Q656A、Q656G、Q656N、Q656S、Q656V、I657A、I657G、I657S、I657V、E658A、E658D、E658G、E658S、E658V、L659A、L659G、L659P、L659S、L659V、D680A、D680G、D680I、D680L、D680N、D680S、D680V、H682A、H682G、H682N、H682Q、H682S、H682V、R702A、R702G、R702H、R702K、R702S、R702V、K706H、K706K、K706R、A707G、A707S、A707T、F710A、F710D、F710E、F710G、F710Q、F710S、F710T、F710V、Y714A、Y714D、Y714E、Y714F、Y714G、Y714S、Y714W、H829A、H829G、D314E、I332L、I334L、K368R、K381R、I385L、K417R、K434R、I454L、D471E、I528L、K601R、K635R、I649L、I665L、K758R和K760R。由代表性Bst变体引起的掺入3'-叠氮基甲基核苷酸的改善示出于图2中。
实施例4:反应速率
在42℃下,将过量纯化酶在反应缓冲液中与在模板位置处含有dG的粘接底物DNA一起预孵育。通过添加正确的dCTP-3'-O-甲基叠氮基核苷酸起始反应并使反应继续进行。在各种时间点,对反应取样并通过添加EDTA和甲酰胺停止反应来淬灭。通过毛细管电泳分析淬灭样品。将产物形成随时间的变化拟合至指数方程式以得出表观反应速率。结果示出于图19中,所述图比较了野生型酶(SEQ ID NO:1)与具有SEQ ID NO:39、297、27、164或225的氨基酸序列的工程化酶。
实施例5:引物延伸反应
制备具有空间上分开且个别地容纳扩增的聚合酶群落区的流通池用于测序。以控制性方式,使含有适当缓冲液、工程化聚合酶(例如SEQ ID NO:27)、dNTP-3'-O-甲基叠氮基和催化性金属的延伸混合物与扩增的聚合酶群落反应以将单一核苷酸理想地掺入长度N的测序引物的3'端。通过移除溶液并彻底洗涤来停止反应。接着,使对应于N+1的延伸产物的封端的测序引物与裂解试剂反应以移除甲基叠氮基封端基团并使可延伸的3'OH基团再生。裂解之后,充分地洗涤扩增的聚合酶群落以移除任何微量的裂解试剂。将所述程序重复2、4、6、8次,以使得各空间上分开的扩增的聚合酶群落区延伸至N+1、N+4、N+6、N+8。接着,将延伸的测序引物取出并通过毛细管电泳分析。结果示出于图20中。
实施例6:使用多价分子和核普酸测序
在上面固定有多个多联体模板分子(例如固定的聚合酶群落)的流通池上进行两阶段测序反应。
第一阶段测序反应通过使多个可溶性测序引物与固定至流通池的多联体模板分子杂交形成固定的引物-多联体双链体来进行。使多个第一测序聚合酶流动至流通池上(例如接触固定的引物-多联体双链体)并在适用于使测序聚合酶与双链体结合形成复合聚合酶的条件下孵育。示例性第一测序聚合酶包含SEQ ID NO:1-274或288-375或385-397中的任一者的氨基酸序列。使荧光标记的多价分子(例如约20-100nM的不同浓度)的混合物在包括非催化性阳离子(例如锶、钡和/或钙)的缓冲液存在下流动至流通池上并在适用于使多价分子的互补核苷酸单元与复合聚合酶结合形成亲合力复合物,而不进行聚合酶催化的核苷酸单元掺入的条件下孵育。荧光标记的多价分子在其核心被标记。洗涤复合聚合酶。获得保持结合至复合聚合酶的荧光标记的多价分子的图像。通过用包含洗涤剂的缓冲液洗涤,将第一测序聚合酶和多价分子移除,同时保留与固定的多联体杂交的测序引物(保留双链体)。
第一阶段测序反应适用于在多联体模板分子(例如聚合酶群落)上形成多个亲合力复合物。举例而言,第一阶段测序反应包括:(a)使第一核酸引物、第一聚合酶和第一多价分子与多联体模板分子的第一部分结合,由此形成第一结合复合物,其中所述第一多价分子的第一核苷酸单元结合至第一聚合酶;以及(b)使第二核酸引物、第二聚合酶和所述第一多价分子与同一多联体模板分子的第二部分结合,由此形成第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至第二聚合酶,其中包括相同多价分子的所述第一结合复合物和第二结合复合物形成第一亲合力复合物。
第二阶段测序反应通过使保留的双链体与多个第二测序聚合酶接触形成复合聚合酶来进行。示例性第二测序聚合酶包含SEQ ID NO:1-274或288-375或385-397中的任一者的氨基酸序列。将未标记的核苷酸类似物(例如3'O-甲基叠氮基核苷酸)(例如约1-5uM的不同浓度)的混合物在包括催化性阳离子(例如镁和/或锰)的缓冲液存在下添加至复合聚合酶中并在适用于使互补核苷酸与复合聚合酶结合并促进聚合酶催化的核苷酸掺入的条件下孵育以产生新生的延伸的测序引物。洗涤复合聚合酶。未获得图像。使掺入的未标记的核苷酸类似物与裂解试剂反应以移除3'O-甲基叠氮基并产生可延伸的3'OH基团。
在替代性第二阶段测序反应中,在包括催化性阳离子(例如镁和/或锰)的缓冲液存在下,将荧光标记的核苷酸类似物(例如3'O-甲基叠氮基核苷酸)(例如约1-5uM)的混合物添加至复合聚合酶中并在适用于使互补核苷酸与复合聚合酶结合并促进聚合酶催化的核苷酸掺入的条件下孵育以产生新生的延伸的测序引物。洗涤复合聚合酶。获得作为复合聚合酶的一部分掺入的荧光标记的核苷酸类似物的图像。使掺入的荧光标记的核苷酸类似物与裂解试剂反应以移除3'O-甲基叠氮基并产生可延伸的3'OH基团。
通过用包含洗涤剂的缓冲液洗涤,将第二测序聚合酶移除,同时保留与多联体杂交的新生的延伸的测序引物(保留双链体)。通过执行多个循环的第一阶段和第二阶段测序反应,再进行测序反应以产生延伸的正向测序引物链。由36个循环测序操作获得的示例性定相速率示出于图20中。
Claims (135)
1.一种工程化聚合酶,其包含:
与SEQ ID NO:1的氨基酸序列具有至少85%同一性并具有氨基酸取代D141A和E143A的氨基酸序列,其中与具有SEQ ID NO:1的氨基酸序列的野生型聚合酶相比,所述工程化聚合酶具有增加的掺入链终止核苷酸类似物的能力。
2.如权利要求1所述的工程化聚合酶,其中所述氨基酸取代还包含在氨基酸位置L416处的额外取代。
3.如权利要求2所述的工程化聚合酶,其中所述额外取代为L416S、L416I、L416A、L416V或L416G。
4.如权利要求1至3中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在氨基酸位置Y417处的额外取代。
5.如权利要求2至4中任一项所述的工程化聚合酶,其中所述额外取代为Y417A、Y417T、Y417G或Y417S。
6.如权利要求1至5中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在氨基酸位置P418处的额外取代。
7.如权利要求2至6中任一项所述的工程化聚合酶,其中所述额外取代为P418A、P418G或P418S。
8.如权利要求1至7中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在氨基酸位置I529处的额外取代。
9.如权利要求2至8中任一项所述的工程化聚合酶,其中所述额外取代为I529H、I529T或I529L。
10.如权利要求1至9中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在第一氨基酸位置L416处的第一额外取代和在第二氨基酸位置Y417处的第二额外取代。
11.如权利要求10所述的工程化聚合酶,其中所述第一额外取代为L416S、L416I、L416A、L416V或L416G,并且所述第二额外取代为Y417A、Y417T、Y417G或Y417S。
12.如权利要求11所述的工程化聚合酶,其中所述氨基酸取代还包含在第三氨基酸位置P418处的第三额外取代。
13.如权利要求12所述的工程化聚合酶,其中所述第三额外取代为P418A、P418G或P418S。
14.如权利要求10至13中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在第四氨基酸位置I529处的第四额外取代。
15.如权利要求14所述的工程化聚合酶,其中所述第四额外取代为I529H、I529T或I529L。
16.如权利要求1至15中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在一个或多个选自以下氨基酸位置的氨基酸位置处的一个或多个额外取代:Y10、E14、H48、D75、C104、A115、C130、C269、D305、E328、L416、Y417、P418、A493、S500、M501、R515、I529、N567、A568、E569、S577、K610、N657、E700、N705、S717、K762、G763、L764、G765、K766、Q767和M768。
17.如权利要求1至16中任一项所述的工程化聚合酶,其中所述氨基酸序列与选自以下的氨基酸序列中的一者具有至少90%同一性:SEQ ID NO:12、14、18、20、27、39、66、76、85、86、114、117、118、124、128、129、130、138、163、164、189、194、207、225、233、235、289、291、310、319、323、333、353、346、361、364、362、366、392和393。
18.如权利要求1至17中任一项所述的工程化聚合酶,其中所述氨基酸序列为选自以下的氨基酸序列中的一者:SEQ ID NO:12、14、18、20、27、39、66、76、85、86、114、117、118、124、128、129、130、138、163、164、189、194、207、225、233、235、289、291、310、319、323、333、353、346、361、364、362、366、392和393。
19.如权利要求1至18中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少90%同一性。
20.如权利要求1至19中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少91%同一性。
21.如权利要求1至20中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少92%同一性。
22.如权利要求1至21中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少93%同一性。
23.如权利要求1至22中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少94%同一性。
24.如权利要求1至23中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少95%同一性。
25.如权利要求1至24中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少96%同一性。
26.如权利要求1至25中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少97%同一性。
27.如权利要求1至26中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少98%同一性。
28.如权利要求1至27中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99%同一性。
29.如权利要求1至28中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.1%同一性。
30.如权利要求1至29中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.2%同一性。
31.如权利要求1至30中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.3%同一性。
32.如权利要求1至31中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.4%同一性。
33.如权利要求1至32中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.5%同一性。
34.如权利要求1至33中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.6%同一性。
35.如权利要求1至34中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.7%同一性。
36.如权利要求1至35中任一项所述的工程化聚合酶,其中所述氨基酸序列与SEQ IDNO:1的氨基酸序列具有至少99.8%同一性。
37.如权利要求1至36中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在SEQ ID NO:271的氨基酸序列中所指定的掌型结构域中的额外取代。
38.如权利要求1至37中任一项所述的工程化聚合酶,其中所述氨基酸取代还包含在SEQ ID NO:273的氨基酸序列中所指定的掌型结构域中的额外取代。
39.如权利要求1至38中任一项所述的工程化聚合酶,其中所述氨基酸取代移除所述工程化聚合酶的3'至5'外切核酸酶活性。
40.如权利要求1至39中任一项所述的工程化聚合酶,其中与所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶相比,所述工程化聚合酶表现出增加的热稳定性。
41.如权利要求1至40中任一项所述的工程化聚合酶,其中与所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶相比,所述工程化聚合酶表现出增加的掺入率。
42.如权利要求1至41中任一项所述的工程化聚合酶,其中所述增加的掺入率平均是所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少5倍。
43.如权利要求1至42中任一项所述的工程化聚合酶,其中所述增加的掺入率平均是所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少10倍。
44.如权利要求1至43中任一项所述的工程化聚合酶,其中所述增加的掺入率平均值是所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少20倍。
45.如权利要求1至44中任一项所述的工程化聚合酶,其中所述增加的掺入率平均值是所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶的平均掺入率的至少50倍。
46.如权利要求1至45中任一项所述的工程化聚合酶,其中与所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶相比,所述工程化聚合酶表现出核苷酸类似物的增加的掺入率,所述核苷酸类似物在糖部分的2'位置处或3'位置处包含链终止部分。
47.如权利要求1至46中任一项所述的工程化聚合酶,其中与所述具有SEQ ID NO:1的氨基酸序列的野生型聚合酶相比,所述工程化聚合酶表现出增加的尿嘧啶耐受性。
48.一种组合物,其包含:
一个或多个如权利要求1至47中任一项所述的工程化聚合酶,
一个或多个核酸模板分子,和
一个或多个包含具有3'可延伸端的核苷酸聚合起始位点的分子。
49.如权利要求48所述的组合物,其中所述一个或多个核酸模板分子为线性核酸分子或环形核酸分子。
50.如权利要求48至49中任一项所述的组合物,其中所述一个或多个核酸模板分子包含克隆扩增的模板分子。
51.如权利要求48至50中任一项所述的组合物,其中所述一个或多个核酸模板分子各自包含以下:感兴趣靶序列的一个拷贝或具有感兴趣靶序列的两个或更多个串联拷贝的多联体。
52.如权利要求48至51中任一项所述的组合物,其中所述一个或多个包含核苷酸聚合起始位点的分子包含与所述核酸模板分子的一部分杂交的核酸引物,或其中所述一个或多个包含核苷酸聚合起始位点的分子包含所述核酸模板分子的自引发端部分。
53.如权利要求48至52中任一项所述的组合物,其中所述一个或多个工程化聚合酶、所述一个或多个核酸模板分子和所述一个或多个核苷酸聚合起始位点形成一个或多个复合聚合酶,各复合聚合酶包含:
结合至核酸双链体的所述工程化聚合酶,其中所述双链体包含与核酸引物杂交的所述核酸模板分子中的一者。
54.如权利要求48至53中任一项所述的组合物,其中所述一个或多个核酸模板分子包含相同的感兴趣靶序列或不同的感兴趣靶序列。
55.如权利要求48至54中任一项所述的组合物,其中所述一个或多个复合聚合酶还包含多价分子,其中所述多价分子包含:
(a)核心;和
(b)多个核苷酸臂,其各自包含:
(i)核心附接部分,
(ii)间隔区,
(iii)接头,和
(iv)核苷酸单元。
56.如权利要求55所述的组合物,其中所述核心经由所述核心附接部分附接至所述核苷酸臂中的各者,所述核心附接部分附接至所述间隔区,所述间隔区附接至所述接头,并且所述接头附接至所述核苷酸单元。
57.如权利要求55至56中任一项所述的组合物,所述接头包含具有2至6个亚基的脂族链或具有2至6个亚基的寡聚乙二醇链。
58.如权利要求55至57中任一项所述的组合物,其中所述多个核苷酸臂经由所述核心附接部分附接至所述核心,并且其中附接至所述核心的所述核苷酸臂各自具有相同类型的核苷酸单元,其中所述核苷酸单元包含dATP、dGTP、dCTP、dTTP或dUTP。
59.如权利要求55至58中任一项所述的组合物,其中所述一个或多个多价分子包含一种类型的多价分子,其中各类型的多价分子具有选自由以下组成的组的相同类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。
60.如权利要求55至59中任一项所述的组合物,其中所述一个或多个多价分子包含两种或更多种类型的多价分子,其中各类型的多价分子具有选自由以下组成的组的相同类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。
61.如权利要求55至60中任一项所述的组合物,其中所述一个或多个多价分子中的至少一个多价分子用荧光团标记。
62.如权利要求53至61中任一项所述的组合物,其中所述一个或多个复合聚合酶还包含多个核苷酸,其中所述多个核苷酸中的核苷酸包含芳族碱基、五碳糖和1至10个磷酸酯基。
63.如权利要求62所述的组合物,其中所述多个核苷酸包含选自由以下组成的组的一种类型的核苷酸:dATP、dGTP、dCTP、dTTP和dUTP。
64.如权利要求62至63中任一项所述的组合物,其中所述多个核苷酸包含选自由以下组成的组的两种或更多种类型的核苷酸:dATP、dGTP、dCTP、dTTP和/或dUTP。
65.如权利要求61至64中任一项所述的组合物,其中所述多个核苷酸中的至少一个核苷酸用荧光团标记。
66.如权利要求61至64中任一项所述的组合物,其中所述多个核苷酸没有荧光团标记。
67.如权利要求61至66中任一项所述的组合物,其中所述多个核苷酸中的至少一个核苷酸包含附接至糖基团的3'碳位置的可移除的链终止部分,其中所述可移除的链终止部分包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮化物基团、叠氮基、O-叠氮基甲基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基,并且其中所述可移除的链终止部分可用化学化合物裂解以在所述糖基团上产生可延伸的3'OH部分。
68.如权利要求53至67中任一项所述的组合物,其中所述一个或多个复合聚合酶还包含多个抑制聚合酶催化的核苷酸掺入的非催化性二价阳离子,其中所述非催化性二价阳离子包括锶或钡。
69.如权利要求53至68中任一项所述的组合物,其中所述一个或多个复合聚合酶还包含多个促进聚合酶催化的核苷酸掺入的催化性二价阳离子,其中所述催化性二价阳离子包括镁或锰。
70.如权利要求53至69中任一项所述的组合物,其中所述一个或多个复合聚合酶固定至支撑物或固定至所述支撑物上的涂层。
71.如权利要求53至70中任一项所述的工程化聚合酶,其中固定至所述支撑物的所述一个或多个复合聚合酶的密度为102至109个/平方毫米。
72.如权利要求70至71中任一项所述的组合物,其中所述固定的一个或多个复合聚合酶固定至所述支撑物上的预定位点或固定至所述支撑物上的随机位点。
73.如权利要求70至72中任一项所述的组合物,其中所述涂层包含至少一个亲水性聚合物涂层,其包含具有至少4个分支的分支聚乙二醇(PEG)。
74.如权利要求73所述的组合物,其中所述亲水性聚合物涂层具有不超过45度的水接触角。
75.如权利要求70至74中任一项所述的组合物,其中所述固定的一个或多个复合聚合酶呈彼此流体连通以允许试剂溶液流动至所述支撑物上,以使得所述固定的一个或多个复合聚合酶在所述支撑物上与所述试剂溶液以大规模并行方式反应。
76.如权利要求55至76中任一项所述的组合物,其中所述一个或多个复合聚合酶还包含第一结合复合物和第二结合复合物,其中
(1)所述第一结合复合物包含第一核酸引物、第一工程化聚合酶和第一多价分子,其结合至多联体模板分子的第一部分,由此形成所述第一结合复合物,其中所述多价分子的第一核苷酸单元结合至所述第一工程化聚合酶,并且
(2)所述第二结合复合物包含第二核酸引物、第二工程化聚合酶和所述第一多价分子,其结合至同一多联体模板分子的第二部分,由此形成所述第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至所述第二工程化聚合酶,
其中所述第一结合复合物和所述第二结合复合物包含同一个第一多价分子并形成亲合力复合物。
77.一种形成一个或多个复合聚合酶的方法,其包括:
使一个或多个工程化聚合酶与(i)一个或多个核酸模板分子和(ii)一个或多个核酸引物接触以形成所述一个或多个复合聚合酶,所述复合聚合酶中的至少一者包含:结合至核酸双链体的工程化聚合酶,其中所述核酸双链体包含与核酸引物杂交的核酸模板分子,并且
其中所述一个或多个工程化聚合酶包含与SEQ ID NO:1的氨基酸序列具有至少85%同一性并具有取代Asp141Ala和Glu143Ala的氨基酸序列。
78.如权利要求77所述的方法,其中所述一个或多个核酸模板分子为线性核酸分子、环形核酸分子或线性核酸分子与环形核酸分子的混合物。
79.如权利要求77至78中任一项所述的方法,其中所述一个或多个核酸模板分子包含克隆扩增的模板分子。
80.如权利要求77至79中任一项所述的方法,其中所述核酸分子中的至少一者包含感兴趣靶序列的拷贝或具有感兴趣靶序列的两个或更多个串联拷贝的多联体。
81.如权利要求77至80中任一项所述的方法,其中所述一个或多个核酸分子为多个核酸分子,其中所述多个核酸分子包含相同的感兴趣靶序列或不同的感兴趣靶序列。
82.如权利要求77至81中任一项所述的方法,其还包括:
使所述一个或多个复合聚合酶与一个或多个多价分子接触,其中所述多价分子中的至少一者包含:
(a)核心;和
(b)多个核苷酸臂,所述核苷酸臂中的至少一者包含
(i)核心附接部分,
(ii)间隔区,
(iii)接头,和
(iv)核苷酸单元,
其中所述核心经由所述核心附接部分附接至所述核苷酸臂中的至少一者,其中所述间隔区附接至所述接头,并且其中所述接头附接至所述核苷酸单元。
83.如权利要求82所述的方法,其中所述接头包含具有2至6个亚基的脂族链或具有2至6个亚基的寡聚乙二醇链。
84.如权利要求82至83中任一项所述的方法,其中所述多个核苷酸臂具有相同类型的核苷酸单元,并且其中所述核苷酸单元选自由以下组成的组:dATP、dGTP、dCTP、dTTP和dUTP。
85.如权利要求82至85中任一项所述的方法,其中所述一个或多个多价分子包含一种类型的多价分子,其中各多价分子包含选自由以下组成的组的相同类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。
86.如权利要求82至85中任一项所述的方法,其中所述一个或多个多价分子包含两种或更多种类型的多价分子,其中所述两种或更多种类型的多价分子包含选自由以下组成的组的两种或更多种类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和/或dUTP。
87.如权利要求82至86中任一项所述的方法,其中所述一个或多个多价分子中的至少一个多价分子用荧光团标记。
88.如权利要求82至88中任一项所述的方法,其中所述接触在适用于使所述一个或多个多价分子的互补核苷酸单元与所述复合聚合酶中的一者或多者结合的条件下进行。
89.如权利要求82至88中任一项所述的方法,其还包括使所述一个或多个复合聚合酶与一个或多个抑制聚合酶催化的核苷酸掺入的非催化性二价阳离子接触,其中所述非催化性二价阳离子包括锶或钡。
90.如权利要求77至89中任一项所述的方法,其还包括:
使所述一个或多个复合聚合酶与一个或多个核苷酸单元接触,其中所述核苷酸单元中的至少一者包含芳族碱基、五碳糖和1至10个磷酸酯基。
91.如权利要求90所述的方法,其中所述一个或多个核苷酸单元包含选自由以下组成的组的一种类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。
92.如权利要求90所述的方法,其中所述一个或多个核苷酸单元包含选自由以下组成的组的两种或更多种类型的核苷酸单元的任何组合的混合物:dATP、dGTP、dCTP、dTTP和/或dUTP。
93.如权利要求90至92中任一项所述的方法,其中所述一个或多个核苷酸单元中的至少一者用荧光团标记。
94.如权利要求90至92中任一项所述的方法,其中所述一个或多个核苷酸单元没有荧光团标记。
95.如权利要求90至94中任一项所述的方法,其中所述一个或多个核苷酸单元中的至少一者包含附接至糖基团的3'碳位置的可移除的链终止部分,其中所述可移除的链终止部分包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮化物基团、叠氮基、O-叠氮基甲基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基,并且其中所述可移除的链终止部分可用化学化合物裂解以在所述糖基团上产生可延伸的3'OH部分。
96.如权利要求90至95中任一项所述的方法,其中所述一个或多个复合聚合酶与一个或多个核苷酸单元的所述接触在适用于使所述一个或多个核苷酸单元的互补核苷酸单元与所述一个或多个复合聚合酶结合的条件下进行。
97.如权利要求77至96中任一项所述的方法,其中所述一个或多个工程化聚合酶包含与SEQ ID NO:1的氨基酸序列具有至少90%同一性并具有取代Asp141Ala和Glu143Ala的氨基酸序列。
98.如权利要求90至97中任一项所述的方法,其还包括使所述一个或多个复合聚合酶与一个或多个促进聚合酶催化的核苷酸掺入的催化性二价阳离子接触,其中所述催化性二价阳离子包括镁或锰。
99.如权利要求77至98中任一项所述的方法,其中所述一个或多个复合聚合酶固定至支撑物或固定至所述支撑物上的涂层。
100.如权利要求99所述的方法,其中固定至所述支撑物的所述一个或多个复合聚合酶的密度为102至109个/平方毫米。
101.如权利要求99至100中任一项所述的方法,其中所述固定的一个或多个复合聚合酶固定至所述支撑物上的预定位点或固定至所述支撑物上的随机位点。
102.如权利要求99至101中任一项所述的方法,其中所述涂层包含至少一个亲水性聚合物涂层,其包含具有至少4个分支的分支聚乙二醇(PEG)。
103.如权利要求102所述的方法,其中所述亲水性聚合物涂层具有不超过45度的水接触角。
104.如权利要求99至103中任一项所述的方法,其中所述固定的一个或多个复合聚合酶呈彼此流体连通以允许试剂溶液流动至所述支撑物上,以使得所述固定的一个或多个复合聚合酶在所述支撑物上与所述试剂溶液以大规模并行方式反应。
105.如权利要求82至104中任一项所述的方法,其还包括形成第一结合复合物和第二结合复合物,其中形成所述第一结合复合物和所述第二结合复合物包括:
a)使第一核酸引物、第一工程化聚合酶和第一多价分子结合至多联体模板分子的第一部分,由此形成所述第一结合复合物,其中所述第一多价分子的第一核苷酸单元结合至所述第一工程化聚合酶,和
b)使第二核酸引物、第二工程化聚合酶和所述第一多价分子结合至同一多联体模板分子的第二部分,由此形成所述第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至所述第二工程化聚合酶,
其中包含同一多价分子的所述第一结合复合物和所述第二结合复合物形成亲合力复合物。
106.一种用于执行核酸测序的方法,其包括:
(a)使第一组工程化聚合酶与(i)多个核酸模板分子和(ii)多个核酸引物接触,
其中所述接触在适用于使所述工程化聚合酶与核酸模板分子和所述核酸引物结合,由此形成第一组复合聚合酶的条件下进行,其中所述第一组复合聚合酶各自包含结合至核酸双链体的所述工程化聚合酶,
其中所述核酸双链体包含与所述核酸引物中的一者杂交的所述核酸模板分子中的一者,
其中所述工程化聚合酶包含与SEQ ID NO:1的氨基酸序列具有至少85%同一性并具有氨基酸取代Asp141Ala和Glu143Ala的氨基酸序列;
(b)使所述第一组复合聚合酶与多个多价分子接触以形成第一组多价结合复合物,
其中所述多个多价分子中的各多价分子包含附接至多个核苷酸臂的核心,
其中各核苷酸臂附接至核苷酸单元,
其中所述接触在适用于以下的条件下进行:
使所述多价分子的互补核苷酸单元与所述第一组复合聚合酶中的至少两者结合,由此形成第一组多价结合复合物,和
抑制各多价分子的互补核苷酸掺入所述第一组多价结合复合物的核酸引物中;
(c)检测所述第一组多价结合复合物;以及
(d)鉴别所述第一组多价结合复合物中所述互补核苷酸的核苷酸碱基,由此确定所述核酸模板分子的序列。
107.如权利要求106所述的方法,其还包括:
(e)将所述第一组多价结合复合物解离,其中所述解离包括:
移除所述第一组工程化聚合酶和其结合的多价分子,和
保留多个核酸双链体;
(f)使所述多个保留的核酸双链体与第二组工程化聚合酶在适用于使所述第二组工程化聚合酶与所述多个保留的核酸双链体结合,由此形成第二组复合聚合酶的条件下接触,
其中各复合聚合酶包含结合至核酸双链体的第二工程化聚合酶,
其中所述第二组工程化聚合酶包含与SEQ ID NO:1的氨基酸序列具有至少85%同一性并具有氨基酸取代Asp141Ala和Glu143Ala的氨基酸序列;以及
(g)使所述第二组复合聚合酶与多个核苷酸单元接触,
其中所述接触在适用于使互补核苷酸单元与所述第二组复合聚合酶中的至少两者结合,由此形成多个核苷酸结合复合物的条件下进行,并且
其中所述条件适用于促进结合的互补核苷酸单元的核苷酸掺入所述核苷酸结合复合物的引物中。
108.如权利要求107所述的方法,其还包括:
(h)检测所述多个核苷酸结合复合物中的所述互补核苷酸单元。
109.如权利要求106至108中任一项所述的方法,其还包括:
(i)鉴别所述多个核苷酸结合复合物中所述互补核苷酸单元的核苷酸碱基。
110.如权利要求106至109中任一项所述的方法,其中步骤(b)的所述使所述第一组复合聚合酶与所述多个多价分子接触在抑制聚合酶催化的核苷酸掺入的非催化性二价阳离子存在下进行,其中所述非催化性二价阳离子包括锶或钡。
111.如权利要求107至110中任一项所述的方法,其中步骤(g)的所述使所述第二组复合聚合酶与所述多个核苷酸单元接触在促进聚合酶催化的核苷酸掺入的催化性二价阳离子存在下进行,其中所述催化性二价阳离子包括镁或锰。
112.如权利要求106至111中任一项所述的方法,其中步骤(a)中的所述多个核酸模板分子包含克隆扩增的模板分子。
113.如权利要求106至112中任一项所述的方法,其中步骤(a)的所述多个核酸模板分子中的至少一个核酸模板分子包含感兴趣靶序列的拷贝或包含具有感兴趣靶序列的两个或更多个串联拷贝的多联体。
114.如权利要求106至113中任一项所述的方法,其中步骤(a)中的所述多个核酸模板分子包含相同的靶序列或不同的靶序列。
115.如权利要求106至114中任一项所述的方法,其中所述多价分子中的至少一者的所述核苷酸臂中的至少一者包含:
(i)核心附接部分,
(ii)间隔区,和
(iii)接头,
其中所述多价分子中的至少一者的核心经由所述核心附接部分附接至所述核苷酸臂中的至少一者,其中所述间隔区附接至所述接头,并且其中所述接头附接至所述核苷酸臂中的所述至少一者所携带的核苷酸单元。
116.如权利要求115所述的方法,其中所述接头包含具有2至6个亚基的脂族链或具有2至6个亚基的寡聚乙二醇链。
117.如权利要求115至116中任一项所述的方法,其中附接至所述多价分子中的至少一者的核心的所述多个核苷酸臂具有相同类型的核苷酸单元,并且其中所述核苷酸单元选自由以下组成的组:dATP、dGTP、dCTP、dTTP和dUTP。
118.如权利要求115至117中任一项所述的方法,其中所述多个多价分子包含一种类型的多价分子,其中各多价分子包含选自由以下组成的组的一种类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和dUTP。
119.如权利要求115至118中任一项所述的方法,其中所述多个多价分子包含两种或更多种类型的多价分子,其中所述两种或更多种类型的多价分子包含选自以下的两种或更多种类型的核苷酸单元:dATP、dGTP、dCTP、dTTP和/或dUTP。
120.如权利要求106至119中任一项所述的方法,其中所述多个多价分子中的至少一个多价分子用荧光团标记。
121.如权利要求106至120中任一项所述的方法,其中步骤(a)和(b)中的接触在25至75℃的等温温度下进行。
122.如权利要求106至121中任一项所述的方法,其中步骤(c)的检测和步骤(d)的鉴别在25至75℃的等温温度下进行。
123.如权利要求107至123中任一项所述的方法,其中步骤(g)中所述多个核苷酸单元中的至少一者包含芳族碱基、五碳糖和1至10个磷酸酯基。
124.如权利要求107至123中任一项所述的方法,其中步骤(g)的所述多个核苷酸单元包含选自由以下组成的组的一种类型的核苷酸单元:dATP、dGTP、dCTP、dTTP或dUTP,或包含选自由以下组成的组的两种或更多种类型的核苷酸单元的任何组合的混合物:dATP、dGTP、dCTP、dTTP和/或dUTP。
125.如权利要求107至124中任一项所述的方法,其中步骤(g)中的所述多个核苷酸单元中至少一者用荧光团标记。
126.如权利要求107至125中任一项所述的方法,其中步骤(g)中的所述多个核苷酸单元没有荧光团标记。
127.如权利要求107至126中任一项所述的方法,其中步骤(g)中的所述多个核苷酸单元中的至少一者包含附接至糖基团的3'碳位置的可移除的链终止部分,其中所述可移除的链终止部分包含烷基、烯基、炔基、烯丙基、芳基、苯甲基、叠氮化物基团、叠氮基、O-叠氮基甲基、氨基、酰氨基、酮基、异氰酸酯基、磷酸酯基、硫基、二硫化物基团、碳酸酯基、脲基或甲硅烷基,并且其中所述可移除的链终止部分可用化学化合物裂解以在所述糖基团上产生可延伸的3'OH部分。
128.如权利要求106至127中任一项所述的方法,其中步骤(a)中的所述第一组复合聚合酶固定至支撑物或固定至所述支撑物上的涂层。
129.如权利要求128所述的方法,其中固定至所述支撑物的所述第一组复合聚合酶的密度为102至109个/平方毫米。
130.如权利要求128至129中任一项所述的方法,其中所述第一组复合聚合酶固定至所述支撑物上的预定位点或固定至所述支撑物上的随机位点。
131.如权利要求128至130中任一项所述的方法,其中所述涂层包含至少一个亲水性聚合物涂层,其包含具有至少4个分支的分支聚乙二醇(PEG)。
132.如权利要求131所述的方法,其中所述亲水性聚合物涂层具有不超过45度的水接触角。
133.如权利要求128至132中任一项所述的方法,其中所述固定的第一组复合聚合酶呈彼此流体连通以允许试剂溶液流动至所述支撑物上,以使得所述固定的第一组第一复合聚合酶在所述支撑物上与所述试剂溶液以大规模并行方式反应。
134.如权利要求106至133中任一项所述的方法,其还包括形成第一结合复合物和第二结合复合物,其中形成所述第一结合复合物和所述第二结合复合物包括:
a)使第一核酸引物、第一工程化聚合酶和第一多价分子结合至多联体模板分子的第一部分,由此形成所述第一结合复合物,其中所述第一多价分子的第一核苷酸单元结合至所述第一工程化聚合酶,和
b)使第二核酸引物、第二工程化聚合酶和所述第一多价分子结合至同一多联体模板分子的第二部分,由此形成所述第二结合复合物,其中所述第一多价分子的第二核苷酸单元结合至所述第二工程化聚合酶,
其中包含同一多价分子的所述第一结合复合物和所述第二结合复合物形成亲合力复合物。
135.如权利要求106至134中任一项所述的方法,
其中步骤(a)中的所述接触包括使所述第一组工程化聚合酶和所述多个核酸引物与多联体核酸模板分子的不同部分接触以在同一多联体模板分子上由所述第一组工程化聚合酶形成至少第一复合聚合酶和第二复合聚合酶;
其中步骤(b)中的所述接触包括使所述多个多价分子与在同一多联体模板分子上的所述至少第一复合聚合酶和第二复合聚合酶在适用于使来自所述多个的单一多价分子与所述第一复合聚合酶和所述第二复合聚合酶结合的条件下接触,
其中所述单一多价分子的至少第一核苷酸单元结合至所述第一复合聚合酶,
其中所述第一复合聚合酶包含第一引物,其与所述多联体模板分子的第一部分杂交,由此形成第一结合复合物,并且其中所述单一多价分子的至少第二核苷酸单元结合至所述第二复合聚合酶,
其中所述第二复合聚合酶包含第二引物,其与所述多联体模板分子的第二部分杂交,由此形成第二结合复合物,
其中步骤(b)中的所述接触在适用于抑制聚合酶催化的所述第一结合复合物和所述第二结合复合物中结合的第一核苷酸单元和第二核苷酸单元掺入的条件下进行,并且
其中所述第一结合复合物和所述第二结合复合物结合至同一多价分子,形成亲合力复合物;
其中步骤(c)中的所述检测包括检测在同一多联体模板分子上的所述第一结合复合物和所述第二结合复合物;并且
其中步骤(d)中的所述鉴别包括鉴别所述第一结合复合物中的第一核苷酸单元,由此确定所述多联体模板分子的第一部分的序列,以及鉴别所述第二结合复合物中的第二核苷酸单元,由此确定所述多联体模板分子的第二部分的序列。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/212,540 | 2021-06-18 | ||
US17/705,020 | 2022-03-25 | ||
US17/705,043 | 2022-03-25 | ||
US17/705,011 | 2022-03-25 | ||
US17/705,020 US20220403352A1 (en) | 2021-06-18 | 2022-03-25 | Engineered polymerases |
PCT/US2022/034021 WO2022266462A2 (en) | 2021-06-18 | 2022-06-17 | Engineered polymerases |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117980474A true CN117980474A (zh) | 2024-05-03 |
Family
ID=90850053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280054380.XA Pending CN117980474A (zh) | 2021-06-18 | 2022-06-17 | 工程化聚合酶 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117980474A (zh) |
-
2022
- 2022-06-17 CN CN202280054380.XA patent/CN117980474A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11624079B2 (en) | Polymerase-tethered nucleotides for nucleic acid synthesis | |
US6858393B1 (en) | Chain terminators for DNA synthesis | |
US20240158767A1 (en) | Polymerase enzyme from phage t4 | |
WO2016077324A1 (en) | Thiolated nucleotide analogues for nucleic acid synthesis | |
US20220403351A1 (en) | Engineered polymerases | |
CN117980474A (zh) | 工程化聚合酶 | |
US20220144875A1 (en) | Reversible modification of nucleotides | |
JP2024522795A (ja) | 操作されたポリメラーゼ | |
US12006518B2 (en) | Engineered polymerases with reduced sequence-specific errors | |
US20230392144A1 (en) | Compositions and methods for reducing base call errors by removing deaminated nucleotides from a nucleic acid library | |
US20240084380A1 (en) | Compositions and methods for preparing nucleic acid nanostructures using compaction oligonucleotides | |
US20240191225A1 (en) | Double-stranded splint adaptors with universal long splint strands and methods of use | |
WO2023240230A2 (en) | Engineered polymerases with improved thermal stability | |
US20240052398A1 (en) | Spatially resolved surface capture of nucleic acids | |
CA3224352A1 (en) | Compositions and methods for pairwise sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |