WO2024138419A1 - 具有dna聚合酶活性的多肽及其应用 - Google Patents
具有dna聚合酶活性的多肽及其应用 Download PDFInfo
- Publication number
- WO2024138419A1 WO2024138419A1 PCT/CN2022/142778 CN2022142778W WO2024138419A1 WO 2024138419 A1 WO2024138419 A1 WO 2024138419A1 CN 2022142778 W CN2022142778 W CN 2022142778W WO 2024138419 A1 WO2024138419 A1 WO 2024138419A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sequencing
- polypeptide
- nucleic acid
- dna polymerase
- activity
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 91
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 90
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 90
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 title claims abstract description 78
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 title claims abstract description 78
- 230000000694 effects Effects 0.000 title claims abstract description 78
- 238000012163 sequencing technique Methods 0.000 claims abstract description 72
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 67
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 62
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 29
- 230000003321 amplification Effects 0.000 claims abstract description 27
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 19
- 239000000203 mixture Substances 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 15
- 239000012634 fragment Substances 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 108090000623 proteins and genes Proteins 0.000 claims description 25
- 239000002773 nucleotide Substances 0.000 claims description 23
- 125000003729 nucleotide group Chemical group 0.000 claims description 23
- 238000006073 displacement reaction Methods 0.000 claims description 19
- 239000000872 buffer Substances 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 15
- 239000011541 reaction mixture Substances 0.000 claims description 10
- 125000000539 amino acid group Chemical group 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 8
- 230000035772 mutation Effects 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 150000002500 ions Chemical class 0.000 claims description 6
- 239000011807 nanoball Substances 0.000 claims description 6
- 238000003752 polymerase chain reaction Methods 0.000 claims description 6
- 239000007787 solid Substances 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000000839 emulsion Substances 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 3
- 235000011180 diphosphates Nutrition 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000011901 isothermal amplification Methods 0.000 claims description 3
- 235000019689 luncheon sausage Nutrition 0.000 claims description 3
- 238000003203 nucleic acid sequencing method Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000007480 sanger sequencing Methods 0.000 claims description 3
- 239000004065 semiconductor Substances 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000007671 third-generation sequencing Methods 0.000 claims description 3
- 239000001226 triphosphate Substances 0.000 claims description 3
- 235000011178 triphosphate Nutrition 0.000 claims description 3
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 21
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 19
- 210000004027 cell Anatomy 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 15
- 239000001103 potassium chloride Substances 0.000 description 15
- 102000040350 B family Human genes 0.000 description 14
- 108091072128 B family Proteins 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 14
- 108090000790 Enzymes Proteins 0.000 description 14
- 230000037048 polymerization activity Effects 0.000 description 13
- 229920004890 Triton X-100 Polymers 0.000 description 12
- 239000013504 Triton X-100 Substances 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 9
- 102000004169 proteins and genes Human genes 0.000 description 9
- 150000001413 amino acids Chemical group 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 229940024606 amino acid Drugs 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 108060002716 Exonuclease Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 239000011535 reaction buffer Substances 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 3
- 241000205188 Thermococcus Species 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 238000010791 quenching Methods 0.000 description 2
- 230000000171 quenching effect Effects 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101710200526 DNA polymerase 2 Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241001148023 Pyrococcus abyssi Species 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 241000205192 Pyrococcus woesei Species 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241001237851 Thermococcus gorgonarius Species 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589501 Thermus caldophilus Species 0.000 description 1
- 241000589498 Thermus filiformis Species 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 239000000385 dialysis solution Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012248 genetic selection Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000003521 protein stability assay Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000002702 ribosome display Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000001447 template-directed synthesis Methods 0.000 description 1
- 238000002849 thermal shift Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Abstract
提供一种具有DNA 聚合酶活性的多肽,其包含与SEQ ID NO:1或其聚合酶活性片段或结构域具有至少 80%同一性的氨基酸序列,以及相应的分离的核酸、包含核酸的载体和宿主细胞、制备多肽的方法、包含多肽或核酸的组合物或试剂盒,和通过多肽进行核酸扩增和测序的方法。
Description
本公开涉及具有DNA聚合酶活性的多肽以及通过所述多肽进行核酸扩增、测序、文库构建、基因筛选或突变检测的方法等。
DNA聚合酶是以DNA单链为模板,以4种脱氧核苷酸为底物,由5′端开始复制合成一条与模板链序列互补的DNA新链的酶。DNA聚合酶可以将游离核苷酸添加到新形成链的3′端,从而导致新链在5′-3′方向的延伸。某些酶具有3′到5′核酸外切酶的活性,可以校正新合成DNA中的错误,PCR扩增过程中如果产生了错配碱基,它可以将其切掉,在错误碱基切除以后,聚合酶可以重新插入正确的碱基并继续复制,从而保证了扩增的准确性。
DNA聚合酶分为六个家族:A、B、C、D、X以及Y。目前发现的耐热DNA聚合酶属于A家族或B家族。属于A家族DNA聚合酶来源于真细菌,如来源于栖热属的Taq(Thermus aquaticus)、Tth(Thermus thermophilus)、Tca(Thermus caldophilus)、Tfl(Thermus flavus)、Tfi(Thermus filiformis)以及来源于芽孢菌属的Bst(Bacillus stearothemophilis);属于B家族的耐热DNA聚合酶来源于古细菌,如来源于高温球菌属的Tli(Thermococcus litoralis)、焦热球菌属的Pfu(Pyrococcus furiosus)和KOD1(Thermococcus kodacaraensis),以及Pwo(Pyrococcus woesei)、Tgo(Thermococcus gorgonarius)、Pab(Pyrococcus abyssi)等。A家族DNA聚合酶主要有5′-3′聚合活性,及5′-3′外切活性。B家族DNA聚合酶主要特点为具有5′-3′聚合活性以及3′-5′核酸外切活性,该特有的外切活性赋予B家族DNA聚合酶校正功能,和普通DNA聚合酶(如Taq DNA聚合酶)相比,其具有更低的错误率,更适合应用于PCR保真性要求较高的实验,寻找新型具有B家族DNA聚合酶活性的多肽具有重要的意义和价值。
发明内容
本公开提供具有DNA聚合酶活性的多肽及其应用。本公开还提供编码所述多肽的分离的核酸、包含所述核酸的载体和宿主细胞、制备所述多肽的方法、包含所述多肽或核酸的组合物或试剂盒,以及通过所述多肽进行核酸扩增、测序、文库构建、基因筛选或突变检测的方法。
发明人通过对来源于深海热液沉积物样本的宏基因组测序数据分析,令人吃惊地发现了一种新的具备DNA聚合酶活性的多肽,通过探究,确定该序列具有B家族DNA聚合酶的功能。发明人进一步将该序列基因合成后,构建入pET28a载体内(插入位点为Nde I/Xho I),并在大肠杆菌BL21感受态中进行异源表达、采用镍柱-Q柱-SP柱进行纯化,获得了纯化的多肽。发明人通过功能活性测定,确定该酶具有优异的热稳定性、5′-3′聚合活性及3′-5′外切活性,且具有链置换活性。功能PCR测试表面该酶可直接应用于PCR反应。
在一些方面中,本公开提供下述一项或多项描述的发明。
1.一种具有DNA聚合酶活性的多肽,其中所述多肽为:
(1)包含SEQ ID NO:1所示的氨基酸序列或与SEQ ID NO:1有至少80%同一性的氨基酸序列并具有DNA聚合酶活性的多肽,
(2)与SEQ ID NO:1的氨基酸序列相比具有一个或多个氨基酸残基的置换、缺失、或添加并具有DNA聚合酶活性的多肽,或
(3)(1)或(2)所述多肽的具有DNA聚合酶活性的功能性片段。
2.项目1所述的多肽,其中所述多肽还具有以下一种或多种性质:1)热稳定性,2)3′-5′外切活性,和3)链置换活性。
3.一种分离的核酸,其中所述分离的核酸编码项目1或2所述的多肽,例如所述分离的核酸可以具有SEQ ID NO:2所示的核苷酸序列。
4.一种载体,其包含项目3所述分离的核酸。
5.一种宿主细胞,其包含项目3所述分离的核酸或项目4所述的载体。
6.一种制备项目1或2所述的多肽的方法,其中包括在适于所述多肽表达的条件下,培养项目5所述的宿主细胞,以获得所述多肽。
7.一种组合物或试剂盒,其包含项目1或2所述的多肽、项目3所述分离的核酸、项目4所述载体或项目5所述的宿主细胞。
8.项目7所述的组合物或试剂盒,其还包含以下一种或多种:1)脱 氧核苷三磷酸,2)引物,和3)缓冲剂。
9.项目1或2所述的多肽,或项目7或8所述的组合物或试剂盒,其用于下述至少一种应用:1)核酸扩增,2)测序,3)文库构建,4)基因筛选,或5)突变检测。
10.一种扩增样品中靶核酸的方法,所述方法包括在允许所述靶核酸通过聚合酶扩增的条件下,在反应混合物中温育所述靶核酸,所述反应混合物包含至少一种引物和项目1或2所述的具有DNA聚合酶活性的多肽。
11.项目10所述的方法,其中扩增反应为聚合酶链反应、乳液聚合酶链反应、等温扩增反应、邻位连接扩增反应、滚环扩增反应或链置换扩增反应。
12.项目10或11所述的方法,其中所述扩增在溶液中或在固体载体上进行。
13.一种核酸测序方法,其包括:
提供测序反应混合物,所述测序反应混合物包含待测核酸、一种或多种核苷酸、测序引物和项目1或2所述的具有DNA聚合酶活性的多肽,使待测核酸与至少一种类型的核苷酸接触,使来自所述至少一种类型的核苷酸的一种或多种核苷酸掺入到所述测序引物的3′端上,产生延伸的引物产物,以及通过检测所述延伸的引物产物的存在,由此对待测核酸进行测序。
14.项目13所述的测序方法,其中所述测序方法为第一代测序方法、第二代测序方法和/或第三代测序方法,例如Sanger法测序,合成法测序(如Illumina的染料测序,Pacific Biosciences的单分子实时测序),连接法测序(如Applied Biosystems的SOLiD或Polony测序),焦磷酸测序(如Roche Diagnostics的454测序),离子半导体测序(如Life Technologies的Ion Torrent测序),真迈基因单分子测序,BGI(华大基因)的纳米球(DNA nano ball,DNB)测序方法。
15.项目13或14所述的方法,其中待测核酸为DNA和/或RNA。
在一些方面中,本公开提供一种新型B家族DNA聚合酶,具备B家族聚合酶特有的属性,即5’-3’聚合活性和3’-5’外切活性,不含5’-3’外切活性,但是和现有同类酶产品相比,本公开蛋白序列同一性较低,为新型 的B家族DNA聚合酶,该酶具有优异的热稳定性、5′-3′聚合活性、3′-5′外切活性、链置换活性,可为B家族DNA聚合酶不同应用场景的改造需求提供全新的酶骨架。
相较于现有的B家族DNA聚合酶,本公开提供的DNA聚合酶为新型DNA聚合酶,具备广泛的应用前景。本公开提供的DNA聚合酶能够根据不用的应用场景进行体系优化,获得具备优异性能的变体和衍生物。
图1显示B7DNA聚合酶和KOD DNA聚合酶以及Pfu DNA聚合酶的氨基酸序列比对结果。
图2显示B7DNA聚合酶纯化结果。
图3显示蛋白稳定性测定结果。
图4显示聚合活性测定原理。
图5显示3′-5′外切活性检测原理。
图6显示B7DNA聚合酶3′-5′外切活性检测荧光曲线。
图7显示链置换活性检测原理。
图8显示B7DNA聚合酶链置换活性检测荧光曲线。
图9显示B7DNA聚合酶在不同反应缓冲液中PCR扩增结果。
现在将通过参考以下定义和实施例详细描述本发明。除非另有说明,本文使用的所有科技术语都具有与本领域普通技术人员通常理解的含义。
(I)具有DNA聚合酶活性的多肽
在一些实施方案中,本文提供具有DNA聚合酶活性的多肽,其包含与SEQ ID NO:1或其聚合酶活性片段或结构域具有至少80%同一性的氨基酸序列。在一些实施方案中,本文提供的多肽具有B家族DNA聚合酶活性。如本领域技术人员所知,B家族聚合酶活性是指具有5’-3’聚合活性和3’-5’外切活性,不具有5’-3’外切活性。在本文中,具有B家族DNA聚合酶活性的多肽有时也称为B家族DNA聚合酶。在一些实施方案中,具备SEQ ID NO:1的氨基酸序列的多肽在本文中有时也称为B7DNA聚合酶。
术语“多肽”在本文中与“肽”、“蛋白”可互换使用,并不限定特定的氨基酸残基长度,还可以包括翻译后修饰,如糖基化、乙酰化和磷酸化等。在一些实施方案中,所述多肽是分离的多肽,基本上不含与其共同产生的其他蛋白以及其他污染物。
本公开包括与本文鉴定的SEQ ID NO:1的多肽(包括其片段或结构域)具有至少80,82,84,86,88,90,91,92,93,94,95,96,97,98,99或100%的氨基酸序列同一性的氨基酸序列,并具有SEQ ID NO:1的多肽的一种或多种活性(例如DNA聚合酶活性、优选B7DNA聚合酶活性)。用于确定同一性的序列比对算法是本领域熟知的。例如,可以通过计算机执行的算法(例如,GAP,BESTFIT,FASTA或TFASTA)、或BLAST和BLAST 2.0算法采用默认参数进行氨基酸序列的比对。
在一些实施方案中,本公开的多肽具备DNA聚合酶活性,优选还具有以下一种或多种性质:1)热稳定性(耐热DNA聚合酶),2)3′-5′外切活性,和3)链置换活性。在一些实施方案中,本公开的多肽具备与SEQ ID NO:1的多肽相同的DNA聚合酶活性,优选还具有相同的以下一种或多种性质:1)热稳定性,2)3′-5′外切活性,和3)链置换活性。在本文中,相同活性一般是指与参照相比相差在20%以下、优选15%以下、10%以下、5%以下的活性。
在本文中,术语“DNA聚合酶活性”通常是指DNA聚合酶在催化多核苷酸的模板引导的合成方面的活性。可以利用本领域已知的各种技术和方法来测量聚合酶的酶活性。例如,可以在缓冲液中制备聚合酶的连续稀释物,将聚合酶反应混合物在适当温度(例如37℃、74℃等)孵育,然后测定通过聚合酶合成的产物量。测量聚合酶活性和其他性质如热稳定性、3′-5′外切活性和链置换活性的方法是本领域已知的(参见例如本文实施例,以及Sambrook等人(2001),Molecular Cloning:A Laboratory Manual等)。
在一些实施方案中,本文还提供所述多肽的片段、类似物、变体或衍生物。术语“片段”、“变体”、“衍生物”和“类似物”包括保留相对应的天然多肽分子的至少一种功能特性(例如DNA聚合酶活性、优选B7DNA聚合酶活性)的任意多肽。变体可以是天然存在或非天然存在的。非天然存在的变体可以使用本领域已知的诱变技术产生。在一些实施方案中,变 体多肽可以包括保守或非保守氨基酸置换、缺失或添加。本发明的多肽的衍生物可以是已被改变从而表现出天然多肽所不存在的另外的特征的多肽。当用于本文时,多肽的“衍生物”是指具有通过官能侧链基团的反应而化学衍生的一个或多个残基的目的多肽。当用于本文时,术语“功能变体”是指与天然存在的序列具有基本上相同的氨基酸序列或由基本上相同的核苷酸序列编码并且能够具有天然存在的序列的一种或多种活性(例如DNA聚合酶活性、优选B7DNA聚合酶活性)的多肽。在一些实施方案中,本公开提供与SEQ ID NO:1或其聚合酶活性片段或结构域具有至少80%同一性的多肽、所述多肽的片段、类似物、变体或衍生物。在一些实施方案中,多肽的变体与SEQ ID NO:1的多肽相比具有一个或多个(例如1、2、3、4、5、6、7、8、9、10或更多个)氨基酸残基突变,如置换(优选保守氨基酸置换)、缺失、或添加。“保守氨基酸置换”是其中氨基酸残基被具有相似侧链的氨基酸残基置换。在本领域中已经定义了具有相似侧链的氨基酸残基,包括具有碱性侧链的氨基酸(例如,赖氨酸,精氨酸,组氨酸),具有酸性侧链的氨基酸(例如,天冬氨酸,谷氨酸),具有不带电荷的极性侧链的氨基酸(例如,甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸),具有非极性侧链的氨基酸(例如,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸),具有β-支链的侧链的氨基酸(例如,苏氨酸,缬氨酸,异亮氨酸)以及具有芳香族侧链的氨基酸(例如,酪氨酸,苯丙氨酸,色氨酸,组氨酸)。在一些实施方案中,所述多肽的片段、类似物、变体或衍生物保留亲本多肽分子的至少一种功能特性(例如DNA聚合酶活性、优选B7DNA聚合酶活性)。在一些实施方案中,所述多肽的片段、类似物、变体或衍生物还可以任选地具有接头或标签,如亲和标签,如FLAG标签、MYC标签、聚组氨酸标签或任意可检测的标签。在一些实施方案中,本公开的多肽还可以包含非天然存在的氨基酸残基。
(II)分离的核酸、载体、宿主细胞、制备多肽的方法
在一些实施方案中,本文提供一种分离的核酸,其中所述分离的核酸编码本公开的任一种多肽(包括其片段或结构域),例如与SEQ ID NO:1或其聚合酶活性片段或结构域具有至少80%同一性的氨基酸序列的多肽,以及其变体和衍生物。在一些实施方案中,本公开的核酸可以具有SEQ ID NO:2所示的核苷酸序列或与其具有至少80,82,84,86,88,90,91,92,93,94,95,96,97,98,99或100%同一性的核苷酸序列。用于确定核苷酸序列同一性的序列比对算法是本领域熟知的。在一些实施方案中,本公开的核酸包括和参照序列能够在严格杂交条件下杂交的序列,这样的条件是本领域熟知的,参见例如Sambrook等人(2001),Molecular Cloning:A Laboratory Manual。在一些实施方案中,本公开的核酸包括密码子优化的序列,可以通过本领域已知的方法将特定宿主细胞所偏好的密码子引入到本公开的核酸中。
本文中,术语“核酸”和“多核苷酸”可互换使用,可以包括DNA(包括cDNA)和RNA序列。本公开的分离的核酸包括已经从其天然存在的环境中分开的核酸序列,重组或克隆的DNA分离物,可以包含5′和3′非不翻译区,如启动子和终止子,并可以通过本领域已知的任何方法制备。例如,所述核酸可以通过在适当的宿主细胞中重组表达产生。可以将编码所核酸或其片段序列构建到重组核酸构建体中,引入到原核或真核宿主细胞中进行重组表达。
本文中,术语“载体”包括表达载体,例如重组DNA载体,其可以用于制备本公开的多肽。载体可以包括适当的控制序列,如启动子和/或终止子,其是本领域技术人员已知的,并且可以根据宿主细胞进行选择。适当的宿主细胞包括原核宿主细胞如大肠杆菌、枯草芽孢杆菌、假单胞菌、哺乳动物细胞如VERO、HeLa、CHO细胞、酵母、真菌、植物、昆虫等宿主细胞。可以通过分子生物学方法在相容的原核或真核宿主细胞中表达在载体中的本公开的核酸序列而制备本公开的多核苷酸或多肽。
(III)组合物或试剂盒
在一些实施方案中,本文提供一种组合物或试剂盒,其包含本公开的多肽、分离的核酸、载体或宿主细胞。在一些实施方案中,所述组合物或试剂盒还可以包含以下一种或多种:1)脱氧核苷三磷酸,2)引物,和3)缓冲剂。在一些实施方案中,所述组合物或试剂盒还可以包含其他适合用于进行核酸扩增、测序、文库构建、基因筛选或突变检测的任何组分。在一些实施方案中,所述组合物或试剂盒中组分可以适当的放置于一个或多个容器中。
(IV)方法和应用
在一些实施方案中,本公开的多肽、组合物或试剂盒可以用于各种基于DNA聚合酶活性的应用,包括例如1)核酸扩增,2)测序,3)文库构建,4)基因筛选,或5)突变检测。在一些实施方案中,所述应用可以包括基因分型、SNP分析、拷贝数变异分析、表观遗传分析、基因表达分析、杂交阵列、基因突变分析等。
在一些实施方案中,本文提供通过本公开的多肽、组合物或试剂盒进行核酸扩增、测序、文库构建、基因筛选或突变检测的方法。在一些实施方案中,所述方法可以为基于链置换反应的方法。
如阅读本文后本领域技术人员将理解的,本公开的核酸扩增方法没有特别限制,可以适用于任何依赖于DNA聚合酶活性的方法。在一些实施方案中,本文提供核酸扩增方法,其包括在一种或多种核苷酸存在下,使所述具备DNA聚合酶活性的多肽(也称为DNA聚合酶)与核酸模板接触,在适用于核酸扩增的条件下,使用所述多肽使所述核酸扩增。在一些实施方案中,在一种或多种核苷酸和盐如KCl、NaCl、MgCl
2存在下使所述DNA聚合酶与所述核酸模板接触。在一些实施方案中,所述扩增可以为聚合酶链反应、乳液聚合酶链反应、等温扩增反应、重组酶聚合酶扩增反应、邻位连接扩增反应、滚环扩增反应或链置换扩增反应。在一些实施方案中,所述扩增包含使所述核酸在溶液中或在固体载体上克隆扩增。
如阅读本文后本领域技术人员将理解的,本公开的测序方法没有特别限制,可以适用于任何依赖于DNA聚合酶活性的测序方法。在一些实施方案中,本文提供测序方法,其包括提供包含待测核酸、一种或多种核苷酸、测序引物和DNA聚合酶的反应混合物,使待测核酸与至少一种类型的核苷酸接触,使来自所述至少一种类型的核苷酸的一种或多种核苷酸掺入到所述测序引物的3′端上,产生延伸的引物产物,以及通过检测所述延伸的引物产物的存在,由此对待测核酸进行测序。在一些实施方案中,本公开的测序方法可以用于任何边合成边测序的方法。在一些实施方案中,待测核酸的来源没有特别限定,可以时任何待测样品的核酸序列如DNA和/或RNA序列。在一些实施方案中,本公开的测序方法可以适用于第一代测序方法、第二代测序方法和/或第三代测序方法,例如传统的Sanger法测序,合成法测序(比如Illumina的染料测序,Pacific Biosciences的单分子实时测序),连接法测序(Applied Biosystems的SOLiD或Polony测 序平台),焦磷酸测序(Roche Diagnostics的454测序),离子半导体测序(Life Technologies的Ion Torrent测序),真迈基因单分子测序,BGI(华大基因)纳米球(DNA nano ball,DNB)测序方法进行。在一些实施方案中,RNA测序方法也是本领域已知的,例如可以通过由信使和结构RNA产生的互补DNA(cDNA)的直接测序和将测序读出定位至参考基因组以用于基因表达分析。
在一些实施方案中,本公开的多肽可以用于构建文库,例如用于所述核酸测序方法的文库,如在乳液PCR或桥式PCR期间产生的文库。在一些实施方案中,本公开的多肽构建的文库可以用于测序、高通量筛选、遗传选择、噬菌体展示、酵母展示、核糖体展示等。
本公开的多肽具备优异的热稳定性、5′-3′聚合活性、3′-5′外切活性、链置换活性,因此尤其适合上述各项应用和方法中。
下面主要结合附图及具体实施例进行进一步详细的说明。除有具体说明的以外,本公开实施例一般通过本领域常规方法、条件或者根据产品说明书并通过商购获得的常规仪器、试剂和材料进行。
实施例1-序列比对
采用Clustal Omega在线序列比对网站,将该新型DNA聚合酶(B7DNA聚合酶)和KOD DNA聚合酶以及Pfu DNA聚合酶进行多重序列比,比对结果显示B7DNA聚合酶和上述两种酶的序列一致性分别为45.44%,44.99%,具体比对结果如图1所示。
实施例2-构建重组质粒,表达纯化
委托北京六合华大基因科技有限公司进行B7DNA聚合酶基因序列合成,并将基因克隆入pET28A表达载体中,克隆位点为Nde I和Xho I。将上述重组质粒转化入大肠杆菌BL21(DE3)感受态细胞中,37℃静止隔夜,用于后续的表达纯化。蛋白纯化所用亲和层析柱和阴离子交换柱分别为HisTrap FF 5mL和HiTrap Q FF 5mL,具体纯化步骤为:
(1)挑取平板上长势良好的单菌落3-6个,接种至50/250ml的LB液体锥形瓶中,37℃培养5-7h,OD600达到0.6-4.0。随后以1%的接种量将上述菌液接种至2L/5L的LB培养基中,37℃培养2-4h,待OD600达到0.8-1.0。将原摇床预冷至16℃。向培养基中分别加入IPTG,使其终浓度 为0.5mM。16℃的摇床内,220rpm、诱导表达12-16h。
(2)采用8000g转速,离心30min收集菌体,随后按1∶20比例加入亲和A液进行菌体重悬,并采用超声的方法,在冰浴环境中,进行菌体破碎。
(3)加热处理:水浴锅预热至75-80℃,将已破碎菌体放入水浴锅中,摇动混匀,用干净的温度计检测菌液内部温度到达75℃时,计时30min,期间每10min摇动混匀3次,使受热均匀。
(4)将热处理后的超声破碎液在12000rpm转速下4℃离心60min,将上清用0.22μM滤膜进行过滤,作为纯化柱上样样品。
(5)将上述样品以3ml/min的速率上样进预处理后的层析柱(HisTrap FF)。上样完成后,继续用Ni柱亲和A液冲洗20个柱体积。随后进行Ni柱亲和B液占比0-70%,10.5CV的线性洗脱。紫外吸收峰达到100mAu时收集洗脱蛋白,紫外吸收峰下降到200mAu时停止收集。
(6)将上述收集到的洗脱液采用B7稀释液进行6倍稀释后上样到预处理的Q柱上(HiTrap Q HP 5ml),待上样完毕后,用Q柱A液漂洗30CV,至基线稳定,流速5min/min。
(7)Q柱B液进行梯度洗脱(0-100%Q柱B液,10CV)目的蛋白,流速5ml/min。将收集的样品进行SDS-PAGE分析确定蛋白纯度。
(8)将纯化后的蛋白样品进行透析及浓度测定后,储存在储藏液中,用于后续功能活性分析。
纯化过程中所用缓冲液具体组分如下所示:
Ni柱-A Buffer:20mM Tris-HCl,300mM NaCl,20mM Imidazole,5%Glycerol,pH 8.5
Ni柱-B Buffer:20mM Tris-HCl,300mM NaCl,500mM Imidazole,5%Glycerol,pH 8.5
Q柱-A Buffer:20mM Tris-HCl,100mM NaCl,5%Glycerol,pH 8.5
Q柱-B Buffer:20mM Tris-HCl,500mM NaCl,5%Glycerol,pH 8.5
稀释液:20mM Tris-HCl,5%Glycerol,pH 8.5
2X透析液:40mM Tris-HCl,200mM KCl,2mM DTT(0.154g/L),0.2mM EDTA(0.0884g/L),5%Glycerol,pH 8.0@25℃
储存液:10mM Tris-HCl(1.2114g/L),100mM KCl(7.455g/L),1mM DTT(0.15425g/L),0.1mM EDTA(0.037224g/L),50%Glycerol(625g/L),pH 8.0@25℃
纯化结果如图2所示:B7 DNA聚合酶纯化过程SDS-PAGE胶图。
实施例3-热稳定性测定
采用Protein Thermal Shift
TM染料试剂盒(ThermoFisher)进行蛋白稳定性测定,对照采用KOD DNA聚合酶和Pfu DNA聚合酶,结果如图3所示。
根据上述结果获得B7 DNA聚合酶和KOD DNA聚合酶的Tm值分别为93.5℃和95.9℃。
实施例4-聚合活性测定
采用primed M13 ssDNA底物进行聚合活性测定,具体原理如下图所示,在聚合活性存在的情况下primed M13 ssDNA上的引物会按照5′-3′的方向沿着ssDNA进行延伸,产生dsDNA,后者可通过Qubit dsDNA HS Assay Kits试剂盒进行定量检测。
聚合活性检测原理如图4所示。
具体反应体系及组分如下:
将上述反应液在72℃反应5min后,加入2μl 0.5M的EDTA终止反应,并用Qubit试剂盒进行dsDNA浓度测定。结果如下所示:
反应条件 | Qubit值(ng/μl) |
72℃/5min | 21.66 |
上述结果显示该酶在72℃具有聚合活性。
实施例5-外切活性测定(3′-5′外切活性)
采用末端错配底物探针的方法进行外切活性测定,所用荧光探针序列 为:一条3′端带有淬灭基团的引物(ATCAGCAGGCCACACGTTAAACTGT3′-BHQ2)和一条5′端带有荧光基团的引物(TAGTCGTCCGGTGTGCAATTTCTGT 5′-Rox)退火后互补配对形成双链底物,该底物末端含有4个错配。3′-5′外切活性检测原理如图5所示。
检测3′-5′外切活性反应体系如下,其中空白对照为不含酶的反应体系,反应在30℃进行1h,每隔30s收集一次荧光信号(FAM荧光,激发峰为492nm,发射峰为520nm):
最终结果如图6所示(图中荧光信号为已减去空白对照后的矫正荧光信号),显示荧光值随反应时间逐渐上升,因此该酶具有3′-5′外切活性。
实施例6-链置换活性测定
链置换活性检测原理如图所示,采用带有切口的双链DNA荧光探针为底物,当未添加链置换活性的酶时,探针底物的荧光基团F被紧邻的淬灭基团Q淬灭掉,当加入具有链置换活性的酶时,上游链会在切口处沿着5′-3′方向进行链置换,随着下游含荧光基团F的单链被置换掉而发出荧光信号。荧光信号采用酶标仪进行检测和收集,所用激发波长为494nm,发射波长为522nm。反应在37℃进行,每隔1min收集一次荧光信号。
链置换活性检测原理如图7所示。
反应体系如下所示:
组分体积(μl)
B7DNA聚合酶2
10μM探针底物1
10mM dNTPs 0.5
H
2O 41.5
检测结果如图8所示(图中荧光信号为已减去空白对照后的矫正荧光 信号)。
实施例7-PCR体系优化
采用12种具有代表性的PCR反应Buffer测试B7DNA聚合酶应用于PCR的潜力。所用12种反应Buffer组分如下所示:
Buffer 1∶10mM Tris-HCl(pH 8.4),25mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 2∶10mM Tris-HCl(pH 8.4),25mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 3∶10mM Tris-HCl(pH 8.4),75mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 4∶10mM Tris-HCl(pH 8.4),75mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 5∶10mM Tris-HCl(pH 8.8),25mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 6∶10mM Tris-HCl(pH 8.8),25mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 7∶10mM Tris-HCl(pH 8.8),75mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 8∶10mM Tris-HCl(pH 8.8),75mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 9∶10mM Tris-HCl(pH 9.2),25mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 10∶10mM Tris-HCl(pH 9.2),25mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 11∶10mM Tris-HCl(pH 9.2),75mM KCl,1.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
Buffer 12∶10mM Tris-HCl(pH 9.2),75mM KCl,2.5mM MgCl
2,40mM TMAC,0.1%Triton X-100。
采用大肠杆菌基因组为模板进行16s基因的扩增,所用上下游引物为E16S-27F和E16S-1492R,引物序列分别为 5′-AGAGTTTGATCCTGGCTCAG-3′和5′-GGTTACCTTGTTACGACTT-3′,PCR反应体系如下所示:
10×反应buffer 2.5μL
10mM dNTPs 1.25μL
10ng/μl E.coli gDNA 1μL
10μM E16S-27F 1μL
10μM E16S-1492R 1μL
酶1μL
NF水12.25μL
PCR循环为95℃预变性3min,然后95℃,20s;58℃,15s;72℃,1.5min;30个循环,最后在72℃补充反应7min。PCR产物进行琼脂糖凝胶电泳,电泳结果结果如图9所示。
B7 DNA聚合酶氨基酸序列(SEQ ID NO:1):
B7 DNA聚合酶核酸序列(SEQ ID NO:2):
需要说明的是,由于密码子简并性原则,翻译氨基酸序列的核苷酸序列并不是唯一恒定的序列,任何可以编码相同氨基酸序列的核苷酸序列都是本公开范围内的核酸序列。
外切活性测定所用荧光探针序列:
3′端带有淬灭基团的引物(SEQ ID NO:3):ATCAGCAGGCCACACGTTAAACTGT 3′-BHQ2
5′端带有荧光基团的引物(SEQ ID NO:4):TAGTCGTCCGGTGTGCAATTTCTGT 5′-Rox
以大肠杆菌基因组为模板进行16s基因的扩增所用上下游引物序列:
E16S-27F(SEQ ID NO:5):5′-AGAGTTTGATCCTGGCTCAG-3′
E16S-1492R(SEQ ID NO:6):5′-GGTTACCTTGTTACGACTT-3′
Claims (15)
- 一种具有DNA聚合酶活性的多肽,其中所述多肽为:(1)包含SEQ ID NO:1所示的氨基酸序列或与SEQ ID NO:1有至少80%同一性的氨基酸序列并具有DNA聚合酶活性的多肽;(2)与SEQ ID NO:1的氨基酸序列相比具有一个或多个氨基酸残基的置换、缺失、或添加并具有DNA聚合酶活性的多肽;或(3)(1)或(2)所述多肽的具有DNA聚合酶活性的功能性片段。
- 权利要求1所述的多肽,其中所述多肽还具有以下一种或多种性质:1)热稳定性,2)3′-5′外切活性,和3)链置换活性。
- 一种分离的核酸,其中所述分离的核酸编码权利要求1或2所述的多肽,例如所述分离的核酸可以具有SEQ ID NO:2所示的核苷酸序列。
- 一种载体,其包含权利要求3所述分离的核酸。
- 一种宿主细胞,其包含权利要求3所述分离的核酸或权利要求4所述的载体。
- 一种制备权利要求1或2所述的多肽的方法,其中包括在适于所述多肽表达的条件下,培养权利要求5所述的宿主细胞,以获得所述多肽。
- 一种组合物或试剂盒,其包含权利要求1或2所述的多肽、权利要求3所述分离的核酸、权利要求4所述载体或权利要求5所述的宿主细胞。
- 权利要求7所述的组合物或试剂盒,其还包含以下一种或多种:1)脱氧核苷三磷酸,2)引物,和3)缓冲剂。
- 权利要求1或2所述的多肽,或权利要求7或8所述的组合物或试剂盒,其用于下述至少一种应用:1)核酸扩增,2)测序,3)文库构建,4)基因筛选,或5)突变检测。
- 一种扩增样品中靶核酸的方法,所述方法包括在允许所述靶核酸通过聚合酶扩增的条件下,在反应混合物中温育所述靶核酸,所述反应混合物包含至少一种引物和权利要求1或2所述的具有DNA聚合酶活性的多肽。
- 权利要求10所述的方法,其中扩增反应为聚合酶链反应、乳液聚合酶链反应、等温扩增反应、邻位连接扩增反应、滚环扩增反应或链置换 扩增反应。
- 权利要求10或11所述的方法,其中所述扩增在溶液中或在固体载体上进行。
- 一种核酸测序方法,其包括:提供测序反应混合物,所述测序反应混合物包含待测核酸、一种或多种核苷酸、测序引物和权利要求1或2所述的具有DNA聚合酶活性的多肽,使待测核酸与至少一种类型的核苷酸接触,使来自所述至少一种类型的核苷酸的一种或多种核苷酸掺入到所述测序引物的3′端上,产生延伸的引物产物,以及通过检测所述延伸的引物产物的存在,由此对待测核酸进行测序。
- 权利要求13所述的测序方法,其中所述测序方法为第一代测序方法、第二代测序方法或第三代测序方法,例如Sanger法测序,合成法测序(如Illumina的染料测序,Pacific Biosciences的单分子实时测序),连接法测序(如Applied Biosystems的SOLiD或Polony测序),焦磷酸测序(如Roche Diagnostics的454测序),离子半导体测序(如Life Technologies的Ion Torrent测序),真迈基因单分子测序,BGI(华大基因)的纳米球(DNA nano ball,DNB)测序方法。
- 权利要求13或14所述的方法,其中待测核酸为DNA和/或RNA。
Publications (1)
Publication Number | Publication Date |
---|---|
WO2024138419A1 true WO2024138419A1 (zh) | 2024-07-04 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5241493B2 (ja) | Dna結合タンパク質−ポリメラーゼのキメラ | |
JP6150847B2 (ja) | キメラdnaポリメラーゼ | |
JP2006513726A (ja) | Dnaポリメラーゼブレンドおよびその使用 | |
CA2581471A1 (en) | Mutant polymerases for sequencing and genotyping | |
US10351831B2 (en) | Fusion polymerases | |
JP4575160B2 (ja) | ハイブリッドタンパク質方法および組成物 | |
JP7014256B2 (ja) | 核酸増幅試薬 | |
JP2006507012A (ja) | 減少した塩基類似体検出活性を有するdnaポリメラーゼ | |
WO2024138419A1 (zh) | 具有dna聚合酶活性的多肽及其应用 | |
US20120083018A1 (en) | Thermostable dna polymerases and methods of use | |
CN114829593B (zh) | 嵌合dna聚合酶及其应用 | |
US20120135472A1 (en) | Hot-start pcr based on the protein trans-splicing of nanoarchaeum equitans dna polymerase | |
WO2023082266A1 (zh) | 嵌合dna聚合酶及其应用 | |
US20230107606A1 (en) | B-family dna polymerase variant and kit comprising the same | |
US9416352B2 (en) | Mutant Neq HS DNA polymerase derived from Nanoarchaeum equitans and its application to hot-start PCR | |
JP6798594B2 (ja) | 核酸増幅の正確性を向上させる方法 | |
JP2022550810A (ja) | 海洋性dnaポリメラーゼi | |
US20100291638A1 (en) | Thermostable dna polymerases and methods of use | |
WO2024121022A1 (en) | Variants of poly(a) polymerase and uses thereof | |
CN113637085A (zh) | 融合dna聚合酶突变体及其在等温扩增中的应用 | |
WO2020037295A1 (en) | Enhanced speed polymerases for sanger sequencing | |
JP2006197947A (ja) | エキソヌクレアーゼ活性が低減された耐熱性dnaポリメラーゼおよびその用途 | |
JPH1042872A (ja) | 改変された耐熱性dnaポリメラーゼおよびその用途 |