CN116254252A - 苏氨酸醛缩酶及其制备方法和用途 - Google Patents
苏氨酸醛缩酶及其制备方法和用途 Download PDFInfo
- Publication number
- CN116254252A CN116254252A CN202211370269.XA CN202211370269A CN116254252A CN 116254252 A CN116254252 A CN 116254252A CN 202211370269 A CN202211370269 A CN 202211370269A CN 116254252 A CN116254252 A CN 116254252A
- Authority
- CN
- China
- Prior art keywords
- threonine aldolase
- amino acid
- seq
- threonine
- tanem
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010043428 Glycine hydroxymethyltransferase Proteins 0.000 title claims abstract description 99
- 102000002667 Glycine hydroxymethyltransferase Human genes 0.000 title claims abstract description 94
- 238000002360 preparation method Methods 0.000 title claims abstract description 6
- 238000000034 method Methods 0.000 claims abstract description 42
- 102220076182 rs749750052 Human genes 0.000 claims abstract description 20
- 102220041142 rs587778635 Human genes 0.000 claims abstract description 12
- 238000000338 in vitro Methods 0.000 claims abstract description 11
- 229920001184 polypeptide Polymers 0.000 claims description 59
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 59
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 59
- 230000000694 effects Effects 0.000 claims description 51
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 36
- 150000001413 amino acids Chemical group 0.000 claims description 22
- 108091033319 polynucleotide Proteins 0.000 claims description 22
- 102000040430 polynucleotide Human genes 0.000 claims description 22
- 239000002157 polynucleotide Substances 0.000 claims description 22
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 claims description 19
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 claims description 19
- 239000004471 Glycine Substances 0.000 claims description 18
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 claims description 18
- 229960001327 pyridoxal phosphate Drugs 0.000 claims description 17
- 239000000758 substrate Substances 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 17
- 230000035772 mutation Effects 0.000 claims description 13
- 230000014509 gene expression Effects 0.000 claims description 9
- 125000000539 amino acid group Chemical group 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 7
- -1 nitro, methyl Chemical group 0.000 claims description 6
- 230000003197 catalytic effect Effects 0.000 claims description 5
- 238000005882 aldol condensation reaction Methods 0.000 claims description 4
- 238000005575 aldol reaction Methods 0.000 claims description 4
- 150000003935 benzaldehydes Chemical class 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 229910052736 halogen Inorganic materials 0.000 claims description 3
- 150000002367 halogens Chemical class 0.000 claims description 3
- 125000004170 methylsulfonyl group Chemical group [H]C([H])([H])S(*)(=O)=O 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 abstract description 39
- 108090000790 Enzymes Proteins 0.000 abstract description 35
- 102000004190 Enzymes Human genes 0.000 abstract description 34
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 abstract description 29
- 102000004169 proteins and genes Human genes 0.000 abstract description 27
- 230000002194 synthesizing effect Effects 0.000 abstract description 13
- 239000004473 Threonine Substances 0.000 abstract description 12
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 abstract description 9
- 239000003814 drug Substances 0.000 abstract description 7
- 230000001976 improved effect Effects 0.000 abstract description 5
- 239000000543 intermediate Substances 0.000 abstract description 5
- 241001277524 Neptunomonas Species 0.000 abstract description 4
- 229940079593 drug Drugs 0.000 abstract description 4
- 230000009466 transformation Effects 0.000 abstract description 4
- 241000589516 Pseudomonas Species 0.000 abstract description 2
- 238000009510 drug design Methods 0.000 abstract description 2
- 238000006243 chemical reaction Methods 0.000 description 53
- 210000004027 cell Anatomy 0.000 description 39
- 238000006467 substitution reaction Methods 0.000 description 26
- 235000018102 proteins Nutrition 0.000 description 21
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 20
- 125000003275 alpha amino acid group Chemical group 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 15
- 235000001014 amino acid Nutrition 0.000 description 15
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 14
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 13
- 239000007995 HEPES buffer Substances 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 239000002773 nucleotide Substances 0.000 description 13
- 125000003729 nucleotide group Chemical group 0.000 description 13
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 11
- 229960002898 threonine Drugs 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 9
- 125000001493 tyrosinyl group Chemical class [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 9
- 239000000872 buffer Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 239000000654 additive Substances 0.000 description 7
- 150000001299 aldehydes Chemical class 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 7
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical group CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical group CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 230000000996 additive effect Effects 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 6
- 210000003527 eukaryotic cell Anatomy 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- PSVPUHBSBYJSMQ-UHFFFAOYSA-N 4-methylsulfonylbenzaldehyde Chemical compound CS(=O)(=O)C1=CC=C(C=O)C=C1 PSVPUHBSBYJSMQ-UHFFFAOYSA-N 0.000 description 5
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 5
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000010188 recombinant method Methods 0.000 description 5
- VHVGNTVUSQUXPS-UHFFFAOYSA-N 2-amino-3-hydroxy-3-phenylpropanoic acid Chemical class OC(=O)C(N)C(O)C1=CC=CC=C1 VHVGNTVUSQUXPS-UHFFFAOYSA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 229910021645 metal ion Inorganic materials 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 102220129326 rs765777463 Human genes 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 102220541496 Geminin_N18T_mutation Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 102220321637 rs377730553 Human genes 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 102220546945 ASNSD1 upstream open reading frame protein_Q39A_mutation Human genes 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- AYFVYJQAPQTCCC-STHAYSLISA-N D-threonine Chemical compound C[C@H](O)[C@@H](N)C(O)=O AYFVYJQAPQTCCC-STHAYSLISA-N 0.000 description 2
- 229930182822 D-threonine Natural products 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000003028 enzyme activity measurement method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 102220327235 rs1555462083 Human genes 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 150000003354 serine derivatives Chemical class 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- AYFVYJQAPQTCCC-HRFVKAFMSA-N L-allothreonine Chemical compound C[C@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-HRFVKAFMSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 150000001483 arginine derivatives Chemical class 0.000 description 1
- 150000003934 aromatic aldehydes Chemical class 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- HUMNYLRZRPPJDN-UHFFFAOYSA-N benzaldehyde Chemical class O=CC1=CC=CC=C1 HUMNYLRZRPPJDN-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P41/00—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
- C12P41/006—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by reactions involving C-N bonds, e.g. nitriles, amides, hydantoins, carbamates, lactames, transamination reactions, or keto group formation from racemic mixtures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/02—Aldehyde-lyases (4.1.2)
- C12Y401/02005—L-Threonine aldolase (4.1.2.5)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及苏氨酸醛缩酶及其制备方法和用途。具体地,本发明涉及一种苏氨酸醛缩酶基因编码蛋白的功能鉴定及体外定向进化。通过扩增来自海神单胞菌Neptunomonas marine的苏氨酸醛缩酶基因,基于理性设计对其进行定向进化改造,最终获得对L‑threo‑甲磺酰基苯基丝氨酸非对映选择性显著提高的苏氨酸酶突变体N18S/Q39R/Y319L。本发明的突变体可用于体外酶法合成L‑threo‑甲磺酰基苯基丝氨酸等药物中间体。本发明证实了该基因编码蛋白的功能及其在合成L‑threo‑甲磺酰基苯基丝氨酸等药物中间体中的潜力。
Description
技术领域
本发明涉及分子生物学和生物催化领域,具体涉及一种苏氨酸醛缩酶及其制备方法和用途,尤其涉及一种氨酸醛缩酶及其突变体在合成L-threo-甲磺酰基苯基丝氨酸(L-threo-MPTS)等药物中间体的应用。
背景技术
β-羟基-α-氨基酸是一类应用于化工,医药等领域的重要手性化合物。在过去几年中,生物催化已成为化学品工业生产的一种新兴工具,特别是在精细化学品和药物生产所需的手性构建块。生物催化具有反应条件温和,高立体选择性和不使用任何保护基团等特性,已经成为将经典化学和化学催化于一体的更具吸引力的手段。
苏氨酸醛缩酶能催化碳碳键的形成或裂解,产生立体化学上的纯手性产物而受到广泛关注。苏氨酸醛缩酶在自然界中普遍存在,在脊椎动物、植物、细菌、酵母和真菌中都能找到苏氨酸醛缩酶。它是一类5-磷酸吡哆醛(PLP)依赖的I型折叠酶,是在甘氨酸生物合成途径中催化L-苏氨酸或l-allo-苏氨酸裂解为甘氨酸和乙醛。其也可以通过逆向反应催化醛和甘氨酸缩合生产具有两个手性中心的氨基酸衍生物。
迄今为止,已报道的苏氨酸醛缩酶在羟醛缩合反应中存在立体选择性差、活性低和底物范围窄等问题,限制了其在β-羟基-α-氨基酸合成中的应用。因此挖掘和改造新的立体选择性好、活性高和底物范围广的醛缩酶是非常重要的研究,也能进一步应用于多种手性氨基酸药物及其前体的高效绿化合成。
鉴于现有技术的上述缺陷,本发明所需要解决的技术问题是开发一种新型苏氨酸醛缩酶(L-TAnem),用于体外酶法转化合成单一非对映体产物L-thero-甲磺酰基苯基丝氨酸以及L-threo-苯基丝氨酸衍生物。
发明内容
本发明的目的就是提供一种苏氨酸醛缩酶及其突变体。
本发明的另一目的是提供苏氨酸醛缩酶及其突变体在合成L-threo-甲磺酰基苯基丝氨酸等药物中间体的应用。
在本发明的第一方面,提供了一种苏氨酸醛缩酶,所述的苏氨酸醛缩酶选自下组:
(a)具有SEQ ID NO:2所示氨基酸序列的多肽;
(b)将SEQ ID NO:2所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的并具有苏氨酸醛缩酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NO:2所示氨基酸序列的同源性≥85%(较佳地≥95%),并具有苏氨酸醛缩酶活性的衍生多肽。
在另一优选例中,所述的苏氨酸醛缩酶的氨基酸序列如SEQ ID NO:2所示。
在另一优选例中,所述的苏氨酸醛缩酶的氨基酸序列在对应于SEQ ID NO:2所示氨基酸序列的一个或多个位点的选自下组的氨基酸残基突变:第18位、第39位、第319位。
在另一优选例中,所述的苏氨酸醛缩酶具有以下突变:N18S/Q39R/Y319L。
在本发明的第二方面,提供了一种分离的多核苷酸,所述的多核苷酸编码本发明第一方面所述的苏氨酸醛缩酶。
在另一优选例中,所述的分离的多核苷酸为选自下组的序列:
(a)编码如SEQ ID NO:2所示多肽的核苷酸序列;
(b)如SEQ ID NO:1所示的核苷酸序列;
(c)与SEQ ID NO:1所示序列的同源性≥95%(较佳地≥98%)的核苷酸序列;
(d)在SEQ ID NO:1所示核苷酸序列的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸所形成的核苷酸序列;
(e)与(a)-(d)任一所述的核苷酸序列互补(较佳地完全互补)的核苷酸序列。
在另一优选例中,所述的核苷酸的序列如SEQ ID NO:1所示。
在另一优选例中,序列如SEQ ID NO:1所示的多核苷酸编码氨基酸序列如SEQ IDNO:2所示的苏氨酸醛缩酶。
在本发明的第三方面,提供了一种载体,述的载体含有本发明第二方面所述的多核苷酸。
在另一优选例中,所述的载体包括重组载体、表达载体、整合载体。
在本发明的第四方面,提供了一种遗传工程化的宿主细胞,所述宿主细胞含有本发明第三方面所述的载体,或其基因组中整合有外源的本发明第二方面所述的多核苷酸。
在另一优选例中,所述的宿主细胞包括原核细胞和真核细胞。
在另一优选例中,所述的宿主细胞为大肠杆菌。
在本发明的第五方面,提供了一种制备本发明第一方面所述的苏氨酸醛缩酶的方法,所述方法包括:
(a)在适合表达的条件下,培养本发明第四方面所述的宿主细胞,从而表达本发明第一方面所述的苏氨酸醛缩酶;和
(b)分离表达产物,从而获得所述的苏氨酸醛缩酶。
在本发明的第六方面,提供了一种本发明第一方面所述的苏氨酸醛缩酶的用途,用于催化羟醛缩合反应或用于制备催化羟醛缩合反应的催化试剂。
在另一优选例中,所述羟醛缩合反应如下所示:
其中,
R为位于邻位、间位或对位的选自下组的一个或多个基团:卤素、硝基、甲基和甲磺酰基,
PLP为5-磷酸吡哆醛。
在本发明的第七方面,提供了一种体外制备式(I)化合物的催化方法,包括步骤:
在苏氨酸醛缩酶存在的情况下,使甘氨酸和苯甲醛衍生物为底物进行羟醛缩合反应,从而形成式I所示的氨基酸产物:
其中,
R为邻位、间位或对位的选自下组的一个或多个基团:卤素、硝基、甲基和甲磺酰基,
PLP为5-磷酸吡哆醛。
在另一优选例中,所述的苯甲醛衍生物和甘氨酸的摩尔比为0.5~2:1~100。
在另一优选例中,所述反应在亲水性有机溶剂中进行。
在另一优选例中,所述的亲水性有机溶剂为N-N二甲基酰胺(DMF)。
在另一优选例中,所述方法还包括:向反应体系中提供用于调节酶活性的添加物。
在另一优选例中,所述的用于调节酶活性的添加物是:提高酶活性或抑制酶活性的添加物。
在另一优选例中,所述的用于调节酶活性的添加物选自下组:Mn2+、K+、Ba2+、Zn2+、Mg2+、NH4 +、Ca2+、Fe2+或Fe3+、或其组合。
在另一优选例中,所述方法的5-磷酸吡哆醛(PLP)浓度条件为:1μM~100μM,优选20μM~50μM。
在另一优选例中,所述方法的pH条件为:pH 5.0~10.0,较佳地pH 7.0~pH9.0,更佳地8.0。
在另一优选例中,所述方法的温度条件为:20℃-50℃,较佳地25℃~30℃,更佳地30℃。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。
图1显示了苏氨酸醛缩酶L-TAnem纯化后SDS-PAGE电泳分析结果图。
图2显示了苏氨酸醛缩酶L-TAnem反应所需的最适pH结果图。
图3显示了苏氨酸醛缩酶L-TAnem反应所需的最适温度结果图。
图4显示了苏氨酸醛缩酶L-TAnem反应所需的最适5-磷酸吡哆醛(PLP)浓度结果图
图5显示了苏氨酸醛缩酶L-TAnem的金属离子影响活性结果图。
图6显示了苏氨酸醛缩酶L-TAnem的温度耐受性结果图。
图7显示了苏氨酸醛缩酶L-TAnem的天然底物结果图。
图8显示了苏氨酸醛缩酶L-TAnem中S16位点、N18位点、Q39位点和Y319位点饱和突变体合成L-threo-甲磺酰基苯基丝氨酸的相对活性及非对映体立体选择性结果图。
图9显示了苏氨酸醛缩酶L-TAnem中多点组合突变体合成L-threo-甲磺酰基苯基丝氨酸的相对活性及非对映体立体选择性结果图。
图10显示了苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L合成L-threo-甲磺酰基苯基丝氨酸放大反应结果图。
图11显示了苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L以非天然苯甲醛衍生物与甘氨酸为底物合成不同β-羟基-α氨基酸的活性和非对映体立体选择性的结果图。
图12显示了苏氨酸醛缩酶L-TAnem突变体合成L-threo-甲磺酰基苯基丝氨酸的HPLC和MS分析图谱。
具体实施方式
本发明人经过广泛而深入的研究,首次提供了一种苏氨酸醛缩酶及其制备方法和用途。具体地,通过扩增来自海神单胞菌Neptunomonas marine的苏氨酸醛缩酶基因,基于理性设计对其进行定向进化改造,最终获得对L-threo-甲磺酰基苯基丝氨酸非对映选择性显著提高的苏氨酸酶突变体。本发明的突变体可用于体外酶法合成L-threo-甲磺酰基苯基丝氨酸等药物中间体。在此基础上完成了本发明。
术语
为了可以更容易地理解本公开,首先定义某些术语。如本申请中所使用的,除非本文另有明确规定,否则以下术语中的每一个应具有下面给出的含义。在整个申请中阐述了其它定义。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
苏氨酸醛缩酶(L-TAnem)
苏氨酸醛缩酶L-TAnem是一类5-磷酸吡哆醛依赖的I型折叠酶,可进一步催化醛和甘氨酸缩合生产具有两个手性中心的β-羟基-α氨基酸衍生物。
在本发明中,借助已报道苏氨酸醛缩酶的序列和结构,通过在NCBI等数据库中进行非冗余性检索,基于蛋白结构相似性、保守位点分析和宿主来源多样等原则,筛选了一些候选酶基因。将筛选的基因在大肠杆菌表达系统中进行功能表达,纯化后获得纯酶。优选的苏氨酸醛缩酶为来源于Neptunomonas marine的苏氨酸醛缩酶L-TAnem,其具有广泛的底物谱,能够催化一系列醛和α-氨基酸底物生成相应的β-羟基-α-氨基酸化合物。
野生型L-TAnem核苷酸序列如SEQ ID NO:1所示,氨基酸序列如SEQ ID NO:2所示。
SEQ ID NO:1:
ATGGCTAGTAATGATTCATGTATAGAAGACACAGTGAGCTTCACCTCCGACAACATCGCGGCTGCGGCTCCGGAAATCGTGCAGGCGATGGCGCAAGCGTGTCAGGGCAATGCGCAACCGTACGGCGGAGACGCGCTGACTCAAAATGTTGAGGCACAGCTTAAGGCTATCTTCGAGTGTGACCTCCAGCTGTTCTTGGTACCGACGGGTTCGGCTGCCAACGCGATCAGCCTGGCTGCGCTCACCCCTCCGTGGGGGGCGATTTTGTGCCACCAGGAGAGCCATATTAACAACGATGAGTGCGGTGCGCCGGAATTCTTTACCGCAGGTGCCAAACTGATCGCGGTGGCGGGCACCCATGGCAAACTGGATCCGCAGGCGTTGACTCAAGCAGCGCGCAATAAACGCGGCGACGTTCACAGCGTCGAGCCGACCACCGTGAGTATTACCCAGGCAACCGAAGTTGGTTCTATCTACGCGTTGGACGAGCTGAACGAGATTGGTCAGATTTGCCGTAACGAAGGTCTGAAACTGCACATGGATGGTGCGCGTTTCGCTAACGCACTGTCTGCGCTGGGTTGTACCCCAGCTGAAATGACCTGGAAGGCAGGCGTTGATGTGCTGAGCTTTGGTGCGACTAAGAATGGTTCCCTTTGCGCCGAGGCTATCATCTTGTTCGATAAAAGCTATGCCCAAGAAATCGCGTTCCGCCGTAAACGTGGTGGCCATCTGCTGTCCAAGATGCGTTTTCTCAGCGCACAAATGCATGCGTACCTGGCGGACGACCTGTGGCTGACCAATGCCCGCCACGCGAATCTGATGGCAGCGCGTTTGGCTGCTGGCCTGTCAGCCTTGAGCCGTGTTTCGCTGATCGCGCCGACCGAAAGCAACATTATCTTCTGCCGCATGCCGACCAAGATGATTGCCGCATTACAGCAACAGGGTTTTCAGTTTTATCACGATCGTTGGGGCGACGGCATTGTTAGACTGGTCACGTCTTTCGCCACGACGCAGGCTCAAGTGGATACCTTTATCGCGGCTGCCGCGCAACTGAACCAGAACACCGAT
SEQ ID NO:2:
MASNDSCIEDTVSFTSDNIAAAAPEIVQAMAQACQGNAQPYGGDALTQNVEAQLKAIFECDLQLFLVPTGSAANAISLAALTPPWGAILCHQESHINNDECGAPEFFTAGAKLIAVAGTHGKLDPQALTQAARNKRGDVHSVEPTTVSITQATEVGSIYALDELNEIGQICRNEGLKLHMDGARFANALSALGCTPAEMTWKAGVDVLSFGATKNGSLCAEAIILFDKSYAQEIAFRRKRGGHLLSKMRFLSAQMHAYLADDLWLTNARHANLMAARLAAGLSALSRVSLIAPTESNIIFCRMPTKMIAALQQQGFQFYHDRWGDGIVRLVTSFATTQAQVDTFIAAAAQLNQNTD
如本文所用,术语“活性多肽”、“本发明的多肽”、“本发明的酶”、“苏氨酸醛缩酶”或“本发明的苏氨酸醛缩酶”或“L-TAnem”可互换使用,均指的是本发明第一方面所述的苏氨酸醛缩酶。
如本文所用,“分离的多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。
在本发明中,对氨基酸序列如SEQ ID NO:1所示的野生型苏氨酸醛缩酶进行特定位点的突变,得到了活性显著提高的相应的突变体。如本文所用,术语“突变蛋白”、“突变体”可互换使用,指的是苏氨酸醛缩酶突变体。
如本文所用,在描述突变时,以术语“N18S/Q39R/Y319L”为例,指基于SEQ ID NO:1(野生型)所示的序列,第18位N突变为S、第39位Q突变为R以及第319位Y突变为L。其他突变的描述方式与此类似。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括所述多肽的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。
本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
在本发明的活性多肽具有糖基转移酶活性,并且能够催化下述反应:
其中,R和PLP的定义如上所述。
所述的多肽优选序列为SEQ ID NO:2所示的多肽,该术语还包括具有与所示多肽具有相同功能的、SEQ ID NO:2序列的变异形式。这些变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人EGFRvA蛋白的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然人EGFRvA多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
一类优选的活性衍生物指与SEQ ID NO.:2所示氨基酸序列相比,有至多5个,较佳地至多3个,更佳地至多2个,最佳地1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。
表A
编码核酸及其组合
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO:1所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:1所示的编码区序列有差别的核酸序列。
编码SEQ ID NO:2的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的L-TAnem核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
载体
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或L-TAnem蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的苏氨酸醛缩酶L-TAnem。一般来说有以下步骤:
(1)用本发明的编码苏氨酸醛缩酶的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2)在合适的培养基中培养的宿主细胞;
(3)从培养基或细胞中分离、纯化蛋白质。
本发明中,L-TAnem多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含L-TAnem编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
宿主细胞
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
应用
本发明涉及的苏氨酸醛缩酶及其突变体的用途包括(但不限于):特异和高效地催化底物4-甲磺酰基苯甲醛或苯甲醛衍生物和甘氨酸的转化,合成L-threo-甲磺酰基苯基丝氨酸及其L-threo-苯基丝氨酸衍生物。
本发明提供了一种工业催化方法,包括:在提供苏氨酸醛缩酶存在的条件下,用本发明的苏氨酸醛缩酶将式(I)化合物转化为式(II)化合物,其中所述的酶优选为具有SEQID NO:2所示氨基酸序列以及其单点或多点突变的氨基选序列的活性多肽。
在所述方法中,还可以添加酶活性添加物(提高酶活性或抑制酶活性的添加物)。所述酶活性的添加物可以选自下组:Mn2+、K+、Ba2+、Zn2+、Mg2+、NH4 +、Ca2+、Fe2+或Fe3+、或其组合。
所述方法的pH条件为:pH5.0~10.0,优选pH 7.0~pH 9.0,更优选8.0。
所述方法的温度条件为:20℃~50℃,优选25℃~30℃,更优选30℃。
所述方法的PLP浓度条件为:1μM~100μM,优选20μM~50μM。
本发明还提供了一种组合物,它含有有效量的本发明的活性多肽或苏氨酸醛缩酶L-TAnem,以及食品学上或工业上可接受的载体或赋形剂。这类载体包括(但并不限于):水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。
所述的组合物中还可添加调节本发明的苏氨酸醛缩酶活性的物质。任何具有提高酶活性功能的物质均是可用的。
在获得了本发明的苏氨酸醛缩酶后,本领域人员可以方便地应用该酶来发挥体外酶法合成,特别是对底物4-甲磺酰基苯甲醛和甘氨酸的转化作用。
作为本发明的优选方式,还提供了形成L-threo-甲磺酰基苯基丝氨酸的方法,所述方法包括:用本发明所述的苏氨酸醛缩酶酶处理待转转化的底物,所述的底物包括4-甲磺酰基苯甲醛和甘氨酸。较佳地,在pH5.0-10条件下,用所述的苏氨酸醛缩酶处理待转转化的底物。较佳地,在温度25-50℃条件下,用所述的苏氨酸醛缩酶处理待转转化的底物。
本发明的主要优点:
1.利用本发明所述的苏氨酸醛缩酶在体外酶法合成L-threo-甲磺酰基苯基丝氨酸,对底物4-甲磺酰基苯甲醛和甘氨酸的转化率可达80%;其突变体在相同条件下,催化4-甲磺酰基苯甲醛和甘氨酸生成L-threo-甲磺酰基苯基丝氨酸的活性是野生型的1.4-1.5倍,de值提高至99%。
2.利用本发明所述的苏氨酸醛缩酶突变体成功实现了在体外酶法合成单一对映纯L-threo-甲磺酰基苯基丝氨酸。
3.本发明获得的苏氨酸醛缩酶及其突变体可用于体外酶法合成L-threo-甲磺酰基苯基丝氨酸和和L-threo-苯基丝氨酸衍生物,是区别于现有生产技术的一种新的生产方法,生产过程简化、消耗低、绿色环保。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
本发明所述的生物材料的来源的一般性说明:
1.引物合成:本发明中所使用的引物均由擎科生物公司合成制备。
2.实验中所使用的Primer STAR Max DNA聚合酶购自TakaRa公司;使用的DNA胶回收试剂盒及质粒小提试剂盒均购自Axygen公司。
实施例1苏氨酸醛缩酶的筛选
借助已报道苏氨酸醛缩酶的序列和结构,通过在NCBI等数据库中进行非冗余性检索,基于蛋白结构相似性、保守位点分析和宿主来源多样等原则,筛选得到来源于Neptunomonas marine的苏氨酸醛缩酶基因L-TAnem。该基因经过密码子优化后通过全基因合成获得,全长以NdeⅠ、XhoⅠ酶切位点克隆至pET22b(+)质粒。
实施例2苏氨酸醛缩酶表达与纯化
将上述筛选基因的重组表达质粒热休克转化至大肠杆菌BL21(DE3)感受态细胞,进行基因表达及蛋白纯化。培养重组菌浓度至OD600为0.6-0.9时,添加IPTG至终浓度为0.5mM,在低温25℃、220rpm条件下诱导培养过夜。离心收集菌体,将细胞重悬于50mM HEPES缓冲液中(pH 8.0,500mM NaCl,50mM咪唑)。250mL的培养细胞最终重悬于40mL的缓冲液中,使用高压细胞破碎仪(4~6℃,700pa)进行细胞破碎,然后细胞破碎液以12000rpm高速离心30min(4℃),收集上清液再次重复12000rpm离心30min(4℃),收集上清,利用Ni-NTA柱亲和纯化蛋白,使用50mM HEPES缓冲液中(pH 8.0,500mM NaCl,50mM咪唑)洗脱杂蛋白,最后使用50mM HEPES缓冲液中(pH 8.0,500mM NaCl,250mM咪唑)洗脱目标蛋白,洗脱目标蛋白液经过浓缩除盐得到纯化的蛋白。纯化的蛋白保存于100mM Tris-HCl缓冲液中(pH 8.0),使用12% SDS-PAGE对纯化后的蛋白进行电泳检测,使用Bradford蛋白浓度测定试剂盒(上海生工生物)测定蛋白浓度。
结果如图1所示。结果表明,在41.9kDa处得到一条清晰的条带,这表明目标蛋白L-TAnem已得到纯化。
实施例3苏氨酸醛缩酶L-TAnem酶学性质测定
使用偶联醇脱氢酶ADH测定苏氨酸醛缩酶L-TAnem的酶活。具体步骤如下:
1.苏氨酸醛缩酶L-TAnem最适pH、最适温度、最适PLP浓度和不同金属离子的测定:
分别在不同pH(5.0、6.0、7.0、7.5、8.0、8.5、9.0、10.0)下探究L-TAnem的酶活,反应体系为:10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NAD+、50mM苏氨酸。使用50mMHEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD340的变化,计算出活性。计算不同pH下的相对酶活。
结果如图2所示。结果表明,L-TAnem在pH 8.0时具有高活性。
分别在不同温度(20℃、25℃、30℃、37℃)下探究L-TAnem的酶活,反应体系为:10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH+、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD340的变化,计算不同温度反应条件下的相对酶活。
结果如图3所示。结果表明,L-TAnem在30℃时具有高活性。
分别在不同PLP(1μM、10μM、20μM、40μM、60μM、80μM、100μM)下探究L-TAnem的酶活,反应体系为:10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH+、50mM苏氨酸。使用50mMHEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD340的变化,计算不同温度反应条件下的相对酶活。
结果如图4所示。结果表明,L-TAnem在40μM浓度下具有高活性。
分别在1mM不同金属离子浓度(Mn2+、K+、Ba2+、Ni2+、Zn2+、Cu2+、Mg2+、NH4 +、Ca2+、Fe2+、Fe3+)下探究L-TAnem的酶活,反应体系为:10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mMNADH+、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD340的变化,计算不同温度反应条件下的相对酶活。
结果如图5所示。结果表明,Ni+和Cu2+对L-TAnem的活性有明显的抑制作用,其他金属离子对L-TAnem的活性影响不大。
2.苏氨酸醛缩酶L-TAnem的天然底物谱测定:
分别下探究L-TAnem对D-苏氨酸和L-苏氨酸的活性。反应体系为:10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH+、50mM苏氨酸,25℃,使用50mM HEPES(pH8.0)缓冲液将最终反应体积补足至1000μL。下监测OD340的变化,计算活性。
结果如图7所示。结果表明,L-TAnem具对L-苏氨酸具有良好的活性,对D-苏氨酸没有活性。
3.苏氨酸醛缩酶L-TAnem的热稳定性测定:
在30℃、40℃、50℃和60℃条件下孵育不同的时间(0min、5min、10min、15min、30min和60min)后探究L-TAnem的酶活,反应体系为:10μg/mL L-TAnem纯酶、5U ADH(Sigma)、0.2mM NADH+、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。
结果如图6所示。结果表明,L-TAnem具有良好的热稳定性,在50℃处理30min后其活性保持了85%左右。
实施例4苏氨酸醛缩酶L-TAnem突变体的构建及筛选
针对苏氨酸醛缩酶L-TAnem具有催化合成L-threo-甲磺酰基苯基丝氨酸的活性特征,基于L-TAnem的晶体结构、分子对接分析通过理性设计选择位点,对该酶进行定向进化改造以获得能催化合成单一非对映体L-threo-甲磺酰基苯基丝氨酸的突变体。
4.1以重组质粒pET22b-L-TAnem为模板,以带有突变位点为简并碱基(NNK)的一对互补寡核苷酸作引物,用Primestar高保真酶进行全质粒PCR扩增,获得具有特定突变位点的重组质粒。引物序列如下:
对应于SEQ NO:2中第16位丝氨酸被其它19种氨基酸取代的突变体:
S16-F:AGCTTCACCNNKGACAACATCGCGGCTGCG(SEQ ID NO:3)
S16-R:GATGTTGTCMNNGGTGAAGCTCACTGTGTC(SEQ ID NO:4)
对应于SEQ NO:2中第18位天冬酰胺被其它19种氨基酸取代的突变体:
N18-F:ACCTCCGACNNKATCGCGGCTGCGGCTCCG(SEQ ID NO:5)
N18-R:AGCCGCGATMNNGTCGGAGGTGAAGCTCAC(SEQ ID NO:6)
对应于SEQ NO:2中第39位谷氨酰胺被其它19种氨基酸取代的突变体:
Q39-F:GGCAATGCGNNKCCGTACGGCGGAGACGCG(SEQ ID NO:7)
Q39-R:GCCGTACGGMNNCGCATTGCCCTGACACGC(SEQ ID NO:8)
对应于SEQ NO:2中第140位组氨酸被其它19种氨基酸取代的突变体:
H140-F:GGCGACGTTNNKAGCGTCGAGCCGACCACC(SEQ ID NO:9)
H140-R:CTCGACGCTMNNAACGTCGCCGCGTTTATT(SEQ ID NO:10)
对应于SEQ NO:2中第319位酪氨酸被其它19种氨基酸取代的突变体:
Y319-F:TTTCAGTTTNNKCACGATCGTTGGGGCGAC(SEQ ID NO:11)
Y319-R:ACGATCGTGMNNAAACTGAAAACCCTGTTG(SEQ ID NO:12)
扩增体系为:重组质粒模板1ng、引物(10uM)各2uL、PrimeSTAR Max DNA聚合酶25uL、补充双蒸水至50uL。
扩增条件为:94℃预变性1分钟,94℃变性10秒,56℃退火35秒,72℃延伸1分钟,共30个循环。
反应结束后,以1%琼脂糖凝胶电泳检测扩增产物。产物经PCR产物纯化试剂盒纯化回收,用DpnⅠ酶(NEB公司)在37℃条件下消化回收产物2小时,降解初始模板。消化产物转化至E.coli BL21(DE3)感受态细胞,涂布到含有100ug/mL氨苄霉素LB琼脂平板上,37℃过夜培养,筛选阳性克隆,测序验证,得到苏氨酸醛缩酶L-TAnem指定位点的饱和突变体重组菌。
按照实施例2的方法得到苏氨酸醛缩酶L-TAnem指定位点的饱和突变体纯化蛋白。
突变体酶活测定反应体系为:20μg/mL L-TAnem纯酶、100mM醛、1M甘氨酸、50μMPLP、和10%(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至500μL。反应在25℃下以250rpm的速度振荡孵育0.5小时。然后取50μL反应液加入至950μL丙酮中终止反应,离心取上清,使用HPLC进行分析。
结果
结果如图8所示。从文库中共筛选出约100个克隆,获得12个阳性突变体,分别是S16G、S16A、N18T、N18S、Q39A、Q39K、Q39L、Q39R、Y319L、Y319S和Y319D。
对于S16和N18位点,所有突变体的活性都降低了(图8)。在立体选择性方面,只有S16A、S16G、N18S和N18T的de值相比野生型增加,他们的的de值分别为94.3%、94.1%、92.5%和91.1%。但与L-TAnem-WT相比,它们的活性分别降低了54.7%、74.9%、24.4%和33.3%(图8)。
对于Q39位点,有5个突变体(Q39A、Q39R、Q39K、Q39H和Q39L)的de值升高,并保持了绝大部分的活性。其中,Q39R和Q39K的活性较L-TAnem-WT分别提高3.5U/mg和8U/mg,分别达到68.3U/mg和72.8U/mg(图8)。
对于Y319位点,Y319D、Y319L和Y319S对de值均有正向影响,他们的de值分别达到94.0%、93.7%、92.7%。在活性方面,Y319D仅为L-TAnem-WT的27.5%。Y319S的活性较L-TAnem-WT提高了1.4U/mg(图8)。
4.2为了进一步提高L-TAnem的立体选择性,进行了多点组合突变。以前面得到的12个阳性突变体为模板,设计引物,用Primestar高保真酶进行全质粒PCR扩增,获得具有特定突变位点的重组质粒。引物序列如下:
对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第16位丝氨酸被丙氨酸取代的突变体:
S16A-F:AGCTTCACCGCTGACAACATCGCGGCTGCG(SEQ ID NO:13)
S16A-R:GATGTTGTCAGCGGTGAAGCTCACTGTGTC(SEQ ID NO:14)
对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第16位丝氨酸被甘氨酸取代的突变体:
S16G-F:AGCTTCACCGGCGACAACATCGCGGCTGCG(SEQ ID NO:15)
S16G-R:GATGTTGTCGCCGGTGAAGCTCACTGTGTC(SEQ ID NO:16)
对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第18位天冬酰胺被丝氨酸取代的突变体:
N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:17)
N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:18)
对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第39位谷氨酰胺被精氨酸取代的突变体:
Q39R-F:GGCAATGCGCGTCCGTACGGCGGAGACGCG(SEQ ID NO:19)
Q39R-R:GCCGTACGGACGCGCATTGCCCTGACACGC(SEQ ID NO:20)
对应于SEQ NO:2中第319位点酪氨酸被天冬氨酸取代同时第39位谷氨酰胺被精氨酸取代的突变体:
Q39R-F:GGCAATGCGCGTCCGTACGGCGGAGACGCG(SEQ ID NO:21)
Q39R-R:GCCGTACGGACGCGCATTGCCCTGACACGC(SEQ ID NO:22)
对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代同时第16位丝氨酸被丙氨酸取代的突变体:
S16A-F:AGCTTCACCGCTGACAACATCGCGGCTGCG(SEQ ID NO:23)
S16A-R:GATGTTGTCAGCGGTGAAGCTCACTGTGTC(SEQ ID NO:24)
对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被亮氨酸取代的同时,第18位天冬酰胺被丝氨酸取代的突变体:
N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:25)
N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:26)
对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被亮氨酸取代的同时,第18位天冬酰胺被苏氨酸取代的突变体:
N18T-F:ACCTCCGACACCATCGCGGCTGCGGCTCCG(SEQ ID NO:27)
N18T-R:AGCCGCGATGGTGTCGGAGGTGAAGCTCAC(SEQ ID NO:28)
对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被天冬氨酸取代的同时,第18位天冬酰胺被丝氨酸取代的突变体:
N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:29)
N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:30)
按照实施例2的方法得到苏氨酸醛缩酶L-TAnem指定位点的饱和突变体纯化蛋白。
突变体酶活测定的反应体系为:20μg/mL L-TAnem突变体、100mM醛、1M甘氨酸、50μM PLP、和10%(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至500μL。反应在25℃下以250rpm的速度振荡孵育0.5小时。然后取50μL反应液加入至950μL丙酮中终止反应,离心取上清,使用HPLC进行分析。
结果
结果如图9A所示,共获得了6个阳性双点突变体,分别为S16G/Y319L、Q39R/Y319L、N18S/Y319L、S16A/Q39R、Q39R/Y319D和S16A/Y319L。
其中,Q39R/Y319L的立体选择性最好,de值达到97.6%,比WT提高了8%。Q39R/Y319L的比活性为WT的2.0倍,达到133U/mg。同时,其他5个双突变体也较单点进一步提高了de值。其中,N18S/Y319L的de值达到96.7%,比活性达到64.4U/mg。S16A/Y319L、S16A/Q39R、Q39R/Y319D和S16G/Y319L对立体选择性也有提高,de值分别为95.9%、95.2%、96.3%和96.2%。
在双突变的基础上,进一步组合提高了L-TAnem的非对映选择性。鉴定出3个高效突变体N18T/Q39R/Y319L、N18S/Q39R/Y319L和N18S/Q39R/Y319D。它们的de值分别为98.6%、99.3%和98.5%(图9A)。N18S/Q39R/Y319L比活性达到95.7U/mg,显著高于野生型(64.8U/mg)(图9B)。
实施例5苏氨酸醛缩酶L-TAnem及其突变体合成L-threo-甲磺酰基苯基丝氨酸
针对合成L-threo-甲磺酰基苯基丝氨酸的反应体系的放大。反应条件为:15mg L-TAnem以及突变体、100mM醛、1M甘氨酸、50μM PLP、和10%(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至1L。反应在25℃下以250rpm的速度振荡孵育2.5小时。分别在不同的时间点取样50μL反应液加入至950μL丙酮中终止反应,离心取上清,使用HPLC进行分析
结果如图10所示。结果表明,反应140min后苏氨酸醛缩酶L-TAnem合成L-threo-甲磺酰基苯基丝氨酸反应的转化率达到54.8%,de值为89.1%;突变体N18S/Q39R/Y319L合成L-threo-甲磺酰基苯基丝氨酸反应的转化率达到80.1%,de值>99%。
实施例6苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L合成L-threo-苯基丝氨酸衍生物
反应条件为:1.5U L-TAnem及其突变体、100mM醛、1M甘氨酸、50μMPLP、和10%(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至1L。反应在25℃下以250rpm的速度振荡孵育2小时。分别在不同的时间点取样50μL反应液加入至950μL丙酮中终止反应,离心取上清,使用HPLC进行分析
结果如图10所示。结果表明,该苏氨酸醛缩酶对不同芳香醛底物都具有良好的活性和选择性,其中对于对位取代的底物,突变体表现出了更好的非对映体立体选择性。同时对于双取代的底物,也能表现出良好的活性。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (10)
1.一种苏氨酸醛缩酶(L-TAnem),其特征在于,所述的苏氨酸醛缩酶选自下组:
(a)具有SEQ ID NO:2所示氨基酸序列的多肽;
(b)将SEQ ID NO:2所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的并具有苏氨酸醛缩酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NO:2所示氨基酸序列的同源性≥85%(较佳地≥95%),并具有苏氨酸醛缩酶活性的衍生多肽。
2.如权利要求1所述的苏氨酸醛缩酶,其特征在于,所述的苏氨酸醛缩酶的氨基酸序列如SEQ ID NO:2所示。
3.如权利要求2所述的苏氨酸醛缩酶,其特征在于,所述的苏氨酸醛缩酶的氨基酸序列在对应于SEQ ID NO:2所示氨基酸序列的一个或多个位点的选自下组的氨基酸残基突变:第18位、第39位、第319位。
4.如权利要求3所述的苏氨酸醛缩酶,其特征在于,所述的苏氨酸醛缩酶具有以下突变:N18S/Q39R/Y319L。
5.一种分离的多核苷酸,其特征在于,所述的多核苷酸编码权利要求1所述的苏氨酸醛缩酶。
6.一种载体,其特征在于,所述的载体含有权利要求5所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,所述宿主细胞含有权利要求6所述的载体,或其基因组中整合有外源的如权利要求5所述的多核苷酸。
8.一种制备如权利要求1所述的苏氨酸醛缩酶的方法,其特征在于,所述方法包括:
(a)在适合表达的条件下,培养权利要求7所述的宿主细胞,从而表达权利要求1所述的苏氨酸醛缩酶;和
(b)分离表达产物,从而获得所述的苏氨酸醛缩酶。
9.如权利要求1所述的苏氨酸醛缩酶的用途,其特征在于,用于催化羟醛缩合反应或用于制备催化羟醛缩合反应的催化试剂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211370269.XA CN116254252A (zh) | 2022-11-03 | 2022-11-03 | 苏氨酸醛缩酶及其制备方法和用途 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211370269.XA CN116254252A (zh) | 2022-11-03 | 2022-11-03 | 苏氨酸醛缩酶及其制备方法和用途 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116254252A true CN116254252A (zh) | 2023-06-13 |
Family
ID=86679908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211370269.XA Pending CN116254252A (zh) | 2022-11-03 | 2022-11-03 | 苏氨酸醛缩酶及其制备方法和用途 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116254252A (zh) |
-
2022
- 2022-11-03 CN CN202211370269.XA patent/CN116254252A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108048417B (zh) | 酮还原酶突变体及其应用 | |
US7335471B2 (en) | Polypeptides derived from RNA polymerases and use thereof | |
CN110551701B (zh) | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 | |
CN108239633B (zh) | 一种催化活性得到提高的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
TWI479023B (zh) | 腈水合酵素變異體 | |
CN107858340B (zh) | 高催化活性的d-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用 | |
CN109402074B (zh) | 单加氧酶突变体及其应用 | |
CN113774036B (zh) | 一种亚胺还原酶突变体及其应用 | |
CN112210549B (zh) | 腈水解酶突变蛋白及其在催化合成(r)-3-取代-4-氰基丁酸类化合物中的应用 | |
JP2008517607A (ja) | 改良されたアラニン2,3−アミノムターゼおよび関連ポリヌクレオチド | |
CN112877307A (zh) | 一种氨基酸脱氢酶突变体及其应用 | |
CN105713883B (zh) | 一种l-脯氨酸-4-羟基化酶及其应用 | |
CN108239632B (zh) | 一种热稳定性得到改善的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
CN110951705B (zh) | 胺脱氢酶突变体、酶制剂、重组载体、重组细胞及其制备方法和应用 | |
CN110592035B (zh) | 一种羰基还原酶的突变体、重组表达载体及其在生产手性醇中的应用 | |
CN111100851B (zh) | 醇脱氢酶突变体及其在手性双芳基醇化合物合成中的应用 | |
CN117004679A (zh) | 南极假丝酵母脂肪酶b分子进化及催化合成(s)-1,4-苯并二噁烷 | |
CN116254252A (zh) | 苏氨酸醛缩酶及其制备方法和用途 | |
CN111254134A (zh) | 腈基水解酶突变体及其在(s)-单腈单酸合成中的应用 | |
KR101564315B1 (ko) | 신규 포름산 탈수소효소 및 이를 이용한 포름산의 생산방법 | |
CN110343728B (zh) | 一种生物转化合成六氢哒嗪-3-羧酸的方法 | |
CN109182286B (zh) | 一种改进的氰基还原酶及其在合成3-氯吡嗪-2甲胺中的应用 | |
CN116334018A (zh) | 耐热还原胺化酶及其制法和应用 | |
CN116334153A (zh) | 还原胺化酶及其制法和应用 | |
CN112538468B (zh) | 一种Perakine还原酶突变体及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |