CN115725524A - 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 - Google Patents
羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 Download PDFInfo
- Publication number
- CN115725524A CN115725524A CN202210812801.2A CN202210812801A CN115725524A CN 115725524 A CN115725524 A CN 115725524A CN 202210812801 A CN202210812801 A CN 202210812801A CN 115725524 A CN115725524 A CN 115725524A
- Authority
- CN
- China
- Prior art keywords
- mutein
- carbonyl reductase
- cyclopentanone
- amino acid
- reaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010031132 Alcohol Oxidoreductases Proteins 0.000 title claims abstract description 74
- 102000005751 Alcohol Oxidoreductases Human genes 0.000 title claims abstract description 72
- 230000009467 reduction Effects 0.000 title abstract description 8
- 150000001875 compounds Chemical class 0.000 title description 10
- -1 cyclopentanedione compound Chemical class 0.000 claims abstract description 43
- 150000001413 amino acids Chemical class 0.000 claims abstract description 41
- BGTOWKSIORTVQH-UHFFFAOYSA-N cyclopentanone Chemical compound O=C1CCCC1 BGTOWKSIORTVQH-UHFFFAOYSA-N 0.000 claims abstract description 39
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 30
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 23
- 108010021466 Mutant Proteins Proteins 0.000 claims abstract description 16
- 102000008300 Mutant Proteins Human genes 0.000 claims abstract description 16
- 230000003197 catalytic effect Effects 0.000 claims abstract description 15
- 230000002255 enzymatic effect Effects 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 49
- 229940024606 amino acid Drugs 0.000 claims description 40
- 239000000758 substrate Substances 0.000 claims description 32
- 108091033319 polynucleotide Proteins 0.000 claims description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 29
- 239000002157 polynucleotide Substances 0.000 claims description 29
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 27
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 24
- 229960000310 isoleucine Drugs 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 18
- 108090000790 Enzymes Proteins 0.000 claims description 13
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 12
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 10
- 238000006555 catalytic reaction Methods 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 241000529919 Ralstonia sp. Species 0.000 claims description 2
- 238000009472 formulation Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- BGTOWKSIORTVQH-HOSYLAQJSA-N cyclopentanone Chemical class O=[13C]1CCCC1 BGTOWKSIORTVQH-HOSYLAQJSA-N 0.000 claims 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 abstract description 29
- CIISBNCSMVCNIP-UHFFFAOYSA-N cyclopentane-1,2-dione Chemical compound O=C1CCCC1=O CIISBNCSMVCNIP-UHFFFAOYSA-N 0.000 abstract description 14
- 210000004027 cell Anatomy 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 40
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 29
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 27
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 24
- 230000035772 mutation Effects 0.000 description 21
- 235000018102 proteins Nutrition 0.000 description 18
- 239000000047 product Substances 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- 125000003275 alpha amino acid group Chemical group 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 10
- 235000004279 alanine Nutrition 0.000 description 10
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 10
- 238000004128 high performance liquid chromatography Methods 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 239000008057 potassium phosphate buffer Substances 0.000 description 9
- 238000003259 recombinant expression Methods 0.000 description 9
- 239000002904 solvent Substances 0.000 description 9
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 8
- 239000012074 organic phase Substances 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 239000004474 valine Substances 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 7
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 7
- 235000013922 glutamic acid Nutrition 0.000 description 7
- 239000004220 glutamic acid Substances 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 238000006722 reduction reaction Methods 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- 239000004472 Lysine Substances 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 6
- 210000003527 eukaryotic cell Anatomy 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 241001052560 Thallis Species 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- WWYNJERNGUHSAO-XUDSTZEESA-N (+)-Norgestrel Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](CC)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 WWYNJERNGUHSAO-XUDSTZEESA-N 0.000 description 4
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 229960004400 levonorgestrel Drugs 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010188 recombinant method Methods 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- 239000004280 Sodium formate Substances 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Chemical group C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000011942 biocatalyst Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000005515 coenzyme Substances 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- HLBBKKJFGFRGMU-UHFFFAOYSA-M sodium formate Chemical compound [Na+].[O-]C=O HLBBKKJFGFRGMU-UHFFFAOYSA-M 0.000 description 2
- 235000019254 sodium formate Nutrition 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 2
- 229920002554 vinyl polymer Polymers 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- ZAFNJMIOTHYJRJ-UHFFFAOYSA-N Diisopropyl ether Chemical compound CC(C)OC(C)C ZAFNJMIOTHYJRJ-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- 239000012880 LB liquid culture medium Substances 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 241001489174 Ogataea minuta Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102220536821 S-phase kinase-associated protein 2_L87I_mutation Human genes 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960001701 chloroform Drugs 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000002254 contraceptive effect Effects 0.000 description 1
- 239000012084 conversion product Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- UYDJAHJCGZTTHB-UHFFFAOYSA-N cyclopentane-1,1-diol Chemical compound OC1(O)CCCC1 UYDJAHJCGZTTHB-UHFFFAOYSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 125000004989 dicarbonyl group Chemical group 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 239000000820 nonprescription drug Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000001072 progestational effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000001953 recrystallisation Methods 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000002390 rotary evaporation Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01184—Carbonyl reductase (NADPH) (1.1.1.184)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明提供了一种羰基还原酶突变体及其在环戊二酮化合物还原中的应用,具体地,本发明提供了一种羰基还原酶突变体,所述的突变蛋白为非天然蛋白,且所述突变蛋白具有催化环戊二酮化合物生成环戊酮醇的催化活性,并且所述突变蛋白在野生型的羰基还原酶的4个或4个以上的与酶催化活性相关的核心氨基酸发生突变。本发明的羰基还原酶突变体可以显著提高羰基还原酶的催化活性、提高环戊酮醇2R、3S手性产物的比例、提高环戊酮醇化合物的产率、时空产率、ee和de值。
Description
本申请是申请日为2018年5月31日、申请号为201810555674.6、发明名称为“羰基还原酶突变体及其在环戊二酮类化合物还原中的应用”的发明专利申请的分案申请。
技术领域
本发明涉及酶及酶工程领域,具体地,本发明涉及羰基还原酶突变体及其在环戊二酮类化合物还原中的应用。
背景技术
对2,2-双取代的环戊二酮的羰基不对称还原是合成许多药物关键中间体的有效途径,例如在激素类药物中的左炔诺孕酮及其羟化物。左炔诺孕酮(式I)是目前我国市场上最为常见的紧急避孕药品为单方孕激素药品——左炔诺孕酮片的有效成分(每片0.75mg或每片1.5mg),已纳入了我国的《国家非处方药药品目录》。
左炔诺孕酮的合成路线中涉及到了通过对双羰基中间体的不对称还原合成手性中间体,目前的生产路线是通过利用酿酒酵母转化制备手性中间体(路线1)。该路线的转化需要首先对酿酒酵母进行两天至三天的培养,随后加入底物乙基缩合物,而乙基缩合物的浓度为4g/L,转化时间最短的报道为3天。近几年的报道中仍然是野生菌对乙基缩合物的报道,如利用Pichia minuta CBS 1708实现乙基缩合物的转化,但是反应产物的ee值仅为90%,无法满足对立体选择性的要求。
利用野生菌进行转化不仅培养菌体时间长,而且由于野生菌中不会过量表达需要的羰基还原酶进行转化,因此催化效率低。
因此本领域迫切需要开发高效的羰基还原酶,从而实现环戊二酮类化合物,尤其是乙基缩合物的高立体选择性转化。
发明内容
本发明提供了一种高效的羰基还原酶,从而实现环戊酮醇的高立体选择性合成。
本发明第一方面提供了一种羰基还原酶突变蛋白,所述的突变蛋白为非天然蛋白,且所述突变蛋白具有催化环戊二酮类化合物生成环戊酮醇化合物的催化活性,并且所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组的四个或四个以上与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第92位谷氨酸(E);
第93位谷氨酰胺(Q);
第142位亮氨酸(L);
第144位亮氨酸(L);
第147位组氨酸(H);
第150位酪氨酸(Y);
第187位异亮氨酸(I);
第188位异亮氨酸(I);
第191位谷氨酰胺(Q);
第201位亮氨酸(L);
第204位赖氨酸(K);
第205位苯丙氨酸(F);和
第246位亮氨酸(L)。
在另一优选例中,所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第92位谷氨酸(E);
第93位谷氨酰胺(Q);
第142位亮氨酸(L);
第144位亮氨酸(L);
第147位组氨酸(H);
第150位;酪氨酸(Y);
第187位异亮氨酸(I);
第188位异亮氨酸(I);
第191位谷氨酰胺(Q);
第201位亮氨酸(L);
第204位赖氨酸(K);
第205位苯丙氨酸(F);和
第246位亮氨酸(L)。
在另一优选例中,所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第92位谷氨酸(E);
第93位谷氨酰胺(Q);
第142位亮氨酸(L);
第144位亮氨酸(L);
第147位组氨酸(H);
第150位酪氨酸(Y);
第187位异亮氨酸(I);
第188位异亮氨酸(I);
第191位谷氨酰胺(Q);
第201位亮氨酸(L);
第204位赖氨酸(K);和
第205位苯丙氨酸(F)。
在另一优选例中,所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第187位异亮氨酸(I);
第188位异亮氨酸(I);
第204位赖氨酸(K);和
第205位苯丙氨酸(F)。
在另一优选例中,所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第187位异亮氨酸(I);
第188位异亮氨酸(I);和
第205位苯丙氨酸(F)。
在另一优选例中,第91位异亮氨酸(I)突变为丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、或其组合,优选丙氨酸(A)和/或缬氨酸(V)。
在另一优选例中,所述第92位谷氨酸(E)突变为缬氨酸(V)、亮氨酸(L)、或其组合,优选缬氨酸(V)。
在另一优选例中,所述第93位谷氨酰胺(Q)突变为谷氨酸(E)、天冬氨酸(D)、或其组合,优选谷氨酸(E)。
在另一优选例中,所述第142位亮氨酸(L)突变为缬氨酸(V)、丙氨酸(A)、甘氨酸(G)、或其组合,优选缬氨酸(V)。
在另一优选例中,所述第144位亮氨酸(L)突变为丙氨酸(A)、缬氨酸(V)、或其组合,优选丙氨酸(A)。
在另一优选例中,所述第147位组氨酸(H)突变为苯丙氨酸(F)、亮氨酸(L)、或其组合,优选苯丙氨酸(F)。
在另一优选例中,所述第150位酪氨酸(Y)突变为甘氨酸(G)、丙氨酸(A)、或其组合,优选甘氨酸(G)。
在另一优选例中,第187位异亮氨酸(I)突变为苏氨酸(T)、丝氨酸(S)、或其组合,优选丝氨酸(S)。
在另一优选例中,所述第188位异亮氨酸(I)突变为亮氨酸(L)、缬氨酸(V)、或其组合,优选亮氨酸(L)。
在另一优选例中,所述第191位谷氨酰胺(Q)突变为天冬酰胺(N)、丙氨酸(A)、甘氨酸(G)、或其组合,优选天冬酰胺(N)和/或甘氨酸(G),更优选天冬酰胺(N)。
在另一优选例中,所述第201位亮氨酸(L)突变为脯氨酸(P)、丙氨酸(A)、或其组合,优选脯氨酸(P)。
在另一优选例中,所述第204位赖氨酸(K)突变为苏氨酸(T)、丝氨酸(S)、天冬氨酸(D)、或其组合,优选苏氨酸(T)。
在另一优选例中,第205位苯丙氨酸(F)突变为丙氨酸(A)、甘氨酸(G)、或其组合,优选丙氨酸(A)。
在另一优选例中,所述第246位亮氨酸(L)突变为半胱氨酸(C)、丝氨酸(S)、脯氨酸(P)、或其组合,优选半胱氨酸(C)。
在另一优选例中,所述野生型的羰基还原酶为RasADH。
在另一优选例中,所述的突变蛋白除所述突变(如91位、92位、93位、142位、144位、147位、150位、187位、188位、191位、201位、204位、205位、和/或246位)外,其余的氨基酸序列与SEQ ID NO.:1所示的序列相同或基本相同。
在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为1-10个、更佳地1-5个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突变蛋白仍具有催化生成环戊酮醇化合物的催化活性。
在另一优选例中,与SEQ ID NO.:1所示序列的同源性至少为80%,较佳地至少为85%或90%,更佳地至少为95%,最佳地至少为98%或99%。
在另一优选例中,所述突变蛋白的氨基酸序列如SEQ ID NO.:6-9中的任一所示。
在另一优选例中,所述羰基还原酶来源于Ralstonia sp.。
在另一优选例中,所述羰基还原酶的催化底物包括环戊二酮类化合物。
在另一优选例中,所述环戊二酮类化合物选自下组:
在另一优选例中,所述环戊二酮类化合物包括环戊二酮、和/或乙基缩合物。
在另一优选例中,所述羰基还原酶的突变蛋白催化环戊二酮类化合物反应生成环戊酮醇化合物。
在另一优选例中,所述的羰基还原酶的突变蛋白催化如下反应:
在另一优选例中,所述反应具有选自下组的一个或多个特点:
(i)反应体系的pH为6.0-9.0,较佳地,6.5-8,更佳地,6.5-7.5;
(ii)反应温度为20-45℃,较佳地,25-35℃,更佳地,28-32℃;
(iii)反应时间为4-24小时,较佳地,6-12小时,更佳地,6-8小时。
在另一优选例中,所述羰基还原酶的突变蛋白催化双羰基环戊二酮生成环戊酮醇化合物的催化活性为野生型羰基还原酶(SEQ ID NO.:1)的100-2000%,较佳地,1000%-2000%。
在另一优选例中,所述羰基还原酶的突变蛋白具有选自下组的一个或多个特征:
(a)与野生型的羰基还原酶相比,催化获得的环戊酮醇化合物的2R,3S手性产物的比例≥85%,较佳地,≥90%,更佳地95-99%;
(b)与野生型的羰基还原酶相比,催化获得的环戊酮醇化合物的产率≥95%,较佳地,≥98%;
(c)与野生型的羰基还原酶相比,催化获得的环戊酮醇化合物的时空产率为0.1-6g/L.h,较佳地,2-4g/L.h;
(d)与野生型的羰基还原酶相比,催化获得的环戊酮醇化合物的ee值≥95%,较佳地,>98%;
(e)与野生型的羰基还原酶相比,催化获得的环戊酮醇化合物含量>99%,并且无环戊二醇产物生成。
本发明第二方面提供了一种多核苷酸,所述的多核苷酸编码本发明第一方面所述的突变蛋白。
在另一优选例中,所述多核苷酸选自下组:
(a)编码如SEQ ID NO.:6-9任一所示的多肽;
(b)序列如SEQ ID NO.:2-5任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:2-5任一所示序列的同源性≥95%(较佳地≥98%),且编码SEQ ID NO.:1,6-9任一所示多肽的多核苷酸;
(d)与(a)-(c)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述的多核苷酸在羰基还原酶的突变蛋白的ORF的侧翼还额外含有选自下组的辅助元件:信号肽、分泌肽、标签序列(如6His)、或其组合。
在另一优选例中,所述的多核苷酸选自下组:DNA序列、RNA序列、或其组合。
本发明第三方面提供了一种载体,所述的载体含有本发明第二方面所述的多核苷酸。
在另一优选例中,所述载体包括表达载体、穿梭载体、整合载体。
本发明第四方面提供了一种宿主细胞,所述的宿主细胞含有本发明第三方面所述的载体,或其基因组中整合有本发明第二方面所述的多核苷酸。
在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞或植物细胞。
在另一优选例中,所述的宿主细胞为原核细胞,如大肠杆菌。
本发明第五方面提供了一种产生本发明第一方面所述的羰基还原酶的突变蛋白的方法,包括步骤:
在适合表达的条件下,培养本发明第四方面所述的宿主细胞,从而表达出羰基还原酶的突变蛋白;和/或
分离所述羰基还原酶的突变蛋白。
本发明第六方面提供了一种酶制剂,所述酶制剂包含本发明第一方面所述的羰基还原酶的突变蛋白。
在另一优选例中,所述的酶制剂包括注射剂、和/或冻干制剂。
本发明第七方面提供了一种制备环戊酮醇化合物的方法,包括步骤:
(i)将本发明第一方面所述的羰基还原酶的突变蛋白与反应底物接触,进行催化反应,从而获得所述环戊酮醇化合物;和
(i i)任选地,分离并纯化所述环戊酮醇化合物。
在另一优选例中,所述环戊酮醇化合物为手性环戊酮醇化合物。
在另一优选例中,在步骤(i)中,在辅因子存在下,所述羰基还原酶的突变蛋白与辅酶再生体系共同作用。
在另一优选例中,所述辅酶再生体系选自下组:葡萄糖脱氢酶/葡萄糖、甲酸脱氢酶/甲酸钠、或其组合。
在另一优选例中,所述辅因子包括:烟酰胺腺嘌呤二核苷酸磷酸氧化态(如NADP+)、和/或烟酰胺腺嘌呤二核苷酸磷酸还原态(如NADPH)。
在另一优选例中,所述反应底物为环戊二酮类化合物。
在另一优选例中,在步骤(i)中,所述催化反应的时间为2-20h,较佳地,3-10h,更佳地,6-8h。
在另一优选例中,在步骤(i)中,所述催化反应的温度为20-40℃,较佳地,25-35℃,更佳地,28-32℃。
本发明第八方面提供了一种本发明第一方面所述的突变蛋白的用途,所述的突变蛋白用于催化环戊二酮类化合物生成环戊酮醇化合物,或被用于制备催化环戊二酮类化合物生成环戊酮醇化合物的催化制剂。
本发明第九方面提供了一种本发明第一方面所述的突变蛋白或本发明第四方面所述的宿主细胞的用途,用于制备环戊酮醇化合物。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了RasADH突变体蛋白经过纯化后结果。
其中,M表示Marker,1为代表性突变体蛋白
具体实施方式
通过广泛而深入的研究,本发明人通过大量筛选,意外的筛到了可显著提高羰基还原酶的突变蛋白催化活性的关键氨基酸位点。本发明发现,对本发明的野生型的羰基还原酶中的关键位点进行改造后,可以显著提高羰基还原酶的催化活性、提高2R、3S手性产物的比例、提高环状戊酮醇化合物的产率、时空产率、ee、de值。在此基础上,本发明人完成了本发明。
术语
如本文所用,术语“AxxB”表示第xx位的氨基酸A变为氨基酸B,例如“L87I”表示第87位的氨基酸L突变为I,以此类推。
本发明突变蛋白及其编码核酸
如本文所用,术语“突变蛋白”、“本发明突变蛋白”、“本发明羰基还原酶突变蛋白”、“本方面羰基还原酶突变体”可互换使用,均指非天然存在的羰基还原酶突变蛋白,且所述突变蛋白为基于SEQ ID NO.:1所示蛋白进行人工改造的蛋白,其中,所述的突变蛋白含有与酶催化活性相关的核心氨基酸,且所述核心氨基酸中至少有一个是经过人工改造的;并且本发明突变蛋白具有催化环戊二酮类化合物形成环戊酮醇化合物的酶活性。
术语“核心氨基酸”指的是基于SEQ ID NO.:1,且与SEQ ID NO.:1同源性达至少80%,如84%、85%、90%、92%、95%、98%的序列中,相应位点是本文所述的特定氨基酸,如基于SEQ ID NO.:1所示的序列,核心氨基酸为:
第91位异亮氨酸(I);和/或
第92位谷氨酸(E);和/或
第93位谷氨酰胺(Q);和/或
第142位亮氨酸(L);和/或
第144位亮氨酸(L);和/或
第147位组氨酸(H);和/或
第150位酪氨酸(Y);和/或
第187位异亮氨酸(I);和/或
第188位异亮氨酸(I);和/或
第191位谷氨酰胺(Q);和/或
第201位亮氨酸(L);和/或
第204位赖氨酸(K);和/或
第205位苯丙氨酸(F);和/或
第246位亮氨酸(L)。
且对上述核心氨基酸进行突变所得到的突变蛋白具有催化环戊二酮类化合物形成环戊酮醇化合物的酶活性。
优选地,在本发明中,对本发明的所述核心氨基酸进行如下突变,如表1所示。
表1
位置 | 野生型 | 最优选突变体 |
突变位点1(第91位氨基酸) | I | A或V |
突变位点2(第92位氨基酸) | E | V |
突变位点3(第93位氨基酸) | Q | E |
突变位点4(第142位氨基酸) | L | V |
突变位点5(第144位氨基酸) | L | A |
突变位点6(第147位氨基酸) | H | F |
突变位点7(第150位氨基酸) | Y | G |
突变位点8(第187位氨基酸) | I | S |
突变位点9(第188位氨基酸) | I | L |
突变位点10(第191位氨基酸) | Q | N |
突变位点11(第201位氨基酸) | L | P |
突变位点12(第204位氨基酸) | K | T |
突变位点13(第205位氨基酸) | F | A |
突变位点14(第246位氨基酸) | L | C |
应理解,本发明突变蛋白中的氨基酸编号基于SEQ ID NO.:1作出,当某一具体突变蛋白与SEQ ID NO.:1所示序列的同源性达到80%或以上时,突变蛋白的氨基酸编号可能会有相对于SEQ ID NO.:1)的氨基酸编号的错位,如向氨基酸的N末端或C末端错位1-5位,而采用本领域常规的序列比对技术,本领域技术人员通常可以理解这样的错位是在合理范围内的,且不应当由于氨基酸编号的错位而使同源性达80%(如90%、95%、98%)的、具有相同或相似产生环戊二酮化合物催化活性的突变蛋白不在本发明突变蛋白的范围内。
本发明突变蛋白是合成蛋白或重组蛋白,即可以是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的突变蛋白可以是糖基化的,或可以是非糖基化的。本发明的突变蛋白还可包括或不包括起始的甲硫氨酸残基。
本发明还包括所述突变蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述突变蛋白相同的生物学功能或活性的蛋白。
本发明的突变蛋白片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的突变蛋白,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的突变蛋白,或(iii)成熟突变蛋白与另一个化合物(比如延长突变蛋白半衰期的化合物,例如聚乙二醇)融合所形成的突变蛋白,或(iv)附加的氨基酸序列融合到此突变蛋白序列而形成的突变蛋白(如前导序列或分泌序列或用来纯化此突变蛋白的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。本发明中,保守性替换的氨基酸最好根据表I进行氨基酸替换而产生。
表I
最初的残基 | 代表性的取代 | 优选的取代 |
Ala(A) | Val;Leu;Ile | Val |
Arg(R) | Lys;Gln;Asn | Lys |
Asn(N) | Gln;His;Lys;Arg | Gln |
Asp(D) | Glu | Glu |
Cys(C) | Ser | Ser |
Gln(Q) | Asn | Asn |
Glu(E) | Asp | Asp |
Gly(G) | Pro;Ala | Ala |
His(H) | Asn;Gln;Lys;Arg | Arg |
Ile(I) | Leu;Val;Met;Ala;Phe | Leu |
Leu(L) | Ile;Val;Met;Ala;Phe | Ile |
Lys(K) | Arg;Gln;Asn | Arg |
Met(M) | Leu;Phe;Ile | Leu |
Phe(F) | Leu;Val;Ile;Ala;Tyr | Leu |
Pro(P) | Ala | Ala |
Ser(S) | Thr | Thr |
Thr(T) | Ser | Ser |
Trp(W) | Tyr;Phe | Tyr |
Tyr(Y) | Trp;Phe;Thr;Ser | Phe |
Val(V) | Ile;Leu;Met;Phe;Ala | Leu |
本发明的活性突变蛋白具有催化环戊二酮类化合物形成环戊酮醇化合物的酶活性。
优选地,所述的突变蛋白如SEQ ID NO.:6,7,8,9所示。应理解,本发明突变蛋白与SEQ ID NO.:6,7,8,9所示的序列相比,通常具有较高的同源性(相同性),优选地,所述的突变蛋白与SEQ ID NO.:6,7,8,9所示序列的同源性至少为80%,较佳地至少为85%-90%,更佳地至少为95%,最佳地至少为98%,最佳地,≥99%。此外,还可以对本发明突变蛋白进行修饰。修饰(通常不改变一级结构)形式包括:体内或体外的突变蛋白的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在突变蛋白的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的突变蛋白。这种修饰可以通过将突变蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的突变蛋白。
术语“编码突变蛋白的多核苷酸”可以是包括编码本发明突变蛋白的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或突变蛋白的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的突变蛋白的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。
本发明的突变蛋白和多核苷酸优选以分离的形式提供,更佳地,被纯化至均质。
本发明多核苷酸全长序列通常可以通过PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的多核苷酸。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明的羰基还原酶具有宽广的底物谱,对一系列环戊二酮类底物均具有高的反应活性及立体选择性,尤其对乙基缩合物立体选择性高。
在本发明的一优选实施方式中,本发明所述重组羰基还原酶的制备方法为:培养如上所述的重组表达转化体,获得重组表达的羰基还原酶。其中所述的培养重组表达转化体所用的培养基为本领域任何可使转化体生长并产生本发明的重组羰基还原酶的培养基。培养方法和培养条件没有特殊的限制,可以根据宿主细胞类型和培养方法等因素的不同,按本领域常规知识进行适当的选择,只要使转化体能够生长并生产羰基还原酶即可。
在本发明的一优选实施方式中,本发明的羰基还原酶突变体(RasADH突变体)的制备方法如下:大肠杆菌作为表达宿主。
具体地,该制备方法包括以下步骤:(1)RasADH相应突变位点的基因构建到pET21a表达载体上,获得带有目的酶基因的重组质粒。(2)将重组质粒转入宿主菌细胞(优选大肠杆菌BL21(DE3)),获得相应的工程菌株。(3)将工程菌株接种至L-B培养基中,25℃培养16小时。(4)离心收集菌体,破菌留取上清液。
本发明还提供了利用RasADH及突变体重组菌作为生物催化剂转化环戊二酮的方法。具体地,将环戊二酮底物与重组菌或者破菌液、纯酶构建反应体系,利用葡萄糖脱氢酶、葡萄糖或者甲酸脱氢酶、甲酸钠实现辅因子NADPH的再生。反应体系为pH 6.0-9.0的缓冲溶液,反应温度为20℃到45℃。
待不对称还原反应结束后,反应液用等量本领域常规的水不溶性有机溶剂,如乙酸乙酯、乙酸丁酯、甲苯、二氯甲烷、三氯甲烷、异丙醚、甲基叔丁基醚等进行萃取,重复萃取两次,合并萃取液,加入无水硫酸钠干燥过夜。旋转蒸发除去溶剂,即得光学纯手性产物,进一步通过常规方法,比如减压蒸馏、重结晶等方法进行纯化即可得高度化学纯和光学纯的产物。
野生型羰基还原酶
如本文所用,“野生型羰基还原酶”是指天然存在的、未经过人工改造的羰基还原酶,其核苷酸可以通过基因工程技术来获得,如基因组测序、聚合酶链式反应(PCR)等,其氨基酸序列可由核苷酸序列推导而得到。所述野生型羰基还原酶的氨基酸序列如SEQ IDNO.:1所示。
上述涉及的野生蛋白、本发明突变蛋白的序列信息如表2(见实施例)所示。
表达载体
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明突变蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的突变蛋白。一般来说有以下步骤:
(1).用本发明的编码本发明突变蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,编码突变蛋白的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含本发明突变蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
本发明的所述羰基还原酶基因的启动子可通过一个或多个核苷酸的替换、插入或缺失而改变,但这些改变对启动子的功能没有负面影响。而且通过改变启动子的序列或使用不同来源的更有效的启动子进行完全替换,可提高所述羰基还原酶的表达水平。
本发明的所述重组表达载体可通过本领域常规方法将上述羰基还原酶基因克隆到各种载体上构建而成。所述的表达载体较佳地包括本领域常规的各种载体,如市售的质粒、粘粒、噬菌体或病毒载体等,所述载体对于大肠杆菌优选地为pET28a质粒。
本发明的主要优点包括:
(i)经大量筛选和改造,本发明首次发现了羰基还原酶的催化活性位点,改造了相关位点后,能够显著提高羰基还原酶的催化活性、提高2R、3S手性产物的比例、提高环状戊酮醇化合物的产率(等同于产量)、时空产率、以及ee值。
(ii)本发明首次发现一种能够提高对乙基缩合物,尤其是环戊二酮类化合物底物活力和立体选择性的羰基还原酶(RasADH突变体蛋白质)。
(iii)本发明的羰基还原酶具有宽广的底物谱,对一系列环戊二酮类化合物底物均具有高的反应活性及立体选择性,尤其对乙基缩合物立体选择性高。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
除非有特别说明,否则本发明实施例中的试剂和材料均为市售产品。
实施例1RasADH羰基还原酶重组表达质粒和重组表达转化体的制备
将SEQ ID No.1的序列全合成后连接到pET 28a空质粒同时用限制性内切酶BamHI和HindIII双酶切过夜,然后经琼脂糖凝胶电泳纯化、DNA试剂盒回收。将回收的酶切目的片段和空载体在T4DNA连接酶的作用下,于4℃连接12小时,得到重组质粒pET28a-RasADH,进一步转化至E.coli BL21(DE3),挑取阳性克隆,即获得重组表达转化体E.coli BL21(DE3)/pET28a-RasADH。
实施例2羰基还原酶RasADH突变体构建
构建羰基还原酶RasADH的突变库:根据RasADH的晶体结构,选取其底物结合口袋内非保守残基、底物通道氨基酸,分组进行组合饱和突变,采用简并密码子NDT设计突变引物,以pET28a-RasADH作为模板,用高保真聚合酶PrimeSTAR进行PCR。PCR反应条件如下:总体积为20μL的PCR反应体系中,加入模板0.5~20ng,10μL 2×PrimeSTAR(Premix),一对突变引物各0.4μL(10μM),加灭菌蒸馏水至20μL。PCR反应程序:(1)98℃变性10sec,(2)55℃退火5sec,(3)72℃延伸60sec,步骤(1)~(3)共进行30个循环,4℃保存产物。PCR产物经琼脂糖凝胶电泳分析验证后加入限内酶DpnI在37℃消化1h。将消化产物转入E.coli BL21(DE3)感受态细胞并涂布于含有卡那抗生素的平板中,置于37℃培养箱中静置培养约12h。将所得到的单克隆菌落挑取到96孔深孔板中进行培养,对表达的蛋白进行高通量活力筛选,对活性较高的突变体进行纯化表征,对相应的基因进行测序。
其中,代表性的突变体2的蛋白序列如SEQ ID NO.:6所示,其核苷酸序列如SEQ IDNO.:2所示。
突变体3的蛋白序列如SEQ ID NO.:7所示,其核苷酸序列如SEQ ID NO.:3所示。
突变体5的蛋白序列如SEQ ID NO.:8所示,其核苷酸序列如SEQ ID NO.:4所示。
突变体6的蛋白序列如SEQ ID NO.:9所示,其核苷酸序列如SEQ ID NO.:5所示。
表2提供本发明的具有相关活性以及较高2R,3S手性产物所占比例(%)的特定序列的羰基还原酶RasADH突变体的列表。
在下表中,序列标号分别指表1后面的一系列序列,在活性列中,一个加号“+”表示突变体蛋白比由序列表中SEQ ID No.1(野生型羧基还原酶)所示氨基酸序列组成的蛋白质的比活力提高了1~5倍;两个加号“++”表示突变体蛋白比SEQ ID No.1所示氨基酸序列组成的蛋白质的比活力提高了5~10倍,三个加号“+++”表示突变体蛋白比SEQ ID No.1所示氨基酸序列组成的蛋白质的比活力提高了10倍以上。
表2
实施例3:羰基还原酶RasADH突变体的诱导表达及纯化
配置种子液50mL,培养基为LB液体培养基(蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L),用接种环挑取基因工程菌单菌落接入培养基中,37℃,200rpm培养过夜。将过夜培养的种子液以1%的接种量转接到发酵培养基(LB培养基),37℃,200rpm培养至A600 0.6-1.0左右,加入0.25mM的IPTG,并置于37℃,200rpm诱导10~12h。4℃,6000rpm条件下离心收集菌体,用磷酸钠缓冲液(50mM,pH 7.5)清洗两遍,并用高压匀浆机破碎,13000rpm离心留取上清液,然后采用金属亲和层析(镍柱)法纯化回收目的蛋白,目的蛋白经透析除去咪唑后即得RasADH突变体纯酶液。SDS-PAGE电泳图谱显示纯化所得蛋白条带单一,如图1所示。
结果表明,本实施例的方法能够获得较纯的蛋白突变体,分子量为27KD,纯度>95%。
实施例4 RasADH突变体的底物谱
构建反应检测底物转化率及产物立体选择性:1mL,pH 7.0-7.5,浓度为100mM的磷酸钠缓冲液,0.1mM的NADP+和10mM的不同环戊二酮底物,30mM葡萄糖,0.2U葡萄糖脱氢酶,加入适量纯酶液,反应过夜后HPLC检测。产物测定方法:Aglient高效液相色谱仪,色谱柱:Daicel OD-H(3μm,4.6×150mm),流动相:正己烷-异丙醇(V/V=95:5),检测波长:254nm,柱温:30℃,流速:0.8mL/min。
结果表明,RasADH突变体能够高效的转化环戊二酮类化合物(如乙基缩合物)为2R,3S-环戊酮醇,转化产物的ee,de值均>98%。
实施例5 RasADH突变体重组菌转化环戊二酮的方法
按照实施例2的方法诱导表达本发明的RasADH突变体,离心收集菌体(8000rpm),并以磷酸钾缓冲液(pH 7.0,100mM)洗涤菌体2次,以菌体作为生物催化剂。
(1)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为20g/L,加入底物环戊二酮(10%v/v乙醇或DMF)至终浓度为10g/L,辅助底物葡萄糖30g/L,30℃,200r/min的摇床上反应,8h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率(等同于产量)为95%,时空产率为2.40g/(L.h),ee,de值均>98%。
(2)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物环戊二酮(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
(3)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物乙基缩合物(10%v/v乙醇或DMF)至终浓度为20g/L,辅助底物葡萄糖40g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为2.40g/(L.h),ee,de值均>98%。
(4)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物乙基缩合物(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
(5)取菌体重悬于1L磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物乙基缩合物(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
(6)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物环戊二酮(R取代基团为乙烯基)(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
(7)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物环戊二酮(R取代基团为乙炔基)(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
(8)取菌体重悬于10mL磷酸钾缓冲液(pH 7.0,100mM),菌体浓度为50g/L,加入底物环戊二酮(R取代基团为苯基)(10%v/v乙醇或DMF)至终浓度为40g/L,辅助底物葡萄糖60g/L,30℃,200r/min的摇床上反应,12h后停止反应。反应结束后,用乙酸乙酯萃取反应液数次,合并有机相,无水硫酸钠干燥后,减压除去溶剂。HPLC检测,产率为95%,时空产率为3.96g/(L.h),ee,de值均>98%。
具体结果见表3。
表3
结果表明,与野生型的羰基还原酶相比,本发明的羰基还原酶的突变蛋白可显著提高2R,3S-环戊酮醇的产率、时空产率、ee、de值。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (10)
1.一种羰基还原酶突变蛋白,其特征在于,所述的突变蛋白为非天然蛋白,且所述突变蛋白具有催化环戊二酮类化合物生成环戊酮醇化合物的催化活性,并且所述突变蛋白在野生型的羰基还原酶的对应于SEQ ID NO.:1的选自下组的与酶催化活性相关的核心氨基酸发生突变:
第91位异亮氨酸(I);
第187位异亮氨酸(I);
第188位异亮氨酸(I);和
第205位苯丙氨酸(F)。
2.如权利要求1所述的突变蛋白,其特征在于,所述羰基还原酶来源于Ralstonia sp.。
3.一种多核苷酸,其特征在于,所述的多核苷酸编码权利要求1所述的突变蛋白。
4.一种载体,其特征在于,所述的载体含有权利要求3所述的多核苷酸。
5.一种宿主细胞,其特征在于,所述的宿主细胞含有权利要求4所述的载体,或其基因组中整合有权利要求3所述的多核苷酸。
6.一种产生权利要求1所述的羰基还原酶的突变蛋白的方法,其特征在于,包括步骤:
在适合表达的条件下,培养权利要求5所述的宿主细胞,从而表达出羰基还原酶的突变蛋白;和/或
分离所述羰基还原酶的突变蛋白。
7.一种酶制剂,其特征在于,所述酶制剂包含权利要求1所述的羰基还原酶的突变蛋白。
8.一种制备环戊酮醇化合物的方法,其特征在于,包括步骤:
(i)将权利要求1所述的羰基还原酶的突变蛋白与反应底物接触,进行催化反应,从而获得所述环戊酮醇化合物;和
(ii)任选地,分离并纯化所述环戊酮醇化合物。
9.一种权利要求1所述的突变蛋白的用途,其特征在于,所述的突变蛋白用于催化环戊二酮类化合物生成环戊酮醇化合物,或被用于制备催化环戊二酮类化合物生成环戊酮醇化合物的催化制剂。
10.一种权利要求1所述的突变蛋白或权利要求5所述的宿主细胞的用途,其特征在于,用于制备环戊酮醇化合物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210812801.2A CN115725524A (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210812801.2A CN115725524A (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
CN201810555674.6A CN110551701B (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810555674.6A Division CN110551701B (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115725524A true CN115725524A (zh) | 2023-03-03 |
Family
ID=68697846
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810555674.6A Active CN110551701B (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
CN202210812801.2A Pending CN115725524A (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810555674.6A Active CN110551701B (zh) | 2018-05-31 | 2018-05-31 | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN110551701B (zh) |
WO (1) | WO2019228083A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110713991B (zh) * | 2018-07-13 | 2022-01-25 | 中国科学院天津工业生物技术研究所 | 羰基还原酶及其突变体在茚达特罗药物中间体合成中的应用 |
CN112852765B (zh) * | 2020-02-24 | 2021-11-12 | 中国科学院天津工业生物技术研究所 | 甲醛转化突变蛋白及其应用 |
CN111172124B (zh) | 2020-02-26 | 2022-07-22 | 复旦大学 | 一种羰基还原酶突变体及其在制备(r)-4-氯-3-羟基-丁酸酯中的应用 |
CN112852768B (zh) * | 2020-08-07 | 2021-10-08 | 中国科学院天津工业生物技术研究所 | 羰基还原酶突变体及其应用 |
CN111996176B (zh) * | 2020-10-29 | 2021-01-15 | 中国科学院天津工业生物技术研究所 | 羰基还原酶突变体及其应用 |
CN113174377B (zh) * | 2021-04-28 | 2022-11-25 | 华东理工大学 | 羰基还原酶、突变体及其在制备地尔硫卓中间体中的应用 |
CN112941043B (zh) * | 2021-05-17 | 2021-09-10 | 中国科学院天津工业生物技术研究所 | 羰基还原酶突变体及在制备手性β’-羟基-β-氨基酸酯中的应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050148057A1 (en) * | 2003-04-17 | 2005-07-07 | Daicel Chemical Industries, Ltd. | Carbonyl reductases, polynucleotides comprising DNA encoding the same, methods for producing the same, and methods for producing optically active alcohol utilizing the same |
CN104099305A (zh) * | 2014-07-18 | 2014-10-15 | 华东理工大学 | 一种羰基还原酶突变体及其基因和应用 |
CN106701698A (zh) * | 2016-11-15 | 2017-05-24 | 华东理工大学 | 羰基还原酶、突变体及其在制备抗真菌类药物中间体中的应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10767196B2 (en) * | 2011-11-30 | 2020-09-08 | Enchi Corporation | Engineering an increase in ethanol production by altering cofactor specificity |
-
2018
- 2018-05-31 CN CN201810555674.6A patent/CN110551701B/zh active Active
- 2018-05-31 CN CN202210812801.2A patent/CN115725524A/zh active Pending
-
2019
- 2019-04-12 WO PCT/CN2019/082499 patent/WO2019228083A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050148057A1 (en) * | 2003-04-17 | 2005-07-07 | Daicel Chemical Industries, Ltd. | Carbonyl reductases, polynucleotides comprising DNA encoding the same, methods for producing the same, and methods for producing optically active alcohol utilizing the same |
CN104099305A (zh) * | 2014-07-18 | 2014-10-15 | 华东理工大学 | 一种羰基还原酶突变体及其基因和应用 |
CN106701698A (zh) * | 2016-11-15 | 2017-05-24 | 华东理工大学 | 羰基还原酶、突变体及其在制备抗真菌类药物中间体中的应用 |
Also Published As
Publication number | Publication date |
---|---|
CN110551701B (zh) | 2022-08-05 |
CN110551701A (zh) | 2019-12-10 |
WO2019228083A1 (zh) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110551701B (zh) | 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用 | |
CN108239633B (zh) | 一种催化活性得到提高的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
CN112210549B (zh) | 腈水解酶突变蛋白及其在催化合成(r)-3-取代-4-氰基丁酸类化合物中的应用 | |
CN111718949B (zh) | 利用双质粒系统在蛋白中引入非天然氨基酸 | |
CN107858340B (zh) | 高催化活性的d-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用 | |
EP3943599A1 (en) | Aminoacyl-trna synthetase for efficiently introducing lysine derivative in protein | |
CN111850020B (zh) | 利用质粒系统在蛋白中引入非天然氨基酸 | |
KR102310518B1 (ko) | 시토크롬 p450 돌연변이 단백질 및 이의 응용 | |
CN105713883B (zh) | 一种l-脯氨酸-4-羟基化酶及其应用 | |
CN108239632B (zh) | 一种热稳定性得到改善的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
CN111254134B (zh) | 腈基水解酶突变体及其在(s)-单腈单酸合成中的应用 | |
CN110592035B (zh) | 一种羰基还原酶的突变体、重组表达载体及其在生产手性醇中的应用 | |
US20240035062A1 (en) | Cytochrome P450 Mutant Protein and Use Thereof | |
CN115873837A (zh) | 高表达的新型的苯丙氨酸解氨酶 | |
CN117004679A (zh) | 南极假丝酵母脂肪酶b分子进化及催化合成(s)-1,4-苯并二噁烷 | |
CN112522222B (zh) | 一种新的色氨酸羟化酶突变体及其应用 | |
CN109182286B (zh) | 一种改进的氰基还原酶及其在合成3-氯吡嗪-2甲胺中的应用 | |
CN113652409B (zh) | 一种新的甘草次酸葡糖醛酸基转移酶突变体及其应用 | |
CN112322592B (zh) | 一种参与紫草素生物合成的cyp76b100蛋白及其编码基因与应用 | |
CN110747190B (zh) | 一种马来酸水合酶突变体及其应用 | |
CN113755458B (zh) | 一种参与紫草素和/或阿卡宁生物合成的cyp82ar2蛋白及其编码基因与应用 | |
CN116948999B (zh) | 酮还原酶突变体、其组合物、生物材料及应用 | |
CN111926000B (zh) | 绞股蓝糖基转移酶及其应用 | |
CN116254252A (zh) | 苏氨酸醛缩酶及其制备方法和用途 | |
CN116334018A (zh) | 耐热还原胺化酶及其制法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |