CN114341350A - 用于制备熊脱氧胆酸的方法 - Google Patents
用于制备熊脱氧胆酸的方法 Download PDFInfo
- Publication number
- CN114341350A CN114341350A CN202080061324.XA CN202080061324A CN114341350A CN 114341350 A CN114341350 A CN 114341350A CN 202080061324 A CN202080061324 A CN 202080061324A CN 114341350 A CN114341350 A CN 114341350A
- Authority
- CN
- China
- Prior art keywords
- enzyme
- ldh
- leu
- amino acid
- asp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000008569 process Effects 0.000 title claims abstract description 27
- RUDATBOHQWOJDD-UHFFFAOYSA-N (3beta,5beta,7alpha)-3,7-Dihydroxycholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)CC2 RUDATBOHQWOJDD-UHFFFAOYSA-N 0.000 title claims abstract description 25
- RUDATBOHQWOJDD-UZVSRGJWSA-N ursodeoxycholic acid Chemical compound C([C@H]1C[C@@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)CC1 RUDATBOHQWOJDD-UZVSRGJWSA-N 0.000 title claims abstract description 25
- 229960001661 ursodiol Drugs 0.000 title claims abstract description 24
- 238000002360 preparation method Methods 0.000 title claims abstract description 15
- 102000004190 Enzymes Human genes 0.000 claims abstract description 101
- 108090000790 Enzymes Proteins 0.000 claims abstract description 101
- KXGVEGMKQFWNSR-UHFFFAOYSA-N deoxycholic acid Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 KXGVEGMKQFWNSR-UHFFFAOYSA-N 0.000 claims abstract description 58
- KXGVEGMKQFWNSR-LLQZFEROSA-N deoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 KXGVEGMKQFWNSR-LLQZFEROSA-N 0.000 claims abstract description 52
- 229960003964 deoxycholic acid Drugs 0.000 claims abstract description 52
- 230000000694 effects Effects 0.000 claims abstract description 52
- BHQCQFFYRZLCQQ-UTLSPDKDSA-N ursocholic acid Chemical compound C([C@H]1C[C@@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 BHQCQFFYRZLCQQ-UTLSPDKDSA-N 0.000 claims abstract description 30
- 102000003855 L-lactate dehydrogenase Human genes 0.000 claims description 88
- 108700023483 L-lactate dehydrogenases Proteins 0.000 claims description 88
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 34
- 241000235058 Komagataella pastoris Species 0.000 claims description 28
- 150000001413 amino acids Chemical class 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 17
- 125000003729 nucleotide group Chemical group 0.000 claims description 17
- 239000002028 Biomass Substances 0.000 claims description 13
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 13
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 13
- 229910052799 carbon Inorganic materials 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 9
- 239000008363 phosphate buffer Substances 0.000 claims description 9
- 101710088194 Dehydrogenase Proteins 0.000 claims description 8
- 238000005644 Wolff-Kishner reduction reaction Methods 0.000 claims description 8
- 229910052739 hydrogen Inorganic materials 0.000 claims description 7
- 239000001257 hydrogen Substances 0.000 claims description 7
- 238000011534 incubation Methods 0.000 claims description 6
- 108010073927 12-alpha-hydroxysteroid dehydrogenase Proteins 0.000 claims description 3
- 230000002209 hydrophobic effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 79
- 108090000623 proteins and genes Proteins 0.000 description 83
- 102000004169 proteins and genes Human genes 0.000 description 78
- 235000018102 proteins Nutrition 0.000 description 72
- 230000014509 gene expression Effects 0.000 description 61
- 238000012360 testing method Methods 0.000 description 40
- 239000000758 substrate Substances 0.000 description 39
- 108010052832 Cytochromes Proteins 0.000 description 32
- 102000018832 Cytochromes Human genes 0.000 description 32
- 229940024606 amino acid Drugs 0.000 description 31
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 30
- 239000002609 medium Substances 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 28
- 230000035772 mutation Effects 0.000 description 28
- 238000002703 mutagenesis Methods 0.000 description 26
- 231100000350 mutagenesis Toxicity 0.000 description 26
- 238000004458 analytical method Methods 0.000 description 20
- 230000036983 biotransformation Effects 0.000 description 16
- 230000012010 growth Effects 0.000 description 15
- 238000003752 polymerase chain reaction Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 238000000855 fermentation Methods 0.000 description 11
- 230000004151 fermentation Effects 0.000 description 11
- 230000001965 increasing effect Effects 0.000 description 10
- 238000003032 molecular docking Methods 0.000 description 10
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 102000004316 Oxidoreductases Human genes 0.000 description 9
- 108090000854 Oxidoreductases Proteins 0.000 description 9
- 239000003613 bile acid Substances 0.000 description 9
- 239000011942 biocatalyst Substances 0.000 description 9
- 238000004128 high performance liquid chromatography Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 9
- 241000223192 Fusarium sporotrichioides Species 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 238000002708 random mutagenesis Methods 0.000 description 8
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000008101 lactose Substances 0.000 description 7
- 238000007254 oxidation reaction Methods 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- BHQCQFFYRZLCQQ-UHFFFAOYSA-N (3alpha,5alpha,7alpha,12alpha)-3,7,12-trihydroxy-cholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 BHQCQFFYRZLCQQ-UHFFFAOYSA-N 0.000 description 6
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 6
- 239000004380 Cholic acid Substances 0.000 description 6
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- BHQCQFFYRZLCQQ-OELDTZBJSA-N cholic acid Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 BHQCQFFYRZLCQQ-OELDTZBJSA-N 0.000 description 6
- 229960002471 cholic acid Drugs 0.000 description 6
- 235000019416 cholic acid Nutrition 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000002538 fungal effect Effects 0.000 description 6
- 150000003278 haem Chemical group 0.000 description 6
- 238000013537 high throughput screening Methods 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 6
- 108010005942 methionylglycine Proteins 0.000 description 6
- 230000003647 oxidation Effects 0.000 description 6
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 6
- 210000005253 yeast cell Anatomy 0.000 description 6
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- 239000012535 impurity Substances 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 241001255830 Thema Species 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 238000007622 bioinformatic analysis Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000006285 cell suspension Substances 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 238000005580 one pot reaction Methods 0.000 description 4
- 230000020477 pH reduction Effects 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000006722 reduction reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 3
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 3
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 3
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 3
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 3
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 3
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 3
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 3
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 3
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 3
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 3
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 3
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 3
- SPKRHJOVRVDJGG-CIUDSAMLSA-N Asp-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SPKRHJOVRVDJGG-CIUDSAMLSA-N 0.000 description 3
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 3
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 3
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 3
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 3
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 3
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 3
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 3
- KEBJBKIASQVRJS-WDSKDSINSA-N Cys-Gln-Gly Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N KEBJBKIASQVRJS-WDSKDSINSA-N 0.000 description 3
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 3
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 3
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 3
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 3
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 3
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 3
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 3
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 3
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 3
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 3
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 3
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 3
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 3
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 3
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 3
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 3
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 3
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 3
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 3
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 3
- IMPKSPYRPUXYAP-SZMVWBNQSA-N His-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CN=CN3)N IMPKSPYRPUXYAP-SZMVWBNQSA-N 0.000 description 3
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 3
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 3
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 3
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 3
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 3
- KECFCPNPPYCGBL-PMVMPFDFSA-N His-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N KECFCPNPPYCGBL-PMVMPFDFSA-N 0.000 description 3
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 3
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 3
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 3
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 3
- AFERFBZLVUFWRA-HTFCKZLJSA-N Ile-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)O)N AFERFBZLVUFWRA-HTFCKZLJSA-N 0.000 description 3
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 3
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 3
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 3
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 3
- LJKJVTCIRDCITR-SRVKXCTJSA-N Leu-Cys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LJKJVTCIRDCITR-SRVKXCTJSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 3
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 3
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 3
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 3
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 3
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 3
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 3
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 3
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 3
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 3
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 3
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 3
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 3
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 3
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 3
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 3
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 3
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 3
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 3
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 3
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 3
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 3
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 3
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 3
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 3
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 3
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 3
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 3
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 3
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 3
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 3
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 3
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 3
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 3
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 3
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 3
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 3
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 3
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 3
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 3
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 3
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 3
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 3
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 210000000941 bile Anatomy 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 108010067758 ent-kaurene oxidase Proteins 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 101150006547 hdhA gene Proteins 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 3
- 150000002576 ketones Chemical class 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 108010068488 methionylphenylalanine Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000007086 side reaction Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 3
- 108010003137 tyrosyltyrosine Proteins 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- 102000000428 Lactate Dehydrogenases Human genes 0.000 description 2
- 108010080864 Lactate Dehydrogenases Proteins 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- 238000013401 experimental design Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000033444 hydroxylation Effects 0.000 description 2
- 238000005805 hydroxylation reaction Methods 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 238000006213 oxygenation reaction Methods 0.000 description 2
- 239000008055 phosphate buffer solution Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004451 qualitative analysis Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102100036826 Aldehyde oxidase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 101100179978 Arabidopsis thaliana IRX10 gene Proteins 0.000 description 1
- 101100233722 Arabidopsis thaliana IRX10L gene Proteins 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 101000608709 Caenorhabditis elegans L-lactate dehydrogenase Proteins 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000223195 Fusarium graminearum Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- -1 GCW14 Proteins 0.000 description 1
- 101150115938 GUT1 gene Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 1
- 101001036258 Homo sapiens Little elongation complex subunit 2 Proteins 0.000 description 1
- 101000626080 Homo sapiens Thyrotroph embryonic factor Proteins 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical group [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 241000316163 Jeotgalicoccus Species 0.000 description 1
- 102220564773 Killer cell immunoglobulin-like receptor 2DS5_H68D_mutation Human genes 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000186684 Lactobacillus pentosus Species 0.000 description 1
- 241000589929 Leptospira interrogans Species 0.000 description 1
- 102100039420 Little elongation complex subunit 2 Human genes 0.000 description 1
- 241000327612 Lysinibacillus sphaericus CBAM5 Species 0.000 description 1
- 206010029719 Nonspecific reaction Diseases 0.000 description 1
- 241000193804 Planococcus <bacterium> Species 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 102220570852 Protein CFAP210_L67E_mutation Human genes 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000009105 Short Chain Dehydrogenase-Reductases Human genes 0.000 description 1
- 108010048287 Short Chain Dehydrogenase-Reductases Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 101100074321 Thermus caldophilus ldh gene Proteins 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012520 frozen sample Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 125000005456 glyceride group Chemical group 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 150000007857 hydrazones Chemical class 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 101150104734 ldh gene Proteins 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 150000002696 manganese Chemical class 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 231100000243 mutagenic effect Toxicity 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000003617 peroxidasic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 238000011020 pilot scale process Methods 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 108010009004 proteose-peptone Proteins 0.000 description 1
- 230000005588 protonation Effects 0.000 description 1
- 238000012205 qualitative assay Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000003431 reductive deoxygenation reaction Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 102220003305 rs80356662 Human genes 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 238000012764 semi-quantitative analysis Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- QDRKDTQENPPHOJ-UHFFFAOYSA-N sodium ethoxide Chemical compound [Na+].CC[O-] QDRKDTQENPPHOJ-UHFFFAOYSA-N 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01176—12-Alpha-hydroxysteroid dehydrogenase (1.1.1.176)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
- C12P33/06—Hydroxylating
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01027—L-Lactate dehydrogenase (1.1.1.27)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
描述了一种用于从脱氧胆酸(DCA)开始制备熊脱氧胆酸(UDCA)的化学‑酶促方法,所述化学‑酶促方法包括制备具有用于将脱氧胆酸(DCA)转化为熊胆酸(UCA)的高7β‑羟化酶活性的酶,所述转化是所述方法的第一步。
Description
说明
发明领域
本发明涉及一种用于从脱氧胆酸(DCA)开始制备熊脱氧胆酸(UDCA)的化学-酶促方法,以及一种具有高7β-羟化酶活性的酶,用于将DCA转化为熊胆酸(UCA),所述转化是所述方法的第一步。
背景技术
熊脱氧胆酸(UDCA)是通常以少量存在于人类胆汁中的化合物,熊脱氧胆酸(UDCA)增加胆汁对于胆固醇的溶解能力。
UDCA或3α,7β-二羟基-5β-胆烷酸,具有以下式:
UDCA以其治疗特性被已知,例如在肝紊乱包括胆固醇结石、原发性胆汁性胆管炎和硬化性胆管炎的治疗中的治疗特性被已知。
因此,具有可用于工业产生UDCA的方法是非常有利的。
多于一种用于UDCA合成的化学和酶促两种类型的方法在文献中是已知的。然而,迄今,所述方法已经表现出明显的局限性,特别是在UDCA的区域选择性和最终收率方面。
因此,本发明的目的是提供用于制备UDCA的方法,该方法高效、经济并提供高收率和纯度的UDCA。
发明概述
如所附权利要求中描述的,所述目的已通过用于制备UDCA的化学-酶促方法实现。
在另一方面,本发明涉及一种具有高7β-羟化酶活性的酶,所述高7β-羟化酶活性的酶可以有利地用于所述方法的将脱氧胆酸(DCA)转化为熊胆酸(UCA)的步骤中。
在另一方面,本发明涉及一种表达载体,所述表达载体包含编码所述酶的核苷酸序列。
附图简述
本发明的特征和优势将从以下详细描述、出于说明性和非限制性目的提供的工作实施例以及通过附图变得明显,其中:
-图1示出了根据实施例鉴定用于饱和诱变测试的细胞色素的氨基酸序列的区域。呈灰色的,诱变靶残基;
-图2示出了Seq11,用组合的A和B克隆的突变重建的氨基酸序列。呈灰色的,两个突变的氨基酸;
-图3示出了不同生物催化剂载量的化学动力学:10%w/v、20%w/v、30%w/v。转化率表示为24h-48h-72h-96h中产生的UCA(ppm);
-图4示出了酶Seq73的序列。呈粗体的,根据实施例的随机诱变的残基;并且
-图5示出了细胞色素g3484序列与那些表现出7β-羟化酶活性的细胞色素序列之间的比较。
发明详述
因此,本发明的目的是具有7β-羟化酶活性并具有SEQ ID N.1的酶,其中彼此独立地:
-位置113处的氨基酸是选自A、E、F、I、L、P、Y、W和V的疏水性氨基酸;
-位置110处的氨基酸是选自R、N、Q、S和T的形成氢键的氨基酸;
-位置368处的氨基酸是I;
-位置365处的氨基酸是选自A、N、Q、S和T的形成氢键的氨基酸。
优选地,在本发明的酶中,位置113处的氨基酸是V。
优选地,在本发明的酶中,位置110处的氨基酸是R或S。
优选地,在本发明的酶中,位置365处的氨基酸是A或S。
在优选的实施方案中,本发明的酶具有SEQ ID N.2。
在最优选的实施方案中,本发明的酶具有SEQ ID N.3。
优选地,本发明主题酶的氨基酸序列具有匹配SEQ ID N.1的至少80%的序列同一性,更优选地,该氨基酸序列具有匹配SEQ ID N.1的至少85%的序列同一性。
本发明的另外的主题是一种表达载体,所述表达载体包含编码本发明的具有7β-羟化酶活性的酶的序列的核苷酸。
优选地,所述表达载体包含编码本发明的具有7β-羟化酶活性的酶的核苷酸序列SEQ ID N.11、核苷酸序列SEQ ID N.12或核苷酸序列SEQ ID N.13。
在优选的方面,本发明的酶在所述表达载体中在启动子AOX1、TEF、GUT1、GCW14、GK1或GAP,优选地启动子TEF的控制下被表达。
在本发明的优选的方面,该表达载体能够在真核细胞中自我复制。
优选地,所述酶在巴斯德毕赤酵母(P.pastoris)、大肠杆菌(E.coli)、芽孢杆菌属(Bacillus)、酿酒酵母(S.cerevisiae)、乳酸克鲁维酵母(K.lactis)或者曲霉属(Aspergillus)的细胞中被表达.
在本发明的优选的方面,所述酶在巴斯德毕赤酵母菌株中通过发酵方法被表达。
优选地,所述发酵方法在25℃至35℃优选地约30℃的温度和在6.5-7.5优选地7.0的pH的包含酪蛋白蛋白胨、酵母提取物、甘油和磷酸盐缓冲液的培养基中进行。
优选地,所述巴斯德毕赤酵母菌株选自巴斯德毕赤酵母X-33、巴斯德毕赤酵母KM71H、巴斯德毕赤酵母SMD1168H、巴斯德毕赤酵母M5(Superman5)及其组合。优选地,菌株是巴斯德毕赤酵母X-33。
可选地,本发明的主题也是具有7-β羟化酶活性和SEQ ID N.1的酶,其中彼此独立地:
-位置110处的氨基酸是选自A、E、F、I、L、P、Y、W和V的疏水性氨基酸;
-位置113处的氨基酸是选自R、N、Q、S和T的形成氢键的氨基酸;
-位置365处的氨基酸是I;
-位置368处的氨基酸是选自A、N、Q、S和T的形成氢键的氨基酸。
优选地,在本发明的酶中,位置110处的氨基酸是V。
优选地,在本发明的酶中,位置113处的氨基酸是R或S。
优选地,在本发明的酶中,位置368处的氨基酸是A或S。
本发明的另外的主题是用于制备熊脱氧胆酸(UDCA)的化学-酶促方法,所述化学-酶促方法包括以下步骤:
a)通过使用本发明具有7β-羟化酶活性的酶,将脱氧胆酸(DCA)转化为熊胆酸(UCA)。
b)通过使用12α-羟基类固醇脱氢酶(12α-HSDH)和乳酸脱氢酶(LDH),将熊胆酸(UCA)转化为12K-UDCA,以及
c)进行Wolff-Kishner还原,从而得到UDCA。
下文是本发明方法优选的实施方案的示意图:
在优选的方面,在本发明方法的步骤a)中,DCA向UCA的转化通过使用以编码本发明的具有7-β羟化酶活性的酶的表达载体转化的巴斯德毕赤酵母的生物质来实现。
优选地,在转化的步骤a)中,从巴斯德毕赤酵母(Pichia pastoris)的发酵获得的细胞被直接使用。
可选地,在所述转化步骤a)中,本发明的具有7-β羟化酶活性的酶在溶液中游离使用或固定在固体基质上,所述固体基质选自本领域已知的树脂。
所述酶通过本领域已知的细胞裂解方法裂解用本发明载体转化的细胞而获得。
在优选的实施方案中,将收集的细胞以20%最终浓度加入至100mM pH 7.00的磷酸盐缓冲液中,所述磷酸盐缓冲液含有200mM山梨醇。在搅拌下加入溶解在有机溶剂优选地DMSO中的10×DCA溶液(每升悬浮液中100ml)。
优选地,DCA的浓度是5-30g/L,更优选地是约20g/L。
优选地,将整个混合物维持搅拌48-96h,更优选地72h。
从DCA到UCA的最终转化收率百分比是约60%-65%。
在优选的方面,在本发明方法的步骤b)中,使用选自12a_988、12a_829、12a_793、12a_956和12a_698的脱氢酶12α-HSDH以及使用选自LDH_CUPNH、LDH_THECA、LDH_CAEEL、LDA_GEOSE和LDH_LACPE的乳酸脱氢酶LDH。
优选地,在步骤b)中,使用乳酸脱氢酶LDH_LACPE和脱氢酶12a_829的组合或乳酸脱氢酶LDH_LACPE和脱氢酶12a_793的组合。
在另外的优选的方面,在本发明方法步骤b)中使用的脱氢酶12α-HSDH和LDH酶可以在反应溶液中是游离的或固定在固体基质上,所述固体基质选自本领域已知的树脂。
优选地,UCA的浓度是20-50g/L,更优选地约40g/L。
在优选的方面,本发明化学-酶促方法的步骤b)在24℃-30℃的孵育温度、在0.1-1M的磷酸盐缓冲液浓度和在6.5-7.5的pH值进行。
优选地,步骤b)在约27℃的温度、在pH=7和在约1M的磷酸盐缓冲液浓度进行。
在另外的优选的方面,所使用的LDH的体积是3%-6%v/v,并且所使用的12α-HSDH的体积是3%-6%v/v。
从UCA到12K-UDCA的最终转化收率百分比几乎是全部,即>98%-99%。
在可选的实施方案中,步骤a)和b)以一锅法(one-pot)进行,即在相同的反应环境中进行,没有中间的分离步骤。
一锅法实施方案变体是其中在加入12α-羟基类固醇脱氢酶和乳酸脱氢酶之前未反应的DCA被分离的方法。
在该方法的步骤c)中,使12K-UDCA经历Wolff-Kishner还原,从而得到UDCA。
Wolff-Kishner还原是从醛或酮开始产生烷烃的还原性脱氧化学反应,并且在文献中已知数十年。因此,例如遵循Dutcher等人(“Studies on the Wolff-Kishnerreduction of steroid ketones”tuColumbia University,1939,Journal of theAmerican chemical society,第61卷)的教导或Szmant(“The Mechanism of the Wolff-Kishner Reduction,Elimination,and Isomerization Reactions”,Angew.Chem.Internat.编著,1968,第7卷,第2期)的教导,Wolff-Kishner还原也可以在本发明的上下文中实现。最初方法包括将腙与乙醇钠一起加热至约200℃,但随着时间推移在该方法中已经引入各种修改。最近,Wolff-Kishner还原使用醛或酮、KOH、肼和乙二醇在单个步骤中进行。
在可选的实施方案中,步骤a)、b)和c)以一锅法进行,即在相同的反应环境中进行,没有中间的分离步骤。
酶的制备方法、其用途及涉及该酶的合成方法的优选的方面的所有可能的组合应如本文所述和类似优选地理解。
还要理解的是,对于酶,所有被鉴定为优选的和有利的方面对于使用该酶的方法都是类似优选的和有利的。
下文是为了说明性和非限制性目的而提供的本发明的工作实施例。
实施例
选择拟枝孢镰刀菌(Fusarium sporotrichioides)的贝壳杉烯氧化酶细胞色素
g3484的候选替代物
在拟枝孢镰刀菌中鉴定的细胞色素P450(贝壳杉烯氧化酶)与数据库中记载的另外10种相似的蛋白之间做比较。
拟枝孢镰刀菌(F.sporotrichioides)中的贝壳杉烯氧化酶序列与在UniProtKB/Swiss-Prot数据库中记录的已知序列之间的匹配鉴定了100个表现出与参考酶相比在43%与98%之间的相似性的序列。
所鉴定的序列根据进化距离相互比较可以分为10个亚群,在这些亚群中的蛋白在系统发生上相关。
10个选择的序列的鉴定ID列于表1中,表明了相对于拟枝孢镰刀菌酶的相似性百分比和微生物起源。
表1.用于表达和相对于拟枝孢镰刀菌的酶的生物转化收率比较的10个选择的序列的列表。
n.d.=对整个基因组应用测序技术获得的推定基因的翻译,所述推定基因的真实活性从未通过试验被证明。
克隆与转化
订购序列并且针对在巴斯德毕赤酵母中的表达进行优化。将基因克隆在用于由甲醇诱导的启动子调控的酵母细胞内表达的载体,例如载体pPICZA中。所获得的质粒转化巴斯德毕赤酵母菌株,该菌株还能够表达操作细胞色素所必需的被鉴定为g11235的真菌辅助蛋白NAD(P)H-p450还原酶,能够为细胞色素提供完成反应所需的还原力。
每个载体选择两个克隆,在液体培养基中繁殖,并且冷冻保存,以用于表达测试。同一转化体的不同克隆之间的比较是必要的,因为与大肠杆菌等其他宿主生物体不同,表达取决于载体如何整合到基因组中,并且因此同一质粒的克隆之间的表达可能存在显著的差异。
生物转化测试
开发了呈两个步骤的生物转化测试:表达被分析细胞色素的生物质的积累和实际生物转化。在第一步中,在血红素基团的已知前体δ红氨基乙酰丙酸和巴斯德毕赤酵母表达系统所需的诱导物甲醇存在情况下,将克隆接种在富集培养基中。表达3天之后,收集生物质,以20%w/v重悬于缓冲液中,并且在以3g/L的DCA存在的情况下用于生物转化反应。
3天之后,在细胞悬浮液酸化后,利用2体积乙酸乙酯提取胆汁酸。将提取物利用分析实验室中常规使用的INERTSIL ODS-2柱,C18,250×4.6至5um,CPS分析型(目录号5020-01128)(方法EP 8.0)进行分析。
分析的细胞色素中仅4个能够将DCA转化为UCA,这表明表1中列出的蛋白1、2、3、10以相对于参考蛋白的65%至98%的相似性转化。
除蛋白10外,前三个呈现出相对于参考(表1)最高的序列相似性,并且属于同一系统发生簇;可能是经历了相似的进化过程使得它们获得了以或多或少特异性的方式将DCA识别为底物的相同能力。
在g3484细胞色素存在的情况下对DCA->UCA生物转化的分析中,发现蛋白1与拟枝孢镰刀菌的细胞色素具有非常相似的转化谱,起因于这两个序列实际上是相同的(98%相似性)。
相对于参考表现出65%的序列相似性的蛋白10,由于存在其他样品中不存在的多种杂质,产生约8%的反应收率,这些杂质是由降低细胞色素从DCA产生UCA效率的非特异性反应引起的。
细胞色素3表现出约30%的收率,没有参考反应中的过氧化化合物,但包括其他非特异性峰的出现。
蛋白2的有趣之处在于与标准的40%相比,它提供了49.7%的转化收率。优异的结果是因为在标准反应中包含过氧化分子的杂质以较小的量存在,即使存在更多的剩余未反应底物(约45%,相比之下参考为3%)。
对杂质面积百分比的分析表明,与在用鉴定的蛋白2转化的情况下的18%的面积百分比相比,在细胞色素g3484反应中,这些杂质占存在的胆汁酸的多于55%。在绝对值方面,与利用基因g3484在使用乙酸乙酯提取后获得的1200ppm的UCA相比,用新的细胞色素测量的相关产物的量是1500ppm。
因此,蛋白2在识别DCA作为底物的方面天然地比细胞色素g3484是更具选择性的,并且构成鉴定用于生物转化的最佳蛋白的更好的起点。
将样品以HPLC利用方法04 MA RS035(方法HPLC-RI 12K-UDCA)第1版进行分析,该方法提供了短保留时间化合物的改进的分辨率。观察到,与参考反应相比,包含新细胞色素的样品呈现较少的过氧化化合物。
从获得的结果清楚的是,源自禾谷镰刀菌的细胞色素2是进一步提高反应收率的最有希望的候选者。该蛋白不促进朝向不期望的产物的氧化反应,所述不期望的产物构成了在利用细胞色素g3484时导致相对较低收率的污染物,并且该蛋白直接实现大于49%的DCA->UCA的转化收率。
因此,与已知的蛋白结构进行了比较,以便应用I-TASSER预测方法定制三维计算机模型。该模型表明了哪些残基参与血红素辅基(heme prosthetic group)(通常细胞色素)的键合,以及哪些氨基酸构成与底物的键合口袋,使得确定哪些氨基酸参与形成与底物键合位点成为可能。
随后进行对接分析,这是对蛋白与所讨论的底物(DCA)之间相互作用的模拟,诸如以鉴定哪些氨基酸取代存在的氨基酸,以便获得潜在优异的酶变体用于将DCA转化为UCA。
合理诱变
对于合理诱变,利用其已知结构在RCSB-PDB数据库(Research Center forStructural Biology-Protein Data Bank)中可得的相似的蛋白作为支架,使用细胞色素2在计算机中(in silicon)对三维蛋白结构计算机建模。
突出显示的蛋白位置3和12是与OH基团键合的碳,而位置7是所讨论的羟基化的靶位置。
第一次对接分析鉴定了与底物相互作用的蛋白的残基,所述残基使得以正确取向容纳键合口袋,以引起位置7处的碳与由血红素基团铁原子激活的氧反应,血红素基团是细胞色素的特征催化中心。
表2总结了分析结果,显示了蛋白根据该模型可以与DCA接触并调节碳7的β羟基化结果的氨基酸残基。
表2.细胞色素2在键合口袋中与特定的底物原子(环的碳原子C,或取代基羟基基团OH)相互作用的氨基酸残基的列表。Va1301可能与血红素基团的位置相关,调节其反应性。
氨基酸残基 | 底物 |
Arg113 | 12C处的-OH |
Arg220 | 12C处的-OH |
Glu110 | 12C处的-OH |
Phe123 | 2C |
Leu212 | 7C |
Met485 | 7C |
Leu300 | 4C |
Thr116 | 3C处的-OH |
His117 | 3C处的-OH |
Arg370 | 24C |
Asp217 | 24C |
Leu365 | 24C |
Leu366 | 24C |
Ala216 | 24C |
Val301 | 血红素 |
特别重要的是靠近位置12处的羟基基团的氨基酸,因为对接研究观察到,在键合口袋中的底物使其β侧面对血红素时,位置12处的羟基基团与生物催化剂之间的氢键促进碳7的β处氧化。
随机诱变
作为合理诱变的备选的常用的定向进化测试方法是随机诱变,随机诱变利用分子生物学技术在已知序列中引入随机突变,并且产生无法先验定义的酶变体。
易错PCR
易错PCR能够利用通常以高精度延伸DNA序列的PCR(聚合酶链式反应)分子生物学技术在选择的DNA序列中引入随机突变。改变反应条件,例如通过引入锰盐或改变dNTP的浓度,诱导反应中的DNA聚合酶在DNA聚合期间利用不正确的核苷酸,导致在延伸的DNA序列中引入突变。
Ep-PCR是定向进化测试中常用的技术,用于获得编码具有与野生型不同氨基酸的蛋白的参考核苷酸序列的变体,以便根据预期的用途赋予初始蛋白新的和潜在的更感兴趣的特性。
该技术能够产生编码具有随机突变的蛋白的序列池,在商业载体pPICZA中克隆,用于由甲醇诱导的启动子调控的酵母细胞内表达。所获得的质粒被用于转化先前选择的菌株,该菌株还能够表达称为g11235的真菌辅助蛋白NAD(P)H-p450还原酶,该还原酶由于提供完成反应的还原力而是细胞色素功能所必需的。将克隆用于表达和生物转化测试。
饱和诱变
除了ep-PCR提供的随机诱变测试外,还在饱和条件下进行了更加靶向的随机诱变测试。利用直到该时间点从分子对接所获得的数据,鉴定蛋白与底物接触的两个区域,从而有望在与用ep-PCR测试相比更受限制的区域进行随机诱变测试。
鉴定用于饱和诱变测试的细胞色素氨基酸序列的区域示于图1中,其中指示了靶诱变残基。
将细胞色素序列与前一步骤中表现出7β-羟化酶活性的细胞色素序列进行比较,观察到这些区域是保守的(图5),而细胞色素2的残基Glu110、Arg113、Leu365、Ala368表现出几乎不保守的取代,包括空间体积(steric bulk)或电荷与细胞色素2残基不同的氨基酸。考虑到所比较的4种蛋白表现出不同的生物转化谱和收率,这些不同的残基可能在定义酶促性能方面起着重要作用。因此,选择它们进行饱和诱变测试,这预测4个残基中的每一个都被所有其他20个L-氨基酸取代,获得204个可能的不同序列组合进行试验。
将细胞色素2序列作为PCR反应模板,其中将该序列在具有与4个残基中的每一个相关的简并的引物存在的情况下进行扩增,因此仅在四个选择的位置中引入随机突变。
用于引入最大可能数目的突变,将获得终止密码子的可能性降低至最小的引物如下:
EVAR位点(SEQ ID N.4)
LLGAFR位点(SEQ ID N.5)
获得了序列池,克隆在通过由甲醇诱导的启动子调控的酵母细胞内表达的商品化载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株,该菌株还能够表达真菌辅助蛋白NAD(P)H-p450还原酶。
表达和生物转化测试
从使用由随机诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于在巴斯德毕赤酵母中表达和生物转化的HTS测试,利用小型化系统,使用24孔微孔板(2ml培养基/孔)用于细胞生长和96深孔微孔板用于生物转化步骤,诸如以降低工作体积并且能够同时对多个克隆(每次测试多达192个克隆)进行宽谱筛选。
进行总计10次表达和生物转化测试,因此实现总计960个克隆的分析。
生长步骤包括在浓度为2%(v/v)的诱导物(甲醇)的存在下,在缓冲培养基中,以每个微孔板的孔一个克隆进行的接种。生长3天之后,将细胞糊状物通过离心与耗尽的培养基分离,并在以20%wwcp/V重悬于反应缓冲液中并且加入DCA底物至3g/L的最终浓度后用于准备生物转化测试。
反应3天之后,在细胞悬浮液酸化后利用2体积甲醇提取总胆汁酸。提取物的分析利用INERTSIL ODS-2柱,C18,250×4.6至5um,CPS分析型(目录号5020-01128),(方法EP8.0)来进行。
从分析的960个克隆中,2个被鉴定为表现出感兴趣的性能。克隆A实现60.6%的转化收率,获得1820ppm的UCA和850ppm的未转化底物的剩余物(29%剩余物)。相反,克隆B实现65%的转化,获得1950ppm的产物和700ppm的未反应DCA(23.3%)。
突变分析
使获得的两个突变经历测序,以鉴定哪些核苷酸取代以及因此氨基酸序列中的哪些突变被引入。分析表明,克隆A表达其中位置368处的丙氨酸残基已经被来自异亮氨酸的残基突变(Ala368->Ile368)的酶,而由克隆B表达的单加氧酶表现出精氨酸残基被来自缬氨酸的残基的突变(Arg113->Val113)。将两个突变的残基定位在用于先前部分中描述的饱和诱变的靶区域中。第一对接分析结果将这些位点鉴定为底物与蛋白之间相互作用的区域。氨基酸侧链的电荷或极性的改变以及空间体积的变化改变与蛋白底物的键合位点,允许底物在键合口袋中的改进的容纳并且因此优化反应是可能的。
由于PCR反应,两个突变组合到单个序列中,称为seq11(SEQ ID N.2)。
由该核苷酸序列编码的蛋白序列示于图2中。
将新的核苷酸序列克隆在由甲醇诱导的启动子调控的酵母细胞内表达的商品化载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株,该菌株还能表达真菌辅助蛋白NAD(P)H-p450还原酶。
利用3g/L的DCA的蛋白表达和生物转化测试(根据下文描述的方案)确认了利用克隆B实现的收率,即65%收率。这两个突变被证明是相容的,因此使用Seq11(SEQ ID N.2)作为模板,产生相对于已引入的突变具有加性效应的其他突变,以实现预定的目的。
第二诱变周期
Seq11是第二突变周期的起点。注意不仅要消除不想要的副反应(collateralreactions),例如在酶修饰的第一步期间,而且要降低可能的底物抑制,诸如增加反应中DCA的浓度,以便实现对该方法的工业化步骤有用的转化。
利用来自对接分析的数据,第二诱变周期集中在生物信息学分析中鉴定的某些位置上,这些位置不仅对增加底物与蛋白之间的亲和力是重要的,而且对消除可能产生用于DCA的第二个键合口袋的残基也是重要的。生物信息学的底物-细胞色素相互作用模型鉴定了潜在的第二区域的存在,在那里DCA可以定位自身,从而阻碍进入活性位点。
表3列出了根据至少三种对接模型的比较可能参与形成与DCA的第二键合位点的主要残基。
表3.参与用于多于一种对接模型中蛋白与DCA之间的相互作用的第二位点形成的残基的列表。
残基 | 位置 |
组氨酸 | 83 |
谷氨酸 | 110 |
精氨酸 | 220 |
亮氨酸 | 365 |
甘氨酸 | 367 |
精氨酸 | 370 |
观察到,这些残基远离一级蛋白序列,但在酶具有决定其活性的三级结构时,这些残基在附近。
选择这些残基作为饱和诱变测试的靶,这包括将表3中列出的6个残基中的每个用所有其他20个L-氨基酸取代,获得206个可能的不同序列组合进行测试。利用Seq11作为PCR反应模板,其中将序列在具有与6个残基中的每一个相关的简并的引物存在的情况下进行扩增,诸如以仅在6个选择的位置中引入随机突变。
下文描述了用于引入最大可能数目的突变,将获得终止密码子的可能性降低至最小的引物。
在下文列出的引物中,4个含氮碱基使用传统的缩写表示,而其他字母具有以下含义:
A=腺嘌呤
C=胞嘧啶
G=鸟嘌呤
T=胸腺嘧啶
R=G A(嘌呤)
Y=T C(嘧啶)
K=GT(酮)
M=A C(氨基)
S=G C(强键)
W=A T(弱键)
B=G T C(除A外的全部)
D=G A T(除C外的全部)
H=A C T(除G外的全部)
V=G、C、A(除T外的全部)
N=A G C T(全部)
Glu110(SEQ ID N.6)
His83(SEQ ID N.7)
Arg220(SEQ ID N.8)
GIFR位点(SEQ ID N.9)
Leu365(SEQ ID N.10)
将获得的序列池克隆在由甲醇诱导的启动子调控的酵母细胞内表达的商用载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株,该菌株还能表达真菌辅助蛋白NAD(P)H-p450还原酶。
表达和生物转化测试
从利用如本文以上部分中描述的诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于在巴斯德毕赤酵母表达和生物转化的HTS测试,利用24孔微孔板(2ml培养基/孔)用于细胞生长和96深孔微孔板用于生物转化步骤的小型化系统,诸如以降低工作体积并且能够同时对多个克隆(每次测试多达192个克隆)进行宽谱筛选。
进行总计6次表达和生物转化测试,因此分析总计多于1000个克隆。
生长步骤包括在浓度为2%(v/v)的诱导物(甲醇)的存在下,在缓冲培养基中,以每个微孔板的孔一个克隆进行的接种。生长3天之后,将细胞糊状物通过离心与耗尽的培养基分离并且在以20%wwcp/V重悬于反应缓冲液中后用于准备生物转化测试。与初始筛选相比,所提供的底物浓度从3g/L增加至5g/L,诸如以满足两个要求:从方法的工业化的角度出发,选择能够转化显著量DCA的酶,以及不因所讨论的胆汁酸的溶解性差而使小体积筛选变得困难。
反应3天之后,在细胞悬浮液酸化后利用2体积甲醇提取总胆汁酸。提取物的分析通过PCA分析实验室中常规使用的INERTSIL ODS-2柱,C18,250×4.6至5um,CPS分析型(目录号5020-01128)(方法EP 8.0)来进行。
与来自第一诱变周期的最佳克隆的1950ppm的产物相比,在所分析的克隆中,一个被鉴定,称为克隆73,相对于350ppm未反应底物能够产生4500ppm的UCA。与在先处理步骤期间获得的65%收率相比,该突变的酶实现90%的收率。
与第一次诱变的最佳克隆相比增加的收率是DCA消耗更大和关于底物选择性增加二者的结果,导致过氧化杂质减少。测量结果显示,未反应底物的降低,以及对应于可能比所需产物极性更强的化合物的峰面积的降低二者。
突变体分析
使克隆73经历测序,以鉴定在诱变周期期间引入的核苷酸取代。与模板(Seq11)和野生型序列(蛋白2)相比,由这些取代产生的氨基酸序列报道于表4中。在描述的处理步骤期间引入了两个突变:位置110处的谷氨酸残基被丝氨酸残基突变,并且位置365处的亮氨酸残基被丝氨酸残基突变。
表4.诱变之前(ICE2)、第一诱变周期之后(Seq11)以及第二诱变周期之后(Seq73)的序列的比较。浅灰色指示第一诱变之后突变的残基,深灰色指示第二次诱变之后突变的残基。
残基的极性、电荷和空间体积的改变改变酶的三维结构、促进DCA进入活性位点并且增加蛋白对所讨论的底物的亲和力是可能的。特别地,位置110处的谷氨酸用丝氨酸的取代可能消除了该谷氨酸与位置220处的精氨酸残基之间的盐桥,至少部分地修饰了DCA与蛋白之间的第二键合口袋,这是先前鉴定的底物抑制作用的原因。
来自连续诱变周期的突变总和不仅导致实现了70%的最小反应收率(步骤4定义的最终目标),而且还通过实现了90%的转化百分比超过了这一数值。诱变活性也部分地消除底物引起的抑制作用,使羟基化底物超过2g/L成为可能,这构成了第一诱变周期结束时的最大转化极限。
发酵的优化
扩大发酵规模的第一个关键步骤是消除甲醇,甲醇在用于所讨论的细胞色素的表达的商业巴斯德毕赤酵母系统中被用作表达的指示物,以避免易燃性和毒性问题。
因此,作为AOX启动子的替代,对4个启动子进行测试,这些启动子被用于异源蛋白在选择的宿主系统中的组成型表达。将酵母使用产生的4种新的载体转化,并且在无甲醇培养基中表达3天之后,获得的生物质用于DCA的生物转化反应。从反应混合物中提取的胆汁酸的HPLC分析能够鉴定启动子1为调控所讨论的蛋白质表达的最佳选择。
进行从HT筛选步骤期间利用的3ml培养基至锥形烧瓶中的100ml培养基的转变。在富集培养基中,在96h的总发酵中实现120g/L的生物质产生。
第二个扩大步骤包括从锥形瓶培养基至2L发酵罐的转变。这是重要的步骤,并且已经指示在中试规模上可预见的发酵罐收率,因为有可能控制培养中酵母生长的基本参数,包括pH、温度和氧合。在向酵母提供营养的碳源和蛋白提取物和/或水解物、维生素和辅助因子的存在的情况下(这些维生素和辅助因子不仅是生长所需的,而且是细胞色素异源表达所需的),在缓冲盐水培养基中评价替代的工业原料也是可能的。
然后应用旨在组合不同的蛋白提取物和水解物,同时评价48个生长条件和随后表达的实验设计。
应用的实验设计能够鉴定最佳的组分组合作为锥形瓶中富集培养基的替代,特别是消除合成复杂蛋白如细胞色素所必需的纯辅助因子的加入,该加入在工业发酵中难以经济维持。
所得到的培养基不仅使用工业组分维持了富集培养基实现的收率(125gwcp/L),而且时间也减半:最大产量在发酵的48h,而不是96h,被实现。
增加DCA载量
所产生的生物质以20%w/v在5g/L、10g/L、20g/L、30g/L的DCA标量浓度在反应中被利用。
孵育3天之后,将反应通过HPLC分析(表5)进行评价,生物质也转化10g/L底物,产生90%的收率,直到该时间点实现载量加倍。
表5.增加的底物载量测试的HPLC分析。在10g/L时,维持90%的转化收率。
样品 | UCA | 剩余的DCA | 转化收率 |
5 | 4.9g/L | n.d. | 99% |
10 | 9.7g/L | 0.15g/L | 90% |
20 | 12.5g/L | 6.8g/L | 62% |
30 | 8.9g/L | 20g/L | 29% |
如表5中示出的,在反应中DCA增加至高于10g/L之后,转化收率降低:在两个诱变周期中引入的突变确实降低了酶底物抑制,但没有完全消除它。然而,应该注意的是,在20g/L载量,实现12.5g/L的UCA的最大浓度,并且收率的下降仅归因于未反应底物的积累,而不是由于在使用原始酶最初发生的不期望的氧化的产物。
反应动力学分析
反应动力学通过制备三种不同浓度的湿细胞糊状物(wcp),具体地10%w/v、20%w/v和30%w/v,利用初始20g/L的DCA来评价。在连续的间隔提取胆汁酸以评价反应的发展。
如图3中示出,在72h以20%w/v的生物质实现了最大转化。在较高浓度的生物催化剂,较长的时间尺度不改进收率,而较低浓度的酶不允许实现所需的性能。
与使用游离酶的反应相比,相对高的生物催化剂百分比可以归因于细胞色素的复杂性,所述细胞色素锚定至细胞膜上并依赖于辅助蛋白,该辅助蛋白也整合至细胞膜上,以用于正确操作以及底物和胆汁产物通过细胞膜渗透的需要。
生物催化剂的稳定性
进行了生物催化剂(生物质)稳定性测试,评价参数包括:稳定剂(甘油或山梨醇)的不存在或存在、保存温度(具体地-80℃、-20℃、4℃和25℃)和保存时间(7天、14天、30天)。
在10g/L的DCA存在的情况下,利用不同条件下保存的生物质评价稳定性,并且表示为生物转化收率。
反应产物的比较表明,在4℃保存的酶的性能维持稳定多达14天,无需加入稳定剂。30天之后,生物催化剂经历活性的部分减少,因此最大储存可以预见保存多达发酵后回收细胞团之后的14天至15天(在4℃至6℃)(可能根据更详细的随后评价,在14天至30天的时间范围内)。
最佳12α-HSDH候选者的选择
考虑到迄今使用的芽孢杆菌种(Bacillus sp)的12α-HSDH(ID数据库:A3IBN0)在所需的反应中表现出优异的性能,该酶的序列是用于选择数据库中可得的那些范围内的其他潜在的12α-HSDH的起点。用于选择候选者采用的策略是维持与所用序列最大可能的相似性,假定相似的氨基酸序列会诱导相似的二级和三级结构,并且因此赋予不同蛋白相同的特性和在匹配条件下相同的行为。
在UniProtKB/Swiss-Prot数据库中对与目前使用的序列最相似的序列的目录学研究导致表6中列出的蛋白的选择。
表6.选择用于在大肠杆菌中表达的12α-HSDH的列表。相似性表示为与芽孢杆菌种的12α-HSDH(ID数据库:A3IBN0被描述为“预测的短链脱氢酶”)相比的氨基酸序列相似性的百分比。
69%至98.8%的相似性范围的选择表示在与迄今已经给出优异结果的蛋白的高相似性和足够的多样性之间的良好折衷。
最佳LDH候选者的选择
兔肌肉乳酸脱氢酶的异源表达总是导致比12α-HSDH更多的问题。这可能是错误的折叠问题和随后溶解度/活性降低的后果,这是真核蛋白在宿主细菌的表达期间频繁遇到的。
因此,LDH新品种的选择策略是基于微生物大肠杆菌的异源表达的便利性,因此选择提供最少复杂可能的四级结构的细菌来源序列或蛋白,以及基于与迄今使用的蛋白相关和在新候选者之间两者的最大的序列多样性,诸如从数据库中存在的所有乳酸脱氢酶亚类中选择一个代表性的,并且不依赖于1.6-二磷酸果糖和热稳定性。
用于表达选择的酶列于表7中。
表7.用于在大肠杆菌中表达选择的LDH的列表。
两种蛋白LDH_GEOSE和LDH_THECA表现出相对于数据库中记录的序列的突变,因为这些修饰赋予1.6-二磷酸果糖的不依赖性。特别地LDH_GEOSE表现出突变R104C、Q189L、N293S,而序列LDH_THECA表现出6个突变,具体地L67E、H68D、E178K、A235R、R173Q和R216L,这些突变显著增加蛋白的热稳定性。
相反,列表中的其他酶在野生型形式已经不依赖效应子。
对序列之间进化距离的分析表明,选择的蛋白除了表示LDH的不同亚类外,在进化上也是弱相关的,这表明评价进化以适应不同条件并因此表现出不同特性的酶的可能性。
制备合成基因
编码选择的酶的基因在经历用于在作为宿主选择的微生物中表达的优化之后进行化学合成。优化算法利用遗传密码的简并来构思核苷酸序列,所述核苷酸序列尽管编码与所需蛋白的相同的蛋白,但能够在选择的表达系统中转录和优化翻译,稳定信使RNA,促进核糖体键合,并且消除诱导翻译过早中断的区域。
表达载体的克隆
在第一个操作步骤中选择的五个LDH和五个12α-HSDH的编码序列分别总结于表8和表9中。
表8.用于在大肠杆菌中表达的选择的LDH的列表
名称 | 生物体 | 功能 | 数据库ID |
LDH_CUPNH.Ec | 钩虫贪铜菌 | LDH | Q07251 |
LDH_LACPE.Ec | 戊糖乳杆菌 | LDH | P56511 |
LDH_GEOSE.Ec | 嗜热脂肪芽孢杆菌 | LDH | P00344_mut6A |
LDH_THECA.Ec | Thermus caldophilus | LDH | P06150_mutQ4P2 |
LDH_CAEEL.Ec | 秀丽隐杆线虫 | LDH | Q27888 |
表9.用于在大肠杆菌中表达的选择的12α-HSDH的列表
名称 | 生物体 | 功能 | 数据库ID |
12a_988.Ec | 球形赖氨酸芽孢杆菌CBAM5 | 氧化还原酶 | W7S3E4 |
12a_956.Ec | 纺缍形赖氨酸芽孢杆菌ZC1 | 短链DH | D7WVF0 |
12a_829.Ec | 沙氏芽孢杆菌 | 氧化还原酶 | A0A0Q3WK25 |
12a_793.Ec | 动性球菌属亚种L10.15 | 氧化还原酶 | A0A0K9SYS7 |
12a_698.Ec | Jeotgalicoccus亚种13MG44_air | 应激蛋白39 | A0A078M324 |
将针对使用大肠杆菌作为宿主进行优化之后合成的基因克隆在用于细胞质表达的特异性载体(pET21 12a_988)中,该载体表现出可使用乳糖或合成类似物例如IPTG(异丙基β-d-1-硫代半乳糖吡喃糖苷)诱导的启动子,并且赋予氨苄青霉素抗性。
转化与LDH表达测试
使用构建的载体转化异源表达通常使用的超生产型大肠杆菌菌株。还转化了先前通过hdhA基因缺失制备的菌株(菌株ΔhdhA),该基因编码导致不想要的副反应的内源酶7α-HSDH。每个菌株的转化克隆在选择性液体培养基中繁殖,并且然后以不同量冷冻保存。这些样品代表所有随后表达测试的起点。
使用获得的甘油酯的初步测试在最小培养基中通过由乳糖诱导进行。在蛋白的预期分子量在32.8kDa(LDH_THECA)与36.8kDa(LDH_CUPNH)之间时,表达的定性和半定量分析使用SDS-PAGE(十二烷基硫酸钠存在下的聚丙烯酰胺凝胶电泳)进行。鉴于表达与所用的大肠杆菌类型无关,测试表明,所用的菌株不是限制性参数。进行的测试表明,对于被分析的5种酶中的任何酶,超产菌株与对应的缺失菌株之间的比较在表达上不存在明显差异。
为了优化表达,在实验室规模(最终体积=50ml)测试可能促进蛋白表达的不同条件。为此目的,所有的测试都在环境温度进行。
特别地,考虑以下变量:
培养基:标准和优化;
诱导物浓度(乳糖):2g/L或10g/L;
诱导时所处的生长期:指数期或稳定期;
搅拌:250rpm或150rpm。
无论测试条件如何,LDH_CUPNH、LDH_THECA和LDH_LACPE都实现良好的过表达水平。
但是,在LDH_GEOSE和LDH_CAEEL的表达中观察到较大的变异性。
对列出的变量的所有组合的评价能够鉴定提供所有感兴趣的LDH酶最有利表达的条件,即优化的培养基、在指数期期间使用2g/L乳糖诱导以及以250rpm搅拌。
纯化和溶解度
乳酸脱氢酶应用机械裂解方法来纯化,包括在去污剂存在的情况下使用超声处理细胞,以促进膜的溶解。使可溶性级分(合适地与不溶性级分分离)经历使用SDS-PAGE的首次定性分析。
对应于酶LDH_LACPE、LDH_CAEEL和LDH_CUPNH的条带在聚丙烯酰胺凝胶上是可见的,包括第一种酶的更强的条带,因此它是五种感兴趣的蛋白中最可溶的。相反,酶LDH_GEOSE和LDH_THECA是不可见的。
酶活性
应用先前开发的“UV Bict LDH”方法对酶进行滴定。标准测试条件包括在环境温度,pH7的100mM磷酸盐缓冲液中孵育酶。
测量的活性水平示于表10中。
表10.以单位/ml表示的细胞裂解物的活性。还报道了用于标准生物转化中的乳酸脱氢酶兔肌肉的LDH样品(LDH.A)(批次LDH010111/4)的活性,。
LDH | 活性(U/ml) |
LDH.A | 225±4.6 |
LDH_CAEEL | 290±1.2 |
LDH_CUPNH | 47±11.5 |
LDH_GEOSE | 20±0.7 |
LDH_LACPE | 2830±45 |
LDH_THECA | 4±1.1 |
在定性分析中最可溶的酶,LDH_LACPE,在标准条件下表现出更大的活性。较低的溶解度也与较低的活性对应,如对于酶LDH_GEOSE和LDH_THECAL观察到的。
滴定是在标准条件下体外建立的活性值。因此,评价LDH在目标反应条件下的性能是有必要的,因为这些条件可能正面地或负面地影响每种特定蛋白的活性。
12α-HSDH的转化及表达测试
与LDH的情况一样,使用构建的载体转化异源表达通常使用的超生产型大肠杆菌菌株,包括菌株ΔhdhA。每个菌株的转化克隆在选择性液体培养基中繁殖,并且然后冷冻保存。这些冷冻样品代表所有随后表达测试的起点。
在最小培养基上用乳糖诱导的初步试验表明,12α-HSDH表达的基本参数是宿主菌株。
可能的是,表达诱导除ROS菌株外的所有细胞过度应激,因此ROS菌株被选择作为随后测试的最佳菌株。
对于每一个ROS转化子,还产生了具有内源7α-HSDH缺失的形式,目的是作为没有与预期相关的副反应的表达菌株偶然使用。
与对LDH表达执行的操作相匹配,对12α-HSDH进行了ROS菌株的优化表达,在实验室规模(最终体积=50ml)测试了可以促进可溶形式蛋白表达的不同条件下。为此目的,所有的测试都在环境温度进行,评价不同的诱导物(乳糖或IPTG)、诱导时所处的生长步骤(指数或固定)和培养基(标准或优化)。
在优化的培养基中在指数期乳糖诱导下获得了最佳表达,并且其他酶也获得了类似的结果。
纯化和溶解度
12α-HSDH利用机械裂解方法来纯化,包括使用超声处理细胞,以及随后分离可溶性和不可溶性级分。利用SDS-PAGE的第一分析表明,在通过细胞超声纯化后,所有蛋白均是可溶性的,在可溶性级分中所有条带均是可见的。
酶促活性
将酶使用先前定义的方法“Uv Bict 12α-HSDH”进行滴定。标准测试条件包括在环境温度,在pH8.5的100mM磷酸盐缓冲液中孵育酶。
表11显示了获得的值,包括用于标准反应的酶Ox111(批次12A010113/1)的活性。
表11.以单位/ml表示的细胞裂解物的活性。同时还报道了用于标准生物转化的酶12α-HSDH Ox111(批次12A010113/1)样品的活性。
12a-HSDH | 活性(U/ml) |
Ox111 | 1380±28 |
12a_988 | 716±38 |
12a_956 | 525±23 |
12a_829 | 406±56 |
12a_793 | 55±2.3 |
12a_698 | 70±0.7 |
根据体外滴定,与酶Ox111相比,所有表达的蛋白表现出较低的活性。然而,酶的性能在反应条件下可以不同,这取决于结构和蛋白活性如何受与体外那些相比的反应参数差异的影响。
还观察到,根据先前进行的测试,胆酸向12k-CDCA生物转化中的限制因素不是12α-HSDH的活性,而是辅助因子NAD+/NADH的循环反应,并且因此影响乳酸脱氢酶(LDH)的性能。因此,可能的是,通过优化后一种酶,新的12α-HSDH变体相对于标准酶(Ox111)的较低活性不会负面地影响反应收率。
生物转化
为了鉴定在新的LDH与新的12α-HSDH之间在收率方面最有利的组合,根据表12中列出的因子设计实施初步测试。将所有五种乳酸脱氢酶与五种12α-HSDH的每一种组合,利用在Bict应用的小型化系统,该小型化系统能够对很小的体积(1ml)执行高通量筛选(HTS),同时分析不同的参数。作为对照,反应也与酶LDH.A和OX111组合实施。
表12.所有感兴趣的6种LDH(5种新的和对照LDH.A)与所有感兴趣的6种12α-HSDH(5种新的和对照Ox111)的组合。
反应在标准条件下进行。
20h之后,根据“在12K-CDCA的氧化法”(Method Ox of CA at 12K-CDCA)利用HPLC分析对生物转化收率进行验证。表13呈现了以色谱面积百分比表示的剩余胆酸值。
表13.以色谱面积百分比表示的剩余胆酸。
在标准条件下,没有组合实现与两种标准酶LDH.A和Ox111的收率相当的收率,剩余底物面积百分比是约50%,而仅LDH_CAEEL实现至少80%的转化。表9显示,在这两种酶之间,是乳酸脱氢酶调节收率,考虑到在相同的LDH下,不管利用的12α-HSDH如何,剩余胆酸获得相似的值。即使是在体外最有前途的LDH,在反应条件下也给出了非常糟糕的结果。
限制因素:LDH与酶稳定性
考虑到调节酶促活性的重要因素之一是蛋白在反应条件下的稳定性,随后对各乳酸脱氢酶的剩余活性进行了体外滴定,在标准条件下(T=30℃,pH8)的反应混合物中孵育。
表14显示了从反应混合物中取样后的特定时间(1h、4h、20h)记录的活性值(U/ml)。
表14.在随后时间在反应混合物中孵育后,使用“Method Uv-Bict LDH”测量的滴度。表中的值表示为单位/ml(U/ml)。
0h | 1h | 4h | 20h | |
CAEEL | 290 | 109.5 | 74.4 | 61.3 |
CUPNH | 47 | 57.3 | 43.7 | 65.3 |
GEOSE | 20 | 16.1 | 38.2 | 61 |
THECA | 4 | 17.1 | 33 | 52.3 |
LDH.A | 225 | 82.9 | 103 | 80.4 |
LACPE | 2830 | 36 | 39 | 50 |
表14显示,真核蛋白(LDH_LDH.A和LDH_CAEEL)在一小时后失去其活性的多于60%,并且酶滴度在随后数小时内保持不变。LDH_CUPNH、LDH_GEOSE和LDH_THECA是稳定的,但活性保持太低,不能实现目标收率。虽然LDH_LACPE表现出远高于其他蛋白的初始滴度,但在一小时之后活性急剧下降,证明其在感兴趣的生物转化中极其不稳定。
因此,明显的是,标准条件不适用于所选择的五种乳酸脱氢酶的活性,特别是在体外视为表现的最有希望的一种,LDH_LACPE。
限制因素:LDH和pH
标准反应分析的主要参数是pH值:蛋白氨基酸质子化的不同状态可以调节其三维结构,并且因此调节其活性。
平行实施反应,其中将Ox111由不同的LDH与在每种情况下确定的辅助因子循环系统关联,对每种酶组合测试3个pH,pH=7.5、pH=7和pH=6.5。20h之后,LDH的剩余活性利用““Method Uv-Bict LDH”来滴定。
获得的实验结果表明,乳酸脱氢酶变体在反应混合物中孵育后相对不稳定,特别是在较低的pH值相对不稳定。唯一的例外是l’LDH_LACPE,它的稳定性随着反应环境酸度的增加而增加。这一行为得到了文献数据的支持,其中该酶的最佳pH是5.5,并且这可能解释了尽管与其他滴定剂相比体外蛋白滴度高,但生物转化收率低。
根据“从CA至12K-CDCA氧化法”(Method Ox from CA to 12K-CDCA),利用HPLC分析确定中性和酸性pH值的生物转化收率。
如预测的,LDH_LACPE的稳定性随着pH减少而增加,并且反应收率也增加,由50%的转化(pH8)转变至约93%的转化(pH7)。可能的是,在pH 6.5,收率低于中性条件下的收率,因为Ox111的活性成为限制;已知12α-HSDH变体表现出碱性最佳pH(约8)。
相反,另一种LDH转移到酸性条件表现出性能恶化。
12α-HSDH的选择
在鉴定了最佳LDH和改进其性能的条件后,努力选择能够实现至少与OX111相当的收率的12α-HSDH。
在LDH_LACPE活性更加稳定的pH值(pH7、pH6.5、pH6),与每一个替代OX111的12α-HSDH组合,实施平行反应。
在30℃20h之后,将样品根据“从CA至12K-CDCA氧化法”处理和分析。
最佳收率使用酶LDH_LACPE与12a_829或12a_793获得,这表现出与对照Ox111收率相当的值,但仅在pH7,这表示LDH的最佳酸性pH与12α-HSDH的碱性pH值之间的良好折衷。
优化击中
使给出最佳收率的组合LDH_LACPE/12α-HSDH_829和LDH_LACPE/12α-HSDH_793经历优化,以便接近所需的目标(剩余胆酸低于0.5%)。
因此,实施反应,不同的参数包括:孵育温度(30℃/24℃)、LDH体积(6%v/v或3%v/v)、12α-HSDH体积(3%v/v或6%v/v)和pH7磷酸缓冲液的浓度(1M或0.1M)。收率应用“从CA至12K-CDCA氧化法”进行评价。
考虑仅使用100mM浓度的磷酸盐缓冲液实现目标,表15中的所得值显示区分要素是发生反应的磷酸盐缓冲液的摩尔浓度。可以注意的是,与标准相比,LDH的浓度可以减半,因为可能在这些条件下,酶是非常活跃的,并且大大过量。
表15.使用12a_829和12a_793的反应优化过程中的反应收率。报告的值被理解为HPLC分析色谱中剩余胆酸的面积百分比。Std:[LACPE]=6%V/V,[12α-HSDH]=3%V/V,12A_2X:[12α-HSDH]=6%V/V,[LACPE]=6%V/V;LDH_0.5X:[LACPE]=3%V/V,[12α-HSDH]=3%V/V
根据对小体积(1ml)筛选和优化步骤期间获得的数据,进行了扩大测试,在200ml的反应体积中重现最佳条件。生物转化完成之后,将产物使用HPLC进行纯化和分析。
考虑到在筛选步骤期间两种酶12a_829和12a_793返回相似的结果,对它们均进行了测试。
HPLC分析返回如下剩余胆酸的面积值百分比:
12a_829=0.466
12a_793=0.657
发现对小规模选择的参数使用较大的体积实现所需收率也是可能的,并且12a_829是两种选择中较好的酶。
样品制备
利用以上本文描述的菌株和最佳条件,将酶LDH_LACPE、12A_829和12A_793在实验室规模(500ml锥形瓶)的发酵方法中进行表达。
将蛋白根据以上描述方法进行纯化。然后,细胞裂解物形式的酶以25%v/v重悬于甘油中,以便实现改进的蛋白和滴度稳定性。
另外的诱变
如上文观察到的,进行的两个诱变循环产生了两个进行的突变体,其中最后一个(Seq73)表现出几乎完全消除氧化化合物,并且利用多达10g/L的DCA底物的约90%转化。
对该酶的结构生物信息学分析揭示了许多其他任选的突变以便潜在增加性能,可能以便进一步降低底物抑制(作用于酶三维结构中所谓的“第二口袋”)。
因此,利用生物信息学分析期间收集的信息,对所有潜在有用的突变进行了进一步的考虑,以产生另外的改进。
利用从对接分析导出的数据,本工作针对生物信息学分析鉴定对不仅增加底物与蛋白之间的亲和力而且对消除可能产生用于DCA的第二个键合口袋的残基重要的某些位置。
表16列出了根据至少三种对接模型的比较可能参与与DCA形成第二个键合位点的主要残基。
表16.在多于一种对接模型中参与蛋白与DCA之间第二相互作用位点形成的残基的列表。
残基 | 位置 |
苯丙氨酸 | 60 |
丙氨酸 | 64 |
组氨酸 | 83 |
亮氨酸 | 86 |
精氨酸 | 220 |
甘氨酸 | 367 |
精氨酸 | 370 |
赖氨酸 | 390 |
图4清楚地示出了蛋白的氨基酸序列中包含的感兴趣的残基:它们在一级线性序列彼此远离,但在生物催化剂折叠之后,它们都靠近与底物相互作用的区域。底物-细胞色素相互作用的生物信息学模型鉴定第二区域的可能存在,在那里DCA可以定位自身,因此阻止进入实际的活性位点,并且从而降低酶的性能。
选择所述残基作为用于饱和诱变测试的靶,这旨在将所有6个残基用所有其他19个L-氨基酸取代,得到196种用于测试的潜在的不同序列组合。使用Seq11作为PCR反应模板,其中将序列在具有影响8个残基的每一个的简并的引物存在的情况下进行扩增,以便仅在8个选择的位置中引入随机突变。使用5种不同的引物引入最大可能的突变数,将获得终止密码子的可能性降低至最小。
将获得的序列池克隆在以上本文描述的用于由组成型启动子调控的酵母细胞内表达的载体中被,因此消除商业载体中预见的甲醇作为诱导物的使用,但难以在工业规模上应用于发酵(易燃性和毒性风险)。利用所获得的质粒转化先前选择的巴斯德毕赤酵母菌株,该菌株也能够表达真菌辅助蛋白NAD(P)H-p450还原酶。
表达和生物转化测试
从使用由随机诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于HTS表达和生物转化测试,利用24孔微孔板小型化系统(2ml培养基/孔)用于细胞生长的和96深孔微孔板用于生物转化步骤,诸如以降低操作体积,并且能够同时对不同克隆(每次测试多达192个克隆)进行宽谱筛选。
进行总计5次表达和生物转化测试,实现总计960个克隆的分析。
生长步骤包括在缓冲培养基中以每个微孔板的孔一个克隆进行的接种。生长3天之后,将细胞糊状物通过离心与耗尽的培养基分离并且随后以20%wwcp/V重悬于反应缓冲液中,并且加入20g/L最终浓度的DCA底物,用于准备生物转化测试。
反应3天之后,在细胞悬浮液酸化后使用2体积甲醇提取总胆汁酸。提取物的分析使用INERTSIL ODS-2柱,C18,250×4.6至5um,CPS分析型(目录号5020-01128)来进行。
在分析的960个克隆中,在小规模HTS测试中,没有一个克隆表现出比原始克隆更好的性能,但鉴定出提供与阳性对照相比相似性能的三个克隆(P2B1、P5C3、P8D5)。
然后,将鉴定的3个克隆在具有100ml培养基的500ml锥形瓶中在更大规模测试,诸如以改进培养物的氧合度,氧合度是最大调节巴斯德毕赤酵母生长的参数之一。以这种方式,以下是可能的:评价在最佳生长和表达条件下,克隆是否会产生提供优于野生型收率的突变的细胞色素,或者尽管提供相似的性能,克隆是否可能在随着时间的推移产生的生物质方面表现出优异的生长。从工业应用的角度来看,考虑到生物催化剂包含在生物质自身中,对于感兴趣的细胞色素的同等表达,具有尽可能快速生长的酵母克隆是有利的,诸如限制发酵时间并且因此限制成本。
生长3天之后,将细胞糊状物通过离心与耗尽的培养基分离并且随后以20%wwcp/V重悬于反应缓冲液中,并且加入20g/L最终浓度的DCA底物,用于准备生物转化测试。与表达Seq73的酵母克隆相比,这三个克隆没有表现出更高的生长速度。
序列表
<110> 艾希易股份公司
<120>用于制备熊脱氧胆酸的方法
<130> ADV00459PTITWO
<160> 13
<170> BiSSAP 1.3.6
<210> 1
<211> 513
<212> PRT
<213> 未知(Unknown)
<220>
<223> 蛋白2
<400> 1
Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu
1 5 10 15
Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu
20 25 30
Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro
35 40 45
Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala
50 55 60
Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr
65 70 75 80
Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe
85 90 95
Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala
100 105 110
Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser
115 120 125
Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu
130 135 140
Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn
145 150 155 160
His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu
165 170 175
Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly
180 185 190
Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr
195 200 205
Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg
210 215 220
Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val
225 230 235 240
Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp
245 250 255
Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser
260 265 270
Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys
275 280 285
Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His
290 295 300
Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln
305 310 315 320
Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser
325 330 335
Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp
340 345 350
Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ala
355 360 365
Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val
370 375 380
Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn
385 390 395 400
Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu
405 410 415
Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser
420 425 430
Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro
435 440 445
Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met
450 455 460
Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser
465 470 475 480
Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met
485 490 495
Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp
500 505 510
Glu
<210> 2
<211> 513
<212> PRT
<213> 未知(Unknown)
<220>
<223> 蛋白11
<400> 2
Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu
1 5 10 15
Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu
20 25 30
Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro
35 40 45
Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala
50 55 60
Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr
65 70 75 80
Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe
85 90 95
Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala
100 105 110
Val Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser
115 120 125
Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu
130 135 140
Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn
145 150 155 160
His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu
165 170 175
Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly
180 185 190
Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr
195 200 205
Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg
210 215 220
Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val
225 230 235 240
Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp
245 250 255
Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser
260 265 270
Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys
275 280 285
Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His
290 295 300
Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln
305 310 315 320
Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser
325 330 335
Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp
340 345 350
Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ile
355 360 365
Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val
370 375 380
Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn
385 390 395 400
Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu
405 410 415
Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser
420 425 430
Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro
435 440 445
Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met
450 455 460
Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser
465 470 475 480
Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met
485 490 495
Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp
500 505 510
Glu
<210> 3
<211> 513
<212> PRT
<213> 未知(Unknown)
<220>
<223> 蛋白73
<400> 3
Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu
1 5 10 15
Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu
20 25 30
Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro
35 40 45
Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala
50 55 60
Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr
65 70 75 80
Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe
85 90 95
Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Ser Val Ala
100 105 110
Val Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser
115 120 125
Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu
130 135 140
Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn
145 150 155 160
His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu
165 170 175
Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly
180 185 190
Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr
195 200 205
Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg
210 215 220
Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val
225 230 235 240
Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp
245 250 255
Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser
260 265 270
Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys
275 280 285
Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His
290 295 300
Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln
305 310 315 320
Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser
325 330 335
Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp
340 345 350
Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Ser Leu Gly Ile
355 360 365
Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val
370 375 380
Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn
385 390 395 400
Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu
405 410 415
Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser
420 425 430
Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro
435 440 445
Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met
450 455 460
Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser
465 470 475 480
Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met
485 490 495
Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp
500 505 510
Glu
<210> 4
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> /PCR_引物="n=任何碱基a、c、g或t;k=g或t s=g或c"
/注释="合成核苷酸"
<400> 4
ctttgaaatc tgagagacaa ttggatttca ctnnkgttgc tnnsgatgat actcacggtt 60
acattccagg 70
<210> 5
<211> 72
<212> DNA
<213> 未知(Unknown)
<220>
<223> /PCR_引物="n=任何碱基a、c、g或t,k=g或t;S=g或c "
/注释="人工序列"
<400> 5
ctgttattaa agagtctcaa agattgagac ctgttnnktt gggtnnsttc agaagaatgg 60
ctttggctga tg 72
<210> 6
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> /PCR_引物="n=任何碱基a、c、g或t;k=g或t"
/注释="合成核苷"
<400> 6
ctttgaaatc tgagagacaa ttggatttca ctnnkgttgc tgtcgatgat actcacggtt 60
acattccagg 70
<210> 7
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> /PCR_引物="N=任何碱基a、c、g或t"
/注释="合成核苷"
<400> 7
gtagatcttt gtacaaggat actccatata aagctnnkac tgatttggga gatgttttg 59
<210> 8
<211> 80
<212> DNA
<213> 未知(Unknown)
<220>
<223> /PCR_引物="n=任何碱基a、c、g或t,K=g或t,b= c、g或t"
/注释="Arg220"
<400> 8
ttgagtacac tgttcaattg tttcaaactg ctgatgaatt gbnkaattac cctagatgga 60
ctagaccata tattcattgg 80
<210> 9
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> /PCR_引物="n= a、c、g或t,k=g或t,h=a、c或t"
/注释="合成核苷酸"
<400> 9
gagtctcaaa gattgagacc tgttagtttg hnkatcttcn nkagaatggc tttggctgat 60
gttactttgc ca 72
<210> 10
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> /PCR_引物="n= a、c、g或t,k=g或t"
/注释="合成引物"
<400> 10
ctgttattaa agagtctcaa agattgagac ctgttnnktt gggtatcttc agaagaatgg 60
ctttggctga tg 72
<210> 11
<211> 1544
<212> DNA
<213> 未知(Unknown)
<220>
<223> 蛋白2的核苷酸序列
<400> 11
atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60
actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120
ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180
atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240
ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300
tgaaatctga gagacaattg gatttcactg aagttgctag agacgatact cacggttaca 360
ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420
tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480
atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540
gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600
attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660
gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720
ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780
ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840
ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900
tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960
aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020
tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080
gattgagacc tgttttgttg ggtgctttca gaagaatggc tttggctgat gttactttgc 1140
caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200
accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260
aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320
ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380
ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440
ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500
gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544
<210> 12
<211> 1544
<212> DNA
<213> 未知(Unknown)
<220>
<223> 蛋白11的核苷酸序列
<400> 12
atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60
actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120
ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180
atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240
ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300
tgaaatctga gagacaattg gatttcactg aagttgctgt cgacgatact cacggttaca 360
ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420
tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480
atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540
gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600
attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660
gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720
ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780
ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840
ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900
tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960
aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020
tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080
gattgagacc tgttttgttg ggtatcttca gaagaatggc tttggctgat gttactttgc 1140
caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200
accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260
aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320
ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380
ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440
ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500
gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544
<210> 13
<211> 1544
<212> DNA
<213> 未知(Unknown)
<220>
<223> 蛋白73的核苷酸序列
<400> 13
atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60
actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120
ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180
atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240
ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300
tgaaatctga gagacaattg gatttcacta gtgttgctgt cgacgatact cacggttaca 360
ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420
tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480
atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540
gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600
attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660
gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720
ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780
ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840
ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900
tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960
aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020
tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080
gattgagacc tgttagtttg ggtatcttca gaagaatggc tttggctgat gttactttgc 1140
caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200
accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260
aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320
ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380
ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440
ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500
gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544
Claims (13)
1.具有7-β羟化酶活性的酶,并且所述酶具有SEQ ID N.1,其中彼此独立地:
-位置113处的氨基酸是选自A、E、F、I、L、P、Y、W和V的疏水性氨基酸;
-位置110处的氨基酸是选自R、N、Q、S和T的形成氢键的氨基酸;
-位置368处氨基酸是I;
-位置365处的氨基酸是选自A、N、Q、S和T的形成氢键的氨基酸。
2.根据权利要求1所述的具有7-β羟化酶活性的酶,其中所述位置110处的氨基酸是R或S。
3.根据权利要求1或2所述的具有7-β羟化酶活性的酶,其中所述位置365处的氨基酸是A或S。
4.根据权利要求1-3中任一项所述的具有7-β羟化酶活性的酶,其中所述位置113处的氨基酸是V。
5.根据权利要求1-4中任一项所述的具有7-β羟化酶活性的酶,所述酶具有SEQ IDN.3。
6.根据权利要求1-5中任一项所述的具有7-β羟化酶活性的酶,其中所述酶的氨基酸序列与SEQ ID N.1具有至少80%的序列同一性,优选地所述酶的氨基酸序列与SEQ ID No.1具有至少85%的序列同一性。
7.表达载体,所述表达载体包含编码根据权利要求1-6中任一项所述的具有7-β羟化酶活性的酶的核苷酸序列。
8.一种用于制备熊脱氧胆酸(UDCA)的化学-酶促方法,所述化学-酶促方法包括以下步骤:
a)通过使用权利要求1所述的具有7-β羟化酶活性的酶,将脱氧胆酸(DCA)转化为熊胆酸(UCA),
b)通过使用12α-羟基类固醇脱氢酶(12-HSDH)和乳酸脱氢酶(LDH),将熊胆酸(UCA)转化为12K-UDCA,以及
c)进行Wolff-Kishner还原,从而得到UDCA。
9.根据权利要求8所述的化学-酶促方法,其中将DCA转化为UCA的步骤a)通过使用以编码具有7-β羟化酶活性的酶的权利要求7所述的表达载体转化的巴斯德毕赤酵母(P.pastoris)的生物质进行。
10.根据权利要求8或9所述的化学-酶促方法,其中在步骤b)中,使用脱氢酶12α-HSDH,所述脱氢酶12α-HSDH选自12a_988、12a_829、12a_793、12a_956和12a_698;以及使用乳酸脱氢酶LDH,所述乳酸脱氢酶LDH选自LDH_CUPNH、LDH_THECA、LDH_CAEEL、LDA_GEOSE和LDH_LACPE。
11.根据权利要求10所述的化学-酶促方法,其中在步骤b)中使用乳酸脱氢酶LDH_LACPE和脱氢酶12a_829的组合或乳酸脱氢酶LDH_LACPE和脱氢酶12a_793的组合。
12.根据权利要求8-11中任一项所述的化学-酶促方法,其中步骤b)在24℃-30℃的孵育温度,在0.1-1M的磷酸盐缓冲液浓度和在6.5-7.5的pH,优选地在约27℃的温度,在pH=7和在约1M的磷酸盐缓冲液浓度进行。
13.根据权利要求8-12中任一项所述的化学-酶促方法,其中在步骤b)中使用的LDH的体积是3%-6%v/v,并且使用的12α-HSDH的体积是3%-6%v/v。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT102019000017411 | 2019-09-27 | ||
IT102019000017411A IT201900017411A1 (it) | 2019-09-27 | 2019-09-27 | Processo di preparazione di acido ursodesossicolico |
PCT/IB2020/058932 WO2021059182A1 (en) | 2019-09-27 | 2020-09-24 | Process for preparing ursodeoxycholic acid |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114341350A true CN114341350A (zh) | 2022-04-12 |
Family
ID=69570718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080061324.XA Pending CN114341350A (zh) | 2019-09-27 | 2020-09-24 | 用于制备熊脱氧胆酸的方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4034643A1 (zh) |
CN (1) | CN114341350A (zh) |
IT (1) | IT201900017411A1 (zh) |
WO (1) | WO2021059182A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114134067A (zh) * | 2021-10-19 | 2022-03-04 | 山东睿智医药科技有限公司 | 一种大肠杆菌及应用 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5753431A (en) * | 1993-10-13 | 1998-05-19 | Northeastern Ohio University | Cholesterol 7 α-hydroxdylase gene regulatory elements and transcription factors |
US20130040341A1 (en) * | 2009-11-30 | 2013-02-14 | PhamaZell GmbH | NOVEL 7beta-HYDROXYSTEROID DEHYDROGENASES AND THEIR USE |
CN103502442A (zh) * | 2010-12-16 | 2014-01-08 | 细胞制药有限公司 | 新的7β-羟基类固醇脱氢酶突变体和制备熊去氧胆酸的方法 |
US20150052634A1 (en) * | 2011-12-09 | 2015-02-19 | Ceres, Inc. | Transgenic plants having altered biomass composition |
US20170226556A1 (en) * | 2014-07-29 | 2017-08-10 | Pharmazell Gmbh | 7-Beta-Hydroxysteroid Dehydrogenase Mutants and Process for the Preparation of Ursodeoxycholic Acid |
CN107099516A (zh) * | 2017-06-05 | 2017-08-29 | 华东理工大学 | 7β‑羟基甾醇脱氢酶突变体及其在熊脱氧胆酸合成中的应用 |
US20170327798A1 (en) * | 2014-10-28 | 2017-11-16 | Amano Enzyme Inc. | Mutated enzyme having dehydrogenase activity and use thereof |
WO2018036982A1 (de) * | 2016-08-22 | 2018-03-01 | Pharmazell Gmbh | Chemisch-biokatalytisches verfahren zur herstellung von ursodesoxycholsäure |
CN108546691A (zh) * | 2018-05-09 | 2018-09-18 | 华东理工大学 | 7β-羟基甾醇脱氢酶突变体及其在制备熊脱氧胆酸中的应用 |
-
2019
- 2019-09-27 IT IT102019000017411A patent/IT201900017411A1/it unknown
-
2020
- 2020-09-24 WO PCT/IB2020/058932 patent/WO2021059182A1/en active Application Filing
- 2020-09-24 EP EP20793443.1A patent/EP4034643A1/en active Pending
- 2020-09-24 CN CN202080061324.XA patent/CN114341350A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5753431A (en) * | 1993-10-13 | 1998-05-19 | Northeastern Ohio University | Cholesterol 7 α-hydroxdylase gene regulatory elements and transcription factors |
US20130040341A1 (en) * | 2009-11-30 | 2013-02-14 | PhamaZell GmbH | NOVEL 7beta-HYDROXYSTEROID DEHYDROGENASES AND THEIR USE |
CN105936897A (zh) * | 2009-11-30 | 2016-09-14 | 细胞制药有限公司 | 新的7β-羟类固醇脱氢酶及它们的用途 |
CN103502442A (zh) * | 2010-12-16 | 2014-01-08 | 细胞制药有限公司 | 新的7β-羟基类固醇脱氢酶突变体和制备熊去氧胆酸的方法 |
CN105441399A (zh) * | 2010-12-16 | 2016-03-30 | 细胞制药有限公司 | 新的7β-羟基类固醇脱氢酶突变体和制备熊去氧胆酸的方法 |
US20150052634A1 (en) * | 2011-12-09 | 2015-02-19 | Ceres, Inc. | Transgenic plants having altered biomass composition |
US20170226556A1 (en) * | 2014-07-29 | 2017-08-10 | Pharmazell Gmbh | 7-Beta-Hydroxysteroid Dehydrogenase Mutants and Process for the Preparation of Ursodeoxycholic Acid |
US20170327798A1 (en) * | 2014-10-28 | 2017-11-16 | Amano Enzyme Inc. | Mutated enzyme having dehydrogenase activity and use thereof |
WO2018036982A1 (de) * | 2016-08-22 | 2018-03-01 | Pharmazell Gmbh | Chemisch-biokatalytisches verfahren zur herstellung von ursodesoxycholsäure |
CN107099516A (zh) * | 2017-06-05 | 2017-08-29 | 华东理工大学 | 7β‑羟基甾醇脱氢酶突变体及其在熊脱氧胆酸合成中的应用 |
CN108546691A (zh) * | 2018-05-09 | 2018-09-18 | 华东理工大学 | 7β-羟基甾醇脱氢酶突变体及其在制备熊脱氧胆酸中的应用 |
Non-Patent Citations (1)
Title |
---|
JA-YOUNG LEE等: "Contribution of the 7β-hydroxysteroid dehydrogenase from Ruminococcus gnavus N53 to ursodeoxycholic acid formation in the human colon", 《JOURNAL OF LIPID RESEARCH》, vol. 54, no. 11, pages 3062 - 3069, XP055174301, DOI: 10.1194/jlr.M039834 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114134067A (zh) * | 2021-10-19 | 2022-03-04 | 山东睿智医药科技有限公司 | 一种大肠杆菌及应用 |
Also Published As
Publication number | Publication date |
---|---|
EP4034643A1 (en) | 2022-08-03 |
IT201900017411A1 (it) | 2021-03-27 |
WO2021059182A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3303601B1 (en) | Biosynthesis of phenylpropanoids and phenylpropanoid derivatives | |
US9957497B2 (en) | Hydrocarbon synthase gene and use thereof | |
Fujii et al. | Purification, characterization, and directed evolution study of a vitamin D3 hydroxylase from Pseudonocardia autotrophica | |
JP2017525372A (ja) | 3−hpを生産することができる組換え酵母およびこれを利用した3−hpの製造方法 | |
JP6091629B2 (ja) | アスパラギン酸キナーゼiii変異体およびその宿主細胞と応用 | |
US8932835B2 (en) | Process for the enantioselective enzymatic reduction of intermediates | |
MXPA03011813A (es) | Metodo para la modificacion de enzimas y variantes de oxido reductasa. | |
CN112204146A (zh) | 具有受抑制的乙醇产生途径的耐酸酵母及使用其生产乳酸的方法 | |
CN114450403A (zh) | 用于在枫糖尿症(msud)的治疗中使用的酶的生物合成 | |
CN114341350A (zh) | 用于制备熊脱氧胆酸的方法 | |
WO2019246488A1 (en) | Compositions and methods for the production of pyruvic acid and related products using dynamic metabolic control | |
US9416350B2 (en) | Enzyme function modification method and enzyme variant thereof | |
CN112410353B (zh) | 一种fkbS基因、含其的基因工程菌及其制备方法和用途 | |
KR101551533B1 (ko) | 2,3-부탄디올의 생성능이 증강된 재조합 미생물 및 이를 이용한 2,3-부탄디올의 생산 방법 | |
CN106318917A (zh) | 天冬氨酸-β-半醛脱氢酶突变体及其应用 | |
US9714436B2 (en) | Recombinant microorganism and method for producing a substance using the same | |
US11078499B2 (en) | Host cells and methods for producing toluene biochemically | |
Shinozaki et al. | Molecular basis of triterpene-based chemophenetics in ferns | |
Junichi et al. | Molecular basis of triterpene-based chemophenetics in ferns | |
CN117903007A (zh) | 一种亚精胺生物合成途径关键酶 | |
CN114807066A (zh) | 一种酮还原酶突变体 | |
CN117015612A (zh) | 还原型辅酶q10的生产工艺 | |
Lee et al. | Research Molecular cloning and biochemical characterization of a novel erythrose reductase from Candida magnoliae JH110 | |
AU2011213806A1 (en) | Method for the enantioselective enzymatic reduction of secodione derivatives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |