CN118119715A - 改进的方法和酶 - Google Patents
改进的方法和酶 Download PDFInfo
- Publication number
- CN118119715A CN118119715A CN202280070136.2A CN202280070136A CN118119715A CN 118119715 A CN118119715 A CN 118119715A CN 202280070136 A CN202280070136 A CN 202280070136A CN 118119715 A CN118119715 A CN 118119715A
- Authority
- CN
- China
- Prior art keywords
- formula
- compound
- seq
- isomer
- fold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 195
- 102000004190 Enzymes Human genes 0.000 title claims abstract description 127
- 108090000790 Enzymes Proteins 0.000 title claims abstract description 127
- 239000000203 mixture Substances 0.000 claims abstract description 326
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 87
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 85
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 85
- 101710095468 Cyclase Proteins 0.000 claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 19
- 150000001875 compounds Chemical class 0.000 claims description 1138
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 143
- 235000001014 amino acid Nutrition 0.000 claims description 113
- 238000006467 substitution reaction Methods 0.000 claims description 82
- 239000000047 product Substances 0.000 claims description 79
- 239000002773 nucleotide Substances 0.000 claims description 66
- 125000003729 nucleotide group Chemical group 0.000 claims description 66
- 229910052739 hydrogen Inorganic materials 0.000 claims description 45
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 44
- 125000000217 alkyl group Chemical group 0.000 claims description 39
- 239000006227 byproduct Substances 0.000 claims description 31
- 238000004519 manufacturing process Methods 0.000 claims description 30
- 239000002304 perfume Substances 0.000 claims description 29
- 229910052799 carbon Inorganic materials 0.000 claims description 28
- 102200082967 rs34264048 Human genes 0.000 claims description 28
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 25
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 25
- 235000004279 alanine Nutrition 0.000 claims description 25
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 24
- 239000004473 Threonine Substances 0.000 claims description 24
- 239000004474 valine Substances 0.000 claims description 21
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 20
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 14
- 235000009582 asparagine Nutrition 0.000 claims description 14
- 229960001230 asparagine Drugs 0.000 claims description 14
- 229930182817 methionine Natural products 0.000 claims description 13
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 12
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 12
- 235000018417 cysteine Nutrition 0.000 claims description 12
- 239000004475 Arginine Substances 0.000 claims description 11
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 11
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 11
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 10
- 239000007787 solid Substances 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 7
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 claims description 6
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 claims description 6
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 claims description 6
- 229940031439 squalene Drugs 0.000 claims description 6
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 claims description 6
- 229960005174 ambroxol Drugs 0.000 abstract description 34
- -1 ambroxol acetals Chemical class 0.000 abstract description 33
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 abstract description 29
- 108091000048 Squalene hopene cyclase Proteins 0.000 description 361
- 210000004027 cell Anatomy 0.000 description 203
- 238000006243 chemical reaction Methods 0.000 description 186
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 56
- 229940024606 amino acid Drugs 0.000 description 54
- 150000001413 amino acids Chemical class 0.000 description 54
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 45
- 230000000694 effects Effects 0.000 description 43
- 239000000758 substrate Substances 0.000 description 43
- 108090000623 proteins and genes Proteins 0.000 description 40
- 239000002904 solvent Substances 0.000 description 34
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 33
- 239000011942 biocatalyst Substances 0.000 description 31
- 238000004113 cell culture Methods 0.000 description 31
- 108090000765 processed proteins & peptides Proteins 0.000 description 30
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 27
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 description 26
- 230000001965 increasing effect Effects 0.000 description 26
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 25
- 230000035772 mutation Effects 0.000 description 24
- 102000004169 proteins and genes Human genes 0.000 description 24
- 230000001413 cellular effect Effects 0.000 description 23
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 22
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 22
- 239000001257 hydrogen Substances 0.000 description 22
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 21
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 21
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 21
- 102000004196 processed proteins & peptides Human genes 0.000 description 21
- 235000018102 proteins Nutrition 0.000 description 21
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 21
- 239000002609 medium Substances 0.000 description 20
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 20
- 239000000243 solution Substances 0.000 description 20
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 19
- 230000001105 regulatory effect Effects 0.000 description 17
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 16
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 16
- 239000000872 buffer Substances 0.000 description 16
- 238000000855 fermentation Methods 0.000 description 16
- 230000004151 fermentation Effects 0.000 description 16
- 239000011541 reaction mixture Substances 0.000 description 16
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- 238000004817 gas chromatography Methods 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 14
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 14
- 239000004615 ingredient Substances 0.000 description 14
- 229960000310 isoleucine Drugs 0.000 description 14
- LTUMRKDLVGQMJU-UHFFFAOYSA-N famesylacetone Natural products CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=O LTUMRKDLVGQMJU-UHFFFAOYSA-N 0.000 description 13
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 13
- 239000001384 succinic acid Substances 0.000 description 13
- 241000223218 Fusarium Species 0.000 description 12
- 239000004471 Glycine Substances 0.000 description 12
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 12
- 239000012043 crude product Substances 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 11
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 11
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 11
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 11
- SYSQUGFVNFXIIT-UHFFFAOYSA-N n-[4-(1,3-benzoxazol-2-yl)phenyl]-4-nitrobenzenesulfonamide Chemical class C1=CC([N+](=O)[O-])=CC=C1S(=O)(=O)NC1=CC=C(C=2OC3=CC=CC=C3N=2)C=C1 SYSQUGFVNFXIIT-UHFFFAOYSA-N 0.000 description 11
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 10
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 239000008367 deionised water Substances 0.000 description 10
- 229910021641 deionized water Inorganic materials 0.000 description 10
- 239000003921 oil Substances 0.000 description 10
- 235000019198 oils Nutrition 0.000 description 10
- 230000009257 reactivity Effects 0.000 description 10
- 241000123346 Chrysosporium Species 0.000 description 9
- 241000193403 Clostridium Species 0.000 description 9
- 125000000539 amino acid group Chemical class 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 8
- 241001494489 Thielavia Species 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 238000012258 culturing Methods 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 239000011550 stock solution Substances 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 7
- 150000001241 acetals Chemical class 0.000 description 7
- 150000001298 alcohols Chemical class 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 7
- 229960003495 thiamine Drugs 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 6
- 241000221779 Fusarium sambucinum Species 0.000 description 6
- GLZPCOQZEFWAFX-UHFFFAOYSA-N Geraniol Chemical compound CC(C)=CCCC(C)=CCO GLZPCOQZEFWAFX-UHFFFAOYSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- 239000004472 Lysine Substances 0.000 description 6
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 6
- 239000007795 chemical reaction product Substances 0.000 description 6
- QMVPMAAFGQKVCJ-UHFFFAOYSA-N citronellol Chemical compound OCCC(C)CCC=C(C)C QMVPMAAFGQKVCJ-UHFFFAOYSA-N 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 238000010956 selective crystallization Methods 0.000 description 6
- 239000007790 solid phase Substances 0.000 description 6
- 235000019157 thiamine Nutrition 0.000 description 6
- 239000011721 thiamine Substances 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- 239000008346 aqueous phase Substances 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 125000004432 carbon atom Chemical group C* 0.000 description 5
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 5
- 239000003960 organic solvent Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 238000003756 stirring Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 239000002028 Biomass Substances 0.000 description 4
- 241000722885 Brettanomyces Species 0.000 description 4
- 241000186216 Corynebacterium Species 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 241000179039 Paenibacillus Species 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 4
- 241000223259 Trichoderma Species 0.000 description 4
- 239000002671 adjuvant Substances 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000011230 binding agent Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- FLKPEMZONWLCSK-UHFFFAOYSA-N diethyl phthalate Chemical compound CCOC(=O)C1=CC=CC=C1C(=O)OCC FLKPEMZONWLCSK-UHFFFAOYSA-N 0.000 description 4
- 239000003085 diluting agent Substances 0.000 description 4
- RRAFCDWBNXTKKO-UHFFFAOYSA-N eugenol Chemical compound COC1=CC(CC=C)=CC=C1O RRAFCDWBNXTKKO-UHFFFAOYSA-N 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- CDOSHBSSFJOMGT-UHFFFAOYSA-N linalool Chemical compound CC(C)=CCCC(C)(O)C=C CDOSHBSSFJOMGT-UHFFFAOYSA-N 0.000 description 4
- ZRSNZINYAWTAHE-UHFFFAOYSA-N p-methoxybenzaldehyde Chemical compound COC1=CC=C(C=O)C=C1 ZRSNZINYAWTAHE-UHFFFAOYSA-N 0.000 description 4
- 229910052700 potassium Inorganic materials 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000035484 reaction time Effects 0.000 description 4
- 238000007363 ring formation reaction Methods 0.000 description 4
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 4
- 229910052717 sulfur Inorganic materials 0.000 description 4
- 239000004094 surface-active agent Substances 0.000 description 4
- 239000011573 trace mineral Substances 0.000 description 4
- 235000013619 trace mineral Nutrition 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- OOCCDEMITAIZTP-QPJJXVBHSA-N (E)-cinnamyl alcohol Chemical compound OC\C=C\C1=CC=CC=C1 OOCCDEMITAIZTP-QPJJXVBHSA-N 0.000 description 3
- 241000589220 Acetobacter Species 0.000 description 3
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- 241000223194 Fusarium culmorum Species 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000146406 Fusarium heterosporum Species 0.000 description 3
- 241000223221 Fusarium oxysporum Species 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- 241000006364 Torula Species 0.000 description 3
- JBDGDEWWOUBZPM-XYPYZODXSA-N ambroxol Chemical compound NC1=C(Br)C=C(Br)C=C1CN[C@@H]1CC[C@@H](O)CC1 JBDGDEWWOUBZPM-XYPYZODXSA-N 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 239000012876 carrier material Substances 0.000 description 3
- 235000000484 citronellol Nutrition 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 239000002178 crystalline material Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000013355 food flavoring agent Nutrition 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- WPFVBOQKRVRMJB-UHFFFAOYSA-N hydroxycitronellal Chemical compound O=CCC(C)CCCC(C)(C)O WPFVBOQKRVRMJB-UHFFFAOYSA-N 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 150000002576 ketones Chemical class 0.000 description 3
- 239000010410 layer Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 239000007320 rich medium Substances 0.000 description 3
- CZCBTSFUTPZVKJ-UHFFFAOYSA-N rose oxide Chemical compound CC1CCOC(C=C(C)C)C1 CZCBTSFUTPZVKJ-UHFFFAOYSA-N 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000012137 tryptone Substances 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 3
- NOOLISFMXDJSKH-UTLUCORTSA-N (+)-Neomenthol Chemical compound CC(C)[C@@H]1CC[C@@H](C)C[C@@H]1O NOOLISFMXDJSKH-UTLUCORTSA-N 0.000 description 2
- CRDAMVZIKSXKFV-GNESMGCMSA-N (2-trans,6-cis)-farnesol Chemical compound CC(C)=CCC\C(C)=C/CC\C(C)=C\CO CRDAMVZIKSXKFV-GNESMGCMSA-N 0.000 description 2
- AVJMJMPVWWWELJ-DHZHZOJOSA-N (2e)-1-methoxy-3,7-dimethylocta-2,6-diene Chemical compound COC\C=C(/C)CCC=C(C)C AVJMJMPVWWWELJ-DHZHZOJOSA-N 0.000 description 2
- GLZPCOQZEFWAFX-JXMROGBWSA-N (E)-Geraniol Chemical compound CC(C)=CCC\C(C)=C\CO GLZPCOQZEFWAFX-JXMROGBWSA-N 0.000 description 2
- 229910019614 (NH4)6 Mo7 O24.4H2 O Inorganic materials 0.000 description 2
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 2
- XPCTZQVDEJYUGT-UHFFFAOYSA-N 3-hydroxy-2-methyl-4-pyrone Chemical compound CC=1OC=CC(=O)C=1O XPCTZQVDEJYUGT-UHFFFAOYSA-N 0.000 description 2
- HIQIXEFWDLTDED-UHFFFAOYSA-N 4-hydroxy-1-piperidin-4-ylpyrrolidin-2-one Chemical compound O=C1CC(O)CN1C1CCNCC1 HIQIXEFWDLTDED-UHFFFAOYSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- 241000588986 Alcaligenes Species 0.000 description 2
- 241000223600 Alternaria Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000186063 Arthrobacter Species 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241000892910 Aspergillus foetidus Species 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000194108 Bacillus licheniformis Species 0.000 description 2
- 241000194106 Bacillus mycoides Species 0.000 description 2
- 241000906059 Bacillus pseudomycoides Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- IWANDZNOKBEEFG-UHFFFAOYSA-N CC(C)=CCCC(C)=CCCC(C)=CCC(C(C)=O)O Chemical class CC(C)=CCCC(C)=CCCC(C)=CCC(C(C)=O)O IWANDZNOKBEEFG-UHFFFAOYSA-N 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 241000146399 Ceriporiopsis Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 241000221755 Cryphonectria Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- NOOLISFMXDJSKH-UHFFFAOYSA-N DL-menthol Natural products CC(C)C1CCC(C)CC1O NOOLISFMXDJSKH-UHFFFAOYSA-N 0.000 description 2
- ZAFNJMIOTHYJRJ-UHFFFAOYSA-N Diisopropyl ether Chemical compound CC(C)OC(C)C ZAFNJMIOTHYJRJ-UHFFFAOYSA-N 0.000 description 2
- 241000194033 Enterococcus Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 2
- 229930091371 Fructose Natural products 0.000 description 2
- 239000005715 Fructose Substances 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000206581 Gracilaria Species 0.000 description 2
- 108010034145 Helminth Proteins Proteins 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 241000194036 Lactococcus Species 0.000 description 2
- 241000183011 Melanocarpus Species 0.000 description 2
- 241000192041 Micrococcus Species 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 241000228150 Penicillium chrysogenum Species 0.000 description 2
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 2
- 241000222385 Phanerochaete Species 0.000 description 2
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 2
- 108010009736 Protein Hydrolysates Proteins 0.000 description 2
- 241000589614 Pseudomonas stutzeri Species 0.000 description 2
- 241000383860 Pseudoplectania Species 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 241000223255 Scytalidium Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241000223257 Thermomyces Species 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- 241000589500 Thermus aquaticus Species 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000378866 Trichoderma koningii Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- DOOTYTYQINUNNV-UHFFFAOYSA-N Triethyl citrate Chemical compound CCOC(=O)CC(O)(C(=O)OCC)CC(=O)OCC DOOTYTYQINUNNV-UHFFFAOYSA-N 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- HMKKIXGYKWDQSV-KAMYIIQDSA-N alpha-Amylcinnamaldehyde Chemical compound CCCCC\C(C=O)=C\C1=CC=CC=C1 HMKKIXGYKWDQSV-KAMYIIQDSA-N 0.000 description 2
- WUOACPNHFRMFPN-UHFFFAOYSA-N alpha-terpineol Chemical compound CC1=CCC(C(C)(C)O)CC1 WUOACPNHFRMFPN-UHFFFAOYSA-N 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- FIXLYHHVMHXSCP-UHFFFAOYSA-H azane;dihydroxy(dioxo)molybdenum;trioxomolybdenum;tetrahydrate Chemical compound N.N.N.N.N.N.O.O.O.O.O=[Mo](=O)=O.O=[Mo](=O)=O.O=[Mo](=O)=O.O=[Mo](=O)=O.O[Mo](O)(=O)=O.O[Mo](O)(=O)=O.O[Mo](O)(=O)=O FIXLYHHVMHXSCP-UHFFFAOYSA-H 0.000 description 2
- 229940065181 bacillus anthracis Drugs 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- DKPFZGUDAPQIHT-UHFFFAOYSA-N butyl acetate Chemical compound CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- MVPPADPHJFYWMZ-UHFFFAOYSA-N chlorobenzene Chemical compound ClC1=CC=CC=C1 MVPPADPHJFYWMZ-UHFFFAOYSA-N 0.000 description 2
- 239000007979 citrate buffer Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 2
- 229910000388 diammonium phosphate Inorganic materials 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- XSNQECSCDATQEL-UHFFFAOYSA-N dihydromyrcenol Chemical compound C=CC(C)CCCC(C)(C)O XSNQECSCDATQEL-UHFFFAOYSA-N 0.000 description 2
- 229930008394 dihydromyrcenol Natural products 0.000 description 2
- SZXQTJUDPRGNJN-UHFFFAOYSA-N dipropylene glycol Chemical compound OCCCOCCCO SZXQTJUDPRGNJN-UHFFFAOYSA-N 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 150000002170 ethers Chemical class 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 244000000013 helminth Species 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- UFLHIIWVXFIJGU-UHFFFAOYSA-N hex-3-en-1-ol Natural products CCC=CCCO UFLHIIWVXFIJGU-UHFFFAOYSA-N 0.000 description 2
- ZOCHHNOQQHDWHG-UHFFFAOYSA-N hexan-3-ol Chemical compound CCCC(O)CC ZOCHHNOQQHDWHG-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 2
- 150000002678 macrocyclic compounds Chemical class 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036284 oxygen consumption Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 230000010399 physical interaction Effects 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 239000003531 protein hydrolysate Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 235000019719 rose oil Nutrition 0.000 description 2
- 239000010666 rose oil Substances 0.000 description 2
- 238000002390 rotary evaporation Methods 0.000 description 2
- 238000011218 seed culture Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- JQWHASGSAFIOCM-UHFFFAOYSA-M sodium periodate Chemical compound [Na+].[O-]I(=O)(=O)=O JQWHASGSAFIOCM-UHFFFAOYSA-M 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- NUMQCACRALPSHD-UHFFFAOYSA-N tert-butyl ethyl ether Chemical compound CCOC(C)(C)C NUMQCACRALPSHD-UHFFFAOYSA-N 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000001069 triethyl citrate Substances 0.000 description 2
- VMYFZRTXGLUXMZ-UHFFFAOYSA-N triethyl citrate Natural products CCOC(=O)C(O)(C(=O)OCC)C(=O)OCC VMYFZRTXGLUXMZ-UHFFFAOYSA-N 0.000 description 2
- 235000013769 triethyl citrate Nutrition 0.000 description 2
- 229910052721 tungsten Inorganic materials 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000000341 volatile oil Substances 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- RZLVQBNCHSJZPX-UHFFFAOYSA-L zinc sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Zn+2].[O-]S([O-])(=O)=O RZLVQBNCHSJZPX-UHFFFAOYSA-L 0.000 description 2
- MHSSURNGSJBONH-RQOWECAXSA-N (10z)-1-oxacyclohexadec-10-en-2-one Chemical compound O=C1CCCCCCC\C=C/CCCCCO1 MHSSURNGSJBONH-RQOWECAXSA-N 0.000 description 1
- 239000000260 (2E,6E)-3,7,11-trimethyldodeca-2,6,10-trien-1-ol Substances 0.000 description 1
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- 239000001490 (3R)-3,7-dimethylocta-1,6-dien-3-ol Substances 0.000 description 1
- KRLBLPBPZSSIGH-CSKARUKUSA-N (6e)-3,7-dimethylnona-1,6-dien-3-ol Chemical compound CC\C(C)=C\CCC(C)(O)C=C KRLBLPBPZSSIGH-CSKARUKUSA-N 0.000 description 1
- DCSCXTJOXBUFGB-JGVFFNPUSA-N (R)-(+)-Verbenone Natural products CC1=CC(=O)[C@@H]2C(C)(C)[C@H]1C2 DCSCXTJOXBUFGB-JGVFFNPUSA-N 0.000 description 1
- QMVPMAAFGQKVCJ-SNVBAGLBSA-N (R)-(+)-citronellol Natural products OCC[C@H](C)CCC=C(C)C QMVPMAAFGQKVCJ-SNVBAGLBSA-N 0.000 description 1
- DCSCXTJOXBUFGB-SFYZADRCSA-N (R)-(+)-verbenone Chemical compound CC1=CC(=O)[C@H]2C(C)(C)[C@@H]1C2 DCSCXTJOXBUFGB-SFYZADRCSA-N 0.000 description 1
- CDOSHBSSFJOMGT-JTQLQIEISA-N (R)-linalool Natural products CC(C)=CCC[C@@](C)(O)C=C CDOSHBSSFJOMGT-JTQLQIEISA-N 0.000 description 1
- UFLHIIWVXFIJGU-ARJAWSKDSA-N (Z)-hex-3-en-1-ol Chemical compound CC\C=C/CCO UFLHIIWVXFIJGU-ARJAWSKDSA-N 0.000 description 1
- 239000000267 (Z)-hex-3-en-1-ol Substances 0.000 description 1
- RNLHVODSMDJCBR-VURMDHGXSA-N (z)-3-methyl-5-(2,2,3-trimethylcyclopent-3-en-1-yl)pent-4-en-2-ol Chemical compound CC(O)C(C)\C=C/C1CC=C(C)C1(C)C RNLHVODSMDJCBR-VURMDHGXSA-N 0.000 description 1
- KVDORLFQOZGRPI-CHNJZELVSA-N (z)-hex-3-en-1-ol Chemical compound CC\C=C/CCO.CC\C=C/CCO KVDORLFQOZGRPI-CHNJZELVSA-N 0.000 description 1
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- OCJBOOLMMGQPQU-UHFFFAOYSA-N 1,4-dichlorobenzene Chemical compound ClC1=CC=C(Cl)C=C1 OCJBOOLMMGQPQU-UHFFFAOYSA-N 0.000 description 1
- BVDMQAQCEBGIJR-UHFFFAOYSA-N 1-(2,2,6-trimethylcyclohexyl)hexan-3-ol Chemical compound CCCC(O)CCC1C(C)CCCC1(C)C BVDMQAQCEBGIJR-UHFFFAOYSA-N 0.000 description 1
- VPKMGDRERYMTJX-CMDGGOBGSA-N 1-(2,6,6-Trimethyl-2-cyclohexen-1-yl)-1-penten-3-one Chemical compound CCC(=O)\C=C\C1C(C)=CCCC1(C)C VPKMGDRERYMTJX-CMDGGOBGSA-N 0.000 description 1
- DURPTKYDGMDSBL-UHFFFAOYSA-N 1-butoxybutane Chemical compound CCCCOCCCC DURPTKYDGMDSBL-UHFFFAOYSA-N 0.000 description 1
- VBUBLWCIADYRMB-UHFFFAOYSA-N 1-hydroxypentane-2,4-dione Chemical class CC(=O)CC(=O)CO VBUBLWCIADYRMB-UHFFFAOYSA-N 0.000 description 1
- JSXWGBVKNMGJMC-UHFFFAOYSA-N 1-phenylethanol;2-phenylethanol Chemical compound CC(O)C1=CC=CC=C1.OCCC1=CC=CC=C1 JSXWGBVKNMGJMC-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PSIOIPWJOZPZPA-UHFFFAOYSA-N 2,4,7-trimethylocta-2,6-dien-1-ol Chemical compound CC(CC=C(C)C)C=C(C)CO PSIOIPWJOZPZPA-UHFFFAOYSA-N 0.000 description 1
- FAVZTHXOOBZCOB-UHFFFAOYSA-N 2,6-Bis(1,1-dimethylethyl)-4-methyl phenol Natural products CC(C)CC1=CC(C)=CC(CC(C)C)=C1O FAVZTHXOOBZCOB-UHFFFAOYSA-N 0.000 description 1
- DGJXPLQJXLEEQL-UHFFFAOYSA-N 2-(2-methylpropyl)quinoline Chemical compound C1=CC=CC2=NC(CC(C)C)=CC=C21.C1=CC=CC2=NC(CC(C)C)=CC=C21 DGJXPLQJXLEEQL-UHFFFAOYSA-N 0.000 description 1
- OMIGHNLMNHATMP-UHFFFAOYSA-N 2-hydroxyethyl prop-2-enoate Chemical compound OCCOC(=O)C=C OMIGHNLMNHATMP-UHFFFAOYSA-N 0.000 description 1
- JRBJSXQPQWSCCF-UHFFFAOYSA-N 3,3'-Dimethoxybenzidine Chemical compound C1=C(N)C(OC)=CC(C=2C=C(OC)C(N)=CC=2)=C1 JRBJSXQPQWSCCF-UHFFFAOYSA-N 0.000 description 1
- 229930008411 3,7-dimethylocta-2,6-dien-1-ol Natural products 0.000 description 1
- UKZXPOJABTXLMK-UHFFFAOYSA-N 3-[2-methyl-4-(2-methylpropyl)phenyl]propanal Chemical compound CC(C)CC1=CC=C(CCC=O)C(C)=C1 UKZXPOJABTXLMK-UHFFFAOYSA-N 0.000 description 1
- NGYMOTOXXHCHOC-UHFFFAOYSA-N 3-methyl-5-(2,2,3-trimethylcyclopent-3-en-1-yl)pentan-2-ol Chemical compound CC(O)C(C)CCC1CC=C(C)C1(C)C NGYMOTOXXHCHOC-UHFFFAOYSA-N 0.000 description 1
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 1
- 241000589212 Acetobacter pasteurianus Species 0.000 description 1
- 241000222518 Agaricus Species 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- 240000000559 Albizia odoratissima Species 0.000 description 1
- 235000011438 Albizia odoratissima Nutrition 0.000 description 1
- 235000009051 Ambrosia paniculata var. peruviana Nutrition 0.000 description 1
- 235000003097 Artemisia absinthium Nutrition 0.000 description 1
- 240000001851 Artemisia dracunculus Species 0.000 description 1
- 235000017731 Artemisia dracunculus ssp. dracunculus Nutrition 0.000 description 1
- 235000003261 Artemisia vulgaris Nutrition 0.000 description 1
- 241000499952 Arthropodium Species 0.000 description 1
- 241000221377 Auricularia Species 0.000 description 1
- NTTIDCCSYIDANP-UHFFFAOYSA-N BCCP Chemical compound BCCP NTTIDCCSYIDANP-UHFFFAOYSA-N 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241001560509 Bacillus cytotoxicus Species 0.000 description 1
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 1
- 101710180532 Biotin carboxyl carrier protein of acetyl-CoA carboxylase Proteins 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 241000244202 Caenorhabditis Species 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 235000002687 Caesalpinia echinata Nutrition 0.000 description 1
- 240000007436 Cananga odorata Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241001090476 Castoreum Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 241000221955 Chaetomium Species 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- NPBVQXIMTZKSBA-UHFFFAOYSA-N Chavibetol Natural products COC1=CC=C(CC=C)C=C1O NPBVQXIMTZKSBA-UHFFFAOYSA-N 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000862992 Chondromyces Species 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241001674001 Chrysosporium tropicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- 241000722206 Chrysotila carterae Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000221760 Claviceps Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241000222511 Coprinus Species 0.000 description 1
- 241001509964 Coptotermes Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 241000223935 Cryptosporidium Species 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- FKUPPRZPSYCDRS-UHFFFAOYSA-N Cyclopentadecanolide Chemical compound O=C1CCCCCCCCCCCCCCO1 FKUPPRZPSYCDRS-UHFFFAOYSA-N 0.000 description 1
- 101710112752 Cytotoxin Proteins 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 241000195632 Dunaliella tertiolecta Species 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 241001288713 Escherichia coli MC1061 Species 0.000 description 1
- 239000005770 Eugenol Substances 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000221433 Exidia Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241001251094 Formica Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 239000005792 Geraniol Substances 0.000 description 1
- GLZPCOQZEFWAFX-YFHOEESVSA-N Geraniol Natural products CC(C)=CCC\C(C)=C/CO GLZPCOQZEFWAFX-YFHOEESVSA-N 0.000 description 1
- 241000589236 Gluconobacter Species 0.000 description 1
- 241001594094 Gluconobacter morbifer Species 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 241000222684 Grifola Species 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 241001424361 Haematoxylum brasiletto Species 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000132446 Inula Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 239000005909 Kieselgur Substances 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 240000000599 Lentinula edodes Species 0.000 description 1
- 235000001715 Lentinula edodes Nutrition 0.000 description 1
- 241001358029 Leucotrichum Species 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- HYMLWHLQFGRFIY-UHFFFAOYSA-N Maltol Natural products CC1OC=CC(=O)C1=O HYMLWHLQFGRFIY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 description 1
- UIHCLUNTQKBZGK-UHFFFAOYSA-N Methyl isobutyl ketone Natural products CCC(C)C(C)=O UIHCLUNTQKBZGK-UHFFFAOYSA-N 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 235000019502 Orange oil Nutrition 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000235645 Pichia kudriavzevii Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- UVMRYBDEERADNV-UHFFFAOYSA-N Pseudoeugenol Natural products COC1=CC(C(C)=C)=CC=C1O UVMRYBDEERADNV-UHFFFAOYSA-N 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 241000195474 Sargassum Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235348 Schizosaccharomyces japonicus Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 241001313699 Thermosynechococcus elongatus Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 241000183053 Thielavia subthermophila Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- FZLOGXXTGWFQFP-UHFFFAOYSA-N [1-methyl-2-(5-methylhex-4-en-2-yl)cyclopropyl]methanol Chemical compound CC(C)=CCC(C)C1CC1(C)CO FZLOGXXTGWFQFP-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- DLRVVLDZNNYCBX-CAPXFGMSSA-N allolactose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@@H]1OC[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](O)O1 DLRVVLDZNNYCBX-CAPXFGMSSA-N 0.000 description 1
- OOCCDEMITAIZTP-UHFFFAOYSA-N allylic benzylic alcohol Natural products OCC=CC1=CC=CC=C1 OOCCDEMITAIZTP-UHFFFAOYSA-N 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- 239000001138 artemisia absinthium Substances 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 239000010619 basil oil Substances 0.000 description 1
- 229940018006 basil oil Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- JGQFVRIQXUFPAH-UHFFFAOYSA-N beta-citronellol Natural products OCCC(C)CCCC(C)=C JGQFVRIQXUFPAH-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- FUSUHKVFWTUUBE-UHFFFAOYSA-N buten-2-one Chemical compound CC(=O)C=C FUSUHKVFWTUUBE-UHFFFAOYSA-N 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000000679 carrageenan Substances 0.000 description 1
- 229920001525 carrageenan Polymers 0.000 description 1
- 229940113118 carrageenan Drugs 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 238000011072 cell harvest Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000001926 citrus aurantium l. subsp. bergamia wright et arn. oil Substances 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- MGNCLNQXLYJVJD-UHFFFAOYSA-N cyanuric chloride Chemical compound ClC1=NC(Cl)=NC(Cl)=N1 MGNCLNQXLYJVJD-UHFFFAOYSA-N 0.000 description 1
- 150000004292 cyclic ethers Chemical class 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- WJTCGQSWYFHTAC-UHFFFAOYSA-N cyclooctane Chemical compound C1CCCCCCC1 WJTCGQSWYFHTAC-UHFFFAOYSA-N 0.000 description 1
- 239000004914 cyclooctane Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 239000002619 cytotoxin Substances 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000013530 defoamer Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- SQIFACVGCPWBQZ-UHFFFAOYSA-N delta-terpineol Natural products CC(C)(O)C1CCC(=C)CC1 SQIFACVGCPWBQZ-UHFFFAOYSA-N 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 229940117389 dichlorobenzene Drugs 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- POLCUAVZOMRGSN-UHFFFAOYSA-N dipropyl ether Chemical compound CCCOCCC POLCUAVZOMRGSN-UHFFFAOYSA-N 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 229960002217 eugenol Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 229940043259 farnesol Drugs 0.000 description 1
- 229930002886 farnesol Natural products 0.000 description 1
- 239000012527 feed solution Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000003818 flash chromatography Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 239000004088 foaming agent Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 229940113087 geraniol Drugs 0.000 description 1
- 239000010648 geranium oil Substances 0.000 description 1
- 235000019717 geranium oil Nutrition 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000000687 hydroquinonyl group Chemical class C1(O)=C(C=C(O)C=C1)* 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000012948 isocyanate Substances 0.000 description 1
- 150000002513 isocyanates Chemical class 0.000 description 1
- 239000010656 jasmine oil Substances 0.000 description 1
- 210000003125 jurkat cell Anatomy 0.000 description 1
- 150000002596 lactones Chemical class 0.000 description 1
- 150000002597 lactoses Chemical class 0.000 description 1
- 239000000171 lavandula angustifolia l. flower oil Substances 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229930007744 linalool Natural products 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 229940043353 maltol Drugs 0.000 description 1
- 210000000723 mammalian artificial chromosome Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 210000002752 melanocyte Anatomy 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 229940041616 menthol Drugs 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- 239000010502 orange oil Substances 0.000 description 1
- 239000012044 organic layer Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- ZHZCYWWNFQUZOR-UHFFFAOYSA-N pent-4-en-2-ol Chemical compound CC(O)CC=C ZHZCYWWNFQUZOR-UHFFFAOYSA-N 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 239000001738 pogostemon cablin oil Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229920003053 polystyrene-divinylbenzene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 229920001447 polyvinyl benzene Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229930007790 rose oxide Natural products 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000010671 sandalwood oil Substances 0.000 description 1
- 239000001290 saussurea lappa clarke root oil Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 150000004756 silanes Chemical class 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 229940095696 soap product Drugs 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000008137 solubility enhancer Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 108010018381 streptavidin-binding peptide Proteins 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- AWDRATDZQPNJFN-VAYUFCLWSA-N taurodeoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS(O)(=O)=O)C)[C@@]2(C)[C@@H](O)C1 AWDRATDZQPNJFN-VAYUFCLWSA-N 0.000 description 1
- 229940116411 terpineol Drugs 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- CRDAMVZIKSXKFV-UHFFFAOYSA-N trans-Farnesol Natural products CC(C)=CCCC(C)=CCCC(C)=CCO CRDAMVZIKSXKFV-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- 150000003624 transition metals Chemical class 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- MWOOGOJBHIARFG-UHFFFAOYSA-N vanillin Chemical compound COC1=CC(C=O)=CC=C1O MWOOGOJBHIARFG-UHFFFAOYSA-N 0.000 description 1
- FGQOOHJZONJGDT-UHFFFAOYSA-N vanillin Natural products COC1=CC(O)=CC(C=O)=C1 FGQOOHJZONJGDT-UHFFFAOYSA-N 0.000 description 1
- 235000012141 vanillin Nutrition 0.000 description 1
- DCSCXTJOXBUFGB-UHFFFAOYSA-N verbenone Natural products CC1=CC(=O)C2C(C)(C)C1C2 DCSCXTJOXBUFGB-UHFFFAOYSA-N 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 235000021119 whey protein Nutrition 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 239000008096 xylene Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Abstract
制备龙涎缩醛和龙涎缩醛同系物的改进方法和包含它们的组合物,用于所述方法的改进的角鲨烯‑何帕烯环化酶(SHC)酶,编码所述酶的核酸构建体和载体,以及表达所述酶的宿主细胞。
Description
领域
本公开一般地涉及制备龙涎缩醛和龙涎缩醛同系物的改进方法。本公开进一步涉及用于所述方法的改进的SHC酶,编码所述酶的核酸构建体和载体,以及表达所述酶的宿主细胞。
背景
龙涎缩醛提供了一种强烈且持久的龙涎香和木香气味,其可单独或与其他木香或龙涎香成分组合用于香料组合物中。传统上,龙涎缩醛是通过许多化学转化从泪柏醇制备的。然而,天然泪柏醇的供应是有限的。WO2021/209482公开了一种使用角鲨烯-何帕烯环化酶(SHC)酶从多不饱和醇生产龙涎缩醛和龙涎缩醛同系物的方法。
概述
本公开的一个方面涉及用于制备式(I)化合物的方法,
其中所述方法包括使式(II)化合物
与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1的序列具有至少70%一致性或相似性的氨基酸序列,其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,
并且其中R选自H和C1-C4烷基。
在用于制备式(I)化合物的方法的一些实施方案中,所述方法使得式(II)化合物的C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)。
本公开的另一方面涉及用于制备包含式(I)化合物的混合物的方法,
其中所述方法包括使包含式(II)化合物和式(IIa)化合物的混合物
与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1或SEQ ID NO:43-49的序列具有至少70%一致性或相似性,优选与SEQ ID NO:1的序列具有至少70%的一致性或相似性的氨基酸序列,并且在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,并且其中R选自H和C1-C4烷基。
在用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述方法使得所述包含式(I)化合物的混合物还包含式(Ia)化合物
其中R选自H和C1-C4烷基。在一些实施方案中,所述式(Ia)化合物具有式(V)的构型
其中R选自H和C1-C4烷基。
在用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述方法使得包含式(II)化合物和式(IIa)化合物的混合物包含以下中的任何一种:
i)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)
ii)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
iii)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体)
iv)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
v)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体),和式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
vi)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
vii)i)至vi)的任意组合。
在用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述方法使得包含式(II)化合物和式(IIa)化合物的混合物包含:
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体),
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体),
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,式(III)化合物作为副产物制备,
其中R选自H和C1-C4烷基。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,具有式(IIIa)中所示的相对构型的化合物作为副产物制备:
其中R选自H和C1-C4烷基。
在用于制备包含式(I)化合物的混合物的方法的一些实施方案中,式(VI)化合物作为副产物制备,
其中R选自H和C1-C4烷基。
在用于制备包含式(I)化合物的混合物的方法的一些实施方案中,具有式(VIa)中所示的相对构型的化合物作为副产物制备:
其中R选自H和C1-C4烷基。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,R是甲基。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶包含与SEQ ID NO:1的序列具有至少70%一致性或相似性的氨基酸序列,并且所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一至七个,优选二至六个,更优选三至五个氨基酸置换。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,166,211,212,355,483和539的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,166,211,212,483和539,优选对应于SEQ ID NO:1中位置2,5,35,166,211,483和539的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶包含选自以下的相对于SEQ ID NO:1的氨基酸置换:
(i)在对应于SEQ ID NO:1中位置2的位置处的天冬酰胺(N)残基;
(ii)在对应于SEQ ID NO:1中位置5的位置处的脯氨酸(P)残基;
(iii)在对应于SEQ ID NO:1中位置35的位置处的丙氨酸(A)残基;
(iv)在对应于SEQ ID NO:1中位置116的位置处的苏氨酸(T)残基;
(v)在对应于SEQ ID NO:1中位置166的位置处的丙氨酸(A)残基;
(vi)在对应于SEQ ID NO:1中位置211的位置处的缬氨酸(V)残基;
(vii)在对应于SEQ ID NO:1中位置212的位置处的精氨酸(R)残基;
(viii)在对应于SEQ ID NO:1中位置317的位置处的甲硫氨酸(M)残基;
(ix)在对应于SEQ ID NO:1中位置355的位置处的苏氨酸(T)残基;
(x)在对应于SEQ ID NO:1中位置382的位置处的苏氨酸(T)残基;
(xi)在对应于SEQ ID NO:1中位置399的位置处的缬氨酸(V)残基;
(xii)在对应于SEQ ID NO:1中位置483的位置处的半胱氨酸(C)残基;
(xiii)在对应于SEQ ID NO:1中位置539位置处的组氨酸(H)残基;
(xiv)在对应于SEQ ID NO:1中位置585的位置处的丙氨酸(A)残基;或
(xv)其任何组合。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶包含选自以下SEQ ID NO:1中相应位置处的相对于SEQ ID NO:1的氨基酸置换:
(i)I2N,T35A,A355T和L539H;
(ii)T166A;
(iii)I2N和Y483C;
(iv)I2N,Y483C和L539H;
(v)I2N,L5P,T35A,L539H;
(vi)I2N,L5P,T35A和Y483C;
(vii)I2N,L5P,T35A,T166A和L539H;
(viii)I2N,L5P,T35A,T166A,E211V和L539H
(ix)I2N,L5P,T35A,E211V,S212R,Y483C和L539H
(x)I2N,T166A和Y483C;
(xi)I2N,T166A,Y483C和L539H;
(xii)I2N,T166A,E211V和Y483C;或
(xiii)I2N,T166A,E211V,Y483C和L539H。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N和T166A。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶还包含选自L5P,T35A,E211V,Y483C和L539H的相对于SEQ IDNO:1的一个或多个的置换。
在用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法的一些实施方案中,所述SHC酶还包含与SEQ ID NO:4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40或42,优选SEQ ID NO:4,6,18,20,22,24,30,32,34,36,38,40或42,更优选SEQ ID NO:30,32,34,36,38,40或42,最优选SEQ ID NO:30,38,40,42中的任何一个至少90%相同的氨基酸序列。
本公开的另一方面涉及包含编码如在任何用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法中所述的角鲨烯何帕烯环化酶(SHC)酶的核苷酸序列的核酸分子。
本公开的另一方面涉及包含本公开的核酸分子的载体。
本公开的另一方面涉及包含本公开的核酸分子或本公开的载体的宿主细胞。
本公开的另一个方面涉及如在任何用于制备式(I)化合物的方法和用于制备包含式(I)化合物的混合物的方法中所述的角鲨烯何帕烯环化酶(SHC)酶。
本公开的另一个方面涉及包含式(I)化合物和式(Ia)化合物的组合物,其中所述组合物通过制备包含本公开的式(I)化合物的混合物而获得或可通过制备包含本公开的式(I)化合物的混合物而获得。
在一些实施方案中,所述组合物使得式(I)化合物和式(Ia)化合物为固体形式,优选为无定形或结晶形式。在一些实施方案中,所述组合物使得式(Ia)化合物具有式(V)的构型。
本公开的另一方面涉及本公开的组合物用于制备香料组合物或消费品的用途。
本公开的另一方面涉及包含本公开组合物的香料组合物或消费品。
本公开的另一方面涉及一种混合物,其包含可通过用于制备本公开化合物的任何方法中所述的方法而获得的产物,其中所述混合物包含I,Ia,III,IIIa,IV,IVa,V,Va,VI和/或VIa。
本公开的另一方面涉及本公开的组合物,其中所述组合物包含式(I)化合物和/或式(Ia)化合物,并且还包含III,IIIa,IV,IVa,V,Va和VI和/或VIa。
说明
仍然需要提供新的,更有效的,成本有效的和可持续的方法来生产龙涎缩醛和龙涎缩醛同系物。通过在工业相关条件下获得改进的底物转化率和产物收率,降低的副产物收率和改进的总体反应性能,可以增强龙涎缩醛和龙涎缩醛同系物生产方法的经济可行性和可持续性。因此,仍然需要改进的龙涎缩醛和龙涎缩醛同系物生产方法。因此,仍然需要改进的SHC酶和表达所述酶的宿主细胞,用于生产龙涎缩醛和龙涎缩醛同系物。
本发明人惊奇地发现,本文所述的角鲨烯-何帕烯环化酶(SHC)酶能够将式(IIa)化合物转化为本文后面所述的式(Ia)化合物。它们还能够将其中式(II)化合物和式(IIa)化合物包含在混合物中的式(II)化合物和/或式(IIa)化合物分别转化为式(I)化合物和式(Ia)化合物。此外,对应于角鲨烯-何帕烯环化酶(SHC)酶的一个或多个特定位置的氨基酸残基的置换导致改进的式(II)化合物至式(I)化合物的转化和/或改进的式(IIa)化合物至式(Ia)化合物的转化,如本文后面所述。
特别地,如本文别处和实验部分所述,本文所述的方法、酶和宿主细胞发挥至少一种、至少两种或所有以下有利效果:
●改进的式(II)化合物和/或式(IIa)化合物的转化率
●改进的式(I)化合物和/或式(Ia)化合物的收率
●改进的反应性能(例如在高底物浓度下的转化率、生产率、收率
因此,本公开的方面和实施方面解决了本文所讨论的至少一些问题和需求。
方法
本文所述的方法可包括通过本公开的SHC酶将式(II)化合物酶促转化为式(I)化合物。本文所述的方法可包括通过本公开的SHC酶将式(IIa)化合物酶促转化为式(Ia)化合物。本文所述的方法可包括将式(II)化合物和/或式(IIa)化合物(其中所述式(II)化合物和式(IIa)化合物包含在混合物中)分别酶促转化为式(I)化合物和/或式(Ia)化合物或包含式(I)化合物和/或式(Ia)化合物的混合物。
因此,在一个方面,本公开提供了用于制备式(I)化合物的方法,
其中所述方法包括使式(II)化合物
与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触。
在一个方面,本公开提供了用于制备式(Ia)化合物的方法,
其中所述方法包括使式(IIa)化合物
与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触。
在一个方面,本公开提供了用于制备包含式(I)化合物和/或式(Ia)化合物的混合物的方法,其中所述方法包括使式(II)化合物和/或式(IIa)化合物与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触。式(II)化合物和/或式(IIa)化合物可以存在于混合物中。
在一些实施方案中,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1或SEQID NO:43-49的序列具有至少30%,40%,50%,60%或70%,优选至少70%一致性或相似性的氨基酸序列。
在优选的实施方案中,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1的序列具有至少30%,40%,50%,60%或70%,优选至少70%一致性或相似性的氨基酸序列,优选地,其中所述SHC酶包含相对于SEQ ID NO:1的一个或多个氨基酸置换。优选地,所述相对于SEQ ID NO:1的一个或多个氨基酸置换是在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处。
本公开的SHC酶在下文中更详细地描述。
本文所述的所有化学式中的R可以选自H(氢)和C1-C4烷基。在一些实施方案中,R是H(氢)。在一些实施方案中,R是乙基。在一些实施方案中,R是正丙基。在一些实施方案中,R是异丙基。在优选的实施方案中,R是甲基。
因此,在一些实施方案中,提供了制备式(I)化合物的方法,其中所述方法包括使式(II)化合物与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1的序列具有至少70%一致性或相似性的氨基酸序列,其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,并且其中R选自H和C1-C4烷基,优选地其中R是甲基。
在一些实施方案中,提供了制备包含式(I)化合物的混合物的方法,其中所述方法包括将包含式(II)化合物和式(IIa)化合物的混合物与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQ ID NO:1或SEQ ID NO:43-49的序列具有至少70%一致性或相似性,优选与SEQ ID NO:1的序列具有至少70%的一致性或相似性的氨基酸序列,并且在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,并且其中R选自H和C1-C4烷基,优选地其中R是甲基。在一些实施方案中,所述包含式(I)化合物的混合物还包含式(Ia)化合物,其优选具有式(V)化合物的构型,如本文后面所述。
如本文所用,“接触”可对应于化合物与本文所述的角鲨烯-何帕烯环化酶(SHC)酶的物理相互作用,其促进酶催化的反应。
“与式(II)化合物接触”和“与式(IIa)化合物接触”可对应于与这些化合物的单一异构体或与这些化合物的异构体的混合物接触。本文所用的化合物的“异构体”优选是指该化合物的立体异构体。
SHC酶可以在宿主细胞中产生,如本文后面所述。这种宿主细胞可用于本文所述的方法中。在一些实施方案中,所述SHC酶可与膜(例如细胞膜或其上固定有SHC酶的膜)缔合,以接收底物(例如式(II)化合物和/或式(IIa)化合物)和/或与底物(例如式(II)化合物和/或式(IIa)化合物)相互作用,所述膜(例如细胞膜)可以是完整细胞(例如重组宿主细胞,如本文后面所述)的一部分。SHC酶也可存在于粗细胞提取物或无细胞提取物中。因此,本领域技术人员理解,所述“接触”也可对应于化合物与表达本文后面所述的SHC酶的细胞,与所述细胞的膜级分,与所述细胞的细胞粗提物,或与所述细胞的无细胞提取物的物理相互作用。SHC酶也可以是固定形式(例如与酶载体缔合),其允许SHC酶与底物(例如式(II)化合物和/或式(IIa)化合物)相互作用。“固定”的描述将在下文中提供。SHC酶也可以以可溶形式使用。
式(II)化合物和(IIa)化合物
式(II)化合物、式(IIa)化合物以及包含它们的混合物在本文中可替换地地称为“底物”,“(生物)转化底物”或“反应底物”,所有术语可以互换。式(II)化合物中碳原子的编号如下:
式(IIa)化合物中碳原子的编号如下:
式(IIa)化合物是式(II)化合物的“结构异构体”。本文所述的SHC酶特别适用于将式(II)化合物和/或式(IIa)化合物转化为有用的产物,如本文后面所述。
在包括与式(II)化合物的异构体的混合物接触的实施方案中,至少一种异构体被转化为式(I)化合物。在包括与式(IIa)化合物的异构体的混合物接触的实施方案中,至少一种异构体被转化为式(Ia)化合物。在包括与包含式(II)化合物和式(IIa)化合物的混合物接触的实施方案中,式(II)化合物可以转化为式(I)化合物和/或式(IIa)化合物可以转化为式(Ia)化合物。
式(II)化合物和(IIa)化合物可以以四种不同异构体的形式存在,例如,作为具有E,E-、Z,E-、Z,Z-或E,Z-构型的式(II)化合物或式(IIa)化合物,或在本文中称为E,E-、Z,E-、Z,Z-或E,Z-异构体。在一些实施方案中,式(II)化合物的C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)。在一些实施方案中,式(II)化合物的C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)。
C-8和C-9之间的双键具有Z-构型并且C-4和C-5之间的双键具有E-构型的式(II)化合物对应于Z,E-异构体。C-8和C-9之间的双键具有Z-构型并且C-4和C-5之间的双键具有Z-构型的式(II)化合物对应于Z,Z-异构体。
在一些实施方案中,式(IIa)化合物的C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体)。在一些实施方案中,式(IIa)化合物的C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)。
C-6和C-7之间的双键具有Z-构型并且C-2和C-3之间的双键具有E-构型的的式(IIa)化合物对应于Z,E-异构体。C-6和C-7之间的双键具有Z-构型并且C-2和C-3之间的双键具有Z-构型的式(IIa)化合物对应于Z,Z-异构体。
在一些实施方案中,式(II)化合物是其两种或多于两种异构体的混合物。在一些实施方案中,所述混合物包含式(II)化合物的E,E-异构体和一种或多种其他异构体。在一些实施方案中,所述混合物包含式(II)化合物的E,Z-异构体和一种或多种其他异构体。因此,在一些实施方案中,所述混合物可包含E,E-和Z,E-异构体。在一些实施方案中,所述混合物可包含E,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-和E,Z-异构体。在一些实施方案中,所述混合物可包含E,Z-和Z,E-异构体。在一些实施方案中,所述混合物可包含E,Z-和Z,Z-异构体。
在一些实施方案中,式(IIa)化合物是其两种或多于两种异构体的混合物。在一些实施方案中,所述混合物包含式(IIa)化合物的E,E-异构体和一种或多种其他异构体。在一些实施方案中,所述混合物包含式(IIa)化合物的E,Z-异构体和一种或多种其他异构体。因此,在一些实施方案中,所述混合物可包含E,E-和Z,E-异构体。在一些实施方案中,所述混合物可包含E,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-和E,Z-异构体。在一些实施方案中,所述混合物可包含E,Z-和Z,E-异构体。在一些实施方案中,所述混合物可包含E,Z-和Z,Z-异构体。
在一些实施方案中,式(II)化合物是其三种或多于三种异构体的混合物。在一些实施方案中,所述混合物包含式(II)化合物的E,E-异构体和两种或更多种其他异构体。在一些实施方案中,所述混合物包含式(II)化合物的E,Z-异构体和两种或多种其他异构体。因此,在一些实施方案中,所述混合物可包含E,E-、Z,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-、Z,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-、Z,E-和E,Z-异构体。在一些实施方案中,所述混合物可包含Z,E-、Z,Z-和E,Z-异构体。
在一些实施方案中,式(IIa)化合物是其三种或多于三种异构体的混合物。在一些实施方案中,所述混合物包含式(IIa)化合物的E,E-异构体和两种或更多种其他异构体。在一些实施方案中,所述混合物包含式(IIa)化合物的E,Z-异构体和两种或更多种其他异构体。因此,在一些实施方案中,所述混合物可包含E,E-、Z,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-、Z,E-和Z,Z-异构体。在一些实施方案中,所述混合物可包含E,E-、Z,E-和E,Z-异构体。在一些实施方案中,所述混合物可包含Z,E-、Z,Z-和E,Z-异构体。
在一些实施方案中,式(II)化合物是包含E,Z-、E,E-、Z,E-和Z,Z-异构体的混合物。优选的混合物包含式(II)化合物的E,Z-异构体和/或E,E-异构体,优选E,Z-异构体。
在一些实施方案中,式(IIa)化合物是包含E,Z-、E,E-、Z,E-和Z,Z-异构体的混合物。优选的混合物包含式(IIa)化合物的E,Z-异构体和/或E,E-异构体,优选E,Z-异构体。
在一些实施方案中,混合物包含式(II)化合物的E,Z-异构体和/或式(II)化合物的E,E-异构体,优选式(II)化合物的E,Z-异构体,和式(IIa)化合物的E,Z-异构体和/或式(IIa)化合物的E,E-异构体,优选式(IIa)化合物的E,Z-异构体。任选地,式(II)化合物的Z,E-异构体,式(II)化合物的Z,Z-异构体,式(IIa)化合物的Z,E-异构体和/或式(IIa)化合物的Z,Z-异构体可包含在混合物中。
在一些实施方案中,本文所述的方法包括使式(II)化合物的E,Z-异构体与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触。在一些实施方案中,本文所述的方法包括使式(IIa)化合物的E,Z-异构体和/或E,E-异构体,优选式(IIa)化合物的E,Z-异构体与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触。
在一些实施方案中,本文所述的方法包括使混合物与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触,所述混合物包含式(II)化合物的E,E-异构体和E,Z-异构体、基本上由其组成或由其组成。在一些实施方案中,所述混合物包含式(II)化合物的Z,E-异构体和Z,Z-异构体中的至少一种或两种。在一些实施方案中,所述混合物不包含式(II)化合物的Z,E-异构体和Z,Z-异构体中的一种或两种。
在一些实施方案中,本文所述的方法包括使混合物与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触,所述混合物包含式(IIa)化合物的E,E-异构体和E,Z-异构体、基本上由其组成或由其组成。在一些实施方案中,所述混合物包含式(IIa)化合物的Z,E-异构体和Z,Z-异构体中的至少一种或两种。在一些实施方案中,所述混合物不包含式(IIa)化合物的Z,E-异构体和Z,Z-异构体中的一种或两种。
在一些实施方案中,本文所述的方法包括使混合物与本文所述的角鲨烯-何帕烯环化酶(SHC)酶接触,所述混合物包含式(II)化合物的E,E-异构体和式(II)化合物的E,Z-异构体和/或式(IIa)化合物的E,E-异构体和/或式(IIa)化合物的E,Z-异构体、基本上由其组成或由其组成。在一些实施方案中,所述混合物包含式(II)化合物的Z,E-异构体和Z,Z-异构体中的至少一种或两种。在一些实施方案中,所述混合物包含式(IIa)化合物的Z,E-异构体和Z,Z-异构体中的至少一种或两种。在一些实施方案中,所述混合物不包含式(II)化合物的Z,E-异构体和Z,Z-异构体中的一种或两种。在一些实施方案中,所述混合物不包含式(IIa)化合物的Z,E-异构体和Z,Z-异构体中的一种或两种。
在包含式(II)化合物的E,Z-异构体和式(II)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于96:4或约96:4。在一些实施方案中,所述比例等于或大于97:3或约97:3。在一些实施方案中,所述比例等于或大于98:2或约98:2。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(II)化合物的E,Z-异构体和式(II)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。
在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(II)化合物的E,Z-异构体和式(II)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为10:90至99:1,10:90至90:1,20:80至80:20,50:50至80:20,或60:40至80:20。
在包含式(IIa)化合物的E,Z-异构体和式(IIa)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(IIa)化合物的E,Z-异构体和式(IIa)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(IIa)化合物的E,Z-异构体和式(IIa)化合物的一种或多种其他异构体的混合物中,E,Z-异构体与组合的所有其他异构体的比例可以为10:90至99:1,10:90至90:1,20:80至80:20,50:50至80:20,或60:40至80:20。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为10:90至99:1或约10:90至约99:1,10:90至90:1或约10:90至约90:1,20:80至80:20或约20:80至约80:20,50:50至80:20或约50:50至约80:20,或60:40至80:20或约60:40至80:20。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为10:90至99:1或约10:90至约99:1,10:90至90:1或约10:90至约90:1,20:80至80:20或约20:80至约80:20,50:50至80:20或约50:50至约80:20,或60:40至80:20或约60:40至80:20。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,Z-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,Z-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。
在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,Z-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,Z-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,Z-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,Z-异构体的比例可以为10:90至99:1,10:90至90:1,20:80至80:20,50:50至80:20,或60:40至80:20。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,E-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,E-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80。在一些实施方案中,所述比例等于或大于30:70或约30:70。在一些实施方案中,所述比例等于或大于40:60或约40:60。在一些实施方案中,所述比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,E-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,E-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于40:60或约40:60。在一些实施方案中,所述比例等于或小于30:70或约30:70。在一些实施方案中,所述比例等于或小于20:80或约20:80。在一些实施方案中,所述比例等于或小于10:90或约10:90。
在包含式(II)化合物的E,Z-异构体和式(IIa)化合物的E,E-异构体的混合物中,式(II)化合物的E,Z-异构体与式(IIa)化合物的E,E-异构体的比例可以为10:90至99:1,10:90至90:1,20:80至80:20,50:50至80:20,或60:40至80:20。
本领域技术人员理解,上述比例可以例如通过除以立体异构体重量或浓度来确定。
异构体混合物中给定异构体与一种或多种其他异构体的比例可以使用本领域技术人员可获得的常规方法来定量,例如气相色谱法,任选地与质谱法和核磁共振(NMR)光谱法结合,其实例可以在本领域的标准手册中找到,例如Encyclopedia of AnalyticalScience:3rd Edition,Eds.Paul Worsfold,Alan Townshend,Colin Poole,Manuel Miro,Elsevier(2019),其全部内容通过引用并入本文。本领域技术人员理解,这些方法也可用于量化混合物(例如水溶液)中异构体的浓度。混合物中异构体的浓度可以用多个定量单位表示,例如体积摩尔浓度,质量摩尔浓度,质量百分数,千分之几(ppth),百万分之几(ppm)和十亿分之几(ppb)。这些单位的相互转换以及基于浓度值计算给定混合物中的异构体重量都在本领域技术人员的能力范围内。
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。优选地,R是甲基。其中R是甲基的式(II)化合物可称为羟基金合欢基丙酮(HFA),包括相应的化合物E,E-羟基金合欢基丙酮(E,E-HFA)、Z,E-羟基金合欢基丙酮(Z,E-HFA)、Z,Z-羟基金合欢基丙酮(Z,Z-HFA)和E,Z-羟基金合欢基丙酮(E,Z-HFA)及其混合物。在羟基金合欢基丙酮的异构体中,E,Z-羟基金合欢基丙酮是优选的。
在式(IIa)化合物的异构体中,E,Z-异构体和E,E-异构体是优选的,E,Z-异构体是进一步优选的。
因此,在一些实施方案中,包含式(II)化合物和式(IIa)化合物的混合物包含以下中的任何一种:
i)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)
ii)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
iii)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体)
iv)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
v)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体),和式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
vi)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
vii)i)至vi)的任意组合。
在一些实施方案中,包含式(II)化合物和式(IIa)化合物的混合物包含:
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体),
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体),
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)。
这样的混合物可以任选地以特定的式(II)化合物的E,Z-异构体:式(II)化合物的E,E-异构体:式(IIa)化合物的E,Z-异构体:式(IIa)化合物的E,E-异构体的比例,例如但不限于37:9:29:16或约37:9:29:16,或27:36:13:24或约27:36:13:24包含式(II)化合物的异构体和式(IIa)化合物的异构体。任选地,所述混合物包含式(II)化合物的Z,E-异构体、式(II)化合物的Z,Z-异构体、式(IIa)化合物的Z,E-异构体和/或式(IIa)化合物的Z,Z-异构体。
本领域技术人员理解,在本公开的上下文中,在“与式(II)化合物接触”之后,没有必要将所有的化合物都转化为式(I)化合物。类似地,在“与式(IIa)化合物接触”之后,没有必要将所有化合物都转化为式(Ia)化合物。作为例子,可能形成反应副产物(例如本文后面描述的那些),或式(II)化合物和/或式(IIa)化合物可能未完全转化。作为另一个实例,在包含式(II)化合物的两种或多种异构体的混合物中,并非所有异构体都必须转化为式(I)化合物。作为另一个实例,在包含式(IIa)化合物的两种或多种异构体的混合物中,并非所有异构体都必须转化为式(Ia)化合物。作为另一个实例,在包含式(II)化合物和式(IIa)化合物的混合物中,不是所有的式(II)化合物必须转化为式(I)化合物和/或不是所有的式(IIa)化合物必须转化为式(Ia)化合物。
在一些实施方案中,不是所有的式(II)化合物都转化为式(I)化合物或反应副产物,从而得到包含式(II)化合物和式(I)化合物的产物,例如组合物。在一些实施方案中,可以从产物(例如组合物)中分离和/或纯化产物中的任何未转化的式(II)化合物,从而获得不包含任何式(II)化合物的产物。在一些实施方案中,所有的式(II)化合物都转化为式(I)化合物或反应副产物。
在一些实施方案中,不是所有的式(IIa)化合物都转化为式(Ia)化合物或反应副产物,从而得到包含式(IIa)化合物和式(Ia)化合物的产物,例如组合物。在一些实施方案中,可以从产物(例如组合物)中分离和/或纯化产物中的任何未转化的式(IIa)化合物,从而获得不包含任何式(IIa)化合物的产物。在一些实施方案中,所有的式(IIa)化合物都转化为式(Ia)化合物或反应副产物。
在一些实施方案中,在包含式(II)化合物和式(IIa)化合物的混合物中,不是所有的式(II)化合物都转化为式(I)化合物或反应副产物和/或不是所有的式(IIa)化合物都转化为式(Ia)化合物或反应副产物。在一些实施方案中,可以从产物(例如组合物)中分离和/或纯化产物中的任何未转化的式(II)化合物和/或式(IIa)化合物,从而获得不包含任何式(II)化合物和/或式(IIa)化合物的产物。在一些实施方案中,所有的式(II)化合物都转化为式(I)化合物或反应副产物。在一些实施方案中,所有的式(IIa)化合物都转化为式(Ia)化合物或反应副产物。
分离和/或纯化将在下文中讨论。
在其中式(II)化合物和/或式(IIa)化合物对应于异构体的混合物的实施方案中,各种异构体的存在可能影响转化;例如,可能降低反应速率。
因此,本文所述的SHC酶可能能够从式(II)化合物的异构体的混合物中将式(II)化合物的E,Z-异构体转化为式(I)化合物。本文所述的SHC酶能够从式(IIa)化合物的异构体的混合物中将式(IIa)化合物的E,Z-异构体转化为式(Ia)化合物。
本文所述的SHC酶能够从包含式(II)化合物和式(IIa)化合物的异构体的混合物中将式(II)化合物的E,Z-异构体转化为式(I)化合物。
本文所述的SHC酶能够从包含式(IIa)化合物和式(II)化合物的异构体的混合物中将式(IIa)化合物的E,Z-异构体转化为式(Ia)化合物。
混合物可包含式(II)化合物的两种异构体,例如E,Z-异构体和E,E-异构体。所述混合物可包含式(II)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一。所述混合物可包含式(II)化合物的四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体。式(II)化合物的其他异构体的存在可能降低E,Z-异构体转化为式(I)化合物的转化率。不希望受理论的束缚,一种可能的解释可以是其他异构体可以与式(II)的E,Z-异构体竞争接近SHC酶,并因此可以作为将式(II)化合物的E,Z-异构体转化为式(I)化合物的竞争性抑制剂和/或作为替代底物。因此,反应底物可以指式(II)化合物的2-4个异构体,优选两个异构体的异构体混合物。在一些实施方案中,反应底物包含式(II)化合物的E,Z-异构体和E,E-异构体的异构体混合物、基本上由其组成或由其组成。
混合物可包含式(IIa)化合物的两种异构体,例如E,Z-异构体和E,E-异构体。所述混合物可包含式(IIa)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一。所述混合物可包含式(IIa)化合物的四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体。因此,反应底物可以指式(IIa)化合物的2-4个异构体,优选两个异构体的异构体混合物。在一些实施方案中,反应底物包含式(IIa)化合物的E,Z-异构体和E,E-异构体的异构体混合物、基本上由其组成或由其组成。
混合物可包含式(II)化合物的两种异构体,例如E,Z-异构体和E,E-异构体,以及式(IIa)化合物的两种异构体,例如E,Z-异构体和E,E-异构体。所述混合物可包含式(II)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一,以及式(IIa)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一。所述混合物可包含式(II)化合物的四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体,以及式(IIa)化合物的四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体。
因此,反应底物可以是式(II)化合物的2-4个异构体(优选两个异构体)和式(IIa)化合物的2-4个异构体(优选两个异构体)的异构体混合物。
在一些实施方案中,反应底物包含式(II)化合物的E,Z-异构体、式(II)化合物的E,E-异构体、式(IIa)化合物的E,Z-异构体和式(IIa)化合物的E,E-异构体的异构体混合物、基本上由其组成或由其组成。
式(II)化合物和式(IIa)化合物可以按照Fujiwara et al.(TetrahedronLetters,1995Vol 36(46),8435-8438)描述的通用方法合成,其全部内容通过引用并入本文。GB2108985.9中描述了另一种通用方法,其全部内容通过引用并入本文。
或者式(II)化合物可以如图1中简要说明的那样获得,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。
式(I)化合物和(Ia)化合物
如本文所用,“制备式(I)化合物”和“制备式(Ia)化合物”也可以称为“生产”或“获得”各个化合物。它也可以指“生产”或“获得”混合物,所述混合物包含各个化合物、基本上由其组成或由其组成。
式(I)化合物和(Ia)化合物包含许多手性碳原子。因此,可以存在式(I)化合物和(Ia)化合物的一种或多种异构体,例如对映异构体和非对映异构体。除式(I)化合物外,通过本文所述的方法制备的产物可包含式(I)化合物的一种或多种其他异构体。除了式(Ia)化合物之外,通过本文所述的方法制备的产物可包含式(Ia)化合物的一种或多种其他异构体。在本文中,这些其他异构体可以代表酶促转化的副产物。通过本文所述的方法获得的异构体可取决于与本文所述的SHC酶接触的式(II)化合物和/或式(IIa)化合物的异构体。
作为非限制性实例,使式(II)化合物与本文所述的SHC酶接触可制备式(IV)化合物:
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地其中R是甲基。
其中R是甲基的式(IV)化合物也称为(-)-表-8-龙涎缩醛。其中R是甲基的式(I)化合物也称为(+)-龙涎缩醛。因此,在一些实施方案中,制备式(I)化合物和式(I)化合物的一种或多种其他异构体,例如但不限于式(IV)化合物,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。因此,产物(例如本文后面描述的组合物)可包含式(I)化合物并任选地包含式(I)化合物的一种或多种其他异构体,例如但不限于式(IV)化合物,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。
优选的式(Ia)化合物具有式(V)的构型:
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。
因此,在一些实施方案中,本文所述的方法导致制备了式(V)化合物。因此,产物(例如本文后面描述的组合物)可包含式(V)化合物并任选地包含式(Ia)化合物的一种或多种其他异构体,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。
在一些实施方案中,本文所述的方法导致产物,例如本文后面所述的组合物,其可包含式(I)化合物和式(V)化合物,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。任选地,所述产物可包含式(I)化合物的一种或多种其他异构体,例如但不限于式(IV)化合物,和/或式(Ia)化合物的一种或多种其他异构体。
在一些实施方案中,式(I)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(I)化合物的所有其他异构体的比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于55:45或约55:45。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于65:35或约65:35。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于75:25或约75:25。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在一些实施方案中,式(V)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(Ia)化合物的所有其他异构体的比例等于或大于50:50或约50:50。在一些实施方案中,所述比例等于或大于55:45或约55:45。在一些实施方案中,所述比例等于或大于60:40或约60:40。在一些实施方案中,所述比例等于或大于65:35或约65:35。在一些实施方案中,所述比例等于或大于70:30或约70:30。在一些实施方案中,所述比例等于或大于75:25或约75:25。在一些实施方案中,所述比例等于或大于80:20或约80:20。在一些实施方案中,所述比例等于或大于85:15或约85:15。在一些实施方案中,所述比例等于或大于90:10或约90:10。在一些实施方案中,所述比例等于或大于95:5或约95:5。在一些实施方案中,所述比例等于或大于99:1或约99:1。
在一些实施方案中,通过本文所述的方法仅制备式(I)化合物,而不制备式(I)化合物的其他异构体,例如不制备式(IV)化合物,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。在一些实施方案中,通过本文所述的方法仅制备式(V)化合物,而不制备式(Ia)化合物的其他异构体,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。
在一些实施方案中,除了式(I)化合物和/或式(V)化合物之外的任何异构体可以从通过本文所述的方法制备的产物(例如组合物)中分离,使得获得不包含任何其他异构体的产物;例如将式(IV)化合物,任选地其中R是H(氢)、甲基或乙基,从产物中分离出并且不再存在于产物中。换言之,本文所述的组合物可以例如包含100wt%的式(I)化合物并且不包含该化合物的其他异构体(或本文称为100:0的比例)。类似地,本文所述的组合物可以例如包含100wt%的式(V)化合物并且不包含式(Ia)化合物的其他异构体。本文所述的组合物可以例如是混合物,所述混合物包含式(I)化合物和式(V)化合物、基本上由组成或由其组成,优选包含式(I)化合物和式(V)化合物。分离方法是本领域技术人员已知的并在本文前面讨论过。
在一些实施方案中,式(I)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(I)化合物的所有其他异构体的比例等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于98:2或约98:2。在一些实施方案中,所述比例等于或小于97:3或约97:3。在一些实施方案中,所述比例等于或小于96:4或约96:4。在一些实施方案中,所述比例等于或小于95:5或约95:5。
在一些实施方案中,式(I)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(I)化合物的所有其他异构体的比例可以为50:50至100:0或约50:50至约100:0,60:40至99:1或约60:40至约99:1,70:30至98:2或约70:30至约98:2,80:20至97:3或约80:20至约97:3,或90:10至97:3或约90:10至约97:3。
在一些实施方案中,式(V)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(Ia)化合物的所有其他异构体的比例等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于98:2或约98:2。在一些实施方案中,所述比例等于或小于97:3或约97:3。在一些实施方案中,所述比例等于或小于96:4或约96:4。在一些实施方案中,所述比例等于或小于95:5或约95:5。
在一些实施方案中,式(V)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的组合的式(Ia)化合物的所有其他异构体的比例可以为50:50至100:0或约50:50至约100:0,60:40至99:1或约60:40至约99:1,70:30至98:2或约70:30至约98:2,80:20至97:3或约80:20至约97:3,或90:10至97:3或约90:10至约97:3。
在一些实施方案中,式(I)化合物与通过本文所述的方法制备的或包含在本文所述的产物(例如组合物)中的式(Ia)化合物(例如式(V)化合物)的比例等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于98:2或约98:2。在一些实施方案中,所述比例等于或小于97:3或约97:3。在一些实施方案中,所述比例等于或小于96:4或约96:4。在一些实施方案中,所述比例等于或小于95:5或约95:5。在一些实施方案中,所述比例等于或小于94:6或约94:6。在一些实施方案中,所述比例等于或小于93:7或约93:7。在一些实施方案中,所述比例等于或小于92:8或约92:8。在一些实施方案中,所述比例等于或小于91:9或约91:9。在一些实施方案中,所述比例等于或小于90:10或约90:10。在一些实施方案中,所述比例等于或小于85:15或约85:15。在一些实施方案中,所述比例等于或小于80:20或约80:20。在一些实施方案中,所述比例等于或小于75:25或约75:25。在一些实施方案中,所述比例等于或小于70:30或约70:30。在一些实施方案中,所述比例等于或小于65:35或约65:35。在一些实施方案中,所述比例等于或小于60:40或约60:40。在一些实施方案中,所述比例等于或小于55:45或约55:45。在一些实施方案中,所述比例等于或小于50:50或约50:50。在一些实施方案中,所述比例等于或小于49:51或约49:51。在一些实施方案中,所述比例等于或小于49:51或约49:51。在一些实施方案中,所述比例等于或小于48:52或约48:52。在一些实施方案中,所述比例等于或小于47:53或约47:53。在一些实施方案中,所述比例等于或小于46:54或约46:54。在一些实施方案中,所述比例等于或小于45:55或约45:55。在一些实施方案中,所述比例等于或小于44:56或约44:56。在一些实施方案中,所述比例等于或小于43:57或约43:57。在一些实施方案中,所述比例等于或小于42:58或约42:58。在一些实施方案中,所述比例等于或小于41:59或约41:59。在一些实施方案中,所述比例等于或小于40:60或约40:60。
在一些实施方案中,式(I)化合物与通过本文所述的方法制备的或包含在本文所述的在产物(例如组合物)中的式(Ia)化合物(例如式(V)化合物)的比例可以为40:60至100:0或约40:60至约100:0,60:40至99:1或约60:40至约99:1,70:30至98:2或约70:30至约98:2,80:20至97:3或约80:20至约97:3,或90:10至97:3或约90:10至97:3,或93:7到97:3或约97:3至约97。
式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的给定异构体与异构体混合物中各个化合物的一种或多种其他异构体的比例,以及异构体的量和浓度,可以如本文前面所讨论的进行测定,使用本领域技术人员可获得的常规方法,例如本领域技术人员可获得的气相色谱法(任选地在手性柱上)或NMR光谱法(任选地在位移试剂存在下)。相同的方法可用于测定式(I)化合物的给定异构体与式(V)化合物和/或与式(Ia)化合物的另一异构体的比例。
通过本文所述的方法制备的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以例如包含在混合物中。通过本文所述的方法制备的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以例如为固体形式,优选为无定形或结晶形式。通过本文所述的方法制备的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以例如在反应混合物的固相中。
这样的形式可能是有利的,因为固体形式/固相的化合物的存在可以简化化合物制备后的下游处理。作为非限制性实例,当表达本文所述的SHC酶的宿主细胞用作生物催化剂,并且式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)以固体形式(例如无定形或结晶形式)制备时,通过简单的技术例如过滤和/或离心,可以容易地从反应混合物(其也可对应于本文后面描述的细胞培养物)中分离所述化合物。任选地,所获得的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以如本文所述进一步分离和/或纯化,相对于其中式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)不以固体形式(例如无定形或结晶形式)制备的情况,在任何情况下需要更少的材料(例如溶剂)和/或更少的能量输入。
式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以在其制备后分离和/或纯化。因此,在一些实施方案中,分离式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)。任选地,对式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)进行纯化。本文所用的术语“分离”是指化合物(例如式(I)化合物和/或式(Ia)化合物(例如式(V)化合物))与伴随它的组分的分离(或本文称为“提取”)。化合物的分离程度或纯度可以通过本领域常用的任何方法测量,例如气相色谱(GC),色谱方法(例如HPLC)或NMR光谱,这些方法都是本领域技术人员已知的,并且总结在标准手册中,例如Encyclopedia of Analytical Science:3rdEdition(见上文)。
可以通过本领域中通常使用的任何方法来完成分离。合适的方法的实例包括蒸汽提取、蒸馏或使用与水不混溶的溶剂(其将反应产物和未反应的底物与留在水相中的生物催化剂分离)进行有机溶剂萃取,随后蒸发溶剂以获得粗反应产物,如通过气相色谱分析所测定的。这些方法是本领域技术人员已知的,并且总结在标准手册中,例如Encyclopediaof Analytical Science:3rd Edition(见上文)。
举例来说,所产生的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以使用有机溶剂例如非水混溶性溶剂(例如甲苯)从整个反应混合物中萃取。或者,可以使用水混溶性溶剂(例如乙醇)或非水混溶性溶剂(例如甲苯)从反应混合物的固相(通过例如离心或过滤获得)中提取产生的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)。作为进一步的实例,式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以作为晶体或以无定形形式存在于固相中,如本文前面所讨论的,并且也可以通过过滤从剩余的固相(细胞物质或其碎片)和液相中分离。作为进一步的实例,在高于式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)熔点的温度下,式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以在水相的顶部形成油层,该油层可以被除去和收集。为了确保在除去油层之后完全回收化合物,可以将有机溶剂加入到含有生物质的水相中,以萃取任何残留的包含在生物质中、生物质上或生物质周围的式(I)化合物(例如(+)-龙涎缩醛)和/或式(Ia)化合物(例如式(V)化合物)。有机层可以与油层合并,然后整体进一步处理以分离和纯化式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)。式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)可以进一步选择性地结晶以从最终产物中除去副产物和任何未反应的式(II)化合物和/或式(IIa)化合物。
纯化可以通过本领域中常用的任何方法来完成,这些方法是本领域技术人员已知的,并且在标准手册中进行了总结,例如Encyclopedia of Analytical Science:3rdEdition(见上文)。分离和纯化的其他实例在本文的实验部分中提供。
术语“选择性结晶”是指使式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)从溶剂中结晶,而副产物保持溶解在结晶溶剂中,溶解的程度使得分离的结晶物质仅含有式(I)化合物和/或式(Ia)化合物(例如式(V)化合物),或如果其含有任何副产物,则它们仅以嗅觉上可接受的量存在。例如,式(I)化合物不含或基本上不含副产物例如式(III)或(IlIa)化合物(本文后面描述)。例如,式(Ia)化合物,优选式(V)化合物,不含或基本上不含副产物,例如式(VI)或(VIa)化合物(本文后面描述)。选择性结晶步骤可以使用与水混溶的溶剂例如乙醇等。式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的选择性结晶可能受到未反应的式(II)化合物和/或未反应的式(IIa)化合物的存在以及式(I)化合物和/或式(Ia)(例如式(V))化合物与其他可检测副产物的比例的影响。即使式(II)化合物转化为式(I)化合物的转化率仅为10%,所产生的化合物的选择性结晶仍然是可能的。类似地,即使式(IIa)化合物转化为式(Ia)化合物,优选转化为式(V)化合物的转化率仅为10%,所产生的化合物的选择性结晶仍然是可能的。
所获得的最终式(I)化合物和/或最终式(Ia)化合物(例如式(V)化合物)的纯度可使用常规气相色谱(GC)技术测定。类似的技术也可应用于包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物。
包含式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物的产物可以通过测试结晶物质或结晶物质在乙醇中的溶液来测定。可以将包含式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物的产物对照可商购的式(I)化合物参比、可商购的式(Ia)化合物(例如式(V)化合物)参比或可商购的包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的参比混合物进行测试,由训练有素的嗅觉专家或训练有素的嗅觉专家小组进行嗅觉质量和感官分析。该产物也可以由训练有素的嗅觉专家在应用研究中进行测试,以确定该物质是否满足关于其嗅觉特征的规范,从而提供嗅觉上可接受的产品。
术语“嗅觉上纯的”,当其用于本公开的产物时,是指式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物产物不含化合物(II),(IIa),(III),(IIIa),(IV),(IVa),(V),(Va),(VI)和(Via)和/或在反应混合物中发现的任何其他物质,或者如果这样的化合物和/或物质应该存在,则它们以嗅觉上可接受的量存在,如该术语在本文中所定义的。
在本公开的一个实施方案中,嗅觉纯形式的式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物产物含有小于5%重量的化合物(II),(IIa),(III),(IIIa),(IV),(IVa),(V),(Va),(VI)和/或(VIa)中的每一种和/或在反应混合物中发现的任何其他物质。
在更具体的实施方案中,嗅觉纯形式的式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物产物含有小于4%,小于3%,小于2%,小于1%,小于0.9%,小于0.8%,小于0.7%,小于0.6%,小于0.5%,小于0.4%,小于0.3%,小于0.2%,小于0.1%或小于0.05%重量的化合物(II),(IIa),(III),(IIIa),(IV),(IVa),(V),(Va),(VI)和/或(VIa)中的每一种和/或在反应混合物中发现的任何其他物质。
在更具体的实施方案中,嗅觉纯形式的式(I)化合物、式(Ia)化合物(例如式(V)化合物)或包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物产物含有小于4%,小于3%,小于2%,小于1%,小于0.9%,小于0.8%,小于0.7%,小于0.6%,小于0.5%,小于0.4%,小于0.3%,小于0.2%,小于0.1%或小于0.05%重量的化合物(II),(IIa),(III),(IIIa),(IV),(IVa),(VI)和/或(VIa)中的每一种和/或在反应混合物中发现的任何其他物质。
适用于式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的萃取和/或选择性结晶的水混溶性和非水混溶性有机溶剂的非限制性实例包括脂族烃,优选具有5至8个碳原子的那些,例如戊烷,环戊烷,环己烷,庚烷,辛烷或环辛烷,芳族烃,例如甲苯,二甲苯,氯苯或二氯苯,脂族无环和环状醚或醇,优选具有4至8个碳原子的那些,例如乙醇,异丙醇,乙醚,甲基叔丁基醚,乙基叔丁基醚,二丙醚,二异丙醚,二丁醚,四氢呋喃,甲基四氢呋喃,或酯,例如乙酸乙酯或乙酸正丁酯,或酮,例如甲基异丁基酮,或其混合物。优选的溶剂是庚烷,甲基叔丁基醚(也称为MTBE,叔丁基甲基醚,叔丁基甲基醚和tBME),二异丙醚,四氢呋喃,甲基四氢呋喃,乙酸乙酯和/或其混合物。优选地,使用水混溶性溶剂例如乙醇从反应混合物的固相中萃取式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)。使用乙醇可能是有利的,因为它易于处理、无毒、环境友好并且可以使用可再生原料生产。
本文所用的术语“%纯度”是指作为材料中所需化合物的化合物在材料中的百分比(例如由所需化合物的质量相对于整个材料的质量的百分比表示)。在一些实施方案中,将式(I)化合物(例如(+)-龙涎缩醛)从获得的粗产物中分离并纯化至纯度为至少80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%或100%。
在一些实施方案中,将式(Ia)化合物,优选式(V)化合物,从获得的粗产物中分离并纯化至纯度为至少80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%或100%。
在一些实施方案中,将包含式(I)化合物(例如(+)-龙涎缩醛)和式(Ia)化合物(例如式(V)化合物)的产物从获得的粗产物中分离并纯化至纯度为至少80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%或100%。
在一些实施方案中,通过本文所述的方法获得的反应混合物或培养液中式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的浓度可以为1mg/L至20000mg/L(20g/L)或约1mg/L至约20000mg/L,或更高,例如20g/L至200g/L或约20g/L至约200g/L,100g/L至500g/L或约100g/L至约500g/L,150g/L至500g/L或约150g/L至约500g/L,250g/L至500g/L或约250g/L至约500g/L,300g/L至500g/L或约300g/L至约500g/L,350g/L至500g/L或约350g/L至约500g/L,400g/L至500g/L或约400g/L至约500g/L,或450g/L至500g/L或约450g/L至约500g/m。示例性的浓度值是1mg/L或更高,20g/L或更高,50g/L或更高,100g/L或更高,150g/L或更高,200g/L或更高,250g/L或更高,300g/L或更高,350g/L或更高,400g/L或更高或450g/L或更高。
式(III)化合物和(VI)化合物
在一些实施方案中,式(III)化合物:
是作为副产物制备的。在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。例如,式(III)化合物可以具有式(IIIa)的构型,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地其中R是甲基:
在一些实施方案中,式(VI)化合物:
是作为副产物制备的。在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。例如,式(VI)化合物可以具有式(VIa)的构型,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地其中R是甲基:
本领域技术人员理解,特定副产物例如式(III)化合物、式(IIIa)化合物、式(VI)化合物和/或式(VIa)化合物的产生可取决于所用的特定底物(例如式(II)化合物、式(IIa)化合物或包含式(II)化合物和式(IIa)化合物的混合物以及所用的生物催化剂(如本文所述)和/或生物转化反应条件。
本文所述的方法可以例如制备式(III)化合物的一种或多种异构体和/或式(VI)化合物的一种或多种异构体。本文所述的产物例如组合物可包含式(III)化合物的一种或多种异构体和/或式(VI)化合物的一种或多种异构体。因此,在一些实施方案中,制备作为副产物的具有式(IIIa)的构型的式(III)化合物和/或具有式(VIa)的构型的式(VI)化合物,任选地其中R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基。在一些实施方案中,产物(例如组合物)包含具有式(IIIa)的构型的式(III)化合物。在一些实施方案中,产物(例如组合物)包含具有式(VIa)的构型的式(VI)化合物。在一些实施方案中,通过本文所述的方法制备的或包含在本文所述的产物中的唯一式(III)化合物是具有式(IIIa)的构型的化合物。在一些实施方案中,通过本文所述的方法制备的或包含在本文所述的产物中的唯一式(VI)化合物是具有式(VIa)的构型的化合物。
在一些实施方案中,至少50wt%或约50wt%的式(III)化合物具有式(IlIa)中所示的构型。在一些实施方案中,至少50wt%或约50wt%的式(VI)化合物具有式(VIa)中所示的构型。例如,至少60wt%或约60wt%,至少70wt%或约70wt%,至少80wt%或约80wt%或至少90wt%或约90wt%的式(III)化合物可以具有式(IIIa)中所示的构型。例如,至少60wt%或约60wt%,至少70wt%或约70wt%,至少80wt%或约80wt%或至少90wt%或约90wt%的式(VI)化合物可以具有式(VIa)中所示的构型。在一些实施方案中,具有式(IlIa)中所示构型的化合物是制备的或包含在产物中的式(III)化合物的唯一异构体,即100wt%的式(III)化合物具有式(IlIa)中所示构型。在一些实施方案中,具有式(IIIa)中所示构型的化合物可以为等于或小于99wt%或约99wt%,等于或小于95wt%或约95wt%,等于或小于90wt%或约90wt%,等于或小于85wt%或约85wt%,等于或小于80wt%或约85wt%,或等于或小于75wt%或约75wt%的式(III)化合物。在一些实施方案中,具有式(VIa)中所示构型的化合物是制备的或包含在产物中的式(VI)化合物的唯一异构体,即100wt%的式(VI)化合物具有式(VIa)中所示构型。在一些实施方案中,具有式(VIa)中所示构型的化合物可以为等于或小于99wt%或约99wt%,等于或小于95wt%或约95wt%,等于或小于90wt%或约90wt%,等于或小于85wt%或约85wt%,等于或小于80wt%或约80wt%,或等于或小于75wt%或约75wt%的式(VI)化合物。
在一些实施方案中,50wt%至100wt%或约50wt%至约100wt%,60wt%至99wt%或约60wt%至约99wt%,或70wt%至95wt%或约70wt%至约95wt%的式(III)化合物具有式(IIIa)的构型。在一些实施方案中,50wt%至100wt%或约50wt%至约100wt%,60wt%至99wt%或约60wt%至约99wt%,或70wt%至95wt%或约70wt%至约95wt%的式(VI)化合物具有式(VIa)的构型。
可以通过本文前面讨论的任何方法来测定混合物中式(III)化合物的不同异构体和/或式(VI)化合物的不同异构体的比例、量和浓度。
本文所述的方法的合适反应条件将在下文中讨论,并在实验部分进一步给出实施例。合适的反应条件的其他实例可以在WO2021/209482中找到,其全部内容通过引用并入本文。
通过本文所述的方法获得的产物
在一个方面,提供了通过本文所述的方法制备的产物,例如组合物。如本文所用,“制备的产物”也可称为“生产的”,“通过本文所述的方法获得的”或“可通过本文所述的方法获得的”。
在一些实施方案中,组合物包含式(I)化合物和式(IV)化合物、基本上由其组成或由其组成。在一些实施方案中,组合物包含式(I)化合物和式(III)化合物、基本上由其组成或由其组成。所述组合物可包含式(III)的一种或多种异构体,例如具有式(IIIa)的构型的化合物。所述组合物可以还包含式(I)的一种或多种异构体,例如式(IV)化合物。所述组合物可以还包含式(II)化合物的一种或多种异构体,例如未转化或未反应的量的式(II)化合物的异构体。
在一些实施方案中,组合物包含式(I)化合物、式(IV)化合物和式(III)化合物、基本上由其组成或由其组成。在一些实施方案中,组合物包含式(I)化合物、式(IV)化合物和式(IIIa)化合物、基本上由其组成或由其组成。在一些实施方案中,组合物包含式(I)化合物和式(IIIa)化合物、基本上由其组成或由其组成。
在一些实施方案中,组合物包含式(I)化合物和式(I)化合物的一种或多种异构体(例如式(IV)化合物)、基本上由其组成或由其组成。所述组合物可以例如还包含式(III)化合物,例如式(IIIa)化合物。所述组合物可以还包含式(II)化合物的一种或多种异构体,例如未转化或未反应的量的式(II)化合物的异构体。
在一些实施方案中,组合物包含式(Ia)化合物(优选式(V)化合物)、基本上由其组成或由其组成。在一些实施方案中,组合物包含式(Ia)化合物(优选式(V)化合物)和式(VI)化合物、基本上由其组成或由其组成。所述组合物可包含式(VI)的一种或多种异构体,例如具有式(VIa)的构型的化合物。所述组合物可以还包含式(Ia)的一种或多种异构体。所述组合物可以还包含式(IIa)化合物的一种或多种异构体,例如未转化或未反应量的式(IIa)化合物的异构体。
在一些实施方案中,组合物包含式(I)化合物和式(Ia)化合物、基本上由其组成或由其组成。在一些实施方案中,组合物包含式(I)化合物和式(V)化合物、基本上由其组成或由其组成。所述组合物可以还包含式(IV)化合物。所述组合物可以还包含式(Ia)化合物的异构体。所述组合物可以还包含式(III)化合物,例如式(IIIa)化合物。所述组合物可以还包含式(VI)化合物,例如式(VIa)化合物。所述组合物可以还包含式(II)化合物的一种或多种异构体,例如未转化或未反应的量的式(II)化合物的异构体。所述组合物可以还包含式(IIa)化合物的一种或多种异构体,例如未转化或未反应的量的式(IIa)化合物的异构体。在一些实施方案中,所述组合物不包含式(III)化合物。在一些实施方案中,所述组合物不包含式(IIIa)化合物。在一些实施方案中,所述组合物不包含式(VI)化合物。在一些实施方案中,所述组合物不包含式(VIa)化合物。
在一些实施方案中,在存在于本文所述的组合物中的式(I)化合物及其异构体,例如式(IV)化合物,式(Ia)化合物及其异构体,例如式(V)化合物,式(II)化合物及其异构体,式(IIa)化合物及其异构体,式(III)化合物及其异构体,例如式(IIIa)化合物,和式(VI)化合物及其异构体,例如式(VIa)化合物中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。
在一些实施方案中,本文所述的组合物中式(I)化合物与式(III)化合物(例如式(IIIa)化合物)的比例可以为60:40至99:1或约60:40至约99:1。在一些实施方案中,本文所述的组合物中式(I)化合物与式(III)化合物的比例可以为65:35至99:1或约65:35至约99:1,70:30至99:1或约70:30至约99:1,75:25至99:1或约75:25至约99:1,80:20至99:1或约80:20至约99:1,85:15至99:1或约85:15至约99:1,90:10至99:1或约90:10至约99:1,95:5至99:1或约95:5至约99:1,65:35至98:2或约65:35至约98:2,70:30至97:3或约70:30至约97:3,75:25至96:4或约75:25至约96:4,80:20至95:5或约80:20至约95:5,85:15至90:10或约85:15至约90:10。
在一些实施方案中,本文所述的组合物(例如粗产物)中式(I)化合物与式(II)化合物的比例可以为90:10至100:0或约90:10至约100:0。在一些实施方案中,本文所述的组合物(例如粗产物)中式(I)化合物与式(II)化合物的比例可以为92:8至100:0或约92:8至约100:0,94:6至100:0或约94:6至约100:0,95:5至100:0或约95:5至约100:0,96:4至99.5:0.5或约96:4至约99.5:0.5,97:3至99:1或约97:3至约99:1,98:2至99:1或约98:2至约99:1。
在一些实施方案中,本文所述的组合物中式(Ia)化合物(优选式(V)化合物)与式(VI)化合物(例如式(VIa)化合物)的比例可以为60:40至99:1或约60:40至约99:1。在一些实施方案中,本文所述的组合物中式(Ia)化合物(优选式(V)化合物)与式(VI)化合物的比例可以为65:35至99:1或约65:35至约99:1,70:30至99:1或约70:30至约99:1,75:25至99:1或约75:25至约99:1,80:20至99:1或约80:20至约99:1,85:15至99:1或约85:15至约99:1,90:10至99:1或约90:10至约99:1,95:5至99:1或约95:5至约99:1,65:35至98:2或约65:35至约98:2,70:30至97:3或约70:30至约97:3,75:25至96:4或约75:25至约96:4,80:20至95:5或约80:20至约95:5,85:15至90:10或约85:15至约90:10。
在一些实施方案中,本文所述的组合物(例如粗产物)中式(Ia)化合物(优选式(V)化合物)与式(IIa)化合物的比例可以为90:10至100:0或约90:10至约100:0。在一些实施方案中,本文所述的组合物(例如粗产物)中式(Ia)化合物(优选式(V)化合物)与式(IIa)化合物的比例可以为92:8至100:0或约92:8至约100:0,94:6至100:0或约94:6至约100:0,95:5至100:0或约95:5至约100:0,96:4至99.5:0.5或约96:4至约99.5:0.5,97:3至99:1或约97:3至约99:1,98:2至99:1或约98:2至约99:1。
组合物中式(I)化合物及其异构体,例如式(IV)化合物,式(Ia)化合物及其异构体,例如式(V)化合物,式(II)化合物及其异构体,式(IIa)化合物及其异构体,式(III)化合物及其异构体,例如式(IIIa)化合物,和式(VI)化合物及其异构体,例如式(VI)化合物的比例、量和浓度的测量可以通过本文前面讨论的任何方法进行。
在一些实施方案中,通过本文所述的方法获得或可获得的组合物包含固体形式,优选无定形或结晶形式的式(I)化合物和式(Ia)化合物(例如式(V)化合物)。
香料组合物
通过本文所述的方法制备的产物,例如组合物,可包含在香料组合物中。因此,本公开进一步提供了本文所述的组合物用于制备香料组合物的用途。在一些实施方案中,香料组合物包含式(I)化合物。任选地,香料组合物包含式(I)化合物的异构体,例如式(IV)化合物。在一些实施方案中,香料组合物包含式(Ia)化合物,优选式(V)化合物。在一些实施方案中,香料组合物包含式(I)化合物和式(Ia)化合物。在一些实施方案中,组合物包含式(I)化合物和式(V)化合物。任选地,香料组合物包含式(Ia)化合物的异构体。
本文所用的“香料组合物”包括包含式(I)化合物和任选的式(I)化合物的一种或多种异构体例如式(IV)化合物以及基料的任何组合物。其还包括包含式(Ia)化合物以及基料的任何组合物。它还包括包含式(V)化合物和任选的式(Ia)化合物的一种或多种其他异构体以及基料的任何组合物。其还包括包含式(I)化合物、式(Ia)化合物以及基料的任何组合物。其还包括包含式(I)化合物、式(V)化合物以及基料的任何组合物,其任选地另外包含式(I)化合物的一种或多种异构体和/或式(Ia)化合物的一种或多种其他异构体。
本文所用的“基料”可以理解为包括选自广泛的天然产物和目前可获得的合成分子的所有已知的香料成分,例如精油,醇类,醛类和酮类,醚类和缩醛类,酯类和内酯类,大环类和杂环类,和/或与一种或多种通常在香料组合物中与增味剂联合使用的成分或赋形剂混合,例如本领域通常使用的载体材料、稀释剂和其他助剂;其例子可以在标准手册例如Perfume Engineering:Design,Performance and Classification(2012),MiguelTeixeira et al.,Butterworth-Heinemann,UK中找到,其全部内容通过引用并入本文。
合适的香料成分可进一步商购。这些成分的非限制性实例包括:
-精油和提取物,例如海狸香,广木香根油,橡苔净油,香叶油,树苔净油,罗勒油,果油例如香柠檬油和橘子油,香桃木油,玫瑰草油,广藿香油,橙叶油,茉莉油,玫瑰油,檀香油,苦艾油,薰衣草油和/或依兰油;
-醇类,例如肉桂醇((E)-3-苯基丙-2-烯-1-醇);顺式-3-己烯醇((Z)-己-3-烯-1-醇);香茅醇(3,7-二甲基辛-6-烯-1-醇);二氢月桂烯醇(2,6-二甲基辛-7-烯-2-醇);EbanolTM((E)-3-甲基-5-(2,2,3-三甲基环戊-3-烯-1-基)戊-4-烯-2-醇);丁香酚(4-烯丙基-2-甲氧基苯酚);乙基芳樟醇((E)-3,7-二甲基壬基-1,6-二烯-3-醇);金合欢醇((2E,6Z)-3,7,11-三甲基十二碳-2,6,10-三烯-1-醇);香叶醇((E)-3,7-二甲基辛-2,6-二烯-1-醇);Super MuguetTM((E)-6-乙基-3-甲基辛-6-烯-1-醇);芳樟醇(3,7-二甲基辛-1,6-二烯-3-醇);薄荷醇(2-异丙基-5-甲基环己醇);橙花醇(3,7-二甲基-2,6-辛二烯-1-醇);苯基乙醇(2-苯基乙醇);RhodinolTM(3,7-二甲基辛-6-烯-1-醇);SandaloreTM(3-甲基-5-(2,2,3-三甲基环戊-3-烯-1-基)戊-2-醇);松油醇(2-(4-甲基环己-3-烯-1-基)丙-2-醇);或TimberolTM(1-(2,2,6-三甲基环己基)己烷-3-醇);2,4,7-三甲基辛-2,6-二烯-1-醇,和/或[1-甲基-2(5-甲基己-4-烯-2-基)环丙基]-甲醇;
-醛类和酮类,例如茴香醛(4-甲氧基苯甲醛);α-戊基肉桂醛(2-亚苄基庚醛);GeorgywoodTM(1-(1,2,8,8-四甲基-1,2,3,4,5,6,7,8-八氢化萘-2-基)乙酮);羟基香茅醛(7-羟基-3,7-二甲基辛醛);Iso E(1-(2,3,8,8-四甲基-1,2,3,4,5,6,7,8-八氢萘-2-基)乙酮);/>((E)-3-甲基-4-(2,6,6-三甲基环己-2-烯-1-基)丁-3-烯-2-酮);3-(4-异丁基-2-甲基苯基)丙醛;麦芽酚;甲基柏木酮;甲基紫罗兰酮;马鞭草烯酮;和/或香草醛;
-醚类和缩醛类,例如(3a,6,6,9a-四甲基-2,4,5,5a,7,8,9,9b-八氢-1H-苯并[e][1]苯并呋喃);香叶基甲基醚((2E)-1-甲氧基-3,7-二甲基辛-2,6-二烯);玫瑰醚(4-甲基-2-(2-甲基丙-1-烯-1-基)四氢-2H-吡喃);和/或/>(2’,2’,3,7,7-五甲基螺[双环[4.1.0]庚烷-2,5’-[1,3]二噁烷]);
-大环类,例如黄葵内酯((Z)-氧杂环十七碳-10-烯-2-酮);巴西酸亚乙酯(1,4-二氧杂环十七烷-5,17-二酮);和/或(16-氧杂环十六烷-1-酮);和
-杂环类,例如异丁基喹啉(2-异丁基喹啉)。
如本文所用,“载体材料”可以理解为从增香剂的观点来看实际上是中性的材料,即不会显著改变增香剂的感官特性的材料。术语“稀释剂”可以理解为包括通常与增香剂结合使用的任何稀释剂,实例是邻苯二甲酸二乙酯(DEP),一缩二丙二醇(DPG),肉豆蔻酸异丙酯(IPM),柠檬酸三乙酯(TEC)和醇(例如乙醇)。术语“助剂”可理解为包括可用于香料组合物中的任何成分,其原因不特别涉及所述组合物的嗅觉性能。例如,助剂可以是作为加工一种或多种香料成分的助剂的成分,或是含有所述成分的组合物,或它可以改善香料成分或含有该香料成分的组合物的处理或储存,例如抗氧化剂助剂。抗氧化剂可以选自例如TT(BASF),/>Q(BASF),生育酚(包括其异构体,CAS 59-02-9;364-49-8;18920-62-2;121854-78-2),2,6-双(1,1-二甲基乙基)-4-甲基苯酚(BHT,CAS128-37-0)和相关的酚、氢醌(CAS121-31-9)。助剂也可以是提供额外益处如赋予香料组合物颜色或质地的成分。助剂也可以是赋予包含在香料组合物中的一种或多种成分耐光性或增加化学稳定性的成分。本文所讨论的香料成分,载体材料、稀释剂和助剂应被理解为非限制性实例;本领域技术人员知道本领域通常使用的合适的基料,其进一步的实例可在标准手册中获得,例如Perfume Engineering:Design,Performance and Classification(见上文)。
如本文所述,式(I)化合物、式(Ia)化合物(例如式(V)化合物)和包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物可以还包含在多种组合物中,包括但不限于,精细香料或消费品,例如织物护理,化妆品,美容护理和清洁产品,洗涤剂产品和肥皂产品,包括基本上所有商业上使用目前可获得的(+)-龙涎缩醛成分的产品。
本公开还提供了一种消费品,其包含本文所述的组合物或香料组合物,包括其任何实施方案。所述消费品可以例如是化妆品(例如香水或淡香水),清洁产品,洗涤剂产品或肥皂产品。
包括包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的混合物的香料和消费品可能是有利的,因为它们表现出独特的嗅觉性质。
因此,在一些实施方案中,香料组合物或消费品包括包含式(I)化合物和式(Ia)化合物(例如式(V)化合物)的组合物,其中所述组合物通过本文所述的方法获得或可通过本文所述的方法获得。在一些实施方案中,式(I)化合物和式(Ia)化合物(例如式(V)化合物)为固体形式,优选为无定形或结晶形式。
原材料和中间体
在一个方面,本公开提供了用于本文所述的方法的原材料和中间体。
本公开还提供了一种混合物,其包含式(II)化合物、基本上由其组成或由其组成。例如,所述混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体))和式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体))、基本上由其组成或由其组成。在一些实施方案中,所述混合物包含式(II)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一。在一些实施方案中,所述混合物包含式(II)化合物的所有四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体。
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。
本公开还提供了一种混合物,其包含式(IIa)化合物、基本上由其组成或由其组成。例如,所述混合物可包含式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体))和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体))、基本上由其组成或由其组成。在一些实施方案中,所述混合物包含式(IIa)化合物的三种异构体,例如E,Z-异构体、E,E-异构体和Z,E-异构体或Z,Z-异构体之一。在一些实施方案中,所述混合物包含式(IIa)化合物的四种异构体,即E,Z-异构体、E,E-异构体、Z,E-异构体和Z,Z-异构体。
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。
本公开还提供了一种混合物,其包含式(II)化合物和式(IIa)化合物、基本上由其组成或由其组成。例如,混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体))和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体))、基本上由其组成或由其组成。例如,混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体))和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体))、基本上由其组成或由其组成。例如,混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体))、基本上由其组成或由其组成。例如,混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体))和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体))、基本上由其组成或由其组成。
例如,混合物可包含式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体))、式(II)化合物(其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体))、式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体))和式(IIa)化合物(其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体))、基本上由其组成或由其组成。任选地,混合物可还包含式(II)化合物和/或式(IIa)化合物的一种或多种其他异构体。
在一些实施方案中,R选自H(氢)和C1-C4烷基,例如甲基、乙基、正丙基或异丙基,优选地R是甲基。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80,等于或大于30:70或约30:70,等于或大于40:60或约40:60,等于或大于50:50或约50:50,等于或大于60:40或约60:40,等于或大于70:30或约70:30,等于或大于80:20或约80:20,等于或大于85:15或约85:15,等于或大于90:10或约90:10,等于或大于95:5或约95:5,或等于或大于99:1或约99:1。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5,等于或小于90:10或约90:10,等于或小于85:15或约85:15,等于或小于80:20或约80:20,等于或小于70:30或约70:30,等于或小于60:40或约60:40,等于或小于50:50或约50:50,等于或小于40:60或约40:60,等于或小于30:70或约30:70,等于或小于20:80或约20:80,或等于或小于10:90或约10:90。
在包含式(II)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为10:90至99:1或约10:90至约99:1,10:90至90:10或约10:90至约90:10,或约5:95至约95:5,或约4:96至约96:4,或约3:97至约97:3,或约2:98至约98:2,或约1:99至约99:1,或约20:80至约80:20,50:50至80:20或约50:50至约80:20,或60:40至80:20或约60:40至约80:20。任选地,所述混合物可还包含式(II)化合物和/或式(IIa)化合物的一种或多种其他异构体。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或大于10:90或约10:90。在一些实施方案中,所述比例等于或大于20:80或约20:80,等于或大于30:70或约30:70,等于或大于40:60或约40:60,等于或大于50:50或约50:50,等于或大于60:40或约60:40,等于或大于70:30或约70:30,等于或大于80:20或约80:20,等于或大于85:15或约85:15,等于或大于90:10或约90:10,等于或大于95:5或约95:5,或等于或大于99:1或约99:1。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5,等于或小于90:10或约90:10,等于或小于85:15或约85:15,等于或小于80:20或约80:20,等于或小于70:30或约70:30,等于或小于60:40或约60:40,等于或小于50:50或约50:50,等于或小于40:60或约40:60,等于或小于30:70或约30:70,等于或小于20:80或约20:80,或等于或小于10:90或约10:90。
在包含式(IIa)化合物的E,Z-异构体和E,E-异构体的混合物中,E,Z-异构体与E,E-异构体的比例可以为10:90至99:1或约10:90至约99:1,10:90至90:1或约10:90至约90:1,20:80至20:80或约20:80至约20:80,50:50至80:20或约50:50至约80:20,或60:40至80:20或约60:40至80:20。任选地,所述混合物可还包含式(II)化合物和/或式(IIa)化合物的一种或多种其他异构体。
在包含式(II)化合物和式(IIa)化合物的混合物中,式(II)化合物与式(IIa)化合物的比例可以为等于或大于50:50或约50:50,等于或大于60:40或约60:40,等于或大于70:30或约70:30,等于或大于80:20或约80:20,等于或大于85:15或约85:15,等于或大于90:10或约90:10,等于或大于95:5或约95:5,或等于或大于99:1或约99:1。
在包含式(II)化合物和式(IIa)化合物的混合物中,式(II)化合物与式(IIa)化合物的比例可以为等于或小于99:1或约99:1。在一些实施方案中,所述比例等于或小于95:5或约95:5,等于或小于90:10或约90:10,等于或小于85:15或约85:15,等于或小于80:20或约80:20,等于或小于70:30或约70:30,等于或小于60:40或约60:40,等于或小于50:50或约50:50,等于或小于40:60或约40:60,等于或小于30:70或约30:70,等于或小于20:80或约20:80,或等于或小于10:90或约10:90。
在包含式(II)化合物和式(IIa)化合物的混合物中,式(II)化合物与式(IIa)化合物的比例可以为10:90至99:1或约10:90至约99:1,10:90至90:1或约10:90至约90:1,20:80至80:20或约20:80至约80:20,50:50至80:20或约50:50至约80:20,或60:40至80:20或约60:40至80:20。
角鲨烯-何帕烯环化酶(SHC)酶
本文所述的方法利用本文所述的角鲨烯-何帕烯环化酶(SHC)酶。
在一些实施方案中,本文所述的角鲨烯-何帕烯环化酶可包含与SEQ ID NO:1或SEQ ID NO:43-49的序列,优选与SEQ ID NO:1的序列具有至少30%,40%,50%,60%或70%,优选至少70%一致性或相似性的氨基酸序列。SEQ ID NO:1代表来源于巨大芽孢杆菌(Bacillus megaterium)的SHC酶(BmeSHC)。SEQ ID NO:43代表来源于酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius)的SHC酶(AacSHC)。SEQ ID NOS:44和45代表来自运动发酵单胞菌(Zymomonas mobilis)的SHC酶(分别为ZmoSHC1和ZmoSHC2)。SEQ ID NO:46代表来源于日本慢生根瘤菌(Bradyrhizobium japonicum)的SHC酶(BjaSHC)。SEQ ID NO:47代表来源于细长嗜热聚球藻(Thermosynechococcus elongatus)的SHC酶(TeISHC)。SEQ IDNO:48代表来源于巴氏醋杆菌(Acetobacter pasteurianus)的SHC酶(ApaSHC)。SEQ ID NO:49代表来自致病葡糖杆菌(Gluconobacter morbifer)的SHC酶(GmoSHC)。这些酶的进一步描述可以在WO2021/209482中找到。
在一些实施方案中,本文所述的角鲨烯-何帕烯环化酶(SHC)酶包含氨基酸序列,所述氨基酸序列与SEQ ID NO:1或SEQ ID NO:43-49的序列,优选与SEQ ID NO:1的序列,具有至少30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,95.5%,96%,96.5%,97%,97.5%,98%,98.5%,99%,99.5%或100%的一致性或相似性。在一些实施方案中,所述一致性或相似性为至少30%。在一些实施方案中,所述一致性或相似性为至少35%。在一些实施方案中,所述一致性或相似性为至少40%。在一些实施方案中,所述一致性或相似性为至少45%。在一些实施方案中,所述一致性或相似性为至少50%。在一些实施方案中,所述一致性或相似性为至少55%。在一些实施方案中,所述一致性或相似性为至少60%。在一些实施方案中,所述一致性或相似性为至少65%。在一些实施方案中,所述一致性或相似性为至少70%。在一些实施方案中,所述一致性或相似性为至少75%。在一些实施方案中,所述一致性或相似性为至少80%。在一些实施方案中,所述一致性或相似性为至少85%。在一些实施方案中,所述一致性或相似性为至少90%。在一些实施方案中,所述一致性或相似性为至少95%。在一些实施方案中,所述一致性或相似性为至少95.5%。在一些实施方案中,所述一致性或相似性为至少96%。在一些实施方案中,所述一致性或相似性为至少96.5%。在一些实施方案中,所述一致性或相似性为至少97%。在一些实施方案中,所述一致性或相似性为至少97.5%。在一些实施方案中,所述一致性或相似性为至少98%。在一些实施方案中,所述一致性或相似性为至少98.5%。在一些实施方案中,所述一致性或相似性为至少99%。在一些实施方案中,所述一致性或相似性为至少99.5%。在一些实施方案中,所述一致性或相似性小于100%,即所述氨基酸序列与SEQ ID NO:1或SEQ ID NO:43-49不同,优选与SEQ ID NO:1不同。序列“一致性”和“相似性”的定义以及它们的测定方法在下文标题为“通用定义”的章节中提供。
本文所述的SHC酶可以通过对其序列引入修饰而衍生自SEQ ID NO:1或SEQ IDNO:43-49所示的SHC酶,优选衍生自SEQ ID NO:1所示的SHC酶。这种酶在本文中也可称为“SHC变体”,“SHC突变体”或“SHC衍生物”。本文所述的SHC酶也可以通过对现有SHC变体的序列引入另外的修饰而衍生自其他SHC变体。本文所述的SHC酶可以不是天然存在的。
换言之,术语“变体”,例如SHC变体,应理解为本文所述的多肽(酶),其与其来源的多肽相比包含一个或多个序列修饰。衍生出变体的多肽在本文中也可称为亲本或参考多肽(即亲本或参考SHC酶)。亲本SHC酶可以是野生型酶。亲本SHC酶可以是野生型多肽的同源物、直系同源物或旁系同源物。亲本SHC酶可以是另一种变体,即与先前获得的变体酶相比,通过在其氨基酸序列中引入另外的修饰而得到的酶。因此,本文所述的SHC酶可以衍生自“较早一代”的SHC变体,并且与其亲本SHC酶相比可以表现出改进的性质。可包含在变体酶中的序列修饰的实例是氨基酸置换、缺失、插入、N-端截短、C-端截短或其组合。变体酶可以例如在使用本领域技术人员已知的诱变技术修饰编码所述酶的核苷酸序列后,合成制备或通过细胞(或体外)生产制备,所述诱变技术例如随机诱变,定点诱变,定向进化,基因混编,CRISPR/Cas介导的诱变等,其实例也可在标准手册中获得,例如In Vitro Mutagenesis:Methods and Protocols(Methods in Molecular Biology 1498),1st Edition,Reeves A.(Ed),Humana Press(2017),通过引用将其全部内容并入本文。在一些实施方案中,合成制备本文所述的SHC酶。在一些实施方案中,本文所述的SHC酶由重组宿主细胞产生。
通过直接比较它们的各个氨基酸序列或编码所述酶的核酸的核苷酸序列,可以鉴定本文所述的SHC与其亲本SHC酶(例如SEQ ID NO:1或SEQ ID NO:43-49,优选SEQ ID NO:1所代表的SHC酶)相比的序列修饰,使用本领域可获得的标准生物信息学算法,并在下文标题为“通用定义”的章节中进一步讨论。这些算法通常利用常规序列比对方法,其中将对应于序列的特定位置处的特定核苷酸或氨基酸残基与其所比对的参考序列的相应位置进行匹配。
以SEQ ID NO:1为例,如果将SEQ ID NO:1用作参考序列,并将所讨论的SHC酶氨基酸序列与其进行比对,使用这些方法,本领域技术人员可以例如容易地鉴定SHC酶中哪些氨基酸位置对应于例如SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585(或SEQ ID NO:1中的任何其他位置)。类似地,如果将编码SEQ ID NO:1的核酸的核苷酸序列与所讨论的SHC酶进行比对,则可以鉴定编码特定氨基酸残基的相应核苷酸的位置。在这方面,本领域技术人员理解,SEQ ID NO:1的N-端的甲硫氨酸(M)残基对应于位置1,SEQ ID NO:1的C-端的丝氨酸(S)残基对应于位置625,并且SEQ ID NO:1的N-端和C-端之间的氨基酸分别对应于位置2-624。
氨基酸置换是指替代亲本(参考)氨基酸序列中的氨基酸残基(或编码所述氨基酸序列的核酸的核苷酸序列中的核苷酸)的序列修饰,其导致具有相同氨基酸数目的变体(衍生物)序列。氨基酸置换可对应于任何其他氨基酸的置换。氨基酸置换可以是保守性的。“保守性”置换的定义将在下文中提供。氨基酸置换可对应于亲本SHC酶序列例如SEQ ID NO:1或SEQ ID NO:43-49,优选SEQ ID NO:1所示的序列的多个特定氨基酸位置。在其中多个氨基酸被置换的实施方案中,它们可对应于多肽序列中连续的位置、不连续的位置或空间上分开的位置。
在一些实施方案中,本文所述的SHC酶包含相对于SEQ ID NO:1的一个或多个氨基酸置换。用于置换的优选位置可以选自SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585。在一些实施方案中,本文所述的优选的SHC酶在对应于SEQ IDNO:1中位置2,5,35,166,211,212,355,483和539的一个或多个位置处包含相对于SEQ IDNO:1的一个或多个氨基酸置换。优选地,所述相对于SEQ ID NO:1的一个或多个氨基酸置换是在对应于SEQ ID NO:1中位置2,5,35,166,211,212,483和539的一个或多个位置处。更优选地,所述相对于SEQ ID NO:1的一个或多个氨基酸置换是在对应于SEQ ID NO:1中位置2,5,35,166,211,483和539的一个或多个位置处。
在一些实施方案中,本文所述的SHC酶包含相对于SEQ ID NO:1的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,至少七个,至少八个,至少九个,至少十个,至少十一个,至少十二个,至少十三个或至少十四个氨基酸置换。在一些实施方案中,相对于SEQ ID NO:1,至少一个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少两个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少三个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少四个氨基酸被置换。在一些实施方案中,相对于SEQID NO:1,至少五个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少六个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少七个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少八个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少九个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少十个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少十一个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少十二个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少十三个氨基酸被置换。在一些实施方案中,相对于SEQ ID NO:1,至少十四个氨基酸被置换。用于置换的优选的位置可以选自位置2,5,35,116,166,211,212,317,355,382,399,483,539和585,优选2,5,35,166,211,212,355,483和539,更优选2,5,35,166,211,212,483和539,最优选2,5,35,166,211,483和539。
在一些实施方案中,本文所述的SHC酶包含一至七个,优选二至六个,更优选三至五个相对于SEQ ID NO:1的氨基酸置换。在一些实施方案中,本文所述的SHC酶在对应于SEQID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585,优选2,5,35,166,211,212,355,483和539,最优选2,5,35,166,211,212,483和539的一个或多个位置处包含一至七个,优选二至六个,更优选三至五个相对于SEQ ID NO:1的氨基酸置换。
如本文所用,“保守性”氨基酸置换是指具有相似侧链的残基的互换性。例如,基于所涉及的氨基酸残基的极性、电荷、大小、溶解性、疏水性、亲水性和/或两亲性的相似性,可以进行保守性氨基酸置换。
用于保守性置换的类似种类的氨基酸残基的实例在下表中给出。
酸性残基 | Asp(D)和Glu(E) |
碱性残基 | Lys(K),Arg(R)和His(H) |
亲水性不带电的残基 | Ser(S),Thr(T),Asn(N)和Gln(Q) |
脂族不带电的残基 | Gly(G),Ala(A),Val(V),Leu(L)和Ile(I) |
非极性不带电的残基 | Cys(C),Met(M)和Pro(P) |
芳族残基 | Phe(F),Tyr(Y)和Trp(W) |
可供选择的保守性氨基酸残基置换类别:
1 | A | S | T |
2 | D | E | |
3 | N | Q | |
4 | R | K | |
5 | I | L | M |
6 | F | Y | W |
氨基酸残基的可替代的物理和功能分类:
含醇基的残基 | S和T |
脂族残基 | I,L,V和M |
环烯基相关残基 | F,H,W和Y |
疏水性残基 | A,C,F,G,H,I,L,M,R,T,V,W和Y |
带负电的残余物 | D和E |
极性残基 | C,D,E,H,K,N,Q,R,S和T |
带正电的残基 | H,K和R |
小残基 | A,C,D,G,N,P,S,T和V |
非常小的残基 | A,G和S |
参与片段翻转形式的残基 | A,C,D,E,G,H,K,N,Q,R,S,P和T |
柔性残基 | Q,T,K,S,G,P,D,E和R |
影响链取向的残基 | G,P |
例如,具有脂族侧链的一组氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸;具有脂族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳族侧链的一组氨基酸是苯丙氨酸,酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸,精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守性氨基酸置换基团是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文所公开的氨基酸序列的置换变体是其中所公开的序列中的至少一个残基被去除并在其位置插入不同残基的那些。优选地,氨基酸变化是保守性的。每种天然存在的氨基酸的优选的保守性置换如下:Ala至Ser;Arg至Lys;Asn至Gln或His;Asp至Glu;Cys至Ser或Ala;Gln至Asn;Glu至Asp;Gly至Pro;His至Asn或Gln;Ile至Leu或Val;Leu至Ile或Val;Lys至Arg;Gln或Glu;Met至Leu或Ile;Phe至Met,Leu或Tyr;Ser至Thr;Thr至Ser;Trp至Tyr;Tyr至Trp或Phe;和Val至Ile或Leu。
在对应于本文所述的SEQ ID NO:1中特定位置处的优选的置换位置处发生的优选的置换如下所示。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置2的异亮氨酸(I)已被任意氨基酸置换,优选被天冬酰胺(N),丝氨酸(S),苏氨酸(T)或谷氨酰胺(Q)置换,更优选被天冬酰胺(N)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置5的亮氨酸(L)已被任意氨基酸置换,优选被脯氨酸(P),甲硫氨酸(M)或半胱氨酸(C)置换,更优选被脯氨酸(P)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置35的苏氨酸(T)已被任意氨基酸置换,优选被丙氨酸(A),异亮氨酸(I),缬氨酸(V),甘氨酸(G)或亮氨酸(L)置换,更优选被丙氨酸(A)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置116的异亮氨酸(I)已被任意氨基酸置换,优选被苏氨酸(T),天冬酰胺(N),丝氨酸(S)或谷氨酰胺(Q)置换,更优选被苏氨酸(T)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置166的苏氨酸(T)已被任意氨基酸置换,优选被丙氨酸(A),异亮氨酸(I),缬氨酸(V),甘氨酸(G)或亮氨酸(L)置换,更优选被丙氨酸(A)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置211的谷氨酸(E)已被任意氨基酸置换,优选被缬氨酸(V),丙氨酸(A),异亮氨酸(I),甘氨酸(G)或亮氨酸(L)置换,更优选被缬氨酸(V)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置212的丝氨酸(S)已被任意氨基酸置换,优选被精氨酸(R),赖氨酸(K)或组氨酸(H)置换,更优选被精氨酸(R)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置317的亮氨酸(L)已被任意氨基酸置换,优选被甲硫氨酸(M),脯氨酸(P)或半胱氨酸(C)置换,更优选被甲硫氨酸(M)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置355的丙氨酸(A)已被任意氨基酸置换,优选被苏氨酸(T),天冬酰胺(N),丝氨酸(S)或谷氨酰胺(Q)置换,更优选被苏氨酸(T)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置382的丝氨酸(S)已被任意氨基酸置换,优选被苏氨酸(T),天冬酰胺(N)或谷氨酰胺(Q)置换,更优选被苏氨酸(T)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置399的异亮氨酸(I)已被任意氨基酸置换,优选被缬氨酸(V),丙氨酸(A),或甘氨酸(G),亮氨酸(L)置换,更优选被缬氨酸(V)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置483的酪氨酸(Y)已被任意氨基酸置换,优选被半胱氨酸(C),甲硫氨酸(M)或脯氨酸(P)置换,更优选被半胱氨酸(C)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置539的亮氨酸(L)已被任意氨基酸置换,优选被组氨酸(H),精氨酸(R)或赖氨酸(K)置换,更优选被组氨酸(H)置换。
在一些实施方案中,本文所述的SHC酶包含这样的氨基酸序列,其中对应于SEQ IDNO:1中位置585的谷氨酸(E)已被任意氨基酸置换,优选被丙氨酸(A),缬氨酸(V),异亮氨酸(I),甘氨酸(G)或亮氨酸(L)置换,更优选被丙氨酸(A)置换。
在一些实施方案中,本文所述的优选的SHC酶包括与SEQ ID NO:1的序列具有至少30%,40%,50%,60%或70%,优选至少70%一致性或相似性的氨基酸序列,优选地其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585,优选2,5,35,166,211,212,355,483和539,更优选2,5,35,166,211,212,483和539,最优选2,5,35,166,211,483和539的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换。在一些实施方案中,与SEQ ID NO:1的序列的一致性或相似性为至少30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,95.5%,96%,96.5%,97%,97.5%,98%,98.5%,99%,99.5%或100%。
在一些实施方案中,本文所述的SHC酶包含选自以下的相对于SEQ ID NO:1的氨基酸置换:
(i)在对应于SEQ ID NO:1中位置2的位置处的天冬酰胺(N),丝氨酸(S),苏氨酸(T)或谷氨酰胺(Q)残基;
(ii)在对应于SEQ ID NO:1中位置5的位置处的脯氨酸(P),甲硫氨酸(M)或半胱氨酸(C)残基;
(iii)在对应于SEQ ID NO:1中位置35的位置处的丙氨酸(A),异亮氨酸(I),缬氨酸(V),甘氨酸(G)或亮氨酸(L)残基;
(iv)在对应于SEQ ID NO:1中位置116的位置处的苏氨酸(T),天冬酰胺(N),丝氨酸(S)或谷氨酰胺(Q)残基;
(v)在对应于SEQ ID NO:1中位置166的位置处的丙氨酸(A),异亮氨酸(I),缬氨酸(V),甘氨酸(G)或亮氨酸(L)残基;
(vi)在对应于SEQ ID NO:1中位置211的位置处的缬氨酸(V),丙氨酸(A),异亮氨酸(I),甘氨酸(G)或亮氨酸(L)残基;
(vii)在对应于SEQ ID NO:1中位置212的位置处的精氨酸(R),赖氨酸(K)或组氨酸(H)残基;
(viii)在对应于SEQ ID NO:1中位置317的位置处的甲硫氨酸(M),脯氨酸(P)或半胱氨酸(C)残基;
(ix)在对应于SEQ ID NO:1中位置355的位置处的苏氨酸(T),天冬酰胺(N),丝氨酸(S)或谷氨酰胺(Q)残基;
(x)在对应于SEQ ID NO:1中位置382的位置处的苏氨酸(T),天冬酰胺(N)或谷氨酰胺(Q)残基;
(xi)在对应于SEQ ID NO:1中位置399的位置处的缬氨酸(V),丙氨酸(A),甘氨酸(G)或亮氨酸(L);
(xii)在对应于SEQ ID NO:1中位置483的位置处的半胱氨酸(C),甲硫氨酸(M)或脯氨酸(P)残基;
(xiii)在对应于SEQ ID NO:1中位置539的位置处的组氨酸(H),精氨酸(R)或赖氨酸(K)残基;
(xiv)在对应于SEQ ID NO:1中位置585的位置处的丙氨酸(A),缬氨酸(V),异亮氨酸(I),甘氨酸(G)或亮氨酸(L)残基;或
(xv)其任何组合。
在一些实施方案中,本文所述的SHC酶包含选自以下的相对于SEQ ID NO:1的氨基酸置换:
(i)在对应于SEQ ID NO:1中位置2的位置处的天冬酰胺(N)残基;
(ii)在对应于SEQ ID NO:1中位置5的位置处的脯氨酸(P)残基;
(iii)在对应于SEQ ID NO:1中位置35的位置处的丙氨酸(A)残基;
(iv)在对应于SEQ ID NO:1中位置116的位置处的苏氨酸(T)残基;
(v)在对应于SEQ ID NO:1中位置166的位置处的丙氨酸(A)残基;
(vi)在对应于SEQ ID NO:1中位置211的位置处的缬氨酸(V)残基;
(vii)在对应于SEQ ID NO:1中位置212的位置处的精氨酸(R)残基;
(viii)在对应于SEQ ID NO:1中位置317的位置处的甲硫氨酸(M)残基;
(ix)在对应于SEQ ID NO:1中位置355的位置处的苏氨酸(T)残基;
(x)在对应于SEQ ID NO:1中位置382的位置处的苏氨酸(T)残基;
(xi)在对应于SEQ ID NO:1中位置399的位置处的缬氨酸(V)残基;
(xii)在对应于SEQ ID NO:1中位置483的位置处的半胱氨酸(C)残基;
(xiii)在对应于SEQ ID NO:1中位置539的位置处的组氨酸(H)残基;
(xiv)在对应于SEQ ID NO:1中位置585的位置处的丙氨酸(A)残基;或
(xv)其任何组合。
在一些实施方案中,本文所述的SHC酶包含以下选自SEQ ID NO:1中相应位置处的相对于SEQ ID NO:1的氨基酸置换:
(i)2,35,355和539;
(ii)166;
(iii)2和483;
(iv)2,483和539;
(v)2,5,35,539;
(vi)2,5,35和483;
(vii)2,5,35,166和539;
(viii)2,5,35,166,211和539
(ix)2,5,35,211,212,483和539
(x)2,166和483;
(xi)2,166,483和539;
(xii)2,166,211和483;或
(xiii)2,166,211,483和539。
在一些实施方案中,本文所述的SHC酶包含选自以下的相对于SEQ ID NO:1的氨基酸置换:
(i)I2N,T35A,A355T和L539H;
(ii)T166A;
(iii)I2N和Y483C;
(iv)I2N,Y483C和L539H;
(v)I2N,L5P,T35A,L539H;
(vi)I2N,L5P,T35A和Y483C;
(vii)I2N,L5P,T35A,T166A和L539H;
(viii)I2N,L5P,T35A,T166A,E211V和L539H
(ix)I2N,L5P,T35A,E211V,S212R,Y483C和L539H
(x)I2N,T166A和Y483C;
(xi)I2N,T166A,Y483C和L539H;
(xi)I2N,T166A,E211V和Y483C;或
(xiii)I2N,T166A,E211V,Y483C和L539H。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T35A,A355T,L539H。任选地,其还包含相对于SEQ ID NO:1的E211V置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:T166A。任选地,其还包含相对于SEQ ID NO:1的E211V和/或L539H置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,Y483C。任选地,其还包含相对于SEQ ID NO:1的E211V和/或L539H置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,Y483C,L539H。任选地,其还包含相对于SEQ ID NO:1的E211V置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,L5P,T35A,L539H。任选地,其还包含相对于SEQ ID NO:1的E211V置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,L5P,T35A,Y483C。任选地,其还包含相对于SEQ ID NO:1的E211V和/或L539H置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,L5P,T35A,T166A,L539H。任选地,其还包含相对于SEQ ID NO:1的E211V置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,L5P,T35A,T166A,E211V,L539H。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,L5P,T35A,E211V,S212R,Y483C,L539H。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T166A,Y483C。任选地,其还包含相对于SEQ ID NO:1的E211V和/或L539H置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T166A,Y483C,L539H。任选地,其还包含相对于SEQ ID NO:1的E211V置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T166A,E211V,Y483C。任选地,其还包含相对于SEQ ID NO:1的L539H置换。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T166A,E211V,Y483C,L539H。
在一些实施方案中,本文所述的SHC酶包含以下的相对于SEQ ID NO:1的氨基酸置换:I2N,T166A。任选地,其还包含相对于SEQ ID NO:1的E211V和/或L539H置换。任选地,其还包含相对于SEQ ID NO:1的Y483C置换。
在一些实施方案中,本文所述的任何SHC酶还包含选自以下的相对于SEQ ID NO:1的一个或多个置换:L5P,T35A,E211V,Y483C和L539H。
本领域技术人员理解,本文所述的表示氨基酸置换的位置编号是指SEQ ID NO:1中的对应位置,如本文其他地方所讨论的。
在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40或42,优选SEQ ID NO:4,8,18,20,22,24,30,32,34,36,38,40或42,更优选SEQ ID NO:30,32,34,36,38,40或42,最优选SEQ ID NO:30,38,40或42中的任何一个至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:30,34,36,40或42中的任何一个至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:4至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:6至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:8至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:10至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:12至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:14至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:16至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:18至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:20至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:22至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:24至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:26至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:28至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ IDNO:30至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ IDNO:32至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQID NO:34至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:36至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:38至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:40至少90%相同的氨基酸序列。在一些实施方案中,本文所述的任何SHC酶包含与SEQ ID NO:42至少90%相同的氨基酸序列。所述氨基酸序列可以至少91%相同。所述氨基酸序列可以至少92%相同。所述氨基酸序列可以至少93%相同。所述氨基酸序列可以至少94%相同。所述氨基酸序列可以至少95%相同。所述氨基酸序列可以至少95.5%相同。所述氨基酸序列可以至少96%相同。所述氨基酸序列可以至少96.5%相同。所述氨基酸序列可以至少97%相同。所述氨基酸序列可以至少97.5%相同。所述氨基酸序列可以至少98%相同。所述氨基酸序列可以至少98.5%相同。所述氨基酸序列可以至少99%相同。所述氨基酸序列可以至少99.5%相同。所述氨基酸序列可以相同。
在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39或41,优选SEQ ID NO:3,7,17,19,21,23,29,31,33,35,37,39或41,更优选SEQ ID NO:29,31,33,35,37,39或41,最优选SEQ ID NO:29,37,39或41中的任何一个至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ IDNO:29,33,35,39或41中的任何一个至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:3至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ IDNO:5至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:7至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:9至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ IDNO:11至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:13至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:15至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:17至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:19至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:21至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:23至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:25至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:27至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:29至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:31至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:33至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:35至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:37至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:39至少90%相同。在一些实施方案中,本文所述的任何SHC酶由包含核苷酸序列的核酸编码,所述核苷酸序列与SEQ ID NO:41至少90%相同。
所述核苷酸序列可以至少91%相同。所述核苷酸序列可以至少92%相同。所述核苷酸序列可以至少93%相同。所述核苷酸序列可以至少94%相同。所述核苷酸序列可以至少95%相同。所述核苷酸序列可以至少95.5%相同。所述核苷酸序列可以至少96%相同。所述核苷酸序列可以至少96.5%相同。所述核苷酸序列可以至少97%相同。所述核苷酸序列可以至少97.5%相同。所述核苷酸序列可以至少98%相同。所述核苷酸序列可以至少98.5%相同。所述核苷酸序列可以至少99%相同。所述核苷酸序列可以至少99.5%相同。所述核苷酸序列可以相同。
本文所用的术语“活性”或“酶活性”或“生物活性”是指酶与底物反应以提供目标产物的能力。“SHC活性”或“SHC酶活性”或“SHC生物活性”可以例如指本文所述的SHC酶将式(II)化合物转化为式(I)化合物的能力,例如它们将羟基金合欢基丙酮转化为(+)-龙涎缩醛的能力。例如,它还可以指本文所述的SHC酶将式(IIa)化合物转化为式(Ia)化合物,优选式(V)化合物的能力。它还可以例如指本文所述的SHC酶将式(II)化合物转化为式(I)化合物和/或将式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)的能力,其中式(II)化合物和式(IIa)化合物包含在混合物中,如本文前面所述。
显示其酶活性的SHC酶在本文中也可称为功能酶。例如,可以使用所谓的活性测试,通过监测目标产物的增加,底物(或原材料)的减少或通过这些参数的组合作为时间的函数来测定酶活性。
本文所述的SHC酶与其亲本SHC酶相比,可以例如具有用于将式(II)化合物(例如羟基金合欢基丙酮)转化为式(I)化合物(例如(+)-龙涎缩醛)的增加的酶活性,和/或用于将式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)的增加的酶活性。增加的酶活性可以指式(II)化合物至式(I)化合物和/或式(IIa)化合物至式(Ia)化合物(例如式(V)化合物)的酶促转化的任何方面,包括例如增加的总转化率(收率),增加的转化速率(例如(但不限于)在反应的最初4小时,或最初6小时,或最初12小时,或最初24小时,或最初48小时,或最初72小时,或最初96小时,或最初120小时,或最初144小时,或最初168小时中),增加的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的产量和/或减少的副产物的产量。增加的酶活性通常可以通过增加的生产率来定义,其可以根据每小时反应时间(通常从反应开始的时间点测量)、每克生物催化剂和每升反应产生的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)来定义。
在一些实施方案中,本文所述的方法利用SHC酶与利用其亲本SHC酶相比导致至少5%,至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍,或1000-倍的更高的生产率。
用于测定和定量SHC酶活性的测定法是本领域已知的,并且在本文的实验部分中提供了进一步的实施例。例如,本文所述的SHC酶的活性可通过将纯化的酶或来自已产生该酶的宿主细胞或完全重组宿主细胞的提取物与合适的底物在合适的条件下孵育并进行底物和反应产物分析(例如通过气相色谱(GC)或HPLC分析,如在本领域的标准手册中所讨论的,例如Encyclopedia of Analytical Science:3rd Edition(同上))。实施例中提供了SHC酶活性测定和反应产物分析的进一步细节。这些测定可包含在重组宿主细胞(例如大肠埃希菌(E.coli))中产生酶。
与其亲本SHC酶相比,本文所述的SHC酶可以例如提供增加的式(II)化合物的总转化率。因此,与使用其亲本SHC酶的方法相比,使用本文所述的SHC酶的方法可以具有增加的式(II)化合物的总转化率。与其亲本SHC酶相比,本文所述的SHC酶可以例如提供增加的式(IIa)化合物的总转化率。因此,与使用其亲本SHC酶的方法相比,使用本文所述的SHC酶的方法可以具有增加的式(IIa)化合物的总转化率。与其亲本SHC酶相比,本文所述的SHC酶可以例如提供增加的包含式(II)化合物和式(IIa)化合物的混合物的总转化率。因此,与使用其亲本SHC酶的方法相比,使用本文所述的SHC酶的方法可导致增加的式(II)化合物和/或式(IIa)化合物的总转化率,其中式(II)化合物和式(IIa)化合物包含在本文前述的混合物中。
与其亲本SHC酶相比,本文所述的SHC酶可以例如提供增加的式(II)化合物和/或式(IIa)化合物转化率。因此,与使用其亲本SHC酶的方法相比,使用本文所述的SHC酶的方法可以具有增加的式(II)化合物和/或式(IIa)化合物的转化率。与亲本SHC酶相比,所述SHC酶可以例如在反应的最初2小时内,最初4小时内,最初6小时内,最初8小时内,最初12小时内,最初24小时内,最初36小时内,最初48小时内,最初72小时内,最初96小时内,最初120小时内,最初144小时内或最初168内小时内提供增加的式(II)化合物和/或式(IIa)化合物的转化率。因此,与使用其亲本SHC酶的方法相比,使用本文所述的SHC酶的方法可以在反应的最初2小时内,最初4小时内,最初6小时内,最初8小时内,最初12小时内,最初24小时内,最初36小时内,最初48小时内,最初72小时内,最初96小时内,最初120小时内,最初144小时内或最初168内小时内,优选最初24小时内具有增加的式(II)化合物和/或式(IIa)化合物的转化率。
在一些实施方案中,与其亲本SHC酶相比,由本文所述的SHC酶表现出的式(II)化合物和/或式(IIa)化合物的总转化率和/或转化速率高至少5%,至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍或1000-倍。
在一些实施方案中,与其亲本SHC酶相比,本文所述的SHC酶所表现出的式(II)化合物和/或式(IIa)化合物转化的总转化率和/或速率的改进是在本文所述的包含式(II)化合物和式(IIa)化合物的混合物中获得的。
与其亲本SHC酶相比,本文所述的SHC酶可以例如提供改进的式(II)化合物至式(I)化合物的转化率,其可替代地定义为式(I)化合物的收率。换言之,与其亲本SHC酶相比,本文所述的SHC酶可导致每克/摩尔转化的式(II)化合物形成更多克/摩尔的式(I)化合物。与其亲本SHC酶相比,本文所述的SHC酶可以例如提供改进的式(IIa)化合物至式(Ia)化合物(例如式(V)化合物)的转化率,其可替代地定义为式(Ia)化合物的收率。换言之,与其亲本SHC酶相比,本文所述的SHC酶可导致每克/摩尔转化的式(IIa)化合物形成更多克/摩尔的式(Ia)化合物(例如式(V)化合物)。
在一些实施方案中,与其亲本SHC酶相比,通过本文所述的SHC酶实现的式(II)化合物转化为式(I)化合物和/或式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)的转化率高至少5%,至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍或1000-倍。
在一些实施方案中,本文所述的SHC酶实现了至少5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100的式(II)化合物至式(I)化合物的转化和/或式(IIa)化合物至式(Ia)化合物(例如式(V)化合物)的转化,以摩尔百分比给出并基于所用式(II)化合物的摩尔数。优选地,收率为5至100,10至100,20至100,30至100,35至100,更优选35至100,45至100,50至100,60至100,或70至100mol%。优选地,在反应时间24小时之时或之后测量转化率。
在一些实施方案中,本文所述的SHC酶与其上文所述的亲本SHC酶相比所表现出的式(II)化合物转化为式(I)化合物和/或式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)的改进是在本文所述的包含式(II)化合物和式(IIa)化合物的混合物中获得的。可表征本文所述的SHC酶的非限制性的另外的参数是:特异性(例如底物特异性,键特异性,基团特异性,光学特异性,辅因子特异性,几何特异性),反应速率,副产物形成和对反应条件(例如pH,温度,底物浓度,增溶剂例如SDS的浓度)的敏感性,对产物抑制的抗性等。
本文所述的SHC酶可与其亲本酶在相同反应条件下(例如相同的pH,温度,底物浓度,增溶剂例如SDS的浓度),或在已单独定义为对于每种酶活性最佳并且其可以彼此相同或不同的条件下进行比较。SHC酶与其亲本SHC酶相比在任何反应条件下的反应性能可以使用任何上述参数进行评估,例如式(II)化合物和/或式(IIa)化合物转化的生产率、总转化率或增加的速率,或式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的收率,并且可以例如提高至少5%,10%,20%,30%,40%,50%,60%,70%,80%,90%,100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍或1000-倍。优选地,在反应时间24小时之时或之后测量反应性能。
可以使用任何底物浓度,例如至少1g/L或更高的底物浓度来评估本文所述的SHC酶的反应性能。在其中使用表达本文所述的SHC酶的宿主细胞的实施方案中,可以使用如上文所定义的任何底物浓度和/或任何细胞浓度,例如至少1g/L或更高的细胞浓度来评估反应性能。
特别地,与其亲本SHC酶相比,本文所述的SHC酶在高底物浓度下可表现出改善的反应性能。50g/L或更高的式(II)化合物浓度可被认为是高底物浓度。在一些实施方案中,与其亲本SHC酶相比,所述SHC酶在50g/L或更高,60g/L或更高,70g/L或更高,80g/L或更高,90g/L或更高,100g/L或更高,110g/L或更高,120g/L或更高,130g/L或更高,135g/L或更高,150g/L或更高,175g/L或更高,或200g/L或更高,或250g/L或更高的式(II)化合物浓度下,优选在135g/L或更高的式(II)化合物浓度下,可以表现出改善的反应性能。
在其中使用表达本文所述的SHC酶的宿主细胞的一些实施方案中,与其亲本SHC酶相比,所述SHC酶可以在高细胞浓度下表现出改善的反应性能。50g/L或更高的细胞浓度可被认为是高细胞浓度。与其亲本SHC酶相比,所述SHC酶可以在细胞浓度为50g/L或更高,60g/L或更高,70g/L或更高,80g/L或更高,90g/L或更高,100g/L或更高,110g/L或更高,120g/L或更高,130g/L或更高,150g/L或更高,175g/L或更高,200g/L或更高,或250g/L或更高,优选175g/L或更高的细胞浓度下表现出改善的反应性能。
在一些实施方案中,与其亲本SHC酶相比,本文所述的SHC酶表现出的反应性能的改进是在包含本文所述的式(II)化合物和式(IIa)化合物的混合物中获得的。
在一些实施方案中,可调节SHC酶与底物的比例或表达所述SHC酶的宿主细胞与底物的比例以优化生物转化反应。
在一些实施方案中,所述SHC酶或表达所述SHC酶的宿主细胞与底物的重量比为0.1-4比1或约0.1-4比1(0.1-4:1),0.1-3比1或约0.1-3比1(0.1-3:1),0.1-2比1或约0.1-2比1(0.1-2:1),0.25-2比1或约0.25-2比1(0.25-2:1),0.5-2比1或约0.5-2比1(0.5-2:1),0.1比1或约0.1比1(0.1:1),0.5比1或约0.5比1(0.5:1),1比1或约1比1(1:1),1.5比1或约1.5比1(1.5:1),或2比1或约2比1(2:1),优选0.1比1或约0.1比1(0.1:1),0.5比1或约0.5比1(0.5:1),或1比1或约1比1(1:1)。
因此,与其亲本SHC酶相比,本文所述的SHC酶可表现出至少一种,至少两种,至少三种或所有以下益处:
●改进的式(II)化合物和/或式(IIa)化合物的转化率
●改进的式(I)化合物和/或式(Ia)化合物的收率
●改进的反应性能(例如在高底物浓度下的转化率、生产率、收率)
如本文所用,本文所述的SHC酶的“选择性”可以指与另一种底物相比,所述酶与特定底物反应的能力。作为非限制性实例,与E,E-异构体或另一种异构体相比,SHC酶对式(II)化合物的E,Z-异构体可能是选择性的,这意味着与E,E-异构体或另一种异构体相比,所述酶更可能转化E,Z-异构体。作为另一个非限制性实例,与E,E-异构体或另一种异构体相比,SHC酶对式(IIa)化合物的E,Z-异构体可以是选择性的。作为另一个非限制性实例,SHC酶可以对化合物的特定结构异构体例如式(II)化合物或式(IIa)化合物具有选择性。作为另一个非限制性实例,本文所述的方法中所述和所用的SHC酶可以例如对式(II)化合物具有等于或大于75%或约75%的选择性。作为进一步的非限制性实例,所述SHC酶或其亲本SHC酶可以具有等于或大于80%或约80%,等于或大于85%或约85%,等于或大于90%或约90%,等于或大于95%或约95%的选择性。例如,所述SHC酶或其亲本SHC酶可以具有至多100%或约100%的选择性,例如小于100%或约100%,例如等于或小于99.5%或约99.5%,等于或小于99%或约99%,等于或小于98%或约98%,或等于或小于97%或约97%。
作为另一个非限制性实例,在本文所述的方法中所述和所用的SHC酶可以例如对式(IIa)化合物具有等于或大于75%或约75%的选择性。作为进一步的非限制性实例,所述SHC酶或其亲本SHC酶可以具有等于或大于80%或约80%,等于或大于85%或约85%,等于或大于90%或约90%,等于或大于95%或约95%的选择性。例如,所述SHC酶或其亲本SHC酶可以具有至多100%或约100%的选择性,例如小于100%或约100%,例如等于或小于99.5%或约99.5%,等于或小于99%或约99%,等于或小于98%或约98%,或等于或小于97%或约97%。
本文公开的用于制备式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的方法可以在对所使用的特定酶(例如特定的SHC变体)而言为最佳温度范围或最佳温度和/或最佳pH范围或最佳pH和/或增溶剂(例如SDS)最佳浓度范围或最佳增溶剂(例如SDS)浓度下进行,如本文后面所讨论的。在实验部分进一步提供了实例。另外的实例可以在WO2021/209482中找到。
核酸和载体
本文所述的SHC酶可由核苷酸序列编码。包含所述核苷酸序列的核酸分子可以是例如分离的核酸分子。因此,本公开进一步提供了包含编码本文所述的角鲨烯何帕烯环化酶(SHC)酶的核苷酸序列的核酸分子。
本文所用的术语“核酸”或“核酸分子”是可互换的,是指本公开的多核苷酸,其可以是DNA,cDNA,基因组DNA,合成DNA或RNA,并且可以是双链或单链,有义链或反义链。
该术语特别适用于编码本文所述的SHC酶的多核苷酸,例如编码表现出其酶活性的SHC多肽或其片段的全长核苷酸序列或其片段。该术语还包括单独的分子,例如cDNA,其中其相应的基因组DNA具有内含子并因此具有不同的序列,缺少至少一个侧翼基因的基因组片段,由聚合酶链反应(PCR)产生的cDNA或基因组DNA片段,并且缺少至少一个侧翼基因,缺少至少一个侧翼基因的限制性片段,和为cDNA的简并变体的核酸或天然存在的核酸。
核酸分子可包含用于在特定宿主细胞中表达的密码子优化序列。如本文所用,“密码子优化”是指用于修饰现有编码序列或设计编码序列的方法,例如,用于改进从编码序列转录的转录物RNA分子在表达宿主细胞或生物体中的翻译,或用于改进编码序列的转录。密码子优化包括但不限于选择编码序列的密码子以适合表达宿主细胞的密码子偏好性的方法。例如,为了适应哺乳动物,昆虫,植物或微生物细胞,优选微生物细胞例如大肠埃希菌等的密码子偏好性。微生物细胞的实例包括真核生物例如酵母,丝状真菌和藻类,以及原核生物例如细菌和古细菌。密码子优化还消除了可能对RNA稳定性和/或翻译产生负面影响的元件(例如终止序列,TATA盒,剪接位点,核糖体进入位点,重复序列和/或富含GC的序列和RNA二级结构或不稳定基序)。
在这方面,编码SHC酶的核酸分子可包含在来源生物体中发现的原始核苷酸序列,或可包含用于在所选择的宿主细胞(如大肠埃希菌等)中表达的密码子优化序列。
本公开还提供了核酸构建体,其包含编码本文所述的SHC酶的核苷酸序列,所述核苷酸序列可操作地连接于调节序列,例如转录起始序列例如启动子序列。本文所用的“核酸构建体”是指通常要引入靶细胞的人工产生的核酸。因此,与编码本文所述的SHC酶的核苷酸序列可操作地连接的调节序列在自然界中可能不与其相关。
任选地,其他调节序列如转录终止子,增强子,阻遏子,沉默子,kozak序列,polyA序列等可与编码SHC酶的核苷酸序列可操作地连接。
上述调节序列包括但不限于诱导型和非诱导型,组成型,细胞周期调节型,代谢调节型,增强子,操纵子,沉默子,阻遏子和本领域技术人员已知的在细胞中驱动或调节基因表达的其他元件。这样的调节序列包括但不限于指导组成型表达或允许诱导型表达的调节序列,例如CUP-1启动子,例如在Tet-on或Tet-off系统中使用的Tet-阻遏子,Lac操纵子调节序列或Trp操纵子调节序列。
作为非限制性实例,当Lac操纵子调节序列与感兴趣的核苷酸序列可操作地连接时,异丙基β-D-1-硫代半乳糖苷(IPTG)是有效的基因表达诱导物,其浓度范围为例如100pM至1.0mM。该化合物是别乳糖(触发Lac操纵子转录的乳糖代谢物)的分子模拟物,因此,当核苷酸序列在Lac操纵子的控制下时,可用于诱导核苷酸序列表达。
本文所述的核酸构建体可以还包含编码另外的多肽的核苷酸序列,例如,作为标记或报道分子的序列,和/或能够分离和/或纯化(例如通过亲和层析)所编码的多肽的序列,例如标签(例如His-标签)等。在这方面,核酸构建体可包含编码“杂合”、“融合”或“嵌合”蛋白的核苷酸序列,所述蛋白代表SHC酶的融合体,例如标记、报道分子或标签。融合蛋白可包含一个或多个氨基酸(例如但不限于组氨酸(His)),与其来源的SHC酶相比,其通常在蛋白的N-端,但也在C-端或融合在蛋白的内部区域内。这类融合蛋白或编码这类蛋白的核酸构建体通常有三个目的:(I)增加重组蛋白的产量;(II)增加重组蛋白的溶解性;和(III)通过提供用于亲和纯化的配体来帮助重组蛋白的分离和/或纯化。当从用于其生产的细胞或体外组分中分离时,本文所述的SHC酶可被称为分离的。
标记可以是可选择的标记。术语“可选择的标记”在本文中是指可用于选择表达它的宿主细胞的多肽,其通过在暴露于选择性条件时赋予所述细胞选择性优势来实现。可选择的标记可以使阳性或阴性选择成为可能。合适的选择标记在本领域中是已知的,并且这样的标记和选择方法在例如标准出版物(例如Mortensen和Kingston(2009)Curr ProtocMol Biol 86:9.5.1-9.5.13,通过引用将其全部内容并入本文)以及标准手册(例如Ausubel et al.(2003))以及Sambrook和Green(2012)(见上文)中进行了讨论。本领域技术人员理解,根据宿主细胞和/或所应用的选择条件,特异性可选择的标记可以实现阳性或阴性选择。阳性可选择的标记是使宿主细胞在暴露于选择性条件时能够生长的标记,否则生长将不会发生。阴性可选择的标记是在暴露于选择性条件时抑制宿主细胞生长的标记。可由核苷酸构建体中包含的其他序列编码的合适标记和报道多肽的非限制性实例包括β-内酰胺酶,氯霉素乙酰转移酶(CAT),腺苷脱氨酶(ADA),氨基糖苷磷酸转移酶二氢叶酸还原酶(DHFR),潮霉素-B-磷酸转移酶(HPH),胸苷激酶(TK),β-半乳糖苷酶和黄嘌呤鸟嘌呤磷酸核糖转移酶(XGPRT)。
合适的标签的实例包括AviTag,钙调蛋白-标签,多聚谷氨酸-标签,E-标签,FLAG-标签,HA-标签,His-标签,Myc-标签,S-标签,SBP-标签,Softag 1和Softag 3,Strep-标签,TC-标签,V5-标签,VSV-标签,X-press标签,isopeptag,SpyTag,BCCP,谷胱甘肽-S-转移酶-标签,GFP-标签,Halo-标签,麦芽糖结合蛋白-标签,Nus-标签,硫氧还蛋白-标签和Fc-标签。
本领域技术人员知道可包含在本公开的核酸构建体中的合适的调控序列和另外的序列,以及可以用于获得本文所述的核酸构建体的分子工具箱技术,并且实例可以在标准手册例如Ausubel et al.,Current Protocols in Molecular Biology,3rd edition,John Wiley&Sons Inc(2003)中和在Sambrook and Green,Molecular Cloning.ALaboratory Manual,4th Edition,Cold Spring Harbor Laboratory Press(2012)中找到;这二者的全部内容通过引用并入本文。进一步的例子可以在WO2021/209482中找到。
本公开还提供了包含本文所述的核酸分子或核酸构建体的载体。
如本文所用,“载体”是用作人工携带外源遗传物质进入细胞的载体的核酸分子,在细胞中外源遗传物质可被复制和/或表达。
载体可以是线性或圆形的。
载体可以以低拷贝数(例如每个细胞1-2个拷贝),中拷贝数(例如每个细胞3-20个拷贝)或高拷贝数(例如每个细胞>20个拷贝)的形式保持在宿主细胞中。低拷贝、中拷贝和高拷贝载体的复制起点是本领域技术人员已知的。载体可以是例如质粒,巨大质粒,黏粒,噬粒,噬菌体,病毒载体(例如腺病毒或逆转录病毒载体),敲除或敲入构建体或人工染色体,例如细菌,酵母,植物或哺乳动物人工染色体。优选的载体是质粒。本领域技术人员理解,例如在质粒的情况下,术语核酸构建体和载体可以重叠。
优选的是由本文所述的核酸分子、核酸构建体或载体编码的蛋白质在它们引入宿主细胞后表达。
宿主细胞、制备宿主细胞的方法和使用宿主细胞制备式(I)化合物的方法
在一个方面,本公开提供了包含本文所述的核酸分子、核酸构建体或载体的宿主细胞。宿主细胞优选表达(可替代地本文称为“产生”)本文所述的SHC酶。本公开的宿主细胞在本文中也称为“细胞”,“重组细胞”或“重组宿主细胞”。本文中的“重组的”是指已引入细胞的遗传修饰。
宿主细胞可用于本文所述的方法中。例如,制备本文所述的式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的方法可包括培养本文所述的宿主细胞。术语“培养”是指增殖活细胞以使其产生本文所述的SHC酶的过程。因此,本文所述的与SHC酶和使用SHC酶的方法相关的益处也适用于表达所述SHC酶的宿主细胞和使用该宿主细胞的方法。
本文所述的核酸分子、核酸构建体或载体可以使用本领域技术人员可获得的标准分子工具箱技术引入宿主细胞中,所述技术可以根据宿主细胞(例如原核细胞或真核细胞)而不同。这些技术的实例是转染和(病毒)转导。这种技术的另外的例子还可以在标准手册例如Ausubel et al.(2003)以及Sambrook和Green(2012)中找到(见上文)。
引入的(“转化”)核酸可以是整合或不整合的,即共价连接到细胞的染色体中。例如,在原核生物和酵母中,引入的核酸可以保持在附加体元件例如质粒上。关于真核细胞,稳定转染的细胞是这样的细胞,其中转染的核酸已经整合到染色体中,使得它通过染色体复制被子细胞遗传。这种稳定性通过真核细胞建立细胞系或克隆的能力来证明,所述细胞系或克隆由含有引入核酸的子细胞群组成。在原核和/或真核细胞中,核酸向宿主细胞基因组的整合可以例如通过细胞DNA修复机制例如同源重组、非同源末端连接等发生。核酸的整合可以通过向宿主细胞的染色体中引入断裂来介导,例如使用核酸酶如锌指核酸酶(ZFN),转录激活子样效应子核酸酶(TALEN),成簇的规则间隔的短回文重复序列(CRISPR)-Cas-相关核酸酶,重组酶(例如Cre重组酶)等。核酸酶和重组酶是本领域技术人员已知的,并且在标准手册中进一步讨论了它们在宿主细胞转化中的应用,例如Musunuru Kiran,GenomeEditing:A Practical Guide to Research and Clinical Applications,1st Edition,Academic Press(2021)和Ghosh Dipanjan(Ed),Advances in CRISPR/Cas and RelatedTechnologies,1st Edition,Academic Press(2021),这二者的全部内容通过引用并入本文。
通常,引入的核酸最初并不存在于受体宿主细胞中,但从给定宿主中分离核酸,并随后将该核酸的一个或多个额外拷贝引入同一宿主中,也在本公开的范围内,例如:以增强基因产物的产生或改变基因的表达模式,例如表达本文所述的SHC酶的基因。在一些情况下,引入的核酸将修饰或甚至取代内源核酸序列,例如通过同源重组或定点诱变。
因此,本文所述的宿主细胞对SHC酶的表达可指同源表达(其中编码所述酶的核苷酸序列最初存在于细胞中)或异源表达(其中编码所述酶的核苷酸序列最初不存在于细胞中)。
合适的宿主细胞可选自原核细胞或真核细胞,例如细菌,古细菌,酵母,丝状真菌,藻类,植物细胞,动物细胞,两栖动物细胞(包括载黑素细胞),昆虫细胞,蠕虫细胞和哺乳动物细胞。
藻类宿主细胞可以选自本领域已知的合适的组,例如Botryococcus braunii,小球藻(Chlorella),Dunaliella tertiolecta,江蓠(Gracilaria),Pleurochrysiscarterae和马尾藻(Sargassum)。酵母宿主细胞可选自本领域已知的合适的组,例如酵母属(Saccharomyces)(例如酿酒酵母(Saccharomyces cerevisiae),贝氏酵母(Saccharomycescerevisiae),布拉氏酵母(Saccharomyces cerevisiae)),念珠菌属(Candida)(例如产朊假丝酵母(Candida utilis),克柔假丝酵母(Candida krusei)),裂殖酵母(Schizosaccharomyces)(例如粟酒裂殖酵母(Schizosaccharomyces pombe),日本裂殖酵母(Schizosaccharomyces japonicus)),毕赤酵母(Pichia)或汉逊酵母(Hansenula)(例如巴斯德毕赤酵母(Pichia pastoris)或巴斯德毕赤酵母(Pichia pastoris)(Komagatellaphaffi)或多形汉逊酵母(Hansenula polymorpha)),耶氏酵母(Yarrowia),克鲁维酵母(Kluyveromyces)和酒香酵母(Brettanomyces)(例如克劳森酒香酵母(Brettanomycesclaussenii))。
丝状真菌宿主细胞可选自本领域已知的合适种类,例如枝顶孢霉属(Acremonium),蘑菇属(Agaricus),链格孢属(Alternaria),曲霉属(Aspergillus),短梗霉属(Aureobasidium),葡萄座腔菌属(Botryospaeria),拟蜡菌属(Ceriporiopsis),毛壳霉属(Chaetomidium),金孢子菌属(Chrysosporium),麦角菌属(Claviceps),旋孢菌属(Cochliobolus),鬼伞属(Coprinopsis),乳白蚁属(Coptotermes),棒囊壳属(Corynascus),隐丛赤壳菌属(Cryphonectria),隐球菌属(Cryphonectria),色二孢属(Diplodia),黑耳属(Exidia),Filibasidium,镰刀菌属(Fusarium),赤霉菌属(Gibberella),Holomastigotoides,腐质霉属(Humicola),lrpex,香菇(Lentinula),小球腔霉属(Leptospaeria),巨座壳属(Magnaporthe),Melanocarpus,亚灰树花菌属(Meripilus),毛霉菌属(Mucor),毁丝霉属(Myceliophthora),Neocaffimastix,脉孢菌属(Neurospora),拟青霉属(Paecilomyces),Peniciffium,青霉菌属(Penicillium),原毛平革菌属(Phanerochaete),梨囊鞭菌属(Piromyces),Poitrasia,假黑盘菌属(Pseudoplectania),Pseudotrichonympha),根毛霉属(Rhizomucor),裂褶菌属(Schizophyllum),柱顶孢霉属(Scytalidium),踝节菌属(Talaromyces),耐热囊菌属(Thermoascus),根串珠霉属(Thielavia),弯颈霉属(Tolypocladium),木霉属(Trichoderma),长毛盘菌属(Trichophaea),轮枝菌属(Verticillium),小包脚菇属(Volvariella),或炭角菌属(Xylaria)。物种包括Acremonium cellulolyticus,棘孢曲霉(Aspergillus aculeatus),泡盛曲霉(Aspergillus awamori),臭曲霉(Aspergillusfoetidus),烟曲霉(Aspergillus fumigatus),日本曲霉(Aspergillus japonicus),构巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),米曲霉(Aspergillusoryzae),金孢子菌(Chrysosporiuminops),嗜角质金孢子菌(Chrysosporiumkeratinophilum),勒克文金孢子菌(Chrysosporium lucknowense),墨氏金孢子菌(Chrysosporium merdarium),毛囊金孢子属(Chrysosporium pannicola),昆士兰金孢子菌(Chrysosporium queenslandicum),热带金孢子菌(Chrysosporium tropicum),带状金孢子菌(Chrysosporium zonatum),杆孢状镰孢(Fusarium bactridioides),谷类镰孢(Fusarium cerealis),克鲁克韦尔镰孢(Fusariumcrookwellense),大刀镰孢(Fusariumculmorum),禾谷镰孢(Fusarium graminearum),禾赤镰孢(Fusarium graminum),异孢镰孢(Fusarium heterosporum),合欢木镰孢(Fusarium negundi),尖孢镰孢(Fusariumoxysporum),多枝镰孢(Fusarium reticulatum),玫瑰色镰孢(Fusarium roseum),接骨木镰孢(Fusarium sambucinum),肤色镰孢(Fusarium sarcochroum),拟分枝孢镰孢(Fusarium sporotrichioides),硫色镰孢(Fusarium sulphureum),Fusarium torulosum,拟丝孢镰孢(Fusarium trichothecioides),Fusarium venenaturn,灰色腐质霉(Humicolagrisea),特异腐质霉(Humicola insolens),柔毛腐质霉(Humicola lanuginosa),乳色耙菌(Irpex Lacteus),米赫毛霉(Mucor miehei),嗜热毁丝霉(Myceliophthorathermophila),粗糙链孢霉(Neurospora crassa),绳状青霉(Penicillium funiculosum),产紫青霉(Penicillium purpurogenum),产黄青霉(Penicillium chrysogenum),黄孢原毛平革菌(Phanerochaete chrysosporium),无色梭孢菌(Thielavia achromatica),白纹梭孢菌(Thielavia albomyces),白纹梭孢(Thielavia albopilosa),澳大利亚梭孢霉(Thielavia australeinsis),Thielavia fimeti,小孢梭孢(Thielavia microspora),卵孢梭孢(Thielavia ovispora),秘鲁梭霉(Thielavia peruviana),Thielavia setosa,瘤孢梭孢壳(Thielavia spededonium),耐热梭孢壳菌(Thielavia subthermophila),太瑞斯梭孢壳霉(Thielavia terrestris),哈茨木霉(Trichoderma harzianum),康宁木霉(Trichoderma koningii),长柄木霉(Trichoderma longibrachiatum),里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)。
昆虫宿主细胞和蠕虫细胞可以选自本领域已知的合适的组,例如Sf9细胞,Sf21细胞,草地贪夜蛾(Spodoptora frugiperda)细胞,线虫(Caenorhabditis)细胞(例如秀丽隐杆线虫(Caenorhabditis elegans)细胞)及其衍生物。哺乳动物宿主细胞可以选自本领域已知的合适的组,例如人细胞,中国仓鼠卵巢(CHO)细胞,COS细胞(包括Cos-1和Cos-7),HEK293细胞,HEK293T细胞,HEK293 T-RexTM细胞,PerC6TM细胞,HeLa细胞,Jurkat细胞,杂交瘤及其衍生物。植物宿主细胞可以选自本领域已知的合适的组,例如拟南芥(Arabidopsis)的组等。
优选的宿主细胞是细菌宿主细胞,其可以选自本领域已知的合适的组。细菌宿主细胞包括革兰氏阴性和革兰氏阳性细菌,例如芽孢杆菌属(Bacillus)(例如蜡样芽孢杆菌(Bacillus cereus),炭疽芽孢杆菌(Bacillus anthracis),苏云金芽孢杆菌(Bacillusthuringiensis),蕈状芽孢杆菌(Bacillus mycoides),假蕈状芽孢杆菌(Bacilluspseudomycoides),细胞毒素芽孢杆菌(Bacillus cytotoxicus),凝结芽孢杆菌(Bacilluscoagulans),枯草芽孢杆菌(Bacillus subtilis)和地衣芽孢杆菌(Bacilluslicheniformis)),类芽孢杆菌属(Paenibacillus),链霉菌属(Streptomyces),微球菌属(Micrococcus),棒状杆菌属(Corynebacterium),醋杆菌属(Acetobacter),蓝细菌(Cyanobacteria),沙门菌属(Salmonella),红球菌属(Rhodococcus),假单胞菌属(Pseudomonas),乳杆菌属(Lactobacillus),乳球菌属(Lactococcus),肠球菌属(Enterococcus),产碱杆菌属(Alcaligenes),克雷伯菌属(Klebsiella),类芽孢杆菌属(Paenibacillus),节杆菌属(Arthrobacter),棒状杆菌属(Corynebacterium),短杆菌属(Brevibacterium),水生栖热杆菌(Thermus aquaticus),施氏假单胞菌(Pseudomonasstutzeri),热细胞梭状芽胞杆菌(Clostridium thermocellus),埃希菌属(Escherichia)(例如大肠埃希菌(Escherichia coli)),包括其菌株。对于大肠埃希菌,本领域中可获得突变体、质粒、代谢的详细计算机模型、转化方法和其他信息的多个文库,从而允许合理设计各种遗传模块以提高表达酶的重组宿主细胞的产物产量。优选地,大肠埃希菌宿主细胞是被工业和监管机构认可为安全的大肠埃希菌菌株(包括但不限于K12和BL21菌株)。在从式(II)化合物制备式(I)化合物中,利用大肠埃希菌作为宿主细胞可能是有利的,因为可以相对容易地为该宿主细胞设计低成本和工业上经济的方法。
属于上述组的几种宿主细胞和菌株在许多众所周知的保藏中心很容易被公众获得,所述保藏中心例如American Type Culture Collection(ATCC),Deutsche Sammlungvon Mikroorganismen and Zellkulturen GmbH(DSM),Centraalbureau VoorSchimmelcultures(CBS),and Agricultural Research Service Patent CultureCollection,Northern Regional Research Center(NRRL)。
在一些实施方案中,所述宿主细胞是选自埃希菌属(Escherichia),链霉菌属(Streptomyces),芽孢杆菌属(Bacillus),假单胞菌属(Pseudomonas),乳杆菌属(Lactobacillus)和乳球菌属(Lactococcus)及其菌株的细菌宿主细胞,优选它是大肠埃希菌及其菌株。合适的宿主细胞和转化方法的实例可进一步在WO2021/209482中找到。
本文所述的宿主细胞的培养可以以常规方式进行。合适的细胞培养方法是本领域技术人员已知的,并且例如在van’t Riet,K.和Tramper,J.,1st edition,BasicBioreactor Design,CRC Press,NY,1991(其全部内容通过引用并入本文)中进行了讨论。这些方法包括但不限于液体培养基中的深层发酵、液体培养基上的表面发酵和固态发酵。细胞培养可以例如通过在实验室和/或工业环境中在微量滴定板,摇瓶,小规模台式生物反应器,中等规模生物反应器和/或大规模生物反应器中培养来进行。合适的细胞培养模式包括但不限于连续、分批和/或补料分批培养以及它们的组合。通常,细胞生长至特定密度(可测量的,例如作为光密度(OD))以产生足够的生物质和/或SHC酶,用于发生本文前面所述的生物转化反应。
在一些实施方案中,提供了在细胞系统中制备式(I)化合物的方法,所述方法包括在合适的条件下在细胞系统中产生本文所述的SHC酶,将式(II)化合物喂入细胞系统,使用由所述细胞系统产生的SHC酶将所述式(II)化合物转化为式(I)化合物,从所述细胞系统中收集所述式(I)化合物,并任选地分离和/或纯化所述式(I)化合物。
在一些实施方案中,提供了在细胞系统中制备式(Ia)化合物,优选式(V)化合物的方法,所述方法包括在合适的条件下在细胞系统中产生本文所述的SHC酶,将式(IIa)化合物喂入细胞系统,使用由所述细胞系统产生的SHC酶将所述式(IIa)化合物转化为式(Ia)化合物,优选式(V)化合物,从所述细胞系统中收集所述式(Ia)化合物,优选式(V)化合物,并任选地分离和/或纯化所述式(Ia)化合物,优选式(V)化合物。
在一些实施方案中,提供了在细胞系统中制备包含式(I)化合物和式(Ia)化合物的混合物的方法,所述方法包括在合适的条件下在细胞系统中产生本文所述的SHC酶,将包含式(II)化合物和式(IIa)化合物的混合物喂入细胞系统,使用由所述细胞系统产生的SHC酶将式(II)化合物转化为式(I)化合物并将式(IIa)化合物转化为式(Ia)化合物,从所述细胞系统中收集所述式(I)化合物和所述式(Ia)化合物,并任选地分离和/或纯化所述式(I)化合物和/或所述式(Ia)化合物。
在一些实施方案中,提供了在细胞系统中制备包含式(I)化合物和式(V)化合物的混合物的方法,所述方法包括在合适的条件下在细胞系统中产生本文所述的SHC酶,将包含式(II)化合物和式(IIa)化合物的混合物喂入细胞系统,使用由所述细胞系统产生的SHC酶将式(II)化合物转化为式(I)化合物并将式(IIa)化合物转化为式(V)化合物,从所述细胞系统中收集所述式(I)化合物和所述式(V)化合物,并任选地分离和/或纯化所述式(I)化合物和/或所述式(V)化合物。
其他核酸的表达可用于增强所述方法,例如通过增强用于上述生物转化反应的细胞系统的活性。
在一些实施方案中,提供了制备式(I)化合物的方法,所述方法包括培养包含含有编码本文所述的SHC酶的核苷酸序列的核酸的宿主细胞,在所述宿主细胞中产生SHC酶,向细胞培养物中添加式(II)化合物,在适于促进式(II)化合物转化为式(I)化合物的pH、温度和任选的增溶剂(例如SDS)的条件下孵育细胞培养物,收集所述式(I)化合物,并任选地分离和/或纯化所述式(I)化合物。
在一些实施方案中,提供了制备式(Ia)化合物,优选式(V)化合物的方法,所述方法包括培养包含含有编码本文所述的SHC酶的核苷酸序列的核酸的宿主细胞,在所述宿主细胞中产生SHC酶,向细胞培养物中添加式(IIa)化合物,在适于促进式(IIa)化合物转化为式(Ia)化合物,优选式(V)化合物的pH、温度和任选的增溶剂(例如SDS)的条件下孵育细胞培养物,收集所述式(Ia)化合物,优选式(V)化合物,并任选分离和/或纯化所述式(I)化合物,优选式(V)化合物。
在一些实施方案中,提供了制备包含式(I)化合物和式(Ia)化合物的混合物的方法,所述方法包括培养包含含有编码本文所述的SHC酶的核苷酸序列的核酸的宿主细胞,在所述宿主细胞中产生SHC酶,向细胞培养物中添加包含式(II)化合物和式(IIa)化合物的混合物,在适合于促进式(II)化合物转化为式(I)化合物和式(IIa)化合物转化为式(Ia)化合物的pH、温度和任选的增溶剂(例如SDS)的条件下孵育细胞培养物,收集所述式(I)化合物和式(Ia)化合物,并任选地分离和/或纯化所述式(I)化合物和/或式(Ia)化合物。
在一些实施方案中,提供了制备包含式(I)化合物和式(V)化合物的混合物的方法,所述方法包括培养包含含有编码本文所述的SHC酶的核苷酸序列的核酸的宿主细胞,在所述宿主细胞中产生SHC酶,向细胞培养物中添加包含式(II)化合物和式(IIa)化合物的混合物,在适于促进式(II)化合物转化为式(I)化合物和式(IIa)化合物转化为式(V)化合物的pH、温度和任选的增溶剂(例如SDS)的条件下孵育细胞培养物,收集所述式(I)化合物和式(V)化合物,并任选地分离和/或纯化所述式(I)化合物和/或式(V)化合物。
可以通过向上述细胞培养物中加入更多的生物催化剂和任选的增溶剂例如SDS来增强生物转化反应。
适合于宿主细胞生长和酶产生的细胞培养条件可以根据宿主细胞而变化。这样的条件是本领域技术人员已知的,并且进一步例如通常由可以从中获得宿主细胞的细胞培养物保藏中心提供。细胞培养条件和生物转化反应条件可以相同或不同。本领域技术人员还理解,可以首先在最适于细胞生长和/或酶生产的条件下培养细胞,随后可以将所述条件调节至最适于发生生物转化反应的条件,所述条件可以相同或不同。
本文所用的术语“生物催化剂”可以指本文所述的SHC酶本身,也可以指表达所述酶的宿主细胞、所述宿主细胞的膜级分、细胞裂解物,细胞碎片或无细胞提取物,共同特征是存在SHC酶活性。
在一些实施方案中,所述生物催化剂是产生SHC酶的重组宿主细胞,其可以任选地处于悬浮或固定化形式。
在一些实施方案中,所述生物催化剂是使用常规方法(例如公开于Seitz(2012),Characterization of the substrate specificity of squalene-hopene cyclases(SHCs),PhD论文,University of Stuttgart,可获自http://dx.doi.org/10.18419/opus-1383,其全部内容通过引用并入本文)从产生SHC酶的重组宿主细胞制备的膜级分或液体级分,例如粗提物或无细胞提取物。
生物催化剂包括从细胞培养物(例如从生物反应器细胞培养物)收集的全细胞以及仍在培养中的细胞(其随后用于本文后面描述的一锅法)。生物催化剂包括完整的重组宿主细胞和/或其细胞碎片。
生物催化剂可以是固定化的。宿主细胞和/或SHC酶的固定可以通过本领域技术人员已知的任何方法实现,例如在Seitz et al.(见上文)中和在标准手册例如Guisan,J.M.,Bolivar,J.M.,López-Gallego,F.,Rocha-Martín,J.(Eds.),Immobilization of Enzymesand Cells:Methods and Protocols,Springer US,USA,2020中所讨论的(其全部内容通过引用并入本文)。固定化方法的实例包括聚合或固化含有孢子或细胞的溶液。可聚合或可固化溶液的实例包括褐藻胶,λ-卡拉胶,壳聚糖,聚丙烯酰胺,聚丙烯酰胺-酰肼,琼脂糖,聚丙烯,聚乙二醇,丙烯酸二甲酯,聚苯乙烯二乙烯基苯,聚乙烯基苯,聚乙烯醇,环氧载体,纤维素,乙酸纤维素,可光交联的树脂,预聚物,聚氨酯和明胶。固定方法的另一个实例包括将细胞吸附到支持物上。这种载体的实例包括骨炭,软木,粘土,树脂,砂,多孔氧化铝珠,多孔砖,多孔二氧化硅,硅藻土或木屑。宿主细胞可在支持物上定居并形成生物膜。固定方法的另一个实例包括使用化学试剂如戊二醛,邻联茴香胺,聚合异氰酸酯,硅烷(例如如在US3,983,000;US4,071,409;US3,519,538和US3,652,761中所讨论的,所有这些都通过引用整体并入本文),丙烯酸羟乙酯,过渡金属活化的载体,氰尿酰氯,高碘酸钠,甲苯等将宿主细胞共价偶联至支持物。培养的宿主细胞可以在其生长的任何阶段被固定,例如在培养物中达到所需的细胞密度之后。
在一些实施方案中,宿主细胞在用于生物转化反应之前被培养、收获、洗涤和任选地储存(例如冷冻或冻干)。
在一些实施方案中,培养宿主细胞,然后调节培养条件,而不在生物转化反应之前收获和洗涤细胞以适合反应的发生。这种一步(或“一锅”)方法可能是有利的,因为它可以简化工艺。在这些实施方案中用于生长细胞的培养基也可用作生物转化反应中的反应混合物。式(II)化合物、式(IIa)化合物和/或包含式(II)化合物和式(IIa)化合物的混合物可以从一开始就存在于培养物中,或可以在该方法的培养阶段之后加入。
细胞培养可以使用包含合适的营养物(例如碳源和氮源)和任选的附加化合物(例如无机盐和维生素)的培养基(或在本文中称为生长培养基)进行。合适的培养基可以根据宿主细胞而变化,并且可以从商业供应商获得,或可以使用公开的组合物(例如在Centraalbureau Voor Schimmelcultures collection(CBS)的目录中,其通常可用于每种宿主细胞)来制备。合适的碳源包括可被重组宿主细胞代谢以促进SHC酶的生长和/或生产的任何分子,所述SHC酶如本文所述的用于将式(II)化合物转化为式(I)化合物和/或将式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)。合适的碳源的实例包括但不限于蔗糖(例如纯的或在混合物例如糖蜜中发现的),果糖,木糖,甘油,葡萄糖,乙醇,纤维素,淀粉,纤维二糖或任何其他含碳水化合物的聚合物及其混合物。合适的氮源的实例包括但不限于尿素,氨,铵盐,硝酸盐及其混合物。复合碳源和氮源,例如蛋白质水解产物,胰蛋白胨,大豆粉,玉米浆,乳清蛋白水解产物,卵蛋白水解产物,酪蛋白水解产物,酵母提取物等也是合适的。
在其中宿主细胞是酵母细胞的实施方案中,优选的碳源可以选自蔗糖,果糖,木糖,乙醇,甘油,葡萄糖及其混合物。
宿主细胞可以在丰富培养基(例如LB培养基,细菌用胰蛋白胨酵母提取物培养基等)或确定成分培养基(例如确定成分基本培养基)中培养。
在一些实施方案中,确定成分基本培养基例如M9A培养基或另一种确定成分基本培养基用于细胞培养。M9A培养基可包含:14g/LKH2PO4,16g/L K2HPO4,1g/L柠檬酸Na3.2H2O,7.5g/L(NH4)2SO4,0.25g/L MgSO4.7H20,0.015g/L CaCl2.2H2O,5g/L葡萄糖和1.25g/L酵母提取物。
在一些实施方案中,丰富培养基如LB培养基或另一种丰富培养基用于细胞培养。LB培养基可包含:10g/L胰蛋白胨,5g/L酵母提取物和5g/L NaCl。
矿物介质和M9矿物介质的另外的实例可以例如在US6524831B2和US2003/0092143A1中找到。
合适的基本培养基的另一个例子可以如下制备:
对于350mL的培养物:可以将307mL的H2O加入到35mL的柠檬酸/磷酸盐储备溶液(含有133g/L KH2PO4,40g/L(NH4)2HPO4,17g/L柠檬酸.H2O,并且具有6.3的pH)中,并且可以用32%w/v NaOH将pH调节至6.8。该溶液可以在本领域使用的常规条件下高压灭菌,并且可以在高压灭菌后加入0.85mL 50%w/v MgSO4.7H2O储备溶液(见下文),0.035mL微量元素储备溶液(见下文),0.035mL硫胺素储备溶液和7mL 20%w/v葡萄糖溶液。
微量元素储备溶液可包含:在去离子水中的50g/LNa2EDTA.2H2O,20g/LFeSO4.7H2O,3g/L H3BO3,0.9g/LMnSO4.2H2O,1.1g/L CoCl2,80g/L CuCl2,240g/LNiSO4.7H2O,100g/LKl,1.4g/L(NH4)6Mo7O24.4H2O,1g/L ZnSO4.7H2O。硫胺素储备溶液可包含:在去离子水中的2.25g/L硫胺素.HCl。MgSO4储备溶液可包含:在去离子水中的50%w/vMgSO4.7H2O。
通常,用于在细胞培养物中生长细胞的最佳pH为4至8。生物转化反应的最佳pH可根据所用SHC酶的性质而不同。生物转化反应混合物的pH可以为4至8,优选5至6.5,更优选5.5至6.1。可以通过本领域技术人员已知的任何合适的技术,例如通过添加酸和碱的储备溶液或添加缓冲剂,来调节和调节细胞培养物或反应混合物中的pH。缓冲剂的非限制性实例包括柠檬酸缓冲剂和琥珀酸缓冲剂。
通常,细胞培养和/或生物转化反应的最佳温度为15℃至60℃,优选25℃至50℃,更优选25℃至45℃。生物转化反应的最佳pH可能因所用SHC酶的性质而异。在一些实施方案中,最佳温度为30℃。温度可以在整个细胞培养和/或生物转化反应中保持恒定,或可以改变。
表5中给出了本文所述的特定优选酶的特定最佳pH和温度条件。
通常,细胞培养在无氧、有氧或限氧条件下进行。对氧的需求将根据宿主细胞和培养模式而变化,并且是本领域技术人员已知的。有氧条件是其中宿主细胞的氧消耗不受氧可用性限制的条件。在限氧条件下,氧消耗受到氧可用性的限制。可以通过任何已知的方法,例如通过在空气气氛下摇动,通过搅拌,通过在培养物中喷射空气和/或氧气等,将氧供应到培养物中。
任选地,可将增溶剂例如表面活性剂,去污剂,溶解增强剂,水混溶性有机溶剂等加入细胞培养物或生物转化反应混合物中。如本文所用,术语“表面活性剂”是指降低两种液体之间或液体和固体之间的表面张力(或界面张力)的组分。表面活性剂可用作洗涤剂,润湿剂,乳化剂,发泡剂和分散剂。表面活性剂的实例包括但不限于Triton X-100,吐温80,牛磺脱氧胆酸盐,牛磺脱氧胆酸钠,十二烷基硫酸钠(SDS)和/或月桂基硫酸钠(SLS)。
尽管Triton X-100可用于部分纯化SHC酶(以可溶性或膜级分/悬浮液形式),但其也可用于生物转化反应(参见例如Seitz(2012,上文)的公开内容以及Neumann和Simon(1986),Biol Chem 367:723-729和JP2009060799,两者均通过引用整体并入本文。
优选的增溶剂是SDS。不希望受理论的束缚,SDS与重组宿主细胞的使用可能是有利的,因为SDS可以有利地与宿主细胞膜相互作用,以使SHC酶(其为膜结合酶)更容易接近式(II)化合物和/或式(IIa)化合物底物。此外,在细胞培养物和/或生物转化反应混合物中包含适当水平的SDS可以改善乳液的性质(例如在水中的式(II)化合物和/或式(IIa)化合物)和/或改善式(II)化合物和/或式(IIa)化合物底物接近宿主内的SHC酶。
本领域技术人员理解,用于本文所述生物转化反应的增溶剂(例如SDS)的最佳浓度可根据细胞生物量和底物浓度而变化。增溶剂的最佳浓度(例如SDS)也可以根据所使用的SHC酶的性质而不同。可以通过常规实验来确定适当的浓度。在本公开的方法中,当生物催化剂与式(II)化合物和/或式(IIa)化合物的比例为2:1或约2:1时,SDS/细胞浓度比可以优选为10:1至20:1,更优选为15:1至18:1。在一些实施方案中,当生物催化剂与式(II)化合物和/或式(IIa)化合物的比例为2:1或约2:1时,SDS/细胞浓度比可以优选为10:1或约10:1,11:1或约11:1,12:1或约12:1,13:1或约13:1,14:1或约14:1,15:1或约15:1,16:1或约16:1,17:1或约17:1,18:1或约18:1,19:1或约19:1,或20:1或约20:1。
在本公开的方法中,SDS浓度可以例如是0.001%至0.03%,优选0.01%至0.025%,更优选0.01%至0.02%(w/v%)。这些范围对应于包含OD为10或约10(在650nm处测量)的细胞的反应中所用的范围。本领域技术人员理解,合适的SDS浓度不限于这些范围,并且可以在细胞浓度分别增加或减少时增加或减少,以保持恒定的SDS/细胞浓度比。
表5中给出了本文所述的特定优选酶的特定示例性SDS浓度。实施例8和9中给出了利用本文所述宿主细胞进行生物转化反应的其他示例性SDS浓度。
在将式(II)化合物、式(IIa)化合物或包含式(II)化合物和式(IIa)化合物的混合物加入到细胞培养物或反应混合物中的实施方案中,其加入(“喂入”)可以使用本领域技术人员可获得的任何标准方法(例如通过使用蠕动泵的管道、使用输注注射器等)。
式(II)化合物和/或式(IIa)化合物可以是油溶性的并溶解在油中。在本文前面所述的生物催化剂存在于水相中的情况下,添加式(II)化合物和/或式(IIa)化合物将产生三相体系(包括水相、固相和油相)。甚至当SDS存在于细胞培养物和/或反应混合物中时也可能是这种情况。
在一些实施方案中,细胞培养物是连续培养物。这种培养在某些情况下可能是有利的,因为它可能导致式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的改进的生产。
在一些实施方案中,在表达本文所述的SHC酶的宿主细胞存在下,式(II)化合物生物转化为式(I)化合物导致式(II)化合物至式(I)化合物的转化率为至少5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100,以摩尔百分比给出并基于所用式(II)化合物的摩尔数。优选地,收率为5至100,10至100,20至100,30至100,35至100,更优选地40至100,45至100,50至100,60至100,或70至100mol%。
在一些实施方案中,在表达本文所述的SHC酶的宿主细胞存在下,式(IIa)化合物生物转化为式(Ia)化合物,优选式(V)化合物导致式(IIa)化合物至式(Ia)化合物,优选式(V)化合物的转化率为至少5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100,以摩尔百分比给出并基于所用式(IIa)化合物的摩尔数。优选地,收率为5至100,10至100,20至100,30至100,35至100,更优选地为40至100,45至100,50至100,60至100,或70至100mol%。
在一些实施方案中,在表达本文所述的SHC酶的宿主细胞存在下,在包含式(II)化合物和式(IIa)化合物的混合物中,式(II)化合物生物转化为式(I)化合物和/或式(IIa)化合物生物转化为式(Ia)化合物导致式(II)化合物至式(I)化合物和/或式(IIa)化合物至式(Ia)化合物的转化率为至少5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100,以摩尔百分比给出并基于所用式(II)化合物和式(IIa)化合物的摩尔数。优选地,化合物(I)的收率为5至100,10至100,20至100,30至100,35至100,更优选为40至100,45至100,50至100,60至100,或70至100mol%。优选地,化合物(Ia)的收率为5至100,10至100,20至100,30至100,35至100,更优选40至100,45至100,50至100,60至100,或70至100mol%。
在一些实施方案中,在表达本文所述的SHC酶的宿主细胞存在下,在包含式(II)化合物和式(IIa)化合物的混合物中,式(II)化合物生物转化为式(I)化合物和/或式(IIa)化合物生物转化为式(V)化合物导致式(II)化合物至式(I)化合物和/或式(IIa)化合物至式(V)化合物的转化率为至少5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100,以摩尔百分比给出并基于所用式(II)化合物和式(IIa)化合物的摩尔数。优选地,化合物(I)的收率为5至100,10至100,20至100,30至100,35至100,更优选40至100,45至100,50至100,60至100,或70至100mol%。优选地,化合物(V)的收率为5至100,10至100,20至100,30至100,35至100,更优选40至100,45至100,50至100,60至100,或70至100mol%。
在一些实施方案中,式(II)化合物和/或式(IIa)化合物的优选转化率和/或式(II)化合物转化为式(I)化合物和/或式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物)的转化率是在规定的时间内测定的,例如4,6,8,10,12,16,20,24,36,48,72,96,120,142,144,150或168小时,优选24小时,在此期间,通过重组宿主细胞将式(II)化合物转化为式(I)化合物和/或将式(IIa)化合物转化为式(Ia)化合物(例如式(V)化合物),所述重组宿主细胞包含编码本文所述的SHC酶的核苷酸序列,并且其已经产生了SHC酶。
在一些实施方案中,生物转化反应在例如25℃,30℃,35℃,40℃,50℃或60℃的温度值下进行。在一些实施方案中,所获得的式(II)化合物至式(I)化合物的转化率和/或式(IIa)化合物至式(Ia)化合物(例如式(V)化合物)的转化率和/或式(II)化合物和/或式(IIa)化合物的转化率通过在25℃至55℃,优选30℃至40℃的温度范围内进行反应24-72小时来测定。在一些实施方案中,该时间段被延长,例如延长至总共150小时或更长。
在一些实施方案中,在相同条件下,优选在分别定义为所考虑的SHC酶活性的最佳的条件下,与表达编码亲本SHC酶的核苷酸序列的重组宿主细胞相比,包含编码本文所述的SHC酶的核苷酸序列的重组宿主细胞显示出至少5%,10%,20%,30%,40%,50%,60%,70%,80%,90%,100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍或1000-倍更高的式(II)化合物至式(I)化合物和/或式(IIa)化合物至式(Ia)化合物(例如式(V)化合物)的转化率和/或式(II)化合物和/或式(IIa)化合物的转化速率。
在一些实施方案中,本文所述的方法在宿主细胞和/或式(II)化合物和/或式(IIa)化合物浓度(在液体培养物中)为5g/L或更高,10g/L或更高,20g/L或更高,30g/L或更高,40g/L或更高,50g/L或更高,60g/L或更高,70g/L或更高,80g/L或更高,90g/L或更高,100g/L或更高,110g/L或更高,120g/L或更高,130g/L或更高,135g/L或更高,150g/L或更高,175g/L或更高,或200g/L或更高,或250g/L或更高的情况下进行。
在一些实施方案中,本文所述的方法在宿主细胞与底物的重量比为0.1-4至1或约0.1-4至1(0.1-4:1),0.1-3至1或约0.1-3至1(0.1-3:1),0.1-2至1或约0.1-2至1(0.1-2:1),0.25-2至1或约0.25-2至1(0.25-2:1),0.5-2至1或约0.5-2至1(0.5-2:1),0.1至1或约0.1至1(0.1:1),0.5至1或约0.5至1(0.5:1),1至1或约1至1(1:1),1.5至1或约1.5至1(1.5:1),或2至1或约2至1(2:1),优选地为0.1至1或约0.1至1(0.1:1),0.5至1或约0.5至1(0.5:1),或1至1或约1至1(1:1)的情况下进行。
如前文所述,与其亲本酶相比,本文所述的SHC酶在这些浓度下可表现出改善的反应性能。本文所述的SHC酶的反应性能可以使用本文前面讨论的任何参数来评估,例如生产率、总转化率或增加的底物转化速率,或式(I)化合物和/或式(Ia)化合物(例如式(V)化合物)的收率,其可以改进至少5%,10%,20%,30%,40%,50%,60%,70%,80%,90%,100%(2-倍),3-倍,4-倍,5-倍,6-倍,7-倍,8-倍,9-倍,10-倍,11-倍,12-倍,13-倍,14-倍,15-倍,16-倍,17-倍,18-倍,19-倍,20-倍,21-倍,22-倍,23-倍,24-倍,25-倍,26-倍,27-倍,28-倍,29-倍,30-倍,31-倍,32-倍,33-倍,34-倍,35-倍,36-倍,37-倍,38-倍,39-倍,40-倍,41-倍,42-倍,43-倍,44-倍,45-倍,46-倍,47-倍,48-倍,49-倍,50-倍,51-倍,52-倍,53-倍,54-倍,55-倍,56-倍,57-倍,58-倍,59-倍,60-倍,61-倍,62-倍,63-倍,64-倍,65-倍,66-倍,67-倍,68-倍,69-倍,70-倍,71-倍,72-倍,73-倍,74-倍,75-倍,76-倍,77-倍,78-倍,79-倍,80-倍,81-倍,82-倍,83-倍,84-倍,85-倍,86-倍,87-倍,88-倍,89-倍,90-倍,91-倍,92-倍,93-倍,94-倍,95-倍,96-倍,97-倍,98-倍,99-倍,100-倍,200-倍,500-倍或1000-倍,与其亲本SHC酶的反应性能相比。
表1.序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
通用信息
除非另有说明,否则本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员习惯和通常理解的相同含义,并根据本公开进行阅读。
序列一致性
在本公开的上下文中,核酸分子例如编码本文所述的SHC酶的核酸分子由编码本文所述的SHC酶的核酸或核苷酸序列表示。
应当理解,本文通过给定的序列识别号(SEQ ID NO)鉴定的每个核酸分子或蛋白质片段或多肽或肽或衍生肽或构建体不限于所公开的该特定序列。本文鉴定的每个编码序列编码给定的蛋白质片段或多肽或肽或衍生肽或构建体,或其本身是蛋白质片段或多肽或构建体或肽或衍生肽。
在本申请中,每当提及编码给定的蛋白质片段或多肽或肽或衍生肽的特定核苷酸序列SEQ ID NO(以SEQ ID NO:X为例)时,可以将其替代为:
i.核苷酸序列,其包含与SEQ ID NO:X具有至少30%,40%,50%,60%,70%,80%,90%,95%或99%序列一致性的核苷酸序列;
ii.核苷酸序列,其序列由于遗传密码的简并性与(i)的核酸分子的序列不同;或
iii.核苷酸序列,其编码与核苷酸序列SEQ ID NO:X编码的氨基酸序列具有至少30%,40%,50%,60%,70%,80%,90%,95%或99%氨基酸一致性或相似性的氨基酸序列。
序列一致性或相似性的另一个优选水平是30%。序列一致性或相似性的另一个优选水平是40%。序列一致性或相似性的另一个优选水平是50%。序列一致性或相似性的另一个优选水平是60%。序列一致性或相似性的另一个优选水平是70%。序列一致性或相似性的另一个优选水平是80%。序列一致性或相似性的另一个优选水平是90%。序列一致性或相似性的另一个优选水平是95%。序列一致性或相似性的另一个优选水平是99%。
在整个申请中,每一次引用特定的氨基酸序列SEQ ID NO(以SEQ ID NO:Y为例)时,可以将其替代为:由氨基酸序列表示的多肽,所述氨基酸序列包含与氨基酸序列SEQ IDNO:Y具有至少30%,40%,50%,60%,70%,80%,90%,95%或99%序列一致性或相似性的序列。序列一致性或相似性的另一个优选水平是30%。序列一致性或相似性的另一个优选水平是40%。序列一致性或相似性的另一个优选水平是50%。序列一致性或相似性的另一个优选水平是60%。序列一致性或相似性的另一个优选水平是70%。序列一致性或相似性的另一个优选水平是80%。序列一致性或相似性的另一个优选水平是90%。序列一致性或相似性的另一个优选水平是95%。序列一致性或相似性的另一个优选水平是99%。
本文所述的每个核苷酸序列或氨基酸序列根据其分别与给定核苷酸序列或氨基酸序列的一致性或相似性百分比在进一步优选的实施方案中与给定核苷酸或氨基酸序列分别具有至少30%,至少31%,至少32%,至少33%,至少34%,至少35%,至少36%,至少37%,至少38%,至少39%,至少40%,至少41%,至少42%,至少43%,至少44%,至少45%,至少46%,至少47%,至少48%,至少49%,至少50%,至少51%,至少52%,至少53%,至少54%,至少55%,至少56%,至少57%,至少58%,至少59%,至少60%,至少61%,至少62%,至少63%,至少64%,至少65%,至少66%,至少67%,至少68%,至少69%,至少70%,至少71%,至少72%,至少73%,至少74%,至少75%,至少76%,至少77%,至少78%,至少79%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少95.5%,至少96%,至少96.5%,至少97%,至少97.5%,至少98%,至少98.5%,至少99%,至少99.5%或100%一致性或相似性。
每个非编码核苷酸序列(即启动子或另一个调节区的)可以被一个核苷酸序列替代,该核苷酸序列包含与特定核苷酸序列SEQ ID NO(以SEQ ID NO:A作为例子)具有至少60%序列一致性或相似性的核苷酸序列。优选的核苷酸序列与SEQ ID NO:A具有至少30%,至少31%,至少32%,至少33%,至少34%,至少35%,至少36%,至少37%,至少38%,至少39%,至少40%,至少41%,至少42%,至少43%,至少44%,至少45%,至少46%,至少47%,至少48%,至少49%,至少50%,至少51%,至少52%,至少53%,至少54%,至少55%,至少56%,至少57%,至少58%,至少59%,至少60%,至少61%,至少62%,至少63%,至少64%,至少65%,至少66%,至少67%,至少68%,至少69%,至少70%,至少71%,至少72%,至少73%,至少74%,至少75%,至少76%,至少77%,至少78%,至少79%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少95.5%,至少96%,至少96.5%,至少97%,至少97.5%,至少98%,至少98.5%,至少99%,至少99.5%或100%一致性。在一个优选的实施方案中,这种非编码核苷酸序列例如启动子至少表现或发挥这种非编码核苷酸序列例如本领域技术人员已知的启动子的活性的活性。
术语“同源性”、“序列一致性”等在本文中可互换使用。序列一致性在本文中描述为两个或多个氨基酸(多肽或蛋白质)之间的关系。序列或两个或多个核酸(多核苷酸)序列,如通过比较序列所确定的。在一个优选的实施方案中,基于两个给定的SEQ ID NO的全长或其部分来计算序列一致性。其部分优选地是指两个SEQ ID NO的至少50%,60%,70%,80%,90%或100%。在本领域中,“一致性”也指氨基酸或核酸序列之间的序列相关程度,视情况而定,如由这种序列的字符串之间的匹配所确定的。两个氨基酸序列之间的“相似性”通过将一种多肽的氨基酸序列及其保守氨基酸置换与第二种多肽的序列进行比较来确定。“一致性”和“相似性”可以通过已知方法容易地计算,包括但不限于在Bioinformatics andthe Cell:Modern Computational Approaches in Genomics,Proteomics andtranscriptomics,Xia X.,Springer International Publishing,New York,2018和Bioinformatics:Sequence and Genome Analysis,Mount D.,Cold Spring HarborLaboratory Press,New York,2004中描述的那些,每一个都通过引用并入本文。
“序列同一性”和“序列相似性”可以通过使用全局或局部比对算法比对两个肽或两个核苷酸序列来确定,这取决于两个序列的长度。相似长度的序列优选地使用全局比对算法(例如Needleman-Wunsch)进行比对,其在整个长度上最佳地比对序列,而基本上不同长度的序列优选地使用局部比对算法(例如Smith-Waterman)进行比对。当序列(当使用默认参数通过例如程序EMBOSS needle或EMBOSS water进行最佳比对时)共享至少某个最小百分比的序列一致性(如下所述)时,所述序列可以被称为“基本上相同”或“本质上相似”)。
当两个序列具有相似的长度时,全局比对适合用于确定序列一致性。当序列具有基本上不同的总长度时,优选局部比对,例如使用Smith-Waterman算法的那些。EMBOSSneedle使用Needleman-Wunsch全局比对算法在两个序列的整个长度(全长)上进行比对,最大化匹配的数量并最小化空位的数量。EMBOSS water使用Smith-Waterman局部比对算法。通常,使用EMBOSS needle和EMBOSS water默认参数,空位开放罚分=10(核苷酸序列)/10(蛋白质)和空位延伸罚分=0.5(核苷酸序列)/0.5(蛋白质)。对于核苷酸序列,使用的默认评分矩阵是DNAfull,而对于蛋白质,默认评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919,通过引用并入本文)。
可替代地,可以通过使用诸如FASTA、BLAST等算法对公共数据库进行搜索来确定百分比相似性或一致性。因此,本公开的一些实施方案的核酸和蛋白质序列还可用作“查询序列”以针对公共数据库进行搜索以例如鉴定其他家族成员或相关序列。可以使用Altschul,et al.(1990)J.Mol.Biol.215:403-10(通过引用并入本文)的BLASTn和BLASTx程序(版本2.0)来进行这样的搜索。可以使用BLASTN程序、分数=100、字长=12进行BLAST核苷酸搜索以获得与本公开的氧化还原酶核酸分子同源的核苷酸序列。可以用BLASTx程序、分数=50、字长=3进行BLAST蛋白质搜索以获得与本公开的蛋白质分子同源的氨基酸序列。为了获得用于比较目的空位比对(gapped alignments),可以利用Gapped BLAST,如在Altschul et al.,(1997)Nucleic Acids Res.25(17):3389-3402中所描述的(通过引用并入本文)。当利用BLAST和Gapped BLAST程序时,可以使用各个程序(例如BLASTx和BLASTn)的默认参数。参见国家生物技术信息中心(National Center for BiotechnologyInformation)的主页,可在万维网www.ncbi.nlm.nih.gov/上查阅。
序列匹配分析可以通过已建立的同源性作图技术如Shuffle-LAGAN(Brudno M.,Bioinformatics 2003b,19SuppI 1:154-162)或Markov随机场来补充。
任选地,在确定氨基酸相似性的程度时,本领域技术人员还可以考虑本文前面讨论的所谓的保守性氨基酸置换。
基因或编码序列
术语“基因”意指包含与合适的调节区(例如启动子)可操作地连接的区域(转录区)的DNA片段,其在细胞中转录成RNA分子(例如mRNA)。基因通常包含几个可操作连接的片段,例如启动子,5’前导序列,编码区和3’-非翻译序列(3’-端),例如包含聚腺苷酸化和/或转录终止位点。嵌合或重组基因是在自然界中通常不存在的基因,例如这样的基因,其中例如启动子在性质上不与部分或全部转录的DNA区域相关联。“基因的表达”指这样的过程,其中可操作地连接至适当调节区(特别是启动子)的DNA区域被转录成RNA,其具有生物活性,即能够被翻译成生物活性蛋白质或肽。
蛋白质和氨基酸
术语“蛋白质”或“多肽”或“氨基酸序列”可互换使用并且指由氨基酸链组成的分子,而不涉及具体的作用模式、大小、三维结构或起源。在本文所述的氨基酸序列中,氨基酸或“残基”用三个字母或一个字母的符号表示。三个字母的符号以及相应的一个字母的符号是本领域技术人员公知的,并且具有以下含义:A(Ala)是丙氨酸,C(Cys)是半胱氨酸,D(Asp)是天冬氨酸,E(Glu)是谷氨酸,F(Phe)是苯丙氨酸,G(Gly)是甘氨酸,H(His)是组氨酸,I(Ile)是异亮氨酸,K(Lys)是赖氨酸,L(Leu)是亮氨酸,M(Met)是甲硫氨酸,N(Asn)是天冬酰胺,P(Pro)是脯氨酸,Q(Gln)是谷氨酰胺,R(Arg)是精氨酸,S(Ser)是丝氨酸,T(Thr)是苏氨酸,V(Val)是缬氨酸,W(Trp)是色氨酸,Y(Tyr)是酪氨酸。残基可以是任何蛋白氨基酸,还包括任何非蛋白氨基酸例如D-氨基酸和通过翻译后修饰形成的修饰氨基酸,以及任何非天然氨基酸。
在本文及其权利要求中,动词“包括”及其变化形式在其非限制性意义上用于表示包括单词后面的项目,但不排除未特别提及的项目。此外,动词“组成”可由“基本上由……组成”代替,意指本文所述的组合物可包含另外的组分而不是具体鉴定的那些,所述另外的组分不改变本发明的独特特征。此外,动词“组成”可由“基本上由……组成”替代,意指本文所述的方法可包括另外的步骤,而不是具体鉴定的那些,所述另外的步骤不改变本发明的独特特征。
用不定冠词“a”或“an”提及元件并不排除存在多于一个元件的可能性,除非上下文明确要求存在一个且仅有一个元件。因此,不定冠词“一”或“一个”通常表示“至少一个”。
如本文所用,“至少”特定值是指该特定值或更大值。例如,“至少2个”被理解为与“2个或更多个”相同,即2,3,4,5,6,7,8,9,10,11,12,13,14,15个,……等。
此外,说明书和权利要求中的术语第一,第二,第三等用于区分相似的元件,而不一定用于描述顺序或时间顺序。应当理解,如此使用的术语在适当的情况下是可互换的,并且本文所述的实施例能够以不同于本文所述或所示的其他顺序操作。
当与数值(例如约10)结合使用时,词语“约”或“大约”优选是指该值可以是给定值(10),大于或小于该值的1%。
在本公开的上下文中,术语“和/或”被理解为是指由术语“和/或”连接的组的所有成员都相对于以任何组合彼此连接,并且相对于彼此可替代地连接。示例性地,对于表述“A、B和/或C”,以下公开内容应理解为:i)(A或B或C),或ii)(A和B),或iii)(A和C),或iv)(B和C),或v)(A和B和C),或vi)(A和B或C),或vii)(A或B和C),或viii)(A和C或B)。
本文描述了各种实施方案。除非另有说明,本文所述的每个实施方案都可以组合在一起。
本文引用的所有专利申请、专利和印刷出版物的全部内容均通过引用整体并入本文,除了任何定义、主题、免责声明或否认之外,并且除了所结合的材料与本文明确公开内容不一致的程度之外,在这种情况下,以本公开内容中的语言为准。
本公开不受本文所述的方法、方案和材料的限制。本领域技术人员将认识到与本文所述相似或等同的许多方法、方案和材料,它们可用于本文所述的实践中。实际上,本公开决不限于所描述的方法和材料。还应当理解,本公开包括以下实施例的方面对前述公开的概括。
通过以下实施例进一步描述本公开,这些实施例不应被解释为限制本公开的范围。
附图说明
图1.制备式(II)化合物的反应方案。对于所述化合物,R任选地选自H和C1-C4烷基。
图2.具有所选择的SHC变体的SHC酶活性。E,Z-HFA转化是相对于BmeSHC的转化而言的,如在文库筛选和选择改进的变体期间所测试的(2g/L E,Z-HFA,细胞至OD650nm 10,0.005%SDS,50mM琥珀酸/NaOH缓冲液pH 5.2,35℃,250rpm,24h)。
图3.具有所选择的SHC变体的SHC酶活性。反应条件与图2中讨论的相同。使用的生物催化剂是在发酵中产生的。
图4.具有所选择的SHC变体的SHC酶活性。E,Z-HFA转化是相对于wt BmeSHC的转化而言的,如在突变研究和选择改进的变体期间所测试的(4g/L E,Z-HFA,细胞至OD650nm 10,0.004%SDS,50mM琥珀酸/NaOH缓冲液pH 5.2,35℃,250rpm,24h)。
图5.具有所选择的SHC变体的SHC酶活性。反应条件与图4中讨论的相同。使用的生物催化剂是在发酵中产生的。
图6.具有所选择的SHC变体的SHC酶活性。E,Z-HFA转化是相对于wt BmeSHC的转化而言的(4g/L E,Z-HFA,细胞至OD650nm 10,0.004%SDS,50mM琥珀酸/NaOH缓冲液pH 5.2,35℃,250rpm,24h)。
图7.wt和变体BmeSHC酶的相对活性。用135g/L E,Z-HFA和182g/L细胞在T、pH和SDS(SDS:细胞比)条件下进行反应,所述条件被定义为每种变体的最佳条件。将使用wtBmeSHC的转化率设置为参考(100)。
图8.BmeSHC#192和BmeSHC#192变体的相对活性。用135g/LE,Z HFA和182g/L细胞在T、pH和SDS([SDS]:[细胞]比)条件下进行反应,所述条件分别定义为每种测试变体的最佳条件。使用BmeSHC#192的转化率设置为参考100。
图9.BmeSHC#192和BmeSHC#192变体的相对活性。用100g/LE,Z-HFA和100g/L细胞在T、pH和SDS([SDS]:[细胞]比)条件下进行反应,所述条件分别定义为每种测试变体的最佳条件。使用BmeSHC#192的转换率设置为参考100。
实施例
实施例1:SHC酶进化:文库筛选,BmeSHC变体,新突变
使用编码巨大芽孢杆菌SHC酶的基因作为模板进行酶进化程序。产生约11’300个SHC变体的文库并筛选显示环化E,Z-羟基金合欢基丙酮(E,Z-HFA)至(+)-龙涎缩醛能力增加的变体。在大肠埃希菌MC1061(DE3)中进行SHC生产的基因表达:在自动诱导培养基中的0.5mL培养物,在37℃下孵育2h,然后在20℃下孵育22h(250rpm)。通过离心收集细胞并用50mM琥珀酸/NaOH缓冲液pH 5.2洗涤。
在96深孔板中进行SHC活性筛选。在50mM琥珀酸/NaOH缓冲液(pH 5.2)中进行0.5mL反应。它们含有2g/L E,Z-HFA和0.004%十二烷基硫酸钠(SDS),这些细胞产生了OD650nm为10的SHC变体。在35℃下在恒定搅拌(定轨振荡,250rpm)下进行反应3小时,溶剂萃取用于GC-FID分析以测定E,Z-HFA转化为(+)-龙涎缩醛,如实施例7所述。
生产的大约11’300种变体中有316种被选择进行验证。
选择上述316种变体中的82种进行更大规模的确认。在上述培养方案和细胞收获之后,在自动诱导培养基中运行20mL培养物。在上述设置中测定SHC活性。反应含有2或4g/LE,Z-HFA,细胞OD650nm为10或20,0.01或0.005%SDS,取决于细胞浓度(恒定SDS/细胞比)。将反应物在35℃(250rpm)下孵育2、4或6h。在用于GC-FID分析的溶剂萃取之前测定转化为(+)-龙涎缩醛的E,Z-HFA转化率,如实施例7所述。
选择上述82种变体中的23种进行最终确认步骤。在自动诱导培养基中运行20mL培养物(在37℃下孵育2h,然后在20℃下孵育22h(180rpm))。将细胞通过离心收集,洗涤,并在50mM琥珀酸/NaOH缓冲液pH 5.2中浓缩至OD650nm为200。在96深孔板中测定活性。在pH 5.2的50mM琥珀酸/NaOH缓冲液中反应,含有2、4或8g/L E,Z-HFA,细胞OD650nm为5或10,和0.0025或0.005%SDS,取决于细胞浓度(恒定SDS/细胞比)。随时间对反应物取样,溶剂萃取并通过气相色谱法分析以测定E,Z-HFA向(+)-龙涎缩醛的转化,如实施例7中所述。
7种具有改进的E,Z-HFA环化活性的变体,这取决于用于活性测试的条件(底物浓度、反应时间),揭示了表2中列出的突变。选择这些变体进行深入表征。它们在含有2g/LEZHFA和OD650nm为10的细胞的反应中的活性(E,Z-HFA转化率相对于使用wt BmeSHC的转化率)如图2中所示。当通过发酵生产时,这些变体的活性如图3中所示。结果表明,生物催化剂的活性强烈依赖于如何产生生物催化剂(摇瓶培养vs.发酵,自动诱导培养基vs.基本培养基)
表2:所选择的BmeSHC变体中的突变
实施例2:突变研究1
进行突变研究以确定变体3G6和50D3的突变对E,Z-HFA环化为(+)-龙涎缩醛的影响。研究了3G6和50D3突变的所有可能组合,包括单独突变和与Y483C、L5P和Y483C+L5P突变相关的突变。构建了176种另外的变体,并测试了它们的E,Z-HFA至(+)-龙涎缩醛的环化活性。
如文库筛选(实施例1)所述,在微量滴定板中进行培养和基因表达。在0.5mL反应中用2和4g/L E,Z-HFA测定SHC活性;细胞OD650nm为10,0.004%SDS,在50mM琥珀酸/NaOH缓冲液中,pH5.2(250rpm)。在进行溶剂提取和GC分析之前,将反应物孵育3或6小时,如实施例7所述。所选择的变体中的突变如表3所示,变体的活性(反应24h后相对于wt BMeSHC的E,Z-HFA转化率)如图4中所示。发酵产生的这些生物催化剂的活性如图5中所示。结果表明,生物催化剂的活性强烈依赖于如何产生细胞。
突变组合研究确定了5个有益突变:I2N,Y483C,L539H,L5P,T35A。
表3:所选择的BmeSHC变体中的突变
实施例3:突变研究2
在突变研究1(实施例2)中鉴定为有益的突变与同样鉴定为有益的突变E211V和T166A组合。将E211V和/或T166A添加到SHC变体#15,#21,#42,#47,#56和#96中:构建了21个另外的变体。
如文库筛选(实施例1)所述,在微量滴定板中进行培养和基因表达。在0.5mL含有4g/L E,Z-HFA的反应中测定SHC活性;细胞OD650nm为10,0.004%SDS,在50mM琥珀酸/NaOH缓冲液中,pH5.2(250rpm)。在进行溶剂提取和GC分析之前,将反应物在35℃和250rpm下孵育3、6或24小时。所选择的另外的变体中的突变如表4中所示,变体的活性(3、6和24h后相对于wt BmeSHC的E,Z-HFA转化率)如图6中所示。
SHC变体#179,#182,#188,#192和#193均显示比野生型BmeSHC改进4.5至6.5倍(反应24小时后E,Z-HFA转化率)。
表4:所选择的BmeSHC变体中的突变
实施例4:生物催化剂生产(发酵)
为了在大肠埃希菌中生产SHC酶,将编码所需野生型或变体角鲨烯何帕烯环化酶的基因插入到质粒pET-28a(+)中,其中它在IPTG诱导型T7启动子的控制下。使用标准热激转化程序将质粒转化到大肠埃希菌菌株BL21(DE3)中。
培养基
用于生物催化剂生产的默认基本培养基包含
●10%10x柠檬酸/磷酸盐缓冲液(133g/L KH2PO4,40g/L(NH4)2HPO4,17g/L柠檬酸.H2O的去离子水溶液,用32%NaOH将pH调至6.8),
●2.43%MgSO4溶液(50%w/v MgSO4.7H2O的去离子水溶液),
●0.01%的微量元素溶液(在去离子水中的50g/LNa2EDTA.2H2O,20g/LFeSO4.7H2O,3g/L H3BO3,0.9g/LMnSO4.2H2O,1.1g/L CoCl2,80g/L CuCl2,240g/LNiSO4.7H2O,100g/LKI,1.4g/L(NH4)6Mo7O24.4H2O,1g/L ZnSO4.7H2O),
●0.01%硫胺素溶液(2.25g/L硫胺素.HCl的去离子水溶液),
●2%葡萄糖溶液(20%w/v葡萄糖的去离子水溶液)。
柠檬酸/磷酸盐缓冲液首先通过高压灭菌,然后从无菌溶液中加入的其他成分通过高压灭菌或过滤灭菌(0.2μM)来灭菌。
发酵
发酵在750mL InforsHT反应器中进行。向发酵容器中加入168mL去离子水。反应容器配备有所有需要的探针(pO2,pH,取样,消泡剂),C+N进料和氢氧化钠瓶,并高压灭菌。在向反应器中加入高压灭菌后:
●20mL 10x磷酸盐/柠檬酸缓冲液
●14mL 50%葡萄糖
●0.53mL MgSO4溶液
●2mL(NH4)2SO4溶液(50%(w/v)(NH4)2SO4的去离子水溶液)
●0.020mL微量元素溶液
●0.400mL硫胺素溶液
●0.200mL卡那霉素溶液(50mg/mL)
运行参数如下:pH=6.95,pO2=40%,T=30℃,300rpm。级联:rpm设定值为300,最小值为300,最大值为1000,流量(l/min)设定值为0.1,最小值为0,最大值为0.6。消泡剂控制:1:9。
将种子培养物在LB培养基(+卡那霉素)中在37℃,220rpm下生长8h。将发酵罐接种至OD650nm为0.4-0.5来自该种子培养物。发酵首先以分批模式运行11.5h,之后用进料溶液(灭菌的葡萄糖溶液(143mL H2O+35g葡萄糖))开始C+N进料,灭菌后向其中加入:17.5mL(NH4)2SO4溶液,1.8mL MgSO4溶液,0.018mL微量元素溶液,0.360mL硫胺素溶液,0.180mL卡那霉素溶液。进料以约4.2mL/h的恒定流速运行。在体外进行葡萄糖和NH4 +测量,以评估培养物中碳源和氮源的可用性。通常血糖水平很低。
培养物总共生长了大约25小时,其中它们通常达到40-45的OD650nm。然后通过向发酵罐中加入浓度为1mM的IPTG来诱导SHC的产生,并在30℃和pO2=20%下持续大约16h。在诱导结束时,通过离心收集细胞,用柠檬酸/磷酸钠缓冲液pH 5.6洗涤,并在4℃或-20℃下以沉淀形式储存,直到进一步使用。
实施例5:BmeSHC变体的优化反应条件
就温度、pH和SDS浓度而言,分别优化所选择的SHC变体的反应条件。如实施例4所述通过发酵制备生物催化剂。
将2-5mL体积的反应与4g/L E,Z-HFA和在OD650nm为10处加载的细胞(表达变体SHC酶)在0.1M柠檬酸/磷酸钠缓冲液中,pH 5.0-6.8,在0.010-0.020%SDS存在下,在27-50℃的温度范围和持续搅拌(Heidolph synthesis 1Liquid device,800rpm)下运行。在0.1M琥珀酸/NaOH缓冲液中确定/调节(pH)优化的反应条件。引入的突变对变体的SDS最佳浓度和pH有一定的影响。观察到相对于最佳温度的主要变化。
表5:BmeSHC野生型和变体酶的优化反应条件1。
/>
1提供野生型BmeSHC酶的最佳值用于比较目的。2在含有OD650nm为10的细胞的反应中。
实施例6:SHC变体在135g/L E,Z-羟基金合欢基丙酮生物转化中的性能
在135g/L E,Z-HFA生物转化中使用由大肠埃希菌菌株发酵产生的生物催化剂,所述大肠埃希菌菌株用携带编码所选择的BmeSHC wt或变体SHC酶的基因的质粒转化。4mL反应在Radleys Carousel Plus/Monoblock 16中进行。它们含有135g/L E,Z-HFA,182g/L细胞,并且在关于温度、pH和SDS浓度定义为最佳的条件下运行。
图7显示了wt和变体BmeSHC酶在E,Z-HFA转化为(+)-龙涎缩醛方面的相对活性作为时间的函数。最佳变体#179,#189,#192和#193在24-48小时内达到完全转化,而wtBmeSHC达到完全转化需要72小时。
实施例7:GC-FID分析
用适当体积的MTBE提取(剧烈振荡)样品,以定量其在底物和反应产物中的含量。在GC-FID分析(台式离心机)之前,通过离心将溶剂部分与水相分离。将1μL溶剂相注入(分流比10)30m x 0.32mm x0.25μm DB-Wax柱。柱在恒定流速(4mL/min H2)下展开,温度梯度为:200℃,25℃/min至240℃,120℃/min至240℃,240℃下4min。分流:10mL/min,分流比:5。入口温度:250℃,检测器温度:150℃。这导致E,Z-HFA和(+)-龙涎缩醛的分离。用下式由(+)-龙涎缩醛和E,Z-HFA峰的面积计算E,Z-HFA转化率:
EZHFA转化率(%)=100x(面积峰龙涎缩醛/(面积峰龙涎缩醛+面积EZHFA峰))
实施例8:E,Z-羟基金合欢基丙酮的环化
使用BmeSHC变体#192环化E,Z-羟基金合欢基丙酮。
该反应含有9.9g E,Z-羟基金合欢基丙酮,364g/L已产生BmeSHC变体#192的细胞,1.15g SDS(10%SDS),并在30℃下在恒定搅拌下在0.1M琥珀酸/NaOH缓冲液pH 5.6中运行(250mL烧瓶中的115mL总体积,Radleys Monoblock)。E,Z-羟基金合欢基丙酮在大约142小时内完全转化。
将反应物用100mL MTBE萃取5次,通过离心(30min,3579g,室温)回收溶剂相,合并溶剂相,用MgSO4干燥,并通过旋转蒸发将溶剂蒸发,得到20.9g粗产物。
将粗产物溶于乙醇中,加水结晶。回收8g根据GC分析纯度>99%的结晶(+)-龙涎缩醛。
实施例9:由羟基金合欢基丙酮异构体和羟基金合欢基丙酮的结构异构体的混合物环化E,Z-羟基金合欢基丙酮
使用BmeSHC变体#192环化以下4种化合物的混合物:
a)式(II)化合物的E,Z-异构体,其中R是甲基(E,Z-羟基金合欢基丙酮)
b)式(II)化合物的E,E-异构体,其中R是甲基(E,E-羟基金合欢基丙酮)
c)式(IIa)化合物的E,Z-异构体,其中R是甲基
d)式(IIa)化合物的E,E-异构体,其中R是甲基
在该实施例中a:b:c:d的比例为37:9:29:16。
该反应含有135g/L的4-化合物混合物和364g/L的已经产生BmeSHC变体#192的细胞,2.05g SDS(10.25%SDS),并在30℃下在恒定搅拌下在0.1M琥珀酸/NaOH缓冲液pH 5.6中运行(250mL DASBox发酵罐中的200mL总体积)。反应总共进行150小时,其中E,Z-羟基金合欢基丙酮的转化率为大约80%。
将反应物用100mL MTBE萃取7次,通过离心(30min,3579g,室温)回收溶剂相,合并,用MgSO4干燥,并通过旋转蒸发将溶剂蒸发,得到27.6g粗产物。
使用正庚烷/MTBE作为溶剂系统,通过快速色谱法纯化反应产物。合并含有产物的级分并蒸发溶剂,得到7.1g粗产物。
将粗产物溶解在乙醇中并通过加入水结晶,得到含有式(I)化合物和式(V)化合物的2个产物级分,其中R是甲基。
主要的产物级分(晶体,5.4g)含有比例为93:7的式(I)化合物和式(V)化合物(根据GC分析,纯度>99%)。
第二产物级分(油状结晶,708mg)含有比例为42:58的式(I)化合物和式(V)化合物(96.8%纯度)。
实施例10:与酶稳定性相关的结构元件中的突变
使用酸热脂环酸芽孢杆菌SHC(PDB ID:2SQC)的晶体结构,通过同源建模创建BmeSHC酶的模型。
影响酶稳定性的结构元件包括但不限于例如可能使α-螺旋不稳定的甘氨酸残基,或负责形成盐桥的氨基酸残基。
角鲨烯何帕烯环化酶的酶家族的特征是QW-重复序列(谷氨酰胺(Q)-色氨酸(W)基序),其通过复杂的相互作用网络收紧蛋白质结构(Wendt et al.,The structure of themembrane protein squalene-hopene cyclase at resolution,J.Mol.Biol 286,175-187(1999))。/>
比较BmeSHC和BmeSHC同系物中的QW-重复序列,设计了表6中所列的BmeSHC#192变体,其突变指向QW重复序列。
表6:负责酶稳定性的结构元件的突变。
实施例11:用BmeSHC#192变体转化E,Z-羟基金合欢基丙酮
表6所列变体的生物催化剂通过实施例4所述的方法发酵生产。
对于每种变体,如实施例5中所述,就反应参数温度、pH和SDS浓度而言,用所产生的生物催化剂分别优化反应条件。所选择的BmeSHC#192变体的优化反应条件列于表7中。
表7:BmeSHC#192变体的优化反应条件。
SHC酶 | 温度(℃) | pH | [SDS](w/v%)1 |
BmeSHC#192_v70 | 35 | 5.6-5.8 | 0.024 |
BmeSHC#192_v71 | 35 | 5.6-6.2 | 0.018 |
BmeSHC#192_v72 | 35 | 5.8-6.2 | 0.024 |
BmeSHC#192_v73 | 35 | 5.6-6.2 | 0.018 |
BmeSHC#192_v75 | 35 | 5.8-6.2 | 0.024 |
1在含有细胞的反应中OD650nm为10(大约9g/L细胞)。
在135g/L E,Z-HFA生物转化中使用生物催化剂和182g/L细胞:4mL反应在RadleysCarousel Plus中进行,条件分别定义为每种变体的最佳温度、pH和SDS浓度。
图8显示了亲本和变体BmeSHC#192酶在E,Z-HFA转化为(+)-龙涎缩醛方面的相对活性与时间的函数关系。通过处理结构元件如QW-重复序列来增强酶的稳定性,从而增加酶的活性。用所有测试的变体增加反应3小时后以转化率测量的初始反应速度。除了两种变体BmeSHC#192_v70和BmeSHC#192_v72之外,与亲本BmeSHC#192相比,使用所述变体在42.5和70h的反应之后E,Z-羟基金合欢基丙酮的转化率更高。
实施例12:E,Z-羟基金合欢基丙酮与BmeSHC#192变体在细胞:底物比例为1时的转化
变体BmeSHC#192_v70、BmeSHC#192_v71和BmeSHC#192_v75(表6)的生物催化剂通过实施例4中描述的方法发酵生产。在生物转化中使用生物催化剂,细胞:底物比例为1(100g/LE,Z-HFA,100g/L细胞):4mL反应在Radleys Carousel Plus中进行,条件分别定义为每种变体的最佳温度、pH和SDS浓度(表7)。
图9显示了根据E,Z-HFA转化为(+)-龙涎缩醛作为时间的函数测量的亲本和变体BmeSHC#192酶的相对活性。产生变体BmeSHC#192_v70、BmeSHC#192_v71和BmeSHC#192_v75的生物催化剂比产生亲本酶BmeSHC#192的生物催化剂表现更好:观察到变体的E,Z-HFA转化率与亲本酶相比增加约1.25-1.35倍。
Claims (31)
1.用于制备式(I)化合物的方法,
其中所述方法包括使式(II)化合物
与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQID NO:1的序列具有至少70%一致性或相似性的氨基酸序列,其中所述SHC酶在对应于SEQID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,
并且其中R选自H和C1-C4烷基。
2.根据权利要求1所述的方法,其中所述式(II)化合物的C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)。
3.用于制备包含式(I)化合物的混合物的方法
其中所述方法包括使包含式(II)化合物和式(IIa)化合物的混合物
与角鲨烯-何帕烯环化酶(SHC)酶接触,所述角鲨烯-何帕烯环化酶(SHC)酶包含与SEQID NO:1或SEQ ID NO:43-49的序列具有至少70%一致性或相似性,优选与SEQ ID NO:1的序列具有至少70%的一致性或相似性的氨基酸序列,并且在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换,并且其中R选自H和C1-C4烷基。
4.根据权利要求3所述的方法,其中所述包含式(I)化合物的混合物还包含式(Ia)化合物
其中R选自H和C1-C4烷基。
5.根据权利要求4所述的方法,其中所述式(Ia)化合物具有式(V)的构型
其中R选自H和C1-C4烷基。
6.根据权利要求3至5中任一项所述的方法,其中所述包含式(II)化合物和式(IIa)化合物的混合物包含下列中的任一种:
i)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)
ii)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
iii)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体)
iv)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
v)式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体),和式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
vi)式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)
vii)i)至vi)的任意组合。
7.根据权利要求3至6中任一项所述的方法,其中所述包含式(II)化合物和式(IIa)化合物的混合物包含:
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为Z-构型(E,Z-异构体)
-式(II)化合物,其C-8和C-9之间的双键为E-构型并且C-4和C-5之间的双键为E-构型(E,E-异构体)
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为Z-构型(E,Z-异构体),和;
-式(IIa)化合物,其C-6和C-7之间的双键为E-构型并且C-2和C-3之间的双键为E-构型(E,E-异构体)。
8.根据权利要求1至7中任一项所述的方法,其中式(III)化合物作为副产物制备,
其中R选自H和C1-C4烷基。
9.根据权利要求1至8中任一项所述的方法,其中具有式(IIIa)中所示的相对构型的化合物作为副产物制备:
其中R选自H和C1-C4烷基。
10.根据权利要求3至9中任一项所述的方法,其中式(VI)化合物作为副产物制备,
其中R选自H和C1-C4烷基。
11.根据权利要求3至10中任一项所述的方法,其中具有式(VIa)中所示的相对构型的化合物作为副产物制备:
其中R选自H和C1-C4烷基。
12.根据权利要求1至11中任一项所述的方法,其中R是甲基。
13.根据权利要求1至12中任一项所述的方法,其中所述SHC酶包含与SEQ ID NO:1的序列具有至少70%一致性或相似性的氨基酸序列,并且其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,116,166,211,212,317,355,382,399,483,539和585的一个或多个位置处包含相对于SEQ ID NO:1的一至七个,优选二至六个,更优选三至五个氨基酸置换。
14.根据权利要求1至13中任一项所述的方法,其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,166,211,212,355,483和539的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换。
15.根据权利要求1至14中任一项所述的方法,其中所述SHC酶在对应于SEQ ID NO:1中位置2,5,35,166,211,212,483和539,优选对应于SEQ ID NO:1中位置2,5,35,166,211,483和539的一个或多个位置处包含相对于SEQ ID NO:1的一个或多个氨基酸置换。
16.根据权利要求1至15中任一项所述的方法,其中所述SHC酶包含选自以下的相对于SEQ ID NO:1的氨基酸置换:
(xvi)在对应于SEQ ID NO:1中位置2的位置处的天冬酰胺(N)残基;
(xvii)在对应于SEQ ID NO:1中位置5的位置处的脯氨酸(P)残基;
(xviii)在对应于SEQ ID NO:1中位置35的位置处的丙氨酸(A)残基;
(xix)在对应于SEQ ID NO:1中位置116的位置处的苏氨酸(T)残基;
(xx)在对应于SEQ ID NO:1中位置166的位置处的丙氨酸(A)残基;
(xxi)在对应于SEQ ID NO:1中位置211的位置处的缬氨酸(V)残基;
(xxii)在对应于SEQ ID NO:1中位置212的位置处的精氨酸(R)残基;
(xxiii)在对应于SEQ ID NO:1中位置317的位置处的甲硫氨酸(M)残基;
(xxiv)在对应于SEQ ID NO:1中位置355的位置处的苏氨酸(T)残基;
(xxv)在对应于SEQ ID NO:1中位置382的位置处的苏氨酸(T)残基;
(xxvi)在对应于SEQ ID NO:1中位置399的位置处的缬氨酸(V)残基;
(xxvii)在对应于SEQ ID NO:1中位置483的位置处的半胱氨酸(C)残基;
(xxviii)在对应于SEQ ID NO:1中位置539的位置处的组氨酸(H)残基;
(xxix)在对应于SEQ ID NO:1中位置585的位置处的丙氨酸(A)残基;或
(xxx)其任何组合。
17.根据权利要求1至16中任一项所述的方法,其中所述SHC酶包含选自以下SEQ IDNO:1中相应位置处的相对于SEQ ID NO:1的氨基酸置换:
(xiv)I2N,T35A,A355T和L539H;
(xv)T166A;
(xvi)I2N和Y483C;
(xvii)I2N,Y483C和L539H;
(xviii)I2N,L5P,T35A,L539H;
(xix)I2N,L5P,T35A和Y483C;
(xx)I2N,L5P,T35A,T166A和L539H;
(xxi)I2N,L5P,T35A,T166A,E211V和L539H;
(xxii)I2N,L5P,T35A,E211V,S212R,Y483C和L539H;
(xxiii)I2N,T166A和Y483C;
(xxiv)I2N,T166A,Y483C和L539H;
(xxv)I2N,T166A,E211V和Y483C;或
(xxvi)I2N,T166A,E211V,Y483C和L539H。
18.根据权利要求1至17中任一项所述的方法,其中所述SHC酶包含以下的相对于SEQID NO:1的氨基酸置换:I2N和T166A。
19.根据权利要求1至18中任一项所述的方法,其中所述SHC酶还包含选自L5P,T35A,E211V,Y483C和L539H的相对于SEQ ID NO:1的一个或多个置换。
20.根据权利要求1至19中任一项所述的方法,其中所述SHC酶还包含与SEQ ID NO:4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40或42,优选SEQ ID NO:4,6,18,20,22,24,30,32,34,36,38,40或42,更优选SEQ ID NO:30,32,34,36,38,40或42,最优选SEQ ID NO:30,38,40,42中的任何一个至少90%相同的氨基酸序列。
21.核酸分子,其包含编码如权利要求1或13至20中任一项中所述的角鲨烯何帕烯环化酶(SHC)酶的核苷酸序列。
22.载体,其包含根据权利要求21所述的核酸分子。
23.宿主细胞,其包含根据权利要求21所述的核酸分子或根据权利要求22所述的载体。
24.如权利要求1或13至20中任一项中所述的角鲨烯何帕烯环化酶(SHC)酶。
25.包含式(I)化合物和/或式(Ia)化合物的组合物,其中所述组合物通过权利要求4至20中任一项所述的方法获得或可通过权利要求4至20中任一项所述的方法获得。
26.根据权利要求25所述的组合物,其中所述式(I)化合物和/或所述式(Ia)化合物为固体形式,优选为无定形或结晶形式。
27.根据权利要求25或26所述的组合物,其中所述式(Ia)化合物具有式(V)的构型。
28.根据权利要求25至27中任一项所述的组合物用于制备香料组合物或消费品的用途。
29.香料组合物或消费品,其包含如权利要求25至27中任一项中所定义的组合物。
30.混合物,其包含可通过权利要求3至20中任一项的方法获得的产物,其中所述混合物包含I,Ia,III,IIIa,IV,IVa,V,Va VI和/或VIa。
31.根据权利要求25或权利要求26所述的组合物,其中所述组合物还包含III,IIIa,IV,IVa,V,Va,VI和/或VIa。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2115120.4 | 2021-10-21 | ||
GB2204546.2 | 2022-03-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118119715A true CN118119715A (zh) | 2024-05-31 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11021722B2 (en) | Enzymes and applications thereof | |
CN110312796A (zh) | 角鲨烯何帕烯环化酶及其用于生产降龙涎香醚的用途 | |
US20230175027A1 (en) | Enzyme-mediated process for making amberketal and amberketal homologues | |
US11965195B2 (en) | Enzyme mediated process | |
CN107548418B (zh) | 分离和纯化降龙涎醚的方法 | |
US20230021613A1 (en) | Squalene hopene cyclase (shc) variants | |
CN109071480A (zh) | 在生物催化剂存在下通过高法呢醇的生物转化形成的(-)-降龙涎香醚的固体形式 | |
CN118119715A (zh) | 改进的方法和酶 | |
WO2023067043A1 (en) | Improved methods and enzymes | |
US11634718B2 (en) | Production of macrocyclic ketones in recombinant hosts | |
NL2031120B1 (en) | Engineered alpha-guaiene synthases | |
WO2023175123A1 (en) | Shc enzymes and enzyme variants | |
BR122023025399A2 (pt) | Enzimas de esqualeno hopeno ciclase (sch) e suas variantes, produtos de conversão enzimática, seus processos de preparação e produtos derivados |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |