CN117511890A - 酮还原酶多肽及多核苷酸 - Google Patents
酮还原酶多肽及多核苷酸 Download PDFInfo
- Publication number
- CN117511890A CN117511890A CN202311135556.7A CN202311135556A CN117511890A CN 117511890 A CN117511890 A CN 117511890A CN 202311135556 A CN202311135556 A CN 202311135556A CN 117511890 A CN117511890 A CN 117511890A
- Authority
- CN
- China
- Prior art keywords
- engineered
- seq
- sequence
- ketoreductase
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 101001110310 Lentilactobacillus kefiri NADP-dependent (R)-specific alcohol dehydrogenase Proteins 0.000 title claims abstract description 241
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 173
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 170
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 169
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 89
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 89
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 89
- 108010036197 NAD phosphite oxidoreductase Proteins 0.000 claims abstract description 130
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000006467 substitution reaction Methods 0.000 claims description 76
- 239000013598 vector Substances 0.000 claims description 47
- 239000000203 mixture Substances 0.000 claims description 29
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 abstract description 91
- 108090000790 Enzymes Proteins 0.000 abstract description 91
- 150000001875 compounds Chemical class 0.000 abstract description 27
- 238000005580 one pot reaction Methods 0.000 abstract description 18
- 150000001298 alcohols Chemical class 0.000 abstract description 10
- 239000003054 catalyst Substances 0.000 abstract description 7
- 238000003786 synthesis reaction Methods 0.000 abstract description 7
- 230000015572 biosynthetic process Effects 0.000 abstract description 6
- 239000002777 nucleoside Substances 0.000 abstract description 5
- 230000000840 anti-viral effect Effects 0.000 abstract description 3
- 239000003112 inhibitor Substances 0.000 abstract description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 132
- 229940088598 enzyme Drugs 0.000 description 91
- 235000001014 amino acid Nutrition 0.000 description 88
- 229940024606 amino acid Drugs 0.000 description 80
- 150000001413 amino acids Chemical class 0.000 description 77
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 66
- 238000006243 chemical reaction Methods 0.000 description 56
- 108090000623 proteins and genes Proteins 0.000 description 52
- 239000000758 substrate Substances 0.000 description 52
- XJLXINKUBYWONI-NNYOXOHSSA-O NADP(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-NNYOXOHSSA-O 0.000 description 47
- 239000000047 product Substances 0.000 description 46
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 40
- 150000007523 nucleic acids Chemical class 0.000 description 35
- 230000014509 gene expression Effects 0.000 description 34
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 32
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 32
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 30
- 229960005091 chloramphenicol Drugs 0.000 description 30
- 150000002576 ketones Chemical class 0.000 description 29
- 230000000694 effects Effects 0.000 description 26
- 239000013604 expression vector Substances 0.000 description 25
- 108091026890 Coding region Proteins 0.000 description 24
- 229950006238 nadide Drugs 0.000 description 24
- 125000003275 alpha amino acid group Chemical group 0.000 description 22
- 239000006228 supernatant Substances 0.000 description 22
- 241000588724 Escherichia coli Species 0.000 description 21
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 20
- -1 aliphatic amino acid Chemical class 0.000 description 20
- 238000006722 reduction reaction Methods 0.000 description 19
- 239000000872 buffer Substances 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- 108010076504 Protein Sorting Signals Proteins 0.000 description 17
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 230000010076 replication Effects 0.000 description 17
- 108020004705 Codon Proteins 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- 125000000539 amino acid group Chemical group 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 230000009467 reduction Effects 0.000 description 15
- 239000006137 Luria-Bertani broth Substances 0.000 description 14
- 230000002255 enzymatic effect Effects 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- 238000003556 assay Methods 0.000 description 12
- 239000008103 glucose Substances 0.000 description 12
- 238000011534 incubation Methods 0.000 description 12
- 230000008929 regeneration Effects 0.000 description 12
- 238000011069 regeneration method Methods 0.000 description 12
- 238000007792 addition Methods 0.000 description 11
- 239000006166 lysate Substances 0.000 description 11
- NCPXQVVMIXIKTN-UHFFFAOYSA-N trisodium;phosphite Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])[O-] NCPXQVVMIXIKTN-UHFFFAOYSA-N 0.000 description 11
- 150000001299 aldehydes Chemical class 0.000 description 10
- 238000004128 high performance liquid chromatography Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 238000007254 oxidation reaction Methods 0.000 description 9
- 240000006439 Aspergillus oryzae Species 0.000 description 8
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 8
- 230000002538 fungal effect Effects 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 238000011068 loading method Methods 0.000 description 7
- 238000002703 mutagenesis Methods 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 230000003647 oxidation Effects 0.000 description 7
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- 239000004382 Amylase Substances 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 6
- 102000013142 Amylases Human genes 0.000 description 6
- 241000351920 Aspergillus nidulans Species 0.000 description 6
- 244000063299 Bacillus subtilis Species 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 6
- 102220486708 Cytochrome b-245 chaperone 1_R44G_mutation Human genes 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 108010007843 NADH oxidase Proteins 0.000 description 6
- 229930182475 S-glycoside Natural products 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 239000008272 agar Substances 0.000 description 6
- 235000019418 amylase Nutrition 0.000 description 6
- 125000003118 aryl group Chemical group 0.000 description 6
- 238000006911 enzymatic reaction Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical compound OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 241000228245 Aspergillus niger Species 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 241000222173 Candida parapsilosis Species 0.000 description 5
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 5
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 5
- 108090000637 alpha-Amylases Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000011942 biocatalyst Substances 0.000 description 5
- 229940055022 candida parapsilosis Drugs 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 239000000843 powder Substances 0.000 description 5
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- 102220470475 L-seryl-tRNA(Sec) kinase_C57L_mutation Human genes 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 108010014251 Muramidase Proteins 0.000 description 4
- 102000016943 Muramidase Human genes 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- 241000235403 Rhizomucor miehei Species 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 229960000274 lysozyme Drugs 0.000 description 4
- 239000004325 lysozyme Substances 0.000 description 4
- 235000010335 lysozyme Nutrition 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- SXGMVGOVILIERA-UHFFFAOYSA-N 2,3-diaminobutanoic acid Chemical compound CC(N)C(N)C(O)=O SXGMVGOVILIERA-UHFFFAOYSA-N 0.000 description 3
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 3
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 3
- JJDJLFDGCUYZMN-QMMMGPOBSA-N 3-chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Cl)=C1 JJDJLFDGCUYZMN-QMMMGPOBSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 108010031132 Alcohol Oxidoreductases Proteins 0.000 description 3
- 102000005751 Alcohol Oxidoreductases Human genes 0.000 description 3
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 3
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 3
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 3
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 102000010911 Enzyme Precursors Human genes 0.000 description 3
- 108010062466 Enzyme Precursors Proteins 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- 240000001929 Lactobacillus brevis Species 0.000 description 3
- 235000013957 Lactobacillus brevis Nutrition 0.000 description 3
- 241001468191 Lactobacillus kefiri Species 0.000 description 3
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Polymers OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 3
- 108010093965 Polymyxin B Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- GFZWHAAOIVMHOI-UHFFFAOYSA-N azetidine-3-carboxylic acid Chemical compound OC(=O)C1CNC1 GFZWHAAOIVMHOI-UHFFFAOYSA-N 0.000 description 3
- 125000000051 benzyloxy group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])O* 0.000 description 3
- 230000002210 biocatalytic effect Effects 0.000 description 3
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229960003548 polymyxin b sulfate Drugs 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000004064 recycling Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 102220022237 rs397509313 Human genes 0.000 description 3
- 239000000377 silicon dioxide Substances 0.000 description 3
- 239000001488 sodium phosphate Substances 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- FQRURPFZTFUXEZ-MRVPVSSYSA-N (2s)-2,3,3,3-tetrafluoro-2-(n-fluoroanilino)propanoic acid Chemical compound OC(=O)[C@](F)(C(F)(F)F)N(F)C1=CC=CC=C1 FQRURPFZTFUXEZ-MRVPVSSYSA-N 0.000 description 2
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 2
- IYKLZBIWFXPUCS-VIFPVBQESA-N (2s)-2-(naphthalen-1-ylamino)propanoic acid Chemical compound C1=CC=C2C(N[C@@H](C)C(O)=O)=CC=CC2=C1 IYKLZBIWFXPUCS-VIFPVBQESA-N 0.000 description 2
- PECGVEGMRUZOML-AWEZNQCLSA-N (2s)-2-amino-3,3-diphenylpropanoic acid Chemical compound C=1C=CC=CC=1C([C@H](N)C(O)=O)C1=CC=CC=C1 PECGVEGMRUZOML-AWEZNQCLSA-N 0.000 description 2
- GDMOHOYNMWWBAU-QMMMGPOBSA-N (2s)-2-amino-3-(3-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(Br)=C1 GDMOHOYNMWWBAU-QMMMGPOBSA-N 0.000 description 2
- BURBNIPKSRJAIQ-QMMMGPOBSA-N (2s)-2-amino-3-[3-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C(F)(F)F)=C1 BURBNIPKSRJAIQ-QMMMGPOBSA-N 0.000 description 2
- YTHDRUZHNYKZGF-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(3-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC([N+]([O-])=O)=C1 YTHDRUZHNYKZGF-QMMMGPOBSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 2
- MLLSSTJTARJLHK-UHFFFAOYSA-N 3-aminocyclopentane-1-carboxylic acid Chemical compound NC1CCC(C(O)=O)C1 MLLSSTJTARJLHK-UHFFFAOYSA-N 0.000 description 2
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 102220595179 Casein kinase II subunit alpha'-interacting protein_F78W_mutation Human genes 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 150000008574 D-amino acids Chemical class 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 2
- 102100027612 Kallikrein-11 Human genes 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 2
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 102220472565 Melanoregulin_Y78F_mutation Human genes 0.000 description 2
- 241001467552 Mycobacterium bovis BCG Species 0.000 description 2
- VEYYWZRYIYDQJM-ZETCQYMHSA-N N(2)-acetyl-L-lysine Chemical compound CC(=O)N[C@H](C([O-])=O)CCCC[NH3+] VEYYWZRYIYDQJM-ZETCQYMHSA-N 0.000 description 2
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 2
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 2
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 2
- 241001538234 Nala Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 241000589614 Pseudomonas stutzeri Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000223252 Rhodotorula Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 108010077895 Sarcosine Proteins 0.000 description 2
- 101000928111 Scheffersomyces stipitis (strain ATCC 58785 / CBS 6054 / NBRC 10063 / NRRL Y-11545) Alcohol dehydrogenase 1 Proteins 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 241000256248 Spodoptera Species 0.000 description 2
- 241000228393 Sporidiobolus salmonicolor Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- 101710152431 Trypsin-like protease Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229960000190 bacillus calmette–guérin vaccine Drugs 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000005289 controlled pore glass Substances 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 125000001072 heteroaryl group Chemical group 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 101150109249 lacI gene Proteins 0.000 description 2
- VWHRYODZTDMVSS-QMMMGPOBSA-N m-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-QMMMGPOBSA-N 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 229940101270 nicotinamide adenine dinucleotide (nad) Drugs 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 125000001820 oxy group Chemical group [*:1]O[*:2] 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- WLJVNTCWHIRURA-UHFFFAOYSA-N pimelic acid Chemical compound OC(=O)CCCCCC(O)=O WLJVNTCWHIRURA-UHFFFAOYSA-N 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 125000006239 protecting group Chemical group 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 239000002342 ribonucleoside Substances 0.000 description 2
- 102200075748 rs144811578 Human genes 0.000 description 2
- 102220005165 rs33918343 Human genes 0.000 description 2
- 102220170946 rs567155861 Human genes 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000008961 swelling Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- ZENNTZUZBRESKJ-ZETCQYMHSA-N (2s)-2-(1-benzothiophen-2-ylamino)propanoic acid Chemical compound C1=CC=C2SC(N[C@@H](C)C(O)=O)=CC2=C1 ZENNTZUZBRESKJ-ZETCQYMHSA-N 0.000 description 1
- RWLSBXBFZHDHHX-VIFPVBQESA-N (2s)-2-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(N[C@@H](C)C(O)=O)=CC=C21 RWLSBXBFZHDHHX-VIFPVBQESA-N 0.000 description 1
- CNMAQBJBWQQZFZ-LURJTMIESA-N (2s)-2-(pyridin-2-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=CC=N1 CNMAQBJBWQQZFZ-LURJTMIESA-N 0.000 description 1
- SAAQPSNNIOGFSQ-LURJTMIESA-N (2s)-2-(pyridin-4-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=NC=C1 SAAQPSNNIOGFSQ-LURJTMIESA-N 0.000 description 1
- MRTPISKDZDHEQI-YFKPBYRVSA-N (2s)-2-(tert-butylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC(C)(C)C MRTPISKDZDHEQI-YFKPBYRVSA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- WBZIGVCQRXJYQD-YFKPBYRVSA-N (2s)-2-amino-3-(1,3-thiazol-4-yl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CSC=N1 WBZIGVCQRXJYQD-YFKPBYRVSA-N 0.000 description 1
- JFVLNTLXEZDFHW-QMMMGPOBSA-N (2s)-2-amino-3-(2-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1Br JFVLNTLXEZDFHW-QMMMGPOBSA-N 0.000 description 1
- NHBKDLSKDKUGSB-VIFPVBQESA-N (2s)-2-amino-3-(2-methylphenyl)propanoic acid Chemical compound CC1=CC=CC=C1C[C@H](N)C(O)=O NHBKDLSKDKUGSB-VIFPVBQESA-N 0.000 description 1
- NRCSJHVDTAAISV-QMMMGPOBSA-N (2s)-2-amino-3-(3,4-dichlorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Cl)C(Cl)=C1 NRCSJHVDTAAISV-QMMMGPOBSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-VIFPVBQESA-N (2s)-2-amino-3-(3-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-VIFPVBQESA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- KWIPUXXIFQQMKN-VIFPVBQESA-N (2s)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-VIFPVBQESA-N 0.000 description 1
- DQLHSFUMICQIMB-VIFPVBQESA-N (2s)-2-amino-3-(4-methylphenyl)propanoic acid Chemical compound CC1=CC=C(C[C@H](N)C(O)=O)C=C1 DQLHSFUMICQIMB-VIFPVBQESA-N 0.000 description 1
- IOABLDGLYOGEHY-QMMMGPOBSA-N (2s)-2-amino-3-[2-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1C(F)(F)F IOABLDGLYOGEHY-QMMMGPOBSA-N 0.000 description 1
- GNVNKFUEUXUWDV-VIFPVBQESA-N (2s)-2-amino-3-[4-(aminomethyl)phenyl]propanoic acid Chemical compound NCC1=CC=C(C[C@H](N)C(O)=O)C=C1 GNVNKFUEUXUWDV-VIFPVBQESA-N 0.000 description 1
- GAJBPZXIKZXTCG-VIFPVBQESA-N (2s)-2-amino-3-[4-(azidomethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CN=[N+]=[N-])C=C1 GAJBPZXIKZXTCG-VIFPVBQESA-N 0.000 description 1
- CRFFPDBJLGAGQL-QMMMGPOBSA-N (2s)-2-amino-3-[4-(trifluoromethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C(F)(F)F)C=C1 CRFFPDBJLGAGQL-QMMMGPOBSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- FMUMEWVNYMUECA-LURJTMIESA-N (2s)-2-azaniumyl-5-methylhexanoate Chemical compound CC(C)CC[C@H](N)C(O)=O FMUMEWVNYMUECA-LURJTMIESA-N 0.000 description 1
- CYNAPIVXKRLDER-LBPRGKRZSA-N (2s)-2-benzamido-3-(4-hydroxy-3-nitrophenyl)propanoic acid Chemical compound C([C@@H](C(=O)O)NC(=O)C=1C=CC=CC=1)C1=CC=C(O)C([N+]([O-])=O)=C1 CYNAPIVXKRLDER-LBPRGKRZSA-N 0.000 description 1
- XOZMVGJVSFVJGA-VIFPVBQESA-N (2s)-3-phenyl-2-(phosphonomethylamino)propanoic acid Chemical compound OP(=O)(O)CN[C@H](C(=O)O)CC1=CC=CC=C1 XOZMVGJVSFVJGA-VIFPVBQESA-N 0.000 description 1
- LJRDOKAZOAKLDU-UDXJMMFXSA-N (2s,3s,4r,5r,6r)-5-amino-2-(aminomethyl)-6-[(2r,3s,4r,5s)-5-[(1r,2r,3s,5r,6s)-3,5-diamino-2-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-hydroxycyclohexyl]oxy-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]oxyoxane-3,4-diol;sulfuric ac Chemical compound OS(O)(=O)=O.N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO LJRDOKAZOAKLDU-UDXJMMFXSA-N 0.000 description 1
- ASWBNKHCZGQVJV-UHFFFAOYSA-N (3-hexadecanoyloxy-2-hydroxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(O)COP([O-])(=O)OCC[N+](C)(C)C ASWBNKHCZGQVJV-UHFFFAOYSA-N 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- BWKMGYQJPOAASG-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinoline-3-carboxylic acid Chemical compound C1=CC=C2CNC(C(=O)O)CC2=C1 BWKMGYQJPOAASG-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- WTKYBFQVZPCGAO-UHFFFAOYSA-N 2-(pyridin-3-ylamino)propanoic acid Chemical compound OC(=O)C(C)NC1=CC=CN=C1 WTKYBFQVZPCGAO-UHFFFAOYSA-N 0.000 description 1
- GWHQTNKPTXDNRM-UHFFFAOYSA-N 2-azaniumyl-3-(2,4-dichlorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1Cl GWHQTNKPTXDNRM-UHFFFAOYSA-N 0.000 description 1
- UEFLPVKMPDEMFW-UHFFFAOYSA-N 2-azaniumyl-3-(2,4-difluorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1F UEFLPVKMPDEMFW-UHFFFAOYSA-N 0.000 description 1
- CVZZNRXMDCOHBG-UHFFFAOYSA-N 2-azaniumyl-3-(2-chlorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=CC=C1Cl CVZZNRXMDCOHBG-UHFFFAOYSA-N 0.000 description 1
- OCDHPLVCNWBKJN-UHFFFAOYSA-N 2-azaniumyl-3-(2-cyanophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=CC=C1C#N OCDHPLVCNWBKJN-UHFFFAOYSA-N 0.000 description 1
- PRAWYXDDKCVZTL-UHFFFAOYSA-N 2-azaniumyl-3-(3,4-difluorophenyl)propanoate Chemical compound OC(=O)C(N)CC1=CC=C(F)C(F)=C1 PRAWYXDDKCVZTL-UHFFFAOYSA-N 0.000 description 1
- WTOFYLAWDLQMBZ-UHFFFAOYSA-N 2-azaniumyl-3-thiophen-2-ylpropanoate Chemical compound OC(=O)C(N)CC1=CC=CS1 WTOFYLAWDLQMBZ-UHFFFAOYSA-N 0.000 description 1
- NYCRCTMDYITATC-UHFFFAOYSA-N 2-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=CC=C1F NYCRCTMDYITATC-UHFFFAOYSA-N 0.000 description 1
- CJJYCYZKUNRKFP-UHFFFAOYSA-N 3-azaniumyl-5-phenylpentanoate Chemical compound OC(=O)CC(N)CCC1=CC=CC=C1 CJJYCYZKUNRKFP-UHFFFAOYSA-N 0.000 description 1
- BXRLWGXPSRYJDZ-UHFFFAOYSA-N 3-cyanoalanine Chemical compound OC(=O)C(N)CC#N BXRLWGXPSRYJDZ-UHFFFAOYSA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- UCTNTYHJFWMUBD-UHFFFAOYSA-N 4-chloro-3-oxobutanoic acid Chemical compound OC(=O)CC(=O)CCl UCTNTYHJFWMUBD-UHFFFAOYSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- SUPXSFXAMJPEPH-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]triazine Chemical compound N1=NC=C2NC=CC2=N1 SUPXSFXAMJPEPH-UHFFFAOYSA-N 0.000 description 1
- ZNTOIYUPLXOHAS-UHFFFAOYSA-N 6,7-dihydro-5h-pyrrolo[1,2-a]imidazol-7-ol Chemical compound C1=CN=C2C(O)CCN21 ZNTOIYUPLXOHAS-UHFFFAOYSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- 102220588949 60S ribosomal protein L7-like 1_Q63A_mutation Human genes 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 108010045681 Bacillus stearothermophilus neutral protease Proteins 0.000 description 1
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102220529973 Beta-galactosidase_R41A_mutation Human genes 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 102100021973 Carbonyl reductase [NADPH] 1 Human genes 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N Cysteine Chemical compound SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 108020005199 Dehydrogenases Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241001454374 Drosophila <fruit fly, subgenus> Species 0.000 description 1
- 101100085603 Drosophila melanogaster nclb gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- NIGWMJHCCYYCSF-UHFFFAOYSA-N Fenclonine Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-UHFFFAOYSA-N 0.000 description 1
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 108010001498 Galectin 1 Proteins 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- MBZXSJWDBIIBLL-GDVGLLTNSA-N Homoisoleucine Chemical compound CCC(C)C[C@H](N)C(O)=O MBZXSJWDBIIBLL-GDVGLLTNSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- OYIFNHCXNCRBQI-BYPYZUCNSA-N L-2-aminoadipic acid Chemical compound OC(=O)[C@@H](N)CCCC(O)=O OYIFNHCXNCRBQI-BYPYZUCNSA-N 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 1
- LOOZZTFGSTZNRX-VIFPVBQESA-N L-Homotyrosine Chemical compound OC(=O)[C@@H](N)CCC1=CC=C(O)C=C1 LOOZZTFGSTZNRX-VIFPVBQESA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QWCKQJZIFLGMSD-VKHMYHEASA-N L-alpha-aminobutyric acid Chemical compound CC[C@H](N)C(O)=O QWCKQJZIFLGMSD-VKHMYHEASA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 1
- DGYHPLMPMRKMPD-UHFFFAOYSA-N L-propargyl glycine Natural products OC(=O)C(N)CC#C DGYHPLMPMRKMPD-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241000218378 Magnolia Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 101100062121 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cyc-1 gene Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 241001306288 Ophrys fuciflora Species 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 101150019587 PDH gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101150096038 PTH1R gene Proteins 0.000 description 1
- 240000002390 Pandanus odoratissimus Species 0.000 description 1
- 235000005311 Pandanus odoratissimus Nutrition 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 102220484147 T cell receptor alpha variable 34_A67W_mutation Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241000186339 Thermoanaerobacter Species 0.000 description 1
- 241001147775 Thermoanaerobacter brockii Species 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 102220612026 Tyrosine-protein kinase Fer_K37R_mutation Human genes 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000186864 Weissella minor Species 0.000 description 1
- 241000222292 [Candida] magnoliae Species 0.000 description 1
- 150000008062 acetophenones Chemical class 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 108010051873 alkaline protease Proteins 0.000 description 1
- WNNNWFKQCKFSDK-UHFFFAOYSA-N allylglycine Chemical compound OC(=O)C(N)CC=C WNNNWFKQCKFSDK-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- WTOFYLAWDLQMBZ-LURJTMIESA-N beta(2-thienyl)alanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CS1 WTOFYLAWDLQMBZ-LURJTMIESA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 102220359218 c.223C>G Human genes 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 125000003636 chemical group Chemical class 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 1
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000006178 methyl benzyl group Chemical group 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 229960001639 penicillamine Drugs 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- HXEACLLIILLPRG-UHFFFAOYSA-N pipecolic acid Chemical compound OC(=O)C1CCCCN1 HXEACLLIILLPRG-UHFFFAOYSA-N 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002620 polyvinyl fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 102220207649 rs1057522685 Human genes 0.000 description 1
- 102220322676 rs1207697890 Human genes 0.000 description 1
- 102200052800 rs2303436 Human genes 0.000 description 1
- 102200082945 rs33920173 Human genes 0.000 description 1
- 102220007498 rs33929459 Human genes 0.000 description 1
- 102220067571 rs373957283 Human genes 0.000 description 1
- 102200164344 rs63751661 Human genes 0.000 description 1
- 102220277134 rs776745497 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 150000003333 secondary alcohols Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000011916 stereoselective reduction Methods 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- XTLISYKBKGQMBJ-XDKWHASVSA-N tert-butyl (2s)-2-chloro-5-hydroxy-3-oxohexanoate Chemical compound CC(O)CC(=O)[C@H](Cl)C(=O)OC(C)(C)C XTLISYKBKGQMBJ-XDKWHASVSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 150000003569 thioglycosides Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 125000001834 xanthenyl group Chemical group C1=CC=CC=2OC3=CC=CC=C3C(C12)* 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P41/00—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
- C12P41/002—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by oxidation/reduction reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/182—Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01002—Alcohol dehydrogenase (NADP+) (1.1.1.2), i.e. aldehyde reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01184—Carbonyl reductase (NADPH) (1.1.1.184)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y120/00—Oxidoreductases acting on phosphorus or arsenic in donors (1.20)
- C12Y120/01—Oxidoreductases acting on phosphorus or arsenic in donors (1.20) with NAD+ or NADP+ as acceptor (1.20.1)
- C12Y120/01001—Phosphonate dehydrogenase (1.20.1.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及酮还原酶多肽及多核苷酸。本发明提供了与天然存在的野生型酮还原酶和亚磷酸脱氢酶相比具有改进的特性的工程化酮还原酶和亚磷酸脱氢酶、以及编码工程化酮还原酶和亚磷酸脱氢酶的多核苷酸、能够表达工程化酮还原酶和亚磷酸脱氢酶的宿主细胞、以及使用工程化酮还原酶和亚磷酸脱氢酶来合成用于抗病毒化合物诸如核苷抑制剂的合成的手性催化剂的方法。本发明还提供了使用工程化酶在一锅多酶系统中使手性醇去外消旋化的方法。
Description
本申请是申请日为2018年04月13日,申请号为201880043854.4,发明名称为“酮还原酶多肽及多核苷酸”的申请的分案申请。
本申请要求2017年4月27日提交的美国临时专利申请序列号62/491,161的优先权,该美国临时专利申请在此通过引用以其整体并入以用于所有目的。
对序列表、表格或计算机程序的引用
根据37 C.F.R.§1.821,以计算机可读形式(CRF)通过EFS-Web以文件名CX2-166USP1_ST25.txt与本申请同时提交的序列表通过引用并入本文。序列表的电子副本创建于2017年4月25日,具有544千字节的文件大小。
发明领域
本发明提供了与天然存在的野生型酮还原酶和亚磷酸脱氢酶(phosphitedehydrogenase)相比具有改进的特性的工程化酮还原酶和亚磷酸脱氢酶、以及编码工程化酮还原酶和亚磷酸脱氢酶的多核苷酸、能够表达工程化酮还原酶和亚磷酸脱氢酶的宿主细胞、以及使用工程化酮还原酶和亚磷酸脱氢酶来合成用于抗病毒化合物诸如核苷抑制剂的合成的手性催化剂的方法。本发明还提供了使用工程化酶在一锅多酶系统(one-pot,multi-enzyme system)中使手性醇去外消旋化(deracemize)的方法。
背景
属于酮还原酶(KRED)或羰基还原酶类(EC1.1.1.184)的酶可用于从对应的前手性酮底物并通过对应的外消旋醛底物的立体选择性还原合成光学活性醇。KRED通常将酮底物和醛底物转化为对应的醇产物,但是也可以催化逆反应,将醇底物氧化为对应的酮/醛产物。酶诸如KRED对酮和醛的还原以及对醇的氧化需要辅因子,最常见的是还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH),以及用于氧化反应的烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP)。NADH和NADPH充当电子供体,而NAD和NADP充当电子受体。经常观察到酮还原酶和醇脱氢酶接受磷酸化或非磷酸化的辅因子(处于其氧化态和还原态),但最通常不是两者都接受。
为了绕过用于产生关键化合物的许多化学合成步骤,酮还原酶越来越多地被用于将不同的酮底物和醛底物酶促转化为手性醇产物。这些应用可以利用表达酮还原酶的全细胞生物催化酮和醛的还原或生物催化醇的氧化,或者在全细胞中多种酮还原酶的存在将不利地影响期望产物的立体纯度(stereopurity)和产率的那些情况下使用纯化的酶。对于体外应用,可以将辅因子(NADH或NADPH)再生酶诸如葡萄糖脱氢酶(GDH)、甲酸脱氢酶、亚磷酸脱氢酶等与酮还原酶一起使用。鉴定可以用于进行多种酮底物向对应的手性醇产物的转化或多种醇底物向对应的酮产物的转化的其他酮还原酶是令人期望的。
发明概述
本发明提供了与天然存在的野生型酮还原酶和亚磷酸脱氢酶相比具有改进的特性的工程化酮还原酶和亚磷酸脱氢酶、以及编码工程化酮还原酶和亚磷酸脱氢酶的多核苷酸、能够表达工程化酮还原酶和亚磷酸脱氢酶的宿主细胞、以及使用工程化酮还原酶和亚磷酸脱氢酶来合成用于抗病毒化合物诸如核苷抑制剂的合成的手性催化剂的方法。本发明还提供了使用工程化酶在一锅多酶系统中使手性醇去外消旋化的方法。
此外,本发明提供了与天然存在的野生型亚磷酸脱氢酶相比具有改进的特性的工程化亚磷酸脱氢酶、以及编码工程化亚磷酸脱氢酶的多核苷酸、能够表达工程化亚磷酸脱氢酶的宿主细胞、以及使用工程化亚磷酸脱氢酶在一锅多酶系统中使手性醇去外消旋化的方法。
本发明提供了工程化酮还原酶(“KRED”),其能够在一锅多酶系统中立体选择性地使外消旋醇底物去外消旋化为光学纯的醇产物,并且当与天然存在的从近平滑假丝酵母(Candida parapsilosis)获得的野生型KRED酶(SEQ ID NO:2)、从鲑色锁掷酵母(Sporidiobolus salmonicolor)获得的野生型KRED酶(SEQ ID NO:112)相比时,或者当与其他工程化酮还原酶相比时,具有改进的特性。此外,本发明提供了能够在同一一锅多酶系统中优先使NADPH再循环的工程化亚磷酸脱氢酶(“PDH”)。
在一些另外的实施方案中,工程化酶除了改变的酶活性以外还具有一种或更多种改进的特性。例如,在一些实施方案中,与野生型酮还原酶相比,工程化酮还原酶多肽具有增加的立体选择性,以用于将底物还原为产物和/或优先氧化(S)对映异构体。酶特性的改进包括但不限于热稳定性、溶剂稳定性的增加和/或减少的产物抑制。
本发明提供了工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:2、112、124和/或138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:2具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:37、37/211、37/211/229、37/229、45、52、52/57/110/272/296、52/57/272、52/57/272/274/279/296、52/57/272/279/296、55/57/276、56、57、57/104/114、57/104/114/229、57/286、79/83/275/276、83、83/275/276、83/276、104、110、114、138/146/258/289、211、211/229、228、229、263、268、272、274、275/276、276、279和309,其中所述位置根据SEQ ID NO:2来编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:37R、37R/211R、37R/211R/229R、37R/229R、45R、52D、52D/57L/272H、52S、52S/57L/110T/272H/296F、52S/57L/272H/279H/296F、52S/57L/272H/274V/279H/296F、55F/57A/276M、56L、57I、57I/104G/114H、57L、57L/104G/114H/229R、57X/286X、79T/83S/275N/276M、83I、83S/275N/276M、83S/276M、104G、110T、114H/K/M、138V/146S/258V/289S、211R、211R/229R、228S、229R、263H/Y、268M/W、272H/I/L/P/Q/S/T/V/W、274I/V、275N/276M、276F/M、279H/Q/R和309F,其中所述位置根据SEQ ID NO:2来编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:K37R、K37R/K211R、K37R/K211R/G229R、K37R/G229R、H45R、Y52D、Y52D/C57L/G272H、Y52S、Y52S/C57L/K110T/G272H/L296F、Y52S/C57L/G272H/I279H/L296F、Y52S/C57L/G272H/L274V/I279H/L296F、L55F/C57A/L276M、D56L、C57I、C57I/A104G/G114H、C57L、C57L/A104G/G114H/G229R、C57X/W286X、I79T/V83S/A275N/L276M、V83I、V83S/A275N/L276M、V83S/L276M、A104G、K110T、G114H/K/M、S138V/A146S/M258V/T289S、K211R、K211R/G229R、P228S、G229R、G263H/Y、S268M/W、G272H/I/L/P/Q/S/T/V/W、L274I/V、A275N/L276M、L276F/M、I279H/Q/R和R309F,其中所述位置根据SEQ ID NO:2来编号。
本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:112具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:24/106/136/220/258/260/314/315、24/106/214/250/258/260/314/315、24/220/314/315、122/159/316/318、135、139/207、159/251/272/277/316/318/330和207,其中所述位置根据SEQ ID NO:112来编号。在一些实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:24I/106P/136A/220G/258V/260A/314R/315A、24I/106P/214L/250V/258V/260A/314R/315A、24I/220G/314R/315A、122E/159V/316E/318L、135F、139V/207S、159V/251Q/272F/277P/316E/318L/330L和207G,其中所述位置根据SEQ ID NO:112来编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:V24I/T106P/S136A/S220G/L258V/C260A/P314R/S315A、V24I/T106P/F214L/A250V/L258V/C260A/P314R/S315A、V24I/S220G/P314R/S315A、T122E/I159V/L316E/I318L、V135F、I139V/N207S、I159V/V251Q/Y272F/T277P/L316E/I318L/I330L和N207G,其中所述位置根据SEQ ID NO:112来编号。
本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:124具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且具有选自以下位置的至少一个取代集:2/101/179/182/228/238/282、3/95、3/95/228/314、24/95/228、95、95/135/139/207和159/228/309/330,其中所述位置根据SEQID NO:124来编号。在一些实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:2T/101P/179L/182M/228R/238L/282E、3Y/95T、3Y/95T/228T/314R、24I/95T/228T、95T、95T/135F/139V/207N和159V/228L/309Q/330L,其中所述位置根据SEQ ID NO:124来编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:A2T/Y101P/A179L/T182M/M228R/A238L/T282E、K3Y/V95T、K3Y/V95T/M228T/P314R、V24I/V95T/M228T、V95T、V95T/V135F/I139V/G207N和I159V/M228L/K309Q/I330L,其中所述位置根据SEQ ID NO:124来编号。
本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:19、24/43/47/49/67/68/70/91/220、24/68/91/218/220、67、72、74/75/78/108、75/78/99/108/215/224、78/107、95、96和114,其中所述位置根据SEQ ID NO:138来编号。在一些实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:19S、24I/43V/47E/49N/67V/68E/70P/91V/220G、24I/68E/91V/218N/220G、67W、72Q、74A/75E/78F/108V、75E/78F/99P/108V/215S/224A、78F/107G、95C、96G和114V,其中所述位置根据SEQ ID NO:138来编号。在一些另外的实施方案中,工程化酮还原酶变体包含选自以下的至少一个取代或取代集:G19S、V24I/A43V/S47E/L49N/A67V/V68E/E70P/I91V/S220G、V24I/V68E/I91V/T218N/S220G、A67W、M72Q、K74A/Q75E/Y78F/A108V、Q75E/Y78F/N99P/A108V/D215S/S224A、Y78F/P107G、T95C、S96G和N114V,其中所述位置根据SEQ ID NO:138来编号。
本发明还提供了工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与SEQID NO:2、112、124和/或138具有至少90%序列同一性的序列的多肽序列。在一些实施方案中,工程化酮还原酶变体包含含有与SEQ ID NO:2、112、124和/或138具有至少95%序列同一性的序列的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含SEQ ID NO:2、112、124或138中列出的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含编码表5.1、表6.1、表7.1和/或表8.1中提供的变体的多肽序列。在一些另外的实施方案中,工程化酮还原酶变体包含选自SEQ ID NO:4至SEQ ID NO:170中列出的偶数编号的序列的多肽序列。
本发明还提供了编码本文提供的工程化酮还原酶变体的工程化多核苷酸序列。在一些实施方案中,工程化多核苷酸序列包含与选自SEQ ID NO:3至SEQ ID NO:169中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。本发明还提供了包含编码本文提供的工程化酮还原酶变体的工程化多核苷酸序列的载体。在一些实施方案中,载体还包含至少一种控制序列。
本发明还提供了包含载体的宿主细胞,所述载体包含编码本文提供的工程化酮还原酶变体的多核苷酸。
本发明还提供了产生本文提供的工程化酮还原酶变体的方法,所述方法包括在本文提供的宿主细胞藉以产生工程化酮还原酶变体的条件下培养所述宿主细胞。在一些实施方案中,该方法还包括回收由宿主细胞产生的工程化酮还原酶变体的步骤。
本发明还提供了固定化的工程化酮还原酶变体。
本发明还提供了包含至少一种本文提供的工程化酮还原酶变体的组合物。在一些实施方案中,组合物包含至少一种本文提供的固定化的工程化酮还原酶变体。
本发明还提供了工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQID NO:172和/或SEQ ID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明还提供了工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQID NO:172具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:10/73/78/137/323/325、10/73/78/233/323、10/73/137、13/41/63/132/193/195、18/44/119/124/132/137/145/158/175/177/293/317/323、18/44/119/124/132/137/145/158/177/293/323、18/44/119/124/132/137/145/293/323/334/336、32/44/132/137/145/186/233/293/323/336、41/44/88/193/195、44/69/120/132/137/145/175/195/293/323、44/113/132/145、44/119/132/137/145/158/175/177/293/317/323、44/132/135/136/137/145/293、44/132/136/137/145/293、44/132/137/145/233/308/323、44/132/137/145/293/323、44/132/145、44/132/145/195/293/323、137/233/303/323和266,其中所述位置根据SEQ ID NO:172来编号。在一些实施方案中,工程化亚磷酸脱氢酶变体包含选自以下的至少一个取代或取代集:10K/73A/78Y/137Q/323D/325A、10K/73A/78Y/233I/323D、10K/73A/137Q、13D/41A/63A/132Q/193S/195E、18M/44A/119F/124E/132Q/137I/145G/158K/175S/177T/293L/317R/323D、18M/44A/119F/124E/132Q/137I/145G/158K/177T/293L/323D、18M/44A/119F/124E/132Q/137I/145G/293L/323D/334K/336R、32V/44A/132Q/137I/145G/186T/233I/293L/323D/336S、41A/44A/88R/193S/195E、44A/69K/120V/132Q/137I/145G/175T/195E/293L/323D、44A/113S/132Q/145G、44A/119F/132Q/137I/145G/158K/175S/177T/293L/317R/323D、44A/132Q/135A/136D/137I/145G/293L、44A/132Q/136D/137Q/145G/293L、44A/132Q/137I/145G/233I/308V/323D、44A/132Q/137I/145G/293L/323D、44A/132Q/145G、44A/132Q/145G/195E/293L/323D、137Q/233I/303A/323D和266S/V/W,其中所述位置根据SEQ ID NO:172来编号。在一些另外的实施方案中,工程化亚磷酸脱氢酶变体包含选自以下的至少一个取代或取代集:R10K/C73A/F78Y/R137Q/N323D/V325A、R10K/C73A/F78Y/V233I/N323D、R10K/C73A/R137Q、E13D/R41A/Q63A/R132Q/A193S/S195E、L18M/R44A/L119F/A124E/R132Q/R137I/N145G/L158K/A175S/K177T/I293L/A317R/N323D、L18M/R44A/L119F/A124E/R132Q/R137I/N145G/L158K/K177T/I293L/N323D、L18M/R44A/L119F/A124E/R132Q/R137I/N145G/I293L/N323D/A334K/C336R、S32V/R44A/R132Q/R137I/N145G/R186T/V233I/I293L/N323D/C336S、R41A/R44A/A88R/A193S/S195E、R44A/R69K/R120V/R132Q/R137I/N145G/A175T/S195E/I293L/N323D、R44A/V113S/R132Q/N145G、R44A/L119F/R132Q/R137I/N145G/L158K/A175S/K177T/I293L/A317R/N323D、R44A/R132Q/Q135A/P136D/R137I/N145G/I293L、R44A/R132Q/P136D/R137Q/N145G/I293L、R44A/R132Q/R137I/N145G/V233I/A308V/N323D、R44A/R132Q/R137I/N145G/I293L/N323D、R44A/R132Q/N145G、R44A/R132Q/N145G/S195E/I293L/N323D、R137Q/V233I/E303A/N323D和E266S/V/W,其中所述位置根据SEQ IDNO:172来编号。
本发明还提供了工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:32/59/124/177/191/327、78/150/198/327/328、83/266、95/211/213/322、104、178/194/211/213/322、206、211/213/322、215、262、266和323,其中所述位置根据SEQ ID NO:208来编号。在一些实施方案中,工程化亚磷酸脱氢酶变体包含选自以下的至少一个取代或取代集:32V/59M/124E/177S/191H/327D、78Y/150I/198L/327S/328P、83A/266A、95I/211A/213Q/322M、104F/L、178P/194L/211A/213Q/322Q、206N、211A/213Q/322Q、215P、262D/P、266S和323N,其中所述位置根据SEQ ID NO:208来编号。在一些另外的实施方案中,工程化亚磷酸脱氢酶变体包含选自以下的至少一个取代或取代集:S32V/A59M/A124E/T177S/Q191H/R327D、F78Y/F150I/F198L/R327S/L328P、V83A/E266A、F95I/N211A/D213Q/I322M、T104F/L、A178P/C194L/N211A/D213Q/I322Q、L206N、N211A/D213Q/I322Q、L215P、V262D/P、E266S和D323N,其中所述位置根据SEQ ID NO:208来编号。
本发明还提供了工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体包含含有与SEQ ID NO:172和/或SEQ ID NO:208具有至少90%序列同一性的序列的多肽序列。在一些实施方案中,工程化亚磷酸脱氢酶变体包含含有与SEQ ID NO:172和/或SEQ ID NO:208具有至少95%序列同一性的序列的多肽序列。在一些另外的实施方案中,工程化亚磷酸脱氢酶变体包含SEQ ID NO:172或SEQ ID NO:208中列出的多肽序列。在一些另外的实施方案中,工程化亚磷酸脱氢酶变体包含编码表9.1、表10.1和/或表11.1中提供的变体的多肽序列。在仍一些另外的实施方案中,工程化亚磷酸脱氢酶变体包含选自SEQ ID NO:174至SEQ ID NO:260中列出的偶数编号的序列的多肽序列。
本发明还提供了固定化的工程化亚磷酸脱氢酶变体。在一些实施方案中,本发明提供了至少一种本文提供的固定化的工程化酮还原酶变体和至少一种本文提供的工程化亚磷酸脱氢酶变体的混合物。
本发明还提供了包含至少一种本文提供的亚磷酸脱氢酶变体的组合物。在一些实施方案中,本发明还提供了包含至少一种本文提供的工程化酮还原酶变体和至少一种本文提供的工程化亚磷酸脱氢酶的混合物的组合物。
本发明还提供了编码本文提供的工程化亚磷酸脱氢酶变体的工程化多核苷酸序列。在一些实施方案中,工程化多核苷酸序列包含与选自SEQ ID NO:171至SEQ ID NO:259中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。
本发明还提供了包含编码本文提供的工程化亚磷酸脱氢酶变体的工程化多核苷酸序列的载体。在一些实施方案中,载体还包含至少一种控制序列。在仍一些另外的实施方案中,载体包含编码本文提供的工程化亚磷酸脱氢酶变体的至少一种工程化多核苷酸序列和编码本文提供的工程化酮还原酶变体的至少一种工程化多核苷酸序列。本发明还提供了包含本文提供的载体的宿主细胞。
本发明还提供了用于产生本文提供的工程化亚磷酸脱氢酶变体的方法,所述方法包括在包含含有编码至少一种本发明的工程化亚磷酸脱氢酶的至少一种工程化多核苷酸序列的载体的宿主细胞藉以产生工程化亚磷酸脱氢酶变体的条件下培养所述宿主细胞。在一些实施方案中,宿主细胞包含载体,所述载体包含多核苷酸序列,所述多核苷酸序列包含本文提供的至少一种工程化酮还原酶和至少一种工程化亚磷酸脱氢酶。在一些另外的实施方案中,宿主细胞包含至少一种本文未提供的酮还原酶,但包含至少一种本文提供的工程化亚磷酸脱氢酶变体。在一些另外的实施方案中,宿主细胞包含至少一种本文未提供的亚磷酸脱氢酶,但包含至少一种本文提供的工程化酮还原酶变体。在一些实施方案中,该方法还包括回收由宿主细胞产生的工程化亚磷酸脱氢酶变体的步骤。在宿主细胞产生至少一种酮还原酶和至少一种亚磷酸脱氢酶的实施方案中,一些方法还包括回收由宿主细胞产生的酮还原酶和/或亚磷酸脱氢酶的步骤。
本发明还提供了使手性醇去外消旋化的方法,所述方法包括,在使得手性醇被去外消旋化的条件下,提供至少一种本文提供的工程化酮还原酶变体,提供至少一种本文提供的工程化亚磷酸脱氢酶变体、至少一种手性醇和至少一种辅因子。在一些实施方案中,该方法以一锅反应来进行,而在一些可选择的实施方案中,使用多个反应容器。
附图简述
图1提供了本发明提出的反应方案。
图2提供了底物异构体和产物异构体的结构。
图3提供了一锅多酶反应方案。
图4和图5提供了辅因子竞争测定方案。
图6提供了一锅多酶反应中获得的产物的HPLC色谱图。
图7提供了反应图。
发明描述
本发明提供了与天然存在的野生型酮还原酶和亚磷酸脱氢酶相比具有改进的特性的工程化酮还原酶和工程化亚磷酸脱氢酶、以及编码工程化酮还原酶和工程化亚磷酸脱氢酶的多核苷酸、能够表达工程化酮还原酶和工程化亚磷酸脱氢酶的宿主细胞、以及使用工程化酮还原酶和工程化亚磷酸脱氢酶在一锅多酶系统中使外消旋醇去外消旋化的方法。
定义
关于本发明,本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另有具体定义。因此,意图以下术语具有以下含义。本文提及的所有专利和出版物,包括这些专利和出版物中公开的所有序列,都通过引用明确并入。除非另外说明,否则本发明的实践涉及本领域技术人员已知的分子生物学、发酵、微生物学和相关领域中通常使用的常规技术。除非本文另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管与本文描述的那些相似或等效的任何方法和材料都可以用于实践或测试本发明,但描述了优选的方法和材料。实际上,意图是本发明不受限于本文描述的特定方法、方案和试剂,因为这些可以根据使用它们的情况而变化。本文提供的标题不是对本发明的各方面或实施方案的限制。
尽管如此,为了便于理解本发明,以下定义了许多术语。数值范围包括限定该范围的数值。因此,本文公开的每个数值范围意图包括落在此较宽数值范围内的每个较窄数值范围,如同这些较窄数值范围被全部明确写入本文。还意图本文公开的每个最大(或最小)的数值限制包括每个较低(或较高)的数值限制,如同这些较低(或较高)的数值限制被明确写入本文。
如本文使用的,术语“包括/包含/含有(comprising)”及其同源词以其包含性含义来使用(即,等同于术语“包括/包含/含有(including)”及其对应的同源词)。
如本文和所附权利要求中使用的,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代物,除非上下文另外清楚指明。因此,例如,对“宿主细胞”的提及包括多于一个这样的宿主细胞。
除非另外指示,否则,分别地,核酸以5'至3'方向从左至右书写;并且氨基酸序列以氨基至羧基方向从左至右书写。
本文提供的标题不是对通过参考本说明书整体可以获得的本发明的各方面或实施方案的限制。因此,以下定义的术语通过参考本说明书整体而被更充分地定义。
“酮还原酶”和“KRED”在本文中可互换使用,以指具有将羰基基团还原为其对应醇的酶促能力的多肽。更具体地,如方案1中示出的(参见图1),本发明的酮还原酶多肽能够在一锅多酶系统中将式(I)的醇立体选择性地去外消旋化为式(II)的对应产物。
亚磷酸脱氢酶和“PDH”在本文中可互换使用,以指具有使NADPH辅因子再生的酶促能力的多肽。
如本文使用的,术语“一锅反应”是指在一个反应容器中使用多种酶(即KRED和PDH)从原材料产生产物。
如本文使用的,术语“蛋白”、“多肽”和“肽”在本文中可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等)。这个定义中包括D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物。
如本文使用的,“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷。多核苷酸可以完全包含核糖核苷(即RNA)、完全包含2'脱氧核糖核苷酸(即DNA)或核糖核苷和2'脱氧核糖核苷的混合物。虽然核苷通常将通过标准磷酸二酯键连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区和双链区两者。此外,虽然多核苷酸通常将变化天然存在的编码核苷碱基(即,腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),但它也可以包含一种或更多种修饰和/或合成的核苷碱基(例如,肌苷、黄嘌呤、次黄嘌呤等)。优选地,这些修饰的或合成的核苷碱基将是编码核苷碱基。
如本文使用的,“编码序列”是指编码蛋白的氨基酸序列的那部分核酸(例如,基因)。
如本文使用的,“天然存在的”或“野生型”是指在自然界中存在的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于可以从自然界的来源分离的生物体中并且未被通过人工操作有意修饰的序列。
如本文使用的,当在本发明中关于(例如,细胞、核酸或多肽)使用时,“非天然存在的”或“工程化”或“重组”是指如下材料或与该材料的天然或自然形式对应的材料:已经以自然界本来不存在的方式被修饰或与其相同但由合成材料产生或衍生和/或通过使用重组技术操作产生。非限制性实例包括,除其他以外,表达在天然(非重组)形式的细胞中不存在的基因或表达本来以不同水平表达的天然基因的重组细胞。
如本文使用的,“序列同一性百分比”、“同一性百分比”和“相同百分比”是指多核苷酸序列或多肽序列之间的比较,并通过在比较窗上比较两个最佳比对的序列来确定,其中与用于两个序列的最佳比对的参考序列相比,比较窗中的多核苷酸或多肽序列的部分可以包括添加或缺失(即,空位)。百分比如下计算:通过确定两个序列中出现相同的核酸碱基或核酸碱基或氨基酸残基中与空位对齐的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数,并将结果乘以100以产生序列同一性的百分比。对最佳比对和序列同一性百分比的确定使用BLAST和BLAST 2.0算法来进行(例如参见,Altschul等人,J.Mol.Biol.215:403-410[1990];和Altschul等人,Nucleic Acids Res.3389-3402[1977])。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center forBiotechnology Information)网站公开获得。
简言之,BLAST分析包括首先通过识别查询序列中长度W的短字(short words)来识别高评分序列对(HSP),所述长度W的短字在与数据库序列中的相同长度的字比对时,匹配或满足一定的正值的阈值评分T。T被称为相邻字评分阈值(Altschul等人,同上)。这些初始的相邻字击中(word hit)充当种子,用于启始搜索以发现包含它们的更长的HSP。然后,字击中沿每个序列在两个方向上延伸,直至累积比对评分不能增加。对于核苷酸序列,累积评分使用参数M(对于匹配残基对的奖励评分;永远>0)和N(对于错配残基的惩罚评分;永远<0)来计算。对于氨基酸序列,使用评分矩阵来计算累积评分。当以下情况时,字击中在每个方向上的延伸停止:累积比对评分从其达到的最大值下降了量X;由于累积一个或更多个负评分的残基比对,累积评分达到零或以下;或到达任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为缺省值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及双链比较。对于氨基酸序列,BLASTP程序使用以下作为缺省值:字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵(参见例如,Henikoff和Henikoff,Proc Natl Acad Sci USA 89:10915[1989])。
许多其他算法是可获得及本领域已知的,这些算法在提供两个序列的同一性百分比方面与BLAST起相似作用。用于比较的序列的最佳比对可以使用本领域已知的任何合适的方法进行(例如,通过Smith和Waterman,Adv.Appl.Math.2:482[1981]的局部同源性算法;通过Needleman和Wunsch,J.Mol.Biol.48:443[1970]的同源性比对算法;通过Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]的搜索相似性的方法;和/或通过这些算法的计算机化实现[GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA]),或通过使用本领域通常已知的方法进行目视检查。此外,序列比对和序列同一性百分比的确定可以使用所提供的缺省参数,利用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序。
如本文中使用的,“参考序列”指另一序列被与其比较的限定序列。参考序列可以是更大的序列的子集;例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度,或者核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸在“比较窗”上的序列来鉴定和比较序列相似性的局部区域来进行。术语“参考序列”不意图受限于野生型序列,并且可以包括工程化序列或改变的序列。例如,在一些实施方案中,“参考序列”可以是先前工程化或改变的氨基酸序列。
如本文使用的,“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中与参考序列(其不包含添加或缺失)相比,序列在比较窗中的部分可以包含20%或更少的添加或缺失(即,空位),以获得两个序列的最佳比对。比较窗可以比20个连续残基更长,并且任选地包括30个、40个、50个、100个或更长的窗口。
当如本文使用的,当在特定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“关于”或“相对于”是指,当将特定氨基酸或多核苷酸序列与指定参考序列相比时,该参考序列的残基的编号。换言之,特定聚合物的残基编号或残基位置相对于参考序列来指定,而不是由残基在特定氨基酸或多核苷酸序列内的实际数值位置指定。例如,可以通过引入空位将特定氨基酸序列诸如工程化酮还原酶的氨基酸序列与参考序列比对,以优化两个序列之间的残基匹配。在这些情况下,尽管存在空位,但是特定氨基酸或多核苷酸序列中残基的编号相对于与其比对的参考序列来进行。如本文使用的,对残基位置的指代,诸如以下进一步描述的“Xn”,应被理解为是指“对应于……的残基”,除非另外明确说明。因此,例如,“X94”是指多肽序列中位置94处的任何氨基酸。
如本文使用的,“立体选择性”指一种立体异构体相对于另一种立体异构体或另一组立体异构体在化学或酶促反应中的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于另一种,或者立体选择性可以是完全的,此时仅形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两种对映异构体的总和中一种对映异构体的分数(通常报道为百分比)。本领域中通常可选择地将其报道(通常为百分比)为根据下式从中计算的对映异构体过量(e.e.):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报道为百分比),通常可选择地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。还应理解,立体选择性不限于单一立体异构体,并且可以描述立体异构体的组。
如本文使用的,“高立体选择性”是指能够以至少约75%的立体异构体过量将底物转化为其对应的手性醇产物的化学或酶促反应。
如本文使用的,“增加的酶促活性”和“增加的活性”是指工程化酶的改进的特性,其可以通过与参考酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如,使用指定量的酮还原酶,在指定时间段内,起始量的底物向产物的转化百分比)的增加来表示。确定酶活性的示例性方法在实施例中提供。与酶活性相关的任何特性都可以被影响,包括经典的酶特性Km、Vmax或kcat,其改变可以导致酶促活性的增加。酮还原酶活性可以通过用于测量酮还原酶的标准测定中的任何一种来测量,诸如底物或产物浓度的变化,或辅因子浓度的变化(在辅因子再生系统的不存在下)。酶活性的比较使用限定的酶制剂、设定条件下的限定的测定和一种或更多种限定的底物来进行,如本文进一步详细描述的。通常,当比较细胞裂解物中的酶时,确定细胞的数目和测定的蛋白的量,并使用相同表达系统和相同宿主细胞以使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。
如本文使用的,“转化”是指将底物向对应产物的酶促转化。
如本文使用的,“转化百分比”是指在指定条件下在一定时间段内转化为产物的底物的百分比。因此,例如,酮还原酶多肽的“酶促活性”或“活性”可以表示为底物向产物的“转化百分比”。
如本文使用的,“热稳定的(thermostable)”或“热稳定的(thermal stable)”可互换使用以指这样的多肽,其与未处理的酶相比,当暴露于一组温度条件(例如,40℃-80℃)一定时间段(例如,0.5hr-24hr)时耐受失活,因此在暴露于升高的温度后,保持一定水平的残余活性(诸如例如,多于60%至80%)。
如本文使用的,“溶剂稳定的”是指与未处理的酶相比,多肽在暴露于不同浓度(例如,5%-99%)的溶剂后,维持相似活性(例如,多于例如60%至80%)的能力。
如本文使用的,“氨基酸差异”或“残基差异”是指多肽序列的一个位置处的氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比在位置X40处的残基差异”是指在对应于SEQ ID NO:2的位置40的多肽位置处的氨基酸残基的差异。因此,如果SEQ ID NO:2的参考多肽在位置40处具有组氨酸,那么“与SEQ ID NO:2相比在位置X40处的残基差异”是指在对应于SEQ ID NO:2的位置40的多肽位置处除组氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸的单字母标识符(即,与参考多肽中的不同的残基)。在一些情况下,本发明还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是参考序列中的残基位置的编号,并且B是工程化多肽序列中残基取代的单字母标识符。在一些情况下,本发明的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异,所述氨基酸残基差异由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中,当多于一个氨基酸可以在多肽的特定残基位置中使用时,可以使用的不同氨基酸残基由“/”隔开(例如,X192A/G)。本发明包括包含一个或更多个氨基酸差异的工程化多肽序列,所述一个或更多个氨基酸差异包括保守氨基酸取代和非保守氨基酸取代的任一种/或两者。本发明的序列表中包括的特定重组碳酸酐酶多肽的氨基酸序列包括起始甲硫氨酸(M)残基(即,M代表残基位置1)。然而,技术人员理解,该起始甲硫氨酸残基可以通过诸如宿主细胞中或体外翻译系统中的生物加工机制去除,以产生缺乏起始甲硫氨酸残基但在其他方面保留酶的特性的成熟蛋白。因此,如本文使用的术语“相对于SEQ ID NO:2在位置Xn处的氨基酸残基差异”可以指位置“Xn”或已经被加工以便缺少起始甲硫氨酸的参考序列的对应位置(例如,位置(X-1)n)。
如本文使用的,措辞“保守氨基酸取代”是指具有相似侧链的残基的可互换性,并且因此通常包括用相同或相似的氨基酸定义类别内的氨基酸取代多肽中的氨基酸。通过实例且非限制性的方式,在一些实施方案中,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水性或亲水性氨基酸分别被另一种疏水性或亲水性氨基酸取代。示例性保守取代在表1中提供。
如本文使用的,措辞“非保守取代”是指用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而非定义的组之内的氨基酸,并且影响(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。通过实例且非限制性的方式,示例性非保守取代可以是用碱性氨基酸或脂肪族氨基酸取代的酸性氨基酸;用小氨基酸取代的芳香族氨基酸;以及用疏水性氨基酸取代的亲水性氨基酸。
如本文使用的,“缺失”是指通过从参考多肽去除一个或更多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或者20个或更多个氨基酸、多达构成多肽的氨基酸总数的10%或多达构成多肽的氨基酸总数的20%,同时保留酶促活性和/或保留工程化酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以构成连续的区段,或者可以是不连续的。
如本文使用的,“插入”是指通过向参考多肽添加一个或更多个氨基酸来修饰多肽。在一些实施方案中,改进的工程化酮还原酶包括向天然存在的酮还原酶多肽插入一个或更多个氨基酸,以及向工程化酮还原酶多肽插入一个或更多个氨基酸。插入可以在多肽的内部部分,或在羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或由天然存在的多肽中的一个或更多个氨基酸隔开。
术语“氨基酸取代集”或“取代集”是指与参考序列相比,多肽序列中的一组氨基酸取代。取代集可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个氨基酸取代。在一些实施方案中,取代集是指存在于实施例中提供的表格中所列的变体KRED的任一个中的氨基酸取代集。
如本文使用的,“片段”是指具有氨基末端和/或羧基末端缺失,但其中剩余的氨基酸序列与序列中的对应位置相同的多肽。片段通常可以具有全长酮还原酶多肽例如多肽SEQ ID NO:4的约80%、约90%、约95%、约98%或约99%。在一些实施方案中,片段是“有生物活性的”(即,它表现出与全长序列相同的酶促活性)。
如本文使用的,“分离的多肽”是指与天然伴随多肽的其他污染物,例如,蛋白、脂质和多核苷酸基本上分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。改进的酮还原酶可以存在于细胞内、存在于细胞培养基中,或以各种形式制备,诸如裂解物或分离的制品。如此,在一些实施方案中,本发明的工程化酮还原酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”是指其中多肽物质是存在的主要物质(即,以摩尔或重量计,其比组合物中的任何其他单独的大分子物质更丰富)的组合物,并且当目标物质以摩尔或%重量计构成存在的大分子物质的至少约50%时,该组合物通常为基本上纯的组合物。通常,以存在于组合物中的所有大分子物质的摩尔或%重量计,基本上纯的工程化酮还原酶多肽组合物将占约60%或更多、约70%或更多、约80%或更多、约90%或更多、约91%或更多、约92%或更多、约93%或更多、约94%或更多、约95%或更多、约96%或更多、约97%或更多、约98%或更多、或约99%。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的改进的酮还原酶多肽是基本上纯的多肽组合物。
如本文使用的,当关于核酸或多肽使用时,术语“异源的”是指正常情况下生物体(例如,野生型生物体)不表达及分泌的序列。在一些实施方案中,该术语包括包含两个或更多个子序列的序列,发现所述子序列彼此之间关系与在自然界中正常存在的关系不同,或所述序列被重组工程化,使得其表达水平或与细胞中的其他核酸或其他分子的物理关系或结构不是正常存在于自然界中的。例如,异源核酸通常被重组地产生,具有以自然界中未发现的方式排列的来自不相关的基因的两个或更多个序列(例如,本发明的核酸开放阅读框(ORF)可操作地连接至被插入到表达盒诸如载体中的启动子序列)。在一些实施方案中,“异源多核苷酸”是指通过实验室技术被引入宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经受实验室操作、并且然后重新引入宿主细胞中的多核苷酸。
如本文使用的,“密码子优化”是指编码蛋白的多核苷酸的密码子向特定生物体中优选使用的密码子的改变,使得编码的蛋白在感兴趣的生物体中有效地表达。在一些实施方案中,编码酮还原酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体优化产生。
如本文使用的,“控制序列”在本文中被定义为包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每个控制序列对于感兴趣的多核苷酸可以是天然的或外源的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。
如本文使用的,“可操作地连接”在本文中被定义为控制序列被适当地放置(即,以功能性关系)在相对于感兴趣的多核苷酸序列的某一位置处的配置,使得控制序列指导或调控感兴趣的多核苷酸和/或多肽的表达。
如本文使用的,措辞“辅因子再生系统”或“辅因子再循环系统”是指参与还原辅因子的氧化形式的反应(例如,NADP+至NADPH)的一组反应物。由酮还原酶催化的酮底物的还原而氧化的辅因子通过辅因子再生系统以还原的形式再生。辅因子再生系统包括化学计量的还原剂,所述还原剂是还原氢等同物的来源并且能够还原辅因子的氧化形式。辅因子再生系统还可以包含催化剂,例如催化由还原剂还原辅因子的氧化形式的酶催化剂。分别从NAD+或NADP+再生NADH或NADPH的辅因子再生系统是本领域已知的,并且可以用于本文描述的方法。
如本文使用的,“合适的反应条件”是指生物催化反应溶液中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、pH、缓冲剂、共溶剂等的范围),在这些条件下本发明的酮还原酶多肽能够立体选择性地使底物化合物去外消旋化为产物化合物。在本发明中提供并通过实施例说明了示例性的“合适的反应条件”。
如本文使用的,诸如“化合物载量”、“酶载量”或“辅因子载量”中的“载量”是指在反应开始时反应混合物中组分的浓度或量。
如本文使用的,在生物催化剂介导的方法的上下文中,“底物”是指由生物催化剂作用的化合物或分子。例如,在本文公开的方法中,酮还原酶生物催化剂的示例性底物是化合物(1)。
如本文使用的,在生物催化剂介导的方法的上下文中,“产物”是指由生物催化剂的作用产生的化合物或分子。
如本文使用的,“平衡”是指在化学或酶促反应中产生稳定状态浓度的化学物质的过程(例如,两种物质A和B的相互转化),包括立体异构体的相互转化,如通过该化学或酶促反应的正向速率常数和逆向速率常数确定的。
如本文使用的,“氧代”是指=O。
如本文使用的,“氧基”是指二价基团-O-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
如本文使用的,“羧基”是指-COOH。
如本文使用的,“羰基”是指-C(O)-,其可以具有各种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
如本文使用的,“羟基”是指-OH。
如本文使用的,“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且该描述包括其中事件或情形发生的情况和其中事件或情形不发生的情况。本领域普通技术人员将理解,对于被描述为含有一个或更多个任选的取代基的任何分子,仅意图包括空间上可实现的和/或合成上可行的化合物。
如本文使用的,“任选地被取代的”是指术语或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基、环烷基、芳基和杂芳基彼此独立地可以被取代或可以不被取代。
工程化酶多肽
酮还原酶(KRED)或羰基还原酶生物催化剂(EC 1.1.1.184)可用于从醛和酮合成醇,以及从对应的前立体异构体酮底物合成光学活性仲醇。KRED也可以催化逆反应(即,醇底物向对应的醛/酮产物的氧化)。KRED对酮和醛的还原以及对醇的氧化使用辅因子,最常见的是还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH),以及用于氧化反应的烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP+)。NADH和NADPH充当电子供体,而NAD+和NADP+充当电子受体。
如本领域已知的,KRED酶可见于广泛范围的细菌和酵母中(参见例如,Hummel和Kula Eur.J.Biochem.,184:1-13[1989])。已经报道了许多KRED基因和酶序列,包括木兰假丝酵母(Candida magnoliae)(Genbank登录号JC7338;GI:11360538);近平滑假丝酵母(Genbank登录号BAA24528.1;GI:2815409),赭色掷孢酵母(Sporobolomycessalmonicolor)(Genbank登录号AF160799;GI:6539734),开菲尔乳杆菌(Lactobacilluskefir)(Genbank登录号AAP94029.1;GI:33112056),短乳杆菌(Lactobacillus brevis)(Genbank登录号1NXQ_A;GI:30749782)和布氏嗜热厌氧菌(Thermoanaerobium brockii)(Genbank登录号P14941;GI:1771790)的那些KRED基因和酶序列。
酮还原酶的立体选择性已经被应用于制备重要的药物构建区块(pharmaceuticalbuilding block)(参见例如,Broussy等人,Org.Lett.,11:305-308[2009])。天然存在或工程化的KRED在产生有用的化学化合物的生物催化过程中的具体应用已针对以下被证明:4-氯乙酰乙酸酯的还原(参见例如,Zhou,J.Am.Chem.Soc.,105:5925-5926[1983];Santaniello,J.Chem.Res.,(S)132-133[1984];美国专利第5,559,030号;美国专利第5,700,670号;和美国专利第5,891,685号)、二氧代羧酸的还原(参见例如,美国专利第6,399,339号)、叔丁基(S)-氯-5-羟基-3-氧代己酸酯的还原(参见例如,美国专利第6,645,746号;和WO 01/40450)、基于吡咯并三嗪的化合物的还原(参见例如,美国申请公布第2006/0286646号);取代的苯乙酮的还原(参见例如,美国专利第6,800,477号和第8,748,143号)、以及酮噻茂烷(ketothiolane)的还原(WO 2005/054491)。
本发明提供了能够在一锅多酶系统中使底物化合物(1)(6,7-二氢-5H-吡咯并[1,2-a]咪唑-7-醇)去外消旋化的工程化酮还原酶,如图7中的反应和图1中示出的。
本发明还提供了改进的酮还原酶和改进的亚磷酸脱氢酶,以及用于使用工程化酮还原酶和工程化亚磷酸脱氢酶在一锅多酶系统中使手性化合物去外消旋化的方法。
重要的是要注意,只有当氧化反应和还原反应是正交的、相容的且不相互影响时,才能在一锅、一步、多酶系统中获得期望的产物。只有当氧化性酮还原酶及其对应的再循环酶仅仅使用一种辅因子(例如,NAD+)并且还原性酮还原酶及其对应的再循环酶仅仅使用相对的辅因子(即,NADPH)时,这些条件才得到满足。
化合物(1)具有一个手性中心,并且可以以两种不同的非对映异构体形式(1a和1b)存在。通过串联的酮还原酶的去外消旋化反应可以产生两种不同的对映异构体产物(1a-1b),如图2和下文中示出的。
然而,(1a)是唯一期望的产物。在本发明的开发中使用的演化程序被设计成改进S-选择性酮还原酶的活性,该酶将使外消旋混合物中的S-醇氧化,产生用于R-选择性酮还原酶的酮底物。此外,演化程序被设计成改进R-选择性酮还原酶的选择性、活性和辅因子偏好性。演化还被设计成改进亚磷酸脱氢酶的活性、稳定性和辅因子偏好性,从而能够以一锅、一步、多酶方法使底物(1)去外消旋化为产物(1a)及最小量的酮和(1b)。
选择SEQ ID NO:2的酮还原酶多肽作为用于开发本发明提供的改进的S-选择性酶的初始骨架。选择这种酶作为初始骨架,因为酮(2)仅通过(1b)的氧化产生,留下(1a)。SEQID NO:2的酮还原酶多肽使用NAD+作为辅因子,具有相对于NADP+的大于200:1的效率,并且可以与商业上可得的NADH氧化酶偶联以使辅因子再循环。
选择SEQ ID NO:2的酮还原酶多肽作为开发将酮还原为产物(1a)的R-选择性酶的初始骨架,具有初始选择性为92.7%e.e.。本文中对映选择性值根据以下提供的等式(1)来计算。
(1){[(1a量)-(1b量)]/[(1a量)+(1b量)]}x 100
实际上,本发明的非天然存在的酮还原酶多肽是被工程化为与SEQ ID NO:2的天然存在的酮还原酶相比具有改进的特性的酮还原酶。
选择亚磷酸脱氢酶多肽作为开发改进的PDH酶的初始骨架。这种酶同样有效地使NADH和NADPH两者再循环。
在一些实施方案中,工程化酮还原酶多肽能够在合适的反应条件下以相对于SEQID NO:2的参考多肽的活性增加了至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或100倍的活性将底物化合物转化为产物。在一些实施方案中,工程化酮还原酶多肽能够在合适的反应条件下,以约48h、约36h、约24h的反应时间或甚至更短的时间长度,以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、或至少约90%、至少约95%、至少约98%、至少约99%的转化率百分比将底物化合物转化为产物。
在一些实施方案中,工程化酮还原酶和亚磷酸脱氢酶能够在一锅、一步、多酶系统中将底物化合物(1)转化为相对于化合物(1b)呈对映异构体过量的产物化合物(1a)。在一些实施方案中,工程化酮还原酶和亚磷酸脱氢酶能够在合适的反应条件下将化合物(1)转化为相对于化合物(1b)呈非对映异构体过量的化合物(1a)。
如本领域技术人员将理解的,除非另外说明,否则以上定义的类别中的一些并不相互排斥。因此,具有显示两种或更多种物理化学特性的侧链的氨基酸可以被包括在多个类别中。对任何氨基酸或残基的适当分类对本领域技术人员来说将是明显的,特别是根据本文提供的详细发明。
在一些实施方案中,改进的工程化酮还原酶和工程化亚磷酸脱氢酶包含天然存在的酮还原酶或亚磷酸脱氢酶多肽中的氨基酸残基缺失、或其他工程化酮还原酶或亚磷酸脱氢酶多肽中的氨基酸残基缺失。因此,在本发明的一些实施方案中,缺失包括酮还原酶多肽的1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多的氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达氨基酸总数的10%、多达氨基酸总数的10%、多达氨基酸总数的20%、或多达氨基酸总数的30%的缺失,条件为酮还原酶的功能活性或亚磷酸脱氢酶活性被保持。在一些实施方案中,缺失可以包括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-25个、1-30个、1-35个或约1-40个氨基酸残基的缺失。在一些实施方案中,缺失的数目可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、16个、18个、20个、22个、24个、26个、30个、35个或约40个氨基酸。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个或20个氨基酸残基的缺失。
如本文描述的,本发明的酮还原酶多肽或亚磷酸脱氢酶多肽可以呈融合多肽的形式,其中酮还原酶多肽或亚磷酸脱氢酶多肽与其他多肽诸如抗体标签(例如,myc表位)或纯化序列(例如,His标签)融合。因此,在一些实施方案中,可使用与其他多肽融合或不与其他多肽融合的酮还原酶多肽和/或亚磷酸脱氢酶多肽。
在一些实施方案中,本文描述的多肽不限于遗传编码氨基酸。除了遗传编码氨基酸之外,本文描述的多肽可以完全或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌啶酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可以包含的另外的非编码氨基酸对本领域技术人员是明显的。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基团的氨基酸或残基也可以构成本文描述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括(保护基团在圆括号中列出)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶亚磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象上受限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(pipecolic acid);氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
如以上描述的,被引入天然存在的多肽以产生工程化酮还原酶和工程化亚磷酸脱氢酶的各种修饰可以靶向酶的特定特性。
编码工程化酶的多核苷酸
在另一方面中,本发明提供了编码工程化酮还原酶和工程化亚磷酸脱氢酶的多核苷酸。可以将多核苷酸可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。可以将包含编码工程化酮还原酶和/或工程化亚磷酸脱氢酶的异源多核苷酸的表达构建体引入适当的宿主细胞中来表达对应的酮还原酶多肽或工程化亚磷酸脱氢酶多肽。
因为对各种氨基酸所对应的密码子的了解,蛋白序列的可用性提供了对能够编码主题的所有多核苷酸的描述。遗传密码的简并性,其中相同的氨基酸由可替代的密码子或同义密码子编码,允许制备极大数目的核酸,所有这些核酸都编码本文公开的改进的酮还原酶和/或改进的亚磷酸脱氢酶。因此,已经鉴定了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单修改序列的一个或更多个密码子来制备任何数目的不同核酸。在此方面,本发明特别设想了通过选择基于可能的密码子选择的组合可以进行的每个和每一个可能的多核苷酸变化,并且所有这样的变化应被认为针对本文公开的任何多肽(包括实施例中的表格中呈现的氨基酸序列)具体公开。在各种实施方案中,优选地选择密码子来适应在其中产生蛋白的宿主细胞。例如,在细菌中使用的优选的密码子被用于在细菌中表达基因;在酵母中使用的优选的密码子被用于酵母中的表达;并且在哺乳动物中使用的优选的密码子被用于在哺乳动物细胞中表达。
在一些实施方案中,工程化酮还原酶序列或亚磷酸酯脱氢酶序列包括包含被鉴定为有益的位置的序列,如实施例中描述的。
在一些实施方案中,将编码改进的酮还原酶多肽或亚磷酸脱氢酶多肽的分离的多核苷酸以多种方式操作,以提供多肽的改进的表达和/或产生。取决于使用的表达载体,在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可能是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
对于细菌宿主细胞,用于指导本发明的核酸构建体的转录的合适的启动子包括从以下获得的启动子:大肠杆菌(E.coli)lac操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、及原核生物β-内酰胺酶基因(参见例如,Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA 75:3727-3731[1978])、以及tac启动子(参见例如,DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。另外的合适的启动子对于本领域技术人员是已知的。
对于丝状真菌宿主细胞,用于指导本发明的核酸构建体的转录的合适的启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillusnidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)及其突变启动子、截短启动子和杂合启动子。
在酵母宿主中,可用的启动子包括但不限于来自以下的基因的启动子:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶,以及用于酵母宿主细胞的其它可用的启动子(参见例如,Romanos等人,Yeast 8:423-488[1992])。
控制序列还可以是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3'末端。在本发明中可以使用在所选择的宿主细胞中起作用的任何终止子。
例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。
用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶,以及本领域已知的用于酵母宿主细胞的其他可用的终止子(参见例如,Romanos等人,同上)。
控制序列还可以是合适的前导序列,前导序列是对宿主细胞的翻译重要的mRNA的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5'末端。可以使用在所选择的宿主细胞中起作用的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列从以下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是被可操作地连接至核酸序列的3'末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号。在本发明中可以使用在所选择的宿主细胞中起作用的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列可以来自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶,以及本领域已知的用于酵母宿主细胞的其他可用的多腺苷酸化序列(参见例如,Guo等人,Mol.Cell.Biol.15:5983-5990[1995])。
控制序列还可以是信号肽编码区域,其编码与多肽的氨基末端连接并指导所编码的多肽进入细胞的分泌途径的氨基酸序列。核酸序列的编码序列的5'末端可以固有地包含信号肽编码区,所述信号肽编码区符合翻译阅读框地(in translation reading frame)与编码分泌多肽的编码区的区段天然地连接。可选择地,编码序列的5'末端可以包含对于编码序列是外源的信号肽编码区。当编码序列不天然包含信号肽编码区时可能需要外源信号肽编码区。
可选择地,外源信号肽编码区可以简单替换天然信号肽编码区以增加多肽的分泌。然而,指导所表达的多肽进入所选择的宿主细胞的分泌途径的任何信号肽编码区可以在本发明中使用。
用于细菌宿主细胞的有效的信号肽编码区是从以下的基因获得的信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA、以及本领域已知的另外的信号肽(参见例如,Simonen等人,Microbiol.Rev.,57:109-137[1993])。
用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和Humicola lanuginosa脂肪酶。用于酵母宿主细胞的可用的信号肽可以来自以下的基因:酿酒酵母α因子和酿酒酵母转化酶,以及另外的可用的信号肽编码区(参见例如,Romanos等人,1992,同上)。
控制序列还可以是编码定位于多肽的氨基末端的氨基酸序列的前肽编码区。所得多肽被称为酶原(proenzyme)或多肽原(或在某些情况下称为酶原(zymogen))。多肽原通常是无活性的并且可以通过前肽从多肽原的催化裂解或自动催化裂解转化为成熟的有活性的多肽。前肽编码区可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(WO 95/33836)。
当信号肽区和前肽区两者存在于多肽的氨基末端时,前肽区紧邻多肽的氨基末端定位,并且信号肽区紧邻前肽区的氨基末端定位。
添加允许相对于宿主细胞的生长来调控多肽的表达的调控序列也可能是期望的。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。在原核宿主细胞中,合适的调控序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括例如ADH2系统或GAL1系统。在丝状真菌中,合适的调控序列包括TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括在氨甲蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明的KRED多肽或本发明的PDH多肽的核酸序列将与调控序列可操作地连接。
因此,在一些实施方案中,本发明还涉及重组表达载体,所述重组表达载体包含编码工程化酮还原酶多肽或其变体或者工程化亚磷酸脱氢酶多肽或其变体的多核苷酸,以及根据它们待被引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等。以上描述的各种核酸和控制序列可以被连接在一起以产生重组表达载体,所述重组表达载体可以包括一个或更多个方便的限制性位点,以允许在这些位点插入或取代编码多肽的核酸序列。可选择地,本发明的核酸序列可以通过将包含该序列的核酸序列或核酸构建体插入到用于表达的适当的载体中来表达。在创建表达载体时,编码序列位于载体中以使编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经受重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择通常将取决于载体与载体待引入的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
表达载体可以是自主复制载体(即,作为染色体外实体存在的载体),其复制独立于染色体复制(例如,质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。可选择地,载体可以是当被引入宿主细胞中时被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒、或转座子。
本发明的表达载体优选地含有一个或更多个可选择的标志物,其允许容易地选择转化的细胞。可选择的标志物可以是基因,其产物提供杀生物剂或病毒抗性、重金属抗性、针对营养缺陷型的原养型等。细菌的可选择的标志物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
用于在丝状真菌宿主细胞中使用的可选择的标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)及其等同物。用于在曲霉属真菌细胞中使用的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的表达载体可以包含允许载体整合到宿主细胞的基因组中或允许载体在细胞中独立于基因组自主复制的元件。为了整合到宿主细胞基因组中,载体可以依赖于核酸序列,所述核酸序列编码用于通过同源或非同源重组将载体整合到基因组中的多肽或载体的任何其他元件。
可选择地,表达载体可以包含用于指导通过同源重组整合到宿主细胞的基因组中的另外的核酸序列。另外的核酸序列能够使载体在染色体的准确位置整合到宿主细胞基因组中。为了增加在准确位置整合的可能性,整合元件应当优选地包含与对应的靶序列高度同源的足够数目的核酸,诸如100个至10,000个碱基对,优选地400个至10,000个碱基对,并且最优选地800个至10,000个碱基对,以增强同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码的或编码的核酸序列。另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,载体还可以包含能够使载体在所讨论的宿主细胞中自主复制的复制起点。细菌复制起点的实例是允许在大肠杆菌中复制的P15Aori或质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)、或pACYC184的复制起点,以及允许在芽孢杆菌属中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。用于在酵母宿主细胞中使用的复制起点的实例是2微米(2micron)复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。复制起点可以是具有使其在宿主细胞中的功能对温度敏感的突变的复制起点(参见例如,Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433[1978])。
可以将多于一个拷贝的本发明的核酸序列插入宿主细胞中以增加基因产物的产量。核酸序列的拷贝数的增加可以通过将至少一个另外拷贝的序列整合到宿主细胞基因组中,或通过包括具有核酸序列的可扩增的可选择标志物基因来获得,其中包含可选择标志物基因的扩增拷贝并从而包含核酸序列的另外拷贝的细胞可以通过在适当的选择剂的存在下培养细胞被选择。
用于在本发明中使用的许多表达载体是商业上可得的。合适的商业表达载体包括但不限于p3xFLAGTMTM表达载体(Sigma-Aldrich),其包括CMV启动子和用于在哺乳动物宿主细胞中表达的hGH多腺苷酸化位点以及用于在大肠杆菌中扩增的pBR322复制起点和氨苄青霉素抗性标志物。其他商业上可得的合适的表达载体包括但不限于pBluescriptII SK(-)和pBK-CMV载体(Stratagene),以及源自pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly的质粒(参见,Lathe等人,Gene57:193-201[1987])。
用于表达工程化多肽的宿主细胞
本发明还提供了包含编码本发明的改进的酮还原酶多肽或改进的亚磷酸脱氢酶多肽的多核苷酸的宿主细胞,所述多核苷酸可操作地连接至用于在宿主细胞中表达酮还原酶或亚磷酸脱氢酶的一个或更多个控制序列。用于在表达由本发明的表达载体编码的KRED多肽或由本发明的表达载体编码的PDH多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、开菲尔乳杆菌、短乳杆菌、微小乳杆菌(Lactobacillusminor)、链霉菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;以及植物细胞。用于以上描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。
用于表达酮还原酶或亚磷酸脱氢酶的多核苷酸可以通过本领域已知的各种方法引入细胞中。技术尤其包括电穿孔、生物弹射颗粒轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞中的各种方法对技术人员将是明显的。
大肠杆菌W3110是可用于本发明的宿主菌株,尽管并不意图本发明受限于这种特定的宿主菌株。表达载体通过将编码改进的酶的多核苷酸可操作地连接至质粒pCK110900中来创建,所述编码改进的酶的多核苷酸可操作地连接至在lacI阻遏子的控制下的lac启动子。表达载体还包含P15a复制起点和氯霉素抗性基因。大肠杆菌W3110中包含主题多核苷酸的细胞可以通过使细胞经受氯霉素选择来分离。
产生工程化酮还原酶多肽和工程化亚磷酸脱氢酶多肽的方法。
在一些实施方案中,为了制备本发明的改进的KRED多核苷酸和多肽,催化还原反应的天然存在的酮还原酶从近平滑假丝酵母或鲑色锁掷酵母获得(或衍生)。在一些实施方案中,对亲本多核苷酸序列密码子优化以增强酮还原酶在指定宿主细胞中的表达。作为说明,编码鲑色锁掷酵母的野生型KRED多肽的亲本多核苷酸序列由寡核苷酸构建,所述寡核苷酸基于可从Genbank数据库获得的鲑色锁掷酵母KRED序列的已知多肽序列来制备。对亲本多核苷酸序列密码子优化,用于在大肠杆菌中表达,并将密码子优化的多核苷酸克隆到表达载体中,将酮还原酶基因的表达置于lac启动子和lacI阻遏子基因的控制下。鉴定在大肠杆菌中表达活性酮还原酶的克隆,并对基因测序以确认它们的身份。
在一些实施方案中,如以上讨论的,工程化酮还原酶可以通过使编码天然存在的酮还原酶的多核苷酸经受诱变和/或定向演化方法来获得。诱变可以根据本领域已知的任何技术来进行,包括随机诱变和定点诱变。定向演化可以用本领域已知的任何技术包括重排来进行,以筛选改进的启动子变体。诱变和定向演化方法是本领域熟知的(参见例如,美国专利号5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326和所有相关的非美国的对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和WO 2009/152336;所有这些通过引用并入本文)。
对诱变处理后获得的克隆筛选具有期望的改进的酶特性的工程化酮还原酶。测量来自表达文库的酶活性可以使用标准生物化学技术来进行,所述标准生物化学技术监测NADH或NADPH浓度的降低速率(通过吸光度或荧光的降低),随着它们被转化为NAD+或NADP+。在这个反应中,当酮还原酶将酮底物还原为对应的羟基基团时,由酮还原酶消耗(氧化)NADH或NADPH。如通过每单位时间吸光度或荧光的降低测量的NADH或NADPH浓度的降低速率指示KRED多肽在固定量的裂解物(或由其制成的冻干粉末)中的相对(酶促)活性。产物的立体化学可以通过各种已知技术来确定,并如实施例中所提供的。当期望的改进的酶特性是热稳定性时,可以使酶制品经受指定的温度后并测量热处理后剩余的酶活性的量来测量酶活性。然后对包含编码酮还原酶的多核苷酸的克隆进行分离、测序以鉴定核苷酸序列的改变(如果有的话)、并且用于在宿主细胞中表达酶。
当已知工程化多肽的序列时,编码该酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成、然后连接(例如,通过酶促连接方法或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,本发明的多核苷酸和寡核苷酸可以通过化学合成来制备(例如,使用由Beaucage等人,Tet.Lett.,22:1859-69[1981]描述的经典亚磷酰胺法,或由Matthes等人,EMBO J.,3:801-05[1984]描述的方法,因为它通常以自动化合成方法来实践)。根据亚磷酰胺法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆到适当的载体中。此外,基本上任何核酸可以从多种商业来源中的任一种获得(例如,The MidlandCertified Reagent Company,Midland,TX,The Great American Gene Company,Ramona,CA,ExpressGen Inc.Chicago,IL,Operon Technologies Inc.,Alameda,CA,以及许多其他商业来源)。
在宿主细胞中表达的工程化酮还原酶和工程化亚磷酸脱氢酶可以使用用于蛋白纯化的熟知的技术中的任一种或更多种从细胞和/或培养基来回收,所述技术尤其包括溶菌酶处理、超声、过滤、盐析、超速离心和色谱。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是以商标名CelLytic BTM(Sigma-Aldrich)商业上可得的。
用于分离酮还原酶多肽和/或亚磷酸脱氢酶多肽的色谱技术尤其包括反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是明显的。
在一些实施方案中,亲和技术被用于分离改进的酮还原酶和/或改进的亚磷酸脱氢酶。对于亲和色谱纯化,可以使用特异性结合酮还原酶多肽或亚磷酸脱氢酶多肽的任何抗体。为了产生抗体,可以通过注射酮还原酶或亚磷酸脱氢酶来免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。酮还原酶多肽可以通过侧链官能团或附接至侧链官能团的接头的方式被附接至合适的载体诸如BSA。取决于宿主物种,多种佐剂可以被用来增加免疫应答,包括但不限于弗氏佐剂(完全和不完全)、矿物凝胶诸如氢氧化铝、表面活性物质诸如溶血卵磷脂、pluronic多元醇、聚阴离子、肽、油乳剂、钥孔虫戚血兰素、二硝基酚和可能有用的人类佐剂诸如BCG(卡介苗)和短棒杆菌(Corynebacterium parvum)。
酮还原酶和/或亚磷酸脱氢酶可以以表达酶的细胞的形式、作为粗提取物、或作为分离的或纯化的制品来制备及使用。酮还原酶和/或亚磷酸脱氢酶可以被制备为冻干物、呈粉末形式(例如,丙酮粉末)或被制备为酶溶液。在一些实施方案中,酮还原酶或亚磷酸脱氢酶可以呈基本上纯的制品的形式。
在一些实施方案中,酮还原酶多肽和/或亚磷酸脱氢酶多肽可以被附接至固体基底。基底可以是固相、表面和/或膜。固体支持物可以包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅(silica)、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。基底的构型可以呈珠、球、微粒(particle)、颗粒(granule)、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷或其他容器、器皿、特征或位置的形式。多于一种支持物可以被配置在阵列的多个位置上,所述多个位置是试剂的自动递送或通过检测方法和/或仪器可寻址的。
如本领域技术人员已知的,酮还原酶催化的还原反应通常需要辅因子。由本文描述的工程化酮还原酶催化的还原反应通常也需要辅因子,尽管工程化酮还原酶的许多实施方案比用野生型酮还原酶催化的反应需要少得多的辅因子。如本文使用的,术语“辅因子”是指与酮还原酶联合起作用的非蛋白化合物。适合于与本文描述的工程化酮还原酶一起使用的辅因子包括但不限于NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、NADPH(NADP+的还原形式)、NAD+(烟酰胺腺嘌呤二核苷酸)和NADH(NAD+的还原形式)。通常,将还原形式的辅因子添加到反应混合物中。还原的NAD(P)H形式可以使用辅因子再生系统任选地由氧化的NAD(P)+形式再生。术语“辅因子再生系统”是指参与将辅因子的氧化形式还原的反应(例如,NADP+到NADPH)的一组反应物。通过酮还原酶催化的酮底物的还原被氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量还原剂,所述化学计量还原剂是还原氢等同物的来源,并且能够将辅因子的氧化形式还原。辅因子再生系统还可以包括催化剂,例如,催化由还原剂将辅因子的氧化形式还原的酶催化剂。分别由NAD+或NADP+再生NADH或NADPH的辅因子再生系统是本领域已知的,并且可以用于本文描述的方法中。
实验
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
在以下实验公开内容中,以下缩写适用:ppm(百万分率);M(摩尔/升);mM(毫摩尔/升),uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(分钟);h和hr(小时);U(单位);MW(分子量);rpm(转每分);℃(摄氏度);RT(室温);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);HPLC(高效液相色谱);FIOPC(相对于阳性对照的倍数改进);HTP(高通量);LB(Luria肉汤);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);Millipore(Millipore,Corp.,Billerica MA);Difco(Difco Laboratories,BDDiagnostic Systems,Detroit,MI);Daicel(Daicel,West Chester,PA);Genetix(GenetixUSA,Inc.,Beaverton,OR);Molecular Devices(Molecular Devices,LLC,Sunnyvale,CA);Applied Biosystems(Applied Biosystems,part of Life Technologies,Corp.,GrandIsland,NY),Agilent(Agilent Technologies,Inc.,Santa Clara,CA);ThermoScientific(Thermo Fisher Scientific的一部分,Waltham,MA);Corning(Corning,Inc.,Palo Alto,CA);和Bio-Rad(Bio-Rad Laboratories,Hercules,CA)。
实施例1
酮还原酶和亚磷酸脱氢酶基因构建及表达载体
从基因组DNA扩增编码野生型近平滑假丝酵母酮还原酶(KRED)的基因,并将其克隆到表达载体pCK110900中(参见,美国专利申请公布第2006/0195947号的图3,该专利申请通过引用并入本文),处于lac启动子的控制下。表达载体还包含P15a复制起点和氯霉素抗性基因。野生型酮还原酶的活性如WO2008/042876中描述的来确认。将编码本发明的工程化酮还原酶的多核苷酸同样地克隆到载体pCK110900中,用于在大肠杆菌W3110中表达。KRED基因的定向演化通过以下步骤来进行:首先选择亲本基因(即,SEQ ID NO:2、6、104),随后进行变体基因的文库构建,其中与某些结构特征相关的位置经受诱变。然后,如实施例2、5和12中描述的,将这些文库铺板、使其生长并使用HTP测定来筛选。
基于所报道的酮还原酶的氨基酸序列和如WO2008/042876的实施例1中描述的密码子优化算法,合成了用于在大肠杆菌中表达的编码野生型鲑色锁掷酵母酮还原酶(KRED)的基因,WO2008/042876通过引用并入本文。该基因使用包含42个核苷酸的寡核苷酸来合成,并被克隆到表达载体pCK110900中(参见,美国专利申请公布第2006/0195947号的图3,该专利申请通过引用并入本文),处于lac启动子的控制下。表达载体还包含P15a复制起点和氯霉素抗性基因。野生型酮还原酶的活性如WO2008/042876中描述的来确认。将编码本发明的工程化酮还原酶的多核苷酸同样地克隆到载体pCK110900中,用于在大肠杆菌W3110中表达。KRED基因的定向演化通过以下步骤来进行:首先选择亲本基因(即,SEQ ID NO:112、124、138),随后进行变体基因的文库构建,其中与某些结构特征相关的位置经受诱变。然后,如实施例3、6、7、8和12中描述的,将这些文库铺板、使其生长并使用HTP测定来筛选。
将编码野生型斯氏假单胞菌(Pseudomonas stutzeri)亚磷酸脱氢酶(PDH)的基因的变体克隆到表达载体pCK110900中(参见,美国专利申请公布第2006/0195947号的图3,通过引用并入本文),处于lac启动子的控制下。表达载体还包含P15a复制起点和氯霉素抗性基因。亚磷酸脱氢酶的活性如WO2008/042876中描述的来确认。
将编码本发明的工程化亚磷酸脱氢酶的多核苷酸同样地克隆到载体pCK110900中,用于在大肠杆菌W3110中表达。PDH基因的定向演化通过以下步骤来进行:首先选择亲本基因(即,SEQ ID NO:172、182、200、208、260),随后进行变体基因的文库构建,其中与某些结构特征相关的位置经受诱变。然后,如实施例4和实施例9至实施例12中描述的,将这些文库铺板、使其生长并使用HTP测定来筛选。
实施例2
用于氧化的工程化KRED多肽的产生及分析
将通过定向演化获得并且含有演化的酮还原酶基因的质粒文库转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,使用自动菌落挑取器(Genetix)将菌落挑取到包含200μL的LB、1%葡萄糖和30μg/ml CAM的96孔浅孔微量滴定板中。使细胞在30℃并以200rpm摇动生长18h-20h。然后将20μL的该培养物转移到360μL的Terrific Broth(TB)、1mMMgCl2、2mM ZnSO4和30μg/ml CAM中。将深孔板在30℃并以250rpm摇动孵育2.5h后(OD6000.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将平板在30℃并以250rpm摇动孵育18h-21h。
将细胞培养物以3500x g沉淀20min,并将其上清液弃去。将细胞沉淀物在300μL的20mM Tris、2mM ZnSO4、1mM MgCl2、pH 7.5、及1g/L溶菌酶和0.5g/L硫酸多粘菌素B中通过在室温摇动2h来裂解。将样品以3500x g离心20min以澄清细胞碎片,并使用上清液来进行实施例5和12中描述的转化。
实施例3
用于还原的工程化KRED多肽的产生及分析
将通过定向演化获得并且含有演化的酮还原酶基因的质粒文库转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,使用自动菌落挑取器(Genetix)将菌落挑取到包含200μL的LB、1%葡萄糖和30μg/ml CAM的96孔浅孔微量滴定板中。使细胞在30℃并以200rpm摇动生长18h-20h。然后将20μL的该培养物转移到360μL的Terrific Broth(TB)、1mM MgSO4和30μg/ml CAM中。将深孔板在30℃并以250rpm摇动孵育2.5h后(OD600 0.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将平板在30℃并以250rpm摇动孵育18h-21h。
将细胞培养物以3500x g沉淀20min,并将其上清液弃去。将细胞沉淀物在300μL的20mM Tris、1mM MgSO4、pH 7.5、及1g/L溶菌酶和0.5g/L硫酸多粘菌素B中通过在室温摇动2h来裂解。将样品以3500x g离心20min以澄清细胞碎片,并使用上清液来进行实施例6至实施例8和实施例12中描述的转化。
实施例4
工程化亚磷酸脱氢酶多肽的产生及分析
将通过定向演化获得并且含有演化的亚磷酸脱氢酶基因的质粒文库转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,使用自动菌落挑取器(Genetix)将菌落挑取到包含200μL的LB、1%葡萄糖和30μg/ml CAM的96孔浅孔微量滴定板中。使细胞在30℃并以200rpm摇动生长18h-20h。然后将20μL的该培养物转移到360μL的Terrific Broth(TB)和30μg/ml CAM中。将深孔板在30℃并以250rpm摇动孵育2.5h后(OD600 0.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将平板在30℃并以250rpm摇动孵育18h-21h。
将细胞培养物以3500x g沉淀20min,并将其上清液弃去。将细胞沉淀物在300μL的20mM Tris、pH 7.5、及1g/L溶菌酶和0.5g/L硫酸多粘菌素B中通过在室温摇动2h来裂解。将样品以3500x g离心20min以澄清细胞碎片,并使用上清液来进行实施例9至实施例12中描述的转化。
实施例5
SEQ ID NO:2的KRED变体
如实施例1中所描述的产生大肠杆菌KRED变体。为了分析变体的活性,将如实施例2中所描述的产生的20μL上清液添加到180μL外消旋醇底物(50g/L)与4g/L NAD+、10g/L商业上可得的NADH氧化酶(NOx-9)和100mM FAD在pH 8.0的100mM亚磷酸钠中的混合物中。使反应物在30℃孵育16h-18h,并通过添加200μL的1M HCl来猝灭。将猝灭的混合物添加到样品中并短暂混合。反应样品通过UPLC来分析,以定量剩余底物和产物,如以上描述的。显著改进的变体在以下表5.1中提供。
/>
/>
实施例6
SEQ ID NO:112的KRED变体
如实施例1中所描述的产生大肠杆菌KRED变体。为了分析变体的活性,将如实施例3中所描述的产生的5μL上清液添加到95μL的含有0.25mM NADPH、19g/L酮底物和5g/L PDH的pH 7.9的0.3M亚磷酸盐缓冲液中。将反应物在室温孵育16-18小时,温和摇动。将反应物通过添加100μL的1M HCl来猝灭。将猝灭的混合物(10μL)稀释到190μL的水中。通过HPLC分析反应样品(10μL),以定量剩余底物和产物,如以上描述的。
显著改进的变体在以下表6.1中提供。
实施例7
SEQ ID NO:124的KRED变体
如实施例1中所描述的产生大肠杆菌KRED变体。为了分析变体的活性,将如实施例3中所描述的产生的7.5μL上清液添加到192.5μL的含有0.25mM NADPH、50g/L酮底物和5g/LPDH的pH 7.9的0.3M亚磷酸盐缓冲液中。将反应物在室温孵育16-18小时,温和摇动。将反应物通过添加100μL的1M HCl来猝灭。将猝灭的混合物(10μL)稀释到190μL的水中。通过HPLC分析反应样品(10μL),以定量剩余底物和产物,如以上描述的。显著改进的变体在以下表7.1中提供。
实施例8
SEQ ID NO:138的KRED变体
如实施例1中所描述的产生大肠杆菌KRED变体。为了分析变体的辅因子偏好,利用了四种单独测定。第一,将如实施例3中所描述的产生的10μL上清液添加到90μL的含有1g/L酮和1g/L NADPH的pH 7.9的0.2M亚磷酸盐缓冲液中。样品的NADPH消耗的初始速率通过Exλ=330nm,Emλ=445nm的荧光来分析,每21秒采集数据,持续180秒。
第二,将如实施例3中所描述的产生的20μL上清液添加到190μL的含有1g/L外消旋醇和2g/L NAD+的pH 7.9的0.2M亚磷酸盐缓冲液中。NAD+消耗的初始速率通过UV 340nm处的动力学读数来分析,每9秒采集数据,持续5分钟。
第三,将如实施例3中所描述的产生的20μL上清液添加到180μL的含有2g/L咪唑酮和16.4mM NADPH的500mM亚磷酸钠中;将样品在室温以300rpm摇动孵育2hr。通过添加200μLMeCN来猝灭反应。摇动5分钟后,将100μL猝灭的反应物转移到Millipore过滤板(45微米孔径)中,用含有100μL水的co-star圆底板收集滤液,并将混合物以4000rpm离心(spin)2分钟。通过HPLC分析反应样品(10μL),以定量剩余底物和产物,如以上描述的。
第四,将如实施例3中所描述的产生的20μL上清液添加到180μL的含有2g/L咪唑酮和16.4mM NADPH的500mM亚磷酸钠中;将样品在室温以300rpm摇动孵育2hr。通过添加200μLMeCN来猝灭反应。摇动5分钟后,将100μL猝灭的反应物转移到Millipore过滤板(45微米孔径)中,用含有100μL水的co-star圆底板收集滤液,并将混合物以4000rpm离心2分钟。通过HPLC分析反应样品(10μL),以定量剩余底物和产物,如以上描述的。辅因子特异性被计算为
(用NADPH生成的产物的量)/(用NADH生成的产物的量)
显著改进的变体在以下表8.1中提供。
实施例9
SEQ ID NO:172的PDH变体
如实施例1中所描述的产生大肠杆菌PDH变体。为了分析变体的活性,将如实施例3中所描述的产生的5μL上清液添加到95μL的含有0.25mM NADPH、50g/L酮底物和2g/L SEQID NO:138的KRED的pH 7.9的0.5M亚磷酸钠缓冲液中。将反应物在25℃孵育16-18小时,温和摇动。将反应物通过添加100μL的1M HCl来猝灭。将猝灭的混合物(10μL)稀释到190μL的水中。通过HPLC分析反应样品(10μL),以定量剩余底物和产物,如以上描述的。显著改进的变体在以下表9.1中提供。
实施例10
SEQ ID NO:208的PDH变体
如实施例1中所描述的产生大肠杆菌PDH变体。为了分析变体的辅因子偏好,将如实施例3中所描述的产生的上清液用pH 7.5的50mM Tris-HCl缓冲液稀释4倍。将20μL稀释的裂解物添加到180μL的pH 7.9的0.1M亚磷酸钠缓冲液中,并孵育过夜,以消耗掉裂解物中存在的剩余NAD+和NADP+。然后以分析变体的辅因子特异性的三种单独测定来筛选变体。第一,对于初始速率NADP+测定,添加pH 7.9的0.1M亚磷酸钠缓冲液中的0.2mM NADP+,并通过荧光测定在2分钟内测量初始速率。第二,对于初始速率NAD+测定,添加pH 7.9的0.1M亚磷酸钠缓冲液中的0.2mM NAD+,并通过荧光测定在2分钟内测量初始速率。第三,进行辅因子竞争测定。对于该测定,将含有100uM NADP、1mM NAD和1g/LNADH氧化酶NOx-9的pH 7.9的100mM亚磷酸盐添加到反应中。NOx-9立即消耗掉所有的NADH,只留下通过NADP+和NAD+之间的竞争而减少的NADPH信号。将反应通过添加100μL的1M HCl来猝灭。将猝灭的混合物(10μL)稀释到190μL的水中。通过HPLC分析稀释的反应样品(10μL),以定量剩余底物和产物,如以上描述的。显著改进的变体在以下表10.1中提供。
实施例11
SEQ ID NO:208的另外的PDH变体
如实施例1中所描述的产生大肠杆菌PDH变体。为了分析变体的辅因子偏好,将如实施例3中所描述的产生的上清液用pH 7.5的50mM Tris-HCl缓冲液稀释4倍。将20μL稀释的裂解物添加到180μL的pH 7.9的0.1M亚磷酸钠缓冲液中,并孵育过夜,以消耗掉裂解物中存在的剩余NAD+和NADP+。然后以分析变体的辅因子特异性的三种单独测定来筛选变体。第一,对于初始速率NADP+测定,添加pH 7.9的0.1M亚磷酸钠缓冲液中的0.2mM NADP+,并通过荧光测定在2分钟内测量初始速率。第二,对于初始速率NAD+测定,添加pH 7.9的0.1M亚磷酸钠缓冲液中的0.2mM NAD+,并通过荧光测定在2分钟内测量初始速率。第三,进行辅因子竞争测定。对于该测定,将3μL预孵育的裂解物添加到97μL的含有2mM NAD、0.2mM NADP、2g/L SEQ ID NO:138的KRED、4g/L SEQ ID NO:104的KRED和10g/L酮(2)的pH 7.9的200mM亚磷酸盐中。将反应通过添加100μL的1M HCl来猝灭。将猝灭的混合物(10μL)稀释到190μL的水中。稀释的反应样品(10μL)通过反相HPLC来分析,以定量剩余底物和产物的两种对映异构体,如以上描述的。显著改进的变体在以下表11.1中提供。
实施例12
工程化多肽的产生及性能验证
将包含通过对SEQ ID NO:2的KRED定向演化获得的变体并且含有演化的酮还原酶基因的质粒转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,将单菌落挑取到5mL的LB、1%葡萄糖和30μg/ml CAM中。使细胞在30℃并以250rpm摇动生长18h-20h。然后将该培养物转移到Terrific Broth(TB)、2mM ZnSO4、1mM MgSO4和30μg/ml CAM中,最终OD600为~0.02并且最终体积为250mL。将瓶(flask)在30℃并以250rpm摇动孵育3.5h后(OD600 0.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将瓶在30℃并以250rpm摇动孵育18h-21h。将细胞以3500x g沉淀20min,并将上清液弃去。将细胞沉淀物在50mL冰冷的含2mM ZnSO4和1mM MgSO4的pH 7.5的50mM磷酸钠中洗涤,在30mL相同的缓冲液中重悬浮,并使用细胞破碎仪以18kpsi-20kpsi裂解。将裂解物以10000x g澄清60min,并将澄清的上清液冻干成灰白色粉末。
将包含通过对SEQ ID NO:112和SEQ ID NO:138的KRED定向演化获得的变体并且含有演化的酮还原酶基因的质粒转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,将单菌落挑取到5mL的LB、1%葡萄糖和30μg/ml CAM中。使细胞在30℃并以250rpm摇动生长18h-20h。然后将该培养物转移到Terrific Broth(TB)和30μg/ml CAM中,最终OD600为~0.02并且最终体积为250mL。将瓶在30℃并以250rpm摇动孵育3.5h后(OD600 0.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将瓶在30℃并以250rpm摇动孵育18h-21h。将细胞以3500x g沉淀20min,并将上清液弃去。将细胞沉淀物在50mL冰冷的pH 7.5的50mM磷酸钠中洗涤,在30mL相同的缓冲液中重悬浮,并使用细胞破碎仪以18kpsi-20kpsi裂解。将裂解物以10000x g澄清60min,并将澄清的上清液冻干成灰白色粉末。
将包含通过对SEQ ID NO:172和SEQ ID NO:208的PDH定向演化获得的变体并且含有演化的亚磷酸脱氢酶基因的质粒转化到大肠杆菌W3110中,并放置于含有1%葡萄糖和30μg/ml氯霉素(CAM)的Luria-Bertani(LB)琼脂培养基上。在30℃孵育至少16h后,将单菌落挑取到5mL的LB、1%葡萄糖和30μg/ml CAM中。使细胞在30℃并以250rpm摇动生长18h-20h。然后将该培养物转移到Terrific Broth(TB)和30μg/ml CAM中,最终OD600为~0.02并且最终体积为250mL。将瓶在30℃并以250rpm摇动孵育3.5h后(OD600 0.6-0.8),通过1mM的终浓度的异丙基硫代糖苷(IPTG)诱导重组基因表达。然后将瓶在30℃并以250rpm摇动孵育18h-21h。将细胞以3500x g沉淀20min,并将上清液弃去。将细胞沉淀物在50mL冰冷的pH 7.5的50mM磷酸钠中洗涤,在30mL相同的缓冲液中重悬浮,并使用细胞破碎仪以18kpsi-20kpsi裂解。将裂解物以10000x g澄清60min,并将澄清的上清液冻干成灰白色粉末。
为了在类似方法的条件下评估最终化合物,将在pH 7.9的500mM亚磷酸钠缓冲液、0.1g/L NAD、0.1g/L NADP、2.5g/L SEQ ID NO:104的KRED、10g/L商业上可得的NADH氧化酶NOx-9、2.5g/L SEQ ID NO:154的KRED、10g/L SEQ ID NO:250的PDH中的50g/L外消旋醇底物,在氧气流和1%v/v防沫剂下,在室温搅拌24小时,产生93%的底物转化率和99.5%的(R)-醇1a对映异构体过量。通过反相HPLC分析反应样品,以定量剩余底物和产物,如以上描述的。
虽然已经说明并描述了多种具体实施方案,但是应当理解,可以进行各种改变,而不偏离本发明的精神和范围。
为了所有目的,本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独指出为了所有目的通过引用并入一样。
本发明还提供以下项目:
1.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:2、112、124和/或138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
2.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:2具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:37、37/211、37/211/229、37/229、45、52、52/57/110/272/296、52/57/272、52/57/272/274/279/296、52/57/272/279/296、55/57/276、56、57、57/104/114、57/104/114/229、57/286、79/83/275/276、83、83/275/276、83/276、104、110、114、138/146/258/289、211、211/229、228、229、263、268、272、274、275/276、276、279和309,其中所述位置根据SEQ ID NO:2来编号。
3.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:112具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且具有选自以下的至少一个取代或取代集:24/106/136/220/258/260/314/315、24/106/214/250/258/260/314/315、24/220/314/315、122/159/316/318、135、139/207、159/251/272/277/316/318/330和207,其中所述位置根据SEQ ID NO:112来编号。
4.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:124具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下的位置处具有至少一个取代集:2/101/179/182/228/238/282、3/95、3/95/228/314、24/95/228、95、95/135/139/207和159/228/309/330,其中所述位置根据SEQ IDNO:124来编号。
5.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下的位置处具有至少一个取代或取代集:19、24/43/47/49/67/68/70/91/220、24/68/91/218/220、67、72、74/75/78/108、75/78/99/108/215/224、78/107、95、96和114,其中所述位置根据SEQ ID NO:138来编号。
6.如项目1-5中任一项所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与SEQ ID NO:2、112、124和/或138具有至少90%序列同一性的序列的多肽序列。
7.如项目1-6中任一项所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与SEQ ID NO:2、112、124和/或138具有至少95%序列同一性的序列的多肽序列。
8.如项目1-7中任一项所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含SEQ ID NO:2、112、124或138中列出的多肽序列。
9.如项目1-8中任一项所述的工程化酮还原酶变体,其中所述工程化酮还原酶包含编码表5.1、表6.1、表7.1和/或表8.1中提供的变体的多肽序列。
10.如项目1-9中任一项所述的工程化酮还原酶变体,其中所述工程化酮还原酶包含选自SEQ ID NO:4至SEQ ID NO:170中列出的偶数编号的序列的多肽序列。
11.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码如项目1-10中任一项所述的工程化酮还原酶变体。
12.如项目11所述的工程化多核苷酸序列,其中所述序列包含与选自SEQ ID NO:3至SEQ ID NO:169中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。
13.一种载体,所述载体包含如项目11和/或12所述的工程化多核苷酸序列。
14.如项目13所述的载体,所述载体还包含至少一种控制序列。
15.一种宿主细胞,所述宿主细胞包含如项目13和/或14所述的载体。
16.一种用于产生如项目1-10中任一项所述的工程化酮还原酶变体的方法,所述方法包括在项目15的所述宿主细胞藉以产生所述工程化酮还原酶变体的条件下培养所述宿主细胞。
17.如项目16所述的方法,所述方法还包括回收由所述宿主细胞产生的所述工程化酮还原酶变体的步骤。
18.一种组合物,所述组合物包含至少一种如项目1-17的任一项中提供的工程化酮还原酶变体。
19.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:172和/或SEQ ID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
20.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:172具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:10/73/78/137/323/325、10/73/78/233/323、10/73/137、13/41/63/132/193/195、18/44/119/124/132/137/145/158/175/177/293/317/323、18/44/119/124/132/137/145/158/177/293/323、18/44/119/124/132/137/145/293/323/334/336、32/44/132/137/145/186/233/293/323/336、41/44/88/193/195、44/69/120/132/137/145/175/195/293/323、44/113/132/145、44/119/132/137/145/158/175/177/293/317/323、44/132/135/136/137/145/293、44/132/136/137/145/293、44/132/137/145/233/308/323、44/132/137/145/293/323、44/132/145、44/132/145/195/293/323、137/233/303/323和266,其中所述位置根据SEQ IDNO:172来编号。
21.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:32/59/124/177/191/327、78/150/198/327/328、83/266、95/211/213/322、104、178/194/211/213/322、206、211/213/322、215、262、266和323,其中所述位置根据SEQ ID NO:208来编号。
22.如项目19-21中任一项所述的工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体包含含有与SEQ ID NO:172和/或SEQ ID NO:208具有至少90%序列同一性的序列的多肽序列。
23.如项目19-22中任一项所述的工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体包含含有与SEQ ID NO:172和/或SEQ ID NO:208具有至少95%序列同一性的序列的多肽序列。
24.如项目19-23中任一项所述的工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体包含SEQ ID NO:172或SEQ ID NO:208中列出的多肽序列。
25.如项目19-24中任一项所述的工程化亚磷酸脱氢酶变体,其中所述工程化亚磷酸脱氢酶变体包含编码表9.1、表10.1和/或表11.1中提供的变体的多肽序列。
26.如项目19-25中任一项所述的工程化亚磷酸脱氢酶变体,其中所述工程化亚磷酸脱氢酶变体包含选自SEQ ID NO:172至SEQ ID NO:260中列出的偶数编号的序列的多肽序列。
27.一种组合物,所述组合物包含至少一种如项目18-26中列出的亚磷酸脱氢酶变体。
28.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码如项目19-26中任一项所述的工程化亚磷酸脱氢酶变体。
29.如项目28所述的工程化多核苷酸序列,其中所述序列包含与选自SEQ ID NO:171至SEQ ID NO:259中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。
30.一种载体,所述载体包含如项目28和/或29所述的工程化多核苷酸序列。
31.如项目30所述的载体,所述载体还包含至少一种控制序列。
32.一种宿主细胞,所述宿主细胞包含如项目30和/或31所述的载体。
33.一种用于产生如项目19-25中任一项所述的工程化亚磷酸脱氢酶变体的方法,所述方法包括在项目32的所述宿主细胞藉以产生所述工程化亚磷酸脱氢酶变体的条件下培养所述宿主细胞。
34.如项目33所述的方法,所述方法还包括回收由所述宿主细胞产生的所述工程化亚磷酸脱氢酶变体的步骤。
35.一种用于使手性醇去外消旋化的方法,所述方法在使得所述手性醇去外消旋化的条件下,包括至少一种根据项目1-17中任一项的工程化酮还原酶变体,包括至少一种根据项目19-25中任一项的工程化亚磷酸脱氢酶变体、至少一种手性醇和至少一种辅因子。
36.如项目35所述的方法,其中所述方法以一锅反应来进行。
Claims (21)
1.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:2具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
2.根据权利要求1所述的工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ IDNO:2具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:37、37/211、37/211/229、37/229、45、52、52/57/110/272/296、52/57/272、52/57/272/274/279/296、52/57/272/279/296、55/57/276、56、57、57/104/114、57/104/114/229、57/286、79/83/275/276、83、83/275/276、83/276、104、110、114、138/146/258/289、211、211/229、228、229、263、268、272、274、275/276、276、279和309,其中所述位置根据SEQ ID NO:2来编号。
3.根据权利要求1所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与SEQ ID NO:2具有至少90%序列同一性的序列的多肽序列。
4.根据权利要求1所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含含有与SEQ ID NO:2具有至少95%序列同一性的序列的多肽序列。
5.根据权利要求1所述的工程化酮还原酶变体,所述工程化酮还原酶变体包含SEQ IDNO:2中列出的多肽序列。
6.根据权利要求1所述的工程化酮还原酶变体,其中所述工程化酮还原酶变体包含编码表5.1中提供的变体的多肽序列。
7.根据权利要求1所述的工程化酮还原酶变体,其中所述工程化酮还原酶变体包含选自SEQ ID NO:4至SEQ ID NO:110中列出的偶数编号的序列的多肽序列。
8.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码权利要求1所述的工程化酮还原酶变体。
9.根据权利要求8所述的工程化多核苷酸序列,其中所述工程化多核苷酸序列包含与选自SEQ ID NO:3至SEQ ID NO:109中列出的奇数编号的序列的序列至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多核苷酸序列。
10.一种载体,所述载体包含权利要求8所述的工程化多核苷酸序列。
11.根据权利要求10所述的载体,所述载体还包含至少一种控制序列。
12.一种宿主细胞,所述宿主细胞包含权利要求10所述的载体。
13.一种用于产生权利要求1所述的工程化酮还原酶变体的方法,所述方法包括在宿主细胞藉以产生所述工程化酮还原酶变体的条件下培养所述宿主细胞。
14.根据权利要求13所述的方法,所述方法还包括回收由所述宿主细胞产生的所述工程化酮还原酶变体的步骤。
15.一种组合物,所述组合物包含至少一种权利要求1中提供的工程化酮还原酶变体。
16.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:112和/或138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
17.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:112具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且具有选自以下的至少一个取代或取代集:24/106/136/220/258/260/314/315、24/106/214/250/258/260/314/315、24/220/314/315、122/159/316/318、135、139/207、159/251/272/277/316/318/330和207,其中所述位置根据SEQ ID NO:112来编号。
18.一种工程化酮还原酶变体,所述工程化酮还原酶变体与SEQ ID NO:138具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下的位置处具有至少一个取代或取代集:19、24/43/47/49/67/68/70/91/220、24/68/91/218/220、67、72、74/75/78/108、75/78/99/108/215/224、78/107、95、96和114,其中所述位置根据SEQ ID NO:138来编号。
19.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:172和/或SEQ ID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
20.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:172具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:10/73/78/137/323/325、10/73/78/233/323、10/73/137、13/41/63/132/193/195、18/44/119/124/132/137/145/158/175/177/293/317/323、18/44/119/124/132/137/145/158/177/293/323、18/44/119/124/132/137/145/293/323/334/336、32/44/132/137/145/186/233/293/323/336、41/44/88/193/195、44/69/120/132/137/145/175/195/293/323、44/113/132/145、44/119/132/137/145/158/175/177/293/317/323、44/132/135/136/137/145/293、44/132/136/137/145/293、44/132/137/145/233/308/323、44/132/137/145/293/323、44/132/145、44/132/145/195/293/323、137/233/303/323和266,其中所述位置根据SEQ ID NO:172来编号。
21.一种工程化亚磷酸脱氢酶变体,所述工程化亚磷酸脱氢酶变体与SEQ ID NO:208具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且在选自以下位置中的一个或更多个位置处具有至少一个取代或取代集:32/59/124/177/191/327、78/150/198/327/328、83/266、95/211/213/322、104、178/194/211/213/322、206、211/213/322、215、262、266和323,其中所述位置根据SEQ ID NO:208来编号。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762491161P | 2017-04-27 | 2017-04-27 | |
US62/491,161 | 2017-04-27 | ||
CN201880043854.4A CN110831618B (zh) | 2017-04-27 | 2018-04-13 | 酮还原酶多肽及多核苷酸 |
PCT/US2018/027450 WO2018200214A2 (en) | 2017-04-27 | 2018-04-13 | Ketoreductase polypeptides and polynucleotides |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880043854.4A Division CN110831618B (zh) | 2017-04-27 | 2018-04-13 | 酮还原酶多肽及多核苷酸 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117511890A true CN117511890A (zh) | 2024-02-06 |
Family
ID=63920465
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880043854.4A Active CN110831618B (zh) | 2017-04-27 | 2018-04-13 | 酮还原酶多肽及多核苷酸 |
CN202311135556.7A Pending CN117511890A (zh) | 2017-04-27 | 2018-04-13 | 酮还原酶多肽及多核苷酸 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880043854.4A Active CN110831618B (zh) | 2017-04-27 | 2018-04-13 | 酮还原酶多肽及多核苷酸 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11021729B2 (zh) |
EP (1) | EP3615058A4 (zh) |
JP (1) | JP7045725B2 (zh) |
CN (2) | CN110831618B (zh) |
CA (1) | CA3061133A1 (zh) |
SG (1) | SG11201909712TA (zh) |
WO (1) | WO2018200214A2 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111718913B (zh) * | 2019-03-20 | 2023-06-20 | 尚科生物医药(上海)有限公司 | 一种酮还原酶多肽及其催化制备(s)-1-(2-碘-5-氟苯基)乙醇的方法 |
WO2020248186A1 (zh) * | 2019-06-13 | 2020-12-17 | 凯莱英医药集团(天津)股份有限公司 | 酮还原酶突变体及生产手性醇的方法 |
CN111394324B (zh) * | 2020-06-08 | 2020-09-08 | 凯莱英生命科学技术(天津)有限公司 | 酮还原酶突变体及其应用 |
CN112941043B (zh) * | 2021-05-17 | 2021-09-10 | 中国科学院天津工业生物技术研究所 | 羰基还原酶突变体及在制备手性β’-羟基-β-氨基酸酯中的应用 |
CN115851635A (zh) * | 2021-08-10 | 2023-03-28 | 深圳瑞德林生物技术有限公司 | 一种s-尼古丁的制备方法 |
WO2024010785A1 (en) * | 2022-07-08 | 2024-01-11 | Merck Sharp & Dohme Llc | Ketoreductase enzymes for the synthesis of 1,3-diol substituted indanes |
CN117887679A (zh) * | 2024-03-14 | 2024-04-16 | 山东金城生物药业有限公司 | 羰基还原酶突变体及其在制备(s)-玻色因中的应用 |
Family Cites Families (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3155107B2 (ja) | 1993-01-12 | 2001-04-09 | ダイセル化学工業株式会社 | 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法 |
JP3574682B2 (ja) | 1993-09-24 | 2004-10-06 | ダイセル化学工業株式会社 | 新規な酵素、該酵素を製造する方法、該酵素をコードするdna、該dnaを含む形質転換体、該酵素による光学活性アルコール等の製造方法 |
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5928905A (en) | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6309883B1 (en) | 1994-02-17 | 2001-10-30 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6995017B1 (en) | 1994-02-17 | 2006-02-07 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6165793A (en) | 1996-03-25 | 2000-12-26 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6406855B1 (en) | 1994-02-17 | 2002-06-18 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
KR970703426A (ko) | 1994-06-03 | 1997-07-03 | 제임스 쉐한 | 정제된 Myceliophthora 락카제 및 그것을 암호화 하는 핵산(PURIFIED MYCELIOPHTHORA LACCASES AND NUCLEIC ACIDS ENCODING SAME) |
AU2705895A (en) | 1994-06-30 | 1996-01-25 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
JPH08336393A (ja) | 1995-04-13 | 1996-12-24 | Mitsubishi Chem Corp | 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法 |
FI104465B (fi) | 1995-06-14 | 2000-02-15 | Valio Oy | Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6506602B1 (en) | 1996-03-25 | 2003-01-14 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5891685A (en) | 1996-06-03 | 1999-04-06 | Mitsubishi Chemical Corporation | Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
AU6029998A (en) | 1997-01-17 | 1998-08-07 | Regents Of The University Of Minnesota | Dna molecules and protein displaying improved triazine compound degrading ability |
DE69835360T2 (de) | 1997-01-17 | 2007-08-16 | Maxygen, Inc., Redwood City | EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION |
US7148054B2 (en) | 1997-01-17 | 2006-12-12 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
DK2270234T3 (da) | 1997-12-08 | 2013-06-03 | California Inst Of Techn | Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser |
CA2326835A1 (en) | 1998-04-02 | 1999-10-14 | Tellus Genetic Resources, Inc. | A method for obtaining a plant with a genetic lesion in a gene sequence |
KR20010082543A (ko) | 1998-05-01 | 2001-08-30 | 추후제출 | Dna 재편성을 이용한 내병충성 유전자의 최적화 방법 |
US6337186B1 (en) | 1998-06-17 | 2002-01-08 | Maxygen, Inc. | Method for producing polynucleotides with desired properties |
US6365408B1 (en) | 1998-06-19 | 2002-04-02 | Maxygen, Inc. | Methods of evolving a polynucleotides by mutagenesis and recombination |
US6605430B1 (en) | 1998-08-12 | 2003-08-12 | Maxygen, Inc. | DNA shuffling of monooxygenase genes for production of industrial chemicals |
JP2002526107A (ja) | 1998-10-07 | 2002-08-20 | マキシジェン, インコーポレイテッド | マイコトキシンの解毒のための核酸を生成するためのdnaシャッフリング |
WO2000028018A1 (en) | 1998-11-10 | 2000-05-18 | Maxygen, Inc. | Modified adp-glucose pyrophosphorylase for improvement and optimization of plant phenotypes |
DE19857302C2 (de) | 1998-12-14 | 2000-10-26 | Forschungszentrum Juelich Gmbh | Verfahren zur enantioselektiven Reduktion von 3,5-Dioxocarbonsäuren, deren Salze und Ester |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
IL138002A0 (en) | 1999-01-19 | 2001-10-31 | Maxygen Inc | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US7873477B1 (en) | 2001-08-21 | 2011-01-18 | Codexis Mayflower Holdings, Llc | Method and system using systematically varied data libraries |
US7702464B1 (en) | 2001-08-21 | 2010-04-20 | Maxygen, Inc. | Method and apparatus for codon determining |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US8457903B1 (en) | 1999-01-19 | 2013-06-04 | Codexis Mayflower Holdings, Llc | Method and/or apparatus for determining codons |
US7384387B1 (en) | 1999-02-11 | 2008-06-10 | Maxygen, Inc. | High throughput mass spectrometry |
WO2000052155A2 (en) | 1999-03-05 | 2000-09-08 | Maxygen, Inc. | Recombination of insertion modified nucleic acids |
US6703240B1 (en) | 1999-04-13 | 2004-03-09 | Maxygar, Inc. | Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6519065B1 (en) | 1999-11-05 | 2003-02-11 | Jds Fitel Inc. | Chromatic dispersion compensation device |
US6686515B1 (en) | 1999-11-23 | 2004-02-03 | Maxygen, Inc. | Homologous recombination in plants |
US6645746B1 (en) | 1999-12-03 | 2003-11-11 | Kaneka Corporation | Carbonyl reductase, gene thereof and method of using the same |
US20010039014A1 (en) | 2000-01-11 | 2001-11-08 | Maxygen, Inc. | Integrated systems and methods for diversity generation and screening |
US6818752B2 (en) * | 2000-01-31 | 2004-11-16 | Biocatalytics, Inc. | Synthetic genes for enhanced expression |
WO2001075767A2 (en) | 2000-03-30 | 2001-10-11 | Maxygen, Inc. | In silico cross-over site selection |
AU4981101A (en) | 2000-04-03 | 2001-10-15 | Maxygen Inc | Subtilisin variants |
BR0208265A (pt) | 2001-03-22 | 2004-03-02 | Bristol Myers Squibb Co | Redução estereosseletiva de acetofenona substituìda |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
DK2278509T3 (en) | 2002-03-01 | 2014-12-15 | Codexis Mayflower Holdings Llc | Methods, systems and software for identification of functional biomolecules |
US7620500B2 (en) | 2002-03-09 | 2009-11-17 | Maxygen, Inc. | Optimization of crossover points for directed evolution |
US7109004B2 (en) | 2002-07-10 | 2006-09-19 | Merck & Co., Inc. | Process for reducing an alpha-keto ester |
CA2529063A1 (en) * | 2003-06-11 | 2004-12-16 | Biotechnology Research And Development Corporation | Phosphite dehydrogenase mutants for nicotinamide cofactor regeneration |
CA2533838A1 (en) | 2003-08-11 | 2005-02-24 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
JP4394647B2 (ja) | 2003-12-02 | 2010-01-06 | メルシャン株式会社 | 光学活性テトラヒドロチオフェン誘導体の製造方法、および、光学活性テトラヒドロチオフェン−3−オールの晶析方法 |
WO2006074194A2 (en) * | 2005-01-05 | 2006-07-13 | Biotechnology Research And Development Corporation | Engineered phosphite dehydrogenase mutants for nicotinamide cofactor regeneration |
EP1854893A4 (en) | 2005-02-25 | 2008-06-18 | Kaneka Corp | PROCESS FOR PRODUCING OPTICALLY ACTIVE SECONDARY ALCOHOL |
EP2478760A1 (en) * | 2005-05-10 | 2012-07-25 | Monsanto Technology LLC | Genes and uses for plant improvement |
WO2006130657A2 (en) | 2005-05-31 | 2006-12-07 | Bristol-Myers Squibb Company | Stereoselective reduction process for the preparation of pyrrolotriazine compounds |
US20090203096A1 (en) * | 2006-06-05 | 2009-08-13 | Daicel Chemical Industries, Ltd. | Process for Production of Optically Active Alcohol |
WO2008042876A2 (en) | 2006-10-02 | 2008-04-10 | Codexis, Inc. | Compositions and methods for producing stereoisomerically pure statins and synthetic intermediates therefor |
MX2009008547A (es) * | 2007-02-08 | 2010-01-15 | Synta Pharmaceuticals Corp | Compuestos de triazol que son utiles en el tratamiento de trastornos proliferativos tales como cancer. |
WO2008131215A2 (en) * | 2007-04-19 | 2008-10-30 | Biotechnology Research And Development Corporation | Engineered phosphite dehydrogenase mutants |
WO2009036404A2 (en) * | 2007-09-13 | 2009-03-19 | Codexis, Inc. | Ketoreductase polypeptides for the reduction of acetophenones |
CN101883846A (zh) | 2007-10-01 | 2010-11-10 | 科德克希思公司 | 用于生成氮杂环丁酮的还原酶多肽 |
HUE034642T2 (en) | 2008-02-12 | 2018-02-28 | Codexis Inc | A method for selecting an optimized diverse population of variants |
WO2009102901A1 (en) | 2008-02-12 | 2009-08-20 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
AT506639A1 (de) | 2008-04-01 | 2009-10-15 | Kroutil Wolfgang Dipl Ing Dr T | Verfahren zur deracemisierung von enantiomerengemischen unter verwendung von enzymsystemen |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
CA2726850C (en) | 2008-06-13 | 2015-06-02 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
JP2013046572A (ja) | 2009-12-08 | 2013-03-07 | Kaneka Corp | 光学活性2−ヒドロキシシクロアルカンカルボン酸エステルの製造方法 |
DK2726651T3 (en) | 2011-06-28 | 2019-01-28 | Codexis Inc | PROTEIN INVARIANT GENERATION BY REGION SHUFFLING |
SI2882723T1 (sl) | 2012-08-07 | 2017-04-26 | Basilea Pharmaceutica Ag | Postopek izdelave izavukonazola ali ravukonazola |
US20160207696A9 (en) * | 2013-02-25 | 2016-07-21 | Liberatore A. Trombetta | Single serve capsule for improved extraction efficiency and favor retention |
US10253340B2 (en) | 2013-03-27 | 2019-04-09 | Annikki Gmbh | Method for the isomerisation of glucose |
CN105765592B (zh) | 2013-09-27 | 2019-12-17 | 科德克希思公司 | 用于酶变体的自动筛选的方法、装置和系统 |
CN103789368B (zh) * | 2014-01-23 | 2016-03-02 | 上海工业生物技术研发中心 | 一种n-保护哌啶醇的生产方法 |
CN105420306A (zh) * | 2015-12-17 | 2016-03-23 | 黄燕鸽 | 一种艾沙康唑中间体的合成方法 |
-
2018
- 2018-04-13 WO PCT/US2018/027450 patent/WO2018200214A2/en unknown
- 2018-04-13 EP EP18789850.7A patent/EP3615058A4/en active Pending
- 2018-04-13 SG SG11201909712T patent/SG11201909712TA/en unknown
- 2018-04-13 CN CN201880043854.4A patent/CN110831618B/zh active Active
- 2018-04-13 CN CN202311135556.7A patent/CN117511890A/zh active Pending
- 2018-04-13 JP JP2019558370A patent/JP7045725B2/ja active Active
- 2018-04-13 US US16/605,576 patent/US11021729B2/en active Active
- 2018-04-13 CA CA3061133A patent/CA3061133A1/en active Pending
-
2021
- 2021-04-26 US US17/239,953 patent/US11746369B2/en active Active
-
2023
- 2023-07-14 US US18/352,899 patent/US20240068005A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2020517284A (ja) | 2020-06-18 |
CA3061133A1 (en) | 2018-11-01 |
EP3615058A4 (en) | 2021-06-02 |
US20210254119A1 (en) | 2021-08-19 |
WO2018200214A2 (en) | 2018-11-01 |
US20200123585A1 (en) | 2020-04-23 |
WO2018200214A3 (en) | 2019-11-28 |
US11021729B2 (en) | 2021-06-01 |
EP3615058A2 (en) | 2020-03-04 |
CN110831618A (zh) | 2020-02-21 |
US11746369B2 (en) | 2023-09-05 |
SG11201909712TA (en) | 2019-11-28 |
US20240068005A1 (en) | 2024-02-29 |
CN110831618B (zh) | 2023-08-25 |
JP7045725B2 (ja) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11479756B2 (en) | Ketoreductase polypeptides for the reduction of acetophenones | |
US10329540B2 (en) | Ketoreductase polypeptides for the production of azetidinone | |
US11746369B2 (en) | Ketoreductase polypeptides and polynucleotides | |
EP2329014B1 (en) | Ketoreductase polypeptides for the stereoselective production of (4s)-3[(5s)-5(4-fluorophenyl)-5-hydroxypentanoyl]-4-phenyl-1,3-oxazolidin-2-one | |
US11236308B2 (en) | Ketoreductase polypeptides for the synthesis of chiral compounds | |
US20220213518A1 (en) | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds | |
US20230287360A1 (en) | Ketoreductase polypeptides and polynucleotides | |
EP4133065A1 (en) | Carboxyesterase polypeptides for kinetic resolution | |
US20220145268A1 (en) | Engineered glucose dehydrogenases and methods for the reductive amination of ketone and amine compounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |