CN101809158B

CN101809158B - 中间体的对映选择性酶还原的方法

Info

Publication number: CN101809158B
Application number: CN200880108175.7A
Authority: CN
Inventors: A·古普塔; M·博布科瓦; A·申茨彻尔
Original assignee: IEP GmbH
Current assignee: Cambrex IEP GmbH
Priority date: 2007-09-27
Filing date: 2008-09-22
Publication date: 2015-04-08
Anticipated expiration: 2028-09-22
Also published as: CA2697038C; EP2201122B1; ZA201001052B; CA2697038A1; RU2010116394A; AU2008303842B2; TWI601825B; CN101809158A; JP2010539910A; HUE035577T2; US20100248317A1; KR101474815B1; PT2201122T; WO2009040080A1; ES2647069T3; US8932835B2; TW200920846A; EP2201122A1; KR20100065344A; PL2201122T3

Abstract

对映选择性酶还原通式I酮化合物的方法，

Description

中间体的对映选择性酶还原的方法

本发明涉及在辅因子的存在下应用氧化还原酶将通式I酮化合物分别对映选择性(enantioselective)酶还原为式II(R，S-醇)和III(S，S-醇)化合物的方法，

其中，R可以表示氨基官能的任何保护基团(叔丁氧羰基、苄氧羰基、9-芴甲氧羰基)且X＝-Cl、-CN、-OH、Br、F，

优选的式I化合物含有丁氧羰基或苄氧羰基作为氨基保护基团并且在X的位置是氯原子。

通式II和III的手性醇是用于治疗HIV的蛋白酶抑制剂的生产中重要的中间体。此类蛋白酶抑制剂例如是：利托那韦(Ritonavir)、安泼那韦(Amprenavir)、福沙那韦(Fosamprenavir)、Atazanavir或Darunavir。

例如可通过式I相应酮化合物的对映选择性还原分别获得式 II(R，S-醇)和III(S，S-醇)中间体，其中所述的对映选择性还原在当前的生产方法中通过化学方法进行。在做这些时，化学催化还原具有这样的缺陷：一方面，其可能由于恶劣的反应条件而产生副产品，另一方面，分别产生不符合要求的对映体和非对映体过量，并且只有费很大的努力才能在技术上可行。因此，对映体富集形式的式II(R，S-醇)中间体比式III(S，S-醇)更难以化学获得。

由于这一原因，在相当一些时间，已努力开发允许所述中间体对映选择性还原的生物催化方法。生物催化方法通常在温和的条件下操作，由于这一原因，可预期它们能够还原式I的酮化合物而不会形成其它的副产品。然而，到目前为止，还没有可能发现可利用来用分离的酶进行酶还原的合适生物催化剂。

据我们所知，仅存在很少的这样的出版物，即在所述出版物中描述了在全细胞方法中应用红球菌属(Rhodococcus)或链霉菌属(Streptomyces)菌株的式I酮的反应(Tetrahedron Asymmetry 14(2003)3105-3109，Tetrahedron Asymmetry 8(1997)p.2547)。然而，该反应因此分别只能用野生型菌株全细胞和溶胞产物才发生，并且因此已只在远低于2％的非常低的浓度下进行，并且没有辅酶的再生。目前为止，还没有可在工业规模上可应用的酶还原方法，并且参与该反应的酶也还既未被分离也未被鉴定。

本发明的目的是提供能以高产量经济地分别产生对映体纯的对映体富集的通式II和III中间体，并且具有高对映体纯度而无任何副产品的方法。

根据本发明，通过最初提到的方法类型完成所述目的，其特征在于用于生产式II化合物(R，S-醇)的氧化还原酶：

a)包含根据SEQ ID NO：1、SEQ ID No 2、SEQ ID No 3或SEQ IDNo 4的氨基酸序列，

b)包含这样的氨基酸序列，其中至少60％的所述氨基酸与氨基酸序列SEQ ID NO：1、SEQ ID No 2或SEQ ID No 3、SEQ ID No 4的那些相同，或

c)包含这样的氨基酸序列，其中至少70％的所述氨基酸与氨基酸序列SEQ ID NO：1、SEQ ID No 2或SEQ ID No3、SEQ ID No 4的那些相同，或

d)由核酸序列SEQ ID NO：16、SEQ ID No 17、SEQ ID No 18、SEQ ID No 19编码，或

e)由在严格条件下与SEQ ID NO：16、SEQ ID No 17、SEQ ID No18、SEQ ID No 19杂交的核酸序列编码，

f)具有220至260个氨基酸的长度，并且包含一个或若干个选自序列SEQ ID NO：31至SEQ ID NO：51的部分序列，并且优先将式I化合物还原为式II化合物。

nalvtgasrgig(31)nalvtggsrgig(32)，gysvt(33)，gynvt(34)，gygitl(35)，gygvt(51)vlaklp(36)，vkaklp(37)

fkgaplpa(38)，frgaplpa(39)，lkgaplpa(40)，

spialtk(41)，spvaltk(42)，sqialtq(43)，

avysask(44)，avysatk(45)，gvysatk(46)，

pikgwi(47)，piegwi(48)，piggwi(49)and pisgwi(50)，

此外，通过最初提到的方法类型完成所述目的，其特征在于用于生产式III化合物(S，S-醇)的氧化还原酶：

a)包含根据SEQ ID NO：5、SEQ ID No 6、SEQ ID No 7、SEQ IDNo 8、SEQ ID No 9、SEQ ID No 10、SEQ ID No 11、SEQ ID No 12、SEQ ID No 13、SEQ ID No 14、SEQ ID No 15的氨基酸序列；

b)包含这样的氨基酸序列，其中至少60％的所述氨基酸与根据SEQ ID NO：5、SEQ ID No 6、SEQ ID No 7、SEQ ID No 8、SEQ ID No9、SEQ ID No 10、SEQ ID No 11、SEQ ID No 12、SEQ ID No 13、SEQID No 14、SEQ ID No 15的氨基酸序列的那些相同，或

c)由核酸序列SEQ ID NO：20、SEQ ID No 21、SEQ ID No 22、SEQID No 23、SEQ ID No 24、SEQ ID No 25、SEQ ID No 26、SEQ ID No27、SEQ ID No 28、SEQ ID No 29或SEQ ID No 30编码，或

d)由在严格条件下与SEQ ID NO：20、SEQ ID No 21、SEQ ID No22、SEQ ID No 23、SEQ ID No 24、SEQ ID No 25、SEQ ID No 26、SEQ ID No 27、SEQ ID No 28、SEQ ID No 29或SEQ ID No 30杂交的核酸序列编码，

e)具有220至260个氨基酸的长度，并且包含一个或若干个选自序列SEQ ID NO：31至SEQ ID NO：66的部分序列，并且优先将式I化合物还原为式III化合物。

nalvtgasrgig(31)nalvtggsrgig(32)，gysvt(33)，gynvt(34)，gygitl(35)，gygvt(51)

vlaklp(36)，vkaklp(37)

fkgaplpa(38)，frgaplpa(39)，lkgaplpa(40)，fkaaplpa(52)，fkgsplpa(53)

spialtk(41)，spvaltk(42)，sqialtq(43)，

avysask(44)，avysatk(45)，gvysatk(46)，

pikgwi(47)，piegwi(48)，piggwi(49)and pisgwi(50)，

gigrat(54)，gigrasa(55)，gigret(56)，

nnagig(57)，nnagieg(58)，

irvvaiapg(59)，irvnaiapg(60)，irvnaicpg(61)，irvvgiapg(62)，

peqiagav(63)，peaianav(64)，peevanav(65)，peaianav(66)。

将式I化合物优先还原为式II化合物的多肽应被理解为这样的多肽，即其中在最佳的反应条件下可达到的R，S-醇的最大对映体过量总计至少50％。最佳反应条件由此被理解为这样的多肽反应条件，即在该条件下，多肽产生R，S-醇的最大对映体过量。

已发现包含氨基酸序列SEQ ID NO：1、SEQ ID No 2、SEQ ID NO：3和SEQ ID No 4的多肽显示出氧化还原活性，并且可用于将式I化合物优先还原为式II化合物(R，S-化合物)。可达到的R，S-的醇的对映体过量总计＞50％，优选＞80％，并且尤其优选＞95％。当应用SEQ ID NO：1时，达到的对映体过量例如可达到最高＞99％的R，S-化合物(式II)。

类似地，已发现包含氨基酸序列SEQ ID NO：5至SEQ ID No 15的多肽显示出氧化还原活性，并且可用于将式I化合物优先还原为式III化合物(S，S-化合物)。可达到的R，S-醇的对映体过量总计＞80％，优选＞90％，并且尤其优选＞95％。当应用SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：9或SEQ ID NO：12时，达到的对映体过量可达到最高＞99％的R，S-化合物(式II)。

许多所提到的氧化还原酶诸如例如SEQID No 1、3、4、5、6、7和15还具有其它的优点，即它们能够通过还原仲醇再生在还原过程中形成的氧化的辅因子。因此，所述氧化还原酶特别的经济优点还在于，与现有技术方法相反，不需要其它的酶用于辅因子再生。

编码包含SEQ ID NO：5的多肽的DNA序列SEQ ID NO：20例如可从生物Rubrobacter xylanophilus DSM 9941的基因组获得。

编码包含SEQ ID NO：6的多肽的DNA序列SEQ ID NO：21例如可从生物Geobacillus thermodenitrificans DSM 465的基因组获得。

编码包含SEQ ID NO：7的多肽的DNA序列SEQ ID NO：22例如可从生物橙色绿屈挠菌(Chloroflexus aurantiacus)DSM 635的基因组获得。

分别编码包含SEQ ID NO：8或SEQ ID NO：9的多肽的DNA序列SEQ ID NO：23或DNA序列SEQ ID NO：24例如可从生物木兰假丝酵母(Candida magnoliae)DSMZ 70638获得。

编码包含SEQ ID NO：11的多肽的DNA序列SEQ ID NO：26例如可从生物木兰假丝酵母(Candida magnoliae)DSMZ 70639获得。

编码包含SEQ ID NO：1的多肽的DNA序列SEQ ID NO：16例如可从生物木兰假丝酵母(Candida magnoliae)CBS 6396获得。

此外，SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：12、SEQ ID NO：13、SEQ ID NO：14和SEQ ID NO：15的氧化还原酶例如可从菌株木兰假丝酵母(Candida magnoliae)CBS 5659、CBS 7318、CBS2798、JCM 9448，Candida geochares MUCL 29832，假丝酵母属物种MUCL 40660，Candida gropengiesseri MUCL 29836通过同源筛选获得。

因此，本发明涉及将式I的酮化合物分别还原为通式II和III的化合物的方法，其特征在于明显过量地形成式II或III化合物之一，其应用包含氨基酸序列SEQ ID NO：1至SEQ ID NO：15之一的多肽，或包含与氨基酸序列SEQ ID NO：1至SEQ ID NO：15之一至少50％相同的氨基酸序列的多肽，即可通过替换、插入、缺失或添加至少一个氨基酸来源于序列SEQ ID NO：1至SEQ ID NO：15的多肽，或应用由核酸序列SEQ ID NO：16至SEQ ID NO：30之一编码的多肽，或由在严格条件下与序列SEQ ID NO：16至SEQ ID NO：30之一杂交的核酸序列编码的多肽。

例如在严格条件下与SEQ ID NO：16杂交的核酸序列被理解为可通过菌落杂交法、噬菌斑杂交方法、DNA印迹杂交法或类似方法，应用SEQ ID NO：16作为DNA探针鉴定的多核苷酸。

为这一目的，在60℃在0.7-1M NaCl溶液中使固定在滤器上的多核苷酸例如与SEQ ID NO：16杂交。如例如在Molecular Cloning，ALaboratory Manual，Second Edition(Cold Spring Harbor LaboratoryPress，1989)或类似出版物上描述的那样进行杂交。随后，用0.1至2-倍SSC溶液在65℃洗涤滤器，其中1-倍SSC溶液被理解为由150mMNaCl和15mM柠檬酸钠组成的混合物。

此外，本发明涉及氨基酸序列SEQ ID NO：1、SEQ ID NO：2、SEQID NO：3、SEQ ID NO：4、SEQ ID NO：11、SEQ ID NO：12、SEQ ID NO：13、SEQ ID NO：14和SEQ ID NO：15的多肽，以及与氨基酸序列SEQ IDNO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：11、SEQ ID NO：12、SEQ ID NO：13、SEQ ID NO：14和SEQ ID NO：15之一至少55％，优选65％-75％，尤其优选超过75％相同的多肽，即涉及可通过替换、插入、缺失、或添加至少一个氨基酸来源于序列SEQ IDNO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：11、SEQ ID NO：12、SEQ ID NO：13、SEQ ID NO：14和SEQ ID NO：15的多肽。此外，本发明还涉及由核酸序列SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ ID NO：26、SEQ ID NO：27、SEQID NO：28、SEQ ID NO：29或SEQ ID NO：30编码，或由在严格条件下与序列SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ IDNO：19、SEQ ID NO：26、SEQ ID NO：27、SEQ ID NO：28、SEQ ID NO：29或SEQ ID NO：30之一杂交的核酸序列编码的多肽。

在根据本发明的方法中，包含序列SEQ ID NO：1至SEQ IDNO：15的多肽和可来源于所述多肽的多肽分别可以以完全纯化的状态、部分纯化的状态或作为含有多肽SEQ ID NO：1至SEQ ID NO：15之一的细胞使用。由此可以以天然、透化的或裂解状态提供使用的细胞。优选地，使包含序列SEQ ID NO：1至SEQ ID NO：15的多肽和可来源于其的衍生物分别在合适的宿主生物中过表达，所述宿主生物诸如例如大肠杆菌(Escherichia coli)，并且将重组多肽用于还原通式I的羟基酮。

根据本发明的酶还原在温和的条件下进行，因此可很大地避免不稳定的式I化合物的降解以及由此不期望的副产品的形成。取决于所使用的多肽，根据本发明的方法具有最高达99％的式II化合物(R，S-化合物)的对映体纯度，然而至少50％的R，S-化合物。

对于式III化合物(S，S-化合物)，取决于所使用的多肽，根据本发明的方法具有最高达99％的式III化合物(S，S-化合物)的对映体纯度，然而至少80％的R，S-化合物。

本发明优选的实施方案的特征在于在该方法中使用的辅因子被共底物持续地还原。优选地，应用NAD(P)H作为辅因子，其中在还原中形成的NAD(P)通过共底物还原回NAD(P)H。

在根据本发明的方法中，优选持续地再生通过氧化还原酶/脱氢酶形成的氧化的辅因子NAD或NADP。

根据本发明所有方法的优选实施方案，通过醇的氧化再生氧化的辅因子NAD或NADP。

优选应用诸如2-丙醇、2-丁醇、2-戊醇、3-戊醇、4-甲基-2-戊醇、2-庚醇、2-辛醇或环己醇的仲醇作为共底物。根据特别优选的实施方案，将2-丙醇或4-甲基-2-戊醇用于辅酶再生。用于再生的共底物的量可以是总体积的5至95％体积。

优选地，将通式R_XR_YCHOH的仲醇用于辅因子再生，其中R_X和R_Y独立地是氢、支链或非支链C₁-C₈-烷基并且C_总≥3。

根据本发明方法其它优选的实施方案，添加其它的氧化还原酶/脱氢酶用于辅因子再生。

在其它优选的实施方案中，可还添加其它的醇脱氢酶用于辅因子的再生。合适的NADH-依赖性醇脱氢酶例如可从面包酵母，从近平滑假丝酵母(Candida parapsilosis(CPCR))(US 5,523,223和US5,763,236，Enzyme Microb.Technol.，1993，15(11)：950-8)，Pichiacapsulata(DE 10327454.4)，从红串红球菌(Rhodococcus erythropolis(RECR))(US 5,523,223)、Norcardia fusca(Biosci.Biotechnol.Biochem.，63(10)，1999，第1721-1729页；Appl.Microbiol.Biotechnol，.2003，62(4)：380-6；Epub 2003，4月26日)或从赤红球菌(Rhodococcus ruber)(J.Org.Chem.，2003，68(2)：402-6)获得。用于这些醇脱氢酶的合适的共底物例如是已经提到的仲醇，诸如2-丙醇(异丙醇)、2-丁醇、2-戊醇、4-甲基-2-戊醇、2-辛醇或环己醇。

用于NADPH再生的合适的仲醇脱氢酶例如是上面描述并且分离自乳杆菌(Lactobacillale)目生物的那些，所述生物例如高加索酸奶乳杆菌(Lactobacillus kefir)(US 5,200,335)、短乳杆菌(Lactobacillus brevis) (DE 19610984 A1；Acta Crystallogr.D.Biol.Crystallogr.2000Dec；56Pt 12：1696-8)、稍小乳杆菌(Lactobacillus minor)(DE 10119274)、肉色明串珠菌(Leuconostoc carnosum)(A 1261/2005，K1.C12N)，或如所描述的那样，来自Thermoanerobium brockii、Thermoanerobiumethanolicus或拜氏梭菌(Clostridium beijerinckii)的那些。

然而，原则上其它酶系统也可用于辅因子再生。例如，可应用NAD-或NADP-依赖性甲酸脱氢酶实现辅因子再生(Tishkov等，J.Biotechnol.Bioeng.[1999]64，187-193，Pilot-scale production andisolation of recombinant NAD and NADP specific formatedehydrogenase)。甲酸脱氢酶的合适共底物例如是甲酸盐，诸如甲酸铵、甲酸钠或甲酸钙。

在根据本发明的方法中，反应批次中使用的通式I化合物的量优选为基于总体积的10g/l至500g/l，优选25g/l至300g/l，特别优选50g/l至200g/l。

进行酶还原的反应混合物中水性部分优选含有缓冲剂，例如，磷酸钾、tris/HCl或三乙醇胺缓冲剂，其具有5-10的pH值，优选6-9的pH值。此外，该缓冲剂可以含有用于稳定或活化酶的离子，例如诸如，锌离子或镁离子。

当实施根据本发明的方法时，温度合适地是约10℃至70℃，优选20℃至45℃。

在根据本发明的方法的其它优选实施方案中，在有机溶剂的存在下进行酶反应，其中所述的有机溶剂不与水混溶或仅以非常小的程度与水混溶。所述溶剂例如是对称的或非对称的二(C₁-C₆)烷基醚、直链或支链烷或环烷或不溶于水的仲醇，其同时作为共底物。优选的有机溶剂是二乙醚、叔丁基甲基醚、二异丙基醚、二丁基醚、乙酸丁酯、庚烷、己烷、2-辛醇、2-庚醇、4-甲基-2-戊醇和环己醇。在这种情况下，该溶剂又可同时作为用于辅因子再生的共底物。

如果分别使用不溶于水的溶剂和共底物，反应批次由水相和有机相组成。根据其溶解度，通式化合物分布在有机相和水相之间。一般而言，基于总反应体积，有机相具有5至95％的比例，优选10至90％。优选机械地混合物两个液态相，因此在它们之间产生大的表面面积。在这一实施方案中，例如，在酶还原期间形成的NAD(P)也可被诸如上面描述的共底物还原回NAD(P)H。

在水相中辅因子(特别是NADH或NADPH)的浓度分别一般为0.001mM至10mM，特别是0.01mM至1mM。

在根据本发明的方法中达到的TTN(总转化数＝还原的式I化合物mol/所使用的辅因子mol)通常为10²至10⁵，然而优选为≥10³。

在根据本发明的方法中，还可使用氧化还原酶/脱氢酶的稳定剂。合适的稳定剂例如是甘油、山梨醇、1，4-DL-二硫苏糖醇(DTT)或二甲基亚砜(DMSO)。

根据本发明的方法例如在由玻璃或金属制成的封闭反应容器中进行。为这一目的，将成分单个地转移至该反应容器中，并且在例如氮气或空气气氛中搅拌。

根据本发明另一可能的实施方案，可持续地移除氧化的共底物(例如丙酮)和/或可持续地新添加共底物(例如，2-丙醇)，以使得反应平衡偏向反应产物。

在其它实施方案中，在反应过程中逐渐地添加根据SEQ ID NO：1至SEQID No15的氧化还原酶和/或共底物。

在反应完成后，处理反应混合物。为这一目的，例如任选地将水相从有机相中分离，并且过滤含有产物的有机相。任选地，还可萃取水相并如有机相那样进一步处理。随即从有机相中蒸发溶剂，并且作为粗产物获得通式II或III的产物。然后可进一步纯化粗产物，或将其直接用于结果产物的合成。

以下通过实施例的方式进一步阐明本发明。

实施例1

克隆并提供来自Rubrobacter xylanophilus DSM 9941的氧化还原酶(SEQ ID No 5)

A)Rubrobacter xylanophilus DSM 9941的培养

在细菌摇床上以140rpm在50℃(pH 7.2)的以下培养基中培养Rubrobacter xylanophilus DSM 9941细胞：0.1％酵母提取物、0.1％胰蛋白胨、0.004％CaSO₄x 2H₂O、0.02％MgCl₂x 6H₂O、0.01％氨三乙酸、100ml磷酸盐缓冲液[5.44g/l KH₂PO₄、43g/l Na₂HPO₄x 12H₂O]、500μl/l 0.01M柠檬酸铁、500μl/l微量元素[500μl/l H₂SO₄、 2.28g/l MnSO₄x H₂O、500mg/l ZnSO₄x 7H₂O、500mg H₃BO₃、25mg/lCuSO₄x 5H₂O、25mg/l Na₂MoO₄x 2H₂O、45mg/l CoCl₂x 6H₂O]。在培养的第6天，通过离心从培养基中分离细胞，并且储存在-80℃。

B)编码选择性氧化还原酶的基因的扩增

根据描述于Manniatis&Sambrook的“Molecular Cloning”中所描述的方法提取基因组DNA。将得到的核酸用作聚合酶链式反应(PCR)的模板，所述PCR包含来源于NCBI数据库中46106817号下公开的基因序列的特异性引物。为了完成这些，在引物的5’端位置分别提供了用于核酸内切酶Nde I和Hind III或Sph I的限制性位点(SEQID NO：67、SEQ ID NO：68、SEQ ID NO：69)，用于随后克隆至表达载体中。

在PCR缓冲液[10mM Tris-HCl(pH 8.0)；50mM KCl；10mMMgSO₄；1mM dNTP混合液；在每种情况下20pMol引物和2.5UPlatinum Pfx DNA聚合酶(Invitrogen)]中，用500ng基因组DNA，并在以下温度循环中进行扩增：

循环1： 94℃，2min

循环2×30：94℃，15秒，

54℃，30秒，

68℃，60秒，

循环3： 68℃，7min

4℃，∞

在1％琼脂糖凝胶上纯化后，将所得到的具有约750bp大小的PCR产物分别在核酸内切酶Nde I和Hind III或Sph I和Hind III的帮助下进行限制性切割，并且分别连接至pET21a载体(Novagen)或pQE70载体(Qiagen)的骨架中，其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后，通过分别用核酸内切酶Nde I和Hind III或Sph I和Hind III进行限制性分析的方式测试氨苄青霉素耐性集落的质粒DNA中具有750bp大小的插入片段的存在。将制备自所述片段为阳性的克隆的质粒进行序列分析，并随后分别转化至大肠杆菌BL21Star(Invitrogen)和大肠杆菌RB791(genetic stock，Yale)中。

C)在大肠杆菌细胞中高效表达多肽SEQ ID NO：5

为在大肠杆菌细胞中高效表达多肽SEQ ID NO：5，在PCR反应中应用编码DNA SEQ ID NO：70作为模板，用于克隆至表达载体中。在第一个的区域，这一DNA序列在153个碱基与之前已知的DNA序列(SEQ ID NO：20)不同。这一修饰是保守的并且不会导致氨基酸序列中的改变。

在PCR缓冲液[10mM Tris-HCl(pH 8.0)；50mM KCl；10mMMgSO₄；1mM dNTP混合液；在每种情况下20pMol引物(SEQ IDNO：71、SEQ ID NO：68)和2.5U Platinum Pfx DNA聚合酶(Invitrogen)]中，用50ng DNA SEQ ID NO：70作为模版，并在以下温度循环中进行扩增：

循环1： 94℃，2min

循环2×30：94℃，40秒，

56℃，30秒，

68℃，60秒，

循环3： 68℃，7min

4℃，∞

在1％琼脂糖凝胶上纯化后，在核酸内切酶Nde I和Hind III的帮助下将所得到的具有约750bp大小的PCR产物连接至pET21a载体(Novagen)的骨架中，其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后，通过用核酸内切酶Nde I和Hind III进行限制性分析的方式测试氨苄青霉素耐性集落的质粒DNA中具有750bp大小的插入片段的存在。将制备自所述片段为阳性的克隆的质粒进行序列分析，并随后转化至大肠杆菌BL21Star(Invitrogen)中。

D.)制备来自Rubrobacter xylanophilus DSM 9941的氧化还原酶

在含有氨苄青霉素(50μg/ml)的培养基(1％胰蛋白胨、0.5％酵母提取物、1％NaCl)中分别培养已用表达构建物转化的大肠杆菌菌株BL21Star(Invitrogen，Karlsruhe，德国)和RB791(大肠杆菌geneticstoc k，Yale，USA)，直到达到在550nm处测量的0.5的光密度。通过以0.1mM的浓度添加异丙基硫代半乳糖苷(IPTG)诱导重组蛋白的表达。在25℃和220rpm诱导16小时后，收集细胞并在-20℃保存。

对于酶回收，将30g细胞悬浮于150ml三乙醇胺缓冲液(100mM，pH＝7，2mM MgCl₂，10％甘油)，并且应用高压匀化器破坏。随后，将酶溶液与150ml甘油混合并储存在-20℃。

将这样获得的酶溶液用于化合物I的还原(实施例3)。

与在实施例2中提到的方法类似，还可提供氧化还原酶SEQ IDNO 6和SEQ ID NO 7。

实施例2

通过分子筛选克隆并提供来自木兰假丝酵母(Candida magnoliae)的氧化还原酶(SEQ ID No 1)

A)氧化还原酶的分子筛选

将分离自木兰假丝酵母CBS 6396细胞的基因组DNA作为通过PCR分子筛选的模板。为做这些，在PCR缓冲液[16mM(NH4)₂SO₄；67mM Tris-HCl pH 8.3(在25℃)；1.5m MgCl₂；0.01％Tween 20；0.2mM dNTP混合物；在每种情况下30pMol引物(SEQ ID NO：72、SEQ ID NO：73)和1.25U Bio Therm Star聚合酶(Genecraft)]中，用50ng分离自木兰假丝酵母(Candida magnoliae)CBS 6396细胞的基因组DNA作为模版，并用以下循环进行扩增：

循环1： 95℃，7min

循环2×28：94℃，40秒，

从63℃开始每步温度下降0.5℃，30秒，

68℃，60秒，

×20： 94℃，40秒，

53℃，40秒，

70℃，60秒，

循环3： 70℃，7min

4℃，∞

在1％琼脂糖凝胶上对整个PCR批次进行分级分离后，鉴定约400bp的条带，并且通过悬突腺苷部分克隆至Topo-TA载体(Invitrogen)，用于确定DNA序列。

从该筛选反应得到的DNA条带展示出相应于137个氨基酸残基的氧化还原酶片段的开放阅读框。

B)分离(总的及mRNA)

将600mg新鲜细胞重悬浮于2.5ml冰冷的LETS缓冲液中。往所述细胞悬浮液中加入5ml(约20g)在硝酸中洗涤过并用3ml苯酚(pH 7.0)平衡过的玻璃珠。然后通过30秒涡旋振荡和30秒在冰上冷冻交替处理整个批次，总共历时10分钟。随后，加入5ml冰冷的LETS缓冲液，并再次剧烈地涡旋振荡。在4℃用11000g离心所述细胞悬浮液5分钟。回收水相并用等体积的苯酚∶氯仿∶异戊醇(24∶24∶1)提取两次。随后立即用氯仿抽提。在最后抽提后，通过加入1/10体积的5M LiCl₂使总RNA在-20℃沉淀4h。

将1mg如此获得的总RNA用于通过寡聚-dT纤维素(NEBBiolabs)富集mRNA分子。

通过根据Manniatis&Sambrook的“Molecular Cloning”中描述的方法，通过RACE(cDNA末端快速扩增)完成编码氧化还原酶的全序列的测定。

编码氧化还原酶的基因序列包括720个碱基对，并且等于239个氨基酸残基长度。

C)通过PCR合成编码来自木兰假丝酵母CBS 6396的短链ADH的全长转录物

构建特异引物用于随后将全长转录物克隆至合适的表达系统中。为此目的，修饰了具有Nde I识别序列的5’引物和具有Hind III识别序列的3’引物(SEQ ID NO：74、SEQ ID NO：75)。将分离自木兰假丝酵母CBS 6396细胞的基因组DNA作为聚合酶链式反应的模板。在PCR缓冲液[10mM Tris-HCl(pH 8.0)；50mM KCl；10mM MgSO₄；1mMdNTP混合液；在每种情况下20pMol引物和2.5U Platinum PfxDNA聚合酶(Invitrogen)]中，用50ng模板，并在以下温度循环中进行扩增：

循环1： 94℃，2min

循环2×30：94℃，15秒，

58℃，30秒，

68℃，75秒，

循环3： 68℃，7min

4℃，∞

在1％琼脂糖凝胶上纯化后，在核酸内切酶Nde I和Hind III的帮助下将所得到的PCR产物进行限制性切割，并连接至pET21a载体(Novagen)的骨架中，其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后，通过用核酸内切酶Nde I和Hind进行限制性分析的方式测试氨苄青霉素(或卡那霉素)耐性集落的质粒DNA中具有750bp大小的插入片段的存在。测序表达构建物pET21-MIX。来自木兰假丝酵母编码短链氧化还原酶的基因具有共720bp的开放阅读框(SEQ ID NO：16)，其相应于239个氨基酸的蛋白质(SEQ ID NO：1)。

D)在大肠杆菌细胞中表达重组氧化还原酶

用编码该氧化还原酶的表达构建物pET21-MIX分别转化感受态大肠杆菌StarBL21(De3)细胞(Invitrogen)和RB791细胞(大肠杆菌genetic stock，Yale，USA)。然后在200ml含有50μg/ml氨苄青霉素或40μg/ml卡那霉素的LB培养基(1％胰蛋白胨、0.5％酵母提取物、1％NaCl)中分别培养用表达构建物转化的大肠杆菌集落，直到达到在550nm处测量的0.5的光密度。通过以0.1mM的浓度添加异丙基硫代半乳糖苷(IPTG)诱导重组蛋白的表达。在25℃和220rpm诱导16小时后，收集细胞并在-20℃保存。为了活性测试，使10mg细胞与500μl100mM TEA缓冲液pH 7.0、1mM MgCl₂和500μl玻璃珠混合，并应用球磨机消化10分钟。然后以稀释状态将获得的裂解物用于各个测试。

如下构成活性测试：960μl 100mM TEA缓冲液pH 7.0、1mMMgCl₂、160μg NADPH、10μl稀释的细胞裂解物。通过添加10μl100mM底物溶液至该反应混合物中开始反应。

对于酶的大量回收，将30g细胞重悬浮于150ml三乙醇胺缓冲液(100mM，pH＝7，2mM MgCl₂，10％甘油)，并且应用高压匀化器消化。随后，将该酶溶液与150ml甘油混合并储存在-20℃。

与在实施例2中提到的方法类似，还可提供氧化还原酶SEQ IDNO：2、3、4、8、9、10、11、12、13、14、15。

实施例3

氧化还原酶SEQ ID NO 1至SEQ ID NO 15就它们还原式I化合物的特性而言的表征

如下就式I化合物的转化检测序列SEQ ID NO 1至SEQ ID NO 15的氧化还原酶。

反应批次A(无辅酶再生)

160μl 缓冲液(三乙醇胺100mM pH＝7，1mM MgCl₂，10％甘油)

150μl NAD(P)H(40mg/ml)＝6mg

20μl 2-丙醇

2mg 式I化合物

50μl 根据实施例1D的酶溶液

反应批次B(有辅酶再生)

400μl 缓冲液(三乙醇胺100mM pH＝7，1mM MgCl₂，10％甘油)

0.05mg NAD(P)H

50μl 2-丙醇

10mg 式I化合物

50μl 根据实施例1D的酶溶液

在温育样本A和B 24h后，在每种情况下往完成的反应批次中加入1ml乙腈，离心反应批次，并转移至HPLC分析容器(1mg/ml)。

通过HPLC (Nucleodur 1005C18ec，125mm，直径4mm，Macherey-Nagel)分析反应批次。应用了1ml/分钟的流速和乙腈(B)及水(A)的溶剂系统。用从40％至80％递增线性梯度的乙腈可在10分钟内分离式I、II和III的化合物。

保持的时间是(酮式I)10.0分钟，(R，S-化合物式II)9.3分钟，以及(S，S-化合物式III)8.5分钟。

结果

实施例4

通过氧化还原酶SEQ ID NO：1将式I化合物转化为式II化合物(R，S-化合物)

为将式I化合物转化为式II化合物(R，S-化合物)，在每种情况下将2.25ml SEQ ID No 1的酶悬浮液(参见实施例1D)和75单位(＝2ml)过表达的来自Thermoanerobium brockii的醇脱氢酶加入到3ml缓冲液(100mM TEA，pH＝8，10％甘油)、1.5g式I化合物、0.3mg NADP和7ml 4-甲基-2-戊醇的混合物中。在室温中在恒定完全的混合下温育该反应混合物。48h后，超过95％的所使用的式I化合物被还原为式II化合物。对映体过量总计＞98％。

实施例5：

通过氧化还原酶SEQ ID NO：5将式I化合物转化为式III化合物(S，S-化合物)

为进一步将式I化合物转化为式III化合物(S，S-化合物)，在Eppendorf反应容器中温育600μl缓冲液(100mM TEA，pH＝9)、200μl 2-丙醇、50mg式I化合物、0.1mg NAD和200μl SEQ ID NO：5的酶悬浮液(参见实施例1D)的混合物。在室温中在恒定完全的混合下温育该反应混合物。48h后，超过90％的所使用的式I化合物被还原为式III化合物(S，S)。对映体过量总计＞98％。

氨基酸序列

SEQ ID No l：

木兰假丝酵母CBS 6396蛋白质序列羰基还原酶

1 mnalvtggsr gigeaiatkl aedgysvtia srgidqlnkv kaklpvvreg qthhvwqldl

61 sdaeaassfk gaplpassyd vlvnnagvtd pspiakqsds eihklfsvnl lspvaltkty

121 vqavtgkpre tpahiifiss gvairgypnv avysatksgl dgfmrslare lgpegvhvnt

181 vspgltktem asgvslddfp pspiggwiqp eaiadavryl vksknitgti lsvdngitv

SEQ ID No 2：

木兰假丝酵母JCM 9448蛋白质序列羰基还原酶

1 mpstlnalvt ggsrgigeat avklaeegyg itlaardikk lndvkaklpt ikqgqehhvw

61 qldladvqaa lelkgaplpa skydllvana gvsahvptae hddahwqnvi tinlssqial

121 tqalvraige rsdeapfhiv yvssiaalrg npmsavysas kagldgfars isrelgpkgi

181 hvntvhpglt ktdmtvrmrp aedqpikgwv lpdaiadavv flaksknitg tnivvdngrv

241 v

SEQ ID No 3：

Candida geochares MUCL 29832蛋白质序列羰基还原酶

1 mssvpassss ssptlnalvt gasrgigeat aiqlasqgys vtlasrgleq lkavkaklpl

61 vrqgqthhvw qldladvaaa gsfkgaplpa ssydvlvsna gvalfspigd qadedwqrml

121 avnltspial tkalvkaiad kprenpahii fvssavslrg yplvgvysat kagldgftrs

181 lahelgpkri hvntvnpglt ktemakdvel dsfggnvpis gwiqvdaiad avsflvnskn

241 itgtslvvdn gisv

SEQ ID No 4：

木兰假丝酵母CBS 5659蛋白质序列羰基还原酶

1 mnalvtggsr gigeataiql aqegygvtlv argarqlnev laklpvvrdg qthhiwqldl

61 sdpeaaaafr gaplpassyd vlinnagvss lspfvaqsde vqktilavnl lspialtkaf

121 vkaavgkpre rpahiifiss gaalrgfanm avysatkggl dsfmrslare lgpqgihvns

181 vnpgftetem tattdlndyp ptpiegwiqp raiadailfl lksrnitgtn vtvdngitv

SEQ ID No 5：

Rubrobacter xylanophilus DSM 9941蛋白质序列羰基还原酶

1 mlegkvavit gagsgigrat alrfaregar vvvaelderr geevvreile sggeavfvrt

61 dvsefeqvea averaveeyg tldvmfnnag ighyaplleh dpehydrvvr vnqygvyygi

121 laagrkmael enpgviinta svyaflaspg vigyhaskga vkmmtqaaal elaphgirvv

181 aiapggvdtp iiqgykdmgl gerlargqmr rrlqtpeqia gavvllatee adaingsvvm

241 tddgyaefk

SEQ ID No 6：

Geobacillus kaustophilus JCM 12893(HTA426)蛋白质序列羰基还原酶

1 mrlkgkaaiv tggasgigra tairfaeega kvavsdinee ggeetvrlir ekggeaifvq

61 tdvadskqvs rlvqtavdaf gglhilfnna gighsevrst dlseeewdrv invnlkqvfl

121 gikyavpvmk qcgggaivnt ssllgikgkk yesaynaska gvilltknaa leygkfnirv

181 naiapgvidt niitpwkqde rkwpiiskan algrigtpee vanavlflas deasfitgat

241 lsvdgggltf

SEQ ID No 7：

橙色绿屈挠菌DSMZ 635(J-10-fl)蛋白质序列羰基还原酶

1 meppfigkva lvtgaaagig rasalafare gakvvvadvn veggeetial cralntdamf

61 vrcdvsqrde verlialavd tfgridfahn nagiegvgam ladypeevwd rvieinlkgv

121 wlcmkyeirh mlkqgggaiv ntssvaglag srgvsayvas khgivgitka aaleyarngi

181 rvnaicpgti htamidrftq gdpqllaqfa egepigrlgs peevanaviw lcsdkasfvt

241 gatlavdggr la

SEQ ID No 8：

木兰假丝酵母DSM 70638蛋白质序列羰基还原酶

1 mtstpnalit ggsrgigasa aiklaqegys vtlasrdlek ltevkdklpi vrggqkhyvw

61 qldladveaa ssfkaaplpa ssydlfvsna giaqfsptae htnsewlnim tinlvspial

121 tkallqavsg rssenpfqiv fissvaalrg vaqtavysas kagtdgfars larelgpqgv

181 hvnvvnpgwt ktdmtegvet pkdmpikgwi qpeaiadavv flarsknitg anivvdngfs

241 t

SEQ ID No 9：

木兰假丝酵母DSM 70638蛋白质序列羰基还原酶

1 mtttsnalvt ggsrgigaas aiklaqegyn vtlasrsvdk lnevkaklpi vqdgqkhyiw

61 eldladveaa ssfkgaplpa rsydvfvsna gvaafsptad hddkewqnll avnlsspial

121 tkallkdvse rpvdkplqii yissvaglhg aaqvavysas kagldgfmrs varevgpkgi

181 hvnsinpgyt ktemtagiea lpdlpikgwi epeaiadavl flaksknitg tnivvdngli

241 a

SEQ ID No 10：

木兰假丝酵母ATCC 12573蛋白质序列羰基还原酶

1 msyqmsssap sstslnalvt ggsrgigeat aiklaeegys vtiasrglkq leavkaklpi

61 vkqgqvhhvw qldlsdvdaa aafkgsplpa srydvlvsna gvaqfspfie hakqdwsqml

121 ainlaapial aqtfakaigd kprntpahiv fvssnvslrg fpnigvytat kagidgfmrs

181 varelgpsgi nvnsvnpgpt rtemtkgidv gtidmpikgw iepeaiadav lfvvksknit

241 gttvvvdngs sa

SEQ ID No 11：

木兰假丝酵母DSM 70639蛋白质序列羰基还原酶

1 mttsstssst ssrslnalvt gasrgigeat aiklasegys vtlasrsleq lkalkeklpv

61 vkqgqthhvw qldlsdvdaa atfkgsplpa ssydavisna gvaqfsplse haredwsqml

121 tinlaapial aqafvkaigd kkrdipaqiv fvssnvvmrg lpylgiytas kagidgfmrs

181 aarelgpkgi nvnsvnpgat qtemtkgvdv naldlpikgw iqleavadav lfvvqsknit

241 gttivvdngs va

SEQ ID No 12：

木兰假丝酵母CBS 2798蛋白质序列羰基还原酶

1 mnalvtgasr gigeaiavkl aedgysvtla srsleklesl kkglpvvkdg qahhvweldl

61 gdvdaassfk gaplpaeayd vfvsnagmak stlmvdhpid elqdminvnl vspialtqgl

121 vkalteskrd kpahivfmss irsfrgipng avysatksgl dgfmrsiare lgpqgihvns

181 vcpgfvqtem trkvdmeskk dqlpiagwiq pdaiadtvlf fvksknitgq aivvdngitv

SEQ ID No 13：

Candida gropengoesseri MUCL 29836蛋白质序列羰基还原酶

1 mpsglnalvt ggsrgigaaa atklaaagyn vtvasrgvea lnkvkaslpv vkegqqhhvw

61 qldvsdlaav sgfkgsplpa ksydvvvvna gvanlsplaa qdddviqniv tvnllspial

121 vkslikayge gpratpahiv fvssvaairg fpngavysst ksaldgltrs lakelgpqni

181 rvnsvnpgft rtelasgvdi davtqsspik gwvepeaigd ailflatsnh itgtitvidn

241 gtsa

SEQ ID No 14：

Candida sp.MUCL 40660蛋白质序列羰基还原酶

1 msssssstpl nalvtgasrg igevislqla negynvtlaa rslddlnavk aklpivrdaq

61 khsvwpldis didavtnfkg splpaekydl fvsnagvvdf aplvhqspes isslfnvnli

121 apvaltkall kafgdsprkt tthfiyvssv valrgfpnva vysssksgld gfvrslaaev

181 aplnirvnsi npgptktemt asldveafta gnpikgwiyp daiadgvvyl aksknitgit

241 lqvdngagi

SEQ ID No 15：

Candida vaccinii CBS 7318蛋白质序列羰基还原酶

1 mrstpnalvt ggsrgigaaa aiklaeagys vtlasrgldk lnevkaklpv vkqgqehhvw

61 qldlsdvqaa lefkgaplpa skydlfvsna gvatfsptae hddkdwqnii avnltspiai

121 tkalvkavge rsndnpfqia flssaaalrg vpqtavysat kagldgftrs lakelgpkgi

181 hvnivhpgwt qtemtagvde prdtpipgwi qpeaiaeaiv ylaksknitg tnivvdnglt

241 i

SEQ ID No 16：

木兰假丝酵母CBS 6396核酸序列羰基还原酶

1 atgaacgctc tagtgaccgg tggtagccgt ggcattggcg aggcgatcgc gaccaagctg

61 gccgaagatg gctacagcgt gacaatcgcc tcgcgcggaa tcgatcagct caacaaggta

121 aaggctaaac ttccggttgt gagggagggc cagacccacc acgtgtggca gcttgatttg

181 agcgacgccg aggccgcgtc gtccttcaag ggcgctcctt tgccagcaag cagctacgat

241 gtccttgtca acaacgccgg agtaacggat ccgagtccca ttgcgaagca gtcggatagc

301 gagattcaca agctgtttag cgtgaatctg ctgtcaccag ttgctttgac aaagacgtac

361 gtccaggcgg ttaccggaaa gcctcgtgag acgccagctc acattatttt tatctcgtca

421 ggcgttgcca ttcgaggcta cccaaacgtc gctgtatact cggctactaa gagcgggctc

481 gacggtttca tgaggtctct ggcgcgcgag cttggccccg agggcgtcca tgtgaacact

541 gtcagcccgg gtctcaccaa aaccgagatg gccagcggcg tcagcctcga cgacttcccg

601 ccatcgccga ttgggggctg gatccagccc gaggccatcg ctgatgcagt gaggtacctg

661 gtgaagtcga agaacatcac aggcacgatt ctgtcagttg acaacggaat cacggtttaa

SEQ ID No 17：

木兰假丝酵母JCM 9448核酸序列羰基还原酶

1 mpstlnalvt ggsrgigeat avklaeegyg itlaardikk lndvkaklpt ikqgqehhvw

61 gldladvqaa lelkgaplpa skydllvana gvsahvptae hddahwqnvi tinlssgial

121 tqalvraige rsdeapfhiv yvssiaalrg npmsavysas kagldgfars isrelgpkgi

181 hvntvhpglt ktdmtvrmrp aedqpikgwv lpdaiadavv flaksknitg tnivvdngrv

241 v

SEQ ID No 18：

Candida geochares MUCL 29832蛋白质序列羰基还原酶

1 atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc

61 gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa

121 ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg

181 cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg

241 agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag

301 cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc

361 acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg

421 tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg

481 aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt

541 catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct

601 gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg

661 ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg

721 gtctaa

SEQ ID No 19：

木兰假丝酵母CBS 5659蛋白质序列羰基还原酶

1 atgaacgcgt tagtgaccgg cggaagccgc gggatcggcg aggccacggc catacagctg

61 gctcaggagg gctacggtgt gacattggtt gcgcgaggag cccgccagct caatgaagtg

121 ttggcaaagc taccagttgt gagagacgga cagacgcacc acatttggca gctagatctg

181 agcgatcctg aggcggccgc tgccttcagg ggtgctcctt tgcccgccag cagctacgac

241 gtgctgatca ataacgcagg tgttagtagt ctcagcccgt tcgtcgcgca gtctgatgag

301 gtccagaaaa ctattttagc ggtgaatctt ttgtcgccaa tcgcgttgac gaaggcgttc

361 gtgaaggcag cggtgggcaa gccgcgtgag aggccggcgc atatcatttt catctcttcg

421 ggcgctgccc tgcgcggttt cgcgaacatg gcagtgtata gtgcaacgaa aggcggcctt

481 gacagtttca tgcgctcgct agctagagag ctaggtcccc agggcatcca cgtcaactca

541 gtcaatccgg gctttactga aacagaaatg acagccacta cagatttgaa tgactacccc

601 ccgaccccca ttgagggctg gattcagcct cgcgcaatcg ccgacgctat acttttccta

661 ctgaagtcca gaaacatcac tggcacaaat gtgaccgtcg acaacggcat cactgtttga

SEQ ID No 20：

Rubrobacter xylanophilus DSM 9941蛋白质序列羰基还原酶

1 atgctcgagg ggaaggtcgc ggtcatcacg ggggccggca gcggcatagg ccgggccacc

61 gcgctcaggt tcgcccgcga aggggcccgg gtggtcgtgg cggagctcga cgagcggagg

121 ggggaggagg tcgtccggga gatcctcgag tccggcgggg aggccgtctt cgtgaggacg

181 gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg

241 acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac

301 gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata

361 ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc

421 tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg

481 gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc

541 gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc

601 ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc

661 ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg

721 accgacgacg gctacgcgga gttcaagtaa

SEQ ID No 21：

Geobacillus kaustophilus JCM 12893(HTA426)蛋白质序列羰基还原酶

1 atgaggctaa aaggaaaagc ggcgattgtc accggcggcg cgagcggcat cggccgggcg

61 acggcgattc gctttgcgga agaaggcgcc aaagtggcgg tgagcgacat caatgaggaa

121 ggaggggaag aaacggtccg cctgattcgg gaaaaaggag gggaggcgat ttttgtccaa

181 acggacgtag ccgattccaa gcaagtgagc cgccttgtcc aaacggcggt tgatgccttt

241 ggcggcctac atattctctt taacaatgcc ggcatcggcc attcggaagt gcggagcacc

301 gacttgtctg aagaagagtg ggaccgggtc atcaacgtta atttgaaagg agtgttcctt

361 ggcatcaaat acgcggtgcc cgtgatgaag caatgcggtg gcggggccat tgtcaacaca

421 tcgagcctgc ttggaatcaa agggaaaaag tacgaatcgg cctacaacgc ctcgaaggcc

481 ggggtgattt tgttgacgaa aaatgcagca ttggaatatg ggaagtttaa cattcgcgtc

541 aatgccattg caccgggggt cattgatacg aacatcatca cgccgtggaa acaagatgag

601 cgcaaatggc cgatcatttc gaaagcgaac gccctcggcc gcatcgggac gccagaggaa

661 gtggcgaacg cggtgttgtt tttggcgtcc gatgaagcgt cgtttatcac cggcgcgaca

721 ttgtcggtcg acggcggcgg gctgacgttt tag

SEQ ID No 22：

橙色绿屈挠菌DSMZ 635(J-10-fl)蛋白质序列羰基还原酶

1 atggagccac ctttcattgg gaaggttgcg ctggtcaccg gcgcagcagc cggtattggt

61 cgtgcttcag cactggcgtt tgcccgtgag ggtgccaagg ttgtcgttgc tgatgtgaat

121 gtcgagggcg gggaagagac gattgcgctg tgtcgggctt tgaataccga tgcaatgttc

181 gtgcgttgtg atgtttcgca acgcgatgaa gtggagcgat taattgctct ggcagttgac

241 acgttcggtc ggatcgactt tgcgcacaac aacgccggga ttgaaggcgt gcaggcaatg

301 ctggccgatt atcccgaaga ggtctgggat cgggtgatcg agatcaacct caaaggggtc

361 tggttgtgta tgaagtacga aatccggcac atgctcaagc agggtggcgg tgcgattgtg

421 aatacctcat cggtcgccgg tctggccgga tcacgtggcg tttcggcgta tgtagccagc

481 aagcacggta ttgttggtat taccaaagcg gcagcccttg agtatgcgcg taacggtatt

541 cgtgtcaacg caatctgtcc aggtacgatt catactgcga tgatcgaccg ctttacccag

601 ggtgatcccc aactgcttgc ccagttcgct gagggtgaac cgattggtcg gctcggctcg

661 cctgaagagg tcgccaatgc ggtgatctgg ctctgctcag ataaggcttc gtttgtgacc

721 ggagcgacac tggcggttga tggtggccgc ctggcgtaa

SEQ ID No 23：

木兰假丝酵母DSM 70638蛋白质序列羰基还原酶

1 atgacatcta cacctaatgc cctcatcacg ggaggcagcc gcggcattgg cgcttccgcc

61 gccatcaaac tggctcaaga agggtacagc gtcacgctgg cgtcccgcga ccttgagaaa

121 cttactgagg tcaaggacaa gctgccaatc gtgagaggtg gacagaaaca ctacgtttgg

181 cagctcgatc ttgccgatgt ggaggctgca tcgtctttca aggcggctcc tctgccggcc

241 agcagctacg atttgtttgt ttcgaacgcc ggaattgccc agttctcgcc tacggcagag

301 catactaata gtgagtggct gaacattatg accattaact tagtgtcccc gattgccctg

361 acgaaggctc ttttgcaggc cgtttctggg aggtcgagcg agaacccgtt tcagatcgtc

421 ttcatctcgt cggttgcagc actacgtggc gttgcacaaa cggccgtcta cagtgcgtcg

481 aaggctggta ctgatggatt cgcacgctca cttgctcgcg aactaggtcc tcaaggtgtt

541 catgtgaacg tggtgaaccc tggctggact aagacagaca tgacggaagg agtcgaaacc

601 ccaaaggaca tgcccattaa gggctggatc cagcctgagg caattgctga tgctgtagta

661 ttccttgcga ggtcgaaaaa cattaccggc gcgaatattg tagtggacaa tggtttctcg

721 acgtaa

SEQ ID No 24：

木兰假丝酵母DSM 70638蛋白质序列羰基还原酶

1 atgacgacta cttcaaacgc gcttgtcact ggaggcagcc gcggcattgg cgctgcctcc

61 gccattaagc tggctcagga gggctacaat gttacgctgg cctctcgcag tgttgataaa

121 ctgaatgaag taaaggcgaa actcccaatt gtacaggacg ggcagaagca ctacatttgg

181 gaactcgatc tggctgatgt ggaagctgct tcgtcgttca agggtgctcc tttgcctgct

241 cgcagctacg acgtctttgt ttcgaacgcg ggcgtcgctg cgttctcgcc cacagccgac

301 cacgatgata aggagtggca gaacttgctt gccgtgaact tgtcgtcgcc cattgccctc

361 acgaaggccc tcttgaagga tgtctccgaa aggcctgtgg acaagccact gcagattatc

421 tacatttcgt cggtggccgg cttgcatggc gccgcgcagg tcgccgtgta cagtgcatct

481 aaggccggtc ttgatggttt tatgcgctcc gtcgcccgtg aggtgggccc gaagggcatc

541 catgtgaact ccatcaaccc cggatacacg aagactgaaa tgaccgcggg cattgaagcc

601 cttcctgatt tgcctatcaa ggggtggatc gagcccgagg caattgctga cgcggttctg

661 tttctggcaa agtccaagaa tatcaccggc acaaacattg tggtcgacaa tggcttgatt

721 gcttaa

SEQ ID No 25：

木兰假丝酵母ATCC 12573蛋白质序列羰基还原酶

1 atgtcttatc aaatgtcttc ttctgctcca tcctccacct ccctgaatgc gcttgtcacg

61 ggcggcagcc gcggcattgg cgaagccact gccattaagc tcgccgagga gggctacagc

121 gtcacgattg cgtctcgcgg ccttaagcag ctcgaggctg tgaaggccaa actacccatt

181 gtgaagcagg gacaggttca ccacgtgtgg cagcttgatc tcagtgatgt cgacgctgcg

241 gccgccttca aagggtcgcc gctacctgcc agccgctacg acgtgctcgt cagcaatgct

301 ggcgtggccc agtttagccc gttcatcgag catgcgaagc aggactggtc gcagatgctt

361 gccatcaatc tggcggcacc cattgcgctg gcccagacat ttgctaaggc cattggcgac

421 aagccgcgca acacaccggc ccacattgtg tttgtctcgt cgaacgtctc gttgcgaggc

481 ttcccgaaca tcggcgtcta cacggccacg aaagccggca ttgacggctt catgcgctcg

541 gtcgcacgcg aactggggcc cagcggcatt aacgtgaact ccgtgaaccc cgggcccacg

601 cggacggaga tgacgaaggg cattgacgtc ggcacgatcg atatgccgat caagggctgg

661 atcgagcccg aggcgattgc ggatgccgtg ctcttcgtgg tcaagtcgaa gaacattacg

721 ggcacgaccg ttgttgtcga caacggctcc tccgcttga

SEQ ID No 26：

木兰假丝酵母DSM 70639蛋白质序列羰基还原酶

1 atgaccacct cctccacctc ctcctccacc tcctcccgct ctctaaacgc tcttgtcacc

61 ggcgctagcc gcggcattgg cgaggccact gcaatcaagc tagcatctga gggatacagc

121 gttacgcttg catctcgtag cctcgagcag ctcaaggctt tgaaggagaa gttgcccgtt

181 gtgaagcagg gccagacgca ccacgtctgg cagctcgact tgagcgacgt cgacgccgct

241 gccacgttca agggctcccc cttgccggcc agcagctacg acgccgtcat cagcaatgcc

301 ggtgttgctc agttctctcc gttgtcggaa cacgccaggg aggactggtc tcagatgctg

361 acgatcaacc tcgcggctcc cattgccctc gcgcaggcgt ttgtgaaggc cattggcgac

421 aagaagcgcg acatcccggc ccaaattgtc tttgtttcgt cgaatgtcgt gatgcgtggc

481 ctcccttacc tcggcatcta cacggcttcg aaggctggta tcgatggctt catgcgctcg

541 gccgcccgcg agctgggacc caagggtatc aacgtgaact cagtaaaccc gggcgccacg

601 cagaccgaga tgacgaaggg cgttgatgtc aacgccctcg acctgccgat caagggatgg

661 attcagctcg aggctgtcgc ggacgccgtg ctcttcgtgg tccagtcgaa gaacattacc

721 ggcacgacga ttgttgtcga caacggctcc gtcgcttga

SEQ ID No 27：

木兰假丝酵母CBS 2798蛋白质序列羰基还原酶

1 atgaatgcct tagttactgg tgcgagccgc gggatcggcg aagcaattgc ggtgaagctg

61 gccgaggacg ggtacagcgt gacactggcc tcgcgctctc ttgaaaagct ggagtcgctc

121 aagaaagggc tgccggtcgt gaaggacggc caagcacatc atgtatggga gcttgatctc

181 ggtgatgttg atgccgcgtc atccttcaag ggggcgcctc tgcctgccga ggcctatgac

241 gtgttcgtca gtaacgctgg aatggccaaa tccaccttga tggtagacca tcccattgac

301 gagctgcagg acatgattaa cgtgaatctt gtgtcgccaa ttgcactcac acagggcctt

361 gtcaaggctc tgacagaatc taagcgagac aagcctgcgc atatcgtgtt catgtcgtcc

421 atccgctcgt tcaggggcat tccgaatggc gcggtgtaca gcgccacaaa gagtggtctt

481 gacggattca tgcgatccat tgcgcgagag ctgggccctc agggcatcca cgtcaactct

541 gtgtgccccg gattcgtgca aacggaaatg acgcgcaagg ttgatatgga gtcgaagaaa

601 gaccagctac ccatcgccgg ctggatccag cccgacgcga ttgctgacac cgttctgttt

661 tttgtgaaat cgaagaacat cacgggccag gcaattgtcg ttgacaatgg catcactgtc

721 tga

SEQ ID No 28：

Candida gropengoesseri MUCL 29836蛋白质序列羰基还原酶

1 atgccctctg gactcaatgc tcttgtcact ggcggcagcc gcggaatcgg cgctgccgct

61 gctaccaagc tcgccgctgc aggatacaac gtcacggttg cgtcccgcgg ggtcgaggct

121 ctgaataagg tcaaggcctc cttgcctgtt gtcaaggagg gccagcagca ccatgtctgg

181 cagctcgacg taagcgatct cgcagcggtg tctggcttca agggatctcc gctgccggct

241 aagagctacg atgttgttgt tgttaacgcc ggcgtcgcga acctgagccc gctggctgcc

301 caggacgacg acgtcattca gaacattgtg accgtgaacc tgctgtcgcc gattgcgctg

361 gtgaagtcgc tgatcaaggc gtacggcgag ggtcctcgcg cgacaccggc ccacattgtg

421 tttgtgtcgt cggtggccgc gatccgtggg ttccccaacg gcgccgtcta tagctcgacg

481 aagagtgcgc tcgacgggct gacgcggtcg ctggcgaagg agctggggcc ccagaacatc

541 cgggtcaact ccgtgaaccc cggcttcacg aggaccgagc tggccagcgg cgtcgacatt

601 gacgccgtga cgcagagctc tccgatcaag gggtgggttg agccggaggc gattggcgat

661 gcgattttgt ttctcgcgac gtcgaaccac atcacgggca cgatcaccgt catcgacaac

721 ggcactagcg cgtag

SEQ ID No 29：

假丝酵母属物种MUCL 40660蛋白质序列羰基还原酶

1 atgtcctcct cttcctcctc gactcctctc aacgctctcg tcaccggtgc cagccgcggc

61 atcggtgagg tcatctctct ccagctcgcc aacgagggct acaatgttac cctcgcagcc

121 cgcagtcttg acgacctcaa tgcggtgaag gctaagctcc ctatcgtaag ggatgcccag

181 aagcactctg tctggccgct cgacattagc gatatcgacg ccgtgacgaa cttcaaggga

241 tcgcccctgc cggccgagaa gtacgatctg ttcgtcagca acgccggcgt ggtcgacttc

301 gctccgcttg tccaccagag ccccgagagc atcagcagcc tgttcaatgt gaacctaatc

361 gcgcctgttg ccttgacaaa agctcttctt aaggcgttcg gtgacagccc tcgcaagact

421 acgactcact ttatctacgt ttcgtccgtt gttgccctcc gcggcttccc caatgttgcg

481 gtttacagct cctccaagag cggcctcgac gggtttgtgc gctcccttgc cgccgaggtt

541 gctccgctca acatccgcgt caactccatt aacccaggcc ctaccaagac tgagatgacc

601 gcttccctgg atgttgaggc gtttactgcg ggcaacccca tcaagggttg gatttacccc

661 gatgctattg ctgatggagt ggtgtacctg gcgaagtcga agaacattac tggtatcacc

721 ctccaagtcg acaacggcgc cggcatctaa

SEQ ID No 30：

Candida vaccinii CBS 7318蛋白质序列羰基还原酶

1 atgaggtcga cacctaacgc ccttgtgact ggcggcagcc gcggcattgg cgcggccgct

61 gcaattaaac tcgccgaggc aggctacagc gtgacgctcg cgtcgcgcgg tctcgacaag

121 ctcaacgagg tgaaggccaa gcttcctgtc gtgaagcagg gccaggagca ccatgtatgg

181 cagcttgatc tcagcgacgt gcaggccgcg ctcgagttca agggcgcacc gctgcccgcg

241 agtaagtacg atttgtttgt ctcgaacgcc ggcgtggcta ctttctcgcc aacggctgag

301 catgacgaca aggactggca gaacattatt gccgtgaact tgacatcgcc cattgccatt

361 acgaaggcgc tcgttaaggc cgttggcgag cgctcaaacg ataacccgtt tcagatcgcg

421 ttcctgtcat cggcggccgc cctgcgcggt gtgccgcaga ccgctgttta cagcgctacg

481 aaggccggcc tcgacggctt cacgcgctcg ctcgccaagg agctcggccc aaagggcatc

541 catgtgaaca tcgtacaccc tggatggacg cagaccgaga tgactgcggg tgtagatgag

601 cctagggata cgcccatccc gggctggatc cagccggaag ccatcgccga ggccattgtg

661 tatctcgcga agtcaaagaa catcacggga acgaacatcg ttgtcgacaa cggcctgact

721 atttaa

SEQ ID No 31：

氨基酸序列部分

nalvtgasrgig

SEQ ID No 32：

氨基酸序列部分

nalvtggsrgig

SEQ ID No 33：

氨基酸序列部分

gysvt

SEQ ID No 34：

氨基酸序列部分

gynvt

SEQ ID No 35：

氨基酸序列部分

gygitl

SEQ ID No 51：

氨基酸序列部分

gygvt

SEQ ID No 36：

氨基酸序列部分

vlaklp

SEQ ID No 37：

氨基酸序列部分

vkaklp

SEQ ID No 38：

氨基酸序列部分

fkgaplpa

SEQ ID No 39：

氨基酸序列部分

frgaplpa

SEQ ID No 40：

氨基酸序列部分

lkgaplpa

SEQ ID No 41：

氨基酸序列部分

spialtk

SEQ ID No 42：

氨基酸序列部分

spvaltk

SEQ ID No 43：

氨基酸序列部分

sqialtq

SEQ ID No 44：

氨基酸序列部分

avysask

SEQ ID No 45：

氨基酸序列部分

avysatk

SEQ ID No 46：

氨基酸序列部分

gvysatk

SEQ ID No 47：

氨基酸序列部分

pikgwi

SEQ ID No 48：

氨基酸序列部分

piegwi

SEQ ID No 49：

氨基酸序列部分

piggwi

SEQ ID No 50：

氨基酸序列部分

pisgwi

SEQ ID No 52：

氨基酸序列部分

fkaaplpa

SEQ ID No 53：

氨基酸序列部分

fkgsplpa

SEQ ID No 54：

氨基酸序列部分

gigrat

SEQ ID No 55：

氨基酸序列部分

gigrasa

SEQ ID No 56：

氨基酸序列部分

gigret

SEQ ID No 57：

氨基酸序列部分

nnagig

SEQ ID No 58：

氨基酸序列部分

nnagieg

SEQ ID No 59：

氨基酸序列部分

irvvaiapg

SEQ ID No 60：

氨基酸序列部分

irvnaiapg

SEQ ID No 61：

氨基酸序列部分

irvnaicpg

SEQ ID No 62：

氨基酸序列部分

irvvgiapg

SEQ ID No 63：

氨基酸序列部分

peqiagav

SEQ ID No 64：

氨基酸序列部分

peaianav

SEQ ID No 65：

氨基酸序列部分

peevanav

SEQ ID No 66：

氨基酸序列部分

peaianav

SEQ ID No 67：

GGGAATTCCATATGATGCTCGAGGGGAAGGTCG

SEQ ID No 68：

CACATGCATGCGAATGCTCGAGGGGAAGGTC

SEQ ID No 69：

CCCAAGCTTATTACTTGAACTCCGCGTAGCCGTC

SEQ ID No 70：

Rubrobacter xylanophilus DSM 9941核酸序列羰基还原酶半合成

1 atgctggaag gtaaagtggc agtcatcacc ggtgcaggca gcggcattgg gcgtgccact

61 gcgctgcgtt ttgcgcgtga aggcgctcgc gtcgttgtgg ccgagctgga tgaacgtcgc

121 ggtgaggaag ttgtacgtga gattctggaa tctggcgggg aggccgtctt cgtgaggacg

181 gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg

241 acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac

301 gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata

361 ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc

421 tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg

481 gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc

541 gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc

601 ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcaga tcgcc

661 ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg

721 accgacgacg gctacgcgga gttcaagtaa

SEQ ID No 71：

CCTAGCTAGCATGCTGGAAGGTAAAGTGGC

SEQ ID No 72：

CCTTTRCCTGCHAGCAGCTAYG

SEQ ID No：73

GGCTGGATCCAGCCCTTRATSGG

SEQ ID No：74

GGAATTCCATATGATGAACGCTCTAGTGACCGGTGGTAG

SEQ ID No：75

CCCAAGCTTATTAAACCGTGATTCCGTTGTCAACTGAC

序列表

<110>IEP GmbH

<120>中间体的对映选择性酶还原的方法

<130>I 11734

<140>A1530/2007

<141>2007-09-27

<160>75

<170>PatentIn version 3.3

<210>1

<211>239

<212>PRT

<213>木兰假丝酵母

<400>1

Met Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Ile

1 5 10 15

Ala Thr Lys Leu Ala Glu Asp Gly Tyr Ser Val Thr Ile Ala Ser Arg

20 25 30

Gly Ile Asp Gln Leu Asn Lys Val Lys Ala Lys Leu Pro Val Val Arg

35 40 45

Glu Gly Gln Thr His His Val Trp Gln Leu Asp Leu Ser Asp Ala Glu

50 55 60

Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp

65 70 75 80

Val Leu Val Asn Asn Ala Gly Val Thr Asp Pro Ser Pro Ile Ala Lys

85 90 95

Gln Ser Asp Ser Glu Ile His Lys Leu Phe Ser Val Asn Leu Leu Ser

100 105 110

Pro Val Ala Leu Thr Lys Thr Tyr Val Gln Ala Val Thr Gly Lys Pro

115 120 125

Arg Glu Thr Pro Ala His Ile Ile Phe Ile Ser Ser Gly Val Ala Ile

130 135 140

Arg Gly Tyr Pro Asn Val Ala Val Tyr Ser Ala Thr Lys Ser Gly Leu

145 150 155 160

Asp Gly Phe Met Arg Ser Leu Ala Arg Glu Leu Gly Pro Glu Gly Val

165 170 175

His Val Asn Thr Val Ser Pro Gly Leu Thr Lys Thr Glu Met Ala Ser

180 185 190

Gly Val Ser Leu Asp Asp Phe Pro Pro Ser Pro Ile Gly Gly Trp Ile

195 200 205

Gln Pro Glu Ala Ile Ala Asp Ala Val Arg Tyr Leu Val Lys Ser Lys

210 215 220

Asn Ile Thr Gly Thr Ile Leu Ser Val Asp Asn Gly Ile Thr Val

225 230 235

<210>2

<211>241

<212>PRT

<213>木兰假丝酵母

<400>2

Met Pro Ser Thr Leu Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile

1 5 10 15

Gly Glu Ala Thr Ala Val Lys Leu Ala Glu Glu Gly Tyr Gly Ile Thr

20 25 30

Leu Ala Ala Arg Asp Ile Lys Lys Leu Asn Asp Val Lys Ala Lys Leu

35 40 45

Pro Thr Ile Lys Gln Gly Gln Glu His His Val Trp Gln Leu Asp Leu

50 55 60

Ala Asp Val Gln Ala Ala Leu Glu Leu Lys Gly Ala Pro Leu Pro Ala

65 70 75 80

Ser Lys Tyr Asp Leu Leu Val Ala Asn Ala Gly Val Ser Ala His Val

85 90 95

Pro Thr Ala Glu His Asp Asp Ala His Trp Gln Asn Val Ile Thr Ile

100 105 110

Asn Leu Ser Ser Gln Ile Ala Leu Thr Gln Ala Leu Val Arg Ala Ile

115 120 125

Gly Glu Arg Ser Asp Glu Ala Pro Phe His Ile Val Tyr Val Ser Ser

130 135 140

Ile Ala Ala Leu Arg Gly Asn Pro Met Ser Ala Val Tyr Ser Ala Ser

145 150 155 160

Lys Ala Gly Leu Asp Gly Phe Ala Arg Ser Ile Ser Arg Glu Leu Gly

165 170 175

Pro Lys Gly Ile His Val Asn Thr Val His Pro Gly Leu Thr Lys Thr

180 185 190

Asp Met Thr Val Arg Met Arg Pro Ala Glu Asp Gln Pro Ile Lys Gly

195 200 205

Trp Val Leu Pro Asp Ala Ile Ala Asp Ala Val Val Phe Leu Ala Lys

210 215 220

Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Arg Val

225 230 235 240

Val

<210>3

<211>254

<212>PRT

<213>Candida geochares

<400>3

Met Ser Ser Val Pro Ala Ser Ser Ser Ser Ser Ser Pro Thr Leu Asn

1 5 10 15

Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile

20 25 30

Gln Leu Ala Ser Gln Gly Tyr Ser Val Thr Leu Ala Ser Arg Gly Leu

35 40 45

Glu Gln Leu Lys Ala Val Lys Ala Lys Leu Pro Leu Val Arg Gln Gly

50 55 60

Gln Thr His His Val Trp Gln Leu Asp Leu Ala Asp Val Ala Ala Ala

65 70 75 80

Gly Ser Phe Lys Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp Val Leu

85 90 95

Val Ser Asn Ala Gly Val Ala Leu Phe Ser Pro Ile Gly Asp Gln Ala

100 105 110

Asp Glu Asp Trp Gln Arg Met Leu Ala Val Asn Leu Thr Ser Pro Ile

115 120 125

Ala Leu Thr Lys Ala Leu Val Lys Ala Ile Ala Asp Lys Pro Arg Glu

130 135 140

Asn Pro Ala His Ile Ile Phe Val Ser Ser Ala Val Ser Leu Arg Gly

145 150 155 160

Tyr Pro Leu Val Gly Val Tyr Ser Ala Thr Lys Ala Gly Leu Asp Gly

165 170 175

Phe Thr Arg Ser Leu Ala His Glu Leu Gly Pro Lys Arg Ile His Val

180 185 190

Asn Thr Val Asn Pro Gly Leu Thr Lys Thr Glu Met Ala Lys Asp Val

195 200 205

Glu Leu Asp Ser Phe Gly Gly Asn Val Pro Ile Ser Gly Trp Ile Gln

210 215 220

Val Asp Ala Ile Ala Asp Ala Val Ser Phe Leu Val Asn Ser Lys Asn

225 230 235 240

Ile Thr Gly Thr Ser Leu Val Val Asp Asn Gly Ile Ser Val

245 250

<210>4

<211>239

<212>PRT

<213>木兰假丝酵母

<400>4

Met Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Thr

1 5 10 15

Ala Ile Gln Leu Ala Gln Glu Gly Tyr Gly Val Thr Leu Val Ala Arg

20 25 30

Gly Ala Arg Gln Leu Asn Glu Val Leu Ala Lys Leu Pro Val Val Arg

35 40 45

Asp Gly Gln Thr His His Ile Trp Gln Leu Asp Leu Ser Asp Pro Glu

50 55 60

Ala Ala Ala Ala Phe Arg Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp

65 70 75 80

Val Leu Ile Asn Asn Ala Gly Val Ser Ser Leu Ser Pro Phe Val Ala

85 90 95

Gln Ser Asp Glu Val Gln Lys Thr Ile Leu Ala Val Asn Leu Leu Ser

100 105 110

Pro Ile Ala Leu Thr Lys Ala Phe Val Lys Ala Ala Val Gly Lys Pro

115 120 125

Arg Glu Arg Pro Ala His Ile Ile Phe Ile Ser Ser Gly Ala Ala Leu

130 135 140

Arg Gly Phe Ala Asn Met Ala Val Tyr Ser Ala Thr Lys Gly Gly Leu

145 150 155 160

Asp Ser Phe Met Arg Ser Leu Ala Arg Glu Leu Gly Pro Gln Gly Ile

165 170 175

His Val Asn Ser Val Asn Pro Gly Phe Thr Glu Thr Glu Met Thr Ala

180 185 190

Thr Thr Asp Leu Asn Asp Tyr Pro Pro Thr Pro Ile Glu Gly Trp Ile

195 200 205

Gln Pro Arg Ala Ile Ala Asp Ala Ile Leu Phe Leu Leu Lys Ser Arg

210 215 220

Asn Ile Thr Gly Thr Asn Val Thr Val Asp Asn Gly Ile Thr Val

225 230 235

<210>5

<211>249

<212>PRT

<213>Rubrobacter xylanophilus

<400>5

Met Leu Glu Gly Lys Val Ala Val Ile Thr Gly Ala Gly Ser Gly Ile

1 5 10 15

Gly Arg Ala Thr Ala Leu Arg Phe Ala Arg Glu Gly Ala Arg Val Val

20 25 30

Val Ala Glu Leu Asp Glu Arg Arg Gly Glu Glu Val Val Arg Glu Ile

35 40 45

Leu Glu Ser Gly Gly Glu Ala Val Phe Val Arg Thr Asp Val Ser Glu

50 55 60

Phe Glu Gln Val Glu Ala Ala Val Glu Arg Ala Val Glu Glu Tyr Gly

65 70 75 80

Thr Leu Asp Val Met Phe Asn Asn Ala Gly Ile Gly His Tyr Ala Pro

85 90 95

Leu Leu Glu His Asp Pro Glu His Tyr Asp Arg Val Val Arg Val Asn

100 105 110

Gln Tyr Gly Val Tyr Tyr Gly Ile Leu Ala Ala Gly Arg Lys Met Ala

115 120 125

Glu Leu Glu Asn Pro Gly Val Ile Ile Asn Thr Ala Ser Val Tyr Ala

130 135 140

Phe Leu Ala Ser Pro Gly Val Ile Gly Tyr His Ala Ser Lys Gly Ala

145 150 155 160

Val Lys Met Met Thr Gln Ala Ala Ala Leu Glu Leu Ala Pro His Gly

165 170 175

Ile Arg Val Val Ala Ile Ala Pro Gly Gly Val Asp Thr Pro Ile Ile

180 185 190

Gln Gly Tyr Lys Asp Met Gly Leu Gly Glu Arg Leu Ala Arg Gly Gln

195 200 205

Met Arg Arg Arg Leu Gln Thr Pro Glu Gln Ile Ala Gly Ala Val Val

210 215 220

Leu Leu Ala Thr Glu Glu Ala Asp Ala Ile Asn Gly Ser Val Val Met

225 230 235 240

Thr Asp Asp Gly Tyr Ala Glu Phe Lys

245

<210>6

<211>250

<212>PRT

<213>Geobacillus kaustophilus

<400>6

Met Arg Leu Lys Gly Lys Ala Ala Ile Val Thr Gly Gly Ala Ser Gly

1 5 10 15

Ile Gly Arg Ala Thr Ala Ile Arg Phe Ala Glu Glu Gly Ala Lys Val

20 25 30

Ala Val Ser Asp Ile Asn Glu Glu Gly Gly Glu Glu Thr Val Arg Leu

35 40 45

Ile Arg Glu Lys Gly Gly Glu Ala Ile Phe Val Gln Thr Asp Val Ala

50 55 60

Asp Ser Lys Gln Val Ser Arg Leu Val Gln Thr Ala Val Asp Ala Phe

65 70 75 80

Gly Gly Leu His Ile Leu Phe Asn Asn Ala Gly Ile Gly His Ser Glu

85 90 95

Val Arg Ser Thr Asp Leu Ser Glu Glu Glu Trp Asp Arg Val Ile Asn

100 105 110

Val Asn Leu Lys Gly Val Phe Leu Gly Ile Lys Tyr Ala Val Pro Val

115 120 125

Met Lys Gln Cys Gly Gly Gly Ala Ile Val Asn Thr Ser Ser Leu Leu

130 135 140

Gly Ile Lys Gly Lys Lys Tyr Glu Ser Ala Tyr Asn Ala Ser Lys Ala

145 150 155 160

Gly Val Ile Leu Leu Thr Lys Asn Ala Ala Leu Glu Tyr Gly Lys Phe

165 170 175

Asn Ile Arg Val Asn Ala Ile Ala Pro Gly Val Ile Asp Thr Asn Ile

180 185 190

Ile Thr Pro Trp Lys Gln Asp Glu Arg Lys Trp Pro Ile Ile Ser Lys

195 200 205

Ala Asn Ala Leu Gly Arg Ile Gly Thr Pro Glu Glu Val Ala Asn Ala

210 215 220

Val Leu Phe Leu Ala Ser Asp Glu Ala Ser Phe Ile Thr Gly Ala Thr

225 230 235 240

Leu Ser Val Asp Gly Gly Gly Leu Thr Phe

245 250

<210>7

<211>252

<212>PRT

<213>橙色绿屈挠菌

<400>7

Met Glu Pro Pro Phe Ile Gly Lys Val Ala Leu Val Thr Gly Ala Ala

1 5 10 15

Ala Gly Ile Gly Arg Ala Ser Ala Leu Ala Phe Ala Arg Glu Gly Ala

20 25 30

Lys Val Val Val Ala Asp Val Asn Val Glu Gly Gly Glu Glu Thr Ile

35 40 45

Ala Leu Cys Arg Ala Leu Asn Thr Asp Ala Met Phe Val Arg Cys Asp

50 55 60

Val Ser Gln Arg Asp Glu Val Glu Arg Leu Ile Ala Leu Ala Val Asp

65 70 75 80

Thr Phe Gly Arg Ile Asp Phe Ala His Asn Asn Ala Gly Ile Glu Gly

85 90 95

Val Gln Ala Met Leu Ala Asp Tyr Pro Glu Glu Val Trp Asp Arg Val

100 105 110

Ile Glu Ile Asn Leu Lys Gly Val Trp Leu Cys Met Lys Tyr Glu Ile

115 120 125

Arg His Met Leu Lys Gln Gly Gly Gly Ala Ile Val Asn Thr Ser Ser

130 135 140

Val Ala Gly Leu Ala Gly Ser Arg Gly Val Ser Ala Tyr Val Ala Ser

145 150 155 160

Lys His Gly Ile Val Gly Ile Thr Lys Ala Ala Ala Leu Glu Tyr Ala

165 170 175

Arg Asn Gly Ile Arg Val Asn Ala Ile Cys Pro Gly Thr Ile His Thr

180 185 190

Ala Met Ile Asp Arg Phe Thr Gln Gly Asp Pro Gln Leu Leu Ala Gln

195 200 205

Phe Ala Glu Gly Glu Pro Ile Gly Arg Leu Gly Ser Pro Glu Glu Val

210 215 220

Ala Asn Ala Val Ile Trp Leu Cys Ser Asp Lys Ala Ser Phe Val Thr

225 230 235 240

Gly Ala Thr Leu Ala Val Asp Gly Gly Arg Leu Ala

245 250

<210>8

<211>241

<212>PRT

<213>木兰假丝酵母

<400>8

Met Thr Ser Thr Pro Asn Ala Leu Ile Thr Gly Gly Ser Arg Gly Ile

1 5 10 15

Gly Ala Ser Ala Ala Ile Lys Leu Ala Gln Glu Gly Tyr Ser Val Thr

20 25 30

Leu Ala Ser Arg Asp Leu Glu Lys Leu Thr Glu Val Lys Asp Lys Leu

35 40 45

Pro Ile Val Arg Gly Gly Gln Lys His Tyr Val Trp Gln Leu Asp Leu

50 55 60

Ala Asp Val Glu Ala Ala Ser Ser Phe Lys Ala Ala Pro Leu Pro Ala

65 70 75 80

Ser Ser Tyr Asp Leu Phe Val Ser Asn Ala Gly Ile Ala Gln Phe Ser

85 90 95

Pro Thr Ala Glu His Thr Asn Ser Glu Trp Leu Asn Ile Met Thr Ile

100 105 110

Asn Leu Val Ser Pro Ile Ala Leu Thr Lys Ala Leu Leu Gln Ala Val

115 120 125

Ser Gly Arg Ser Ser Glu Asn Pro Phe Gln Ile Val Phe Ile Ser Ser

130 135 140

Val Ala Ala Leu Arg Gly Val Ala Gln Thr Ala Val Tyr Ser Ala Ser

145 150 155 160

Lys Ala Gly Thr Asp Gly Phe Ala Arg Ser Leu Ala Arg Glu Leu Gly

165 170 175

Pro Gln Gly Val His Val Asn Val Val Asn Pro Gly Trp Thr Lys Thr

180 185 190

Asp Met Thr Glu Gly Val Glu Thr Pro Lys Asp Met Pro Ile Lys Gly

195 200 205

Trp Ile Gln Pro Glu Ala Ile Ala Asp Ala Val Val Phe Leu Ala Arg

210 215 220

Ser Lys Asn Ile Thr Gly Ala Asn Ile Val Val Asp Asn Gly Phe Ser

225 230 235 240

Thr

<210>9

<211>241

<212>PRT

<213>木兰假丝酵母

<400>9

Met Thr Thr Thr Ser Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile

1 5 10 15

Gly Ala Ala Ser Ala Ile Lys Leu Ala Gln Glu Gly Tyr Asn Val Thr

20 25 30

Leu Ala Ser Arg Ser Val Asp Lys Leu Asn Glu Val Lys Ala Lys Leu

35 40 45

Pro Ile Val Gln Asp Gly Gln Lys His Tyr Ile Trp Glu Leu Asp Leu

50 55 60

Ala Asp Val Glu Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala

65 70 75 80

Arg Ser Tyr Asp Val Phe Val Ser Asn Ala Gly Val Ala Ala Phe Ser

85 90 95

Pro Thr Ala Asp His Asp Asp Lys Glu Trp Gln Asn Leu Leu Ala Val

100 105 110

Asn Leu Ser Ser Pro Ile Ala Leu Thr Lys Ala Leu Leu Lys Asp Val

115 120 125

Ser Glu Arg Pro Val Asp Lys Pro Leu Gln Ile Ile Tyr Ile Ser Ser

130 135 140

Val Ala Gly Leu His Gly Ala Ala Gln Val Ala Val Tyr Ser Ala Ser

145 150 155 160

Lys Ala Gly Leu Asp Gly Phe Met Arg Ser Val Ala Arg Glu Val Gly

165 170 175

Pro Lys Gly Ile His Val Asn Ser Ile Asn Pro Gly Tyr Thr Lys Thr

180 185 190

Glu Met Thr Ala Gly Ile Glu Ala Leu Pro Asp Leu Pro Ile Lys Gly

195 200 205

Trp Ile Glu Pro Glu Ala Ile Ala Asp Ala Val Leu Phe Leu Ala Lys

210 215 220

Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Leu Ile

225 230 235 240

Ala

<210>10

<211>252

<212>PRT

<213>木兰假丝酵母

<400>10

Met Ser Tyr Gln Met Ser Ser Ser Ala Pro Ser Ser Thr Ser Leu Asn

1 5 10 15

Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile

20 25 30

Lys Leu Ala Glu Glu Gly Tyr Ser Val Thr Ile Ala Ser Arg Gly Leu

35 40 45

Lys Gln Leu Glu Ala Val Lys Ala Lys Leu Pro Ile Val Lys Gln Gly

50 55 60

Gln Val His His Val Trp Gln Leu Asp Leu Ser Asp Val Asp Ala Ala

65 70 75 80

Ala Ala Phe Lys Gly Ser Pro Leu Pro Ala Ser Arg Tyr Asp Val Leu

85 90 95

Val Ser Asn Ala Gly Val Ala Gln Phe Ser Pro Phe Ile Glu His Ala

100 105 110

Lys Gln Asp Trp Ser Gln Met Leu Ala Ile Asn Leu Ala Ala Pro Ile

115 120 125

Ala Leu Ala Gln Thr Phe Ala Lys Ala Ile Gly Asp Lys Pro Arg Asn

130 135 140

Thr Pro Ala His Ile Val Phe Val Ser Ser Asn Val Ser Leu Arg Gly

145 150 155 160

Phe Pro Asn Ile Gly Val Tyr Thr Ala Thr Lys Ala Gly Ile Asp Gly

165 170 175

Phe Met Arg Ser Val Ala Arg Glu Leu Gly Pro Ser Gly Ile Asn Val

180 185 190

Asn Ser Val Asn Pro Gly Pro Thr Arg Thr Glu Met Thr Lys Gly Ile

195 200 205

Asp Val Gly Thr Ile Asp Met Pro Ile Lys Gly Trp Ile Glu Pro Glu

210 215 220

Ala Ile Ala Asp Ala Val Leu Phe Val Val Lys Ser Lys Asn Ile Thr

225 230 235 240

Gly Thr Thr Val Val Val Asp Asn Gly Ser Ser Ala

245 250

<210>11

<211>252

<212>PRT

<213>木兰假丝酵母

<400>11

Met Thr Thr Ser Ser Thr Ser Ser Ser Thr Ser Ser Arg Ser Leu Asn

1 5 10 15

Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile

20 25 30

Lys Leu Ala Ser Glu Gly Tyr Ser Val Thr Leu Ala Ser Arg Ser Leu

35 40 45

Glu Gln Leu Lys Ala Leu Lys Glu Lys Leu Pro Val Val Lys Gln Gly

50 55 60

Gln Thr His His Val Trp Gln Leu Asp Leu Ser Asp Val Asp Ala Ala

65 70 75 80

Ala Thr Phe Lys Gly Ser Pro Leu Pro Ala Ser Ser Tyr Asp Ala Val

85 90 95

Ile Ser Asn Ala Gly Val Ala Gln Phe Ser Pro Leu Ser Glu His Ala

100 105 110

Arg Glu Asp Trp Ser Gln Met Leu Thr Ile Asn Leu Ala Ala Pro Ile

115 120 125

Ala Leu Ala Gln Ala Phe Val Lys Ala Ile Gly Asp Lys Lys Arg Asp

130 135 140

Ile Pro Ala Gln Ile Val Phe Val Ser Ser Asn Val Val Met Arg Gly

145 150 155 160

Leu Pro Tyr Leu Gly Ile Tyr Thr Ala Ser Lys Ala Gly Ile Asp Gly

165 170 175

Phe Met Arg Ser Ala Ala Arg Glu Leu Gly Pro Lys Gly Ile Asn Val

180 185 190

Asn Ser Val Asn Pro Gly Ala Thr Gln Thr Glu Met Thr Lys Gly Val

195 200 205

Asp Val Asn Ala Leu Asp Leu Pro Ile Lys Gly Trp Ile Gln Leu Glu

210 215 220

Ala Val Ala Asp Ala Val Leu Phe Val Val Gln Ser Lys Asn Ile Thr

225 230 235 240

Gly Thr Thr Ile Val Val Asp Asn Gly Ser Val Ala

245 250

<210>12

<211>240

<212>PRT

<213>木兰假丝酵母

<400>12

Met Asn Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile

1 5 10 15

Ala Val Lys Leu Ala Glu Asp Gly Tyr Ser Val Thr Leu Ala Ser Arg

20 25 30

Ser Leu Glu Lys Leu Glu Ser Leu Lys Lys Gly Leu Pro Val Val Lys

35 40 45

Asp Gly Gln Ala His His Val Trp Glu Leu Asp Leu Gly Asp Val Asp

50 55 60

Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala Glu Ala Tyr Asp

65 70 75 80

Val Phe Val Ser Asn Ala Gly Met Ala Lys Ser Thr Leu Met Val Asp

85 90 95

His Pro Ile Asp Glu Leu Gln Asp Met Ile Asn Val Asn Leu Val Ser

100 105 110

Pro Ile Ala Leu Thr Gln Gly Leu Val Lys Ala Leu Thr Glu Ser Lys

115 120 125

Arg Asp Lys Pro Ala His Ile Val Phe Met Ser Ser Ile Arg Ser Phe

130 135 140

Arg Gly Ile Pro Asn Gly Ala Val Tyr Ser Ala Thr Lys Ser Gly Leu

145 150 155 160

Asp Gly Phe Met Arg Ser Ile Ala Arg Glu Leu Gly Pro Gln Gly Ile

165 170 175

His Val Asn Ser Val Cys Pro Gly Phe Val Gln Thr Glu Met Thr Arg

180 185 190

Lys Val Asp Met Glu Ser Lys Lys Asp Gln Leu Pro Ile Ala Gly Trp

195 200 205

Ile Gln Pro Asp Ala Ile Ala Asp Thr Val Leu Phe Phe Val Lys Ser

210 215 220

Lys Asn Ile Thr Gly Gln Ala Ile Val Val Asp Asn Gly Ile Thr Val

225 230 235 240

<210>13

<211>244

<212>PRT

<213>Candida gropengiesseri

<400>13

Met Pro Ser Gly Leu Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile

1 5 10 15

Gly Ala Ala Ala Ala Thr Lys Leu Ala Ala Ala Gly Tyr Asn Val Thr

20 25 30

Val Ala Ser Arg Gly Val Glu Ala Leu Asn Lys Val Lys Ala Ser Leu

35 40 45

Pro Val Val Lys Glu Gly Gln Gln His His Val Trp Gln Leu Asp Val

50 55 60

Ser Asp Leu Ala Ala Val Ser Gly Phe Lys Gly Ser Pro Leu Pro Ala

65 70 75 80

Lys Ser Tyr Asp Val Val Val Val Asn Ala Gly Val Ala Asn Leu Ser

85 90 95

Pro Leu Ala Ala Gln Asp Asp Asp Val Ile Gln Asn Ile Val Thr Val

100 105 110

Asn Leu Leu Ser Pro Ile Ala Leu Val Lys Ser Leu Ile Lys Ala Tyr

115 120 125

Gly Glu Gly Pro Arg Ala Thr Pro Ala His Ile Val Phe Val Ser Ser

130 135 140

Val Ala Ala Ile Arg Gly Phe Pro Asn Gly Ala Val Tyr Ser Ser Thr

145 150 155 160

Lys Ser Ala Leu Asp Gly Leu Thr Arg Ser Leu Ala Lys Glu Leu Gly

165 170 175

Pro Gln Asn Ile Arg Val Asn Ser Val Asn Pro Gly Phe Thr Arg Thr

180 185 190

Glu Leu Ala Ser Gly Val Asp Ile Asp Ala Val Thr Gln Ser Ser Pro

195 200 205

Ile Lys Gly Trp Val Glu Pro Glu Ala Ile Gly Asp Ala Ile Leu Phe

210 215 220

Leu Ala Thr Ser Asn His Ile Thr Gly Thr Ile Thr Val Ile Asp Asn

225 230 235 240

Gly Thr Ser Ala

<210>14

<211>249

<212>PRT

<213>假丝酵母属

<400>14

Met Ser Ser Ser Ser Ser Ser Thr Pro Leu Asn Ala Leu Val Thr Gly

1 5 10 15

Ala Ser Arg Gly Ile Gly Glu Val Ile Ser Leu Gln Leu Ala Asn Glu

20 25 30

Gly Tyr Asn Val Thr Leu Ala Ala Arg Ser Leu Asp Asp Leu Asn Ala

35 40 45

Val Lys Ala Lys Leu Pro Ile Val Arg Asp Ala Gln Lys His Ser Val

50 55 60

Trp Pro Leu Asp Ile Ser Asp Ile Asp Ala Val Thr Asn Phe Lys Gly

65 70 75 80

Ser Pro Leu Pro Ala Glu Lys Tyr Asp Leu Phe Val Ser Asn Ala Gly

85 90 95

Val Val Asp Phe Ala Pro Leu Val His Gln Ser Pro Glu Ser Ile Ser

100 105 110

Ser Leu Phe Asn Val Asn Leu Ile Ala Pro Val Ala Leu Thr Lys Ala

115 120 125

Leu Leu Lys Ala Phe Gly Asp Ser Pro Arg Lys Thr Thr Thr His Phe

130 135 140

Ile Tyr Val Ser Ser Val Val Ala Leu Arg Gly Phe Pro Asn Val Ala

145 150 155 160

Val Tyr Ser Ser Ser Lys Ser Gly Leu Asp Gly Phe Val Arg Ser Leu

165 170 175

Ala Ala Glu Val Ala Pro Leu Asn Ile Arg Val Asn Ser Ile Asn Pro

180 185 190

Gly Pro Thr Lys Thr Glu Met Thr Ala Ser Leu Asp Val Glu Ala Phe

195 200 205

Thr Ala Gly Asn Pro Ile Lys Gly Trp Ile Tyr Pro Asp Ala Ile Ala

210 215 220

Asp Gly Val Val Tyr Leu Ala Lys Ser Lys Asn Ile Thr Gly Ile Thr

225 230 235 240

Leu Gln Val Asp Asn Gly Ala Gly Ile

245

<210>15

<211>241

<212>PRT

<213>Candida vaccinii

<400>15

Met Arg Ser Thr Pro Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile

1 5 10 15

Gly Ala Ala Ala Ala Ile Lys Leu Ala Glu Ala Gly Tyr Ser Val Thr

20 25 30

Leu Ala Ser Arg Gly Leu Asp Lys Leu Asn Glu Val Lys Ala Lys Leu

35 40 45

Pro Val Val Lys Gln Gly Gln Glu His His Val Trp Gln Leu Asp Leu

50 55 60

Ser Asp Val Gln Ala Ala Leu Glu Phe Lys Gly Ala Pro Leu Pro Ala

65 70 75 80

Ser Lys Tyr Asp Leu Phe Val Ser Asn Ala Gly Val Ala Thr Phe Ser

85 90 95

Pro Thr Ala Glu His Asp Asp Lys Asp Trp Gln Asn Ile Ile Ala Val

100 105 110

Asn Leu Thr Ser Pro Ile Ala Ile Thr Lys Ala Leu Val Lys Ala Val

115 120 125

Gly Glu Arg Ser Asn Asp Asn Pro Phe Gln Ile Ala Phe Leu Ser Ser

130 135 140

Ala Ala Ala Leu Arg Gly Val Pro Gln Thr Ala Val Tyr Ser Ala Thr

145 150 155 160

Lys Ala Gly Leu Asp Gly Phe Thr Arg Ser Leu Ala Lys Glu Leu Gly

165 170 175

Pro Lys Gly Ile His Val Asn Ile Val His Pro Gly Trp Thr Gln Thr

180 185 190

Glu Met Thr Ala Gly Val Asp Glu Pro Arg Asp Thr Pro Ile Pro Gly

195 200 205

Trp Ile Gln Pro Glu Ala Ile Ala Glu Ala Ile Val Tyr Leu Ala Lys

210 215 220

Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Leu Thr

225 230 235 240

Ile

<210>16

<211>720

<212>DNA

<213>木兰假丝酵母

<400>16

atgaacgctc tagtgaccgg tggtagccgt ggcattggcg aggcgatcgc gaccaagctg 60

gccgaagatg gctacagcgt gacaatcgcc tcgcgcggaa tcgatcagct caacaaggta 120

aaggctaaac ttccggttgt gagggagggc cagacccacc acgtgtggca gcttgatttg 180

agcgacgccg aggccgcgtc gtccttcaag ggcgctcctt tgccagcaag cagctacgat 240

gtccttgtca acaacgccgg agtaacggat ccgagtccca ttgcgaagca gtcggatagc 300

gagattcaca agctgtttag cgtgaatctg ctgtcaccag ttgctttgac aaagacgtac 360

gtccaggcgg ttaccggaaa gcctcgtgag acgccagctc acattatttt tatctcgtca 420

ggcgttgcca ttcgaggcta cccaaacgtc gctgtatact cggctactaa gagcgggctc 480

gacggtttca tgaggtctct ggcgcgcgag cttggccccg agggcgtcca tgtgaacact 540

gtcagcccgg gtctcaccaa aaccgagatg gccagcggcg tcagcctcga cgacttcccg 600

ccatcgccga ttgggggctg gatccagccc gaggccatcg ctgatgcagt gaggtacctg 660

gtgaagtcga agaacatcac aggcacgatt ctgtcagttg acaacggaat cacggtttaa 720

<210>17

<211>726

<212>DNA

<213>木兰假丝酵母

<400>17

atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc 60

gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa 120

ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg 180

cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg 240

agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag 300

cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc 360

acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg 420

tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg 480

aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt 540

catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct 600

gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg 660

ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg 720

gtctaa 726

<210>18

<211>726

<212>DNA

<213>Candida geochares

<400>18

atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc 60

gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa 120

ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg 180

cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg 240

agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag 300

cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc 360

acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg 420

tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg 480

aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt 540

catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct 600

gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg 660

ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg 720

gtctaa 726

<210>19

<211>720

<212>DNA

<213>木兰假丝酵母

<400>19

atgaacgcgt tagtgaccgg cggaagccgc gggatcggcg aggccacggc catacagctg 60

gctcaggagg gctacggtgt gacattggtt gcgcgaggag cccgccagct caatgaagtg 120

ttggcaaagc taccagttgt gagagacgga cagacgcacc acatttggca gctagatctg 180

agcgatcctg aggcggccgc tgccttcagg ggtgctcctt tgcccgccag cagctacgac 240

gtgctgatca ataacgcagg tgttagtagt ctcagcccgt tcgtcgcgca gtctgatgag 300

gtccagaaaa ctattttagc ggtgaatctt ttgtcgccaa tcgcgttgac gaaggcgttc 360

gtgaaggcag cggtgggcaa gccgcgtgag aggccggcgc atatcatttt catctcttcg 420

ggcgctgccc tgcgcggttt cgcgaacatg gcagtgtata gtgcaacgaa aggcggcctt 480

gacagtttca tgcgctcgct agctagagag ctaggtcccc agggcatcca cgtcaactca 540

gtcaatccgg gctttactga aacagaaatg acagccacta cagatttgaa tgactacccc 600

ccgaccccca ttgagggctg gattcagcct cgcgcaatcg ccgacgctat acttttccta 660

ctgaagtcca gaaacatcac tggcacaaat gtgaccgtcg acaacggcat cactgtttga 720

<210>20

<211>750

<212>DNA

<213>Rubrobacter xylanophilus

<400>20

atgctcgagg ggaaggtcgc ggtcatcacg ggggccggca gcggcatagg ccgggccacc 60

gcgctcaggt tcgcccgcga aggggcccgg gtggtcgtgg cggagctcga cgagcggagg 120

ggggaggagg tcgtccggga gatcctcgag tccggcgggg aggccgtctt cgtgaggacg 180

gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg 240

acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac 300

gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata 360

ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc 420

tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg 480

gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc 540

gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc 600

ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc 660

ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg 720

accgacgacg gctacgcgga gttcaagtaa 750

<210>21

<211>753

<212>DNA

<213>Gebacillus kaustophilus

<400>21

atgaggctaa aaggaaaagc ggcgattgtc accggcggcg cgagcggcat cggccgggcg 60

acggcgattc gctttgcgga agaaggcgcc aaagtggcgg tgagcgacat caatgaggaa 120

ggaggggaag aaacggtccg cctgattcgg gaaaaaggag gggaggcgat ttttgtccaa 180

acggacgtag ccgattccaa gcaagtgagc cgccttgtcc aaacggcggt tgatgccttt 240

ggcggcctac atattctctt taacaatgcc ggcatcggcc attcggaagt gcggagcacc 300

gacttgtctg aagaagagtg ggaccgggtc atcaacgtta atttgaaagg agtgttcctt 360

ggcatcaaat acgcggtgcc cgtgatgaag caatgcggtg gcggggccat tgtcaacaca 420

tcgagcctgc ttggaatcaa agggaaaaag tacgaatcgg cctacaacgc ctcgaaggcc 480

ggggtgattt tgttgacgaa aaatgcagca ttggaatatg ggaagtttaa cattcgcgtc 540

aatgccattg caccgggggt cattgatacg aacatcatca cgccgtggaa acaagatgag 600

cgcaaatggc cgatcatttc gaaagcgaac gccctcggcc gcatcgggac gccagaggaa 660

gtggcgaacg cggtgttgtt tttggcgtcc gatgaagcgt cgtttatcac cggcgcgaca 720

ttgtcggtcg acggcggcgg gctgacgttt tag 753

<210>22

<211>759

<212>DNA

<213>橙色绿屈挠菌

<400>22

atggagccac ctttcattgg gaaggttgcg ctggtcaccg gcgcagcagc cggtattggt 60

cgtgcttcag cactggcgtt tgcccgtgag ggtgccaagg ttgtcgttgc tgatgtgaat 120

gtcgagggcg gggaagagac gattgcgctg tgtcgggctt tgaataccga tgcaatgttc 180

gtgcgttgtg atgtttcgca acgcgatgaa gtggagcgat taattgctct ggcagttgac 240

acgttcggtc ggatcgactt tgcgcacaac aacgccggga ttgaaggcgt gcaggcaatg 300

ctggccgatt atcccgaaga ggtctgggat cgggtgatcg agatcaacct caaaggggtc 360

tggttgtgta tgaagtacga aatccggcac atgctcaagc agggtggcgg tgcgattgtg 420

aatacctcat cggtcgccgg tctggccgga tcacgtggcg tttcggcgta tgtagccagc 480

aagcacggta ttgttggtat taccaaagcg gcagcccttg agtatgcgcg taacggtatt 540

cgtgtcaacg caatctgtcc aggtacgatt catactgcga tgatcgaccg ctttacccag 600

ggtgatcccc aactgcttgc ccagttcgct gagggtgaac cgattggtcg gctcggctcg 660

cctgaagagg tcgccaatgc ggtgatctgg ctctgctcag ataaggcttc gtttgtgacc 720

ggagcgacac tggcggttga tggtggccgc ctggcgtaa 759

<210>23

<211>726

<212>DNA

<213>木兰假丝酵母

<400>23

atgacatcta cacctaatgc cctcatcacg ggaggcagcc gcggcattgg cgcttccgcc 60

gccatcaaac tggctcaaga agggtacagc gtcacgctgg cgtcccgcga ccttgagaaa 120

cttactgagg tcaaggacaa gctgccaatc gtgagaggtg gacagaaaca ctacgtttgg 180

cagctcgatc ttgccgatgt ggaggctgca tcgtctttca aggcggctcc tctgccggcc 240

agcagctacg atttgtttgt ttcgaacgcc ggaattgccc agttctcgcc tacggcagag 300

catactaata gtgagtggct gaacattatg accattaact tagtgtcccc gattgccctg 360

acgaaggctc ttttgcaggc cgtttctggg aggtcgagcg agaacccgtt tcagatcgtc 420

ttcatctcgt cggttgcagc actacgtggc gttgcacaaa cggccgtcta cagtgcgtcg 480

aaggctggta ctgatggatt cgcacgctca cttgctcgcg aactaggtcc tcaaggtgtt 540

catgtgaacg tggtgaaccc tggctggact aagacagaca tgacggaagg agtcgaaacc 600

ccaaaggaca tgcccattaa gggctggatc cagcctgagg caattgctga tgctgtagta 660

ttccttgcga ggtcgaaaaa cattaccggc gcgaatattg tagtggacaa tggtttctcg 720

acgtaa 726

<210>24

<211>726

<212>DNA

<213>木兰假丝酵母

<400>24

atgacgacta cttcaaacgc gcttgtcact ggaggcagcc gcggcattgg cgctgcctcc 60

gccattaagc tggctcagga gggctacaat gttacgctgg cctctcgcag tgttgataaa 120

ctgaatgaag taaaggcgaa actcccaatt gtacaggacg ggcagaagca ctacatttgg 180

gaactcgatc tggctgatgt ggaagctgct tcgtcgttca agggtgctcc tttgcctgct 240

cgcagctacg acgtctttgt ttcgaacgcg ggcgtcgctg cgttctcgcc cacagccgac 300

cacgatgata aggagtggca gaacttgctt gccgtgaact tgtcgtcgcc cattgccctc 360

acgaaggccc tcttgaagga tgtctccgaa aggcctgtgg acaagccact gcagattatc 420

tacatttcgt cggtggccgg cttgcatggc gccgcgcagg tcgccgtgta cagtgcatct 480

aaggccggtc ttgatggttt tatgcgctcc gtcgcccgtg aggtgggccc gaagggcatc 540

catgtgaact ccatcaaccc cggatacacg aagactgaaa tgaccgcggg cattgaagcc 600

cttcctgatt tgcctatcaa ggggtggatc gagcccgagg caattgctga cgcggttctg 660

tttctggcaa agtccaagaa tatcaccggc acaaacattg tggtcgacaa tggcttgatt 720

gcttaa 726

<210>25

<211>759

<212>DNA

<213>木兰假丝酵母

<400>25

atgtcttatc aaatgtcttc ttctgctcca tcctccacct ccctgaatgc gcttgtcacg 60

ggcggcagcc gcggcattgg cgaagccact gccattaagc tcgccgagga gggctacagc 120

gtcacgattg cgtctcgcgg ccttaagcag ctcgaggctg tgaaggccaa actacccatt 180

gtgaagcagg gacaggttca ccacgtgtgg cagcttgatc tcagtgatgt cgacgctgcg 240

gccgccttca aagggtcgcc gctacctgcc agccgctacg acgtgctcgt cagcaatgct 300

ggcgtggccc agtttagccc gttcatcgag catgcgaagc aggactggtc gcagatgctt 360

gccatcaatc tggcggcacc cattgcgctg gcccagacat ttgctaaggc cattggcgac 420

aagccgcgca acacaccggc ccacattgtg tttgtctcgt cgaacgtctc gttgcgaggc 480

ttcccgaaca tcggcgtcta cacggccacg aaagccggca ttgacggctt catgcgctcg 540

gtcgcacgcg aactggggcc cagcggcatt aacgtgaact ccgtgaaccc cgggcccacg 600

cggacggaga tgacgaaggg cattgacgtc ggcacgatcg atatgccgat caagggctgg 660

atcgagcccg aggcgattgc ggatgccgtg ctcttcgtgg tcaagtcgaa gaacattacg 720

ggcacgaccg ttgttgtcga caacggctcc tccgcttga 759

<210>26

<211>759

<212>DNA

<213>木兰假丝酵母

<400>26

atgaccacct cctccacctc ctcctccacc tcctcccgct ctctaaacgc tcttgtcacc 60

ggcgctagcc gcggcattgg cgaggccact gcaatcaagc tagcatctga gggatacagc 120

gttacgcttg catctcgtag cctcgagcag ctcaaggctt tgaaggagaa gttgcccgtt 180

gtgaagcagg gccagacgca ccacgtctgg cagctcgact tgagcgacgt cgacgccgct 240

gccacgttca agggctcccc cttgccggcc agcagctacg acgccgtcat cagcaatgcc 300

ggtgttgctc agttctctcc gttgtcggaa cacgccaggg aggactggtc tcagatgctg 360

acgatcaacc tcgcggctcc cattgccctc gcgcaggcgt ttgtgaaggc cattggcgac 420

aagaagcgcg acatcccggc ccaaattgtc tttgtttcgt cgaatgtcgt gatgcgtggc 480

ctcccttacc tcggcatcta cacggcttcg aaggctggta tcgatggctt catgcgctcg 540

gccgcccgcg agctgggacc caagggtatc aacgtgaact cagtaaaccc gggcgccacg 600

cagaccgaga tgacgaaggg cgttgatgtc aacgccctcg acctgccgat caagggatgg 660

attcagctcg aggctgtcgc ggacgccgtg ctcttcgtgg tccagtcgaa gaacattacc 720

ggcacgacga ttgttgtcga caacggctcc gtcgcttga 759

<210>27

<211>723

<212>DNA

<213>木兰假丝酵母

<400>27

atgaatgcct tagttactgg tgcgagccgc gggatcggcg aagcaattgc ggtgaagctg 60

gccgaggacg ggtacagcgt gacactggcc tcgcgctctc ttgaaaagct ggagtcgctc 120

aagaaagggc tgccggtcgt gaaggacggc caagcacatc atgtatggga gcttgatctc 180

ggtgatgttg atgccgcgtc atccttcaag ggggcgcctc tgcctgccga ggcctatgac 240

gtgttcgtca gtaacgctgg aatggccaaa tccaccttga tggtagacca tcccattgac 300

gagctgcagg acatgattaa cgtgaatctt gtgtcgccaa ttgcactcac acagggcctt 360

gtcaaggctc tgacagaatc taagcgagac aagcctgcgc atatcgtgtt catgtcgtcc 420

atccgctcgt tcaggggcat tccgaatggc gcggtgtaca gcgccacaaa gagtggtctt 480

gacggattca tgcgatccat tgcgcgagag ctgggccctc agggcatcca cgtcaactct 540

gtgtgccccg gattcgtgca aacggaaatg acgcgcaagg ttgatatgga gtcgaagaaa 600

gaccagctac ccatcgccgg ctggatccag cccgacgcga ttgctgacac cgttctgttt 660

tttgtgaaat cgaagaacat cacgggccag gcaattgtcg ttgacaatgg catcactgtc 720

tga 723

<210>28

<211>735

<212>DNA

<213>Candida gropengiesseri

<400>28

atgccctctg gactcaatgc tcttgtcact ggcggcagcc gcggaatcgg cgctgccgct 60

gctaccaagc tcgccgctgc aggatacaac gtcacggttg cgtcccgcgg ggtcgaggct 120

ctgaataagg tcaaggcctc cttgcctgtt gtcaaggagg gccagcagca ccatgtctgg 180

cagctcgacg taagcgatct cgcagcggtg tctggcttca agggatctcc gctgccggct 240

aagagctacg atgttgttgt tgttaacgcc ggcgtcgcga acctgagccc gctggctgcc 300

caggacgacg acgtcattca gaacattgtg accgtgaacc tgctgtcgcc gattgcgctg 360

gtgaagtcgc tgatcaaggc gtacggcgag ggtcctcgcg cgacaccggc ccacattgtg 420

tttgtgtcgt cggtggccgc gatccgtggg ttccccaacg gcgccgtcta tagctcgacg 480

aagagtgcgc tcgacgggct gacgcggtcg ctggcgaagg agctggggcc ccagaacatc 540

cgggtcaact ccgtgaaccc cggcttcacg aggaccgagc tggccagcgg cgtcgacatt 600

gacgccgtga cgcagagctc tccgatcaag gggtgggttg agccggaggc gattggcgat 660

gcgattttgt ttctcgcgac gtcgaaccac atcacgggca cgatcaccgt catcgacaac 720

ggcactagcg cgtag 735

<210>29

<211>750

<212>DNA

<213>假丝酵母属

<400>29

atgtcctcct cttcctcctc gactcctctc aacgctctcg tcaccggtgc cagccgcggc 60

atcggtgagg tcatctctct ccagctcgcc aacgagggct acaatgttac cctcgcagcc 120

cgcagtcttg acgacctcaa tgcggtgaag gctaagctcc ctatcgtaag ggatgcccag 180

aagcactctg tctggccgct cgacattagc gatatcgacg ccgtgacgaa cttcaaggga 240

tcgcccctgc cggccgagaa gtacgatctg ttcgtcagca acgccggcgt ggtcgacttc 300

gctccgcttg tccaccagag ccccgagagc atcagcagcc tgttcaatgt gaacctaatc 360

gcgcctgttg ccttgacaaa agctcttctt aaggcgttcg gtgacagccc tcgcaagact 420

acgactcact ttatctacgt ttcgtccgtt gttgccctcc gcggcttccc caatgttgcg 480

gtttacagct cctccaagag cggcctcgac gggtttgtgc gctcccttgc cgccgaggtt 540

gctccgctca acatccgcgt caactccatt aacccaggcc ctaccaagac tgagatgacc 600

gcttccctgg atgttgaggc gtttactgcg ggcaacccca tcaagggttg gatttacccc 660

gatgctattg ctgatggagt ggtgtacctg gcgaagtcga agaacattac tggtatcacc 720

ctccaagtcg acaacggcgc cggcatctaa 750

<210>30

<211>726

<212>DNA

<213>Candida vaccinii

<400>30

atgaggtcga cacctaacgc ccttgtgact ggcggcagcc gcggcattgg cgcggccgct 60

gcaattaaac tcgccgaggc aggctacagc gtgacgctcg cgtcgcgcgg tctcgacaag 120

ctcaacgagg tgaaggccaa gcttcctgtc gtgaagcagg gccaggagca ccatgtatgg 180

cagcttgatc tcagcgacgt gcaggccgcg ctcgagttca agggcgcacc gctgcccgcg 240

agtaagtacg atttgtttgt ctcgaacgcc ggcgtggcta ctttctcgcc aacggctgag 300

catgacgaca aggactggca gaacattatt gccgtgaact tgacatcgcc cattgccatt 360

acgaaggcgc tcgttaaggc cgttggcgag cgctcaaacg ataacccgtt tcagatcgcg 420

ttcctgtcat cggcggccgc cctgcgcggt gtgccgcaga ccgctgttta cagcgctacg 480

aaggccggcc tcgacggctt cacgcgctcg ctcgccaagg agctcggccc aaagggcatc 540

catgtgaaca tcgtacaccc tggatggacg cagaccgaga tgactgcggg tgtagatgag 600

cctagggata cgcccatccc gggctggatc cagccggaag ccatcgccga ggccattgtg 660

tatctcgcga agtcaaagaa catcacggga acgaacatcg ttgtcgacaa cggcctgact 720

atttaa 726

<210>31

<211>12

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>31

Asn Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly

1 5 10

<210>32

<211>12

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>32

Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly

1 5 10

<210>33

<211>5

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>33

Gly Tyr Ser Val Thr

1 5

<210>34

<211>5

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>34

Gly Tyr Asn Val Thr

1 5

<210>35

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>35

Gly Tyr Gly Ile Thr Leu

1 5

<210>36

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>36

Val Leu Ala Lys Leu Pro

1 5

<210>37

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>37

Val Lys Ala Lys Leu Pro

1 5

<210>38

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>38

Phe Lys Gly Ala Pro Leu Pro Ala

1 5

<210>39

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>39

Phe Arg Gly Ala Pro Leu Pro Ala

1 5

<210>40

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>40

Leu Lys Gly Ala Pro Leu Pro Ala

1 5

<210>41

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>41

Ser Pro Ile Ala Leu Thr Lys

1 5

<210>42

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>42

Ser Pro Val Ala Leu Thr Lys

1 5

<210>43

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>43

Ser Gln Ile Ala Leu Thr Gln

1 5

<210>44

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>44

Ala Val Tyr Ser Ala Ser Lys

1 5

<210>45

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>45

Ala Val Tyr Ser Ala Thr Lys

1 5

<210>46

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>46

Gly Val Tyr Ser Ala Thr Lys

1 5

<210>47

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>47

Pro Ile Lys Gly Trp Ile

1 5

<210>48

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>48

Pro Ile Glu Gly Trp Ile

1 5

<210>49

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>49

Pro Ile Gly Gly Trp Ile

1 5

<210>50

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>50

Pro Ile Ser Gly Trp Ile

1 5

<210>51

<211>5

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>51

Gly Tyr Gly Val Thr

1 5

<210>52

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>52

Phe Lys Ala Ala Pro Leu Pro Ala

1 5

<210>53

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>53

Phe Lys Gly Ser Pro Leu Pro Ala

1 5

<210>54

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>54

Gly Ile Gly Arg Ala Thr

1 5

<210>55

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>55

Gly Ile Gly Arg Ala Ser Ala

1 5

<210>56

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>56

Gly Ile Gly Arg Glu Thr

1 5

<210>57

<211>6

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>57

Asn Asn Ala Gly Ile Gly

1 5

<210>58

<211>7

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>58

Asn Asn Ala Gly Ile Glu Gly

1 5

<210>59

<211>9

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>59

Ile Arg Val Val Ala Ile Ala Pro Gly

1 5

<210>60

<211>9

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>60

Ile Arg Val Asn Ala Ile Ala Pro Gly

1 5

<210>61

<211>9

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>61

Ile Arg Val Asn Ala Ile Cys Pro Gly

1 5

<210>62

<211>9

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>62

Ile Arg Val Val Gly Ile Ala Pro Gly

1 5

<210>63

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>63

Pro Glu Gln Ile Ala Gly Ala Val

1 5

<210>64

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>64

Pro Glu Ala Ile Ala Asn Ala Val

1 5

<210>65

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>65

Pro Glu Glu Val Ala Asn Ala Val

1 5

<210>66

<211>8

<212>PRT

<213>人工序列

<220>

<223>部分氨基酸序列

<400>66

Pro Glu Ala Ile Ala Asn Ala Val

1 5

<210>67

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>67

gggaattcca tatgatgc tc gaggggaagg tcg 33

<210>68

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>68

cacatgcatg cgaatgctcg aggggaaggt c 31

<210>69

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>69

cccaagctta ttacttgaac tccgcgtagc cgtc 34

<210>70

<211>750

<212>DNA

<213>人工序列

<220>

<223>来自Rubrobacter xylanophilus的半合成基因序列

<400>70

atgctggaag gtaaagtggc agtcatcacc ggtgcaggca gcggcattgg gcgtgccact 60

gcgctgcgtt ttgcgcgtga aggcgctcgc gtcgttgtgg ccgagctgga tgaacgtcgc 120

ggtgaggaag ttgtacgtga gattctggaa tctggcgggg aggccgtctt cgtgaggacg 180

gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg 240

acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac 300

gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata 360

ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc 420

tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg 480

gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc 540

gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc 600

ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc 660

ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg 720

accgacgacg gctacgcgga gttcaagtaa 750

<210>71

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>71

cctagctagc atgctggaag gtaaagtggc 30

<210>72

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>72

cctttrcctg chagcagcta yg 22

<210>73

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>73

ggctggatcc agcccttrat sgg 23

<210>74

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>74

ggaattccat atgatgaacg ctctagtgac cggtggtag 39

<210>75

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物

<400>75

cccaagctta ttaaaccgtg attccgttgt caactgac 38

Claims

1.将通式I酮化合物对映选择性酶还原为通式II羟基化合物R，S-化合物的方法，

其中，R表示氨基官能的任何保护基团且X＝-Cl、-CN、-OH、Br、F，

其中R和X具有与式I中相同的含义，

所述的酮化合物在辅因子的存在下被氧化还原酶还原；

其特征在于

所述氧化还原酶由根据SEQ ID NO：1的氨基酸序列组成。

2.权利要求1的方法，其特征在于所述氨基官能的保护基团是叔丁氧羰基、苄氧羰基或9-芴甲氧羰基。

3.权利要求1或2的方法，其特征在于持续地再生形成的氧化的辅因子NAD或NADP。

4.权利要求1或2的方法，其特征在于通过氧化通式R_XR_YCHOH的仲醇持续地再生形成的氧化的辅因子NAD或NADP。

5.权利要求1或2的方法，其特征在于将2-丙醇、2-丁醇、2-戊醇、4-甲基-2-戊醇、2-庚醇或2-辛醇用作共底物。

6.权利要求1或2的方法，其特征在于添加附加的氧化还原酶/脱氢酶用于辅因子的再生。

7.权利要求1或2的方法，其特征在于式I化合物以＞20g/l的浓度存在于反应批次中。

8.权利要求1或2的方法，其特征在于式I化合物以＞50g/l的浓度存在于反应批次中。

9.权利要求1或2的方法，其特征在于式I化合物以＞100g/l的浓度存在于反应批次中。

10.权利要求1或2的方法，其特征在于TTN＞10³，所述TTN是指总转化数＝还原的式I化合物mol/所使用的辅因子mol。

11.权利要求1或2的方法，其特征在于其在水有机两相系统中进行。

12.权利要求1或2的方法，其特征在于还应用了有机溶剂。

13.权利要求12的方法，其特征在于所述有机溶剂选自二乙醚、叔丁基甲基醚、二异丙基醚、二丁基醚、乙酸乙酯、乙酸丁酯、庚烷、己烷或环己烷。

14.权利要求1或2的方法，其特征在于应用式IV的特定化合物作为酮化合物

15.氨基酸序列SEQ ID NO：1的多肽。

16.多肽，其由核酸序列SEQ ID NO：16编码。