CN101809158B - 中间体的对映选择性酶还原的方法 - Google Patents
中间体的对映选择性酶还原的方法 Download PDFInfo
- Publication number
- CN101809158B CN101809158B CN200880108175.7A CN200880108175A CN101809158B CN 101809158 B CN101809158 B CN 101809158B CN 200880108175 A CN200880108175 A CN 200880108175A CN 101809158 B CN101809158 B CN 101809158B
- Authority
- CN
- China
- Prior art keywords
- ala
- val
- gly
- leu
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 0 *CC([C@](Cc1ccccc1)N*)=O Chemical compound *CC([C@](Cc1ccccc1)N*)=O 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
Landscapes
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Wood Science & Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
对映选择性酶还原通式I酮化合物的方法,
Description
本发明涉及在辅因子的存在下应用氧化还原酶将通式I酮化合物分别对映选择性(enantioselective)酶还原为式II(R,S-醇)和III(S,S-醇)化合物的方法,
其中,R可以表示氨基官能的任何保护基团(叔丁氧羰基、苄氧羰基、9-芴甲氧羰基)且X=-Cl、-CN、-OH、Br、F,
优选的式I化合物含有丁氧羰基或苄氧羰基作为氨基保护基团并且在X的位置是氯原子。
通式II和III的手性醇是用于治疗HIV的蛋白酶抑制剂的生产中重要的中间体。此类蛋白酶抑制剂例如是:利托那韦(Ritonavir)、安泼那韦(Amprenavir)、福沙那韦(Fosamprenavir)、Atazanavir或Darunavir。
例如可通过式I相应酮化合物的对映选择性还原分别获得式 II(R,S-醇)和III(S,S-醇)中间体,其中所述的对映选择性还原在当前的生产方法中通过化学方法进行。在做这些时,化学催化还原具有这样的缺陷:一方面,其可能由于恶劣的反应条件而产生副产品,另一方面,分别产生不符合要求的对映体和非对映体过量,并且只有费很大的努力才能在技术上可行。因此,对映体富集形式的式II(R,S-醇)中间体比式III(S,S-醇)更难以化学获得。
由于这一原因,在相当一些时间,已努力开发允许所述中间体对映选择性还原的生物催化方法。生物催化方法通常在温和的条件下操作,由于这一原因,可预期它们能够还原式I的酮化合物而不会形成其它的副产品。然而,到目前为止,还没有可能发现可利用来用分离的酶进行酶还原的合适生物催化剂。
据我们所知,仅存在很少的这样的出版物,即在所述出版物中描述了在全细胞方法中应用红球菌属(Rhodococcus)或链霉菌属(Streptomyces)菌株的式I酮的反应(Tetrahedron Asymmetry 14(2003)3105-3109,Tetrahedron Asymmetry 8(1997)p.2547)。然而,该反应因此分别只能用野生型菌株全细胞和溶胞产物才发生,并且因此已只在远低于2%的非常低的浓度下进行,并且没有辅酶的再生。目前为止,还没有可在工业规模上可应用的酶还原方法,并且参与该反应的酶也还既未被分离也未被鉴定。
本发明的目的是提供能以高产量经济地分别产生对映体纯的对映体富集的通式II和III中间体,并且具有高对映体纯度而无任何副产品的方法。
根据本发明,通过最初提到的方法类型完成所述目的,其特征在于用于生产式II化合物(R,S-醇)的氧化还原酶:
a)包含根据SEQ ID NO:1、SEQ ID No 2、SEQ ID No 3或SEQ IDNo 4的氨基酸序列,
b)包含这样的氨基酸序列,其中至少60%的所述氨基酸与氨基酸序列SEQ ID NO:1、SEQ ID No 2或SEQ ID No 3、SEQ ID No 4的那些相同,或
c)包含这样的氨基酸序列,其中至少70%的所述氨基酸与氨基酸序列SEQ ID NO:1、SEQ ID No 2或SEQ ID No3、SEQ ID No 4的那些相同,或
d)由核酸序列SEQ ID NO:16、SEQ ID No 17、SEQ ID No 18、SEQ ID No 19编码,或
e)由在严格条件下与SEQ ID NO:16、SEQ ID No 17、SEQ ID No18、SEQ ID No 19杂交的核酸序列编码,
f)具有220至260个氨基酸的长度,并且包含一个或若干个选自序列SEQ ID NO:31至SEQ ID NO:51的部分序列,并且优先将式I化合物还原为式II化合物。
nalvtgasrgig(31)nalvtggsrgig(32),gysvt(33),gynvt(34),gygitl(35),gygvt(51)vlaklp(36),vkaklp(37)
fkgaplpa(38),frgaplpa(39),lkgaplpa(40),
spialtk(41),spvaltk(42),sqialtq(43),
avysask(44),avysatk(45),gvysatk(46),
pikgwi(47),piegwi(48),piggwi(49)and pisgwi(50),
此外,通过最初提到的方法类型完成所述目的,其特征在于用于生产式III化合物(S,S-醇)的氧化还原酶:
a)包含根据SEQ ID NO:5、SEQ ID No 6、SEQ ID No 7、SEQ IDNo 8、SEQ ID No 9、SEQ ID No 10、SEQ ID No 11、SEQ ID No 12、SEQ ID No 13、SEQ ID No 14、SEQ ID No 15的氨基酸序列;
b)包含这样的氨基酸序列,其中至少60%的所述氨基酸与根据SEQ ID NO:5、SEQ ID No 6、SEQ ID No 7、SEQ ID No 8、SEQ ID No9、SEQ ID No 10、SEQ ID No 11、SEQ ID No 12、SEQ ID No 13、SEQID No 14、SEQ ID No 15的氨基酸序列的那些相同,或
c)由核酸序列SEQ ID NO:20、SEQ ID No 21、SEQ ID No 22、SEQID No 23、SEQ ID No 24、SEQ ID No 25、SEQ ID No 26、SEQ ID No27、SEQ ID No 28、SEQ ID No 29或SEQ ID No 30编码,或
d)由在严格条件下与SEQ ID NO:20、SEQ ID No 21、SEQ ID No22、SEQ ID No 23、SEQ ID No 24、SEQ ID No 25、SEQ ID No 26、SEQ ID No 27、SEQ ID No 28、SEQ ID No 29或SEQ ID No 30杂交的核酸序列编码,
e)具有220至260个氨基酸的长度,并且包含一个或若干个选自序列SEQ ID NO:31至SEQ ID NO:66的部分序列,并且优先将式I化 合物还原为式III化合物。
nalvtgasrgig(31)nalvtggsrgig(32),gysvt(33),gynvt(34),gygitl(35),gygvt(51)
vlaklp(36),vkaklp(37)
fkgaplpa(38),frgaplpa(39),lkgaplpa(40),fkaaplpa(52),fkgsplpa(53)
spialtk(41),spvaltk(42),sqialtq(43),
avysask(44),avysatk(45),gvysatk(46),
pikgwi(47),piegwi(48),piggwi(49)and pisgwi(50),
gigrat(54),gigrasa(55),gigret(56),
nnagig(57),nnagieg(58),
irvvaiapg(59),irvnaiapg(60),irvnaicpg(61),irvvgiapg(62),
peqiagav(63),peaianav(64),peevanav(65),peaianav(66)。
将式I化合物优先还原为式II化合物的多肽应被理解为这样的多肽,即其中在最佳的反应条件下可达到的R,S-醇的最大对映体过量总计至少50%。最佳反应条件由此被理解为这样的多肽反应条件,即在该条件下,多肽产生R,S-醇的最大对映体过量。
已发现包含氨基酸序列SEQ ID NO:1、SEQ ID No 2、SEQ ID NO:3和SEQ ID No 4的多肽显示出氧化还原活性,并且可用于将式I化合物优先还原为式II化合物(R,S-化合物)。可达到的R,S-的醇的对映体过量总计>50%,优选>80%,并且尤其优选>95%。当应用SEQ ID NO:1时,达到的对映体过量例如可达到最高>99%的R,S-化合物(式II)。
类似地,已发现包含氨基酸序列SEQ ID NO:5至SEQ ID No 15的多肽显示出氧化还原活性,并且可用于将式I化合物优先还原为式III化合物(S,S-化合物)。可达到的R,S-醇的对映体过量总计>80%,优选>90%,并且尤其优选>95%。当应用SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:9或SEQ ID NO:12时,达到的对映体过量可达到最高>99%的R,S-化合物(式II)。
许多所提到的氧化还原酶诸如例如SEQID No 1、3、4、5、6、7和15还具有其它的优点,即它们能够通过还原仲醇再生在还原过程中形成的氧化的辅因子。因此,所述氧化还原酶特别的经济优点还在于,与现有技术方法相反,不需要其它的酶用于辅因子再生。
编码包含SEQ ID NO:5的多肽的DNA序列SEQ ID NO:20例如可 从生物Rubrobacter xylanophilus DSM 9941的基因组获得。
编码包含SEQ ID NO:6的多肽的DNA序列SEQ ID NO:21例如可从生物Geobacillus thermodenitrificans DSM 465的基因组获得。
编码包含SEQ ID NO:7的多肽的DNA序列SEQ ID NO:22例如可从生物橙色绿屈挠菌(Chloroflexus aurantiacus)DSM 635的基因组获得。
分别编码包含SEQ ID NO:8或SEQ ID NO:9的多肽的DNA序列SEQ ID NO:23或DNA序列SEQ ID NO:24例如可从生物木兰假丝酵母(Candida magnoliae)DSMZ 70638获得。
编码包含SEQ ID NO:11的多肽的DNA序列SEQ ID NO:26例如可从生物木兰假丝酵母(Candida magnoliae)DSMZ 70639获得。
编码包含SEQ ID NO:1的多肽的DNA序列SEQ ID NO:16例如可从生物木兰假丝酵母(Candida magnoliae)CBS 6396获得。
此外,SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15的氧化还原酶例如可从菌株木兰假丝酵母(Candida magnoliae)CBS 5659、CBS 7318、CBS2798、JCM 9448,Candida geochares MUCL 29832,假丝酵母属物种MUCL 40660,Candida gropengiesseri MUCL 29836通过同源筛选获得。
因此,本发明涉及将式I的酮化合物分别还原为通式II和III的化合物的方法,其特征在于明显过量地形成式II或III化合物之一,其应用包含氨基酸序列SEQ ID NO:1至SEQ ID NO:15之一的多肽,或包含与氨基酸序列SEQ ID NO:1至SEQ ID NO:15之一至少50%相同的氨基酸序列的多肽,即可通过替换、插入、缺失或添加至少一个氨基酸来源于序列SEQ ID NO:1至SEQ ID NO:15的多肽,或应用由核酸序列SEQ ID NO:16至SEQ ID NO:30之一编码的多肽,或由在严格条件下与序列SEQ ID NO:16至SEQ ID NO:30之一杂交的核酸序列编码的多肽。
例如在严格条件下与SEQ ID NO:16杂交的核酸序列被理解为可通过菌落杂交法、噬菌斑杂交方法、DNA印迹杂交法或类似方法,应用SEQ ID NO:16作为DNA探针鉴定的多核苷酸。
为这一目的,在60℃在0.7-1M NaCl溶液中使固定在滤器上的多 核苷酸例如与SEQ ID NO:16杂交。如例如在Molecular Cloning,ALaboratory Manual,Second Edition(Cold Spring Harbor LaboratoryPress,1989)或类似出版物上描述的那样进行杂交。随后,用0.1至2-倍SSC溶液在65℃洗涤滤器,其中1-倍SSC溶液被理解为由150mMNaCl和15mM柠檬酸钠组成的混合物。
此外,本发明涉及氨基酸序列SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15的多肽,以及与氨基酸序列SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15之一至少55%,优选65%-75%,尤其优选超过75%相同的多肽,即涉及可通过替换、插入、缺失、或添加至少一个氨基酸来源于序列SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14和SEQ ID NO:15的多肽。此外,本发明还涉及由核酸序列SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29或SEQ ID NO:30编码,或由在严格条件下与序列SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29或SEQ ID NO:30之一杂交的核酸序列编码的多肽。
在根据本发明的方法中,包含序列SEQ ID NO:1至SEQ IDNO:15的多肽和可来源于所述多肽的多肽分别可以以完全纯化的状态、部分纯化的状态或作为含有多肽SEQ ID NO:1至SEQ ID NO:15之一的细胞使用。由此可以以天然、透化的或裂解状态提供使用的细胞。优选地,使包含序列SEQ ID NO:1至SEQ ID NO:15的多肽和可来源于其的衍生物分别在合适的宿主生物中过表达,所述宿主生物诸如例如大肠杆菌(Escherichia coli),并且将重组多肽用于还原通式I的羟基酮。
根据本发明的酶还原在温和的条件下进行,因此可很大地避免不稳定的式I化合物的降解以及由此不期望的副产品的形成。取决于所使用的多肽,根据本发明的方法具有最高达99%的式II化合物(R,S-化合物)的对映体纯度,然而至少50%的R,S-化合物。
对于式III化合物(S,S-化合物),取决于所使用的多肽,根据本发明的方法具有最高达99%的式III化合物(S,S-化合物)的对映体纯度,然而至少80%的R,S-化合物。
本发明优选的实施方案的特征在于在该方法中使用的辅因子被共底物持续地还原。优选地,应用NAD(P)H作为辅因子,其中在还原中形成的NAD(P)通过共底物还原回NAD(P)H。
在根据本发明的方法中,优选持续地再生通过氧化还原酶/脱氢酶形成的氧化的辅因子NAD或NADP。
根据本发明所有方法的优选实施方案,通过醇的氧化再生氧化的辅因子NAD或NADP。
优选应用诸如2-丙醇、2-丁醇、2-戊醇、3-戊醇、4-甲基-2-戊醇、2-庚醇、2-辛醇或环己醇的仲醇作为共底物。根据特别优选的实施方案,将2-丙醇或4-甲基-2-戊醇用于辅酶再生。用于再生的共底物的量可以是总体积的5至95%体积。
优选地,将通式RXRYCHOH的仲醇用于辅因子再生,其中RX和RY独立地是氢、支链或非支链C1-C8-烷基并且C总≥3。
根据本发明方法其它优选的实施方案,添加其它的氧化还原酶/脱氢酶用于辅因子再生。
在其它优选的实施方案中,可还添加其它的醇脱氢酶用于辅因子的再生。合适的NADH-依赖性醇脱氢酶例如可从面包酵母,从近平滑假丝酵母(Candida parapsilosis(CPCR))(US 5,523,223和US5,763,236,Enzyme Microb.Technol.,1993,15(11):950-8),Pichiacapsulata(DE 10327454.4),从红串红球菌(Rhodococcus erythropolis(RECR))(US 5,523,223)、Norcardia fusca(Biosci.Biotechnol.Biochem.,63(10),1999,第1721-1729页;Appl.Microbiol.Biotechnol,.2003,62(4):380-6;Epub 2003,4月26日)或从赤红球菌(Rhodococcus ruber)(J.Org.Chem.,2003,68(2):402-6)获得。用于这些醇脱氢酶的合适的共底物例如是已经提到的仲醇,诸如2-丙醇(异丙醇)、2-丁醇、2-戊醇、4-甲基-2-戊醇、2-辛醇或环己醇。
用于NADPH再生的合适的仲醇脱氢酶例如是上面描述并且分离自乳杆菌(Lactobacillale)目生物的那些,所述生物例如高加索酸奶乳杆菌(Lactobacillus kefir)(US 5,200,335)、短乳杆菌(Lactobacillus brevis) (DE 19610984 A1;Acta Crystallogr.D.Biol.Crystallogr.2000Dec;56Pt 12:1696-8)、稍小乳杆菌(Lactobacillus minor)(DE 10119274)、肉色明串珠菌(Leuconostoc carnosum)(A 1261/2005,K1.C12N),或如所描述的那样,来自Thermoanerobium brockii、Thermoanerobiumethanolicus或拜氏梭菌(Clostridium beijerinckii)的那些。
然而,原则上其它酶系统也可用于辅因子再生。例如,可应用NAD-或NADP-依赖性甲酸脱氢酶实现辅因子再生(Tishkov等,J.Biotechnol.Bioeng.[1999]64,187-193,Pilot-scale production andisolation of recombinant NAD and NADP specific formatedehydrogenase)。甲酸脱氢酶的合适共底物例如是甲酸盐,诸如甲酸铵、甲酸钠或甲酸钙。
在根据本发明的方法中,反应批次中使用的通式I化合物的量优选为基于总体积的10g/l至500g/l,优选25g/l至300g/l,特别优选50g/l至200g/l。
进行酶还原的反应混合物中水性部分优选含有缓冲剂,例如,磷酸钾、tris/HCl或三乙醇胺缓冲剂,其具有5-10的pH值,优选6-9的pH值。此外,该缓冲剂可以含有用于稳定或活化酶的离子,例如诸如,锌离子或镁离子。
当实施根据本发明的方法时,温度合适地是约10℃至70℃,优选20℃至45℃。
在根据本发明的方法的其它优选实施方案中,在有机溶剂的存在下进行酶反应,其中所述的有机溶剂不与水混溶或仅以非常小的程度与水混溶。所述溶剂例如是对称的或非对称的二(C1-C6)烷基醚、直链或支链烷或环烷或不溶于水的仲醇,其同时作为共底物。优选的有机溶剂是二乙醚、叔丁基甲基醚、二异丙基醚、二丁基醚、乙酸丁酯、庚烷、己烷、2-辛醇、2-庚醇、4-甲基-2-戊醇和环己醇。在这种情况下,该溶剂又可同时作为用于辅因子再生的共底物。
如果分别使用不溶于水的溶剂和共底物,反应批次由水相和有机相组成。根据其溶解度,通式化合物分布在有机相和水相之间。一般而言,基于总反应体积,有机相具有5至95%的比例,优选10至90%。优选机械地混合物两个液态相,因此在它们之间产生大的表面面积。在这一实施方案中,例如,在酶还原期间形成的NAD(P)也可被诸如 上面描述的共底物还原回NAD(P)H。
在水相中辅因子(特别是NADH或NADPH)的浓度分别一般为0.001mM至10mM,特别是0.01mM至1mM。
在根据本发明的方法中达到的TTN(总转化数=还原的式I化合物mol/所使用的辅因子mol)通常为102至105,然而优选为≥103。
在根据本发明的方法中,还可使用氧化还原酶/脱氢酶的稳定剂。合适的稳定剂例如是甘油、山梨醇、1,4-DL-二硫苏糖醇(DTT)或二甲基亚砜(DMSO)。
根据本发明的方法例如在由玻璃或金属制成的封闭反应容器中进行。为这一目的,将成分单个地转移至该反应容器中,并且在例如氮气或空气气氛中搅拌。
根据本发明另一可能的实施方案,可持续地移除氧化的共底物(例如丙酮)和/或可持续地新添加共底物(例如,2-丙醇),以使得反应平衡偏向反应产物。
在其它实施方案中,在反应过程中逐渐地添加根据SEQ ID NO:1至SEQID No15的氧化还原酶和/或共底物。
在反应完成后,处理反应混合物。为这一目的,例如任选地将水相从有机相中分离,并且过滤含有产物的有机相。任选地,还可萃取水相并如有机相那样进一步处理。随即从有机相中蒸发溶剂,并且作为粗产物获得通式II或III的产物。然后可进一步纯化粗产物,或将其直接用于结果产物的合成。
以下通过实施例的方式进一步阐明本发明。
实施例1
克隆并提供来自Rubrobacter xylanophilus DSM 9941的氧化还原酶(SEQ ID No 5)
A)Rubrobacter xylanophilus DSM 9941的培养
在细菌摇床上以140rpm在50℃(pH 7.2)的以下培养基中培养Rubrobacter xylanophilus DSM 9941细胞:0.1%酵母提取物、0.1%胰蛋白胨、0.004%CaSO4x 2H2O、0.02%MgCl2x 6H2O、0.01%氨三乙酸、100ml磷酸盐缓冲液[5.44g/l KH2PO4、43g/l Na2HPO4x 12H2O]、500μl/l 0.01M柠檬酸铁、500μl/l微量元素[500μl/l H2SO4、 2.28g/l MnSO4x H2O、500mg/l ZnSO4x 7H2O、500mg H3BO3、25mg/lCuSO4x 5H2O、25mg/l Na2MoO4x 2H2O、45mg/l CoCl2x 6H2O]。在培养的第6天,通过离心从培养基中分离细胞,并且储存在-80℃。
B)编码选择性氧化还原酶的基因的扩增
根据描述于Manniatis&Sambrook的“Molecular Cloning”中所描述的方法提取基因组DNA。将得到的核酸用作聚合酶链式反应(PCR)的模板,所述PCR包含来源于NCBI数据库中46106817号下公开的基因序列的特异性引物。为了完成这些,在引物的5’端位置分别提供了用于核酸内切酶Nde I和Hind III或Sph I的限制性位点(SEQID NO:67、SEQ ID NO:68、SEQ ID NO:69),用于随后克隆至表达载体中。
在PCR缓冲液[10mM Tris-HCl(pH 8.0);50mM KCl;10mMMgSO4;1mM dNTP混合液;在每种情况下20pMol引物和2.5UPlatinum Pfx DNA聚合酶(Invitrogen)]中,用500ng基因组DNA,并在以下温度循环中进行扩增:
循环1: 94℃,2min
循环2×30:94℃,15秒,
54℃,30秒,
68℃,60秒,
循环3: 68℃,7min
4℃,∞
在1%琼脂糖凝胶上纯化后,将所得到的具有约750bp大小的PCR产物分别在核酸内切酶Nde I和Hind III或Sph I和Hind III的帮助下进行限制性切割,并且分别连接至pET21a载体(Novagen)或pQE70载体(Qiagen)的骨架中,其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后,通过分别用核酸内切酶Nde I和Hind III或Sph I和Hind III进行限制性分析的方式测试氨苄青霉素耐性集落的质粒DNA中具有750bp大小的插入片段的存在。将制备自所述片段为阳性的克隆的质粒进行序列分析,并随后分别转化至大肠杆菌BL21Star(Invitrogen)和大肠杆菌RB791(genetic stock,Yale)中。
C)在大肠杆菌细胞中高效表达多肽SEQ ID NO:5
为在大肠杆菌细胞中高效表达多肽SEQ ID NO:5,在PCR反应中应用编码DNA SEQ ID NO:70作为模板,用于克隆至表达载体中。在第一个的区域,这一DNA序列在153个碱基与之前已知的DNA序列(SEQ ID NO:20)不同。这一修饰是保守的并且不会导致氨基酸序列中的改变。
在PCR缓冲液[10mM Tris-HCl(pH 8.0);50mM KCl;10mMMgSO4;1mM dNTP混合液;在每种情况下20pMol引物(SEQ IDNO:71、SEQ ID NO:68)和2.5U Platinum Pfx DNA聚合酶(Invitrogen)]中,用50ng DNA SEQ ID NO:70作为模版,并在以下温度循环中进行扩增:
循环1: 94℃,2min
循环2×30:94℃,40秒,
56℃,30秒,
68℃,60秒,
循环3: 68℃,7min
4℃,∞
在1%琼脂糖凝胶上纯化后,在核酸内切酶Nde I和Hind III的帮助下将所得到的具有约750bp大小的PCR产物连接至pET21a载体(Novagen)的骨架中,其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后,通过用核酸内切酶Nde I和Hind III进行限制性分析的方式测试氨苄青霉素耐性集落的质粒DNA中具有750bp大小的插入片段的存在。将制备自所述片段为阳性的克隆的质粒进行序列分析,并随后转化至大肠杆菌BL21Star(Invitrogen)中。
D.)制备来自Rubrobacter xylanophilus DSM 9941的氧化还原酶
在含有氨苄青霉素(50μg/ml)的培养基(1%胰蛋白胨、0.5%酵母提取物、1%NaCl)中分别培养已用表达构建物转化的大肠杆菌菌株BL21Star(Invitrogen,Karlsruhe,德国)和RB791(大肠杆菌geneticstoc k,Yale,USA),直到达到在550nm处测量的0.5的光密度。通过 以0.1mM的浓度添加异丙基硫代半乳糖苷(IPTG)诱导重组蛋白的表达。在25℃和220rpm诱导16小时后,收集细胞并在-20℃保存。
对于酶回收,将30g细胞悬浮于150ml三乙醇胺缓冲液(100mM,pH=7,2mM MgCl2,10%甘油),并且应用高压匀化器破坏。随后,将酶溶液与150ml甘油混合并储存在-20℃。
将这样获得的酶溶液用于化合物I的还原(实施例3)。
与在实施例2中提到的方法类似,还可提供氧化还原酶SEQ IDNO 6和SEQ ID NO 7。
实施例2
通过分子筛选克隆并提供来自木兰假丝酵母(Candida magnoliae)的氧化还原酶(SEQ ID No 1)
A)氧化还原酶的分子筛选
将分离自木兰假丝酵母CBS 6396细胞的基因组DNA作为通过PCR分子筛选的模板。为做这些,在PCR缓冲液[16mM(NH4)2SO4;67mM Tris-HCl pH 8.3(在25℃);1.5m MgCl2;0.01%Tween 20;0.2mM dNTP混合物;在每种情况下30pMol引物(SEQ ID NO:72、SEQ ID NO:73)和1.25U Bio Therm Star聚合酶(Genecraft)]中,用50ng分离自木兰假丝酵母(Candida magnoliae)CBS 6396细胞的基因组DNA作为模版,并用以下循环进行扩增:
循环1: 95℃,7min
循环2×28:94℃,40秒,
从63℃开始每步温度下降0.5℃,30秒,
68℃,60秒,
×20: 94℃,40秒,
53℃,40秒,
70℃,60秒,
循环3: 70℃,7min
4℃,∞
在1%琼脂糖凝胶上对整个PCR批次进行分级分离后,鉴定约400bp的条带,并且通过悬突腺苷部分克隆至Topo-TA载体(Invitrogen),用于确定DNA序列。
从该筛选反应得到的DNA条带展示出相应于137个氨基酸残基的氧化还原酶片段的开放阅读框。
B)分离(总的及mRNA)
将600mg新鲜细胞重悬浮于2.5ml冰冷的LETS缓冲液中。往所述细胞悬浮液中加入5ml(约20g)在硝酸中洗涤过并用3ml苯酚(pH 7.0)平衡过的玻璃珠。然后通过30秒涡旋振荡和30秒在冰上冷冻交替处理整个批次,总共历时10分钟。随后,加入5ml冰冷的LETS缓冲液,并再次剧烈地涡旋振荡。在4℃用11000g离心所述细胞悬浮液5分钟。回收水相并用等体积的苯酚∶氯仿∶异戊醇(24∶24∶1)提取两次。随后立即用氯仿抽提。在最后抽提后,通过加入1/10体积的5M LiCl2使总RNA在-20℃沉淀4h。
将1mg如此获得的总RNA用于通过寡聚-dT纤维素(NEBBiolabs)富集mRNA分子。
通过根据Manniatis&Sambrook的“Molecular Cloning”中描述的方法,通过RACE(cDNA末端快速扩增)完成编码氧化还原酶的全序列的测定。
编码氧化还原酶的基因序列包括720个碱基对,并且等于239个氨基酸残基长度。
C)通过PCR合成编码来自木兰假丝酵母CBS 6396的短链ADH的全长转录物
构建特异引物用于随后将全长转录物克隆至合适的表达系统中。为此目的,修饰了具有Nde I识别序列的5’引物和具有Hind III识别序列的3’引物(SEQ ID NO:74、SEQ ID NO:75)。将分离自木兰假丝酵母CBS 6396细胞的基因组DNA作为聚合酶链式反应的模板。在PCR缓冲液[10mM Tris-HCl(pH 8.0);50mM KCl;10mM MgSO4;1mMdNTP混合液;在每种情况下20pMol引物和2.5U Platinum PfxDNA聚合酶(Invitrogen)]中,用50ng模板,并在以下温度循环中进行扩增:
循环1: 94℃,2min
循环2×30:94℃,15秒,
58℃,30秒,
68℃,75秒,
循环3: 68℃,7min
4℃,∞
在1%琼脂糖凝胶上纯化后,在核酸内切酶Nde I和Hind III的帮助下将所得到的PCR产物进行限制性切割,并连接至pET21a载体(Novagen)的骨架中,其中所述的骨架已用相同的核酸内切酶处理过。在将2μl连接批次转化至大肠杆菌Top 10F`细胞(Invitrogen)中后,通过用核酸内切酶Nde I和Hind进行限制性分析的方式测试氨苄青霉素(或卡那霉素)耐性集落的质粒DNA中具有750bp大小的插入片段的存在。测序表达构建物pET21-MIX。来自木兰假丝酵母编码短链氧化还原酶的基因具有共720bp的开放阅读框(SEQ ID NO:16),其相应于239个氨基酸的蛋白质(SEQ ID NO:1)。
D)在大肠杆菌细胞中表达重组氧化还原酶
用编码该氧化还原酶的表达构建物pET21-MIX分别转化感受态大肠杆菌StarBL21(De3)细胞(Invitrogen)和RB791细胞(大肠杆菌genetic stock,Yale,USA)。然后在200ml含有50μg/ml氨苄青霉素或40μg/ml卡那霉素的LB培养基(1%胰蛋白胨、0.5%酵母提取物、1%NaCl)中分别培养用表达构建物转化的大肠杆菌集落,直到达到在550nm处测量的0.5的光密度。通过以0.1mM的浓度添加异丙基硫代半乳糖苷(IPTG)诱导重组蛋白的表达。在25℃和220rpm诱导16小时后,收集细胞并在-20℃保存。为了活性测试,使10mg细胞与500μl100mM TEA缓冲液pH 7.0、1mM MgCl2和500μl玻璃珠混合,并应用球磨机消化10分钟。然后以稀释状态将获得的裂解物用于各个测试。
如下构成活性测试:960μl 100mM TEA缓冲液pH 7.0、1mMMgCl2、160μg NADPH、10μl稀释的细胞裂解物。通过添加10μl100mM底物溶液至该反应混合物中开始反应。
对于酶的大量回收,将30g细胞重悬浮于150ml三乙醇胺缓冲液(100mM,pH=7,2mM MgCl2,10%甘油),并且应用高压匀化器消化。随后,将该酶溶液与150ml甘油混合并储存在-20℃。
与在实施例2中提到的方法类似,还可提供氧化还原酶SEQ IDNO:2、3、4、8、9、10、11、12、13、14、15。
实施例3
氧化还原酶SEQ ID NO 1至SEQ ID NO 15就它们还原式I化合物的特性而言的表征
如下就式I化合物的转化检测序列SEQ ID NO 1至SEQ ID NO 15的氧化还原酶。
反应批次A(无辅酶再生)
160μl 缓冲液(三乙醇胺100mM pH=7,1mM MgCl2,10%甘油)
150μl NAD(P)H(40mg/ml)=6mg
20μl 2-丙醇
2mg 式I化合物
50μl 根据实施例1D的酶溶液
反应批次B(有辅酶再生)
400μl 缓冲液(三乙醇胺100mM pH=7,1mM MgCl2,10%甘油)
0.05mg NAD(P)H
50μl 2-丙醇
10mg 式I化合物
50μl 根据实施例1D的酶溶液
在温育样本A和B 24h后,在每种情况下往完成的反应批次中加入1ml乙腈,离心反应批次,并转移至HPLC分析容器(1mg/ml)。
通过HPLC (Nucleodur 1005C18ec,125mm,直径4mm,Macherey-Nagel)分析反应批次。应用了1ml/分钟的流速和乙腈(B)及水(A)的溶剂系统。用从40%至80%递增线性梯度的乙腈可在10分钟内分离式I、II和III的化合物。
保持的时间是(酮式I)10.0分钟,(R,S-化合物式II)9.3分钟,以及(S,S-化合物式III)8.5分钟。
结果
实施例4
通过氧化还原酶SEQ ID NO:1将式I化合物转化为式II化合物(R,S-化合物)
为将式I化合物转化为式II化合物(R,S-化合物),在每种情况下将2.25ml SEQ ID No 1的酶悬浮液(参见实施例1D)和75单位(=2ml)过表达的来自Thermoanerobium brockii的醇脱氢酶加入到3ml缓冲液(100mM TEA,pH=8,10%甘油)、1.5g式I化合物、0.3mg NADP和7ml 4-甲基-2-戊醇的混合物中。在室温中在恒定完全的混合下温育该反应混合物。48h后,超过95%的所使用的式I化合物被还原为式II化合物。对映体过量总计>98%。
实施例5:
通过氧化还原酶SEQ ID NO:5将式I化合物转化为式III化合物(S,S-化合物)
为进一步将式I化合物转化为式III化合物(S,S-化合物),在Eppendorf反应容器中温育600μl缓冲液(100mM TEA,pH=9)、200μl 2-丙醇、50mg式I化合物、0.1mg NAD和200μl SEQ ID NO:5的酶悬浮液(参见实施例1D)的混合物。在室温中在恒定完全的混合下温育该反应混合物。48h后,超过90%的所使用的式I化合物被还原为式III化合物(S,S)。对映体过量总计>98%。
氨基酸序列
SEQ ID No l:
木兰假丝酵母CBS 6396蛋白质序列羰基还原酶
1 mnalvtggsr gigeaiatkl aedgysvtia srgidqlnkv kaklpvvreg qthhvwqldl
61 sdaeaassfk gaplpassyd vlvnnagvtd pspiakqsds eihklfsvnl lspvaltkty
121 vqavtgkpre tpahiifiss gvairgypnv avysatksgl dgfmrslare lgpegvhvnt
181 vspgltktem asgvslddfp pspiggwiqp eaiadavryl vksknitgti lsvdngitv
SEQ ID No 2:
木兰假丝酵母JCM 9448蛋白质序列羰基还原酶
1 mpstlnalvt ggsrgigeat avklaeegyg itlaardikk lndvkaklpt ikqgqehhvw
61 qldladvqaa lelkgaplpa skydllvana gvsahvptae hddahwqnvi tinlssqial
121 tqalvraige rsdeapfhiv yvssiaalrg npmsavysas kagldgfars isrelgpkgi
181 hvntvhpglt ktdmtvrmrp aedqpikgwv lpdaiadavv flaksknitg tnivvdngrv
241 v
SEQ ID No 3:
Candida geochares MUCL 29832蛋白质序列羰基还原酶
1 mssvpassss ssptlnalvt gasrgigeat aiqlasqgys vtlasrgleq lkavkaklpl
61 vrqgqthhvw qldladvaaa gsfkgaplpa ssydvlvsna gvalfspigd qadedwqrml
121 avnltspial tkalvkaiad kprenpahii fvssavslrg yplvgvysat kagldgftrs
181 lahelgpkri hvntvnpglt ktemakdvel dsfggnvpis gwiqvdaiad avsflvnskn
241 itgtslvvdn gisv
SEQ ID No 4:
木兰假丝酵母CBS 5659蛋白质序列羰基还原酶
1 mnalvtggsr gigeataiql aqegygvtlv argarqlnev laklpvvrdg qthhiwqldl
61 sdpeaaaafr gaplpassyd vlinnagvss lspfvaqsde vqktilavnl lspialtkaf
121 vkaavgkpre rpahiifiss gaalrgfanm avysatkggl dsfmrslare lgpqgihvns
181 vnpgftetem tattdlndyp ptpiegwiqp raiadailfl lksrnitgtn vtvdngitv
SEQ ID No 5:
Rubrobacter xylanophilus DSM 9941蛋白质序列羰基还原酶
1 mlegkvavit gagsgigrat alrfaregar vvvaelderr geevvreile sggeavfvrt
61 dvsefeqvea averaveeyg tldvmfnnag ighyaplleh dpehydrvvr vnqygvyygi
121 laagrkmael enpgviinta svyaflaspg vigyhaskga vkmmtqaaal elaphgirvv
181 aiapggvdtp iiqgykdmgl gerlargqmr rrlqtpeqia gavvllatee adaingsvvm
241 tddgyaefk
SEQ ID No 6:
Geobacillus kaustophilus JCM 12893(HTA426)蛋白质序列羰基还原酶
1 mrlkgkaaiv tggasgigra tairfaeega kvavsdinee ggeetvrlir ekggeaifvq
61 tdvadskqvs rlvqtavdaf gglhilfnna gighsevrst dlseeewdrv invnlkqvfl
121 gikyavpvmk qcgggaivnt ssllgikgkk yesaynaska gvilltknaa leygkfnirv
181 naiapgvidt niitpwkqde rkwpiiskan algrigtpee vanavlflas deasfitgat
241 lsvdgggltf
SEQ ID No 7:
橙色绿屈挠菌DSMZ 635(J-10-fl)蛋白质序列羰基还原酶
1 meppfigkva lvtgaaagig rasalafare gakvvvadvn veggeetial cralntdamf
61 vrcdvsqrde verlialavd tfgridfahn nagiegvgam ladypeevwd rvieinlkgv
121 wlcmkyeirh mlkqgggaiv ntssvaglag srgvsayvas khgivgitka aaleyarngi
181 rvnaicpgti htamidrftq gdpqllaqfa egepigrlgs peevanaviw lcsdkasfvt
241 gatlavdggr la
SEQ ID No 8:
木兰假丝酵母DSM 70638蛋白质序列羰基还原酶
1 mtstpnalit ggsrgigasa aiklaqegys vtlasrdlek ltevkdklpi vrggqkhyvw
61 qldladveaa ssfkaaplpa ssydlfvsna giaqfsptae htnsewlnim tinlvspial
121 tkallqavsg rssenpfqiv fissvaalrg vaqtavysas kagtdgfars larelgpqgv
181 hvnvvnpgwt ktdmtegvet pkdmpikgwi qpeaiadavv flarsknitg anivvdngfs
241 t
SEQ ID No 9:
木兰假丝酵母DSM 70638蛋白质序列羰基还原酶
1 mtttsnalvt ggsrgigaas aiklaqegyn vtlasrsvdk lnevkaklpi vqdgqkhyiw
61 eldladveaa ssfkgaplpa rsydvfvsna gvaafsptad hddkewqnll avnlsspial
121 tkallkdvse rpvdkplqii yissvaglhg aaqvavysas kagldgfmrs varevgpkgi
181 hvnsinpgyt ktemtagiea lpdlpikgwi epeaiadavl flaksknitg tnivvdngli
241 a
SEQ ID No 10:
木兰假丝酵母ATCC 12573蛋白质序列羰基还原酶
1 msyqmsssap sstslnalvt ggsrgigeat aiklaeegys vtiasrglkq leavkaklpi
61 vkqgqvhhvw qldlsdvdaa aafkgsplpa srydvlvsna gvaqfspfie hakqdwsqml
121 ainlaapial aqtfakaigd kprntpahiv fvssnvslrg fpnigvytat kagidgfmrs
181 varelgpsgi nvnsvnpgpt rtemtkgidv gtidmpikgw iepeaiadav lfvvksknit
241 gttvvvdngs sa
SEQ ID No 11:
木兰假丝酵母DSM 70639蛋白质序列羰基还原酶
1 mttsstssst ssrslnalvt gasrgigeat aiklasegys vtlasrsleq lkalkeklpv
61 vkqgqthhvw qldlsdvdaa atfkgsplpa ssydavisna gvaqfsplse haredwsqml
121 tinlaapial aqafvkaigd kkrdipaqiv fvssnvvmrg lpylgiytas kagidgfmrs
181 aarelgpkgi nvnsvnpgat qtemtkgvdv naldlpikgw iqleavadav lfvvqsknit
241 gttivvdngs va
SEQ ID No 12:
木兰假丝酵母CBS 2798蛋白质序列羰基还原酶
1 mnalvtgasr gigeaiavkl aedgysvtla srsleklesl kkglpvvkdg qahhvweldl
61 gdvdaassfk gaplpaeayd vfvsnagmak stlmvdhpid elqdminvnl vspialtqgl
121 vkalteskrd kpahivfmss irsfrgipng avysatksgl dgfmrsiare lgpqgihvns
181 vcpgfvqtem trkvdmeskk dqlpiagwiq pdaiadtvlf fvksknitgq aivvdngitv
SEQ ID No 13:
Candida gropengoesseri MUCL 29836蛋白质序列羰基还原酶
1 mpsglnalvt ggsrgigaaa atklaaagyn vtvasrgvea lnkvkaslpv vkegqqhhvw
61 qldvsdlaav sgfkgsplpa ksydvvvvna gvanlsplaa qdddviqniv tvnllspial
121 vkslikayge gpratpahiv fvssvaairg fpngavysst ksaldgltrs lakelgpqni
181 rvnsvnpgft rtelasgvdi davtqsspik gwvepeaigd ailflatsnh itgtitvidn
241 gtsa
SEQ ID No 14:
Candida sp.MUCL 40660蛋白质序列羰基还原酶
1 msssssstpl nalvtgasrg igevislqla negynvtlaa rslddlnavk aklpivrdaq
61 khsvwpldis didavtnfkg splpaekydl fvsnagvvdf aplvhqspes isslfnvnli
121 apvaltkall kafgdsprkt tthfiyvssv valrgfpnva vysssksgld gfvrslaaev
181 aplnirvnsi npgptktemt asldveafta gnpikgwiyp daiadgvvyl aksknitgit
241 lqvdngagi
SEQ ID No 15:
Candida vaccinii CBS 7318蛋白质序列羰基还原酶
1 mrstpnalvt ggsrgigaaa aiklaeagys vtlasrgldk lnevkaklpv vkqgqehhvw
61 qldlsdvqaa lefkgaplpa skydlfvsna gvatfsptae hddkdwqnii avnltspiai
121 tkalvkavge rsndnpfqia flssaaalrg vpqtavysat kagldgftrs lakelgpkgi
181 hvnivhpgwt qtemtagvde prdtpipgwi qpeaiaeaiv ylaksknitg tnivvdnglt
241 i
SEQ ID No 16:
木兰假丝酵母CBS 6396核酸序列羰基还原酶
1 atgaacgctc tagtgaccgg tggtagccgt ggcattggcg aggcgatcgc gaccaagctg
61 gccgaagatg gctacagcgt gacaatcgcc tcgcgcggaa tcgatcagct caacaaggta
121 aaggctaaac ttccggttgt gagggagggc cagacccacc acgtgtggca gcttgatttg
181 agcgacgccg aggccgcgtc gtccttcaag ggcgctcctt tgccagcaag cagctacgat
241 gtccttgtca acaacgccgg agtaacggat ccgagtccca ttgcgaagca gtcggatagc
301 gagattcaca agctgtttag cgtgaatctg ctgtcaccag ttgctttgac aaagacgtac
361 gtccaggcgg ttaccggaaa gcctcgtgag acgccagctc acattatttt tatctcgtca
421 ggcgttgcca ttcgaggcta cccaaacgtc gctgtatact cggctactaa gagcgggctc
481 gacggtttca tgaggtctct ggcgcgcgag cttggccccg agggcgtcca tgtgaacact
541 gtcagcccgg gtctcaccaa aaccgagatg gccagcggcg tcagcctcga cgacttcccg
601 ccatcgccga ttgggggctg gatccagccc gaggccatcg ctgatgcagt gaggtacctg
661 gtgaagtcga agaacatcac aggcacgatt ctgtcagttg acaacggaat cacggtttaa
SEQ ID No 17:
木兰假丝酵母JCM 9448核酸序列羰基还原酶
1 mpstlnalvt ggsrgigeat avklaeegyg itlaardikk lndvkaklpt ikqgqehhvw
61 gldladvqaa lelkgaplpa skydllvana gvsahvptae hddahwqnvi tinlssgial
121 tqalvraige rsdeapfhiv yvssiaalrg npmsavysas kagldgfars isrelgpkgi
181 hvntvhpglt ktdmtvrmrp aedqpikgwv lpdaiadavv flaksknitg tnivvdngrv
241 v
SEQ ID No 18:
Candida geochares MUCL 29832蛋白质序列羰基还原酶
1 atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc
61 gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa
121 ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg
181 cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg
241 agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag
301 cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc
361 acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg
421 tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg
481 aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt
541 catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct
601 gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg
661 ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg
721 gtctaa
SEQ ID No 19:
木兰假丝酵母CBS 5659蛋白质序列羰基还原酶
1 atgaacgcgt tagtgaccgg cggaagccgc gggatcggcg aggccacggc catacagctg
61 gctcaggagg gctacggtgt gacattggtt gcgcgaggag cccgccagct caatgaagtg
121 ttggcaaagc taccagttgt gagagacgga cagacgcacc acatttggca gctagatctg
181 agcgatcctg aggcggccgc tgccttcagg ggtgctcctt tgcccgccag cagctacgac
241 gtgctgatca ataacgcagg tgttagtagt ctcagcccgt tcgtcgcgca gtctgatgag
301 gtccagaaaa ctattttagc ggtgaatctt ttgtcgccaa tcgcgttgac gaaggcgttc
361 gtgaaggcag cggtgggcaa gccgcgtgag aggccggcgc atatcatttt catctcttcg
421 ggcgctgccc tgcgcggttt cgcgaacatg gcagtgtata gtgcaacgaa aggcggcctt
481 gacagtttca tgcgctcgct agctagagag ctaggtcccc agggcatcca cgtcaactca
541 gtcaatccgg gctttactga aacagaaatg acagccacta cagatttgaa tgactacccc
601 ccgaccccca ttgagggctg gattcagcct cgcgcaatcg ccgacgctat acttttccta
661 ctgaagtcca gaaacatcac tggcacaaat gtgaccgtcg acaacggcat cactgtttga
SEQ ID No 20:
Rubrobacter xylanophilus DSM 9941蛋白质序列羰基还原酶
1 atgctcgagg ggaaggtcgc ggtcatcacg ggggccggca gcggcatagg ccgggccacc
61 gcgctcaggt tcgcccgcga aggggcccgg gtggtcgtgg cggagctcga cgagcggagg
121 ggggaggagg tcgtccggga gatcctcgag tccggcgggg aggccgtctt cgtgaggacg
181 gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg
241 acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac
301 gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata
361 ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc
421 tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg
481 gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc
541 gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc
601 ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc
661 ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg
721 accgacgacg gctacgcgga gttcaagtaa
SEQ ID No 21:
Geobacillus kaustophilus JCM 12893(HTA426)蛋白质序列羰基还原酶
1 atgaggctaa aaggaaaagc ggcgattgtc accggcggcg cgagcggcat cggccgggcg
61 acggcgattc gctttgcgga agaaggcgcc aaagtggcgg tgagcgacat caatgaggaa
121 ggaggggaag aaacggtccg cctgattcgg gaaaaaggag gggaggcgat ttttgtccaa
181 acggacgtag ccgattccaa gcaagtgagc cgccttgtcc aaacggcggt tgatgccttt
241 ggcggcctac atattctctt taacaatgcc ggcatcggcc attcggaagt gcggagcacc
301 gacttgtctg aagaagagtg ggaccgggtc atcaacgtta atttgaaagg agtgttcctt
361 ggcatcaaat acgcggtgcc cgtgatgaag caatgcggtg gcggggccat tgtcaacaca
421 tcgagcctgc ttggaatcaa agggaaaaag tacgaatcgg cctacaacgc ctcgaaggcc
481 ggggtgattt tgttgacgaa aaatgcagca ttggaatatg ggaagtttaa cattcgcgtc
541 aatgccattg caccgggggt cattgatacg aacatcatca cgccgtggaa acaagatgag
601 cgcaaatggc cgatcatttc gaaagcgaac gccctcggcc gcatcgggac gccagaggaa
661 gtggcgaacg cggtgttgtt tttggcgtcc gatgaagcgt cgtttatcac cggcgcgaca
721 ttgtcggtcg acggcggcgg gctgacgttt tag
SEQ ID No 22:
橙色绿屈挠菌DSMZ 635(J-10-fl)蛋白质序列羰基还原酶
1 atggagccac ctttcattgg gaaggttgcg ctggtcaccg gcgcagcagc cggtattggt
61 cgtgcttcag cactggcgtt tgcccgtgag ggtgccaagg ttgtcgttgc tgatgtgaat
121 gtcgagggcg gggaagagac gattgcgctg tgtcgggctt tgaataccga tgcaatgttc
181 gtgcgttgtg atgtttcgca acgcgatgaa gtggagcgat taattgctct ggcagttgac
241 acgttcggtc ggatcgactt tgcgcacaac aacgccggga ttgaaggcgt gcaggcaatg
301 ctggccgatt atcccgaaga ggtctgggat cgggtgatcg agatcaacct caaaggggtc
361 tggttgtgta tgaagtacga aatccggcac atgctcaagc agggtggcgg tgcgattgtg
421 aatacctcat cggtcgccgg tctggccgga tcacgtggcg tttcggcgta tgtagccagc
481 aagcacggta ttgttggtat taccaaagcg gcagcccttg agtatgcgcg taacggtatt
541 cgtgtcaacg caatctgtcc aggtacgatt catactgcga tgatcgaccg ctttacccag
601 ggtgatcccc aactgcttgc ccagttcgct gagggtgaac cgattggtcg gctcggctcg
661 cctgaagagg tcgccaatgc ggtgatctgg ctctgctcag ataaggcttc gtttgtgacc
721 ggagcgacac tggcggttga tggtggccgc ctggcgtaa
SEQ ID No 23:
木兰假丝酵母DSM 70638蛋白质序列羰基还原酶
1 atgacatcta cacctaatgc cctcatcacg ggaggcagcc gcggcattgg cgcttccgcc
61 gccatcaaac tggctcaaga agggtacagc gtcacgctgg cgtcccgcga ccttgagaaa
121 cttactgagg tcaaggacaa gctgccaatc gtgagaggtg gacagaaaca ctacgtttgg
181 cagctcgatc ttgccgatgt ggaggctgca tcgtctttca aggcggctcc tctgccggcc
241 agcagctacg atttgtttgt ttcgaacgcc ggaattgccc agttctcgcc tacggcagag
301 catactaata gtgagtggct gaacattatg accattaact tagtgtcccc gattgccctg
361 acgaaggctc ttttgcaggc cgtttctggg aggtcgagcg agaacccgtt tcagatcgtc
421 ttcatctcgt cggttgcagc actacgtggc gttgcacaaa cggccgtcta cagtgcgtcg
481 aaggctggta ctgatggatt cgcacgctca cttgctcgcg aactaggtcc tcaaggtgtt
541 catgtgaacg tggtgaaccc tggctggact aagacagaca tgacggaagg agtcgaaacc
601 ccaaaggaca tgcccattaa gggctggatc cagcctgagg caattgctga tgctgtagta
661 ttccttgcga ggtcgaaaaa cattaccggc gcgaatattg tagtggacaa tggtttctcg
721 acgtaa
SEQ ID No 24:
木兰假丝酵母DSM 70638蛋白质序列羰基还原酶
1 atgacgacta cttcaaacgc gcttgtcact ggaggcagcc gcggcattgg cgctgcctcc
61 gccattaagc tggctcagga gggctacaat gttacgctgg cctctcgcag tgttgataaa
121 ctgaatgaag taaaggcgaa actcccaatt gtacaggacg ggcagaagca ctacatttgg
181 gaactcgatc tggctgatgt ggaagctgct tcgtcgttca agggtgctcc tttgcctgct
241 cgcagctacg acgtctttgt ttcgaacgcg ggcgtcgctg cgttctcgcc cacagccgac
301 cacgatgata aggagtggca gaacttgctt gccgtgaact tgtcgtcgcc cattgccctc
361 acgaaggccc tcttgaagga tgtctccgaa aggcctgtgg acaagccact gcagattatc
421 tacatttcgt cggtggccgg cttgcatggc gccgcgcagg tcgccgtgta cagtgcatct
481 aaggccggtc ttgatggttt tatgcgctcc gtcgcccgtg aggtgggccc gaagggcatc
541 catgtgaact ccatcaaccc cggatacacg aagactgaaa tgaccgcggg cattgaagcc
601 cttcctgatt tgcctatcaa ggggtggatc gagcccgagg caattgctga cgcggttctg
661 tttctggcaa agtccaagaa tatcaccggc acaaacattg tggtcgacaa tggcttgatt
721 gcttaa
SEQ ID No 25:
木兰假丝酵母ATCC 12573蛋白质序列羰基还原酶
1 atgtcttatc aaatgtcttc ttctgctcca tcctccacct ccctgaatgc gcttgtcacg
61 ggcggcagcc gcggcattgg cgaagccact gccattaagc tcgccgagga gggctacagc
121 gtcacgattg cgtctcgcgg ccttaagcag ctcgaggctg tgaaggccaa actacccatt
181 gtgaagcagg gacaggttca ccacgtgtgg cagcttgatc tcagtgatgt cgacgctgcg
241 gccgccttca aagggtcgcc gctacctgcc agccgctacg acgtgctcgt cagcaatgct
301 ggcgtggccc agtttagccc gttcatcgag catgcgaagc aggactggtc gcagatgctt
361 gccatcaatc tggcggcacc cattgcgctg gcccagacat ttgctaaggc cattggcgac
421 aagccgcgca acacaccggc ccacattgtg tttgtctcgt cgaacgtctc gttgcgaggc
481 ttcccgaaca tcggcgtcta cacggccacg aaagccggca ttgacggctt catgcgctcg
541 gtcgcacgcg aactggggcc cagcggcatt aacgtgaact ccgtgaaccc cgggcccacg
601 cggacggaga tgacgaaggg cattgacgtc ggcacgatcg atatgccgat caagggctgg
661 atcgagcccg aggcgattgc ggatgccgtg ctcttcgtgg tcaagtcgaa gaacattacg
721 ggcacgaccg ttgttgtcga caacggctcc tccgcttga
SEQ ID No 26:
木兰假丝酵母DSM 70639蛋白质序列羰基还原酶
1 atgaccacct cctccacctc ctcctccacc tcctcccgct ctctaaacgc tcttgtcacc
61 ggcgctagcc gcggcattgg cgaggccact gcaatcaagc tagcatctga gggatacagc
121 gttacgcttg catctcgtag cctcgagcag ctcaaggctt tgaaggagaa gttgcccgtt
181 gtgaagcagg gccagacgca ccacgtctgg cagctcgact tgagcgacgt cgacgccgct
241 gccacgttca agggctcccc cttgccggcc agcagctacg acgccgtcat cagcaatgcc
301 ggtgttgctc agttctctcc gttgtcggaa cacgccaggg aggactggtc tcagatgctg
361 acgatcaacc tcgcggctcc cattgccctc gcgcaggcgt ttgtgaaggc cattggcgac
421 aagaagcgcg acatcccggc ccaaattgtc tttgtttcgt cgaatgtcgt gatgcgtggc
481 ctcccttacc tcggcatcta cacggcttcg aaggctggta tcgatggctt catgcgctcg
541 gccgcccgcg agctgggacc caagggtatc aacgtgaact cagtaaaccc gggcgccacg
601 cagaccgaga tgacgaaggg cgttgatgtc aacgccctcg acctgccgat caagggatgg
661 attcagctcg aggctgtcgc ggacgccgtg ctcttcgtgg tccagtcgaa gaacattacc
721 ggcacgacga ttgttgtcga caacggctcc gtcgcttga
SEQ ID No 27:
木兰假丝酵母CBS 2798蛋白质序列羰基还原酶
1 atgaatgcct tagttactgg tgcgagccgc gggatcggcg aagcaattgc ggtgaagctg
61 gccgaggacg ggtacagcgt gacactggcc tcgcgctctc ttgaaaagct ggagtcgctc
121 aagaaagggc tgccggtcgt gaaggacggc caagcacatc atgtatggga gcttgatctc
181 ggtgatgttg atgccgcgtc atccttcaag ggggcgcctc tgcctgccga ggcctatgac
241 gtgttcgtca gtaacgctgg aatggccaaa tccaccttga tggtagacca tcccattgac
301 gagctgcagg acatgattaa cgtgaatctt gtgtcgccaa ttgcactcac acagggcctt
361 gtcaaggctc tgacagaatc taagcgagac aagcctgcgc atatcgtgtt catgtcgtcc
421 atccgctcgt tcaggggcat tccgaatggc gcggtgtaca gcgccacaaa gagtggtctt
481 gacggattca tgcgatccat tgcgcgagag ctgggccctc agggcatcca cgtcaactct
541 gtgtgccccg gattcgtgca aacggaaatg acgcgcaagg ttgatatgga gtcgaagaaa
601 gaccagctac ccatcgccgg ctggatccag cccgacgcga ttgctgacac cgttctgttt
661 tttgtgaaat cgaagaacat cacgggccag gcaattgtcg ttgacaatgg catcactgtc
721 tga
SEQ ID No 28:
Candida gropengoesseri MUCL 29836蛋白质序列羰基还原酶
1 atgccctctg gactcaatgc tcttgtcact ggcggcagcc gcggaatcgg cgctgccgct
61 gctaccaagc tcgccgctgc aggatacaac gtcacggttg cgtcccgcgg ggtcgaggct
121 ctgaataagg tcaaggcctc cttgcctgtt gtcaaggagg gccagcagca ccatgtctgg
181 cagctcgacg taagcgatct cgcagcggtg tctggcttca agggatctcc gctgccggct
241 aagagctacg atgttgttgt tgttaacgcc ggcgtcgcga acctgagccc gctggctgcc
301 caggacgacg acgtcattca gaacattgtg accgtgaacc tgctgtcgcc gattgcgctg
361 gtgaagtcgc tgatcaaggc gtacggcgag ggtcctcgcg cgacaccggc ccacattgtg
421 tttgtgtcgt cggtggccgc gatccgtggg ttccccaacg gcgccgtcta tagctcgacg
481 aagagtgcgc tcgacgggct gacgcggtcg ctggcgaagg agctggggcc ccagaacatc
541 cgggtcaact ccgtgaaccc cggcttcacg aggaccgagc tggccagcgg cgtcgacatt
601 gacgccgtga cgcagagctc tccgatcaag gggtgggttg agccggaggc gattggcgat
661 gcgattttgt ttctcgcgac gtcgaaccac atcacgggca cgatcaccgt catcgacaac
721 ggcactagcg cgtag
SEQ ID No 29:
假丝酵母属物种MUCL 40660蛋白质序列羰基还原酶
1 atgtcctcct cttcctcctc gactcctctc aacgctctcg tcaccggtgc cagccgcggc
61 atcggtgagg tcatctctct ccagctcgcc aacgagggct acaatgttac cctcgcagcc
121 cgcagtcttg acgacctcaa tgcggtgaag gctaagctcc ctatcgtaag ggatgcccag
181 aagcactctg tctggccgct cgacattagc gatatcgacg ccgtgacgaa cttcaaggga
241 tcgcccctgc cggccgagaa gtacgatctg ttcgtcagca acgccggcgt ggtcgacttc
301 gctccgcttg tccaccagag ccccgagagc atcagcagcc tgttcaatgt gaacctaatc
361 gcgcctgttg ccttgacaaa agctcttctt aaggcgttcg gtgacagccc tcgcaagact
421 acgactcact ttatctacgt ttcgtccgtt gttgccctcc gcggcttccc caatgttgcg
481 gtttacagct cctccaagag cggcctcgac gggtttgtgc gctcccttgc cgccgaggtt
541 gctccgctca acatccgcgt caactccatt aacccaggcc ctaccaagac tgagatgacc
601 gcttccctgg atgttgaggc gtttactgcg ggcaacccca tcaagggttg gatttacccc
661 gatgctattg ctgatggagt ggtgtacctg gcgaagtcga agaacattac tggtatcacc
721 ctccaagtcg acaacggcgc cggcatctaa
SEQ ID No 30:
Candida vaccinii CBS 7318蛋白质序列羰基还原酶
1 atgaggtcga cacctaacgc ccttgtgact ggcggcagcc gcggcattgg cgcggccgct
61 gcaattaaac tcgccgaggc aggctacagc gtgacgctcg cgtcgcgcgg tctcgacaag
121 ctcaacgagg tgaaggccaa gcttcctgtc gtgaagcagg gccaggagca ccatgtatgg
181 cagcttgatc tcagcgacgt gcaggccgcg ctcgagttca agggcgcacc gctgcccgcg
241 agtaagtacg atttgtttgt ctcgaacgcc ggcgtggcta ctttctcgcc aacggctgag
301 catgacgaca aggactggca gaacattatt gccgtgaact tgacatcgcc cattgccatt
361 acgaaggcgc tcgttaaggc cgttggcgag cgctcaaacg ataacccgtt tcagatcgcg
421 ttcctgtcat cggcggccgc cctgcgcggt gtgccgcaga ccgctgttta cagcgctacg
481 aaggccggcc tcgacggctt cacgcgctcg ctcgccaagg agctcggccc aaagggcatc
541 catgtgaaca tcgtacaccc tggatggacg cagaccgaga tgactgcggg tgtagatgag
601 cctagggata cgcccatccc gggctggatc cagccggaag ccatcgccga ggccattgtg
661 tatctcgcga agtcaaagaa catcacggga acgaacatcg ttgtcgacaa cggcctgact
721 atttaa
SEQ ID No 31:
氨基酸序列部分
nalvtgasrgig
SEQ ID No 32:
氨基酸序列部分
nalvtggsrgig
SEQ ID No 33:
氨基酸序列部分
gysvt
SEQ ID No 34:
氨基酸序列部分
gynvt
SEQ ID No 35:
氨基酸序列部分
gygitl
SEQ ID No 51:
氨基酸序列部分
gygvt
SEQ ID No 36:
氨基酸序列部分
vlaklp
SEQ ID No 37:
氨基酸序列部分
vkaklp
SEQ ID No 38:
氨基酸序列部分
fkgaplpa
SEQ ID No 39:
氨基酸序列部分
frgaplpa
SEQ ID No 40:
氨基酸序列部分
lkgaplpa
SEQ ID No 41:
氨基酸序列部分
spialtk
SEQ ID No 42:
氨基酸序列部分
spvaltk
SEQ ID No 43:
氨基酸序列部分
sqialtq
SEQ ID No 44:
氨基酸序列部分
avysask
SEQ ID No 45:
氨基酸序列部分
avysatk
SEQ ID No 46:
氨基酸序列部分
gvysatk
SEQ ID No 47:
氨基酸序列部分
pikgwi
SEQ ID No 48:
氨基酸序列部分
piegwi
SEQ ID No 49:
氨基酸序列部分
piggwi
SEQ ID No 50:
氨基酸序列部分
pisgwi
SEQ ID No 52:
氨基酸序列部分
fkaaplpa
SEQ ID No 53:
氨基酸序列部分
fkgsplpa
SEQ ID No 54:
氨基酸序列部分
gigrat
SEQ ID No 55:
氨基酸序列部分
gigrasa
SEQ ID No 56:
氨基酸序列部分
gigret
SEQ ID No 57:
氨基酸序列部分
nnagig
SEQ ID No 58:
氨基酸序列部分
nnagieg
SEQ ID No 59:
氨基酸序列部分
irvvaiapg
SEQ ID No 60:
氨基酸序列部分
irvnaiapg
SEQ ID No 61:
氨基酸序列部分
irvnaicpg
SEQ ID No 62:
氨基酸序列部分
irvvgiapg
SEQ ID No 63:
氨基酸序列部分
peqiagav
SEQ ID No 64:
氨基酸序列部分
peaianav
SEQ ID No 65:
氨基酸序列部分
peevanav
SEQ ID No 66:
氨基酸序列部分
peaianav
SEQ ID No 67:
GGGAATTCCATATGATGCTCGAGGGGAAGGTCG
SEQ ID No 68:
CACATGCATGCGAATGCTCGAGGGGAAGGTC
SEQ ID No 69:
CCCAAGCTTATTACTTGAACTCCGCGTAGCCGTC
SEQ ID No 70:
Rubrobacter xylanophilus DSM 9941核酸序列羰基还原酶半合成
1 atgctggaag gtaaagtggc agtcatcacc ggtgcaggca gcggcattgg gcgtgccact
61 gcgctgcgtt ttgcgcgtga aggcgctcgc gtcgttgtgg ccgagctgga tgaacgtcgc
121 ggtgaggaag ttgtacgtga gattctggaa tctggcgggg aggccgtctt cgtgaggacg
181 gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg
241 acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac
301 gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata
361 ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc
421 tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg
481 gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc
541 gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc
601 ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcaga tcgcc
661 ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg
721 accgacgacg gctacgcgga gttcaagtaa
SEQ ID No 71:
CCTAGCTAGCATGCTGGAAGGTAAAGTGGC
SEQ ID No 72:
CCTTTRCCTGCHAGCAGCTAYG
SEQ ID No:73
GGCTGGATCCAGCCCTTRATSGG
SEQ ID No:74
GGAATTCCATATGATGAACGCTCTAGTGACCGGTGGTAG
SEQ ID No:75
CCCAAGCTTATTAAACCGTGATTCCGTTGTCAACTGAC
序列表
<110>IEP GmbH
<120>中间体的对映选择性酶还原的方法
<130>I 11734
<140>A1530/2007
<141>2007-09-27
<160>75
<170>PatentIn version 3.3
<210>1
<211>239
<212>PRT
<213>木兰假丝酵母
<400>1
Met Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Ile
1 5 10 15
Ala Thr Lys Leu Ala Glu Asp Gly Tyr Ser Val Thr Ile Ala Ser Arg
20 25 30
Gly Ile Asp Gln Leu Asn Lys Val Lys Ala Lys Leu Pro Val Val Arg
35 40 45
Glu Gly Gln Thr His His Val Trp Gln Leu Asp Leu Ser Asp Ala Glu
50 55 60
Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp
65 70 75 80
Val Leu Val Asn Asn Ala Gly Val Thr Asp Pro Ser Pro Ile Ala Lys
85 90 95
Gln Ser Asp Ser Glu Ile His Lys Leu Phe Ser Val Asn Leu Leu Ser
100 105 110
Pro Val Ala Leu Thr Lys Thr Tyr Val Gln Ala Val Thr Gly Lys Pro
115 120 125
Arg Glu Thr Pro Ala His Ile Ile Phe Ile Ser Ser Gly Val Ala Ile
130 135 140
Arg Gly Tyr Pro Asn Val Ala Val Tyr Ser Ala Thr Lys Ser Gly Leu
145 150 155 160
Asp Gly Phe Met Arg Ser Leu Ala Arg Glu Leu Gly Pro Glu Gly Val
165 170 175
His Val Asn Thr Val Ser Pro Gly Leu Thr Lys Thr Glu Met Ala Ser
180 185 190
Gly Val Ser Leu Asp Asp Phe Pro Pro Ser Pro Ile Gly Gly Trp Ile
195 200 205
Gln Pro Glu Ala Ile Ala Asp Ala Val Arg Tyr Leu Val Lys Ser Lys
210 215 220
Asn Ile Thr Gly Thr Ile Leu Ser Val Asp Asn Gly Ile Thr Val
225 230 235
<210>2
<211>241
<212>PRT
<213>木兰假丝酵母
<400>2
Met Pro Ser Thr Leu Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile
1 5 10 15
Gly Glu Ala Thr Ala Val Lys Leu Ala Glu Glu Gly Tyr Gly Ile Thr
20 25 30
Leu Ala Ala Arg Asp Ile Lys Lys Leu Asn Asp Val Lys Ala Lys Leu
35 40 45
Pro Thr Ile Lys Gln Gly Gln Glu His His Val Trp Gln Leu Asp Leu
50 55 60
Ala Asp Val Gln Ala Ala Leu Glu Leu Lys Gly Ala Pro Leu Pro Ala
65 70 75 80
Ser Lys Tyr Asp Leu Leu Val Ala Asn Ala Gly Val Ser Ala His Val
85 90 95
Pro Thr Ala Glu His Asp Asp Ala His Trp Gln Asn Val Ile Thr Ile
100 105 110
Asn Leu Ser Ser Gln Ile Ala Leu Thr Gln Ala Leu Val Arg Ala Ile
115 120 125
Gly Glu Arg Ser Asp Glu Ala Pro Phe His Ile Val Tyr Val Ser Ser
130 135 140
Ile Ala Ala Leu Arg Gly Asn Pro Met Ser Ala Val Tyr Ser Ala Ser
145 150 155 160
Lys Ala Gly Leu Asp Gly Phe Ala Arg Ser Ile Ser Arg Glu Leu Gly
165 170 175
Pro Lys Gly Ile His Val Asn Thr Val His Pro Gly Leu Thr Lys Thr
180 185 190
Asp Met Thr Val Arg Met Arg Pro Ala Glu Asp Gln Pro Ile Lys Gly
195 200 205
Trp Val Leu Pro Asp Ala Ile Ala Asp Ala Val Val Phe Leu Ala Lys
210 215 220
Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Arg Val
225 230 235 240
Val
<210>3
<211>254
<212>PRT
<213>Candida geochares
<400>3
Met Ser Ser Val Pro Ala Ser Ser Ser Ser Ser Ser Pro Thr Leu Asn
1 5 10 15
Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile
20 25 30
Gln Leu Ala Ser Gln Gly Tyr Ser Val Thr Leu Ala Ser Arg Gly Leu
35 40 45
Glu Gln Leu Lys Ala Val Lys Ala Lys Leu Pro Leu Val Arg Gln Gly
50 55 60
Gln Thr His His Val Trp Gln Leu Asp Leu Ala Asp Val Ala Ala Ala
65 70 75 80
Gly Ser Phe Lys Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp Val Leu
85 90 95
Val Ser Asn Ala Gly Val Ala Leu Phe Ser Pro Ile Gly Asp Gln Ala
100 105 110
Asp Glu Asp Trp Gln Arg Met Leu Ala Val Asn Leu Thr Ser Pro Ile
115 120 125
Ala Leu Thr Lys Ala Leu Val Lys Ala Ile Ala Asp Lys Pro Arg Glu
130 135 140
Asn Pro Ala His Ile Ile Phe Val Ser Ser Ala Val Ser Leu Arg Gly
145 150 155 160
Tyr Pro Leu Val Gly Val Tyr Ser Ala Thr Lys Ala Gly Leu Asp Gly
165 170 175
Phe Thr Arg Ser Leu Ala His Glu Leu Gly Pro Lys Arg Ile His Val
180 185 190
Asn Thr Val Asn Pro Gly Leu Thr Lys Thr Glu Met Ala Lys Asp Val
195 200 205
Glu Leu Asp Ser Phe Gly Gly Asn Val Pro Ile Ser Gly Trp Ile Gln
210 215 220
Val Asp Ala Ile Ala Asp Ala Val Ser Phe Leu Val Asn Ser Lys Asn
225 230 235 240
Ile Thr Gly Thr Ser Leu Val Val Asp Asn Gly Ile Ser Val
245 250
<210>4
<211>239
<212>PRT
<213>木兰假丝酵母
<400>4
Met Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Thr
1 5 10 15
Ala Ile Gln Leu Ala Gln Glu Gly Tyr Gly Val Thr Leu Val Ala Arg
20 25 30
Gly Ala Arg Gln Leu Asn Glu Val Leu Ala Lys Leu Pro Val Val Arg
35 40 45
Asp Gly Gln Thr His His Ile Trp Gln Leu Asp Leu Ser Asp Pro Glu
50 55 60
Ala Ala Ala Ala Phe Arg Gly Ala Pro Leu Pro Ala Ser Ser Tyr Asp
65 70 75 80
Val Leu Ile Asn Asn Ala Gly Val Ser Ser Leu Ser Pro Phe Val Ala
85 90 95
Gln Ser Asp Glu Val Gln Lys Thr Ile Leu Ala Val Asn Leu Leu Ser
100 105 110
Pro Ile Ala Leu Thr Lys Ala Phe Val Lys Ala Ala Val Gly Lys Pro
115 120 125
Arg Glu Arg Pro Ala His Ile Ile Phe Ile Ser Ser Gly Ala Ala Leu
130 135 140
Arg Gly Phe Ala Asn Met Ala Val Tyr Ser Ala Thr Lys Gly Gly Leu
145 150 155 160
Asp Ser Phe Met Arg Ser Leu Ala Arg Glu Leu Gly Pro Gln Gly Ile
165 170 175
His Val Asn Ser Val Asn Pro Gly Phe Thr Glu Thr Glu Met Thr Ala
180 185 190
Thr Thr Asp Leu Asn Asp Tyr Pro Pro Thr Pro Ile Glu Gly Trp Ile
195 200 205
Gln Pro Arg Ala Ile Ala Asp Ala Ile Leu Phe Leu Leu Lys Ser Arg
210 215 220
Asn Ile Thr Gly Thr Asn Val Thr Val Asp Asn Gly Ile Thr Val
225 230 235
<210>5
<211>249
<212>PRT
<213>Rubrobacter xylanophilus
<400>5
Met Leu Glu Gly Lys Val Ala Val Ile Thr Gly Ala Gly Ser Gly Ile
1 5 10 15
Gly Arg Ala Thr Ala Leu Arg Phe Ala Arg Glu Gly Ala Arg Val Val
20 25 30
Val Ala Glu Leu Asp Glu Arg Arg Gly Glu Glu Val Val Arg Glu Ile
35 40 45
Leu Glu Ser Gly Gly Glu Ala Val Phe Val Arg Thr Asp Val Ser Glu
50 55 60
Phe Glu Gln Val Glu Ala Ala Val Glu Arg Ala Val Glu Glu Tyr Gly
65 70 75 80
Thr Leu Asp Val Met Phe Asn Asn Ala Gly Ile Gly His Tyr Ala Pro
85 90 95
Leu Leu Glu His Asp Pro Glu His Tyr Asp Arg Val Val Arg Val Asn
100 105 110
Gln Tyr Gly Val Tyr Tyr Gly Ile Leu Ala Ala Gly Arg Lys Met Ala
115 120 125
Glu Leu Glu Asn Pro Gly Val Ile Ile Asn Thr Ala Ser Val Tyr Ala
130 135 140
Phe Leu Ala Ser Pro Gly Val Ile Gly Tyr His Ala Ser Lys Gly Ala
145 150 155 160
Val Lys Met Met Thr Gln Ala Ala Ala Leu Glu Leu Ala Pro His Gly
165 170 175
Ile Arg Val Val Ala Ile Ala Pro Gly Gly Val Asp Thr Pro Ile Ile
180 185 190
Gln Gly Tyr Lys Asp Met Gly Leu Gly Glu Arg Leu Ala Arg Gly Gln
195 200 205
Met Arg Arg Arg Leu Gln Thr Pro Glu Gln Ile Ala Gly Ala Val Val
210 215 220
Leu Leu Ala Thr Glu Glu Ala Asp Ala Ile Asn Gly Ser Val Val Met
225 230 235 240
Thr Asp Asp Gly Tyr Ala Glu Phe Lys
245
<210>6
<211>250
<212>PRT
<213>Geobacillus kaustophilus
<400>6
Met Arg Leu Lys Gly Lys Ala Ala Ile Val Thr Gly Gly Ala Ser Gly
1 5 10 15
Ile Gly Arg Ala Thr Ala Ile Arg Phe Ala Glu Glu Gly Ala Lys Val
20 25 30
Ala Val Ser Asp Ile Asn Glu Glu Gly Gly Glu Glu Thr Val Arg Leu
35 40 45
Ile Arg Glu Lys Gly Gly Glu Ala Ile Phe Val Gln Thr Asp Val Ala
50 55 60
Asp Ser Lys Gln Val Ser Arg Leu Val Gln Thr Ala Val Asp Ala Phe
65 70 75 80
Gly Gly Leu His Ile Leu Phe Asn Asn Ala Gly Ile Gly His Ser Glu
85 90 95
Val Arg Ser Thr Asp Leu Ser Glu Glu Glu Trp Asp Arg Val Ile Asn
100 105 110
Val Asn Leu Lys Gly Val Phe Leu Gly Ile Lys Tyr Ala Val Pro Val
115 120 125
Met Lys Gln Cys Gly Gly Gly Ala Ile Val Asn Thr Ser Ser Leu Leu
130 135 140
Gly Ile Lys Gly Lys Lys Tyr Glu Ser Ala Tyr Asn Ala Ser Lys Ala
145 150 155 160
Gly Val Ile Leu Leu Thr Lys Asn Ala Ala Leu Glu Tyr Gly Lys Phe
165 170 175
Asn Ile Arg Val Asn Ala Ile Ala Pro Gly Val Ile Asp Thr Asn Ile
180 185 190
Ile Thr Pro Trp Lys Gln Asp Glu Arg Lys Trp Pro Ile Ile Ser Lys
195 200 205
Ala Asn Ala Leu Gly Arg Ile Gly Thr Pro Glu Glu Val Ala Asn Ala
210 215 220
Val Leu Phe Leu Ala Ser Asp Glu Ala Ser Phe Ile Thr Gly Ala Thr
225 230 235 240
Leu Ser Val Asp Gly Gly Gly Leu Thr Phe
245 250
<210>7
<211>252
<212>PRT
<213>橙色绿屈挠菌
<400>7
Met Glu Pro Pro Phe Ile Gly Lys Val Ala Leu Val Thr Gly Ala Ala
1 5 10 15
Ala Gly Ile Gly Arg Ala Ser Ala Leu Ala Phe Ala Arg Glu Gly Ala
20 25 30
Lys Val Val Val Ala Asp Val Asn Val Glu Gly Gly Glu Glu Thr Ile
35 40 45
Ala Leu Cys Arg Ala Leu Asn Thr Asp Ala Met Phe Val Arg Cys Asp
50 55 60
Val Ser Gln Arg Asp Glu Val Glu Arg Leu Ile Ala Leu Ala Val Asp
65 70 75 80
Thr Phe Gly Arg Ile Asp Phe Ala His Asn Asn Ala Gly Ile Glu Gly
85 90 95
Val Gln Ala Met Leu Ala Asp Tyr Pro Glu Glu Val Trp Asp Arg Val
100 105 110
Ile Glu Ile Asn Leu Lys Gly Val Trp Leu Cys Met Lys Tyr Glu Ile
115 120 125
Arg His Met Leu Lys Gln Gly Gly Gly Ala Ile Val Asn Thr Ser Ser
130 135 140
Val Ala Gly Leu Ala Gly Ser Arg Gly Val Ser Ala Tyr Val Ala Ser
145 150 155 160
Lys His Gly Ile Val Gly Ile Thr Lys Ala Ala Ala Leu Glu Tyr Ala
165 170 175
Arg Asn Gly Ile Arg Val Asn Ala Ile Cys Pro Gly Thr Ile His Thr
180 185 190
Ala Met Ile Asp Arg Phe Thr Gln Gly Asp Pro Gln Leu Leu Ala Gln
195 200 205
Phe Ala Glu Gly Glu Pro Ile Gly Arg Leu Gly Ser Pro Glu Glu Val
210 215 220
Ala Asn Ala Val Ile Trp Leu Cys Ser Asp Lys Ala Ser Phe Val Thr
225 230 235 240
Gly Ala Thr Leu Ala Val Asp Gly Gly Arg Leu Ala
245 250
<210>8
<211>241
<212>PRT
<213>木兰假丝酵母
<400>8
Met Thr Ser Thr Pro Asn Ala Leu Ile Thr Gly Gly Ser Arg Gly Ile
1 5 10 15
Gly Ala Ser Ala Ala Ile Lys Leu Ala Gln Glu Gly Tyr Ser Val Thr
20 25 30
Leu Ala Ser Arg Asp Leu Glu Lys Leu Thr Glu Val Lys Asp Lys Leu
35 40 45
Pro Ile Val Arg Gly Gly Gln Lys His Tyr Val Trp Gln Leu Asp Leu
50 55 60
Ala Asp Val Glu Ala Ala Ser Ser Phe Lys Ala Ala Pro Leu Pro Ala
65 70 75 80
Ser Ser Tyr Asp Leu Phe Val Ser Asn Ala Gly Ile Ala Gln Phe Ser
85 90 95
Pro Thr Ala Glu His Thr Asn Ser Glu Trp Leu Asn Ile Met Thr Ile
100 105 110
Asn Leu Val Ser Pro Ile Ala Leu Thr Lys Ala Leu Leu Gln Ala Val
115 120 125
Ser Gly Arg Ser Ser Glu Asn Pro Phe Gln Ile Val Phe Ile Ser Ser
130 135 140
Val Ala Ala Leu Arg Gly Val Ala Gln Thr Ala Val Tyr Ser Ala Ser
145 150 155 160
Lys Ala Gly Thr Asp Gly Phe Ala Arg Ser Leu Ala Arg Glu Leu Gly
165 170 175
Pro Gln Gly Val His Val Asn Val Val Asn Pro Gly Trp Thr Lys Thr
180 185 190
Asp Met Thr Glu Gly Val Glu Thr Pro Lys Asp Met Pro Ile Lys Gly
195 200 205
Trp Ile Gln Pro Glu Ala Ile Ala Asp Ala Val Val Phe Leu Ala Arg
210 215 220
Ser Lys Asn Ile Thr Gly Ala Asn Ile Val Val Asp Asn Gly Phe Ser
225 230 235 240
Thr
<210>9
<211>241
<212>PRT
<213>木兰假丝酵母
<400>9
Met Thr Thr Thr Ser Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile
1 5 10 15
Gly Ala Ala Ser Ala Ile Lys Leu Ala Gln Glu Gly Tyr Asn Val Thr
20 25 30
Leu Ala Ser Arg Ser Val Asp Lys Leu Asn Glu Val Lys Ala Lys Leu
35 40 45
Pro Ile Val Gln Asp Gly Gln Lys His Tyr Ile Trp Glu Leu Asp Leu
50 55 60
Ala Asp Val Glu Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala
65 70 75 80
Arg Ser Tyr Asp Val Phe Val Ser Asn Ala Gly Val Ala Ala Phe Ser
85 90 95
Pro Thr Ala Asp His Asp Asp Lys Glu Trp Gln Asn Leu Leu Ala Val
100 105 110
Asn Leu Ser Ser Pro Ile Ala Leu Thr Lys Ala Leu Leu Lys Asp Val
115 120 125
Ser Glu Arg Pro Val Asp Lys Pro Leu Gln Ile Ile Tyr Ile Ser Ser
130 135 140
Val Ala Gly Leu His Gly Ala Ala Gln Val Ala Val Tyr Ser Ala Ser
145 150 155 160
Lys Ala Gly Leu Asp Gly Phe Met Arg Ser Val Ala Arg Glu Val Gly
165 170 175
Pro Lys Gly Ile His Val Asn Ser Ile Asn Pro Gly Tyr Thr Lys Thr
180 185 190
Glu Met Thr Ala Gly Ile Glu Ala Leu Pro Asp Leu Pro Ile Lys Gly
195 200 205
Trp Ile Glu Pro Glu Ala Ile Ala Asp Ala Val Leu Phe Leu Ala Lys
210 215 220
Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Leu Ile
225 230 235 240
Ala
<210>10
<211>252
<212>PRT
<213>木兰假丝酵母
<400>10
Met Ser Tyr Gln Met Ser Ser Ser Ala Pro Ser Ser Thr Ser Leu Asn
1 5 10 15
Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile
20 25 30
Lys Leu Ala Glu Glu Gly Tyr Ser Val Thr Ile Ala Ser Arg Gly Leu
35 40 45
Lys Gln Leu Glu Ala Val Lys Ala Lys Leu Pro Ile Val Lys Gln Gly
50 55 60
Gln Val His His Val Trp Gln Leu Asp Leu Ser Asp Val Asp Ala Ala
65 70 75 80
Ala Ala Phe Lys Gly Ser Pro Leu Pro Ala Ser Arg Tyr Asp Val Leu
85 90 95
Val Ser Asn Ala Gly Val Ala Gln Phe Ser Pro Phe Ile Glu His Ala
100 105 110
Lys Gln Asp Trp Ser Gln Met Leu Ala Ile Asn Leu Ala Ala Pro Ile
115 120 125
Ala Leu Ala Gln Thr Phe Ala Lys Ala Ile Gly Asp Lys Pro Arg Asn
130 135 140
Thr Pro Ala His Ile Val Phe Val Ser Ser Asn Val Ser Leu Arg Gly
145 150 155 160
Phe Pro Asn Ile Gly Val Tyr Thr Ala Thr Lys Ala Gly Ile Asp Gly
165 170 175
Phe Met Arg Ser Val Ala Arg Glu Leu Gly Pro Ser Gly Ile Asn Val
180 185 190
Asn Ser Val Asn Pro Gly Pro Thr Arg Thr Glu Met Thr Lys Gly Ile
195 200 205
Asp Val Gly Thr Ile Asp Met Pro Ile Lys Gly Trp Ile Glu Pro Glu
210 215 220
Ala Ile Ala Asp Ala Val Leu Phe Val Val Lys Ser Lys Asn Ile Thr
225 230 235 240
Gly Thr Thr Val Val Val Asp Asn Gly Ser Ser Ala
245 250
<210>11
<211>252
<212>PRT
<213>木兰假丝酵母
<400>11
Met Thr Thr Ser Ser Thr Ser Ser Ser Thr Ser Ser Arg Ser Leu Asn
1 5 10 15
Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Thr Ala Ile
20 25 30
Lys Leu Ala Ser Glu Gly Tyr Ser Val Thr Leu Ala Ser Arg Ser Leu
35 40 45
Glu Gln Leu Lys Ala Leu Lys Glu Lys Leu Pro Val Val Lys Gln Gly
50 55 60
Gln Thr His His Val Trp Gln Leu Asp Leu Ser Asp Val Asp Ala Ala
65 70 75 80
Ala Thr Phe Lys Gly Ser Pro Leu Pro Ala Ser Ser Tyr Asp Ala Val
85 90 95
Ile Ser Asn Ala Gly Val Ala Gln Phe Ser Pro Leu Ser Glu His Ala
100 105 110
Arg Glu Asp Trp Ser Gln Met Leu Thr Ile Asn Leu Ala Ala Pro Ile
115 120 125
Ala Leu Ala Gln Ala Phe Val Lys Ala Ile Gly Asp Lys Lys Arg Asp
130 135 140
Ile Pro Ala Gln Ile Val Phe Val Ser Ser Asn Val Val Met Arg Gly
145 150 155 160
Leu Pro Tyr Leu Gly Ile Tyr Thr Ala Ser Lys Ala Gly Ile Asp Gly
165 170 175
Phe Met Arg Ser Ala Ala Arg Glu Leu Gly Pro Lys Gly Ile Asn Val
180 185 190
Asn Ser Val Asn Pro Gly Ala Thr Gln Thr Glu Met Thr Lys Gly Val
195 200 205
Asp Val Asn Ala Leu Asp Leu Pro Ile Lys Gly Trp Ile Gln Leu Glu
210 215 220
Ala Val Ala Asp Ala Val Leu Phe Val Val Gln Ser Lys Asn Ile Thr
225 230 235 240
Gly Thr Thr Ile Val Val Asp Asn Gly Ser Val Ala
245 250
<210>12
<211>240
<212>PRT
<213>木兰假丝酵母
<400>12
Met Asn Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile
1 5 10 15
Ala Val Lys Leu Ala Glu Asp Gly Tyr Ser Val Thr Leu Ala Ser Arg
20 25 30
Ser Leu Glu Lys Leu Glu Ser Leu Lys Lys Gly Leu Pro Val Val Lys
35 40 45
Asp Gly Gln Ala His His Val Trp Glu Leu Asp Leu Gly Asp Val Asp
50 55 60
Ala Ala Ser Ser Phe Lys Gly Ala Pro Leu Pro Ala Glu Ala Tyr Asp
65 70 75 80
Val Phe Val Ser Asn Ala Gly Met Ala Lys Ser Thr Leu Met Val Asp
85 90 95
His Pro Ile Asp Glu Leu Gln Asp Met Ile Asn Val Asn Leu Val Ser
100 105 110
Pro Ile Ala Leu Thr Gln Gly Leu Val Lys Ala Leu Thr Glu Ser Lys
115 120 125
Arg Asp Lys Pro Ala His Ile Val Phe Met Ser Ser Ile Arg Ser Phe
130 135 140
Arg Gly Ile Pro Asn Gly Ala Val Tyr Ser Ala Thr Lys Ser Gly Leu
145 150 155 160
Asp Gly Phe Met Arg Ser Ile Ala Arg Glu Leu Gly Pro Gln Gly Ile
165 170 175
His Val Asn Ser Val Cys Pro Gly Phe Val Gln Thr Glu Met Thr Arg
180 185 190
Lys Val Asp Met Glu Ser Lys Lys Asp Gln Leu Pro Ile Ala Gly Trp
195 200 205
Ile Gln Pro Asp Ala Ile Ala Asp Thr Val Leu Phe Phe Val Lys Ser
210 215 220
Lys Asn Ile Thr Gly Gln Ala Ile Val Val Asp Asn Gly Ile Thr Val
225 230 235 240
<210>13
<211>244
<212>PRT
<213>Candida gropengiesseri
<400>13
Met Pro Ser Gly Leu Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile
1 5 10 15
Gly Ala Ala Ala Ala Thr Lys Leu Ala Ala Ala Gly Tyr Asn Val Thr
20 25 30
Val Ala Ser Arg Gly Val Glu Ala Leu Asn Lys Val Lys Ala Ser Leu
35 40 45
Pro Val Val Lys Glu Gly Gln Gln His His Val Trp Gln Leu Asp Val
50 55 60
Ser Asp Leu Ala Ala Val Ser Gly Phe Lys Gly Ser Pro Leu Pro Ala
65 70 75 80
Lys Ser Tyr Asp Val Val Val Val Asn Ala Gly Val Ala Asn Leu Ser
85 90 95
Pro Leu Ala Ala Gln Asp Asp Asp Val Ile Gln Asn Ile Val Thr Val
100 105 110
Asn Leu Leu Ser Pro Ile Ala Leu Val Lys Ser Leu Ile Lys Ala Tyr
115 120 125
Gly Glu Gly Pro Arg Ala Thr Pro Ala His Ile Val Phe Val Ser Ser
130 135 140
Val Ala Ala Ile Arg Gly Phe Pro Asn Gly Ala Val Tyr Ser Ser Thr
145 150 155 160
Lys Ser Ala Leu Asp Gly Leu Thr Arg Ser Leu Ala Lys Glu Leu Gly
165 170 175
Pro Gln Asn Ile Arg Val Asn Ser Val Asn Pro Gly Phe Thr Arg Thr
180 185 190
Glu Leu Ala Ser Gly Val Asp Ile Asp Ala Val Thr Gln Ser Ser Pro
195 200 205
Ile Lys Gly Trp Val Glu Pro Glu Ala Ile Gly Asp Ala Ile Leu Phe
210 215 220
Leu Ala Thr Ser Asn His Ile Thr Gly Thr Ile Thr Val Ile Asp Asn
225 230 235 240
Gly Thr Ser Ala
<210>14
<211>249
<212>PRT
<213>假丝酵母属
<400>14
Met Ser Ser Ser Ser Ser Ser Thr Pro Leu Asn Ala Leu Val Thr Gly
1 5 10 15
Ala Ser Arg Gly Ile Gly Glu Val Ile Ser Leu Gln Leu Ala Asn Glu
20 25 30
Gly Tyr Asn Val Thr Leu Ala Ala Arg Ser Leu Asp Asp Leu Asn Ala
35 40 45
Val Lys Ala Lys Leu Pro Ile Val Arg Asp Ala Gln Lys His Ser Val
50 55 60
Trp Pro Leu Asp Ile Ser Asp Ile Asp Ala Val Thr Asn Phe Lys Gly
65 70 75 80
Ser Pro Leu Pro Ala Glu Lys Tyr Asp Leu Phe Val Ser Asn Ala Gly
85 90 95
Val Val Asp Phe Ala Pro Leu Val His Gln Ser Pro Glu Ser Ile Ser
100 105 110
Ser Leu Phe Asn Val Asn Leu Ile Ala Pro Val Ala Leu Thr Lys Ala
115 120 125
Leu Leu Lys Ala Phe Gly Asp Ser Pro Arg Lys Thr Thr Thr His Phe
130 135 140
Ile Tyr Val Ser Ser Val Val Ala Leu Arg Gly Phe Pro Asn Val Ala
145 150 155 160
Val Tyr Ser Ser Ser Lys Ser Gly Leu Asp Gly Phe Val Arg Ser Leu
165 170 175
Ala Ala Glu Val Ala Pro Leu Asn Ile Arg Val Asn Ser Ile Asn Pro
180 185 190
Gly Pro Thr Lys Thr Glu Met Thr Ala Ser Leu Asp Val Glu Ala Phe
195 200 205
Thr Ala Gly Asn Pro Ile Lys Gly Trp Ile Tyr Pro Asp Ala Ile Ala
210 215 220
Asp Gly Val Val Tyr Leu Ala Lys Ser Lys Asn Ile Thr Gly Ile Thr
225 230 235 240
Leu Gln Val Asp Asn Gly Ala Gly Ile
245
<210>15
<211>241
<212>PRT
<213>Candida vaccinii
<400>15
Met Arg Ser Thr Pro Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile
1 5 10 15
Gly Ala Ala Ala Ala Ile Lys Leu Ala Glu Ala Gly Tyr Ser Val Thr
20 25 30
Leu Ala Ser Arg Gly Leu Asp Lys Leu Asn Glu Val Lys Ala Lys Leu
35 40 45
Pro Val Val Lys Gln Gly Gln Glu His His Val Trp Gln Leu Asp Leu
50 55 60
Ser Asp Val Gln Ala Ala Leu Glu Phe Lys Gly Ala Pro Leu Pro Ala
65 70 75 80
Ser Lys Tyr Asp Leu Phe Val Ser Asn Ala Gly Val Ala Thr Phe Ser
85 90 95
Pro Thr Ala Glu His Asp Asp Lys Asp Trp Gln Asn Ile Ile Ala Val
100 105 110
Asn Leu Thr Ser Pro Ile Ala Ile Thr Lys Ala Leu Val Lys Ala Val
115 120 125
Gly Glu Arg Ser Asn Asp Asn Pro Phe Gln Ile Ala Phe Leu Ser Ser
130 135 140
Ala Ala Ala Leu Arg Gly Val Pro Gln Thr Ala Val Tyr Ser Ala Thr
145 150 155 160
Lys Ala Gly Leu Asp Gly Phe Thr Arg Ser Leu Ala Lys Glu Leu Gly
165 170 175
Pro Lys Gly Ile His Val Asn Ile Val His Pro Gly Trp Thr Gln Thr
180 185 190
Glu Met Thr Ala Gly Val Asp Glu Pro Arg Asp Thr Pro Ile Pro Gly
195 200 205
Trp Ile Gln Pro Glu Ala Ile Ala Glu Ala Ile Val Tyr Leu Ala Lys
210 215 220
Ser Lys Asn Ile Thr Gly Thr Asn Ile Val Val Asp Asn Gly Leu Thr
225 230 235 240
Ile
<210>16
<211>720
<212>DNA
<213>木兰假丝酵母
<400>16
atgaacgctc tagtgaccgg tggtagccgt ggcattggcg aggcgatcgc gaccaagctg 60
gccgaagatg gctacagcgt gacaatcgcc tcgcgcggaa tcgatcagct caacaaggta 120
aaggctaaac ttccggttgt gagggagggc cagacccacc acgtgtggca gcttgatttg 180
agcgacgccg aggccgcgtc gtccttcaag ggcgctcctt tgccagcaag cagctacgat 240
gtccttgtca acaacgccgg agtaacggat ccgagtccca ttgcgaagca gtcggatagc 300
gagattcaca agctgtttag cgtgaatctg ctgtcaccag ttgctttgac aaagacgtac 360
gtccaggcgg ttaccggaaa gcctcgtgag acgccagctc acattatttt tatctcgtca 420
ggcgttgcca ttcgaggcta cccaaacgtc gctgtatact cggctactaa gagcgggctc 480
gacggtttca tgaggtctct ggcgcgcgag cttggccccg agggcgtcca tgtgaacact 540
gtcagcccgg gtctcaccaa aaccgagatg gccagcggcg tcagcctcga cgacttcccg 600
ccatcgccga ttgggggctg gatccagccc gaggccatcg ctgatgcagt gaggtacctg 660
gtgaagtcga agaacatcac aggcacgatt ctgtcagttg acaacggaat cacggtttaa 720
<210>17
<211>726
<212>DNA
<213>木兰假丝酵母
<400>17
atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc 60
gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa 120
ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg 180
cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg 240
agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag 300
cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc 360
acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg 420
tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg 480
aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt 540
catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct 600
gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg 660
ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg 720
gtctaa 726
<210>18
<211>726
<212>DNA
<213>Candida geochares
<400>18
atgccttcta ctctgaacgc tcttgtcact ggcggcagtc gcggtattgg cgaggctacc 60
gcagtgaagc tcgccgagga gggctacggt atcacacttg ctgcgcgcga tatcaaaaaa 120
ctgaatgacg tgaaggccaa actacccaca atcaagcagg gtcaagagca ccacgtctgg 180
cagcttgact tggccgatgt gcaggctgcg cttgagctca agggcgcacc actgcctgcg 240
agcaagtacg acctgttggt cgcgaatgcg ggcgtttccg cacacgttcc tacggccgag 300
cacgacgatg cgcactggca gaacgtcata actatcaact tgagctcgca gattgcgctc 360
acgcaggccc tagttagggc cattggcgag aggtctgatg aagcgccttt ccacattgtg 420
tatgtgtcct cgatcgccgc cctgcgcggt aaccccatga gcgcggtgta cagtgcctcg 480
aaggccggac ttgatggatt tgctcgttcc atctctcgcg agctcggccc gaagggtatt 540
catgtgaata cggtgcaccc gggactcacg aagacggaca tgaccgttcg catgcggcct 600
gctgaggacc agccgatcaa gggctgggta ctgcccgatg caattgctga tgccgttgtg 660
ttcctcgcga agtctaaaaa catcacgggc acaaacatcg ttgtcgacaa cggccgggtg 720
gtctaa 726
<210>19
<211>720
<212>DNA
<213>木兰假丝酵母
<400>19
atgaacgcgt tagtgaccgg cggaagccgc gggatcggcg aggccacggc catacagctg 60
gctcaggagg gctacggtgt gacattggtt gcgcgaggag cccgccagct caatgaagtg 120
ttggcaaagc taccagttgt gagagacgga cagacgcacc acatttggca gctagatctg 180
agcgatcctg aggcggccgc tgccttcagg ggtgctcctt tgcccgccag cagctacgac 240
gtgctgatca ataacgcagg tgttagtagt ctcagcccgt tcgtcgcgca gtctgatgag 300
gtccagaaaa ctattttagc ggtgaatctt ttgtcgccaa tcgcgttgac gaaggcgttc 360
gtgaaggcag cggtgggcaa gccgcgtgag aggccggcgc atatcatttt catctcttcg 420
ggcgctgccc tgcgcggttt cgcgaacatg gcagtgtata gtgcaacgaa aggcggcctt 480
gacagtttca tgcgctcgct agctagagag ctaggtcccc agggcatcca cgtcaactca 540
gtcaatccgg gctttactga aacagaaatg acagccacta cagatttgaa tgactacccc 600
ccgaccccca ttgagggctg gattcagcct cgcgcaatcg ccgacgctat acttttccta 660
ctgaagtcca gaaacatcac tggcacaaat gtgaccgtcg acaacggcat cactgtttga 720
<210>20
<211>750
<212>DNA
<213>Rubrobacter xylanophilus
<400>20
atgctcgagg ggaaggtcgc ggtcatcacg ggggccggca gcggcatagg ccgggccacc 60
gcgctcaggt tcgcccgcga aggggcccgg gtggtcgtgg cggagctcga cgagcggagg 120
ggggaggagg tcgtccggga gatcctcgag tccggcgggg aggccgtctt cgtgaggacg 180
gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg 240
acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac 300
gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata 360
ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc 420
tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg 480
gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc 540
gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc 600
ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc 660
ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg 720
accgacgacg gctacgcgga gttcaagtaa 750
<210>21
<211>753
<212>DNA
<213>Gebacillus kaustophilus
<400>21
atgaggctaa aaggaaaagc ggcgattgtc accggcggcg cgagcggcat cggccgggcg 60
acggcgattc gctttgcgga agaaggcgcc aaagtggcgg tgagcgacat caatgaggaa 120
ggaggggaag aaacggtccg cctgattcgg gaaaaaggag gggaggcgat ttttgtccaa 180
acggacgtag ccgattccaa gcaagtgagc cgccttgtcc aaacggcggt tgatgccttt 240
ggcggcctac atattctctt taacaatgcc ggcatcggcc attcggaagt gcggagcacc 300
gacttgtctg aagaagagtg ggaccgggtc atcaacgtta atttgaaagg agtgttcctt 360
ggcatcaaat acgcggtgcc cgtgatgaag caatgcggtg gcggggccat tgtcaacaca 420
tcgagcctgc ttggaatcaa agggaaaaag tacgaatcgg cctacaacgc ctcgaaggcc 480
ggggtgattt tgttgacgaa aaatgcagca ttggaatatg ggaagtttaa cattcgcgtc 540
aatgccattg caccgggggt cattgatacg aacatcatca cgccgtggaa acaagatgag 600
cgcaaatggc cgatcatttc gaaagcgaac gccctcggcc gcatcgggac gccagaggaa 660
gtggcgaacg cggtgttgtt tttggcgtcc gatgaagcgt cgtttatcac cggcgcgaca 720
ttgtcggtcg acggcggcgg gctgacgttt tag 753
<210>22
<211>759
<212>DNA
<213>橙色绿屈挠菌
<400>22
atggagccac ctttcattgg gaaggttgcg ctggtcaccg gcgcagcagc cggtattggt 60
cgtgcttcag cactggcgtt tgcccgtgag ggtgccaagg ttgtcgttgc tgatgtgaat 120
gtcgagggcg gggaagagac gattgcgctg tgtcgggctt tgaataccga tgcaatgttc 180
gtgcgttgtg atgtttcgca acgcgatgaa gtggagcgat taattgctct ggcagttgac 240
acgttcggtc ggatcgactt tgcgcacaac aacgccggga ttgaaggcgt gcaggcaatg 300
ctggccgatt atcccgaaga ggtctgggat cgggtgatcg agatcaacct caaaggggtc 360
tggttgtgta tgaagtacga aatccggcac atgctcaagc agggtggcgg tgcgattgtg 420
aatacctcat cggtcgccgg tctggccgga tcacgtggcg tttcggcgta tgtagccagc 480
aagcacggta ttgttggtat taccaaagcg gcagcccttg agtatgcgcg taacggtatt 540
cgtgtcaacg caatctgtcc aggtacgatt catactgcga tgatcgaccg ctttacccag 600
ggtgatcccc aactgcttgc ccagttcgct gagggtgaac cgattggtcg gctcggctcg 660
cctgaagagg tcgccaatgc ggtgatctgg ctctgctcag ataaggcttc gtttgtgacc 720
ggagcgacac tggcggttga tggtggccgc ctggcgtaa 759
<210>23
<211>726
<212>DNA
<213>木兰假丝酵母
<400>23
atgacatcta cacctaatgc cctcatcacg ggaggcagcc gcggcattgg cgcttccgcc 60
gccatcaaac tggctcaaga agggtacagc gtcacgctgg cgtcccgcga ccttgagaaa 120
cttactgagg tcaaggacaa gctgccaatc gtgagaggtg gacagaaaca ctacgtttgg 180
cagctcgatc ttgccgatgt ggaggctgca tcgtctttca aggcggctcc tctgccggcc 240
agcagctacg atttgtttgt ttcgaacgcc ggaattgccc agttctcgcc tacggcagag 300
catactaata gtgagtggct gaacattatg accattaact tagtgtcccc gattgccctg 360
acgaaggctc ttttgcaggc cgtttctggg aggtcgagcg agaacccgtt tcagatcgtc 420
ttcatctcgt cggttgcagc actacgtggc gttgcacaaa cggccgtcta cagtgcgtcg 480
aaggctggta ctgatggatt cgcacgctca cttgctcgcg aactaggtcc tcaaggtgtt 540
catgtgaacg tggtgaaccc tggctggact aagacagaca tgacggaagg agtcgaaacc 600
ccaaaggaca tgcccattaa gggctggatc cagcctgagg caattgctga tgctgtagta 660
ttccttgcga ggtcgaaaaa cattaccggc gcgaatattg tagtggacaa tggtttctcg 720
acgtaa 726
<210>24
<211>726
<212>DNA
<213>木兰假丝酵母
<400>24
atgacgacta cttcaaacgc gcttgtcact ggaggcagcc gcggcattgg cgctgcctcc 60
gccattaagc tggctcagga gggctacaat gttacgctgg cctctcgcag tgttgataaa 120
ctgaatgaag taaaggcgaa actcccaatt gtacaggacg ggcagaagca ctacatttgg 180
gaactcgatc tggctgatgt ggaagctgct tcgtcgttca agggtgctcc tttgcctgct 240
cgcagctacg acgtctttgt ttcgaacgcg ggcgtcgctg cgttctcgcc cacagccgac 300
cacgatgata aggagtggca gaacttgctt gccgtgaact tgtcgtcgcc cattgccctc 360
acgaaggccc tcttgaagga tgtctccgaa aggcctgtgg acaagccact gcagattatc 420
tacatttcgt cggtggccgg cttgcatggc gccgcgcagg tcgccgtgta cagtgcatct 480
aaggccggtc ttgatggttt tatgcgctcc gtcgcccgtg aggtgggccc gaagggcatc 540
catgtgaact ccatcaaccc cggatacacg aagactgaaa tgaccgcggg cattgaagcc 600
cttcctgatt tgcctatcaa ggggtggatc gagcccgagg caattgctga cgcggttctg 660
tttctggcaa agtccaagaa tatcaccggc acaaacattg tggtcgacaa tggcttgatt 720
gcttaa 726
<210>25
<211>759
<212>DNA
<213>木兰假丝酵母
<400>25
atgtcttatc aaatgtcttc ttctgctcca tcctccacct ccctgaatgc gcttgtcacg 60
ggcggcagcc gcggcattgg cgaagccact gccattaagc tcgccgagga gggctacagc 120
gtcacgattg cgtctcgcgg ccttaagcag ctcgaggctg tgaaggccaa actacccatt 180
gtgaagcagg gacaggttca ccacgtgtgg cagcttgatc tcagtgatgt cgacgctgcg 240
gccgccttca aagggtcgcc gctacctgcc agccgctacg acgtgctcgt cagcaatgct 300
ggcgtggccc agtttagccc gttcatcgag catgcgaagc aggactggtc gcagatgctt 360
gccatcaatc tggcggcacc cattgcgctg gcccagacat ttgctaaggc cattggcgac 420
aagccgcgca acacaccggc ccacattgtg tttgtctcgt cgaacgtctc gttgcgaggc 480
ttcccgaaca tcggcgtcta cacggccacg aaagccggca ttgacggctt catgcgctcg 540
gtcgcacgcg aactggggcc cagcggcatt aacgtgaact ccgtgaaccc cgggcccacg 600
cggacggaga tgacgaaggg cattgacgtc ggcacgatcg atatgccgat caagggctgg 660
atcgagcccg aggcgattgc ggatgccgtg ctcttcgtgg tcaagtcgaa gaacattacg 720
ggcacgaccg ttgttgtcga caacggctcc tccgcttga 759
<210>26
<211>759
<212>DNA
<213>木兰假丝酵母
<400>26
atgaccacct cctccacctc ctcctccacc tcctcccgct ctctaaacgc tcttgtcacc 60
ggcgctagcc gcggcattgg cgaggccact gcaatcaagc tagcatctga gggatacagc 120
gttacgcttg catctcgtag cctcgagcag ctcaaggctt tgaaggagaa gttgcccgtt 180
gtgaagcagg gccagacgca ccacgtctgg cagctcgact tgagcgacgt cgacgccgct 240
gccacgttca agggctcccc cttgccggcc agcagctacg acgccgtcat cagcaatgcc 300
ggtgttgctc agttctctcc gttgtcggaa cacgccaggg aggactggtc tcagatgctg 360
acgatcaacc tcgcggctcc cattgccctc gcgcaggcgt ttgtgaaggc cattggcgac 420
aagaagcgcg acatcccggc ccaaattgtc tttgtttcgt cgaatgtcgt gatgcgtggc 480
ctcccttacc tcggcatcta cacggcttcg aaggctggta tcgatggctt catgcgctcg 540
gccgcccgcg agctgggacc caagggtatc aacgtgaact cagtaaaccc gggcgccacg 600
cagaccgaga tgacgaaggg cgttgatgtc aacgccctcg acctgccgat caagggatgg 660
attcagctcg aggctgtcgc ggacgccgtg ctcttcgtgg tccagtcgaa gaacattacc 720
ggcacgacga ttgttgtcga caacggctcc gtcgcttga 759
<210>27
<211>723
<212>DNA
<213>木兰假丝酵母
<400>27
atgaatgcct tagttactgg tgcgagccgc gggatcggcg aagcaattgc ggtgaagctg 60
gccgaggacg ggtacagcgt gacactggcc tcgcgctctc ttgaaaagct ggagtcgctc 120
aagaaagggc tgccggtcgt gaaggacggc caagcacatc atgtatggga gcttgatctc 180
ggtgatgttg atgccgcgtc atccttcaag ggggcgcctc tgcctgccga ggcctatgac 240
gtgttcgtca gtaacgctgg aatggccaaa tccaccttga tggtagacca tcccattgac 300
gagctgcagg acatgattaa cgtgaatctt gtgtcgccaa ttgcactcac acagggcctt 360
gtcaaggctc tgacagaatc taagcgagac aagcctgcgc atatcgtgtt catgtcgtcc 420
atccgctcgt tcaggggcat tccgaatggc gcggtgtaca gcgccacaaa gagtggtctt 480
gacggattca tgcgatccat tgcgcgagag ctgggccctc agggcatcca cgtcaactct 540
gtgtgccccg gattcgtgca aacggaaatg acgcgcaagg ttgatatgga gtcgaagaaa 600
gaccagctac ccatcgccgg ctggatccag cccgacgcga ttgctgacac cgttctgttt 660
tttgtgaaat cgaagaacat cacgggccag gcaattgtcg ttgacaatgg catcactgtc 720
tga 723
<210>28
<211>735
<212>DNA
<213>Candida gropengiesseri
<400>28
atgccctctg gactcaatgc tcttgtcact ggcggcagcc gcggaatcgg cgctgccgct 60
gctaccaagc tcgccgctgc aggatacaac gtcacggttg cgtcccgcgg ggtcgaggct 120
ctgaataagg tcaaggcctc cttgcctgtt gtcaaggagg gccagcagca ccatgtctgg 180
cagctcgacg taagcgatct cgcagcggtg tctggcttca agggatctcc gctgccggct 240
aagagctacg atgttgttgt tgttaacgcc ggcgtcgcga acctgagccc gctggctgcc 300
caggacgacg acgtcattca gaacattgtg accgtgaacc tgctgtcgcc gattgcgctg 360
gtgaagtcgc tgatcaaggc gtacggcgag ggtcctcgcg cgacaccggc ccacattgtg 420
tttgtgtcgt cggtggccgc gatccgtggg ttccccaacg gcgccgtcta tagctcgacg 480
aagagtgcgc tcgacgggct gacgcggtcg ctggcgaagg agctggggcc ccagaacatc 540
cgggtcaact ccgtgaaccc cggcttcacg aggaccgagc tggccagcgg cgtcgacatt 600
gacgccgtga cgcagagctc tccgatcaag gggtgggttg agccggaggc gattggcgat 660
gcgattttgt ttctcgcgac gtcgaaccac atcacgggca cgatcaccgt catcgacaac 720
ggcactagcg cgtag 735
<210>29
<211>750
<212>DNA
<213>假丝酵母属
<400>29
atgtcctcct cttcctcctc gactcctctc aacgctctcg tcaccggtgc cagccgcggc 60
atcggtgagg tcatctctct ccagctcgcc aacgagggct acaatgttac cctcgcagcc 120
cgcagtcttg acgacctcaa tgcggtgaag gctaagctcc ctatcgtaag ggatgcccag 180
aagcactctg tctggccgct cgacattagc gatatcgacg ccgtgacgaa cttcaaggga 240
tcgcccctgc cggccgagaa gtacgatctg ttcgtcagca acgccggcgt ggtcgacttc 300
gctccgcttg tccaccagag ccccgagagc atcagcagcc tgttcaatgt gaacctaatc 360
gcgcctgttg ccttgacaaa agctcttctt aaggcgttcg gtgacagccc tcgcaagact 420
acgactcact ttatctacgt ttcgtccgtt gttgccctcc gcggcttccc caatgttgcg 480
gtttacagct cctccaagag cggcctcgac gggtttgtgc gctcccttgc cgccgaggtt 540
gctccgctca acatccgcgt caactccatt aacccaggcc ctaccaagac tgagatgacc 600
gcttccctgg atgttgaggc gtttactgcg ggcaacccca tcaagggttg gatttacccc 660
gatgctattg ctgatggagt ggtgtacctg gcgaagtcga agaacattac tggtatcacc 720
ctccaagtcg acaacggcgc cggcatctaa 750
<210>30
<211>726
<212>DNA
<213>Candida vaccinii
<400>30
atgaggtcga cacctaacgc ccttgtgact ggcggcagcc gcggcattgg cgcggccgct 60
gcaattaaac tcgccgaggc aggctacagc gtgacgctcg cgtcgcgcgg tctcgacaag 120
ctcaacgagg tgaaggccaa gcttcctgtc gtgaagcagg gccaggagca ccatgtatgg 180
cagcttgatc tcagcgacgt gcaggccgcg ctcgagttca agggcgcacc gctgcccgcg 240
agtaagtacg atttgtttgt ctcgaacgcc ggcgtggcta ctttctcgcc aacggctgag 300
catgacgaca aggactggca gaacattatt gccgtgaact tgacatcgcc cattgccatt 360
acgaaggcgc tcgttaaggc cgttggcgag cgctcaaacg ataacccgtt tcagatcgcg 420
ttcctgtcat cggcggccgc cctgcgcggt gtgccgcaga ccgctgttta cagcgctacg 480
aaggccggcc tcgacggctt cacgcgctcg ctcgccaagg agctcggccc aaagggcatc 540
catgtgaaca tcgtacaccc tggatggacg cagaccgaga tgactgcggg tgtagatgag 600
cctagggata cgcccatccc gggctggatc cagccggaag ccatcgccga ggccattgtg 660
tatctcgcga agtcaaagaa catcacggga acgaacatcg ttgtcgacaa cggcctgact 720
atttaa 726
<210>31
<211>12
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>31
Asn Ala Leu Val Thr Gly Ala Ser Arg Gly Ile Gly
1 5 10
<210>32
<211>12
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>32
Asn Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly
1 5 10
<210>33
<211>5
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>33
Gly Tyr Ser Val Thr
1 5
<210>34
<211>5
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>34
Gly Tyr Asn Val Thr
1 5
<210>35
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>35
Gly Tyr Gly Ile Thr Leu
1 5
<210>36
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>36
Val Leu Ala Lys Leu Pro
1 5
<210>37
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>37
Val Lys Ala Lys Leu Pro
1 5
<210>38
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>38
Phe Lys Gly Ala Pro Leu Pro Ala
1 5
<210>39
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>39
Phe Arg Gly Ala Pro Leu Pro Ala
1 5
<210>40
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>40
Leu Lys Gly Ala Pro Leu Pro Ala
1 5
<210>41
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>41
Ser Pro Ile Ala Leu Thr Lys
1 5
<210>42
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>42
Ser Pro Val Ala Leu Thr Lys
1 5
<210>43
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>43
Ser Gln Ile Ala Leu Thr Gln
1 5
<210>44
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>44
Ala Val Tyr Ser Ala Ser Lys
1 5
<210>45
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>45
Ala Val Tyr Ser Ala Thr Lys
1 5
<210>46
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>46
Gly Val Tyr Ser Ala Thr Lys
1 5
<210>47
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>47
Pro Ile Lys Gly Trp Ile
1 5
<210>48
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>48
Pro Ile Glu Gly Trp Ile
1 5
<210>49
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>49
Pro Ile Gly Gly Trp Ile
1 5
<210>50
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>50
Pro Ile Ser Gly Trp Ile
1 5
<210>51
<211>5
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>51
Gly Tyr Gly Val Thr
1 5
<210>52
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>52
Phe Lys Ala Ala Pro Leu Pro Ala
1 5
<210>53
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>53
Phe Lys Gly Ser Pro Leu Pro Ala
1 5
<210>54
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>54
Gly Ile Gly Arg Ala Thr
1 5
<210>55
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>55
Gly Ile Gly Arg Ala Ser Ala
1 5
<210>56
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>56
Gly Ile Gly Arg Glu Thr
1 5
<210>57
<211>6
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>57
Asn Asn Ala Gly Ile Gly
1 5
<210>58
<211>7
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>58
Asn Asn Ala Gly Ile Glu Gly
1 5
<210>59
<211>9
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>59
Ile Arg Val Val Ala Ile Ala Pro Gly
1 5
<210>60
<211>9
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>60
Ile Arg Val Asn Ala Ile Ala Pro Gly
1 5
<210>61
<211>9
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>61
Ile Arg Val Asn Ala Ile Cys Pro Gly
1 5
<210>62
<211>9
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>62
Ile Arg Val Val Gly Ile Ala Pro Gly
1 5
<210>63
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>63
Pro Glu Gln Ile Ala Gly Ala Val
1 5
<210>64
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>64
Pro Glu Ala Ile Ala Asn Ala Val
1 5
<210>65
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>65
Pro Glu Glu Val Ala Asn Ala Val
1 5
<210>66
<211>8
<212>PRT
<213>人工序列
<220>
<223>部分氨基酸序列
<400>66
Pro Glu Ala Ile Ala Asn Ala Val
1 5
<210>67
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>67
gggaattcca tatgatgc tc gaggggaagg tcg 33
<210>68
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
cacatgcatg cgaatgctcg aggggaaggt c 31
<210>69
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>69
cccaagctta ttacttgaac tccgcgtagc cgtc 34
<210>70
<211>750
<212>DNA
<213>人工序列
<220>
<223>来自Rubrobacter xylanophilus的半合成基因序列
<400>70
atgctggaag gtaaagtggc agtcatcacc ggtgcaggca gcggcattgg gcgtgccact 60
gcgctgcgtt ttgcgcgtga aggcgctcgc gtcgttgtgg ccgagctgga tgaacgtcgc 120
ggtgaggaag ttgtacgtga gattctggaa tctggcgggg aggccgtctt cgtgaggacg 180
gacgtctcgg agttcgagca ggttgaggcc gccgtcgagc gcgccgtcga ggagtacggg 240
acgctggacg tcatgttcaa caacgccggc atcgggcact acgcccccct gctggagcac 300
gacccggagc actacgaccg ggtggtccgg gtgaaccagt acggcgtcta ctacgggata 360
ctcgccgccg gcaggaagat ggccgagctg gagaaccccg gcgtgatcat caacaccgcc 420
tcggtctacg ctttcctggc ctcccccggt gtgatcggct atcacgcttc caagggggcg 480
gtgaagatga tgacccaggc cgcagccctg gagctcgccc cccacggcat acgggtcgtc 540
gccatcgccc cgggcggggt ggacaccccg atcatccagg gctacaagga catgggcctc 600
ggtgagcggc tggcccgcgg ccagatgcgt cgcaggctcc agacccccga gcagatcgcc 660
ggcgccgtcg tcctgctcgc caccgaggag gcagacgcca taaacggctc ggtggtgatg 720
accgacgacg gctacgcgga gttcaagtaa 750
<210>71
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>71
cctagctagc atgctggaag gtaaagtggc 30
<210>72
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>72
cctttrcctg chagcagcta yg 22
<210>73
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>73
ggctggatcc agcccttrat sgg 23
<210>74
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>74
ggaattccat atgatgaacg ctctagtgac cggtggtag 39
<210>75
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>75
cccaagctta ttaaaccgtg attccgttgt caactgac 38
Claims (16)
1.将通式I酮化合物对映选择性酶还原为通式II羟基化合物R,S-化合物的方法,
其中,R表示氨基官能的任何保护基团且X=-Cl、-CN、-OH、Br、F,
其中R和X具有与式I中相同的含义,
所述的酮化合物在辅因子的存在下被氧化还原酶还原;
其特征在于
所述氧化还原酶由根据SEQ ID NO:1的氨基酸序列组成。
2.权利要求1的方法,其特征在于所述氨基官能的保护基团是叔丁氧羰基、苄氧羰基或9-芴甲氧羰基。
3.权利要求1或2的方法,其特征在于持续地再生形成的氧化的辅因子NAD或NADP。
4.权利要求1或2的方法,其特征在于通过氧化通式RXRYCHOH的仲醇持续地再生形成的氧化的辅因子NAD或NADP。
5.权利要求1或2的方法,其特征在于将2-丙醇、2-丁醇、2-戊醇、4-甲基-2-戊醇、2-庚醇或2-辛醇用作共底物。
6.权利要求1或2的方法,其特征在于添加附加的氧化还原酶/脱氢酶用于辅因子的再生。
7.权利要求1或2的方法,其特征在于式I化合物以>20g/l的浓度存在于反应批次中。
8.权利要求1或2的方法,其特征在于式I化合物以>50g/l的浓度存在于反应批次中。
9.权利要求1或2的方法,其特征在于式I化合物以>100g/l的浓度存在于反应批次中。
10.权利要求1或2的方法,其特征在于TTN>103,所述TTN是指总转化数=还原的式I化合物mol/所使用的辅因子mol。
11.权利要求1或2的方法,其特征在于其在水有机两相系统中进行。
12.权利要求1或2的方法,其特征在于还应用了有机溶剂。
13.权利要求12的方法,其特征在于所述有机溶剂选自二乙醚、叔丁基甲基醚、二异丙基醚、二丁基醚、乙酸乙酯、乙酸丁酯、庚烷、己烷或环己烷。
14.权利要求1或2的方法,其特征在于应用式IV的特定化合物作为酮化合物
15.氨基酸序列SEQ ID NO:1的多肽。
16.多肽,其由核酸序列SEQ ID NO:16编码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AT15302007 | 2007-09-27 | ||
ATA1530/2007 | 2007-09-27 | ||
PCT/EP2008/007992 WO2009040080A1 (en) | 2007-09-27 | 2008-09-22 | Process for the enantioselective enzymatic reduction of intermediates |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101809158A CN101809158A (zh) | 2010-08-18 |
CN101809158B true CN101809158B (zh) | 2015-04-08 |
Family
ID=40352741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880108175.7A Active CN101809158B (zh) | 2007-09-27 | 2008-09-22 | 中间体的对映选择性酶还原的方法 |
Country Status (14)
Country | Link |
---|---|
US (1) | US8932835B2 (zh) |
EP (1) | EP2201122B1 (zh) |
JP (1) | JP2010539910A (zh) |
KR (1) | KR101474815B1 (zh) |
CN (1) | CN101809158B (zh) |
AU (1) | AU2008303842B2 (zh) |
CA (1) | CA2697038C (zh) |
ES (1) | ES2647069T3 (zh) |
HU (1) | HUE035577T2 (zh) |
PL (1) | PL2201122T3 (zh) |
PT (1) | PT2201122T (zh) |
TW (1) | TWI601825B (zh) |
WO (1) | WO2009040080A1 (zh) |
ZA (1) | ZA201001052B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2445890B1 (en) | 2009-06-22 | 2015-05-06 | SK Biopharmaceuticals Co., Ltd. | Method for preparation of carbamic acid (r)-1-aryl-2-tetrazolyl-ethyl ester |
WO2011005527A2 (en) | 2009-06-22 | 2011-01-13 | Codexis, Inc. | Ketoreductase-mediated stereoselective route to alpha chloroalcohols |
US8404461B2 (en) * | 2009-10-15 | 2013-03-26 | SK Biopharmaceutical Co. Ltd. | Method for preparation of carbamic acid (R)-1-aryl-2-tetrazolyl-ethyl ester |
WO2011100265A2 (en) | 2010-02-10 | 2011-08-18 | Codexis, Inc. | Processes using amino acid dehydrogenases and ketoreductase-based cofactor regenerating system |
US9410169B2 (en) | 2012-06-18 | 2016-08-09 | Laboratorio Chimico Internazionale S.P.A. | Process for producing chiral 1- substituted 2-piperidinols employing oxidoreductases |
DE102013104418B4 (de) * | 2013-04-30 | 2018-09-27 | Cambrex Iep Gmbh | Biokatalytisches Verfahren für die Herstellung von (R)-3-Chinuclidinol |
WO2019012095A1 (en) | 2017-07-14 | 2019-01-17 | C-Lecta Gmbh | TCO-reductase |
EP3728618A1 (en) | 2017-12-20 | 2020-10-28 | OLON S.p.A. | Process for preparing intermediates for the synthesis of optically active beta-amino alcohols by enzymatic reduction and novel synthesis intermediates |
CN111690696B (zh) * | 2020-07-07 | 2021-12-31 | 南京朗恩生物科技有限公司 | 一种生物催化制备达芦那韦中间体的方法 |
CN114540456A (zh) * | 2020-11-25 | 2022-05-27 | 弈柯莱生物科技(上海)股份有限公司 | 拆分2-(苄氧基羰基氨基)-2-(氧杂环丁烷-3-基)乙酸甲酯的方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4014573C1 (zh) * | 1990-05-07 | 1991-10-10 | Forschungszentrum Juelich Gmbh, 5170 Juelich, De | |
US5523223A (en) * | 1992-03-13 | 1996-06-04 | Forschungszentrum Julich Gmbh | Ketoester reductase for conversion of keto acid esters to optically active hydroxy acid esters |
JP3574682B2 (ja) * | 1993-09-24 | 2004-10-06 | ダイセル化学工業株式会社 | 新規な酵素、該酵素を製造する方法、該酵素をコードするdna、該dnaを含む形質転換体、該酵素による光学活性アルコール等の製造方法 |
JP3529904B2 (ja) * | 1995-06-19 | 2004-05-24 | 鐘淵化学工業株式会社 | 光学活性1−ハロ−3−アミノ−4−フェニル−2−ブタノール誘導体の製造法 |
DE19610984A1 (de) | 1996-03-21 | 1997-09-25 | Boehringer Mannheim Gmbh | Alkohol-Dehydrogenase und deren Verwendung zur enzymatischen Herstellung chiraler Hydroxyverbindungen |
USH1893H (en) * | 1996-07-23 | 2000-10-03 | Bristol-Myers Squibb Company | Enzymatic reduction method for the preparation of halohydrins |
DE60005304T2 (de) * | 1999-01-21 | 2004-06-24 | Kaneka Corp. | Methode zur reinigung und abtrennung von (2s,3s)- oder (2r,3s)-halohydrinderivaten |
JP2001149088A (ja) * | 1999-11-24 | 2001-06-05 | Nippon Kayaku Co Ltd | 光学活性1−置換−3−アミノ−4−フェニル−2−ブタノール誘導体の製造方法 |
AU1551701A (en) * | 1999-12-03 | 2001-06-12 | Kaneka Corporation | Novel carbonyl reductase, gene thereof and method of using the same |
KR20040031674A (ko) | 2000-08-16 | 2004-04-13 | 브리스톨-마이어스스퀴브컴파니 | 치환된 옥소-부탄의 입체선택성 환원 |
DE10119274A1 (de) | 2001-04-20 | 2002-10-31 | Juelich Enzyme Products Gmbh | Enzymatisches Verfahren zur enantioselektiven Reduktion von Ketoverbindungen |
JP2003289874A (ja) * | 2002-04-03 | 2003-10-14 | Kanegafuchi Chem Ind Co Ltd | 共役ポリケトン還元酵素遺伝子とその利用 |
DE10327454A1 (de) | 2003-06-18 | 2005-01-20 | Juelich Enzyme Products Gmbh | Oxidoreduktase aus Pichia capsulata |
WO2006046455A1 (ja) * | 2004-10-27 | 2006-05-04 | Kaneka Corporation | 新規カルボニル還元酵素、その遺伝子、およびその利用法 |
AT501496B1 (de) * | 2005-02-21 | 2007-03-15 | Iep Gmbh | Verfahren zur enantioselektiven enzymatischen reduktion von ketoverbindungen |
AT502395B1 (de) | 2005-07-27 | 2007-03-15 | Iep Gmbh | Oxidoreduktasen zur stereoselektiven reduktion von ketoverbindungen |
DE102005044736A1 (de) * | 2005-09-19 | 2007-03-22 | Basf Ag | Neue Dehydrogenasen, deren Derivate und ein Verfahren zur Herstellung von optisch aktiven Alkanolen |
AT502185B1 (de) * | 2005-09-23 | 2007-02-15 | Iep Gmbh | Verfahren zur enantioselektiven enzymatischen reduktion von ketoverbindungen |
AT503017B1 (de) * | 2005-12-19 | 2007-07-15 | Iep Gmbh | Verfahren zur enantioselektiven enzymatischen reduktion von hydroxyketoverbindungen |
AT504542B1 (de) * | 2006-12-07 | 2008-09-15 | Iep Gmbh | Verfahren zur enantioselektiven enzymatischen reduktion von secodionderivaten |
-
2008
- 2008-09-08 TW TW097134420A patent/TWI601825B/zh not_active IP Right Cessation
- 2008-09-22 JP JP2010526201A patent/JP2010539910A/ja active Pending
- 2008-09-22 US US12/680,148 patent/US8932835B2/en active Active
- 2008-09-22 HU HUE08802486A patent/HUE035577T2/en unknown
- 2008-09-22 ES ES08802486.4T patent/ES2647069T3/es active Active
- 2008-09-22 PT PT88024864T patent/PT2201122T/pt unknown
- 2008-09-22 EP EP08802486.4A patent/EP2201122B1/en active Active
- 2008-09-22 WO PCT/EP2008/007992 patent/WO2009040080A1/en active Application Filing
- 2008-09-22 PL PL08802486T patent/PL2201122T3/pl unknown
- 2008-09-22 CA CA2697038A patent/CA2697038C/en active Active
- 2008-09-22 CN CN200880108175.7A patent/CN101809158B/zh active Active
- 2008-09-22 KR KR1020107006660A patent/KR101474815B1/ko active IP Right Grant
- 2008-09-22 AU AU2008303842A patent/AU2008303842B2/en not_active Ceased
-
2010
- 2010-02-12 ZA ZA2010/01052A patent/ZA201001052B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA2697038C (en) | 2013-06-18 |
EP2201122B1 (en) | 2017-08-16 |
ZA201001052B (en) | 2011-04-28 |
CA2697038A1 (en) | 2009-04-02 |
RU2010116394A (ru) | 2011-11-10 |
AU2008303842B2 (en) | 2014-07-31 |
TWI601825B (zh) | 2017-10-11 |
CN101809158A (zh) | 2010-08-18 |
JP2010539910A (ja) | 2010-12-24 |
HUE035577T2 (en) | 2018-05-28 |
US20100248317A1 (en) | 2010-09-30 |
KR101474815B1 (ko) | 2014-12-19 |
PT2201122T (pt) | 2017-11-15 |
WO2009040080A1 (en) | 2009-04-02 |
ES2647069T3 (es) | 2017-12-19 |
US8932835B2 (en) | 2015-01-13 |
TW200920846A (en) | 2009-05-16 |
EP2201122A1 (en) | 2010-06-30 |
KR20100065344A (ko) | 2010-06-16 |
PL2201122T3 (pl) | 2018-01-31 |
AU2008303842A1 (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101809158B (zh) | 中间体的对映选择性酶还原的方法 | |
JP4845729B2 (ja) | ピキア・カプスラータ由来酸化還元酵素 | |
EP2710117B1 (en) | Recombinant microorganisms and methods of use thereof | |
TWI408234B (zh) | 對映異構選擇性酶催化還原羥基酮化合物類之方法 | |
US8969053B2 (en) | Mutant YqhD enzyme for the production of a biochemical by fermentation | |
JP2007523617A6 (ja) | ピキア・カプスラータ由来酸化還元酵素 | |
JP2009502148A (ja) | ケト化合物の立体選択的還元に用いる酸化還元酵素 | |
KR101474816B1 (ko) | Nadh 또는 nadph의 존재 하에 산화환원효소/탈수소화효소를 이용한 세코디온 유도체의 거울상이성질체 선택적인 효소적 환원 방법에 의한 세콜 유도체의 제조 방법 | |
JPWO2007142210A1 (ja) | 光学活性アルコールの製造方法 | |
US20040229326A1 (en) | Method for producing para-hydroxystyrene and other multifunctional aromatic compounds using two-phase extractive fermentation | |
EP2834351B1 (en) | Enzyme-altered metabolite activity | |
EP2980213A1 (en) | Modified carbonyl reducing enzyme and gene | |
KR101780510B1 (ko) | 케토 화합물의 입체선택적 효소적 환원 방법 | |
KR102291199B1 (ko) | (r)-3-퀴누클리디놀의 생체촉매적 제조방법 | |
Madigal et al. | Yeast and bacterial community profiling of fermenting nipa (Nypa fruticans) sap in two Philippine locations and fermentation characteristics of selected yeasts | |
RU2486239C2 (ru) | Полипептиды для энантиоселективного ферментативного восстановления промежуточных соединений | |
AU2011213806A1 (en) | Method for the enantioselective enzymatic reduction of secodione derivatives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |