CN116670147A

CN116670147A - 将lca和3-kca转化为udca和3-kudca的酶促方法

Info

Publication number: CN116670147A
Application number: CN202180080103.1A
Authority: CN
Inventors: J·G·里德; J·P·雷迪; B·J·保罗; U·谢尔; M·格雷戈里
Original assignee: Shashan No1 Co ltd
Current assignee: Shashan No1 Co ltd
Priority date: 2020-11-30
Filing date: 2021-11-29
Publication date: 2023-08-29
Also published as: AU2021385425A1; WO2022115710A1; CA3201311A1; JP2023552528A; KR20230116864A; EP4251169A1; US20230416800A1

Abstract

本发明提供了7β‑羟化系统，以及由此类系统产生石胆酸和3‑酮基‑石胆酸的7β‑羟基衍生物的方法。本发明还提供了用于产生此类酶系统的重组生物体，以及编码此类酶的质粒。

Description

将LCA和3-KCA转化为UDCA和3-KUDCA的酶促方法

技术领域

本发明涉及7β-羟化系统，以及由此类系统产生石胆酸和3-酮基-5β-胆烷酸的7β-羟基衍生物的方法。本发明还涉及用于产生此类酶系统的重组生物体，以及编码此类酶的质粒。

背景技术

熊去氧胆酸(UDCA)是一种常用于治疗胆囊炎的有价值的胆汁酸，因为它可以溶解胆固醇结石，而副作用比鹅去氧胆酸(CDCA)更少。UDCA还具有抗炎特性，用于治疗囊性纤维化和肝脏疾病，如原发性胆管炎。UDCA的主要天然来源是各种熊的胆汁。

UDCA也可以由胆酸(CA)或CDCA产生，其也可以从动物胆汁中获得。Eggert等人(2014)报道了一条从CA开始形成CDCA的合成路线，分为5个步骤，包括Wolff-Kishner酮还原和C7差向异构化以产生UDCA。T.Eggert,D.Bakonyi,W.Hummel,J.Biotechnol.2014,191,11-21。Zheng等人(2015)报道了一条基于将CDCA生物催化差向异构化为UDCA的较短合成路线。M.-M.Zheng,R.-F.Wang,C.-X.Li,J.-H.Xu,Process Biochem.2015,50,598-604.

7β-羟化酶系统与细胞膜的结合是生物催化系统的一个特殊挑战。事实上，Durairaj等人(2016)报道了P450nor是迄今为止发现的唯一可溶性真菌CYP，并且它进行反硝化作用。Durairaj等人,Microb Cell Fact(2016)15:125。Grobe等人(2020)报道了在全细胞真菌(诸如木贼镰孢菌(Fusarium equiseti))中，这项工作进一步复杂化，其中多种P450酶的作用导致副产物形成。S.Grobe,C.Badenhorst,T.Bayer等人,Angew.Chem.Int.Ed.10.1002/anie.202012675。

为了克服这些障碍，Grobe等人(2020)报道了在基于大肠杆菌(Escherichiacoli)的全细胞系统中，使用来自抗生链霉菌(Streptomyces antibioticus)的细胞色素P450单加氧酶CYP107D1(oleP)的变体从LCA形成UDCA，这种P450酶不需要与细胞膜结合。通过修饰将LCA转化为其6β-羟基衍生物MDCA的天然酶，作者能够主要改变羟基化的位置，使得UDCA优先于MDCA形成。然而，这种转化以非常低的生产率(24小时内最多67μM)和不完全的区域选择性(UDCA∶MDCA的比例最多为73∶27)进行。

因此，需要一种高效且多产的方法来选择性地将LCA和3-KCA转化为UDCA和3-KUDCA。一种理想的方法将提高产量，易于扩大规模，并且易于在商业生产中实施。现在需要的是用于商业规模的石胆酸或3-KCA的7β-羟化的有效的酶系统、方法和组分。

发明内容

在对各种用于羟基化LCA和3-KCA的工程化微生物系统进行了大量实验之后，包括用来自其他物种的天然7β-羟化系统转化的酵母进行的一系列实验，发明人意外地发现了经转化以表达7β-羟化酶活性的基于酵母的系统，其能够从LCA和3-KCA及其衍生物选择性地产生UDCA和3-KUDCA及其衍生物。因此，在第一个主要实施方案中，本发明提供了一种将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法，包含在酵母或其提取物或裂解物的存在下，将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触，其中7β-羟化酶系统对酵母而言是非天然的。

进一步的主要实施方案涉及用于产生本发明生物体的质粒。因此，在第二个主要实施方案中，本发明提供了一种质粒，其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQID NO.32的核酸序列，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

附加的实施方案涉及用于本发明方法的转化生物体。因此，在第三个主要实施方案中，本发明提供了一种转化生物体，其由CYP编码核酸序列转化而来，所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ IDNO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

更进一步的实施方案涉及在其中发生本发明的转化的反应混合物。因此，在第四个主要实施方案中，本发明提供了一种反应混合物，其包含：(i)LCA或3-KCA，(ii)酵母或其提取物或裂解物，(iii)7β-羟化系统。第五个主要实施方案提供了一种反应混合物，其包含酵母和7β-羟化系统，该7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶，其中CYP酶是一种天然存在于玉米赤霉菌(Gibberella zeae)、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。

本发明的附加优点部分在下面的描述中进行阐述，部分将从描述中显而易见，或者可以通过本发明的实践来了解。本发明的优点将通过所附权利要求中特别指出的元素和组合来实现和获得。应当理解，前面的一般描述和下面的详细描述都仅仅是示例性和解释性的，而并非对所要求保护的本发明的限制。

附图说明

附图并入本说明书并构成其一部分，示出了本发明的几个实施方案，并与说明书一起用于解释本发明的原理。

图1描绘了来自实施例17中所述实验的LCMS色谱图。图1A是提取的发酵液样品的TIC迹线。图1B是LCA标准品的TIC迹线。图1C是UDCA标准品的TIC迹线。

图2是从实施例17中所报道的发酵液样品中提取的UDCA(A)与UDCA可信标准品(B)的MS谱图的比较。

图3描绘了来自实施例18中所述实验的CMS色谱图。图3A是分离的UDCA的TIC迹线。图3B是UDCA标准品的TIC迹线。

图4是实施例18中报道的分离的UDCA(A)与UDCA可信标准品(B)的MS谱图的比较。

图5描绘了来自实施例18中所述实验的分离的UDCA的¹H NMR谱图。

图6描述了来自实施例18中所述实验的分离的UDCA的¹³C NMR谱图。

图7描绘了来自实施例18中所述实验的可信UDCA的¹H NMR谱图。

图8描绘了来自实施例18中所述实验的可信UDCA的¹³C NMR谱图。

图9描绘了来自实施例19中所述实验的LCMS色谱图。图9A是提取的发酵液样品的TIC迹线。图9B是提取的发酵液样品的m/z 389.3(3-KUDCA)的提取离子色谱图(EIC)。图9C是3-KUDCA标准品的TIC迹线。图9D是3-KCA标准品的TIC迹线。

图10是从实施例19中所报道的发酵液样品中提取的3-KUDCA(A)与3-KUDCA可信标准品(B)的MS谱图的比较。

图11描绘了来自实施例21中所述实验的LCMS色谱图。图11A是提取的发酵液样品的TIC迹线。图11B是提取的发酵液样品的m/z 391.3(UDCA)的提取离子色谱图(EIC)。图11C是UDCA标准品的TIC迹线。

图12是如实施例21中所报道的从发酵液样品(A)中提取的UDCA与UDCA可信标准品(B)的MS谱图的比较。

具体实施方式

术语定义和用途

如在本说明书和随后的权利要求中所使用的，单数形式“一个、一种(a、an)”和“该(the)”包括复数指示物，除非上下文中另有明确规定。

如在本说明书和随后的权利要求中所使用的，词语“包含(comprise)”及该词语的变体，诸如“包含(comprising)”和“包含(comprises)”，意指“包括但不限于”，并且不旨在排除例如其他添加剂、组分、整体或步骤。当一个元素被描述为包含多个组分、步骤或条件时，应当理解，该元素也可以被描述为包含此类多个组分、步骤或条件的任意组合，或者“由”多个此类组分、步骤或条件或其组合“组成”或“基本上由其组成”。

当通过分别指定范围的下限和范围的上限，或者指定特定的数值来给出范围时，应当理解，可以通过选择性地组合数学上可能的任何下限变量、上限变量和特定数值中的任一个来定义范围。以类似的方式，当范围被定义为从一个端点跨越到另一个端点时，该范围也将被理解为包括两个端点之间的跨度，并且不包括这两个端点。

当本文使用时，术语“约”将补偿化学工业中允许的以及该工业中产品固有的可变性，诸如由于制造变化和时间诱导的产品降解而导致的产品强度差异。在一个实施方案中，该术语允许±5％可变性或±10％可变性。

与本发明的组合物结合使用的短语“可接受的”是指此类组合物的分子实体和其他成分是生理上可耐受的，并且当施用于受试者(例如，哺乳动物，诸如人)时通常不会产生不良反应。

“编码序列”指编码蛋白质氨基酸序列的核酸部分(例如，基因)。

与“非自然存在的”、“非野生型的”、“非天然的”或“外源的”相反，“自然存在的”或“野生型的”或“天然的”指的是在自然界中发现的形式。例如，自然存在的或野生型多肽或多核苷酸序列是存在于生物体中的序列，其可以从自然界的来源中分离，并且没有被人为操作有意修饰。

当用于指例如细胞、核酸或多肽时,“重组体”是指材料或对应于该材料的自然或天然形式的材料，其已经以自然界中不存在的方式进行了修饰。非限制性实例包括，除此之外，重组细胞表达在细胞的天然(非重组)形式中未曾发现的基因，或者表达以不同水平表达的天然基因。

“序列同一性百分比”和“同源性百分比”在本文中可互换使用，是指多核苷酸和多肽之间的比较，并通过在比较窗口(comparison window)中比较两个最佳比对的序列来进行确定，其中多核苷酸或多肽序列在比较窗口中的部分与参考序列(不包含添加或缺失)相比将包含添加或缺失(即，空位(gap))，以实现两个序列的最佳比对。百分比的计算方法是：通过确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数量，得到匹配位置的数量，将匹配位置的数量除以比较窗口中位置的总数，并将结果乘以100，得到序列同一性的百分比。

本领域技术人员将理解，存在多种已建立的算法可用于比对两个序列。可以通过例如Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源算法、通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源比对算法、通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444的相似性搜索方法、通过这些算法的计算机化实现(GCG威斯康辛软件包中的GAP、BESTFIT、FASTA和TFASTA)或通过视觉检查(通常参见，CurrentProtocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols(Greene出版社和John Wiley&Sons出版社的合伙企业)，(1995增补)(Ausubel))来进行用于比较的序列的最佳比对。适用于确定序列同一性百分比和序列相似性的算法的实例是BLAST和BLAST2.0算法，在Altschul等人,1990,J.Mol.Biol.215:403-410和Altschul等人,1977,NucleicAcids Res.3389-3402中分别进行了描述。

“参考序列”是指用作序列比较基础的确定序列。参考序列可以是更大序列的子集，例如全长基因或多肽序列的片段。通常，参考序列的长度为至少20个核苷酸或氨基酸残基、至少25个残基、至少50个残基、或核酸或多肽的全长。由于两个多核苷酸或多肽可能各自(1)包含两个序列之间相似的序列(即，完整序列的一部分)，并且(2)可能进一步包含两个序列之间不同的序列，因此通常通过在“比较窗口”中比较两个多核苷酸的序列来进行两个(或更多个)多核苷酸或多肽之间的序列比较，以鉴定和比较序列相似性的局部区域。

“比较窗口”是指至少约20个连续核苷酸位置或氨基酸残基的概念化片段，其中序列可与至少20个连续核苷酸或氨基酸的参考序列进行比较，并且其中与参考序列(不包含添加或缺失)相比，比较窗口中的序列部分可包含20％或更少的添加或缺失(即，空位)以用于两个序列的最佳比对。比较窗口可以长于20个连续残基，并且任选包括30、40、50、100、150或200个或更长的窗口。

“基本同一性(substantial identity)”是指在包含至少90％、95％、98％或99％的参考序列的比较窗口中，与参考序列相比，多核苷酸或多肽序列具有至少80％序列同一性、至少85％序列同一性、至少90％序列同一性或至少95％序列同一性，更通常地至少98％或99％序列同一性。在应用于多肽的具体实施方案中，术语“基本同一性”是指在诸如通过GAP或BESTFIT程序使用默认空位权重进行最佳比对时，，两条多肽序列共享至少80％序列同一性、优选至少89％序列同一性、至少95％序列同一性或更多(例如，99％序列同一性)。优选地，不相同的残基位置因保守氨基酸取代而不同。

当本文提及细胞生物体时，应当理解为指野生型状态的生物体和修饰的生物体。因此，术语酵母包括自然界中自然存在的所有野生型酵母，以及使用重组技术产生的任何人造酵母。

术语“酵母”是指酵母纲、优选酵母菌目、优选酵母科的子囊菌门真菌。特别优选的酵母属于毕赤酵母属(Pichia)和酵母属(Saccharomyces)，尤其是巴斯德毕赤酵母(Pichiapastoris)和酿酒酵母(Saccharomyces cerevisiae)。

3-KCA或3-酮基-5β-胆烷酸由以下化学结构表示：

LCA或石胆酸由以下化学结构表示：

3-KUDCA或7β-羟基-3-酮基-5β-胆烷酸由以下化学结构表示：

UDCA或熊去氧胆酸由以下化学结构表示：

如本文所用，羧酸“盐”是指所公开化合物的衍生物，其中通过将现有的酸部分转化成其盐的形式，而使母体化合物得以修饰。合适的盐的实例包括但不限于羧酸的酸性残基的碱金属盐或有机盐。本发明的盐包括例如由无毒无机或有机碱形成的母体化合物的常规无毒盐或季铵盐。本发明的盐可以由含有酸性部分的母体化合物通过常规化学方法合成。通常，可以通过使这些化合物的游离酸形式与化学计量量的适当碱在水或有机溶剂或两者的混合物中反应，来制备此类盐。

本文所用的“酯”优选指-COOR部分，其中R是任选取代的C_1-20烷基，或任选取代的芳基。

如本文所用，术语“烷基”是指直链或支链的饱和烃基。烷基的实例包括甲基(Me)、乙基(Et)、丙基(例如，正丙基和异丙基)、丁基(例如，正丁基、异丁基、叔丁基)、戊基(例如，正戊基、异戊基、新戊基)等。在本发明的任何实施方案或子实施方案中，烷基可以含有1至约20、2至约20、1至约10、1至约8、1至约6、1至约4或1至约3个碳原子。

如本文所用，“芳基”是指单环或多环(例如，具有2、3或4个稠环)芳烃(包括杂芳烃)，例如苯基、萘基、蒽基、菲基、茚满基、茚基等。在一些实施方案中，芳基具有6至约20个碳原子。

在本发明的任何实施方案或子实施方案中，任选被取代的部分可替代地定义为被0、1、2或3个独立选自卤素、OH、胺、C_1-6烷基、C_1-6烷氧基、C_1-6羟烷基、CO(C_1-6烷基)、CHO、CO₂H、CO₂(C_1-6烷基)和C_1-6卤代烷基的取代基取代。

如本文所用，酰胺优选指-C(O)N(R’)(R”)部分，其中R’和R”独立地为任选取代的C_1-20烷基，或任选取代的芳基。可替代地，UDCA的羧酸酰胺可以是牛磺熊去氧胆酸(“TUDCA”)。

本发明的“P450 7β-羟化酶系统”是指能够羟基化LCA或K-LCA的7-H位的II类CYP酶系统。如Durairaj等人,Microb Cell Fact(2016)15:125中所讨论的，II类CYP酶系统包含两种整合膜蛋白：P450 7β-羟化酶(本文有时称为“CYP”)和细胞色素P450还原酶(本文有时称为“CPR”)，其含有辅因子FAD和FMN，将两个电子从NAD(P)H递送至血红素部分。该系统还可以包含第三种蛋白质组分Cyt b5，它将第二个电子转移到氧化亚铁CYP。

主要实施方案的讨论

本发明的第一个主要实施方案提供了将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法，包含在酵母或其提取物或裂解物的存在下，将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触，其中7β-羟化酶系统对酵母而言是非天然的。

第二个主要实施方案提供了一种质粒，其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQ ID NO.32的核酸序列，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

第三个主要实施方案提供了一种生物体，其由CYP编码核酸序列转化，该CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

在第四个主要实施方案中，本发明提供了一种反应混合物，其包含：(i)LCA或3-KCA；(ii)酵母或其提取物或裂解物；和(iii)7β-羟化系统。

第五个主要实施方案提供了一种反应混合物，其包含酵母和7β-羟化系统，该7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶，其中CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。

子实施方案的讨论

如前所述，本发明优选在转化表达非天然7β-羟化系统的酵母存在下进行。酵母优选选自酵母属和毕赤酵母属，最优选选自酿酒酵母和巴斯德毕赤酵母。

本发明方法中使用的生物体将由非天然7β-羟化系统转化，该系统包含非天然P450 7β-羟化酶(“CYP”)酶和任选的非天然P450氧化还原酶(“CPR”)酶。尽管CPR酶对7β-羟化酶系统至关重要，但CPR酶对于生物体来说可能并非绝对必需的，因为酵母中天然存在的固有酶可能是足够的。

用于实施本发明的优选CYP酶由CYP编码核酸序列编码，该CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

编码CYP的核酸可以选自前述SEQ ID NO的任何一种或组合，并与本发明的任何CPR酶组合。在一个实施方案中，编码核酸序列选自SEQ ID 8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17和SEQ ID NO.20，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。在另一个实施方案中，核酸选自SEQ ID NO.23、SEQ ID NO.26或SEQ ID NO.29，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。在另一个实施方案中，核酸序列选自SEQ ID NO.32，或与SEQ ID NO.32具有至少85％、90％、95％、98％或99％同一性的核酸序列。

CYP酶优选包含CYP氨基酸序列，该CYP氨基酸序列选自SEQ ID NO.9、SEQ IDNO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ ID NO.24、SEQ ID NO.27、SEQ IDNO.30或SEQ ID NO.33，或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

CYP酶可以选自前述SEQ ID NO的任何一种或组合，并与本发明的任何CPR酶组合。在一个实施方案中，CYP酶包含SEQ ID NO.9、SEQ ID NO.12、SEQ ID NO.15、SEQ ID NO.18和SEQ ID NO.21，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。在另一个实施方案中，CYP酶包含SEQ ID NO.24、SEQ ID NO.27或SEQ ID NO.30，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。在另一个实施方案中，CYP酶包含SEQ ID NO.33，或与SEQ ID NO.33具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

编码本发明CYP酶的优选质粒优选包含选自SEQ ID NO.7、SEQ ID NO.10、SEQ IDNO.13、SEQ ID NO.16、SEQ ID NO.19、SEQ ID NO.22、SEQ ID NO.25、SEQ ID NO.28或SEQID NO.31的核酸序列，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

在一个实施方案中，编码CYP酶的质粒包含SEQ ID NO.7、SEQ ID NO.10、SEQ IDNO.13、SEQ ID NO.16或SEQ ID NO.19，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。在另一个实施方案中，编码CYP酶的质粒包含SEQ ID NO.22、SEQID NO.25或SEQ ID NO.28，或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。在另一个实施方案中，编码CYP酶的质粒包含SEQ ID NO.31，或与SEQ IDNO.31具有至少85％、90％、95％、98％或99％同一性的核酸序列。

在一个实施方案中，CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的蛋白质，并且该生物体被转化以表达此类蛋白质。

7β-羟化系统中的CPR酶可以天然存在于表达7β-羟化酶活性的生物体中，或由CPR编码核酸序列编码，该CPR编码核酸序列选自SEQ ID NO.2和SEQ ID NO.5，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。CPR酶优选包含CPR氨基酸序列，该CPR氨基酸序列选自SEQ ID NO.3和SEQ ID NO.6，或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

在一个实施方案中，通过将LCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触来实施本发明的方法，以产生UDCA或其羧酸酯、羧酸酰胺或羧酸盐。在另一个实施方案中，通过将3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触来实施本发明的方法，以产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。当产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐时，本发明的方法将任选地进一步包含将3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐还原成UDCA或其羧酸酯、羧酸酰胺或羧酸盐。

在优选的实施方案中，本发明的方法进一步包含从7β-羟化酶系统中分离UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。分离是指UDCA或3-KUDCA基本上不含7β-羟化酶系统以及产生UDCA或3-KUDCA的反应混合物。因此，当考虑任何残余反应混合物的重量时，UDCA或3-KUDCA的纯度至少为90％、至少95％、或至少98％。在特别优选的实施方案中，UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐基本上作为纯的非对映异构体产生。“基本上纯的非对映异构体”是指当考虑非对映异构体的7α-非对映体时，非对映异构体的纯度至少为90％、至少95％或至少98％。

工程化CYP和CPR酶

通过使编码CYP或CPR酶的遗传物质突变并鉴定表达具有所需性质的工程化酶的多核苷酸，可以获得与本文公开的酶序列性质不同的CYP和CPR酶。这些非天然存在的CYP和CPR酶可以通过各种众所周知的技术产生，诸如体外诱变或定向进化。在一些实施方案中，定向进化是产生工程化酶的有吸引力的方法，因为在编码多肽的整个基因中产生突变相对容易，并且使得能够获取先前突变的多核苷酸并使它们经受额外的诱变和/或重组循环以进一步改善所选酶性质。对整个基因进行诱变可以减少由于将变化限制在基因的有限区域而产生的偏差。它还可以增强受不同酶性质影响的酶的产生，因为酶的间隔较远的部分可能在酶功能的各个方面发挥作用。

在诱变和定向进化中，对编码自然存在或野生型CYP或CPR酶的亲本或参考多核苷酸进行诱变处理，例如随机诱变和重组，以将突变导入多核苷酸。突变的多核苷酸被表达和翻译，从而产生对多肽进行修饰的工程化CYP或CPR酶。如本文所用，“修饰”包括氨基酸取代、缺失和插入。可以将任何一种修饰或修饰的组合导入自然存在的具有酶活性的多肽中，以产生工程化酶，然后通过各种方法对其进行筛选，以鉴定在特定酶性质方面具有所需改善的多肽和相应的多核苷酸。

7-β羟化酶环境

CYP和CPR酶可以存在于细胞内、细胞培养基中、固定化底物上，或者以其他形式存在，诸如被重组设计用于表达该酶的细胞的裂解物和提取物，或者分离的制剂。术语“分离的多肽”是指基本上与其天然伴随的其他污染物分离的多肽，例如蛋白质、脂质和多核苷酸。该术语包括从其自然存在的环境或表达系统(例如，宿主细胞或体外合成)中去除或纯化的多肽。

在一些实施方案中，分离的CYP和CPR酶存在于基本上纯的多肽组合物中。术语“基本上纯的多肽”是指组合物中多肽种类是存在的主要种类(即，基于摩尔或重量，它比组合物中任何其他单个大分子种类更为丰富)，并且当目标种类包含至少约50％摩尔或％重量的大分子种类时，通常是基本上纯化的组合物。通常，基本上纯的CYP和CPR酶组合物将包含组合物中存在的按摩尔或重量计约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多以及约98％或更多的所有大分子物质。在一些实施方案中，目标物质被纯化至基本同质(即，通过常规检测方法不能在组合物中检测到污染物物质)，其中组合物基本上由单一CYP和CPR大分子物质组成。溶剂种类、小分子(<500道尔顿)和元素离子种类不被认为是大分子种类。

编码多核苷酸

编码CYP和CPR酶的分离的多核苷酸可以以多种方式操作以提供该酶的表达。取决于表达载体，在将分离的多核苷酸插入载体之前对其进行操作可能是期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域众所周知的。指南参见Sambrook等人,2001,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory出版社；以及Current Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,2006年更新。

因此，在另一方面，本发明还涉及一种重组表达载体，其包含编码CYP和CPR酶多肽或其变体的多核苷酸，以及一个或多个表达调节区，诸如启动子和终止子、复制起点等，这取决于要将它们导入的宿主的类型。各种核酸和控制序列可以连接在一起以产生重组表达载体，该载体可以包括一个或多个方便的限制性位点，以允许在这些位点插入或取代编码多肽的核酸序列。在创建重组表达载体时，编码序列位于载体中，使得编码序列与用于表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其可以方便地进行重组DNA程序，并且可以引起多核苷酸序列的表达。载体的选择通常取决于载体与载体将被导入的宿主细胞的相容性。载体可以是线性或闭环质粒。

表达载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制不依赖于染色体复制，例如质粒、染色体外元件、小染色体或人工染色体。载体可以包含任何确保自我复制的手段。可替代地，载体可以是这样一种载体，当其被导入宿主细胞时，被整合到基因组中并与其被整合到其中的染色体一起复制。此外，可以使用单个载体或质粒，或者两个或更多个载体或质粒，它们一起含有将被导入宿主细胞基因组的总DNA。在特别优选的实施方案中，本发明的质粒或载体受AOX1启动子和AOX1终止子序列的控制。

术语“控制序列”在本文中被定义为包括对本发明多肽的表达是必要的或有利的所有组分。每个控制序列对于编码多肽的核酸序列可以是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少，控制序列包括启动子、转录和翻译终止信号以及核糖体结合位点(以终止翻译)。可以为控制序列提供接头，以便导入特定的限制性位点，从而促进控制序列与编码多肽的核酸序列的编码区的连接。

术语“可操作地连接”在本文中被定义为一种构型，其中控制序列被适当地置于相对于DNA序列的编码序列的位置，使得控制序列指导多核苷酸和/或多肽的表达。控制序列可以是合适的启动子序列。“启动子序列”是被宿主细胞识别以表达编码区的核酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何核酸序列，包括突变、截短和杂合启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。

控制序列也可以是合适的转录终止子序列，即被宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3'末端。在所选宿主细胞中有功能的任何终止子都可以用于本发明。

用于表达CYP和CPR多肽的宿主细胞

在另一个方面，本发明提供了一种宿主细胞，其包含编码本发明的CYP和CPR酶的多核苷酸，该多核苷酸可操作地连接到一个或多个用于在宿主细胞中表达CYP和CPR酶的控制序列。用于表达由本发明表达载体编码的CYP和CPR酶的宿主细胞是本领域众所周知的，尤其包括本发明的酵母细胞(例如，酿酒酵母或巴斯德毕赤酵母)。在一个特定的实施方案中，本发明的方法用表达CYP和CPR酶的全细胞或此类细胞的提取物或裂解物进行，其中全细胞或此类全细胞的提取物或裂解物选自巴斯德毕赤酵母和酿酒酵母。上述宿主细胞的适当培养基和生长条件是本领域众所周知的。

可以通过本领域已知的各种方法，将用于表达CYP和CPR酶的多核苷酸导入细胞。对于本文所述的酵母，典型的过程是通过转化(例如，电穿孔或氯化钙介导)或接合，或者有时是天然质体融合。将多核苷酸导入细胞的各种方法对技术人员来说是显而易见的。

反应条件

在进行本文所述的立体选择性羟化时，CYP和CPR酶可以以纯化的酶(包括固定化变体)、用编码酶的基因转化的全细胞和/或此类细胞的细胞提取物和/或裂解物的形式加入到反应混合物中。编码工程化CYP和CPR酶的基因可以单独或一起转化到宿主细胞中。

例如，在一些实施方案中，可以用编码CYP酶的基因转化一组宿主细胞，并且可以用编码CPR酶的基因转化另一组宿主细胞。两组转化的细胞可以以全细胞的形式、或以其衍生的裂解物或提取物的形式一起用于反应混合物中。在其他实施方案中，可以用编码工程化CYP和CPR酶的基因转化宿主细胞。

用编码CYP和CPR酶的基因转化的全细胞或其细胞提取物和/或裂解物可以以各种不同的形式使用，包括固体(例如，冻干的、喷雾干燥的、固定化的等)或半固体(例如，粗糊)。细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)进行部分纯化，然后在冻干前进行脱盐程序(例如，超滤、透析等)。

羟化反应中使用的反应物的量通常根据所用的CYP和CPR酶底物的量而变化。以下指南可用于确定CYP和CPR酶的用量。通常，使用约50mg/L至约5g/L的羟化酶系统，以约1至20g/L的浓度使用甾醇底物。反应混合物中甾醇与羟化酶系统的重量比通常为约10∶1至200∶1。本领域普通技术人员将容易理解如何改变这些量，以将它们调整到期望的生产率水平和生产规模。

反应物的加入顺序并不重要。反应物可以同时一起加入到溶剂(例如，单相溶剂、双相水性共溶剂系统等)中，或者可替代地，一些反应物可以单独加入，以及一些反应物在不同的时间点一起加入。例如，羟化酶系统可以首先加入到溶剂中。然而，优选最后加入酶制剂。

进行本文所述的CYP和CPR酶催化反应的合适条件包括多种条件，包括在实验pH和温度下使CYP和CPR酶与甾醇底物接触，并例如使用本文提供的实施例中所述的方法检测产物。

本文所述的羟化酶催化反应通常在溶剂中进行。虽然水是最优选的，但是在某些情况下，可以单独或与水组合使用有机溶剂，诸如乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等，以及离子液体，诸如1-乙基4-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑六氟磷酸盐等。在优选的实施方案中，使用水性溶剂，包括水和水性助溶剂系统。溶剂系统优选大于50％、75％、90％、95％或98％的水，并且在一个实施方案中是100％的水。

在羟基化过程中，反应混合物的pH值可能会改变。通过在反应过程中加入酸或碱，可以将反应混合物的pH保持在所需的pH或所需的pH范围内。可替代地，可以通过使用包含缓冲液的溶剂来控制pH。维持所需pH范围的合适缓冲液是本领域已知的，包括例如磷酸盐缓冲液、三乙醇胺缓冲液等。也可以使用缓冲和添加酸或碱的组合。

羟基化通常在约15℃至约75℃的温度范围内进行。对于一些实施方案，反应在约20℃至约55℃的温度范围内进行。在又一些实施方案中，反应在约20℃至约45℃的温度范围内进行。该反应也可以在环境条件下进行。

通常允许反应进行，直到基本上完成或接近完成底物的羟化。可以使用已知方法通过检测底物和/或产物来监测底物到产物的羟化。合适的方法包括气相色谱法、HPLC等。反应混合物中生成的甾醇羟化产物的转化率通常大于约50％，也可以大于约60％，也可以大于约70％，也可以大于约80％，也可以大于90％，甚至可以大于约97％。

可以从反应混合物中回收羟化产物，并任选地使用本领域技术人员已知的方法进一步纯化。从羟化酶系统中分离的色谱技术包括反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱等。纯化特定甾醇的条件将部分取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素。产品纯化的优选方法包括提取到有机溶剂中，随后结晶。

实施例

在以下实施例中，已经努力确保数字(例如，数量、温度等)的准确性。但是应当考虑一些误差和偏差。提出以下实施例是为了向本领域普通技术人员提供关于如何进行和评估本文要求保护的方法的完整公开和描述，并且这些实施例旨在纯粹作为本发明的示例，而不旨在限制发明人认为是其发明的范围。

实施例1至15的一般方法

使用标准方法(Green和Sambrook，2012)进行DNA的分离、处理和操作，包括限制性酶消化、PCR、克隆技术和细菌细胞转化。例如，参见Green,M.R.,Sambrook,J.,2012.Molecular Cloning:A Laboratory Manual,第四版,4Lab版本.Cold Spring Harbor出版社,纽约冷泉港。

从商业供应商处订购合成DNA，诸如Eurofins Scientific SE(比利时布鲁塞尔)、Integrated DNA Technologies(爱荷华州科拉尔维尔)、Genewiz(布鲁克斯生命科学公司)(新泽西州南普莱恩菲尔德)或Twist Bioscience(加利福尼亚州旧金山)。如实施例中所述，在定制载体中提供基因。

培养基

2TY培养基含有16g/L细菌胰蛋白胨、10g/L酵母提取物和5g/L氯化钠，并通过高压灭菌。2TY琼脂还含有15g/L琼脂。

YPD培养基含有10g/L酵母提取物、10g/L细菌胰蛋白胨，并通过高压灭菌。使用前加入50mL/L的无菌40％葡萄糖储备液。YPD琼脂平板另外含有15g/L琼脂。

BMG含有100mM磷酸钾、pH 7.5、13.4g/L YNB、0.4mg/L生物素和1％甘油。

BMM含有100mM磷酸钾、pH 7.5、13.4g/L YNB、0.4mg/L生物素和1％甲醇。

BMMY培养基是通过将10g酵母提取物和10g细菌胰蛋白胨溶解在700ml dH2O中并通过高压灭菌来制备的。使用前加入100mL YNB储备液、2mL生物素储备液和100mL 100mM磷酸钾缓冲液(pH 6.0)。

YNB储备液由134g/L酵母氮碱和硫酸铵组成，不含氨基酸，并通过高压灭菌。

生物素原液由200mg/L生物素组成，使用0.2μm过滤器过滤灭菌。

材料

限制性酶购自新英格兰生物实验室(马萨诸塞州伊普斯威奇)或Promega公司(威斯康星州麦迪逊)。培养基组分、化学物质和PCR引物从MilliporeSigma(密苏里州圣路易斯)获得。Zeocin由Thermo Fisher Scientific(马萨诸塞州沃尔瑟姆)提供。

巴斯德毕赤酵母的转化

巴斯德毕赤酵母(Komagataella phaffi NRRL Y-11430/ATCC 76273，下文称为巴斯德毕赤酵母SAND101)在10mL YPD中于30℃以250转/分钟振荡生长过夜。该培养物用于接种500ml YPD至OD600为0.1，然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下以2000×g离心10分钟来收获细胞，并重悬于补充有20ml 1M HEPES(pH 8.0)和2.5ml1M DTT的100ml YPD中。细胞于30℃孵育15分钟，不振荡。加入冷dH₂O至最终体积为500ml，并通过在4℃下以2000×g离心10分钟来收获细胞。用250ml冷dH₂O洗涤细胞，并通过在4℃下以2000×g离心10分钟来收获细胞。用20ml冷的1M山梨醇洗涤细胞，并通过在4℃下以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng DNA加入到40μl感受态细胞中，并转移到2mm间隙的电穿孔比色皿中，在冰上预冷。使用1500V、200Ω、25μF设置，在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1ml冷的1M山梨醇，并将混合物转移到无菌Eppendorf管中。细胞于30℃再生，以250转/分钟振荡至少30分钟。然后将细胞涂布于含有适当抗生素的YPD琼脂平板上，然后于30℃孵育2天或直至菌落变得可见。

实施例1：构建能够表达SEQ ID NO.2(FGSG_04903)的巴斯德毕赤酵母菌株

质粒pSAND102是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.1。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.2的基因，编码序列为SEQ ID NO.3的P450还原酶，受AOX1启动子控制，随后是AOX1终止子序列。AOX1启动子含有一个独特的PmeI限制性位点，允许质粒pSAND102线性化。

质粒pSAND102用限制性内切酶PmeI线性化。从反应混合物中纯化线性化的质粒，例如使用市售的柱纯化试剂盒。用PmeI线性化的质粒pSAND102转化巴斯德毕赤酵母SAND101菌株的电感受态细胞，使其能够在AOX1启动子处整合到基因组中。将转化体铺板于含有100μg/ml诺尔丝菌素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND102。

实施例2：构建能够表达SEQ ID NO.5(FGSG_03175)的巴斯德毕赤酵母菌株

质粒pSAND103是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.4。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.5的基因，编码序列为SEQ ID NO.6的P450还原酶，受AOX1启动子控制，随后是AOX1终止子序列。AOX1启动子含有一个独特的PmeI限制性位点，允许质粒pSAND103线性化。

质粒pSAND103用限制性内切酶PmeI线性化。从反应混合物中纯化线性化的质粒，例如使用市售的柱纯化试剂盒。用PmeI线性化的质粒pSAND103转化巴斯德毕赤酵母SAND101菌株的电感受态细胞，使其能够在AOX1启动子处整合到基因组中。将转化体铺板于含有100μg/ml诺尔丝菌素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND103。

实施例3：构建能够表达SEQ ID NO.8(FGSG_05333)的毕赤酵母菌株

质粒pSAND104是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.7。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.8的基因，编码序列为SEQ ID NO.9的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND104转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素(zeocin)的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND104。

用质粒pSAND104转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND105。

实施例4：构建能够表达SEQ ID NO.11(FGSG_02672)的巴斯德毕赤酵母菌株

质粒pSAND105是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.10。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.11的基因，编码序列为SEQ ID NO.12的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND105转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND106。

用质粒pSAND105转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND107。

实施例5：构建能够表达SEQ ID NO.14(FGSG_10695)的巴斯德毕赤酵母菌株

质粒pSAND106是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.13。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.14的基因，编码序列为SEQ ID NO.15的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND106转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND108。

用质粒pSAND106转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND109。

实施例6：构建能够表达SEQ ID NO.17(P450 51(1)-FGSG_04092)的巴斯德毕赤酵母菌株

质粒pSAND107是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.16。简而言之，它包含AOX1启动子序列，随后是序列为SEQ ID NO.17的基因，编码序列为SEQ ID NO.18的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND107转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND110。

用质粒pSAND107转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND111。

实施例7：构建能够表达SEQ ID NO.20(P450 51(2)-FGSG_01000)的巴斯德毕赤酵母菌株

质粒pSAND108是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.19。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.20的基因，编码序列为SEQ ID NO.21的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND108转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND112。

用质粒pSAND108转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND113。

实施例8：构建能够表达SEQ ID NO.23(FGRAMPH1_01T05089)的毕赤酵母菌株

质粒pSAND109是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.22。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.23的基因，编码序列为SEQ ID NO.24的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND109转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND114。

用质粒pSAND109转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND115。

实施例9：构建能够表达SEQ ID NO.26(FGRAMPH1_01T09325)的毕赤酵母菌株

质粒pSAND110是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.25。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.26的基因，编码序列为SEQ ID NO.27的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND110转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND116。

用质粒pSAND110转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND117。

实施例10：构建能够表达SEQ ID NO.29(FGRAMPH1_01T21239)的毕赤酵母菌株

质粒pSAND111是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.28。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.29的基因，编码序列为SEQ ID NO.30的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND111转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND118。

用质粒pSAND111转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND119。

实施例11：构建能够表达SEQ ID NO.32(FGSG_02672V2)的巴斯德毕赤酵母菌株

质粒pSAND112是从商业供应商处获得的合成DNA，其序列为SEQ ID NO.31。简而言之，它含有AOX1启动子序列，随后是序列为SEQ ID NO.32的基因，编码序列为SEQ ID NO.33的P450，受AOX1启动子控制，随后是AOX1终止子序列。

用质粒pSAND112转化巴斯德毕赤酵母SAND102菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND120。

用质粒pSAND112转化巴斯德毕赤酵母SAND103菌株的电感受态细胞，将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上，并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND121。

实施例12：P450和P450还原酶基因在巴斯德毕赤酵母菌株巴斯德毕赤酵母SAND104-巴斯德毕赤酵母SAND121中的表达

通过使用标准方法诱导基因表达，测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将石胆酸转化为熊去氧胆酸。在一种此类方法中，用菌株的新鲜单菌落接种含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD培养基，并于30℃以250转/分钟振荡孵育过夜。用1/10体积的过夜培养物接种含有2mM氨基乙酰丙酸、100μl/ml诺尔丝菌素和100μg/ml博来霉素的新鲜BMMY培养基，并于30℃以250转/分钟振荡孵育，直到OD600达到1.0。加入甲醇至终浓度为0.5％(v/v)，加入石胆酸至终浓度为1mM，并于30℃以250转/分钟振荡2-3天继续孵育。

使用标准方法从发酵液中提取包括UDCA在内的产物，诸如在X.Ma,和X.Cao,Bioresources and Bioprocessin第1卷,文章编号:5(2014)以及F.Tonin和I.Arends,Beilstein J Org Chem.2018；14:470–483中描述的那些。在一种方法中，将培养物提取到等体积的乙酸乙酯中，通过加入酸将pH调节到小于4，分离乙酸乙酯相，然后蒸发除去溶剂，然后使用色谱法纯化目的甾醇。

实施例13：使用在BMG培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行LCA转化

通过使用标准方法诱导基因表达，测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将石胆酸转化为熊去氧胆酸，诸如W.Lu,J.Feng,X.Chen等人,2019Appl.Environ.Microbiol.85,e01182-19中所描述的那样。在该方法中，用菌株的新鲜单菌落接种25ml BMG培养基，并于30℃以250转/分钟振荡孵育至OD600为10。通过以4000×g离心5分钟来收获细胞，并悬浮在含有2mM氨基乙酰丙酸的BMM培养基中至OD600为1.0。培养物于20℃以250转/分钟的速度振荡孵育，每24小时加入甲醇(1％v/v)，持续5天。

通过以4000×g离心5分钟来收获细胞，并重悬于30ml的50mM磷酸钾缓冲液(pH7.5，含有2mM氨基乙酰丙酸和1mM石胆酸)中。每24小时加入甲醇(1％v/v)，于30℃以200转/分钟振荡孵育细胞悬浮液3天。

实施例14：使用在YPD培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行3-KCA转化

通过使用标准方法诱导基因表达，测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将3-酮基-5-β-胆烷酸(3-KCA)转化为3-酮基-7-β-羟基-5-β-胆烷酸(3-KUDCA)。在一种此类方法中，用菌株的新鲜单菌落接种含有100μl/ml诺尔丝菌素和100μg/ml博来霉素的YPD培养基，并于30℃以250转/分钟振荡孵育过夜。用1/10体积的过夜培养物接种含有2mM氨基乙酰丙酸、100μl/ml诺尔丝菌素和100μg/ml博来霉素的新鲜BMMY培养基，并于30℃以250转/分钟振荡孵育，直到OD600达到1.0。加入甲醇至终浓度为0.5％(v/v)，加入3-KCA至终浓度为1mM，并于30℃以250转/分钟振荡继续孵育2-3天。

使用标准方法从发酵液中提取包括3-KUDCA在内的产物。在一种方法中，将培养物提取到等体积的乙酸乙酯中，通过加入酸将pH调节到小于4，分离乙酸乙酯相，然后蒸发除去溶剂，然后使用色谱法纯化目的甾醇。

实施例15：使用在BMG培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行3-KCA转化

通过使用标准方法诱导基因表达，测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将3-KCA转化为3-KUDCA，诸如W.Lu,J.Feng,X.Chen等人，2019Appl.Environ.Microbiol.85,e01182-19中所描述的那样。在该方法中，用菌株的新鲜单菌落接种25ml BMG培养基，并于30℃以250转/分钟振荡孵育至OD600为10。通过以4000×g离心5分钟来收获细胞，并悬浮在含有2mM氨基乙酰丙酸的BMM培养基中至OD600为1.0。培养物于20℃以250转/分钟的速度振荡孵育，每24小时加入甲醇(1％v/v)，持续5天。

通过以4000×g离心5分钟来收获细胞，并重悬于30ml 50mM磷酸钾缓冲液(pH7.5，含有2mM氨基乙酰丙酸和1mM 3-KCA)中。每24小时加入甲醇(1％v/v)，于30℃以200转/分钟振荡孵育细胞悬浮液3天。

实施例16至21的一般方法

培养提取物的分析

如实施例中所述对液体培养物进行溶剂提取后，在Agilent 1100HPLC上分析样品中UDCA和3-KUDCA的产生，Agilent 1100HPLC具有Waters XSelect CSH C18柱(2.1mm×50mm×3.5μm)，该柱配有Waters VanGuard和Acquity在线柱过滤器，并于60℃操作。流动相由溶剂A(0.005M乙酸铵、0.012％甲酸)和溶剂B(95％甲醇、5％水、0.012％甲酸)组成，流速为1.0mL/分钟。在9.5分钟内运行从50％溶剂B到100％溶剂B的梯度。样品在212nm处进行UV分析，并使用以电喷雾负离子模式运行的Waters ZQ单四极杆质谱仪进行MS分析，质量范围m/z为150-500。

培养基

合成葡萄糖基础培养基含有6.7g/L不含氨基酸的酵母氮碱、20g/L葡萄糖和1.3g/L缺陷型氨基酸粉末(amino acid dropout powder)，并通过高压灭菌。合成葡萄糖基础琼脂培养基含有20g/L琼脂。

合成半乳糖基础培养基含有6.7g/L不含氨基酸的酵母氮基、20g/L半乳糖和1.3g/L缺陷型氨基酸粉末，并通过高压灭菌。合成半乳糖基础琼脂培养基含有20g/L琼脂。

巴斯德毕赤酵母的转化

巴斯德毕赤酵母(Komagataella phaffi NRRL Y-11430/ATCC 76273，下文称为巴斯德毕赤酵母SAND101)在10mL YPD中于30℃以250转/分钟振荡生长过夜。该培养物用于接种500ml YPD至OD600为0.1，然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下2000×g离心10分钟来收获细胞，并重悬于补充有20mL的1M HEPES(pH 8.0)和2.5mL的1M DTT的100mL YPD中。细胞于30℃孵育15分钟，不振荡。加入冷dH₂O至最终体积为500mL，并通过在4℃下以2000×g离心10分钟来收获细胞。用250mL冷dH₂O洗涤细胞，并通过在4℃下以2000×g离心10分钟来收获细胞。用20mL冷的1M山梨醇洗涤细胞，并通过在4℃以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng DNA加入到40μl感受态细胞中，并转移到2mm间隙的电穿孔比色皿中，在冰上预冷。使用1500V、200Ω、25μF设置，在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1mL冷的1M山梨醇，并将混合物转移到无菌Eppendorf管中。细胞于30℃再生，以250转/分钟振荡至少30分钟。然后将细胞涂布于含有适当抗生素的YPD琼脂平板上，然后于30℃孵育2天或直至菌落变得可见。

酿酒酵母的转化

酿酒酵母YPH499(Agilent)在10mLYPD中于30℃以250转/分钟的速度振荡生长过夜。该培养物用于接种500mL的YPD至OD600为0.1，然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下以2000×g离心10分钟来收获细胞，并重悬于补充有20mL的1M HEPES(pH 8.0)和2.5mL的1M DTT的100mL YPD中。细胞于30℃孵育15分钟，不振荡。加入冷dH₂O至最终体积为500mL，并通过在4℃下以2000×g离心10分钟收获细胞。用250mL冷dH₂O洗涤细胞，并通过在4℃下以2000×g离心10分钟来收获细胞。用20mL冷的1M山梨醇洗涤细胞，并通过在4℃下以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng的DNA加入到40μl感受态细胞中，并转移到2mm间隙的电穿孔比色皿中，在冰上预冷。使用1500V、200Ω、25μF设置，在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1ml冷的1M山梨醇，并将混合物转移到无菌Eppendorf管中。细胞于30℃再生，以250转/分钟振荡至少30分钟。然后将细胞涂布于尿嘧啶缺陷型合成葡萄糖基础琼脂培养基上，然后于30℃孵育3天或直至菌落变得可见。

实施例16：构建能够表达SEQ ID NO.2和SEQ ID NO.32的巴斯德毕赤酵母菌株

质粒pSAND101构建如下。质粒pPICHOLI-1(MoBiTec公司，德国)用限制性内切酶BsaI和PciI切割。SEQ ID NO.34作为合成DNA(Integrated DNA Technologies)订购，并通过注入克隆(Takara Bio)插入切割的pPICHOLI-1中，然后用标准方法转化大肠杆菌。将转化体铺板于含有100μg/mL诺尔丝菌素的2TY琼脂上。限制性消化证实了pSAND101的正确组装。

质粒pSAND102构建如下。质粒pSAND101用限制性内切酶EcoRI和SalI切割。SEQ IDNO.35作为合成DNA订购(Twist Bioscience)，并用限制性内切酶EcoRI和SalI切割。按照标准方法，通过连接将消化的合成DNA插入切割的pSAND101中。将大肠杆菌转化体铺板于含有100μg/mL诺尔丝菌素的2TY琼脂上。限制性消化证实了pSAND102的正确组装。

质粒pSAND112构建如下。质粒pPICHOLI-1用限制性内切酶EcoRI和SalI切割。SEQID NO.36作为合成DNA订购(Twist Bioscience)，并用限制性内切酶EcoRI和SalI切割。按照标准方法，通过连接将消化的合成DNA插入切割的pPICHOLI-1。将大肠杆菌转化体铺板于含有100μg/mL博来霉素的2TY琼脂上。限制性消化证实了pSAND112的正确组装。

质粒pSAND102通过用限制性酶PmeI消化而线性化。线性化的pSAND102被用于使用标准方法通过电穿孔转化毕赤酵母SAND101。所得菌株被标记为巴斯德毕赤酵母SAND102。

质粒pSAND112被用于使用标准方法通过电穿孔转化巴斯德毕赤酵母SAND102。所得菌株被标记为巴斯德毕赤酵母SAND121。

实施例17：通过巴斯德毕赤酵母SAND121将LCA生物转化为UDCA

毕赤酵母SAND121用于在250mL锥形瓶中接种补充有100μg/mL博来霉素的25mLBMG培养基，并于30℃以250转/分钟振荡孵育2天，用作种子培养物。

通过离心收获来自种子培养物的细胞，并用于在1L锥形瓶中接种含有2mM 5-氨基乙酰丙酸(5-ALA)的250mL BMM至OD595为1.0，并于20℃孵育5天，用作表达培养物。表达培养物以170转/分钟振荡1天，然后以250转/分钟振荡剩余4天。每天向表达培养物中加入浓度为1％v/v的甲醇。

通过离心从80mL表达培养物中收获细胞，悬浮在30mL过滤灭菌的pH为7.5的磷酸钾缓冲液中，并转移到250mL锥形瓶中。通过离心从80mL表达培养物中收获细胞，悬浮于30mL过滤灭菌的pH为9的磷酸钾缓冲液中，并转移至250mL锥形瓶中。向每个烧瓶中加入0.25mL的5-ALA水溶液(200mM)和含有38.8mg/mL LCA的0.35mL甲醇。用作生物转化培养物的两个烧瓶都于30℃以250转/分钟的速度振荡孵育。每天向生物转化培养物中加入0.35mL甲醇，然后继续孵育2天。然后向生物转化培养物中加入1.0mL甲醇，之后继续孵育3天。

从生物转化培养物中取出500μL样品，并用含有0.1％甲酸的等体积乙酸乙酯振荡45分钟进行提取。通过离心分离各相，并将20μL溶剂相转移到干净试管中并蒸发。将沉淀溶解在20μL甲醇中，在50％流动相溶液A和50％流动相溶液B的混合物中稀释10倍，并通过HPLC-MS进行分析(参见一般方法)。观察到与UDCA标准品平行运行时具有相同保留时间和质谱图的峰(参见图1和图2)。

将剩余的生物转化培养物发酵液转移到50mL Falcon试管中，并储存于-20℃，用于后续分离UDCA(参见实施例18)。

实施例18：分离UDCA并与实际标准品进行比较

将如实施例17所述储存于-20℃的生物转化培养物发酵液解冻，并以4500转/分钟离心15分钟。倾析所得100mL上清液，并用含有0.1％甲酸的等体积乙酸乙酯萃取三次，搅拌45分钟。合并有机相，并真空蒸发，得到重179mg的粗产物。

将粗产物溶解在80mL乙酸乙酯中，并通过真空除去溶剂将其干燥装载到1.5g硅胶(Merck等级9385，200-400目粒度)上。将干燥的二氧化硅倒在25g Biotage KP-Sil Snap柱(Biotage)的预装二氧化硅上。用10倍柱体积的10％乙酸乙酯至100％乙酸乙酯的乙酸乙酯-己烷梯度洗脱该柱。收集馏分并通过LCMS进行分析。将选定的馏分合并，在旋转蒸发器上蒸发溶剂，得到11.3mg的提取物。

然后将提取物溶解在乙腈(0.3mL)和DMSO(0.7mL)中，并注入到已经用25％乙腈和75％水的混合物预平衡的12g Snap Ultra柱(Biotage)上。用10倍柱体积的25％乙腈至80％乙腈的乙腈-水梯度洗脱该柱。收集馏分，然后通过LC-MS进行分析。收集选定的馏分，通过LCMS进行分析(参见图3和图4)，然后冷冻干燥，得到重3.8mg的白色粉末。

对样品在d4-甲醇中进行NMR光谱分析，并与同时进行的商业获得的UDCA样品(Sigma-Aldrich)进行比较。通过在298K下分别在500.05MHz和125.75MHz下对1H和13C操作以在Bruker 500MHz DCH冷冻探针光谱仪上记录NMR光谱。UDCA市售标准品核磁共振谱与样品核磁共振谱一致(参见图5、图6、图7和图8)。

实施例19：通过巴斯德毕赤酵母SAND121将3-KCA生物转化为3-KUDCA

巴斯德毕赤酵母SAND121用于在250mL锥形瓶中接种补充有100μg/mL诺尔丝菌素和100μg/mL博来霉素的25mL BMG培养基，并于30℃以250转/分钟振荡孵育3天。向培养物中加入0.25mL的5-ALA水溶液(200mM)和0.25mL含有37.6mg/mL 3-酮石胆酸(3-KCA)的甲醇，然后如前所述继续孵育1天。向培养物中加入0.25mL甲醇，然后如前所述继续孵育1天。从培养物中取出800μL培养物发酵液，并用等体积的含0.1％甲酸的乙酸乙酯振荡提取45分钟。通过离心分离各相，并将400μL溶剂相转移至干净试管中并蒸发。通过混合10分钟将沉淀溶解在400μL甲醇中，并以12000×g离心1分钟。将15μL甲醇溶液在50％流动相溶液A和50％流动相溶液B的混合物中稀释10倍，并通过HPLC-MS进行分析(参见一般方法)。观察到与3-KUDCA标准品平行运行时具有相同保留时间和质谱图的峰(参见图9和图10)。

实施例20：构建能够表达SEQ ID NO.2和SEQ ID NO.32的酿酒酵母菌株

如下构建质粒pSAND113，以表达在Gal1启动子控制下的编码序列为SEQ ID NO.33的P450的基因，以及在Gal10启动子控制下的编码序列为SEQ ID NO.3的P450还原酶的基因。

质粒pESC-URA(Agilent)用限制性内切酶EcoRI和SpeI切割。使用引物SEQ IDNO.37和SEQ ID NO.38从质粒pSAND102扩增出837bp的片段。使用SLiCE克隆法(Zhang等人，2014)将该837bp片段插入EcoRI-SpeI消化的pESC-URA中，形成中间质粒。通过限制性消化确认插入和插入物的身份。

用限制性内切酶HindIII和SalI切割中间质粒。使用引物SEQ ID NO.39和SEQ IDNO.40从质粒pSAND112扩增出1584bp的片段。使用SLiCE克隆方法(Zhang等人，2014)将该1584bp片段插入HindIII-SalI消化的中间质粒中，形成质粒pSAND113。通过限制性消化确认插入和插入物的身份。

使用标准方法，通过电穿孔用质粒pSAND113转化酿酒酵母菌株YPH499(Agilent)，之后将细胞悬液铺板于尿嘧啶缺陷型合成葡萄糖基础琼脂培养基上，并于30℃孵育直至菌落变得可见。所得菌株被命名为酿酒酵母SAND122。

实施例21：通过酿酒酵母SAND122将LCA生物转化为UDCA

在50mL Falcon管中的7mL尿嘧啶缺陷型合成葡萄糖基础培养基中接种酿酒酵母SAND122，并于30℃以250转/分钟振荡孵育24小时，用作种子培养物。

将1mL种子培养物短暂离心以收获细胞。弃去上清液，将剩余的细胞沉淀在50mLFalcon管中悬浮于5mL尿嘧啶缺陷型合成半乳糖基础培养基中，该试管用泡沫塞封盖。该培养物于30℃以250转/分钟振荡孵育24小时，用作表达培养物。

将4mL表达培养物短暂离心以收获细胞。弃去上清液，将剩余的细胞沉淀在50mLFalcon管中悬浮于5mL生物转化缓冲液(0.1M磷酸钾缓冲液(pH 10)、1％半乳糖和650mg/LLCA)中，用泡沫塞封盖。该悬浮液于30℃以250转/分钟的速度振荡孵育72小时，用作生物转化培养物。

从生物转化培养物中取出500μL样品，用含有0.1％甲酸的等体积乙酸乙酯振荡45分钟进行提取。通过离心分离各相，并将20μL溶剂相转移到干净的试管中并蒸发。将沉淀溶解于20μL甲醇中，在50％流动相溶液A和50％流动相溶液B的混合物中稀释10倍，并通过HPLC-MS进行分析(参见一般方法)。观察到与UDCA标准品具有相同保留时间和质谱图的峰(参见图11和图12)。

引用的参考文献

Zhang,Y.,Werling,U.,Ederlmann,W.(2014).Seamless Ligation CloningExtract(SLiCE)Cloning Method.Methods in Molecular Biology 1116,235—244.

********

在本申请全文中，参考了各种出版物。这些出版物的公开内容在此通过引用全部并入本申请，以便更全面地描述本发明所属领域的现状。对于本领域技术人员来说，很明显，在不脱离本发明的范围或精神的情况下，可以对本发明进行各种修改和变化。考虑到本文公开的本发明的说明书和实践，本发明的其他实施方案对于本领域技术人员来说将是显而易见的。说明书和实施例仅被认为是示例性的，本发明的真实范围和精神由所附权利要求指出。

序列表

<110> 沙山一号有限责任公司

<120> 将LCA和3-KCA转化为UDCA和3-KUDCA的酶促方法

<130> 申请档案号

<160> 40

<170> PatentIn 3.5版

<210> 1

<211> 4157

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 1

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gcccttcgaa cgtccctatc acgacccgta ccgcttctgg 1080

ctacacttac tgccagcgca atcggagtat ccatattgtc taaaatgatg ttttcaacag 1140

caagtgcaga gagtccatct ccgcaaaaaa ttttttccgg tgcttttgct tccgtaaaac 1200

tcccgctgca ttcaagtgaa tacgagtccc atgacacaaa gaggcttcgt ttcaaacttc 1260

cgcaagagac tgcagtaacg ggtttaccgt tagcttactt ggttcacatt ccaccgtccc 1320

accatcaaag ggacttgact acgccggatg aacctggata catggacctg ttggtaaaga 1380

aataccccaa aggccagggc tcgacatatc tacactccct ccagcccggt gatacgttat 1440

ccttcacatc tctacccctc aaaccagctt ggaaaacaaa caattttcct cacatcactc 1500

ttatagctgg agggtgtggg atcacgccat tattcaactt ggctcaaggg atacttagag 1560

atccggccga aaaaactagg atgaccttta tttttggtgc acgatcagac gaggacgtat 1620

tactgaaaaa ggagttagat ggctttgcaa aagagttccc ggaaagattc gaggtgaaat 1680

atacagcact tttggaagag gtcctagggg gcgtgggtcg tgatactaag gtctttgtct 1740

gtgggccgaa ggagatggaa aaggcacttg taggaggccg tggcgtatta aaggaaatag 1800

gcttcgaaaa gtctcagatc catacttttt gagtcgacct gcaagatctg cggccgcgaa 1860

ttaattcgcc ttagacatga ctgttcctca gttcaagttg ggcacttacg agaagaccgg 1920

tcttgctaga ttctaatcaa gaggatgtca gaatgccatt tgcctgagag atgcaggctt 1980

catttttgat acttttttat ttgtaaccta tatagtatag gatttttttt gtcattttgt 2040

ttcttctcgt acgagcttgc tcctgatcag cctatctcgc agctgatgaa tatcttgtgg 2100

taggggtttg ggaaaatcat tcgagtttga tgtttttctt ggtatttccc actcctcttc 2160

agagtacaga agattaaggc gcgccgcaag ccaagcctgc gaagaatgta gtcgagaatt 2220

gagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 2280

cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 2340

cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 2400

agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 2460

gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 2520

ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 2580

acatccgaac ataaacaaaa atgaccactt tggatgatac tgcttacaga tacagaactt 2640

ctgttccagg tgatgctgaa gctattgaag ctttggatgg atctttcacc actgatactg 2700

ttttcagagt cactgctact ggtgatggat tcactttgag agaagttcct gttgatcctc 2760

ctttgaccaa agtttttcct gatgatgaat ctgatgatga atctgatgct ggtgaagatg 2820

gtgatccaga ttctagaact tttgttgctt atggtgatga tggtgatttg gctggatttg 2880

ttgttgtttc ttattctgga tggaacagaa gattgactgt tgaagatatt gaagttgctc 2940

cagaacatag aggtcatggt gttggaagag ctttgatggg attggcaact gagtttgcca 3000

gagaaagagg tgctggtcat ctttggttgg aagtcaccaa tgtcaatgct ccagctattc 3060

atgcttacag aagaatggga ttcactcttt gtggattgga tactgctttg tatgatggaa 3120

ctgcttctga tggagaacaa gctttgtaca tgtccatgcc atgtccttaa agtaactgac 3180

aataaaaaga ttcttgtttt caagaacttg tcatttgtat agttttttta tattgtagtt 3240

gttctatttt aatcaaatgt tagcgtgatt tatatttttt ttcgcctcga catcatctgc 3300

ccagatgcga agttaagtgc gcagaaagta atatcatgcg tcaatcgtat gtgaatgctg 3360

gtcgctatac tgctgtcgat tcgatactaa cgccgccatc cagtgtcgga tctgtgagca 3420

aacccgggca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 3480

ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 3540

cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 3600

ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 3660

tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc 3720

gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 3780

tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 3840

gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 3900

tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 3960

ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 4020

agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 4080

gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 4140

attttggtca tgagatc 4157

<210> 2

<211> 795

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 2

atggcccttc gaacgtccct atcacgaccc gtaccgcttc tggctacact tactgccagc 60

gcaatcggag tatccatatt gtctaaaatg atgttttcaa cagcaagtgc agagagtcca 120

tctccgcaaa aaattttttc cggtgctttt gcttccgtaa aactcccgct gcattcaagt 180

gaatacgagt cccatgacac aaagaggctt cgtttcaaac ttccgcaaga gactgcagta 240

acgggtttac cgttagctta cttggttcac attccaccgt cccaccatca aagggacttg 300

actacgccgg atgaacctgg atacatggac ctgttggtaa agaaataccc caaaggccag 360

ggctcgacat atctacactc cctccagccc ggtgatacgt tatccttcac atctctaccc 420

ctcaaaccag cttggaaaac aaacaatttt cctcacatca ctcttatagc tggagggtgt 480

gggatcacgc cattattcaa cttggctcaa gggatactta gagatccggc cgaaaaaact 540

aggatgacct ttatttttgg tgcacgatca gacgaggacg tattactgaa aaaggagtta 600

gatggctttg caaaagagtt cccggaaaga ttcgaggtga aatatacagc acttttggaa 660

gaggtcctag ggggcgtggg tcgtgatact aaggtctttg tctgtgggcc gaaggagatg 720

gaaaaggcac ttgtaggagg ccgtggcgta ttaaaggaaa taggcttcga aaagtctcag 780

atccatactt tttga 795

<210> 3

<211> 264

<212> PRT

<213> 禾谷镰孢菌

<400> 3

Met Ala Leu Arg Thr Ser Leu Ser Arg Pro Val Pro Leu Leu Ala Thr

1 5 10 15

Leu Thr Ala Ser Ala Ile Gly Val Ser Ile Leu Ser Lys Met Met Phe

20 25 30

Ser Thr Ala Ser Ala Glu Ser Pro Ser Pro Gln Lys Ile Phe Ser Gly

35 40 45

Ala Phe Ala Ser Val Lys Leu Pro Leu His Ser Ser Glu Tyr Glu Ser

50 55 60

His Asp Thr Lys Arg Leu Arg Phe Lys Leu Pro Gln Glu Thr Ala Val

65 70 75 80

Thr Gly Leu Pro Leu Ala Tyr Leu Val His Ile Pro Pro Ser His His

85 90 95

Gln Arg Asp Leu Thr Thr Pro Asp Glu Pro Gly Tyr Met Asp Leu Leu

100 105 110

Val Lys Lys Tyr Pro Lys Gly Gln Gly Ser Thr Tyr Leu His Ser Leu

115 120 125

Gln Pro Gly Asp Thr Leu Ser Phe Thr Ser Leu Pro Leu Lys Pro Ala

130 135 140

Trp Lys Thr Asn Asn Phe Pro His Ile Thr Leu Ile Ala Gly Gly Cys

145 150 155 160

Gly Ile Thr Pro Leu Phe Asn Leu Ala Gln Gly Ile Leu Arg Asp Pro

165 170 175

Ala Glu Lys Thr Arg Met Thr Phe Ile Phe Gly Ala Arg Ser Asp Glu

180 185 190

Asp Val Leu Leu Lys Lys Glu Leu Asp Gly Phe Ala Lys Glu Phe Pro

195 200 205

Glu Arg Phe Glu Val Lys Tyr Thr Ala Leu Leu Glu Glu Val Leu Gly

210 215 220

Gly Val Gly Arg Asp Thr Lys Val Phe Val Cys Gly Pro Lys Glu Met

225 230 235 240

Glu Lys Ala Leu Val Gly Gly Arg Gly Val Leu Lys Glu Ile Gly Phe

245 250 255

Glu Lys Ser Gln Ile His Thr Phe

260

<210> 4

<211> 4400

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 4

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg aaggaggcta tcgttaagaa agatgcaagt gttgaggtag 1080

tggacagtcc aataccgaaa cctgggacga atcctaaaga ttggaaaata ccagcctttt 1140

atggaacgga gtctaattct ggagatgaca ttgccgggtt ggttgaggca gtcggggaaa 1200

atgttgtagg tttccataaa ggagacaggg tggcagcttt tcacgaaatg ctgactcccc 1260

atggagcctt tgctgaatat gcaattgcac actattacac tacgttccat attccagaca 1320

gcatatccta cgaagaggct gccacgatac ctttggctgc ctatacttcc gtatgcgcct 1380

tgtttcaaga gctacagtta ccagatcctt ggagtcccct cgccaagtta gacgagaaaa 1440

gaccgttgct cgtatacgga gcatcaacgg ctacggctgc cttcgcaata aaactggccg 1500

ctgccgcaaa cgtacaccca atcatagccg tgggctctca aagaagcgaa tttgtaaaac 1560

catttctaga tgagtcaaag ggcgacctat tagtcgatta cacgctgcac gatacagaag 1620

ataaactggt ggcagccatc caagacgcaa ttaaaaagtc aggtgcaccc gacggtaggt 1680

gttgggtcgc atacgattca gtgtcagagg acagcaccgt ccgtctggtg accaaagcaa 1740

tcgctggccc gccagatgca aatggtcgaa aacctcgaat gacaaattta ctcatgaaat 1800

ccaacgtgga aggtgtggat ccctctgtcg aaatagtaca taccaaagta tctcaggtac 1860

acgaaaaaaa cgaaaaagat cagatgttgg gcctgacgtg ggctgccgca tttagtaggg 1920

gcctaagaga gggatggctt actgctcacc cctatatcgt gggaaagaac ggactacagg 1980

gactcagtga gggtctagtg gccctgcgtg atggtaagac aaaagcaaat aagttcctca 2040

ctatactgtc tgaaactcct ggggctactg cttgagtcga cctgcaagat ctgcggccgc 2100

gaattaattc gccttagaca tgactgttcc tcagttcaag ttgggcactt acgagaagac 2160

cggtcttgct agattctaat caagaggatg tcagaatgcc atttgcctga gagatgcagg 2220

cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt tttgtcattt 2280

tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagctgat gaatatcttg 2340

tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt cccactcctc 2400

ttcagagtac agaagattaa ggcgcgccgc aagccaagcc tgcgaagaat gtagtcgaga 2460

attgagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 2520

ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 2580

tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 2640

cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 2700

gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 2760

ccactgaggt tcttctttca tatacttcct tttaaaatct tgctaggata cagttctcac 2820

atcacatccg aacataaaca aaaatgacca ctttggatga tactgcttac agatacagaa 2880

cttctgttcc aggtgatgct gaagctattg aagctttgga tggatctttc accactgata 2940

ctgttttcag agtcactgct actggtgatg gattcacttt gagagaagtt cctgttgatc 3000

ctcctttgac caaagttttt cctgatgatg aatctgatga tgaatctgat gctggtgaag 3060

atggtgatcc agattctaga acttttgttg cttatggtga tgatggtgat ttggctggat 3120

ttgttgttgt ttcttattct ggatggaaca gaagattgac tgttgaagat attgaagttg 3180

ctccagaaca tagaggtcat ggtgttggaa gagctttgat gggattggca actgagtttg 3240

ccagagaaag aggtgctggt catctttggt tggaagtcac caatgtcaat gctccagcta 3300

ttcatgctta cagaagaatg ggattcactc tttgtggatt ggatactgct ttgtatgatg 3360

gaactgcttc tgatggagaa caagctttgt acatgtccat gccatgtcct taaagtaact 3420

gacaataaaa agattcttgt tttcaagaac ttgtcatttg tatagttttt ttatattgta 3480

gttgttctat tttaatcaaa tgttagcgtg atttatattt tttttcgcct cgacatcatc 3540

tgcccagatg cgaagttaag tgcgcagaaa gtaatatcat gcgtcaatcg tatgtgaatg 3600

ctggtcgcta tactgctgtc gattcgatac taacgccgcc atccagtgtc ggatctgtga 3660

gcaaacccgg gcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 3720

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3780

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3840

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3900

ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 3960

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4020

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4080

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 4140

aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 4200

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4260

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4320

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 4380

gggattttgg tcatgagatc 4400

<210> 5

<211> 1038

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 5

atgaaggagg ctatcgttaa gaaagatgca agtgttgagg tagtggacag tccaataccg 60

aaacctggga cgaatcctaa agattggaaa ataccagcct tttatggaac ggagtctaat 120

tctggagatg acattgccgg gttggttgag gcagtcgggg aaaatgttgt aggtttccat 180

aaaggagaca gggtggcagc ttttcacgaa atgctgactc cccatggagc ctttgctgaa 240

tatgcaattg cacactatta cactacgttc catattccag acagcatatc ctacgaagag 300

gctgccacga tacctttggc tgcctatact tccgtatgcg ccttgtttca agagctacag 360

ttaccagatc cttggagtcc cctcgccaag ttagacgaga aaagaccgtt gctcgtatac 420

ggagcatcaa cggctacggc tgccttcgca ataaaactgg ccgctgccgc aaacgtacac 480

ccaatcatag ccgtgggctc tcaaagaagc gaatttgtaa aaccatttct agatgagtca 540

aagggcgacc tattagtcga ttacacgctg cacgatacag aagataaact ggtggcagcc 600

atccaagacg caattaaaaa gtcaggtgca cccgacggta ggtgttgggt cgcatacgat 660

tcagtgtcag aggacagcac cgtccgtctg gtgaccaaag caatcgctgg cccgccagat 720

gcaaatggtc gaaaacctcg aatgacaaat ttactcatga aatccaacgt ggaaggtgtg 780

gatccctctg tcgaaatagt acataccaaa gtatctcagg tacacgaaaa aaacgaaaaa 840

gatcagatgt tgggcctgac gtgggctgcc gcatttagta ggggcctaag agagggatgg 900

cttactgctc acccctatat cgtgggaaag aacggactac agggactcag tgagggtcta 960

gtggccctgc gtgatggtaa gacaaaagca aataagttcc tcactatact gtctgaaact 1020

cctggggcta ctgcttga 1038

<210> 6

<211> 345

<212> PRT

<213> 禾谷镰孢菌

<400> 6

Met Lys Glu Ala Ile Val Lys Lys Asp Ala Ser Val Glu Val Val Asp

1 5 10 15

Ser Pro Ile Pro Lys Pro Gly Thr Asn Pro Lys Asp Trp Lys Ile Pro

20 25 30

Ala Phe Tyr Gly Thr Glu Ser Asn Ser Gly Asp Asp Ile Ala Gly Leu

35 40 45

Val Glu Ala Val Gly Glu Asn Val Val Gly Phe His Lys Gly Asp Arg

50 55 60

Val Ala Ala Phe His Glu Met Leu Thr Pro His Gly Ala Phe Ala Glu

65 70 75 80

Tyr Ala Ile Ala His Tyr Tyr Thr Thr Phe His Ile Pro Asp Ser Ile

85 90 95

Ser Tyr Glu Glu Ala Ala Thr Ile Pro Leu Ala Ala Tyr Thr Ser Val

100 105 110

Cys Ala Leu Phe Gln Glu Leu Gln Leu Pro Asp Pro Trp Ser Pro Leu

115 120 125

Ala Lys Leu Asp Glu Lys Arg Pro Leu Leu Val Tyr Gly Ala Ser Thr

130 135 140

Ala Thr Ala Ala Phe Ala Ile Lys Leu Ala Ala Ala Ala Asn Val His

145 150 155 160

Pro Ile Ile Ala Val Gly Ser Gln Arg Ser Glu Phe Val Lys Pro Phe

165 170 175

Leu Asp Glu Ser Lys Gly Asp Leu Leu Val Asp Tyr Thr Leu His Asp

180 185 190

Thr Glu Asp Lys Leu Val Ala Ala Ile Gln Asp Ala Ile Lys Lys Ser

195 200 205

Gly Ala Pro Asp Gly Arg Cys Trp Val Ala Tyr Asp Ser Val Ser Glu

210 215 220

Asp Ser Thr Val Arg Leu Val Thr Lys Ala Ile Ala Gly Pro Pro Asp

225 230 235 240

Ala Asn Gly Arg Lys Pro Arg Met Thr Asn Leu Leu Met Lys Ser Asn

245 250 255

Val Glu Gly Val Asp Pro Ser Val Glu Ile Val His Thr Lys Val Ser

260 265 270

Gln Val His Glu Lys Asn Glu Lys Asp Gln Met Leu Gly Leu Thr Trp

275 280 285

Ala Ala Ala Phe Ser Arg Gly Leu Arg Glu Gly Trp Leu Thr Ala His

290 295 300

Pro Tyr Ile Val Gly Lys Asn Gly Leu Gln Gly Leu Ser Glu Gly Leu

305 310 315 320

Val Ala Leu Arg Asp Gly Lys Thr Lys Ala Asn Lys Phe Leu Thr Ile

325 330 335

Leu Ser Glu Thr Pro Gly Ala Thr Ala

340 345

<210> 7

<211> 4418

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 7

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gactgtaacc ccgactatga aaatgccacc tgggcttttt 1080

atagatttgt ccccagtaaa gaagccaata ttgtttttgt ggtattgttc gccataacca 1140

cattgcttca tgtgctgcaa ctttggagaa cacgaacgtg gtacctaatt ccactcgtag 1200

tcgggggcgt aagtgccagt ggcgaggtca taggatacat aggccgagta ttaaacacga 1260

atgaagagcc cggttgttgg accatgggcc catacataat gcagtccgtg ttgatattaa 1320

ttgctcctgc tctatttgca gcttctattt acatgatact gggccgtatt atcattctta 1380

ccgaaggcga acatcacagc ctgatccctt taaagtggtt aacgaagctt ttcgtttttg 1440

gggatgtcgc ttcatttatg ctacaatcaa gtgggggtgg cctgatggca atacaggatt 1500

taaataagat gggagagaaa attatcgttg gcggtttatt tgtgcagctt ttctttttcg 1560

gttgttttat tatagtctca gctgtgttcc atatacgaat gcttagagct ccgacgccta 1620

acagttcgca aactagggta cgatggcaaa catatttagc aactttgtac gtcactggtg 1680

tgcttatctg ggtgcgatct ttgttcagag tcattgagtt catagagggt aatgatggac 1740

acttgatgcg ttcagaggtt tgggttttcg ttttcgatgg catgttaatg ttattggtac 1800

tcgtgtggat gaactggttc catcccggtg aaatcggcct tctgataaga ggagaagagt 1860

ccataaccaa cggattggaa cttatgaaac ttggtggcag tggtcgtagg tcccgagtgg 1920

atacgatgga gtcactgggc agcggcagac accttgagga aaataccgaa agataagtcg 1980

acctgcaaga tctgcggccg cgaattaatt cgccttagac atgactgttc ctcagttcaa 2040

gttgggcact tacgagaaga ccggtcttgc tagattctaa tcaagaggat gtcagaatgc 2100

catttgcctg agagatgcag gcttcatttt tgatactttt ttatttgtaa cctatatagt 2160

ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc ttgctcctga tcagcctatc 2220

tcgcagctga tgaatatctt gtggtagggg tttgggaaaa tcattcgagt ttgatgtttt 2280

tcttggtatt tcccactcct cttcagagta cagaagatta agtgagacct tcgtttgtgc 2340

ggatccaatt aatatttact tattttggtc aaccccaaat aggttgattt catacttggt 2400

tcattcaaaa ataagtagtc ttttgagatc tttcaatatt ataataaata tactataaca 2460

gccgacttgt ttcattttcg cgaatgttcc cccagcttat cggatccccc acacaccata 2520

gcttcaaaat gtttctactc cttttttact cttccagatt ttctcggact ccgcgcatcg 2580

ccgtaccact tcaaaacacc caagcacagc atactaaatt tcccctcttt cttcctctag 2640

ggtgtcgtta attacccgta ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct 2700

ttttcttcgt cgaaaaaggc aataaaaatt tttatcacgt ttctttttct tgaaattttt 2760

ttttttagtt tttttctctt tcagtgacct ccattgatat ttaagttaat aaacggtctt 2820

caatttctca agtttcagtt tcatttttct tgttctatta caactttttt tacttcttgt 2880

tcattagaaa gaaagcatag caatctaatc taaggggcgg tgttgacaat taatcatcgg 2940

catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gccaagttga 3000

ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 3060

accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 3120

acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 3180

gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 3240

acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 3300

agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 3360

gacacgtccg acggcggccc acgggtccca ggcctcggag atccgtcccc cttttccttt 3420

gtcgatatca tgtaattagt tatgtcacgc ttacattcac gccctccccc cacatccgct 3480

ctaaccgaaa aggaaggagt tagacaacct gaagtctagg tccctattta tttttttata 3540

gttatgttag tattaagaac gttatttata tttcaaattt ttcttttttt tctgtacaga 3600

cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 3660

aaggctttaa tttgcaagct ggagaccaac atgtgagcaa aaggccagca aaaggccagg 3720

aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 3780

cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3840

gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3900

tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg 3960

tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 4020

cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 4080

gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 4140

ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 4200

ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 4260

ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 4320

agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 4380

aacgaaaact cacgttaagg gattttggtc atgagatc 4418

<210> 8

<211> 939

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 8

atggactgta accccgacta tgaaaatgcc acctgggctt tttatagatt tgtccccagt 60

aaagaagcca atattgtttt tgtggtattg ttcgccataa ccacattgct tcatgtgctg 120

caactttgga gaacacgaac gtggtaccta attccactcg tagtcggggg cgtaagtgcc 180

agtggcgagg tcataggata cataggccga gtattaaaca cgaatgaaga gcccggttgt 240

tggaccatgg gcccatacat aatgcagtcc gtgttgatat taattgctcc tgctctattt 300

gcagcttcta tttacatgat actgggccgt attatcattc ttaccgaagg cgaacatcac 360

agcctgatcc ctttaaagtg gttaacgaag cttttcgttt ttggggatgt cgcttcattt 420

atgctacaat caagtggggg tggcctgatg gcaatacagg atttaaataa gatgggagag 480

aaaattatcg ttggcggttt atttgtgcag cttttctttt tcggttgttt tattatagtc 540

tcagctgtgt tccatatacg aatgcttaga gctccgacgc ctaacagttc gcaaactagg 600

gtacgatggc aaacatattt agcaactttg tacgtcactg gtgtgcttat ctgggtgcga 660

tctttgttca gagtcattga gttcatagag ggtaatgatg gacacttgat gcgttcagag 720

gtttgggttt tcgttttcga tggcatgtta atgttattgg tactcgtgtg gatgaactgg 780

ttccatcccg gtgaaatcgg ccttctgata agaggagaag agtccataac caacggattg 840

gaacttatga aacttggtgg cagtggtcgt aggtcccgag tggatacgat ggagtcactg 900

ggcagcggca gacaccttga ggaaaatacc gaaagataa 939

<210> 9

<211> 312

<212> PRT

<213> 禾谷镰孢菌

<400> 9

Met Asp Cys Asn Pro Asp Tyr Glu Asn Ala Thr Trp Ala Phe Tyr Arg

1 5 10 15

Phe Val Pro Ser Lys Glu Ala Asn Ile Val Phe Val Val Leu Phe Ala

20 25 30

Ile Thr Thr Leu Leu His Val Leu Gln Leu Trp Arg Thr Arg Thr Trp

35 40 45

Tyr Leu Ile Pro Leu Val Val Gly Gly Val Ser Ala Ser Gly Glu Val

50 55 60

Ile Gly Tyr Ile Gly Arg Val Leu Asn Thr Asn Glu Glu Pro Gly Cys

65 70 75 80

Trp Thr Met Gly Pro Tyr Ile Met Gln Ser Val Leu Ile Leu Ile Ala

85 90 95

Pro Ala Leu Phe Ala Ala Ser Ile Tyr Met Ile Leu Gly Arg Ile Ile

100 105 110

Ile Leu Thr Glu Gly Glu His His Ser Leu Ile Pro Leu Lys Trp Leu

115 120 125

Thr Lys Leu Phe Val Phe Gly Asp Val Ala Ser Phe Met Leu Gln Ser

130 135 140

Ser Gly Gly Gly Leu Met Ala Ile Gln Asp Leu Asn Lys Met Gly Glu

145 150 155 160

Lys Ile Ile Val Gly Gly Leu Phe Val Gln Leu Phe Phe Phe Gly Cys

165 170 175

Phe Ile Ile Val Ser Ala Val Phe His Ile Arg Met Leu Arg Ala Pro

180 185 190

Thr Pro Asn Ser Ser Gln Thr Arg Val Arg Trp Gln Thr Tyr Leu Ala

195 200 205

Thr Leu Tyr Val Thr Gly Val Leu Ile Trp Val Arg Ser Leu Phe Arg

210 215 220

Val Ile Glu Phe Ile Glu Gly Asn Asp Gly His Leu Met Arg Ser Glu

225 230 235 240

Val Trp Val Phe Val Phe Asp Gly Met Leu Met Leu Leu Val Leu Val

245 250 255

Trp Met Asn Trp Phe His Pro Gly Glu Ile Gly Leu Leu Ile Arg Gly

260 265 270

Glu Glu Ser Ile Thr Asn Gly Leu Glu Leu Met Lys Leu Gly Gly Ser

275 280 285

Gly Arg Arg Ser Arg Val Asp Thr Met Glu Ser Leu Gly Ser Gly Arg

290 295 300

His Leu Glu Glu Asn Thr Glu Arg

305 310

<210> 10

<211> 5072

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 10

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gaggccgtac acgccgacgt ttcacaatac gaatatgcct 1080

tagacgtaga agtgggtaaa accgcacgac tactgccact agaccttgac tattgggtca 1140

gtggacagta cgcagctagg cttatgcact tgccgtatag tttacttggg aacgggggta 1200

agcagtaccc atacattaac cccaaaaagc cattcgaact tagcaatcag cgtgttgtac 1260

aggattttat agagaatgct cgagacatac tgactaaagg aaggtcgtta tacaaagata 1320

caccttataa agcacatacc gacctggggg atgttctggt tatacctcca gaatttgccg 1380

atgctttaaa gagcgaacga caattagatt ttacagaggt agcaagagac gatacacacg 1440

ggtacatacc gggtttcgaa ccgattggtt ctcctttcga tttagtaccc ttggtgaaca 1500

aatacctaac tagggccctg gccaaactga ccaagccgct gtgggccgaa gcctctctgg 1560

gagtcaacca tgtgttgggt acttcaacag aatggcatcc gatcaatcca ggagaggaca 1620

taatgcgaat cgtctcccgt atgtcgtcaa gaatatttat gggcgaggaa ctctgcaagg 1680

atgacgattg gctcaaggtt tctatagagt acactgtgca gttgttccaa acggcagacg 1740

agctaaggaa ctatccgaga tggacacgtc cgtacattca ttggtttctc cctagttgcc 1800

aaggagtcag gcgtaaacta caggaggcca gagatctgtt gcaaccccat atagacaggc 1860

gtaacgccgt aaaaaaggaa gcaatagctg aaggacgtcc ttcccccttc gacgatagca 1920

tcgaatggtt tgaaaatgag tacgaaggaa agtctgaccc ggcaactgaa caaattaagc 1980

tcagccttgt cgccatacac acaactacag acctgttgtc tgaaactatg tttaatattg 2040

cactgcagcc tgagttgcta ggtcctcttc gtgaggaaat agttaccgta ctatcgaccg 2100

agggtctaaa gaaaacatct ttctacaatt tgaaacttat ggactcggtt ataaaggaga 2160

gccagaggct tcgaccggtc ctattgggtg ccttcagacg aatggcactt gctgatgtaa 2220

cactgcctaa tggcgacgta attaagaaag ggacaaaaat tatctgtgat acaacccacc 2280

aatggaatcc ggagtactat ccagacgcaa gcaaattcaa tgcctacagg tttcttcaga 2340

tgaggcaaac accagggcaa gataaacgag cccacttagt ctccacatca cacgatcaaa 2400

tgggttttgg ccacggcctc cacgcttgtc cgggtagatt ctttgctgca aacgaaatta 2460

aaatagccct atgccacatg ttgttaaagt acgactggaa gctacctgag ggtgtcgttc 2520

cgaaaagtaa ggctctcggt atgtcactcc tgggagacag agaggcaaaa ttgatggtca 2580

agagaagggc tgccgagatc gatatagaca ctattggtag tgacgaatag gtcgacctgc 2640

aagatctgcg gccgcgaatt aattcgcctt agacatgact gttcctcagt tcaagttggg 2700

cacttacgag aagaccggtc ttgctagatt ctaatcaaga ggatgtcaga atgccatttg 2760

cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga 2820

ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag 2880

ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg 2940

tatttcccac tcctcttcag agtacagaag attaagtgag accttcgttt gtgcggatcc 3000

aattaatatt tacttatttt ggtcaacccc aaataggttg atttcatact tggttcattc 3060

aaaaataagt agtcttttga gatctttcaa tattataata aatatactat aacagccgac 3120

ttgtttcatt ttcgcgaatg ttcccccagc ttatcggatc ccccacacac catagcttca 3180

aaatgtttct actccttttt tactcttcca gattttctcg gactccgcgc atcgccgtac 3240

cacttcaaaa cacccaagca cagcatacta aatttcccct ctttcttcct ctagggtgtc 3300

gttaattacc cgtactaaag gtttggaaaa gaaaaaagag accgcctcgt ttctttttct 3360

tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt ttcttgaaat tttttttttt 3420

agtttttttc tctttcagtg acctccattg atatttaagt taataaacgg tcttcaattt 3480

ctcaagtttc agtttcattt ttcttgttct attacaactt tttttacttc ttgttcatta 3540

gaaagaaagc atagcaatct aatctaaggg gcggtgttga caattaatca tcggcatagt 3600

atatcggcat agtataatac gacaaggtga ggaactaaac catggccaag ttgaccagtg 3660

ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 3720

tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 3780

ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 3840

gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 3900

gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 3960

ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgacacg 4020

tccgacggcg gcccacgggt cccaggcctc ggagatccgt cccccttttc ctttgtcgat 4080

atcatgtaat tagttatgtc acgcttacat tcacgccctc cccccacatc cgctctaacc 4140

gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt tatagttatg 4200

ttagtattaa gaacgttatt tatatttcaa atttttcttt tttttctgta cagacgcgtg 4260

tacgcatgta acattatact gaaaaccttg cttgagaagg ttttgggacg ctcgaaggct 4320

ttaatttgca agctggagac caacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 4380

aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 4440

aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 4500

ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 4560

tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 4620

agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 4680

gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 4740

tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 4800

acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 4860

tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 4920

caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 4980

aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5040

aactcacgtt aagggatttt ggtcatgaga tc 5072

<210> 11

<211> 1593

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 11

atggaggccg tacacgccga cgtttcacaa tacgaatatg ccttagacgt agaagtgggt 60

aaaaccgcac gactactgcc actagacctt gactattggg tcagtggaca gtacgcagct 120

aggcttatgc acttgccgta tagtttactt gggaacgggg gtaagcagta cccatacatt 180

aaccccaaaa agccattcga acttagcaat cagcgtgttg tacaggattt tatagagaat 240

gctcgagaca tactgactaa aggaaggtcg ttatacaaag atacacctta taaagcacat 300

accgacctgg gggatgttct ggttatacct ccagaatttg ccgatgcttt aaagagcgaa 360

cgacaattag attttacaga ggtagcaaga gacgatacac acgggtacat accgggtttc 420

gaaccgattg gttctccttt cgatttagta cccttggtga acaaatacct aactagggcc 480

ctggccaaac tgaccaagcc gctgtgggcc gaagcctctc tgggagtcaa ccatgtgttg 540

ggtacttcaa cagaatggca tccgatcaat ccaggagagg acataatgcg aatcgtctcc 600

cgtatgtcgt caagaatatt tatgggcgag gaactctgca aggatgacga ttggctcaag 660

gtttctatag agtacactgt gcagttgttc caaacggcag acgagctaag gaactatccg 720

agatggacac gtccgtacat tcattggttt ctccctagtt gccaaggagt caggcgtaaa 780

ctacaggagg ccagagatct gttgcaaccc catatagaca ggcgtaacgc cgtaaaaaag 840

gaagcaatag ctgaaggacg tccttccccc ttcgacgata gcatcgaatg gtttgaaaat 900

gagtacgaag gaaagtctga cccggcaact gaacaaatta agctcagcct tgtcgccata 960

cacacaacta cagacctgtt gtctgaaact atgtttaata ttgcactgca gcctgagttg 1020

ctaggtcctc ttcgtgagga aatagttacc gtactatcga ccgagggtct aaagaaaaca 1080

tctttctaca atttgaaact tatggactcg gttataaagg agagccagag gcttcgaccg 1140

gtcctattgg gtgccttcag acgaatggca cttgctgatg taacactgcc taatggcgac 1200

gtaattaaga aagggacaaa aattatctgt gatacaaccc accaatggaa tccggagtac 1260

tatccagacg caagcaaatt caatgcctac aggtttcttc agatgaggca aacaccaggg 1320

caagataaac gagcccactt agtctccaca tcacacgatc aaatgggttt tggccacggc 1380

ctccacgctt gtccgggtag attctttgct gcaaacgaaa ttaaaatagc cctatgccac 1440

atgttgttaa agtacgactg gaagctacct gagggtgtcg ttccgaaaag taaggctctc 1500

ggtatgtcac tcctgggaga cagagaggca aaattgatgg tcaagagaag ggctgccgag 1560

atcgatatag acactattgg tagtgacgaa tag 1593

<210> 12

<211> 530

<212> PRT

<213> 禾谷镰孢菌

<400> 12

Met Glu Ala Val His Ala Asp Val Ser Gln Tyr Glu Tyr Ala Leu Asp

1 5 10 15

Val Glu Val Gly Lys Thr Ala Arg Leu Leu Pro Leu Asp Leu Asp Tyr

20 25 30

Trp Val Ser Gly Gln Tyr Ala Ala Arg Leu Met His Leu Pro Tyr Ser

35 40 45

Leu Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys

50 55 60

Pro Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn

65 70 75 80

Ala Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro

85 90 95

Tyr Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu

100 105 110

Phe Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val

115 120 125

Ala Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly

130 135 140

Ser Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala

145 150 155 160

Leu Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val

165 170 175

Asn His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly

180 185 190

Glu Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met

195 200 205

Gly Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu

210 215 220

Tyr Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro

225 230 235 240

Arg Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly

245 250 255

Val Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile

260 265 270

Asp Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro

275 280 285

Ser Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly

290 295 300

Lys Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile

305 310 315 320

His Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu

325 330 335

Gln Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu

340 345 350

Ser Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met

355 360 365

Asp Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly

370 375 380

Ala Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp

385 390 395 400

Val Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp

405 410 415

Asn Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe

420 425 430

Leu Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val

435 440 445

Ser Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys

450 455 460

Pro Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His

465 470 475 480

Met Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys

485 490 495

Ser Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu

500 505 510

Met Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Thr Ile Gly Ser

515 520 525

Asp Glu

530

<210> 13

<211> 4802

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 13

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gcagctacgc taattgtgtt cgggggtttg ctgctcttgg 1080

cctggcttgt caacatcgct tatcgatcgt tgtttcaccc cttagctaaa tttccgggcc 1140

ctaaactagc cgcagtctct gacatttggt atgctattaa gtggacatct ggtagatatc 1200

cttttataat ggaagagact catcgtaagt acggggatgt cgttagaata gcccccaatg 1260

aactatcatt cgcaacagtt caagcctatc aagacatcta cggacacgca ctaaaaggaa 1320

agaaaaagtt tgtaaaatcc aactggtatg atacagctgg tgatcaccct ggaatagttt 1380

cagtgcgtga ccctaaagag cactctcgac aaagaaagta tctatcacac gccttctctg 1440

caaagagcct gagagggcaa gaagtgctgg ttcatgggta tgtcaacttg ttcctggacc 1500

agttaaggga ccttgcattt ggggaatcgt tcgatgcagt tgctaacgga aaaactcact 1560

tttgggttag catcattata gacgccacat acactagcat gctatctgct cttaggaagc 1620

gagtaccgct agtcaacttg tacctgccat tcgtcgtgcc taaagatgct aaggccacat 1680

accaaaaaca tcgtgcactt acccgtgaaa aaatgctaaa gaggcttgat atgcctaatt 1740

ccgaggacag aggtgatttt ttcgccagtt tgctaaggaa gggtggaaac gaagtgcccg 1800

agccagagct actgcagcaa tctaacaccc tgatagtagc aggttccgaa actacagcca 1860

catgtttgac cggcatagta ttctgtctat tgtccaaccc cagctgcctt gaagccttat 1920

ctaacgaagt aaggtctaga tttcagtcgg atagtgaaat cacgggcgac gctacagctg 1980

atatgaaata cctgtctgca gttatagaag aggggttgag aatcttcccg cctgccccat 2040

ttggcctgcc cagaatttct ccaggcgccg tgattgacgg tcactatgtg ccacctggtg 2100

tgacggtgag tgtcgatcat tggaccacga aacatgaccg tcgatactgg aaagaccctt 2160

atagttttat tcccgagcga tggatcgatg aagggtttgg cgacacaaag caggcttcac 2220

aaccattttc tctaggaccc agagcatgct tggggatcaa ccttgcttac ctagaaatgc 2280

gaattatcat tgcaaaaatg gtatattgct tcgattggga actcccacga ttaatggtca 2340

gattccatcc ccataattag gtcgacctgc aagatctgcg gccgcgaatt aattcgcctt 2400

agacatgact gttcctcagt tcaagttggg cacttacgag aagaccggtc ttgctagatt 2460

ctaatcaaga ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac 2520

ttttttattt gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac 2580

gagcttgctc ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg 2640

aaaatcattc gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag 2700

attaagtgag accttcgttt gtgcggatcc aattaatatt tacttatttt ggtcaacccc 2760

aaataggttg atttcatact tggttcattc aaaaataagt agtcttttga gatctttcaa 2820

tattataata aatatactat aacagccgac ttgtttcatt ttcgcgaatg ttcccccagc 2880

ttatcggatc ccccacacac catagcttca aaatgtttct actccttttt tactcttcca 2940

gattttctcg gactccgcgc atcgccgtac cacttcaaaa cacccaagca cagcatacta 3000

aatttcccct ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa 3060

gaaaaaagag accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc 3120

acgtttcttt ttcttgaaat tttttttttt agtttttttc tctttcagtg acctccattg 3180

atatttaagt taataaacgg tcttcaattt ctcaagtttc agtttcattt ttcttgttct 3240

attacaactt tttttacttc ttgttcatta gaaagaaagc atagcaatct aatctaaggg 3300

gcggtgttga caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga 3360

ggaactaaac catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg 3420

ccggagcggt cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg 3480

acttcgccgg tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg 3540

tggtgccgga caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg 3600

agtggtcgga ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga 3660

tcggcgagca gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc 3720

acttcgtggc cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc 3780

ggagatccgt cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat 3840

tcacgccctc cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc 3900

taggtcccta tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa 3960

atttttcttt tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg 4020

cttgagaagg ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga 4080

gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 4140

aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 4200

ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 4260

gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 4320

ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 4380

ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 4440

cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 4500

attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 4560

ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 4620

aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 4680

gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 4740

tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 4800

tc 4802

<210> 14

<211> 1323

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 14

atggcagcta cgctaattgt gttcgggggt ttgctgctct tggcctggct tgtcaacatc 60

gcttatcgat cgttgtttca ccccttagct aaatttccgg gccctaaact agccgcagtc 120

tctgacattt ggtatgctat taagtggaca tctggtagat atccttttat aatggaagag 180

actcatcgta agtacgggga tgtcgttaga atagccccca atgaactatc attcgcaaca 240

gttcaagcct atcaagacat ctacggacac gcactaaaag gaaagaaaaa gtttgtaaaa 300

tccaactggt atgatacagc tggtgatcac cctggaatag tttcagtgcg tgaccctaaa 360

gagcactctc gacaaagaaa gtatctatca cacgccttct ctgcaaagag cctgagaggg 420

caagaagtgc tggttcatgg gtatgtcaac ttgttcctgg accagttaag ggaccttgca 480

tttggggaat cgttcgatgc agttgctaac ggaaaaactc acttttgggt tagcatcatt 540

atagacgcca catacactag catgctatct gctcttagga agcgagtacc gctagtcaac 600

ttgtacctgc cattcgtcgt gcctaaagat gctaaggcca cataccaaaa acatcgtgca 660

cttacccgtg aaaaaatgct aaagaggctt gatatgccta attccgagga cagaggtgat 720

tttttcgcca gtttgctaag gaagggtgga aacgaagtgc ccgagccaga gctactgcag 780

caatctaaca ccctgatagt agcaggttcc gaaactacag ccacatgttt gaccggcata 840

gtattctgtc tattgtccaa ccccagctgc cttgaagcct tatctaacga agtaaggtct 900

agatttcagt cggatagtga aatcacgggc gacgctacag ctgatatgaa atacctgtct 960

gcagttatag aagaggggtt gagaatcttc ccgcctgccc catttggcct gcccagaatt 1020

tctccaggcg ccgtgattga cggtcactat gtgccacctg gtgtgacggt gagtgtcgat 1080

cattggacca cgaaacatga ccgtcgatac tggaaagacc cttatagttt tattcccgag 1140

cgatggatcg atgaagggtt tggcgacaca aagcaggctt cacaaccatt ttctctagga 1200

cccagagcat gcttggggat caaccttgct tacctagaaa tgcgaattat cattgcaaaa 1260

atggtatatt gcttcgattg ggaactccca cgattaatgg tcagattcca tccccataat 1320

tag 1323

<210> 15

<211> 440

<212> PRT

<213> 禾谷镰孢菌

<400> 15

Met Ala Ala Thr Leu Ile Val Phe Gly Gly Leu Leu Leu Leu Ala Trp

1 5 10 15

Leu Val Asn Ile Ala Tyr Arg Ser Leu Phe His Pro Leu Ala Lys Phe

20 25 30

Pro Gly Pro Lys Leu Ala Ala Val Ser Asp Ile Trp Tyr Ala Ile Lys

35 40 45

Trp Thr Ser Gly Arg Tyr Pro Phe Ile Met Glu Glu Thr His Arg Lys

50 55 60

Tyr Gly Asp Val Val Arg Ile Ala Pro Asn Glu Leu Ser Phe Ala Thr

65 70 75 80

Val Gln Ala Tyr Gln Asp Ile Tyr Gly His Ala Leu Lys Gly Lys Lys

85 90 95

Lys Phe Val Lys Ser Asn Trp Tyr Asp Thr Ala Gly Asp His Pro Gly

100 105 110

Ile Val Ser Val Arg Asp Pro Lys Glu His Ser Arg Gln Arg Lys Tyr

115 120 125

Leu Ser His Ala Phe Ser Ala Lys Ser Leu Arg Gly Gln Glu Val Leu

130 135 140

Val His Gly Tyr Val Asn Leu Phe Leu Asp Gln Leu Arg Asp Leu Ala

145 150 155 160

Phe Gly Glu Ser Phe Asp Ala Val Ala Asn Gly Lys Thr His Phe Trp

165 170 175

Val Ser Ile Ile Ile Asp Ala Thr Tyr Thr Ser Met Leu Ser Ala Leu

180 185 190

Arg Lys Arg Val Pro Leu Val Asn Leu Tyr Leu Pro Phe Val Val Pro

195 200 205

Lys Asp Ala Lys Ala Thr Tyr Gln Lys His Arg Ala Leu Thr Arg Glu

210 215 220

Lys Met Leu Lys Arg Leu Asp Met Pro Asn Ser Glu Asp Arg Gly Asp

225 230 235 240

Phe Phe Ala Ser Leu Leu Arg Lys Gly Gly Asn Glu Val Pro Glu Pro

245 250 255

Glu Leu Leu Gln Gln Ser Asn Thr Leu Ile Val Ala Gly Ser Glu Thr

260 265 270

Thr Ala Thr Cys Leu Thr Gly Ile Val Phe Cys Leu Leu Ser Asn Pro

275 280 285

Ser Cys Leu Glu Ala Leu Ser Asn Glu Val Arg Ser Arg Phe Gln Ser

290 295 300

Asp Ser Glu Ile Thr Gly Asp Ala Thr Ala Asp Met Lys Tyr Leu Ser

305 310 315 320

Ala Val Ile Glu Glu Gly Leu Arg Ile Phe Pro Pro Ala Pro Phe Gly

325 330 335

Leu Pro Arg Ile Ser Pro Gly Ala Val Ile Asp Gly His Tyr Val Pro

340 345 350

Pro Gly Val Thr Val Ser Val Asp His Trp Thr Thr Lys His Asp Arg

355 360 365

Arg Tyr Trp Lys Asp Pro Tyr Ser Phe Ile Pro Glu Arg Trp Ile Asp

370 375 380

Glu Gly Phe Gly Asp Thr Lys Gln Ala Ser Gln Pro Phe Ser Leu Gly

385 390 395 400

Pro Arg Ala Cys Leu Gly Ile Asn Leu Ala Tyr Leu Glu Met Arg Ile

405 410 415

Ile Ile Ala Lys Met Val Tyr Cys Phe Asp Trp Glu Leu Pro Arg Leu

420 425 430

Met Val Arg Phe His Pro His Asn

435 440

<210> 16

<211> 5003

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 16

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg ttccaccttc tgatatatcc actatgggtc ttggtggcat 1080

tattcgccgt cattatcgca aacctgctat atcaacagct gccaagacgt cctgatgaac 1140

ccccattagt ctttcactgg ttcccatttt tcggtaatgc agtcgcctat ggattggatc 1200

cctgtggctt tttcgagaaa tgcagggaga agcacgggga cgtattcaca ttcattttat 1260

ttggtcgaaa aattgtagcc tgcctgggcg tggacggaaa cgatttcgtt ctgaactcta 1320

ggctccaaga cgccaacgct gaagaggtct acgggccact caccattcct gtatttggca 1380

gcgacgttgt ctatgactgc cctaattcga agctaatgga acaaaagaaa ttcgtcaaat 1440

tcggtttaac gcagaaggct ttggagagtc atgtgcaact tatcgagagg gaggtgttgg 1500

attacgtcga gacagacccc tcattcagtg ggagaacatc aacaatagat gttccgaaag 1560

ccatggctga gatcacaatc ttcactgcta gtcgtagttt gcagggcgag gaagtcagga 1620

gaaagctgac tgcagagttc gcagccctct accatgatct cgacctgggc tttaggccgg 1680

ttaactttct gttcccttgg ttgccgctgc cccataacag gaagcgtgac gctgcccaca 1740

tcaaaatgag ggaggtctat atggacatta taaatgacag acgaaaaggg ggaatacgta 1800

ccgaggacgg tacggatatg attgccaatt taatgggatg cacatataag aatggccagc 1860

cagttcctga taaggagatt gcacacatga tgattacgct gctcatggca ggtcaacact 1920

catccagctc ggcttcttca tggattgtcc tgcatttagc ctcgagtcct gacattacgg 1980

aagagttgta ccaagagcaa ctcgtcaatt tatcagtcaa cggggccctt cccccgcttc 2040

agtactctga cctagacaaa ttgccgttgt tacagaatgt tgtaaaggaa acgctccgag 2100

ttcattctag tattcatagt attcttagga aagttaagcg tccgatgcaa gtccccaact 2160

caccatatac tattaccacg gataaggtca tcatggcctc ccccacggtg acagcaatgt 2220

cagaagagta cttcgagaat gctaaaacgt ggaaccctca cagatgggac aacagggcta 2280

aagaggaagt ggataccgag gatgtaatag actatggata cggagctgtc agtaaaggaa 2340

caaagtctcc ttatctaccg tttggggcag ggagacatcg atgcatcggc gaaaagttcg 2400

catacgtgaa tttgggggtc atagttgcta cgcttgtgag aaacttcagg ttatcgacaa 2460

tagacggccg acctggtgtt cctgaaaccg actatacatc cctattctcc cgaccggctc 2520

agccggcctt cattcgatgg gaacgaagga aaaagattta ggtcgacctg caagatctgc 2580

ggccgcgaat taattcgcct tagacatgac tgttcctcag ttcaagttgg gcacttacga 2640

gaagaccggt cttgctagat tctaatcaag aggatgtcag aatgccattt gcctgagaga 2700

tgcaggcttc atttttgata cttttttatt tgtaacctat atagtatagg attttttttg 2760

tcattttgtt tcttctcgta cgagcttgct cctgatcagc ctatctcgca gctgatgaat 2820

atcttgtggt aggggtttgg gaaaatcatt cgagtttgat gtttttcttg gtatttccca 2880

ctcctcttca gagtacagaa gattaagtga gaccttcgtt tgtgcggatc caattaatat 2940

ttacttattt tggtcaaccc caaataggtt gatttcatac ttggttcatt caaaaataag 3000

tagtcttttg agatctttca atattataat aaatatacta taacagccga cttgtttcat 3060

tttcgcgaat gttcccccag cttatcggat cccccacaca ccatagcttc aaaatgtttc 3120

tactcctttt ttactcttcc agattttctc ggactccgcg catcgccgta ccacttcaaa 3180

acacccaagc acagcatact aaatttcccc tctttcttcc tctagggtgt cgttaattac 3240

ccgtactaaa ggtttggaaa agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa 3300

aaggcaataa aaatttttat cacgtttctt tttcttgaaa tttttttttt tagttttttt 3360

ctctttcagt gacctccatt gatatttaag ttaataaacg gtcttcaatt tctcaagttt 3420

cagtttcatt tttcttgttc tattacaact ttttttactt cttgttcatt agaaagaaag 3480

catagcaatc taatctaagg ggcggtgttg acaattaatc atcggcatag tatatcggca 3540

tagtataata cgacaaggtg aggaactaaa ccatggccaa gttgaccagt gccgttccgg 3600

tgctcaccgc gcgcgacgtc gccggagcgg tcgagttctg gaccgaccgg ctcgggttct 3660

cccgggactt cgtggaggac gacttcgccg gtgtggtccg ggacgacgtg accctgttca 3720

tcagcgcggt ccaggaccag gtggtgccgg acaacaccct ggcctgggtg tgggtgcgcg 3780

gcctggacga gctgtacgcc gagtggtcgg aggtcgtgtc cacgaacttc cgggacgcct 3840

ccgggccggc catgaccgag atcggcgagc agccgtgggg gcgggagttc gccctgcgcg 3900

acccggccgg caactgcgtg cacttcgtgg ccgaggagca ggactgacac gtccgacggc 3960

ggcccacggg tcccaggcct cggagatccg tccccctttt cctttgtcga tatcatgtaa 4020

ttagttatgt cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa 4080

ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 4140

agaacgttat ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt 4200

aacattatac tgaaaacctt gcttgagaag gttttgggac gctcgaaggc tttaatttgc 4260

aagctggaga ccaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 4320

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 4380

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 4440

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 4500

ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg 4560

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4620

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4680

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4740

ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 4800

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 4860

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 4920

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 4980

taagggattt tggtcatgag atc 5003

<210> 17

<211> 1524

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 17

atgttccacc ttctgatata tccactatgg gtcttggtgg cattattcgc cgtcattatc 60

gcaaacctgc tatatcaaca gctgccaaga cgtcctgatg aacccccatt agtctttcac 120

tggttcccat ttttcggtaa tgcagtcgcc tatggattgg atccctgtgg ctttttcgag 180

aaatgcaggg agaagcacgg ggacgtattc acattcattt tatttggtcg aaaaattgta 240

gcctgcctgg gcgtggacgg aaacgatttc gttctgaact ctaggctcca agacgccaac 300

gctgaagagg tctacgggcc actcaccatt cctgtatttg gcagcgacgt tgtctatgac 360

tgccctaatt cgaagctaat ggaacaaaag aaattcgtca aattcggttt aacgcagaag 420

gctttggaga gtcatgtgca acttatcgag agggaggtgt tggattacgt cgagacagac 480

ccctcattca gtgggagaac atcaacaata gatgttccga aagccatggc tgagatcaca 540

atcttcactg ctagtcgtag tttgcagggc gaggaagtca ggagaaagct gactgcagag 600

ttcgcagccc tctaccatga tctcgacctg ggctttaggc cggttaactt tctgttccct 660

tggttgccgc tgccccataa caggaagcgt gacgctgccc acatcaaaat gagggaggtc 720

tatatggaca ttataaatga cagacgaaaa gggggaatac gtaccgagga cggtacggat 780

atgattgcca atttaatggg atgcacatat aagaatggcc agccagttcc tgataaggag 840

attgcacaca tgatgattac gctgctcatg gcaggtcaac actcatccag ctcggcttct 900

tcatggattg tcctgcattt agcctcgagt cctgacatta cggaagagtt gtaccaagag 960

caactcgtca atttatcagt caacggggcc cttcccccgc ttcagtactc tgacctagac 1020

aaattgccgt tgttacagaa tgttgtaaag gaaacgctcc gagttcattc tagtattcat 1080

agtattctta ggaaagttaa gcgtccgatg caagtcccca actcaccata tactattacc 1140

acggataagg tcatcatggc ctcccccacg gtgacagcaa tgtcagaaga gtacttcgag 1200

aatgctaaaa cgtggaaccc tcacagatgg gacaacaggg ctaaagagga agtggatacc 1260

gaggatgtaa tagactatgg atacggagct gtcagtaaag gaacaaagtc tccttatcta 1320

ccgtttgggg cagggagaca tcgatgcatc ggcgaaaagt tcgcatacgt gaatttgggg 1380

gtcatagttg ctacgcttgt gagaaacttc aggttatcga caatagacgg ccgacctggt 1440

gttcctgaaa ccgactatac atccctattc tcccgaccgg ctcagccggc cttcattcga 1500

tgggaacgaa ggaaaaagat ttag 1524

<210> 18

<211> 507

<212> PRT

<213> 禾谷镰孢菌

<400> 18

Met Phe His Leu Leu Ile Tyr Pro Leu Trp Val Leu Val Ala Leu Phe

1 5 10 15

Ala Val Ile Ile Ala Asn Leu Leu Tyr Gln Gln Leu Pro Arg Arg Pro

20 25 30

Asp Glu Pro Pro Leu Val Phe His Trp Phe Pro Phe Phe Gly Asn Ala

35 40 45

Val Ala Tyr Gly Leu Asp Pro Cys Gly Phe Phe Glu Lys Cys Arg Glu

50 55 60

Lys His Gly Asp Val Phe Thr Phe Ile Leu Phe Gly Arg Lys Ile Val

65 70 75 80

Ala Cys Leu Gly Val Asp Gly Asn Asp Phe Val Leu Asn Ser Arg Leu

85 90 95

Gln Asp Ala Asn Ala Glu Glu Val Tyr Gly Pro Leu Thr Ile Pro Val

100 105 110

Phe Gly Ser Asp Val Val Tyr Asp Cys Pro Asn Ser Lys Leu Met Glu

115 120 125

Gln Lys Lys Phe Val Lys Phe Gly Leu Thr Gln Lys Ala Leu Glu Ser

130 135 140

His Val Gln Leu Ile Glu Arg Glu Val Leu Asp Tyr Val Glu Thr Asp

145 150 155 160

Pro Ser Phe Ser Gly Arg Thr Ser Thr Ile Asp Val Pro Lys Ala Met

165 170 175

Ala Glu Ile Thr Ile Phe Thr Ala Ser Arg Ser Leu Gln Gly Glu Glu

180 185 190

Val Arg Arg Lys Leu Thr Ala Glu Phe Ala Ala Leu Tyr His Asp Leu

195 200 205

Asp Leu Gly Phe Arg Pro Val Asn Phe Leu Phe Pro Trp Leu Pro Leu

210 215 220

Pro His Asn Arg Lys Arg Asp Ala Ala His Ile Lys Met Arg Glu Val

225 230 235 240

Tyr Met Asp Ile Ile Asn Asp Arg Arg Lys Gly Gly Ile Arg Thr Glu

245 250 255

Asp Gly Thr Asp Met Ile Ala Asn Leu Met Gly Cys Thr Tyr Lys Asn

260 265 270

Gly Gln Pro Val Pro Asp Lys Glu Ile Ala His Met Met Ile Thr Leu

275 280 285

Leu Met Ala Gly Gln His Ser Ser Ser Ser Ala Ser Ser Trp Ile Val

290 295 300

Leu His Leu Ala Ser Ser Pro Asp Ile Thr Glu Glu Leu Tyr Gln Glu

305 310 315 320

Gln Leu Val Asn Leu Ser Val Asn Gly Ala Leu Pro Pro Leu Gln Tyr

325 330 335

Ser Asp Leu Asp Lys Leu Pro Leu Leu Gln Asn Val Val Lys Glu Thr

340 345 350

Leu Arg Val His Ser Ser Ile His Ser Ile Leu Arg Lys Val Lys Arg

355 360 365

Pro Met Gln Val Pro Asn Ser Pro Tyr Thr Ile Thr Thr Asp Lys Val

370 375 380

Ile Met Ala Ser Pro Thr Val Thr Ala Met Ser Glu Glu Tyr Phe Glu

385 390 395 400

Asn Ala Lys Thr Trp Asn Pro His Arg Trp Asp Asn Arg Ala Lys Glu

405 410 415

Glu Val Asp Thr Glu Asp Val Ile Asp Tyr Gly Tyr Gly Ala Val Ser

420 425 430

Lys Gly Thr Lys Ser Pro Tyr Leu Pro Phe Gly Ala Gly Arg His Arg

435 440 445

Cys Ile Gly Glu Lys Phe Ala Tyr Val Asn Leu Gly Val Ile Val Ala

450 455 460

Thr Leu Val Arg Asn Phe Arg Leu Ser Thr Ile Asp Gly Arg Pro Gly

465 470 475 480

Val Pro Glu Thr Asp Tyr Thr Ser Leu Phe Ser Arg Pro Ala Gln Pro

485 490 495

Ala Phe Ile Arg Trp Glu Arg Arg Lys Lys Ile

500 505

<210> 19

<211> 5060

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 19

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg ggacttttgc aagaacttgc cgggcacccc ctagcacagc 1080

aattccagga acttcctttg ggtcaacagg ttggaattgg ctttgccgtt tttttggtcc 1140

tctcggtagt ccttaatgtt ctaaaccagc ttttattcag gaatccaaat gaaccgccaa 1200

tggtctttca ttggttccct tttgtaggga gcacaatcac gtacggtatg gatcccccta 1260

catttttcag agaaaacaga gctaaacatg gcgacgtatt cacctttatt ctcttgggaa 1320

agaaaactac ggttgctgtc ggcccggcag gaaatgactt cattttaaac ggtaagctta 1380

aggacgtatg tgctgaagag atctacacgg ttctcacaac tccagtattc ggcaaagatg 1440

tcgtttatga ttgtccaaac gctaagttaa tggaacaaaa aaagttcatg aaaattgctc 1500

tcacgacaga ggcatttaga tcttatgtgc ccataatcag ttcagaagtc agagactact 1560

ttaagagaag tccagacttc aagggaaagt ccggtattgc agatatacca aaaaagatgg 1620

ctgagattac aatattcact gcttcccacg ccctccaagg ttcggctata agaagtaagt 1680

ttgatgagag cttggcagct ttgtatcacg atctagacat gggctttaca ccgattaact 1740

ttatgttaca ctgggcaccg ctgccttgga acaggaagcg agatcacgct caaagaacgg 1800

tcgcaaaaat atatatggat acgattaaag agcgacgtgc aaaaggtaac aatgaatcag 1860

aacatgatat gatgaagcat ctgatgaact cgacgtacaa aaatggaata cgagttcccg 1920

atcacgaggt tgcacacatg atgatcgcac tccttatggc tggacagcat agttcttcaa 1980

gtactagctc gtggataatg ctgcgtttgg ctcagtatcc ccatatcatg gaggaattat 2040

atcaggagca ggtaaagaat ttaggggcag atctgcctcc attgacatat gaggatctag 2100

ccaaacttcc gttgaatcaa gctatcgtaa aagaaacttt acgtttacat gctccaatcc 2160

actctattat gagggctgtc aaatccccaa tgcccgtacc tggcaccaaa tatgtgatac 2220

cgacatcaca cacacttcta gctgcacccg gtgtctcggc tacggactct gcatttttcc 2280

caaatcctga tgaatgggac cctcacagat gggaggctga ttcccctaac tttcccagga 2340

tggcttcgaa aggagaggac gaggaaaaaa tagattatgg gtatggttta gtctcaaaag 2400

gctccgcttc gccgtatctg ccctttggag ctggtaggca ccgatgcatt ggggaacact 2460

ttgctaatgc tcaattacag acaatcgtag ctgaagtcgt gagggaattt aaatttcgta 2520

atgtcgatgg aggtcacacg ttaattgata ctgattacgc ctcattgttc tcgcgaccct 2580

tggaacccgc taacatccat tgggaacgta gacaataggt cgacctgcaa gatctgcggc 2640

cgcgaattaa ttcgccttag acatgactgt tcctcagttc aagttgggca cttacgagaa 2700

gaccggtctt gctagattct aatcaagagg atgtcagaat gccatttgcc tgagagatgc 2760

aggcttcatt tttgatactt ttttatttgt aacctatata gtataggatt ttttttgtca 2820

ttttgtttct tctcgtacga gcttgctcct gatcagccta tctcgcagct gatgaatatc 2880

ttgtggtagg ggtttgggaa aatcattcga gtttgatgtt tttcttggta tttcccactc 2940

ctcttcagag tacagaagat taagtgagac cttcgtttgt gcggatccaa ttaatattta 3000

cttattttgg tcaaccccaa ataggttgat ttcatacttg gttcattcaa aaataagtag 3060

tcttttgaga tctttcaata ttataataaa tatactataa cagccgactt gtttcatttt 3120

cgcgaatgtt cccccagctt atcggatccc ccacacacca tagcttcaaa atgtttctac 3180

tcctttttta ctcttccaga ttttctcgga ctccgcgcat cgccgtacca cttcaaaaca 3240

cccaagcaca gcatactaaa tttcccctct ttcttcctct agggtgtcgt taattacccg 3300

tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt ctttttcttc gtcgaaaaag 3360

gcaataaaaa tttttatcac gtttcttttt cttgaaattt ttttttttag tttttttctc 3420

tttcagtgac ctccattgat atttaagtta ataaacggtc ttcaatttct caagtttcag 3480

tttcattttt cttgttctat tacaactttt tttacttctt gttcattaga aagaaagcat 3540

agcaatctaa tctaaggggc ggtgttgaca attaatcatc ggcatagtat atcggcatag 3600

tataatacga caaggtgagg aactaaacca tggccaagtt gaccagtgcc gttccggtgc 3660

tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc 3720

gggacttcgt ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca 3780

gcgcggtcca ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc 3840

tggacgagct gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg 3900

ggccggccat gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc 3960

cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga ctgacacgtc cgacggcggc 4020

ccacgggtcc caggcctcgg agatccgtcc cccttttcct ttgtcgatat catgtaatta 4080

gttatgtcac gcttacattc acgccctccc cccacatccg ctctaaccga aaaggaagga 4140

gttagacaac ctgaagtcta ggtccctatt tattttttta tagttatgtt agtattaaga 4200

acgttattta tatttcaaat ttttcttttt tttctgtaca gacgcgtgta cgcatgtaac 4260

attatactga aaaccttgct tgagaaggtt ttgggacgct cgaaggcttt aatttgcaag 4320

ctggagacca acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 4380

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 4440

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 4500

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 4560

ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 4620

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4680

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4740

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 4800

aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 4860

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4920

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4980

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 5040

gggattttgg tcatgagatc 5060

<210> 20

<211> 1581

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 20

atgggacttt tgcaagaact tgccgggcac cccctagcac agcaattcca ggaacttcct 60

ttgggtcaac aggttggaat tggctttgcc gtttttttgg tcctctcggt agtccttaat 120

gttctaaacc agcttttatt caggaatcca aatgaaccgc caatggtctt tcattggttc 180

ccttttgtag ggagcacaat cacgtacggt atggatcccc ctacattttt cagagaaaac 240

agagctaaac atggcgacgt attcaccttt attctcttgg gaaagaaaac tacggttgct 300

gtcggcccgg caggaaatga cttcatttta aacggtaagc ttaaggacgt atgtgctgaa 360

gagatctaca cggttctcac aactccagta ttcggcaaag atgtcgttta tgattgtcca 420

aacgctaagt taatggaaca aaaaaagttc atgaaaattg ctctcacgac agaggcattt 480

agatcttatg tgcccataat cagttcagaa gtcagagact actttaagag aagtccagac 540

ttcaagggaa agtccggtat tgcagatata ccaaaaaaga tggctgagat tacaatattc 600

actgcttccc acgccctcca aggttcggct ataagaagta agtttgatga gagcttggca 660

gctttgtatc acgatctaga catgggcttt acaccgatta actttatgtt acactgggca 720

ccgctgcctt ggaacaggaa gcgagatcac gctcaaagaa cggtcgcaaa aatatatatg 780

gatacgatta aagagcgacg tgcaaaaggt aacaatgaat cagaacatga tatgatgaag 840

catctgatga actcgacgta caaaaatgga atacgagttc ccgatcacga ggttgcacac 900

atgatgatcg cactccttat ggctggacag catagttctt caagtactag ctcgtggata 960

atgctgcgtt tggctcagta tccccatatc atggaggaat tatatcagga gcaggtaaag 1020

aatttagggg cagatctgcc tccattgaca tatgaggatc tagccaaact tccgttgaat 1080

caagctatcg taaaagaaac tttacgttta catgctccaa tccactctat tatgagggct 1140

gtcaaatccc caatgcccgt acctggcacc aaatatgtga taccgacatc acacacactt 1200

ctagctgcac ccggtgtctc ggctacggac tctgcatttt tcccaaatcc tgatgaatgg 1260

gaccctcaca gatgggaggc tgattcccct aactttccca ggatggcttc gaaaggagag 1320

gacgaggaaa aaatagatta tgggtatggt ttagtctcaa aaggctccgc ttcgccgtat 1380

ctgccctttg gagctggtag gcaccgatgc attggggaac actttgctaa tgctcaatta 1440

cagacaatcg tagctgaagt cgtgagggaa tttaaatttc gtaatgtcga tggaggtcac 1500

acgttaattg atactgatta cgcctcattg ttctcgcgac ccttggaacc cgctaacatc 1560

cattgggaac gtagacaata g 1581

<210> 21

<211> 526

<212> PRT

<213> 禾谷镰孢菌

<400> 21

Met Gly Leu Leu Gln Glu Leu Ala Gly His Pro Leu Ala Gln Gln Phe

1 5 10 15

Gln Glu Leu Pro Leu Gly Gln Gln Val Gly Ile Gly Phe Ala Val Phe

20 25 30

Leu Val Leu Ser Val Val Leu Asn Val Leu Asn Gln Leu Leu Phe Arg

35 40 45

Asn Pro Asn Glu Pro Pro Met Val Phe His Trp Phe Pro Phe Val Gly

50 55 60

Ser Thr Ile Thr Tyr Gly Met Asp Pro Pro Thr Phe Phe Arg Glu Asn

65 70 75 80

Arg Ala Lys His Gly Asp Val Phe Thr Phe Ile Leu Leu Gly Lys Lys

85 90 95

Thr Thr Val Ala Val Gly Pro Ala Gly Asn Asp Phe Ile Leu Asn Gly

100 105 110

Lys Leu Lys Asp Val Cys Ala Glu Glu Ile Tyr Thr Val Leu Thr Thr

115 120 125

Pro Val Phe Gly Lys Asp Val Val Tyr Asp Cys Pro Asn Ala Lys Leu

130 135 140

Met Glu Gln Lys Lys Phe Met Lys Ile Ala Leu Thr Thr Glu Ala Phe

145 150 155 160

Arg Ser Tyr Val Pro Ile Ile Ser Ser Glu Val Arg Asp Tyr Phe Lys

165 170 175

Arg Ser Pro Asp Phe Lys Gly Lys Ser Gly Ile Ala Asp Ile Pro Lys

180 185 190

Lys Met Ala Glu Ile Thr Ile Phe Thr Ala Ser His Ala Leu Gln Gly

195 200 205

Ser Ala Ile Arg Ser Lys Phe Asp Glu Ser Leu Ala Ala Leu Tyr His

210 215 220

Asp Leu Asp Met Gly Phe Thr Pro Ile Asn Phe Met Leu His Trp Ala

225 230 235 240

Pro Leu Pro Trp Asn Arg Lys Arg Asp His Ala Gln Arg Thr Val Ala

245 250 255

Lys Ile Tyr Met Asp Thr Ile Lys Glu Arg Arg Ala Lys Gly Asn Asn

260 265 270

Glu Ser Glu His Asp Met Met Lys His Leu Met Asn Ser Thr Tyr Lys

275 280 285

Asn Gly Ile Arg Val Pro Asp His Glu Val Ala His Met Met Ile Ala

290 295 300

Leu Leu Met Ala Gly Gln His Ser Ser Ser Ser Thr Ser Ser Trp Ile

305 310 315 320

Met Leu Arg Leu Ala Gln Tyr Pro His Ile Met Glu Glu Leu Tyr Gln

325 330 335

Glu Gln Val Lys Asn Leu Gly Ala Asp Leu Pro Pro Leu Thr Tyr Glu

340 345 350

Asp Leu Ala Lys Leu Pro Leu Asn Gln Ala Ile Val Lys Glu Thr Leu

355 360 365

Arg Leu His Ala Pro Ile His Ser Ile Met Arg Ala Val Lys Ser Pro

370 375 380

Met Pro Val Pro Gly Thr Lys Tyr Val Ile Pro Thr Ser His Thr Leu

385 390 395 400

Leu Ala Ala Pro Gly Val Ser Ala Thr Asp Ser Ala Phe Phe Pro Asn

405 410 415

Pro Asp Glu Trp Asp Pro His Arg Trp Glu Ala Asp Ser Pro Asn Phe

420 425 430

Pro Arg Met Ala Ser Lys Gly Glu Asp Glu Glu Lys Ile Asp Tyr Gly

435 440 445

Tyr Gly Leu Val Ser Lys Gly Ser Ala Ser Pro Tyr Leu Pro Phe Gly

450 455 460

Ala Gly Arg His Arg Cys Ile Gly Glu His Phe Ala Asn Ala Gln Leu

465 470 475 480

Gln Thr Ile Val Ala Glu Val Val Arg Glu Phe Lys Phe Arg Asn Val

485 490 495

Asp Gly Gly His Thr Leu Ile Asp Thr Asp Tyr Ala Ser Leu Phe Ser

500 505 510

Arg Pro Leu Glu Pro Ala Asn Ile His Trp Glu Arg Arg Gln

515 520 525

<210> 22

<211> 4994

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 22

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg ggagtcaata acgcgacttt gggcttggta tgctgtgtta 1080

tcgtcgcggt ggttgcttta gcgacgcgaa aggggcctga ctcaagagag cccccgtatg 1140

ttaaggaaag ggtcccctac ttcagtcaca tctacggact tttgaagcat ggcttacgtt 1200

attttgatgt tgtcagtgct cagcaacccc accccatatt tacgatagat atgtcgggcc 1260

agaagaacta tatagtaact tctcctgaac tggttcaagc ggtgcaacgc aacacaacgt 1320

cgttgagctt ctccccggca atgattcccg cttttcgacg catgatgggg tttgatgaag 1380

ctgggatcga gctgattttt cgggatgcac atacagaaaa aggcatgtac ggggaaattc 1440

acagggtcca gaaggcgtct ttacttccgg gaactgagtc gttggacgaa ctttgcacca 1500

ttatacgagg taagttgtta acaattgtga atgacatgcc ctcctctcaa acaatcgatc 1560

tgtacgcgtg ggtccaggac ctttacatga ggacaaataa ctctgcttgc tttggcgcaa 1620

aggatccttt tactttaaac ccgtccctga tttcgacctt ctggttgtgg gaggcgaata 1680

ttaaggtatt gttactgggg attccatggt tcctatcccc ctcaaaatat tcaactgctc 1740

agcgaactag aaacgattta gtgaacgcgt tcacgcaata cttgggtaat gatgggcttg 1800

aaactgcttg tagctttatc aaagaactat ctaatttggg gattcgtaga ggccttagta 1860

ccgaaaataa cgcgagggcg ctggtcggca gcatcctggc aatcgtgggg aatacaattc 1920

cgacaacctt ttggcttctc attcagatct tctccaggcc agacctgctc aaggagatac 1980

gttctgagct tgaggcaacg ctggaagatc catctagtcg atcagaaata tcactcaact 2040

atactgtgat cagagaaaag tgtccagttc ttatgtctac atatgaggaa attctcagga 2100

tgacgagcgg tatcgcaaca gtcaggtaca cgaatgagga tacgttaatc caggaccgct 2160

ggttgttaaa gaaaggcgca caagtgcaaa tgcccactgc cttcatacat gccgacccaa 2220

ccacgtgggg cgcagacgcg gaggtctttg atcacactag gttcttgaaa tctaaggttc 2280

tgacaaaaga gcaaaaagcg cgcagagccg ctgccttccg gccttttggg ggtggcaaca 2340

ccctgtgccc gggacggcac ttcgcgtctt atgaggtgct taccttcgcc gggagcatcc 2400

tgctcggttt tgatatgaca cccacaactg aagctttcaa cctccccgag atggataggt 2460

ctaagcttcc tctgacctcc ctgaaaccag ctggggatat caaagtcaac ctaacccgcc 2520

gttccgggtg ggagaaggtg caattcaagt gagtcgacct gcaagatctg cggccgcgaa 2580

ttaattcgcc ttagacatga ctgttcctca gttcaagttg ggcacttacg agaagaccgg 2640

tcttgctaga ttctaatcaa gaggatgtca gaatgccatt tgcctgagag atgcaggctt 2700

catttttgat acttttttat ttgtaaccta tatagtatag gatttttttt gtcattttgt 2760

ttcttctcgt acgagcttgc tcctgatcag cctatctcgc agctgatgaa tatcttgtgg 2820

taggggtttg ggaaaatcat tcgagtttga tgtttttctt ggtatttccc actcctcttc 2880

agagtacaga agattaagtg agaccttcgt ttgtgcggat ccaattaata tttacttatt 2940

ttggtcaacc ccaaataggt tgatttcata cttggttcat tcaaaaataa gtagtctttt 3000

gagatctttc aatattataa taaatatact ataacagccg acttgtttca ttttcgcgaa 3060

tgttccccca gcttatcgga tcccccacac accatagctt caaaatgttt ctactccttt 3120

tttactcttc cagattttct cggactccgc gcatcgccgt accacttcaa aacacccaag 3180

cacagcatac taaatttccc ctctttcttc ctctagggtg tcgttaatta cccgtactaa 3240

aggtttggaa aagaaaaaag agaccgcctc gtttcttttt cttcgtcgaa aaaggcaata 3300

aaaattttta tcacgtttct ttttcttgaa attttttttt ttagtttttt tctctttcag 3360

tgacctccat tgatatttaa gttaataaac ggtcttcaat ttctcaagtt tcagtttcat 3420

ttttcttgtt ctattacaac tttttttact tcttgttcat tagaaagaaa gcatagcaat 3480

ctaatctaag gggcggtgtt gacaattaat catcggcata gtatatcggc atagtataat 3540

acgacaaggt gaggaactaa accatggcca agttgaccag tgccgttccg gtgctcaccg 3600

cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc tcccgggact 3660

tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc atcagcgcgg 3720

tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc ggcctggacg 3780

agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc tccgggccgg 3840

ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc gacccggccg 3900

gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtccgacgg cggcccacgg 3960

gtcccaggcc tcggagatcc gtcccccttt tcctttgtcg atatcatgta attagttatg 4020

tcacgcttac attcacgccc tccccccaca tccgctctaa ccgaaaagga aggagttaga 4080

caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt aagaacgtta 4140

tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg taacattata 4200

ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg caagctggag 4260

accaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 4320

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 4380

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 4440

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 4500

ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 4560

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 4620

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 4680

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 4740

tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 4800

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 4860

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 4920

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 4980

ttggtcatga gatc 4994

<210> 23

<211> 1515

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 23

atgggagtca ataacgcgac tttgggcttg gtatgctgtg ttatcgtcgc ggtggttgct 60

ttagcgacgc gaaaggggcc tgactcaaga gagcccccgt atgttaagga aagggtcccc 120

tacttcagtc acatctacgg acttttgaag catggcttac gttattttga tgttgtcagt 180

gctcagcaac cccaccccat atttacgata gatatgtcgg gccagaagaa ctatatagta 240

acttctcctg aactggttca agcggtgcaa cgcaacacaa cgtcgttgag cttctccccg 300

gcaatgattc ccgcttttcg acgcatgatg gggtttgatg aagctgggat cgagctgatt 360

tttcgggatg cacatacaga aaaaggcatg tacggggaaa ttcacagggt ccagaaggcg 420

tctttacttc cgggaactga gtcgttggac gaactttgca ccattatacg aggtaagttg 480

ttaacaattg tgaatgacat gccctcctct caaacaatcg atctgtacgc gtgggtccag 540

gacctttaca tgaggacaaa taactctgct tgctttggcg caaaggatcc ttttacttta 600

aacccgtccc tgatttcgac cttctggttg tgggaggcga atattaaggt attgttactg 660

gggattccat ggttcctatc cccctcaaaa tattcaactg ctcagcgaac tagaaacgat 720

ttagtgaacg cgttcacgca atacttgggt aatgatgggc ttgaaactgc ttgtagcttt 780

atcaaagaac tatctaattt ggggattcgt agaggcctta gtaccgaaaa taacgcgagg 840

gcgctggtcg gcagcatcct ggcaatcgtg gggaatacaa ttccgacaac cttttggctt 900

ctcattcaga tcttctccag gccagacctg ctcaaggaga tacgttctga gcttgaggca 960

acgctggaag atccatctag tcgatcagaa atatcactca actatactgt gatcagagaa 1020

aagtgtccag ttcttatgtc tacatatgag gaaattctca ggatgacgag cggtatcgca 1080

acagtcaggt acacgaatga ggatacgtta atccaggacc gctggttgtt aaagaaaggc 1140

gcacaagtgc aaatgcccac tgccttcata catgccgacc caaccacgtg gggcgcagac 1200

gcggaggtct ttgatcacac taggttcttg aaatctaagg ttctgacaaa agagcaaaaa 1260

gcgcgcagag ccgctgcctt ccggcctttt gggggtggca acaccctgtg cccgggacgg 1320

cacttcgcgt cttatgaggt gcttaccttc gccgggagca tcctgctcgg ttttgatatg 1380

acacccacaa ctgaagcttt caacctcccc gagatggata ggtctaagct tcctctgacc 1440

tccctgaaac cagctgggga tatcaaagtc aacctaaccc gccgttccgg gtgggagaag 1500

gtgcaattca agtga 1515

<210> 24

<211> 504

<212> PRT

<213> 禾谷镰孢菌

<400> 24

Met Gly Val Asn Asn Ala Thr Leu Gly Leu Val Cys Cys Val Ile Val

1 5 10 15

Ala Val Val Ala Leu Ala Thr Arg Lys Gly Pro Asp Ser Arg Glu Pro

20 25 30

Pro Tyr Val Lys Glu Arg Val Pro Tyr Phe Ser His Ile Tyr Gly Leu

35 40 45

Leu Lys His Gly Leu Arg Tyr Phe Asp Val Val Ser Ala Gln Gln Pro

50 55 60

His Pro Ile Phe Thr Ile Asp Met Ser Gly Gln Lys Asn Tyr Ile Val

65 70 75 80

Thr Ser Pro Glu Leu Val Gln Ala Val Gln Arg Asn Thr Thr Ser Leu

85 90 95

Ser Phe Ser Pro Ala Met Ile Pro Ala Phe Arg Arg Met Met Gly Phe

100 105 110

Asp Glu Ala Gly Ile Glu Leu Ile Phe Arg Asp Ala His Thr Glu Lys

115 120 125

Gly Met Tyr Gly Glu Ile His Arg Val Gln Lys Ala Ser Leu Leu Pro

130 135 140

Gly Thr Glu Ser Leu Asp Glu Leu Cys Thr Ile Ile Arg Gly Lys Leu

145 150 155 160

Leu Thr Ile Val Asn Asp Met Pro Ser Ser Gln Thr Ile Asp Leu Tyr

165 170 175

Ala Trp Val Gln Asp Leu Tyr Met Arg Thr Asn Asn Ser Ala Cys Phe

180 185 190

Gly Ala Lys Asp Pro Phe Thr Leu Asn Pro Ser Leu Ile Ser Thr Phe

195 200 205

Trp Leu Trp Glu Ala Asn Ile Lys Val Leu Leu Leu Gly Ile Pro Trp

210 215 220

Phe Leu Ser Pro Ser Lys Tyr Ser Thr Ala Gln Arg Thr Arg Asn Asp

225 230 235 240

Leu Val Asn Ala Phe Thr Gln Tyr Leu Gly Asn Asp Gly Leu Glu Thr

245 250 255

Ala Cys Ser Phe Ile Lys Glu Leu Ser Asn Leu Gly Ile Arg Arg Gly

260 265 270

Leu Ser Thr Glu Asn Asn Ala Arg Ala Leu Val Gly Ser Ile Leu Ala

275 280 285

Ile Val Gly Asn Thr Ile Pro Thr Thr Phe Trp Leu Leu Ile Gln Ile

290 295 300

Phe Ser Arg Pro Asp Leu Leu Lys Glu Ile Arg Ser Glu Leu Glu Ala

305 310 315 320

Thr Leu Glu Asp Pro Ser Ser Arg Ser Glu Ile Ser Leu Asn Tyr Thr

325 330 335

Val Ile Arg Glu Lys Cys Pro Val Leu Met Ser Thr Tyr Glu Glu Ile

340 345 350

Leu Arg Met Thr Ser Gly Ile Ala Thr Val Arg Tyr Thr Asn Glu Asp

355 360 365

Thr Leu Ile Gln Asp Arg Trp Leu Leu Lys Lys Gly Ala Gln Val Gln

370 375 380

Met Pro Thr Ala Phe Ile His Ala Asp Pro Thr Thr Trp Gly Ala Asp

385 390 395 400

Ala Glu Val Phe Asp His Thr Arg Phe Leu Lys Ser Lys Val Leu Thr

405 410 415

Lys Glu Gln Lys Ala Arg Arg Ala Ala Ala Phe Arg Pro Phe Gly Gly

420 425 430

Gly Asn Thr Leu Cys Pro Gly Arg His Phe Ala Ser Tyr Glu Val Leu

435 440 445

Thr Phe Ala Gly Ser Ile Leu Leu Gly Phe Asp Met Thr Pro Thr Thr

450 455 460

Glu Ala Phe Asn Leu Pro Glu Met Asp Arg Ser Lys Leu Pro Leu Thr

465 470 475 480

Ser Leu Lys Pro Ala Gly Asp Ile Lys Val Asn Leu Thr Arg Arg Ser

485 490 495

Gly Trp Glu Lys Val Gln Phe Lys

500

<210> 25

<211> 5051

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 25

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg atattcgaca acttgtcgct cagcaacacg tgggttgtgt 1080

tagtacttag cgcggtattt cttgtgcttt cccgttttat tgctccgaca atctcagaga 1140

acgagcctcc catcgtcaag ccaagggccc ccttcattgg acacattatc tccatgttga 1200

gggacggctc cgatatctac gttaatttgt ttaagcaaag aaaggaacca atagttactt 1260

tacccatgtt aaatggaaaa ttatacgtga taaattctcc agacctcata caggccgcat 1320

tgcgtaacaa tgacatctct ttcacaccgt tcattcttga gtcgtcaaaa gcaatgtggg 1380

ggttatctga taatgcgatg gcgagcatat ctgaccttgc caacttgaaa ggcggtatgc 1440

agattatcca ctcaaccctc ggaggggagt cgcttcataa attgaacata tcgtctctga 1500

gtaggttcat gacttatttg aatcgcgtta aacccggcga aaatattggt atagccgaca 1560

cttatatttg gctgagagac atgctcaccg acgctagcgc gaccgcggtc tatggtccta 1620

agaatccaat aaccgtcgat aaaatgcacc tagtatggta ctcgttacta caatccattt 1680

actctacttg ttccaacagt ggtcgagatt acgataaaca agcgttactt gtcgcaatag 1740

gcctcccttc cttcgtgaca aaagccgcga taaatgctcg tctaaaggtt aataacttgc 1800

ttctgtcgta ctataaaaat ggtggcaacc atgaaaaagg ggcgtctgaa atcatacaac 1860

agcgggcaac gtatctgcga aagacagggt tcacagatga cgatttgtcc cacatggagt 1920

tcatgatact atgggtagga gtgactaata ctgcacccgt tctattctgg ttgtttgtcc 1980

acgttcttac gtctgctggc tatacgagcc gcgtgcgggc tgagatagag gcgataacaa 2040

taatcaccaa gacgccagag ggcagaaaag caaccttcga tacccgttta ctcgagaaat 2100

cctgcccatt cctcaacgcg tgttaccagg aatgccttcg acattactct cactcgatcg 2160

gtaatcgtcg agtcatgcag gatactgaga tccaagattc tcagggccga aagtaccttc 2220

taaagaaagg cgttaacgtt caatggccgc ctccggtcac acatttcaat acggaagttt 2280

ggggccagga cgcggatgta tttcgtccag aaagatttat ggacgtcact cctcaggacg 2340

aaaaaaagag gagaggcgcc ctgttatcct tcggaggtgg caaacacctt tgcccgggta 2400

gaaagttcgc gtacacagaa ttgctagggc ttgtgggggt tgtggctctt ggcttcgaag 2460

ttaagggtct ggagctaccc gaaagtaaat acgcaggaat cggcatagga ggcaagatgc 2520

ctgattggga gaatatggaa aaaggcttcg gtctaagacg tcgagagggg tgggaggatg 2580

ttacctgggt ctttgatgga gataattgag tcgacctgca agatctgcgg ccgcgaatta 2640

attcgcctta gacatgactg ttcctcagtt caagttgggc acttacgaga agaccggtct 2700

tgctagattc taatcaagag gatgtcagaa tgccatttgc ctgagagatg caggcttcat 2760

ttttgatact tttttatttg taacctatat agtataggat tttttttgtc attttgtttc 2820

ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat cttgtggtag 2880

gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact cctcttcaga 2940

gtacagaaga ttaagtgaga ccttcgtttg tgcggatcca attaatattt acttattttg 3000

gtcaacccca aataggttga tttcatactt ggttcattca aaaataagta gtcttttgag 3060

atctttcaat attataataa atatactata acagccgact tgtttcattt tcgcgaatgt 3120

tcccccagct tatcggatcc cccacacacc atagcttcaa aatgtttcta ctcctttttt 3180

actcttccag attttctcgg actccgcgca tcgccgtacc acttcaaaac acccaagcac 3240

agcatactaa atttcccctc tttcttcctc tagggtgtcg ttaattaccc gtactaaagg 3300

tttggaaaag aaaaaagaga ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa 3360

atttttatca cgtttctttt tcttgaaatt ttttttttta gtttttttct ctttcagtga 3420

cctccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca gtttcatttt 3480

tcttgttcta ttacaacttt ttttacttct tgttcattag aaagaaagca tagcaatcta 3540

atctaagggg cggtgttgac aattaatcat cggcatagta tatcggcata gtataatacg 3600

acaaggtgag gaactaaacc atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc 3660

gcgacgtcgc cggagcggtc gagttctgga ccgaccggct cgggttctcc cgggacttcg 3720

tggaggacga cttcgccggt gtggtccggg acgacgtgac cctgttcatc agcgcggtcc 3780

aggaccaggt ggtgccggac aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc 3840

tgtacgccga gtggtcggag gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca 3900

tgaccgagat cggcgagcag ccgtgggggc gggagttcgc cctgcgcgac ccggccggca 3960

actgcgtgca cttcgtggcc gaggagcagg actgacacgt ccgacggcgg cccacgggtc 4020

ccaggcctcg gagatccgtc ccccttttcc tttgtcgata tcatgtaatt agttatgtca 4080

cgcttacatt cacgccctcc ccccacatcc gctctaaccg aaaaggaagg agttagacaa 4140

cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag aacgttattt 4200

atatttcaaa tttttctttt ttttctgtac agacgcgtgt acgcatgtaa cattatactg 4260

aaaaccttgc ttgagaaggt tttgggacgc tcgaaggctt taatttgcaa gctggagacc 4320

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 4380

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 4440

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 4500

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 4560

agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 4620

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 4680

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 4740

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 4800

cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 4860

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 4920

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 4980

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 5040

gtcatgagat c 5051

<210> 26

<211> 1572

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 26

atgatattcg acaacttgtc gctcagcaac acgtgggttg tgttagtact tagcgcggta 60

tttcttgtgc tttcccgttt tattgctccg acaatctcag agaacgagcc tcccatcgtc 120

aagccaaggg cccccttcat tggacacatt atctccatgt tgagggacgg ctccgatatc 180

tacgttaatt tgtttaagca aagaaaggaa ccaatagtta ctttacccat gttaaatgga 240

aaattatacg tgataaattc tccagacctc atacaggccg cattgcgtaa caatgacatc 300

tctttcacac cgttcattct tgagtcgtca aaagcaatgt gggggttatc tgataatgcg 360

atggcgagca tatctgacct tgccaacttg aaaggcggta tgcagattat ccactcaacc 420

ctcggagggg agtcgcttca taaattgaac atatcgtctc tgagtaggtt catgacttat 480

ttgaatcgcg ttaaacccgg cgaaaatatt ggtatagccg acacttatat ttggctgaga 540

gacatgctca ccgacgctag cgcgaccgcg gtctatggtc ctaagaatcc aataaccgtc 600

gataaaatgc acctagtatg gtactcgtta ctacaatcca tttactctac ttgttccaac 660

agtggtcgag attacgataa acaagcgtta cttgtcgcaa taggcctccc ttccttcgtg 720

acaaaagccg cgataaatgc tcgtctaaag gttaataact tgcttctgtc gtactataaa 780

aatggtggca accatgaaaa aggggcgtct gaaatcatac aacagcgggc aacgtatctg 840

cgaaagacag ggttcacaga tgacgatttg tcccacatgg agttcatgat actatgggta 900

ggagtgacta atactgcacc cgttctattc tggttgtttg tccacgttct tacgtctgct 960

ggctatacga gccgcgtgcg ggctgagata gaggcgataa caataatcac caagacgcca 1020

gagggcagaa aagcaacctt cgatacccgt ttactcgaga aatcctgccc attcctcaac 1080

gcgtgttacc aggaatgcct tcgacattac tctcactcga tcggtaatcg tcgagtcatg 1140

caggatactg agatccaaga ttctcagggc cgaaagtacc ttctaaagaa aggcgttaac 1200

gttcaatggc cgcctccggt cacacatttc aatacggaag tttggggcca ggacgcggat 1260

gtatttcgtc cagaaagatt tatggacgtc actcctcagg acgaaaaaaa gaggagaggc 1320

gccctgttat ccttcggagg tggcaaacac ctttgcccgg gtagaaagtt cgcgtacaca 1380

gaattgctag ggcttgtggg ggttgtggct cttggcttcg aagttaaggg tctggagcta 1440

cccgaaagta aatacgcagg aatcggcata ggaggcaaga tgcctgattg ggagaatatg 1500

gaaaaaggct tcggtctaag acgtcgagag gggtgggagg atgttacctg ggtctttgat 1560

ggagataatt ga 1572

<210> 27

<211> 523

<212> PRT

<213> 禾谷镰孢菌

<400> 27

Met Ile Phe Asp Asn Leu Ser Leu Ser Asn Thr Trp Val Val Leu Val

1 5 10 15

Leu Ser Ala Val Phe Leu Val Leu Ser Arg Phe Ile Ala Pro Thr Ile

20 25 30

Ser Glu Asn Glu Pro Pro Ile Val Lys Pro Arg Ala Pro Phe Ile Gly

35 40 45

His Ile Ile Ser Met Leu Arg Asp Gly Ser Asp Ile Tyr Val Asn Leu

50 55 60

Phe Lys Gln Arg Lys Glu Pro Ile Val Thr Leu Pro Met Leu Asn Gly

65 70 75 80

Lys Leu Tyr Val Ile Asn Ser Pro Asp Leu Ile Gln Ala Ala Leu Arg

85 90 95

Asn Asn Asp Ile Ser Phe Thr Pro Phe Ile Leu Glu Ser Ser Lys Ala

100 105 110

Met Trp Gly Leu Ser Asp Asn Ala Met Ala Ser Ile Ser Asp Leu Ala

115 120 125

Asn Leu Lys Gly Gly Met Gln Ile Ile His Ser Thr Leu Gly Gly Glu

130 135 140

Ser Leu His Lys Leu Asn Ile Ser Ser Leu Ser Arg Phe Met Thr Tyr

145 150 155 160

Leu Asn Arg Val Lys Pro Gly Glu Asn Ile Gly Ile Ala Asp Thr Tyr

165 170 175

Ile Trp Leu Arg Asp Met Leu Thr Asp Ala Ser Ala Thr Ala Val Tyr

180 185 190

Gly Pro Lys Asn Pro Ile Thr Val Asp Lys Met His Leu Val Trp Tyr

195 200 205

Ser Leu Leu Gln Ser Ile Tyr Ser Thr Cys Ser Asn Ser Gly Arg Asp

210 215 220

Tyr Asp Lys Gln Ala Leu Leu Val Ala Ile Gly Leu Pro Ser Phe Val

225 230 235 240

Thr Lys Ala Ala Ile Asn Ala Arg Leu Lys Val Asn Asn Leu Leu Leu

245 250 255

Ser Tyr Tyr Lys Asn Gly Gly Asn His Glu Lys Gly Ala Ser Glu Ile

260 265 270

Ile Gln Gln Arg Ala Thr Tyr Leu Arg Lys Thr Gly Phe Thr Asp Asp

275 280 285

Asp Leu Ser His Met Glu Phe Met Ile Leu Trp Val Gly Val Thr Asn

290 295 300

Thr Ala Pro Val Leu Phe Trp Leu Phe Val His Val Leu Thr Ser Ala

305 310 315 320

Gly Tyr Thr Ser Arg Val Arg Ala Glu Ile Glu Ala Ile Thr Ile Ile

325 330 335

Thr Lys Thr Pro Glu Gly Arg Lys Ala Thr Phe Asp Thr Arg Leu Leu

340 345 350

Glu Lys Ser Cys Pro Phe Leu Asn Ala Cys Tyr Gln Glu Cys Leu Arg

355 360 365

His Tyr Ser His Ser Ile Gly Asn Arg Arg Val Met Gln Asp Thr Glu

370 375 380

Ile Gln Asp Ser Gln Gly Arg Lys Tyr Leu Leu Lys Lys Gly Val Asn

385 390 395 400

Val Gln Trp Pro Pro Pro Val Thr His Phe Asn Thr Glu Val Trp Gly

405 410 415

Gln Asp Ala Asp Val Phe Arg Pro Glu Arg Phe Met Asp Val Thr Pro

420 425 430

Gln Asp Glu Lys Lys Arg Arg Gly Ala Leu Leu Ser Phe Gly Gly Gly

435 440 445

Lys His Leu Cys Pro Gly Arg Lys Phe Ala Tyr Thr Glu Leu Leu Gly

450 455 460

Leu Val Gly Val Val Ala Leu Gly Phe Glu Val Lys Gly Leu Glu Leu

465 470 475 480

Pro Glu Ser Lys Tyr Ala Gly Ile Gly Ile Gly Gly Lys Met Pro Asp

485 490 495

Trp Glu Asn Met Glu Lys Gly Phe Gly Leu Arg Arg Arg Glu Gly Trp

500 505 510

Glu Asp Val Thr Trp Val Phe Asp Gly Asp Asn

515 520

<210> 28

<211> 5048

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 28

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gagtccatga taattactcc tgagatgaac tcaactttaa 1080

agatcgcgga tgtccaagcc cacgacttac ctttgcaaca caactttctg tcatacttgt 1140

ttggattgct aatcgccaca tatatagtat ggcagtattt cctgcgaact ggagtcacgg 1200

agtcagcttg ctccgagcct ccaatgctac cctattggat ccccgtggta ggtcatacct 1260

tcagtttctt gactaatact cataatacga taatgtcggg ccggagtcac ttcaaatcta 1320

taacacatcc cttctctctg ttgattggag gtagaaggac ttacgtagtc cttgacccgc 1380

actatattgg aaaggtgtac aagaaaacga aagatttggt tcatgagccg tttatagatc 1440

acttaatgat gtgcatcggg acaactcaaa aaacgaggga cataatgtgg aacacaatga 1500

tcggggactc cagtctaacc gattcggctc tcgattggct tagggaggaa gtctcccaat 1560

cgccttctag ccaaccattt ttcgacagat tcatgatgga attggatcat ggcctccagc 1620

aaggcgaccc gcttactacg gggcgacttc gggaacataa catgcttaag tttgttgaaa 1680

caattataat caccgtatca actaatagct tctttgggaa ggtgcttcta aaacaatctc 1740

cagaaattct tgactcgttt ccaatttttg accgacacgt ctggaagatg gtattccgcg 1800

caccaaaatt tactttcatg acggcacaca acgcgaaggg ttctgtcatc gacggtctta 1860

ctaaatattt tgatttacca caaagtgaga gacaggacgc cgcttctttt atccttaaaa 1920

gtgaggacgc aatgcgtgag aatggaatct gctcacggga gattgcggcc ctgctcttta 1980

aattcttttg gggcataaat ggcatgcccg cgacactggc cttctggttt cttgccagga 2040

ctgtctacac accacacctt tgggaggata tacgtgcaga ggtcgcaccg gcctttagga 2100

atggtattca ttcaccccca gacatagggt atttgaaaaa gtgcccaaaa ttaaacgcca 2160

ccttccacga aacgttacgc atccacggtg ggacggctgg atttaggcaa gtcgcgagtg 2220

ataccgtcat aggtggattt accttcaagg ccgggtccga cgttataatg ccgtaccggc 2280

aaatgcacct agatgagggg atctgggggc aggacgctaa gacttttgat attgatcgct 2340

ttattcataa cccgaaacta gctaccgcaa agacatttaa gccttttgga ggcggtgtaa 2400

cattgtgtcc aggacgcttc catgcgcacc gaactgctct gagctttatt gcgattgtta 2460

taacccgata cgacatccac gttgtgggcg gttgcgaatc gcgacccttc ccacatatga 2520

atacacgcgg accagaggtt ggtgttatat tcccagtctt ggagcaggtg ccacaaatta 2580

tagtaaaaaa tgttgacatt gaatgagtcg acctgcaaga tctgcggccg cgaattaatt 2640

cgccttagac atgactgttc ctcagttcaa gttgggcact tacgagaaga ccggtcttgc 2700

tagattctaa tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt 2760

tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc 2820

tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt gtggtagggg 2880

tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta 2940

cagaagatta agtgagacct tcgtttgtgc ggatccaatt aatatttact tattttggtc 3000

aaccccaaat aggttgattt catacttggt tcattcaaaa ataagtagtc ttttgagatc 3060

tttcaatatt ataataaata tactataaca gccgacttgt ttcattttcg cgaatgttcc 3120

cccagcttat cggatccccc acacaccata gcttcaaaat gtttctactc cttttttact 3180

cttccagatt ttctcggact ccgcgcatcg ccgtaccact tcaaaacacc caagcacagc 3240

atactaaatt tcccctcttt cttcctctag ggtgtcgtta attacccgta ctaaaggttt 3300

ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt cgaaaaaggc aataaaaatt 3360

tttatcacgt ttctttttct tgaaattttt ttttttagtt tttttctctt tcagtgacct 3420

ccattgatat ttaagttaat aaacggtctt caatttctca agtttcagtt tcatttttct 3480

tgttctatta caactttttt tacttcttgt tcattagaaa gaaagcatag caatctaatc 3540

taaggggcgg tgttgacaat taatcatcgg catagtatat cggcatagta taatacgaca 3600

aggtgaggaa ctaaaccatg gccaagttga ccagtgccgt tccggtgctc accgcgcgcg 3660

acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg gacttcgtgg 3720

aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc gcggtccagg 3780

accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg gacgagctgt 3840

acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg ccggccatga 3900

ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg gccggcaact 3960

gcgtgcactt cgtggccgag gagcaggact gacacgtccg acggcggccc acgggtccca 4020

ggcctcggag atccgtcccc cttttccttt gtcgatatca tgtaattagt tatgtcacgc 4080

ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 4140

gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 4200

tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat tatactgaaa 4260

accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcaagct ggagaccaac 4320

atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 4380

ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 4440

cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 4500

tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 4560

gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 4620

aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 4680

tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 4740

aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 4800

aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 4860

ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 4920

ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 4980

atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 5040

atgagatc 5048

<210> 29

<211> 1569

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 29

atggagtcca tgataattac tcctgagatg aactcaactt taaagatcgc ggatgtccaa 60

gcccacgact tacctttgca acacaacttt ctgtcatact tgtttggatt gctaatcgcc 120

acatatatag tatggcagta tttcctgcga actggagtca cggagtcagc ttgctccgag 180

cctccaatgc taccctattg gatccccgtg gtaggtcata ccttcagttt cttgactaat 240

actcataata cgataatgtc gggccggagt cacttcaaat ctataacaca tcccttctct 300

ctgttgattg gaggtagaag gacttacgta gtccttgacc cgcactatat tggaaaggtg 360

tacaagaaaa cgaaagattt ggttcatgag ccgtttatag atcacttaat gatgtgcatc 420

gggacaactc aaaaaacgag ggacataatg tggaacacaa tgatcgggga ctccagtcta 480

accgattcgg ctctcgattg gcttagggag gaagtctccc aatcgccttc tagccaacca 540

tttttcgaca gattcatgat ggaattggat catggcctcc agcaaggcga cccgcttact 600

acggggcgac ttcgggaaca taacatgctt aagtttgttg aaacaattat aatcaccgta 660

tcaactaata gcttctttgg gaaggtgctt ctaaaacaat ctccagaaat tcttgactcg 720

tttccaattt ttgaccgaca cgtctggaag atggtattcc gcgcaccaaa atttactttc 780

atgacggcac acaacgcgaa gggttctgtc atcgacggtc ttactaaata ttttgattta 840

ccacaaagtg agagacagga cgccgcttct tttatcctta aaagtgagga cgcaatgcgt 900

gagaatggaa tctgctcacg ggagattgcg gccctgctct ttaaattctt ttggggcata 960

aatggcatgc ccgcgacact ggccttctgg tttcttgcca ggactgtcta cacaccacac 1020

ctttgggagg atatacgtgc agaggtcgca ccggccttta ggaatggtat tcattcaccc 1080

ccagacatag ggtatttgaa aaagtgccca aaattaaacg ccaccttcca cgaaacgtta 1140

cgcatccacg gtgggacggc tggatttagg caagtcgcga gtgataccgt cataggtgga 1200

tttaccttca aggccgggtc cgacgttata atgccgtacc ggcaaatgca cctagatgag 1260

gggatctggg ggcaggacgc taagactttt gatattgatc gctttattca taacccgaaa 1320

ctagctaccg caaagacatt taagcctttt ggaggcggtg taacattgtg tccaggacgc 1380

ttccatgcgc accgaactgc tctgagcttt attgcgattg ttataacccg atacgacatc 1440

cacgttgtgg gcggttgcga atcgcgaccc ttcccacata tgaatacacg cggaccagag 1500

gttggtgtta tattcccagt cttggagcag gtgccacaaa ttatagtaaa aaatgttgac 1560

attgaatga 1569

<210> 30

<211> 522

<212> PRT

<213> 禾谷镰孢菌

<400> 30

Met Glu Ser Met Ile Ile Thr Pro Glu Met Asn Ser Thr Leu Lys Ile

1 5 10 15

Ala Asp Val Gln Ala His Asp Leu Pro Leu Gln His Asn Phe Leu Ser

20 25 30

Tyr Leu Phe Gly Leu Leu Ile Ala Thr Tyr Ile Val Trp Gln Tyr Phe

35 40 45

Leu Arg Thr Gly Val Thr Glu Ser Ala Cys Ser Glu Pro Pro Met Leu

50 55 60

Pro Tyr Trp Ile Pro Val Val Gly His Thr Phe Ser Phe Leu Thr Asn

65 70 75 80

Thr His Asn Thr Ile Met Ser Gly Arg Ser His Phe Lys Ser Ile Thr

85 90 95

His Pro Phe Ser Leu Leu Ile Gly Gly Arg Arg Thr Tyr Val Val Leu

100 105 110

Asp Pro His Tyr Ile Gly Lys Val Tyr Lys Lys Thr Lys Asp Leu Val

115 120 125

His Glu Pro Phe Ile Asp His Leu Met Met Cys Ile Gly Thr Thr Gln

130 135 140

Lys Thr Arg Asp Ile Met Trp Asn Thr Met Ile Gly Asp Ser Ser Leu

145 150 155 160

Thr Asp Ser Ala Leu Asp Trp Leu Arg Glu Glu Val Ser Gln Ser Pro

165 170 175

Ser Ser Gln Pro Phe Phe Asp Arg Phe Met Met Glu Leu Asp His Gly

180 185 190

Leu Gln Gln Gly Asp Pro Leu Thr Thr Gly Arg Leu Arg Glu His Asn

195 200 205

Met Leu Lys Phe Val Glu Thr Ile Ile Ile Thr Val Ser Thr Asn Ser

210 215 220

Phe Phe Gly Lys Val Leu Leu Lys Gln Ser Pro Glu Ile Leu Asp Ser

225 230 235 240

Phe Pro Ile Phe Asp Arg His Val Trp Lys Met Val Phe Arg Ala Pro

245 250 255

Lys Phe Thr Phe Met Thr Ala His Asn Ala Lys Gly Ser Val Ile Asp

260 265 270

Gly Leu Thr Lys Tyr Phe Asp Leu Pro Gln Ser Glu Arg Gln Asp Ala

275 280 285

Ala Ser Phe Ile Leu Lys Ser Glu Asp Ala Met Arg Glu Asn Gly Ile

290 295 300

Cys Ser Arg Glu Ile Ala Ala Leu Leu Phe Lys Phe Phe Trp Gly Ile

305 310 315 320

Asn Gly Met Pro Ala Thr Leu Ala Phe Trp Phe Leu Ala Arg Thr Val

325 330 335

Tyr Thr Pro His Leu Trp Glu Asp Ile Arg Ala Glu Val Ala Pro Ala

340 345 350

Phe Arg Asn Gly Ile His Ser Pro Pro Asp Ile Gly Tyr Leu Lys Lys

355 360 365

Cys Pro Lys Leu Asn Ala Thr Phe His Glu Thr Leu Arg Ile His Gly

370 375 380

Gly Thr Ala Gly Phe Arg Gln Val Ala Ser Asp Thr Val Ile Gly Gly

385 390 395 400

Phe Thr Phe Lys Ala Gly Ser Asp Val Ile Met Pro Tyr Arg Gln Met

405 410 415

His Leu Asp Glu Gly Ile Trp Gly Gln Asp Ala Lys Thr Phe Asp Ile

420 425 430

Asp Arg Phe Ile His Asn Pro Lys Leu Ala Thr Ala Lys Thr Phe Lys

435 440 445

Pro Phe Gly Gly Gly Val Thr Leu Cys Pro Gly Arg Phe His Ala His

450 455 460

Arg Thr Ala Leu Ser Phe Ile Ala Ile Val Ile Thr Arg Tyr Asp Ile

465 470 475 480

His Val Val Gly Gly Cys Glu Ser Arg Pro Phe Pro His Met Asn Thr

485 490 495

Arg Gly Pro Glu Val Gly Val Ile Phe Pro Val Leu Glu Gln Val Pro

500 505 510

Gln Ile Ile Val Lys Asn Val Asp Ile Glu

515 520

<210> 31

<211> 5021

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 31

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960

cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020

aatttcacac agaattcatg gccacggatc ttgacctcgt gctgggaaaa agtcagtacg 1080

cattattttg tggcataact ttatttagct ttttcatact aaagtattcc cttctcggaa 1140

acgggggcaa gcaataccct tatatcaacc ccaagaaacc ctttgagctg tcgaaccagc 1200

gagtagtcca ggatttcatc gagaacgcac gagacattct tactaagggt cgctcacttt 1260

acaaggatac gccctacaag gcgcataccg atttagggga cgtcctcgta atcccgcccg 1320

agtttgccga cgctctcaag tccgaaagac agcttgactt taccgaggtc gcgagagacg 1380

atactcacgg ttacattcct ggattcgagc ccataggttc cccgttcgat ctggtgccgc 1440

tcgtcaacaa gtatcttaca agggcgttgg caaaactaac aaagccactg tgggccgaag 1500

cctcgttagg tgtaaaccat gttctgggca cgtctacgga gtggcatccc attaacccag 1560

gcgaagatat catgaggata gtctccagaa tgtcatccag aatattcatg ggtgaggaac 1620

tttgtaaaga tgacgattgg ctgaaagtgt cgattgagta cactgtgcag ctgtttcaaa 1680

ccgcagacga attacgtaac tatccacgtt ggacgcggcc ctatattcac tggttcttgc 1740

cttcctgtca gggggttcgt cgcaagttgc aggaggcgcg tgatttattg caaccccata 1800

ttgataggag aaatgcagtg aagaaagaag cgatcgctga aggtagaccc tcaccattcg 1860

acgattcaat agagtggttt gaaaatgagt acgagggcaa atctgatccc gccactgaac 1920

aaattaaact atcactggtg gcgattcaca caaccacgga cctcctgtct gaaaccatgt 1980

tcaatatagc tttgcagcca gaactccttg gtcccctacg tgaagagata gttacggttc 2040

tttccacgga aggtctaaaa aagacgtcgt tttacaattt gaagttgatg gattcggtca 2100

taaaggagtc acagcgactt cgacccgttc ttctcggtgc gttccgaaga atggcactcg 2160

ctgacgtaac cttgcccaat ggcgacgtaa taaagaaagg gaccaagatc atttgcgaca 2220

ctacacatca gtggaaccca gaatactatc ccgatgccag caagttcaat gcatatcggt 2280

ttctccaaat gagacagacg cccggtcagg acaaaagagc acaccttgtc agcacaagcc 2340

acgatcaaat ggggttcgga cacggcttgc acgcgtgccc aggccggttt ttcgcagcca 2400

atgagataaa gatagcgctg tgtcacatgc tattgaagta tgactggaag cttccagaag 2460

gtgttgtacc taagtctaag gccctcggca tgtccttact gggggaccgg gaagccaaac 2520

tgatggtcaa gaggagagca gccgaaatcg atatagacac tattgggagc gatgaatgag 2580

tcgacctgca agatctgcgg ccgcgaatta attcgcctta gacatgactg ttcctcagtt 2640

caagttgggc acttacgaga agaccggtct tgctagattc taatcaagag gatgtcagaa 2700

tgccatttgc ctgagagatg caggcttcat ttttgatact tttttatttg taacctatat 2760

agtataggat tttttttgtc attttgtttc ttctcgtacg agcttgctcc tgatcagcct 2820

atctcgcagc tgatgaatat cttgtggtag gggtttggga aaatcattcg agtttgatgt 2880

ttttcttggt atttcccact cctcttcaga gtacagaaga ttaagtgaga ccttcgtttg 2940

tgcggatcca attaatattt acttattttg gtcaacccca aataggttga tttcatactt 3000

ggttcattca aaaataagta gtcttttgag atctttcaat attataataa atatactata 3060

acagccgact tgtttcattt tcgcgaatgt tcccccagct tatcggatcc cccacacacc 3120

atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg actccgcgca 3180

tcgccgtacc acttcaaaac acccaagcac agcatactaa atttcccctc tttcttcctc 3240

tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga ccgcctcgtt 3300

tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt tcttgaaatt 3360

ttttttttta gtttttttct ctttcagtga cctccattga tatttaagtt aataaacggt 3420

cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt ttttacttct 3480

tgttcattag aaagaaagca tagcaatcta atctaagggg cggtgttgac aattaatcat 3540

cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atggccaagt 3600

tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc gagttctgga 3660

ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt gtggtccggg 3720

acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac aacaccctgg 3780

cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag gtcgtgtcca 3840

cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag ccgtgggggc 3900

gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc gaggagcagg 3960

actgacacgt ccgacggcgg cccacgggtc ccaggcctcg gagatccgtc ccccttttcc 4020

tttgtcgata tcatgtaatt agttatgtca cgcttacatt cacgccctcc ccccacatcc 4080

gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat ttattttttt 4140

atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt ttttctgtac 4200

agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt tttgggacgc 4260

tcgaaggctt taatttgcaa gctggagacc aacatgtgag caaaaggcca gcaaaaggcc 4320

aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 4380

catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 4440

caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 4500

ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 4560

aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 4620

gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 4680

cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 4740

ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 4800

tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 4860

tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 4920

cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 4980

tggaacgaaa actcacgtta agggattttg gtcatgagat c 5021

<210> 32

<211> 1542

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 32

atggccacgg atcttgacct cgtgctggga aaaagtcagt acgcattatt ttgtggcata 60

actttattta gctttttcat actaaagtat tcccttctcg gaaacggggg caagcaatac 120

ccttatatca accccaagaa accctttgag ctgtcgaacc agcgagtagt ccaggatttc 180

atcgagaacg cacgagacat tcttactaag ggtcgctcac tttacaagga tacgccctac 240

aaggcgcata ccgatttagg ggacgtcctc gtaatcccgc ccgagtttgc cgacgctctc 300

aagtccgaaa gacagcttga ctttaccgag gtcgcgagag acgatactca cggttacatt 360

cctggattcg agcccatagg ttccccgttc gatctggtgc cgctcgtcaa caagtatctt 420

acaagggcgt tggcaaaact aacaaagcca ctgtgggccg aagcctcgtt aggtgtaaac 480

catgttctgg gcacgtctac ggagtggcat cccattaacc caggcgaaga tatcatgagg 540

atagtctcca gaatgtcatc cagaatattc atgggtgagg aactttgtaa agatgacgat 600

tggctgaaag tgtcgattga gtacactgtg cagctgtttc aaaccgcaga cgaattacgt 660

aactatccac gttggacgcg gccctatatt cactggttct tgccttcctg tcagggggtt 720

cgtcgcaagt tgcaggaggc gcgtgattta ttgcaacccc atattgatag gagaaatgca 780

gtgaagaaag aagcgatcgc tgaaggtaga ccctcaccat tcgacgattc aatagagtgg 840

tttgaaaatg agtacgaggg caaatctgat cccgccactg aacaaattaa actatcactg 900

gtggcgattc acacaaccac ggacctcctg tctgaaacca tgttcaatat agctttgcag 960

ccagaactcc ttggtcccct acgtgaagag atagttacgg ttctttccac ggaaggtcta 1020

aaaaagacgt cgttttacaa tttgaagttg atggattcgg tcataaagga gtcacagcga 1080

cttcgacccg ttcttctcgg tgcgttccga agaatggcac tcgctgacgt aaccttgccc 1140

aatggcgacg taataaagaa agggaccaag atcatttgcg acactacaca tcagtggaac 1200

ccagaatact atcccgatgc cagcaagttc aatgcatatc ggtttctcca aatgagacag 1260

acgcccggtc aggacaaaag agcacacctt gtcagcacaa gccacgatca aatggggttc 1320

ggacacggct tgcacgcgtg cccaggccgg tttttcgcag ccaatgagat aaagatagcg 1380

ctgtgtcaca tgctattgaa gtatgactgg aagcttccag aaggtgttgt acctaagtct 1440

aaggccctcg gcatgtcctt actgggggac cgggaagcca aactgatggt caagaggaga 1500

gcagccgaaa tcgatataga cactattggg agcgatgaat ga 1542

<210> 33

<211> 513

<212> PRT

<213> 禾谷镰孢菌

<400> 33

Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu

1 5 10 15

Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu

20 25 30

Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro

35 40 45

Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala

50 55 60

Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr

65 70 75 80

Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe

85 90 95

Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala

100 105 110

Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser

115 120 125

Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu

130 135 140

Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn

145 150 155 160

His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu

165 170 175

Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly

180 185 190

Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr

195 200 205

Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg

210 215 220

Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val

225 230 235 240

Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp

245 250 255

Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser

260 265 270

Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys

275 280 285

Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His

290 295 300

Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln

305 310 315 320

Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser

325 330 335

Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp

340 345 350

Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ala

355 360 365

Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val

370 375 380

Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn

385 390 395 400

Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu

405 410 415

Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser

420 425 430

Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro

435 440 445

Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met

450 455 460

Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser

465 470 475 480

Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met

485 490 495

Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Thr Ile Gly Ser Asp

500 505 510

Glu

<210> 34

<211> 1280

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 34

gtacagaaga ttaaggcgcg ccgcaagcca agcctgcgaa gaatgtagtc gagaattgag 60

cttgcctcgt ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt 120

gacagtcttg acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc 180

atacatcccc atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc 240

aaaaattacg gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg 300

ttgaattgtc cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg 360

aggttcttct ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca 420

tccgaacata aacaaaaatg accactttgg atgatactgc ttacagatac agaacttctg 480

ttccaggtga tgctgaagct attgaagctt tggatggatc tttcaccact gatactgttt 540

tcagagtcac tgctactggt gatggattca ctttgagaga agttcctgtt gatcctcctt 600

tgaccaaagt ttttcctgat gatgaatctg atgatgaatc tgatgctggt gaagatggtg 660

atccagattc tagaactttt gttgcttatg gtgatgatgg tgatttggct ggatttgttg 720

ttgtttctta ttctggatgg aacagaagat tgactgttga agatattgaa gttgctccag 780

aacatagagg tcatggtgtt ggaagagctt tgatgggatt ggcaactgag tttgccagag 840

aaagaggtgc tggtcatctt tggttggaag tcaccaatgt caatgctcca gctattcatg 900

cttacagaag aatgggattc actctttgtg gattggatac tgctttgtat gatggaactg 960

cttctgatgg agaacaagct ttgtacatgt ccatgccatg tccttaaagt aactgacaat 1020

aaaaagattc ttgttttcaa gaacttgtca tttgtatagt ttttttatat tgtagttgtt 1080

ctattttaat caaatgttag cgtgatttat attttttttc gcctcgacat catctgccca 1140

gatgcgaagt taagtgcgca gaaagtaata tcatgcgtca atcgtatgtg aatgctggtc 1200

gctatactgc tgtcgattcg atactaacgc cgccatccag tgtcggatct gtgagcaaac 1260

ccgggcatgt gagcaaaagg 1280

<210> 35

<211> 807

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 35

gaattcatgg cccttcgaac gtccctatca cgacccgtac cgcttctggc tacacttact 60

gccagcgcaa tcggagtatc catattgtct aaaatgatgt tttcaacagc aagtgcagag 120

agtccatctc cgcaaaaaat tttttccggt gcttttgctt ccgtaaaact cccgctgcat 180

tcaagtgaat acgagtccca tgacacaaag aggcttcgtt tcaaacttcc gcaagagact 240

gcagtaacgg gtttaccgtt agcttacttg gttcacattc caccgtccca ccatcaaagg 300

gacttgacta cgccggatga acctggatac atggacctgt tggtaaagaa ataccccaaa 360

ggccagggct cgacatatct acactccctc cagcccggtg atacgttatc cttcacatct 420

ctacccctca aaccagcttg gaaaacaaac aattttcctc acatcactct tatagctgga 480

gggtgtggga tcacgccatt attcaacttg gctcaaggga tacttagaga tccggccgaa 540

aaaactagga tgacctttat ttttggtgca cgatcagacg aggacgtatt actgaaaaag 600

gagttagatg gctttgcaaa agagttcccg gaaagattcg aggtgaaata tacagcactt 660

ttggaagagg tcctaggggg cgtgggtcgt gatactaagg tctttgtctg tgggccgaag 720

gagatggaaa aggcacttgt aggaggccgt ggcgtattaa aggaaatagg cttcgaaaag 780

tctcagatcc atactttttg agtcgac 807

<210> 36

<211> 1554

<212> DNA

<213> 人工序列

<220>

<223> 合成DNA

<400> 36

gaattcatgg ccacggatct tgacctcgtg ctgggaaaaa gtcagtacgc attattttgt 60

ggcataactt tatttagctt tttcatacta aagtattccc ttctcggaaa cgggggcaag 120

caataccctt atatcaaccc caagaaaccc tttgagctgt cgaaccagcg agtagtccag 180

gatttcatcg agaacgcacg agacattctt actaagggtc gctcacttta caaggatacg 240

ccctacaagg cgcataccga tttaggggac gtcctcgtaa tcccgcccga gtttgccgac 300

gctctcaagt ccgaaagaca gcttgacttt accgaggtcg cgagagacga tactcacggt 360

tacattcctg gattcgagcc cataggttcc ccgttcgatc tggtgccgct cgtcaacaag 420

tatcttacaa gggcgttggc aaaactaaca aagccactgt gggccgaagc ctcgttaggt 480

gtaaaccatg ttctgggcac gtctacggag tggcatccca ttaacccagg cgaagatatc 540

atgaggatag tctccagaat gtcatccaga atattcatgg gtgaggaact ttgtaaagat 600

gacgattggc tgaaagtgtc gattgagtac actgtgcagc tgtttcaaac cgcagacgaa 660

ttacgtaact atccacgttg gacgcggccc tatattcact ggttcttgcc ttcctgtcag 720

ggggttcgtc gcaagttgca ggaggcgcgt gatttattgc aaccccatat tgataggaga 780

aatgcagtga agaaagaagc gatcgctgaa ggtagaccct caccattcga cgattcaata 840

gagtggtttg aaaatgagta cgagggcaaa tctgatcccg ccactgaaca aattaaacta 900

tcactggtgg cgattcacac aaccacggac ctcctgtctg aaaccatgtt caatatagct 960

ttgcagccag aactccttgg tcccctacgt gaagagatag ttacggttct ttccacggaa 1020

ggtctaaaaa agacgtcgtt ttacaatttg aagttgatgg attcggtcat aaaggagtca 1080

cagcgacttc gacccgttct tctcggtgcg ttccgaagaa tggcactcgc tgacgtaacc 1140

ttgcccaatg gcgacgtaat aaagaaaggg accaagatca tttgcgacac tacacatcag 1200

tggaacccag aatactatcc cgatgccagc aagttcaatg catatcggtt tctccaaatg 1260

agacagacgc ccggtcagga caaaagagca caccttgtca gcacaagcca cgatcaaatg 1320

gggttcggac acggcttgca cgcgtgccca ggccggtttt tcgcagccaa tgagataaag 1380

atagcgctgt gtcacatgct attgaagtat gactggaagc ttccagaagg tgttgtacct 1440

aagtctaagg ccctcggcat gtccttactg ggggaccggg aagccaaact gatggtcaag 1500

aggagagcag ccgaaatcga tatagacact attgggagcg atgaatgagt cgac 1554

<210> 37

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 37

aatttttgaa aattcgaatt catggccctt cgaacgtc 38

<210> 38

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 38

ttgtaatcca tcgatactag ttcaaaaagt atggatctga gacttttcga agc 53

<210> 39

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 39

ctatagggcc cgggcgtcga catggccacg gatcttgac 39

<210> 40

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 40

gctagccgcg gtaccaagct ttcattcatc gctcccaata gtgtctatat cgatttcgg 59

Claims

1.一种将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法，包括在酵母或其提取物或裂解物的存在下，将所述LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触，其中所述7β-羟化酶系统对所述酵母而言是非天然的。

2.根据权利要求1所述的方法，其中所述酵母选自酵母属和毕赤酵母属。

3.根据权利要求1所述的方法，其中所述酵母选自酿酒酵母和巴斯德毕赤酵母。

4.根据权利要求1所述的方法，其中所述酵母或其提取物或裂解物由对所述生物体而言外源的7β-羟化酶系统转化。

5.根据权利要求4所述的方法，其中所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶，所述CYP酶对所述酵母而言是非天然的，并且所述CPR酶对所述酵母而言可以是天然的或非天然的。

6.根据权利要求5所述的方法，其中所述CYP酶由CYP编码核酸序列编码，所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

7.根据权利要求5或6所述的方法，其中所述CPR酶由CPR编码核酸序列编码，所述CPR编码核酸序列选自SEQ ID NO.2和SEQ ID NO.5，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

8.根据权利要求5所述的方法，其中所述CYP酶包含CYP氨基酸序列，所述CYP氨基酸序列选自SEQ ID NO.9、SEQ ID NO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ IDNO.24、SEQ ID NO.27、SEQ ID NO.30或SEQ ID NO.33，或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

9.根据权利要求5或8所述的方法，其中所述CPR酶包含CPR氨基酸序列，所述CPR氨基酸序列选自SEQ ID 3和SEQ ID.6，或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

10.根据权利要求1所述的方法，其中所述7β-羟化酶系统包含P450 7β-羟化酶(“CYP”)，其天然存在于禾谷镰孢菌(F.graminearum)或玉米赤霉菌(Gibberella zeae)、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中。

11.根据权利要求8所述的方法，其包括将所述LCA或其羧酸酯、羧酸酰胺或羧酸盐与所述7β-羟化酶系统接触，以产生UDCA或其羧酸酯、羧酸酰胺或羧酸盐。

12.根据权利要求8所述的方法，其包括将所述3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与所述7β-羟化酶系统接触，以产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。

13.根据权利要求12所述的方法，其还包括将所述3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐还原成UDCA或其羧酸酯、羧酸酰胺或羧酸盐。

14.根据权利要求11、12或13所述的方法，其还包括从所述7β-羟化酶系统中分离所述UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。

15.根据权利要求11、12或13所述的方法，其中所述UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐基本上以纯的非对映异构体的形式产生。

16.根据权利要求11、12或13所述的方法，其在约15℃至约75℃的温度下进行。

17.根据权利要求11、12或13所述的方法，其在约pH 5至约pH 9的pH下进行。

18.根据前述权利要求中任一项所述的方法，其中所述LCA或3-KCA与所述7β-羟化酶系统的重量比为约10∶1至200∶1。

19.一种质粒，其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQ ID NO.32的核酸序列；或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

20.根据权利要求19所述的质粒，其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17和SEQ ID NO.20的核酸序列；或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

21.根据权利要求19所述的质粒，其包含选自SEQ ID NO.23、SEQ ID NO.26或SEQ IDNO.29的核酸序列；或与任何前述序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

22.根据权利要求19所述的质粒，其包含选自SEQ ID NO.32的核酸序列，或与SEQ IDNO.32具有至少85％、90％、95％、98％或99％同一性的核酸序列。

23.根据权利要求19至22中任一项所述的质粒，其处于AOX1启动子和AOX1终止子序列的控制下。

24.一种生物体，其由CYP编码核酸序列转化，所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ IDNO.26、SEQ ID NO.29和SEQ ID NO.32；或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

25.根据权利要求24所述的生物体，其由CYP编码核酸序列转化，所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17和SEQ ID NO.20，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

26.根据权利要求24所述的生物体，其由CYP编码核酸序列转化，所述CYP编码核酸序列选自SEQ ID NO.23、SEQ ID NO.26和SEQ ID NO.29，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

27.根据权利要求24所述的生物体，其由CYP编码核酸序列转化，所述CYP编码核酸序列选自SEQ ID NO.32，或与SEQ ID NO.32具有至少85％、90％、95％、98％或99％同一性的核酸序列。

28.根据权利要求24至27中任一项所述的生物体，其进一步由CPR编码核酸序列转化，所述CPR编码核酸序列包含SEQ ID NO.2或SEQ ID NO.5，或与任何前述核酸序列具有至少85％、90％、95％、98％或99％同一性的核酸序列。

29.根据权利要求24至27中任一项所述的生物体，其中所述生物体是酵母，优选酵母属或毕赤酵母属，更优选酿酒酵母或巴斯德毕赤酵母。

30.一种反应混合物，其包含：(i)LCA或3-KCA，(ii)酵母或其提取物或裂解物，(iii)7β-羟化系统。

31.根据权利要求30所述的反应混合物，其中所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶，其中所述CYP酶包含选自SEQ ID NO.9、SEQ IDNO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ ID NO.24、SEQ ID NO.27、SEQ IDNO.30或SEQ ID NO.33的氨基酸序列；或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

32.根据权利要求30或31所述的反应混合物，其中所述CPR酶包含选自SEQ ID NO.3和SEQ ID NO.6的氨基酸序列，或与任何前述氨基酸序列具有至少85％、90％、95％、98％或99％同一性的氨基酸序列。

33.根据权利要求30或31所述的反应混合物，其中所述酵母是酵母属或毕赤酵母属，更优选酿酒酵母或巴斯德毕赤酵母。

34.一种反应混合物，其包含酵母和7β-羟化系统，所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶，其中所述CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。

35.根据权利要求34所述的反应混合物，还包含LCA或3-KCA。