CN116670147A - 将lca和3-kca转化为udca和3-kudca的酶促方法 - Google Patents

将lca和3-kca转化为udca和3-kudca的酶促方法 Download PDF

Info

Publication number
CN116670147A
CN116670147A CN202180080103.1A CN202180080103A CN116670147A CN 116670147 A CN116670147 A CN 116670147A CN 202180080103 A CN202180080103 A CN 202180080103A CN 116670147 A CN116670147 A CN 116670147A
Authority
CN
China
Prior art keywords
seq
leu
ala
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180080103.1A
Other languages
English (en)
Inventor
J·G·里德
J·P·雷迪
B·J·保罗
U·谢尔
M·格雷戈里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shashan No1 Co ltd
Original Assignee
Shashan No1 Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shashan No1 Co ltd filed Critical Shashan No1 Co ltd
Publication of CN116670147A publication Critical patent/CN116670147A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/06Hydroxylating
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • C12Y114/14001Unspecific monooxygenase (1.14.14.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了7β‑羟化系统,以及由此类系统产生石胆酸和3‑酮基‑石胆酸的7β‑羟基衍生物的方法。本发明还提供了用于产生此类酶系统的重组生物体,以及编码此类酶的质粒。

Description

将LCA和3-KCA转化为UDCA和3-KUDCA的酶促方法
技术领域
本发明涉及7β-羟化系统,以及由此类系统产生石胆酸和3-酮基-5β-胆烷酸的7β-羟基衍生物的方法。本发明还涉及用于产生此类酶系统的重组生物体,以及编码此类酶的质粒。
背景技术
熊去氧胆酸(UDCA)是一种常用于治疗胆囊炎的有价值的胆汁酸,因为它可以溶解胆固醇结石,而副作用比鹅去氧胆酸(CDCA)更少。UDCA还具有抗炎特性,用于治疗囊性纤维化和肝脏疾病,如原发性胆管炎。UDCA的主要天然来源是各种熊的胆汁。
UDCA也可以由胆酸(CA)或CDCA产生,其也可以从动物胆汁中获得。Eggert等人(2014)报道了一条从CA开始形成CDCA的合成路线,分为5个步骤,包括Wolff-Kishner酮还原和C7差向异构化以产生UDCA。T.Eggert,D.Bakonyi,W.Hummel,J.Biotechnol.2014,191,11-21。Zheng等人(2015)报道了一条基于将CDCA生物催化差向异构化为UDCA的较短合成路线。M.-M.Zheng,R.-F.Wang,C.-X.Li,J.-H.Xu,Process Biochem.2015,50,598-604.
7β-羟化酶系统与细胞膜的结合是生物催化系统的一个特殊挑战。事实上,Durairaj等人(2016)报道了P450nor是迄今为止发现的唯一可溶性真菌CYP,并且它进行反硝化作用。Durairaj等人,Microb Cell Fact(2016)15:125。Grobe等人(2020)报道了在全细胞真菌(诸如木贼镰孢菌(Fusarium equiseti))中,这项工作进一步复杂化,其中多种P450酶的作用导致副产物形成。S.Grobe,C.Badenhorst,T.Bayer等人,Angew.Chem.Int.Ed.10.1002/anie.202012675。
为了克服这些障碍,Grobe等人(2020)报道了在基于大肠杆菌(Escherichiacoli)的全细胞系统中,使用来自抗生链霉菌(Streptomyces antibioticus)的细胞色素P450单加氧酶CYP107D1(oleP)的变体从LCA形成UDCA,这种P450酶不需要与细胞膜结合。通过修饰将LCA转化为其6β-羟基衍生物MDCA的天然酶,作者能够主要改变羟基化的位置,使得UDCA优先于MDCA形成。然而,这种转化以非常低的生产率(24小时内最多67μM)和不完全的区域选择性(UDCA∶MDCA的比例最多为73∶27)进行。
因此,需要一种高效且多产的方法来选择性地将LCA和3-KCA转化为UDCA和3-KUDCA。一种理想的方法将提高产量,易于扩大规模,并且易于在商业生产中实施。现在需要的是用于商业规模的石胆酸或3-KCA的7β-羟化的有效的酶系统、方法和组分。
发明内容
在对各种用于羟基化LCA和3-KCA的工程化微生物系统进行了大量实验之后,包括用来自其他物种的天然7β-羟化系统转化的酵母进行的一系列实验,发明人意外地发现了经转化以表达7β-羟化酶活性的基于酵母的系统,其能够从LCA和3-KCA及其衍生物选择性地产生UDCA和3-KUDCA及其衍生物。因此,在第一个主要实施方案中,本发明提供了一种将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法,包含在酵母或其提取物或裂解物的存在下,将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触,其中7β-羟化酶系统对酵母而言是非天然的。
进一步的主要实施方案涉及用于产生本发明生物体的质粒。因此,在第二个主要实施方案中,本发明提供了一种质粒,其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQID NO.32的核酸序列,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
附加的实施方案涉及用于本发明方法的转化生物体。因此,在第三个主要实施方案中,本发明提供了一种转化生物体,其由CYP编码核酸序列转化而来,所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ IDNO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
更进一步的实施方案涉及在其中发生本发明的转化的反应混合物。因此,在第四个主要实施方案中,本发明提供了一种反应混合物,其包含:(i)LCA或3-KCA,(ii)酵母或其提取物或裂解物,(iii)7β-羟化系统。第五个主要实施方案提供了一种反应混合物,其包含酵母和7β-羟化系统,该7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶,其中CYP酶是一种天然存在于玉米赤霉菌(Gibberella zeae)、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。
本发明的附加优点部分在下面的描述中进行阐述,部分将从描述中显而易见,或者可以通过本发明的实践来了解。本发明的优点将通过所附权利要求中特别指出的元素和组合来实现和获得。应当理解,前面的一般描述和下面的详细描述都仅仅是示例性和解释性的,而并非对所要求保护的本发明的限制。
附图说明
附图并入本说明书并构成其一部分,示出了本发明的几个实施方案,并与说明书一起用于解释本发明的原理。
图1描绘了来自实施例17中所述实验的LCMS色谱图。图1A是提取的发酵液样品的TIC迹线。图1B是LCA标准品的TIC迹线。图1C是UDCA标准品的TIC迹线。
图2是从实施例17中所报道的发酵液样品中提取的UDCA(A)与UDCA可信标准品(B)的MS谱图的比较。
图3描绘了来自实施例18中所述实验的CMS色谱图。图3A是分离的UDCA的TIC迹线。图3B是UDCA标准品的TIC迹线。
图4是实施例18中报道的分离的UDCA(A)与UDCA可信标准品(B)的MS谱图的比较。
图5描绘了来自实施例18中所述实验的分离的UDCA的1H NMR谱图。
图6描述了来自实施例18中所述实验的分离的UDCA的13C NMR谱图。
图7描绘了来自实施例18中所述实验的可信UDCA的1H NMR谱图。
图8描绘了来自实施例18中所述实验的可信UDCA的13C NMR谱图。
图9描绘了来自实施例19中所述实验的LCMS色谱图。图9A是提取的发酵液样品的TIC迹线。图9B是提取的发酵液样品的m/z 389.3(3-KUDCA)的提取离子色谱图(EIC)。图9C是3-KUDCA标准品的TIC迹线。图9D是3-KCA标准品的TIC迹线。
图10是从实施例19中所报道的发酵液样品中提取的3-KUDCA(A)与3-KUDCA可信标准品(B)的MS谱图的比较。
图11描绘了来自实施例21中所述实验的LCMS色谱图。图11A是提取的发酵液样品的TIC迹线。图11B是提取的发酵液样品的m/z 391.3(UDCA)的提取离子色谱图(EIC)。图11C是UDCA标准品的TIC迹线。
图12是如实施例21中所报道的从发酵液样品(A)中提取的UDCA与UDCA可信标准品(B)的MS谱图的比较。
具体实施方式
术语定义和用途
如在本说明书和随后的权利要求中所使用的,单数形式“一个、一种(a、an)”和“该(the)”包括复数指示物,除非上下文中另有明确规定。
如在本说明书和随后的权利要求中所使用的,词语“包含(comprise)”及该词语的变体,诸如“包含(comprising)”和“包含(comprises)”,意指“包括但不限于”,并且不旨在排除例如其他添加剂、组分、整体或步骤。当一个元素被描述为包含多个组分、步骤或条件时,应当理解,该元素也可以被描述为包含此类多个组分、步骤或条件的任意组合,或者“由”多个此类组分、步骤或条件或其组合“组成”或“基本上由其组成”。
当通过分别指定范围的下限和范围的上限,或者指定特定的数值来给出范围时,应当理解,可以通过选择性地组合数学上可能的任何下限变量、上限变量和特定数值中的任一个来定义范围。以类似的方式,当范围被定义为从一个端点跨越到另一个端点时,该范围也将被理解为包括两个端点之间的跨度,并且不包括这两个端点。
当本文使用时,术语“约”将补偿化学工业中允许的以及该工业中产品固有的可变性,诸如由于制造变化和时间诱导的产品降解而导致的产品强度差异。在一个实施方案中,该术语允许±5%可变性或±10%可变性。
与本发明的组合物结合使用的短语“可接受的”是指此类组合物的分子实体和其他成分是生理上可耐受的,并且当施用于受试者(例如,哺乳动物,诸如人)时通常不会产生不良反应。
“编码序列”指编码蛋白质氨基酸序列的核酸部分(例如,基因)。
与“非自然存在的”、“非野生型的”、“非天然的”或“外源的”相反,“自然存在的”或“野生型的”或“天然的”指的是在自然界中发现的形式。例如,自然存在的或野生型多肽或多核苷酸序列是存在于生物体中的序列,其可以从自然界的来源中分离,并且没有被人为操作有意修饰。
当用于指例如细胞、核酸或多肽时,“重组体”是指材料或对应于该材料的自然或天然形式的材料,其已经以自然界中不存在的方式进行了修饰。非限制性实例包括,除此之外,重组细胞表达在细胞的天然(非重组)形式中未曾发现的基因,或者表达以不同水平表达的天然基因。
“序列同一性百分比”和“同源性百分比”在本文中可互换使用,是指多核苷酸和多肽之间的比较,并通过在比较窗口(comparison window)中比较两个最佳比对的序列来进行确定,其中多核苷酸或多肽序列在比较窗口中的部分与参考序列(不包含添加或缺失)相比将包含添加或缺失(即,空位(gap)),以实现两个序列的最佳比对。百分比的计算方法是:通过确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数量,得到匹配位置的数量,将匹配位置的数量除以比较窗口中位置的总数,并将结果乘以100,得到序列同一性的百分比。
本领域技术人员将理解,存在多种已建立的算法可用于比对两个序列。可以通过例如Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源算法、通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源比对算法、通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444的相似性搜索方法、通过这些算法的计算机化实现(GCG威斯康辛软件包中的GAP、BESTFIT、FASTA和TFASTA)或通过视觉检查(通常参见,CurrentProtocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols(Greene出版社和John Wiley&Sons出版社的合伙企业),(1995增补)(Ausubel))来进行用于比较的序列的最佳比对。适用于确定序列同一性百分比和序列相似性的算法的实例是BLAST和BLAST2.0算法,在Altschul等人,1990,J.Mol.Biol.215:403-410和Altschul等人,1977,NucleicAcids Res.3389-3402中分别进行了描述。
“参考序列”是指用作序列比较基础的确定序列。参考序列可以是更大序列的子集,例如全长基因或多肽序列的片段。通常,参考序列的长度为至少20个核苷酸或氨基酸残基、至少25个残基、至少50个残基、或核酸或多肽的全长。由于两个多核苷酸或多肽可能各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),并且(2)可能进一步包含两个序列之间不同的序列,因此通常通过在“比较窗口”中比较两个多核苷酸的序列来进行两个(或更多个)多核苷酸或多肽之间的序列比较,以鉴定和比较序列相似性的局部区域。
“比较窗口”是指至少约20个连续核苷酸位置或氨基酸残基的概念化片段,其中序列可与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中与参考序列(不包含添加或缺失)相比,比较窗口中的序列部分可包含20%或更少的添加或缺失(即,空位)以用于两个序列的最佳比对。比较窗口可以长于20个连续残基,并且任选包括30、40、50、100、150或200个或更长的窗口。
“基本同一性(substantial identity)”是指在包含至少90%、95%、98%或99%的参考序列的比较窗口中,与参考序列相比,多核苷酸或多肽序列具有至少80%序列同一性、至少85%序列同一性、至少90%序列同一性或至少95%序列同一性,更通常地至少98%或99%序列同一性。在应用于多肽的具体实施方案中,术语“基本同一性”是指在诸如通过GAP或BESTFIT程序使用默认空位权重进行最佳比对时,,两条多肽序列共享至少80%序列同一性、优选至少89%序列同一性、至少95%序列同一性或更多(例如,99%序列同一性)。优选地,不相同的残基位置因保守氨基酸取代而不同。
当本文提及细胞生物体时,应当理解为指野生型状态的生物体和修饰的生物体。因此,术语酵母包括自然界中自然存在的所有野生型酵母,以及使用重组技术产生的任何人造酵母。
术语“酵母”是指酵母纲、优选酵母菌目、优选酵母科的子囊菌门真菌。特别优选的酵母属于毕赤酵母属(Pichia)和酵母属(Saccharomyces),尤其是巴斯德毕赤酵母(Pichiapastoris)和酿酒酵母(Saccharomyces cerevisiae)。
3-KCA或3-酮基-5β-胆烷酸由以下化学结构表示:
LCA或石胆酸由以下化学结构表示:
3-KUDCA或7β-羟基-3-酮基-5β-胆烷酸由以下化学结构表示:
UDCA或熊去氧胆酸由以下化学结构表示:
如本文所用,羧酸“盐”是指所公开化合物的衍生物,其中通过将现有的酸部分转化成其盐的形式,而使母体化合物得以修饰。合适的盐的实例包括但不限于羧酸的酸性残基的碱金属盐或有机盐。本发明的盐包括例如由无毒无机或有机碱形成的母体化合物的常规无毒盐或季铵盐。本发明的盐可以由含有酸性部分的母体化合物通过常规化学方法合成。通常,可以通过使这些化合物的游离酸形式与化学计量量的适当碱在水或有机溶剂或两者的混合物中反应,来制备此类盐。
本文所用的“酯”优选指-COOR部分,其中R是任选取代的C1-20烷基,或任选取代的芳基。
如本文所用,术语“烷基”是指直链或支链的饱和烃基。烷基的实例包括甲基(Me)、乙基(Et)、丙基(例如,正丙基和异丙基)、丁基(例如,正丁基、异丁基、叔丁基)、戊基(例如,正戊基、异戊基、新戊基)等。在本发明的任何实施方案或子实施方案中,烷基可以含有1至约20、2至约20、1至约10、1至约8、1至约6、1至约4或1至约3个碳原子。
如本文所用,“芳基”是指单环或多环(例如,具有2、3或4个稠环)芳烃(包括杂芳烃),例如苯基、萘基、蒽基、菲基、茚满基、茚基等。在一些实施方案中,芳基具有6至约20个碳原子。
在本发明的任何实施方案或子实施方案中,任选被取代的部分可替代地定义为被0、1、2或3个独立选自卤素、OH、胺、C1-6烷基、C1-6烷氧基、C1-6羟烷基、CO(C1-6烷基)、CHO、CO2H、CO2(C1-6烷基)和C1-6卤代烷基的取代基取代。
如本文所用,酰胺优选指-C(O)N(R’)(R”)部分,其中R’和R”独立地为任选取代的C1-20烷基,或任选取代的芳基。可替代地,UDCA的羧酸酰胺可以是牛磺熊去氧胆酸(“TUDCA”)。
本发明的“P450 7β-羟化酶系统”是指能够羟基化LCA或K-LCA的7-H位的II类CYP酶系统。如Durairaj等人,Microb Cell Fact(2016)15:125中所讨论的,II类CYP酶系统包含两种整合膜蛋白:P450 7β-羟化酶(本文有时称为“CYP”)和细胞色素P450还原酶(本文有时称为“CPR”),其含有辅因子FAD和FMN,将两个电子从NAD(P)H递送至血红素部分。该系统还可以包含第三种蛋白质组分Cyt b5,它将第二个电子转移到氧化亚铁CYP。
主要实施方案的讨论
本发明的第一个主要实施方案提供了将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法,包含在酵母或其提取物或裂解物的存在下,将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触,其中7β-羟化酶系统对酵母而言是非天然的。
第二个主要实施方案提供了一种质粒,其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQ ID NO.32的核酸序列,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
第三个主要实施方案提供了一种生物体,其由CYP编码核酸序列转化,该CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
在第四个主要实施方案中,本发明提供了一种反应混合物,其包含:(i)LCA或3-KCA;(ii)酵母或其提取物或裂解物;和(iii)7β-羟化系统。
第五个主要实施方案提供了一种反应混合物,其包含酵母和7β-羟化系统,该7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶,其中CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。
子实施方案的讨论
如前所述,本发明优选在转化表达非天然7β-羟化系统的酵母存在下进行。酵母优选选自酵母属和毕赤酵母属,最优选选自酿酒酵母和巴斯德毕赤酵母。
本发明方法中使用的生物体将由非天然7β-羟化系统转化,该系统包含非天然P450 7β-羟化酶(“CYP”)酶和任选的非天然P450氧化还原酶(“CPR”)酶。尽管CPR酶对7β-羟化酶系统至关重要,但CPR酶对于生物体来说可能并非绝对必需的,因为酵母中天然存在的固有酶可能是足够的。
用于实施本发明的优选CYP酶由CYP编码核酸序列编码,该CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
编码CYP的核酸可以选自前述SEQ ID NO的任何一种或组合,并与本发明的任何CPR酶组合。在一个实施方案中,编码核酸序列选自SEQ ID 8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17和SEQ ID NO.20,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。在另一个实施方案中,核酸选自SEQ ID NO.23、SEQ ID NO.26或SEQ ID NO.29,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。在另一个实施方案中,核酸序列选自SEQ ID NO.32,或与SEQ ID NO.32具有至少85%、90%、95%、98%或99%同一性的核酸序列。
CYP酶优选包含CYP氨基酸序列,该CYP氨基酸序列选自SEQ ID NO.9、SEQ IDNO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ ID NO.24、SEQ ID NO.27、SEQ IDNO.30或SEQ ID NO.33,或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
CYP酶可以选自前述SEQ ID NO的任何一种或组合,并与本发明的任何CPR酶组合。在一个实施方案中,CYP酶包含SEQ ID NO.9、SEQ ID NO.12、SEQ ID NO.15、SEQ ID NO.18和SEQ ID NO.21,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。在另一个实施方案中,CYP酶包含SEQ ID NO.24、SEQ ID NO.27或SEQ ID NO.30,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。在另一个实施方案中,CYP酶包含SEQ ID NO.33,或与SEQ ID NO.33具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
编码本发明CYP酶的优选质粒优选包含选自SEQ ID NO.7、SEQ ID NO.10、SEQ IDNO.13、SEQ ID NO.16、SEQ ID NO.19、SEQ ID NO.22、SEQ ID NO.25、SEQ ID NO.28或SEQID NO.31的核酸序列,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
在一个实施方案中,编码CYP酶的质粒包含SEQ ID NO.7、SEQ ID NO.10、SEQ IDNO.13、SEQ ID NO.16或SEQ ID NO.19,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。在另一个实施方案中,编码CYP酶的质粒包含SEQ ID NO.22、SEQID NO.25或SEQ ID NO.28,或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。在另一个实施方案中,编码CYP酶的质粒包含SEQ ID NO.31,或与SEQ IDNO.31具有至少85%、90%、95%、98%或99%同一性的核酸序列。
在一个实施方案中,CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的蛋白质,并且该生物体被转化以表达此类蛋白质。
7β-羟化系统中的CPR酶可以天然存在于表达7β-羟化酶活性的生物体中,或由CPR编码核酸序列编码,该CPR编码核酸序列选自SEQ ID NO.2和SEQ ID NO.5,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。CPR酶优选包含CPR氨基酸序列,该CPR氨基酸序列选自SEQ ID NO.3和SEQ ID NO.6,或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
在一个实施方案中,通过将LCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触来实施本发明的方法,以产生UDCA或其羧酸酯、羧酸酰胺或羧酸盐。在另一个实施方案中,通过将3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触来实施本发明的方法,以产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。当产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐时,本发明的方法将任选地进一步包含将3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐还原成UDCA或其羧酸酯、羧酸酰胺或羧酸盐。
在优选的实施方案中,本发明的方法进一步包含从7β-羟化酶系统中分离UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。分离是指UDCA或3-KUDCA基本上不含7β-羟化酶系统以及产生UDCA或3-KUDCA的反应混合物。因此,当考虑任何残余反应混合物的重量时,UDCA或3-KUDCA的纯度至少为90%、至少95%、或至少98%。在特别优选的实施方案中,UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐基本上作为纯的非对映异构体产生。“基本上纯的非对映异构体”是指当考虑非对映异构体的7α-非对映体时,非对映异构体的纯度至少为90%、至少95%或至少98%。
工程化CYP和CPR酶
通过使编码CYP或CPR酶的遗传物质突变并鉴定表达具有所需性质的工程化酶的多核苷酸,可以获得与本文公开的酶序列性质不同的CYP和CPR酶。这些非天然存在的CYP和CPR酶可以通过各种众所周知的技术产生,诸如体外诱变或定向进化。在一些实施方案中,定向进化是产生工程化酶的有吸引力的方法,因为在编码多肽的整个基因中产生突变相对容易,并且使得能够获取先前突变的多核苷酸并使它们经受额外的诱变和/或重组循环以进一步改善所选酶性质。对整个基因进行诱变可以减少由于将变化限制在基因的有限区域而产生的偏差。它还可以增强受不同酶性质影响的酶的产生,因为酶的间隔较远的部分可能在酶功能的各个方面发挥作用。
在诱变和定向进化中,对编码自然存在或野生型CYP或CPR酶的亲本或参考多核苷酸进行诱变处理,例如随机诱变和重组,以将突变导入多核苷酸。突变的多核苷酸被表达和翻译,从而产生对多肽进行修饰的工程化CYP或CPR酶。如本文所用,“修饰”包括氨基酸取代、缺失和插入。可以将任何一种修饰或修饰的组合导入自然存在的具有酶活性的多肽中,以产生工程化酶,然后通过各种方法对其进行筛选,以鉴定在特定酶性质方面具有所需改善的多肽和相应的多核苷酸。
7-β羟化酶环境
CYP和CPR酶可以存在于细胞内、细胞培养基中、固定化底物上,或者以其他形式存在,诸如被重组设计用于表达该酶的细胞的裂解物和提取物,或者分离的制剂。术语“分离的多肽”是指基本上与其天然伴随的其他污染物分离的多肽,例如蛋白质、脂质和多核苷酸。该术语包括从其自然存在的环境或表达系统(例如,宿主细胞或体外合成)中去除或纯化的多肽。
在一些实施方案中,分离的CYP和CPR酶存在于基本上纯的多肽组合物中。术语“基本上纯的多肽”是指组合物中多肽种类是存在的主要种类(即,基于摩尔或重量,它比组合物中任何其他单个大分子种类更为丰富),并且当目标种类包含至少约50%摩尔或%重量的大分子种类时,通常是基本上纯化的组合物。通常,基本上纯的CYP和CPR酶组合物将包含组合物中存在的按摩尔或重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多的所有大分子物质。在一些实施方案中,目标物质被纯化至基本同质(即,通过常规检测方法不能在组合物中检测到污染物物质),其中组合物基本上由单一CYP和CPR大分子物质组成。溶剂种类、小分子(<500道尔顿)和元素离子种类不被认为是大分子种类。
编码多核苷酸
编码CYP和CPR酶的分离的多核苷酸可以以多种方式操作以提供该酶的表达。取决于表达载体,在将分离的多核苷酸插入载体之前对其进行操作可能是期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域众所周知的。指南参见Sambrook等人,2001,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory出版社;以及Current Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,2006年更新。
因此,在另一方面,本发明还涉及一种重组表达载体,其包含编码CYP和CPR酶多肽或其变体的多核苷酸,以及一个或多个表达调节区,诸如启动子和终止子、复制起点等,这取决于要将它们导入的宿主的类型。各种核酸和控制序列可以连接在一起以产生重组表达载体,该载体可以包括一个或多个方便的限制性位点,以允许在这些位点插入或取代编码多肽的核酸序列。在创建重组表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地进行重组DNA程序,并且可以引起多核苷酸序列的表达。载体的选择通常取决于载体与载体将被导入的宿主细胞的相容性。载体可以是线性或闭环质粒。
表达载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒、染色体外元件、小染色体或人工染色体。载体可以包含任何确保自我复制的手段。可替代地,载体可以是这样一种载体,当其被导入宿主细胞时,被整合到基因组中并与其被整合到其中的染色体一起复制。此外,可以使用单个载体或质粒,或者两个或更多个载体或质粒,它们一起含有将被导入宿主细胞基因组的总DNA。在特别优选的实施方案中,本发明的质粒或载体受AOX1启动子和AOX1终止子序列的控制。
术语“控制序列”在本文中被定义为包括对本发明多肽的表达是必要的或有利的所有组分。每个控制序列对于编码多肽的核酸序列可以是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子、转录和翻译终止信号以及核糖体结合位点(以终止翻译)。可以为控制序列提供接头,以便导入特定的限制性位点,从而促进控制序列与编码多肽的核酸序列的编码区的连接。
术语“可操作地连接”在本文中被定义为一种构型,其中控制序列被适当地置于相对于DNA序列的编码序列的位置,使得控制序列指导多核苷酸和/或多肽的表达。控制序列可以是合适的启动子序列。“启动子序列”是被宿主细胞识别以表达编码区的核酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何核酸序列,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
控制序列也可以是合适的转录终止子序列,即被宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3'末端。在所选宿主细胞中有功能的任何终止子都可以用于本发明。
用于表达CYP和CPR多肽的宿主细胞
在另一个方面,本发明提供了一种宿主细胞,其包含编码本发明的CYP和CPR酶的多核苷酸,该多核苷酸可操作地连接到一个或多个用于在宿主细胞中表达CYP和CPR酶的控制序列。用于表达由本发明表达载体编码的CYP和CPR酶的宿主细胞是本领域众所周知的,尤其包括本发明的酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母)。在一个特定的实施方案中,本发明的方法用表达CYP和CPR酶的全细胞或此类细胞的提取物或裂解物进行,其中全细胞或此类全细胞的提取物或裂解物选自巴斯德毕赤酵母和酿酒酵母。上述宿主细胞的适当培养基和生长条件是本领域众所周知的。
可以通过本领域已知的各种方法,将用于表达CYP和CPR酶的多核苷酸导入细胞。对于本文所述的酵母,典型的过程是通过转化(例如,电穿孔或氯化钙介导)或接合,或者有时是天然质体融合。将多核苷酸导入细胞的各种方法对技术人员来说是显而易见的。
反应条件
在进行本文所述的立体选择性羟化时,CYP和CPR酶可以以纯化的酶(包括固定化变体)、用编码酶的基因转化的全细胞和/或此类细胞的细胞提取物和/或裂解物的形式加入到反应混合物中。编码工程化CYP和CPR酶的基因可以单独或一起转化到宿主细胞中。
例如,在一些实施方案中,可以用编码CYP酶的基因转化一组宿主细胞,并且可以用编码CPR酶的基因转化另一组宿主细胞。两组转化的细胞可以以全细胞的形式、或以其衍生的裂解物或提取物的形式一起用于反应混合物中。在其他实施方案中,可以用编码工程化CYP和CPR酶的基因转化宿主细胞。
用编码CYP和CPR酶的基因转化的全细胞或其细胞提取物和/或裂解物可以以各种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的、固定化的等)或半固体(例如,粗糊)。细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)进行部分纯化,然后在冻干前进行脱盐程序(例如,超滤、透析等)。
羟化反应中使用的反应物的量通常根据所用的CYP和CPR酶底物的量而变化。以下指南可用于确定CYP和CPR酶的用量。通常,使用约50mg/L至约5g/L的羟化酶系统,以约1至20g/L的浓度使用甾醇底物。反应混合物中甾醇与羟化酶系统的重量比通常为约10∶1至200∶1。本领域普通技术人员将容易理解如何改变这些量,以将它们调整到期望的生产率水平和生产规模。
反应物的加入顺序并不重要。反应物可以同时一起加入到溶剂(例如,单相溶剂、双相水性共溶剂系统等)中,或者可替代地,一些反应物可以单独加入,以及一些反应物在不同的时间点一起加入。例如,羟化酶系统可以首先加入到溶剂中。然而,优选最后加入酶制剂。
进行本文所述的CYP和CPR酶催化反应的合适条件包括多种条件,包括在实验pH和温度下使CYP和CPR酶与甾醇底物接触,并例如使用本文提供的实施例中所述的方法检测产物。
本文所述的羟化酶催化反应通常在溶剂中进行。虽然水是最优选的,但是在某些情况下,可以单独或与水组合使用有机溶剂,诸如乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等,以及离子液体,诸如1-乙基4-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑六氟磷酸盐等。在优选的实施方案中,使用水性溶剂,包括水和水性助溶剂系统。溶剂系统优选大于50%、75%、90%、95%或98%的水,并且在一个实施方案中是100%的水。
在羟基化过程中,反应混合物的pH值可能会改变。通过在反应过程中加入酸或碱,可以将反应混合物的pH保持在所需的pH或所需的pH范围内。可替代地,可以通过使用包含缓冲液的溶剂来控制pH。维持所需pH范围的合适缓冲液是本领域已知的,包括例如磷酸盐缓冲液、三乙醇胺缓冲液等。也可以使用缓冲和添加酸或碱的组合。
羟基化通常在约15℃至约75℃的温度范围内进行。对于一些实施方案,反应在约20℃至约55℃的温度范围内进行。在又一些实施方案中,反应在约20℃至约45℃的温度范围内进行。该反应也可以在环境条件下进行。
通常允许反应进行,直到基本上完成或接近完成底物的羟化。可以使用已知方法通过检测底物和/或产物来监测底物到产物的羟化。合适的方法包括气相色谱法、HPLC等。反应混合物中生成的甾醇羟化产物的转化率通常大于约50%,也可以大于约60%,也可以大于约70%,也可以大于约80%,也可以大于90%,甚至可以大于约97%。
可以从反应混合物中回收羟化产物,并任选地使用本领域技术人员已知的方法进一步纯化。从羟化酶系统中分离的色谱技术包括反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱等。纯化特定甾醇的条件将部分取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素。产品纯化的优选方法包括提取到有机溶剂中,随后结晶。
实施例
在以下实施例中,已经努力确保数字(例如,数量、温度等)的准确性。但是应当考虑一些误差和偏差。提出以下实施例是为了向本领域普通技术人员提供关于如何进行和评估本文要求保护的方法的完整公开和描述,并且这些实施例旨在纯粹作为本发明的示例,而不旨在限制发明人认为是其发明的范围。
实施例1至15的一般方法
使用标准方法(Green和Sambrook,2012)进行DNA的分离、处理和操作,包括限制性酶消化、PCR、克隆技术和细菌细胞转化。例如,参见Green,M.R.,Sambrook,J.,2012.Molecular Cloning:A Laboratory Manual,第四版,4Lab版本.Cold Spring Harbor出版社,纽约冷泉港。
从商业供应商处订购合成DNA,诸如Eurofins Scientific SE(比利时布鲁塞尔)、Integrated DNA Technologies(爱荷华州科拉尔维尔)、Genewiz(布鲁克斯生命科学公司)(新泽西州南普莱恩菲尔德)或Twist Bioscience(加利福尼亚州旧金山)。如实施例中所述,在定制载体中提供基因。
培养基
2TY培养基含有16g/L细菌胰蛋白胨、10g/L酵母提取物和5g/L氯化钠,并通过高压灭菌。2TY琼脂还含有15g/L琼脂。
YPD培养基含有10g/L酵母提取物、10g/L细菌胰蛋白胨,并通过高压灭菌。使用前加入50mL/L的无菌40%葡萄糖储备液。YPD琼脂平板另外含有15g/L琼脂。
BMG含有100mM磷酸钾、pH 7.5、13.4g/L YNB、0.4mg/L生物素和1%甘油。
BMM含有100mM磷酸钾、pH 7.5、13.4g/L YNB、0.4mg/L生物素和1%甲醇。
BMMY培养基是通过将10g酵母提取物和10g细菌胰蛋白胨溶解在700ml dH2O中并通过高压灭菌来制备的。使用前加入100mL YNB储备液、2mL生物素储备液和100mL 100mM磷酸钾缓冲液(pH 6.0)。
YNB储备液由134g/L酵母氮碱和硫酸铵组成,不含氨基酸,并通过高压灭菌。
生物素原液由200mg/L生物素组成,使用0.2μm过滤器过滤灭菌。
材料
限制性酶购自新英格兰生物实验室(马萨诸塞州伊普斯威奇)或Promega公司(威斯康星州麦迪逊)。培养基组分、化学物质和PCR引物从MilliporeSigma(密苏里州圣路易斯)获得。Zeocin由Thermo Fisher Scientific(马萨诸塞州沃尔瑟姆)提供。
巴斯德毕赤酵母的转化
巴斯德毕赤酵母(Komagataella phaffi NRRL Y-11430/ATCC 76273,下文称为巴斯德毕赤酵母SAND101)在10mL YPD中于30℃以250转/分钟振荡生长过夜。该培养物用于接种500ml YPD至OD600为0.1,然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下以2000×g离心10分钟来收获细胞,并重悬于补充有20ml 1M HEPES(pH 8.0)和2.5ml1M DTT的100ml YPD中。细胞于30℃孵育15分钟,不振荡。加入冷dH2O至最终体积为500ml,并通过在4℃下以2000×g离心10分钟来收获细胞。用250ml冷dH2O洗涤细胞,并通过在4℃下以2000×g离心10分钟来收获细胞。用20ml冷的1M山梨醇洗涤细胞,并通过在4℃下以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng DNA加入到40μl感受态细胞中,并转移到2mm间隙的电穿孔比色皿中,在冰上预冷。使用1500V、200Ω、25μF设置,在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1ml冷的1M山梨醇,并将混合物转移到无菌Eppendorf管中。细胞于30℃再生,以250转/分钟振荡至少30分钟。然后将细胞涂布于含有适当抗生素的YPD琼脂平板上,然后于30℃孵育2天或直至菌落变得可见。
实施例1:构建能够表达SEQ ID NO.2(FGSG_04903)的巴斯德毕赤酵母菌株
质粒pSAND102是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.1。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.2的基因,编码序列为SEQ ID NO.3的P450还原酶,受AOX1启动子控制,随后是AOX1终止子序列。AOX1启动子含有一个独特的PmeI限制性位点,允许质粒pSAND102线性化。
质粒pSAND102用限制性内切酶PmeI线性化。从反应混合物中纯化线性化的质粒,例如使用市售的柱纯化试剂盒。用PmeI线性化的质粒pSAND102转化巴斯德毕赤酵母SAND101菌株的电感受态细胞,使其能够在AOX1启动子处整合到基因组中。将转化体铺板于含有100μg/ml诺尔丝菌素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND102。
实施例2:构建能够表达SEQ ID NO.5(FGSG_03175)的巴斯德毕赤酵母菌株
质粒pSAND103是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.4。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.5的基因,编码序列为SEQ ID NO.6的P450还原酶,受AOX1启动子控制,随后是AOX1终止子序列。AOX1启动子含有一个独特的PmeI限制性位点,允许质粒pSAND103线性化。
质粒pSAND103用限制性内切酶PmeI线性化。从反应混合物中纯化线性化的质粒,例如使用市售的柱纯化试剂盒。用PmeI线性化的质粒pSAND103转化巴斯德毕赤酵母SAND101菌株的电感受态细胞,使其能够在AOX1启动子处整合到基因组中。将转化体铺板于含有100μg/ml诺尔丝菌素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND103。
实施例3:构建能够表达SEQ ID NO.8(FGSG_05333)的毕赤酵母菌株
质粒pSAND104是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.7。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.8的基因,编码序列为SEQ ID NO.9的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND104转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素(zeocin)的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND104。
用质粒pSAND104转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND105。
实施例4:构建能够表达SEQ ID NO.11(FGSG_02672)的巴斯德毕赤酵母菌株
质粒pSAND105是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.10。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.11的基因,编码序列为SEQ ID NO.12的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND105转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND106。
用质粒pSAND105转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND107。
实施例5:构建能够表达SEQ ID NO.14(FGSG_10695)的巴斯德毕赤酵母菌株
质粒pSAND106是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.13。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.14的基因,编码序列为SEQ ID NO.15的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND106转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND108。
用质粒pSAND106转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND109。
实施例6:构建能够表达SEQ ID NO.17(P450 51(1)-FGSG_04092)的巴斯德毕赤酵母菌株
质粒pSAND107是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.16。简而言之,它包含AOX1启动子序列,随后是序列为SEQ ID NO.17的基因,编码序列为SEQ ID NO.18的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND107转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND110。
用质粒pSAND107转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND111。
实施例7:构建能够表达SEQ ID NO.20(P450 51(2)-FGSG_01000)的巴斯德毕赤酵母菌株
质粒pSAND108是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.19。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.20的基因,编码序列为SEQ ID NO.21的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND108转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND112。
用质粒pSAND108转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND113。
实施例8:构建能够表达SEQ ID NO.23(FGRAMPH1_01T05089)的毕赤酵母菌株
质粒pSAND109是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.22。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.23的基因,编码序列为SEQ ID NO.24的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND109转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND114。
用质粒pSAND109转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND115。
实施例9:构建能够表达SEQ ID NO.26(FGRAMPH1_01T09325)的毕赤酵母菌株
质粒pSAND110是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.25。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.26的基因,编码序列为SEQ ID NO.27的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND110转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND116。
用质粒pSAND110转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND117。
实施例10:构建能够表达SEQ ID NO.29(FGRAMPH1_01T21239)的毕赤酵母菌株
质粒pSAND111是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.28。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.29的基因,编码序列为SEQ ID NO.30的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND111转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND118。
用质粒pSAND111转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND119。
实施例11:构建能够表达SEQ ID NO.32(FGSG_02672V2)的巴斯德毕赤酵母菌株
质粒pSAND112是从商业供应商处获得的合成DNA,其序列为SEQ ID NO.31。简而言之,它含有AOX1启动子序列,随后是序列为SEQ ID NO.32的基因,编码序列为SEQ ID NO.33的P450,受AOX1启动子控制,随后是AOX1终止子序列。
用质粒pSAND112转化巴斯德毕赤酵母SAND102菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株命名为巴斯德毕赤酵母SAND120。
用质粒pSAND112转化巴斯德毕赤酵母SAND103菌株的电感受态细胞,将其铺板于含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD琼脂上,并于30℃孵育直至菌落变得可见。所得菌株被命名为巴斯德毕赤酵母SAND121。
实施例12:P450和P450还原酶基因在巴斯德毕赤酵母菌株巴斯德毕赤酵母SAND104-巴斯德毕赤酵母SAND121中的表达
通过使用标准方法诱导基因表达,测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将石胆酸转化为熊去氧胆酸。在一种此类方法中,用菌株的新鲜单菌落接种含有100μg/ml诺尔丝菌素和100μg/ml博来霉素的YPD培养基,并于30℃以250转/分钟振荡孵育过夜。用1/10体积的过夜培养物接种含有2mM氨基乙酰丙酸、100μl/ml诺尔丝菌素和100μg/ml博来霉素的新鲜BMMY培养基,并于30℃以250转/分钟振荡孵育,直到OD600达到1.0。加入甲醇至终浓度为0.5%(v/v),加入石胆酸至终浓度为1mM,并于30℃以250转/分钟振荡2-3天继续孵育。
使用标准方法从发酵液中提取包括UDCA在内的产物,诸如在X.Ma,和X.Cao,Bioresources and Bioprocessin第1卷,文章编号:5(2014)以及F.Tonin和I.Arends,Beilstein J Org Chem.2018;14:470–483中描述的那些。在一种方法中,将培养物提取到等体积的乙酸乙酯中,通过加入酸将pH调节到小于4,分离乙酸乙酯相,然后蒸发除去溶剂,然后使用色谱法纯化目的甾醇。
实施例13:使用在BMG培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行LCA转化
通过使用标准方法诱导基因表达,测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将石胆酸转化为熊去氧胆酸,诸如W.Lu,J.Feng,X.Chen等人,2019Appl.Environ.Microbiol.85,e01182-19中所描述的那样。在该方法中,用菌株的新鲜单菌落接种25ml BMG培养基,并于30℃以250转/分钟振荡孵育至OD600为10。通过以4000×g离心5分钟来收获细胞,并悬浮在含有2mM氨基乙酰丙酸的BMM培养基中至OD600为1.0。培养物于20℃以250转/分钟的速度振荡孵育,每24小时加入甲醇(1%v/v),持续5天。
通过以4000×g离心5分钟来收获细胞,并重悬于30ml的50mM磷酸钾缓冲液(pH7.5,含有2mM氨基乙酰丙酸和1mM石胆酸)中。每24小时加入甲醇(1%v/v),于30℃以200转/分钟振荡孵育细胞悬浮液3天。
使用标准方法从发酵液中提取包括UDCA在内的产物,诸如在X.Ma,和X.Cao,Bioresources and Bioprocessin第1卷,文章编号:5(2014)以及F.Tonin和I.Arends,Beilstein J Org Chem.2018;14:470–483中描述的那些。在一种方法中,将培养物提取到等体积的乙酸乙酯中,通过加入酸将pH调节到小于4,分离乙酸乙酯相,然后蒸发除去溶剂,然后使用色谱法纯化目的甾醇。
实施例14:使用在YPD培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行3-KCA转化
通过使用标准方法诱导基因表达,测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将3-酮基-5-β-胆烷酸(3-KCA)转化为3-酮基-7-β-羟基-5-β-胆烷酸(3-KUDCA)。在一种此类方法中,用菌株的新鲜单菌落接种含有100μl/ml诺尔丝菌素和100μg/ml博来霉素的YPD培养基,并于30℃以250转/分钟振荡孵育过夜。用1/10体积的过夜培养物接种含有2mM氨基乙酰丙酸、100μl/ml诺尔丝菌素和100μg/ml博来霉素的新鲜BMMY培养基,并于30℃以250转/分钟振荡孵育,直到OD600达到1.0。加入甲醇至终浓度为0.5%(v/v),加入3-KCA至终浓度为1mM,并于30℃以250转/分钟振荡继续孵育2-3天。
使用标准方法从发酵液中提取包括3-KUDCA在内的产物。在一种方法中,将培养物提取到等体积的乙酸乙酯中,通过加入酸将pH调节到小于4,分离乙酸乙酯相,然后蒸发除去溶剂,然后使用色谱法纯化目的甾醇。
实施例15:使用在BMG培养基上生长的毕赤酵母菌株毕赤酵母SAND104-毕赤酵母SAND121的全细胞进行3-KCA转化
通过使用标准方法诱导基因表达,测试菌株巴斯德毕赤酵母SAND104、巴斯德毕赤酵母SAND105、巴斯德毕赤酵母SAND106、巴斯德毕赤酵母SAND107、巴斯德毕赤酵母SAND108、巴斯德毕赤酵母SAND109、巴斯德毕赤酵母SAND110、巴斯德毕赤酵母SAND111、巴斯德毕赤酵母SAND112、巴斯德毕赤酵母SAND113、巴斯德毕赤酵母SAND114、巴斯德毕赤酵母SAND115、巴斯德毕赤酵母SAND116、巴斯德毕赤酵母SAND117、巴斯德毕赤酵母SAND118、巴斯德毕赤酵母SAND119、巴斯德毕赤酵母SAND120和巴斯德毕赤酵母SAND121将3-KCA转化为3-KUDCA,诸如W.Lu,J.Feng,X.Chen等人,2019Appl.Environ.Microbiol.85,e01182-19中所描述的那样。在该方法中,用菌株的新鲜单菌落接种25ml BMG培养基,并于30℃以250转/分钟振荡孵育至OD600为10。通过以4000×g离心5分钟来收获细胞,并悬浮在含有2mM氨基乙酰丙酸的BMM培养基中至OD600为1.0。培养物于20℃以250转/分钟的速度振荡孵育,每24小时加入甲醇(1%v/v),持续5天。
通过以4000×g离心5分钟来收获细胞,并重悬于30ml 50mM磷酸钾缓冲液(pH7.5,含有2mM氨基乙酰丙酸和1mM 3-KCA)中。每24小时加入甲醇(1%v/v),于30℃以200转/分钟振荡孵育细胞悬浮液3天。
使用标准方法从发酵液中提取包括3-KUDCA在内的产物。在一种方法中,将培养物提取到等体积的乙酸乙酯中,通过加入酸将pH调节到小于4,分离乙酸乙酯相,然后蒸发除去溶剂,然后使用色谱法纯化目的甾醇。
实施例16至21的一般方法
培养提取物的分析
如实施例中所述对液体培养物进行溶剂提取后,在Agilent 1100HPLC上分析样品中UDCA和3-KUDCA的产生,Agilent 1100HPLC具有Waters XSelect CSH C18柱(2.1mm×50mm×3.5μm),该柱配有Waters VanGuard和Acquity在线柱过滤器,并于60℃操作。流动相由溶剂A(0.005M乙酸铵、0.012%甲酸)和溶剂B(95%甲醇、5%水、0.012%甲酸)组成,流速为1.0mL/分钟。在9.5分钟内运行从50%溶剂B到100%溶剂B的梯度。样品在212nm处进行UV分析,并使用以电喷雾负离子模式运行的Waters ZQ单四极杆质谱仪进行MS分析,质量范围m/z为150-500。
培养基
2TY培养基含有16g/L细菌胰蛋白胨、10g/L酵母提取物和5g/L氯化钠,并通过高压灭菌。2TY琼脂还含有15g/L琼脂。
合成葡萄糖基础培养基含有6.7g/L不含氨基酸的酵母氮碱、20g/L葡萄糖和1.3g/L缺陷型氨基酸粉末(amino acid dropout powder),并通过高压灭菌。合成葡萄糖基础琼脂培养基含有20g/L琼脂。
合成半乳糖基础培养基含有6.7g/L不含氨基酸的酵母氮基、20g/L半乳糖和1.3g/L缺陷型氨基酸粉末,并通过高压灭菌。合成半乳糖基础琼脂培养基含有20g/L琼脂。
巴斯德毕赤酵母的转化
巴斯德毕赤酵母(Komagataella phaffi NRRL Y-11430/ATCC 76273,下文称为巴斯德毕赤酵母SAND101)在10mL YPD中于30℃以250转/分钟振荡生长过夜。该培养物用于接种500ml YPD至OD600为0.1,然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下2000×g离心10分钟来收获细胞,并重悬于补充有20mL的1M HEPES(pH 8.0)和2.5mL的1M DTT的100mL YPD中。细胞于30℃孵育15分钟,不振荡。加入冷dH2O至最终体积为500mL,并通过在4℃下以2000×g离心10分钟来收获细胞。用250mL冷dH2O洗涤细胞,并通过在4℃下以2000×g离心10分钟来收获细胞。用20mL冷的1M山梨醇洗涤细胞,并通过在4℃以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng DNA加入到40μl感受态细胞中,并转移到2mm间隙的电穿孔比色皿中,在冰上预冷。使用1500V、200Ω、25μF设置,在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1mL冷的1M山梨醇,并将混合物转移到无菌Eppendorf管中。细胞于30℃再生,以250转/分钟振荡至少30分钟。然后将细胞涂布于含有适当抗生素的YPD琼脂平板上,然后于30℃孵育2天或直至菌落变得可见。
酿酒酵母的转化
酿酒酵母YPH499(Agilent)在10mLYPD中于30℃以250转/分钟的速度振荡生长过夜。该培养物用于接种500mL的YPD至OD600为0.1,然后于30℃以250转/分钟振荡孵育至OD600为1.3-1.5。通过在4℃下以2000×g离心10分钟来收获细胞,并重悬于补充有20mL的1M HEPES(pH 8.0)和2.5mL的1M DTT的100mL YPD中。细胞于30℃孵育15分钟,不振荡。加入冷dH2O至最终体积为500mL,并通过在4℃下以2000×g离心10分钟收获细胞。用250mL冷dH2O洗涤细胞,并通过在4℃下以2000×g离心10分钟来收获细胞。用20mL冷的1M山梨醇洗涤细胞,并通过在4℃下以2000×g离心10分钟来收获细胞。将细胞重悬于500μl冷的1M山梨醇中。将100ng的DNA加入到40μl感受态细胞中,并转移到2mm间隙的电穿孔比色皿中,在冰上预冷。使用1500V、200Ω、25μF设置,在BTRX ECM 630衰减波电穿孔系统上对细胞进行电穿孔。立即加入1ml冷的1M山梨醇,并将混合物转移到无菌Eppendorf管中。细胞于30℃再生,以250转/分钟振荡至少30分钟。然后将细胞涂布于尿嘧啶缺陷型合成葡萄糖基础琼脂培养基上,然后于30℃孵育3天或直至菌落变得可见。
实施例16:构建能够表达SEQ ID NO.2和SEQ ID NO.32的巴斯德毕赤酵母菌株
质粒pSAND101构建如下。质粒pPICHOLI-1(MoBiTec公司,德国)用限制性内切酶BsaI和PciI切割。SEQ ID NO.34作为合成DNA(Integrated DNA Technologies)订购,并通过注入克隆(Takara Bio)插入切割的pPICHOLI-1中,然后用标准方法转化大肠杆菌。将转化体铺板于含有100μg/mL诺尔丝菌素的2TY琼脂上。限制性消化证实了pSAND101的正确组装。
质粒pSAND102构建如下。质粒pSAND101用限制性内切酶EcoRI和SalI切割。SEQ IDNO.35作为合成DNA订购(Twist Bioscience),并用限制性内切酶EcoRI和SalI切割。按照标准方法,通过连接将消化的合成DNA插入切割的pSAND101中。将大肠杆菌转化体铺板于含有100μg/mL诺尔丝菌素的2TY琼脂上。限制性消化证实了pSAND102的正确组装。
质粒pSAND112构建如下。质粒pPICHOLI-1用限制性内切酶EcoRI和SalI切割。SEQID NO.36作为合成DNA订购(Twist Bioscience),并用限制性内切酶EcoRI和SalI切割。按照标准方法,通过连接将消化的合成DNA插入切割的pPICHOLI-1。将大肠杆菌转化体铺板于含有100μg/mL博来霉素的2TY琼脂上。限制性消化证实了pSAND112的正确组装。
质粒pSAND102通过用限制性酶PmeI消化而线性化。线性化的pSAND102被用于使用标准方法通过电穿孔转化毕赤酵母SAND101。所得菌株被标记为巴斯德毕赤酵母SAND102。
质粒pSAND112被用于使用标准方法通过电穿孔转化巴斯德毕赤酵母SAND102。所得菌株被标记为巴斯德毕赤酵母SAND121。
实施例17:通过巴斯德毕赤酵母SAND121将LCA生物转化为UDCA
毕赤酵母SAND121用于在250mL锥形瓶中接种补充有100μg/mL博来霉素的25mLBMG培养基,并于30℃以250转/分钟振荡孵育2天,用作种子培养物。
通过离心收获来自种子培养物的细胞,并用于在1L锥形瓶中接种含有2mM 5-氨基乙酰丙酸(5-ALA)的250mL BMM至OD595为1.0,并于20℃孵育5天,用作表达培养物。表达培养物以170转/分钟振荡1天,然后以250转/分钟振荡剩余4天。每天向表达培养物中加入浓度为1%v/v的甲醇。
通过离心从80mL表达培养物中收获细胞,悬浮在30mL过滤灭菌的pH为7.5的磷酸钾缓冲液中,并转移到250mL锥形瓶中。通过离心从80mL表达培养物中收获细胞,悬浮于30mL过滤灭菌的pH为9的磷酸钾缓冲液中,并转移至250mL锥形瓶中。向每个烧瓶中加入0.25mL的5-ALA水溶液(200mM)和含有38.8mg/mL LCA的0.35mL甲醇。用作生物转化培养物的两个烧瓶都于30℃以250转/分钟的速度振荡孵育。每天向生物转化培养物中加入0.35mL甲醇,然后继续孵育2天。然后向生物转化培养物中加入1.0mL甲醇,之后继续孵育3天。
从生物转化培养物中取出500μL样品,并用含有0.1%甲酸的等体积乙酸乙酯振荡45分钟进行提取。通过离心分离各相,并将20μL溶剂相转移到干净试管中并蒸发。将沉淀溶解在20μL甲醇中,在50%流动相溶液A和50%流动相溶液B的混合物中稀释10倍,并通过HPLC-MS进行分析(参见一般方法)。观察到与UDCA标准品平行运行时具有相同保留时间和质谱图的峰(参见图1和图2)。
将剩余的生物转化培养物发酵液转移到50mL Falcon试管中,并储存于-20℃,用于后续分离UDCA(参见实施例18)。
实施例18:分离UDCA并与实际标准品进行比较
将如实施例17所述储存于-20℃的生物转化培养物发酵液解冻,并以4500转/分钟离心15分钟。倾析所得100mL上清液,并用含有0.1%甲酸的等体积乙酸乙酯萃取三次,搅拌45分钟。合并有机相,并真空蒸发,得到重179mg的粗产物。
将粗产物溶解在80mL乙酸乙酯中,并通过真空除去溶剂将其干燥装载到1.5g硅胶(Merck等级9385,200-400目粒度)上。将干燥的二氧化硅倒在25g Biotage KP-Sil Snap柱(Biotage)的预装二氧化硅上。用10倍柱体积的10%乙酸乙酯至100%乙酸乙酯的乙酸乙酯-己烷梯度洗脱该柱。收集馏分并通过LCMS进行分析。将选定的馏分合并,在旋转蒸发器上蒸发溶剂,得到11.3mg的提取物。
然后将提取物溶解在乙腈(0.3mL)和DMSO(0.7mL)中,并注入到已经用25%乙腈和75%水的混合物预平衡的12g Snap Ultra柱(Biotage)上。用10倍柱体积的25%乙腈至80%乙腈的乙腈-水梯度洗脱该柱。收集馏分,然后通过LC-MS进行分析。收集选定的馏分,通过LCMS进行分析(参见图3和图4),然后冷冻干燥,得到重3.8mg的白色粉末。
对样品在d4-甲醇中进行NMR光谱分析,并与同时进行的商业获得的UDCA样品(Sigma-Aldrich)进行比较。通过在298K下分别在500.05MHz和125.75MHz下对1H和13C操作以在Bruker 500MHz DCH冷冻探针光谱仪上记录NMR光谱。UDCA市售标准品核磁共振谱与样品核磁共振谱一致(参见图5、图6、图7和图8)。
实施例19:通过巴斯德毕赤酵母SAND121将3-KCA生物转化为3-KUDCA
巴斯德毕赤酵母SAND121用于在250mL锥形瓶中接种补充有100μg/mL诺尔丝菌素和100μg/mL博来霉素的25mL BMG培养基,并于30℃以250转/分钟振荡孵育3天。向培养物中加入0.25mL的5-ALA水溶液(200mM)和0.25mL含有37.6mg/mL 3-酮石胆酸(3-KCA)的甲醇,然后如前所述继续孵育1天。向培养物中加入0.25mL甲醇,然后如前所述继续孵育1天。从培养物中取出800μL培养物发酵液,并用等体积的含0.1%甲酸的乙酸乙酯振荡提取45分钟。通过离心分离各相,并将400μL溶剂相转移至干净试管中并蒸发。通过混合10分钟将沉淀溶解在400μL甲醇中,并以12000×g离心1分钟。将15μL甲醇溶液在50%流动相溶液A和50%流动相溶液B的混合物中稀释10倍,并通过HPLC-MS进行分析(参见一般方法)。观察到与3-KUDCA标准品平行运行时具有相同保留时间和质谱图的峰(参见图9和图10)。
实施例20:构建能够表达SEQ ID NO.2和SEQ ID NO.32的酿酒酵母菌株
如下构建质粒pSAND113,以表达在Gal1启动子控制下的编码序列为SEQ ID NO.33的P450的基因,以及在Gal10启动子控制下的编码序列为SEQ ID NO.3的P450还原酶的基因。
质粒pESC-URA(Agilent)用限制性内切酶EcoRI和SpeI切割。使用引物SEQ IDNO.37和SEQ ID NO.38从质粒pSAND102扩增出837bp的片段。使用SLiCE克隆法(Zhang等人,2014)将该837bp片段插入EcoRI-SpeI消化的pESC-URA中,形成中间质粒。通过限制性消化确认插入和插入物的身份。
用限制性内切酶HindIII和SalI切割中间质粒。使用引物SEQ ID NO.39和SEQ IDNO.40从质粒pSAND112扩增出1584bp的片段。使用SLiCE克隆方法(Zhang等人,2014)将该1584bp片段插入HindIII-SalI消化的中间质粒中,形成质粒pSAND113。通过限制性消化确认插入和插入物的身份。
使用标准方法,通过电穿孔用质粒pSAND113转化酿酒酵母菌株YPH499(Agilent),之后将细胞悬液铺板于尿嘧啶缺陷型合成葡萄糖基础琼脂培养基上,并于30℃孵育直至菌落变得可见。所得菌株被命名为酿酒酵母SAND122。
实施例21:通过酿酒酵母SAND122将LCA生物转化为UDCA
在50mL Falcon管中的7mL尿嘧啶缺陷型合成葡萄糖基础培养基中接种酿酒酵母SAND122,并于30℃以250转/分钟振荡孵育24小时,用作种子培养物。
将1mL种子培养物短暂离心以收获细胞。弃去上清液,将剩余的细胞沉淀在50mLFalcon管中悬浮于5mL尿嘧啶缺陷型合成半乳糖基础培养基中,该试管用泡沫塞封盖。该培养物于30℃以250转/分钟振荡孵育24小时,用作表达培养物。
将4mL表达培养物短暂离心以收获细胞。弃去上清液,将剩余的细胞沉淀在50mLFalcon管中悬浮于5mL生物转化缓冲液(0.1M磷酸钾缓冲液(pH 10)、1%半乳糖和650mg/LLCA)中,用泡沫塞封盖。该悬浮液于30℃以250转/分钟的速度振荡孵育72小时,用作生物转化培养物。
从生物转化培养物中取出500μL样品,用含有0.1%甲酸的等体积乙酸乙酯振荡45分钟进行提取。通过离心分离各相,并将20μL溶剂相转移到干净的试管中并蒸发。将沉淀溶解于20μL甲醇中,在50%流动相溶液A和50%流动相溶液B的混合物中稀释10倍,并通过HPLC-MS进行分析(参见一般方法)。观察到与UDCA标准品具有相同保留时间和质谱图的峰(参见图11和图12)。
引用的参考文献
Zhang,Y.,Werling,U.,Ederlmann,W.(2014).Seamless Ligation CloningExtract(SLiCE)Cloning Method.Methods in Molecular Biology 1116,235—244.
********
在本申请全文中,参考了各种出版物。这些出版物的公开内容在此通过引用全部并入本申请,以便更全面地描述本发明所属领域的现状。对于本领域技术人员来说,很明显,在不脱离本发明的范围或精神的情况下,可以对本发明进行各种修改和变化。考虑到本文公开的本发明的说明书和实践,本发明的其他实施方案对于本领域技术人员来说将是显而易见的。说明书和实施例仅被认为是示例性的,本发明的真实范围和精神由所附权利要求指出。
序列表
<110> 沙山一号有限责任公司
<120> 将LCA和3-KCA转化为UDCA和3-KUDCA的酶促方法
<130> 申请档案号
<160> 40
<170> PatentIn 3.5版
<210> 1
<211> 4157
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 1
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gcccttcgaa cgtccctatc acgacccgta ccgcttctgg 1080
ctacacttac tgccagcgca atcggagtat ccatattgtc taaaatgatg ttttcaacag 1140
caagtgcaga gagtccatct ccgcaaaaaa ttttttccgg tgcttttgct tccgtaaaac 1200
tcccgctgca ttcaagtgaa tacgagtccc atgacacaaa gaggcttcgt ttcaaacttc 1260
cgcaagagac tgcagtaacg ggtttaccgt tagcttactt ggttcacatt ccaccgtccc 1320
accatcaaag ggacttgact acgccggatg aacctggata catggacctg ttggtaaaga 1380
aataccccaa aggccagggc tcgacatatc tacactccct ccagcccggt gatacgttat 1440
ccttcacatc tctacccctc aaaccagctt ggaaaacaaa caattttcct cacatcactc 1500
ttatagctgg agggtgtggg atcacgccat tattcaactt ggctcaaggg atacttagag 1560
atccggccga aaaaactagg atgaccttta tttttggtgc acgatcagac gaggacgtat 1620
tactgaaaaa ggagttagat ggctttgcaa aagagttccc ggaaagattc gaggtgaaat 1680
atacagcact tttggaagag gtcctagggg gcgtgggtcg tgatactaag gtctttgtct 1740
gtgggccgaa ggagatggaa aaggcacttg taggaggccg tggcgtatta aaggaaatag 1800
gcttcgaaaa gtctcagatc catacttttt gagtcgacct gcaagatctg cggccgcgaa 1860
ttaattcgcc ttagacatga ctgttcctca gttcaagttg ggcacttacg agaagaccgg 1920
tcttgctaga ttctaatcaa gaggatgtca gaatgccatt tgcctgagag atgcaggctt 1980
catttttgat acttttttat ttgtaaccta tatagtatag gatttttttt gtcattttgt 2040
ttcttctcgt acgagcttgc tcctgatcag cctatctcgc agctgatgaa tatcttgtgg 2100
taggggtttg ggaaaatcat tcgagtttga tgtttttctt ggtatttccc actcctcttc 2160
agagtacaga agattaaggc gcgccgcaag ccaagcctgc gaagaatgta gtcgagaatt 2220
gagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 2280
cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 2340
cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 2400
agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 2460
gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 2520
ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 2580
acatccgaac ataaacaaaa atgaccactt tggatgatac tgcttacaga tacagaactt 2640
ctgttccagg tgatgctgaa gctattgaag ctttggatgg atctttcacc actgatactg 2700
ttttcagagt cactgctact ggtgatggat tcactttgag agaagttcct gttgatcctc 2760
ctttgaccaa agtttttcct gatgatgaat ctgatgatga atctgatgct ggtgaagatg 2820
gtgatccaga ttctagaact tttgttgctt atggtgatga tggtgatttg gctggatttg 2880
ttgttgtttc ttattctgga tggaacagaa gattgactgt tgaagatatt gaagttgctc 2940
cagaacatag aggtcatggt gttggaagag ctttgatggg attggcaact gagtttgcca 3000
gagaaagagg tgctggtcat ctttggttgg aagtcaccaa tgtcaatgct ccagctattc 3060
atgcttacag aagaatggga ttcactcttt gtggattgga tactgctttg tatgatggaa 3120
ctgcttctga tggagaacaa gctttgtaca tgtccatgcc atgtccttaa agtaactgac 3180
aataaaaaga ttcttgtttt caagaacttg tcatttgtat agttttttta tattgtagtt 3240
gttctatttt aatcaaatgt tagcgtgatt tatatttttt ttcgcctcga catcatctgc 3300
ccagatgcga agttaagtgc gcagaaagta atatcatgcg tcaatcgtat gtgaatgctg 3360
gtcgctatac tgctgtcgat tcgatactaa cgccgccatc cagtgtcgga tctgtgagca 3420
aacccgggca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 3480
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 3540
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 3600
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 3660
tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc 3720
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 3780
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 3840
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 3900
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 3960
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 4020
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 4080
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 4140
attttggtca tgagatc 4157
<210> 2
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 2
atggcccttc gaacgtccct atcacgaccc gtaccgcttc tggctacact tactgccagc 60
gcaatcggag tatccatatt gtctaaaatg atgttttcaa cagcaagtgc agagagtcca 120
tctccgcaaa aaattttttc cggtgctttt gcttccgtaa aactcccgct gcattcaagt 180
gaatacgagt cccatgacac aaagaggctt cgtttcaaac ttccgcaaga gactgcagta 240
acgggtttac cgttagctta cttggttcac attccaccgt cccaccatca aagggacttg 300
actacgccgg atgaacctgg atacatggac ctgttggtaa agaaataccc caaaggccag 360
ggctcgacat atctacactc cctccagccc ggtgatacgt tatccttcac atctctaccc 420
ctcaaaccag cttggaaaac aaacaatttt cctcacatca ctcttatagc tggagggtgt 480
gggatcacgc cattattcaa cttggctcaa gggatactta gagatccggc cgaaaaaact 540
aggatgacct ttatttttgg tgcacgatca gacgaggacg tattactgaa aaaggagtta 600
gatggctttg caaaagagtt cccggaaaga ttcgaggtga aatatacagc acttttggaa 660
gaggtcctag ggggcgtggg tcgtgatact aaggtctttg tctgtgggcc gaaggagatg 720
gaaaaggcac ttgtaggagg ccgtggcgta ttaaaggaaa taggcttcga aaagtctcag 780
atccatactt tttga 795
<210> 3
<211> 264
<212> PRT
<213> 禾谷镰孢菌
<400> 3
Met Ala Leu Arg Thr Ser Leu Ser Arg Pro Val Pro Leu Leu Ala Thr
1 5 10 15
Leu Thr Ala Ser Ala Ile Gly Val Ser Ile Leu Ser Lys Met Met Phe
20 25 30
Ser Thr Ala Ser Ala Glu Ser Pro Ser Pro Gln Lys Ile Phe Ser Gly
35 40 45
Ala Phe Ala Ser Val Lys Leu Pro Leu His Ser Ser Glu Tyr Glu Ser
50 55 60
His Asp Thr Lys Arg Leu Arg Phe Lys Leu Pro Gln Glu Thr Ala Val
65 70 75 80
Thr Gly Leu Pro Leu Ala Tyr Leu Val His Ile Pro Pro Ser His His
85 90 95
Gln Arg Asp Leu Thr Thr Pro Asp Glu Pro Gly Tyr Met Asp Leu Leu
100 105 110
Val Lys Lys Tyr Pro Lys Gly Gln Gly Ser Thr Tyr Leu His Ser Leu
115 120 125
Gln Pro Gly Asp Thr Leu Ser Phe Thr Ser Leu Pro Leu Lys Pro Ala
130 135 140
Trp Lys Thr Asn Asn Phe Pro His Ile Thr Leu Ile Ala Gly Gly Cys
145 150 155 160
Gly Ile Thr Pro Leu Phe Asn Leu Ala Gln Gly Ile Leu Arg Asp Pro
165 170 175
Ala Glu Lys Thr Arg Met Thr Phe Ile Phe Gly Ala Arg Ser Asp Glu
180 185 190
Asp Val Leu Leu Lys Lys Glu Leu Asp Gly Phe Ala Lys Glu Phe Pro
195 200 205
Glu Arg Phe Glu Val Lys Tyr Thr Ala Leu Leu Glu Glu Val Leu Gly
210 215 220
Gly Val Gly Arg Asp Thr Lys Val Phe Val Cys Gly Pro Lys Glu Met
225 230 235 240
Glu Lys Ala Leu Val Gly Gly Arg Gly Val Leu Lys Glu Ile Gly Phe
245 250 255
Glu Lys Ser Gln Ile His Thr Phe
260
<210> 4
<211> 4400
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 4
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg aaggaggcta tcgttaagaa agatgcaagt gttgaggtag 1080
tggacagtcc aataccgaaa cctgggacga atcctaaaga ttggaaaata ccagcctttt 1140
atggaacgga gtctaattct ggagatgaca ttgccgggtt ggttgaggca gtcggggaaa 1200
atgttgtagg tttccataaa ggagacaggg tggcagcttt tcacgaaatg ctgactcccc 1260
atggagcctt tgctgaatat gcaattgcac actattacac tacgttccat attccagaca 1320
gcatatccta cgaagaggct gccacgatac ctttggctgc ctatacttcc gtatgcgcct 1380
tgtttcaaga gctacagtta ccagatcctt ggagtcccct cgccaagtta gacgagaaaa 1440
gaccgttgct cgtatacgga gcatcaacgg ctacggctgc cttcgcaata aaactggccg 1500
ctgccgcaaa cgtacaccca atcatagccg tgggctctca aagaagcgaa tttgtaaaac 1560
catttctaga tgagtcaaag ggcgacctat tagtcgatta cacgctgcac gatacagaag 1620
ataaactggt ggcagccatc caagacgcaa ttaaaaagtc aggtgcaccc gacggtaggt 1680
gttgggtcgc atacgattca gtgtcagagg acagcaccgt ccgtctggtg accaaagcaa 1740
tcgctggccc gccagatgca aatggtcgaa aacctcgaat gacaaattta ctcatgaaat 1800
ccaacgtgga aggtgtggat ccctctgtcg aaatagtaca taccaaagta tctcaggtac 1860
acgaaaaaaa cgaaaaagat cagatgttgg gcctgacgtg ggctgccgca tttagtaggg 1920
gcctaagaga gggatggctt actgctcacc cctatatcgt gggaaagaac ggactacagg 1980
gactcagtga gggtctagtg gccctgcgtg atggtaagac aaaagcaaat aagttcctca 2040
ctatactgtc tgaaactcct ggggctactg cttgagtcga cctgcaagat ctgcggccgc 2100
gaattaattc gccttagaca tgactgttcc tcagttcaag ttgggcactt acgagaagac 2160
cggtcttgct agattctaat caagaggatg tcagaatgcc atttgcctga gagatgcagg 2220
cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt tttgtcattt 2280
tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagctgat gaatatcttg 2340
tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt cccactcctc 2400
ttcagagtac agaagattaa ggcgcgccgc aagccaagcc tgcgaagaat gtagtcgaga 2460
attgagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 2520
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 2580
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 2640
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 2700
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 2760
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctaggata cagttctcac 2820
atcacatccg aacataaaca aaaatgacca ctttggatga tactgcttac agatacagaa 2880
cttctgttcc aggtgatgct gaagctattg aagctttgga tggatctttc accactgata 2940
ctgttttcag agtcactgct actggtgatg gattcacttt gagagaagtt cctgttgatc 3000
ctcctttgac caaagttttt cctgatgatg aatctgatga tgaatctgat gctggtgaag 3060
atggtgatcc agattctaga acttttgttg cttatggtga tgatggtgat ttggctggat 3120
ttgttgttgt ttcttattct ggatggaaca gaagattgac tgttgaagat attgaagttg 3180
ctccagaaca tagaggtcat ggtgttggaa gagctttgat gggattggca actgagtttg 3240
ccagagaaag aggtgctggt catctttggt tggaagtcac caatgtcaat gctccagcta 3300
ttcatgctta cagaagaatg ggattcactc tttgtggatt ggatactgct ttgtatgatg 3360
gaactgcttc tgatggagaa caagctttgt acatgtccat gccatgtcct taaagtaact 3420
gacaataaaa agattcttgt tttcaagaac ttgtcatttg tatagttttt ttatattgta 3480
gttgttctat tttaatcaaa tgttagcgtg atttatattt tttttcgcct cgacatcatc 3540
tgcccagatg cgaagttaag tgcgcagaaa gtaatatcat gcgtcaatcg tatgtgaatg 3600
ctggtcgcta tactgctgtc gattcgatac taacgccgcc atccagtgtc ggatctgtga 3660
gcaaacccgg gcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 3720
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3780
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3840
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3900
ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 3960
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4020
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4080
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 4140
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 4200
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4260
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4320
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 4380
gggattttgg tcatgagatc 4400
<210> 5
<211> 1038
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 5
atgaaggagg ctatcgttaa gaaagatgca agtgttgagg tagtggacag tccaataccg 60
aaacctggga cgaatcctaa agattggaaa ataccagcct tttatggaac ggagtctaat 120
tctggagatg acattgccgg gttggttgag gcagtcgggg aaaatgttgt aggtttccat 180
aaaggagaca gggtggcagc ttttcacgaa atgctgactc cccatggagc ctttgctgaa 240
tatgcaattg cacactatta cactacgttc catattccag acagcatatc ctacgaagag 300
gctgccacga tacctttggc tgcctatact tccgtatgcg ccttgtttca agagctacag 360
ttaccagatc cttggagtcc cctcgccaag ttagacgaga aaagaccgtt gctcgtatac 420
ggagcatcaa cggctacggc tgccttcgca ataaaactgg ccgctgccgc aaacgtacac 480
ccaatcatag ccgtgggctc tcaaagaagc gaatttgtaa aaccatttct agatgagtca 540
aagggcgacc tattagtcga ttacacgctg cacgatacag aagataaact ggtggcagcc 600
atccaagacg caattaaaaa gtcaggtgca cccgacggta ggtgttgggt cgcatacgat 660
tcagtgtcag aggacagcac cgtccgtctg gtgaccaaag caatcgctgg cccgccagat 720
gcaaatggtc gaaaacctcg aatgacaaat ttactcatga aatccaacgt ggaaggtgtg 780
gatccctctg tcgaaatagt acataccaaa gtatctcagg tacacgaaaa aaacgaaaaa 840
gatcagatgt tgggcctgac gtgggctgcc gcatttagta ggggcctaag agagggatgg 900
cttactgctc acccctatat cgtgggaaag aacggactac agggactcag tgagggtcta 960
gtggccctgc gtgatggtaa gacaaaagca aataagttcc tcactatact gtctgaaact 1020
cctggggcta ctgcttga 1038
<210> 6
<211> 345
<212> PRT
<213> 禾谷镰孢菌
<400> 6
Met Lys Glu Ala Ile Val Lys Lys Asp Ala Ser Val Glu Val Val Asp
1 5 10 15
Ser Pro Ile Pro Lys Pro Gly Thr Asn Pro Lys Asp Trp Lys Ile Pro
20 25 30
Ala Phe Tyr Gly Thr Glu Ser Asn Ser Gly Asp Asp Ile Ala Gly Leu
35 40 45
Val Glu Ala Val Gly Glu Asn Val Val Gly Phe His Lys Gly Asp Arg
50 55 60
Val Ala Ala Phe His Glu Met Leu Thr Pro His Gly Ala Phe Ala Glu
65 70 75 80
Tyr Ala Ile Ala His Tyr Tyr Thr Thr Phe His Ile Pro Asp Ser Ile
85 90 95
Ser Tyr Glu Glu Ala Ala Thr Ile Pro Leu Ala Ala Tyr Thr Ser Val
100 105 110
Cys Ala Leu Phe Gln Glu Leu Gln Leu Pro Asp Pro Trp Ser Pro Leu
115 120 125
Ala Lys Leu Asp Glu Lys Arg Pro Leu Leu Val Tyr Gly Ala Ser Thr
130 135 140
Ala Thr Ala Ala Phe Ala Ile Lys Leu Ala Ala Ala Ala Asn Val His
145 150 155 160
Pro Ile Ile Ala Val Gly Ser Gln Arg Ser Glu Phe Val Lys Pro Phe
165 170 175
Leu Asp Glu Ser Lys Gly Asp Leu Leu Val Asp Tyr Thr Leu His Asp
180 185 190
Thr Glu Asp Lys Leu Val Ala Ala Ile Gln Asp Ala Ile Lys Lys Ser
195 200 205
Gly Ala Pro Asp Gly Arg Cys Trp Val Ala Tyr Asp Ser Val Ser Glu
210 215 220
Asp Ser Thr Val Arg Leu Val Thr Lys Ala Ile Ala Gly Pro Pro Asp
225 230 235 240
Ala Asn Gly Arg Lys Pro Arg Met Thr Asn Leu Leu Met Lys Ser Asn
245 250 255
Val Glu Gly Val Asp Pro Ser Val Glu Ile Val His Thr Lys Val Ser
260 265 270
Gln Val His Glu Lys Asn Glu Lys Asp Gln Met Leu Gly Leu Thr Trp
275 280 285
Ala Ala Ala Phe Ser Arg Gly Leu Arg Glu Gly Trp Leu Thr Ala His
290 295 300
Pro Tyr Ile Val Gly Lys Asn Gly Leu Gln Gly Leu Ser Glu Gly Leu
305 310 315 320
Val Ala Leu Arg Asp Gly Lys Thr Lys Ala Asn Lys Phe Leu Thr Ile
325 330 335
Leu Ser Glu Thr Pro Gly Ala Thr Ala
340 345
<210> 7
<211> 4418
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 7
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gactgtaacc ccgactatga aaatgccacc tgggcttttt 1080
atagatttgt ccccagtaaa gaagccaata ttgtttttgt ggtattgttc gccataacca 1140
cattgcttca tgtgctgcaa ctttggagaa cacgaacgtg gtacctaatt ccactcgtag 1200
tcgggggcgt aagtgccagt ggcgaggtca taggatacat aggccgagta ttaaacacga 1260
atgaagagcc cggttgttgg accatgggcc catacataat gcagtccgtg ttgatattaa 1320
ttgctcctgc tctatttgca gcttctattt acatgatact gggccgtatt atcattctta 1380
ccgaaggcga acatcacagc ctgatccctt taaagtggtt aacgaagctt ttcgtttttg 1440
gggatgtcgc ttcatttatg ctacaatcaa gtgggggtgg cctgatggca atacaggatt 1500
taaataagat gggagagaaa attatcgttg gcggtttatt tgtgcagctt ttctttttcg 1560
gttgttttat tatagtctca gctgtgttcc atatacgaat gcttagagct ccgacgccta 1620
acagttcgca aactagggta cgatggcaaa catatttagc aactttgtac gtcactggtg 1680
tgcttatctg ggtgcgatct ttgttcagag tcattgagtt catagagggt aatgatggac 1740
acttgatgcg ttcagaggtt tgggttttcg ttttcgatgg catgttaatg ttattggtac 1800
tcgtgtggat gaactggttc catcccggtg aaatcggcct tctgataaga ggagaagagt 1860
ccataaccaa cggattggaa cttatgaaac ttggtggcag tggtcgtagg tcccgagtgg 1920
atacgatgga gtcactgggc agcggcagac accttgagga aaataccgaa agataagtcg 1980
acctgcaaga tctgcggccg cgaattaatt cgccttagac atgactgttc ctcagttcaa 2040
gttgggcact tacgagaaga ccggtcttgc tagattctaa tcaagaggat gtcagaatgc 2100
catttgcctg agagatgcag gcttcatttt tgatactttt ttatttgtaa cctatatagt 2160
ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc ttgctcctga tcagcctatc 2220
tcgcagctga tgaatatctt gtggtagggg tttgggaaaa tcattcgagt ttgatgtttt 2280
tcttggtatt tcccactcct cttcagagta cagaagatta agtgagacct tcgtttgtgc 2340
ggatccaatt aatatttact tattttggtc aaccccaaat aggttgattt catacttggt 2400
tcattcaaaa ataagtagtc ttttgagatc tttcaatatt ataataaata tactataaca 2460
gccgacttgt ttcattttcg cgaatgttcc cccagcttat cggatccccc acacaccata 2520
gcttcaaaat gtttctactc cttttttact cttccagatt ttctcggact ccgcgcatcg 2580
ccgtaccact tcaaaacacc caagcacagc atactaaatt tcccctcttt cttcctctag 2640
ggtgtcgtta attacccgta ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct 2700
ttttcttcgt cgaaaaaggc aataaaaatt tttatcacgt ttctttttct tgaaattttt 2760
ttttttagtt tttttctctt tcagtgacct ccattgatat ttaagttaat aaacggtctt 2820
caatttctca agtttcagtt tcatttttct tgttctatta caactttttt tacttcttgt 2880
tcattagaaa gaaagcatag caatctaatc taaggggcgg tgttgacaat taatcatcgg 2940
catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg gccaagttga 3000
ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 3060
accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 3120
acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 3180
gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 3240
acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 3300
agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 3360
gacacgtccg acggcggccc acgggtccca ggcctcggag atccgtcccc cttttccttt 3420
gtcgatatca tgtaattagt tatgtcacgc ttacattcac gccctccccc cacatccgct 3480
ctaaccgaaa aggaaggagt tagacaacct gaagtctagg tccctattta tttttttata 3540
gttatgttag tattaagaac gttatttata tttcaaattt ttcttttttt tctgtacaga 3600
cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 3660
aaggctttaa tttgcaagct ggagaccaac atgtgagcaa aaggccagca aaaggccagg 3720
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 3780
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 3840
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 3900
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg 3960
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 4020
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 4080
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 4140
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 4200
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 4260
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 4320
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 4380
aacgaaaact cacgttaagg gattttggtc atgagatc 4418
<210> 8
<211> 939
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 8
atggactgta accccgacta tgaaaatgcc acctgggctt tttatagatt tgtccccagt 60
aaagaagcca atattgtttt tgtggtattg ttcgccataa ccacattgct tcatgtgctg 120
caactttgga gaacacgaac gtggtaccta attccactcg tagtcggggg cgtaagtgcc 180
agtggcgagg tcataggata cataggccga gtattaaaca cgaatgaaga gcccggttgt 240
tggaccatgg gcccatacat aatgcagtcc gtgttgatat taattgctcc tgctctattt 300
gcagcttcta tttacatgat actgggccgt attatcattc ttaccgaagg cgaacatcac 360
agcctgatcc ctttaaagtg gttaacgaag cttttcgttt ttggggatgt cgcttcattt 420
atgctacaat caagtggggg tggcctgatg gcaatacagg atttaaataa gatgggagag 480
aaaattatcg ttggcggttt atttgtgcag cttttctttt tcggttgttt tattatagtc 540
tcagctgtgt tccatatacg aatgcttaga gctccgacgc ctaacagttc gcaaactagg 600
gtacgatggc aaacatattt agcaactttg tacgtcactg gtgtgcttat ctgggtgcga 660
tctttgttca gagtcattga gttcatagag ggtaatgatg gacacttgat gcgttcagag 720
gtttgggttt tcgttttcga tggcatgtta atgttattgg tactcgtgtg gatgaactgg 780
ttccatcccg gtgaaatcgg ccttctgata agaggagaag agtccataac caacggattg 840
gaacttatga aacttggtgg cagtggtcgt aggtcccgag tggatacgat ggagtcactg 900
ggcagcggca gacaccttga ggaaaatacc gaaagataa 939
<210> 9
<211> 312
<212> PRT
<213> 禾谷镰孢菌
<400> 9
Met Asp Cys Asn Pro Asp Tyr Glu Asn Ala Thr Trp Ala Phe Tyr Arg
1 5 10 15
Phe Val Pro Ser Lys Glu Ala Asn Ile Val Phe Val Val Leu Phe Ala
20 25 30
Ile Thr Thr Leu Leu His Val Leu Gln Leu Trp Arg Thr Arg Thr Trp
35 40 45
Tyr Leu Ile Pro Leu Val Val Gly Gly Val Ser Ala Ser Gly Glu Val
50 55 60
Ile Gly Tyr Ile Gly Arg Val Leu Asn Thr Asn Glu Glu Pro Gly Cys
65 70 75 80
Trp Thr Met Gly Pro Tyr Ile Met Gln Ser Val Leu Ile Leu Ile Ala
85 90 95
Pro Ala Leu Phe Ala Ala Ser Ile Tyr Met Ile Leu Gly Arg Ile Ile
100 105 110
Ile Leu Thr Glu Gly Glu His His Ser Leu Ile Pro Leu Lys Trp Leu
115 120 125
Thr Lys Leu Phe Val Phe Gly Asp Val Ala Ser Phe Met Leu Gln Ser
130 135 140
Ser Gly Gly Gly Leu Met Ala Ile Gln Asp Leu Asn Lys Met Gly Glu
145 150 155 160
Lys Ile Ile Val Gly Gly Leu Phe Val Gln Leu Phe Phe Phe Gly Cys
165 170 175
Phe Ile Ile Val Ser Ala Val Phe His Ile Arg Met Leu Arg Ala Pro
180 185 190
Thr Pro Asn Ser Ser Gln Thr Arg Val Arg Trp Gln Thr Tyr Leu Ala
195 200 205
Thr Leu Tyr Val Thr Gly Val Leu Ile Trp Val Arg Ser Leu Phe Arg
210 215 220
Val Ile Glu Phe Ile Glu Gly Asn Asp Gly His Leu Met Arg Ser Glu
225 230 235 240
Val Trp Val Phe Val Phe Asp Gly Met Leu Met Leu Leu Val Leu Val
245 250 255
Trp Met Asn Trp Phe His Pro Gly Glu Ile Gly Leu Leu Ile Arg Gly
260 265 270
Glu Glu Ser Ile Thr Asn Gly Leu Glu Leu Met Lys Leu Gly Gly Ser
275 280 285
Gly Arg Arg Ser Arg Val Asp Thr Met Glu Ser Leu Gly Ser Gly Arg
290 295 300
His Leu Glu Glu Asn Thr Glu Arg
305 310
<210> 10
<211> 5072
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 10
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gaggccgtac acgccgacgt ttcacaatac gaatatgcct 1080
tagacgtaga agtgggtaaa accgcacgac tactgccact agaccttgac tattgggtca 1140
gtggacagta cgcagctagg cttatgcact tgccgtatag tttacttggg aacgggggta 1200
agcagtaccc atacattaac cccaaaaagc cattcgaact tagcaatcag cgtgttgtac 1260
aggattttat agagaatgct cgagacatac tgactaaagg aaggtcgtta tacaaagata 1320
caccttataa agcacatacc gacctggggg atgttctggt tatacctcca gaatttgccg 1380
atgctttaaa gagcgaacga caattagatt ttacagaggt agcaagagac gatacacacg 1440
ggtacatacc gggtttcgaa ccgattggtt ctcctttcga tttagtaccc ttggtgaaca 1500
aatacctaac tagggccctg gccaaactga ccaagccgct gtgggccgaa gcctctctgg 1560
gagtcaacca tgtgttgggt acttcaacag aatggcatcc gatcaatcca ggagaggaca 1620
taatgcgaat cgtctcccgt atgtcgtcaa gaatatttat gggcgaggaa ctctgcaagg 1680
atgacgattg gctcaaggtt tctatagagt acactgtgca gttgttccaa acggcagacg 1740
agctaaggaa ctatccgaga tggacacgtc cgtacattca ttggtttctc cctagttgcc 1800
aaggagtcag gcgtaaacta caggaggcca gagatctgtt gcaaccccat atagacaggc 1860
gtaacgccgt aaaaaaggaa gcaatagctg aaggacgtcc ttcccccttc gacgatagca 1920
tcgaatggtt tgaaaatgag tacgaaggaa agtctgaccc ggcaactgaa caaattaagc 1980
tcagccttgt cgccatacac acaactacag acctgttgtc tgaaactatg tttaatattg 2040
cactgcagcc tgagttgcta ggtcctcttc gtgaggaaat agttaccgta ctatcgaccg 2100
agggtctaaa gaaaacatct ttctacaatt tgaaacttat ggactcggtt ataaaggaga 2160
gccagaggct tcgaccggtc ctattgggtg ccttcagacg aatggcactt gctgatgtaa 2220
cactgcctaa tggcgacgta attaagaaag ggacaaaaat tatctgtgat acaacccacc 2280
aatggaatcc ggagtactat ccagacgcaa gcaaattcaa tgcctacagg tttcttcaga 2340
tgaggcaaac accagggcaa gataaacgag cccacttagt ctccacatca cacgatcaaa 2400
tgggttttgg ccacggcctc cacgcttgtc cgggtagatt ctttgctgca aacgaaatta 2460
aaatagccct atgccacatg ttgttaaagt acgactggaa gctacctgag ggtgtcgttc 2520
cgaaaagtaa ggctctcggt atgtcactcc tgggagacag agaggcaaaa ttgatggtca 2580
agagaagggc tgccgagatc gatatagaca ctattggtag tgacgaatag gtcgacctgc 2640
aagatctgcg gccgcgaatt aattcgcctt agacatgact gttcctcagt tcaagttggg 2700
cacttacgag aagaccggtc ttgctagatt ctaatcaaga ggatgtcaga atgccatttg 2760
cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga 2820
ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag 2880
ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg 2940
tatttcccac tcctcttcag agtacagaag attaagtgag accttcgttt gtgcggatcc 3000
aattaatatt tacttatttt ggtcaacccc aaataggttg atttcatact tggttcattc 3060
aaaaataagt agtcttttga gatctttcaa tattataata aatatactat aacagccgac 3120
ttgtttcatt ttcgcgaatg ttcccccagc ttatcggatc ccccacacac catagcttca 3180
aaatgtttct actccttttt tactcttcca gattttctcg gactccgcgc atcgccgtac 3240
cacttcaaaa cacccaagca cagcatacta aatttcccct ctttcttcct ctagggtgtc 3300
gttaattacc cgtactaaag gtttggaaaa gaaaaaagag accgcctcgt ttctttttct 3360
tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt ttcttgaaat tttttttttt 3420
agtttttttc tctttcagtg acctccattg atatttaagt taataaacgg tcttcaattt 3480
ctcaagtttc agtttcattt ttcttgttct attacaactt tttttacttc ttgttcatta 3540
gaaagaaagc atagcaatct aatctaaggg gcggtgttga caattaatca tcggcatagt 3600
atatcggcat agtataatac gacaaggtga ggaactaaac catggccaag ttgaccagtg 3660
ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 3720
tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 3780
ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 3840
gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 3900
gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 3960
ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgacacg 4020
tccgacggcg gcccacgggt cccaggcctc ggagatccgt cccccttttc ctttgtcgat 4080
atcatgtaat tagttatgtc acgcttacat tcacgccctc cccccacatc cgctctaacc 4140
gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt tatagttatg 4200
ttagtattaa gaacgttatt tatatttcaa atttttcttt tttttctgta cagacgcgtg 4260
tacgcatgta acattatact gaaaaccttg cttgagaagg ttttgggacg ctcgaaggct 4320
ttaatttgca agctggagac caacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 4380
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 4440
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 4500
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 4560
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 4620
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 4680
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 4740
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 4800
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 4860
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 4920
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 4980
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5040
aactcacgtt aagggatttt ggtcatgaga tc 5072
<210> 11
<211> 1593
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 11
atggaggccg tacacgccga cgtttcacaa tacgaatatg ccttagacgt agaagtgggt 60
aaaaccgcac gactactgcc actagacctt gactattggg tcagtggaca gtacgcagct 120
aggcttatgc acttgccgta tagtttactt gggaacgggg gtaagcagta cccatacatt 180
aaccccaaaa agccattcga acttagcaat cagcgtgttg tacaggattt tatagagaat 240
gctcgagaca tactgactaa aggaaggtcg ttatacaaag atacacctta taaagcacat 300
accgacctgg gggatgttct ggttatacct ccagaatttg ccgatgcttt aaagagcgaa 360
cgacaattag attttacaga ggtagcaaga gacgatacac acgggtacat accgggtttc 420
gaaccgattg gttctccttt cgatttagta cccttggtga acaaatacct aactagggcc 480
ctggccaaac tgaccaagcc gctgtgggcc gaagcctctc tgggagtcaa ccatgtgttg 540
ggtacttcaa cagaatggca tccgatcaat ccaggagagg acataatgcg aatcgtctcc 600
cgtatgtcgt caagaatatt tatgggcgag gaactctgca aggatgacga ttggctcaag 660
gtttctatag agtacactgt gcagttgttc caaacggcag acgagctaag gaactatccg 720
agatggacac gtccgtacat tcattggttt ctccctagtt gccaaggagt caggcgtaaa 780
ctacaggagg ccagagatct gttgcaaccc catatagaca ggcgtaacgc cgtaaaaaag 840
gaagcaatag ctgaaggacg tccttccccc ttcgacgata gcatcgaatg gtttgaaaat 900
gagtacgaag gaaagtctga cccggcaact gaacaaatta agctcagcct tgtcgccata 960
cacacaacta cagacctgtt gtctgaaact atgtttaata ttgcactgca gcctgagttg 1020
ctaggtcctc ttcgtgagga aatagttacc gtactatcga ccgagggtct aaagaaaaca 1080
tctttctaca atttgaaact tatggactcg gttataaagg agagccagag gcttcgaccg 1140
gtcctattgg gtgccttcag acgaatggca cttgctgatg taacactgcc taatggcgac 1200
gtaattaaga aagggacaaa aattatctgt gatacaaccc accaatggaa tccggagtac 1260
tatccagacg caagcaaatt caatgcctac aggtttcttc agatgaggca aacaccaggg 1320
caagataaac gagcccactt agtctccaca tcacacgatc aaatgggttt tggccacggc 1380
ctccacgctt gtccgggtag attctttgct gcaaacgaaa ttaaaatagc cctatgccac 1440
atgttgttaa agtacgactg gaagctacct gagggtgtcg ttccgaaaag taaggctctc 1500
ggtatgtcac tcctgggaga cagagaggca aaattgatgg tcaagagaag ggctgccgag 1560
atcgatatag acactattgg tagtgacgaa tag 1593
<210> 12
<211> 530
<212> PRT
<213> 禾谷镰孢菌
<400> 12
Met Glu Ala Val His Ala Asp Val Ser Gln Tyr Glu Tyr Ala Leu Asp
1 5 10 15
Val Glu Val Gly Lys Thr Ala Arg Leu Leu Pro Leu Asp Leu Asp Tyr
20 25 30
Trp Val Ser Gly Gln Tyr Ala Ala Arg Leu Met His Leu Pro Tyr Ser
35 40 45
Leu Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys
50 55 60
Pro Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn
65 70 75 80
Ala Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro
85 90 95
Tyr Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu
100 105 110
Phe Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val
115 120 125
Ala Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly
130 135 140
Ser Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala
145 150 155 160
Leu Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val
165 170 175
Asn His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly
180 185 190
Glu Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met
195 200 205
Gly Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu
210 215 220
Tyr Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro
225 230 235 240
Arg Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly
245 250 255
Val Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile
260 265 270
Asp Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro
275 280 285
Ser Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly
290 295 300
Lys Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile
305 310 315 320
His Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu
325 330 335
Gln Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu
340 345 350
Ser Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met
355 360 365
Asp Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly
370 375 380
Ala Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp
385 390 395 400
Val Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp
405 410 415
Asn Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe
420 425 430
Leu Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val
435 440 445
Ser Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys
450 455 460
Pro Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His
465 470 475 480
Met Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys
485 490 495
Ser Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu
500 505 510
Met Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Thr Ile Gly Ser
515 520 525
Asp Glu
530
<210> 13
<211> 4802
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 13
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gcagctacgc taattgtgtt cgggggtttg ctgctcttgg 1080
cctggcttgt caacatcgct tatcgatcgt tgtttcaccc cttagctaaa tttccgggcc 1140
ctaaactagc cgcagtctct gacatttggt atgctattaa gtggacatct ggtagatatc 1200
cttttataat ggaagagact catcgtaagt acggggatgt cgttagaata gcccccaatg 1260
aactatcatt cgcaacagtt caagcctatc aagacatcta cggacacgca ctaaaaggaa 1320
agaaaaagtt tgtaaaatcc aactggtatg atacagctgg tgatcaccct ggaatagttt 1380
cagtgcgtga ccctaaagag cactctcgac aaagaaagta tctatcacac gccttctctg 1440
caaagagcct gagagggcaa gaagtgctgg ttcatgggta tgtcaacttg ttcctggacc 1500
agttaaggga ccttgcattt ggggaatcgt tcgatgcagt tgctaacgga aaaactcact 1560
tttgggttag catcattata gacgccacat acactagcat gctatctgct cttaggaagc 1620
gagtaccgct agtcaacttg tacctgccat tcgtcgtgcc taaagatgct aaggccacat 1680
accaaaaaca tcgtgcactt acccgtgaaa aaatgctaaa gaggcttgat atgcctaatt 1740
ccgaggacag aggtgatttt ttcgccagtt tgctaaggaa gggtggaaac gaagtgcccg 1800
agccagagct actgcagcaa tctaacaccc tgatagtagc aggttccgaa actacagcca 1860
catgtttgac cggcatagta ttctgtctat tgtccaaccc cagctgcctt gaagccttat 1920
ctaacgaagt aaggtctaga tttcagtcgg atagtgaaat cacgggcgac gctacagctg 1980
atatgaaata cctgtctgca gttatagaag aggggttgag aatcttcccg cctgccccat 2040
ttggcctgcc cagaatttct ccaggcgccg tgattgacgg tcactatgtg ccacctggtg 2100
tgacggtgag tgtcgatcat tggaccacga aacatgaccg tcgatactgg aaagaccctt 2160
atagttttat tcccgagcga tggatcgatg aagggtttgg cgacacaaag caggcttcac 2220
aaccattttc tctaggaccc agagcatgct tggggatcaa ccttgcttac ctagaaatgc 2280
gaattatcat tgcaaaaatg gtatattgct tcgattggga actcccacga ttaatggtca 2340
gattccatcc ccataattag gtcgacctgc aagatctgcg gccgcgaatt aattcgcctt 2400
agacatgact gttcctcagt tcaagttggg cacttacgag aagaccggtc ttgctagatt 2460
ctaatcaaga ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac 2520
ttttttattt gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac 2580
gagcttgctc ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg 2640
aaaatcattc gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag 2700
attaagtgag accttcgttt gtgcggatcc aattaatatt tacttatttt ggtcaacccc 2760
aaataggttg atttcatact tggttcattc aaaaataagt agtcttttga gatctttcaa 2820
tattataata aatatactat aacagccgac ttgtttcatt ttcgcgaatg ttcccccagc 2880
ttatcggatc ccccacacac catagcttca aaatgtttct actccttttt tactcttcca 2940
gattttctcg gactccgcgc atcgccgtac cacttcaaaa cacccaagca cagcatacta 3000
aatttcccct ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa 3060
gaaaaaagag accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc 3120
acgtttcttt ttcttgaaat tttttttttt agtttttttc tctttcagtg acctccattg 3180
atatttaagt taataaacgg tcttcaattt ctcaagtttc agtttcattt ttcttgttct 3240
attacaactt tttttacttc ttgttcatta gaaagaaagc atagcaatct aatctaaggg 3300
gcggtgttga caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga 3360
ggaactaaac catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg 3420
ccggagcggt cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg 3480
acttcgccgg tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg 3540
tggtgccgga caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg 3600
agtggtcgga ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga 3660
tcggcgagca gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc 3720
acttcgtggc cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc 3780
ggagatccgt cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat 3840
tcacgccctc cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc 3900
taggtcccta tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa 3960
atttttcttt tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg 4020
cttgagaagg ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga 4080
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 4140
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 4200
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 4260
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 4320
ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 4380
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 4440
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 4500
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 4560
ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 4620
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 4680
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 4740
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 4800
tc 4802
<210> 14
<211> 1323
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 14
atggcagcta cgctaattgt gttcgggggt ttgctgctct tggcctggct tgtcaacatc 60
gcttatcgat cgttgtttca ccccttagct aaatttccgg gccctaaact agccgcagtc 120
tctgacattt ggtatgctat taagtggaca tctggtagat atccttttat aatggaagag 180
actcatcgta agtacgggga tgtcgttaga atagccccca atgaactatc attcgcaaca 240
gttcaagcct atcaagacat ctacggacac gcactaaaag gaaagaaaaa gtttgtaaaa 300
tccaactggt atgatacagc tggtgatcac cctggaatag tttcagtgcg tgaccctaaa 360
gagcactctc gacaaagaaa gtatctatca cacgccttct ctgcaaagag cctgagaggg 420
caagaagtgc tggttcatgg gtatgtcaac ttgttcctgg accagttaag ggaccttgca 480
tttggggaat cgttcgatgc agttgctaac ggaaaaactc acttttgggt tagcatcatt 540
atagacgcca catacactag catgctatct gctcttagga agcgagtacc gctagtcaac 600
ttgtacctgc cattcgtcgt gcctaaagat gctaaggcca cataccaaaa acatcgtgca 660
cttacccgtg aaaaaatgct aaagaggctt gatatgccta attccgagga cagaggtgat 720
tttttcgcca gtttgctaag gaagggtgga aacgaagtgc ccgagccaga gctactgcag 780
caatctaaca ccctgatagt agcaggttcc gaaactacag ccacatgttt gaccggcata 840
gtattctgtc tattgtccaa ccccagctgc cttgaagcct tatctaacga agtaaggtct 900
agatttcagt cggatagtga aatcacgggc gacgctacag ctgatatgaa atacctgtct 960
gcagttatag aagaggggtt gagaatcttc ccgcctgccc catttggcct gcccagaatt 1020
tctccaggcg ccgtgattga cggtcactat gtgccacctg gtgtgacggt gagtgtcgat 1080
cattggacca cgaaacatga ccgtcgatac tggaaagacc cttatagttt tattcccgag 1140
cgatggatcg atgaagggtt tggcgacaca aagcaggctt cacaaccatt ttctctagga 1200
cccagagcat gcttggggat caaccttgct tacctagaaa tgcgaattat cattgcaaaa 1260
atggtatatt gcttcgattg ggaactccca cgattaatgg tcagattcca tccccataat 1320
tag 1323
<210> 15
<211> 440
<212> PRT
<213> 禾谷镰孢菌
<400> 15
Met Ala Ala Thr Leu Ile Val Phe Gly Gly Leu Leu Leu Leu Ala Trp
1 5 10 15
Leu Val Asn Ile Ala Tyr Arg Ser Leu Phe His Pro Leu Ala Lys Phe
20 25 30
Pro Gly Pro Lys Leu Ala Ala Val Ser Asp Ile Trp Tyr Ala Ile Lys
35 40 45
Trp Thr Ser Gly Arg Tyr Pro Phe Ile Met Glu Glu Thr His Arg Lys
50 55 60
Tyr Gly Asp Val Val Arg Ile Ala Pro Asn Glu Leu Ser Phe Ala Thr
65 70 75 80
Val Gln Ala Tyr Gln Asp Ile Tyr Gly His Ala Leu Lys Gly Lys Lys
85 90 95
Lys Phe Val Lys Ser Asn Trp Tyr Asp Thr Ala Gly Asp His Pro Gly
100 105 110
Ile Val Ser Val Arg Asp Pro Lys Glu His Ser Arg Gln Arg Lys Tyr
115 120 125
Leu Ser His Ala Phe Ser Ala Lys Ser Leu Arg Gly Gln Glu Val Leu
130 135 140
Val His Gly Tyr Val Asn Leu Phe Leu Asp Gln Leu Arg Asp Leu Ala
145 150 155 160
Phe Gly Glu Ser Phe Asp Ala Val Ala Asn Gly Lys Thr His Phe Trp
165 170 175
Val Ser Ile Ile Ile Asp Ala Thr Tyr Thr Ser Met Leu Ser Ala Leu
180 185 190
Arg Lys Arg Val Pro Leu Val Asn Leu Tyr Leu Pro Phe Val Val Pro
195 200 205
Lys Asp Ala Lys Ala Thr Tyr Gln Lys His Arg Ala Leu Thr Arg Glu
210 215 220
Lys Met Leu Lys Arg Leu Asp Met Pro Asn Ser Glu Asp Arg Gly Asp
225 230 235 240
Phe Phe Ala Ser Leu Leu Arg Lys Gly Gly Asn Glu Val Pro Glu Pro
245 250 255
Glu Leu Leu Gln Gln Ser Asn Thr Leu Ile Val Ala Gly Ser Glu Thr
260 265 270
Thr Ala Thr Cys Leu Thr Gly Ile Val Phe Cys Leu Leu Ser Asn Pro
275 280 285
Ser Cys Leu Glu Ala Leu Ser Asn Glu Val Arg Ser Arg Phe Gln Ser
290 295 300
Asp Ser Glu Ile Thr Gly Asp Ala Thr Ala Asp Met Lys Tyr Leu Ser
305 310 315 320
Ala Val Ile Glu Glu Gly Leu Arg Ile Phe Pro Pro Ala Pro Phe Gly
325 330 335
Leu Pro Arg Ile Ser Pro Gly Ala Val Ile Asp Gly His Tyr Val Pro
340 345 350
Pro Gly Val Thr Val Ser Val Asp His Trp Thr Thr Lys His Asp Arg
355 360 365
Arg Tyr Trp Lys Asp Pro Tyr Ser Phe Ile Pro Glu Arg Trp Ile Asp
370 375 380
Glu Gly Phe Gly Asp Thr Lys Gln Ala Ser Gln Pro Phe Ser Leu Gly
385 390 395 400
Pro Arg Ala Cys Leu Gly Ile Asn Leu Ala Tyr Leu Glu Met Arg Ile
405 410 415
Ile Ile Ala Lys Met Val Tyr Cys Phe Asp Trp Glu Leu Pro Arg Leu
420 425 430
Met Val Arg Phe His Pro His Asn
435 440
<210> 16
<211> 5003
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 16
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg ttccaccttc tgatatatcc actatgggtc ttggtggcat 1080
tattcgccgt cattatcgca aacctgctat atcaacagct gccaagacgt cctgatgaac 1140
ccccattagt ctttcactgg ttcccatttt tcggtaatgc agtcgcctat ggattggatc 1200
cctgtggctt tttcgagaaa tgcagggaga agcacgggga cgtattcaca ttcattttat 1260
ttggtcgaaa aattgtagcc tgcctgggcg tggacggaaa cgatttcgtt ctgaactcta 1320
ggctccaaga cgccaacgct gaagaggtct acgggccact caccattcct gtatttggca 1380
gcgacgttgt ctatgactgc cctaattcga agctaatgga acaaaagaaa ttcgtcaaat 1440
tcggtttaac gcagaaggct ttggagagtc atgtgcaact tatcgagagg gaggtgttgg 1500
attacgtcga gacagacccc tcattcagtg ggagaacatc aacaatagat gttccgaaag 1560
ccatggctga gatcacaatc ttcactgcta gtcgtagttt gcagggcgag gaagtcagga 1620
gaaagctgac tgcagagttc gcagccctct accatgatct cgacctgggc tttaggccgg 1680
ttaactttct gttcccttgg ttgccgctgc cccataacag gaagcgtgac gctgcccaca 1740
tcaaaatgag ggaggtctat atggacatta taaatgacag acgaaaaggg ggaatacgta 1800
ccgaggacgg tacggatatg attgccaatt taatgggatg cacatataag aatggccagc 1860
cagttcctga taaggagatt gcacacatga tgattacgct gctcatggca ggtcaacact 1920
catccagctc ggcttcttca tggattgtcc tgcatttagc ctcgagtcct gacattacgg 1980
aagagttgta ccaagagcaa ctcgtcaatt tatcagtcaa cggggccctt cccccgcttc 2040
agtactctga cctagacaaa ttgccgttgt tacagaatgt tgtaaaggaa acgctccgag 2100
ttcattctag tattcatagt attcttagga aagttaagcg tccgatgcaa gtccccaact 2160
caccatatac tattaccacg gataaggtca tcatggcctc ccccacggtg acagcaatgt 2220
cagaagagta cttcgagaat gctaaaacgt ggaaccctca cagatgggac aacagggcta 2280
aagaggaagt ggataccgag gatgtaatag actatggata cggagctgtc agtaaaggaa 2340
caaagtctcc ttatctaccg tttggggcag ggagacatcg atgcatcggc gaaaagttcg 2400
catacgtgaa tttgggggtc atagttgcta cgcttgtgag aaacttcagg ttatcgacaa 2460
tagacggccg acctggtgtt cctgaaaccg actatacatc cctattctcc cgaccggctc 2520
agccggcctt cattcgatgg gaacgaagga aaaagattta ggtcgacctg caagatctgc 2580
ggccgcgaat taattcgcct tagacatgac tgttcctcag ttcaagttgg gcacttacga 2640
gaagaccggt cttgctagat tctaatcaag aggatgtcag aatgccattt gcctgagaga 2700
tgcaggcttc atttttgata cttttttatt tgtaacctat atagtatagg attttttttg 2760
tcattttgtt tcttctcgta cgagcttgct cctgatcagc ctatctcgca gctgatgaat 2820
atcttgtggt aggggtttgg gaaaatcatt cgagtttgat gtttttcttg gtatttccca 2880
ctcctcttca gagtacagaa gattaagtga gaccttcgtt tgtgcggatc caattaatat 2940
ttacttattt tggtcaaccc caaataggtt gatttcatac ttggttcatt caaaaataag 3000
tagtcttttg agatctttca atattataat aaatatacta taacagccga cttgtttcat 3060
tttcgcgaat gttcccccag cttatcggat cccccacaca ccatagcttc aaaatgtttc 3120
tactcctttt ttactcttcc agattttctc ggactccgcg catcgccgta ccacttcaaa 3180
acacccaagc acagcatact aaatttcccc tctttcttcc tctagggtgt cgttaattac 3240
ccgtactaaa ggtttggaaa agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa 3300
aaggcaataa aaatttttat cacgtttctt tttcttgaaa tttttttttt tagttttttt 3360
ctctttcagt gacctccatt gatatttaag ttaataaacg gtcttcaatt tctcaagttt 3420
cagtttcatt tttcttgttc tattacaact ttttttactt cttgttcatt agaaagaaag 3480
catagcaatc taatctaagg ggcggtgttg acaattaatc atcggcatag tatatcggca 3540
tagtataata cgacaaggtg aggaactaaa ccatggccaa gttgaccagt gccgttccgg 3600
tgctcaccgc gcgcgacgtc gccggagcgg tcgagttctg gaccgaccgg ctcgggttct 3660
cccgggactt cgtggaggac gacttcgccg gtgtggtccg ggacgacgtg accctgttca 3720
tcagcgcggt ccaggaccag gtggtgccgg acaacaccct ggcctgggtg tgggtgcgcg 3780
gcctggacga gctgtacgcc gagtggtcgg aggtcgtgtc cacgaacttc cgggacgcct 3840
ccgggccggc catgaccgag atcggcgagc agccgtgggg gcgggagttc gccctgcgcg 3900
acccggccgg caactgcgtg cacttcgtgg ccgaggagca ggactgacac gtccgacggc 3960
ggcccacggg tcccaggcct cggagatccg tccccctttt cctttgtcga tatcatgtaa 4020
ttagttatgt cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa 4080
ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 4140
agaacgttat ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt 4200
aacattatac tgaaaacctt gcttgagaag gttttgggac gctcgaaggc tttaatttgc 4260
aagctggaga ccaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 4320
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 4380
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 4440
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 4500
ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg 4560
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4620
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4680
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4740
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 4800
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 4860
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 4920
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 4980
taagggattt tggtcatgag atc 5003
<210> 17
<211> 1524
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 17
atgttccacc ttctgatata tccactatgg gtcttggtgg cattattcgc cgtcattatc 60
gcaaacctgc tatatcaaca gctgccaaga cgtcctgatg aacccccatt agtctttcac 120
tggttcccat ttttcggtaa tgcagtcgcc tatggattgg atccctgtgg ctttttcgag 180
aaatgcaggg agaagcacgg ggacgtattc acattcattt tatttggtcg aaaaattgta 240
gcctgcctgg gcgtggacgg aaacgatttc gttctgaact ctaggctcca agacgccaac 300
gctgaagagg tctacgggcc actcaccatt cctgtatttg gcagcgacgt tgtctatgac 360
tgccctaatt cgaagctaat ggaacaaaag aaattcgtca aattcggttt aacgcagaag 420
gctttggaga gtcatgtgca acttatcgag agggaggtgt tggattacgt cgagacagac 480
ccctcattca gtgggagaac atcaacaata gatgttccga aagccatggc tgagatcaca 540
atcttcactg ctagtcgtag tttgcagggc gaggaagtca ggagaaagct gactgcagag 600
ttcgcagccc tctaccatga tctcgacctg ggctttaggc cggttaactt tctgttccct 660
tggttgccgc tgccccataa caggaagcgt gacgctgccc acatcaaaat gagggaggtc 720
tatatggaca ttataaatga cagacgaaaa gggggaatac gtaccgagga cggtacggat 780
atgattgcca atttaatggg atgcacatat aagaatggcc agccagttcc tgataaggag 840
attgcacaca tgatgattac gctgctcatg gcaggtcaac actcatccag ctcggcttct 900
tcatggattg tcctgcattt agcctcgagt cctgacatta cggaagagtt gtaccaagag 960
caactcgtca atttatcagt caacggggcc cttcccccgc ttcagtactc tgacctagac 1020
aaattgccgt tgttacagaa tgttgtaaag gaaacgctcc gagttcattc tagtattcat 1080
agtattctta ggaaagttaa gcgtccgatg caagtcccca actcaccata tactattacc 1140
acggataagg tcatcatggc ctcccccacg gtgacagcaa tgtcagaaga gtacttcgag 1200
aatgctaaaa cgtggaaccc tcacagatgg gacaacaggg ctaaagagga agtggatacc 1260
gaggatgtaa tagactatgg atacggagct gtcagtaaag gaacaaagtc tccttatcta 1320
ccgtttgggg cagggagaca tcgatgcatc ggcgaaaagt tcgcatacgt gaatttgggg 1380
gtcatagttg ctacgcttgt gagaaacttc aggttatcga caatagacgg ccgacctggt 1440
gttcctgaaa ccgactatac atccctattc tcccgaccgg ctcagccggc cttcattcga 1500
tgggaacgaa ggaaaaagat ttag 1524
<210> 18
<211> 507
<212> PRT
<213> 禾谷镰孢菌
<400> 18
Met Phe His Leu Leu Ile Tyr Pro Leu Trp Val Leu Val Ala Leu Phe
1 5 10 15
Ala Val Ile Ile Ala Asn Leu Leu Tyr Gln Gln Leu Pro Arg Arg Pro
20 25 30
Asp Glu Pro Pro Leu Val Phe His Trp Phe Pro Phe Phe Gly Asn Ala
35 40 45
Val Ala Tyr Gly Leu Asp Pro Cys Gly Phe Phe Glu Lys Cys Arg Glu
50 55 60
Lys His Gly Asp Val Phe Thr Phe Ile Leu Phe Gly Arg Lys Ile Val
65 70 75 80
Ala Cys Leu Gly Val Asp Gly Asn Asp Phe Val Leu Asn Ser Arg Leu
85 90 95
Gln Asp Ala Asn Ala Glu Glu Val Tyr Gly Pro Leu Thr Ile Pro Val
100 105 110
Phe Gly Ser Asp Val Val Tyr Asp Cys Pro Asn Ser Lys Leu Met Glu
115 120 125
Gln Lys Lys Phe Val Lys Phe Gly Leu Thr Gln Lys Ala Leu Glu Ser
130 135 140
His Val Gln Leu Ile Glu Arg Glu Val Leu Asp Tyr Val Glu Thr Asp
145 150 155 160
Pro Ser Phe Ser Gly Arg Thr Ser Thr Ile Asp Val Pro Lys Ala Met
165 170 175
Ala Glu Ile Thr Ile Phe Thr Ala Ser Arg Ser Leu Gln Gly Glu Glu
180 185 190
Val Arg Arg Lys Leu Thr Ala Glu Phe Ala Ala Leu Tyr His Asp Leu
195 200 205
Asp Leu Gly Phe Arg Pro Val Asn Phe Leu Phe Pro Trp Leu Pro Leu
210 215 220
Pro His Asn Arg Lys Arg Asp Ala Ala His Ile Lys Met Arg Glu Val
225 230 235 240
Tyr Met Asp Ile Ile Asn Asp Arg Arg Lys Gly Gly Ile Arg Thr Glu
245 250 255
Asp Gly Thr Asp Met Ile Ala Asn Leu Met Gly Cys Thr Tyr Lys Asn
260 265 270
Gly Gln Pro Val Pro Asp Lys Glu Ile Ala His Met Met Ile Thr Leu
275 280 285
Leu Met Ala Gly Gln His Ser Ser Ser Ser Ala Ser Ser Trp Ile Val
290 295 300
Leu His Leu Ala Ser Ser Pro Asp Ile Thr Glu Glu Leu Tyr Gln Glu
305 310 315 320
Gln Leu Val Asn Leu Ser Val Asn Gly Ala Leu Pro Pro Leu Gln Tyr
325 330 335
Ser Asp Leu Asp Lys Leu Pro Leu Leu Gln Asn Val Val Lys Glu Thr
340 345 350
Leu Arg Val His Ser Ser Ile His Ser Ile Leu Arg Lys Val Lys Arg
355 360 365
Pro Met Gln Val Pro Asn Ser Pro Tyr Thr Ile Thr Thr Asp Lys Val
370 375 380
Ile Met Ala Ser Pro Thr Val Thr Ala Met Ser Glu Glu Tyr Phe Glu
385 390 395 400
Asn Ala Lys Thr Trp Asn Pro His Arg Trp Asp Asn Arg Ala Lys Glu
405 410 415
Glu Val Asp Thr Glu Asp Val Ile Asp Tyr Gly Tyr Gly Ala Val Ser
420 425 430
Lys Gly Thr Lys Ser Pro Tyr Leu Pro Phe Gly Ala Gly Arg His Arg
435 440 445
Cys Ile Gly Glu Lys Phe Ala Tyr Val Asn Leu Gly Val Ile Val Ala
450 455 460
Thr Leu Val Arg Asn Phe Arg Leu Ser Thr Ile Asp Gly Arg Pro Gly
465 470 475 480
Val Pro Glu Thr Asp Tyr Thr Ser Leu Phe Ser Arg Pro Ala Gln Pro
485 490 495
Ala Phe Ile Arg Trp Glu Arg Arg Lys Lys Ile
500 505
<210> 19
<211> 5060
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 19
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg ggacttttgc aagaacttgc cgggcacccc ctagcacagc 1080
aattccagga acttcctttg ggtcaacagg ttggaattgg ctttgccgtt tttttggtcc 1140
tctcggtagt ccttaatgtt ctaaaccagc ttttattcag gaatccaaat gaaccgccaa 1200
tggtctttca ttggttccct tttgtaggga gcacaatcac gtacggtatg gatcccccta 1260
catttttcag agaaaacaga gctaaacatg gcgacgtatt cacctttatt ctcttgggaa 1320
agaaaactac ggttgctgtc ggcccggcag gaaatgactt cattttaaac ggtaagctta 1380
aggacgtatg tgctgaagag atctacacgg ttctcacaac tccagtattc ggcaaagatg 1440
tcgtttatga ttgtccaaac gctaagttaa tggaacaaaa aaagttcatg aaaattgctc 1500
tcacgacaga ggcatttaga tcttatgtgc ccataatcag ttcagaagtc agagactact 1560
ttaagagaag tccagacttc aagggaaagt ccggtattgc agatatacca aaaaagatgg 1620
ctgagattac aatattcact gcttcccacg ccctccaagg ttcggctata agaagtaagt 1680
ttgatgagag cttggcagct ttgtatcacg atctagacat gggctttaca ccgattaact 1740
ttatgttaca ctgggcaccg ctgccttgga acaggaagcg agatcacgct caaagaacgg 1800
tcgcaaaaat atatatggat acgattaaag agcgacgtgc aaaaggtaac aatgaatcag 1860
aacatgatat gatgaagcat ctgatgaact cgacgtacaa aaatggaata cgagttcccg 1920
atcacgaggt tgcacacatg atgatcgcac tccttatggc tggacagcat agttcttcaa 1980
gtactagctc gtggataatg ctgcgtttgg ctcagtatcc ccatatcatg gaggaattat 2040
atcaggagca ggtaaagaat ttaggggcag atctgcctcc attgacatat gaggatctag 2100
ccaaacttcc gttgaatcaa gctatcgtaa aagaaacttt acgtttacat gctccaatcc 2160
actctattat gagggctgtc aaatccccaa tgcccgtacc tggcaccaaa tatgtgatac 2220
cgacatcaca cacacttcta gctgcacccg gtgtctcggc tacggactct gcatttttcc 2280
caaatcctga tgaatgggac cctcacagat gggaggctga ttcccctaac tttcccagga 2340
tggcttcgaa aggagaggac gaggaaaaaa tagattatgg gtatggttta gtctcaaaag 2400
gctccgcttc gccgtatctg ccctttggag ctggtaggca ccgatgcatt ggggaacact 2460
ttgctaatgc tcaattacag acaatcgtag ctgaagtcgt gagggaattt aaatttcgta 2520
atgtcgatgg aggtcacacg ttaattgata ctgattacgc ctcattgttc tcgcgaccct 2580
tggaacccgc taacatccat tgggaacgta gacaataggt cgacctgcaa gatctgcggc 2640
cgcgaattaa ttcgccttag acatgactgt tcctcagttc aagttgggca cttacgagaa 2700
gaccggtctt gctagattct aatcaagagg atgtcagaat gccatttgcc tgagagatgc 2760
aggcttcatt tttgatactt ttttatttgt aacctatata gtataggatt ttttttgtca 2820
ttttgtttct tctcgtacga gcttgctcct gatcagccta tctcgcagct gatgaatatc 2880
ttgtggtagg ggtttgggaa aatcattcga gtttgatgtt tttcttggta tttcccactc 2940
ctcttcagag tacagaagat taagtgagac cttcgtttgt gcggatccaa ttaatattta 3000
cttattttgg tcaaccccaa ataggttgat ttcatacttg gttcattcaa aaataagtag 3060
tcttttgaga tctttcaata ttataataaa tatactataa cagccgactt gtttcatttt 3120
cgcgaatgtt cccccagctt atcggatccc ccacacacca tagcttcaaa atgtttctac 3180
tcctttttta ctcttccaga ttttctcgga ctccgcgcat cgccgtacca cttcaaaaca 3240
cccaagcaca gcatactaaa tttcccctct ttcttcctct agggtgtcgt taattacccg 3300
tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt ctttttcttc gtcgaaaaag 3360
gcaataaaaa tttttatcac gtttcttttt cttgaaattt ttttttttag tttttttctc 3420
tttcagtgac ctccattgat atttaagtta ataaacggtc ttcaatttct caagtttcag 3480
tttcattttt cttgttctat tacaactttt tttacttctt gttcattaga aagaaagcat 3540
agcaatctaa tctaaggggc ggtgttgaca attaatcatc ggcatagtat atcggcatag 3600
tataatacga caaggtgagg aactaaacca tggccaagtt gaccagtgcc gttccggtgc 3660
tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc 3720
gggacttcgt ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca 3780
gcgcggtcca ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc 3840
tggacgagct gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg 3900
ggccggccat gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc 3960
cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga ctgacacgtc cgacggcggc 4020
ccacgggtcc caggcctcgg agatccgtcc cccttttcct ttgtcgatat catgtaatta 4080
gttatgtcac gcttacattc acgccctccc cccacatccg ctctaaccga aaaggaagga 4140
gttagacaac ctgaagtcta ggtccctatt tattttttta tagttatgtt agtattaaga 4200
acgttattta tatttcaaat ttttcttttt tttctgtaca gacgcgtgta cgcatgtaac 4260
attatactga aaaccttgct tgagaaggtt ttgggacgct cgaaggcttt aatttgcaag 4320
ctggagacca acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 4380
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 4440
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 4500
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 4560
ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 4620
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 4680
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 4740
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 4800
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 4860
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 4920
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 4980
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 5040
gggattttgg tcatgagatc 5060
<210> 20
<211> 1581
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 20
atgggacttt tgcaagaact tgccgggcac cccctagcac agcaattcca ggaacttcct 60
ttgggtcaac aggttggaat tggctttgcc gtttttttgg tcctctcggt agtccttaat 120
gttctaaacc agcttttatt caggaatcca aatgaaccgc caatggtctt tcattggttc 180
ccttttgtag ggagcacaat cacgtacggt atggatcccc ctacattttt cagagaaaac 240
agagctaaac atggcgacgt attcaccttt attctcttgg gaaagaaaac tacggttgct 300
gtcggcccgg caggaaatga cttcatttta aacggtaagc ttaaggacgt atgtgctgaa 360
gagatctaca cggttctcac aactccagta ttcggcaaag atgtcgttta tgattgtcca 420
aacgctaagt taatggaaca aaaaaagttc atgaaaattg ctctcacgac agaggcattt 480
agatcttatg tgcccataat cagttcagaa gtcagagact actttaagag aagtccagac 540
ttcaagggaa agtccggtat tgcagatata ccaaaaaaga tggctgagat tacaatattc 600
actgcttccc acgccctcca aggttcggct ataagaagta agtttgatga gagcttggca 660
gctttgtatc acgatctaga catgggcttt acaccgatta actttatgtt acactgggca 720
ccgctgcctt ggaacaggaa gcgagatcac gctcaaagaa cggtcgcaaa aatatatatg 780
gatacgatta aagagcgacg tgcaaaaggt aacaatgaat cagaacatga tatgatgaag 840
catctgatga actcgacgta caaaaatgga atacgagttc ccgatcacga ggttgcacac 900
atgatgatcg cactccttat ggctggacag catagttctt caagtactag ctcgtggata 960
atgctgcgtt tggctcagta tccccatatc atggaggaat tatatcagga gcaggtaaag 1020
aatttagggg cagatctgcc tccattgaca tatgaggatc tagccaaact tccgttgaat 1080
caagctatcg taaaagaaac tttacgttta catgctccaa tccactctat tatgagggct 1140
gtcaaatccc caatgcccgt acctggcacc aaatatgtga taccgacatc acacacactt 1200
ctagctgcac ccggtgtctc ggctacggac tctgcatttt tcccaaatcc tgatgaatgg 1260
gaccctcaca gatgggaggc tgattcccct aactttccca ggatggcttc gaaaggagag 1320
gacgaggaaa aaatagatta tgggtatggt ttagtctcaa aaggctccgc ttcgccgtat 1380
ctgccctttg gagctggtag gcaccgatgc attggggaac actttgctaa tgctcaatta 1440
cagacaatcg tagctgaagt cgtgagggaa tttaaatttc gtaatgtcga tggaggtcac 1500
acgttaattg atactgatta cgcctcattg ttctcgcgac ccttggaacc cgctaacatc 1560
cattgggaac gtagacaata g 1581
<210> 21
<211> 526
<212> PRT
<213> 禾谷镰孢菌
<400> 21
Met Gly Leu Leu Gln Glu Leu Ala Gly His Pro Leu Ala Gln Gln Phe
1 5 10 15
Gln Glu Leu Pro Leu Gly Gln Gln Val Gly Ile Gly Phe Ala Val Phe
20 25 30
Leu Val Leu Ser Val Val Leu Asn Val Leu Asn Gln Leu Leu Phe Arg
35 40 45
Asn Pro Asn Glu Pro Pro Met Val Phe His Trp Phe Pro Phe Val Gly
50 55 60
Ser Thr Ile Thr Tyr Gly Met Asp Pro Pro Thr Phe Phe Arg Glu Asn
65 70 75 80
Arg Ala Lys His Gly Asp Val Phe Thr Phe Ile Leu Leu Gly Lys Lys
85 90 95
Thr Thr Val Ala Val Gly Pro Ala Gly Asn Asp Phe Ile Leu Asn Gly
100 105 110
Lys Leu Lys Asp Val Cys Ala Glu Glu Ile Tyr Thr Val Leu Thr Thr
115 120 125
Pro Val Phe Gly Lys Asp Val Val Tyr Asp Cys Pro Asn Ala Lys Leu
130 135 140
Met Glu Gln Lys Lys Phe Met Lys Ile Ala Leu Thr Thr Glu Ala Phe
145 150 155 160
Arg Ser Tyr Val Pro Ile Ile Ser Ser Glu Val Arg Asp Tyr Phe Lys
165 170 175
Arg Ser Pro Asp Phe Lys Gly Lys Ser Gly Ile Ala Asp Ile Pro Lys
180 185 190
Lys Met Ala Glu Ile Thr Ile Phe Thr Ala Ser His Ala Leu Gln Gly
195 200 205
Ser Ala Ile Arg Ser Lys Phe Asp Glu Ser Leu Ala Ala Leu Tyr His
210 215 220
Asp Leu Asp Met Gly Phe Thr Pro Ile Asn Phe Met Leu His Trp Ala
225 230 235 240
Pro Leu Pro Trp Asn Arg Lys Arg Asp His Ala Gln Arg Thr Val Ala
245 250 255
Lys Ile Tyr Met Asp Thr Ile Lys Glu Arg Arg Ala Lys Gly Asn Asn
260 265 270
Glu Ser Glu His Asp Met Met Lys His Leu Met Asn Ser Thr Tyr Lys
275 280 285
Asn Gly Ile Arg Val Pro Asp His Glu Val Ala His Met Met Ile Ala
290 295 300
Leu Leu Met Ala Gly Gln His Ser Ser Ser Ser Thr Ser Ser Trp Ile
305 310 315 320
Met Leu Arg Leu Ala Gln Tyr Pro His Ile Met Glu Glu Leu Tyr Gln
325 330 335
Glu Gln Val Lys Asn Leu Gly Ala Asp Leu Pro Pro Leu Thr Tyr Glu
340 345 350
Asp Leu Ala Lys Leu Pro Leu Asn Gln Ala Ile Val Lys Glu Thr Leu
355 360 365
Arg Leu His Ala Pro Ile His Ser Ile Met Arg Ala Val Lys Ser Pro
370 375 380
Met Pro Val Pro Gly Thr Lys Tyr Val Ile Pro Thr Ser His Thr Leu
385 390 395 400
Leu Ala Ala Pro Gly Val Ser Ala Thr Asp Ser Ala Phe Phe Pro Asn
405 410 415
Pro Asp Glu Trp Asp Pro His Arg Trp Glu Ala Asp Ser Pro Asn Phe
420 425 430
Pro Arg Met Ala Ser Lys Gly Glu Asp Glu Glu Lys Ile Asp Tyr Gly
435 440 445
Tyr Gly Leu Val Ser Lys Gly Ser Ala Ser Pro Tyr Leu Pro Phe Gly
450 455 460
Ala Gly Arg His Arg Cys Ile Gly Glu His Phe Ala Asn Ala Gln Leu
465 470 475 480
Gln Thr Ile Val Ala Glu Val Val Arg Glu Phe Lys Phe Arg Asn Val
485 490 495
Asp Gly Gly His Thr Leu Ile Asp Thr Asp Tyr Ala Ser Leu Phe Ser
500 505 510
Arg Pro Leu Glu Pro Ala Asn Ile His Trp Glu Arg Arg Gln
515 520 525
<210> 22
<211> 4994
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 22
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg ggagtcaata acgcgacttt gggcttggta tgctgtgtta 1080
tcgtcgcggt ggttgcttta gcgacgcgaa aggggcctga ctcaagagag cccccgtatg 1140
ttaaggaaag ggtcccctac ttcagtcaca tctacggact tttgaagcat ggcttacgtt 1200
attttgatgt tgtcagtgct cagcaacccc accccatatt tacgatagat atgtcgggcc 1260
agaagaacta tatagtaact tctcctgaac tggttcaagc ggtgcaacgc aacacaacgt 1320
cgttgagctt ctccccggca atgattcccg cttttcgacg catgatgggg tttgatgaag 1380
ctgggatcga gctgattttt cgggatgcac atacagaaaa aggcatgtac ggggaaattc 1440
acagggtcca gaaggcgtct ttacttccgg gaactgagtc gttggacgaa ctttgcacca 1500
ttatacgagg taagttgtta acaattgtga atgacatgcc ctcctctcaa acaatcgatc 1560
tgtacgcgtg ggtccaggac ctttacatga ggacaaataa ctctgcttgc tttggcgcaa 1620
aggatccttt tactttaaac ccgtccctga tttcgacctt ctggttgtgg gaggcgaata 1680
ttaaggtatt gttactgggg attccatggt tcctatcccc ctcaaaatat tcaactgctc 1740
agcgaactag aaacgattta gtgaacgcgt tcacgcaata cttgggtaat gatgggcttg 1800
aaactgcttg tagctttatc aaagaactat ctaatttggg gattcgtaga ggccttagta 1860
ccgaaaataa cgcgagggcg ctggtcggca gcatcctggc aatcgtgggg aatacaattc 1920
cgacaacctt ttggcttctc attcagatct tctccaggcc agacctgctc aaggagatac 1980
gttctgagct tgaggcaacg ctggaagatc catctagtcg atcagaaata tcactcaact 2040
atactgtgat cagagaaaag tgtccagttc ttatgtctac atatgaggaa attctcagga 2100
tgacgagcgg tatcgcaaca gtcaggtaca cgaatgagga tacgttaatc caggaccgct 2160
ggttgttaaa gaaaggcgca caagtgcaaa tgcccactgc cttcatacat gccgacccaa 2220
ccacgtgggg cgcagacgcg gaggtctttg atcacactag gttcttgaaa tctaaggttc 2280
tgacaaaaga gcaaaaagcg cgcagagccg ctgccttccg gccttttggg ggtggcaaca 2340
ccctgtgccc gggacggcac ttcgcgtctt atgaggtgct taccttcgcc gggagcatcc 2400
tgctcggttt tgatatgaca cccacaactg aagctttcaa cctccccgag atggataggt 2460
ctaagcttcc tctgacctcc ctgaaaccag ctggggatat caaagtcaac ctaacccgcc 2520
gttccgggtg ggagaaggtg caattcaagt gagtcgacct gcaagatctg cggccgcgaa 2580
ttaattcgcc ttagacatga ctgttcctca gttcaagttg ggcacttacg agaagaccgg 2640
tcttgctaga ttctaatcaa gaggatgtca gaatgccatt tgcctgagag atgcaggctt 2700
catttttgat acttttttat ttgtaaccta tatagtatag gatttttttt gtcattttgt 2760
ttcttctcgt acgagcttgc tcctgatcag cctatctcgc agctgatgaa tatcttgtgg 2820
taggggtttg ggaaaatcat tcgagtttga tgtttttctt ggtatttccc actcctcttc 2880
agagtacaga agattaagtg agaccttcgt ttgtgcggat ccaattaata tttacttatt 2940
ttggtcaacc ccaaataggt tgatttcata cttggttcat tcaaaaataa gtagtctttt 3000
gagatctttc aatattataa taaatatact ataacagccg acttgtttca ttttcgcgaa 3060
tgttccccca gcttatcgga tcccccacac accatagctt caaaatgttt ctactccttt 3120
tttactcttc cagattttct cggactccgc gcatcgccgt accacttcaa aacacccaag 3180
cacagcatac taaatttccc ctctttcttc ctctagggtg tcgttaatta cccgtactaa 3240
aggtttggaa aagaaaaaag agaccgcctc gtttcttttt cttcgtcgaa aaaggcaata 3300
aaaattttta tcacgtttct ttttcttgaa attttttttt ttagtttttt tctctttcag 3360
tgacctccat tgatatttaa gttaataaac ggtcttcaat ttctcaagtt tcagtttcat 3420
ttttcttgtt ctattacaac tttttttact tcttgttcat tagaaagaaa gcatagcaat 3480
ctaatctaag gggcggtgtt gacaattaat catcggcata gtatatcggc atagtataat 3540
acgacaaggt gaggaactaa accatggcca agttgaccag tgccgttccg gtgctcaccg 3600
cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc tcccgggact 3660
tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc atcagcgcgg 3720
tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc ggcctggacg 3780
agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc tccgggccgg 3840
ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc gacccggccg 3900
gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtccgacgg cggcccacgg 3960
gtcccaggcc tcggagatcc gtcccccttt tcctttgtcg atatcatgta attagttatg 4020
tcacgcttac attcacgccc tccccccaca tccgctctaa ccgaaaagga aggagttaga 4080
caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt aagaacgtta 4140
tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg taacattata 4200
ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg caagctggag 4260
accaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 4320
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 4380
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 4440
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 4500
ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 4560
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 4620
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 4680
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 4740
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 4800
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 4860
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 4920
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 4980
ttggtcatga gatc 4994
<210> 23
<211> 1515
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 23
atgggagtca ataacgcgac tttgggcttg gtatgctgtg ttatcgtcgc ggtggttgct 60
ttagcgacgc gaaaggggcc tgactcaaga gagcccccgt atgttaagga aagggtcccc 120
tacttcagtc acatctacgg acttttgaag catggcttac gttattttga tgttgtcagt 180
gctcagcaac cccaccccat atttacgata gatatgtcgg gccagaagaa ctatatagta 240
acttctcctg aactggttca agcggtgcaa cgcaacacaa cgtcgttgag cttctccccg 300
gcaatgattc ccgcttttcg acgcatgatg gggtttgatg aagctgggat cgagctgatt 360
tttcgggatg cacatacaga aaaaggcatg tacggggaaa ttcacagggt ccagaaggcg 420
tctttacttc cgggaactga gtcgttggac gaactttgca ccattatacg aggtaagttg 480
ttaacaattg tgaatgacat gccctcctct caaacaatcg atctgtacgc gtgggtccag 540
gacctttaca tgaggacaaa taactctgct tgctttggcg caaaggatcc ttttacttta 600
aacccgtccc tgatttcgac cttctggttg tgggaggcga atattaaggt attgttactg 660
gggattccat ggttcctatc cccctcaaaa tattcaactg ctcagcgaac tagaaacgat 720
ttagtgaacg cgttcacgca atacttgggt aatgatgggc ttgaaactgc ttgtagcttt 780
atcaaagaac tatctaattt ggggattcgt agaggcctta gtaccgaaaa taacgcgagg 840
gcgctggtcg gcagcatcct ggcaatcgtg gggaatacaa ttccgacaac cttttggctt 900
ctcattcaga tcttctccag gccagacctg ctcaaggaga tacgttctga gcttgaggca 960
acgctggaag atccatctag tcgatcagaa atatcactca actatactgt gatcagagaa 1020
aagtgtccag ttcttatgtc tacatatgag gaaattctca ggatgacgag cggtatcgca 1080
acagtcaggt acacgaatga ggatacgtta atccaggacc gctggttgtt aaagaaaggc 1140
gcacaagtgc aaatgcccac tgccttcata catgccgacc caaccacgtg gggcgcagac 1200
gcggaggtct ttgatcacac taggttcttg aaatctaagg ttctgacaaa agagcaaaaa 1260
gcgcgcagag ccgctgcctt ccggcctttt gggggtggca acaccctgtg cccgggacgg 1320
cacttcgcgt cttatgaggt gcttaccttc gccgggagca tcctgctcgg ttttgatatg 1380
acacccacaa ctgaagcttt caacctcccc gagatggata ggtctaagct tcctctgacc 1440
tccctgaaac cagctgggga tatcaaagtc aacctaaccc gccgttccgg gtgggagaag 1500
gtgcaattca agtga 1515
<210> 24
<211> 504
<212> PRT
<213> 禾谷镰孢菌
<400> 24
Met Gly Val Asn Asn Ala Thr Leu Gly Leu Val Cys Cys Val Ile Val
1 5 10 15
Ala Val Val Ala Leu Ala Thr Arg Lys Gly Pro Asp Ser Arg Glu Pro
20 25 30
Pro Tyr Val Lys Glu Arg Val Pro Tyr Phe Ser His Ile Tyr Gly Leu
35 40 45
Leu Lys His Gly Leu Arg Tyr Phe Asp Val Val Ser Ala Gln Gln Pro
50 55 60
His Pro Ile Phe Thr Ile Asp Met Ser Gly Gln Lys Asn Tyr Ile Val
65 70 75 80
Thr Ser Pro Glu Leu Val Gln Ala Val Gln Arg Asn Thr Thr Ser Leu
85 90 95
Ser Phe Ser Pro Ala Met Ile Pro Ala Phe Arg Arg Met Met Gly Phe
100 105 110
Asp Glu Ala Gly Ile Glu Leu Ile Phe Arg Asp Ala His Thr Glu Lys
115 120 125
Gly Met Tyr Gly Glu Ile His Arg Val Gln Lys Ala Ser Leu Leu Pro
130 135 140
Gly Thr Glu Ser Leu Asp Glu Leu Cys Thr Ile Ile Arg Gly Lys Leu
145 150 155 160
Leu Thr Ile Val Asn Asp Met Pro Ser Ser Gln Thr Ile Asp Leu Tyr
165 170 175
Ala Trp Val Gln Asp Leu Tyr Met Arg Thr Asn Asn Ser Ala Cys Phe
180 185 190
Gly Ala Lys Asp Pro Phe Thr Leu Asn Pro Ser Leu Ile Ser Thr Phe
195 200 205
Trp Leu Trp Glu Ala Asn Ile Lys Val Leu Leu Leu Gly Ile Pro Trp
210 215 220
Phe Leu Ser Pro Ser Lys Tyr Ser Thr Ala Gln Arg Thr Arg Asn Asp
225 230 235 240
Leu Val Asn Ala Phe Thr Gln Tyr Leu Gly Asn Asp Gly Leu Glu Thr
245 250 255
Ala Cys Ser Phe Ile Lys Glu Leu Ser Asn Leu Gly Ile Arg Arg Gly
260 265 270
Leu Ser Thr Glu Asn Asn Ala Arg Ala Leu Val Gly Ser Ile Leu Ala
275 280 285
Ile Val Gly Asn Thr Ile Pro Thr Thr Phe Trp Leu Leu Ile Gln Ile
290 295 300
Phe Ser Arg Pro Asp Leu Leu Lys Glu Ile Arg Ser Glu Leu Glu Ala
305 310 315 320
Thr Leu Glu Asp Pro Ser Ser Arg Ser Glu Ile Ser Leu Asn Tyr Thr
325 330 335
Val Ile Arg Glu Lys Cys Pro Val Leu Met Ser Thr Tyr Glu Glu Ile
340 345 350
Leu Arg Met Thr Ser Gly Ile Ala Thr Val Arg Tyr Thr Asn Glu Asp
355 360 365
Thr Leu Ile Gln Asp Arg Trp Leu Leu Lys Lys Gly Ala Gln Val Gln
370 375 380
Met Pro Thr Ala Phe Ile His Ala Asp Pro Thr Thr Trp Gly Ala Asp
385 390 395 400
Ala Glu Val Phe Asp His Thr Arg Phe Leu Lys Ser Lys Val Leu Thr
405 410 415
Lys Glu Gln Lys Ala Arg Arg Ala Ala Ala Phe Arg Pro Phe Gly Gly
420 425 430
Gly Asn Thr Leu Cys Pro Gly Arg His Phe Ala Ser Tyr Glu Val Leu
435 440 445
Thr Phe Ala Gly Ser Ile Leu Leu Gly Phe Asp Met Thr Pro Thr Thr
450 455 460
Glu Ala Phe Asn Leu Pro Glu Met Asp Arg Ser Lys Leu Pro Leu Thr
465 470 475 480
Ser Leu Lys Pro Ala Gly Asp Ile Lys Val Asn Leu Thr Arg Arg Ser
485 490 495
Gly Trp Glu Lys Val Gln Phe Lys
500
<210> 25
<211> 5051
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 25
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg atattcgaca acttgtcgct cagcaacacg tgggttgtgt 1080
tagtacttag cgcggtattt cttgtgcttt cccgttttat tgctccgaca atctcagaga 1140
acgagcctcc catcgtcaag ccaagggccc ccttcattgg acacattatc tccatgttga 1200
gggacggctc cgatatctac gttaatttgt ttaagcaaag aaaggaacca atagttactt 1260
tacccatgtt aaatggaaaa ttatacgtga taaattctcc agacctcata caggccgcat 1320
tgcgtaacaa tgacatctct ttcacaccgt tcattcttga gtcgtcaaaa gcaatgtggg 1380
ggttatctga taatgcgatg gcgagcatat ctgaccttgc caacttgaaa ggcggtatgc 1440
agattatcca ctcaaccctc ggaggggagt cgcttcataa attgaacata tcgtctctga 1500
gtaggttcat gacttatttg aatcgcgtta aacccggcga aaatattggt atagccgaca 1560
cttatatttg gctgagagac atgctcaccg acgctagcgc gaccgcggtc tatggtccta 1620
agaatccaat aaccgtcgat aaaatgcacc tagtatggta ctcgttacta caatccattt 1680
actctacttg ttccaacagt ggtcgagatt acgataaaca agcgttactt gtcgcaatag 1740
gcctcccttc cttcgtgaca aaagccgcga taaatgctcg tctaaaggtt aataacttgc 1800
ttctgtcgta ctataaaaat ggtggcaacc atgaaaaagg ggcgtctgaa atcatacaac 1860
agcgggcaac gtatctgcga aagacagggt tcacagatga cgatttgtcc cacatggagt 1920
tcatgatact atgggtagga gtgactaata ctgcacccgt tctattctgg ttgtttgtcc 1980
acgttcttac gtctgctggc tatacgagcc gcgtgcgggc tgagatagag gcgataacaa 2040
taatcaccaa gacgccagag ggcagaaaag caaccttcga tacccgttta ctcgagaaat 2100
cctgcccatt cctcaacgcg tgttaccagg aatgccttcg acattactct cactcgatcg 2160
gtaatcgtcg agtcatgcag gatactgaga tccaagattc tcagggccga aagtaccttc 2220
taaagaaagg cgttaacgtt caatggccgc ctccggtcac acatttcaat acggaagttt 2280
ggggccagga cgcggatgta tttcgtccag aaagatttat ggacgtcact cctcaggacg 2340
aaaaaaagag gagaggcgcc ctgttatcct tcggaggtgg caaacacctt tgcccgggta 2400
gaaagttcgc gtacacagaa ttgctagggc ttgtgggggt tgtggctctt ggcttcgaag 2460
ttaagggtct ggagctaccc gaaagtaaat acgcaggaat cggcatagga ggcaagatgc 2520
ctgattggga gaatatggaa aaaggcttcg gtctaagacg tcgagagggg tgggaggatg 2580
ttacctgggt ctttgatgga gataattgag tcgacctgca agatctgcgg ccgcgaatta 2640
attcgcctta gacatgactg ttcctcagtt caagttgggc acttacgaga agaccggtct 2700
tgctagattc taatcaagag gatgtcagaa tgccatttgc ctgagagatg caggcttcat 2760
ttttgatact tttttatttg taacctatat agtataggat tttttttgtc attttgtttc 2820
ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat cttgtggtag 2880
gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact cctcttcaga 2940
gtacagaaga ttaagtgaga ccttcgtttg tgcggatcca attaatattt acttattttg 3000
gtcaacccca aataggttga tttcatactt ggttcattca aaaataagta gtcttttgag 3060
atctttcaat attataataa atatactata acagccgact tgtttcattt tcgcgaatgt 3120
tcccccagct tatcggatcc cccacacacc atagcttcaa aatgtttcta ctcctttttt 3180
actcttccag attttctcgg actccgcgca tcgccgtacc acttcaaaac acccaagcac 3240
agcatactaa atttcccctc tttcttcctc tagggtgtcg ttaattaccc gtactaaagg 3300
tttggaaaag aaaaaagaga ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa 3360
atttttatca cgtttctttt tcttgaaatt ttttttttta gtttttttct ctttcagtga 3420
cctccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca gtttcatttt 3480
tcttgttcta ttacaacttt ttttacttct tgttcattag aaagaaagca tagcaatcta 3540
atctaagggg cggtgttgac aattaatcat cggcatagta tatcggcata gtataatacg 3600
acaaggtgag gaactaaacc atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc 3660
gcgacgtcgc cggagcggtc gagttctgga ccgaccggct cgggttctcc cgggacttcg 3720
tggaggacga cttcgccggt gtggtccggg acgacgtgac cctgttcatc agcgcggtcc 3780
aggaccaggt ggtgccggac aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc 3840
tgtacgccga gtggtcggag gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca 3900
tgaccgagat cggcgagcag ccgtgggggc gggagttcgc cctgcgcgac ccggccggca 3960
actgcgtgca cttcgtggcc gaggagcagg actgacacgt ccgacggcgg cccacgggtc 4020
ccaggcctcg gagatccgtc ccccttttcc tttgtcgata tcatgtaatt agttatgtca 4080
cgcttacatt cacgccctcc ccccacatcc gctctaaccg aaaaggaagg agttagacaa 4140
cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag aacgttattt 4200
atatttcaaa tttttctttt ttttctgtac agacgcgtgt acgcatgtaa cattatactg 4260
aaaaccttgc ttgagaaggt tttgggacgc tcgaaggctt taatttgcaa gctggagacc 4320
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 4380
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 4440
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 4500
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 4560
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 4620
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 4680
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 4740
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 4800
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 4860
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 4920
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 4980
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 5040
gtcatgagat c 5051
<210> 26
<211> 1572
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 26
atgatattcg acaacttgtc gctcagcaac acgtgggttg tgttagtact tagcgcggta 60
tttcttgtgc tttcccgttt tattgctccg acaatctcag agaacgagcc tcccatcgtc 120
aagccaaggg cccccttcat tggacacatt atctccatgt tgagggacgg ctccgatatc 180
tacgttaatt tgtttaagca aagaaaggaa ccaatagtta ctttacccat gttaaatgga 240
aaattatacg tgataaattc tccagacctc atacaggccg cattgcgtaa caatgacatc 300
tctttcacac cgttcattct tgagtcgtca aaagcaatgt gggggttatc tgataatgcg 360
atggcgagca tatctgacct tgccaacttg aaaggcggta tgcagattat ccactcaacc 420
ctcggagggg agtcgcttca taaattgaac atatcgtctc tgagtaggtt catgacttat 480
ttgaatcgcg ttaaacccgg cgaaaatatt ggtatagccg acacttatat ttggctgaga 540
gacatgctca ccgacgctag cgcgaccgcg gtctatggtc ctaagaatcc aataaccgtc 600
gataaaatgc acctagtatg gtactcgtta ctacaatcca tttactctac ttgttccaac 660
agtggtcgag attacgataa acaagcgtta cttgtcgcaa taggcctccc ttccttcgtg 720
acaaaagccg cgataaatgc tcgtctaaag gttaataact tgcttctgtc gtactataaa 780
aatggtggca accatgaaaa aggggcgtct gaaatcatac aacagcgggc aacgtatctg 840
cgaaagacag ggttcacaga tgacgatttg tcccacatgg agttcatgat actatgggta 900
ggagtgacta atactgcacc cgttctattc tggttgtttg tccacgttct tacgtctgct 960
ggctatacga gccgcgtgcg ggctgagata gaggcgataa caataatcac caagacgcca 1020
gagggcagaa aagcaacctt cgatacccgt ttactcgaga aatcctgccc attcctcaac 1080
gcgtgttacc aggaatgcct tcgacattac tctcactcga tcggtaatcg tcgagtcatg 1140
caggatactg agatccaaga ttctcagggc cgaaagtacc ttctaaagaa aggcgttaac 1200
gttcaatggc cgcctccggt cacacatttc aatacggaag tttggggcca ggacgcggat 1260
gtatttcgtc cagaaagatt tatggacgtc actcctcagg acgaaaaaaa gaggagaggc 1320
gccctgttat ccttcggagg tggcaaacac ctttgcccgg gtagaaagtt cgcgtacaca 1380
gaattgctag ggcttgtggg ggttgtggct cttggcttcg aagttaaggg tctggagcta 1440
cccgaaagta aatacgcagg aatcggcata ggaggcaaga tgcctgattg ggagaatatg 1500
gaaaaaggct tcggtctaag acgtcgagag gggtgggagg atgttacctg ggtctttgat 1560
ggagataatt ga 1572
<210> 27
<211> 523
<212> PRT
<213> 禾谷镰孢菌
<400> 27
Met Ile Phe Asp Asn Leu Ser Leu Ser Asn Thr Trp Val Val Leu Val
1 5 10 15
Leu Ser Ala Val Phe Leu Val Leu Ser Arg Phe Ile Ala Pro Thr Ile
20 25 30
Ser Glu Asn Glu Pro Pro Ile Val Lys Pro Arg Ala Pro Phe Ile Gly
35 40 45
His Ile Ile Ser Met Leu Arg Asp Gly Ser Asp Ile Tyr Val Asn Leu
50 55 60
Phe Lys Gln Arg Lys Glu Pro Ile Val Thr Leu Pro Met Leu Asn Gly
65 70 75 80
Lys Leu Tyr Val Ile Asn Ser Pro Asp Leu Ile Gln Ala Ala Leu Arg
85 90 95
Asn Asn Asp Ile Ser Phe Thr Pro Phe Ile Leu Glu Ser Ser Lys Ala
100 105 110
Met Trp Gly Leu Ser Asp Asn Ala Met Ala Ser Ile Ser Asp Leu Ala
115 120 125
Asn Leu Lys Gly Gly Met Gln Ile Ile His Ser Thr Leu Gly Gly Glu
130 135 140
Ser Leu His Lys Leu Asn Ile Ser Ser Leu Ser Arg Phe Met Thr Tyr
145 150 155 160
Leu Asn Arg Val Lys Pro Gly Glu Asn Ile Gly Ile Ala Asp Thr Tyr
165 170 175
Ile Trp Leu Arg Asp Met Leu Thr Asp Ala Ser Ala Thr Ala Val Tyr
180 185 190
Gly Pro Lys Asn Pro Ile Thr Val Asp Lys Met His Leu Val Trp Tyr
195 200 205
Ser Leu Leu Gln Ser Ile Tyr Ser Thr Cys Ser Asn Ser Gly Arg Asp
210 215 220
Tyr Asp Lys Gln Ala Leu Leu Val Ala Ile Gly Leu Pro Ser Phe Val
225 230 235 240
Thr Lys Ala Ala Ile Asn Ala Arg Leu Lys Val Asn Asn Leu Leu Leu
245 250 255
Ser Tyr Tyr Lys Asn Gly Gly Asn His Glu Lys Gly Ala Ser Glu Ile
260 265 270
Ile Gln Gln Arg Ala Thr Tyr Leu Arg Lys Thr Gly Phe Thr Asp Asp
275 280 285
Asp Leu Ser His Met Glu Phe Met Ile Leu Trp Val Gly Val Thr Asn
290 295 300
Thr Ala Pro Val Leu Phe Trp Leu Phe Val His Val Leu Thr Ser Ala
305 310 315 320
Gly Tyr Thr Ser Arg Val Arg Ala Glu Ile Glu Ala Ile Thr Ile Ile
325 330 335
Thr Lys Thr Pro Glu Gly Arg Lys Ala Thr Phe Asp Thr Arg Leu Leu
340 345 350
Glu Lys Ser Cys Pro Phe Leu Asn Ala Cys Tyr Gln Glu Cys Leu Arg
355 360 365
His Tyr Ser His Ser Ile Gly Asn Arg Arg Val Met Gln Asp Thr Glu
370 375 380
Ile Gln Asp Ser Gln Gly Arg Lys Tyr Leu Leu Lys Lys Gly Val Asn
385 390 395 400
Val Gln Trp Pro Pro Pro Val Thr His Phe Asn Thr Glu Val Trp Gly
405 410 415
Gln Asp Ala Asp Val Phe Arg Pro Glu Arg Phe Met Asp Val Thr Pro
420 425 430
Gln Asp Glu Lys Lys Arg Arg Gly Ala Leu Leu Ser Phe Gly Gly Gly
435 440 445
Lys His Leu Cys Pro Gly Arg Lys Phe Ala Tyr Thr Glu Leu Leu Gly
450 455 460
Leu Val Gly Val Val Ala Leu Gly Phe Glu Val Lys Gly Leu Glu Leu
465 470 475 480
Pro Glu Ser Lys Tyr Ala Gly Ile Gly Ile Gly Gly Lys Met Pro Asp
485 490 495
Trp Glu Asn Met Glu Lys Gly Phe Gly Leu Arg Arg Arg Glu Gly Trp
500 505 510
Glu Asp Val Thr Trp Val Phe Asp Gly Asp Asn
515 520
<210> 28
<211> 5048
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 28
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gagtccatga taattactcc tgagatgaac tcaactttaa 1080
agatcgcgga tgtccaagcc cacgacttac ctttgcaaca caactttctg tcatacttgt 1140
ttggattgct aatcgccaca tatatagtat ggcagtattt cctgcgaact ggagtcacgg 1200
agtcagcttg ctccgagcct ccaatgctac cctattggat ccccgtggta ggtcatacct 1260
tcagtttctt gactaatact cataatacga taatgtcggg ccggagtcac ttcaaatcta 1320
taacacatcc cttctctctg ttgattggag gtagaaggac ttacgtagtc cttgacccgc 1380
actatattgg aaaggtgtac aagaaaacga aagatttggt tcatgagccg tttatagatc 1440
acttaatgat gtgcatcggg acaactcaaa aaacgaggga cataatgtgg aacacaatga 1500
tcggggactc cagtctaacc gattcggctc tcgattggct tagggaggaa gtctcccaat 1560
cgccttctag ccaaccattt ttcgacagat tcatgatgga attggatcat ggcctccagc 1620
aaggcgaccc gcttactacg gggcgacttc gggaacataa catgcttaag tttgttgaaa 1680
caattataat caccgtatca actaatagct tctttgggaa ggtgcttcta aaacaatctc 1740
cagaaattct tgactcgttt ccaatttttg accgacacgt ctggaagatg gtattccgcg 1800
caccaaaatt tactttcatg acggcacaca acgcgaaggg ttctgtcatc gacggtctta 1860
ctaaatattt tgatttacca caaagtgaga gacaggacgc cgcttctttt atccttaaaa 1920
gtgaggacgc aatgcgtgag aatggaatct gctcacggga gattgcggcc ctgctcttta 1980
aattcttttg gggcataaat ggcatgcccg cgacactggc cttctggttt cttgccagga 2040
ctgtctacac accacacctt tgggaggata tacgtgcaga ggtcgcaccg gcctttagga 2100
atggtattca ttcaccccca gacatagggt atttgaaaaa gtgcccaaaa ttaaacgcca 2160
ccttccacga aacgttacgc atccacggtg ggacggctgg atttaggcaa gtcgcgagtg 2220
ataccgtcat aggtggattt accttcaagg ccgggtccga cgttataatg ccgtaccggc 2280
aaatgcacct agatgagggg atctgggggc aggacgctaa gacttttgat attgatcgct 2340
ttattcataa cccgaaacta gctaccgcaa agacatttaa gccttttgga ggcggtgtaa 2400
cattgtgtcc aggacgcttc catgcgcacc gaactgctct gagctttatt gcgattgtta 2460
taacccgata cgacatccac gttgtgggcg gttgcgaatc gcgacccttc ccacatatga 2520
atacacgcgg accagaggtt ggtgttatat tcccagtctt ggagcaggtg ccacaaatta 2580
tagtaaaaaa tgttgacatt gaatgagtcg acctgcaaga tctgcggccg cgaattaatt 2640
cgccttagac atgactgttc ctcagttcaa gttgggcact tacgagaaga ccggtcttgc 2700
tagattctaa tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt 2760
tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc 2820
tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt gtggtagggg 2880
tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta 2940
cagaagatta agtgagacct tcgtttgtgc ggatccaatt aatatttact tattttggtc 3000
aaccccaaat aggttgattt catacttggt tcattcaaaa ataagtagtc ttttgagatc 3060
tttcaatatt ataataaata tactataaca gccgacttgt ttcattttcg cgaatgttcc 3120
cccagcttat cggatccccc acacaccata gcttcaaaat gtttctactc cttttttact 3180
cttccagatt ttctcggact ccgcgcatcg ccgtaccact tcaaaacacc caagcacagc 3240
atactaaatt tcccctcttt cttcctctag ggtgtcgtta attacccgta ctaaaggttt 3300
ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt cgaaaaaggc aataaaaatt 3360
tttatcacgt ttctttttct tgaaattttt ttttttagtt tttttctctt tcagtgacct 3420
ccattgatat ttaagttaat aaacggtctt caatttctca agtttcagtt tcatttttct 3480
tgttctatta caactttttt tacttcttgt tcattagaaa gaaagcatag caatctaatc 3540
taaggggcgg tgttgacaat taatcatcgg catagtatat cggcatagta taatacgaca 3600
aggtgaggaa ctaaaccatg gccaagttga ccagtgccgt tccggtgctc accgcgcgcg 3660
acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg gacttcgtgg 3720
aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc gcggtccagg 3780
accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg gacgagctgt 3840
acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg ccggccatga 3900
ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg gccggcaact 3960
gcgtgcactt cgtggccgag gagcaggact gacacgtccg acggcggccc acgggtccca 4020
ggcctcggag atccgtcccc cttttccttt gtcgatatca tgtaattagt tatgtcacgc 4080
ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 4140
gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 4200
tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat tatactgaaa 4260
accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcaagct ggagaccaac 4320
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 4380
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 4440
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 4500
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 4560
gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 4620
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 4680
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 4740
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 4800
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 4860
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 4920
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 4980
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 5040
atgagatc 5048
<210> 29
<211> 1569
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 29
atggagtcca tgataattac tcctgagatg aactcaactt taaagatcgc ggatgtccaa 60
gcccacgact tacctttgca acacaacttt ctgtcatact tgtttggatt gctaatcgcc 120
acatatatag tatggcagta tttcctgcga actggagtca cggagtcagc ttgctccgag 180
cctccaatgc taccctattg gatccccgtg gtaggtcata ccttcagttt cttgactaat 240
actcataata cgataatgtc gggccggagt cacttcaaat ctataacaca tcccttctct 300
ctgttgattg gaggtagaag gacttacgta gtccttgacc cgcactatat tggaaaggtg 360
tacaagaaaa cgaaagattt ggttcatgag ccgtttatag atcacttaat gatgtgcatc 420
gggacaactc aaaaaacgag ggacataatg tggaacacaa tgatcgggga ctccagtcta 480
accgattcgg ctctcgattg gcttagggag gaagtctccc aatcgccttc tagccaacca 540
tttttcgaca gattcatgat ggaattggat catggcctcc agcaaggcga cccgcttact 600
acggggcgac ttcgggaaca taacatgctt aagtttgttg aaacaattat aatcaccgta 660
tcaactaata gcttctttgg gaaggtgctt ctaaaacaat ctccagaaat tcttgactcg 720
tttccaattt ttgaccgaca cgtctggaag atggtattcc gcgcaccaaa atttactttc 780
atgacggcac acaacgcgaa gggttctgtc atcgacggtc ttactaaata ttttgattta 840
ccacaaagtg agagacagga cgccgcttct tttatcctta aaagtgagga cgcaatgcgt 900
gagaatggaa tctgctcacg ggagattgcg gccctgctct ttaaattctt ttggggcata 960
aatggcatgc ccgcgacact ggccttctgg tttcttgcca ggactgtcta cacaccacac 1020
ctttgggagg atatacgtgc agaggtcgca ccggccttta ggaatggtat tcattcaccc 1080
ccagacatag ggtatttgaa aaagtgccca aaattaaacg ccaccttcca cgaaacgtta 1140
cgcatccacg gtgggacggc tggatttagg caagtcgcga gtgataccgt cataggtgga 1200
tttaccttca aggccgggtc cgacgttata atgccgtacc ggcaaatgca cctagatgag 1260
gggatctggg ggcaggacgc taagactttt gatattgatc gctttattca taacccgaaa 1320
ctagctaccg caaagacatt taagcctttt ggaggcggtg taacattgtg tccaggacgc 1380
ttccatgcgc accgaactgc tctgagcttt attgcgattg ttataacccg atacgacatc 1440
cacgttgtgg gcggttgcga atcgcgaccc ttcccacata tgaatacacg cggaccagag 1500
gttggtgtta tattcccagt cttggagcag gtgccacaaa ttatagtaaa aaatgttgac 1560
attgaatga 1569
<210> 30
<211> 522
<212> PRT
<213> 禾谷镰孢菌
<400> 30
Met Glu Ser Met Ile Ile Thr Pro Glu Met Asn Ser Thr Leu Lys Ile
1 5 10 15
Ala Asp Val Gln Ala His Asp Leu Pro Leu Gln His Asn Phe Leu Ser
20 25 30
Tyr Leu Phe Gly Leu Leu Ile Ala Thr Tyr Ile Val Trp Gln Tyr Phe
35 40 45
Leu Arg Thr Gly Val Thr Glu Ser Ala Cys Ser Glu Pro Pro Met Leu
50 55 60
Pro Tyr Trp Ile Pro Val Val Gly His Thr Phe Ser Phe Leu Thr Asn
65 70 75 80
Thr His Asn Thr Ile Met Ser Gly Arg Ser His Phe Lys Ser Ile Thr
85 90 95
His Pro Phe Ser Leu Leu Ile Gly Gly Arg Arg Thr Tyr Val Val Leu
100 105 110
Asp Pro His Tyr Ile Gly Lys Val Tyr Lys Lys Thr Lys Asp Leu Val
115 120 125
His Glu Pro Phe Ile Asp His Leu Met Met Cys Ile Gly Thr Thr Gln
130 135 140
Lys Thr Arg Asp Ile Met Trp Asn Thr Met Ile Gly Asp Ser Ser Leu
145 150 155 160
Thr Asp Ser Ala Leu Asp Trp Leu Arg Glu Glu Val Ser Gln Ser Pro
165 170 175
Ser Ser Gln Pro Phe Phe Asp Arg Phe Met Met Glu Leu Asp His Gly
180 185 190
Leu Gln Gln Gly Asp Pro Leu Thr Thr Gly Arg Leu Arg Glu His Asn
195 200 205
Met Leu Lys Phe Val Glu Thr Ile Ile Ile Thr Val Ser Thr Asn Ser
210 215 220
Phe Phe Gly Lys Val Leu Leu Lys Gln Ser Pro Glu Ile Leu Asp Ser
225 230 235 240
Phe Pro Ile Phe Asp Arg His Val Trp Lys Met Val Phe Arg Ala Pro
245 250 255
Lys Phe Thr Phe Met Thr Ala His Asn Ala Lys Gly Ser Val Ile Asp
260 265 270
Gly Leu Thr Lys Tyr Phe Asp Leu Pro Gln Ser Glu Arg Gln Asp Ala
275 280 285
Ala Ser Phe Ile Leu Lys Ser Glu Asp Ala Met Arg Glu Asn Gly Ile
290 295 300
Cys Ser Arg Glu Ile Ala Ala Leu Leu Phe Lys Phe Phe Trp Gly Ile
305 310 315 320
Asn Gly Met Pro Ala Thr Leu Ala Phe Trp Phe Leu Ala Arg Thr Val
325 330 335
Tyr Thr Pro His Leu Trp Glu Asp Ile Arg Ala Glu Val Ala Pro Ala
340 345 350
Phe Arg Asn Gly Ile His Ser Pro Pro Asp Ile Gly Tyr Leu Lys Lys
355 360 365
Cys Pro Lys Leu Asn Ala Thr Phe His Glu Thr Leu Arg Ile His Gly
370 375 380
Gly Thr Ala Gly Phe Arg Gln Val Ala Ser Asp Thr Val Ile Gly Gly
385 390 395 400
Phe Thr Phe Lys Ala Gly Ser Asp Val Ile Met Pro Tyr Arg Gln Met
405 410 415
His Leu Asp Glu Gly Ile Trp Gly Gln Asp Ala Lys Thr Phe Asp Ile
420 425 430
Asp Arg Phe Ile His Asn Pro Lys Leu Ala Thr Ala Lys Thr Phe Lys
435 440 445
Pro Phe Gly Gly Gly Val Thr Leu Cys Pro Gly Arg Phe His Ala His
450 455 460
Arg Thr Ala Leu Ser Phe Ile Ala Ile Val Ile Thr Arg Tyr Asp Ile
465 470 475 480
His Val Val Gly Gly Cys Glu Ser Arg Pro Phe Pro His Met Asn Thr
485 490 495
Arg Gly Pro Glu Val Gly Val Ile Phe Pro Val Leu Glu Gln Val Pro
500 505 510
Gln Ile Ile Val Lys Asn Val Asp Ile Glu
515 520
<210> 31
<211> 5021
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 31
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaagga tcctacgtat taatacgact 960
cactatattt gctttgtgag cggataacaa ttataataga ttcaattgtg agcggataac 1020
aatttcacac agaattcatg gccacggatc ttgacctcgt gctgggaaaa agtcagtacg 1080
cattattttg tggcataact ttatttagct ttttcatact aaagtattcc cttctcggaa 1140
acgggggcaa gcaataccct tatatcaacc ccaagaaacc ctttgagctg tcgaaccagc 1200
gagtagtcca ggatttcatc gagaacgcac gagacattct tactaagggt cgctcacttt 1260
acaaggatac gccctacaag gcgcataccg atttagggga cgtcctcgta atcccgcccg 1320
agtttgccga cgctctcaag tccgaaagac agcttgactt taccgaggtc gcgagagacg 1380
atactcacgg ttacattcct ggattcgagc ccataggttc cccgttcgat ctggtgccgc 1440
tcgtcaacaa gtatcttaca agggcgttgg caaaactaac aaagccactg tgggccgaag 1500
cctcgttagg tgtaaaccat gttctgggca cgtctacgga gtggcatccc attaacccag 1560
gcgaagatat catgaggata gtctccagaa tgtcatccag aatattcatg ggtgaggaac 1620
tttgtaaaga tgacgattgg ctgaaagtgt cgattgagta cactgtgcag ctgtttcaaa 1680
ccgcagacga attacgtaac tatccacgtt ggacgcggcc ctatattcac tggttcttgc 1740
cttcctgtca gggggttcgt cgcaagttgc aggaggcgcg tgatttattg caaccccata 1800
ttgataggag aaatgcagtg aagaaagaag cgatcgctga aggtagaccc tcaccattcg 1860
acgattcaat agagtggttt gaaaatgagt acgagggcaa atctgatccc gccactgaac 1920
aaattaaact atcactggtg gcgattcaca caaccacgga cctcctgtct gaaaccatgt 1980
tcaatatagc tttgcagcca gaactccttg gtcccctacg tgaagagata gttacggttc 2040
tttccacgga aggtctaaaa aagacgtcgt tttacaattt gaagttgatg gattcggtca 2100
taaaggagtc acagcgactt cgacccgttc ttctcggtgc gttccgaaga atggcactcg 2160
ctgacgtaac cttgcccaat ggcgacgtaa taaagaaagg gaccaagatc atttgcgaca 2220
ctacacatca gtggaaccca gaatactatc ccgatgccag caagttcaat gcatatcggt 2280
ttctccaaat gagacagacg cccggtcagg acaaaagagc acaccttgtc agcacaagcc 2340
acgatcaaat ggggttcgga cacggcttgc acgcgtgccc aggccggttt ttcgcagcca 2400
atgagataaa gatagcgctg tgtcacatgc tattgaagta tgactggaag cttccagaag 2460
gtgttgtacc taagtctaag gccctcggca tgtccttact gggggaccgg gaagccaaac 2520
tgatggtcaa gaggagagca gccgaaatcg atatagacac tattgggagc gatgaatgag 2580
tcgacctgca agatctgcgg ccgcgaatta attcgcctta gacatgactg ttcctcagtt 2640
caagttgggc acttacgaga agaccggtct tgctagattc taatcaagag gatgtcagaa 2700
tgccatttgc ctgagagatg caggcttcat ttttgatact tttttatttg taacctatat 2760
agtataggat tttttttgtc attttgtttc ttctcgtacg agcttgctcc tgatcagcct 2820
atctcgcagc tgatgaatat cttgtggtag gggtttggga aaatcattcg agtttgatgt 2880
ttttcttggt atttcccact cctcttcaga gtacagaaga ttaagtgaga ccttcgtttg 2940
tgcggatcca attaatattt acttattttg gtcaacccca aataggttga tttcatactt 3000
ggttcattca aaaataagta gtcttttgag atctttcaat attataataa atatactata 3060
acagccgact tgtttcattt tcgcgaatgt tcccccagct tatcggatcc cccacacacc 3120
atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg actccgcgca 3180
tcgccgtacc acttcaaaac acccaagcac agcatactaa atttcccctc tttcttcctc 3240
tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga ccgcctcgtt 3300
tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt tcttgaaatt 3360
ttttttttta gtttttttct ctttcagtga cctccattga tatttaagtt aataaacggt 3420
cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt ttttacttct 3480
tgttcattag aaagaaagca tagcaatcta atctaagggg cggtgttgac aattaatcat 3540
cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atggccaagt 3600
tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc gagttctgga 3660
ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt gtggtccggg 3720
acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac aacaccctgg 3780
cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag gtcgtgtcca 3840
cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag ccgtgggggc 3900
gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc gaggagcagg 3960
actgacacgt ccgacggcgg cccacgggtc ccaggcctcg gagatccgtc ccccttttcc 4020
tttgtcgata tcatgtaatt agttatgtca cgcttacatt cacgccctcc ccccacatcc 4080
gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat ttattttttt 4140
atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt ttttctgtac 4200
agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt tttgggacgc 4260
tcgaaggctt taatttgcaa gctggagacc aacatgtgag caaaaggcca gcaaaaggcc 4320
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 4380
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 4440
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 4500
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 4560
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 4620
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 4680
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 4740
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 4800
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 4860
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 4920
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 4980
tggaacgaaa actcacgtta agggattttg gtcatgagat c 5021
<210> 32
<211> 1542
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 32
atggccacgg atcttgacct cgtgctggga aaaagtcagt acgcattatt ttgtggcata 60
actttattta gctttttcat actaaagtat tcccttctcg gaaacggggg caagcaatac 120
ccttatatca accccaagaa accctttgag ctgtcgaacc agcgagtagt ccaggatttc 180
atcgagaacg cacgagacat tcttactaag ggtcgctcac tttacaagga tacgccctac 240
aaggcgcata ccgatttagg ggacgtcctc gtaatcccgc ccgagtttgc cgacgctctc 300
aagtccgaaa gacagcttga ctttaccgag gtcgcgagag acgatactca cggttacatt 360
cctggattcg agcccatagg ttccccgttc gatctggtgc cgctcgtcaa caagtatctt 420
acaagggcgt tggcaaaact aacaaagcca ctgtgggccg aagcctcgtt aggtgtaaac 480
catgttctgg gcacgtctac ggagtggcat cccattaacc caggcgaaga tatcatgagg 540
atagtctcca gaatgtcatc cagaatattc atgggtgagg aactttgtaa agatgacgat 600
tggctgaaag tgtcgattga gtacactgtg cagctgtttc aaaccgcaga cgaattacgt 660
aactatccac gttggacgcg gccctatatt cactggttct tgccttcctg tcagggggtt 720
cgtcgcaagt tgcaggaggc gcgtgattta ttgcaacccc atattgatag gagaaatgca 780
gtgaagaaag aagcgatcgc tgaaggtaga ccctcaccat tcgacgattc aatagagtgg 840
tttgaaaatg agtacgaggg caaatctgat cccgccactg aacaaattaa actatcactg 900
gtggcgattc acacaaccac ggacctcctg tctgaaacca tgttcaatat agctttgcag 960
ccagaactcc ttggtcccct acgtgaagag atagttacgg ttctttccac ggaaggtcta 1020
aaaaagacgt cgttttacaa tttgaagttg atggattcgg tcataaagga gtcacagcga 1080
cttcgacccg ttcttctcgg tgcgttccga agaatggcac tcgctgacgt aaccttgccc 1140
aatggcgacg taataaagaa agggaccaag atcatttgcg acactacaca tcagtggaac 1200
ccagaatact atcccgatgc cagcaagttc aatgcatatc ggtttctcca aatgagacag 1260
acgcccggtc aggacaaaag agcacacctt gtcagcacaa gccacgatca aatggggttc 1320
ggacacggct tgcacgcgtg cccaggccgg tttttcgcag ccaatgagat aaagatagcg 1380
ctgtgtcaca tgctattgaa gtatgactgg aagcttccag aaggtgttgt acctaagtct 1440
aaggccctcg gcatgtcctt actgggggac cgggaagcca aactgatggt caagaggaga 1500
gcagccgaaa tcgatataga cactattggg agcgatgaat ga 1542
<210> 33
<211> 513
<212> PRT
<213> 禾谷镰孢菌
<400> 33
Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu
1 5 10 15
Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu
20 25 30
Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro
35 40 45
Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala
50 55 60
Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr
65 70 75 80
Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe
85 90 95
Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala
100 105 110
Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser
115 120 125
Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu
130 135 140
Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn
145 150 155 160
His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu
165 170 175
Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly
180 185 190
Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr
195 200 205
Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg
210 215 220
Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val
225 230 235 240
Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp
245 250 255
Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser
260 265 270
Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys
275 280 285
Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His
290 295 300
Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln
305 310 315 320
Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser
325 330 335
Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp
340 345 350
Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ala
355 360 365
Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val
370 375 380
Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn
385 390 395 400
Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu
405 410 415
Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser
420 425 430
Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro
435 440 445
Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met
450 455 460
Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser
465 470 475 480
Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met
485 490 495
Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Thr Ile Gly Ser Asp
500 505 510
Glu
<210> 34
<211> 1280
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 34
gtacagaaga ttaaggcgcg ccgcaagcca agcctgcgaa gaatgtagtc gagaattgag 60
cttgcctcgt ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt 120
gacagtcttg acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc 180
atacatcccc atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc 240
aaaaattacg gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg 300
ttgaattgtc cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg 360
aggttcttct ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca 420
tccgaacata aacaaaaatg accactttgg atgatactgc ttacagatac agaacttctg 480
ttccaggtga tgctgaagct attgaagctt tggatggatc tttcaccact gatactgttt 540
tcagagtcac tgctactggt gatggattca ctttgagaga agttcctgtt gatcctcctt 600
tgaccaaagt ttttcctgat gatgaatctg atgatgaatc tgatgctggt gaagatggtg 660
atccagattc tagaactttt gttgcttatg gtgatgatgg tgatttggct ggatttgttg 720
ttgtttctta ttctggatgg aacagaagat tgactgttga agatattgaa gttgctccag 780
aacatagagg tcatggtgtt ggaagagctt tgatgggatt ggcaactgag tttgccagag 840
aaagaggtgc tggtcatctt tggttggaag tcaccaatgt caatgctcca gctattcatg 900
cttacagaag aatgggattc actctttgtg gattggatac tgctttgtat gatggaactg 960
cttctgatgg agaacaagct ttgtacatgt ccatgccatg tccttaaagt aactgacaat 1020
aaaaagattc ttgttttcaa gaacttgtca tttgtatagt ttttttatat tgtagttgtt 1080
ctattttaat caaatgttag cgtgatttat attttttttc gcctcgacat catctgccca 1140
gatgcgaagt taagtgcgca gaaagtaata tcatgcgtca atcgtatgtg aatgctggtc 1200
gctatactgc tgtcgattcg atactaacgc cgccatccag tgtcggatct gtgagcaaac 1260
ccgggcatgt gagcaaaagg 1280
<210> 35
<211> 807
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 35
gaattcatgg cccttcgaac gtccctatca cgacccgtac cgcttctggc tacacttact 60
gccagcgcaa tcggagtatc catattgtct aaaatgatgt tttcaacagc aagtgcagag 120
agtccatctc cgcaaaaaat tttttccggt gcttttgctt ccgtaaaact cccgctgcat 180
tcaagtgaat acgagtccca tgacacaaag aggcttcgtt tcaaacttcc gcaagagact 240
gcagtaacgg gtttaccgtt agcttacttg gttcacattc caccgtccca ccatcaaagg 300
gacttgacta cgccggatga acctggatac atggacctgt tggtaaagaa ataccccaaa 360
ggccagggct cgacatatct acactccctc cagcccggtg atacgttatc cttcacatct 420
ctacccctca aaccagcttg gaaaacaaac aattttcctc acatcactct tatagctgga 480
gggtgtggga tcacgccatt attcaacttg gctcaaggga tacttagaga tccggccgaa 540
aaaactagga tgacctttat ttttggtgca cgatcagacg aggacgtatt actgaaaaag 600
gagttagatg gctttgcaaa agagttcccg gaaagattcg aggtgaaata tacagcactt 660
ttggaagagg tcctaggggg cgtgggtcgt gatactaagg tctttgtctg tgggccgaag 720
gagatggaaa aggcacttgt aggaggccgt ggcgtattaa aggaaatagg cttcgaaaag 780
tctcagatcc atactttttg agtcgac 807
<210> 36
<211> 1554
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 36
gaattcatgg ccacggatct tgacctcgtg ctgggaaaaa gtcagtacgc attattttgt 60
ggcataactt tatttagctt tttcatacta aagtattccc ttctcggaaa cgggggcaag 120
caataccctt atatcaaccc caagaaaccc tttgagctgt cgaaccagcg agtagtccag 180
gatttcatcg agaacgcacg agacattctt actaagggtc gctcacttta caaggatacg 240
ccctacaagg cgcataccga tttaggggac gtcctcgtaa tcccgcccga gtttgccgac 300
gctctcaagt ccgaaagaca gcttgacttt accgaggtcg cgagagacga tactcacggt 360
tacattcctg gattcgagcc cataggttcc ccgttcgatc tggtgccgct cgtcaacaag 420
tatcttacaa gggcgttggc aaaactaaca aagccactgt gggccgaagc ctcgttaggt 480
gtaaaccatg ttctgggcac gtctacggag tggcatccca ttaacccagg cgaagatatc 540
atgaggatag tctccagaat gtcatccaga atattcatgg gtgaggaact ttgtaaagat 600
gacgattggc tgaaagtgtc gattgagtac actgtgcagc tgtttcaaac cgcagacgaa 660
ttacgtaact atccacgttg gacgcggccc tatattcact ggttcttgcc ttcctgtcag 720
ggggttcgtc gcaagttgca ggaggcgcgt gatttattgc aaccccatat tgataggaga 780
aatgcagtga agaaagaagc gatcgctgaa ggtagaccct caccattcga cgattcaata 840
gagtggtttg aaaatgagta cgagggcaaa tctgatcccg ccactgaaca aattaaacta 900
tcactggtgg cgattcacac aaccacggac ctcctgtctg aaaccatgtt caatatagct 960
ttgcagccag aactccttgg tcccctacgt gaagagatag ttacggttct ttccacggaa 1020
ggtctaaaaa agacgtcgtt ttacaatttg aagttgatgg attcggtcat aaaggagtca 1080
cagcgacttc gacccgttct tctcggtgcg ttccgaagaa tggcactcgc tgacgtaacc 1140
ttgcccaatg gcgacgtaat aaagaaaggg accaagatca tttgcgacac tacacatcag 1200
tggaacccag aatactatcc cgatgccagc aagttcaatg catatcggtt tctccaaatg 1260
agacagacgc ccggtcagga caaaagagca caccttgtca gcacaagcca cgatcaaatg 1320
gggttcggac acggcttgca cgcgtgccca ggccggtttt tcgcagccaa tgagataaag 1380
atagcgctgt gtcacatgct attgaagtat gactggaagc ttccagaagg tgttgtacct 1440
aagtctaagg ccctcggcat gtccttactg ggggaccggg aagccaaact gatggtcaag 1500
aggagagcag ccgaaatcga tatagacact attgggagcg atgaatgagt cgac 1554
<210> 37
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
aatttttgaa aattcgaatt catggccctt cgaacgtc 38
<210> 38
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
ttgtaatcca tcgatactag ttcaaaaagt atggatctga gacttttcga agc 53
<210> 39
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
ctatagggcc cgggcgtcga catggccacg gatcttgac 39
<210> 40
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
gctagccgcg gtaccaagct ttcattcatc gctcccaata gtgtctatat cgatttcgg 59

Claims (35)

1.一种将LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐转化为UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐的方法,包括在酵母或其提取物或裂解物的存在下,将所述LCA或3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与7β-羟化酶系统接触,其中所述7β-羟化酶系统对所述酵母而言是非天然的。
2.根据权利要求1所述的方法,其中所述酵母选自酵母属和毕赤酵母属。
3.根据权利要求1所述的方法,其中所述酵母选自酿酒酵母和巴斯德毕赤酵母。
4.根据权利要求1所述的方法,其中所述酵母或其提取物或裂解物由对所述生物体而言外源的7β-羟化酶系统转化。
5.根据权利要求4所述的方法,其中所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶,所述CYP酶对所述酵母而言是非天然的,并且所述CPR酶对所述酵母而言可以是天然的或非天然的。
6.根据权利要求5所述的方法,其中所述CYP酶由CYP编码核酸序列编码,所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29和SEQ ID NO.32,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
7.根据权利要求5或6所述的方法,其中所述CPR酶由CPR编码核酸序列编码,所述CPR编码核酸序列选自SEQ ID NO.2和SEQ ID NO.5,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
8.根据权利要求5所述的方法,其中所述CYP酶包含CYP氨基酸序列,所述CYP氨基酸序列选自SEQ ID NO.9、SEQ ID NO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ IDNO.24、SEQ ID NO.27、SEQ ID NO.30或SEQ ID NO.33,或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
9.根据权利要求5或8所述的方法,其中所述CPR酶包含CPR氨基酸序列,所述CPR氨基酸序列选自SEQ ID 3和SEQ ID.6,或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
10.根据权利要求1所述的方法,其中所述7β-羟化酶系统包含P450 7β-羟化酶(“CYP”),其天然存在于禾谷镰孢菌(F.graminearum)或玉米赤霉菌(Gibberella zeae)、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中。
11.根据权利要求8所述的方法,其包括将所述LCA或其羧酸酯、羧酸酰胺或羧酸盐与所述7β-羟化酶系统接触,以产生UDCA或其羧酸酯、羧酸酰胺或羧酸盐。
12.根据权利要求8所述的方法,其包括将所述3-KCA或其羧酸酯、羧酸酰胺或羧酸盐与所述7β-羟化酶系统接触,以产生3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。
13.根据权利要求12所述的方法,其还包括将所述3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐还原成UDCA或其羧酸酯、羧酸酰胺或羧酸盐。
14.根据权利要求11、12或13所述的方法,其还包括从所述7β-羟化酶系统中分离所述UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐。
15.根据权利要求11、12或13所述的方法,其中所述UDCA或3-KUDCA或其羧酸酯、羧酸酰胺或羧酸盐基本上以纯的非对映异构体的形式产生。
16.根据权利要求11、12或13所述的方法,其在约15℃至约75℃的温度下进行。
17.根据权利要求11、12或13所述的方法,其在约pH 5至约pH 9的pH下进行。
18.根据前述权利要求中任一项所述的方法,其中所述LCA或3-KCA与所述7β-羟化酶系统的重量比为约10∶1至200∶1。
19.一种质粒,其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ ID NO.26、SEQ ID NO.29或SEQ ID NO.32的核酸序列;或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
20.根据权利要求19所述的质粒,其包含选自SEQ ID NO.8、SEQ ID NO.11、SEQ IDNO.14、SEQ ID NO.17和SEQ ID NO.20的核酸序列;或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
21.根据权利要求19所述的质粒,其包含选自SEQ ID NO.23、SEQ ID NO.26或SEQ IDNO.29的核酸序列;或与任何前述序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
22.根据权利要求19所述的质粒,其包含选自SEQ ID NO.32的核酸序列,或与SEQ IDNO.32具有至少85%、90%、95%、98%或99%同一性的核酸序列。
23.根据权利要求19至22中任一项所述的质粒,其处于AOX1启动子和AOX1终止子序列的控制下。
24.一种生物体,其由CYP编码核酸序列转化,所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17、SEQ ID NO.20、SEQ ID NO.23、SEQ IDNO.26、SEQ ID NO.29和SEQ ID NO.32;或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
25.根据权利要求24所述的生物体,其由CYP编码核酸序列转化,所述CYP编码核酸序列选自SEQ ID NO.8、SEQ ID NO.11、SEQ ID NO.14、SEQ ID NO.17和SEQ ID NO.20,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
26.根据权利要求24所述的生物体,其由CYP编码核酸序列转化,所述CYP编码核酸序列选自SEQ ID NO.23、SEQ ID NO.26和SEQ ID NO.29,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
27.根据权利要求24所述的生物体,其由CYP编码核酸序列转化,所述CYP编码核酸序列选自SEQ ID NO.32,或与SEQ ID NO.32具有至少85%、90%、95%、98%或99%同一性的核酸序列。
28.根据权利要求24至27中任一项所述的生物体,其进一步由CPR编码核酸序列转化,所述CPR编码核酸序列包含SEQ ID NO.2或SEQ ID NO.5,或与任何前述核酸序列具有至少85%、90%、95%、98%或99%同一性的核酸序列。
29.根据权利要求24至27中任一项所述的生物体,其中所述生物体是酵母,优选酵母属或毕赤酵母属,更优选酿酒酵母或巴斯德毕赤酵母。
30.一种反应混合物,其包含:(i)LCA或3-KCA,(ii)酵母或其提取物或裂解物,(iii)7β-羟化系统。
31.根据权利要求30所述的反应混合物,其中所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶,其中所述CYP酶包含选自SEQ ID NO.9、SEQ IDNO.12、SEQ ID NO.15、SEQ ID NO.18、SEQ ID NO.21、SEQ ID NO.24、SEQ ID NO.27、SEQ IDNO.30或SEQ ID NO.33的氨基酸序列;或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
32.根据权利要求30或31所述的反应混合物,其中所述CPR酶包含选自SEQ ID NO.3和SEQ ID NO.6的氨基酸序列,或与任何前述氨基酸序列具有至少85%、90%、95%、98%或99%同一性的氨基酸序列。
33.根据权利要求30或31所述的反应混合物,其中所述酵母是酵母属或毕赤酵母属,更优选酿酒酵母或巴斯德毕赤酵母。
34.一种反应混合物,其包含酵母和7β-羟化系统,所述7β-羟化系统包含P450氧化还原酶(“CPR”)酶和P450 7β-羟化酶(“CYP”)酶,其中所述CYP酶是一种天然存在于玉米赤霉菌、优选玉米赤霉菌PH1或玉米赤霉菌VKM2600、最优选玉米赤霉菌VKM2600中的酶。
35.根据权利要求34所述的反应混合物,还包含LCA或3-KCA。
CN202180080103.1A 2020-11-30 2021-11-29 将lca和3-kca转化为udca和3-kudca的酶促方法 Pending CN116670147A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063119188P 2020-11-30 2020-11-30
US63/119,188 2020-11-30
PCT/US2021/061025 WO2022115710A1 (en) 2020-11-30 2021-11-29 Enzymatic methods for converting lca and 3-kca to udca and 3-kudca

Publications (1)

Publication Number Publication Date
CN116670147A true CN116670147A (zh) 2023-08-29

Family

ID=81754944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180080103.1A Pending CN116670147A (zh) 2020-11-30 2021-11-29 将lca和3-kca转化为udca和3-kudca的酶促方法

Country Status (8)

Country Link
US (1) US20230416800A1 (zh)
EP (1) EP4251169A1 (zh)
JP (1) JP2023552528A (zh)
KR (1) KR20230116864A (zh)
CN (1) CN116670147A (zh)
AU (1) AU2021385425A1 (zh)
CA (1) CA3201311A1 (zh)
WO (1) WO2022115710A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117025709A (zh) * 2023-07-31 2023-11-10 华南理工大学 一种细胞色素p450酶联合细胞色素p450还原酶在合成熊去氧胆酸中的应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ727413A (en) * 2014-07-29 2022-04-29 Pharmazell Gmbh 7-beta-hydroxysteroid dehydrogenase mutants and process for the preparation of ursodeoxycholic acid

Also Published As

Publication number Publication date
AU2021385425A1 (en) 2023-06-15
WO2022115710A1 (en) 2022-06-02
CA3201311A1 (en) 2022-06-02
JP2023552528A (ja) 2023-12-18
KR20230116864A (ko) 2023-08-04
EP4251169A1 (en) 2023-10-04
US20230416800A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
AU2021203937B2 (en) Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
KR20180081527A (ko) 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구
AU2020205228B2 (en) Gene therapies for lysosomal disorders
KR100820367B1 (ko) 피히아 파스토리스에서의 단백질 글리코실화 변형
RU2650860C2 (ru) Векторы для экспрессии простатоассоциированных антигенов
CN112546211A (zh) 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法
CN107630029B (zh) 一种产朊假丝酵母游离型表达载体及其构建方法与应用
KR101047167B1 (ko) 피치아 파스토리스에서의 단백질 글라이코실화 변형
DK2931918T5 (en) PROCEDURE FOR IDENTIFYING A CELL WITH INCREASED CONCENTRATION OF A PARTICULAR METABOLIT COMPARED TO THE SIMILAR WILD TYPE CELL .....
KR20120128638A (ko) 형질전환용 플라스미드
EP3145949A1 (en) Lentiviral vectors
CN112888426A (zh) Aav三质粒系统
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR20210148270A (ko) 이중 원형 재조합 dna 작제물 및 이의 조성물을 이용하여 바실러스의 게놈 내로의 폴리뉴클레오타이드를 통합하기 위한 방법
KR20210148269A (ko) 선형 재조합 dna 작제물 및 이의 조성물을 이용하여 공여 dna 서열을 바실러스 게놈 내에 통합시키기 위한 방법
CN116670147A (zh) 将lca和3-kca转化为udca和3-kudca的酶促方法
CN115927299A (zh) 增加双链rna产生的方法和组合物
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
CN101238214A (zh) 使用改进的调节表达系统治疗疾病
CN113584074B (zh) 假重组嵌合黄瓜花叶病毒介导的基因沉默系统及其应用
KR20170068304A (ko) 대장균 및 코마가타에이박터 속 세포에서 복제가능한 벡터, 그를 포함한 세포, 및 그를 이용하는 방법
CN112553240A (zh) 重组表达载体系统、重组工程菌及其制备方法和用途
CN113498438A (zh) 基因疗法dna载体
CN115074304B (zh) 一种谷氨酸棒杆菌突变体及重组菌构建方法与应用
KR102214835B1 (ko) 락테이트 데히드로게나제 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 효모 세포, 및 이를 이용한 락테이트의 생산 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination