CN101812472A - 米多霉素生物合成基因簇 - Google Patents

米多霉素生物合成基因簇 Download PDF

Info

Publication number
CN101812472A
CN101812472A CN200910056338A CN200910056338A CN101812472A CN 101812472 A CN101812472 A CN 101812472A CN 200910056338 A CN200910056338 A CN 200910056338A CN 200910056338 A CN200910056338 A CN 200910056338A CN 101812472 A CN101812472 A CN 101812472A
Authority
CN
China
Prior art keywords
ala
gly
leu
arg
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910056338A
Other languages
English (en)
Other versions
CN101812472B (zh
Inventor
邓子新
贺新义
李力
徐志南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN2009100563388A priority Critical patent/CN101812472B/zh
Publication of CN101812472A publication Critical patent/CN101812472A/zh
Application granted granted Critical
Publication of CN101812472B publication Critical patent/CN101812472B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

一种生物技术领域的米多霉素生物合成基因簇,该基因簇的序列如SEQ IDNO:1所示;该基因簇包含16个基因:结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;调节基因2个:milK和milO;抗性基因1个:milP;其他基因2个:milF、milI。本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。

Description

米多霉素生物合成基因簇
技术领域
本发明涉及一种生物技术领域的基因簇,具体是一种米多霉素生物合成基因簇。
背景技术
核苷类抗生素是一类通常由微生物次级代谢产生的,在结构上含有修饰的核苷和核苷酸的分子的总称。它们具有广泛的生物活性,包括抗细菌、抗真菌、抗线虫、抗肿瘤、抗病毒、除草、免疫刺激和免疫抑制等活性(J.Antibiot.(1998)41,1711-39)。米多霉素(mildiomycin)是由生裂链轮丝菌(Streptoverticilliumrimofaciens)产生的一种水溶性碱性抗生素(J.Antibiot.(1978)31,511-8),在化学结构上包括一个5-羟甲基胞嘧啶(自然界中仅发现存在于T偶数噬菌体的DNA中)、一个特殊的带有γ-羟化的胍基和一个带有丝氨酸残基的4-氨基-吡喃-3-烯部分(J.Am.Chem.Soc.(1978)100,4895-7),属于核苷类抗生素(结构见图1)。米多霉素并不像其它核苷类和氨基糖苷类抗生素那样容易通过细胞膜,它作用机制在于能够抑制蛋白质合成中肽键的转移(J.Antibiot.(1985)38,415-9)。米多霉素对多数细菌和真菌都有抑制活性,尤其对植物白粉病具有强烈的抑制活性。白粉病是由子囊菌纲白粉菌目(Erysiphales)白粉菌引起的植物真菌性病害。白粉菌能侵染650多种单子叶植物和9000多种双子叶植物。目前用于防治白粉病的主要是三唑类化学农药,然而,化学农药对人类的可持续发展的危害日益引起关注(农药学学报,(2001)3,12-8)。米多霉素低毒高效的特点成为良好的抑制植物白粉病的农药。目前,市场上销售的是日本武田药业(TAKADA)生产的米多霉素可湿性粉剂,由于价格较高,多用于防治高档观赏植物的白粉病原菌。
Kishimoto等人研究发现,在亚铁离子存在的情况下,培养基中添加适当的无机磷酸盐能够提高米多霉素的产量(J.Antibiot.(1996)49,775-80);Sawade等通过用环丝氨酸(D-Cycloserine)诱变,并在含氨蝶呤(aminopterin)的平板上进行筛选米多霉素高产菌株,得到了产量是原始菌株2.6倍的高产突变株(J.Antibiot.(1997)50,206-11)。通过原生质体融合等手段,徐志南教授得到了一株突变株Sv.rimofaciens ZJU5119,其米多霉素产量比出发菌株ZD615提高了170%,达到了1015mg/L(浙江大学学报(工学版)(2006)40,1262-6)。Sawada等在Sv.rimofaciens的培养基中添加5-羟甲基胞嘧啶,5-甲基胞嘧啶(5-methyl-cytosine)、5-溴胞嘧啶(5-bromo-cytosine)、5-碘胞嘧啶(5-iodo-cytosine)和5-氟胞嘧啶(5-fluoro-cytosine),能够分别得到一系列对应的米多霉素衍生物(J.Ferment.Technol.(1984)62,537-43)。通过改变发酵条件,我们前期还在生裂链轮丝菌ZJU5119分离到去羟甲基米多霉素、去羟基米多霉素和去羟基去羟甲基米多霉素(上海交通大学学报(2009)43,1-4)。
通过DNA重组技术可以对抗生素化学结构进行改造,提高效价、扩大抗菌谱、降低毒性,同时对调节基因的遗传工程改造还可以提高抗生素的产量,这方面的先驱Hopwood等利用来自不同链霉菌菌株的结构基因转移产生出新的杂合的抗生素(Nature(1985)314,642-4)。由于抗生素生物合成的相关基因,包括结构基因,抗性基因以及调节基因一般都成簇存在(Annu.Rev.Microbiol.(1989)43,173~06)。我们以生裂链轮丝菌ZJU5119产生的米多霉素为目标分子,从克隆其生物合成基因簇出发,阐明了合成米多霉素的基因簇。
经对现有技术的文献检索发现,尚未见到有关于米多霉素生物合成基因簇的报道。
发明内容
本发明的目的在于克服现有技术的不足,提供一种米多霉素生物合成基因簇。本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。
本发明是通过以下的技术方案实现的:
本发明涉及一种米多霉素生物合成基因簇,其序列如SEQID NO:1所示。
所述米多霉素生物合成基因簇包含16个基因:
结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;其中:
所述基因milA,位于SEQ ID NO:1的第6125~7126位,
所述基因milB,位于SEQ ID NO:1的第7252~7761位,
所述基因milC,位于SEQ ID NO:1的第7906~9165位,
所述基因milD,位于SEQ ID NO:1的第9185~10369位,
所述基因milE,位于SEQ ID NO:1的第10380~11198位,
所述基因milG,位于SEQ ID NO:1的第11627~12631位,
所述基因milH,位于SEQ ID NO:1的第12729~14948位,
所述基因milJ,位于SEQ ID NO:1的第16202~17152位,
所述基因milM,位于SEQ ID NO:1的第19548~20714位,
所述基因milN,位于SEQ ID NO:1的第20710~21483位,
所述基因milQ,位于SEQ ID NO:1的第25168~25935位;
调节基因2个:milK和milO;其中:
所述基因milK,位于SEQ ID NO:1的第17152~18477位,
所述基因milO,位于SEQ ID NO:1的第23289~22222位;
抗性基因1个:milP,所述基因milP,位于SEQ ID NO:1的第23298~24878位;
其他基因2个:milF、milI;其中:
所述基因milF,位于SEQ ID NO:1的第11194~11664位,
所述基因milI,位于SEQ ID NO:1的第14948~16027位。
所述11个结构基因编码的蛋白具体为:
所述基因milA编码的蛋白的序列如SEQ ID NO:2所示,该蛋白为CMP羟甲基转移酶;
所述基因milB编码的蛋白的序列如SEQ ID NO:3所示,该蛋白为CMP/羟甲基水解酶;
所述基因milC编码的蛋白的序列如SEQID NO:4所示,该蛋白为胞嘧啶/羟甲基胞嘧啶葡萄糖醛酸合成酶;
所述基因milD编码的蛋白的序列如SEQ ID NO:5所示,该蛋白为degT/dnrT/eryC1/strS氨基转移酶;
所述基因milE编码的蛋白的序列如SEQ ID NO:6所示,该蛋白为氨基糖苷类磷酸转移酶;
所述基因milG编码的蛋白的序列如SEQ ID NO:8所示,该蛋白为RadicalSAM蛋白;
所述基因milH编码的蛋白的序列如SEQ ID NO:9所示,该蛋白为连接酶;
所述基因milJ编码的蛋白的序列如SEQ ID NO:11所示,该蛋白为精氨酸羟化酶;
所述基因milM编码的蛋白的序列如SEQ ID NO:14所示,该蛋白为Asp/Tyr/Aro氨基转移酶;
所述基因milN编码的蛋白的序列如SEQID NO:15所示,该蛋白为二氢二吡啶甲酸合酶;
所述基因milQ编码的蛋白的序列如SEQ ID NO:18所示,该蛋白为氨基糖苷磷酸转移酶。
所述2个调节基因编码的蛋白具体为:
所述基因milK编码的蛋白的序列如SEQ ID NO:12所示,该蛋白为Majorfacilitator superfamily家族蛋白;
所述基因milO编码的蛋白的序列如SEQ ID NO:16所示,该蛋白为LuxR家族调节蛋白。
所述1个抗性基因编码的蛋白具体为:
所述基因milP编码的蛋白的序列如SEQ ID NO:17所示,该蛋白为ABCtransporter。
与现有技术相比,本发明具有如下的有益效果:利用本发明的基因簇可实现以下目的:
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从生裂链轮丝菌(Sv.rimofaciens ZJU5119)基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有基因组中以前临近区域未克隆的DNA。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失、聚合酶链式反应、错误介导聚合酶链式反应、位点特异性突变、不同序列的重新连接、序列的不同部分或其它来源的同源序列进行定向进化(DNA Shuffling),或提供紫外线或化学试剂诱变等。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以提供合适的表达体系在外源宿主中表达以得到相应的酶或其它更高的生物活性物质及产量。这些外源宿主包括链霉菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。
包含本发明所提供的氨基酸序列或至少部分序列可以用来分离所需要的蛋白质并可用于抗体的制备。
包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其它致力于得到的性质。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。
包含本发明所提供的核苷酸序列编码的蛋白可以催化合成羟甲基胞嘧啶葡萄糖醛酸,进一步催化合成抗生素-米多霉素。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断米多霉素生物合成的一个或几个步骤而得到新的米多霉素结构类似物或前体。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以用来提高米多霉素或其衍生物的产量,例如增加正调节基因的拷贝数或增强其表达以及负调节基因的敲除等。本发明提供了在基因工程微生物中提高产量的途径。
总之,本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。
附图说明
图1为米多霉素和去羟甲基米多霉素的化学结构示意图;
图2生裂链轮丝菌产生米多霉素及去羟甲基米多霉素的LC-MS检测结果图;
图3为米多霉素的异源表达示意图;
图4为米多霉素生物合成基因簇边界的确定示意图;
图5为与米多霉素生物合成的相关基因分析示意图;
图6为MilC蛋白催化胞嘧啶葡萄糖醛酸和羟甲基胞嘧啶葡萄糖醛酸的合成示意图;
图7为MilG蛋白负责4’-酮基羟甲基胞嘧啶葡萄糖醛酸的合成示意图;
图8为推导的米多霉素生物合成途径示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
以下结合图1~8对本发明做进一步说明
图1中:米多霉素:R=CH2OH;去羟甲基米多霉素:R=H
(1)米多霉素的发酵及LC-MS检测
将米多霉素的产生菌生裂链轮丝菌ZJU5119接种到TSBY(10.3%蔗糖)培养基于含有弹簧的三角瓶中30℃培养6天。调节发酵液ph至5,离心取上清进行LC-MS检测,所用仪器为安捷伦公司的Agilent 1100series LC/MSD Trap system。采用Agilent TC-C18(5μm,4.6×250mm反向柱,流动相为10m M三氯乙酸(Sigma公司)/HPLC级乙腈(Merck公司)(92∶8,v/v),流速为0.3ml/min。质谱检测是在离子阱的正离子模式下进行。干燥气流为8l/min,喷雾器压力为40psi。干燥气温为325℃。多级质谱断裂分析轰击电压在1.0~1.8V之间。以米多霉素标准品(购自武田药业公司)为对照,结果见图2,可见生裂链轮丝菌ZJU5119不仅能够产生米多霉素,同时能够产生米多霉素的衍生物-去羟甲基米多霉素。
(2)米多霉素的异源表达
利用来自杀稻瘟菌素生物合成基因簇上的胞嘧啶核苷单磷酸水解酶基因blsM及其同源基因设计兼并引物,从生裂链轮丝菌ZJU5119的基因组文库中筛选出六个相互重叠的包含有blsM同源基因的科斯质粒。基因敲除milA和milB证明了它们是合成米多霉素生物合成的必须基因。将包含milA和milB基因的一个科斯质粒14A6提供原生质体转化的方式转入到链霉菌模式菌株变铅青链霉菌1326(Streptomyces lividans 1326)中,并将转化子在YEME培养基中(Difco酵母提取粉3g、Difco蛋白胨5g、Oxoid麦芽糖3g、葡萄糖10g、蔗糖340g、蒸馏水1000ml,灭菌后补加2ml 2∶5M MgCl2)发酵6天。
生物测定:将指示菌红酵母接种到10.3%YEME液体培养基中,30℃摇床(220rpm/min)培养约24小时,离心收集菌体,用LB培养基洗涤一次,融化PDA培养基并冷却至50℃左右,每20ml培养基中加入100μl上述指示菌,立即混匀后倒入培养皿,使其凝固。收集20μl发酵液,利用灭菌后的牛津杯放置在制备好的含红酵母指示菌的PDA平板上,30℃培养1~2天后观察指示菌生长被抑制的结果。
HPLC-MS分析:将收集的发酵液用草酸调节pH 5.0,12,000g离心5分钟,用阳离子交换小柱(Supelclean LC-SCX,500mg/3ml,Supelco公司)处理上清。小柱先用3ml甲醇活化,上样后分别用2ml纯水和2ml 0.5%氨水洗涤,最后收集3%氨水洗脱组份供测定分析。在检测米多霉素中所用的高压液相色谱-质谱联用是安捷伦公司的Agilent 1100series LC/MSD Trap system。采用AgilentTC-C18(5μm,4.6×250mm)反向柱,流动相为10m M三氯乙酸(Sigma公司)/HPLC级乙腈(Merck公司)(92∶8,v/v),流速为0.3ml/min。质谱检测是在离子阱的正离子模式下进行。干燥气流为8l/min,喷雾器压力为40psi。干燥气温为325℃。多级质谱断裂分析轰击电压在1.0~1.8V之间。
如图3A所示,指示菌为红酵母,I米多霉素;II和III分别是从两个携带14A6的变铅青链霉菌的发酵提取物;IV从携带空载体的变铅青链霉菌的发酵提取物;科斯质粒14A6的变铅青链霉菌1326的转化子发酵液和米多霉素标准品一样产生了抑菌圈,而空载体的转化子的发酵液不能够产生抑菌圈。图3B为米多霉素和14A6和空载体的变铅青链霉菌转化子在YEME培养基中的发酵提取物的HPLC图谱;显示了14A6的变铅青链霉菌转化子发酵液提取物中的米多霉素的峰,而空载体的转化子没有此峰。
这样通过生物测定和HPLC-MS的数据证明了科斯质粒14A6能够赋予变铅青链霉菌1326米多霉素的生产能力,也就表明了14A6包含了米多霉素生物合成所必须的全部功能基因。
(3)米多霉素生物合成基因簇的边界确定
突变株LL2(敲除milA)丧失了生产米多霉素的能力,仅能够产生去羟甲基米多霉素,证明了milA是必须基因,因此对其上游基因进行了敲除,通过筛选得到了生裂链轮丝菌突变株LL4(敲除orf-1的突变株)和LL23(敲除orf-5至orf-1的突变株),生物测定实验结果表明它们仍然能够产生米多霉素,因此米多霉素生物合成基因簇的上游边界确定在orf-1和milA之间。LL17(敲除orf+1至orf+2的突变株)、LL18(敲除orf+3至orf+6的突变株)和LL9((敲除orf+7的突变株)的生测实验结果表明它们仍然能够正常产生米多霉素;(见图4A LL4:敲除orf-1的突变株;LL23:敲除orf-1至orf-5的突变株;LL17:敲除orf+1至orf+2的突变株;LL18:敲除orf+3至orf+6的突变株;LL9:敲除orf+7的突变株;WT:野生型;CK:琼脂块对照);
而milQ的突变株LL11丧失了生产米多霉素的能力(图4B,从下至上分别为米多霉素;生裂链轮丝菌野生型ZJU5119和生裂链轮丝菌LL11:milQ突变株发酵液的HPLC图谱)。因此,把米多霉素生物合成基因簇下游边界确定在milQ和orf+1之间。这样,米多霉素的生物合成基因簇就确定在milA至milQ范围内。
(4)米多霉素生物合成基因簇的功能分析
通过对生裂链轮丝菌ZJU5119的米多霉素生物合成基因簇上的基因进行系统的敲除和各个突变株的发酵产物检测,这些基因在米多霉素生物合成中的相关可通过图5所示的内容阐述,其中,结构基因、调节基因和抗性基因等用不同的颜色表示。+表示基因的敲除丧失了米多霉素的生产能力;-表示基因敲除对米多霉素的生产没有影响;/表示基因的敲除降低了米多霉素的产量。包括相关的结构基因11个(包括milA、milB、milC、milD、milE、milG、milH、milJ、milM、milN、和milQ),它们的突变株丧失了米多霉素的生产能力;负责米多霉素生物合成的调节基因(milO和milK),LuxR家族的调节蛋白MilO的突变株样丧失了米多霉素的生产能力,而主要易化家族蛋白MilK突变株的米多霉素产量降低;米多霉素生物合成的抗性基因milP的突变株不能够生产米多霉素;功能未知的基因milF、milI和milL,其中敲除milL的突变株仍然能够正常的产生米多霉素,而敲除milF和milI突变株丧失了米多霉素的生产能力,这说明了milF和milI和米多霉素生物合成的相关性,证明了它们是米多霉素生物合成基因簇的一部份。
(5)体外反应进一步证明MilC的功能
MilC是由463个氨基酸编码的蛋白质,序列比对的结果显示它和杀稻瘟菌素生物合成中的BlsD(AAP03118)具有一定的同源性(Identities=144/338(42%),Positives=180/338(53%),e-value=2e-49),BlsD被认为是一种UDP-葡萄糖转移酶,负责在杀稻瘟菌素生物合成中cytosylglucuronic acid(CGA)的合成,称之为CGA合成酶。Guo等在1991年发现S:griseochromogenes中存在着催化胞嘧啶和UDP葡萄糖醛酸合成CGA的酶,并在1994年从菌体中纯化了CGA合成酶,研究发现,UDP-葡萄糖(UDP-glucose)、UDP-半乳糖(UDP-galactose)和UDP-半乳糖醛酸(UDP-galacturonic acid)都不是CGA的合适底物,同时除了胞嘧啶外,腺嘌呤(adenine)、尿嘧啶(uracil)、4-硝基酚(4-nitrophenol)和α-萘酚(α-naphthol)都不是合适的糖基配体。Cone等在分析杀稻瘟菌素生物合成基因簇的时候发现,把包含blsD的6∶5kb DNA片段克隆到pIJ702上,并在S:lividans中表达,有胞嘧啶存在条件下,能够产生CGA,表明BlsD就是Guo等人纯化的CGA合成酶。然而,Guo等人纯化的CGA合成酶大小是43kD与通过氨基酸序列计算出的Bl sD大小34∶5kD并不一致[J:Bacteriol:1994(176):1282-6;ChemBioChem 2003(4):821-9]。通过MilC做BLASTP仅能找到BlsD,并且在保守域的搜索中也没有如何结果。于是我们采用了PSI-BLAST。Position specific iterative BLAST(PSI-BLAST)是位点特异的迭代blast搜索,主要针对蛋白序列。第一次blast搜索后,结果中最相似的序列重新构建PSSM(位点特异性打分矩阵),然后再使用该矩阵进行第二轮blast搜索,再调整矩阵,搜索,如此迭代。最终高度保守的区域就会得到比较高的分值,而不保守的区域则分数降低,趋近0。这样可以提高blast搜索的灵敏度。在检索结果中我们发现了一些相似的N-己酰氨基葡萄糖转移酶(N-acetylglucosaminyl transferase)序列,这让我们相信MilC可能与CGA合成有关(UDP-葡萄糖醛酸为底物),负责糖基的转移。尽管UDP-葡萄糖醛酸基转移酶在哺乳动物的异生物质代谢(Xenobiotic metabolism)中非常普遍,在真菌中也有发现,但在细菌中却很少报道。
敲除milC的突变株丧失了米多霉素的生产能力,证明了它的必要性。为了进一步研究milC的确切功能,进行了蛋白的表达和纯化,我们把MilC基因克隆到原核表达载体pET28a+上,并在大肠杆菌中进行超表达。然而,几乎所有的重组蛋白均以包含体形式存在。经过复性纯化后得到了可溶的重组MilC蛋白,如图6A所示,其中,MW:蛋白质分子量标准;泳道1:透析后重新折叠的可溶性蛋白;泳道2:从可溶性蛋白中纯化的MilC。
分别以胞嘧啶和羟甲基胞嘧啶为底物,分析它们在MilC的催化下与UDP-葡萄糖醛酸(UDP-glucoronic acid)的作用,结果见图6B,(以失活的MilC作为对照)。在A中,经过30分钟的温浴,做为对照的加入煮沸失活的MilC的HPLC图谱显示仍然只有底物胞嘧啶和UDP-葡萄糖醛酸(下部),而在上部的HPLC图谱中可以发现,不仅存在着胞嘧啶和UDP-葡萄糖醛酸,而且出现了两个产物UDP和cytosylglucuronic acid(CGA),它们的保留时间,紫外吸收和MS都与标准品一致。在B中,经过30分钟的温浴,做为对照的加入煮沸失活的MilC的HPLC图谱显示仍然只有底物羟甲基胞嘧啶和UDP-葡萄糖醛酸(下部),而在上部的HPLC图谱中可以发现,不仅存在着羟甲基胞嘧啶和UDP-葡萄糖醛酸,而且出现了两个产物UDP和HM-cytosylglucuronic acid(HM-CGA)。可见,胞嘧啶和羟甲基胞嘧啶都能够在MilC的作用下与UDP-葡萄糖醛酸反应,分别生成CGA和HM-CGA。在对糖基供体的实验中,MilC不能够催化UDP-葡萄糖(UDP-glucose)和胞嘧啶或羟甲基胞嘧啶的反应。
MilC的酶动力学参数的研究具有非常重要的意义,因为它可以表明对于胞嘧啶和羟甲基胞嘧啶哪一个是酶的最适底物。因此,我们在反应体系中加入过量的UDP-葡萄糖醛酸,来计算胞嘧啶和羟甲基胞嘧啶对MilC的米氏常数,结果见图6C和表1,可见,MilC对胞嘧啶和羟甲基胞嘧啶来说有着近似的Km值,但胞嘧啶的Kcat值却是羟甲基胞嘧啶的1.9倍,可见对MilC来说胞嘧啶是更适合的底物。
表1MilC对胞嘧啶和羟甲基胞嘧啶的酶动力学参数比较
  胞嘧啶   羟甲基胞嘧啶
  Kcat(10-4s-1)   1.070±0.0037   0.5623±0.0257
  Km(μm)   200.0±18.26   206.8±24.49
  胞嘧啶   羟甲基胞嘧啶
  Kcat/Km(M-1s-1)   0.5250±0.0019   0.2719±0.0012
MilC在米多霉素生物合成途径中所催化的反应如图6D所示。
(6)检测到中间产物进一步证明Radical SAM家族蛋白MilG的功能
milG编码一335氨基酸残基的蛋白,通过对MilG的Pfam数据库检索发现它属于一类被称为Radical SAM的超家族蛋白(Radical SAM superfamily,PF04055)。这类蛋白通过一个特殊的铁硫中心来还原性的分解S-腺苷甲硫氨酸(SAM)产生自由基。这类蛋白家族的发现表明了自由基依赖的催化反应对以前未能解决的一些复杂的化学反应途径的重要性,同时也反映了这个家族蛋白既古老而又保守的性质。Radical SAM能够催化多种反应,包括特殊的甲基化反应、异构化反应、硫的搀入、成环反应、厌氧氧化反应和蛋白自由基的形成等。它们在DNA前体物、维生素、辅酶、抗生素和除草素的生物合成和生物降解过程中起着重要作用,如赖氨酸2,3变位酶(lysine 2,3-aminomutase)、孢子光合产物裂解酶(spore photoproduct lyase)、丙酮酸甲酸裂解酶(pyruvate formatelyase)、厌氧核糖核苷酸还原酶(anaerobic ribonucleotide reductase)和生物素合成酶(biotin synthase)等(Chem:Rev:2003(103):2129-48)。
图7A(MIL:米多霉素;WT:生裂链轮丝菌野生型ZJU5119;LL8:生裂链轮丝菌milG突变株LL8,羟甲基胞嘧啶葡萄糖醛酸的化学结构显示在图上)显示敲除milG的生裂链轮丝菌丧失了生产米多霉素的能力,同时,在突变株的发酵液中,中间产物羟甲基胞嘧啶葡萄糖醛酸([M+H]/Z 318)得到了大量积累,这表明了MilG可能是以羟甲基胞嘧啶葡萄糖醛酸为底物,同时,在整个米多霉素生物合成基因簇中,milG是唯一一个可能编码参与氧化反应的基因,因此推断MilG负责催化羟甲基胞嘧啶葡萄糖醛酸的糖上碳4位羟基氧化成羰基,milG是米多霉素生物合成所必须的基因,在米多霉素生物合成途径中它所负责的功能如图7B所示。
(7)米多霉素生物合成基因簇中各种基因的作用
根据前面对蛋白MilA、MilB和MilC的功能研究,已经能够明确了从CMP出发至合成出(羟甲基)CGA的步骤。而米多霉素生物合成基因簇边界的确定、各个基因的敲除和生物信息学的利用提供了米多霉素生物合成基因簇中各个基因的作用。
milG的功能:由羟甲基CGA出发合成米多霉素需要在碳4位上转入氨基,而转氨基之前的羟基必须被氧化成羰基。MilG是一类Radical SAM,它能够利用自由基来催化许多在化学上及其难以发生的反应。而MilG的中断突变株生裂链轮丝菌LL8的发酵产物中羟甲基CGA的大量积累则支持了我们的判断。同时,在其它的突变株中未能找到积累的中间产物的原因可能就是MilG作用后的中间产物的不稳定性。通过和杀稻瘟菌素的生物合成基因簇的对比,同样发现的一个Radical SAM-BlsE,考虑到米多霉素和杀稻瘟菌素的结构上相似性,MilG和BlsE可能就就负责(羟甲基)CGA的糖基的碳4为上羟基的氧化,转化为羰基。
milM和milN的功能:对于精氨酸侧链和葡萄糖醛酸的缩合反应,类似于MilN催化的二氢吡啶甲酸合成,即半醛和酮酸的缩合。而MilM这个氨基转移酶可以将精氨酸脱去氨基转化为α酮酸,而MilN催化α酮酸和脱羧的己糖的反应。milM和milN的基因中断突变株都失去了生产米多霉素的能力。
milE和milQ的功能:关于糖基部分2位碳与3位碳间双键的形成也是米多霉素生物合成途径中非常特殊的反应,尽管现在没有直接的证据显示哪个基因与此相关,但通过生物合成基因簇边界确定和基因中断实验,我们认为很可能是MilE和MilQ这两个磷酸转移酶负责这个双键的形成。milE和milQ的基因中断突变株都失去了生产米多霉素的能力。
milD,milI和milH的功能:对于丝氨酸残基侧链的形成,MilD是个degT/dnrJ/eryC/strS类型的氨基转移酶,它可以在被MilG氧化成羰基的4位碳上转入氨基。MilI包含一磷酸泛酰巯基乙胺结合位点,磷酸泛酰巯基乙胺是一些多酶复合体中的酰基载体蛋白的辅基,它作为一个结合活化的脂肪酸和氨基酸基团的摆臂,因此MilI可能参与的丝氨酸的活化。MilH作为一个具有ATP结合位点的连接酶可能催化丝氨酸残基和糖上碳4位的氨基之间的缩合反应,形成类似肽键的酰胺键。对比杀稻瘟菌素的生物合成,MilH的同源蛋白BlsK可能同样负责氨基酸残基和糖的结合,同样,在杀稻瘟菌素的生物合成以及嘌呤霉素的生物合成途径中,催化这一反应的都是连接酶,而并不是NRPS(ChemBioChem2003(4):821-9)。
负责米多霉素生物合成的调节基因milO和milK,LuxR家族的调节蛋白MilO的突变株样丧失了米多霉素的生产能力,而主要易化家族蛋白MilK突变株的米多霉素产量降低。这说明了两个调节基因在米多霉素生物合成途径中的重要作用。米多霉素生物合成的抗性基因milP的突变株不能够生产米多霉素,所用它是合成的必不可少基因;milJ做为米多霉素生物合成基因簇中唯一的氧化还原酶基因负责精氨酸的羟化反应。敲除milF突变株丧失了米多霉素的生产能力,这说明了milF和米多霉素生物合成的相关性,证明了它是米多霉素生物合成基因簇的一部份。
根据体外酶活实验、体内突变实验和生物信息学分析整个基因簇的的功能,总结如图8所示。
实施例
步骤一,米多霉素产生菌生裂链轮丝菌ZJU5119总DNA的提取
接种链轮丝菌至TSBY(10.3%蔗糖)培养基于含有弹簧的三角瓶中30℃培养48h。离心收集菌体,重悬于5ml SET缓冲液中(75mM NaCl,25mM EDTA pH8.0,20mM Tris-HCl pH7.5)。加入100μl溶菌酶溶液(50mg/ml),置37℃约60分钟。溶菌后然后加入140μl蛋白酶K溶液(20mg/ml)混均匀,再加600μl 10%SDS,通过颠倒混匀,置55℃温浴2h,期间偶尔颠倒几次。再加入2ml 5M NaCl,彻底混匀,冷却置37℃后,加入5ml氯仿,于室温轻轻混匀。20℃、4500g离心15分钟。转移上清至新管中,加入0.6倍体积的异丙醇颠倒混匀,约3分钟后用玻棒挑取至含70%(v/v)乙醇的新管中洗涤,重复2次,空气中干燥,溶解在TE中。
步骤二,生裂链轮丝菌基因组文库的构建
(1)链轮丝菌总DNA的部分酶解和大片段DNA的回收
将提取的链轮丝菌总DNA用Sau3AI部分酶解,用1%低熔点琼脂糖凝胶,在装有0.5倍TBE电泳缓冲液的脉冲场电泳(Pulse Field Gel Electrophoresis,PFGE,Bio-Rad)中分离。回收约40kb大小的DNA片段。用热敏的碱性磷酸酶(APexTMHeat-Labile Alkaline Phosphatase,EPICENTRE Biotechnologies公司)处理是末端去磷酸化,供载体的连接及包装转染用。
(2)柯斯质粒载体的构建和处理
为了方便在链霉菌中做异源表达,从pOJ446和pSET152质粒出发,构建了新的可整合在链霉菌染色体的穿梭柯斯质粒载体,pOJ446被XbaI和XhoI双酶切后,包含多柯斯位点的部分和来自pSET152的用同样酶切的包含整合酶和attP位点的片段连接。将提取的pJTU2554质粒用单酶切位点的HpaI酶切成线性片段,然后用CIAP(NEB公司)酶处理末端使其去磷酸化,然后再用BamHI酶切成两条片段。
(3)连接和包装
将处理好的链轮丝菌基因组DNA(大小约40kb)和柯斯质粒载体按照1∶1分子数比例用T4连接酶(NEB公司)连接。将在冰上溶解的噬菌体包装蛋白(MaxPlaxLambda Packing Extracts,EPICENTRE Biotechnologies公司)加入连接产物中,混匀,避免产生气泡,短暂离心,在30℃中温浴90分钟,再加入另一份包装蛋白,继续温浴90分钟后加入噬菌体稀释缓冲液(Phage Dilution Buffer,100mM NaCl,10mM MgCl,10mM Tris-HCl pH8.3)至1ml,并加入25μl氯仿,4℃保存。
(4)转染与保存
将大肠杆菌EPI300培养至OD600=0.8~1.0作为感受态菌,可在4℃保存72h。将包装产物与感受态菌混合,37℃温浴20分钟后涂含阿伯拉抗生素的LB平板。37℃培养过夜。挑取单克隆至含抗生素的LB培养基96孔板中继续培养18小时,加入灭菌的甘油至终浓度20%,于-70℃中保存。
步骤三,基因组文库的筛选
采用PCR的方法从基因组文库中筛选所需要的柯斯质粒。为筛选基因组文库,从每个板的96孔孔中取出等量菌液混合,接种培养,提取质粒为一个模板进行PCR筛选,在得到的阳性平板中,从每排的12个孔中取出等量菌液混合,接种培养,提取质粒为一个模板进行PCR筛选。然后在那些阳性的排中进行单个的PCR筛选,直至筛出所有阳性克隆。
步骤四,双交换基因置换质粒的构建(以pJTU412为载体,目的基因被壮观霉素抗性基因替换)
基因置换载体的构建采用PCR-Targeting方法。因为构建文库所用的柯斯质粒(pJTU2554)在链霉菌中属于整合型载体,会将整个质粒片段整合到染色体上的aatB位置,所以不适合用于基因置换。因此,首先要构建中间载体,本研究采用的是以pJTU412为载体,它是一种大肠杆菌链霉菌的穿梭质粒,具有在链霉菌中遗传不稳定的特点,在非抗性选择的条件下,质粒极容易丢失。将基因组文库中筛选到的负责米多霉素生物合成的柯斯质粒酶切,连接到经相应限制性内切酶酶切的pJTU412载体上,构建了中间载体。分别将各中间载体转化至含有pIJ790质粒的大肠杆菌BW25113中(E.coli BW25113/pIJ790)中制备成感受态细胞,以通过PCR扩增的pIJ779或pIJ778中含有的aadA基因(带有与目的替换基因两侧同源的尾端)DNA进行电转化,得到基因置换质粒,并转化到大肠杆菌ET12567中以消除DNA甲基化影响。
步骤五,融合蛋白的表达
(1)表达质粒构建
本实施例均以pET28a+(Novagen公司)为表达载体,将待表达的基因用高保真的KOD酶和带有限制性酶切位点的引物扩增出,酶切后连接至相应酶切处理的表达载体上,构建成融合表达质粒,并转化至大肠杆菌DH10B中,测序正确后,将质粒转化到含有pLysE质粒大肠杆菌BL21(DE3)(Novagen公司)。
(2)融合蛋白的表达
含有融合表达质粒的大肠杆菌BL21(DE3)(Novagen公司)接种到含氯霉素和卡那霉素的LB培养基中37℃培养过夜。然后将10ml的种子接种到1L的含相应抗生素的LB培养基中培养至OD600=0.6,将培养温度降至28℃,加入IPTG至终浓度为1mM,继续培养5小时。
(3)融合蛋白的纯化
12,000g离心5分钟收集菌体,然后重悬于25ml的裂解缓冲液(20mM磷酸钠,0.5M NaCl,pH7.4),反复冻融两次,放置在冰浴中,用超声波仪破碎细胞和打断DNA分子(60s 10次,每次间隔60s),然后在4℃,16,000g离心45分钟。
对可溶性融合蛋白,取上清过镍金属鳌合小柱(HisTrap HP column,GEHealthcare公司),用
Figure G2009100563388D00151
FPLC(GE Healthcare公司)纯化,采用线性方式用洗脱液(20mM磷酸钠,0.5M NaCl,0.5M咪唑,pH7.4)洗脱,收集蛋白,用SDS-PAGE电泳来鉴定。纯化后的蛋白用脱盐柱(HisTrap Desalting column,GE Healthcare公司)进行缓冲液置换,置换为50mM的Tris-HCl(pH7.4)缓冲液,加入甘油至浓度20%,保存于-80℃。对不可溶蛋白,则收集细胞破碎后的沉淀物,按照蛋白复性试剂盒(Protein Refolding Kit,Novagen公司)的说明书进行蛋白复性,然后在按照上述对可溶的重组蛋白的纯化方法进行纯化。蛋白定量采用Bradford方法(Bradford Protein Assay Kit,Bio-Rad公司)。
序列表
<110>上海交通大学
<120>米多霉素生物合成基因簇
<160>18
<170>PatentIn version 3.5
<210>1
<211>43561
<212>DNA
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>1
ccaagcttgg gctgcaggtc gactctagag atatcggatc accgtcagct tctcgcaggt     60
ctcgccctcg gcggcgatga cctgcccggc ctcgaaggcc accggctcga aggcgcccgc    120
gagttcggcc agtaaggcct cgtcggcctc gcgcaggaag ggcagttcgc gcaggtcctc    180
ggggacgacg cggtgcgcgc cgccctcgct gtagcagctg atgcggtcgt cgccgaggat    240
gaacgtccgg cggcggttga cgcggtagac accggactcg acgtcgaccc agggcagcgc    300
gcgcagcaga tagcgcggcg tgatcccgcg catctgcggg gtggtcttgg tggtcgtggc    360
caactgccgt gcggcatcgg gcgcgagact gagacgatcg ttcatgcggt cctcctcgaa    420
gagcccgcgc ggcagcccgc gcgggagcgc agaccgatcg tccggtcggt gggttcgtgt    480
cacaagacag gggattccga cacggtccgg aaatgatcga ctggcggagt gtgatgccgc    540
ggccctcgat ccggggcaag ggcttcaccg ccgcgcgccc gcttggtccg gaccgcgaga    600
tgaccggatt ccacccactg agacccgcct cccgggcgcg tcgcaccgac ggggcagcgc    660
aaaaccgccc tcgccgccgg ttcggtcccc cgaaaaccgg tcccgtcccc gaagcagaac    720
cgcccctacc gcccccggaa aacagaaccg ccccgatccg gtgatccgga tcggggcggt    780
tccacaagcg gtagcggtgg gatttgaacc cacggtggag ttgcccccac acacgctttc    840
gaggcgtgct ccttaggccg ctcggacacg ctaccgagag agagcttagc ggacggtggg    900
ccgtgctctg aaatccgttc cccggtgaca gggtgtggtg ctggtcaccg gtcgcggaag    960
aagcgggtga gtagctcggc gcagtcgtcg gcgaggacgc cggtgacgac ctcgggacgg   1020
tggttgagac ggcggtcgcg gacgacgtcc cagagggagc ccgccgcgcc ggccttctcg   1080
tcgacggcgc cgtagacgac gcggtccagg cgggagagga cgatcgcgcc cgcgcacatc   1140
gtgcagggct ccagggtgac gacgagcgtg cagcccgaca ggcgccactc gccgacggcc    1200
cgcgcggcct cgcggatggc gaggacctcc gcgtgaccgg tggggtcgcc ggtggcctcg    1260
cgctcgttgc ggccgcggcc gatgacggag ccgtccctgt ccagcacgac ggcacccacc    1320
ggcacgtcgc cggtggcggg ggccgccgcg gcctccgcca gggcggcccg catgggagcg    1380
acccaggggt cgcgcaccgg gtcggggacg gggacggctg cgtcgtggac ggcttcgttc    1440
atggcaccag tgtgagcgca cccgccctgg cggacgtcag cggacggcct ccaggacgtc    1500
ggtgcagccg agggcctcgg cgatcgagcc gagggcgtcc ccgtccagcg acaggatctc    1560
cttctcgctc accccgaggt cctccaggag cctgccgtcg cccagcgggc cgctgggcgc    1620
gacggaggcg cccgccccgt cgtcgctctc gtcctcctcc gtctcgggtt cgccgtcctc    1680
ggtgccgtcg aggtcgaggg tgtccagcgc gtcgtcctcg tcgtcgtcgc ggccgacgag    1740
ctcgtcgacg agcatcgccc cgtacgagct gcggttggcg acgacggcgt tcgagacgta    1800
gacccggggg tcgtcctcgc cgtccacccg gacgacgccg aaccaggcgt cctcctgctc    1860
gatgagcacc aggaccgtgt cgtcgtcgta cgaggcctcg cgggcgaggt cggcgatgtc    1920
ggacagggtc tccacgttgt cgagttctgt gtcgctcgct tcccacccgt cttcggtgcg    1980
cgcgagcatt gcggcgaagt acaccgtgac tctcccactg gtcataggcg gtgccgggtc    2040
ggacggggac caccccgccc actcggaatc gtggcagaaa cctgggcgtt gcgagaggtc    2100
ttccgcgctg cgtcgtgcag cagtccgaga gatgtcgctc acgtggggcc cgtgagggcg    2160
ccgtacgggc gtgacgcggc gcgacacggt gcggcatggt gcgacgcggc gccctgggcg    2220
tggcgcggac gggtccgccg ggacggtcac cagcggaagg tgcgcatccg catctgctga    2280
cgcatccggg ccgcccgggc ccggcgcggc tggacgcggt cgcgcagctc cttggcctcg    2340
ttcagctcac ggaggaactg ggcccggcgc cgtctgcggt cctcggcgct ctcggggctc    2400
tcgtccgggt cggcggcctc ccggggccgc cgggggtccg gccgctcgcc gccgggcgtc    2460
cggcgccggt cctcgcggcg tttcccggtg tctatggagt ccggttcccg ggtgtccgct    2520
tccgctgtct cccggggcgt ccgggcaccc gacccggatc cccgcctgtc atggccggcc    2580
atgggcagca ccacctcgtg ccgaggtcct cgcccggcga caggccgggc gtacgtgccc    2640
actttccccc taagtggtgg tttgatgcca gggctgcgac agaccgtcga agcctcgccg    2700
aagccccgcc gtggcgcctc ggcgggagcc cgggcattaa agctcggtta atgtcgatgt    2760
catgcggatc cacgtcgtcg accaccccct ggtggctcac aagctcacca cgctgcgcga    2820
caagcgcacc gattccccca ccttccggcg cctctgcgac gagctggtca ccctgctcgc    2880
gtacgaggcc acgcgcgacg tgcgcaccga gcaggtcagc atcgagtccc cggtgaccgc    2940
caccaccggc gtccggctct cccacccgcg tccgctggtg gtgccgatcc tccgggccgg    3000
cctgggcatg ctggacggca tggtccggct gctgccgacg gccgaggtcg gcttcctcgg    3060
catgatccgc aatgaggaga ccctcaaggc ggagacgtac gcgacgcgca tgccggagga    3120
cctctccggt cgccaggtct acgtcctgga cccgatgctc gccaccggtg gcacgctcgt    3180
cgccgcgatc aacgagctga tcgcccgtgg cgcggacgac gtcaccgcga tctgcctgct    3240
ggccgcgccg gagggcgtcg aggtcatgga gcgcgagctc gagggcgcgc cggtgaccgt    3300
cgtcaccgcg tccgtggacg agcggctcaa cgagcacggc tacatcgtcc cgggcctcgg    3360
cgacgccggc gaccggatgt acggcaccgc gggctgaccc ccgagccggt ttccctctcc    3420
tccgcccgcc gacctcggcg accgcccggc gccgtcctcg gcgaccgccc ggcggccgag    3480
ctcagcgtct gcccggccgc cggcccaggc gaccgcccgg cgccgtcctc agcgaccgcc    3540
cgccgccctc agcacttggc ggcgggcgag cccggtgcgg ccgacgccga cggcggggga    3600
gagcccgtgg cgccgggcga ggccgacacc gagggcgcgg gccggcccgt gaggccggtc    3660
agcgccttgt cggcctcctc ctggggcatg agcccctgaa aggccgcccc cagcacgagg    3720
tcgacgtcct gtccctcgcg ctggtcgctc ttgggctccg ccccggcgag ctgggtgccc    3780
agcacccgga gcgcgccctc cagggactcc tgggacccca gcagtatgcc ggtgccctcc    3840
accttcttgt cgtagtcggc ctgggcgttg cccaccttgc cgatcctgaa gccgcgcttc    3900
tccagctcgt ccgccgtgat cttggcgagc ccgccgcgcg gcgtggcgtt gtagacgttg    3960
acggtgatgt cgccgggccg gggcaggtcc ctgggcagct tccgggcggg gacccgggcc    4020
gcgtcggccc cgctcttgca gtcgccgctc cgctttcccg aagccgcggc ccgcgtcgga    4080
gcgggcccgc ccgagaagac gtcgacgagc tggaccgttc cccacccggc cagccccagc    4140
acgacggccg tggcggtgcc ggcgagcacg atcctgcggc ggttccgggt gcggcgcata    4200
tgcgggaacc gatggcccgt gatgcggtac ttaccaccca tgccaggagg ggtgagcatg    4260
ctcatgagcg cagcgtagtg ccgggcggag ccgctgccta ctagatgatc aatgggttgc    4320
ccggacccct acccaaaagg gccaataacc gcccatgcga ccgtttttcc ggagggcggt    4380
acgagcccgg aacgacggcc cggaaagcgc ccggtccgca tatcggtccg ggaatcgaca    4440
aaagtgccga acgaagcgcc gagacggcgg ccggacgggt gacggccccg gcggtcagtc    4500
cagttcgagc acgcgcgcgt gcagcacctg gcgctgctgc agcgcggccc gtacggcccg    4560
gtgcagcccg tcctccaggt agagatcgcc ccgccacttc acgacgtggg cgaagaggtc    4620
cccgtagaac gtcgagtcct ccgcgagcag cgtctcgagg tcgagctgct gcttggtggt    4680
caccagctgg tccaggcgta ccgggcgagg ggcaacatcc gcccactggc gggtgctttc    4740
ccggccgtgg tcggggtacg gccgcccgtt tccgatgcgc ttgaagatca cacggaaagc    4800
ctaccgggcg agcggctccc ggcgcagcca tggcgcggga gtgcgatggt gacaatcagc    4860
cgcataccgg gagtgatgca tggaactctt gagcgagaat tctttcgtca gagctccgga    4920
ttccggatgg ggtccaccgg aatccgctcg cccgggccgt tccccgccgc cgcgaccgcc    4980
cgctcactcg gcgatctcgg tccgctccca ccactcgtag acgggcagcc tgccctcggc    5040
ggtgtcctga tgccgcgagg tcttcttgaa gtgctcgtag ccgcccttga acgggatctt    5100
cagctcgacc ccgggagggg tgatcgtgac gacccgctcc ggaagatcgt ccggaccgcc    5160
ttcgaggaat gctttgggag cgctgctcat gggggacagt cttccggcgc tccccgccgt    5220
acgtgcggcg cgacgcgccg caggccgagg gggcgggcgt cacgccttct tgaccgccgt    5280
cttcttggcg gctcgtttca tttcctgctt gtaggcccgg accttgtcca gggactccgg    5340
cccggtgatg tcggccaccg agcggtacga ccccgcctcc ccgtaggagc cggccgcctc    5400
ccgccagccc tccggcgtca cccccagtcg cttgcccagc agcgccagga agatctgcgc    5460
cttctgcttg ccgaaccccg gcagcgcctg gagccgctcc agcagttcgc gccccgtcgc    5520
cgcgccggac cacaccgcgc tcgcgtcccc gtcgtacgtc tcgaccagat ggcggcacag    5580
ctgctgcacc cggcccgcca tggaccccgg atagcggtgc acggccggct tctccgcgca    5640
cagcgcggcg aacgcctcgg ggtcgtacgc cgcgatctcg tgcgcgtcca gatcgtctcg    5700
cccgagccgc cgggcgatgg tgtacgggcc ggtgaaggcc cactccatcg ggatctgctg    5760
gtccagcaac atgccgacca gggcagccag cgggctgcgc gagagcaggg cgtcggcgtc    5820
gggctgctgg gcgagccgga ggggacggtc catgggccga tggtccctcc gggagggcgg    5880
cggcgcatgc cgtcccggcc gttcggcggt gtcgggtggt ggtgcccggt cgtgtcgccc    5940
ggtcgtgtcg ctcggtggtg tccgccggtg ccccggggtg tccaccggtg ttctgtggtg    6000
tcagcaattg cggtctgcag ctagtggtca acgcggcggc attggtccgc ggcccggccc    6060
tgggcaggat ggcggacgcc gatcggcaag tcctgtggta cctcactatt acgggcgggc    6120
agtgatggaa acccatacgt tcgggacgtt ccaagacgct tatctgagcc agctgcgcga    6180
catctaccac tcaccggaat tccgtaacgc accgcgtgga caggcgagtc gcgaacggat    6240
cggcgccgga ttccggctgc tggatcccgt gcagcgccac atatccgtgc cggcccggcg    6300
cgccaacgtc gtgttcaact tcgccgaggc gctctggtac ctctccggct ccgaccgcct    6360
cgacttcatc cagtactacg cgcccggcat cgcggcctat tcggccgacg ggcggaccct    6420
gcggggcacc gcctacgggc cccgtatctt ccgccacccg gcgggcgggg tgaaccagtg    6480
ggagaacgtc gtcaagacgc tgacggacga ccccgacagc aaacgggccg tcatccagat    6540
cttcgacccc cgggaactgg ccgtcgccga caacatcgac gtcgcctgca ccctggccct    6600
gcaattcctg atccgcgacg ggctgctctg cggcatcggc tacatgcggg cgaacgacgc    6660
cttccggggc gccgtgagcg acgtcttctc cttcactttc ctgcaggaat tcacggcccg    6720
ctatctcggg ctcggtatcg gcacgtacca ccacgtcgtg gggtccgtgc acatctacga    6780
cagcgacgcc cggtgggcgg agcgggtgct ggacgccgcg acgccggacg gcggcccgcg    6840
gcccggcttc cccgccatgc cggacggcga caactggccg cacgtccgcc gtgtactgga    6900
gtgggaggaa cgcctccgca cgaacgcggc gcgcctctcg gcggacgccc tggacgccct    6960
ggacctgccc gcctactgga agcacgtcgt ggcgctgttc gaggcccacc gtcaggtccg    7020
gcacgaggac acgcccgacc gggcgctgct cgccgcgctg cccgaggtct accggcagtc    7080
gctggccgtc aaatggcccg gccacttcgg ctctccggcc ggctcctgac cccgatcggc    7140
tcctgacctc ggtccgttcc cgaccccggt ccgttcccga ccgttcgccg ggcacgcccg    7200
gacgacgcga ccccaccaga gacgcgaccc caccagaaag gaacaacccc ggtgaccacc    7260
acccccaagc cccgtaccgc ccccgcggtc ggctcggtct tcctcggcgg gccgttccgc    7320
cagctcgtcg acccccgcac cggtgtgatg agcagcggtg accagaacgt cttcagccgc    7380
ctcatcgagc acttcgagag ccgcggcacg acggtctaca acgcccaccg ccgcgaggcc    7440
tggggcgccg aattcctgtc gcccgccgag gcgacccggc tcgaccacga cgagatcaag    7500
gccgcggacg tcttcgtcgc cttccccggc gtcccggcct cccccggcac ccatgtggag    7560
atcggctggg cgagcggcat gggcaagccc atggtcctgc tgctggagcg cgacgaggac    7620
tacgcgttcc tggtcaccgg tctggagagc caggccaatg tggagatcct ccggttctcc    7680
ggcaccgagg agatcgtcga gcggctggac ggggccgtcg cccgggtgct gggccgggcg    7740
ggcgagccga cggtcatcgg ctgaggcgcg gcccgcatgg acctcttatc ggcggcccgg    7800
gcggaccggg cggatcggtc ggaccaggcg gatcggccga ctcggccgga cggagcggat    7860
cgggcggact ggacggctcg ggcggacgga cccgtgaccc tggcggtggc gggtgccgag    7920
ttcggctggg ggagcgcggg gaagctggcc gcgatcgtcg ccgcgttgcg cgaacggcac    7980
ggcgagcggg tccggttcgc cggcctgggc tccgggctcg ggcgccccgt gctgggcgcc    8040
ctggacgccc gcgactggac ggacgtgccg gagccgggcg acggcccggc gggcgaggcc    8100
gcgctggcgg cgctgctgcg cgagcggggc gtggacgcgg cggtcgtcgt cctcgacggc    8160
ctgctggcgg cccggctgga ggcggtgggg tgtcccgtcg tctacgtcga cagcctgccc    8220
ttcctgtgga ccgagcacga cttcgtcccg tccggagtcc acacctactg cgcgcagttg    8280
tgcccctcgc tgccccggca gagctggccc gtgctgcgcg ggatcgaggc actgcgctgg    8340
gtggaaccgg tggtgggcac gtacggggcc ggcggcctcg acccggtgcc ggggaaggcc    8400
gtgctcaacg tcggcggcct gcgctcgccg ttcaccgccg aggacgacga ctcctatgtg    8460
gagctcgtcc tgggccccgc cctgcgggcg ctgcgggcgg cgggcttcgg acaggtcgtg    8520
atcagcggca atgtggatcc cggcctggcc cgggtgccgc acgccggtac gcacgggctg    8580
accgtgacgg cggggcggct ggaccacggc gcgttcatcg aggaactgcg cacggcggag    8640
ctgctggtga cctcgccggg ccgcaccacc ctgctggagg cggcggcgct cggccagcgg    8700
gccgtcgtcc tgcccccgca gaacttcagc caggtcatga acgccgcgga cgtcgcggac    8760
ctggtggacc cggccgtcgt ggtcccctgg ccggccgccg tcctggacct ggccgagctg    8820
gcccgggtcc gcgaccaggg cgaggagggc gcggtgcggc tgatgtacgc ccgtatcgcc    8880
gcggcgcgcc gggagccggg gacggtggcc ggcccgctgg ccgacgcgct cggcgccgcc    8940
gtcgcccacg tccgccggca cgacgtccgc atggggccgt tcgccggcac ggacgggagc    9000
ggcgcgggaa cgcgaggcgc gggaggcgca agagatacag gaggcgcagg aggagcgcgg    9060
agtgtggcgg acgccgtcga cgagctgatc gggaagctga cggacggccc ggccgccggg    9120
aatcgcaggg acggatcacc actggcggcg ccggtccggg cgcgctgagg gagagaagga    9180
agcgatgcgg caccccaggg aactcaggca ggacacctcg ctcgcgatca acggggggac    9240
ccccacgttc gccgcgctcc cggaggagga caccgggatc gtggccgagg ccgccgacga    9300
ggtggcggag ctgatcagga ccaggcgcac cgtccactgg ggcggcggcc cccacacccg    9360
cgtcctggaa cgggacttcg cggccctcgt cggccgggag cgcgcgttct tccacaactc    9420
cggcacggcg gccctgcaga ccgccctctt cgccctggag gtcgaggagg gcacccccgt    9480
cgccctcagc gactccggtt tcgtcgccag tctcaacgcc ctctaccacc tccgggcgcg    9540
gccggtcttc ctgcccaccc acccggccac gctgcagtgc gtcgacgacg tcgcggagtg    9600
gaccgccggg accggcgtcc acacggcgct gatcacccac ttcttcggca acgtcgccga    9660
cgtcgaggcg atctggcgca cctccggggc ccggcatctg gtcgaggacg gcggccaggc    9720
ccacggcgcg cggctgcggg gccggccggt cggctccttc gggaccgtcg gctccttcgc    9780
gggctcgacg aagaagctgg tcaccgccgg gcagggcggg ctgaacgtcc acgacgacga    9840
gcacctggac tggcggatgc gcacctacgc gcaccacggc aagtccggga actacgaagg    9900
gacgttcccc ggctacaact tccggggcgg ggagatggag gcgatcctcg cccacgccgc    9960
cctgcggcgc ctggacgagc gcgtcgcggc ccgcaaccgc accgccgaca cgatgttccg   10020
gatcttcgac gaggccggga tccgcaccgc gcgcccggcg cccggactcg actgctcgcc   10080
cgcctggttc gacgtcgcgc tgatcctcga cgaggagtgg ctgggccacc gcgactggct   10140
ggtcgaggcg atggtcgccg acggcatccc cggctggcac tacccggcgc tgatcggcat    10200
gccctgggtc gagccgtgga tgcgatccaa gggctggtgg ggcgagcgcg aacaggagct    10260
gctcgcctcg gagaccgcgc tgtggggccg caccctcgtc ctcggcgccc agatgaacgc    10320
cgtggacgcc gagcggatcg cccacgccgt cgtggcgctg ctcaagggat gacacggcga    10380
tgacctgcgg cgagatctcc gaggtgcgcc gggtgctgcg ccggctcggc gacggcgggc    10440
cgcgttccgt ccgggtcagg gagaacggga actgcgcggt gtacgtgggg gaccggctcg    10500
tggtgcgcgt cggccactcc tggccgctgg acgcccgggg cgagctccac tgctggagcg    10560
tcgcccggga tgcgggggtg cccgcccccg agcggatcga cgagggccgg ctgcccggcg    10620
ggcgtacgta cgtggcgtac gtgtacgtca tgggcacccc ggccgggacg cccgcctccc    10680
tcgcggccgc gggcgccgtg ctggcgcggc tgcacacggt gccgggcgag cacttcccgg    10740
ccgtggcgca caacctgccc cggcgcaggg accgttaccg cacggcggtg cggtgcgcgc    10800
gggccgccgg gctcgcgccc ggcggcctcg cccaccgctg tctgctgcgc gcggcggacg    10860
actggcggcg gtcgcgggag gtggccgcgc acggcgactt ccgcacgccc aacctggtgg    10920
tccggggccg gggggtgagg gccgtcctgg actggagcga cgcccgcgcc gccagccccg    10980
agagcgatct gggccagctc gggcccgggc agctgcgccc gctcctgcgg ggctatctgg    11040
accgtgcccg gcgcgccccg gacctggagc tggtggccgg gcacatgctg gcccggcatc    11100
tcgccctgga ggccgccggg gtgttcccgg cgggcacgtc ggcggcgctc gcccggaggt    11160
tcgggccggg gctgtcccgg gggaggtgga ccgttgcctg accggagtcc ggcggccgag    11220
ccgctgatcc tcgacgtcgg cagcgcgggc cagctcgcgg agctggccgg cgacctggtc    11280
gacctggccg ggcccggcgg cgcgaccggc ccctgggtgc tcacctgggc ccacggcgcc    11340
ggggagccgg gcggggagcc gggcgagggg cagaaccggg ggccgaacgg gggcacgggc    11400
gggggcccgg gcgggacggt ggcccggccg ccgggcgcca cggtcgtgcg ccacggcggg    11460
ctggaggtgg tcacggtgcc ccgtccgcca cgcgacctcg gcggtttcct cgacgcgtgc    11520
tgccgcaccg gcccggtctc gggccacccg gacgtcaccc gcacgatcct catccttgcc    11580
gaccccacgg accgggaccg gtccgcttcc cctccggagg cacctcatga cgcaccccgc    11640
gacggggccc gcgacgggcg gccgtgaccg ctatctcttc atcaggatcc tggaggcgtg    11700
caacgccgac tgcttcatgt gcgagttcgc cctctcccgc gacacctacc gcttcaccct    11760
cgacgacttc cgcgaactgc tgccgcaggc acaggagtcg ggcgtgcgat acgtccggtt    11820
caccggcggc gagccgctga tgcacggcga ggtgctcgac ctgatccgcg agggcaccgc    11880
cgccggcatg cggatgtcgc tcatcaccaa cggcttccgg ctgccgcaga tggtcgacaa    11940
gctggcggag gcggggctgg cgcaggtcat cgtcagcctc gacggctcct ccggtgagac    12000
gcacgacgtc taccggcgca cccccgggat gttcgaccgc gggctggacg gactcgtacg    12060
cgcctcccgg gcgggcatgc tcacccgcgt caacacggtc gtcgggccgc acaacttcgc    12120
gcagatgccg gagctgcagc gggtcctgac cgaggcccgc gtggagcagt gggagatgtc    12180
cgcgctcaag ctggaacggc acatcgccta ccccccggcc gaggaggtgc tccacgcctg    12240
cgaacccgtc ttcctggccg acccgaagcg gtggctggtg cccctgggca agcgcttcta    12300
cggggagacc gccgaggaac gggaggcgtt cttcgagcgc ggcacgaccc cgagcgcgtc    12360
acggccgctg tgccatgtga ccgacgacgt gatgtacctg gaccccaagc tgggccgcac    12420
cttcgcctgc agctgtctgc cccaccggga cggcccgggc gccgacatgc gcgacgagcg    12480
gggccgcgtc ttcctcaaca gcccttcgtt ccgcgcgcac gccgaggagt tcaagcagca    12540
ggggcccgtg atctgcagcg gctgctcgac cacggcggcc ggctacagcg acgacgtggc    12600
ccggctcggc tcggtgcccg cctggcacta ctgaccgggg cgccacgccc tttgctcgca    12660
cgccccgtcc gtacacccgt acgcctcctc caccgcccgc acgtcatcct ccgcccagga    12720
agccgaacat gatcctgcgt accgaccacg tggacgcgta tctgtccgcc gtgtccgcca    12780
tcctcgacga gcccggccgc gccggggccg gcgtccccgt gctgtgccgg ccgggctctc    12840
cgctggacgt gctggtgacc cgctggtccg ccctgctggg ccacgccggg ccgcgtgccc    12900
gctcggaccg gccgggccgg gccgtcgtcg cggtcggcga cgaccccgtc gtctccgcgg    12960
cggcacggct gctcgccgtg ctcacgggac ggaccgcgct ggccgtcgcc gacgtcaagg    13020
agctgcccgc cctgtgggag cggcacgacc tcgtctccac cgcgctggtg ggcatcggca    13080
ccgggttcga cgtcccgggc gtcgagccca gcgccttctg gcggctcgac gcgaccgacg    13140
cgaccctcgg catcctgacc ggccgggacc gggagtccct gacctggttc gtcgccaaga    13200
gtctgctcac ctccaccgtc cccggcgacg cgcagacgct gctgctgccg gaccgcaagc    13260
cgcgcgagga cacggcgtcg gcgggcgtgg gtgccggggg cgtcgaggtg ctgtacgggg    13320
ccgccgccga ggaggcgctg cccgcgctcg ccgaggacga gcgggtacgg gcgctgatcg    13380
ccgtggaggc ccacggcagg gccgaccacc tgggggtgcg ggacggcatc atctgcggcg    13440
accggctggc ccatctgggc cggtccagcg agccggaggg catcgggcgg gtgccgcagt    13500
gcgcgttcgg gcacggctgc ttcaagcccg gcgcccgggt ggcgatctcc cgtatgccgg    13560
cgcagtcgct gttcctgcac agctgcacca gttcgcacac cgaggcggac atgtacgaga    13620
agtcgttcct gctgggcctg gccgccctgg aagggcccgc ccggcacgtg ctgggcaccg    13680
tccgcccgat gcacgacggg ggccacgagg tcggactcgt ctcggcgttg acggcggcgg    13740
gcgcctccgc cggcgaggtg acccggctgc tgaacgcctc ctaccaccag caccgcggcg    13800
agcccgcgcc ctatctgctg ctcggcgacc cggagctgcc gttcgcggac gggccggtgg    13860
gcgggccgga cgcgggcccg gccgtggagc tggacgcctc cgccggcgcg ctgccgctcg    13920
gcggccggcg cacggcggtc ctgggcagcg gccccggcgt gctggtcgtg ggcgacgcga    13980
ccggggacga ggacggggac ggcccggggc ttcccgcggg cgtgggcgcg ctgaccgtcc    14040
ggcgcggcga ccgtacggac gtcgtggcgt ggagcaccga gggcccgctc cccgaagggg    14100
cgcttccgtt ggtccgccgg gagggcgggg cggtggccgc ggacggcggt gccgaggagc    14160
tccacgcccg ctgggaccac gtcgaccacg gcatcgcgtc gggcggcgcg ctcggcctgc    14220
tgcccaagga cctcacgggc aggctccagg agctgcggga cctcgccgca gccgtcggca    14280
ccgccgaccg ggacgcccgc ttcttccccg gccgcctggg cgcggtccgg cgcgcagcgg    14340
cccggctcga ccagcggatc cgcgacgccg accgggcact gatgcacgcg ctgctcggcc    14400
gcaacggcaa gccgttcgac gccgacgaca ggctggagag cgccttcgtg ccgctggagt    14460
cccagtacgg ccgccaggtg tgctggtgcg gccgggacgc ggtcgtcagc cggctgcggc    14520
cccggctggg cgcccgggaa gtgcgccgga agtacaactg catgcagtgc ggggactacg    14580
cccaggtcgc ggtggacggc gtcgacgtgc gctgggaggc cccggagttc gtggcctcgg    14640
gaggcgagct ggagcactcc ttccggatcg ccaaccccct tccccacccg gtcaccgggg    14700
tgctcgcgct gagcgtgtcc ccctggtacg gcggcgacgt gtccttccgc cccggcatcg    14760
cgaccttctc ggtggcgccg ggcggcacgt gccgggtggg cgtcacgatg cgcgccgccg    14820
ggctgaagcc ccaccgctac acggtcgacg cgacggtggt cagccatctg cgcatcaacg    14880
cctatcgcaa gttcgtgcag gtccgcccgg cgggacccgt cggcccgagc gacgaggacg    14940
gtgcgctgtg acagcaccta cgaccggacc gaccaccgga cccacgaccg ggcccacggc    15000
cgggcccacg accgggccca cggccgggcc cacggccggg cccacggccg gatcggcggt    15060
cgccgaggag gccgtggcgg agtgggccgc ggcctggctg gagcaggtgc acggggtgcg    15120
ctacgggccc gacgacgcgc tcttcggctc gctcgactcg ctcgcgctga ccgagctcct    15180
ggtggcctgc gaggcccatt tcgggctgcg catcgacgag gggttcggct ggcaggcgct    15240
cgcctcggtc cgcagcctcg ccgcccatgt ggccacgggg gtccgcccgc ccagcgaccg    15300
cgtctggttc cggtcgggcc ccggcgcgac cggggacgcg gacctggacc gtacggccgt    15360
cgtccgggtg gcgctggggc tgccgccggg cgcggccgtg gcccggctct ccccgaggga    15420
gctggcgctg ggcatcggcg ccgccgcagc gccttccgag aagccggcca cgaccctgcc    15480
gcccgagcgc gaacggcttt ccctcgctcg ggagtcgagc acccggcccg gctcgctgct    15540
ggccgtcggc gccacggccg cgcggatccg ggcgttcgcc gggcgcctcg acgccgcgct    15600
cgcggcggtg ggggccacgc ccgtctggta cccgatcacg accgacagcc ccgtcggcgc    15660
cgaccacgtc cagggcatcc cctccgagct gacggcgggc cgcctcgggc acgcgggctg    15720
tctgcagctg ctcgccgaac tgcccgcgga acgcgacgtc gtgtactcgg gcatcgccta    15780
cgccttccgg gacgagcccg gccgccgctg ggaacccgcc ggccggctgg aggcctaccg    15840
ggtccacgag acggtcgtgc acggcaccga ggagttccgc acggcgatgt ggcgacggct    15900
gtacgagctg gtggaccggg agctgtcggc cctcggcccg ggcggctggc aggaggggcg    15960
ggacggcttc accccccggc atggaccgca agctcgaatg gctgctggaa ctcgacgctg    16020
ggcacggtga gcgtgggggg cacggccatc cgggtggacg gatcgcggtg gcctcgctca    16080
acgaccacgg cgggctcttc gcggcggcgc cggacggctc cggcacgccg gacggcggcc    16140
cgccgggctc cttctgtctg ggcatcggcg tcgaccggct cgcctcgctg ggggtgatct    16200
gatggacgcc gcgcccggca ccgcccgtac ggccgcgggc acgtccgtac cgcccgtact    16260
ccccgtcgat gccgaacgtc ccgccgcccg gcgcaccctg gccatggagg agggcacacc    16320
ccggcagtgg gagggcctag ggctgcacgg tgttccggag gccgtggagg cggcgctggg    16380
cccggccgcc gagctggtcg tcgccgcgcg gggcggcggc cggtccccgc tgcccggcct    16440
cgtcttcgcc cagccctgcc tcggccgctc cgccggcgtg gcccgggacc tgcccgtctc    16500
cgtggtgtgg gagacgggcg tggccctcgc gatcgcccgg gcgctggacc ggcccgcggt    16560
gatcgggctg tgcgtgtacg aggagatcct ccagcagccg caccgggacg ccgagttcac    16620
cgcgctgggc gcggccgtcg cgcggaccgt cgaggcgctg ggccggctgc tgggcgtggc    16680
ggtcaccgcc cgcgtcgaga ccgccgcgcc ccgcgccgcg gaggtgccgg cgcgacggct    16740
ctacggtctg tacacgccgt tctccgaatc cacctatccg aggggtttcc ccaacgaggc    16800
ggaggtgctg cgcgccttct ccgcgtactg cgggcgctac gaggacgccg cccggcggga    16860
ggcgtccctg tgggtgacgg aaggcgtgca cctggccaag gcggcgctcc tcggcctcgg    16920
ccccggcgtg cccttcctgg ccaccacccc gctgcccgac cctgcgcacc ccggccggct    16980
tctccaggac gccccggccg ccacccgggt caccctggaa cgccgctcgg cgctgcctgc    17040
cgactggtgg ccggagcagg cgctggaacg cgcgctcggg accggtctgc ggcggctgac    17100
cgaggacttc cacgcgctga tcgaagactt ccacgacccg gcgggagacc gatgagaacg    17160
ccccggaccg gagccgtcct cggcgggcgc ggccccgccc tgcccttcgt cgcctatatg    17220
gcgctctcca acgcccagtt cacccggggc gtgttcgtcc tcttcctgct gcgcgggaac    17280
atcagcctgg ccgaagtcgg actgctggag agcctgttcc acctcacccg ggtgctctgc    17340
gaggtgcccg ccggcagcgt cgccgaccgc tggggccgcc gtcgtacgat ccaggcgggc    17400
ctgatcctct cggcggcggc gatgccggcg ttcctgctcg gcgggatgtt ctggtacgcg    17460
ctggcgttcg tgttccaggg cgcgggctgg gccgcccagc gcggcgccga caccgcgctg    17520
ctgtacgagc tgctggaacg gaccggcggg accgatcgct acgcccgcat cctggggcgc    17580
tcccacgcgg cctcgtacgg gacgctcgcc ctcaccaccg cgctcggcgc gatgctctac    17640
cagcggcacg tcagcctgcc gttctggctt caggcggccg tcaccctgct ggccgtcggg    17700
gcgatcggcg tgctgccgga gagctcgggg acggcggcgt cgggggcggg gtcttcgggg    17760
tcggggtcct cgggggagcc ggccgaacgg cccatgggtg tctggcggct ggcccgcgcg    17820
ggggcccggc tggtggtcgg ccaccccgtg ctgaggctct tcgtcgcctt cgtcgccctg    17880
gtcgaggccg ggacgacggt ggtgagcatc ttctcccaga gcttcttccg gacgctcgga    17940
tacggcaccg ccaccaccgg gctgatcctc gccctggtca cggccttcag cgcggcggcc    18000
gcgctgcagt cccaccgcct cgtcgaacgc ggtccggtcc gggtgctgat ggccgcttcg    18060
agcctgtacc tcgtggggct ggccgggatg gcctcgctgc agccgcagct ggccgtcgtg    18120
ggctactacc tcgtcttcct caaccttgac ctgctcgccc cggtgctgag cgccttcttc    18180
caccgctctg tggacgagga ggtgcgagcg accgccggtt cgtacctcaa cctgtcgacc    18240
agcgtgctca ccttcgccgc cttcccgctc tccggctcgc tgatcgacgc cggcggctac    18300
cgcccgctgc tgatcatcac cgccctggtc agcctgccgc tcctggtctt cctcgtcggc    18360
gcggcccggc gggtcctctc accgccggaa gagggcgatt ccggggagga cgccggggag    18420
cgggccgggc ccaaggggcc cggtgcggcg gcacccgaca ccaccacgac gggagtgtga    18480
gaacaccatg accaccaggg ctgactcccc gtctcccggg tccggcgggc ctgtcggacc    18540
cggcgggtcc ggcggcgacg acggacggcc ggtgatcgcg ctgcgcttcg ccccggccga    18600
cgtcgaagcg gcggccgcgg cggagtacgt cgccgcgcac ctcggcggtt tccggtgcct    18660
gccggagtgt ccccaggagg gcgattccgg cccgggccgg aatccacccg ccgccgtgat    18720
cgtcttcggg cggtccggtg ccgccggagg ggccggtccc gcgggcgtgc ccaccgtcct    18780
ggtcgagggc gcggaaccgg tgcccggcac ggacgcggac gtcgtctgcc ggcaggcgcc    18840
cggctggctc accgccgggg aaccgcccgc cccgcccgcc gtacgccccg gcggcggccg    18900
gatccgcacc gtggacgtgg ccgccgtcgc gcccttccgt caggtgcggt cgggcggggg    18960
tggcgggcgg gctgccctcc tgctcggcgg ggccggtggg cccgacgggt ccggtgcgtc    19020
cgccgggggc gaggctcttc ccggcgccct cgcccggttc atcgccgggc atccggccgc    19080
cgccggtgac gcgtgggccg tgctcaccga tctcaccggg gagcccctgc gggagctgct    19140
cggcctgctg cccccgaccg cccgcacggt gggtgcggcg gactgggccc aggtcctgcg    19200
ccgcgcggac tcgttggtgg cgacccccac cctgctggcc gccgcccatg cccgtaccgc    19260
ccggatcccc ctgcacgtac tggacccggc gggaccggcc cagcggcgcg tccaccgggc    19320
gctggccgcg atcgccggcg ctcccgggga gccgggcggc ctcccggtgg tcgggcccga    19380
cgactggccg cgtgacgacg gccgcgccgg agccctgggc ggggccgcgc agatcgcccg    19440
gcaggtgcgg cagttgtgcc tcgcgccggc ctgaaccgtc cggcgggtcc tgtcacgtcc    19500
cttgagacgt ccctccgggg cgtcccccac gcaaaggtat ggatggcatg tccgacactc    19560
tcgcgcacaa ccgtcccctc gacctgaccc agcacgagat agcggccctg cgctccgagc    19620
acaatctcgc ggacgcgcac acgcaccagt accagtcgcc ggcccagcag ctcatcgtgg    19680
actccctgcc cgccctctgg cacgaggcgg agaagggccg gcaggccgat ttcgaacagc    19740
ggttcatcga ggcgttcttc cggctgcacg gccagcccac ggccatcggc ctggaccgca    19800
cgctgctcac ctacgccgcc tccatctcca cgatgatcgc cgggatgttc ctcaagcgcc    19860
gcgacgcgcg ggtgacgctg gtcgagccct gcttcgacaa cctccccgac ctgctcgtca    19920
atctgggcgt tccgctcacc gccctccccg aggatgccct gcgcgacccc gcgcgcatcc    19980
accgcgaact gtcacggctg gtgaccaccg aggcgctttt tctcgtcgac cccaacaacc    20040
cgactggcca tagcctgttc gccgacggca tgcgcggctt cgaggaggtc gtacggttct    20100
gccgcgagcg cggcacggtc ctcgtcctcg acctgtgctt cgcggccttc gccctcggca    20160
gtggcggacc cggccgtcac gacgtctacg agctgctgga gaactccggc gtcacctaca    20220
tcgccatgga ggacaccggc aagacctggc ccgtccagga cgccaaatgc gccctgctca    20280
ccaccagcgc cgacatctac cccgccgtgt acaacctcca caccagcgtc ctgctgaacg    20340
tctcgccctt catcctgaac accctcaccc gctacatcga ggattcccgg cgggacggct    20400
tcgcctccgt gaccgacgtc ctcgaacgca atcgcaagtc cctgcgggcg gccaccgagg    20460
gcacggtgct ccgcgcccac gagcccgacg tcccggtcag cgtcgcctgg ttcaccatcg    20520
acgaccgcgg cccggacgcc acgcagctgc agcgcgacct ctccggccac ggcatccacg    20580
tcctgcccgg tacgtacttc tactggaacg agccgagccg cggcgagcgc tacgtccggg    20640
tggcgctggc gcgtgatccc ggggagttcg acgcctccat ggcccggctg cggacgcttc    20700
tcgcccgcta tgcgtgagcc cggcctcatc gctccgctgg tcaccccgct gacccccgac    20760
ggcgcggtct cggaagcgtg cgtacgggcg caggtcgcgc gcgtccgccc gtacgtccgc    20820
gccctgatgc ccggcatcag ctgcggggag gggtggctcc tggaccgtcc gcggtgggag    20880
cggctggccg ccgccgtcct ggactgccgc gacggcctgc ccgtccacct cggtgtccag    20940
gcggcggaca cggcggaggt gatccggcgc gcccgctggg ccgtacggca cggggccgac    21000
gccgtcacgg tcggcccccc gcacggcgcg ggcgcccggc agcgggcggt ccacgagcac    21060
ttcgcgcggg tctgcgcggc ggtcgacacc cccgtctgcg tctaccacga gagcgtcgtc    21120
agcggcacgc gcatgacgcc cgccacgctg accgccgtct gccggctcga cggcgtccgc    21180
gccgtgaagg agtcgggccg cgagccgtcc gtcaccaacg acctcatcgc cgcggttccc    21240
gacgtggccg tccaccaggg ctgggaggac ctcttccacg ccacgcccgg ggccgccggg    21300
ctgatcgggc cccttgtcct catcgacccg gcgctgtgcg cggagctcgt cgccggggtg    21360
ggtggggtgc agggggtggt gacggaccgc tgtcgtgagc tggggctttt ccgacctgat    21420
tatgtggccc gcaccaagcg ggagttgtgc cggctgggtg tcctggccca tgccgtgacg    21480
ctgtgacccc ccaccgtacg gaaatgggag tgaccatgaa tccttcgaag acctttctcg    21540
ttgtcgggcc gctgcgtgcc gacaccggct ggcagtagag ggcacggccg atcatttctg    21600
agttctcgtg gagcgaggcg gtgcggctgg ccggcgtcgc ggcggaggcg ctcggggcgg    21660
gagatctggc gggcgccgtc ggggcgcttg accgggtggc cgcgctgatc cggctggcgg    21720
gggagtcggg gggcgggggt gctgcggccg gggtgcgggg ctttcgggcg agtgcggcgc    21780
tgatctggga cgccttcgcg gcggctgcgt ccgggccgtg cgacgcgctg cggatcgcgg    21840
aggtctgccg ggcgctgcgg gggctggacg aggcggtggc ctcctgggag gagacctgtt    21900
accggttctt cccggcgctg ggtggggagg agggggcggg ctgtgcgggg cctacggctt    21960
ggtgagcgtc gggggcgggg ccgtgggtcg ggggcggggt ggggtggacg ggcccttacg    22020
gggctgatct cttcgcggtg cctgccttca ggggagggtg ccccgtattt ggcttcagcg    22080
gcgaagagct ctttacgccc ctaccagggc ccgttcaccc caccccgccc cctcgcgtca    22140
ccacctcgcg ggctgcggtt ccgggtgggc gggtgggcga aaccccgcgc cgccaggcgc    22200
gggaaacccc acggcgggtc agccggagag tccacggaac ccccgcaggg gaggcggtcc    22260
gccggaaagg cggaggaggc cgcggtccgc cgccagaacg cccgcctgga agcgactctc    22320
cgcccccaac tccgccatca tctccgcgat gtgccgccga cacgtccgcg tggacatgtt    22380
catccgcttg gcgatgacct cgtccttcgc cccggccgcc atcagccgca agatgcccgc    22440
gcggatctcg tcggcggcgg ggccgtagcc cacgtgcgtg tagacgaagg gtttcgccag    22500
gcgccagacc tgttcgatgg tccggtagag gtagtccacg accgccgggt ggcggatgac    22560
gaccgcgccg gggccgtcgg agcggcggtc ggccaggaag gccagcgatt ggtcgaagat    22620
gacgacgcga tcgagcaccc cggtcgtggt cctgatctgg gtgccggcct cgtgcatcag    22680
cgagaagtgc tgctggaccg ccgggctcga caggacggtg tgcggataca cggtccgtat    22740
ggcgatgccc cgggtcagca gggacaggtc ccgggggcgg ctgtcggcga gggtgctctc    22800
cagcagggct tcgggctggg cggtgagcac ctcgtgccgg cagtcgcgcg cggcagcgct    22860
caacagcccg cggatcgtgc tgatgtcggt gagggactcg atctgcggcg ccttccgggc    22920
gcgcccctcg ttgaccgcgt cgtacgcgtc ctggagcgag gccatggcgc tgcgcagccg    22980
ctcgtcctcc aggcgctgcc gctggatctc gccctcgcgg accgcgctca gcgcggcggc    23040
cgccgactgc gggctgatcg cggccagcag tcgcccgcgg tccgtgtgct ggatcaggcg    23100
cagcgcgacg agcgcgtcga tcgcctccgt gagttcgtgg tccccgtcgg cgtccgttcc    23160
ctcgccgctg tgttccgggg ggccgggcgt gcgcagggcc gtacggggca gggagccgcc    23220
ggcccgcagg atctccaggt acacggcgcg ggcccggccg gtcagccggg cctccgtcag    23280
ggggcacacg ccggtcatcg gccggcctgc ccggcgccct ccaccacggc gggctcccag    23340
accggggcgg tcacctcctt gaccgcgccg tccccccgga agtgcaggaa gcggtcgaag    23400
gaccgggtga accagcggtc gtgggtgacg gccagtacgg tgccgcggaa gcccgcgagg    23460
ccctgctcca gcgcttcggc gctcgcgagg tccaggttgt ccgtcggctc gtcgagcagc    23520
agcaaggtcg ccccggagag ctccaggagg aggatgagga agcgggcctg ttggcctccg    23580
gacagcgtct cgaagcgctg gccgccctgg ccggccagtt cgtagcggcc gagggcggcc    23640
atcgcctcgt ccctgggcag gctgtcgcgc cggacgtcgc ccttccagag gatgtcctcg    23700
agggtgcggc ccacgagttc gggccggtcg tgggtctggg agaagtgccc gggcaccacc    23760
cgggcgccca gtcgggcgct gccggtgtgc gccacgggct ccagcggggt gagcgacggc    23820
agctcggggt cgctgccccc gcggcccagc agccgcagga agtgggactt gccggtgccg    23880
ttcgccccca ggacggcgat gcggtcgccg taccaggcct cgaagccgaa gggatccgtc    23940
agcccgtcca gtcccagccg ctcgcagacg acggcccgtt tgccggtgcg gtcgcccgtc    24000
agccgcatcc ggatgttctg ctcgcgcggc cggggcggcg ggggcggctg cgcctcgaac    24060
ttcgccagcc gggtgcgggc ggcctgcagc cggctggcca tggcgtcgtt gtgcgaggcc    24120
ttgacctggt agtggcggac gagctccttg agcttggcgt gctcctcgtc ccagcgacgg    24180
cgctcctcct cgaagcgctc gtagcgggag acgcgggcgt cgtgccagga ggcgaacgag    24240
cccgggtgca tccaggcgga gccgccctcg acggtgacca cgcgcgaggc ggtgttggcc    24300
agcagctcgc ggtcgtgcga gacgtagagc accgtcttcg gggactcggc gaggcgggcc    24360
tccagccggc gcttgccggg gacgtcgagg aagttgtcgg gctcgtcgag gagcaggacc    24420
tcgtccggcc cggcgagcag gagcgagagg gcgaacctct tctgctcgcc gcccgacagg    24480
gtgcgcaccg gacgcgaacg ggcctcgtcc cagggtgtgc cgaggatgtc ggtgacgacg    24540
gtgtcgaaga cgacctcctg ttcgtatccc ccggcgtcgc cccaggccac cagggcctcg    24600
gcgtagcgca gttgtgcctt ctcgccggcg ccgggtacgg ccatcgcggt ctccgcccgc    24660
gccagtgcct cgccggcgcc gcggagcccg gcgggggaga gggagagggc cagcccggcg    24720
agcgtggtct cgtcgctgac catcccgatg aactgccgca tcacgccgag cccgcccgag    24780
cgggcgacgg ccccgcgcgt cacggggaga tcgcccgcga tcatgcgcaa caacgtggtc    24840
ttgccggcgc cgttcggtcc gacgagggcg accttcatgc cctcgcccac tctgaaggag    24900
acgtcttcga agagaacgcg cccatctggc agtacatgac ggagacttgt cacatcgaca    24960
tatcccatgt gcggaatctt gcaacatgca cgggatctct gtcacgcgac tttgcggaac    25020
cagccactct ggtatgtatc cctgggtaag cggcttgatt cgcatgtccg ttcgcaaggg    25080
gtggatgtcc tttccggctc ttgatctcgt gtgcgccagg cggtaattgg gcccgttcgg    25140
ggggcccgtt tcccgtaggg tggacgcgtg atcgaggacg gcggcagcgc gcggggaagt    25200
gtcaccacgg tgcggcgtgt gggggacacc gtccgccgtc cgcgcggccg ctggaccgcc    25260
aacgtgcacg ccctgctgcg ccatctggcg gacgccgggt tcctccgcgc gccccgggcg    25320
ctgggcgtcg acgaggacgg gagcgagatc ctgtccttcc tcgacggcga ggtcgcgatg    25380
cgtccctggc cggccgcgtt gcgggagcgg tccggtgttg tcgagctggc cgtgtggctg    25440
cgcgaatacc acgatgttgt acgggacttc cgtccgccgt gccctgatga gtggttcgtg    25500
cccggtgtct cctggcgtcc cgggcggctc gtccgccacg gtgacctggg accctggaac    25560
tccgtctggc gtggctcccg gctcgtgggc ttcatcgact gggacttcgc cgagcccggc    25620
gatcccctcg acgacctggc ccagctcgcc tggtactgcg tccctctggg cgggcgtgcg    25680
actggggcgg gcggtgagga gagccgggtg cgggtccggg agcgcctcgc ggccgtgtgc    25740
acggcctacg gggccgagcc cgtgtccgtc ctggacgccc tggccgggct gcaggagcgc    25800
gaggcccgcc gcatcaccga cctgggcggc cggggcctcg agccgtggac gtccttcctc    25860
gcccggggcg acgcgacggc gatcgaggag gagcgcgctt ggctgctgac ccaccgggag    25920
gggttgctgg tgggatgagc gggcccggtg ggtggggcgg gggcggggtg gggtggacgg    25980
gcccttgacg gggctgagct cttcgcggtg cctgccttca ggggagggtg ccccgtgttt    26040
tcctccagcg gcgaagagct ctttacgccc ctaccagggc ccgtccgccc caccccgccc    26100
cctcgcgtca ccaccaccgg tcgctcgtgg ccgagcaatc aggtccgggt gatcggggcg    26160
ggtgggcgaa atccccgcgc cgccaggcgc gggaaccccc caccggcggg cagccggaaa    26220
gccacggcac cccgccaggg ggtcacgggc gcgtgggggc atccgtcgat cgatggccgc    26280
ccggcggtca gacgtccgcg tcgcccgcca aaaggtcgac gccgaacagc tcccgaaagg    26340
cccgttcacc cgctgcggtg atcttcaacg cccgcccgga cccgatccgt tccacccagt    26400
gccgctcgag cgccgcacgg caaagcgccg cgccgagcgc accgccgagg tgcccccggc    26460
gttcggtcca gtccaggcag ctgcggacca cgggtctcga ccccgtgcgg accggcaggg    26520
ggacgcccag ctcggcgagg cgggtccggc cgtgcccggt gatggagagc ccggcgtcgt    26580
cggtgacgat cccctgtccg agcagggcgt cggagagggc cacccccagg cggccggcga    26640
ggtggtcgta gcaggtgcga gcccgcgcct cggcgctcgt ccggctcgcc ccgcgcaggt    26700
tgccgggggc cgggtcgggc ggtgaccagg aggtcaggtc ctcgatcagg gcggccactt    26760
cgggcccggc cagccggacg tagcggtgcc ggccctggcg ctcctcggcg agcaggccgg    26820
cggagatcag ccgggagagg tgctcgctgg cggtggaccg cgcgactccg gcgtgccggg    26880
ccagttcgcc cgcggtccag gcccggccgt cgagcagggc cgtgcagaag gcggcccggg    26940
tccggtcggc gagcagcccg gcgatctgag cgagtgacat gcgcccatca tgcggcggga    27000
tcggttcggc ggccgccgaa cagttccgct cctaccgtcg gggcatgacc cacaccccgc    27060
ataccttcac ccggtacgcc gccgtcggca ccccggtcgc cctcggcgat ggcgtgccga    27120
tccgggcccg cgcgtccgtg gcggaccaca ccccggtctg gcggcccgca gccgccgcta    27180
cggccgcagc cgaatccgtc gccaccccgg cggcagccga gcgcctcgcc gccccggcct    27240
cggccgcaac cgaggccacg acccccttcg cggccttcgc cgcgctgcat cggcccggct    27300
cgccgcttct gcttcccaat gcctgggacc acgcctcggc ggtggctctc gtcgaggcgg    27360
gcttcctggc gatcgggacg acgagtctcg gtgtggccgc ggcggtcggt cggcccgacg    27420
ccgtgggggc gacccgggag gagaccctgc ggctggcccg gcggctcggg cgggggcggg    27480
aacgggggcg gttcctgctg tccgtggacg ctgaaggcgg gttctccgac gatccggcgg    27540
acgtggccga gctggcccgt gagctggccg gggccggggt ggtcggcatc aacctggagg    27600
acggccgctc cgacggcacg ctcgcccccg tggagctgca cgtcgcgaag atcgaggcgg    27660
tgaaggccgc ggtccccggc ctcttcgtca acgcccgtac cgacgtctac tggctgggcg    27720
gcggccagga gggcgaggac aaggacgagg acgagacgtc gtaccggctc gacgcctaca    27780
gccgggcggg cgccgacggc gtgttcgtac cgggcctgtc cgaccgtacg ggcatcgcga    27840
ggctggtgga gcggctccac gtgccgctga acatcctcca caccccctcc ggccccaccg    27900
tcgccgagct cggcgagctg ggcgtggcca gggtcagcct cggttccctg ctgttccggg    27960
tggccctggg cgcggcggtc ggcgcggcgg tggacatccg ggcgggccgt ccggcgggag    28020
cgggcgcgcc gtcctacgac gaggtccagg accggatccg gatcacgggc ccgctgggct    28080
gagctcagcc gacgcgtacg gccaggacgg cgatgtcgtc gttgaggccc tggtcgctgt    28140
ggtcgaggag atcgcggtgc agcctgtcga gcagctcgcg ggggtgggcc gggggctgct    28200
gccgcatcca gtccgccagg gggaagaagc cgccgtcgcg gccgcgggcc tcggtgacgc    28260
cgtcggtgta gaggagcagc tgatcgccgg gggcgatgtc gaaggtgtcg acggtgtagg    28320
agtcgccgat gaggtccgcg aggctgagca gcggggaggg ggccgtgggt ttcagggagc    28380
ggagttcccc gcggttcagg aggagcggtg gggggtggcc gcagttgagg atccggatgc    28440
ggccgtcctc gtgcgggatc tcgacgagga gggcggtggc gaagcgttcc accaggtcct    28500
cggggggaaa cgcggcgctg tagcggctgc tgctggcctc cagacgccgt gcgatgccgc    28560
ccaggtcggg ttcgtcgtgg gcggcctccc ggaaggagtt caccaccgcc gcggccgccc    28620
ccacggccgg caggcccttg ccccgtacgt cgccgatgag cagccggact ccgtacgcgg    28680
tgtcggccgc ctcgtagaag tcgccgccga tccgggcctc cgccgcggcc gcgaggtaca    28740
gcgagtcgat ctcgacgtcc ccgaagcggc gcggcatggg ccccaggacc accatctgcg    28800
ccgcgtcggc gacgagccgg acctggaaga gggtgcgttc ccgctggagc cgcacatggc    28860
ttccgtacgc cgccgccacg gtgacggcga cgatgccccc cgccgtccac cacgtcccca    28920
gcccggggaa gacgatgctc aggccgatca tgaggaacag gcagaccgtc cccagcagca    28980
cggtggggag cacgggccac atggctgcgg cgagcgcggg cgcggcgggc aggagccggc    29040
tgaaggccat gcgccggggc gtgttgtagg ccagggcggc gatgaccacg gtcaggatca    29100
ccggggagag gagaacaggg gaccacctgc cgtggagacg gcggggccgc ggccggtcat    29160
gcttgaccat gagacatagc ttatccgtat aaaacggaca tagggctccg ggaagtcacc    29220
cggtcggagg gtctcctagc cctgtgtggg gcgaggggag gggtggtggg gcgggtggtc    29280
gtgggtcggc gggtccagga agcggtcgac cagcagacgg cgcgggcccg gccccgccct    29340
cccgagccgg tccttgggat tggccgccat gcagcggtcc agggacaggc atccgcagcc    29400
gatgcagtcg tcgagccggt cgcgcagccg tgtcagctgt tcgatgcggg cgtcgaggtc    29460
gtcccgccag ctccgggaca gggcttccca gtcctcctgg ttcggcgtgc gccgctcggg    29520
caggtcggcc agcgcttcct ggacctcgcg cagggagatg ccgacgctct gggcgacccg    29580
tacgagcgcc acctgccgga gcgtggcccg ggggtagcgg cgctggttgc ccgaggtgcg    29640
gcggctgtgg atcaggccca tggactcgta gaaccgcagc gcgctggtcg cgacgccgct    29700
gcgctccgcg agctcgccga tggtgagttc cttcgcgttg caagggggcc tttccatgtc    29760
tccaccgtat ctgggtcttc aagttaagtt gaggtttttg gggtgggggc ggtggggggc    29820
ggtgcgcggt gcgccgtgcg cggtgagccg cgtacggcgt acggtcggcg ctccgcctca    29880
gcgctccgcc cgtacggacg tggccgagcc gcgccgcccc gcgcaggcgg tgacgcccgc    29940
cagggccgcg acggcggcga acccgaacag gacgtagtgc gccgagcgcg tcatggcggg    30000
tgcgccgagg ttgaccagga cgccggcgag ggcggcgccg aaggagaagg cgaacagccc    30060
gatcgtgttc agggccgcgg acgccttcgc cgcctcctcg gggtcccggg tgctgcccat    30120
caccgccgtg gacaggtggg gcatggccat gccgatgccg gagcccgcca ccagataggc    30180
cgcggcccag gccgccaccg tgagcggtcc ggcgtcctcg cgctggagga ggcccgtgag    30240
cgtcaggccg gcggccagga cgaacggtcc cgccaggctc aggcggccga gcgtcgcggg    30300
ccgggcgccg gagaccgcga cctgcgtcag cgcccacccg acgggcaacg aggtgcccag    30360
gaagccggcc gccaccggcg gcagaccgcc cagccgctgg ccgaacaggg agatgaacgc    30420
ctcgacggag gcggcggtcg tgatgaggac cctgacgagg tagagccacc ggagcgagga    30480
cccggcggcg taggtcgccg ccggcagcac ccgggcgcgt gctccgggcc gccgctcgct    30540
catcacgtag accacgatca gggcgcacgc gacggtgacg gccacggcgg tgggcccggg    30600
cccggacagc acgccggcca cgctgatcac cgtcgccgtc gcggtgagca gcaccaggga    30660
gaccagtggg agcgcgccgg cgtcccccgc ccggcggccc gagggaacgg ctcgcgacac    30720
gagtgccacc aagggcagcg ccaggaccgc cacgacggcg aacgccagcc gccaggcccc    30780
gagctgggcg aacagcccgc cgatcgcggg cccgacgaag aagccggccg ccatcatcgc    30840
cgacaccagg cccgtgcccc gcgcccagag gcgctcgggc agcaccgact ggacggtgac    30900
gtagctcagc cccgccagga gcccggcgcc gaacccctgg aggacccgcc ccgccagcag    30960
cacctccatc gtgggcgtga cggccgcgac gaccgtgccg aggacgaacg ccccgatgcc    31020
gatccggtag ccgccccggg ggccgcgcgt ggacaggacg cggctgacga gcatcgcgga    31080
gatcaccgag gcgatcgcga aggcggtcgc ggtccacgcg tagaggcgtt cgccgccgat    31140
gtcctcgatg gccgtgggca gcaggctggt ggtcacccac gtactggtgc cgtccaggag    31200
catcaccccg gcgagcagca gagcggtggc ccggtgttcg ggcccgaaga gctcgcgcca    31260
gccgccgggg cgtgtgccgg ggaggggtac ggaagtctcg gacgtctcgg agatctcgga    31320
ggtgttgttc ggtatcgcca cccccgcacc aaacaacttc aacagctctt gaagtcaacc    31380
gcgcgtccgc gcgtccacgc cggtgggctg ccgtacgagt ccaggttgtc ggtcatccgc    31440
tccaggacgg tgacggcgat ccggtactcc tcgcgggtga tgccgaccgt cgacagctcg    31500
cggaaggcgt ggacgtgctc ggcgacgtcg gcgaggcggg tacggccgtc ttcggtcagg    31560
gccagacggc ccggttccgg gcgggcgacc cagccgtcgg cgatgaccgc cccgatggcg    31620
gcggccaggg cggtggcgtc cgcgttggcg gccaggacgg tcagcacttc ggtgtcggtg    31680
gcctgtggat cgtccttgat gacgttgagg acctgccagt cggtccgggt gatgccgaat    31740
ccggccagca aggagttcat acggtgggtg agagcgctgt cggtgcggtt gagccagtag    31800
ccgatgggct tcatgttcgc gttcctgagc cgggtcagtg atgccgggcc ccggccttgc    31860
ggggcagcag gcgtacgagg gcgcagcagg cgagggtggc cgcggcgacc acggcgaggc    31920
tgtggacggt cgcggtcgcg gttgcggtcg tggaggcgcc ggggcgtgga agcaagggga    31980
cggacctgtg cggtgcgggc ccggccggat cagtgccggg tgaaggcggc ggcgttctcg    32040
cgcgcccact gccggaaggt gcgggcgggg cggccgagga gggtacgggt ggtgtcggcg    32100
atggccgcgg gaccgtggtc ggcggcctcc cacaggtcga gcagcgaggt gaccatcggc    32160
gcgggcatgt agtggcccat ctgctgctcg gcctcggcgc gggtgatgcg ctcgacgggg    32220
atctcgcggc cgagggcgtc cgcgaggacg gcgagttgct cgcggaacgt gagcgactcg    32280
gggccggtca gggtgaccga gcggccggtg agggaggtgc cggtcagcgc ctcgacggcg    32340
atgtcggcga tgtcctcggg gtggatgggc gcgatgtgcg cgtccgggta ggcgagccgg    32400
acgggcagcg accggccgat gaagtgggcc cagccgaggg agttgctggc gaaggcgtcc    32460
gggcgcagga acgtacgggt gagaccggag ccggcgaggg cgcgctcgac ctggaggctg    32520
tggcccgcga gcgggtcggt ctcggcgtcc gggcccagga ccgaggagga cgagagcagg    32580
acgacgtgct cgacaccggc gccctcggcc gccttgatca gctcatggat gccggacggc    32640
tgggggtaga ggaagacctg gcggacgccg cggagcgcgg ggccgaaggt ctcgggccgg    32700
tcgaggacga gctcggcggt ctcgacgccg tccgggacgg ccagttcggc ggggaccgcg    32760
ctggcggcgc ggacggtgag gccggcggag tgcagacggt gggtgaccgc ctgggcgacc    32820
ttgccgcggg cgccggtgac gaggatggcc atggagtgct ccattcattg ctgatgacat    32880
atgcatgctt gcatgcacac atttgttggt caacacatgc cttcgtgatg tcatccatgt    32940
ctgtacgatg aggggcatgg cgaagcgcga acccaagacg gcggacgagc tgctggacgc    33000
cgtgggcccg gccttcggga agctgcggcg ctcctcgctc ctcgaggtcg agaacccgat    33060
ctcccagaag gacctgagcc gcacgctggt gctcagagtc gtcctggagg cggaacggga    33120
agcggagccg gcagcggaac agggcgccgc gcagggcgag gcggacgagc ggtccgacgc    33180
cggggagatc acggtcggcg cggtcgccca gcacctggga gtggacccgt cggtggccag    33240
ccgtatggtc tccgactgca tctcggccgg ctatctggtc cgcgcggcct cccagcgcga    33300
cggccgccgc accgtcctcc acctcagccc cgagggccgt gagctgatgg cccgcttcgg    33360
ccgccaccag cgctcggcct tcgagtgcat caccgccgac tggaccgagc gggaccgcct    33420
ggaattcgcc cgcctcatgc tcaagtacgt cgactcccag gacgccctcc gccaccggcc    33480
cccggtcaag gacgccgtgc gctgaaccgc ccggcgggcc gtcccccggg cggctcgtcc    33540
ccgggcggtg cgctcgctgg tgcgacgacg gtgtgaccgt aggcgcgaca gtacgaccgc    33600
gggcatcacg ctgtgaccgt aggcgcgatg gtgcggccgc aggtgcgacg acggcacgac    33660
cgcaggcatg acgaaggccc cgaccactcg agtggtcggg gccttcgtgg cagctgacgg    33720
catacgaacc cgcccgcctc acccctcctt cggcgcaagg ccggtgagcg cggcccccag    33780
ccggcgcgcg ccctcggcca gctcggcgtg atcggcggtc gcggcgaacc cgatgcgcag    33840
gtgggccgca ggcggctccg cggcgaagtg gcgactgccg gcgctcacgg cgacgccgcg    33900
ctgccgggcg gcgccggcga gggcggtgtc gtccacgccc gacggcaggc ggacccacag    33960
gtgcagtccg cccgtgggca accgggccag ggtcgcatcg ggaagctcct gggcgatcgc    34020
cgcggccagg acggcgcacc gctcccgcag cgccgtaccg agggaacgga cgtgccggtc    34080
ccaggacggg gagctgagca cctccagtgc cgcctcctgg agcgggcgcg tgacgaagaa    34140
gtcgtcgacc aggcgcaccg cccgcatgcg ctccatgacc ggtccgcggg ccaccagcgc    34200
cccgatccgc aggctcggcg cggcgggctt ggtgagcgag gtgacgtgga cgaccgtgcc    34260
gtcacggtcg tcggcgatca acggccgtgc cacggcgccg ccgtgtccca ggtgccgtgc    34320
gaagtcgtcc tcgagcacga aggcgcccga ggcgcgcgcc acgtcgagga tctggcggcg    34380
tcgttcgggt gccagcacgg cgccggtcgg gttctggaag gtcggctggc agtacagcag    34440
tcgcgcgccg gtcatcgcga acgcgtcggc cagcatgtcg ggccgcaggc cgtcggcgtc    34500
gagcggtacc ggaaccggtc gcagccccgc ggcgcgagcc gcggccaggg cctggggata    34560
ggtcggggac tccaccagga ccgggctgcc gggaccggcg atggcccgga acgcgatcga    34620
cagggcactc tgcccaccgg cggtgaccag cacgtcctcc ggcgccactc cgccgccgac    34680
gatccgggcg aacacggtgc gcagcgccgt cagtccgtcg gccggggcac ggtcccaggc    34740
gtccggacga cgtgccgccc gcgcgagcgc cgcgctcagg gcccgggcgg gctggagcga    34800
gctgtgcacg tagccgccgt ccatcgcgat cgtcccggcc ggtggcgggc cgagcggctc    34860
ggcgatcagg tgggtgtcga ccgcgcggtc ggtgagggcg accgtctgcc agtcggtgtc    34920
catctgccag ttggcgtcca tgtcgccgcc gctaccgccg cccctgccgc cgcccgcgcc    34980
gcggagtcgg ctgcgctgcg ccacgaacgt cccgctgccc gggcgggtca ccaccgcgcc    35040
ctcggcggcc agcgcggcga tggtccgcgc cactgtcgcc ggaccgatcc ggtactcctt    35100
gatcagctcc cggctgctcg gcagccggtc gccgggcgcc agccgggaga ccagcgcgcg    35160
gaggctatcg gccaactcgg cagaagtgct accgtcgttc atgagagatc acagtagcgc    35220
ttctggttct gctcgggaag cacttcagct ggacgtcccc gccctgcggg ccgacacccc    35280
ggggtgccgc cgggtcatcc acttcaacaa cgcgggctgc ggactgatgg cggcgcccgt    35340
gacggacgcg atggtcggcc atctgaacct cgaggccagg atcggtggtt acgaggcgtc    35400
ggccgcccgg gccgccgagg tccgcgggtt ccacacggag atcgccgccc tcatcaacac    35460
cacacccgac aacatcgcct tcgccggcag cgccacccac gcctacgcca acgccctgtc    35520
ctcgataccg ttcgaggccg acgacgtcat cctcaccacc cgcgacgact tcgtctccca    35580
ccagatcgcc ttcctctccc tgcgcaaacg attcggcgta cgcgtcgtcc acgcgcccaa    35640
caccccggag ggcgggcccg atgtggaggc gatggccgcg ctgatgcgga cccaccgccc    35700
ccgcctggtc tccgtcaccc acgtcccgac caactcgggc ctcgtctcgc ccgtcgccgc    35760
gatcggccgc cactgccggg agctggacct gctctacctg gtcgacgcct gtcagtcggt    35820
gggccagctc gtcatcgacg tggaggagat cggctgcgac ctcctcaccg ccacctgccg    35880
caagttcctc cgcggcccgc gcggttccgg cttcctctac gtatccgatc gcgtcctgcg    35940
cgcgggttac gaaccgctgt tcatcgacat gcacggggcc cgctggaccg agccgggcgg    36000
ctacgagccc gtggggacgg cggcccgttt cgaggagtgg gagttcccgt acgccacggt    36060
gctcggcagc gccgccgcgg tgcgctacgc ccgcgaggtc ggtgtcgagg ccatcgagcg    36120
gcgcaccccg gcgctcgcgg cccggctccg cgaccggctc gcacccatcc cgggggtgcg    36180
cgtgctcgac cgcggcccgc gtctcgccgc gctcgtcacc ttcgaggtag cgggctggca    36240
gccgcagccg ttcaaggcgg ccatggacgc ccgaagcatc aactcggcgc tcagcttccg    36300
tgagttcgcg caattcgact tcggggacaa ggacgtcgac tggtgcctcc gcctgtcgcc    36360
gcactactac aacaccgagg aggaagtgga ccacgtcgcg gaggcggtcg cggccctcgc    36420
cggccagggg cggcgatgac cgacacccgg acacgcgcgg aggagccggc cggggaacgg    36480
cctgaggagc cgcccgggca acggtctgaa gggccgcccg gggaatcgca cgcggagccg    36540
tccgcggagc cacccggggg aagcctctgg cacaaccgcg acttcctcag gttctggttc    36600
ggcgagacgc tgtcgctcct cggtacccag gtcacgaacc tcgccctgcc gctgaccgcg    36660
atcaacgcct tccacgccac cgacgagcag gtcggtgtcc tgcggttcct gcagctcgtc    36720
ccgtacctcg gtctcgccct ggtcttcggg gtgtgggtgg accgggcccg tcggcggcgg    36780
atcatgctgg gcgccaacct cgtccggatg gtcctgctga ccctcgtacc cgtcctgtac    36840
tggtcggacg cgctcgacat ggtctccctg ctggtgatcg cctgtgccgt cggcgccgcc    36900
tcggtgctgt tcgacgtgag ctggatgtcg tacgtgccca cgctcgtgcg cgagcccgag    36960
cactacgtcg aagccggcgc caagatgggg atgagctcat cggcggccga tgtggcgggg    37020
cccgggctcg cgggcgtgct ggtgggcgcc ctgagtgccc cggtggcgct gatcgccgac    37080
gcgttctcct atctggtgtc cttgatctcg ctgctgctca tccgcacgcc cgagccccgc    37140
cccgaaccgg cggccgcgcg gaggcatctg ccgaccgaga tccgggacgg cctgcgctgg    37200
gtgctgaaga acccggtcct gcggtcgctg gccgtgatcg gcttctgctg caacttctcg    37260
atgatcaccg tctggacgat gttcctgctg tacggaacgc gcgacctgcg tctggactcg    37320
acgaccctcg gcgggatctt cgccaccgct tccgtgggcg gactgatcgg cgccgcgatc    37380
tcccgcaagg tcatccggcg cttcaggctc ggcctcgtct acctcgtcgc ccagtccgcc    37440
ctcctcgtcg gcccgacgct gatcgtcctg gcgaccggtc ccaggtgggt gatggtgggg    37500
atgttcgtcc tctccttctt caccacctac ctcgggctcg gcgtcgccgc cgtcgtcatc    37560
gtcagcctgc gccaggtcag taccccgccg tcgatgatgg gccggatgac ggcggtcttc    37620
cgcaccctgc tcttcggtgg cggcgccctc ggcggcctgt tcgcgggcct gctgtccggc    37680
cggatcggcg cccgaggggc attgaccgtg gcggcgaccg gatccgccgc cgtactgatc    37740
gcgctcgccc tgtccccggt gacccggcta cggggcctgc cgccggcaac ggaggaaccc    37800
gtcgcggcgg cgaactgagg tcgcggcgac gtactgaggt cgcggcggcg aactgaggtc    37860
gcggcggcga actgaggcgg agaacgtcga agggccccac cgcaagcggt ggggcccttc    37920
gagtcgtgcc cggtgaggca ctggcggagg atacgagatt cgaactcgtg aggggttgcc    37980
cccaacacgc tttccaagcg tgcgccctag gcctctaggc gaatcctccg ccgcaaacaa    38040
tacaagactc cgaggggtgc tcgcgaacac gtgctctcgg gagggcctcg gaaggacccg    38100
ggaggacccc gggagggggt ggagtgggtc gaggggtggc cgagcacccc cggcgatccg    38160
ctaggctggg ggcaagcccc tcacgtggcg ctatctcacc caactccccc agggccggaa    38220
ggcagcaagg gtaagtgggc tctggcgggt gcgtgagggg cccttgtgtt ttccggggga    38280
tcccgggggc tccgggagcc aggagcgggg cggggagcgg gctccgggat ctgtgacgga    38340
gaccacttgt cggtggggcc cgatatcgtc gtaggtgtgt cgtccctcgc gctctaccgc    38400
cgctaccgcc ccgagtcctt cgccgaggtc atcgggcagg agcatgtcac caccccgttg    38460
cagcaggctc tgcggaacaa ccgggtcaac cacgcgtacc tgttcagcgg cccgcgcggc    38520
tgcggcaaga cgaccagcgc gcgcatcctc gcccgctgtc tgaactgcga gcaggggccg    38580
acgcccactc cctgcggcga gtgccactcg tgcgtggacc tcgcgcgcaa cggtcgtgga    38640
tcgatcgacg tcatcgagat cgacgccgcg tcccacggtg gtgtcgacga cgcccgtgag    38700
ctgcgcgaaa aggccttctt cggccccgcc gccagccggt acaagatcta catcatcgac    38760
gaggcccaca tggtcacctc ggcgggcttc aacgccctgc tgaaggtcgt cgaggagccc    38820
ccggagcatc tgaagttcat cttcgcgacg accgagcccg agaaggtcat cggcacgatc    38880
cgttcgcgta cgcaccacta tccgttccgg ctcgtcccgc ccggcaccct ccgtgactat    38940
ctgggcgagg tctgcgagca ggagaagatc cccgtcgagg acggcgtcct gccgctggtc    39000
gtccgggccg gtgccggttc cgtgcgtgac tcgatgtccg tgatggacca gctgctggcc    39060
ggcgccgccg aggacggtgt gacatacgcc atggcgacgt ccctcctcgg ctacacggac    39120
ggctccctgc tggacgccgt ggtcgacgcc ttcgccgccg gcgacggcgc cgcggccttc    39180
gaggtcgtcg accgcgtcat cgagggcggc aacgaccccc gccgcttcgt cgccgacctg    39240
ctggagcggc tgcgcgacct ggtgatcctc gccgccgtgc cggacgccgc cgagaagggc    39300
ctcatcgacg ccccggtgga tgtcatcgag cgcatgcagg cccaggcgtc cgtcttcggc    39360
gccggcgagc tcagccgcgc cgccgacctc gtcaacgagg gcctgacgga gatgcgcggc    39420
gccacgtccc cgcgcctcca gctggagctc atctgcgcgc gcgtgctgct gcccgccgcc    39480
ttcgacgacg agcggtccgt acgggcccgc ctcgagcgtc tggagcgcgg cgccgcgagt    39540
gcggccgccg ccttcacgcc cgcgcccccc ggtacggcca tgggctacgt ccccggtccg    39600
gatgcccacg cccacgctcc cgccccggcc gccggtctct ccggcccggc ggcggcccgc    39660
gcggccgtga cgggggcggg gcccgcggca ggtcctgccc ctgttcctgc tgcccctgcc    39720
cctgctgctg ctcctgtcgc tgccgttccc gcgtcgggtc aggccgctcc cgctccggcg    39780
caggctccgg gcgcgcaggc cggtggcgcg tggccggcgg gcgccgcccc cgccgccccg    39840
gcccccgccg cctccgcgcc cgcatcgcag cccggcgcgt ggcctgcggc ctccggcgcc    39900
cccactcctg ccccggccgc cccgcaggcg ggtccccagc ccggcgcctg gccgaccgcc    39960
gcggcgcccg gctcgggccc cgcgcaggct ccggcccccg ccgcgagcgc cccgcaggcc    40020
ggttcctggc ccacgggcgc cgcccccgcc gccccggctc ccgccgcgcc cacgggcgcg    40080
cccatgggcg ccccgcaggg cgacgcaggc caggcgcgcc agctctggcc gaacatcctg    40140
gaggccgtga agaaccgccg ccgcttcacc tggatcctgc tcagccagaa cgcccaggtc    40200
tccggctgcg acggcatcac gctccaggtc ggcttcgcca ccgccggagc gcgcgacagc    40260
ttcgccaaca gcggtagcga ggacgtcctg cggcaggccc tcggcgacct cggcctgcag    40320
tggaagaccg agctgctcgt cgatccctcc ggcggcgcca acgcgcccgg cggcggctcg    40380
ggcggcttcg gcggcggctc aagcggtttc ggtggctccg gcggttccgg cggtggctac    40440
ggaggagggt tcggcggcgg cgcccctgcg gcctccccgg cccccgccta cgcccgcccg    40500
caggcccagg cccaggccca gagcccggct cccgccccgg ccgcctccgc cccgcagcag    40560
gccgcgtccg ccgccccgga gtcccgtccg gccccgtcgg cggccccggc cgccggcccg    40620
gcgcagcggt acggcggcga gcccgaggcc cccccggtcg cccccgagga cgacatcccc    40680
gccgaggacg atccggacct cgacgacacc gccctgaccg gccacgatct gatcgtgcgc    40740
gagctcggag cgaccgtcat cgaagagatc gccaacgaat aacgggcgaa caatcaccgc    40800
cgcgcagtcg aacgagtgcc cggatgtgta aagacgtcgc aggtcaggag cgcgggcggc    40860
gcgaagtgcg tcagtgcgcc cgttctcctt cctgcggcgt agggcgtacc gcgcggtgag    40920
cacgtaggct cgggctaccg aagcaatcag tcgtcgagag cccaggagcg aaaccgtgtt    40980
ccccggtggt ggtcagccca acatgcagca gctgctccag caggcccaga agatgcagca    41040
ggatctcgcc aaggcccagg aggagctggc gcgcaccctc gtcgacggca cggccggcgg    41100
cggcctggtc aaggccaccg tcaccggcgc gggcgagctc cagagcctgg tcatcgaccc    41160
caaggccgtg gacccggacg acaccgagac cctcgcggac ctcgtcgtgg ccgccgtgcg    41220
cgacgccaac gagaccgccc agaagatgca gcagcagaag ctcggcccgc tcgcccaggg    41280
cctgggtggc ggcggcagcg gcatcccggg tctcccgttc tgacggaccc gacggccgga    41340
gcggccgggt ccgtaaggtt ccggccgttc cgacagacgt agcactcctc cccgggccgg    41400
ccccgtggag acaaccgcag acgcagaagc cgaagaaacc gaagaaggag aacccgatcc    41460
gtgtatgaag gcgtggtcca ggacctcatc gacgagctgg gcaggctgcc cggcgtcggt    41520
cccaagagcg cgcagcggat cgccttccac atcctccagg ccgagcccgc cgacgtccgc    41580
cggctcgccc acgccctgac cgaagtgaag gccaaggtcc gcttctgcgc ggtctgcggc    41640
aacgtcgcgc aggaggagcg ctgccgggtc tgccaggacc cgcgccgcga ccccgcggtc    41700
atctgtgtcg tggaggagcc caaggacgtc gtcgccatcg agcggacgcg cgagttccgc    41760
ggccgctacc acgtgctcgg cggggccatc agccccatcg agggcgtcgg cccggacgac    41820
ctgcggatcc gtgagctgct ggcccggctc gcggacggca cggtcaccga gctgatcctg    41880
gccaccgacc ccaacctcga gggcgaggcc accgccacgt acctcgcgcg catggtgaag    41940
cccatggggc tgagggtcac ccggctggcc agcggtctgc ccgtgggtgg ggatcttgaa    42000
tacgccgacg aggtcacgct cggccgtgcc ttcgaaggga gaagacttct cgatgtctga    42060
cgcaacgctc cacgacgcca agcgcgatcc cgacgacttc gtcgtctcgc tcgcggactc    42120
gatcgagagt ttcatcgtgg ccgtcacgga ggtgtcccgc ggcgacgagc ccgacagcgc    42180
cgtgccgttc ctgctcctgg aggtctccca gctcctcctc acgggtggcc ggctcggcgc    42240
gcacgaggac ttcgtcccgg acgagcgcta cgagccggac gtcggtcccg agccggacgt    42300
cgacgagctc cgcgagcggt tcgccaccat gctcgacccc gtcgacgtct actccgaggt    42360
cttcgacccc tacgtcccgc gcagcgcgcc cgtcgcctcc cggatctccg acgacctcgc    42420
cgacatcatc accgacctcc gccacggcat ggcccactac cgcgacggcc gcgtcagcga    42480
ggccctctgg tggtggcagt tctcctacct ctccaactgg ggccccaccg cctccgcctg    42540
cctccgcgcc ctgcagtcgc tcgtcgccca cgtccgcctc gaccagcccc tggacgagct 42600
cgacggcctc gacaccgacg tcatcggccc ggaggaccag ctggccgagg aagccggccg 42660
cgtcatggcc gccgagatcg gcggcccgat gcggatgcga gcacgaggcg cctcccaggg 42720
cgcctgaggc ggcctgccgg gatctgcgcc cctaggggcg cagcccgccg agttgtcgtc 42780
tttcgggggc gccgcccgcc ggggtgccgg ccggggtggc cgtgccacgg ggccgccgcc 42840
ctgcgggatc gtcgcctccg ggaaggacgt ccctagaggc cgccgccctc cgagttctac 42900
gcccggcagt tggcgaccgt gccgcccgcg cggttgtcgg tacggcagat gttgtcgcca 42960
cgcccgccgt cgacggtccc gtattcgccg acgacgatcg cggtgccgcc cggtccctgg 43020
atgacgtcat cgtcgtcgtc cccggagacc gtgacgaatg cggcctgccc gatggagggc 43080
acctcgatga ggtcggcgtc ggcgccccca cggacgtgga cggggcgtgc cttgtcgtcg 43140
acgccgatcg ccccgacgcg gatgacgtcg tccccttcgt cgccgtcgat ggtgacgggg 43200
ttggggagac gggacgacag gcgggaggcc ctttccacgg tgatcttgtc cgcgccgggg 43260
ccgccacgga gcggtccgcc gagttccccg accgtgatgg tgtcgtcgcc gagtccgccg 43320
tcgaggctgc tcgacttgtc ccaggcgggt acgacgtagg cggcgatgcg gagggtgtcg 43380
tccccgtcgc cgccctcgat cctggtgctg aacacggcgc cggtggtgat cacgtcgttc 43440
ccggcggcgc cgtcgatgag cccccggtac gacacggcgc ccgtggtgat gatgtcgttg 43500
cccgcgccgc cgtagatggt gccctggacg ctccacgcgt ccttgtcggt cacggtgatc 43560
c                                                                 43561
<210>2
<211>334
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>2
Met Glu Thr His Thr Phe Gly Thr Phe Gln Asp Ala Tyr Leu Ser Gln
1               5                   10                  15
Leu Arg Asp Ile Tyr His Ser Pro Glu Phe Arg Asn Ala Pro Arg Gly
            20                  25                  30
Gln Ala Ser Arg Glu Arg Ile Gly Ala Gly Phe Arg Leu Leu Asp Pro
        35                  40                  45
Val Gln Arg His Ile Ser Val Pro Ala Arg Arg Ala Asn Val Val Phe
    50                  55                  60
Asn Phe Ala Glu Ala Leu Trp Tyr Leu Ser Gly Ser Asp Arg Leu Asp
65                  70                  75                  80
Phe Ile Gln Tyr Tyr Ala Pro Gly Ile Ala Ala Tyr Ser Ala Asp Gly
                85                  90                  95
Arg Thr Leu Arg Gly Thr Ala Tyr Gly Pro Arg Ile Phe Arg His Pro
            100                 105                 110
Ala Gly Gly Val Asn Gln Trp Glu Asn Val Val Lys Thr Leu Thr Asp
        115                 120                 125
Asp Pro Asp Ser Lys Arg Ala Val Ile Gln Ile Phe Asp Pro Arg Glu
    130                 135                 140
Leu Ala Val Ala Asp Asn Ile Asp Val Ala Cys Thr Leu Ala Leu Gln
145                 150                 155                 160
Phe Leu Ile Arg Asp Gly Leu Leu Cys Gly Ile Gly Tyr Met Arg Ala
                165                 170                 175
Asn Asp Ala Phe Arg Gly Ala Val Ser Asp Val Phe Ser Phe Thr Phe
            180                 185                 190
Leu Gln Glu Phe Thr Ala Arg Tyr Leu Gly Leu Gly Ile Gly Thr Tyr
        195                 200                 205
His His Val Val Gly Ser Val His Ile Tyr Asp Ser Asp Ala Arg Trp
    210                 215                 220
Ala Glu Arg Val Leu Asp Ala Ala Thr Pro Asp Gly Gly Pro Arg Pro
225                 230                 235                 240
Gly Phe Pro Ala Met Pro Asp Gly Asp Asn Trp Pro His Val Arg Arg
                245                 250                 255
Val Leu Glu Trp Glu Glu Arg Leu Arg Thr Asn Ala Ala Arg Leu Ser
            260                 265                 270
Ala Asp Ala Leu Asp Ala Leu Asp Leu Pro Ala Tyr Trp Lys His Val
        275                 280                 285
Val Ala Leu Phe Glu Ala His Arg Gln Val Arg His Glu Asp Thr Pro
    290                 295                 300
Asp Arg Ala Leu Leu Ala Ala Leu Pro Glu Val Tyr Arg Gln Ser Leu
305                 310                 315                 320
Ala Val Lys Trp Pro Gly His Phe Gly Ser Pro Ala Gly Ser
                325                 330
<210>3
<211>170
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>3
Val Thr Thr Thr Pro Lys Pro Arg Thr Ala Pro Ala Val Gly Ser Val
1               5                   10                  15
Phe Leu Gly Gly Pro Phe Arg Gln Leu Val Asp Pro Arg Thr Gly Val
            20                  25                  30
Met Ser Ser Gly Asp Gln Asn Val Phe Ser Arg Leu Ile Glu His Phe
        35                  40                  45
Glu Ser Arg Gly Thr Thr Val Tyr Asn Ala His Arg Arg Glu Ala Trp
    50                  55                  60
Gly Ala Glu Phe Leu Ser Pro Ala Glu Ala Thr Arg Leu Asp His Asp
65                  70                  75                  80
Glu Ile Lys Ala Ala Asp Val Phe Val Ala Phe Pro Gly Val Pro Ala
                85                  90                  95
Ser Pro Gly Thr His Val Glu Ile Gly Trp Ala Ser Gly Met Gly Lys
            100                 105                 110
Pro Met Val Leu Leu Leu Glu Arg Asp Glu Asp Tyr Ala Phe Leu Val
        115                 120                 125
Thr Gly Leu Glu Ser Gln Ala Asn Val Glu Ile Leu Arg Phe Ser Gly
    130                 135                 140
Thr Glu Glu Ile Val Glu Arg Leu Asp Gly Ala Val Ala Arg Val Leu
145                 150                 155                 160
Gly Arg Ala Gly Glu Pro Thr Val Ile Gly
                165                 170
<210>4
<211>420
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>4
Val Ala Gly Ala Glu Phe Gly Trp Gly Ser Ala Gly Lys Leu Ala Ala
1               5                   10                  15
Ile Val Ala Ala Leu Arg Glu Arg His Gly Glu Arg Val Arg Phe Ala
            20                  25                  30
Gly Leu Gly Ser Gly Leu Gly Arg Pro Val Leu Gly Ala Leu Asp Ala
        35                  40                  45
Arg Asp Trp Thr Asp Val Pro Glu Pro Gly Asp Gly Pro Ala Gly Glu
    50                  55                  60
Ala Ala Leu Ala Ala Leu Leu Arg Glu Arg Gly Val Asp Ala Ala Val
65                  70                  75                  80
Val Val Leu Asp Gly Leu Leu Ala Ala Arg Leu Glu Ala Val Gly Cys
                85                  90                  95
Pro Val Val Tyr Val Asp Ser Leu Pro Phe Leu Trp Thr Glu His Asp
            100                 105                 110
Phe Val Pro Ser Gly Val His Thr Tyr Cys Ala Gln Leu Cys Pro Ser
        115                 120                 125
Leu Pro Arg Gln Ser Trp Pro Val Leu Arg Gly Ile Glu Ala Leu Arg
    130                 135                 140
Trp Val Glu Pro Val Val Gly Thr Tyr Gly Ala Gly Gly Leu Asp Pro
145                 150                 155                 160
Val Pro Gly Lys Ala Val Leu Asn Val Gly Gly Leu Arg Ser Pro Phe
                165                 170                 175
Thr Ala Glu Asp Asp Asp Ser Tyr Val Glu Leu Val Leu Gly Pro Ala
            180                 185                 190
Leu Arg Ala Leu Arg Ala Ala Gly Phe Gly Gln Val Val Ile Ser Gly
        195                 200                 205
Asn Val Asp Pro Gly Leu Ala Arg Val Pro His Ala Gly Thr His Gly
    210                 215                 220
Leu Thr Val Thr Ala Gly Arg Leu Asp His Gly Ala Phe Ile Glu Glu
225                 230                 235                 240
Leu Arg Thr Ala Glu Leu Leu Val Thr Ser Pro Gly Arg Thr Thr Leu
                245                 250                 255
Leu Glu Ala Ala Ala Leu Gly Gln Arg Ala Val Val Leu Pro Pro Gln
            260                 265                 270
Asn Phe Ser Gln Val Met Asn Ala Ala Asp Val Ala Asp Leu Val Asp
        275                 280                 285
Pro Ala Val Val Val Pro Trp Pro Ala Ala Val Leu Asp Leu Ala Glu
    290                 295                 300
Leu Ala Arg Val Arg Asp Gln Gly Glu Glu Gly Ala Val Arg Leu Met
305                 310                 315                 320
Tyr Ala Arg Ile Ala Ala Ala Arg Arg Glu Pro Gly Thr Val Ala Gly
                325                 330                 335
Pro Leu Ala Asp Ala Leu Gly Ala Ala Val Ala His Val Arg Arg His
            340                 345                 350
Asp Val Arg Met Gly Pro Phe Ala Gly Thr Asp Gly Ser Gly Ala Gly
        355                 360                 365
Thr Arg Gly Ala Gly Gly Ala Arg Asp Thr Gly Gly Ala Gly Gly Ala
    370                 375                 380
Arg Ser Val Ala Asp Ala Val Asp Glu Leu Ile Gly Lys Leu Thr Asp
385                 390                 395                 400
Gly Pro Ala Ala Gly Asn Arg Arg Asp Gly Ser Pro Leu Ala Ala Pro
                405                 410                 415
Val Arg Ala Arg
            420
<210>5
<211>395
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>5
Met Arg His Pro Arg Glu Leu Arg Gln Asp Thr Ser Leu Ala Ile Asn
1               5                   10                  15
Gly Gly Thr Pro Thr Phe Ala Ala Leu Pro Glu Glu Asp Thr Gly Ile
            20                  25                  30
Val Ala Glu Ala Ala Asp Glu Val Ala Glu Leu IIe Arg Thr Arg Arg
        35                  40                  45
Thr Val His Trp Gly Gly Gly Pro His Thr Arg Val Leu Glu Arg Asp
    50                  55                  60
Phe Ala Ala Leu Val Gly Arg Glu Arg Ala Phe Phe His Asn Ser Gly
65                  70                  75                  80
Thr Ala Ala Leu Gln Thr Ala Leu Phe Ala Leu Glu Val Glu Glu Gly
                85                  90                  95
Thr Pro Val Ala Leu Ser Asp Ser Gly Phe Val Ala Ser Leu Asn Ala
            100                 105                 110
Leu Tyr His Leu Arg Ala Arg Pro Val Phe Leu Pro Thr His Pro Ala
        115                 120                 125
Thr Leu Gln Cys Val Asp Asp Val Ala Glu Trp Thr Ala Gly Thr Gly
    130                 135                 140
Val His Thr Ala Leu Ile Thr His Phe Phe Gly Asn Val Ala Asp Val
145                 150                 155                 160
Glu Ala Ile Trp Arg Thr Ser Gly Ala Arg His Leu Val Glu Asp Gly
                165                 170                 175
Gly Gln Ala His Gly Ala Arg Leu Arg Gly Arg Pro Val Gly Ser Phe
            180                 185                 190
Gly Thr Val Gly Ser Phe Ala Gly Ser Thr Lys Lys Leu Val Thr Ala
        195                 200                 205
Gly Gln Gly Gly Leu Asn Val His Asp Asp Glu His Leu Asp Trp Arg
    210                 215                 220
Met Arg Thr Tyr Ala His His Gly Lys Ser Gly Asn Tyr Glu Gly Thr
225                 230                 235                 240
Phe Pro Gly Tyr Asn Phe Arg Gly Gly Glu Met Glu Ala Ile Leu Ala
                245                 250                 255
His Ala Ala Leu Arg Arg Leu Asp Glu Arg Val Ala Ala Arg Asn Arg
            260                 265                 270
Thr Ala Asp Thr Met Phe Arg Ile Phe Asp Glu Ala Gly Ile Arg Thr
        275                 280                 285
Ala Arg Pro Ala Pro Gly Leu Asp Cys Ser Pro Ala Trp Phe Asp Val
    290                 295                 300
Ala Leu Ile Leu Asp Glu Glu Trp Leu Gly His Arg Asp Trp Leu Val
305                 310                 315                 320
Glu Ala Met Val Ala Asp Gly Ile Pro Gly Trp His Tyr Pro Ala Leu
                325                 330                 335
Ile Gly Met Pro Trp Val Glu Pro Trp Met Arg Ser Lys Gly Trp Trp
            340                 345                 350
Gly Glu Arg Glu Gln Glu Leu Leu Ala Ser Glu Thr Ala Leu Trp Gly
        355                 360                 365
Arg Thr Leu Val Leu Gly Ala Gln Met Asn Ala Val Asp Ala Glu Arg
    370                 375                 380
Ile Ala His Ala Val Val Ala Leu Leu Lys Gly
385                 390                 395
<210>6
<211>273
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>6
Met Thr Cys Gly Glu Ile Ser Glu Val Arg Arg Val Leu Arg Arg Leu
1               5                   10                  15
Gly Asp Gly Gly Pro Arg Ser Val Arg Val Arg Glu Asn Gly Asn Cys
            20                  25                  30
Ala Val Tyr Val Gly Asp Arg Leu Val Val Arg Val Gly His Ser Trp
        35                  40                  45
Pro Leu Asp Ala Arg Gly Glu Leu His Cys Trp Ser Val Ala Arg Asp
    50                  55                  60
Ala Gly Val Pro Ala Pro Glu Arg Ile Asp Glu Gly Arg Leu Pro Gly
65                  70                  75                  80
Gly Arg Thr Tyr Val Ala Tyr Val Tyr Val Met Gly Thr Pro Ala Gly
                85                  90                  95
Thr Pro Ala Ser Leu Ala Ala Ala Gly Ala Val Leu Ala Arg Leu His
            100                 105                 110
Thr Val Pro Gly Glu His Phe Pro Ala Val Ala His Asn Leu Pro Arg
        115                 120                 125
Arg Arg Asp Arg Tyr Arg Thr Ala Val Arg Cys Ala Arg Ala Ala Gly
    130                 135                 140
Leu Ala Pro Gly Gly Leu Ala His Arg Cys Leu Leu Arg Ala Ala Asp
145                 150                 155                 160
Asp Trp Arg Arg Ser Arg Glu Val Ala Ala His Gly Asp Phe Arg Thr
                165                 170                 175
Pro Asn Leu Val Val Arg Gly Arg GIy Val Arg Ala Val Leu Asp Trp
            180                 185                 190
Ser Asp Ala Arg Ala Ala Ser Pro Glu Ser Asp Leu Gly Gln Leu Gly
        195                 200                 205
Pro Gly Gln Leu Arg Pro Leu Leu Arg Gly Tyr Leu Asp Arg Ala Arg
    210                 215                 220
Arg Ala Pro Asp Leu Glu Leu Val Ala Gly His Met Leu Ala Arg His
225                 230                 235                 240
Leu Ala Leu Glu Ala Ala Gly Val Phe Pro Ala Gly Thr Ser Ala Ala
                245                 250                 255
Leu Ala Arg Arg Phe Gly Pro Gly Leu Ser Arg Gly Arg Trp Thr Val
            260                 265                 270
Ala
<210>7
<211>157
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>7
Leu Pro Asp Arg Ser Pro Ala Ala Glu Pro Leu Ile Leu Asp Val Gly
1               5                   10                  15
Ser Ala Gly Gln Leu Ala Glu Leu Ala Gly Asp Leu Val Asp Leu Ala
            20                 25                 30
Gly Pro Gly Gly Ala Thr Gly Pro Trp Val Leu Thr Trp Ala His Gly
        35                  40                  45
Ala Gly Glu Pro Gly Gly Glu Pro Gly Glu Gly Gln Asn Arg Gly Pro
    50                  55                  60
Asn Gly Gly Thr Gly Gly Gly Pro Gly Gly Thr Val Ala Arg Pro Pro
65                  70                  75                  80
Gly Ala Thr Val Val Arg His Gly Gly Leu Glu Val Val Thr Val Pro
                85                  90                  95
Arg Pro Pro Arg Asp Leu Gly Gly Phe Leu Asp Ala Cys Cys Arg Thr
            100                 105                 110
Gly Pro Val Ser Gly His Pro Asp Val Thr Arg Thr Ile Leu Ile Leu
        115                 120                 125
Ala Asp Pro Thr Asp Arg Asp Arg Ser Ala Ser Pro Pro Glu Ala Pro
    130                 135                 140
His Asp Ala Pro Arg Asp Gly Ala Arg Asp Gly Arg Pro
145                 150                 155
<210>8
<211>335
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>8
Met Thr His Pro Ala Thr Gly Pro Ala Thr Gly Gly Arg Asp Arg Tyr
1               5                   10                  15
Leu Phe Ile Arg Ile Leu Glu Ala Cys Asn Ala Asp Cys Phe Met Cys
            20                  25                  30
Glu Phe Ala Leu Ser Arg Asp Thr Tyr Arg Phe Thr Leu Asp Asp Phe
        35                  40                  45
Arg Glu Leu Leu Pro Gln Ala Gln Glu Ser Gly Val Arg Tyr Val Arg
    50                  55                  60
Phe Thr Gly Gly Glu Pro Leu Met His Gly Glu Val Leu Asp Leu Ile
65                  70                  75                  80
Arg Glu Gly Thr Ala Ala Gly Met Arg Met Ser Leu Ile Thr Asn Gly
                85                  90                  95
Phe Arg Leu Pro Gln Met Val Asp Lys Leu Ala Glu Ala Gly Leu Ala
            100                 105                 110
Gln Val Ile Val Ser Leu Asp Gly Ser Ser Gly Glu Thr His Asp Val
        115                 120                 125
Tyr Arg Arg Thr Pro Gly Met Phe Asp Arg Gly Leu Asp Gly Leu Val
    130                 135                 140
Arg Ala Ser Arg Ala Gly Met Leu Thr Arg Val Asn Thr Val Val Gly
145                 150                 155                 160
Pro His Asn Phe Ala Gln Met Pro Glu Leu Gln Arg Val Leu Thr Glu
                165                 170                 175
Ala Arg Val Glu Gln Trp Glu Met Ser Ala Leu Lys Leu Glu Arg His
            180                 185                 190
Ile Ala Tyr Pro Pro Ala Glu Glu Val Leu His Ala Cys Glu Pro Val
        195                 200                 205
Phe Leu Ala Asp Pro Lys Arg Trp Leu Val Pro Leu Gly Lys Arg Phe
    210                 215                 220
Tyr Gly Glu Thr Ala Glu Glu Arg Glu Ala Phe Phe Glu Arg Gly Thr
225                 230                 235                 240
Thr Pro Ser Ala Ser Arg Pro Leu Cys His Val Thr Asp Asp Val Met
                245                 250                 255
Tyr Leu Asp Pro Lys Leu Gly Arg Thr Phe Ala Cys Ser Cys Leu Pro
            260                 265                 270
His Arg Asp Gly Pro Gly Ala Asp Met Arg Asp Glu Arg Gly Arg Val
        275                 280                 285
Phe Leu Asn Ser Pro Ser Phe Arg Ala His Ala Glu Glu Phe Lys Gln
    290                 295                 300
Gln Gly Pro Val Ile Cys Ser Gly Cys Ser Thr Thr Ala Ala Gly Tyr
305                 310                 315                 320
Ser Asp Asp Val Ala Arg Leu Gly Ser Val Pro Ala Trp His Tyr
                325                 330                 335
<210>9
<211>740
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>9
Met Ile Leu Arg Thr Asp His Val Asp Ala Tyr Leu Ser Ala Val Ser
1               5                   10                  15
Ala Ile Leu Asp Glu Pro Gly Arg Ala Gly Ala Gly Val Pro Val Leu
            20                  25                  30
Cys Arg Pro Gly Ser Pro Leu Asp Val Leu Val Thr Arg Trp Ser Ala
        35                  40                  45
Leu Leu Gly His Ala Gly Pro Arg Ala Arg Ser Asp Arg Pro Gly Arg
    50                  55                  60
Ala Val Val Ala Val Gly Asp Asp Pro Val Val Ser Ala Ala Ala Arg
65                  70                  75                  80
Leu Leu Ala Val Leu Thr Gly Arg Thr Ala Leu Ala Val Ala Asp Val
                85                  90                  95
Lys Glu Leu Pro Ala Leu Trp Glu Arg His Asp Leu Val Ser Thr Ala
            100                 105                 110
Leu Val Gly Ile Gly Thr Gly Phe Asp Val Pro Gly Val Glu Pro Ser
        115                 120                 125
Ala Phe Trp Arg Leu Asp Ala Thr Asp Ala Thr Leu Gly Ile Leu Thr
    130                 135                 140
Gly Arg Asp Arg Glu Ser Leu Thr Trp Phe Val Ala Lys Ser Leu Leu
145                 150                 155                 160
Thr Ser Thr Val Pro Gly Asp Ala Gln Thr Leu Leu Leu Pro Asp Arg
                165                 170                 175
Lys Pro Arg Glu Asp Thr Ala Ser Ala Gly Val Gly Ala Gly Gly Val
            180                 185                 190
Glu Val Leu Tyr Gly Ala Ala Ala Glu Glu Ala Leu Pro Ala Leu Ala
        195                 200                 205
Glu Asp Glu Arg Val Arg Ala Leu Ile Ala Val Glu Ala His Gly Arg
    210                 215                 220
Ala Asp His Leu Gly Val Arg Asp Gly Ile Ile Cys Gly Asp Arg Leu
225                 230                 235                 240
Ala His Leu Gly Arg Ser Ser Glu Pro Glu Gly Ile Gly Arg Val Pro
                245                 250                 255
Gln Cys Ala Phe Gly His Gly Cys Phe Lys Pro Gly Ala Arg Val Ala
            260                 265                 270
Ile Ser Arg Met Pro Ala Gln Ser Leu Phe Leu His Ser Cys Thr Ser
        275                 280                 285
Ser His Thr Glu Ala Asp Met Tyr Glu Lys Ser Phe Leu Leu Gly Leu
    290                 295                 300
Ala Ala Leu Glu Gly Pro Ala Arg His Val Leu Gly Thr Val Arg Pro
305                 310                 315                 320
Met His Asp Gly Gly His Glu Val Gly Leu Val Ser Ala Leu Thr Ala
                325                 330                 335
Ala Gly Ala Ser Ala Gly Glu Val Thr Arg Leu Leu Asn Ala Ser Tyr
            340                 345                 350
His Gln His Arg Gly Glu Pro Ala Pro Tyr Leu Leu Leu Gly Asp Pro
        355                 360                 365
Glu Leu Pro Phe Ala Asp Gly Pro Val Gly Gly Pro Asp Ala Gly Pro
    370                 375                 380
Ala Val Glu Leu Asp Ala Ser Ala Gly Ala Leu Pro Leu Gly Gly Arg
385                 390                 395                 400
Arg Thr Ala Val Leu Gly Ser Gly Pro Gly Val Leu Val Val Gly Asp
                405                 410                 415
Ala Thr Gly Asp Glu Asp Gly Asp Gly Pro Gly Leu Pro Ala Gly Val
            420                 425                 430
Gly Ala Leu Thr Val Arg Arg Gly Asp Arg Thr Asp Val Val Ala Trp
        435                 440                 445
Ser Thr Glu Gly Pro Leu Pro Glu Gly Ala Leu Pro Leu Val Arg Arg
    450                 455                 460
Glu Gly Gly Ala Val Ala Ala Asp Gly Gly Ala Glu Glu Leu His Ala
465                 470                 475                 480
Arg Trp Asp His Val Asp His Gly Ile Ala Ser Gly Gly Ala Leu Gly
                485                 490                 495
Leu Leu Pro Lys Asp Leu Thr Gly Arg Leu Gln Glu Leu Arg Asp Leu
            500                 505                 510
Ala Ala Ala Val Gly Thr Ala Asp Arg Asp Ala Arg Phe Phe Pro Gly
        515                 520                 525
Arg Leu Gly Ala Val Arg Arg Ala Ala Ala Arg Leu Asp Gln Arg Ile
    530                 535                 540
Arg Asp Ala Asp Arg Ala Leu Met His Ala Leu Leu Gly Arg Asn Gly
545                 550                 555                 560
Lys Pro Phe Asp Ala Asp Asp Arg Leu Glu Ser Ala Phe Val Pro Leu
                565                 570                 575
Glu Ser Gln Tyr Gly Arg Gln Val Cys Trp Cys Gly Arg Asp Ala Val
            580                 585                 590
Val Ser Arg Leu Arg Pro Arg Leu Gly Ala Arg Glu Val Arg Arg Lys
        595                 600                 605
Tyr Asn Cys Met Gln Cys Gly Asp Tyr Ala Gln Val Ala Val Asp Gly
    610                 615                 620
Val Asp Val Arg Trp Glu Ala Pro Glu Phe Val Ala Ser Gly Gly Glu
625                 630                 635                 640
Leu Glu His Ser Phe Arg Ile Ala Asn Pro Leu Pro His Pro Val Thr
                645                 650                 655
Gly Val Leu Ala Leu Ser Val Ser Pro Trp Tyr Gly Gly Asp Val Ser
            660                 665                 670
Phe Arg Pro Gly Ile Ala Thr Phe Ser Val Ala Pro Gly Gly Thr Cys
        675                 680                 685
Arg Val Gly Val Thr Met Arg Ala Ala Gly Leu Lys Pro His Arg Tyr
    690                 695                 700
Thr Val Asp Ala Thr Val Val Ser His Leu Arg Ile Asn Ala Tyr Arg
705                 710                 715                 720
Lys Phe Val Gln Val Arg Pro Ala Gly Pro Val Gly Pro Ser Asp Glu
                725                 730                 735
Asp Gly Ala Leu
            740
<210>10
<211>360
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>10
Val Thr Ala Pro Thr Thr Gly Pro Thr Thr Gly Pro Thr Thr Gly Pro
1               5                   10                  15
Thr Ala Gly Pro Thr Thr Gly Pro Thr Ala Gly Pro Thr Ala Gly Pro
            20                  25                  30
Thr Ala Gly Ser Ala Val Ala Glu Glu Ala Val Ala Glu Trp Ala Ala
        35                  40                  45
Ala Trp Leu Glu Gln Val His Gly Val Arg Tyr Gly Pro Asp Asp Ala
    50                  55                  60
Leu Phe Gly Ser Leu Asp Ser Leu Ala Leu Thr Glu Leu Leu Val Ala
65                  70                  75                  80
Cys Glu Ala His Phe Gly Leu Arg Ile Asp Glu Gly Phe Gly Trp Gln
                85                  90                  95
Ala Leu Ala Ser Val Arg Ser Leu Ala Ala His Val Ala Thr Gly Val
            100                 105                 110
Arg Pro Pro Ser Asp Arg Val Trp Phe Arg Ser Gly Pro Gly Ala Thr
        115                 120                 125
Gly Asp Ala Asp Leu Asp Arg Thr Ala Val Val Arg Val Ala Leu Gly
    130                 135                 140
Leu Pro Pro Gly Ala Ala Val Ala Arg Leu Ser Pro Arg Glu Leu Ala
145                 150                 155                 160
Leu Gly Ile Gly Ala Ala Ala Ala Pro Ser Glu Lys Pro Ala Thr Thr
                165                 170                 175
Leu Pro Pro Glu Arg Glu Arg Leu Ser Leu Ala Arg Glu Ser Ser Thr
            180                 185                 190
Arg Pro Gly Ser Leu Leu Ala Val Gly Ala Thr Ala Ala Arg Ile Arg
        195                 200                 205
Ala Phe Ala Gly Arg Leu Asp Ala Ala Leu Ala Ala Val Gly Ala Thr
    210                 215                 220
Pro Val Trp Tyr Pro Ile Thr Thr Asp Ser Pro Val Gly Ala Asp His
225                 230                 235                 240
Val Gln Gly Ile Pro Ser Glu Leu Thr Ala Gly Arg Leu Gly His Ala
                245                 250                 255
Gly Cys Leu Gln Leu Leu Ala Glu Leu Pro Ala Glu Arg Asp Val Val
            260                 265                 270
Tyr Ser Gly Ile Ala Tyr Ala Phe Arg Asp Glu Pro Gly Arg Arg Trp
        275                 280                 285
Glu Pro Ala Gly Arg Leu Glu Ala Tyr Arg Val His Glu Thr Val Val
    290                 295                 300
His Gly Thr Glu Glu Phe Arg Thr Ala Met Trp Arg Arg Leu Tyr Glu
305                 310                 315                 320
Leu Val Asp Arg Glu Leu Ser Ala Leu Gly Pro Gly Gly Trp Gln Glu
                325                 330                 335
Gly Arg Asp Gly Phe Thr Pro Arg His Gly Pro Gln Ala Arg Met Ala
            340                 345                 350
Ala Gly Thr Arg Arg Trp Ala Arg
        355                 360
<210>11
<211>317
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>11
Met Asp Ala Ala Pro Gly Thr Ala Arg Thr Ala Ala Gly Thr Ser Val
1               5                   10                  15
Pro Pro Val Leu Pro Val Asp Ala Glu Arg Pro Ala Ala Arg Arg Thr
            20                  25                  30
Leu Ala Met Glu Glu Gly Thr Pro Arg Gln Trp Glu Gly Leu Gly Leu
        35                  40                  45
His Gly Val Pro Glu Ala Val Glu Ala Ala Leu Gly Pro Ala Ala Glu
    50                  55                  60
Leu Val Val Ala Ala Arg Gly Gly Gly Arg Ser Pro Leu Pro Gly Leu
65                  70                  75                  80
Val Phe Ala Gln Pro Cys Leu Gly Arg Ser Ala Gly Val Ala Arg Asp
                85                  90                  95
Leu Pro Val Ser Val Val Trp Glu Thr Gly Val Ala Leu Ala Ile Ala
            100                 105                 110
Arg Ala Leu Asp Arg Pro Ala Val Ile Gly Leu Cys Val Tyr Glu Glu
        115                 120                 125
Ile Leu Gln Gln Pro His Arg Asp Ala Glu Phe Thr Ala Leu Gly Ala
    130                 135                 140
Ala Val Ala Arg Thr Val Glu Ala Leu Gly Arg Leu Leu Gly Val Ala
145                 150                 155                 160
Val Thr Ala Arg Val Glu Thr Ala Ala Pro Arg Ala Ala Glu Val Pro
                165                 170                 175
Ala Arg Arg Leu Tyr Gly Leu Tyr Thr Pro Phe Ser Glu Ser Thr Tyr
            180                 185                 190
Pro Arg Gly Phe Pro Asn Glu Ala Glu Val Leu Arg Ala Phe Ser Ala
        195                 200                 205
Tyr Cys Gly Arg Tyr Glu Asp Ala Ala Arg Arg Glu Ala Ser Leu Trp
    210                 215                 220
Val Thr Glu Gly Val His Leu Ala Lys Ala Ala Leu Leu Gly Leu Gly
225                 230                 235                 240
Pro Gly Val Pro Phe Leu Ala Thr Thr Pro Leu Pro Asp Pro Ala His
                245                 250                 255
Pro Gly Arg Leu Leu Gln Asp Ala Pro Ala Ala Thr Arg Val Thr Leu
            260                 265                 270
Glu Arg Arg Ser Ala Leu Pro Ala Asp Trp Trp Pro Glu Gln Ala Leu
        275                 280                 285
Glu Arg Ala Leu Gly Thr Gly Leu Arg Arg Leu Thr Glu Asp Phe His
    290                 295                 300
Ala Leu Ile Glu Asp Phe His Asp Pro Ala Gly Asp Arg
305                 310                 315
<210>12
<211>442
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>12
Met Arg Thr Pro Arg Thr Gly Ala Val Leu Gly Gly Arg Gly Pro Ala
1               5                   10                  15
Leu Pro Phe Val Ala Tyr Met Ala Leu Ser Asn Ala Gln Phe Thr Arg
            20                  25                  30
Gly Val Phe Val Leu Phe Leu Leu Arg Gly Asn Ile Ser Leu Ala Glu
        35                  40                  45
Val Gly Leu Leu Glu Ser Leu Phe His Leu Thr Arg Val Leu Cys Glu
    50                  55                  60
Val Pro Ala Gly Ser Val Ala Asp Arg Trp Gly Arg Arg Arg Thr Ile
65                  70                  75                  80
Gln Ala Gly Leu Ile Leu Ser Ala Ala Ala Met Pro Ala Phe Leu Leu
                85                  90                  95
Gly Gly Met Phe Trp Tyr Ala Leu Ala Phe Val Phe Gln Gly Ala Gly
            100                 105                 110
Trp Ala Ala Gln Arg Gly Ala Asp Thr Ala Leu Leu Tyr Glu Leu Leu
        115                 120                 125
Glu Arg Thr Gly Gly Thr Asp Arg Tyr Ala Arg Ile Leu Gly Arg Ser
    130                 135                 140
His Ala Ala Ser Tyr Gly Thr Leu Ala Leu Thr Thr Ala Leu Gly Ala
145                 150                 155                 160
Met Leu Tyr Gln Arg His Val Ser Leu Pro Phe Trp Leu Gln Ala Ala
                165                 170                 175
Val Thr Leu Leu Ala Val Gly Ala Ile Gly Val Leu Pro Glu Ser Ser
            180                 185                 190
Gly Thr Ala Ala Ser Gly Ala Gly Ser Ser Gly Ser Gly Ser Ser Gly
        195                 200                 205
Glu Pro Ala Glu Arg Pro Met Gly Val Trp Arg Leu Ala Arg Ala Gly
    210                 215                 220
Ala Arg Leu Val Val Gly His Pro Val Leu Arg Leu Phe Val Ala Phe
225                 230                 235                 240
Val Ala Leu Val Glu Ala Gly Thr Thr Val Val Ser Ile Phe Ser Gln
                245                 250                 255
Ser Phe Phe Arg Thr Leu Gly Tyr Gly Thr Ala Thr Thr Gly Leu Ile
            260                 265                 270
Leu Ala Leu Val Thr Ala Phe Ser Ala Ala Ala Ala Leu Gln Ser His
        275                 280                 285
Arg Leu Val Glu Arg Gly Pro Val Arg Val Leu Met Ala Ala Ser Ser
    290                 295                 300
Leu Tyr Leu Val Gly Leu Ala Gly Met Ala Ser Leu Gln Pro Gln Leu
305                 310                 315                 320
Ala Val Val Gly Tyr Tyr Leu Val Phe Leu Asn Leu Asp Leu Leu Ala
                325                 330                 335
Pro Val Leu Ser Ala Phe Phe His Arg Ser Val Asp Glu Glu Val Arg
            340                 345                 350
Ala Thr Ala Gly Ser Tyr Leu Asn Leu Ser Thr Ser Val Leu Thr Phe
        355                 360                 365
Ala Ala Phe Pro Leu Ser Gly Ser Leu Ile Asp Ala Gly Gly Tyr Arg
    370                 375                 380
Pro Leu Leu Ile Ile Thr Ala Leu Val Ser Leu Pro Leu Leu Val Phe
385                 390                 395                 400
Leu Val Gly Ala Ala Arg Arg Val Leu Ser Pro Pro Glu Glu Gly Asp
                405                 410                 415
Ser Gly Glu Asp Ala Gly Glu Arg Ala Gly Pro Lys Gly Pro Gly Ala
            420                 425                 430
Ala Ala Pro Asp Thr Thr Thr Thr Gly Val
        435                 440
<210>13
<211>328
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>13
Met Thr Thr Arg Ala Asp Ser Pro Ser Pro Gly Ser Gly Gly Pro Val
1               5                   10                  15
Gly Pro Gly Gly Ser Gly Gly Asp Asp Gly Arg Pro Val Ile Ala Leu
            20                  25                  30
Arg Phe Ala Pro Ala Asp Val Glu Ala Ala Ala Ala Ala Glu Tyr Val
        35                  40                  45
Ala Ala His Leu Gly Gly Phe Arg Cys Leu Pro Glu Cys Pro Gln Glu
    50                  55                  60
Gly Asp Ser Gly Pro Gly Arg Asn Pro Pro Ala Ala Val Ile Val Phe
65                  70                  75                  80
Gly Arg Ser Gly Ala Ala Gly Gly Ala Gly Pro Ala Gly Val Pro Thr
                85                  90                  95
Val Leu Val Glu Gly Ala Glu Pro Val Pro Gly Thr Asp Ala Asp Val
            100                 105                 110
Val Cys Arg Gln Ala Pro Gly Trp Leu Thr Ala Gly Glu Pro Pro Ala
        115                 120                 125
Pro Pro Ala Val Arg Pro Gly Gly Gly Arg Ile Arg Thr Val Asp Val
    130                 135                 140
Ala Ala Val Ala Pro Phe Arg Gln Val Arg Ser Gly Gly Gly Gly Gly
145                 150                 155                 160
Arg Ala Ala Leu Leu Leu Gly Gly Ala Gly Gly Pro Asp Gly Ser Gly
                165                 170                 175
Ala Ser Ala Gly Gly Glu Ala Leu Pro Gly Ala Leu Ala Arg Phe Ile
            180                 185                 190
Ala Gly His Pro Ala Ala Ala Gly Asp Ala Trp Ala Val Leu Thr Asp
        195                 200                 205
Leu Thr Gly Glu Pro Leu Arg Glu Leu Leu Gly Leu Leu Pro Pro Thr
    210                 215                 220
Ala Arg Thr Val Gly Ala Ala Asp Trp Ala Gln Val Leu Arg Arg Ala
225                 230                 235                 240
Asp Ser Leu Val Ala Thr Pro Thr Leu Leu Ala Ala Ala His Ala Arg
                245                 250                 255
Thr Ala Arg Ile Pro Leu His Val Leu Asp Pro Ala Gly Pro Ala Gln
            260                 265                 270
Arg Arg Val His Arg Ala Leu Ala Ala Ile Ala Gly Ala Pro Gly Glu
        275                 280                 285
Pro Gly Gly Leu Pro Val Val Gly Pro Asp Asp Trp Pro Arg Asp Asp
    290                 295                 300
Gly Arg Ala Gly Ala Leu Gly Gly Ala Ala Gln Ile Ala Arg Gln Val
305                 310                 315                 320
Arg Gln Leu Cys Leu Ala Pro Ala
                325
<210>14
<211>389
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>14
Met Ser Asp Thr Leu Ala His Asn Arg Pro Leu Asp Leu Thr Gln His
1               5                   10                  15
Glu Ile Ala Ala Leu Arg Ser Glu His Asn Leu Ala Asp Ala His Thr
            20                  25                  30
His Gln Tyr Gln Ser Pro Ala Gln Gln Leu Ile Val Asp Ser Leu Pro
        35                  40                  45
Ala Leu Trp His Glu Ala Glu Lys Gly Arg Gln Ala Asp Phe Glu Gln
    50                  55                  60
Arg Phe Ile Glu Ala Phe Phe Arg Leu His Gly Gln Pro Thr Ala Ile
65                  70                  75                  80
Gly Leu Asp Arg Thr Leu Leu Thr Tyr Ala Ala Ser Ile Ser Thr Met
                85                  90                  95
Ile Ala Gly Met Phe Leu Lys Arg Arg Asp Ala Arg Val Thr Leu Val
            100                 105                 110
Glu Pro Cys Phe Asp Asn Leu Pro Asp Leu Leu Val Asn Leu Gly Val
        115                 120                 125
Pro Leu Thr Ala Leu Pro Glu Asp Ala Leu Arg Asp Pro Ala Arg Ile
    130                 135                 140
His Arg Glu Leu Ser Arg Leu Val Thr Thr Glu Ala Leu Phe Leu Val
145                 150                 155                 160
Asp Pro Asn Asn Pro Thr Gly His Ser Leu Phe Ala Asp Gly Met Arg
                165                 170                 175
Gly Phe Glu Glu Val Val Arg Phe Cys Arg Glu Arg Gly Thr Val Leu
            180                 185                 190
Val Leu Asp Leu Cys Phe Ala Ala Phe Ala Leu Gly Ser Gly Gly Pro
        195                 200                 205
Gly Arg His Asp Val Tyr Glu Leu Leu Glu Asn Ser Gly Val Thr Tyr
    210                 215                 220
Ile Ala Met Glu Asp Thr Gly Lys Thr Trp Pro Val Gln Asp Ala Lys
225                 230                 235                 240
Cys Ala Leu Leu Thr Thr Ser Ala Asp Ile Tyr Pro Ala Val Tyr Asn
                245                 250                 255
Leu His Thr Ser Val Leu Leu Asn Val Ser Pro Phe Ile Leu Asn Thr
            260                 265                 270
Leu Thr Arg Tyr Ile Glu Asp Ser Arg Arg Asp Gly Phe Ala Ser Val
        275                 280                 285
Thr Asp Val Leu Glu Arg Asn Arg Lys Ser Leu Arg Ala Ala Thr Glu
    290                 295                 300
Gly Thr Val Leu Arg Ala His Glu Pro Asp Val Pro Val Ser Val Ala
305                 310                 315                 320
Trp Phe Thr Ile Asp Asp Arg Gly Pro Asp Ala Thr Gln Leu Gln Arg
                325                 330                 335
Asp Leu Ser Gly His Gly Ile His Val Leu Pro Gly Thr Tyr Phe Tyr
            340                 345                 350
Trp Asn Glu Pro Ser Arg Gly Glu Arg Tyr Val Arg Val Ala Leu Ala
        355                 360                 365
Arg Asp Pro Gly Glu Phe Asp Ala Ser Met Ala Arg Leu Arg Thr Leu
    370                 375                 380
Leu Ala Arg Tyr Ala
385
<210>15
<211>258
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>15
Met Arg Glu Pro Gly Leu Ile Ala Pro Leu Val Thr Pro Leu Thr Pro
1               5                   10                  15
Asp Gly Ala Val Ser Glu Ala Cys Val Arg Ala Gln Val Ala Arg Val
            20                  25                  30
Arg Pro Tyr Val Arg Ala Leu Met Pro Gly Ile Ser Cys Gly Glu Gly
        35                  40                  45
Trp Leu Leu Asp Arg Pro Arg Trp Glu Arg Leu Ala Ala Ala Val Leu
    50                  55                  60
Asp Cys Arg Asp Gly Leu Pro Val His Leu Gly Val Gln Ala Ala Asp
65                  70                  75                  80
Thr Ala Glu Val Ile Arg Arg Ala Arg Trp Ala Val Arg His Gly Ala
                85                  90                  95
Asp Ala Val Thr Val Gly Pro Pro His Gly Ala Gly Ala Arg Gln Arg
            100                 105                 110
Ala Val His Glu His Phe Ala Arg Val Cys Ala Ala Val Asp Thr Pro
        115                 120                 125
Val Cys Val Tyr His Glu Ser Val Val Ser Gly Thr Arg Met Thr Pro
    130                 135                 140
Ala Thr Leu Thr Ala Val Cys Arg Leu Asp Gly Val Arg Ala Val Lys
145                 150                 155                 160
Glu Ser Gly Arg Glu Pro Ser Val Thr Asn Asp Leu Ile Ala Ala Val
                165                 170                 175
Pro Asp Val Ala Val His Gln Gly Trp Glu Asp Leu Phe His Ala Thr
            180                 185                 190
Pro Gly Ala Ala Gly Leu Ile Gly Pro Leu Val Leu Ile Asp Pro Ala
        195                 200                 205
Leu Cys Ala Glu Leu Val Ala Gly Val Gly Gly Val Gln Gly Val Val
    210                 215                 220
Thr Asp Arg Cys Arg Glu Leu Gly Leu Phe Arg Pro Asp Tyr Val Ala
225                 230                 235                 240
Arg Thr Lys Arg Glu Leu Cys Arg Leu Gly Val Leu Ala His Ala Val
                245                 250                 255
Thr Leu
<210>16
<211>356
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>16
Val Cys Pro Leu Thr Glu Ala Arg Leu Thr Gly Arg Ala Arg Ala Val
1               5                   10                  15
Tyr Leu Glu Ile Leu Arg Ala Gly Gly Ser Leu Pro Arg Thr Ala Leu
            20                  25                  30
Arg Thr Pro Gly Pro Pro Glu His Ser Gly Glu Gly Thr Asp Ala Asp
        35                  40                  45
Gly Asp His Glu Leu Thr Glu Ala Ile Asp Ala Leu Val Ala Leu Arg
    50                  55                  60
Leu Ile Gln His Thr Asp Arg Gly Arg Leu Leu Ala Ala Ile Ser Pro
65                  70                  75                  80
Gln Ser Ala Ala Ala Ala Leu Ser Ala Val Arg Glu Gly Glu Ile Gln
                85                  90                  95
Arg Gln Arg Leu Glu Asp Glu Arg Leu Arg Ser Ala Met Ala Ser Leu
            100                 105                 110
Gln Asp Ala Tyr Asp Ala Val Asn Glu Gly Arg Ala Arg Lys Ala Pro
        115                 120                 125
Gln Ile Glu Ser Leu Thr Asp Ile Ser Thr Ile Arg Gly Leu Leu Ser
    130                 135                 140
Ala Ala Ala Arg Asp Cys Arg His Glu Val Leu Thr Ala Gln Pro Glu
145                 150                 155                 160
Ala Leu Leu Glu Ser Thr Leu Ala Asp Ser Arg Pro Arg Asp Leu Ser
                165                 170                 175
Leu Leu Thr Arg Gly Ile Ala Ile Arg Thr Val Tyr Pro His Thr Val
            180                 185                 190
Leu Ser Ser Pro Ala Val Gln Gln His Phe Ser Leu Met His Glu Ala
        195                 200                 205
Gly Thr Gln Ile Arg Thr Thr Thr Gly Val Leu Asp Arg Val Val Ile
    210                 215                 220
Phe Asp Gln Ser Leu Ala Phe Leu Ala Asp Arg Arg Ser Asp Gly Pro
225                 230                 235                 240
Gly Ala Val Val Ile Arg His Pro Ala Val Val Asp Tyr Leu Tyr Arg
                245                 250                 255
Thr Ile Glu Gln Val Trp Arg Leu Ala Lys Pro Phe Val Tyr Thr His
            260                 265                 270
Val Gly Tyr Gly Pro Ala Ala Asp Glu Ile Arg Ala Gly Ile Leu Arg
        275                 280                 285
Leu Met Ala Ala Gly Ala Lys Asp Glu ValIle Ala Lys Arg Met Asn
    290                 295                 300
Met Ser Thr Arg Thr Cys Arg Arg His Ile Ala Glu Met Met Ala Glu
305                 310                 315                 320
Leu Gly Ala Glu Ser Arg Phe Gln Ala Gly Val Leu Ala Ala Asp Arg
                325                 330                 335
Gly Leu Leu Arg Leu Ser Gly Gly Pro Pro Pro Leu Arg Gly Phe Arg
            340                 345                 350
Gly Leu Ser Gly
        355
<210>17
<211>527
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>17
Met Lys Val Ala Leu Val Gly Pro Asn Gly Ala Gly Lys Thr Thr Leu
1               5                   10                  15
Leu Arg Met Ile Ala Gly Asp Leu Pro Val Thr Arg Gly Ala Val Ala
            20                  25                  30
Arg Ser Gly Gly Leu Gly Val Met Arg Gln Phe Ile Gly Met Val Ser
        35                  40                  45
Asp Glu Thr Thr Leu Ala Gly Leu Ala Leu Ser Leu Ser Pro Ala Gly
    50                  55                  60
Leu Arg Gly Ala Gly Glu Ala Leu Ala Arg Ala Glu Thr Ala Met Ala
65                  70                  75                  80
Val Pro Gly Ala Gly Glu Lys Ala Gln Leu Arg Tyr Ala Glu Ala Leu
                85                  90                  95
Val Ala Trp Gly Asp Ala Gly Gly Tyr Glu Gln Glu Val Val Phe Asp
            100                 105                 110
Thr Val Val Thr Asp Ile Leu Gly Thr Pro Trp Asp Glu Ala Arg Ser
        115                 120                 125
Arg Pro Val Arg Thr Leu Ser Gly Gly Glu Gln Lys Arg Phe Ala Leu
    130                 135                 140
Ser Leu Leu Leu Ala Gly Pro Asp Glu Val Leu Leu Leu Asp Glu Pro
145                 150                 155                 160
Asp Asn Phe Leu Asp Val Pro Gly Lys Arg Arg Leu Glu Ala Arg Leu
                165                 170                 175
Ala Glu Ser Pro Lys Thr Val Leu Tyr Val Ser His Asp Arg Glu Leu
            180                 185                 190
Leu Ala Asn Thr Ala Ser Arg Val Val Thr Val Glu Gly Gly Ser Ala
        195                 200                 205
Trp Met His Pro Gly Ser Phe Ala Ser Trp His Asp Ala Arg Val Ser
    210                 215                 220
Arg Tyr Glu Arg Phe Glu Glu Glu Arg Arg Arg Trp Asp Glu Glu His
225                 230                 235                 240
Ala Lys Leu Lys Glu Leu Val Arg His Tyr Gln Val Lys Ala Ser His
                245                 250                 255
Asn Asp Ala Met Ala Ser Arg Leu Gln Ala Ala Arg Thr Arg Leu Ala
            260                 265                 270
Lys Phe Glu Ala Gln Pro Pro Pro Pro Pro Arg Pro Arg Glu Gln Asn
        275                 280                 285
Ile Arg Met Arg Leu Thr Gly Asp Arg Thr Gly Lys Arg Ala Val Val
    290                 295                 300
Cys Glu Arg Leu Gly Leu Asp Gly Leu Thr Asp Pro Phe Gly Phe Glu
305                 310                 315                 320
Ala Trp Tyr Gly Asp Arg Ile Ala Val Leu Gly Ala Asn Gly Thr Gly
                325                 330                 335
Lys Ser His Phe Leu Arg Leu Leu Gly Arg Gly Gly Ser Asp Pro Glu
            340                 345                 350
Leu Pro Ser Leu Thr Pro Leu Glu Pro Val Ala His Thr Gly Ser Ala
        355                 360                 365
Arg Leu Gly Ala Arg Val Val Pro Gly His Phe Ser Gln Thr His Asp
    370                 375                 380
Arg Pro Glu Leu Val Gly Arg Thr Leu Glu Asp Ile Leu Trp Lys Gly
385                 390                 395                 400
Asp Val Arg Arg Asp Ser Leu Pro Arg Asp Glu Ala Met Ala Ala Leu
                405                 410                 415
Gly Arg Tyr Glu Leu Ala Gly Gln Gly Gly Gln Arg Phe Glu Thr Leu
            420                 425                 430
Ser Gly Gly Gln Gln Ala Arg Phe Leu Ile Leu Leu Leu Glu Leu Ser
        435                 440                 445
Gly Ala Thr Leu Leu Leu Leu Asp Glu Pro Thr Asp Asn Leu Asp Leu
    450                 455                 460
Ala Ser Ala Glu Ala Leu Glu Gln Gly Leu Ala Gly Phe Arg Gly Thr
465                 470                 475                 480
Val Leu Ala Val Thr His Asp Arg Trp Phe Thr Arg Ser Phe Asp Arg
                485                 490                 495
Phe Leu His Phe Arg Gly Asp Gly Ala Val Lys Glu Val Thr Ala Pro
            500                 505                 510
Val Trp Glu Pro Ala Val Val Glu Gly Ala Gly Gln Ala Gly Arg
        515                 520                 525
<210>18
<211>256
<212>PRT
<213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)
<400>18
Val Ile Glu Asp Gly Gly Ser Ala Arg Gly Ser Val Thr Thr Val Arg
1               5                   10                  15
Arg Val Gly Asp Thr Val Arg Arg Pro Arg Gly Arg Trp Thr Ala Asn
            20                  25                  30
Val His Ala Leu Leu Arg His Leu Ala Asp Ala Gly Phe Leu Arg Ala
        35                  40                  45
Pro Arg Ala Leu Gly Val Asp Glu Asp Gly Ser Glu Ile Leu Ser Phe
    50                  55                  60
Leu Asp Gly Glu Val Ala Met Arg Pro Trp Pro Ala Ala Leu Arg Glu
65                  70                  75                  80
Arg Ser Gly Val Val Glu Leu Ala Val Trp Leu Arg Glu Tyr His Asp
                85                  90                  95
Val Val Arg Asp Phe Arg Pro Pro Cys Pro Asp Glu Trp Phe Val Pro
            100                 105                 110
Gly Val Ser Trp Arg Pro Gly Arg Leu Val Arg His Gly Asp Leu Gly
        115                 120                 125
Pro Trp Asn Ser Val Trp Arg Gly Ser Arg Leu Val Gly Phe Ile Asp
    130                 135                 140
Trp Asp Phe Ala Glu Pro Gly Asp Pro Leu Asp Asp Leu Ala Gln Leu
145                 150                 155                 160
Ala Trp Tyr Cys Val Pro Leu Gly Gly Arg Ala Thr Gly Ala Gly Gly
                165                 170                 175
Glu Glu Ser Arg Val Arg Val Arg Glu Arg Leu Ala Ala Val Cys Thr
            180                 185                 190
Ala Tyr Gly Ala Glu Pro Val Ser Val Leu Asp Ala Leu Ala Gly Leu
        195                 200                 205
Gln Glu Arg Glu Ala Arg Arg Ile Thr Asp Leu Gly Gly Arg Gly Leu
    210                 215                 220
Glu Pro Trp Thr Ser Phe Leu Ala Arg Gly Asp Ala Thr Ala Ile Glu
225                 230                 235                 240
Glu Glu Arg Ala Trp Leu Leu Thr His Arg Glu Gly Leu Leu Val Gly
                245                 250                 255

Claims (5)

1.一种米多霉素生物合成基因簇,其特征在于,序列如SEQ ID NO:1所示。
2.根据权利要求1所述的米多霉素生物合成基因簇,其特征是,所述基因簇包含16个基因:
结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;其中:
所述基因milA,位于SEQ ID NO:1的第6125~7126位,
所述基因milB,位于SEQ ID NO:1的第7252~7761位,
所述基因milC,位于SEQ ID NO:1的第7906~9165位,
所述基因milD,位于SEQ ID NO:1的第9185~10369位,
所述基因milE,位于SEQ ID NO:1的第10380~11198位,
所述基因milG,位于SEQ ID NO:1的第11627~12631位,
所述基因mi1H,位于SEQ ID NO:1的第12729~14948位,
所述基因milJ,位于SEQ ID NO:1的第16202~17152位,
所述基因milM,位于SEQ ID NO:1的第19548~20714位,
所述基因milN,位于SEQ ID NO:1的第20710~21483位,
所述基因milQ,位于SEQ ID NO:1的第25168~25935位;
调节基因2个:milK和milO;其中:
所述基因milK,位于SEQ ID NO:1的第17152~18477位,
所述基因milO,位于SEQ ID NO:1的第23289~22222位;
抗性基因1个:milP;
所述基因milP,位于SEQ ID NO:1的第23298~24878位;
其他基因2个:milF、milI;其中:
所述基因milF,位于SEQ ID NO:1的第11194~11664位,
所述基因milI,位于SEQ ID NO:1的第14948~16027位。
3.根据权利要求2所述的米多霉素生物合成基因簇,其特征是,所述11个结构基因编码的蛋白具体为:
所述基因milA编码的蛋白的序列如SEQ ID NO:2所示,该蛋白为CMP羟甲基转移酶;
所述基因milB编码的蛋白的序列如SEQ ID NO:3所示,该蛋白为CMP/羟甲基水解酶;
所述基因milC编码的蛋白的序列如SEQ ID NO:4所示,该蛋白为胞嘧啶/羟甲基胞嘧啶葡萄糖醛酸合成酶;
所述基因milD编码的蛋白的序列如SEQ ID NO:5所示,该蛋白为degT/dnrT/eryC1/strS氨基转移酶;
所述基因milE编码的蛋白的序列如SEQ ID NO:6所示,该蛋白为氨基糖苷类磷酸转移酶;
所述基因milG编码的蛋白的序列如SEQ ID NO:8所示,该蛋白为RadicalSAM蛋白;
所述基因milH编码的蛋白的序列如SEQ ID NO:9所示,该蛋白为连接酶;
所述基因milJ编码的蛋白的序列如SEQ ID NO:11所示,该蛋白为精氨酸羟化酶;
所述基因milM编码的蛋白的序列如SEQ ID NO:14所示,该蛋白为Asp/Tyr/Aro氨基转移酶;
所述基因milN编码的蛋白的序列如SEQ ID NO:15所示,该蛋白为二氢二吡啶甲酸合酶;
所述基因milQ编码的蛋白的序列如SEQ ID NO:18所示,该蛋白为氨基糖苷磷酸转移酶。
4.根据权利要求2所述的米多霉素生物合成基因簇,其特征是,所述2个调节基因编码的蛋白具体为:
所述基因milK编码的蛋白的序列如SEQ ID NO:12所示,该蛋白为Majorfacilitator superfamily家族蛋白;
所述基因milO编码的蛋白的序列如SEQ ID NO:16所示,该蛋白为LuxR家族调节蛋白。
5.根据权利要求2所述的米多霉素生物合成基因簇,其特征是,所述1个抗性基因编码的蛋白具体为:
所述基因milP编码的蛋白的序列如SEQ ID NO:17所示,该蛋白为ABCtransporter。
CN2009100563388A 2009-08-13 2009-08-13 米多霉素生物合成基因簇 Expired - Fee Related CN101812472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100563388A CN101812472B (zh) 2009-08-13 2009-08-13 米多霉素生物合成基因簇

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100563388A CN101812472B (zh) 2009-08-13 2009-08-13 米多霉素生物合成基因簇

Publications (2)

Publication Number Publication Date
CN101812472A true CN101812472A (zh) 2010-08-25
CN101812472B CN101812472B (zh) 2011-07-20

Family

ID=42619839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100563388A Expired - Fee Related CN101812472B (zh) 2009-08-13 2009-08-13 米多霉素生物合成基因簇

Country Status (1)

Country Link
CN (1) CN101812472B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110857447A (zh) * 2018-08-23 2020-03-03 中国科学院上海生命科学研究院 提高米尔贝霉素a3/a4或其衍生物产量的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1190444C (zh) * 2003-01-16 2005-02-23 上海交通大学 南昌霉素生物合成基因簇

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110857447A (zh) * 2018-08-23 2020-03-03 中国科学院上海生命科学研究院 提高米尔贝霉素a3/a4或其衍生物产量的方法
CN110857447B (zh) * 2018-08-23 2023-06-23 中国科学院分子植物科学卓越创新中心 提高米尔贝霉素a3/a4或其衍生物产量的方法

Also Published As

Publication number Publication date
CN101812472B (zh) 2011-07-20

Similar Documents

Publication Publication Date Title
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
Margot et al. The gene of the N‐acetylglucosaminidase, a Bacillus subtilis 168 cell wall hydrolase not involved in vegetative cell autolysis
JPH09224686A (ja) プラテノリドシンターゼ遺伝子
CN107868789B (zh) 可利霉素生物合成基因簇
KR20120136341A (ko) 새로운 카나마이신 화합물, 카나마이신 생산 스트렙토마이세스 속 미생물 및 카나마이신의 생산 방법
CN101275141A (zh) 阿嗪霉素的生物合成基因簇
KR20100049580A (ko) 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도
CN101802168B (zh) 非天然型抗生素的制造方法
CN101157929A (zh) 番红霉素的生物合成基因簇
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
CN101818158B (zh) Fr901464的生物合成基因簇
CN101812472B (zh) 米多霉素生物合成基因簇
CN101586112B (zh) 诺丝七肽的生物合成基因簇
CN106701788A (zh) 喷司他丁和阿糖腺苷生物合成基因簇及其应用
CN101063140B (zh) 万古霉素生物合成基因簇
CN106676115B (zh) 2’-氯代喷司他丁和2’-氨基-2’-脱氧腺苷生物合成基因簇及其应用
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
CN114517175B (zh) 基因工程菌及其应用
KR100882692B1 (ko) 부테닐-스피노신 살충제 생산을 위한 생합성 유전자
CN112080454B (zh) 一株产柔红霉素的工程链霉菌及其构建方法
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
CN110305881B (zh) 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用
CN102517309A (zh) 一种手霉素类抗生素生物合成基因簇
US20030113874A1 (en) Genes and proteins for the biosynthesis of rosaramicin
CN101027395A (zh) 用于制备复合聚酮化合物的生物合成基因簇

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110720

Termination date: 20140813

EXPY Termination of patent right or utility model