CN102517309A - 一种手霉素类抗生素生物合成基因簇 - Google Patents

一种手霉素类抗生素生物合成基因簇 Download PDF

Info

Publication number
CN102517309A
CN102517309A CN2011103286346A CN201110328634A CN102517309A CN 102517309 A CN102517309 A CN 102517309A CN 2011103286346 A CN2011103286346 A CN 2011103286346A CN 201110328634 A CN201110328634 A CN 201110328634A CN 102517309 A CN102517309 A CN 102517309A
Authority
CN
China
Prior art keywords
coding
ucf
gene cluster
mycin
buddhist nun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103286346A
Other languages
English (en)
Inventor
李富超
姜鹏
陈华新
秦松
刘兆普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Oceanology of CAS
Original Assignee
Institute of Oceanology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Oceanology of CAS filed Critical Institute of Oceanology of CAS
Priority to CN2011103286346A priority Critical patent/CN102517309A/zh
Publication of CN102517309A publication Critical patent/CN102517309A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,(1)负责手霉素A和中尼霉素生物合成的结构基因25个;(2)负责手霉素A和中尼霉素生物合成的调节基因3个;(3)负责手霉素A和中尼霉素生物合成的转运基因2个。通过对上述生物合成基因的遗传改造可以得到手霉素A和中尼霉素的结构类似物,本发明所提供的基因及其所编码的蛋白质,可以用来寻找和发现可用于医药、工业和农业的化合物、基因和蛋白。

Description

一种手霉素类抗生素生物合成基因簇
技术领域
本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。
背景技术
手霉素类化合物是非常特殊的一类聚酮类天然产物,大多数是由链霉菌产生的抗生素,具有良好的生物活性。第一个手霉素化合物手霉素A是从链霉菌Streptomyces parvulus Tü64分离得到的(Buzzetti et al.,1963),然后在1973年发表了其结构(
Figure BSA00000598841000011
et al.,1973),后来Zeeck等人给出了手霉素A的立体化学结构,进一步修正了其结构(Zeeck et al.,1987;Sattler et al.,1998),手霉素化合物被认为是一族新的抗生素,随后又分离得到了有类似结构的化合物如asukamycin(
Figure BSA00000598841000012
et al.,1976;Kakinuma et al.,1979),U-62162(Slechta et al.,1982)和U-56407(Brodasky et al.,1983),丰富了此族抗生素,以上这些手霉素类化合物的中心核心结构是m-C7N结构。而2005年Li等从海洋链霉菌中分离得到了手霉素A和中尼霉素A、B(Li et al.,2005),中尼霉素中心芳香环结构是p-C7N结构单元,且有氯的取代,是第一个来自天然的para-C7N结构。
一些临床上使用的利福霉素、丝裂霉素C等氨莎类抗生素,其结构通常是脂肪族安莎链通过酰胺键连接在m-C7N芳香环结构上,而m-C7N结构单元是由特殊的3-氨基-5-羟基苯甲酸(AHBA)作为起始单元合成的(Floss2006)。
手霉素类化合物看上去核心结构具有类似m-C7N的结构单元,但是Floss课题组通过前体喂养实验发现,手霉素A和asukamycin等核心结构的前体物并不是AHBA,而是其异构物3-氨基-4羟基苯甲酸(3,4-AHBA)(Huet al.,1997 and 2004)。在2010年Rui等人解析了asukamycin的生物合成基因簇(Rui et al.,2010),进一步证实了前体物是3,4-AHBA。
几乎所有手霉素类化合物的侧链上都存在C5N结构:2-氨基-3-羟基-2-环戊烯酮(2-amino-3-hydroxycyclopent-2-enone),C5N结构单元的前体物是5-氨基酮戊酸(5-aminolevulinic acid,ALA),也是四吡咯的重要前体物,可以合成亚铁血红素、叶绿素、类咕啉等化合物。ALA在生物体内通常有两种合成途径,C5途径和Shemin(C4)途径(Petricek et al.,2006)。在C5途径中,完整的谷氨酸碳骨架在谷氨酸tRNA连接酶、还原酶及一个氨基变位酶的作用下生成ALA,这个过程常存在于植物和大多数细菌中。而Shemin途径,则是甘氨酸和琥珀酰辅酶A在5-氨乙酰丙酸合成酶作用下直接生成ALA,这个途径常被认为存在于动物、真菌及许多光合细菌中(Avissar et al.,1989)。而最近的研究发现Shemin途径也常存在于链霉菌的ALA合成过程中(Zhang et al.,2010),还发现有的链霉菌同时具有C5和Shemin(C4)两种途径(Petricek et al.,2006)。ALA可以在5-氨乙酰丙酸辅酶A连接酶的作用下环化生成C5N结构单元,然后在酰胺合成酶的作用下,进入到手霉素类化合物的代谢过程。
手霉素化合物一般具有良好的生物活性,手霉素A是Ras蛋白法呢基转移酶抑制剂(Hara et al.,1993)和白细胞介素-1β转换酶抑制剂(Tanaka et al.,1996);抗生素U-62162和U-56407选择性地抑制革兰氏阳性细菌,而对革兰氏阴性菌没有抑制效果;中尼霉素A对乳腺癌及黑色素瘤具有显著的抑制活性(IC50=2.41μg/mL);以商品农药作为对照,中尼霉素对农作物病原真菌的抗菌效果明显,优于武夷菌素水剂、克菌康、宝丽安及百菌清等商品农药(李富超等,2009),具有很好的开发前景。
手霉素类化合物的生物活性与其结构密切相关,随着手霉素A和中尼霉素整个生物合成基因簇的解析,可以从基因和酶催化两个层次理解链霉菌进行抗生素生物合成的机制,进而可以实现手霉素A和中尼霉素结构的定向改造以及利用组合生物合成手段创制生物活性更高的手霉素类化合物,并且实现手霉素类化合物产生菌的分子育种、发酵工艺优化,高效积累手霉素类目标化合物。
发明内容
本发明目的在于提供一种手霉素类抗生素生物合成基因簇。
为实现上述目的,本发明采用的技术方案为:
一种手霉素生物合成基因簇:所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,
1)手霉素A和中尼霉素的生物合成的结构基因:编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶的chiA1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2;编码醛裂合酶的chiA3;编码3-羟丁酰辅酶A脱氢酶的chiB1;编码芳香胺N乙酰转移酶的chiB2;编码3-氧乙酰基载体蛋白合成酶III的chiB3;编码3-氧乙酰基载体蛋白合成酶III的chiB4;编码酰基载体蛋白的chiB5;编码硫酯酶的chiB6;编码3-氧乙酰基载体蛋白还原酶的chiB7;编码酰基脱水酶的chiB8;编码酰基脱水酶的chiB9;编码I/II型酮合成酶相关的酰基载体蛋白的chiC1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白的chiC2;编码3-氧乙酰基载体蛋白合成酶II的chiC3;编码酮合成酶的chiC4;编码甲基丙二酰辅酶A变位酶的chiC5;编码硫酯酶的chiC6;编码酰胺合成酶的chiD1;编码5-氨乙酰丙酸合成酶的chiD2;编码5-氨乙酰丙酸辅酶A连接酶的chiD3;编码氧化酶的chiE1;编码黄素还原酶的chiE2;编码黄素依赖的单加氧酶的chiE3;编码黄素依赖的氧化还原酶的chiE4;共25个基因;
2)手霉素A和中尼霉素的生物合成的调节基因:编码LuxR家族转录调节子的chiR1;编码TetR家族转录调节子的chiR2;编码调节蛋白的chiR3;共3个基因;
3)手霉素A和中尼霉素的生物合成的转运基因:编码抗药性转运蛋白的chiM1;编码分泌蛋白酶的chiM2;共2个基因。
所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A的结构类似物。
所述中尼霉素生物合成基因簇用于其编码蛋白催化合成中尼霉素及其类似物。对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
本发明提供了产生手霉素A和中尼霉素生物合成基因被阻断或加倍的微生物体内的途径。
本发明提供的核苷酸序列或部分核苷酸序列,可以利用聚合酶链式反应(PCR)的方法或包括本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与手霉素A或中尼霉素生物合成同源的基因。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从海洋链霉菌Streptomyces griseoaurantiacus M045的基因组文库中定位更多的文库质粒,这些文库质粒至少包含本发明中的部分序列,也包含链霉菌M045基因组中邻近区域以前未克隆的DNA。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通过紫外或化学试剂进行诱变等。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达系统,包括链霉菌、芽孢杆菌、假单胞菌、大肠杆菌、酵母、植物和动物等,进行异源表达获得相应的酶或高活性的代谢产物。
手霉素A和中尼霉素生物合成的修饰基因、调节基因、膜蛋白相关基因的核苷酸序列提供了通过缺失或改造这些修饰基因、调节基因、转运基因而得到手霉素A和中尼霉素结构类似物,或者使手霉素A和中尼霉素类似物产量提高的途径。
本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。
本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组载体以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断手霉素A或中尼霉素生物合成的一个或几个步骤而得到新的手霉素或中尼霉素结构类似物或前体。包含DNA片段或基因可以用来提高手霉素、中尼霉素或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。
本发明所提供的聚酮合成酶可以通过缺失、插入或失活来自于相同或不同的聚酮合成酶系统的一个或多个聚酮合成酶结构域、模块或基因而产生新的聚酮化合物。本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建聚酮合成酶库或聚酮合成酶衍生库或组合库。
本发明所提供的手霉素A骨架的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的催化从手霉素A到中尼霉素的氧化反应可有其他应用,包括进行卤素的取代。综上,本发明所提供的包含手霉素A和中尼霉素生物合成相关的所有基因和蛋白信息可以帮助人们理解手霉素类天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明
图1为本发明实施例提供的手霉素A、中尼霉素A、中尼霉素B、asukamycin的化学结构。
图2为本发明实施例提供的手霉素A和中尼霉素基因簇的结构组成图。
图3为本发明实施例提供的构建的基因敲除载体pHZ132D2。
图4为本发明实施例提供的从链霉菌M045野生菌株及突变株基因组上扩增硫链丝菌素的抗性基因tsr电泳图(图中:M:Trans2K Plus II DNAMarker(TransGen Biotech);1:空白对照;w:野生菌株;a-e:转化子;p:pHZ132质粒阳性对照。)。
图5为本发明实施例提供的以tsr为探针,进行总基因组DNA的酶切Southern Blot分析图(其中:m:λDNA/EcoR I+Hind III marker;w:野生菌株;a-e:转化子;p:pHZ132质粒阳性对照。)。
图6为本发明实施例提供的HPLC分析链霉菌M045野生菌株(w)和突变菌株(a,b,c)代谢产物的变化图(其中:化合物1:中尼霉素A;化合物2:中尼霉素B;化合物3:手霉素A;化合物4:中尼霉素A1;化合物6:手霉素A1。)。
图7为本发明实施例提供的中尼霉素A、中尼霉素B、手霉素A、中尼霉素A1、中尼霉素B1、手霉素A1的化学结构。
图8为本发明实施例提供的5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的C5N结构单元合成的Shemin途径。
具体实施方式
本发明中所述的手霉素A和中尼霉素的生物合成基因簇包含30个基因的核苷酸序列或互补序列(序列1),具体为:(1)负责手霉素A和中尼霉素的生物合成的结构基因共25个基因:chiA1,chiA2,chiA3,编码蛋白负责中心结构C7N的生物合成;chiB1,chiB2,chiB3,chiB4,chiB5,chiB6,chiB7,chiB8,chiB9,chiC1,chiC2,chiC3,chiC4,chiC5,chiC6,编码蛋白负责两个聚酮侧链的生物合成;chiD1,chiD2,chiD3,编码蛋白负责C5N结构的生物合成;chiE1,chiE2,chiE3,chiE4,编码氧化酶,负责手霉素A环氧结构形成,以及氯的取代和基团重排;(2)负责手霉素A和中尼霉素的生物合成的调节基因chiR1,chiR2,chiR3,共3个基因;(3)负责手霉素A和中尼霉素的生物合成的转运基因chiM1,chiM2,共2个基因。
chiA1位于基因簇的核苷酸序列第23831-24949碱基处,长度1119碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶,372个氨基酸;
chiA2位于基因簇的核苷酸序列第25075-26493碱基处,长度1419碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白,472个氨基酸;
chiA3位于基因簇的核苷酸序列第14395-15195碱基处,长度801碱基对,编码醛裂合酶,266个氨基酸;
chiB1位于基因簇的核苷酸序列第22841-23734碱基处,长度894碱基对,编码3-羟丁酰辅酶A脱氢酶,297个氨基酸;
chiB2位于基因簇的核苷酸序列第21942-22808碱基处,长度867碱基对,编码芳香胺N乙酰转移酶,288个氨基酸;
chiB3位于基因簇的核苷酸序列第20308-21357碱基处,长度1050碱基对,编码3-氧乙酰基载体蛋白合成酶III,349个氨基酸;
chiB4位于基因簇的核苷酸序列第18314-19336碱基处,长度1023碱基对,编码3-氧乙酰基载体蛋白合成酶III,340个氨基酸;
chiB5位于基因簇的核苷酸序列第19409-19639碱基处,长度231碱基对,编码酰基载体蛋白,76个氨基酸;
chiB6位于基因簇的核苷酸序列第21378-21935碱基处,长度558碱基对,编码硫酯酶,185个氨基酸;
chiB7位于基因簇的核苷酸序列第27438-28142碱基处,长度705碱基对,编码3-氧乙酰基载体蛋白还原酶,234个氨基酸;
chiB8位于基因簇的核苷酸序列第26490-26966碱基处,长度477碱基对,编码酰基脱水酶,158个氨基酸;
chiB9位于基因簇的核苷酸序列第26969-27421碱基处,长度453碱基对,编码酰基脱水酶,150个氨基酸;
chiC1位于基因簇的核苷酸序列第15248-15526碱基处,长度279碱基对,编码I/II型酮合成酶相关的酰基载体蛋白,92个氨基酸;
chiC2位于基因簇的核苷酸序列第15523-15789碱基处,长度267碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白,88个氨基酸;
chiC3位于基因簇的核苷酸序列第15779-16969碱基处,长度1191碱基对,编码3-氧乙酰基载体蛋白合成酶II,396个氨基酸;
chiC4位于基因簇的核苷酸序列第16966-17853碱基处,长度888碱基对,编码酮合成酶,295个氨基酸;
chiC5位于基因簇的核苷酸序列第85-222碱基处,长度138碱基对,编码甲基丙二酰辅酶A变位酶,45个氨基酸;
chiC6位于基因簇的核苷酸序列第17850-18317碱基处,长度468碱基对,编码硫酯酶,155个氨基酸;
chiD1位于基因簇的核苷酸序列第6529-8109碱基处,长度1581碱基对,编码酰胺合成酶,526个氨基酸;
chiD2位于基因簇的核苷酸序列第8114-9340碱基处,长度1227碱基对,编码5-氨乙酰丙酸合成酶,408个氨基酸;
chiD3位于基因簇的核苷酸序列第9452-10990碱基处,长度1539碱基对,编码5-氨乙酰丙酸辅酶A连接酶,512个氨基酸;
chiE1位于基因簇的核苷酸序列第5239-6423碱基处,长度1185碱基对,编码氧化酶,394个氨基酸;
chiE2位于基因簇的核苷酸序列第19639-20196碱基处,长度558碱基对,编码黄素还原酶,185个氨基酸;
chiE3位于基因簇的核苷酸序列第12173-11064碱基处,长度1110碱基对,编码黄素依赖的单加氧酶,369个氨基酸;
chiE4位于基因簇的核苷酸序列第28209-29267碱基处,长度1059碱基对,编码黄素依赖的氧化还原酶,352个氨基酸;
chiR1位于基因簇的核苷酸序列第3639-4331碱基处,长度693碱基对,编码LuxR家族转录调节子,230个氨基酸;
chiR2位于基因簇的核苷酸序列第4964-4377碱基处,长度588碱基对,编码TetR家族转录调节子,195个氨基酸;
chiR3位于基因簇的核苷酸序列第644-3439碱基处,长度2796碱基对,编码调节蛋白,931个氨基酸;
chiM1位于基因簇的核苷酸序列第12510-14039碱基处,长度1530碱基对,编码抗药性转运蛋白,509个氨基酸;
chiM2位于基因簇的核苷酸序列第29514-30914碱基处,长度1401碱基对,编码分泌蛋白酶,466个氨基酸;
序列表SEQ ID No.1为:
atgcggaagg ccgccgaggg cgaggacaac gtcctctatc ccatgaagga ggcgctcgcc      60
gcaggtgcca cgatcgggga agtgtgtgac acattgcggg aagtgtgggg aacgtaccgt     120
ccaaacgatg tcttttgacg aggaaaattt ctcgtaatgt cgcccgacgc acgggctcgg     180
ggctcccgtt gtgagaaacg gcacggtccg agcccgttta gggccctcac gggaaccctt     240
tccacggcct tcgcggtcgg ccggcgggca cacctccgga cgtcccggaa tactccgcca     300
cgcgccgccc ggcgaaaggt agactcggcc gaaaagttcg aacagttcga ctccagggaa     360
tggggaattg ccgagtaatg cccactgccg gaatgaccgc ctcaaacgac cgaattcagc     420
cattgtttat ccctgaattg gttcatcttt caagagtctc tcgctgtcgt ccctgacgcg     480
cggccgtcca ggccgctccc tgccaccgcg cgctccctct ccccacagtc catgtcgtcg     540
cgccatgcca ggagtactca tgctcagcca ggaccagcgt tccggggtcg cagtgccgcg     600
cccggacgat ccgcagcccg tacggttccg ggtactgggg ccgctcgccg tccagggcag     660
ggacggccgg gccatcccgg tgcccgggac gaagcagcgg gcggtgctcg gttatctgct     720
gctgcacccc aaccaggtcg tcgccaccag ccggctggtc gacgccctgt ggccgggcag     780
aaagcccgtc accgcccgga agatggtgca gaacgccgtc tccgcgctcc gtaccgcact     840
cgcccggggc aacgggccgg acgacgaggt ggtcctgctg acccacgcgc ccggctatct     900
gctgcgcgtc gaccccgagc tgatcgacct gcaccgctcc cggcggctgg ccgagcaggg     960
acggcgcgaa ctggccgccg gctcgccggc cgccgcggcc gagtccttcc gccaggcgct    1020
ggcgcagtgg aacggcgcgg tcctcgcgga tctcgtggag gccggggcct cctggccgga    1080
actcgccgcg atgtccgagg agcgccaggc gatccgtgag gaccgcgccg acgccgaact    1140
gcgctgcggc cggcaccaga cggtgctcgg cgagttacgt ctcctcgccg aggctgaccc    1200
gctgaacgag cggctgtgcg cactcctcat gctcgcgctg caccgcaacg gcaaacccgt    1260
cgaggccctg gagctctacc ggcgccaacg ggacctgatc gccgagaggt tcgacagcga    1320
gcccacccgg gaactgcggg acctcgagcg ggcggtgcgc acccgggacc cggccatcga    1380
cccgcccgca ccggcgcaga cggtcccgcc cctcgccccg cccgaggagg tcgccgcgga    1440
cctcgcggcg gaccggtcgg cgcccccggc ggcgacccgc gccgtgttcc gcccgccgcc    1500
cggtgcgccc ccctcggcgc tggtcaccga ggccctcccg tcggcccccg tgctcgccac    1560
gcccaccggg gaggacgccc cgccggggca cgcggcgggg gaacgcaaac ggctgagcgc    1620
cgtcctggtg cgggtcgagc cgccggccgc cgtcgggggc gacgacgcgg aggccttcga    1680
catccgcttc cgcgaggtgt cggccgtggt cgcggaggag gccgcgcggt acggcggaac    1740
cgtggccggc cggatcggct ccacgctgct gatgctcttc ggggtgttcc gcagccgggt    1800
ggacgacgcg ctgcgcgccg tgcgcgccgg gcacgcggtg cacgaccggc tgctgcggct    1860
cgccctgccc ctcggcgtcg tacccggggc gggacgggtg cgggtggcgg tgtcgaccgg    1920
ggacgcgctg gtccggttca ccgaggcggg ccaggacgcc gcgcccatgg tcgtcggcgc    1980
cctgctcgac cagtgcctgc gccagctgga gtccgccgag ccgggccaca tcaaactgtg    2040
cgacgccacc cgccgggccg cccggctggt caccgccggg ctcggcgacc cgctggacag    2100
cggctcggcc tccgccgccg tggcggccct cggccggtcc ccggccgcgc cgggtgcgag    2160
ggccccgctg gtggaacgcg aggccgaact ggacgtgctg accgccctgt tcaaccaggc    2220
ggtgcgcacc ggcaggccgc accagatcag cgtgctcggc gaacccggcg tgggcaagac    2280
caggctggtc caggagttcg cccggctggt gggtgcgcgc gcggaggacg cgcacctgct    2340
gcggctgcgg atgcccgtcc tcggccgccc caccggccgg accgcgctcg gggaactggt    2400
cggcctgtgc gcgggtctgc acccggcgga cccgccgcac accgtcgacg acaagctctc    2460
ggcggcgctg cggcgctggc tcggcccgcg ggtggtggac cgcgagacgg tcctcggcca    2520
tctgcgcgcc ctggtcgccc cggcgcacac cggcggcgtc ctcgacggcg aggcggtcgc    2580
cgcctgccgg cggatgctgg aggcgctcgc ggcggagcgg cccctggtgc tcgtcctgga    2640
ggacctgcac ctcgcggacg acggggtgct ggacttcgtc gacggcctgg ccgagtcctc    2700
ggcccggatc ccgctgctgg tcgtcaccac cgcgcgtccc gacctgatcg aacgccggcc    2760
cacctggggc ggcgggggct accgcacgac gagcaccatg cacctggaac ccctgagcca    2820
ggacgcctcg gcgcgcctgg tgagccggtt gtgggaacag tggggcgtgc ggcgcaccct    2880
cgaccggtcc gacctcacct cggtgacggg cggcattccg ctcttcgtcg tggagtacgc    2940
cgccctgttc gggcggccct cgccggcgga gcgggcggag gtctgcggcg cgtggccgga    3000
gcatctgccc gagcgggtca gggcggtggt gaccgagcac atcgacgccc tgcgcccgca    3060
ggccaaggcg gtgctgcggg acgcctcggt ccaggggccc cggttctggt cggaggccgt    3120
cgcggccgtg ggcgggcggg aggtggccga gtgcgagcgg tggctcgccc atctcgaacg    3180
ccgccacttc ctggtccggg ccgaccgcag ctccatcccg ggctcggacg agtacgtctt    3240
ccgcagcgcc tgggtgcgcg aggtgacccg gctgtcggtg ctgcagcccg cccgccggga    3300
ggggcggcgg cgggcggacg cctggctcgc ggagcgggcg gcggggatcc ggtgactgtc    3360
cagtggaccg ggagtggaac tgtgcctcta cggtccgggc cgggtcgctg acatgcttct    3420
cccggggccg gagagagcac tggtccccgg ggagacccga gggcacgcgc gtgacacggc    3480
gcaccgccac cggctccggg acagatccgc aacgcaccac cagatgggtc cagttcgtat    3540
tagggggatg accgatgtcg tacgttcaga cgcaacccgc ctcacccacc gcgcccaccg    3600
ctctgacggc cgcccggccg gtgctcacgg tcctgccgaa cgaggtcgcg cgccgggggg    3660
tccgcagcct gctcgacggt cccggccacg gacgcgccgt ggtggcctgc cccgctcccg    3720
aggaggccgc ggccctgctg cgcgccgagc ggttcggcct gctgatcgtc tcggccgcct    3780
acggcgaggc gcgcctggcc gaactggtcg gggagagttc ccggtcggac gtgaagtcgc    3840
tgctgctgct ggacagcgcg gagcccgagt acattccgtg gatcgccgcc atcccgttcg    3900
acggctatgt gatgcaggag gacctgacgc cggattcgat ggcggaggca ctgcggcgtc    3960
tggagcgggg caagctgccg atacccgaca cgctcgcccg gctcttcatc cggcacgccg    4020
gccgcagccg gggcacgcac cgcagccccc gggtccagct cacgccgagg gagcaggcgg    4080
tcctcgggct catcgcggag gggctgagca accggatgat cgcgcaccgg ttcggcatct    4140
cggagcacgg ggtgaagcgc cacgtggcca acctgctggc caagttcaac tgctccaacc    4200
gtgcccaggc ggtctcggtg gcactgcagc agggactgct ggcctgacgt ccccgcgccg    4260
gcgcccctcc cccgggccgt tcccggtggg gatcagtccg tcgaggacag ggcgtgccac    4320
gcgccctcgg ccatggcggc ggcctcgacc ggttccggtg ccagcagcca gtggcgcagg    4380
acgccgatga aggcgccggc cgcgcagtgc gcccgcagcg cggtgccggc gccgttccgc    4440
ggcccggccg gggaggcggt gagctgccgc gccacctcct cggcgaccag ttgctgcagc    4500
cggttcagga accgggcgga gccgcagggg cccagcatgc gccggtagag cacgagttgg    4560
gactccacgt gccggaagac gtcggcgaag gccggcggtg tcctgaccgg gccgtccacc    4620
agggggcagc gggcgagcac cgccaccagc gcggtcagct cgtcctccat ggcgtccagc    4680
agcagcgcgt cccggtcgct gtagtgctgg tagacggtgg cgcggttcac cgtcgcccgt    4740
tcggccacgt gggccacggt gatgcccgac agctcgcgct cggcggccag ttcgagtgcc    4800
gccgaccgca gcagcgcccg ggtccgcagc acccgcggat cgacgcgctt ggcgccgtgg    4860
tctgtcgtcg tgtcgggcat tcgcccagat tacacctgta cccaacaggt gtcgcagagt    4920
gatccggccg ggccgagggg cggtgcccgg ccggccgcgc ccgcccggtg gtccggggcg    4980
gccggacggg cgccgccggg cgggcgcccc gaacggcccg cccggacggg tctgggcgcc    5040
cggcgggggc ttcgtgagga tggccgacca gtgacggcca cacaacggag gaacccgatg    5100
accgcaagcg atcggaaccc agtcggcggc cccggggccg aggtggacgt gtgcgtgacc    5160
ggcggcggct cgaccgcgct cctcgcggcg ctgctctgcg cgcgggccgg ccgctcggtg    5220
ctgctcgtgg cccccgaggc ggagttcgag ccggccggcg cgggcatctc ccccctggtg    5280
gccccgccga ccctcggcct gctcgccggg gagggcgtcg aggaggaact gctgggggcc    5340
ggtcagcgca tcctcggcgc cgacgaccac gggcgggacg ggctcctctc ccgctggcgg    5400
tactacgacc tccccggcat cgcccgcccc tacgggctga cggtgccgac cggcacgctg    5460
gtgcaggcgc tgctcgcccg gctgcgcgcc gaaccgtccg cgaccgtgcg caccggccgt    5520
cgggtgaccg ccctcggcca ggacgaggac ggtgtcctcc tcaccttcgc cgacaccacc    5580
gcaggcacca ccggtgacgg tgccgggggc ggggccgagg aacgggtgag ggcacggtac    5640
gcggtcgccg cggacggccg gcactccccg ctgcgcgacc tgagcggcat caccgtccgc    5700
gacacaccgt tcgggcgtcc gggctggctg gtggccgcgc cggtcgtgcc gaggcgcgag    5760
cccgtgctgc tcgtgcggca cccggccccg caggcgctgt tcaccgtgcc cacgccgggc    5820
gactcgatgg ccgtcgtgtg gtgccccgac cgggagcagg gcgaggctct cgggcaggcg    5880
gacccggagg tgttcgccgg gcagatcaag acggtcgacc ccgagctcgc cgactggctc    5940
ggcgaggtcc gcgaccgcac ctccccggtg ttccggatcg acttcgcgat gtggcaggcc    6000
gcgtcctggc gccggggccg ggtgctgctg ctcggcgagt ccgcgcacgg gatgcacacg    6060
ctcggcgggc agggactcaa ccagtccctg cacagcgccg cctcgctggc ccgcgcggtg    6120
gacgaggcgc tcgcgcacaa ggaccccacg cgggtggagg cgtacgagcg gatccgccgg    6180
ccgcacgtgg agcggctgca ggaactgcag tggaacaccc cggcgctgcg ctcctacgag    6240
gccgagccgc ctcggcgcgg cgcccaccag gacttcgtcg aggtgatgac gacgctgcag    6300
ccggagctcg ccgagcagct cggtgccggc gcccgctgag gacgccgtca ccccacgcac    6360
ccgcaccgcc gaggcgaccg gctcgcccgg ctcgtccacg cccccgcacc actcaccgca    6420
gcacgcatcg aatcgaggtc gaccatggct ctaccggacg gctggtgggc accgcacgac    6480
ggttatgtcg cgcgggtact gtccgcgctg accgcccagc cggatcgcat cgccgtgcac    6540
tggcggcaac aggccctgac cggaggcgag ttcgccgcct cggtcgccgt gacggccgcg    6600
cgactgcggg agctgggcgc cgggccgggc gccgtggtgg gcgtcctgac cgcgtccaac    6660
agtcccgaca tgctgcgggt ccgctacgcg gcccacctgc tgggcgcggc cgtctgccac    6720
gtgcggtcca ccaaccccgg cacctccggg ccggcactgc ccgtcgggga acagctccgc    6780
atcctcctcg acacccgggt ccgggtgctg ttcaccgacg cggagaacgc cggccgcgcc    6840
cgggaactcg ccgagcgcgc ccggggccgt gtcgccctcg ccgaggccgg tgccccgggg    6900
gacgtgcggg agccggccgc cgtgccgtgg cgaccgcgcg ccctggcggt gatcgggttc    6960
accagcggca gcaccggccg tcccaagggg atcaggctgt cggcggcggc ctgggacaac    7020
ctcgtggagg tgaccgggca ggccttcacc ggcgaggcgg ggacggccgc ccggctgctg    7080
gtgacgaccc cgctgagcca taccgtggcc accatggcgg acgccgtgct ggccggcggt    7140
ggcaccgtcg tcctgcacga ggagttcgcg ccggagcccg tcctgcgggc actgaccggg    7200
caccggatca gccacacctt catggccacc gcgcagctgt accagctgct cgaccacgcg    7260
ccgctgcggg aggccgacct gtccgcgctg cgccagctca tctacaccgg cagcgccgcc    7320
gcgcccgccc gtgtcgccga ggccgtccgt ctgctcgggc cggtgctggt gcagggctac    7380
gggaccagcg agagcggccg gatcaccctg ctgcaccccg gcgaccacca ggatcccggg    7440
ctgcactcca ccgtgggccg cccgttcccc gagaacgaga tcgccgtcca cgaccccgag    7500
accgaggagg agctcccccc gggcgcgacg ggcgaggtgt gggtgcgctc cccgcacctg    7560
atggacggct actgggccga cccggcgctg agcatgcgca cgctgcgccg gggctggtac    7620
cggaccggcg acctcggccg gatcgacgag cggggctgcc tgtccctgct cggccggatc    7680
gcggacgtgg tcaagacgga cggggtgctg gtccatccgg cggtcgtcga gcggcggatc    7740
ctcacgctcc ccggcatcgc gcaggccgcc gtcttcgcgg tgcgcgaccc ggatctcgtc    7800
gagcacctca aggccgccgt cgtgccccgg ccgggtgcgc ggatcgaggc cgaggacgtg    7860
cgggcgcacc tcgccgcggg cctcggcgcc gggcacgtgc ccgaggaggt cctgatcctc    7920
gacgcgctgc cgctgaacgc cgggggcaag ccggacaagc gccggctccg tctcgcctgg    7980
cacggcacca cccattcgaa cacccccgta cgagaggtga gttgacgcca tgaaccgact    8040
cctggaccac ttcgccggtg aactggaggc cctcggcggg cagcgcaggg acttcctgga    8100
gatcggccgc cgcgccggcc gcttccccag tgctctcgcc cggctgcagg acgccccctc    8160
cgacgtggag atcagcgtct ggtgcagcaa cgactacctc ggcatgggcc agcacccctc    8220
ggtgctggag gcggccaaga acgccgtcga cgccttcggc gccggctcgg gcggctcccg    8280
caacatcggc ggcacgaact tctaccacgt gctgctcgaa caggaactgg ccgagctgca    8340
cggcaaggag gcggcgctgg tcttctcctc cggttacacg gccaacgacg gggcgctgac    8400
ggtgctcgcg ggccgggcgc cgggcacgct ggtcttctcc gacgcgctga accacgcctc    8460
gatcatcgac ggactgcggc acagcggcgc cgagaagcgc atcttccgcc acaacgacgt    8520
cgcccacctg cgggagctgc tggccgccgc cgatcccgag cggcccaagc tgatcgtgct    8580
ggagtcggtg tactcgatgt ccggggacgt ggcgccgctc gccgagttcg cggacctggc    8640
ggaggagttc cacgcggcca cgttcgtcga cgaggtgcac gcggtgggca tgtacggccc    8700
gcagggcgcc ggcatcgccg cccgggaggg catcgccgac cggttcaccg tgttcatggg    8760
cacgctcgcg aagggattcg gcacggcggg cgggtacatc gccggtccgg ccgacctggt    8820
ggacgcggtg cgcgccctgt cccggccgtt catcttcacc acctcgctcc cgccggccac    8880
cgcggccagc gcgctggcgg cggtgcagca cctgcgctcc tcggaggcgg agcgggaccg    8940
gctcgcggcc aacgccgggc tgctgcaccg gctgctgggc gagcggcgga tcccgttcgt    9000
ctcggacgag tcgcacatcg tgtcggtgtt cgtcggggac gacgcgcagt gccgccgggc    9060
ctcggcgatc ctgctggagc ggcacggcat ctacgtgcag ccgatcaacg cgcccagcgt     9120
ccgggcgggc gaggagatcc tgcgggtggc gccctccgcg acgcacaccc tcggtgacgt     9180
ggagaagttc gccgaggctc tggacggcat ctggcaggaa ctgggcatcc cgcgcggcgg     9240
ggtccgcggc gcctgacccc cggcgggccc gcgcgtccgt gccgggcgcg cggcgcccgc     9300
cccgtcccgt cccggcaccc tcgcccggag gcgcatgacc ggccgggcgg aacggagttg     9360
atgacccatg tccctctcgc tggccgccgt gctcgccgag ccggccgccc gacgcccgga     9420
ccacccggcg atcgtcttcg acgggcagga ggtgtcgtac gcccggctgt ggcaccgggc     9480
gcggagctac gcggccgtgc tcggtgagcg gggggtccgg cccggtgacc gggtggccct     9540
cctgctgtcc aacacaccgc acttcgccat ggcctacttc ggtgccctcg cggccggtgc     9600
cgtcgtggtg ccggtgcacg cgctgctgaa ggcggaggag atcgcctacg tgctgcgcga     9660
cagcggggcc cgcctgctgg tctgcggggg cgccttcctc ggcgagggcg ccaaggcggc     9720
cgagatggcg ggcgtcgagg tgctgaccgt cctcgccccg ggggagccgg cggcgcgccg     9780
cctcgacctc ctggccgagc ggtccgcgcc ggtggagacg tacctgccgc gcgcccccgc     9840
cgacgcggcc gtcgtcctgt acacctccgg taccacgggc cggcccaagg gcgcggtgct     9900
cacgcatctg aacctcacga tgaacatcgg cgtcacgatg ctctccccct tcgacttcca     9960
cgccggggac gtgctgctct gcccgctgcc gctgttccac accttcgggc agatctgcgg    10020
catgggggtg tgcttccggg cgggggcgac gatggtgctg atgccctcct tcgacgcgga    10080
ggaggccctc gagctgatgt gccgtcaccc ccgcgcggtg ttcatgggcg tccccaccat    10140
gtacctggcg ctgctcgacg ccgcccgcgc gcggcgggcg cccggccggc cgctcctcgc    10200
ccgcgcctac tccggggggt ccgcgctgcc ggtgaaggtg ctggaggagg tcgaggaggt    10260
cttcgactgc ccggtgtacg agggttacgg cctgacggag acctcgccgg tggtcgccta    10320
caaccagccg ggcctgcccc ggcgtcccgg caccgtgggc ctgccggtgt ggggcgtccg    10380
ggtggccgtc accgcggccg acacggcgga ggtcgtcccg ctgccgcccg gcgaggtggg    10440
cgaggtcgtc gtgcgcgggc acaacgtgat ggccgggtac ctgggccgcc ccgaggccac    10500
cgccgaggtg ctggtggacg gctggttccg caccggcgac ctgggcgtcc tggacgagga    10560
gggccggctg accctggtgg accgcaagaa ggacatggtg gtgcggggcg ggtacaacgt    10620
gtatccgcgc gagatcgagg aggtgctgtc ccggcatccg gcgatcgcgc aggtcgcggt    10680
gatcggcgtg ccccaccccc gttacggcga ggaggtgtgc gcggtggtgc gcaccccgcc    10740
cggcacggac ggcaccgcgc ggctcggtgc cgagatcgtg gcgtggagca gggaacggct    10800
ggccggccac aagtacccgc ggcgcgtgga gttcgtggac tccttcccgc tgggtccgag    10860
cgggaaggtg ctcaagcggg agctcgcggc ccggttcgcg gcgtagggcg tacggcggcg    10920
ggcgctgccc ggcatccctc ggggtgccgg gcagcgcccg tcgtggtgtg gtccgcgggt    10980
cacctgccgg agagggcgcg ggcgaggtcc gccgtccagg tgtaggagtc ggtgacgccc    11040
ttgagggagc cgttgaaccg gggggcgacg aagcgggcga ggagttcgag gctgcgatgg    11100
gtggcctcgc ggtccgccca gtccatcacg ttgaccagca ggcgcccgaa gccgccggtc    11160
tcctgctgca cgtcccggat ggcctcggtg acctcgtcga cggagccgac gagggtgccg    11220
cgctgctcga tcagttcctc cagcagcgcg cgggcctcgg cgcgtgaggc gacgggcggg    11280
gtgccgagca gggcccagta ctcgttgcgg taccgggtcc agccgtcgac gatctcgtcc    11340
agggcccggt cccggctctc cgacacgtgc acggtcagcg cgacccgcca ctcggcccgg    11400
tccagtttgt ggccgtgctc ggcggcggac tcctcggcgt gctgccactg gccgacgagg    11460
tcgccgatcc ggctgcccgg cttcggcggg atgccgaagg acagcggggc gatgccgtac    11520
tggccggcca gccgcatgcc gaacggggag acggcgctgg agaccgccat cggcagtccg    11580
gccggggtgc tcggccgcag gtgcagccgc gcgtcgcgca gccggaacca gtcggtctcc    11640
cgggtgacgg ggccctcccc ggcgaccagt tggcggatga cgtccaggga ctcggcggtg    11700
cggcgccggg tgtccgccgg gtcgatgccg aggaagtgca tgtcggtggg gatggagccg    11760
gccccgacgc cgagggtgaa ccggccgcgg gtgaggtggt cgagctggag ggcgcgcgtg    11820
gccaccatga aggggtggtg gtagggcagg ctcaccacgc cggtgccgag gcggatgtgc    11880
cgggtgcgct cggcggcggt ggcgaggaac agctcgggcg aaccgacggt cccccagccg    11940
gccgagtggt gttcacccac ccacagttcc tcgtagccga gccggtcgag ccactcggcg    12000
agttccagat cccgccacag gctcagggcg gggtcctcgc ccagcgggtg caggggcgac    12060
aagaaggctc cgaagctcat ccggtccatg gggctcctca ctcacggaag tcgtggcgct    12120
cgtgacggtc gtgccgagtc tgtcgccggg ggcccgggct ttcgcccccc gaacggaccg    12180
gtccttccac ggccccgaac accgtggccg aacgcggtgg ccggacgcgg cccgccgtac    12240
gggcaccccg gccgggcacc ccggccgggc accctccggc ggccctaccc gacacatgtt    12300
gccaatccaa catatgttgt ggaacgctga gcgtcatcgt tcgtgaccca ctgcacaccg    12360
gcaaccccgt gcgcggccgg ctcacgcgcc cctgtccgta cccgcgacaa gagaaagaga    12420
ccgacgtgac gacccagcag gaacggaccc cggcggagga gtccgaacgc atcggtcccg    12480
atctgtggtg gctcgccgcc atcatggcct tcggcagctt cgccgggctc ctcgacgcca    12540
ccatcaccaa tgtcgccatc ggtccgctgg cctcggcctt cgacgccgag atcgccaccg    12600
tgcagtgggt ggtgacgggc tatctgctgg ccatcaccgc cacgctcccg ctcggcgcct    12660
gggcgatggc ccggttcggg gcccgcgaga cactgctctt ctcccaggcg gtgttcctcc    12720
tcggttccct gctctcgggg ctggcctggg acgcccccag cctgatcggc ttccgggtgc    12780
tccagggcat cggcggcggc ctcgccctcc ccgtcggcca ggccctcatc gcccaggcgg    12840
ccgggccccg ccgcctcacc aagctgatgt ccctggtcac cgtgcccgcc ctgttcgccc    12900
cgctggtcgg cccctcgctc ggcggtgtgc tggtcgacca cgcgagctgg cggtggatct    12960
tcctgatcaa cgtgccgttc tgcctggcca ccatcggcct gatcctgtgg cgggtgcgca    13020
acgtcatcgc cccgacgaag gacgccgtcc tggacaccct cggcctggtg ctgctcgttc    13080
ccgccctcgc cgggctgatc tacgggttct ccgaggccgg cgcggccggc gggttcaccg    13140
ggacgcgcgc cctcgcgggc ctgggcgccg gggtcgtgct cggcaccgcc ttcgtcgcgc    13200
acgccctgcg ccggcgcagc gaggccgtcc tcgacctgcg gctgttccgc gtacgggact    13260
tcgcggccgg gaacctggcc agcatggtca tggccgtcgc gatgtacggc gtcctcatcc    13320
cgctcccgct gtacttccag gtcgtccagg gcaccagcgt gctggagtcc gccctgatgc    13380
tgctccccca gagcctcggc tacctcgtcg cggtgtccct gctgcagcgg ctgaccgtgg    13440
ccctcggcgt gcgcaccgtc accctggccg gtgtcgtcct cgtcggcgtg ggcacgctgc    13500
cctacgtcgt catcgacgcc gatccgagcc gcttcctgct gggcgcggcg ctggtggtgc    13560
ggggtctggg gctcggcgcc tcgatgatgc cgacgatgac ggccgccttc agcagcgtgc    13620
ccaaggaggt ggtgccccgc gccaccagtg ccttccacgt cttccagcgc atcggtgcct    13680
cgctgggcac ggccgtgctc acggtggtgc tccagaacga ggccctgcgt catctgcccg    13740
aggaggtgcc gggcctggcc gccgtcgcgc ccggcagtgc cgtcgcccac gggctggcct    13800
cgtccttccg ggcgccgttc tggtgggcgc tggccttcac ggcgctcgcg ctggtgccgg    13860
ccttcttcct gccgggccgc cgcccggcct ccgctgccga cgaggccgac ggggccgcgg    13920
cgcgtccggg gacggcaccc gtgctgtccg agtagccgcc ggtcccgtcg cacccgtcgg    13980
ctccggctcc gcggagcccc gggccacggc aacccccgcg gttcctccgc atcacccctc    14040
acgcgccccg cgcggacgac gcagcacgcg tcctccgcgc ggggcgcctc gcgtgcacgc    14100
ccggcaccgg accgcctcac ggctccgcct cccccaccgc cctgcccgac cgggccccct    14160
cgcgctgcct gtccggccac ctcctcgggc gtgctcccgt tgcccctgcc ggagggccac    14220
cccgttcgag gattccgcgc ccggcccgcc cgccacagac tcggatcacc aacagccgac    14280
gcctgtgcgg gcggacaggg ggaatggacg atggtggcac tcgacaccgg ggcggcggtc    14340
cgcctggccc ggttgtcacg gcaccgggac ggacgcttcc tcttcgtgcc catggaccac    14400
tcggtggccg acgggccgat cgttccggcc tcgcgcttca acgacctggt cgcctccgtg    14460
gtcgcgggcg gcgccgacgc gatcgtggtg cacaagggcc gggcccgcac ggtcgacccg    14520
gccctgctgc gcgactgcgc gctgatcgtg cacctgagcg ccagtacccc gcactccccc    14580
gacgccgacg ccaaggtgct ggtcggcgcg gtggaggagg cggtgcgtct cggcgccgac    14640
gcggtcagcg tgcacgtgaa catgggctcc gacaccgagg cccgccagct cgccgacctc    14700
ggcacggtgg ccgaggcctg ccagcagtgg tcggtgccgc tgctggccat ggtctacccg    14760
cgcgggcccc ggatcgccga cccgcacgac ccggcgctcc tcgcccacgc ggtcaacgtg    14820
gcggccgacc tgggcgccac gctggtgaag accacctcac cgctgcccct gtcggagctg    14880
tccgcggtca ccgcgagctg cccgatcccg gtcctggtgg ccggcggcgg cgaccaggac    14940
ggtgacctca ccgccttcgc caccgccgcc gtggagtcgg ggtgcgcggg actggccgtc    15000
ggccgccggg tgtttctcag cccctccccg accgccgccc tcaaggccct ggcctccgtg    15060
gtgcacgccg acccgccggt ggggccactc ggcgtcgacg ccgccgtctg acgtcccgtc    15120
tcccggcgga aaccgcagcc cacccgcgtc ggaaggaaga cacatgcgcg acgagatccg    15180
cgagttcgtc ctcaccacca tccgtgaggt gatgaacctg ccgctgtccg agaacgtcac    15240
ggacgacacc ccgctcggcg agaacggcct cggcctggaa tcgctgtccc ggctggaact    15300
catgatccag ctcgagagcg cctacggcat cgaggtcccc gaggcggaca gcgacgccca    15360
gcaggacgcg accctcggcg agttcgtgga cgccgtggtg gccctgcgcg gcacggcggt    15420
cgccgacgga gccggccggt gacggacgac accgccctcg gcgcgctgct gcgcgactgc    15480
gggctgctga ccaccgactc cttcgacgac gacaccgaac tcgtcctcga ctcgctcacc    15540
ctcgtctggc tcgcccacct cctcgaggaa cagcacggca tcaccgtgtc cgtcgaggac    15600
gagaacggcc tggcctcctg cgcctcggtg cgggacctgc gccggttcct cgccgaggcg    15660
gcggagggca cccacacctc tgcggagatc cttcatggct catgacgtcg cgatcaccgg    15720
ccacggggtc ctcaccgcgt tcggcttcgg tgaacaggcc ctgctggacg gggtgttcgg    15780
gggccggccc ggcttcaccc cggtcacccg cttcgacccc acgccctacc gggccgggca    15840
tgccgccacc tacgagggcg agggccccga gatccccggg gtgccggtca aacccggggt    15900
gacaccggga cagttcgagg tcctggtcgc ctgcgccgcc gccgcgctgg agatggccgg    15960
cacggacggc gccggcgccc cggtgctgct cggcaccaac ggcgaccact ccgccgcccc    16020
ggacttctgg tcgggcaccg gcgcgcgcac cgccgccgac ccccgcaccc tcgacagcct    16080
ccccgcccgc ctgcccgagc tgctcgcccg cgaactgggt ctgggggcgc cccggacggc    16140
cttcgtgaac gcctgcgtgg ccggcaccaa cgccctcgcc cggggcgcgg aactgatccg    16200
ccgcggcctc gccgacacgg tggtgtgcgg gggcgcctac ctggtcaccg aggacgtgtt    16260
cgccaagttc gactccgggc gtgcgctgtc ccccgaggac gccgtgcgcc ccttcgacgc    16320
cggccgccag gggctgctgc acggcgacgg ggtcgccgtc ctggtgctgg aggccgccga    16380
ccgggcacgg gcccgcggcg cccgcgtcct cgccgggctc accggctggg gcatggcggc    16440
cgacgcccac cacgtcatcc agccgcatcc gcggggggac ggactggccc gggcggcccg    16500
cgccgcgctg cgccgggcgg gcgcggagcc cgggcggatc ggctacgtca acgcgcacgg    16560
caccggcacc ccgctcaacg acgtggcgga gaccgcggcg ctgcaccagg tgttcggcga    16620
gggcgtccac ggcgttccgg tgagctccac caagagcagc accggtcaca tgctcgaggc    16680
caccggggcg gtggaggccg tcatcacgat gctcgccctg cgcgagggcc tgttgccgcc    16740
caccctcggc accctggagc ccgaccccgc gtgcgacctg gaccacgtgc gggacaccgc    16800
ccggccggcc cggatcaccc acgcgctgtc cctgaacgcc gccttcggcg gggtggacgc    16860
cgcactcgta ctggaggcgc cgtgaccgtc ccggacaccc acccgcgcac ccatcggacg    16920
gcaggcccgt ccgccccggc gcgcgccctc ctctcggcgg cctgccgcac cccctggggc    16980
ggcgcggcga ccgggctgcc cggcgcggca ccggtcgaac tgccccgcgt caccggcttc    17040
gtgacctccc gcttcagccc cctcgtgcac agcgtggcca ccgagtgcct gggcgcgccc    17100
ggctccgcgg acgacctcgt cggcgcggcc gggccgcgta ccgggacggt cctggccacg    17160
atgttcgggg acacggtgac gctggacacg gccacccggc ggctgaccga gggccaggtg    17220
cacagcccgc tgctgttctt ccagtccgtc accacctcga tcctcggccg gctgggccag    17280
tcgtacggca tcaccggccc cgtcgagtgc ctctcggtcg cccgcgacgg agccggcgag    17340
gccctctcgg ccgccgatct gatgctggag caggaggaca tcgaccgcgt gctgctggtc    17400
ggcgtcgagc tcgccgccaa tgagcgggcc acctggatcc accggcgcat caccgggccg    17460
gacggtccgg acccgctgcc cgacggggac tgcgccgtcg ccctgctgct cgcccgcacg    17520
gacgagggca ccgggcgggt gctcctgcgc gccggcgcgg ggagcggttc cccggcggac    17580
cgggccccgg cggacgcccg ccactcccgc ttcggctggc tggcgcccct ggtggcggcc    17640
gccgaggccg tgcgcccgcc ggagggcggg cccgtgccgc gcccggtccg tgtgccgggc    17700
cggtacggct acgtggtcgc cccggcggac cgggccgcgg cgcccgccgc tccgggaggt    17760
ccggcatgac ggccgccgaa tccgcccccg gcacgctggt ggcgcgcatg ggcatcgaga    17820
tcgtcgagga ggacccccgg cggctcgtcg cccggatgcc cctgacgggg aaccgccaga    17880
tgtacggctt cctgcacgga ggggccagcg cggccttcgc gcaggcgctc gccacgcacg    17940
ccgccgccct ggaggccggc cccggcggcc gggtcaccgg ccaggagctg tcctgcaccc    18000
accaccgggc ggcccgcggc gagggctggg tggaaggggt gtgcaccccg ctgtacctcg    18060
gcgacgcgtt cggcacctac gacgtggccg tccacgaccg gcgcggcaac cggatcgcct    18120
cggcccggct cacctgccgg ctgcggcggg ccgccggccc gtccgctcgc cccgcgccca    18180
ccggggagtc cgcactttcc agggagcccg cactttccga ggagtccgca tgagcacgac    18240
cgagcccgtg gaggacaggg ccgcggtact ggccggcgtc gggggctggg tgcccccgca    18300
cgtcgtcacc aacgacgacc tctccgccca tctcgacacc tccgacgaat ggatccgcac    18360
ccgcaccggc atccggacca ggcaccgggt ctcccccggc atggccacct ccgacctcgc    18420
ggtggaggcc ggacggcggg cgctggactc ctccggcgac gaccgggccg gggccgtcgt    18480
cctggccacc acgacacccg accggatctg cccggccacc gcccccgacg tggccgcccg    18540
gctcggcctg gccggggtcc ccgccttcga cgtctccgcc gtgtgcaccg gcttcctgta    18600
cgggctggcg accgcggcgg ggctgatcgc caccggcgtc gccgaacgcg tcctgctcat    18660
cggggcggac gcgttcacca ccatcgtcga cccgacggac cgctcgaccg ccgtcatctt    18720
cgccgacggc gcgggggccg tcgtcctgcg ggccggccgg ccggaggagc ccggcgcgct    18780
cggcccggtg gtgctgggca ccgacgggac cctcagccat ctgatccggg taccggcggg    18840
cggctcgcgg cagcgctcgc tggcccccac gcacgcgccg ggcgagcagt tcttccagat    18900
ggagggccgg gacacgttcc ggcacgccgt ggaccggatg gcgaccgcct cgcgccaggc    18960
cgtcgcggcc gcgggctggt cgatgggggg cgtcgaccgg ctggccgcgc accaggccaa    19020
cgcgcggatc ctgcacgcgg tggccgaccg gctcggcatc cccgccgagc accagctctc    19080
caacatcgcc gaggtcggca acacgggcgc cgcctccatc ccgctgctgc tggcccagtc    19140
cgccgcggac ggcggcctgg aggccgggca ccgcaccctg ctcaccgcct tcggcggcgg    19200
tctcgcctgg ggcgcgacca cgctcacctg gcccaagctg tcggccggct gagagcgccg    19260
gccgccccgc gccacgccat ccacctcccc cacggagact cgtacccaag gagacgaccc    19320
gaccatgttc acagcactgc gtgacatcct cgtcggcccg ttcaaggtcg atccggagaa    19380
ggtcaccccc gaggcgaccc tggagcagct cggcctcgac tcgctgtccg tcgtcgaact    19440
ctcgctgatc ctggagaagg acctcggagt gagcgtcacc gacgacgagt tgctgcagac    19500
cccgacgatc ggcgccatgg ccgagctgat cggcgagcgc ggcgccccgg tctgatgccc    19560
acctcgacga gcccgagcgg ccatgccccc gcggtccggc gggaggcgag cgacggcgag    19620
gcctaccgcc gcgcgatggg acggttcccc accggggtcg ccatcctgac gcaggggtgc    19680
ggaccgctga cccgggcggt gaccgtcaac tcggtcacct ccgtgtccct ggacccgcaa    19740
ctgctgtcgg tctgcctcgg cgaggacagc acggtcctcg aaccgctgct gcgggccggg    19800
cacttcaccg tgaacctgct gtccagcgcg caacgcgagt cctgcgcgcg cttcgccggc    19860
cggagccggc cgaccggggc cgacgcccac gaggaactcg gcgggagccg gggggacaac    19920
ggctgcctgg tcgtcgaggg cgcgctggcc gccctggagt gccgggtcga cggcacggta    19980
cgggccggcg accacgtcat cgtcctgggc cgggtcgaga cgctgcacca cggtccggcc    20040
gaggcggagc cgctggtctt ctacggcggc ggctaccgct ggctggcccc gcccgccccc    20100
ggcccgcgct gacccggaca ctcccgcccg tcccccacca cgccaccagg cacggcgccc    20160
cccgcacacc ggcacacctg cccgtgcgcc gcacggcacg ccgcccgaca cgaaggagcc    20220
atcatgtccg accacccgag gaccgccgag gcacagccgt gcggcgtggg catcagggcc    20280
atcggccagt acctgcccga gcgggtcgtc accaacgccg acctggagcg gatgatcgac    20340
accagcgccg agtggatcac cgagaagatc ggcatccact cccggcggtt cgcggcggag    20400
agcgacacca ccgccacgat gggcgcgagc gcgctcctcg acgcgtgcac ccgctccggc    20460
gtcgacccgg actctatcga cctggtgatc tgcggcaccg tcacccccga cctcatggcg    20520
ccggccaccg cggtgtccgt catgcggcac gcggggctga cccaggccgt ggccttcgac    20580
gtgaacagcg gcggctgcgc cggttccgtc ttcgcgctcg acgtggccgc caagtacgtg    20640
cgctccggcg cctaccgcag ggtcgccgtg gtgctcgccg acaccgtcac caagctgctg    20700
gacccgaccg accggatgac cgcggtcatc ttcggcgacg ccgcggcctg ctatctcgtc    20760
gagccggtgg tgcccggcag cggcgtcacc accaccgtgc tgagcaacga cccgagcggc    20820
taccactcgg cgctggtctc ccgggacccg gtcaccgacg ccgagggcaa ggaggtccac    20880
tccgccttcg ggcagaactt catccgcatc gtcgggcgcg acatccgcaa cttcgccctg    20940
gagaacatcc cgggcttcgt ccgcaagctg gcggaggagg agaacctcac tccggaggac    21000
ctcgacatgg tggtgctcca ccaggccaac cggcgcatcg tcgaggggat catggacgcc    21060
ctgcgcctgc cgtacgagcg gacgtccatc aacgtggacc gcttcggcaa cacctcggcc    21120
gccggttccg tgctcgccct gcgcgaggcg gtggacgacg gccggatcac cgccggcgac    21180
cgggtggtgctggtc tcctt cggggccggg ctgagcgtgg gcggcgcgct gatgcgctgg    21240
aacgccccgc aggacttcct cgccgccccg tgaggaacag cgcgaggaat cccgtgcgga    21300
gccaggagcc gaccgtcgcg gagacacccg cgcggacccg tgccggggcc ccggtcgtgc    21360
cgcccgggct gccgatccgg ctcggttcgc tggacccggc cgaactggtc accagcaccc    21420
tcggcgtgcg gatcaccgag tggcgcaccg gccggctcgt cggcaccctg cccctcgcgg    21480
gcaaccgcga ccggtacggg cggctcgacg gggccgccct ggccgtcctg gccgagacgc    21540
tcggctcggt cgccgccgcg ctcgacctcg gggagggcgg catcgtgctg ggccaggaac    21600
tgtccctggc gcaccacgag gaggtcaccg gggaggggag cgtcaccggg gtctgcaccc    21660
ctctgcaccg cggcgaggac gtcgccacct acgaggtcca cgtcaccgac acgcacgccc    21720
gccgggtgtg cacggcccgc ctcacctgca ccctgcgccg caccgcgcgc cccccggccc    21780
gccccgccgg cccgcctgga ccggccggcc ccgtcaccga aacccccgcg cccaccggca    21840
ggaaggtctg aaccgccatg cagtctcacc ggccgccacg ggacccgtac tgggaccgga    21900
tcggctatca cggcccgctg gagccgaccc tcgacgtgct gcgcgagatc tgccgcaagc    21960
acgtcctgga ggtgcccttc gaggccctgg aggggcccga gggcatccgt ccggtcatcg    22020
accgggcggg cgtctacgac aagatcgtga cccggcacgg cggcggcttc tgcctccagg    22080
ccaacgggct gctctctcac cacctgcggg agatcggctt cgacgtgacc gtgctggccg    22140
cgcacatctg ggtcccgcac cgcgagtact tcagcaaggg cggcgaccac ctgatcatgc    22200
tggtccggct ggacggcagg gagtggctgg tggacgccag ctacacccac ctcgtctacg    22260
tcgaccccat cgagctggtc cccggcgagc agcgccagga cggctgggtg taccgcgtgc    22320
gggccgagga cggctggtac gtggtccagc gccggggcga gcgggagtgg ctgccgctct    22380
accggttcgt gccggaggcg cacacggtgg aggacttcga ggagtcggtc gccttccacc    22440
tcgacgggga gaccgtctcg gagaccaccc gcacgctgat gtgctcgcgt ggcatccgcg    22500
gcggcaaggt ctccctggtc aacaacgtgc tcacgatcgc cgagcacggc acggtgacca    22560
cccgtcaggt gcgcgacgcg cgggactgcg cgcagatcat ggcgcgcatc ttccgcggtc    22620
accggggtct cgccgagcgg ggcctgcgca tctgggagcg gatgcgggag gaacgcgagg    22680
ccgccgggtc ggcgccgcgg cccacggccg cgcagggcgc ctgactcccg caccggacaa    22740
cgacggagga cgtctgatga cgatcgacag cagcacaccc gtcgccgtgg tgggggcggg    22800
cgtcatgggc gcggggctgg cccaggtcgc cgccgccgcg ggacacgagg tggtgctcca    22860
cagccggcgg gaggccaccc tgcgccgggc cctcgccggc atcggcgcct ccctggaacg    22920
ggcggccgcg cgcggcgggg gcgcgcgggc ggaggatccc ggcacgacgc tcgcccggat    22980
ccgcaccacg acggacctgg gggacgtcgc cggctgcgcg gtcgccgtgg agtcggtcgc    23040
cgaggacgtc gacctgaagc ggcgcgtctt cgccgagctg gaccggctct gcccgccggg    23100
cgccctgctg gccaccaaca cctccggcat tcccgtcacc gagatcgccg cggccaccgg    23160
ccggccgggc tccgtcgtgg gcacgcactt cttctcaccc gtgccgcgca tggagctgtg    23220
cgagatcgtg cggggccggg agaccaccga cgccaccgtc gccgcggcgc gctccttcgc    23280
cgaggggatc ggcaagagct gcgtggtggt ggagaaggac ctgcccggtt tcgtcaccac    23340
ccgtctgatc atcgccttcg tcctggaggc ggtccgcctg gtggagacgg gcatctgccg    23400
ggccgaggac gtggaccgtg cctgccgtct cgccttcggg cacgcgatgg gaccgctggc    23460
caccgccgac caggccgggc tcgacgtgct gcgcgaggtc gccgccgggc tggccaagga    23520
gtacacccac ccggtcttcg ccacccccgg cctgctggac cggctggtcg cggagggccg    23580
gcacggccgc aagaccgggc gcggcttcca cgtctacgac gacaccaccc ccgcgcccac    23640
ccgcccctga ccccgatccc ccagctcccg actcccgact cccgactccc atttttcagc    23700
tttcagtttt cagctccgct tcacaccacc accggaaggt tctcccgtga agttcgcctg    23760
gatcgacctg cgttccaccc acgacgacct gcgtgccggc gtggtcgacg ccgccgtcca    23820
cgcccgcctc gaaggagtgc tcgacgaccg gctcgaggtt ctgcgcaccc tgccgcccac    23880
cgtcaccaag gtcctgctcc ccgcgcccgg cgacccgctg cccgccgagg ccgccgacgt    23940
cgccgacatc gtgctgaccc gggtcggcac cgccgccgag ctcgacaagc tcaagctgga    24000
gagcgagagc gacccggccc gcacggccgc gttcgtggag gtcgtcgacg acgccaccct    24060
caaggtcgcc tgcgaggcgg cccgggcgct gcccaacacg ctcgtgaagt tccgcgaccc    24120
gaccaagatc ccgctggaga tcgtgatcgc cgccgccgac cacagcccgg gccggctcat    24180
ctgcgaggcc ggcgacctgg aggaggcggg catcgtcgtc gacgtcctgg agaagggctc    24240
cgacgggctg ctcctggcgc ccaaggacgc caatgacgtg ttcggtctga ccgggctgct    24300
ccgcggcagc agccccgatc tgtcgctcac caccctcacc gtgcggtcca tcgagcacaa    24360
cggcctgggc gaccgggtgt gcgtcgacac ctgctcgcac ttcgggcagg acgagggcat    24420
cctcgtcggc tcgtacgcgc acgggttcgt cctgtgcgtc agcgagaccc acccgctgcc    24480
gtacatgccc acgcgtccct tccgggtcaa cgccggcgcc ctgcactcct acgtcctggg    24540
cgaggacaac cgcaccaact acctcagcga gctccaggcg ggcagcacgg tgctcggtgt    24600
caccacggag ggcaagaccc gccggatcgt ggtgggccgg gtcaagctgg agtcccgccc    24660
catgctgacc atccgggcgg tgtcggagtc cggtacggag gtcagcctca ccgtccagga    24720
cgactggcac gtacgggtgc tgggcccggg ggccgccgtc ctgaacgtca ccgaactgaa    24780
ggccggggac cagctcctcg gctacctggc cgacgacaag cgccatgtgg gctggccggt    24840
cggcgagttc tgcatcgaga agtagcccgg agaacggtcg cggcggagac gggtccgccc    24900
cgtctccgcc ggcccggccc ggccccgccc ggccccgcgc ccggcacacg cgcgctcgcg    24960
cacttcgcgc acacggaagg aaaggatgcg atggctgtgg actcggccgc cccggacttc    25020
gggcgatggc tcgacacggc gctcaccggc gacgacctgg acgaggaggt ctgggggcat    25080
gccggacggg cgatgtcctt cggccggatg cggaaggaga cggcccgcac gcgggaggtc    25140
ctggcggccc acggcatcgg ccccgacagc accgtcgccg tccagctcct gcccagcttc    25200
accctgctgt ggacggtgtt cgccgcctgg tcggcgggcg cccaggtgat gctgatggac    25260
ccccggctca cccccgcgga gaccacccgg ctgctggacc tgtgcgaacc gcagttccac    25320
ctcgccgtcg agggaccggt gccgctgtcg gcgccgttcc gcgaggagtg cgagatcgtg    25380
gtcctgcccc gccgctcggg ccggcccgcg cagagtgccc accgcctggt gcagttcagc    25440
tcgggctcca ccggcctgcc caaggtcatc gggcgcaccg ggcggtcgct gctcgacgaa    25500
ctggagcgtt tcgcccggct gcccgacatg ccccggcacg gtgaacgcct gctcctgctc    25560
agctcgatgg cgtactcctt cgggctcatc gggggcgtgc tgcacagcct gcggaccggc    25620
gtctcgctgc acttcagcgg cagtacccag ccgcgcgagc tgctgcggct gctcgcggag    25680
cgggagatcc acgcgctgtt cggggtgccg gtccacttcg acctgctgag ccgggtcggc    25740
cgccccggcg gcctgccgtc cctgcggctc gcggtgtccg gcggggaacc gctgcggccc    25800
gaggtcttca cgcgcttcga ggaggccttc ggtgtacgga tcgggcaggc ctacggcatg    25860
acggaggcgg gcatcatcgc caccgacctg accggccggg ccgcgccgcc ggccgtgggc    25920
acccccgccc ccggcatgcg gaccgaggtg gcggacggca ccctgcgggt gcggctcccc    25980
gaggatccgt atctgcacgc ggaccggtcc gggcgctacg cggacggctg gctcgacacc    26040
cacgaccgct gccgggtccg gccggaggac ggggtcctgg agatcctcgg ccggaacgac    26100
tcgacggtga tgatcggcgg cctcaacgtc gacctcaccg aggtcgagtc ggtggtgctg    26160
gcacatccgt cggtgacgga cgcggtggtg gtgtacggcg aggcgatcga ggcccatctc    26220
gtcgccgaac cgacgctggc caagggtgag ttgctggcct ggtgccgaga gcggctgagc    26280
ccgcacaagc tgcccaaggc gctgcacttc gtgcggaagc tgccgcgcac cgcgaacggg    26340
aagacggtcc gcaaccgcga gctgctgcac gcgagccggg agcgggaacg gcaggtgatc    26400
atccggtgat cgacccctcg tacgcgggca cccgccatcc gcgcttcgac gccgaggtcg    26460
agcgcggccg gctgcgatcc ttcgccgccg cggtgggtct ggacgaggcc gtcttccacg    26520
acgtcgacgc ggcgcgtgcg gccggccatc cggacctgcc cgtcccgccc accttcctgt    26580
tcggcctgga actggagcat tcgcaggaca cactcgccgc gatgggagtc gagatggcgc    26640
gggtcctcca catcgagcag ggcttcgtct accactcgac ggcgcacgcc ggtgaccggc    26700
tcaccttcgc gccggtcctc gtgtccgtcc gcgctcaccg gggagcacgt ctgcagctcc    26760
tcgccacgga gacggccgtc acccggcggg acggcacccc ggtggccgac ctccgccagg    26820
tcctcgcggt ccgcgaggac cccgccgcgc gggatgcgcg gagcacgggg gctgcctcgt    26880
gagggtggac ccggccggcc tcgccgtcgg caccgaactg cccgagctgg tgccaccgcc    26940
cgtgacccgg gcgatgctcg ccctgtacgc cggggcctcg ggcgaccaca acccgatcca    27000
catcgactcg gacgcggcgg tggccgccgg gctcgaggac gtcatcgccc acggcatgct    27060
ctcgatggcg ttcctgggcc gcatgctcac cgcccgggtg cccgtggagg acctggtgtc    27120
cttccgggtg accttccgcg cgccgacccc ggtgcacgcc aggccgcgct gcaccgcccg    27180
ggtcgtctcc gtcgatccgc ccgccgacgg gagcgacggt ccccgcacgg cacggctcga    27240
cctcaccgta cggctggagg acggccccgt gaccgtgcgc ggcgaagcgg tcgtacgcct    27300
gcgggacacc ggtgcggtcc ccgctccgcc ccactgatcg aggaggctcg acgatggcac    27360
gatccgtgct ggtcacggga ggcaaccgcg gcatcggccg cgccgtcgcc caggcgttcg    27420
cccgccaggg cgaccgggtg gcggtcaccc accggggttc cggggcgccc cccgggatgc    27480
tgggcgtcaa gtgcgacgtc accgacgccg cccaggtgga cgccgcgttc gcggaggccg    27540
aggccgccca cggcccggtg gaggtgctgg tgtccaacgc cggcatcacc gacgacgcgc    27600
tgctgctgcg gatgccggag gagcggttcg cccgggtgct ggacaccaac ctcgccggcg    27660
cctaccgggt ggtgcggcgc gcggtgcccg gcatgctgcg gatgcggcgc ggccggatcg    27720
tgctgatgtc ctcggtgtcc gggctgtccg gtgccgtcgg ccaggccaac tacgcggcga    27780
gcaaggcggg catggtgggc atggcgaggt cgctggcccg ggagctgggc gggcgcggga    27840
tcaccgtgaa cgtggtcgcc ccggggctgg tcctgacgga catggccgag accgtctccg    27900
ccgcccgcaa ggagcagatg ctcgccgggg tgccgctcgg gcggcacgcc gagcccgagg    27960
acgtggcggg gccggtgcgc tggctcgcct cggaggaggc cgggtacatc accggggccg    28020
tgctgcccgt cgacggcggc ctgggcatgg ggcactgacg tggtcggcga cgcgcggcgc    28080
gcggcggaca cggagcgggc cggcgggccg ggaggggagc actgatgcgg atcgcgatgg    28140
cactgccgta cgcggggagc ggcttccggg agacggcggc ccggctggtg gactacgagc    28200
gggccgggct ggaccgggtc accgtccggg aggcctacgg ctgggacgcg gtcagtcagt    28260
tggggtatct ggcggcggtc accgtacgtg tggagctcgc ctccggcgtc ctgccgctgc    28320
ccacccgcac gcccgcgctg ctggcgatga cggcggccgg cctcgaccac gtgtccggcg    28380
gccggttcgt gctcgggctg ggtgtgtcgg gaccgcaggt ggtcgagggt ttccacgggg    28440
tgccggccga cgcgccgctg gcccggaccc gcgcggtggt cggcatctgc cggaccgtgt    28500
ggcggcgcga gccgttgacg taccgggacc ggcactatcg catcccgctg accgccgagg    28560
acggcggaac ggggctgggc aagccgctga agctgatcaa ccggcccgag cgcgaccgga    28620
tcccgatcgt gctggccgcg atggggccgc gcagcgtcgc cctggccgcc gagatcgccg    28680
agggctggga gccgatctgg ttccaccccg agcgggccgg gcaggtgtgg ggcggggcgc    28740
tggccgaggg cgccgcgcga cgcgctcccg cgctgggcgc gctcgacgtc gtcgccccgg    28800
tgcacctggc gatcggcgcg gccgaggagt cgcgtgccct ggcggcggtc cgcgccgaca    28860
tggccctgta cgcgggcggc atgggcgccc gcggccgcaa cttctaccac gacctcatgt    28920
gccgcttcgg atacccggag gaggccgggc gcgtgcagga gctgtatctc gccggacgtc    28980
ggcaggaggc cgccgaggcc gtcccggagg aactggcgcg ggcggtctcc ctggtgggca    29040
ccgaggacgt ggtgcgcaag cgggtggccg cgttccgcga ggccggcgtc accacactga    29100
gcgtcgtccc cacggccgcc acccatgccg cccgggtgga cgcggtgggg cggctgaggg    29160
atctggccgg ccccttcggc tgacggaggc ggaagcggac ggcgaacgcg gaagcggaag    29220
cgggctcggg cgcccggccg ccgacggcgg ggagcccagc ctcctgcccg gccgcccccg    29280
gccccgtccg ccgcgcacct gccccacccg gcccgcgcgg tactgaacgc gggcgtacgg    29340
gcgcacgtat ggagggacgg cgcccgacga ccggggcgct ccgtacggtg gtggcccgcc    29400
ggcggtgttc agcggttcgg gagccctgca tgaggcacgt acgacgacgg atcgtccgac    29460
gcgggatacg gctgtcggcc gtcggcggga ttctcctggg gggcctgatg gtcacccagg    29520
ccatggccac cgagccggcc ggcggcacac cggcgcccgg cgcgcacgcc gccggttcct    29580
ccgtcgagtc ggccgccgcg cggggcgccg ggctcgtctc ccggctcggc accgggcgca    29640
ccgccggcac ctggatcggc gccgacggcc gccccgtggt cgccgtgacc gacgcggggg    29700
cggccgggac ggtgcgggag gccggggccc gcgccgaggt ggtgcggcac agcatggacg    29760
agttgaggtc cgccacgaag agcctgcgca cggcgccccg ggtcacgggc accgcctggt    29820
ccgtggacta cacccgcaac gaggtcgtgg tacgggcgga ccccaccgtc tccgccggtg    29880
actggtcgcg gctgacgcga ctcgccgatt ccctgggcgg cagggtgcgg atggagcgca    29940
cgaagaccga gttcaccacc aggctgaacg gggcgcagcc catgttctcc accggcggcc    30000
gctgttcggc cgggtacaac gtgaccgacg ggcagggttc cttcatcctc accgccggtc    30060
actgcgggcc caagggcgcg gtgtggttcg ccgaccaggg gggcgcgacc gagctcggcc    30120
agacggtgtc ctcccgcttc cccggcaacg acttctcgct catccggtac ggcaacgggc    30180
agtcggccgg ggcggacacc aacgtgatcg cgatcggcgg cggcaagggc gtgcgcatcg    30240
cgggggcggg agacgcggcg gtgggccagc gggtgttccg cagcggcagc acgagcgggc    30300
tgcgcgacgg caaggtgacc gggctggacg cgacggtcaa ctaccccgag gggacggtga    30360
ccgggctcat cgagacggac gtgtgcgccg aaccgggtga cagcgggggg ccgttgttct    30420
ccgacgggct cgcgctgggg gtcacctcgg gcggcagcgg ggactgcgag agcgggggga    30480
cgacgttctt ccagccgctc cggacggcga tgagcgcgct gggcgtgcgg ctggcggggg    30540
acggctcggg cgggaaaccg tcctcggcgg cggccggtgc gccggagccc tcggcctccg    30600
cctcccaggg agcggtgatc gcccccgggt cggcgaaccc cggcgcggtc gagcaggtcg    30660
gtgcgggggc ggccccctcg ctcgccgccc ggctcaccga tccggggacg gtgggcccgg    30720
ggctgctggt cctcgcgggg agcatggtgg cgtgggtggc ggcgcggtac atccgctcgg    30780
agcgggaccg ggaggcctac cgcaggcagt acgcccgcag ctggagctga               30830
(a)序列特征
●长度:30830
●类型:碱基序列
●链型:单链
●拓扑结构:线性
(b)分子类型:双链DNA
(c)假设:否
(d)反义:否
(e)最初来源:海洋链霉菌Streptomyces griseoaurantiacus M045
(f)特异性名称:DNA
以下结合具体实施例,对本发明作进一步说明。
1、海洋链霉菌M045基因组DNA的提取
从斜面保存的链霉菌M045菌落上,用接种环刮下孢子,划线接种于M2 +固体培养基上,28℃恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0.5cm2琼脂块,接种于250mL液体M2 +培养基中,28℃恒温振荡培养3-4天。收获培养液,8000rpm、4℃离心10min,弃去上清液,沉淀用50mL灭菌的双蒸水重悬。
进行海洋链霉菌M045基因组DNA抽提:取20mL混悬的菌液,分装于10个2mL的离心管,12000rpm、4℃离心10min;弃去上清,沉淀用1mL灭菌双蒸水重悬,12000rpm、4℃离心10min;弃去上清,沉淀用1mLTE缓冲液重悬,12000rpm、4℃离心10min;重复洗涤一次;沉淀的菌体用1.5mL的TE重悬,制成菌体混悬液,加入50mg/mL的溶菌酶200μL,37℃水浴过夜;加入10mg/mL的蛋白酶K 20μL,37℃水浴2hr;然后加入20%的SDS至浓度为2%,60℃水浴30min;12000rpm、4℃离心15min,取上清,每一管上清分装于两个1.5mL离心管中,分别加入每管上清液体积的1/2体积的Tri s饱和酚,每管上清液体积的1/2体积的氯仿∶异戊醇(其中氯仿和异戊醇按体积比为24∶1混合),缓慢摇动5min,12000rpm、4℃离心15min;取上清,加入与上清液等体积的氯仿∶异戊醇(其中氯仿和异戊醇按体积比为24∶1混合),缓慢摇动5min,12000rpm、4℃离心15min;重复抽提一次;取上清,加入上清液1/10体积的5mol/L醋酸钾,缓慢混匀,然后加入上清液2倍体积的无水乙醇(-20℃预冷),缓慢摇动,至出现大量絮状沉淀;用枪头把絮状沉淀挑出,置于新的1.5mL离心管中,加入70%乙醇洗涤,12000rpm、4℃离心15min,弃去上清,并使沉淀中的乙醇挥干;将所获得的DNA沉淀用50μL ddH2O溶解,取5μL,用1%琼脂糖凝胶电泳检测,剩余样品置于-20℃保存。
上述海洋链霉菌M045,于2009年7月3日保藏于“中国生物菌种保藏管理委员会普通微生物中心”,其保藏登记号为:CGMCC 3161。
M2 +固体培养基为:麦芽提取物1g,葡萄糖0.4g,酵母提取物0.4g,琼脂粉1.8g,人工海水50mL,去离子水50mL。
M2 +液体培养基为:麦芽提取物1g,葡萄糖0.4g,酵母提取物0.4g,人工海水50mL,去离子水50mL。
2.海洋链霉菌M045全基因组shotgun测序
利用Roche 454 GS FLX第二代测序技术进行规模测序,获得的数据利用GS de novo Assembler Software进行拼接,最后获得海洋链霉菌M045的基因组草图。其为线性基因组,7,712,377bp,GC含量72.73%。该基因组中,预测得到6839个开放阅读框(ORFs),614个预测蛋白是其特有的,发现660个paralog蛋白家族,4416个预测蛋白可以归到COG数据库,预测234个蛋白属于分泌蛋白,1352个蛋白属于跨膜蛋白,106个蛋白是脂蛋白。
3.海洋链霉菌M045基因组fosmid文库构建和筛选
取链霉菌M045的大片段基因组DNA溶液200μL,按照每管10μL分别置于20个200μL的离心管中。然后用10μL的微量进样器(Agilent,10μL Syringe)反复吹打40次,以剪切DNA,获得40kb左右的DNA片段,然后按照EPICENTRE公司的CopyControlTM Fosmid Library Production Kit构建fosmid文库,库容为6万左右克隆。
中尼霉素和手霉素A具有2-氨基-3-羟基-2-环戊烯酮(2-amino-3-hydroxycyclo pent-2-enone)的C5N结构,它是由5-氨乙酰丙酸合成酶和5-氨乙酰丙酸辅酶A连接酶催化生成的,其中5-氨乙酰丙酸合成酶催化最关键的第一步反应。根据链霉菌M045基因组的序列,设计5-氨乙酰丙酸合成酶基因(chiD2)的引物ALAS1F(5’ATGAACCGACTCCTGGAC3’)和ALAS839R(5’AGCGAGGTGGTGAAGATGAAC3’)。以链霉菌M045的基因组DNA为模板,进行PCR扩增,反应程序为:94℃,5min;(94℃,50sec,55℃,50sec,72℃,1min)×30cycles;72℃,10min。扩增产物经测序,与基因组上的chiD2序列完全一致,ALAS1F/ALAS839R可以作为筛选引物进行fosmid文库的菌落PCR筛选。于是完成了192个fosmid克隆的菌液PCR筛选,获得2个有阳性扩增片段的克隆Fos0036B1和Fos0036E8。通过fosmid末端序列分析,对Fos0036E8进行完整fosmid的测序。
4、手霉素A和中尼霉素的生物合成基因簇分析
如图1所示,手霉素A和中尼霉素属于手霉素类化合物。手霉素A最早是从链霉菌Streptomyces parvulus Tü64分离得到的(Buzzetti etal.,1963),手霉素化合物被认为是一族新的抗生素,随后又分离得到有类似结构的化合物如asukamycin(
Figure BSA00000598841000181
1976;Kakinuma et al.,1979),U-62162(Slechta et al.,1982)和U-56407(Brodasky et al.,1983),丰富了此族抗生素,以上这些手霉素类化合物的核心结构是m-C7N结构。而中尼霉素是从海洋链霉菌中分离得到的(Li et al.,2005),中尼霉素中心芳香环结构是p-C7N结构单元,且有氯的取代,是第一个来自天然的para-C7N结构,同时在该海洋链霉菌中分离得到手霉素A。经序列分析,获得了海洋链霉菌M045染色体上30,830bp的连续区域,GC含量为74.48%,生物信息学分析包含了32个开放读码框(如图2):其中有两个序列很短,为未定功能蛋白chiU1/U2;chiA1/A2/A3三个功能基因编码的蛋白参与了核心C7N结构的合成和转运;chiB1/B2/B3/B4/B5/B6/B7/B8/B9参与了upper聚酮链的合成和延伸;chiC1/C2/C3/C4/C5C6/B7/B8/B9参与了lower聚酮链的合成和延伸;chiD1/D2/D3参与了C5N结构单元的合成和连接;chiE1/E2/E3/E4是合成过程中的氧化还原酶,其中chiE4可能催化了氯的取代和lower聚酮链的重排,从而使手霉素A转化为中尼霉素A;chiM1/M2是转运和分泌蛋白,用于药物的转运;chiR1/R2/R3是转录调控因子。
5、5-氨乙酰丙酸合成酶基因(chiD2)基因敲除载体的构建
目前在放线菌中已经建立了非常成熟的基因克隆和功能分析系统,其中最为常用的是基于同源交换的基因敲除和基因置换技术。质粒pHZ132具有硫链丝菌素抗性标记,携带链霉菌质粒pSG5的复制子,该复制子是一个温敏型复制子。pHZ132在30℃培养时具有良好的遗传及结构稳定性,而在37℃培养时质粒会丢失,因此pHZ132可以用来在放线菌中用于基因敲除实验研究。而载体pHZ132具有单一的BamH I酶切位点,因此把BamH I的酶切位点引入5-氨乙酰丙酸合成酶基因的扩增引物中(ChiD2F:5’ATCGGATCCATGAACCGACTCCTGGAC 3’;ChiD2R:5’CTA GGATCCAGCGAGGTGGTGAAGATGAAC 3’)。将带有BamH I酶切位点的chiD2基因和经过BamHI酶切的pHZ132线性载体,用T4Ligase(TaKaRa)进行连接,16℃连接过夜,然后利用氯化钙法转化E.Coli Top10感受态菌株,37℃培养过夜,获得大肠杆菌-链霉菌穿梭质粒pHZ132D2,如图3。
6、大肠杆菌-链霉菌间的接合转移
链霉菌M045单孢子悬液的制备:加2mL无菌水于链霉菌M045孢子生长丰富的M2 +固体培养基,用接种环轻轻刮下琼脂表面的孢子,并用无菌水清洗几次;将菌悬液用无菌吸管转入装有无菌玻璃珠的三角瓶内,在摇床上或手动摇动30min,尽可能用力破坏孢子链;然后将此孢子悬液倒在装有脱脂棉花的漏斗中进行过滤,以除去菌丝和不小心刮下的琼脂;5000rpm,4℃离心10min,去上清;用2×YT培养基(胰蛋白胨1g,酵母粉1g,氯化钠1g,dd H2O 100mL,pH7.0)洗涤两次,每次10mL,5000rpm,4℃离心10min;最后加入2.5mL 2×YT培养基重悬孢子液,制成1010cfu/mL的孢子悬液,立即用于接合转移或悬浮于20%的甘油溶液中,贮于-80℃冰箱中。
供体菌感受态细胞制备:将含有oriT的大肠杆菌-链霉菌穿梭质粒pHZ132D2转入大肠杆菌ET12567(pUZ8002)中,得到供体菌株ET12567(pUZ8002,pHZ132D2);挑单菌落接种于5mL LB培养基(加入作用浓度为25μg/mL卡那霉素和氯霉素以及50μg/mL氨苄青霉素)中,37℃培养过夜;将过夜培养的菌液按0.1%的比例接种到20mL新鲜的LB培养基(含有25μg/mL卡那霉素和氯霉素以及50μg/mL氨苄青霉素)中,37℃培养至OD600=0.4-0.6;5000rpm,4℃离心10min,沉淀菌体,用新鲜的LB培养基(不含抗生素)洗涤两次,目的是把原来培养液里的抗生素充分洗掉。最后将菌体悬浮于5mL LB培养基中,分装0.5mL于10个1.5mL离心管中,-80℃备用。
接合转移:将制备好的链霉菌M045单孢子悬液,50℃水浴热激活30min,37℃预萌发2.5hr,冷却至室温;将供体菌ET12567(pUZ8002,pHZ132D2)与链霉菌M045单孢子悬液各0.5mL于1.5mL离心管中混合,10000rpm离心10sec,弃去大部分上清;用管底残留的少量液体进行重悬,然后把悬浮液涂布于含有10mmol/L氯化镁的MS培养基(甘露醇2g,大豆蛋白胨2g,琼脂粉2g,dd H2O 50mL,海水50mL,天然pH值)上;28℃培养24hr,然后用1mL含硫链丝菌素(作用浓度25μg/mL)和萘啶酮酸(作用浓度50μg/mL)的水溶液覆盖。28℃继续培养大约20天至平板上长出链霉菌的灰白色孢子。
7、链霉菌M045突变株的分子检测
因为pHZ132D2是温敏性质粒,转入链霉菌M045后,通过添加抗生素,并在37℃培养,可以提高阳性转化子的筛选效率。在高温下培养,可以使游离质粒pHZ132D2上的链霉菌复制子失活不能自主复制,而只能通过与染色体上的同源片段进行交换,随着宿主基因组的复制而复制,由此就发生了基因中断。通过硫链丝菌素抗性基因(tsr)的PCR检测,野生菌株w完全没有扩增信号,转化株a,b,c有很强的扩增信号,同阳性对照的扩增片段大小一致(如图4),载体pHZ132D2已经成功导入a,b,c转化菌株内。用DIG DNA Labeling Kit(Roche)标记抗性基因tsr作为探针,进行突变株的Southern blot检测,突变株a,b,c具有阳性的杂交信号,野生菌株w没有阳性信号(如图5),可以认为载体pHZ132D2已经整合在链霉菌突变株的基因组上。
8、链霉菌M045突变株代谢产物的化学分析
从链霉菌M045及其突变株固体平板上,用接种环刮下孢子,划线接种于M2 +固体培养基上,37℃恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0.5cm2琼脂块,接种于250mL液体M2 +培养基中,37℃恒温振荡培养3-4天,将发酵液冷冻干燥,得到固体粉末。
用乙酸乙酯浸泡干燥后的固体粉末3-4次,在乙酸乙酯浸泡的过程中,用超声波清洗仪破碎,以利于代谢产物的溶出。把乙酸乙酯相用旋转蒸发仪浓缩蒸干,得到粗提物,称重,分别用氯仿∶甲醇(3∶2)溶液溶解,使浓度为10mg/mL,转移到小玻璃瓶中,4℃保存。
使用Agilent-1200液相色谱系统,检测代谢产物的变化,并利用岛津公司的LCMS-IT-TOF系统分析代谢产物的分子组成。色谱柱选择安捷伦Eclipse XDB-C18柱,250×4.6mm,5μm。检测波长为254nm,柱温25℃,流速1mL/min,流动相洗脱条件是:
Figure BSA00000598841000211
通过HPLC和LC-MS分析,链霉菌M045野生株代谢产物中,中尼霉素A、中尼霉素B和手霉素A的流出峰分别出现在18.4、19.5和21分钟,如图6所示。中尼霉素A的C7N上的两个羟基,很容易氧化为羰基形成中尼霉素B,这也是图6-w中尼霉素A的峰面积要小于中尼霉素B的原因。
链霉菌M045突变株a、b和c的代谢产物中,中尼霉素A和B的流出峰消失,手霉素A有很弱的峰,说明通过chiD2基因的失活,突变株不能再合成目的产物。突变株在6.3分钟出现新的流出峰,通过质谱分析,分子量为472.1889,其为中尼霉素A1(化合物4)的分子量,中尼霉素A结构上的C5N结构被羟基所替换形成中尼霉素A1,分子式为C26H31ClNO5。在10.7分钟的流出峰,通过质谱分析分子量为454.2439,是手霉素A1(化合物6)的分子量,同样C5N结构被羟基所替换,分子式为C26H32NO6。如图7所示化学结构。
通过分子检测分析,载体pHZ132D2已经整合到链霉菌M045基因组,5-氨乙酰丙酸合成酶(chiD2)基因被阻断,通关对代谢产物的化学分析,链霉菌M045突变株不能再合成C5N结构,而是进行中间产物中尼霉素A1和手霉素A1的积累。进一步证实了,中尼霉素和手霉素A结构中的C5N结构是通过5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的Shemin途径合成的,如图8。
9、手霉素类化合物的异源表达
从海洋链霉菌Streptomyces griseoaurantiacus M045的基因组fosmid文库中,筛选到含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,利用OMEGA Bio-Tek公司的E.Z.N.A.
Figure BSA00000598841000212
BAC/PAC DNA Kit提取含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,将该fosmid转化到天蓝色链霉菌、变铅青链霉菌(Streptomyces lividans)TK24、或含有Red重组系统的大肠杆菌中,从而可以使链霉菌或大肠杆菌产生手霉素A或中尼霉素;在转化后的宿主菌中,对基因簇的相关基因进行插入、置换或缺失,从而使宿主菌可以合成手霉素类化合物的结构类似物。
Figure ISA00000598841200011
Figure ISA00000598841200021
Figure ISA00000598841200031
Figure ISA00000598841200051
Figure ISA00000598841200061
Figure ISA00000598841200071
Figure ISA00000598841200091
Figure ISA00000598841200101
Figure ISA00000598841200111
Figure ISA00000598841200121
Figure ISA00000598841200131
Figure ISA00000598841200141
Figure ISA00000598841200151
Figure ISA00000598841200161
Figure ISA00000598841200181
Figure ISA00000598841200201
Figure ISA00000598841200211
Figure ISA00000598841200221
Figure ISA00000598841200231
Figure ISA00000598841200241
Figure ISA00000598841200251
Figure ISA00000598841200261
Figure ISA00000598841200271
Figure ISA00000598841200281
Figure ISA00000598841200291
Figure ISA00000598841200301
Figure ISA00000598841200321
Figure ISA00000598841200331
Figure ISA00000598841200341
Figure ISA00000598841200351
Figure ISA00000598841200371
Figure ISA00000598841200381
Figure ISA00000598841200391
Figure ISA00000598841200411
Figure ISA00000598841200421
Figure ISA00000598841200431
Figure ISA00000598841200441
Figure ISA00000598841200451
Figure ISA00000598841200481
Figure ISA00000598841200491
Figure ISA00000598841200501
Figure ISA00000598841200511

Claims (7)

1.一种手霉素生物合成基因簇,其特征在于:所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,1)手霉素A和中尼霉素的生物合成的结构基因:编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶的chiA1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2;编码醛裂合酶的chiA3;编码3-羟丁酰辅酶A脱氢酶的chiB1;编码芳香胺N乙酰转移酶的chiB2;编码3-氧乙酰基载体蛋白合成酶III的chiB3;编码3-氧乙酰基载体蛋白合成酶III的chiB4;编码酰基载体蛋白的chiB5;编码硫酯酶的chiB6;编码3-氧乙酰基载体蛋白还原酶的chiB7;编码酰基脱水酶的chiB8;编码酰基脱水酶的chiB9;编码I/II型酮合成酶相关的酰基载体蛋白的chiC1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白的chiC2;编码3-氧乙酰基载体蛋白合成酶II的chiC3;编码酮合成酶的chiC4;编码甲基丙二酰辅酶A变位酶的chiC5;编码硫酯酶的chiC6;编码酰胺合成酶的chiD1;编码5-氨乙酰丙酸合成酶的chiD2;编码5-氨乙酰丙酸辅酶A连接酶的chiD3;编码氧化酶的chiE1;编码黄素还原酶的chiE2;编码黄素依赖的单加氧酶的chiE3;编码黄素依赖的氧化还原酶的chiE4;共25个基因;2)手霉素A和中尼霉素的生物合成的调节基因:编码LuxR家族转录调节子的chiR1;编码TetR家族转录调节子的chiR2;编码调节蛋白的chiR3;共3个基因;3)手霉素A和中尼霉素的生物合成的转运基因:编码抗药性转运蛋白的chiM1;编码分泌蛋白酶的chiM2;共2个基因。
2.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。
3.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
4.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。
5.按权利要求4所述的手霉素生物合成基因簇,其特征在于:对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A的结构类似物。
6.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述中尼霉素生物合成基因簇用于其编码蛋白催化合中尼霉素及其类似物。
7.根据权利要求6所述的手霉素生物合成基因簇,其特征在于:对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
CN2011103286346A 2011-10-19 2011-10-19 一种手霉素类抗生素生物合成基因簇 Pending CN102517309A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103286346A CN102517309A (zh) 2011-10-19 2011-10-19 一种手霉素类抗生素生物合成基因簇

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103286346A CN102517309A (zh) 2011-10-19 2011-10-19 一种手霉素类抗生素生物合成基因簇

Publications (1)

Publication Number Publication Date
CN102517309A true CN102517309A (zh) 2012-06-27

Family

ID=46288375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103286346A Pending CN102517309A (zh) 2011-10-19 2011-10-19 一种手霉素类抗生素生物合成基因簇

Country Status (1)

Country Link
CN (1) CN102517309A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916835A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN107365368A (zh) * 2016-05-11 2017-11-21 中国科学院微生物研究所 Asperphenamate合成相关蛋白及其编码基因与应用

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916835A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834B (zh) * 2015-12-24 2022-08-05 武汉合生科技有限公司 化合物的生物合成基因簇及其应用
CN106916835B (zh) * 2015-12-24 2022-08-12 武汉合生科技有限公司 化合物的生物合成基因簇及其应用
CN107365368A (zh) * 2016-05-11 2017-11-21 中国科学院微生物研究所 Asperphenamate合成相关蛋白及其编码基因与应用
CN107365368B (zh) * 2016-05-11 2020-09-08 中国科学院微生物研究所 Asperphenamate合成相关蛋白及其编码基因与应用

Similar Documents

Publication Publication Date Title
Rachid et al. Molecular and biochemical studies of chondramide formation—highly cytotoxic natural products from Chondromyces crocatus Cm c5
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
JPH09224686A (ja) プラテノリドシンターゼ遺伝子
Frank et al. From genetic diversity to metabolic unity: studies on the biosynthesis of aurafurones and aurafuron-like structures in myxobacteria and streptomycetes
CN106687577A (zh) 用于产生香草醛的微生物和方法
CN107868789B (zh) 可利霉素生物合成基因簇
CN101809030A (zh) 硫肽前体蛋白质、编码该蛋白质的基因及其用途
CN101275141A (zh) 阿嗪霉素的生物合成基因簇
CN101818158B (zh) Fr901464的生物合成基因簇
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
Li et al. Stepwise increase of thaxtomins production in Streptomyces albidoflavus J1074 through combinatorial metabolic engineering
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN102517309A (zh) 一种手霉素类抗生素生物合成基因簇
CN111378008B (zh) 脂肽类化合物Totopotensamides及其制备方法和应用
KR102159415B1 (ko) Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법
CN101586112B (zh) 诺丝七肽的生物合成基因簇
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
CN103215282A (zh) 越野他汀的生物合成基因簇及其应用
CN114517175B (zh) 基因工程菌及其应用
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
US20030064491A1 (en) Genes and proteins involved in the biosynthesis of enediyne ring structures
CA2391131C (en) Genes and proteins for rosaramicin biosynthesis
CN101142313A (zh) 编码产生地索拉唑类的合成途径的基因
CN101684471A (zh) 诺卡噻唑菌素的生物合成基因簇
KR20130097538A (ko) 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120627