CN102517309A - 一种手霉素类抗生素生物合成基因簇 - Google Patents
一种手霉素类抗生素生物合成基因簇 Download PDFInfo
- Publication number
- CN102517309A CN102517309A CN2011103286346A CN201110328634A CN102517309A CN 102517309 A CN102517309 A CN 102517309A CN 2011103286346 A CN2011103286346 A CN 2011103286346A CN 201110328634 A CN201110328634 A CN 201110328634A CN 102517309 A CN102517309 A CN 102517309A
- Authority
- CN
- China
- Prior art keywords
- coding
- ucf
- gene cluster
- mycin
- buddhist nun
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,(1)负责手霉素A和中尼霉素生物合成的结构基因25个;(2)负责手霉素A和中尼霉素生物合成的调节基因3个;(3)负责手霉素A和中尼霉素生物合成的转运基因2个。通过对上述生物合成基因的遗传改造可以得到手霉素A和中尼霉素的结构类似物,本发明所提供的基因及其所编码的蛋白质,可以用来寻找和发现可用于医药、工业和农业的化合物、基因和蛋白。
Description
技术领域
本发明涉及微生物的基因工程领域,具体的说是一种手霉素A和中尼霉素的生物合成基因簇。
背景技术
手霉素类化合物是非常特殊的一类聚酮类天然产物,大多数是由链霉菌产生的抗生素,具有良好的生物活性。第一个手霉素化合物手霉素A是从链霉菌Streptomyces parvulus Tü64分离得到的(Buzzetti et al.,1963),然后在1973年发表了其结构(et al.,1973),后来Zeeck等人给出了手霉素A的立体化学结构,进一步修正了其结构(Zeeck et al.,1987;Sattler et al.,1998),手霉素化合物被认为是一族新的抗生素,随后又分离得到了有类似结构的化合物如asukamycin(et al.,1976;Kakinuma et al.,1979),U-62162(Slechta et al.,1982)和U-56407(Brodasky et al.,1983),丰富了此族抗生素,以上这些手霉素类化合物的中心核心结构是m-C7N结构。而2005年Li等从海洋链霉菌中分离得到了手霉素A和中尼霉素A、B(Li et al.,2005),中尼霉素中心芳香环结构是p-C7N结构单元,且有氯的取代,是第一个来自天然的para-C7N结构。
一些临床上使用的利福霉素、丝裂霉素C等氨莎类抗生素,其结构通常是脂肪族安莎链通过酰胺键连接在m-C7N芳香环结构上,而m-C7N结构单元是由特殊的3-氨基-5-羟基苯甲酸(AHBA)作为起始单元合成的(Floss2006)。
手霉素类化合物看上去核心结构具有类似m-C7N的结构单元,但是Floss课题组通过前体喂养实验发现,手霉素A和asukamycin等核心结构的前体物并不是AHBA,而是其异构物3-氨基-4羟基苯甲酸(3,4-AHBA)(Huet al.,1997 and 2004)。在2010年Rui等人解析了asukamycin的生物合成基因簇(Rui et al.,2010),进一步证实了前体物是3,4-AHBA。
几乎所有手霉素类化合物的侧链上都存在C5N结构:2-氨基-3-羟基-2-环戊烯酮(2-amino-3-hydroxycyclopent-2-enone),C5N结构单元的前体物是5-氨基酮戊酸(5-aminolevulinic acid,ALA),也是四吡咯的重要前体物,可以合成亚铁血红素、叶绿素、类咕啉等化合物。ALA在生物体内通常有两种合成途径,C5途径和Shemin(C4)途径(Petricek et al.,2006)。在C5途径中,完整的谷氨酸碳骨架在谷氨酸tRNA连接酶、还原酶及一个氨基变位酶的作用下生成ALA,这个过程常存在于植物和大多数细菌中。而Shemin途径,则是甘氨酸和琥珀酰辅酶A在5-氨乙酰丙酸合成酶作用下直接生成ALA,这个途径常被认为存在于动物、真菌及许多光合细菌中(Avissar et al.,1989)。而最近的研究发现Shemin途径也常存在于链霉菌的ALA合成过程中(Zhang et al.,2010),还发现有的链霉菌同时具有C5和Shemin(C4)两种途径(Petricek et al.,2006)。ALA可以在5-氨乙酰丙酸辅酶A连接酶的作用下环化生成C5N结构单元,然后在酰胺合成酶的作用下,进入到手霉素类化合物的代谢过程。
手霉素化合物一般具有良好的生物活性,手霉素A是Ras蛋白法呢基转移酶抑制剂(Hara et al.,1993)和白细胞介素-1β转换酶抑制剂(Tanaka et al.,1996);抗生素U-62162和U-56407选择性地抑制革兰氏阳性细菌,而对革兰氏阴性菌没有抑制效果;中尼霉素A对乳腺癌及黑色素瘤具有显著的抑制活性(IC50=2.41μg/mL);以商品农药作为对照,中尼霉素对农作物病原真菌的抗菌效果明显,优于武夷菌素水剂、克菌康、宝丽安及百菌清等商品农药(李富超等,2009),具有很好的开发前景。
手霉素类化合物的生物活性与其结构密切相关,随着手霉素A和中尼霉素整个生物合成基因簇的解析,可以从基因和酶催化两个层次理解链霉菌进行抗生素生物合成的机制,进而可以实现手霉素A和中尼霉素结构的定向改造以及利用组合生物合成手段创制生物活性更高的手霉素类化合物,并且实现手霉素类化合物产生菌的分子育种、发酵工艺优化,高效积累手霉素类目标化合物。
发明内容
本发明目的在于提供一种手霉素类抗生素生物合成基因簇。
为实现上述目的,本发明采用的技术方案为:
一种手霉素生物合成基因簇:所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,
1)手霉素A和中尼霉素的生物合成的结构基因:编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶的chiA1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2;编码醛裂合酶的chiA3;编码3-羟丁酰辅酶A脱氢酶的chiB1;编码芳香胺N乙酰转移酶的chiB2;编码3-氧乙酰基载体蛋白合成酶III的chiB3;编码3-氧乙酰基载体蛋白合成酶III的chiB4;编码酰基载体蛋白的chiB5;编码硫酯酶的chiB6;编码3-氧乙酰基载体蛋白还原酶的chiB7;编码酰基脱水酶的chiB8;编码酰基脱水酶的chiB9;编码I/II型酮合成酶相关的酰基载体蛋白的chiC1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白的chiC2;编码3-氧乙酰基载体蛋白合成酶II的chiC3;编码酮合成酶的chiC4;编码甲基丙二酰辅酶A变位酶的chiC5;编码硫酯酶的chiC6;编码酰胺合成酶的chiD1;编码5-氨乙酰丙酸合成酶的chiD2;编码5-氨乙酰丙酸辅酶A连接酶的chiD3;编码氧化酶的chiE1;编码黄素还原酶的chiE2;编码黄素依赖的单加氧酶的chiE3;编码黄素依赖的氧化还原酶的chiE4;共25个基因;
2)手霉素A和中尼霉素的生物合成的调节基因:编码LuxR家族转录调节子的chiR1;编码TetR家族转录调节子的chiR2;编码调节蛋白的chiR3;共3个基因;
3)手霉素A和中尼霉素的生物合成的转运基因:编码抗药性转运蛋白的chiM1;编码分泌蛋白酶的chiM2;共2个基因。
所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A的结构类似物。
所述中尼霉素生物合成基因簇用于其编码蛋白催化合成中尼霉素及其类似物。对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
本发明提供了产生手霉素A和中尼霉素生物合成基因被阻断或加倍的微生物体内的途径。
本发明提供的核苷酸序列或部分核苷酸序列,可以利用聚合酶链式反应(PCR)的方法或包括本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与手霉素A或中尼霉素生物合成同源的基因。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从海洋链霉菌Streptomyces griseoaurantiacus M045的基因组文库中定位更多的文库质粒,这些文库质粒至少包含本发明中的部分序列,也包含链霉菌M045基因组中邻近区域以前未克隆的DNA。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通过紫外或化学试剂进行诱变等。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达系统,包括链霉菌、芽孢杆菌、假单胞菌、大肠杆菌、酵母、植物和动物等,进行异源表达获得相应的酶或高活性的代谢产物。
手霉素A和中尼霉素生物合成的修饰基因、调节基因、膜蛋白相关基因的核苷酸序列提供了通过缺失或改造这些修饰基因、调节基因、转运基因而得到手霉素A和中尼霉素结构类似物,或者使手霉素A和中尼霉素类似物产量提高的途径。
本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。
本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。
本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组载体以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断手霉素A或中尼霉素生物合成的一个或几个步骤而得到新的手霉素或中尼霉素结构类似物或前体。包含DNA片段或基因可以用来提高手霉素、中尼霉素或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。
本发明所提供的聚酮合成酶可以通过缺失、插入或失活来自于相同或不同的聚酮合成酶系统的一个或多个聚酮合成酶结构域、模块或基因而产生新的聚酮化合物。本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建聚酮合成酶库或聚酮合成酶衍生库或组合库。
本发明所提供的手霉素A骨架的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的催化从手霉素A到中尼霉素的氧化反应可有其他应用,包括进行卤素的取代。综上,本发明所提供的包含手霉素A和中尼霉素生物合成相关的所有基因和蛋白信息可以帮助人们理解手霉素类天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明
图1为本发明实施例提供的手霉素A、中尼霉素A、中尼霉素B、asukamycin的化学结构。
图2为本发明实施例提供的手霉素A和中尼霉素基因簇的结构组成图。
图3为本发明实施例提供的构建的基因敲除载体pHZ132D2。
图4为本发明实施例提供的从链霉菌M045野生菌株及突变株基因组上扩增硫链丝菌素的抗性基因tsr电泳图(图中:M:Trans2K Plus II DNAMarker(TransGen Biotech);1:空白对照;w:野生菌株;a-e:转化子;p:pHZ132质粒阳性对照。)。
图5为本发明实施例提供的以tsr为探针,进行总基因组DNA的酶切Southern Blot分析图(其中:m:λDNA/EcoR I+Hind III marker;w:野生菌株;a-e:转化子;p:pHZ132质粒阳性对照。)。
图6为本发明实施例提供的HPLC分析链霉菌M045野生菌株(w)和突变菌株(a,b,c)代谢产物的变化图(其中:化合物1:中尼霉素A;化合物2:中尼霉素B;化合物3:手霉素A;化合物4:中尼霉素A1;化合物6:手霉素A1。)。
图7为本发明实施例提供的中尼霉素A、中尼霉素B、手霉素A、中尼霉素A1、中尼霉素B1、手霉素A1的化学结构。
图8为本发明实施例提供的5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的C5N结构单元合成的Shemin途径。
具体实施方式
本发明中所述的手霉素A和中尼霉素的生物合成基因簇包含30个基因的核苷酸序列或互补序列(序列1),具体为:(1)负责手霉素A和中尼霉素的生物合成的结构基因共25个基因:chiA1,chiA2,chiA3,编码蛋白负责中心结构C7N的生物合成;chiB1,chiB2,chiB3,chiB4,chiB5,chiB6,chiB7,chiB8,chiB9,chiC1,chiC2,chiC3,chiC4,chiC5,chiC6,编码蛋白负责两个聚酮侧链的生物合成;chiD1,chiD2,chiD3,编码蛋白负责C5N结构的生物合成;chiE1,chiE2,chiE3,chiE4,编码氧化酶,负责手霉素A环氧结构形成,以及氯的取代和基团重排;(2)负责手霉素A和中尼霉素的生物合成的调节基因chiR1,chiR2,chiR3,共3个基因;(3)负责手霉素A和中尼霉素的生物合成的转运基因chiM1,chiM2,共2个基因。
chiA1位于基因簇的核苷酸序列第23831-24949碱基处,长度1119碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶,372个氨基酸;
chiA2位于基因簇的核苷酸序列第25075-26493碱基处,长度1419碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白,472个氨基酸;
chiA3位于基因簇的核苷酸序列第14395-15195碱基处,长度801碱基对,编码醛裂合酶,266个氨基酸;
chiB1位于基因簇的核苷酸序列第22841-23734碱基处,长度894碱基对,编码3-羟丁酰辅酶A脱氢酶,297个氨基酸;
chiB2位于基因簇的核苷酸序列第21942-22808碱基处,长度867碱基对,编码芳香胺N乙酰转移酶,288个氨基酸;
chiB3位于基因簇的核苷酸序列第20308-21357碱基处,长度1050碱基对,编码3-氧乙酰基载体蛋白合成酶III,349个氨基酸;
chiB4位于基因簇的核苷酸序列第18314-19336碱基处,长度1023碱基对,编码3-氧乙酰基载体蛋白合成酶III,340个氨基酸;
chiB5位于基因簇的核苷酸序列第19409-19639碱基处,长度231碱基对,编码酰基载体蛋白,76个氨基酸;
chiB6位于基因簇的核苷酸序列第21378-21935碱基处,长度558碱基对,编码硫酯酶,185个氨基酸;
chiB7位于基因簇的核苷酸序列第27438-28142碱基处,长度705碱基对,编码3-氧乙酰基载体蛋白还原酶,234个氨基酸;
chiB8位于基因簇的核苷酸序列第26490-26966碱基处,长度477碱基对,编码酰基脱水酶,158个氨基酸;
chiB9位于基因簇的核苷酸序列第26969-27421碱基处,长度453碱基对,编码酰基脱水酶,150个氨基酸;
chiC1位于基因簇的核苷酸序列第15248-15526碱基处,长度279碱基对,编码I/II型酮合成酶相关的酰基载体蛋白,92个氨基酸;
chiC2位于基因簇的核苷酸序列第15523-15789碱基处,长度267碱基对,编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白,88个氨基酸;
chiC3位于基因簇的核苷酸序列第15779-16969碱基处,长度1191碱基对,编码3-氧乙酰基载体蛋白合成酶II,396个氨基酸;
chiC4位于基因簇的核苷酸序列第16966-17853碱基处,长度888碱基对,编码酮合成酶,295个氨基酸;
chiC5位于基因簇的核苷酸序列第85-222碱基处,长度138碱基对,编码甲基丙二酰辅酶A变位酶,45个氨基酸;
chiC6位于基因簇的核苷酸序列第17850-18317碱基处,长度468碱基对,编码硫酯酶,155个氨基酸;
chiD1位于基因簇的核苷酸序列第6529-8109碱基处,长度1581碱基对,编码酰胺合成酶,526个氨基酸;
chiD2位于基因簇的核苷酸序列第8114-9340碱基处,长度1227碱基对,编码5-氨乙酰丙酸合成酶,408个氨基酸;
chiD3位于基因簇的核苷酸序列第9452-10990碱基处,长度1539碱基对,编码5-氨乙酰丙酸辅酶A连接酶,512个氨基酸;
chiE1位于基因簇的核苷酸序列第5239-6423碱基处,长度1185碱基对,编码氧化酶,394个氨基酸;
chiE2位于基因簇的核苷酸序列第19639-20196碱基处,长度558碱基对,编码黄素还原酶,185个氨基酸;
chiE3位于基因簇的核苷酸序列第12173-11064碱基处,长度1110碱基对,编码黄素依赖的单加氧酶,369个氨基酸;
chiE4位于基因簇的核苷酸序列第28209-29267碱基处,长度1059碱基对,编码黄素依赖的氧化还原酶,352个氨基酸;
chiR1位于基因簇的核苷酸序列第3639-4331碱基处,长度693碱基对,编码LuxR家族转录调节子,230个氨基酸;
chiR2位于基因簇的核苷酸序列第4964-4377碱基处,长度588碱基对,编码TetR家族转录调节子,195个氨基酸;
chiR3位于基因簇的核苷酸序列第644-3439碱基处,长度2796碱基对,编码调节蛋白,931个氨基酸;
chiM1位于基因簇的核苷酸序列第12510-14039碱基处,长度1530碱基对,编码抗药性转运蛋白,509个氨基酸;
chiM2位于基因簇的核苷酸序列第29514-30914碱基处,长度1401碱基对,编码分泌蛋白酶,466个氨基酸;
序列表SEQ ID No.1为:
atgcggaagg ccgccgaggg cgaggacaac gtcctctatc ccatgaagga ggcgctcgcc 60
gcaggtgcca cgatcgggga agtgtgtgac acattgcggg aagtgtgggg aacgtaccgt 120
ccaaacgatg tcttttgacg aggaaaattt ctcgtaatgt cgcccgacgc acgggctcgg 180
ggctcccgtt gtgagaaacg gcacggtccg agcccgttta gggccctcac gggaaccctt 240
tccacggcct tcgcggtcgg ccggcgggca cacctccgga cgtcccggaa tactccgcca 300
cgcgccgccc ggcgaaaggt agactcggcc gaaaagttcg aacagttcga ctccagggaa 360
tggggaattg ccgagtaatg cccactgccg gaatgaccgc ctcaaacgac cgaattcagc 420
cattgtttat ccctgaattg gttcatcttt caagagtctc tcgctgtcgt ccctgacgcg 480
cggccgtcca ggccgctccc tgccaccgcg cgctccctct ccccacagtc catgtcgtcg 540
cgccatgcca ggagtactca tgctcagcca ggaccagcgt tccggggtcg cagtgccgcg 600
cccggacgat ccgcagcccg tacggttccg ggtactgggg ccgctcgccg tccagggcag 660
ggacggccgg gccatcccgg tgcccgggac gaagcagcgg gcggtgctcg gttatctgct 720
gctgcacccc aaccaggtcg tcgccaccag ccggctggtc gacgccctgt ggccgggcag 780
aaagcccgtc accgcccgga agatggtgca gaacgccgtc tccgcgctcc gtaccgcact 840
cgcccggggc aacgggccgg acgacgaggt ggtcctgctg acccacgcgc ccggctatct 900
gctgcgcgtc gaccccgagc tgatcgacct gcaccgctcc cggcggctgg ccgagcaggg 960
acggcgcgaa ctggccgccg gctcgccggc cgccgcggcc gagtccttcc gccaggcgct 1020
ggcgcagtgg aacggcgcgg tcctcgcgga tctcgtggag gccggggcct cctggccgga 1080
actcgccgcg atgtccgagg agcgccaggc gatccgtgag gaccgcgccg acgccgaact 1140
gcgctgcggc cggcaccaga cggtgctcgg cgagttacgt ctcctcgccg aggctgaccc 1200
gctgaacgag cggctgtgcg cactcctcat gctcgcgctg caccgcaacg gcaaacccgt 1260
cgaggccctg gagctctacc ggcgccaacg ggacctgatc gccgagaggt tcgacagcga 1320
gcccacccgg gaactgcggg acctcgagcg ggcggtgcgc acccgggacc cggccatcga 1380
cccgcccgca ccggcgcaga cggtcccgcc cctcgccccg cccgaggagg tcgccgcgga 1440
cctcgcggcg gaccggtcgg cgcccccggc ggcgacccgc gccgtgttcc gcccgccgcc 1500
cggtgcgccc ccctcggcgc tggtcaccga ggccctcccg tcggcccccg tgctcgccac 1560
gcccaccggg gaggacgccc cgccggggca cgcggcgggg gaacgcaaac ggctgagcgc 1620
cgtcctggtg cgggtcgagc cgccggccgc cgtcgggggc gacgacgcgg aggccttcga 1680
catccgcttc cgcgaggtgt cggccgtggt cgcggaggag gccgcgcggt acggcggaac 1740
cgtggccggc cggatcggct ccacgctgct gatgctcttc ggggtgttcc gcagccgggt 1800
ggacgacgcg ctgcgcgccg tgcgcgccgg gcacgcggtg cacgaccggc tgctgcggct 1860
cgccctgccc ctcggcgtcg tacccggggc gggacgggtg cgggtggcgg tgtcgaccgg 1920
ggacgcgctg gtccggttca ccgaggcggg ccaggacgcc gcgcccatgg tcgtcggcgc 1980
cctgctcgac cagtgcctgc gccagctgga gtccgccgag ccgggccaca tcaaactgtg 2040
cgacgccacc cgccgggccg cccggctggt caccgccggg ctcggcgacc cgctggacag 2100
cggctcggcc tccgccgccg tggcggccct cggccggtcc ccggccgcgc cgggtgcgag 2160
ggccccgctg gtggaacgcg aggccgaact ggacgtgctg accgccctgt tcaaccaggc 2220
ggtgcgcacc ggcaggccgc accagatcag cgtgctcggc gaacccggcg tgggcaagac 2280
caggctggtc caggagttcg cccggctggt gggtgcgcgc gcggaggacg cgcacctgct 2340
gcggctgcgg atgcccgtcc tcggccgccc caccggccgg accgcgctcg gggaactggt 2400
cggcctgtgc gcgggtctgc acccggcgga cccgccgcac accgtcgacg acaagctctc 2460
ggcggcgctg cggcgctggc tcggcccgcg ggtggtggac cgcgagacgg tcctcggcca 2520
tctgcgcgcc ctggtcgccc cggcgcacac cggcggcgtc ctcgacggcg aggcggtcgc 2580
cgcctgccgg cggatgctgg aggcgctcgc ggcggagcgg cccctggtgc tcgtcctgga 2640
ggacctgcac ctcgcggacg acggggtgct ggacttcgtc gacggcctgg ccgagtcctc 2700
ggcccggatc ccgctgctgg tcgtcaccac cgcgcgtccc gacctgatcg aacgccggcc 2760
cacctggggc ggcgggggct accgcacgac gagcaccatg cacctggaac ccctgagcca 2820
ggacgcctcg gcgcgcctgg tgagccggtt gtgggaacag tggggcgtgc ggcgcaccct 2880
cgaccggtcc gacctcacct cggtgacggg cggcattccg ctcttcgtcg tggagtacgc 2940
cgccctgttc gggcggccct cgccggcgga gcgggcggag gtctgcggcg cgtggccgga 3000
gcatctgccc gagcgggtca gggcggtggt gaccgagcac atcgacgccc tgcgcccgca 3060
ggccaaggcg gtgctgcggg acgcctcggt ccaggggccc cggttctggt cggaggccgt 3120
cgcggccgtg ggcgggcggg aggtggccga gtgcgagcgg tggctcgccc atctcgaacg 3180
ccgccacttc ctggtccggg ccgaccgcag ctccatcccg ggctcggacg agtacgtctt 3240
ccgcagcgcc tgggtgcgcg aggtgacccg gctgtcggtg ctgcagcccg cccgccggga 3300
ggggcggcgg cgggcggacg cctggctcgc ggagcgggcg gcggggatcc ggtgactgtc 3360
cagtggaccg ggagtggaac tgtgcctcta cggtccgggc cgggtcgctg acatgcttct 3420
cccggggccg gagagagcac tggtccccgg ggagacccga gggcacgcgc gtgacacggc 3480
gcaccgccac cggctccggg acagatccgc aacgcaccac cagatgggtc cagttcgtat 3540
tagggggatg accgatgtcg tacgttcaga cgcaacccgc ctcacccacc gcgcccaccg 3600
ctctgacggc cgcccggccg gtgctcacgg tcctgccgaa cgaggtcgcg cgccgggggg 3660
tccgcagcct gctcgacggt cccggccacg gacgcgccgt ggtggcctgc cccgctcccg 3720
aggaggccgc ggccctgctg cgcgccgagc ggttcggcct gctgatcgtc tcggccgcct 3780
acggcgaggc gcgcctggcc gaactggtcg gggagagttc ccggtcggac gtgaagtcgc 3840
tgctgctgct ggacagcgcg gagcccgagt acattccgtg gatcgccgcc atcccgttcg 3900
acggctatgt gatgcaggag gacctgacgc cggattcgat ggcggaggca ctgcggcgtc 3960
tggagcgggg caagctgccg atacccgaca cgctcgcccg gctcttcatc cggcacgccg 4020
gccgcagccg gggcacgcac cgcagccccc gggtccagct cacgccgagg gagcaggcgg 4080
tcctcgggct catcgcggag gggctgagca accggatgat cgcgcaccgg ttcggcatct 4140
cggagcacgg ggtgaagcgc cacgtggcca acctgctggc caagttcaac tgctccaacc 4200
gtgcccaggc ggtctcggtg gcactgcagc agggactgct ggcctgacgt ccccgcgccg 4260
gcgcccctcc cccgggccgt tcccggtggg gatcagtccg tcgaggacag ggcgtgccac 4320
gcgccctcgg ccatggcggc ggcctcgacc ggttccggtg ccagcagcca gtggcgcagg 4380
acgccgatga aggcgccggc cgcgcagtgc gcccgcagcg cggtgccggc gccgttccgc 4440
ggcccggccg gggaggcggt gagctgccgc gccacctcct cggcgaccag ttgctgcagc 4500
cggttcagga accgggcgga gccgcagggg cccagcatgc gccggtagag cacgagttgg 4560
gactccacgt gccggaagac gtcggcgaag gccggcggtg tcctgaccgg gccgtccacc 4620
agggggcagc gggcgagcac cgccaccagc gcggtcagct cgtcctccat ggcgtccagc 4680
agcagcgcgt cccggtcgct gtagtgctgg tagacggtgg cgcggttcac cgtcgcccgt 4740
tcggccacgt gggccacggt gatgcccgac agctcgcgct cggcggccag ttcgagtgcc 4800
gccgaccgca gcagcgcccg ggtccgcagc acccgcggat cgacgcgctt ggcgccgtgg 4860
tctgtcgtcg tgtcgggcat tcgcccagat tacacctgta cccaacaggt gtcgcagagt 4920
gatccggccg ggccgagggg cggtgcccgg ccggccgcgc ccgcccggtg gtccggggcg 4980
gccggacggg cgccgccggg cgggcgcccc gaacggcccg cccggacggg tctgggcgcc 5040
cggcgggggc ttcgtgagga tggccgacca gtgacggcca cacaacggag gaacccgatg 5100
accgcaagcg atcggaaccc agtcggcggc cccggggccg aggtggacgt gtgcgtgacc 5160
ggcggcggct cgaccgcgct cctcgcggcg ctgctctgcg cgcgggccgg ccgctcggtg 5220
ctgctcgtgg cccccgaggc ggagttcgag ccggccggcg cgggcatctc ccccctggtg 5280
gccccgccga ccctcggcct gctcgccggg gagggcgtcg aggaggaact gctgggggcc 5340
ggtcagcgca tcctcggcgc cgacgaccac gggcgggacg ggctcctctc ccgctggcgg 5400
tactacgacc tccccggcat cgcccgcccc tacgggctga cggtgccgac cggcacgctg 5460
gtgcaggcgc tgctcgcccg gctgcgcgcc gaaccgtccg cgaccgtgcg caccggccgt 5520
cgggtgaccg ccctcggcca ggacgaggac ggtgtcctcc tcaccttcgc cgacaccacc 5580
gcaggcacca ccggtgacgg tgccgggggc ggggccgagg aacgggtgag ggcacggtac 5640
gcggtcgccg cggacggccg gcactccccg ctgcgcgacc tgagcggcat caccgtccgc 5700
gacacaccgt tcgggcgtcc gggctggctg gtggccgcgc cggtcgtgcc gaggcgcgag 5760
cccgtgctgc tcgtgcggca cccggccccg caggcgctgt tcaccgtgcc cacgccgggc 5820
gactcgatgg ccgtcgtgtg gtgccccgac cgggagcagg gcgaggctct cgggcaggcg 5880
gacccggagg tgttcgccgg gcagatcaag acggtcgacc ccgagctcgc cgactggctc 5940
ggcgaggtcc gcgaccgcac ctccccggtg ttccggatcg acttcgcgat gtggcaggcc 6000
gcgtcctggc gccggggccg ggtgctgctg ctcggcgagt ccgcgcacgg gatgcacacg 6060
ctcggcgggc agggactcaa ccagtccctg cacagcgccg cctcgctggc ccgcgcggtg 6120
gacgaggcgc tcgcgcacaa ggaccccacg cgggtggagg cgtacgagcg gatccgccgg 6180
ccgcacgtgg agcggctgca ggaactgcag tggaacaccc cggcgctgcg ctcctacgag 6240
gccgagccgc ctcggcgcgg cgcccaccag gacttcgtcg aggtgatgac gacgctgcag 6300
ccggagctcg ccgagcagct cggtgccggc gcccgctgag gacgccgtca ccccacgcac 6360
ccgcaccgcc gaggcgaccg gctcgcccgg ctcgtccacg cccccgcacc actcaccgca 6420
gcacgcatcg aatcgaggtc gaccatggct ctaccggacg gctggtgggc accgcacgac 6480
ggttatgtcg cgcgggtact gtccgcgctg accgcccagc cggatcgcat cgccgtgcac 6540
tggcggcaac aggccctgac cggaggcgag ttcgccgcct cggtcgccgt gacggccgcg 6600
cgactgcggg agctgggcgc cgggccgggc gccgtggtgg gcgtcctgac cgcgtccaac 6660
agtcccgaca tgctgcgggt ccgctacgcg gcccacctgc tgggcgcggc cgtctgccac 6720
gtgcggtcca ccaaccccgg cacctccggg ccggcactgc ccgtcgggga acagctccgc 6780
atcctcctcg acacccgggt ccgggtgctg ttcaccgacg cggagaacgc cggccgcgcc 6840
cgggaactcg ccgagcgcgc ccggggccgt gtcgccctcg ccgaggccgg tgccccgggg 6900
gacgtgcggg agccggccgc cgtgccgtgg cgaccgcgcg ccctggcggt gatcgggttc 6960
accagcggca gcaccggccg tcccaagggg atcaggctgt cggcggcggc ctgggacaac 7020
ctcgtggagg tgaccgggca ggccttcacc ggcgaggcgg ggacggccgc ccggctgctg 7080
gtgacgaccc cgctgagcca taccgtggcc accatggcgg acgccgtgct ggccggcggt 7140
ggcaccgtcg tcctgcacga ggagttcgcg ccggagcccg tcctgcgggc actgaccggg 7200
caccggatca gccacacctt catggccacc gcgcagctgt accagctgct cgaccacgcg 7260
ccgctgcggg aggccgacct gtccgcgctg cgccagctca tctacaccgg cagcgccgcc 7320
gcgcccgccc gtgtcgccga ggccgtccgt ctgctcgggc cggtgctggt gcagggctac 7380
gggaccagcg agagcggccg gatcaccctg ctgcaccccg gcgaccacca ggatcccggg 7440
ctgcactcca ccgtgggccg cccgttcccc gagaacgaga tcgccgtcca cgaccccgag 7500
accgaggagg agctcccccc gggcgcgacg ggcgaggtgt gggtgcgctc cccgcacctg 7560
atggacggct actgggccga cccggcgctg agcatgcgca cgctgcgccg gggctggtac 7620
cggaccggcg acctcggccg gatcgacgag cggggctgcc tgtccctgct cggccggatc 7680
gcggacgtgg tcaagacgga cggggtgctg gtccatccgg cggtcgtcga gcggcggatc 7740
ctcacgctcc ccggcatcgc gcaggccgcc gtcttcgcgg tgcgcgaccc ggatctcgtc 7800
gagcacctca aggccgccgt cgtgccccgg ccgggtgcgc ggatcgaggc cgaggacgtg 7860
cgggcgcacc tcgccgcggg cctcggcgcc gggcacgtgc ccgaggaggt cctgatcctc 7920
gacgcgctgc cgctgaacgc cgggggcaag ccggacaagc gccggctccg tctcgcctgg 7980
cacggcacca cccattcgaa cacccccgta cgagaggtga gttgacgcca tgaaccgact 8040
cctggaccac ttcgccggtg aactggaggc cctcggcggg cagcgcaggg acttcctgga 8100
gatcggccgc cgcgccggcc gcttccccag tgctctcgcc cggctgcagg acgccccctc 8160
cgacgtggag atcagcgtct ggtgcagcaa cgactacctc ggcatgggcc agcacccctc 8220
ggtgctggag gcggccaaga acgccgtcga cgccttcggc gccggctcgg gcggctcccg 8280
caacatcggc ggcacgaact tctaccacgt gctgctcgaa caggaactgg ccgagctgca 8340
cggcaaggag gcggcgctgg tcttctcctc cggttacacg gccaacgacg gggcgctgac 8400
ggtgctcgcg ggccgggcgc cgggcacgct ggtcttctcc gacgcgctga accacgcctc 8460
gatcatcgac ggactgcggc acagcggcgc cgagaagcgc atcttccgcc acaacgacgt 8520
cgcccacctg cgggagctgc tggccgccgc cgatcccgag cggcccaagc tgatcgtgct 8580
ggagtcggtg tactcgatgt ccggggacgt ggcgccgctc gccgagttcg cggacctggc 8640
ggaggagttc cacgcggcca cgttcgtcga cgaggtgcac gcggtgggca tgtacggccc 8700
gcagggcgcc ggcatcgccg cccgggaggg catcgccgac cggttcaccg tgttcatggg 8760
cacgctcgcg aagggattcg gcacggcggg cgggtacatc gccggtccgg ccgacctggt 8820
ggacgcggtg cgcgccctgt cccggccgtt catcttcacc acctcgctcc cgccggccac 8880
cgcggccagc gcgctggcgg cggtgcagca cctgcgctcc tcggaggcgg agcgggaccg 8940
gctcgcggcc aacgccgggc tgctgcaccg gctgctgggc gagcggcgga tcccgttcgt 9000
ctcggacgag tcgcacatcg tgtcggtgtt cgtcggggac gacgcgcagt gccgccgggc 9060
ctcggcgatc ctgctggagc ggcacggcat ctacgtgcag ccgatcaacg cgcccagcgt 9120
ccgggcgggc gaggagatcc tgcgggtggc gccctccgcg acgcacaccc tcggtgacgt 9180
ggagaagttc gccgaggctc tggacggcat ctggcaggaa ctgggcatcc cgcgcggcgg 9240
ggtccgcggc gcctgacccc cggcgggccc gcgcgtccgt gccgggcgcg cggcgcccgc 9300
cccgtcccgt cccggcaccc tcgcccggag gcgcatgacc ggccgggcgg aacggagttg 9360
atgacccatg tccctctcgc tggccgccgt gctcgccgag ccggccgccc gacgcccgga 9420
ccacccggcg atcgtcttcg acgggcagga ggtgtcgtac gcccggctgt ggcaccgggc 9480
gcggagctac gcggccgtgc tcggtgagcg gggggtccgg cccggtgacc gggtggccct 9540
cctgctgtcc aacacaccgc acttcgccat ggcctacttc ggtgccctcg cggccggtgc 9600
cgtcgtggtg ccggtgcacg cgctgctgaa ggcggaggag atcgcctacg tgctgcgcga 9660
cagcggggcc cgcctgctgg tctgcggggg cgccttcctc ggcgagggcg ccaaggcggc 9720
cgagatggcg ggcgtcgagg tgctgaccgt cctcgccccg ggggagccgg cggcgcgccg 9780
cctcgacctc ctggccgagc ggtccgcgcc ggtggagacg tacctgccgc gcgcccccgc 9840
cgacgcggcc gtcgtcctgt acacctccgg taccacgggc cggcccaagg gcgcggtgct 9900
cacgcatctg aacctcacga tgaacatcgg cgtcacgatg ctctccccct tcgacttcca 9960
cgccggggac gtgctgctct gcccgctgcc gctgttccac accttcgggc agatctgcgg 10020
catgggggtg tgcttccggg cgggggcgac gatggtgctg atgccctcct tcgacgcgga 10080
ggaggccctc gagctgatgt gccgtcaccc ccgcgcggtg ttcatgggcg tccccaccat 10140
gtacctggcg ctgctcgacg ccgcccgcgc gcggcgggcg cccggccggc cgctcctcgc 10200
ccgcgcctac tccggggggt ccgcgctgcc ggtgaaggtg ctggaggagg tcgaggaggt 10260
cttcgactgc ccggtgtacg agggttacgg cctgacggag acctcgccgg tggtcgccta 10320
caaccagccg ggcctgcccc ggcgtcccgg caccgtgggc ctgccggtgt ggggcgtccg 10380
ggtggccgtc accgcggccg acacggcgga ggtcgtcccg ctgccgcccg gcgaggtggg 10440
cgaggtcgtc gtgcgcgggc acaacgtgat ggccgggtac ctgggccgcc ccgaggccac 10500
cgccgaggtg ctggtggacg gctggttccg caccggcgac ctgggcgtcc tggacgagga 10560
gggccggctg accctggtgg accgcaagaa ggacatggtg gtgcggggcg ggtacaacgt 10620
gtatccgcgc gagatcgagg aggtgctgtc ccggcatccg gcgatcgcgc aggtcgcggt 10680
gatcggcgtg ccccaccccc gttacggcga ggaggtgtgc gcggtggtgc gcaccccgcc 10740
cggcacggac ggcaccgcgc ggctcggtgc cgagatcgtg gcgtggagca gggaacggct 10800
ggccggccac aagtacccgc ggcgcgtgga gttcgtggac tccttcccgc tgggtccgag 10860
cgggaaggtg ctcaagcggg agctcgcggc ccggttcgcg gcgtagggcg tacggcggcg 10920
ggcgctgccc ggcatccctc ggggtgccgg gcagcgcccg tcgtggtgtg gtccgcgggt 10980
cacctgccgg agagggcgcg ggcgaggtcc gccgtccagg tgtaggagtc ggtgacgccc 11040
ttgagggagc cgttgaaccg gggggcgacg aagcgggcga ggagttcgag gctgcgatgg 11100
gtggcctcgc ggtccgccca gtccatcacg ttgaccagca ggcgcccgaa gccgccggtc 11160
tcctgctgca cgtcccggat ggcctcggtg acctcgtcga cggagccgac gagggtgccg 11220
cgctgctcga tcagttcctc cagcagcgcg cgggcctcgg cgcgtgaggc gacgggcggg 11280
gtgccgagca gggcccagta ctcgttgcgg taccgggtcc agccgtcgac gatctcgtcc 11340
agggcccggt cccggctctc cgacacgtgc acggtcagcg cgacccgcca ctcggcccgg 11400
tccagtttgt ggccgtgctc ggcggcggac tcctcggcgt gctgccactg gccgacgagg 11460
tcgccgatcc ggctgcccgg cttcggcggg atgccgaagg acagcggggc gatgccgtac 11520
tggccggcca gccgcatgcc gaacggggag acggcgctgg agaccgccat cggcagtccg 11580
gccggggtgc tcggccgcag gtgcagccgc gcgtcgcgca gccggaacca gtcggtctcc 11640
cgggtgacgg ggccctcccc ggcgaccagt tggcggatga cgtccaggga ctcggcggtg 11700
cggcgccggg tgtccgccgg gtcgatgccg aggaagtgca tgtcggtggg gatggagccg 11760
gccccgacgc cgagggtgaa ccggccgcgg gtgaggtggt cgagctggag ggcgcgcgtg 11820
gccaccatga aggggtggtg gtagggcagg ctcaccacgc cggtgccgag gcggatgtgc 11880
cgggtgcgct cggcggcggt ggcgaggaac agctcgggcg aaccgacggt cccccagccg 11940
gccgagtggt gttcacccac ccacagttcc tcgtagccga gccggtcgag ccactcggcg 12000
agttccagat cccgccacag gctcagggcg gggtcctcgc ccagcgggtg caggggcgac 12060
aagaaggctc cgaagctcat ccggtccatg gggctcctca ctcacggaag tcgtggcgct 12120
cgtgacggtc gtgccgagtc tgtcgccggg ggcccgggct ttcgcccccc gaacggaccg 12180
gtccttccac ggccccgaac accgtggccg aacgcggtgg ccggacgcgg cccgccgtac 12240
gggcaccccg gccgggcacc ccggccgggc accctccggc ggccctaccc gacacatgtt 12300
gccaatccaa catatgttgt ggaacgctga gcgtcatcgt tcgtgaccca ctgcacaccg 12360
gcaaccccgt gcgcggccgg ctcacgcgcc cctgtccgta cccgcgacaa gagaaagaga 12420
ccgacgtgac gacccagcag gaacggaccc cggcggagga gtccgaacgc atcggtcccg 12480
atctgtggtg gctcgccgcc atcatggcct tcggcagctt cgccgggctc ctcgacgcca 12540
ccatcaccaa tgtcgccatc ggtccgctgg cctcggcctt cgacgccgag atcgccaccg 12600
tgcagtgggt ggtgacgggc tatctgctgg ccatcaccgc cacgctcccg ctcggcgcct 12660
gggcgatggc ccggttcggg gcccgcgaga cactgctctt ctcccaggcg gtgttcctcc 12720
tcggttccct gctctcgggg ctggcctggg acgcccccag cctgatcggc ttccgggtgc 12780
tccagggcat cggcggcggc ctcgccctcc ccgtcggcca ggccctcatc gcccaggcgg 12840
ccgggccccg ccgcctcacc aagctgatgt ccctggtcac cgtgcccgcc ctgttcgccc 12900
cgctggtcgg cccctcgctc ggcggtgtgc tggtcgacca cgcgagctgg cggtggatct 12960
tcctgatcaa cgtgccgttc tgcctggcca ccatcggcct gatcctgtgg cgggtgcgca 13020
acgtcatcgc cccgacgaag gacgccgtcc tggacaccct cggcctggtg ctgctcgttc 13080
ccgccctcgc cgggctgatc tacgggttct ccgaggccgg cgcggccggc gggttcaccg 13140
ggacgcgcgc cctcgcgggc ctgggcgccg gggtcgtgct cggcaccgcc ttcgtcgcgc 13200
acgccctgcg ccggcgcagc gaggccgtcc tcgacctgcg gctgttccgc gtacgggact 13260
tcgcggccgg gaacctggcc agcatggtca tggccgtcgc gatgtacggc gtcctcatcc 13320
cgctcccgct gtacttccag gtcgtccagg gcaccagcgt gctggagtcc gccctgatgc 13380
tgctccccca gagcctcggc tacctcgtcg cggtgtccct gctgcagcgg ctgaccgtgg 13440
ccctcggcgt gcgcaccgtc accctggccg gtgtcgtcct cgtcggcgtg ggcacgctgc 13500
cctacgtcgt catcgacgcc gatccgagcc gcttcctgct gggcgcggcg ctggtggtgc 13560
ggggtctggg gctcggcgcc tcgatgatgc cgacgatgac ggccgccttc agcagcgtgc 13620
ccaaggaggt ggtgccccgc gccaccagtg ccttccacgt cttccagcgc atcggtgcct 13680
cgctgggcac ggccgtgctc acggtggtgc tccagaacga ggccctgcgt catctgcccg 13740
aggaggtgcc gggcctggcc gccgtcgcgc ccggcagtgc cgtcgcccac gggctggcct 13800
cgtccttccg ggcgccgttc tggtgggcgc tggccttcac ggcgctcgcg ctggtgccgg 13860
ccttcttcct gccgggccgc cgcccggcct ccgctgccga cgaggccgac ggggccgcgg 13920
cgcgtccggg gacggcaccc gtgctgtccg agtagccgcc ggtcccgtcg cacccgtcgg 13980
ctccggctcc gcggagcccc gggccacggc aacccccgcg gttcctccgc atcacccctc 14040
acgcgccccg cgcggacgac gcagcacgcg tcctccgcgc ggggcgcctc gcgtgcacgc 14100
ccggcaccgg accgcctcac ggctccgcct cccccaccgc cctgcccgac cgggccccct 14160
cgcgctgcct gtccggccac ctcctcgggc gtgctcccgt tgcccctgcc ggagggccac 14220
cccgttcgag gattccgcgc ccggcccgcc cgccacagac tcggatcacc aacagccgac 14280
gcctgtgcgg gcggacaggg ggaatggacg atggtggcac tcgacaccgg ggcggcggtc 14340
cgcctggccc ggttgtcacg gcaccgggac ggacgcttcc tcttcgtgcc catggaccac 14400
tcggtggccg acgggccgat cgttccggcc tcgcgcttca acgacctggt cgcctccgtg 14460
gtcgcgggcg gcgccgacgc gatcgtggtg cacaagggcc gggcccgcac ggtcgacccg 14520
gccctgctgc gcgactgcgc gctgatcgtg cacctgagcg ccagtacccc gcactccccc 14580
gacgccgacg ccaaggtgct ggtcggcgcg gtggaggagg cggtgcgtct cggcgccgac 14640
gcggtcagcg tgcacgtgaa catgggctcc gacaccgagg cccgccagct cgccgacctc 14700
ggcacggtgg ccgaggcctg ccagcagtgg tcggtgccgc tgctggccat ggtctacccg 14760
cgcgggcccc ggatcgccga cccgcacgac ccggcgctcc tcgcccacgc ggtcaacgtg 14820
gcggccgacc tgggcgccac gctggtgaag accacctcac cgctgcccct gtcggagctg 14880
tccgcggtca ccgcgagctg cccgatcccg gtcctggtgg ccggcggcgg cgaccaggac 14940
ggtgacctca ccgccttcgc caccgccgcc gtggagtcgg ggtgcgcggg actggccgtc 15000
ggccgccggg tgtttctcag cccctccccg accgccgccc tcaaggccct ggcctccgtg 15060
gtgcacgccg acccgccggt ggggccactc ggcgtcgacg ccgccgtctg acgtcccgtc 15120
tcccggcgga aaccgcagcc cacccgcgtc ggaaggaaga cacatgcgcg acgagatccg 15180
cgagttcgtc ctcaccacca tccgtgaggt gatgaacctg ccgctgtccg agaacgtcac 15240
ggacgacacc ccgctcggcg agaacggcct cggcctggaa tcgctgtccc ggctggaact 15300
catgatccag ctcgagagcg cctacggcat cgaggtcccc gaggcggaca gcgacgccca 15360
gcaggacgcg accctcggcg agttcgtgga cgccgtggtg gccctgcgcg gcacggcggt 15420
cgccgacgga gccggccggt gacggacgac accgccctcg gcgcgctgct gcgcgactgc 15480
gggctgctga ccaccgactc cttcgacgac gacaccgaac tcgtcctcga ctcgctcacc 15540
ctcgtctggc tcgcccacct cctcgaggaa cagcacggca tcaccgtgtc cgtcgaggac 15600
gagaacggcc tggcctcctg cgcctcggtg cgggacctgc gccggttcct cgccgaggcg 15660
gcggagggca cccacacctc tgcggagatc cttcatggct catgacgtcg cgatcaccgg 15720
ccacggggtc ctcaccgcgt tcggcttcgg tgaacaggcc ctgctggacg gggtgttcgg 15780
gggccggccc ggcttcaccc cggtcacccg cttcgacccc acgccctacc gggccgggca 15840
tgccgccacc tacgagggcg agggccccga gatccccggg gtgccggtca aacccggggt 15900
gacaccggga cagttcgagg tcctggtcgc ctgcgccgcc gccgcgctgg agatggccgg 15960
cacggacggc gccggcgccc cggtgctgct cggcaccaac ggcgaccact ccgccgcccc 16020
ggacttctgg tcgggcaccg gcgcgcgcac cgccgccgac ccccgcaccc tcgacagcct 16080
ccccgcccgc ctgcccgagc tgctcgcccg cgaactgggt ctgggggcgc cccggacggc 16140
cttcgtgaac gcctgcgtgg ccggcaccaa cgccctcgcc cggggcgcgg aactgatccg 16200
ccgcggcctc gccgacacgg tggtgtgcgg gggcgcctac ctggtcaccg aggacgtgtt 16260
cgccaagttc gactccgggc gtgcgctgtc ccccgaggac gccgtgcgcc ccttcgacgc 16320
cggccgccag gggctgctgc acggcgacgg ggtcgccgtc ctggtgctgg aggccgccga 16380
ccgggcacgg gcccgcggcg cccgcgtcct cgccgggctc accggctggg gcatggcggc 16440
cgacgcccac cacgtcatcc agccgcatcc gcggggggac ggactggccc gggcggcccg 16500
cgccgcgctg cgccgggcgg gcgcggagcc cgggcggatc ggctacgtca acgcgcacgg 16560
caccggcacc ccgctcaacg acgtggcgga gaccgcggcg ctgcaccagg tgttcggcga 16620
gggcgtccac ggcgttccgg tgagctccac caagagcagc accggtcaca tgctcgaggc 16680
caccggggcg gtggaggccg tcatcacgat gctcgccctg cgcgagggcc tgttgccgcc 16740
caccctcggc accctggagc ccgaccccgc gtgcgacctg gaccacgtgc gggacaccgc 16800
ccggccggcc cggatcaccc acgcgctgtc cctgaacgcc gccttcggcg gggtggacgc 16860
cgcactcgta ctggaggcgc cgtgaccgtc ccggacaccc acccgcgcac ccatcggacg 16920
gcaggcccgt ccgccccggc gcgcgccctc ctctcggcgg cctgccgcac cccctggggc 16980
ggcgcggcga ccgggctgcc cggcgcggca ccggtcgaac tgccccgcgt caccggcttc 17040
gtgacctccc gcttcagccc cctcgtgcac agcgtggcca ccgagtgcct gggcgcgccc 17100
ggctccgcgg acgacctcgt cggcgcggcc gggccgcgta ccgggacggt cctggccacg 17160
atgttcgggg acacggtgac gctggacacg gccacccggc ggctgaccga gggccaggtg 17220
cacagcccgc tgctgttctt ccagtccgtc accacctcga tcctcggccg gctgggccag 17280
tcgtacggca tcaccggccc cgtcgagtgc ctctcggtcg cccgcgacgg agccggcgag 17340
gccctctcgg ccgccgatct gatgctggag caggaggaca tcgaccgcgt gctgctggtc 17400
ggcgtcgagc tcgccgccaa tgagcgggcc acctggatcc accggcgcat caccgggccg 17460
gacggtccgg acccgctgcc cgacggggac tgcgccgtcg ccctgctgct cgcccgcacg 17520
gacgagggca ccgggcgggt gctcctgcgc gccggcgcgg ggagcggttc cccggcggac 17580
cgggccccgg cggacgcccg ccactcccgc ttcggctggc tggcgcccct ggtggcggcc 17640
gccgaggccg tgcgcccgcc ggagggcggg cccgtgccgc gcccggtccg tgtgccgggc 17700
cggtacggct acgtggtcgc cccggcggac cgggccgcgg cgcccgccgc tccgggaggt 17760
ccggcatgac ggccgccgaa tccgcccccg gcacgctggt ggcgcgcatg ggcatcgaga 17820
tcgtcgagga ggacccccgg cggctcgtcg cccggatgcc cctgacgggg aaccgccaga 17880
tgtacggctt cctgcacgga ggggccagcg cggccttcgc gcaggcgctc gccacgcacg 17940
ccgccgccct ggaggccggc cccggcggcc gggtcaccgg ccaggagctg tcctgcaccc 18000
accaccgggc ggcccgcggc gagggctggg tggaaggggt gtgcaccccg ctgtacctcg 18060
gcgacgcgtt cggcacctac gacgtggccg tccacgaccg gcgcggcaac cggatcgcct 18120
cggcccggct cacctgccgg ctgcggcggg ccgccggccc gtccgctcgc cccgcgccca 18180
ccggggagtc cgcactttcc agggagcccg cactttccga ggagtccgca tgagcacgac 18240
cgagcccgtg gaggacaggg ccgcggtact ggccggcgtc gggggctggg tgcccccgca 18300
cgtcgtcacc aacgacgacc tctccgccca tctcgacacc tccgacgaat ggatccgcac 18360
ccgcaccggc atccggacca ggcaccgggt ctcccccggc atggccacct ccgacctcgc 18420
ggtggaggcc ggacggcggg cgctggactc ctccggcgac gaccgggccg gggccgtcgt 18480
cctggccacc acgacacccg accggatctg cccggccacc gcccccgacg tggccgcccg 18540
gctcggcctg gccggggtcc ccgccttcga cgtctccgcc gtgtgcaccg gcttcctgta 18600
cgggctggcg accgcggcgg ggctgatcgc caccggcgtc gccgaacgcg tcctgctcat 18660
cggggcggac gcgttcacca ccatcgtcga cccgacggac cgctcgaccg ccgtcatctt 18720
cgccgacggc gcgggggccg tcgtcctgcg ggccggccgg ccggaggagc ccggcgcgct 18780
cggcccggtg gtgctgggca ccgacgggac cctcagccat ctgatccggg taccggcggg 18840
cggctcgcgg cagcgctcgc tggcccccac gcacgcgccg ggcgagcagt tcttccagat 18900
ggagggccgg gacacgttcc ggcacgccgt ggaccggatg gcgaccgcct cgcgccaggc 18960
cgtcgcggcc gcgggctggt cgatgggggg cgtcgaccgg ctggccgcgc accaggccaa 19020
cgcgcggatc ctgcacgcgg tggccgaccg gctcggcatc cccgccgagc accagctctc 19080
caacatcgcc gaggtcggca acacgggcgc cgcctccatc ccgctgctgc tggcccagtc 19140
cgccgcggac ggcggcctgg aggccgggca ccgcaccctg ctcaccgcct tcggcggcgg 19200
tctcgcctgg ggcgcgacca cgctcacctg gcccaagctg tcggccggct gagagcgccg 19260
gccgccccgc gccacgccat ccacctcccc cacggagact cgtacccaag gagacgaccc 19320
gaccatgttc acagcactgc gtgacatcct cgtcggcccg ttcaaggtcg atccggagaa 19380
ggtcaccccc gaggcgaccc tggagcagct cggcctcgac tcgctgtccg tcgtcgaact 19440
ctcgctgatc ctggagaagg acctcggagt gagcgtcacc gacgacgagt tgctgcagac 19500
cccgacgatc ggcgccatgg ccgagctgat cggcgagcgc ggcgccccgg tctgatgccc 19560
acctcgacga gcccgagcgg ccatgccccc gcggtccggc gggaggcgag cgacggcgag 19620
gcctaccgcc gcgcgatggg acggttcccc accggggtcg ccatcctgac gcaggggtgc 19680
ggaccgctga cccgggcggt gaccgtcaac tcggtcacct ccgtgtccct ggacccgcaa 19740
ctgctgtcgg tctgcctcgg cgaggacagc acggtcctcg aaccgctgct gcgggccggg 19800
cacttcaccg tgaacctgct gtccagcgcg caacgcgagt cctgcgcgcg cttcgccggc 19860
cggagccggc cgaccggggc cgacgcccac gaggaactcg gcgggagccg gggggacaac 19920
ggctgcctgg tcgtcgaggg cgcgctggcc gccctggagt gccgggtcga cggcacggta 19980
cgggccggcg accacgtcat cgtcctgggc cgggtcgaga cgctgcacca cggtccggcc 20040
gaggcggagc cgctggtctt ctacggcggc ggctaccgct ggctggcccc gcccgccccc 20100
ggcccgcgct gacccggaca ctcccgcccg tcccccacca cgccaccagg cacggcgccc 20160
cccgcacacc ggcacacctg cccgtgcgcc gcacggcacg ccgcccgaca cgaaggagcc 20220
atcatgtccg accacccgag gaccgccgag gcacagccgt gcggcgtggg catcagggcc 20280
atcggccagt acctgcccga gcgggtcgtc accaacgccg acctggagcg gatgatcgac 20340
accagcgccg agtggatcac cgagaagatc ggcatccact cccggcggtt cgcggcggag 20400
agcgacacca ccgccacgat gggcgcgagc gcgctcctcg acgcgtgcac ccgctccggc 20460
gtcgacccgg actctatcga cctggtgatc tgcggcaccg tcacccccga cctcatggcg 20520
ccggccaccg cggtgtccgt catgcggcac gcggggctga cccaggccgt ggccttcgac 20580
gtgaacagcg gcggctgcgc cggttccgtc ttcgcgctcg acgtggccgc caagtacgtg 20640
cgctccggcg cctaccgcag ggtcgccgtg gtgctcgccg acaccgtcac caagctgctg 20700
gacccgaccg accggatgac cgcggtcatc ttcggcgacg ccgcggcctg ctatctcgtc 20760
gagccggtgg tgcccggcag cggcgtcacc accaccgtgc tgagcaacga cccgagcggc 20820
taccactcgg cgctggtctc ccgggacccg gtcaccgacg ccgagggcaa ggaggtccac 20880
tccgccttcg ggcagaactt catccgcatc gtcgggcgcg acatccgcaa cttcgccctg 20940
gagaacatcc cgggcttcgt ccgcaagctg gcggaggagg agaacctcac tccggaggac 21000
ctcgacatgg tggtgctcca ccaggccaac cggcgcatcg tcgaggggat catggacgcc 21060
ctgcgcctgc cgtacgagcg gacgtccatc aacgtggacc gcttcggcaa cacctcggcc 21120
gccggttccg tgctcgccct gcgcgaggcg gtggacgacg gccggatcac cgccggcgac 21180
cgggtggtgctggtc tcctt cggggccggg ctgagcgtgg gcggcgcgct gatgcgctgg 21240
aacgccccgc aggacttcct cgccgccccg tgaggaacag cgcgaggaat cccgtgcgga 21300
gccaggagcc gaccgtcgcg gagacacccg cgcggacccg tgccggggcc ccggtcgtgc 21360
cgcccgggct gccgatccgg ctcggttcgc tggacccggc cgaactggtc accagcaccc 21420
tcggcgtgcg gatcaccgag tggcgcaccg gccggctcgt cggcaccctg cccctcgcgg 21480
gcaaccgcga ccggtacggg cggctcgacg gggccgccct ggccgtcctg gccgagacgc 21540
tcggctcggt cgccgccgcg ctcgacctcg gggagggcgg catcgtgctg ggccaggaac 21600
tgtccctggc gcaccacgag gaggtcaccg gggaggggag cgtcaccggg gtctgcaccc 21660
ctctgcaccg cggcgaggac gtcgccacct acgaggtcca cgtcaccgac acgcacgccc 21720
gccgggtgtg cacggcccgc ctcacctgca ccctgcgccg caccgcgcgc cccccggccc 21780
gccccgccgg cccgcctgga ccggccggcc ccgtcaccga aacccccgcg cccaccggca 21840
ggaaggtctg aaccgccatg cagtctcacc ggccgccacg ggacccgtac tgggaccgga 21900
tcggctatca cggcccgctg gagccgaccc tcgacgtgct gcgcgagatc tgccgcaagc 21960
acgtcctgga ggtgcccttc gaggccctgg aggggcccga gggcatccgt ccggtcatcg 22020
accgggcggg cgtctacgac aagatcgtga cccggcacgg cggcggcttc tgcctccagg 22080
ccaacgggct gctctctcac cacctgcggg agatcggctt cgacgtgacc gtgctggccg 22140
cgcacatctg ggtcccgcac cgcgagtact tcagcaaggg cggcgaccac ctgatcatgc 22200
tggtccggct ggacggcagg gagtggctgg tggacgccag ctacacccac ctcgtctacg 22260
tcgaccccat cgagctggtc cccggcgagc agcgccagga cggctgggtg taccgcgtgc 22320
gggccgagga cggctggtac gtggtccagc gccggggcga gcgggagtgg ctgccgctct 22380
accggttcgt gccggaggcg cacacggtgg aggacttcga ggagtcggtc gccttccacc 22440
tcgacgggga gaccgtctcg gagaccaccc gcacgctgat gtgctcgcgt ggcatccgcg 22500
gcggcaaggt ctccctggtc aacaacgtgc tcacgatcgc cgagcacggc acggtgacca 22560
cccgtcaggt gcgcgacgcg cgggactgcg cgcagatcat ggcgcgcatc ttccgcggtc 22620
accggggtct cgccgagcgg ggcctgcgca tctgggagcg gatgcgggag gaacgcgagg 22680
ccgccgggtc ggcgccgcgg cccacggccg cgcagggcgc ctgactcccg caccggacaa 22740
cgacggagga cgtctgatga cgatcgacag cagcacaccc gtcgccgtgg tgggggcggg 22800
cgtcatgggc gcggggctgg cccaggtcgc cgccgccgcg ggacacgagg tggtgctcca 22860
cagccggcgg gaggccaccc tgcgccgggc cctcgccggc atcggcgcct ccctggaacg 22920
ggcggccgcg cgcggcgggg gcgcgcgggc ggaggatccc ggcacgacgc tcgcccggat 22980
ccgcaccacg acggacctgg gggacgtcgc cggctgcgcg gtcgccgtgg agtcggtcgc 23040
cgaggacgtc gacctgaagc ggcgcgtctt cgccgagctg gaccggctct gcccgccggg 23100
cgccctgctg gccaccaaca cctccggcat tcccgtcacc gagatcgccg cggccaccgg 23160
ccggccgggc tccgtcgtgg gcacgcactt cttctcaccc gtgccgcgca tggagctgtg 23220
cgagatcgtg cggggccggg agaccaccga cgccaccgtc gccgcggcgc gctccttcgc 23280
cgaggggatc ggcaagagct gcgtggtggt ggagaaggac ctgcccggtt tcgtcaccac 23340
ccgtctgatc atcgccttcg tcctggaggc ggtccgcctg gtggagacgg gcatctgccg 23400
ggccgaggac gtggaccgtg cctgccgtct cgccttcggg cacgcgatgg gaccgctggc 23460
caccgccgac caggccgggc tcgacgtgct gcgcgaggtc gccgccgggc tggccaagga 23520
gtacacccac ccggtcttcg ccacccccgg cctgctggac cggctggtcg cggagggccg 23580
gcacggccgc aagaccgggc gcggcttcca cgtctacgac gacaccaccc ccgcgcccac 23640
ccgcccctga ccccgatccc ccagctcccg actcccgact cccgactccc atttttcagc 23700
tttcagtttt cagctccgct tcacaccacc accggaaggt tctcccgtga agttcgcctg 23760
gatcgacctg cgttccaccc acgacgacct gcgtgccggc gtggtcgacg ccgccgtcca 23820
cgcccgcctc gaaggagtgc tcgacgaccg gctcgaggtt ctgcgcaccc tgccgcccac 23880
cgtcaccaag gtcctgctcc ccgcgcccgg cgacccgctg cccgccgagg ccgccgacgt 23940
cgccgacatc gtgctgaccc gggtcggcac cgccgccgag ctcgacaagc tcaagctgga 24000
gagcgagagc gacccggccc gcacggccgc gttcgtggag gtcgtcgacg acgccaccct 24060
caaggtcgcc tgcgaggcgg cccgggcgct gcccaacacg ctcgtgaagt tccgcgaccc 24120
gaccaagatc ccgctggaga tcgtgatcgc cgccgccgac cacagcccgg gccggctcat 24180
ctgcgaggcc ggcgacctgg aggaggcggg catcgtcgtc gacgtcctgg agaagggctc 24240
cgacgggctg ctcctggcgc ccaaggacgc caatgacgtg ttcggtctga ccgggctgct 24300
ccgcggcagc agccccgatc tgtcgctcac caccctcacc gtgcggtcca tcgagcacaa 24360
cggcctgggc gaccgggtgt gcgtcgacac ctgctcgcac ttcgggcagg acgagggcat 24420
cctcgtcggc tcgtacgcgc acgggttcgt cctgtgcgtc agcgagaccc acccgctgcc 24480
gtacatgccc acgcgtccct tccgggtcaa cgccggcgcc ctgcactcct acgtcctggg 24540
cgaggacaac cgcaccaact acctcagcga gctccaggcg ggcagcacgg tgctcggtgt 24600
caccacggag ggcaagaccc gccggatcgt ggtgggccgg gtcaagctgg agtcccgccc 24660
catgctgacc atccgggcgg tgtcggagtc cggtacggag gtcagcctca ccgtccagga 24720
cgactggcac gtacgggtgc tgggcccggg ggccgccgtc ctgaacgtca ccgaactgaa 24780
ggccggggac cagctcctcg gctacctggc cgacgacaag cgccatgtgg gctggccggt 24840
cggcgagttc tgcatcgaga agtagcccgg agaacggtcg cggcggagac gggtccgccc 24900
cgtctccgcc ggcccggccc ggccccgccc ggccccgcgc ccggcacacg cgcgctcgcg 24960
cacttcgcgc acacggaagg aaaggatgcg atggctgtgg actcggccgc cccggacttc 25020
gggcgatggc tcgacacggc gctcaccggc gacgacctgg acgaggaggt ctgggggcat 25080
gccggacggg cgatgtcctt cggccggatg cggaaggaga cggcccgcac gcgggaggtc 25140
ctggcggccc acggcatcgg ccccgacagc accgtcgccg tccagctcct gcccagcttc 25200
accctgctgt ggacggtgtt cgccgcctgg tcggcgggcg cccaggtgat gctgatggac 25260
ccccggctca cccccgcgga gaccacccgg ctgctggacc tgtgcgaacc gcagttccac 25320
ctcgccgtcg agggaccggt gccgctgtcg gcgccgttcc gcgaggagtg cgagatcgtg 25380
gtcctgcccc gccgctcggg ccggcccgcg cagagtgccc accgcctggt gcagttcagc 25440
tcgggctcca ccggcctgcc caaggtcatc gggcgcaccg ggcggtcgct gctcgacgaa 25500
ctggagcgtt tcgcccggct gcccgacatg ccccggcacg gtgaacgcct gctcctgctc 25560
agctcgatgg cgtactcctt cgggctcatc gggggcgtgc tgcacagcct gcggaccggc 25620
gtctcgctgc acttcagcgg cagtacccag ccgcgcgagc tgctgcggct gctcgcggag 25680
cgggagatcc acgcgctgtt cggggtgccg gtccacttcg acctgctgag ccgggtcggc 25740
cgccccggcg gcctgccgtc cctgcggctc gcggtgtccg gcggggaacc gctgcggccc 25800
gaggtcttca cgcgcttcga ggaggccttc ggtgtacgga tcgggcaggc ctacggcatg 25860
acggaggcgg gcatcatcgc caccgacctg accggccggg ccgcgccgcc ggccgtgggc 25920
acccccgccc ccggcatgcg gaccgaggtg gcggacggca ccctgcgggt gcggctcccc 25980
gaggatccgt atctgcacgc ggaccggtcc gggcgctacg cggacggctg gctcgacacc 26040
cacgaccgct gccgggtccg gccggaggac ggggtcctgg agatcctcgg ccggaacgac 26100
tcgacggtga tgatcggcgg cctcaacgtc gacctcaccg aggtcgagtc ggtggtgctg 26160
gcacatccgt cggtgacgga cgcggtggtg gtgtacggcg aggcgatcga ggcccatctc 26220
gtcgccgaac cgacgctggc caagggtgag ttgctggcct ggtgccgaga gcggctgagc 26280
ccgcacaagc tgcccaaggc gctgcacttc gtgcggaagc tgccgcgcac cgcgaacggg 26340
aagacggtcc gcaaccgcga gctgctgcac gcgagccggg agcgggaacg gcaggtgatc 26400
atccggtgat cgacccctcg tacgcgggca cccgccatcc gcgcttcgac gccgaggtcg 26460
agcgcggccg gctgcgatcc ttcgccgccg cggtgggtct ggacgaggcc gtcttccacg 26520
acgtcgacgc ggcgcgtgcg gccggccatc cggacctgcc cgtcccgccc accttcctgt 26580
tcggcctgga actggagcat tcgcaggaca cactcgccgc gatgggagtc gagatggcgc 26640
gggtcctcca catcgagcag ggcttcgtct accactcgac ggcgcacgcc ggtgaccggc 26700
tcaccttcgc gccggtcctc gtgtccgtcc gcgctcaccg gggagcacgt ctgcagctcc 26760
tcgccacgga gacggccgtc acccggcggg acggcacccc ggtggccgac ctccgccagg 26820
tcctcgcggt ccgcgaggac cccgccgcgc gggatgcgcg gagcacgggg gctgcctcgt 26880
gagggtggac ccggccggcc tcgccgtcgg caccgaactg cccgagctgg tgccaccgcc 26940
cgtgacccgg gcgatgctcg ccctgtacgc cggggcctcg ggcgaccaca acccgatcca 27000
catcgactcg gacgcggcgg tggccgccgg gctcgaggac gtcatcgccc acggcatgct 27060
ctcgatggcg ttcctgggcc gcatgctcac cgcccgggtg cccgtggagg acctggtgtc 27120
cttccgggtg accttccgcg cgccgacccc ggtgcacgcc aggccgcgct gcaccgcccg 27180
ggtcgtctcc gtcgatccgc ccgccgacgg gagcgacggt ccccgcacgg cacggctcga 27240
cctcaccgta cggctggagg acggccccgt gaccgtgcgc ggcgaagcgg tcgtacgcct 27300
gcgggacacc ggtgcggtcc ccgctccgcc ccactgatcg aggaggctcg acgatggcac 27360
gatccgtgct ggtcacggga ggcaaccgcg gcatcggccg cgccgtcgcc caggcgttcg 27420
cccgccaggg cgaccgggtg gcggtcaccc accggggttc cggggcgccc cccgggatgc 27480
tgggcgtcaa gtgcgacgtc accgacgccg cccaggtgga cgccgcgttc gcggaggccg 27540
aggccgccca cggcccggtg gaggtgctgg tgtccaacgc cggcatcacc gacgacgcgc 27600
tgctgctgcg gatgccggag gagcggttcg cccgggtgct ggacaccaac ctcgccggcg 27660
cctaccgggt ggtgcggcgc gcggtgcccg gcatgctgcg gatgcggcgc ggccggatcg 27720
tgctgatgtc ctcggtgtcc gggctgtccg gtgccgtcgg ccaggccaac tacgcggcga 27780
gcaaggcggg catggtgggc atggcgaggt cgctggcccg ggagctgggc gggcgcggga 27840
tcaccgtgaa cgtggtcgcc ccggggctgg tcctgacgga catggccgag accgtctccg 27900
ccgcccgcaa ggagcagatg ctcgccgggg tgccgctcgg gcggcacgcc gagcccgagg 27960
acgtggcggg gccggtgcgc tggctcgcct cggaggaggc cgggtacatc accggggccg 28020
tgctgcccgt cgacggcggc ctgggcatgg ggcactgacg tggtcggcga cgcgcggcgc 28080
gcggcggaca cggagcgggc cggcgggccg ggaggggagc actgatgcgg atcgcgatgg 28140
cactgccgta cgcggggagc ggcttccggg agacggcggc ccggctggtg gactacgagc 28200
gggccgggct ggaccgggtc accgtccggg aggcctacgg ctgggacgcg gtcagtcagt 28260
tggggtatct ggcggcggtc accgtacgtg tggagctcgc ctccggcgtc ctgccgctgc 28320
ccacccgcac gcccgcgctg ctggcgatga cggcggccgg cctcgaccac gtgtccggcg 28380
gccggttcgt gctcgggctg ggtgtgtcgg gaccgcaggt ggtcgagggt ttccacgggg 28440
tgccggccga cgcgccgctg gcccggaccc gcgcggtggt cggcatctgc cggaccgtgt 28500
ggcggcgcga gccgttgacg taccgggacc ggcactatcg catcccgctg accgccgagg 28560
acggcggaac ggggctgggc aagccgctga agctgatcaa ccggcccgag cgcgaccgga 28620
tcccgatcgt gctggccgcg atggggccgc gcagcgtcgc cctggccgcc gagatcgccg 28680
agggctggga gccgatctgg ttccaccccg agcgggccgg gcaggtgtgg ggcggggcgc 28740
tggccgaggg cgccgcgcga cgcgctcccg cgctgggcgc gctcgacgtc gtcgccccgg 28800
tgcacctggc gatcggcgcg gccgaggagt cgcgtgccct ggcggcggtc cgcgccgaca 28860
tggccctgta cgcgggcggc atgggcgccc gcggccgcaa cttctaccac gacctcatgt 28920
gccgcttcgg atacccggag gaggccgggc gcgtgcagga gctgtatctc gccggacgtc 28980
ggcaggaggc cgccgaggcc gtcccggagg aactggcgcg ggcggtctcc ctggtgggca 29040
ccgaggacgt ggtgcgcaag cgggtggccg cgttccgcga ggccggcgtc accacactga 29100
gcgtcgtccc cacggccgcc acccatgccg cccgggtgga cgcggtgggg cggctgaggg 29160
atctggccgg ccccttcggc tgacggaggc ggaagcggac ggcgaacgcg gaagcggaag 29220
cgggctcggg cgcccggccg ccgacggcgg ggagcccagc ctcctgcccg gccgcccccg 29280
gccccgtccg ccgcgcacct gccccacccg gcccgcgcgg tactgaacgc gggcgtacgg 29340
gcgcacgtat ggagggacgg cgcccgacga ccggggcgct ccgtacggtg gtggcccgcc 29400
ggcggtgttc agcggttcgg gagccctgca tgaggcacgt acgacgacgg atcgtccgac 29460
gcgggatacg gctgtcggcc gtcggcggga ttctcctggg gggcctgatg gtcacccagg 29520
ccatggccac cgagccggcc ggcggcacac cggcgcccgg cgcgcacgcc gccggttcct 29580
ccgtcgagtc ggccgccgcg cggggcgccg ggctcgtctc ccggctcggc accgggcgca 29640
ccgccggcac ctggatcggc gccgacggcc gccccgtggt cgccgtgacc gacgcggggg 29700
cggccgggac ggtgcgggag gccggggccc gcgccgaggt ggtgcggcac agcatggacg 29760
agttgaggtc cgccacgaag agcctgcgca cggcgccccg ggtcacgggc accgcctggt 29820
ccgtggacta cacccgcaac gaggtcgtgg tacgggcgga ccccaccgtc tccgccggtg 29880
actggtcgcg gctgacgcga ctcgccgatt ccctgggcgg cagggtgcgg atggagcgca 29940
cgaagaccga gttcaccacc aggctgaacg gggcgcagcc catgttctcc accggcggcc 30000
gctgttcggc cgggtacaac gtgaccgacg ggcagggttc cttcatcctc accgccggtc 30060
actgcgggcc caagggcgcg gtgtggttcg ccgaccaggg gggcgcgacc gagctcggcc 30120
agacggtgtc ctcccgcttc cccggcaacg acttctcgct catccggtac ggcaacgggc 30180
agtcggccgg ggcggacacc aacgtgatcg cgatcggcgg cggcaagggc gtgcgcatcg 30240
cgggggcggg agacgcggcg gtgggccagc gggtgttccg cagcggcagc acgagcgggc 30300
tgcgcgacgg caaggtgacc gggctggacg cgacggtcaa ctaccccgag gggacggtga 30360
ccgggctcat cgagacggac gtgtgcgccg aaccgggtga cagcgggggg ccgttgttct 30420
ccgacgggct cgcgctgggg gtcacctcgg gcggcagcgg ggactgcgag agcgggggga 30480
cgacgttctt ccagccgctc cggacggcga tgagcgcgct gggcgtgcgg ctggcggggg 30540
acggctcggg cgggaaaccg tcctcggcgg cggccggtgc gccggagccc tcggcctccg 30600
cctcccaggg agcggtgatc gcccccgggt cggcgaaccc cggcgcggtc gagcaggtcg 30660
gtgcgggggc ggccccctcg ctcgccgccc ggctcaccga tccggggacg gtgggcccgg 30720
ggctgctggt cctcgcgggg agcatggtgg cgtgggtggc ggcgcggtac atccgctcgg 30780
agcgggaccg ggaggcctac cgcaggcagt acgcccgcag ctggagctga 30830
(a)序列特征
●长度:30830
●类型:碱基序列
●链型:单链
●拓扑结构:线性
(b)分子类型:双链DNA
(c)假设:否
(d)反义:否
(e)最初来源:海洋链霉菌Streptomyces griseoaurantiacus M045
(f)特异性名称:DNA
以下结合具体实施例,对本发明作进一步说明。
1、海洋链霉菌M045基因组DNA的提取
从斜面保存的链霉菌M045菌落上,用接种环刮下孢子,划线接种于M2 +固体培养基上,28℃恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0.5cm2琼脂块,接种于250mL液体M2 +培养基中,28℃恒温振荡培养3-4天。收获培养液,8000rpm、4℃离心10min,弃去上清液,沉淀用50mL灭菌的双蒸水重悬。
进行海洋链霉菌M045基因组DNA抽提:取20mL混悬的菌液,分装于10个2mL的离心管,12000rpm、4℃离心10min;弃去上清,沉淀用1mL灭菌双蒸水重悬,12000rpm、4℃离心10min;弃去上清,沉淀用1mLTE缓冲液重悬,12000rpm、4℃离心10min;重复洗涤一次;沉淀的菌体用1.5mL的TE重悬,制成菌体混悬液,加入50mg/mL的溶菌酶200μL,37℃水浴过夜;加入10mg/mL的蛋白酶K 20μL,37℃水浴2hr;然后加入20%的SDS至浓度为2%,60℃水浴30min;12000rpm、4℃离心15min,取上清,每一管上清分装于两个1.5mL离心管中,分别加入每管上清液体积的1/2体积的Tri s饱和酚,每管上清液体积的1/2体积的氯仿∶异戊醇(其中氯仿和异戊醇按体积比为24∶1混合),缓慢摇动5min,12000rpm、4℃离心15min;取上清,加入与上清液等体积的氯仿∶异戊醇(其中氯仿和异戊醇按体积比为24∶1混合),缓慢摇动5min,12000rpm、4℃离心15min;重复抽提一次;取上清,加入上清液1/10体积的5mol/L醋酸钾,缓慢混匀,然后加入上清液2倍体积的无水乙醇(-20℃预冷),缓慢摇动,至出现大量絮状沉淀;用枪头把絮状沉淀挑出,置于新的1.5mL离心管中,加入70%乙醇洗涤,12000rpm、4℃离心15min,弃去上清,并使沉淀中的乙醇挥干;将所获得的DNA沉淀用50μL ddH2O溶解,取5μL,用1%琼脂糖凝胶电泳检测,剩余样品置于-20℃保存。
上述海洋链霉菌M045,于2009年7月3日保藏于“中国生物菌种保藏管理委员会普通微生物中心”,其保藏登记号为:CGMCC 3161。
M2 +固体培养基为:麦芽提取物1g,葡萄糖0.4g,酵母提取物0.4g,琼脂粉1.8g,人工海水50mL,去离子水50mL。
M2 +液体培养基为:麦芽提取物1g,葡萄糖0.4g,酵母提取物0.4g,人工海水50mL,去离子水50mL。
2.海洋链霉菌M045全基因组shotgun测序
利用Roche 454 GS FLX第二代测序技术进行规模测序,获得的数据利用GS de novo Assembler Software进行拼接,最后获得海洋链霉菌M045的基因组草图。其为线性基因组,7,712,377bp,GC含量72.73%。该基因组中,预测得到6839个开放阅读框(ORFs),614个预测蛋白是其特有的,发现660个paralog蛋白家族,4416个预测蛋白可以归到COG数据库,预测234个蛋白属于分泌蛋白,1352个蛋白属于跨膜蛋白,106个蛋白是脂蛋白。
3.海洋链霉菌M045基因组fosmid文库构建和筛选
取链霉菌M045的大片段基因组DNA溶液200μL,按照每管10μL分别置于20个200μL的离心管中。然后用10μL的微量进样器(Agilent,10μL Syringe)反复吹打40次,以剪切DNA,获得40kb左右的DNA片段,然后按照EPICENTRE公司的CopyControlTM Fosmid Library Production Kit构建fosmid文库,库容为6万左右克隆。
中尼霉素和手霉素A具有2-氨基-3-羟基-2-环戊烯酮(2-amino-3-hydroxycyclo pent-2-enone)的C5N结构,它是由5-氨乙酰丙酸合成酶和5-氨乙酰丙酸辅酶A连接酶催化生成的,其中5-氨乙酰丙酸合成酶催化最关键的第一步反应。根据链霉菌M045基因组的序列,设计5-氨乙酰丙酸合成酶基因(chiD2)的引物ALAS1F(5’ATGAACCGACTCCTGGAC3’)和ALAS839R(5’AGCGAGGTGGTGAAGATGAAC3’)。以链霉菌M045的基因组DNA为模板,进行PCR扩增,反应程序为:94℃,5min;(94℃,50sec,55℃,50sec,72℃,1min)×30cycles;72℃,10min。扩增产物经测序,与基因组上的chiD2序列完全一致,ALAS1F/ALAS839R可以作为筛选引物进行fosmid文库的菌落PCR筛选。于是完成了192个fosmid克隆的菌液PCR筛选,获得2个有阳性扩增片段的克隆Fos0036B1和Fos0036E8。通过fosmid末端序列分析,对Fos0036E8进行完整fosmid的测序。
4、手霉素A和中尼霉素的生物合成基因簇分析
如图1所示,手霉素A和中尼霉素属于手霉素类化合物。手霉素A最早是从链霉菌Streptomyces parvulus Tü64分离得到的(Buzzetti etal.,1963),手霉素化合物被认为是一族新的抗生素,随后又分离得到有类似结构的化合物如asukamycin(1976;Kakinuma et al.,1979),U-62162(Slechta et al.,1982)和U-56407(Brodasky et al.,1983),丰富了此族抗生素,以上这些手霉素类化合物的核心结构是m-C7N结构。而中尼霉素是从海洋链霉菌中分离得到的(Li et al.,2005),中尼霉素中心芳香环结构是p-C7N结构单元,且有氯的取代,是第一个来自天然的para-C7N结构,同时在该海洋链霉菌中分离得到手霉素A。经序列分析,获得了海洋链霉菌M045染色体上30,830bp的连续区域,GC含量为74.48%,生物信息学分析包含了32个开放读码框(如图2):其中有两个序列很短,为未定功能蛋白chiU1/U2;chiA1/A2/A3三个功能基因编码的蛋白参与了核心C7N结构的合成和转运;chiB1/B2/B3/B4/B5/B6/B7/B8/B9参与了upper聚酮链的合成和延伸;chiC1/C2/C3/C4/C5C6/B7/B8/B9参与了lower聚酮链的合成和延伸;chiD1/D2/D3参与了C5N结构单元的合成和连接;chiE1/E2/E3/E4是合成过程中的氧化还原酶,其中chiE4可能催化了氯的取代和lower聚酮链的重排,从而使手霉素A转化为中尼霉素A;chiM1/M2是转运和分泌蛋白,用于药物的转运;chiR1/R2/R3是转录调控因子。
5、5-氨乙酰丙酸合成酶基因(chiD2)基因敲除载体的构建
目前在放线菌中已经建立了非常成熟的基因克隆和功能分析系统,其中最为常用的是基于同源交换的基因敲除和基因置换技术。质粒pHZ132具有硫链丝菌素抗性标记,携带链霉菌质粒pSG5的复制子,该复制子是一个温敏型复制子。pHZ132在30℃培养时具有良好的遗传及结构稳定性,而在37℃培养时质粒会丢失,因此pHZ132可以用来在放线菌中用于基因敲除实验研究。而载体pHZ132具有单一的BamH I酶切位点,因此把BamH I的酶切位点引入5-氨乙酰丙酸合成酶基因的扩增引物中(ChiD2F:5’ATCGGATCCATGAACCGACTCCTGGAC 3’;ChiD2R:5’CTA GGATCCAGCGAGGTGGTGAAGATGAAC 3’)。将带有BamH I酶切位点的chiD2基因和经过BamHI酶切的pHZ132线性载体,用T4Ligase(TaKaRa)进行连接,16℃连接过夜,然后利用氯化钙法转化E.Coli Top10感受态菌株,37℃培养过夜,获得大肠杆菌-链霉菌穿梭质粒pHZ132D2,如图3。
6、大肠杆菌-链霉菌间的接合转移
链霉菌M045单孢子悬液的制备:加2mL无菌水于链霉菌M045孢子生长丰富的M2 +固体培养基,用接种环轻轻刮下琼脂表面的孢子,并用无菌水清洗几次;将菌悬液用无菌吸管转入装有无菌玻璃珠的三角瓶内,在摇床上或手动摇动30min,尽可能用力破坏孢子链;然后将此孢子悬液倒在装有脱脂棉花的漏斗中进行过滤,以除去菌丝和不小心刮下的琼脂;5000rpm,4℃离心10min,去上清;用2×YT培养基(胰蛋白胨1g,酵母粉1g,氯化钠1g,dd H2O 100mL,pH7.0)洗涤两次,每次10mL,5000rpm,4℃离心10min;最后加入2.5mL 2×YT培养基重悬孢子液,制成1010cfu/mL的孢子悬液,立即用于接合转移或悬浮于20%的甘油溶液中,贮于-80℃冰箱中。
供体菌感受态细胞制备:将含有oriT的大肠杆菌-链霉菌穿梭质粒pHZ132D2转入大肠杆菌ET12567(pUZ8002)中,得到供体菌株ET12567(pUZ8002,pHZ132D2);挑单菌落接种于5mL LB培养基(加入作用浓度为25μg/mL卡那霉素和氯霉素以及50μg/mL氨苄青霉素)中,37℃培养过夜;将过夜培养的菌液按0.1%的比例接种到20mL新鲜的LB培养基(含有25μg/mL卡那霉素和氯霉素以及50μg/mL氨苄青霉素)中,37℃培养至OD600=0.4-0.6;5000rpm,4℃离心10min,沉淀菌体,用新鲜的LB培养基(不含抗生素)洗涤两次,目的是把原来培养液里的抗生素充分洗掉。最后将菌体悬浮于5mL LB培养基中,分装0.5mL于10个1.5mL离心管中,-80℃备用。
接合转移:将制备好的链霉菌M045单孢子悬液,50℃水浴热激活30min,37℃预萌发2.5hr,冷却至室温;将供体菌ET12567(pUZ8002,pHZ132D2)与链霉菌M045单孢子悬液各0.5mL于1.5mL离心管中混合,10000rpm离心10sec,弃去大部分上清;用管底残留的少量液体进行重悬,然后把悬浮液涂布于含有10mmol/L氯化镁的MS培养基(甘露醇2g,大豆蛋白胨2g,琼脂粉2g,dd H2O 50mL,海水50mL,天然pH值)上;28℃培养24hr,然后用1mL含硫链丝菌素(作用浓度25μg/mL)和萘啶酮酸(作用浓度50μg/mL)的水溶液覆盖。28℃继续培养大约20天至平板上长出链霉菌的灰白色孢子。
7、链霉菌M045突变株的分子检测
因为pHZ132D2是温敏性质粒,转入链霉菌M045后,通过添加抗生素,并在37℃培养,可以提高阳性转化子的筛选效率。在高温下培养,可以使游离质粒pHZ132D2上的链霉菌复制子失活不能自主复制,而只能通过与染色体上的同源片段进行交换,随着宿主基因组的复制而复制,由此就发生了基因中断。通过硫链丝菌素抗性基因(tsr)的PCR检测,野生菌株w完全没有扩增信号,转化株a,b,c有很强的扩增信号,同阳性对照的扩增片段大小一致(如图4),载体pHZ132D2已经成功导入a,b,c转化菌株内。用DIG DNA Labeling Kit(Roche)标记抗性基因tsr作为探针,进行突变株的Southern blot检测,突变株a,b,c具有阳性的杂交信号,野生菌株w没有阳性信号(如图5),可以认为载体pHZ132D2已经整合在链霉菌突变株的基因组上。
8、链霉菌M045突变株代谢产物的化学分析
从链霉菌M045及其突变株固体平板上,用接种环刮下孢子,划线接种于M2 +固体培养基上,37℃恒温培养3-4天,待长出丰富的灰白色孢子,用接种铲切割下0.5cm2琼脂块,接种于250mL液体M2 +培养基中,37℃恒温振荡培养3-4天,将发酵液冷冻干燥,得到固体粉末。
用乙酸乙酯浸泡干燥后的固体粉末3-4次,在乙酸乙酯浸泡的过程中,用超声波清洗仪破碎,以利于代谢产物的溶出。把乙酸乙酯相用旋转蒸发仪浓缩蒸干,得到粗提物,称重,分别用氯仿∶甲醇(3∶2)溶液溶解,使浓度为10mg/mL,转移到小玻璃瓶中,4℃保存。
使用Agilent-1200液相色谱系统,检测代谢产物的变化,并利用岛津公司的LCMS-IT-TOF系统分析代谢产物的分子组成。色谱柱选择安捷伦Eclipse XDB-C18柱,250×4.6mm,5μm。检测波长为254nm,柱温25℃,流速1mL/min,流动相洗脱条件是:
通过HPLC和LC-MS分析,链霉菌M045野生株代谢产物中,中尼霉素A、中尼霉素B和手霉素A的流出峰分别出现在18.4、19.5和21分钟,如图6所示。中尼霉素A的C7N上的两个羟基,很容易氧化为羰基形成中尼霉素B,这也是图6-w中尼霉素A的峰面积要小于中尼霉素B的原因。
链霉菌M045突变株a、b和c的代谢产物中,中尼霉素A和B的流出峰消失,手霉素A有很弱的峰,说明通过chiD2基因的失活,突变株不能再合成目的产物。突变株在6.3分钟出现新的流出峰,通过质谱分析,分子量为472.1889,其为中尼霉素A1(化合物4)的分子量,中尼霉素A结构上的C5N结构被羟基所替换形成中尼霉素A1,分子式为C26H31ClNO5。在10.7分钟的流出峰,通过质谱分析分子量为454.2439,是手霉素A1(化合物6)的分子量,同样C5N结构被羟基所替换,分子式为C26H32NO6。如图7所示化学结构。
通过分子检测分析,载体pHZ132D2已经整合到链霉菌M045基因组,5-氨乙酰丙酸合成酶(chiD2)基因被阻断,通关对代谢产物的化学分析,链霉菌M045突变株不能再合成C5N结构,而是进行中间产物中尼霉素A1和手霉素A1的积累。进一步证实了,中尼霉素和手霉素A结构中的C5N结构是通过5-氨乙酰丙酸合成酶(chiD2)和连接酶(chiD3)参与的Shemin途径合成的,如图8。
9、手霉素类化合物的异源表达
从海洋链霉菌Streptomyces griseoaurantiacus M045的基因组fosmid文库中,筛选到含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,利用OMEGA Bio-Tek公司的E.Z.N.A.BAC/PAC DNA Kit提取含有完整的手霉素A或中尼霉素生物合成基因簇的fosmid,将该fosmid转化到天蓝色链霉菌、变铅青链霉菌(Streptomyces lividans)TK24、或含有Red重组系统的大肠杆菌中,从而可以使链霉菌或大肠杆菌产生手霉素A或中尼霉素;在转化后的宿主菌中,对基因簇的相关基因进行插入、置换或缺失,从而使宿主菌可以合成手霉素类化合物的结构类似物。
Claims (7)
1.一种手霉素生物合成基因簇,其特征在于:所述手霉素生物合成基因簇碱基序列如SEQ ID NO.1所示,其中手霉素生物合成基因簇为手霉素A和中尼霉素的生物合成基因簇,1)手霉素A和中尼霉素的生物合成的结构基因:编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)合成酶的chiA1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)羧基腺苷酰蛋白的chiA2;编码醛裂合酶的chiA3;编码3-羟丁酰辅酶A脱氢酶的chiB1;编码芳香胺N乙酰转移酶的chiB2;编码3-氧乙酰基载体蛋白合成酶III的chiB3;编码3-氧乙酰基载体蛋白合成酶III的chiB4;编码酰基载体蛋白的chiB5;编码硫酯酶的chiB6;编码3-氧乙酰基载体蛋白还原酶的chiB7;编码酰基脱水酶的chiB8;编码酰基脱水酶的chiB9;编码I/II型酮合成酶相关的酰基载体蛋白的chiC1;编码3-氨基-4-羟基-苯甲酸(3,4-AHBA)载体蛋白的chiC2;编码3-氧乙酰基载体蛋白合成酶II的chiC3;编码酮合成酶的chiC4;编码甲基丙二酰辅酶A变位酶的chiC5;编码硫酯酶的chiC6;编码酰胺合成酶的chiD1;编码5-氨乙酰丙酸合成酶的chiD2;编码5-氨乙酰丙酸辅酶A连接酶的chiD3;编码氧化酶的chiE1;编码黄素还原酶的chiE2;编码黄素依赖的单加氧酶的chiE3;编码黄素依赖的氧化还原酶的chiE4;共25个基因;2)手霉素A和中尼霉素的生物合成的调节基因:编码LuxR家族转录调节子的chiR1;编码TetR家族转录调节子的chiR2;编码调节蛋白的chiR3;共3个基因;3)手霉素A和中尼霉素的生物合成的转运基因:编码抗药性转运蛋白的chiM1;编码分泌蛋白酶的chiM2;共2个基因。
2.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述手霉素A生物合成基因簇用于培育手霉素A的菌株及其突变菌株。
3.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述中尼霉素生物合成基因簇用于培育中尼霉素的菌株及其突变菌株。
4.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述手霉素A生物合成基因簇用于其编码蛋白催化合成手霉素A及其类似物。
5.按权利要求4所述的手霉素生物合成基因簇,其特征在于:对所述手霉素A生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到手霉素A的结构类似物。
6.按权利要求1所述的手霉素生物合成基因簇,其特征在于:所述中尼霉素生物合成基因簇用于其编码蛋白催化合中尼霉素及其类似物。
7.根据权利要求6所述的手霉素生物合成基因簇,其特征在于:对中尼霉素生物合成基因簇的基因进行遗传改造获得的突变体经生物发酵得到中尼霉素的结构类似物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103286346A CN102517309A (zh) | 2011-10-19 | 2011-10-19 | 一种手霉素类抗生素生物合成基因簇 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103286346A CN102517309A (zh) | 2011-10-19 | 2011-10-19 | 一种手霉素类抗生素生物合成基因簇 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102517309A true CN102517309A (zh) | 2012-06-27 |
Family
ID=46288375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011103286346A Pending CN102517309A (zh) | 2011-10-19 | 2011-10-19 | 一种手霉素类抗生素生物合成基因簇 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102517309A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916834A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN107365368A (zh) * | 2016-05-11 | 2017-11-21 | 中国科学院微生物研究所 | Asperphenamate合成相关蛋白及其编码基因与应用 |
-
2011
- 2011-10-19 CN CN2011103286346A patent/CN102517309A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916834A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916834B (zh) * | 2015-12-24 | 2022-08-05 | 武汉合生科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916835B (zh) * | 2015-12-24 | 2022-08-12 | 武汉合生科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN107365368A (zh) * | 2016-05-11 | 2017-11-21 | 中国科学院微生物研究所 | Asperphenamate合成相关蛋白及其编码基因与应用 |
CN107365368B (zh) * | 2016-05-11 | 2020-09-08 | 中国科学院微生物研究所 | Asperphenamate合成相关蛋白及其编码基因与应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rachid et al. | Molecular and biochemical studies of chondramide formation—highly cytotoxic natural products from Chondromyces crocatus Cm c5 | |
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
JPH09224686A (ja) | プラテノリドシンターゼ遺伝子 | |
Frank et al. | From genetic diversity to metabolic unity: studies on the biosynthesis of aurafurones and aurafuron-like structures in myxobacteria and streptomycetes | |
CN106687577A (zh) | 用于产生香草醛的微生物和方法 | |
CN107868789B (zh) | 可利霉素生物合成基因簇 | |
CN101809030A (zh) | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 | |
CN101275141A (zh) | 阿嗪霉素的生物合成基因簇 | |
CN101818158B (zh) | Fr901464的生物合成基因簇 | |
CN101691575B (zh) | 一种萨菲菌素的生物合成基因簇 | |
Li et al. | Stepwise increase of thaxtomins production in Streptomyces albidoflavus J1074 through combinatorial metabolic engineering | |
CN107794286B (zh) | 一种环脂肽类化合物生物合成基因簇及其激活方法与应用 | |
CN102517309A (zh) | 一种手霉素类抗生素生物合成基因簇 | |
CN111378008B (zh) | 脂肽类化合物Totopotensamides及其制备方法和应用 | |
KR102159415B1 (ko) | Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 | |
CN101586112B (zh) | 诺丝七肽的生物合成基因簇 | |
US20030175888A1 (en) | Discrete acyltransferases associated with type I polyketide synthases and methods of use | |
CN103215282A (zh) | 越野他汀的生物合成基因簇及其应用 | |
CN114517175B (zh) | 基因工程菌及其应用 | |
CN107164394B (zh) | 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用 | |
US20030064491A1 (en) | Genes and proteins involved in the biosynthesis of enediyne ring structures | |
CA2391131C (en) | Genes and proteins for rosaramicin biosynthesis | |
CN101142313A (zh) | 编码产生地索拉唑类的合成途径的基因 | |
CN101684471A (zh) | 诺卡噻唑菌素的生物合成基因簇 | |
KR20130097538A (ko) | 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120627 |