CN112921045B - 氨基糖苷类抗生素生物合成基因簇及应用 - Google Patents

氨基糖苷类抗生素生物合成基因簇及应用 Download PDF

Info

Publication number
CN112921045B
CN112921045B CN202110154771.6A CN202110154771A CN112921045B CN 112921045 B CN112921045 B CN 112921045B CN 202110154771 A CN202110154771 A CN 202110154771A CN 112921045 B CN112921045 B CN 112921045B
Authority
CN
China
Prior art keywords
gene cluster
nucleotide sequence
orf
encodes
aminoglycoside antibiotic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110154771.6A
Other languages
English (en)
Other versions
CN112921045A (zh
Inventor
何璟
高君杰
李新颖
于佩青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Agricultural University
Original Assignee
Huazhong Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Agricultural University filed Critical Huazhong Agricultural University
Priority to CN202110154771.6A priority Critical patent/CN112921045B/zh
Publication of CN112921045A publication Critical patent/CN112921045A/zh
Application granted granted Critical
Publication of CN112921045B publication Critical patent/CN112921045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/46Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical bound to a cyclohexyl radical, e.g. kasugamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及一种氨基糖苷类抗生素的生物合成基因簇,其核苷酸序列为SEQ ID NO.1所示,或与SEQ ID NO.1所示核苷酸编码相同蛋白的核苷酸序列。本发明还公开了该基因簇在宿主变铅青链霉菌ZX1中异源表达系统的构建以及制备表达产物的方法。并且,本发明获得的可产生有效霉素A的基因工程菌株具有显著抑制丝状真菌生长的能力。本发明所提供的基因簇可应用于药物产生菌的基因工程育种,在医药或农药开发中具有广阔的应用前景。

Description

氨基糖苷类抗生素生物合成基因簇及应用
技术领域
本发明涉及微生物基因资源和基因工程领域,尤其涉及氨基糖苷类抗生素生物合成基因簇及应用。
背景技术
链霉菌可产生种类繁多的天然产物,具有丰富多样的化学结构和生物活性,可以抗细菌、抗真菌、杀虫、抗病毒、抗肿瘤以及作为免疫抑制剂和降脂药物,一直以来都是科学家研究的热点。天然产物的传统研究方法是以生物活性为基础,在微生物、植物中筛选出具有潜在应用价值的物质,再以该物质为研究对象,对其化学结构、作用机理进行研究(CraggGM等,2013,Natural products:a continuing source of novel drug leads.Biochimicaet biophysica acta.1830:3670)。但由于传统研究方法的局限,使得近十几年来天然产物的发现速度在不断减缓,亟待新的技术方法和研究策略来突破发展的瓶颈。
随着测序技术的迅速发展,很多微生物的基因组都已经被测序。在对众多链霉菌的基因组进行序列分析时,发现它们都存在着一个共同的现象:基因组中往往包含几个甚至几十个天然产物的生物合成基因簇。像在模式菌株天蓝色链霉菌中除了放线紫红素和十二烷基灵菌红素以外,还有19个次级代谢产物的生物合成基因簇(Bentley SD等,2002,Complete genome sequence of the model actinomycete Streptomyces coelicolor A3(2).Nature.417:141-147.),而在阿维菌素的产生菌除虫链霉菌的基因组中则包含有25个次级代谢产物的生物合成酶体系(Ikeda H等,2003,Complete genome sequence andcomparative analysis of the industrial microorganism Streptomycesavermitilis.Nat Biotechnol.21:526-531)。棒状链霉菌除了含有已分离到的头霉素C和克拉维酸的合成基因外,还包含46个其他的次级代谢产物的生物合成基因簇,其中有不少是全新的生物合成酶体系(Medema MH等,2010,The sequence of a 1.8-mb bacteriallinear plasmid reveals a rich evolutionary reservoir of secondary metabolicpathways.Genome Biol Evol.2:212-224)。在链霉菌的基因组中发现的天然产物生物合成基因簇的数目,远远超过从这些微生物中已经分离到的化合物种类。这是因为许多天然产物生物合成基因簇在现有实验室的培养和发酵条件下是沉默的,只有在某些特殊的条件下才会被活化并表达出相应的产物(Zazopoulos E等,2003,A genomics-guided approachfor discovering and expressing cryptic metabolic pathways.Nat Biotechnol.21:187-190)。
有文献报道吸水链霉菌能够生物合成氨基糖苷类抗生素,如有效霉素A(氨基酸添加对吸水链霉菌5008发酵过程中有效霉素A合成的影响,公开于食品与发酵工业杂志2013第5期),但是对于其合成的基因簇却鲜有报道。因而对于氨基糖苷类抗生素生物合成基因簇的揭示,及探索理解氨基糖苷类抗生素生物合成机理并进一步利用其进行结构改造具有重要意义。
发明内容
本发明的目的在于提供一种氨基糖苷类抗生素生物合成基因簇及其应用。
本发明的目的是通过以下技术方案来实现的:
第一方面,本发明涉及一种氨基糖苷类抗生素生物合成基因簇,所述基因簇的核苷酸序列如SEQ ID NO.1所示,或与1.SEQ ID NO.1所示核苷酸编码相同蛋白的核苷酸序列。
具体的,所述基因簇全长39732bp,所述基因簇编码氨基糖苷类抗生素合成涉及的至少10个基因。
第二方面,本发明涉及一种上述基因簇编码的蛋白。
第三方面,本发明涉及一种上述基因簇的表达载体。
具体的,所述重组表达载体的骨架质粒为pMSBBAC质粒。
第四方面,本发明涉及一种基因工程菌,所述基因工程菌携带上述氨基糖苷类抗生素生物合成基因簇。
具体的,所述氨基糖苷类抗生素为有效霉素A。
第五方面,本发明涉及一种微生物,所述微生物具有氨基糖苷类抗生素生物合成基因簇。
第六方面,本发明涉及一种氨基糖苷类抗生素生物合成的方法,包括以下步骤:选择所述氨基糖苷类抗生素生物合成基因簇;构建所述氨基糖苷类抗生素生物合成基因簇的异源表达工程菌株;将所述异源表达工程菌株进行发酵取发酵液,去除菌体,得到发酵上清液;对发酵上清液进行纯化,得到所述氨基糖苷类抗生素。
具体的,所述氨基糖苷类抗生素为有效霉素A。
有益效果:
本发明通过基因组发掘技术,获得了一种新的氨基糖苷类抗生素生物合成基因簇序列,并通过基因工程和异源表达的方法激活了这个氨基糖苷类抗生素生物合成基因簇的表达,成功获得可以产生有效霉素A的工程菌株。以此基因簇以及其异源表达菌株为基础,通过合理的基因工程和代谢工程的设计,优化氨基糖苷类抗生素的合成途径,不仅可以获得有效霉素及其衍生物的高产菌株,还能够生产更多有生物活性的氨基糖苷类抗生素信息新品。
附图说明
图1为本发明实施例提供的氨基糖苷类抗生素生物合成基因簇的示意图。
图2为本发明实施例提供的阳性克隆子SH9A9的物理图谱。
图3为本发明实施例提供的基因工程菌株ZX1::SH9A9及含空载体的对照菌株ZX1::pMSB进行生物活性测定效果图,生物活性测定的指示菌为水稻纹枯病病原真菌。
图4为本发明实施例提供的基因工程菌株ZX1::SH9A9及对照菌株ZX1::pMSB的发酵液的高效液相色谱-质谱联用检测图谱。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下实施例中未特殊说明的实验方法均为常规方法,未特殊说明的材料、试剂均可从商业途经获取。
Streptomyces hygroscopicus基因组文库构建
1、取吸水链霉菌新鲜抱子接种至30m1 TSBY培养基(添加0.6%甘氨酸)中,30℃,220rpm培养16-24h。
2、离心收集菌体,称取0.5g湿菌体至50m1离心管中,加入5m1SET(75mM NaCl,25mMEDTA,20mM Tris,pH 7.5)缓冲液,振荡打散。
加入终浓度为lmg/ml的溶菌酶,37℃温浴l0min。
加入1/10体积的10%SDS溶液后,再加入终浓度为0.5mg/ml的蛋白酶K,55℃温浴2h。
加入1/3体积的5M NaCl溶液,并加入一倍体积的中性酚仿,室温颠倒混匀30min。
4000rpm离心30min后,吸取上清至另一新的50m1离心管中,加入等体积氯仿再次颠倒混匀30min除去残留的蛋白。
4000rpm离心30min后,吸取上清至另一新的50m1离心管中,加入两倍体积的无水乙醇沉淀基因组DNA。
挑取白色絮状的基因组DNA至30m1 75%无水乙醇中,室温静置10min洗去盐离子,重复75%无水乙醇洗涤步骤。倒去75%无水乙醇,室温晾干DNA后,加入3m1 TE(pH8.0)溶解。
3、利用限制性内切酶BamHI对Streptomyces hygroscopicus基因组DNA进行部分酶切。
设置梯度酶切体系(12个梯度),每个梯度酶切体系为200μl:
第1管中加入2001基因组DNA,40μl 10×H缓冲液,159μl无菌水以及1μl BamHI;第2至12管中加入20μl 10×H缓冲液以及180μl基因组DNA。
从第1管溶液中吸取200μ1溶液至第2管中混合均匀得到BamHI稀释两倍的酶切体系,进一步再从第2管中吸取2001溶液至第3管中混合均匀得到BamHI稀释四倍的酶切体系,依此类推稀释至第12管,获得相应稀释度的酶切体系。
37℃温浴30min后,65℃温浴20min失活。每管取10μl酶切样品进行PFGE检测。选择酶切大小为45~60kb左右的梯度体系,混合进行PFGE凝胶电泳回收DNA,方法同上。切下100kb左右胶条用低熔点琼脂糖凝胶制备一块新的凝胶,再次进行PFGE检测除去携带的小片段DNA。切下100kb左右胶条回收基因组DNA,溶于10μl TE(pH 8.0)中。
PFGE检测条件为:Initial switchtime:is:Final switch time:6s:Voltage:6V/cm;Included angle:120°;Run time:14~16h;Temperature:14℃。
4、对总DNA进行去磷酸化处理,去磷酸化体系为:8μ1基因组DNA,1μl FastAP缓冲液,37℃温浴15min后,于75℃温浴5min失活。
将去磷酸化的基因组DNA与经HpaI与BamHI双酶切处理的pMSBBAC载体进行酶连,酶连体系为:10μl基因组DNA去磷酸化溶液,1μl pMSBBAC(经HpaI酶切去磷酸化,然后经BamHI酶切回收载体),1μl 10×Fast-link ligase buffer,1μl 10mM rATP,1μl Fast-link ligase。
5、将上述酶连产物电转化感受态大肠杆菌DH10B/pUZ8002,涂布LB平板(添加0.1%wt阿伯拉霉素和0.1%wt卡那霉素),筛选转染子,获得一个包含2000个克隆的cosmid文库克隆子。将克隆子挑至96孔板中置于-80℃进行保存。
大肠杆菌电转化方法:吸取4μL连接产物,加入到40μL DH10B/pUZ8002感受态细胞中,电激(13KV/cm,25μF,200Ω)处理后,加入900μL的SOC培养基恢复培养1小时,涂布平板37℃培养过夜,可进行蓝白斑筛选。
阳性BAC质粒SH9A9的物理图谱如图2所示,含有来自于F质粒的BAC载体元件,包括parABC、repE和oriS,安普拉霉素抗性基因aac(3)IV用来筛选;转移起始位点oriT用于接合转移;来自链霉菌噬菌体
Figure BDA0002934214940000061
的整合酶基因int和整合位点attP,以便进入链霉菌后可以整合到链霉菌染色体中形成稳定的基因工程菌株。
氨基糖苷类抗生素生物合成基因簇的克隆
根据吸水链霉菌氨基糖苷类抗生素生物合成基因簇的序列设计两对特异性引物:vlm1f:CGTCGCGGCCTGCTGCTATC;vlm1r:
CATCCGGCGCCCTGAAAACC;vlm2f:
CCCGACCGGTGTGGCTTCTTCATTCT;vlm2r:
CAACCGCCTGGAGCCAACATTTCAC;
以文库克隆子为模板进行PCR筛选,其中科克隆子SH9A9可扩增出预期大小条带,为阳性克隆子。
异源表达工程菌株ZX1::SH9A9的构建及有效霉素A的异源表达
1、将大肠杆菌菌株DH10B/pUZ8002+SH9A9接种于5mL含有50μg/mL安普拉霉素的LB培养基中,37℃过夜培养。
2、取0.5mL过夜培养物转接到含有50μg/mL安普拉霉素的新鲜LB培养基中,37℃摇床培养至2~3小时,直至大肠杆菌菌体的浓度达到OD600约为0.5~0.6。
3、收集其中培养物,5000转/分离心3分钟。然后用新鲜的LB培养基清洗菌体3次,最终用1/10体积的新鲜LB培养基悬浮菌体。
4、同时取100μL新鲜的变铅青链霉菌ZX1孢子,先用TSB培养基清洗三次,最终用悬浮在新鲜的TSB培养基中,放入50℃水浴锅中热激10分钟。
5、最后按照一定比例将处理好的大肠杆菌和孢子混合均匀,涂布在含有MISP-4培养基的平板上,30℃培养13-20小时后,使用1mL含有1mg安普拉霉素和0.8mg萘啶酮酸的无菌水均匀覆盖平板表面,进行属间接合转移。
6、吹干平板表面的水分后,再放入30℃培养箱中恒温倒置培养3-5天,转入了阳性BAC质粒SH9A9的异源表达工程菌株ZX1::SH9A9接合子生长起来。同时也将不含有任何插入片段的BAC载体pMSBBAC导入变铅青链霉菌ZX1,获得对照菌株ZX1::pMSB。
7、异源表达工程菌株ZX1::SH9A9的代谢产物测定
将异源表达工程菌株ZX1::SH9A9和对照菌株ZX1::pMSB分别接种到TSB培养基中,30℃震荡培养3天,制备种子培养液。再按照10%的接种量将种子培养液接种到发酵培养基中,37℃震荡培养4天。通过离心将发酵培养物中的发酵液和菌丝体分开,收集上清发酵液,利用0.45μM有机相模过滤后,进行高效液相色谱-质谱联用分析,在ESI+模式下从异源表达工程菌株ZX1::SH9A9的发酵产物中检测到[M+H]+=498.2的离子流信号,与标准品有效霉素A的离子流信号完全一致。如图4,据此确定异源表达工程菌株ZX1::SH9A9可以产生有效霉素A。
同时进行发酵产物的生物活性检测。将15mL的PDA培养基熔化后,冷却至大约40℃,与适量的发酵液混合均匀后,制备生物活性测定平板。将含有指示菌水稻纹枯病病原菌的菌块放置到生物活性测定平板的正中间,30℃正置恒温培养1~2天,如图3,观察到异源表达工程菌株ZX1::SH9A9的发酵液可以有效抑制水稻纹枯病病原菌的扩散生长。
发酵培养基:可溶性淀粉101.1g、黄豆饼粉26.0g、酵母提取物6.0g、氯化钠1.0g、磷酸二氢钾0.4g,加蒸馏水至1L,pH 6.0-6.5,用于代谢产物的发酵。PDA培养基:马铃薯200g,葡萄糖20g,琼脂20g,加蒸馏水至1L,用于生物活性测定。
高效液相色谱条件:安捷伦公司LC1260,通用型C18 TSK gel ODS-100v色谱柱(Tosoh),规格5μM,250×4.6mM,流动相为98%磷酸二氢钠(溶液A,pH7.0)与2%甲醇(溶液B)的混合物,流速为0.5mL/分。质谱条件:电喷雾(ESI+)离子源,正模式ESI,干燥温度350℃,干燥气流10L/min,雾化器压力15.0psi,破碎电压160V,定性离子对m/z=498.2/178.1和m/z=498.2/336.1。
氨基糖苷类抗生素生物合成基因簇的功能分析
将本发明提供的吸水链霉菌氨基糖苷类抗生素生物合成基因簇的基因组测序后通过生物信息学分析发,其现全长39732bp,共31个基因(如图1),其中Orf17~Orf26包含了涉及霉菌氨基糖苷类抗生素生物合成的结构基因、修饰基因、调控基因和转运基因,对于有效霉素A的合成具有决定作用。各基因编码的蛋白及其功能键表1。
表1吸水链霉菌氨基糖苷类抗生素生物合成基因簇功能注释
基因 基因位置 蛋白功能
Orf17 16369-18207 糖苷水解酶家族15蛋白
Orf18 18778-19974 MFS运输机
Orf19 20133-21401 缬草胺A葡萄糖基转移酶
Orf20 21945-22940 脱氢酶
Orf21 22943-24217 转氨酶
Orf22 24241-25734 缬草胺7-磷酸缬烯基转移酶
Orf23 25827-26711 dTDP-4-去氢骆驼蓬碱还原酶
Orf24 28506-29732 2-表-5-表-valiolone合酶
Orf25 29737-30858 缬烯醇-1-磷酸鸟苷基转移酶
Orf26 30855-31910 C(7)-环醇7-激酶
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
序列表
<110> 华中农业大学
<120> 氨基糖苷类抗生素生物合成基因簇及应用
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 39732
<212> DNA
<213> Streptomyces hygroscopicus
<400> 1
tcatcgcggc ggcgtctccg ggcgcctcgg atcgggcggc ggaataggtc tgccgggctt 60
gtggccgtcg ctctcggccg ggtcccgctt ccctccgtgc ttccccacga gggtcttcct 120
ccagtcggtg atgggtgggg ctccatggtg gcgctggatc ggggcacgcg gcagggcgcg 180
cgggtgtgcc gttgcgggca ggccggggtg cgcgcgctgg gcggaccgca ggccgcacgc 240
acgccccgcg cccggcgcgt cagcgtgcgg cccgcgtcgc cggcggagtg ctgccctgac 300
ggccggacgc tcggtttcct cggaacggaa cacccgcgac cgcggcctgg acgtcgtcgg 360
tgcccctcga tggccgaccg ccgcgaaagg gctggtcccg ttcagtcgac gaggtcgagg 420
gcggcggcga cgatgctgtc ggtgtcgatg ccgtggtaac ggtagacgtc ctcgatcgaa 480
ccgctctggc cgaaccgcgt cacgccgagg gtggtgacgg gcgtgttccg gaccgcgctc 540
aggaaggcca gcgtgtgcgg gtggccgtcc agcacggtga ccagcggggt ggcgcggtcg 600
gcggggaaga cctggtcgag gacccagtcg gggtcctgcg acaggccgcg gcgggcctgg 660
agcgcgcgga agagcaggtc cgggctggtc acacagacca cgtcggcgcc gtggccgagg 720
gcggcgagcc ggtcggcggc ggccagggcc tccgggacca gggcgcccat ggcggcgagg 780
gtcaccaccg gcttctcgtg ccgtcgcagc cggtaggcgc ccgcggtcac ctgccggcgg 840
cggcgctcac gggcggccgg gtcgccgggc acgtcggccg cggactggtc gacgggccgg 900
gtggacagcc gcagataggc cgaactcccg tccggccggc ccaggttgcc gagtgcggcg 960
agcagacacc attcggtgtc gatggcgaac gcgggctcat aggtgacgca gccgggctgc 1020
tcgatgccca gtgagggtgt ggtgatcgac tgatgggcac cgccctccgg ggcgagcgtg 1080
accccggacg gcgtgccgac caggatcgac tggccgccgg cgtagatgcc gaacgaccac 1140
ggctccaggg cccggttgac gaaggggtcg tagaccacgc cgatcggcag cagcggctgg 1200
ccccagcggc tccaggtggc acccagctcg ccgagcaggc cgaccaggtt ggtctccgcg 1260
atgcccagct ccacatgctg cccggtgggc cgctcccgcc agtgcaggat cgtctcggcg 1320
tcgtcggcga accagttggg gcgctcggcc ggggaccaca caccgacctt gttgagccag 1380
ccgccgaggt tggtggtgga gctgacgtcc gggctgacgg tgacgatccg ggccgccgcc 1440
tccggcgccc gccgggtgag gtccagcagg acgcgtccga gagcctgctg ggtgttgccg 1500
gagccggtcg gtgccgggcg ggcgaggtcg gcgggaaccg cgggggcctg cagtgccgcg 1560
tggccggggc ggcgcagccg cctggcggcc gccgcgcacc gggccgcttc cggcgatccg 1620
ccggggaagt tcgcccatgg ccggccgggg tcggttccca ggcggtcggc cagtgtccgc 1680
atctggtcgg cggtcagcag tgaggagtgg ttctgcgggt ggccttcggt gggcagcccg 1740
tagcccttca ccgtgtacgc gaagatgacg gtcgggcggg tgtcgtcgac gctgtcgaac 1800
gcctccatca gcgcgccgat gtcgtgccct cccagattgc gcagcgccgc cagcagtgag 1860
gcgtcgtcca ggggggctat caggtccgcg atcggcccgg cggtggagcc ggtgccgggc 1920
aggcgctccc gcaactcccc ggccgagcag cgcagcaggc gctggtattc ggggttgtcc 1980
atggcgtcga tacgggcgtg cagggcctcg ccgcccggcc gcccgaacag ctcccgcagc 2040
acgttcccgt acttgagggt gatgacctgc cagccggccg cggcgaacat gccccgcagc 2100
cggtccgcgg cgatgccggg gacgacccgg tccagggact gccggttcag gtccacgacc 2160
cacaccgcct cgcccagact gggcaccatg gggtcctgga tcgcctccca gatggcgccc 2220
tcgtccagct ccgcgtcgcc cagcagggag tactgccgcc cccgcccggc cccgccgaag 2280
tggccctcca cataagcccg ggcgagggcg ccccacaggg gggcggtggc accgatgccg 2340
accgagcccg tggagtagtc gaccgggtcg gggtccttgg cccggctggg gtagctctgc 2400
aggccgccga aggcgcgcag ggtggtcagg taggactcgt ccagctcgcc cagcaggtaa 2460
ttgatcgcat gcagcaccgg cgaggcgtgg ggcttgaccg acacccggtc ctccgcggtc 2520
agcgcgtgga accacagcgc cgtcatgatc gaggtcatcg aggcgctgga cgcctggtga 2580
ccgccgacct tcagccccga ggggttcggc cgcacccggt tggcgtggtc gatgatcgcg 2640
gtggacagcc acagcacccg ccgctcgacc gcctccagca cggcgagctc ctcctgcccg 2700
ccgggacccg caccgtcgac gtcggacgac ctcagttccg tgaccaccac agaccacctc 2760
cgcgatcagc gccataccct agagattttc ctgttgtgca ccgtcagtag acaggcagct 2820
cttcaactgc acaagatgtg tctgcgcgat tgagcattct gctcatattc catgccaacg 2880
gagaggcgac gaccgagcat catgaacagt gaacgagccc tcgacgccac ggacgcgcgg 2940
atcctgctcg ccctcaccgc ccagccacgg gccaccgtcg tcgccctggc cgagcagctg 3000
gggctgtccc gcaacaccgt ccagacgcgg gtggccagaa tggagcaggg cggcgcgctg 3060
gcttccttcg agcgccggat caccccgaac gcgctgggcc acccgctcac cgcgttcgtc 3120
accgcgcggg tcgatcagca ccggctggcc gaggtgtccg aggcgctggc gggcatcgac 3180
gaggtcgtgg aggtcttcgg cctcagcggc gagaccgatc tgctcgtccg ggtggtcgcg 3240
gcggacgcgg aggacctgta ccgggtcgcg gggcggatcc tcgccgtccc cggcatcgaa 3300
cgcacgacga cggccctggc catgcgcgaa ctggtgccgc accgcctcac cccgctgctg 3360
cgccgcgccg cgggcgacgg cggccggcaa ccggggcggt gaccggatcg gccccgttcg 3420
cgggcgggtg ccctcggcgt tcttcggcgg ccggccgggc ctgaccggtg tccgaaggcc 3480
cgggcgtcgg cggaccgtca cccgggcccc ggcgggacgc ggagtcctca gttccggcgg 3540
tgtccggcgt ccgcggcggc ggacgtcctg atgtgcgccg gctccgcgga cctgccccgg 3600
gtccacgtcc tgcaccacgg acggctcgcc gaacacggca gccacaacga gttcatggcc 3660
gcccaagggc gctacgccgc gatgttcgcg gcgcaggccg cccagtacgc ccgcacggac 3720
accatccccc gccccggctc ccccaccgtc accgatcccg catgacccgc tcgaaaggcc 3780
cagcgtgacg actcctccca ccaccgcgca ggagcacgat cccaaccggc ctcggctcac 3840
ccggcggcga tccgagctgc ccctctcccc accgcccgcc ccggcctggc gagccctttg 3900
ccgagtcggc tgaagctgga cacgtcctcc tggccgccag cgctgctgat ccatctgccg 3960
accatgaggc aaactccacc gcatggtgag tctgcacatc atcacaccgg atgactggcc 4020
gttgtggcag gagatccgtg ttgctgccct gaccgatgcg ccgcacgcgt tcaaagcccg 4080
gctcgccgac tggcacaggg gtggccagga gcagtggcgt gcccgtctgg ccattcccgg 4140
tgcctacaac gttgtcgcgc ggcagggcag tcggcctgtc ggcatggtca ggggcatccc 4200
cgtggacagc gagacgagcg aactcaggtc gctgtgggtc agccccgagg cgcgaggcga 4260
cggcgtcgga gaccggctga tcgaagcagt cacgacgtgg gccctgcgct caggctccac 4320
aacactgaag ctcgcggtga tcccgggcaa cgagtcagcc atcgccctct accggcgcca 4380
cgggttcctc gtcaccgacg agcaagggga tctgttgccc gacggcgtaa ccagggagca 4440
ggtgatggcc aagagacttc gctgaccccc aacgccgtca tgtcccgtgc acattccggc 4500
cgggctgatc accaactggc aaaacgcaag accgagtgct gtcgccagcc ggccccgccg 4560
ccgccgtccg cctcttcccg ggtctgctgg cgctggtggg ctgaccaggc ggcgctgtcc 4620
tgtcggcagc ggatgaggta gcgggcgaac tggcggcgct cgtcggggtc ccatccggcg 4680
atgactcgtt caatggcgtc acgttgttcg gcggcgaggc ggcgagggag cgaggcggcg 4740
gcgttcggct tccccggcct cggccaggac ctgcgagccg tcgagcccgg caacgccctg 4800
cggctcttcc cccgcctcgc ctgaaccctg gcccccggca ccggcaccgg caccgaacct 4860
gacaccggca ccggccctgg caccggccac gccgtcccgg cagccggcgg cgtcgcacag 4920
acagatcccc ggaaggaacc acgaatgagc atcaggcacc tgaccgtcat cgacggcacc 4980
ggcagtgcgc cccgctccgg catggacgtc accatcgcca ccggtccgtt tctccgtgcc 5040
gctcgccgaa cccggcgtac ccggatccgg gatccgcgcc acctgacgcc tgctcgggag 5100
gccggtcacg gaccgggccc tctccctctg cggcccaccc gacacggacc ccatactgtg 5160
gcacgcggcg cacgcgcccc tcttcgcagt ctcttcaccc ccccaaggaa ccgcccgtgt 5220
cctcccacct ctcgacgacc ggaccacgcg ccgcccagcc cgtggccggc gccctgcaac 5280
gcagcctcaa gcgcttcgac atcacggcca tggccatcgc cgcggtgctc tccttcgaca 5340
ccctcgggca gatcgccacc ggcggcggtg aggccgccac ctggacggcg gtcatcgccc 5400
tcttcttcct cgtcccctac gccctgctgt tcgcggagac cggcgccgcg ttcccccagg 5460
aaggcggccc ctacgtatgg gtcaaactgg ccctcggccg tccggcggcc gccctcacga 5520
ccctcatgta ctgggtcacc aaccccatct ggctgggcgg ctcactggcc ttcctcgccg 5580
cggagacctg ggacggattc gtcttccacc tcggctcggg cacggtcgcc gactacgcct 5640
tcaagctgct gttcgtctgg atcgccatcg cgacggccgt cgtctcgctg cggcacggca 5700
aatggatcac caccgcgggc gcggcgataa aggtcctggc gctcgcggtg ttcaccctca 5760
cggccgtgtt ctacggggtg cggcacggct tccacggtct ggccgacacc agcttcaccc 5820
ccacgaccgc cggcttcctc gccctggtgc cggtcctgct gttcgcctat gtcggcttcg 5880
aggcacccaa cgccgccggt gaggagatgc acgacccgca gcgcgacgtg cccaccgcgc 5940
tcggacgctc cgcggccgtc gcggcctgct gctatctgct gccggtcctc gccctcctcg 6000
ccgtcctacc cgcccgccag gtcaccggta tcggcggctt catggacggc gcccgcctgg 6060
tcttcagcgt ctacggcggc gcggccggcc ccctgctgaa ggtcaccgcc gtcatgttcg 6120
tcctcgctct gctcacccag ggcagcgcct ggatgatcgt cagcgaccgc atgcaggcca 6180
tggccgcggc cgacgggggc ttcttcaccc gcgccctcgg caccttccac ccgcggctcg 6240
gcacaccggt gcgcaccaat ctgctctccg gagccgtggc cacggtgttc atgctcgccg 6300
ccatgcggct ggcgaacggc gacgcggccg atgtgttcgc cgtggtcctc accgtcgcgg 6360
tcaccaccct gctgctgtcc tacctcgcca tcatccccgc gctggtactt ctgcggaccc 6420
gccggccgga cgtcccgcgg ccctatcgcg tccccttcgg cacccgcggt ttcctgctct 6480
gcgcggggct cgtctacgcg tggatcctga tcgggtcgtg gtcggcgctc ttccccggag 6540
tcctggaaca gctcttcggc atcgactacg ccttccacga cgtctggggc gtttcccgcg 6600
cctcgttcga agccttcacc ctcggtaccg tcgccgcact gctgatcgtc ggtgtcatcg 6660
gcgtagcggt ggcccgccgg agggacgcgg tacggggtgc ggccgtcgag ggcggttttc 6720
agggcgccgg atgagtgcgc ggcgggtgca cgcgcgtgcg gccgcttcga accggtgccg 6780
acggcgtgtt gaggcggcgc tcggtactgc cccggcctgg gtgctgaccg agccccgggc 6840
tgagggatgg ccgtcacggt cgcgggcgac ggggcctccc tgcgacgggg cctcctcctc 6900
cgtgtgccgc ccgctgtcgg ctcagcggca gggcatgctc atgtagagcg cctgctcacc 6960
cgcggaggcg gtgccctcgt agagggaggt gtcgagtccg cagaaggcga agcccatccg 7020
ccggtacgcc tggatcgccg gcgcgttgac gctggtgacc tccagccaga tgtgacctgc 7080
gccccgctca cgggcgaact ccaccgcgag ccccatcagc gcgcggccga ccccccgtcc 7140
ccggtgctcc ggggcgacct cgatgtcctc gatggtcagc cggcggttcc aggcggagta 7200
cgagacggcg acgaacccgg ccaggtcgcc ggcggcgcca tgggcgacga aggtgcggga 7260
gtccgtgtcg tcccggtcgt cgccgcccgg ctcgtcctcg gggaacacct tggtcagggg 7320
cgggtccacc gggatctccc gcagctcgaa tccgtcctcg gtgacggtca cctggaagac 7380
ggtgtcggtg gtgaaggagc cgtccagagc cccgatagcc tcggtgtcct cgggggcagc 7440
ggcgcggtat cggtaagccg tgtcgtcaac aggggccatg gcacgacgct acgaccgctc 7500
cggccacggc gggccgggtt tcggccggcc acgcccggtc cccggcccag gctccgggcc 7560
atgcgggagt ggtccgcctc tccgcggaac gcctggtggg tgacgcctgt tcaggcgccg 7620
cgtatcgcgg cgagagcgtg ttcccgggcc ggcgcactca gcagcctgtt gagttcgtcg 7680
aacacttccc cggccgtgac gccgttccag cccggtggga gcagtgccag cggaagcccc 7740
gggtcacggt agggcagttg gcgccactgg gtgagcaggg gaatgtaggc gcggaaggcg 7800
tcctgtgggg tggactcggc cgctgaccag ctgtcgagga gcgggcggtg gtgccgcagg 7860
aagtccgcgt acagctcggt gagttcgtcc aggtcccacc agatccgcac cttcgatcgc 7920
aggtctccga aggccacgtg gtgaccggtg aagatgtcga cgtatgccga caggccgcgg 7980
cggtcgaggg cccgttcggt ctcggccttg agatttcccg gcgcgatcca gatccccggg 8040
gccgcggtgc caaagccgag gcgggtgagg ctcgtacgga gttcgtagcg cttctcccgc 8100
tcggactcgg ggacggagaa gacgaccagg atccagccgt ccgcggtgtc ggcccgggtc 8160
cgttcgaaga tgcgggcgtc tccctcggcc agcgtttcca gggtggaggc ggccagcgcg 8220
tatcccgccg cgccggcgtg gcgttcgctg gtcagcacgc cccggcgctt catacgggaa 8280
accgcggaac gcaccgcagc gccctccacg ccgaggtcgg ccatgagccg caccagggcg 8340
gacacggaca gccagttcga cctgctccgg gcatacagcc cgaagagggt catgatcagc 8400
gatccgggcc gggggtcgcg cccgttcgag gagggagccg ccgactcgag tgccgtcgtc 8460
atttcctctt cctcgccccc ggtccatggc gttgcatacg cgcagcttac gcgccacctg 8520
ccgctccgtc cgcctgccct gtctccgcga ggccggagag cgccaagggg ccgcacgccg 8580
tgtctatcgc cggggtagga ccagacggtc ctcggggatc accgcgacgc cgaggatctc 8640
gatcatggct tcgggctgcc acagggcggt gcagccgatc ccggccatgg ccgggtagac 8700
ggggccggcg agctcgcgcc agacgttgcc gatctccttg ccgtgcgcct ggtagtccgg 8760
gatgtcggtg aggtagaggg tgatgctcac caggtccgcc ggctcaccgc ccgccgctcg 8820
cagcgtggtc agcacattgc cgaacgcctg gcggaactgc tccacgatcc cgccggggac 8880
gatgttcatc ccggcgtcca gggcggtctg gccacccaag tggagcgtgt tgcccaccag 8940
cgttccgtgc gagtacccgc tcggggcggg gagggcttcc gggttcaccg ctacggggcg 9000
catgtgatct ccagttccgt ctggtcggcg ccgatccgcc cgacaccgct tattgacaat 9060
aaatgatgct cgtgaaaaaa ccgagatata gcacccacgg ccgcccgccc cggtacggca 9120
agcgtcccgg cgatgaccga tgtgcgattt tgacgaggtc ctcgcctttc gcaccgccca 9180
tgacgcccac tccctgtggc gtaactgaaa cggccggaag aaaagcgcct caacccgccg 9240
gtcccctctg ccgcgggcgt cccctgcccg ctggaacgga gtcttcggtc atggagcctg 9300
atctcggcaa gtaccgcctc gaaggcgaca actcgatgta ccggctgccc agtggcctcg 9360
tcgcgccggt cgtcacgcgc ggcggcctgg aggacgccgg caccgccgac tccggcggtg 9420
cggtgcgcat ctcgggtgtg agcatccagc acacaccggc gacccgcctg tggttcggca 9480
aggtcagcaa cgaacccggc taccgctcgg tctcgcacca ccacggtgag gcggagaccg 9540
gtgggtacgt gctctccggc cgggggcgca tctacttcgg cgaggagttc gcggattacg 9600
tcgacatgga ggagggcgac tgggtcttcg ttccgccctt catgccgcac gtcgagtgca 9660
acctctcgcg caccgaccca ctggtgtgga tgaccacgcg cacaccggag aacatcgtgg 9720
tcaacctgcc cgatgtcgcc gatgacgacc tgcgcgactg gctggaccga tgagcccgca 9780
cccggccccg acctccgagg tcttcaccga ctcggtgacc ctggcgccgg ccgagcccgc 9840
acgcttcgac ctggccttca ccgcggtgac acagccgtgt ccctggccca aggcatacgg 9900
cggggacctg gtcgcccagg ccgccgccgc ggcgatgcgg tcggtcatgg acggcaagac 9960
cctgcactcg atgcacggct acttcctccg ccccgccgag atcggcgcga gcgtgcgcta 10020
cgaggtggag ctgctgcgcg acggccgcgg ttacagcacc cggcaggtac gcggttacca 10080
gaacgagaaa ccgctctacg tctgcctggc caacttcgcc gcgggcgagc ccggcgccgt 10140
cttccgcgcg gcgctcaccg cgccggcccc tcagcccgag gagctgccca gctccgccgc 10200
gtatctctcg ggacgcaccg gtggcaccat gaccgcgcgg tcgaagtcct actggtcggg 10260
cggccgcggt ttcgacatga ggcatgtgcc cggccccgtc tacctcacgg tggagggaaa 10320
gcgggtgccg caccaggcgg tgtggctacg gcccttcgac ggcctccgcc ccgtcggggg 10380
gctgagcgac acgcagcggg accaggccgc tctggcgtac gtctgtgact acacgatcct 10440
cgaacccgtc ctgcgggtgc tcgacctgcc ctgggcgaag ccgggcctgg tcaccgccag 10500
cctcgaccac gcgatgtggt tccaccggcc ggggcccatg gacgactggc tcctctacgc 10560
ccaggaggcc gtggccgcgg aggcgggccg cggcctgggc acgggccgct tcttcacacg 10620
cgaccacctg cacctggcca ccgtcgccca ggagggcgtg atccgcgcct cctgacccgc 10680
ctcccaccgg cgggatcccg aaaggactcc cccgttgtcc ctttcgccca ggtcgtcctc 10740
agcccatctg gacaccttca cccgtgatca cctgccaccc gccgaccagt ggccggtcat 10800
cgaattcacc actgccgaac tgcggtaccc gccacggctc aacgccgcca ccgcgctcat 10860
cgacgccccg gccgcggcct tcggagcaga ccggcccgct cttcgcacac cggacggcgg 10920
ggcgtggacc tacggccggc tcctgaccca cgccaaccag gtcgcccagg tactcaccga 10980
ggatctgggc ctggttccgg ggcaacgggt gctcctgcgc tcgcccaaca cctgctggac 11040
ggtggccgcc tggctgggcg tgctcaaggc cggcggcgtc gtggtgacca ccatggccgc 11100
cctgcgcgcc cgcgagatcg ttcccatcgt cgaaaagacc cgcccctccc tcatgctggt 11160
cgaccaccgc ttcaccgagg agacgcacac cgtccgtgcg gccccggaat cgtctgcgca 11220
cgtgatggag tacggcggcg cgggtcccga cgacctgacc gtccgcgcgg cggccaagtc 11280
cggtgtgttc accaacgtcg acaccgctgc cgatgacgtg gccctcctcg ggcccacctc 11340
cggcagcacc ggcgccccga aaatcaccat gcacttccac cgggacctgc tgtccatcga 11400
caacaccttc ggacgccaca tcctgcggct gacccccgac gacatcgtcg cctgtaccgc 11460
ccccctcgcc ttcaccttcg gcctgggcat gcttgtcgtc ttcccgctgc gggccggcgc 11520
gtgcgcgctg ctgaccgagt ccgtcacccc ctcacagctc gcgcaggtgg tggagcgcca 11580
cggcgtcacc gcactcgcga cggcccccac ggcctaccgc gccatcctcc gcgagggcca 11640
ggtgaggaaa ctggcggggc tgcgggtcgc ggtctccgcc ggcgaacacc ttccccgcgg 11700
cacctgggag cagttgcacg agcaagccgg gctcagggtc atcgacggca tcggcgccac 11760
cgagatgctg cacatcttcc tctccgccgc cggccccgac atacggcccg gtgccaccgg 11820
caggccggta cccggctacc gcgccaccat cctcggcccc ggcggtgagg aactcggtcc 11880
cggtgagccg ggacgcctcg gcgtcatcgg cccgaccggc tgccggtacc tcgacgacac 11940
ccgccagcag ggctacgtcg tccatggctg gaacgtcacc ggcgacgtct tccaccgcga 12000
cgaggagggc tacttccact tcgaggcgcg cgacgacagc ctgatcgtct cctccggcta 12060
caacatcggt gcccccgagg tcgaggccgc cgtggaaacc caccccgacg tgagtgagtg 12120
cgccgtcgtc ccgagtcccg accccgagcg cggttcactc gtgtgcgcct tcatcgtcct 12180
gaaggacggc gtcagcggcg acgacgccaa ggcgcgggag atccaggacc acgtcaaaca 12240
ggtcatcgcg ccctacaagt acccgcgcga cgtgcgcttt tgcgtatcgc ttccccgcaa 12300
ccccagtggc aaggtccagc gcttcacgct ccgcggcatc gtcgaggccg agcacaccgc 12360
cacccccgcc gaccagcagt agaggacgtc ccatgaagat cgcgattgtg ggaggcggcc 12420
ccggcggcct ctatttcgcg acgctgatga agcagctcga cccggcccac gacatcaccg 12480
tcttcgagcg caacgcaccg gatgacacct tcggcttcgg cgtcgtgttc tccgacgaga 12540
ccctcggtgg catcgagaac gccgacaccg tcttctccga ggccatggcc cgccgctgcg 12600
cccgctggac cgatatcgac atccactacc gcggcgagcg gcacaccgtc ggtggccagg 12660
gcttcgccgc gatgggccgc aaggagctgc tccacctcct ccaggagcgc tgccgcgcac 12720
tcggtgtgac cgtccgtttc cggaccaccg caccggacgt cgaggcgctg cgtgccgccc 12780
acgacctggt cgtcggtgcc gacggtgtca actccgccat ccgcgcacgc tacgcgggcg 12840
tcttccgccc cgccctggac cggcgcgcca acaagttcat gtggctgggc acggaccgtg 12900
tgttcgaagc gttccagttc atgatcaagg agacggagtg ggggacgatg caggtccacg 12960
gctaccccta ctccggcagc ggctccacct tcatcgtcga gatgcatgag gaggtctggc 13020
gacgcgccgg cttcgacacc acgcaggaca cccggtttcc cccgggcgtc tccgacgaac 13080
aggctgtcga ccggctgcgc tccctgttcg ccgcggaact ggcaggacac cagctgctcg 13140
ccaacaactc caagtggctg aacttcacca ccgtccgcaa cgaacgctgg caccacggca 13200
acctggtgct gctcggtgac gccgcccaca ccgcgcactt ctccatcggc tcgggcacca 13260
agctggccat ggaggacgct ctcgccctcg ccgcctgcct gcatgagaac accggtgtcc 13320
ggtccgggct gagcgcctac gagagcgagc gaaggcccgt tgtcgaatcc acccaacgcg 13380
ccgcgcaggc atccttggag tggttcgaga acatcggcat gtacacgggt caggagcgcg 13440
tgcagttctg cttcaacctc ctgacccgtt cccggcgcat cacccacgac aacctccgcg 13500
agcgcgatcc ggagttcgcc gcccgcgtcg acgccgcctt cgcggccgcc cagggctgcg 13560
accaggtggc cccggccatg ttccagccct tccggctggg gcagctggag ctgcgcaacc 13620
gggtcgtgat gtcccccatg gacatgtact ccgccgtcga cggcgtccca ggcgacttcc 13680
atctcgtcca tctcgggtcc aaggccctgg gcggcgccgg cctggtgatg acggagatgg 13740
tctgcgtttc ccccgagggc cgcatcaccc ccggctgccc gggcctgtgg accgatgagc 13800
agcgcgactc atggaagcgc atcgtctcct tcgcacacga gcgcagtgac gcggccatcg 13860
gcctccagct cggccactcc ggccgcaagg gctccacccg gctcatgtgg gagggcatgg 13920
accatccgct gcccgagggc aactgggaag tcgtcggccc gtcgccgctg ccgtacggac 13980
ccggctccgc cgtgccccgc gaggtcaccc gtgccgacat ggacaagatc acagccgact 14040
tcgccgccgc cgccctccgt gccaccgagg ccggcttcga cctgctcgaa ctgcactgcg 14100
cccacggtta cctgctgtcg tccttcctgt cgcccgtcgc caaccggcgc accgactcct 14160
acggcggctc cctggagaac cggctgcggt tcccgctgga agtgttcgac gccgtacgtg 14220
ccgcctggcc ggccgaacgc cccatggccg tgcgcatctc cgccaccgac tgggtcccgg 14280
acggcaccac cgagcacgac gccgtcgaga tcgcccgcgc cttcgccacg cacggcgcgg 14340
acgccattga cgtctcctcc gggcaggtca ccaaggccga acggccggcg ttcggccgct 14400
cctaccagac gcccttcgcc gaccgcattc ggcaggaggt cggggcggcc accaacaccg 14460
ccgtgatcgc cgtcggcgcc atcgcgtcct tcgacgatgt caactcgatc ctgctggcag 14520
gccgcgccga cctgtgcgcg gtgggccgca cccatctgta cgatccgcac tggaccctgc 14580
acgcggcagc cgaccagggc tatgaggggc cgggagcgat ctggccggtg cagttccggg 14640
cgggccgccg caagccgccc tcctcgcgca ccgacgccat ccgcccccgc ctgtcgctgc 14700
tccgggccac gccccccgac caggccgtcc acctgcgctg gactccgccc caggagcccg 14760
cgcccatcgc ctgagacggt ggacggcacc ggacgtgtcc agccgggtgc cgcccgtgat 14820
ggcggccccg gcggatttct tccggggccg ccatcacatg gcatggttgc caggcgtcat 14880
acggaacccg gtgtgcttcg ggagaaggcg ccggcgccgg ccgctgcgga gtgcgccacc 14940
aggcgggtca cggggcggtg ccggagtacg tcaccttcgg tggtccggaa gccggagtcg 15000
gctggtcctc cgccgagggg ggtctccggg cgacgatgat ccgctttccg cgcaacgaag 15060
taccccgggg agcagtgcgg ttgctcgtgc gggacgagaa agagcgcatt ctggtggaac 15120
tgcgcacgga cgcctcccgg ttcgggccgc ggtgggcgga cacgttcctg gccgactaca 15180
tgggtctgat caaggacttc accgagcacg cccgtcccgg gtgaccatgc cgtccggccg 15240
gtcggcctgg acggtgttcc cgcgggggcg aggatgcccg tccctgaccg atcagttgcc 15300
ggaccggggc cccacgagcc ggccatccgg cggtggatct cctcgatccg ccgggcacac 15360
acaatggcct gacgggtgag aagccacggt gcatcaccgg cctgtggggc cggatgtcga 15420
ggtcgtcggc agccggcgtc cctggtccga ggccccttga caggatggcg agggccggac 15480
gctcccgcca cgggtcggag accatctggc ggatttctag ggctcgttga gcaggatgtg 15540
ctccagccct ccatcaacat agtggaccgt cggaccggcc gagtccagtg gcggcgggag 15600
gcggacacgc tggacgacga tctcgccgtg cacgtgttcg gttcctcggg ccgggaccgc 15660
ctcgcggttc aggcgggagc cggtggcacg cggcgcgcat cggcgccatt gccatggccg 15720
acaaccgcgg cccggcgccc ggttcgccgg cttcggcctt ccggtgcggc cggattccgc 15780
ccgtcgtcgc ggtccccgcc gtcaccttcg accgggcatc cggatacggc gccgaccgcc 15840
cttgcgaggc tctcgaactc ggttactctg atgaagatcg acacccggga cccgcacgcc 15900
ggcaactccg ggctcatcgc cttgatcggc taccgcctcc ccctacgatc gcctgaagag 15960
gagaaacgcc atgcccatgc cggccgcatc gccggtcctc gacgacccgc accccacgcg 16020
gtgccgcggt cgctgggccc ggcggtcccc ctcgaggagc cgggaatccg ggccgtcccg 16080
ggccatgcgg cggcgcaggg cacactgaag gacctaggca ccttcagttc catcggcggg 16140
atcgcgttga ctcaactggc caatgccgag atccttttcg ggacggtact cgccacgtac 16200
ggcgagcagc actcccggct gcgccgggtg ctgtcccgac agccggccag tggcccggcg 16260
tcgccgcgct gatcgacatc tgtggccgcc ccgtcgcgcg ggggccaatc caggaactag 16320
cacaccacgg tggcccgacg ctgggtcacc ccagaaggac ggacattcat ggctgggcat 16380
atcgaggact acgcactgat cggtgacttg gagacagccg cgctggtcgg ccgcgacggg 16440
acgatcgact ggttgtgcct gcccaggctc gactcccagg ctgttttcgc cgcgctcctc 16500
ggcaccgagg acaacggctc ctggagcgtc ggcccggcgg agtccagcgg cctgagccca 16560
acggccgacc gccgctccta ccgcggcgaa tcgctgctcc tggaatcgga gtgggacacc 16620
ccgaccggta ccctgcgcgt caccgacttc atgccgccgc gtgagggcgg ggctccccgt 16680
ctgatccggg tcgtcgaagc cgtccgcggc accgtcaccg ccgtgtcgac cctgcgcctg 16740
cggttcaact acggcagggt cgtgccctgg gtccagagga ccgacgacgg ccgggtccgc 16800
gcggtagcgg gcccccacgc ggtgtggctc gacaccgaag cggagacgca cagcgaagcg 16860
ctcaccaccc actcccgcgt cacgctcacc gagggcgagc gcacggcgtt caccttgagc 16920
tggcagccgt cgtacgtcgg cccgcccgac agcctcgaca ccgatcaggt ctcccagata 16980
caggaggaca cggagaagtt ctgggcggac tgggcctccc actgcactta ccacggcccc 17040
taccgcgacg ctgtgatccg ctccctgatc acactgaagg ccctgacgaa cccgctgacc 17100
ggagggatcg tcgccgcggc gaccacctcg ctgcccgagg atctcggtgg cgtccgcaac 17160
tgggactacc gctacgtctg gctcagggac gccgccatca ccatgtcgtg ccttctgcgg 17220
gcgggctacc gcgacgaagc ccgtgcctgg cgggactggc tcctgcgcgc ggtcgccggt 17280
gaccccgaga acctccagat catgtacgga atcgccgggg aacgggagat acccgagacc 17340
acgctgccct ggctggccgg ctacgagaac tcgaccccgg tgcgcatcgg caacgatgcc 17400
gccaaccagc gccaactcga cgtgtacggc gaggtgatcg aggccttact gctggcggca 17460
cacctcggcc tggagcgcga cgagaccagc aacaccctgc tgttcaagct cgtccagtcc 17520
gtcgaagccc actggcacga gcccgacaag ggcatctggg aagtccgcgg ccccgaccgg 17580
cacttcgtgc actccaaggt gatggcctgg gtcgcggtcg actgcgccat caagctgatc 17640
gaaggcggcc acgcggacgg ccccgtggat cgctggaagg tcctgcgtga cacgatccac 17700
caggacgtgt gcgagaacgg ttacgacccc gaacgcaaca ccttcaccca gtcctacggc 17760
agccaggagc tggacgccgc tctgctgctg atcccccaga tcggcttcct gcccgccgac 17820
gacgagcgcg tcatcggcac catcgaggcg atccagcggg aactctccac ccccgacggg 17880
ttcctccggc gctacccgac cgacggggac agtgccggca gcgacggtct ggaggggcat 17940
gagggggcgt tcctcgtctg cgcgttctgg ctggtcgacg atctggcgat gatcggccgt 18000
gccgacgagg cacgtaacct gttcgagcgt ctgctcgccc tgcgcaacga cgtcggtctg 18060
ctggccgaag agtgggaccc gcaccagcgg cgacaggtcg ggaactaccc gcaggcctac 18120
tcccacatcg gcatcgttga cgccgccctc tccctccaga gcccggccca gcggcatccg 18180
ctcgccctca ggagcacgca gcgatgacct cctgccggcc acggctcacc gcgagctgtt 18240
cgcgatagcc gggcaaccgg cctctccttc ccatcctcac gcggtacggc gcggcccgtc 18300
cggtctccac cttccgtgag gatgggctca tcacggtccc cggtccccgg cagaggacca 18360
cccggggcgc gcgaagaccg tcccgcggtg tcggccgggg ccatcgccgg acccggcttc 18420
cggacgggct ctccgaggga cgattgccac ggtggcgcgg ccagtcaggc gcacggtgaa 18480
gcagtacgcc gtggccgcgc ggagcctgcc gggcctgcgt cgtcgggatc cgcgccggga 18540
ccggatcgcg ggaacgccca cgaccagcgg cgaacgtgcc tgactggcgc ggacgtgcac 18600
gccgaggacg ccgagggcga ggggcaagcc ctgggcgtcg gacaggacgt gaggtgggtc 18660
gcccctcttg ccctggaggt gggccctgga ggtgggccct ggaggtgggt cgcccctctt 18720
gccctggtcg accggatcgc gcccggtcag cgcatcacac ggcgaagtcg ccctgggtca 18780
ggagaggagg tccacccgct gcggcgcgtc ctctcccccc ttgggcggcc ggcccggccc 18840
cgcgagcgtg cccgcgagga acagcgggcc cgccgcgaac gcggtgacca gcgcgaaggc 18900
cgccggcagg gaggtggcat cagcgacggc gcccgtcacg gagggggcca ggagcgatga 18960
ggtgtaggtg aaggtggcga cgcccgcgat gtgccggctg ggatctcccc cgtgccggcc 19020
ggcagcgctg agggagaggg gcagtacaac ggcgacgccg gtgccgatca gggcgaaccc 19080
ggcgatggcg acgggtgggg tacgggccag cacgaccagc gtgccgccaa gcgccgcgat 19140
gccgccgctc agccgcaccg tgcggaccgg tccgaggcgg ctgacgacga agccgctgga 19200
gagcctggcc agcgccaggg tgaagctgag cccggtgtag ctgagcgcgg cgaccccctc 19260
ggacgcgtgc gcggtcgagc tcaggtacac cgcgctccag tttccgctgg cgccctcggc 19320
gaacacggcg cagaaaccga ggatgccgat ggggagggtg gacagcgggg ggagcgcgaa 19380
gcgaggcggt ggctgccggg cctcggtcgg gtccgactcc agcaggtgcc gcctggtggc 19440
cagcagcccg atgcccgcca ggaccgcggc ggcgacggcg aagtgcaagc gggcgtccat 19500
gccggcgctg gcggcgagtg cgccgcagcc cgaggagacc agccctccca cagcccatat 19560
gccatgcagg ccggcgatga ggggttggtt caggcgctgc tcgacctgta ccccctgcgc 19620
gttcatcagg acgtccatca tgccggaggc cgcgccgaac agtcccaggg ccacacacag 19680
ggcgggcagg ttcggcgcga gtgccggcag gatgagcgag gcacaccaca gcgggagcag 19740
gcaggtcagg gcacgggggt taccgaagcg gtgaaccagg cggctggtga agggcaccgc 19800
cccgaacgag ccgagagccg gggcgaggag tgccaggccg agagtgctgt cgctgaggcc 19860
gaggtgctgc tgcagccagg ggatgcgggt ggcgaacgcc cccacggccg ccccgtgggc 19920
ggcgaagacg acggagatcc gacgacgcga gcgatataac acgcgctcgg tcatggtgat 19980
gaacccttct cgatcgtgtc gtgctgcgcc accggcccgc gtggtcggag cagggcggtc 20040
ggggggaggc gagggtggca cacagccacc gcgggtggac agcgcgccac aggttgtggg 20100
ggtggatgtg gtgaccgccg tggacgcggc cgtcagtcgc cgcgcgggga cggctcgagg 20160
accgagcccg cgatccggtg tgcctccttg gtgatcccct ccccccacgc ctgccggggt 20220
tcgtccatgc gcgaggtgat gatgacgagg tcgaagtgct ggtcgggcca gggggtacgc 20280
agtccggaca ggtgccacgt cgagaccgcg tcaccgtcgc gtccctcctg tcgcgcgagc 20340
accccctcgt cgaaatcgca caggaagagt tcgacatttt cccgcggcgc ggcggggagg 20400
gactccgtgc cgcttccgaa caccgccacc cgctgggtgc gctccagcgg cggcagggtg 20460
tccaaccccg cctcgatctc ggccaggacc ttgtgcccgc gagcccggtt cgcccattcc 20520
tcgaagcgga gccgctccgt ctcgaccgag ccgtagatgc ccctgttggt cacggcccag 20580
aagagctcgg ggagcaggga ggggtgcttg ccgaggaaca gatcacagtt gcgcaggagg 20640
gtggagacgt tggcgtcctg ggtgcgctcg tgcggcgcct cgatccccca gcactcacgc 20700
gagaccgtca tggggatgcc atgctggtgc agccggtagc cgagttcgat gtcctcccct 20760
ccccatccgg tgaagtcctc gtcgaacccg ccgacccgcc agaagacggc tgtcggcatc 20820
gacacgttga gcgtccagaa gaacagccag ggcatgtgca tacggctgag gtcgaagtcg 20880
accgcggcga attccggcag ccgcatgtcc tcgaaccagg aggcgcccgc gaccctcctc 20940
acgacctcct ccggggggaa gtcggcgacg agagtgtgga gttcggggcg ggggttctgc 21000
gggtcgtagc cgtagctgta gccgaagaca acctgggcgg gcgccggcgc ggcgtgggcg 21060
gcgagtaccg cctcgacgta ctgcggcccg gccagaacac cggtgtcgag gaaggccagc 21120
agtggcgcgg aggccaggcg cgcaccaccg ttgcgcgcgc tggcgacccg gtacccgagg 21180
tcttcctgga agacgtaccg catgcgcagc cggtcctcat aggaccgcac cacgtcgcgg 21240
gtggtgtcgt tcgagccgtc gtcggacacc acgacctcga aggtctcggg cgccgccgtc 21300
tggcgaacca gcgtgctcaa cgtccggtcg aggagcgcgg ctcggttgta ggtcgggatg 21360
acgatcgaga gcagtggcac gtcagacgtc gcaccgggca tggaagtcac ctttgcgtca 21420
actggatgga aataggggtc gggttgcgca tgcccgccgg gcggagggtg gccgggtctg 21480
tcggcccccg tcgcggcagg cgtgggaatg cgggagggca tcggaggcgc tcaccgccag 21540
gttccggctc tggccacggg gaccccggtc cgcgcgtggt gagtctaccc cttgatcgtg 21600
gcgcctggac agctgaaccc cttggtgtcc ggctatcttg acgggccgtc acccgacgcg 21660
ccccggcgcc ttgaacaccc tttgttcatc agggagttcg cccgcccttg ggcttcttgg 21720
ccgggtggtg ggaccgcctt ccgcgggcgg gggaatcaac ggcgcaccgc ggcttccacc 21780
gctccggatg acgtggtgta cggccggccg ccaccagggc ggcaccctgg cagtgcatcg 21840
ccgacgtgcg gtgcgtcgcg tacctgggag ccgtctttcg ccgcatccca gggccggtcg 21900
ctcacctgga acacggtggg gcagccgccg tcatgggcgt cccgtcaggg gggttcgggg 21960
tggacgacga tcttgccggg tccgagtgcg tccggggtcc gcagcagtcc gagcagcccc 22020
ggcaggtcca cttcgccggc caccagggct tcggcacgca gaggtgccgc gacgtcggtg 22080
aggtcgccga tcgcggcagc gaaatcctgc ggggtcgtgc cgtagctgcc ggccacccga 22140
agcgagtggc cccgccaggt gcaggcggcg accgttccgg tgcgccgcac gtggtccagg 22200
tcgcagtcca gccccgggta ccggtcgcct ggcgcggtgc cgccgtacag cagcaccaga 22260
ccaccgggcg cgaccagacg cagcgcctcg tccagcccgg cgggcagcac gaagctggtg 22320
gcgaccacca ccacgtcggc cctgcccgcg gccggttcgc cgaacagcag ccagggcacg 22380
tcgagcaggc cggccttgcg ggcctcatcc atccgggcgc ggctccggtt gtgcaccgac 22440
acccgggcgc ccgctcgtcc ggcgagcgcc gcgatgagaa gcccggcggt cccggcaccg 22500
agcaccatga cgtgaacccc tcgcaggtcc ccgacctggc gctggacggc gcccagacag 22560
tgctgggcgc aggcgatcgg ctcggcgaag accaggcgac gggcggccgg accgtgcggc 22620
accggttgca gggcctgccg cagcaggtca gccggacccg ccgcccacat gtggtcggcg 22680
aacccggtgc cccggtccac cacgacgttc gggtccagga cgacgcgggt gccctcggcg 22740
agggcgggga cagtggactc gcggatgatg ccgacgagtt cgtgcccgaa ctggctggga 22800
ccgtggcggc taccagccac ctccttgagg tcggagcggc acagcgcggc cagttcgatg 22860
tccacgagta cagcggggtc ctcgcgcggg cgcggcggcg gcgagcggcg caggcggggc 22920
ccgccctcct ccaggatcac tctcatgcga tggcctccag tgcctcgccg aaccggtcgg 22980
cgatggtgtg ggcttcggca ggggtgagga tgagaggcgg gcgcagttcg atggtgctgc 23040
cgtttccgtg ctcggagacc cgggtgagga tgccgtggct ctggagcgac cgctggtagg 23100
cgttggcgcg ggcggtggcc tggctgccgt cgggttccac cagctccacc ccgatcatca 23160
ggccgacccc tcggacgtcg ccgatcacgg ggttgtcctt ctggaggtcc cgcagccggc 23220
cgaggagcac gtcgccgctg gcccgtacgt tctccaggaa gccgggtcgc tggacgattt 23280
ccagggtggc cagggcggcg gcggccgaca gggtgtggct gccgtaggtg aagctgtgca 23340
ggctgcggtc ccagtcggcc atgcgttcct cggtgaggat ggcggccatc gggaggccgc 23400
tgccggtgag ccccttggcg agggtcatca tatgcggctg gacaccgaag tggtcggcgg 23460
cgaacatgcg tccggtgcgg cccagcccgg tctggatctc gtcgaagacg agcacgatct 23520
cgcgctcgtc gcagaaccgg cgcagctcct ggaggtagcc gtcgggcggg acgatgttgc 23580
cgccggcgcc gctgatcggc tcgatcacta cgcaggccac gctgccggag ctggcgtagg 23640
tgatgaagtc ctcgatgcgg tcgacgcaga gcatgccgca cgtctcgggc gtctgccggt 23700
agaagcagcg gaaacagtag gggcccggca cgtgaaggcc gccggggtag cggtacggga 23760
atggcgcgcg catcttggtg gtgccgttga ggctggccgt cgcgaggctc tggccgaggt 23820
gggcgcggaa gggcacgatg acgtcgcggc ggccggtgtg cagctgggcc atcttgatgg 23880
cgccctcatt ggcggtggag ccgctggagc tgcgcaggtt gacccgcgtg agattgggcg 23940
ggctgatggc ggccagttcc tggatgaccc ggttggtggg ttcggtctgg aaggaggagc 24000
tggcgaagac gagccgctcg gtctgttccc gtacggcggc catcacctcg gggtggttgt 24060
gcccgagcag caggttgaag gtgccggaga cgcagtcgag gaattcacgt ccctcggcat 24120
cccaggcgcg gatgccctca ccgcctacca gcatgatgtc gccgagctgg tactgcgccg 24180
cctcctgcgg cgcggggagg cgttttgtcg ttgtcatggc gcgctccgtg gtcgtggcgg 24240
tcagaggtct gcccgtgccg ggatggccgt cgcggcgtcg gggccctcag cggccctcgt 24300
gcgggccgcg tggtcggcgg cgagtccgtc cagctgggcc tgcacccagg cttcgagcgt 24360
ccaggggcgg gcagcgtcac gacggcgggc ggcgtcctcc gcccgctgtc gcggcccggc 24420
ggtgagcgcg gcggaaatgg cctcggcctg ctcaacgaga tcgaaggggt tgacggtgcg 24480
gcagtactcg cccaggacct cggccgcgcc gcacgtttcc gacaggatga cgtcggcgtc 24540
gcgttcgttg accagcggcg cttcgaacgt gctgaggttc tggccgtcga cggtcgagtt 24600
gaagatgagc aggtcggccc ggcggaagca ggcgatggtg tggttcacgt cgttgtcgtt 24660
gtccatgcgc acggtgtcgg ggcccagctc ggcgttggcc tccgccacgg cggcctccac 24720
ccggcgtacg tagtcggcgt tggccggcac gtacagtcgg ttggggttca tccgcaccag 24780
catgcgggtt ccctcgagtc cgccgttccg ggcggccagg acgaaggcgc gcaccgcgcg 24840
tgcggcgttc ttgatcgggt cggtgcgccc gctgtgcacc accagccggt ggccgtccgc 24900
ccactcctcg atcccgtcgg gcagttgcgg gtcgcggccc tcaagggtga gcgggctgta 24960
gccgagcggc atggtgcgca gtcgggtgcg gtggccgcgc cactcgacgg tcatcgcctc 25020
gcggtcgatc cgggcgtcgg gcaggagatc ggccacgcat tccaggaagt tgcggcacca 25080
gcggtcggcg aagaagccga tggtggtggc cggtaacatg ctctggagga tgctggtgcg 25140
gatctccttg ggcagcaccc tccagtagtc ggccgacggc cacgggatgt gcacgaagac 25200
caggatcggc gcgtccggcc gcttttcgcg cagcagcgcg gggaccccga ccagctggta 25260
gtcgtggacg aggtagacgg ggtccggcga ctgggccgag ctctggagga tggcgtcagc 25320
gaagtcccgc gtgaagcggc cgaagtccgc ccagcccgcg cgggcgtcgg agccgaacga 25380
cggctgggtc cagcggtccc agccgtagtt gttggccgcc cacatcaggt tggcggtcat 25440
gaagttctgc acgttgcgga agacatcggg gtcgtgcctg atgagccgga ccaggatctc 25500
ccggccggag tgcagctcca tggtcacgcc gtcggggttg cgcgccgagg cgcggcggtc 25560
gtcctcggag tcggcgctgg ctatccagga gatgttgagg acaccggcct gttcggcgac 25620
gacgttcccg gtgccgccgg gggccagcca ggcacgaggt tcgccggtgg cgggatcggt 25680
gtcataggtg atcgccgcgc gcttgctggc gaggaagatc tcagatccgg tcacgggtgc 25740
cccattcacg ggtcgggggc cggaagcggg ccggccggga tggacagaac gtgtgcatgc 25800
ggtgcggagg ggggcgggtg gtggcgtcag aaggtcaggg cgtgggtggc ttcgaggacg 25860
tcgaccggac ggtggcgccg gagctcgggc aactgcgcgg ccacctcact gtgcagacag 25920
gcgttgcgcg gccgacaggc gtaggcggtg ccggcacgcg gcgtcggcac gatgagcgcg 25980
gggtccgctc cgagctgccg ggcgatgtgc ctggcccagt cgacccggcc gatgcggcgc 26040
ggcccgccga ggtgcagcgt cccggtgcgg ccggaacgca tcagcgccgc cgtccacgcg 26100
gccacgtccg ccacgagaac gggcgtgttc cagtggtcat cggggatccg cagccgctcc 26160
ccgcgcatca gcgaacgagc gacgctggta aggaagttgg gccgtggtcc gcggtcctcc 26220
catccgtaga ccaggctcac ccgcaggaca agggcgcagg aggtggcgag cagttcccgc 26280
tcggccgcga gcttcgcccg gccgtaggcg ttggccgggg aggtctgtgc cgactcgccg 26340
tggctctccg cctcgccggg gaagacgttg tcggtcgaca ccagcagtac gggccggccg 26400
tccagcgcgg ctgcgatgtt gcgggcgccg ccgtggtggg tggcgtacgc ctcctcggga 26460
tgtgcctcgc accatgtgat gtcggacggg ccgtgtacgg ccacgacggc gtcgggctgg 26520
atggcctcca tcagggcggc cacctgcggc cttgaggtga catcgacccg ggcccagcgc 26580
ataccgcggc tttcggggag gaccggggcg ctccgggagc tgagcaccgt ctcgacgccg 26640
agcccggtga ggcgggcggc gatgtgcccg gcgaggtagc cggagccgat gaccaggacc 26700
cggccaggca tggcgcccgc cgtcgacccg ggtggcgcga ggggcgacgg gcgaagatca 26760
gacatgtact tcctccagct gatgcggcgg gcggacaggg cggggcgtgt tccggtcggg 26820
tatgcggacg ttccgtgccg gcgcgcccgc cgccacacgg gttccccggc cggtgccgac 26880
ggtgagcgcg ccgagcaggt tcgtggtgtc gtgtcaccgt cgcgggtacg gcacggttgc 26940
ggcgacggtt cggcactggt ggggttcggc tccggcgccc gtgcctggtt cgctcatcac 27000
ccgacagcac gacagcgcac ccggacgggc ccaggtacgg cccggtgata ccggcggccc 27060
tttccgtgaa cgccgggtct tcgacggttt gaaaaggccc gaccggtgtg gcttcttcat 27120
tcttctcccg ccagaagcgg cgcgcaggag aaaagaaaga gacctcgatt ccctcacgcc 27180
gattcgcgcg acgctccagc acaggagtcg acgagcgaga cccgctcgat ttcggcggcc 27240
gggacattcc gctcagtgcg atcacgtggc ctgcggcggc agcacctggc cctttccggc 27300
tccgccgctt ttttcaccgg ccccgccgac ccgagttcct cacaacgggt tccggtgcgg 27360
tcccgtctct catgcggata cgaccgccgg ttcggcgacg tcctcacggt ggcgccgctc 27420
gtccaccaca ttgcgtcagg ccccggaaaa ggccgcggac actgtcacct gccggcccgt 27480
gatcaacgcc tgcaccagag gggcggagaa aaatctgact ggtacgcgcg cccaggttgg 27540
cgcccgagcg gcagcagagg cttccgtcgt cgctctcgcg ccggccccgc cgctgaggaa 27600
tgtcgccgaa ggtgaaatgt tggctccagg cggttggcgc tgcggaaacc gcccctgtgc 27660
ccagtcccat tgtcgtcgtt gcgcgcccgc aaccagcgcg gcaagagctg cgcgcttcat 27720
gtaccacaag agcatgcttt ctccacgtgt gccgtgggtg actcatgcgc tttacatctt 27780
cacttattac aagcggcgat caacttgctg tcaaggatgc gatctttctt ggctcaatcg 27840
gcccggtggc gtttcccgca cccatgtgag tcagcctgtc aggccgcagg tgacaccctg 27900
tcacatatca cgacaacggc cagaagatgg cggtgcccgg cgacgcataa ccgatcgagc 27960
aatctaaacc aagatggaca taagggatca cgtgtctctt gacaaggtca tgtgcgcggc 28020
ctttagatcg ataaggtatc ggtaaggtat tgatcactta ccacgactgg cccgaagccg 28080
cagcgggaac cgccgtaccg gcagttcacc gcttggcgcg gacgcggcgc gcaggaagcc 28140
cggtcaggca gcggtggcgc gtccgtgggg gaccgcccac ccatcaccgc gatcacacat 28200
ccgaacctct atccgacgcc agaagtagtg tgccggtccc tgtcacctgc tgcgggacgc 28260
ccaccaccgc ccggtcgcgc ctccgcccgg agcgccacca ccccatcttc cgtaccgtca 28320
actcgccccg accactgccg agttcacccc cgttgcgcgg ctgggcgacc gccgtccgca 28380
caccgcgtgc cgcggcccgc gggtgatggc ctgctgcgcc cgtgcccacc gctcctcccc 28440
ctcacagcac gagaggatcg acgaccgtga ccagaaccaa aagtctttcc cgccgcgccg 28500
atcgtgtggc cgatcgtgtg gccgatcgtg tgcacgacga ggcgacggag ggcggcgcag 28560
tctggcgggt gagcgcgctc aaggaggtga gctacgacgt catggtgcag ccacggctgc 28620
tcgatccggc gaacccagcg ctcgcccgcg ccgtgacgtc cggtgcggcg ccggtacgcc 28680
ggctcatcgt gatcgacgcc acggtggcct ccctctacgg tgagcggctg accgcctacc 28740
tgacgggcca tgacgtggag ttccgcctgt gcgtcatcga cgcccacgaa tcggtgaagg 28800
tcatggccac cgtcttcgag gtcgtggacg cgatggacgc cttcggtgtg ccgcggcgcc 28860
acgcgccggt ggtcgccatg ggtggcgggg tgctcacgga catcgtcggg ctcgcggcga 28920
gcctgtaccg cagggccacg ccgtacatcc ggatacccac gaccctgatc gggatgatcg 28980
acgcgggcat cggctccaag acgggcgtca acttccgcga gcacaagaac cggctcggcg 29040
cctatcaccc ctcgtcgctg acgctcatcg accccggttt cctcagcacg ctcgattccc 29100
ggcacttacg caacggcctg gcggaaatcc tgaagattgc cctgatcaag gatgccgaac 29160
tgttcgatct gctggcgacg tacggcgcgg gcctggtcga gcagcggatg caaccgggcg 29220
aggacgcggt cggcggtgcg gcgctcaccg tgctgcgccg ggcggtccag ggcatgctgg 29280
aggaactcca gcccaatctc tgggaggacc gtctgcagcg tctggtcgat ttcgggcact 29340
ccttctcacc gaccattgag atgacggcgc tgcccgagtt gctgcacggc gaggccgtct 29400
gcgtcgacat ggcgctcagc tcggtcctcg cccaccaccg ggggctcctg accacggccg 29460
agctcgaccg tgtcctggat gtcatgcgcg tcctccacct gcccgtgctc cacccggtgt 29520
gcacaccgga actgctgcgc ggggcgctcg cggacacggt caagcatcgg gacggccggc 29580
agcacctgcc tcttccccag gggatcggcg acgccgtgtt cgtggacgac gtcacccagc 29640
acgaggtcga ggccgcgctg ttcgccctcg gcgagcgtga gcgggcgacg cggcagccga 29700
aggtgcgcgg tccggtggat atgggggtct gagggcatgg atggagtgcg tgccgtcctg 29760
ctggcgggtg gtgagggccg gcgcatgggg ccgctgggac gcggcaggct caagccactg 29820
gtgccgttcg gcggcacctc ccgcctcatc gacttcagca tcgccaacgt ccaccggtcg 29880
ggcctgcggg atgtcctgct gttgtcccag tacgaggagc gccgcctcat ggacgacctg 29940
cacctggtgt ggaacggacg tcatcacggc tttcgggtgg acttcggccc ctacgacgcg 30000
gtgtaccgga attcaccggg caagctgccc gagcggctgc cggagcgtac ctggccggtg 30060
gagcgcggta cggccgacgc actgctcaac aaggccgagt acgtcttcgg gcagaggggc 30120
gcgggggcct cggagatcct cgtgctccat gcggaccacg tctaccgttt cgattacggc 30180
cgcatgatcc gcgagcaccg tgcgtcacgg gccgcgctga ccatctcgta ccagcgcata 30240
gaacggcgct acgtgcacct gttcggcatg gtcgagttcg accggaacgg cctgctcaca 30300
gccttcgagg aaaagccgca ccaccccacg agcgacctgg tgttcgccgc tttctgcgtc 30360
ttcgacgcgg cgacactgcg gcgctacctg gagcacctgc gcggcaccga ctggcagcac 30420
gacatcagca gggacgtcat ccccgccatg ctggccggcg gcgaactcat ccgtgggtat 30480
gaagtcaagg gctactggga ggacatcggc accgtggacc gctaccaccg cgcccaccgc 30540
ggactgctgc gggctgagcc gacgctcgcg ttgggcgaca tgccactgac cgtcgccccc 30600
ggggtgccgc ggcgcctcgt ccctgacggg cccggcgggg acgccagcat cgtggcggcc 30660
gacgtggtga acgagggcga gatcgtgaac agtgtggtgt acccgggcgc gcgcatcggt 30720
ttcggcgcac acgtggccga ctgcgtcgtg ctgccgggtg cccaggtgcc cgacggggca 30780
cgcctggcgt cggccatcgt gctggaggac ggctctgtcc agcagtgcga ggcggcgcgg 30840
gaagaggtcg cgccatgacg gcactcgtac ccgcgccatg tgacctcgtg gtggccgacc 30900
tcggtggcac gaccctacgc gtgggccgga tcagggcggg cacctccgag gtgcgtgacg 30960
tgcggcgagt gcccaccgac gggctcggcc ggtacggcac acgcgacccg caggagctcc 31020
aggaccgggt catggagcag ctcacgcggg agatcgcggc cgacgtcgcc cgaccaggcc 31080
agccacccgc tcgggccgtg gcggtgtcct tcgccgggcc gatgacatcc gacggagtcg 31140
tcctcgccgg cccgacgctg tggggcggcc ccgccgcgcg gctgcccgtc gccgatgtgc 31200
tggcagggca gctgggcctg cccgtggtcg tggccaacga cgtgaccgcg gcggcctggc 31260
gctacgcctc ggccgagtcc gagccgttct gcctgatcac cgtgagctcg ggcatcggga 31320
acaaggtgtt ccgccatggc gagatcgtct gcgacgagcg cgggtacggc ggggagatcg 31380
gccactggct cgtcgacccg gccgaggacg ccgcgccgtg cgagtgcgga gggcgcggcc 31440
acctcggggc gatcgcgtca ggacgcggcg cgctgttcgc ggtgcgggcc gcggcggcgg 31500
ccgacaccgg tgccttcgcc cgctcggcgc tggccgggcc ctcgggcggc gtgcccgacg 31560
ccatcaccaa cgaggcgttc gcggcggcgg cccgagcggg cgacaccttc gcgcgggagg 31620
cgctgcgccg ctcgctgcgg cccctcgcgt ccgcggtgag cctgctgttc accgcgatcg 31680
gcgtgcgccg ctacctgttc gtcgggggct tcgcccttgc cctgggcgac accttcctta 31740
cgctgctcgg cgacgaactg gtgcggatcg gctgcttcgg cctggacgag tacgcgacac 31800
gcgccatgct cgcgctcggc gaggacgacg acgaccactg cctcatcggc atcggccagt 31860
tggcggcggc acgcctcggt gctccccggg ccctcaaggc gcctgcgtga ccacgccgat 31920
cctcggcagc ggctccgtcg gcggcacgcc ggccacagac cggcggcggc cggggagccc 31980
gcgcggtcgc ctccgggaca ccgccgaggt ccggcacgct cgccggagat gtccggtgga 32040
aaccgcccga cgtgagcggc ccggggacct cgcccggggg ccggccgccc gcggcgccag 32100
gcggcccggc gaacgacgcc cacggcgccg gccgtcgcct gcggcagggc agagctcgcg 32160
gcggagcacc gggcgggcgg cgtgccggag cctgacggtg ccacgggccg gccctgtccc 32220
tggcccggaa gacccggcgc ccgtcgggtg gccgcgatcc tccgcccggt gcgcgctggc 32280
cgcgatcctc cgcccggtgc gcgctggccg cgatcctccg cccggtgcgc gctggccgcg 32340
atcctccgcc cggtgcgcgc tggccgcgat cctccgcccg gtgcgtgctg ggcgcgggcc 32400
gcgaggtgcg cgtcccgcgc ccagcggacc acgttcggcc ctggtggcca acgtggcagc 32460
cgtcacgagc gcgctccgga cggtgcgcgg gccgcccctg ccgtccctcg gcggatccga 32520
ccgggtcccg cgccacgagg cggcgccggt cctcgcccgc ccggccggcg ctcccgaccc 32580
gccggtggtc cccgggcccc gggccgcagg gcggtacgcg agcgggcccc cggacaaccg 32640
cctggtacgc ctccagccgg ccggcgcccc cggcctcgcg ctcccccacc gggtccgtgg 32700
ggttcccgag ggcgcccgcc acctgtcgca cgccccgtgg cccccacggc cccctcgcag 32760
cgatcgaccc atcacccagc ctgaggaggc agccccgtgc tcccccccga ccgctcgtgc 32820
gcgcccgctt ccgccgcggc cggcccgtcc tcgtgtggcg acggccaagg accggcgccg 32880
cgtggggtgc ccggcgccca acgagtcgac cacctggcgt tcaccgtgtc cgacctggac 32940
gccgcgatcg gcttcgccga aacggcactc ggtggcgaac tcgtctaccg gctcccgccg 33000
ctgacgcacg ccaacgactg gatgcgcgta cacctcgacg tacacccgcg agccagcgcc 33060
gagatcgccc tcgtccgcct gggacccgac accaacctcg aactgttcgc ctaccagtcg 33120
ccggatcgca ccgccccgcc acgggctccg cacgacgcgg gacacgtgca cctcgcgctg 33180
cacgtgacgg acgtggcacg ggccgccgcc gaactcacgc gtcgagcggg ggtgagccca 33240
ctcggcccgg tccgccgggt ccccgacggg cagcccgacg cgggcacgcg ctgggtgaga 33300
ctgtcctcgc cgttcgacgc acccctggaa ctgcggtccg taccggaggc gttgccgtac 33360
gaggtggagg gcggcacacc acgccgccgc ccgccggggc cgtggcgcaa ccgggacgac 33420
ggcacggcga gccggcgcgg cctgcccggc gcgctcggcg tcgaccactt cgccaggacc 33480
gtcaccgacc tcgacgcggc cgagcggttc ttcgtggacg tcctgggcgc cgagctgctg 33540
taccggaacg agcagagcgt ccttcccgcg gacgtggcgg cggcgctcgg cgtgccaccg 33600
ggcggtggcc tgcggcgggc cgtgctgggc atgggcccga ccgacaccat cgaactggcc 33660
tgctacgagg ggacgtcggc cggcgaccca caccctccgc gcaacagcga cgtcggcggc 33720
agccatctcg ccctgcacgt ccgcgacgtg gacgtggccg ccgcctacct ggccgaacac 33780
ggctgcaccg tgctcggcgg gccggagacg atcgatcagg ggccgctcac cggcgaccga 33840
tgggtgtaca cccgcgcccc cttcggcctc tacgtggagg tcgtgcgcat gccggacggc 33900
gcactgccct acgaacgcac caccgccgcc cggcgcaggg ccgcgcacga gctgtcatgg 33960
accgtacgcc acccccggcg gtgaccggag tcagccgtcc gatcaggccg ccgagccggg 34020
catcccccat ggatgaagcg gtcggggaac ccccgtgtgg tgcgcgtcga gcggtccgcc 34080
gacgaccttc ccacgcgtga ccgccgcagc ggtcaacggc atcacctgcg ggcggaagca 34140
acgagcgccg ggtccggtca cccttcccgt gacggggaag ctcgcccggt gaggcgacca 34200
tcccctccgg caaggccgac cgggactgac cggtgtccgg cgcgcatgtc cagcgcgccg 34260
gacaccggta ccacgtcacc agcgggcccg gagtgtccag ccgatgacgg catggagcgg 34320
gtggcaggtg ccgggcagaa gcggagcgcg ccgcacgcga gtgctccggc gctgtgacac 34380
cacgccgccg gggcgtctga ctacgcggcc gccgcgcgac cgctctccac accggcgagc 34440
cgcaggactc ccgtcagccc ccggggcacg cgcacgtcac gctcgctcgg caacaggtac 34500
accggcaacc cggcgcgcgc cgccgcgccg tccttgacgg gatcgtcgcc aacgaacagc 34560
acccgcccgg ccggaagacc cagccgctcg caggcgacgc cgaagacggc agggtcgggc 34620
ttggccaacc cgacctcgca cgacagcacc accgcgtcga gctgatccag tacaccggtg 34680
cgctggaaga ccggtcggat atcccagccg atgttgctca gcacgcccgt gcgcacgcct 34740
gcggcgctga gcgcctcgag caccggaagc gcgtcggggt acgggagcca ggcgtcgttg 34800
tcggtcaggc agtcatagag cgcctccacc aacggtggct cgaacggccc ggcgtcggcg 34860
atcagcccgg tccagatccg ccggtgcgcg tcgggcgaca gatcgcatcc ctccttcgcc 34920
gcgctgcgct ccggcgcgtc cacgtacgcc acggtgcgtc ggatcagcgt cgccgcggcc 34980
tgctcgtcaa gcctgacgcc gcggttactc gccttcgcca ccagccgtgc cgccgtgaac 35040
acccccgtgt cgtcgaacaa tgttcccgcg aagtcgaaga ggaccgcctg gactcctcgt 35100
tcgccaggtc cgctcactgg ttcaccatcc tcttgtgtag gcgatctgtc gtgggtactg 35160
atgcgcccga ggcgctacgg ggccaccgtc agttcgctcg accggcggga ctcctcatga 35220
gatccgcgga gcctggcggc ggcccgggac gtgccggcca tcgacgaggc tggacgccac 35280
cgggcgccga ctcgccaccg actgcgccgg ctgctgggcg gggccgccac ctcccccacg 35340
tacctgcccc gtggcaggct ctttcaggct ccatggccgc ggcacaccgg gaaatgtgac 35400
gggactcatg cccaccccct cccggacacg acggctccgg cgtgccgtgg tacttcaccc 35460
cgctacgccg gagggtggcg ctgccgcacc ggccgccacc gcacgtcctg gacggtggta 35520
cggcgccgcg atgcaacctt cgcagcgcag ccgcgcggac cgggtgccgg gtggccctgc 35580
cgggtcgcag cttccgggcg gtgccggacg gtgccgggcg gtgccggacg gcaagggcct 35640
caatcaggcg gtatgcgccg gggcgctcga aggcatgagg gccgggagac aaggcatgag 35700
gggccgggag acgccgagac gcacatgcct gacgcccggc gagaagtgcg ccacggctgc 35760
ggggttctcc ttccctcggc acggcgcgcc ccgcatcgca tcccttcaac ggcagcggtg 35820
acggactgcc ggtagcaggg atcgcgtgag gttctacggc cggtggaccc agccccggtc 35880
cgtacgggtc agttcgcgga agcccaagcc gagcaactgc tcggtctcgg ccccgtcgtc 35940
agcgcacgcg taggcaagaa ggcggtccgc accgcacagg cgcagccagt cagcggcgtg 36000
tgcgagaagc aggcgttccc agccctcgcc ctgacgtgcc gagtcgatgt gcaggtccgc 36060
gagttcggcc agagcctccg tccgggcgag gcgttcgggt cgggccacag cggtgtcgac 36120
ctcgatgaat cccacggcct ggcggccgac gcaggcggtg aagcgtgtac cgcactcccc 36180
cacggtccgc tcgatcgtga caccggaccg ggattgccgc cgcggcaggt cctcgacccg 36240
ggcgaggaaa agcacctccg tgtccccggt gtgccggaag ccggcgcgct gataggcggc 36300
ccggatatgc ggccaggcac gcggcagccc gtacaccccc gggacgggca gggcaccgtc 36360
gccgtaccgg gtgcggacgt tccagcgggc gaactgggca aggccggcgc tcatcagcag 36420
gtccgccgcc ttcccggcct gtggcagcag ggctgtcgac gggcggcaca cgaaccagtc 36480
gatggccccc gcgtcccgat agtcggcgcc gactccggcc tcatcgcgat aacgcagcag 36540
atgggcggct gctacgacac accggcggtg ctcggcgacg agtgtcatcc gctcacacac 36600
ccaggggtcg gtgacgaact cgtcaggccg gcgttccagc ctgctcaaga cggtgttcac 36660
ggagacggag acgcccggga ccacggctgc ggcatgggcg ttgatgagtt cggtcagctg 36720
atcgcggtct tcgcgtcgga agagacgcac agcaggcata tgtgacctcc agtggaaaac 36780
gtccagggga ggccgccatg cgatgcggta tgccgctgat gctacaccgg tacgacgaca 36840
gcatgcgctg acacctttga cggtcgggcg gggtggtggc ggccacccgc ccgacgccga 36900
cgaccttggc ggtgacgatg gtcgggcctc cggccggacg gcctcgcctc ggtcaggtgc 36960
ggacgctgcc ggtgttcacc ggcagcttgt cctgcttgcg ctggagggcc cggaagtcgt 37020
cgtaccagcc gagactctgg gcgggcgtcg gcgacgtgcc ctcgggtcgt gcggtgcggc 37080
tcgcgtacag gctgttcagc agccacgggg tcttcttcgg gccgaagtcc ttggtcatgg 37140
cggctccctg ggccacacca taggtggcca cggcgagctt tccggtgtcg cggaactgct 37200
tgacctgatt cctcagccag tgcttgtggc tcgcgtacca ggggctcatg gcgagcaggt 37260
cctgccactg gcgctgcggc cacgggtggt cgatcgcctg cttgatcgcc tgccacacct 37320
cggtgccggg gctcatcccg taacgctcgg cgaactggtg cggaatcggg tcgctcaggt 37380
gctgccgcca cagcagcacc agggagaact cggtgaccag gaacttctgc ccgggtccca 37440
gccgcggcac cacgaaatcg aggtacttct tggcgttcgc caacgacgac acgtggggat 37500
ggatgtccac cccctcgatc ccgtcggtcc tccgcgcgaa ctccatccac cgctccgcgc 37560
ccttgccgcg ccactcgggc tcgtcgaggt ggttgagagc gcccatgtag atgcgggtac 37620
ggctgctctt accgctgtgc ctggcccggt aggcgagcac atgctcggcg accttctcgt 37680
agaagtcacc cagcggaccg ttccagtcct ccttgcggct ctcgatgaac ggctcgttcc 37740
cgacaacgag gatgttcacc ttgtccatga cggtggccag caccttgtcg accttggcca 37800
gcacctcggc cgtctcggag ctgtccgggt ccgggaaagg tgtgccgttg tgcgggagct 37860
tcaggctgag aatggtgccg taaccgtgct gggaggcgtt gagcaaggtg gagacggccc 37920
gttcctgcat ggcaccggtc tcctccttgg cacgaagggc gacgaagccg cgcagccaag 37980
tggcgtccac accctcgagt tcggtgagac cgcagccggt ggggtcctcg ttgaagttgc 38040
cgccgagcgc cccgtccggg gccgacccgc cgccggagcc gccgtggccg ccgtggccgc 38100
cgtggccgcc ttggccgcct tggccgccgt ggccgccttg gccgccggag ccgccgttgt 38160
gccctccgcc atcgttcgtc gagcacccgg cggcgaggag ggccgccccc gaggccccga 38220
ccagccaccg acgcgacact gcgagatcgt tctgcttcac gtgctttccc tttccaccgg 38280
ctacgccgaa atcgttctgt gggcaagagc ggcgtctagc cgagcaggaa cctcgcctgg 38340
gagccaggac cggtggagtc catccagaac gagatgatcg cccgagcgcc ggacctcacc 38400
cagcccgagg gcgcatgggc gcccagagcg agggcgagcc tggcgtggcc caccctcgca 38460
cgatcgagtt cgggggcatg gaccagctcg tccgcggtcg cgccgcgccg cccccacggc 38520
aggggcttgg tgcggcgcct gtcgaggacg tcgccgtgcc agagcacgct cttcgcgacg 38580
ccgtggccga gtacgtagtc gacccggatg ccgaacaacg cctccgacga ggccggctgg 38640
tggtccggga actcggcgcg gacgtccgtg tccagggtct gcggcagatc gcggtactcc 38700
gctccgcaca gcccggtgcc ctcatccccc tcgacgccca gataggcgat ggcacgcacg 38760
gcgtcgtagc agccataggc gttgccgcgc accgtggtcg tccctttcgg ccccgtgacg 38820
cggtcggcgt aggtgtgctt ccggaccagg gtggcggaca ggccgtcccg gtccaggacg 38880
ggatggtgcg atacggcgcc gacctccacg tacaccaggc ccgggcccgc caccgtcacg 38940
gtcttggaca acttacggga gtgcccgcgg aggcggacgg tctcactggg gccgaagtcg 39000
cttccgctgt gctccagcgg gctgccgtgc ttctgatcga tgtgatacac cttcagctcg 39060
gtccgccccc cgtcggccgg cggaacgtcg gccagctcga gctggacggt ccgcgactca 39120
ccggactcgt tccacaccag gaccgagctg cgatgctcgt caccggacgc catggcaccg 39180
acgccctcgg gcagcccacc gcgcaccgga gtgcggcggt ccggcatgcg cgcgtagagc 39240
ttcagcgcgt tgaacaacgg cgtgcggagc gccgtgccgc ccttgaaggc gatcatgtgc 39300
ggcaaccagc cgctgaaggt gaacgtctgc aggtcgggta tccgcagcgc cttctccaac 39360
gccgccaccg agcgggccgc ctccagcgcg gttccgccct gcttctccca ctcacccggg 39420
cggaacaccc cgaactgcgc ctgaatgagc ggaacggtgt tgaagtcgcc gcccagcgcg 39480
ttgcgtgcgc cgtcggcgaa gtcggagaga tcctcgccgt agttgttcat ggtgaggtag 39540
tcgaacggca ggtcggggtc ggtcctgcgc cgcttccgca acgcgtcgac ggcggtctcc 39600
aggtagctcc ggccgcccaa ctgccggcgg gggtgcgcgt cgaccggaac gaagctcgcc 39660
ataccgaaca gccccttggg cccgatcgcg ccggtgtagg cgtcgtagat gtcgaccatc 39720
tgccggatgg ac 39732

Claims (10)

1.一种氨基糖苷类抗生素生物合成基因簇,其特征在于,所述基因簇的核苷酸序列如SEQ ID NO.1所示,或与SEQ ID NO.1所示核苷酸编码相同蛋白的核苷酸序列。
2.如权利要求1所述的基因簇,其特征在于,所述基因簇全长39732bp,所述基因簇编码氨基糖苷类抗生素合成涉及的至少10个基因,所述10个基因包括:
ORF17:位于基因簇的核苷酸序列第16369-18207碱基处,编码糖苷水解酶家族15蛋白;
ORF18:位于基因簇的核苷酸序列第18778-19974碱基处,编码MFS转运蛋白;
ORF19:位于基因簇的核苷酸序列第20133-21401碱基处,编码缬草胺A葡萄糖基转移酶;
ORF20:位于基因簇的核苷酸序列第21945-22940碱基处,编码脱氢酶;
ORF21:位于基因簇的核苷酸序列第22943-24217碱基处,编码转氨酶;
ORF22:位于基因簇的核苷酸序列第24241-25734碱基处,编码缬草胺7-磷酸缬烯基转移酶;
ORF23:位于基因簇的核苷酸序列第25827-26711碱基处,编码dTDP-4-去氢骆驼蓬碱还原酶;
ORF24:位于基因簇的核苷酸序列第28506-29732碱基处,编码2-表-5-表-valiolone合酶;
ORF25:位于基因簇的核苷酸序列第29737-30858碱基处,编码缬烯醇-1-磷酸鸟苷基转移酶;
ORF26:位于基因簇的核苷酸序列第30855-31910碱基处,编码C(7)-环醇7-激酶。
3.一种如权利要求1或2所述的基因簇编码的蛋白。
4.一种如权利要求1或2所述的基因簇的表达载体。
5.如权利要求4所述的表达载体,其特征在于,所述表达载体的骨架质粒为pMSBBAC质粒。
6.一种基因工程菌,其特征在于,所述基因工程菌携带如权利要求1或2所述的氨基糖苷类抗生素生物合成基因簇,所述氨基糖苷类抗生素为有效霉素A。
7.一种微生物,其特征在于,所述微生物具有权利要求1或2所述的氨基糖苷类抗生素生物合成基因簇。
8.如权利要求7所述的微生物,其特征在于,所述微生物为吸水链霉菌。
9.一种氨基糖苷类抗生素生物合成的方法,其特征在于,包括以下步骤:
选择如权利要求1或2所述的基因簇;
构建所述基因簇的异源表达工程菌株;
将所述异源表达工程菌株进行发酵取发酵液,去除菌体,得到发酵上清液;
对发酵上清液进行纯化,得到所述氨基糖苷类抗生素。
10.如权利要求9所述的方法,其特征在于,所述氨基糖苷类抗生素为有效霉素A。
CN202110154771.6A 2021-02-04 2021-02-04 氨基糖苷类抗生素生物合成基因簇及应用 Active CN112921045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110154771.6A CN112921045B (zh) 2021-02-04 2021-02-04 氨基糖苷类抗生素生物合成基因簇及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110154771.6A CN112921045B (zh) 2021-02-04 2021-02-04 氨基糖苷类抗生素生物合成基因簇及应用

Publications (2)

Publication Number Publication Date
CN112921045A CN112921045A (zh) 2021-06-08
CN112921045B true CN112921045B (zh) 2022-06-21

Family

ID=76170366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110154771.6A Active CN112921045B (zh) 2021-02-04 2021-02-04 氨基糖苷类抗生素生物合成基因簇及应用

Country Status (1)

Country Link
CN (1) CN112921045B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060095435A (ko) * 2005-02-28 2006-08-31 명지대학교 산학협력단 발리다마이신 생합성 유전자군의 염기서열, 이를 이용한알파-글루코시데이즈 억제물질 생산 균주의 제조 및알파-글루코시데이즈 억제물질의 대량생산방법
CN102277310A (zh) * 2010-06-11 2011-12-14 中国科学院上海生命科学研究院 表达抗生素基因簇的载体宿主系统及其应用
CN103290032A (zh) * 2013-05-14 2013-09-11 华中农业大学 硫藤黄链霉菌抗生素调控基因及提高链霉菌抗生素产量的方法
CN104593309A (zh) * 2015-01-06 2015-05-06 浙江工业大学 一种产udpg的重组工程菌及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060095435A (ko) * 2005-02-28 2006-08-31 명지대학교 산학협력단 발리다마이신 생합성 유전자군의 염기서열, 이를 이용한알파-글루코시데이즈 억제물질 생산 균주의 제조 및알파-글루코시데이즈 억제물질의 대량생산방법
CN102277310A (zh) * 2010-06-11 2011-12-14 中国科学院上海生命科学研究院 表达抗生素基因簇的载体宿主系统及其应用
CN103290032A (zh) * 2013-05-14 2013-09-11 华中农业大学 硫藤黄链霉菌抗生素调控基因及提高链霉菌抗生素产量的方法
CN104593309A (zh) * 2015-01-06 2015-05-06 浙江工业大学 一种产udpg的重组工程菌及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吸水链霉菌5008中井冈霉素生物合成基因簇的克隆;虞沂;《道客巴巴》;20150404;第1-63页 *
红霉素高产菌株的构建和链霉菌SH-62中三个可能的次级代谢产物生物合成基因簇的异源表达;于佩青;《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》;20190315;A006-90 *
链霉菌SH-62中活性天然产物生物合成基因簇的克隆和异源表达以及azinomycin B生物合成调控机制的初步研究;周俊;《链霉菌SH-62中活性天然产物生物合成基因簇的克隆和异源表达以及azinomycin B生物合成调控机制的初步研究》;20170630;A006-116 *

Also Published As

Publication number Publication date
CN112921045A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
CN108048472B (zh) 一株高效异源表达Disorazole Z的工程菌株和构建该菌株的基因簇及其应用
CN101275141A (zh) 阿嗪霉素的生物合成基因簇
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN101818158B (zh) Fr901464的生物合成基因簇
CN111378008B (zh) 脂肽类化合物Totopotensamides及其制备方法和应用
CN108456703A (zh) 一种异源表达埃博霉素的方法
CN111607603B (zh) Hangtaimycin生物合成基因簇及其应用
CN107540682B (zh) 曲张链丝菌素衍生物及其制备方法和应用
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
CN110857447B (zh) 提高米尔贝霉素a3/a4或其衍生物产量的方法
CN112921045B (zh) 氨基糖苷类抗生素生物合成基因簇及应用
CN113897301B (zh) 基因工程高产菌株淀粉酶产色链霉菌及ε-聚赖氨酸的生产方法和应用
CN114517175B (zh) 基因工程菌及其应用
CN112080454B (zh) 一株产柔红霉素的工程链霉菌及其构建方法
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
CN107868770B (zh) 基于c-di-GMP合成相关基因的抗真菌和卵菌活性物质HSAF高产菌株构建及应用
CN112359048B (zh) 一种吕宋肽菌素c的制备方法
CN110129244B (zh) 链霉菌底盘菌株及其构建方法、在异源表达研究中的应用
NL8001676A (nl) Plasmide dna en werkwijze voor het verkrijgen daarvan.
CN113549587B (zh) 一种基因工程高产菌株淀粉酶产色链霉菌及提高ε-聚赖氨酸产量的方法
CN102234674A (zh) 一种提高红霉素产量的方法
NL8001240A (nl) Plasmide dna en werkwijze voor het verkrijgen daarvan.
EP0038156A2 (en) A plasmid and its microbiological preparation
KR102017788B1 (ko) 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant