CN101184838A - 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法 - Google Patents

基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法 Download PDF

Info

Publication number
CN101184838A
CN101184838A CNA2006800182893A CN200680018289A CN101184838A CN 101184838 A CN101184838 A CN 101184838A CN A2006800182893 A CNA2006800182893 A CN A2006800182893A CN 200680018289 A CN200680018289 A CN 200680018289A CN 101184838 A CN101184838 A CN 101184838A
Authority
CN
China
Prior art keywords
sequence
dna
coding
bit base
codon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800182893A
Other languages
English (en)
Other versions
CN101184838B (zh
Inventor
町田和弘
有德保秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eisai R&D Management Co Ltd
Microbiopharm Japan Co Ltd
Original Assignee
Mercian Corp
Eisai R&D Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mercian Corp, Eisai R&D Management Co Ltd filed Critical Mercian Corp
Publication of CN101184838A publication Critical patent/CN101184838A/zh
Application granted granted Critical
Publication of CN101184838B publication Critical patent/CN101184838B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/08Oxygen as only ring hetero atoms containing a hetero ring of at least seven ring members, e.g. zearalenone, macrolide aglycons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/162Heterorings having oxygen atoms as the only ring heteroatoms, e.g. Lasalocid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了直接生产16位羟基化大环内酯类化合物的基因重组微生物,以及使用这些基因重组微生物的16位羟基化大环内酯类化合物的制备方法。具体地,本发明提供了具有编码参与大环内酯类化合物普拉地内酯(pladienolide)的生物合成的多肽的DNA和编码具有普拉地内酯的16位羟基化酶活性的多肽的DNA的基因重组微生物,以及特征在于在培养基中培养这些基因重组微生物,从其培养液中收集16位羟基化大环内酯类化合物的16位羟基化大环内酯类化合物的制备方法。

Description

基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
技术领域
本发明涉及具有生产16位羟基化大环内酯类化合物能力的基因重组微生物以及使用这些微生物的16位羟基化大环内酯类化合物的制备方法。
背景技术
放线菌生产的各种代谢产物中,发现了作为生理活性物质的重要的物质。尤其是,发现许多结构上在母核中具有聚烯酮(polyketide)的化合物(以下称为聚烯酮化合物)。已知有,例如,已知为抗菌性物质的红霉素、交沙霉素、Tyrocin、麦迪霉素、麻西那霉素,已知为抗真菌性物质的制霉菌素、两性霉素,已知为杀虫性物质的密尔伯霉素(Milbemycin)、除虫菌素(Avermectin),已知为免疫抑制物质的他克莫司(Tacrolimus)、雷帕霉素(Rapamycin)和已知为抗肿瘤物质的道诺霉素(daunomycin)、亚德里亚霉素、阿克拉霉素等多种具有生物活性的化合物。
作为这种聚烯酮化合物的一种,为被命名为普拉地内酯(pladienolide)的显示出优异的抗肿瘤活性的一组大环内酯类化合物。普拉地内酯是从放线菌链霉菌属(Streptomyces sp.)Mer-11107株的培养物中发现的化合物组的总称,已知有以下式(A)表示的11107B(有时称为普拉地内酯B)为代表的50种以上的衍生物(参照WO2002/060890)。
Figure A20068001828900101
这些普拉地内酯中,下式(I)表示的16位羟基化体具有强抗肿瘤活性的优异性质,但是其生产性比11107B的生产性要差,制造效率低。
Figure A20068001828900102
(但是,R表示氢原子或羟基)
并且,式(I)中,有时R为氢原子的化合物称为ME-282,将R为羟基的化合物称为11107D或普拉地内酯D。
然后,本申请人的研究组进行了11107B的16位羟基化反应,发现称为普拉地内酯生产菌的其它放线菌(参照WO2003/099813和WO2004/050890),从这些放线菌中获得了与11107B的16位羟基化反应相关的DNA(编码16位羟基化酶及其铁氧还蛋白的DNA),并进行了鉴定(参照2005年6月9日公布的WO-A 2005/052152)。
而且,普拉地内酯生产菌-链霉菌属(Streptomyces sp.)Mer-11107株获得了参与11107B的生物合成的多肽和编码这些多肽的DNA,并进行了鉴定(参照2006年1月26日公布的WO-A 2006/009276)。
这样一来,使用链霉菌属(Streptomyces sp.)Mer-11107株或其变体生产11107B等,通过进行这些16位羟基化反应的其它放线菌将获得的11107B等转化成16位羟基化体,可以实现比以往更有效地制备16位羟基化体。但是,由于进行两个阶段的反应,作业的麻烦变成两倍,希望建立更有效的制备方法。
另一方面,已知有通过在生产聚烯酮化合物的菌株中以可以表达的形式导入编码修饰该聚烯酮化合物的酶的基因,直接生产由导入的酶修饰的聚烯酮化合物的实例。例如,已经报道了在生产丁省霉素(Tetracenomycin)C的淡青链霉菌(Streptomyces glaucescens)GLA.0株中导入弗氏链霉菌(Streptomyces fradiae)Tu2717株的羟基化基因,可以直接生产6-羟基-丁省霉素C(参照J.Bacteriol,1995,vol.177,6126-6136)。
而且,已知有通过向具有修饰聚烯酮化合物的酶的菌株中以可以表达的形式导入该聚烯酮化合物的生物合成基因,作为宿主的菌株直接生产由本来具有的酶修饰的聚烯酮化合物的实例。例如,已经报道了通过向具有羟基化丁省霉素C的6位的酶的弗氏链霉菌(Streptomycesfradiae)Tu2717株中导入淡青链霉菌(Streptomyces glaucescens)GLA.0株的丁省霉素C的生物合成基因,可以直接生产6-羟基-丁省霉素C(参照J.Bacteriol,1995,vol.177,6126-6136)。
而且,还存在通过在异种菌株中导入聚烯酮化合物的生物合成基因和编码修饰该聚烯酮化合物的酶的基因,可以通过异种菌株生产修饰的聚烯酮化合物的情况。例如,报道了通过以变铅青链霉菌(Streptomyceslividans)K4-114株作为宿主,在宿主中导入红色糖多孢菌(Saccharopolyspora erythraea)株来源的编码6-红霉内酯(Erythronolide)B合成酶的基因和抗生链霉菌(Streptomyces antibioticus)ATCC11891株来源的P-450基因,可以直接生产8,8a-二羟基-6-红霉内酯B(参照J.Antibiot.,2000,vol.53,502-508)。
发明的公开
本发明的课题是提供具有生产由前述式(I)表示的16位羟基化大环内酯类化合物的能力的基因重组微生物。进而,还提供了使用这些基因重组微生物的16位羟基化大环内酯类化合物的制备方法。
本发明人,为了解决上述问题,用基因工程的方法制备(育种)具有先前分离鉴定的参与11107B的生物合成的DNA和与11107B的16位羟基化反应相关的DNA的微生物,发现在其培养液中积累了大量16位羟基化大环内酯类化合物,完成了本发明。
即,本发明涉及以下的[1]-[21]。
[1]具有生产式(I)
(但是,R表示氢原子或羟基)表示的16位羟基化大环内酯类化合物的能力的微生物,其为具有(a)编码参与式(II)
Figure A20068001828900122
(但是,R表示氢原子或羟基)表示的大环内酯类化合物的生物合成的多肽的部分或全部的DNA以及(b)编码具有前述式(II)表示的大环内酯类化合物的16位羟基化酶活性的多肽的部分或全部的DNA的基因重组微生物。
[2]根据[1]记载的基因重组微生物,前述(a)表示的DNA为编码具有聚烯酮合成酶活性的多肽、具有7位乙酰化酶活性的多肽、具有18,19位环氧化酶活性的多肽和具有转录调节因子活性的多肽的部分或全部的DNA。
[3]根据[1]或[2]记载的基因重组微生物,前述(a)表示的DNA为含有
(a-1)序列号1的第8340-27935位碱基的连续的碱基序列
(a-2)序列号1的第28021-49098位碱基的连续的碱基序列
(a-3)序列号1的第49134-60269位碱基的连续的碱基序列
(a-4)序列号1的第60269-65692位碱基的连续的碱基序列
(a-5)序列号1的第68160-66970位碱基的连续的碱基序列
(a-6)序列号1的第69568-68270位碱基的连续的碱基序列
(a-7)序列号1的第72725-70020位碱基的连续的碱基序列的DNA或其变体。
[4]根据[2]或[3]记载的基因重组微生物,前述(a)表示的DNA还包含编码具有6位羟基化酶活性的多肽的部分或全部的DNA。
[5]根据[4]记载的基因重组微生物,编码具有6位羟基化酶活性的多肽的部分或全部的DNA是含有序列号1的第65707-66903位的连续的碱基序列的DNA或其变体。
[6]根据[1]-[5]任一项记载的基因重组微生物,前述(b)表示的DNA是选自于下组的DNA或其变体:
(b-1)序列号2的第1322-2548位的连续的碱基序列、
(b-2)序列号3的第420-1604位的连续的碱基序列,和
(b-3)序列号4的第172-1383位的连续的碱基序列。
[7]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的氨基酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
[8]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
[9]根据[1]-[6]任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
[10]根据[1]记载的基因重组微生物,其在具有前述(a)表示的DNA的宿主中整合了异种微生物来源的前述(b)表示的DNA。
[11]根据[1]记载的基因重组微生物,其在具有前述(b)表示的DNA的宿主中整合了异种微生物来源的前述(a)表示的DNA。
[12]根据[1]记载的基因重组微生物,其在不具有前述(a)和(b)表示的任一DNA的宿主中整合了异种微生物来源的前述(a)和(b)表示的两种DNA。
[13]根据[1]-[12]任一项记载的基因重组微生物,具有生产式(I)表示的16位羟基化大环内酯类化合物的能力的基因重组微生物为属于链霉菌(Streptomyces)属的菌株。
[14]根据[1]-[13]任一项记载的基因重组微生物,其在装入了30ml下述培养基的容积为250ml的三角烧瓶中接种基因重组微生物,于25℃旋转振荡(220rpm)培养4天后,通过加入270ml乙腈进行提取,在下述测定条件下对获得的提取液进行HPLC分析、定量式(I)表示的16位羟基化大环内酯类化合物时,具有每1L培养液生产50mg以上的式(I)表示的16位羟基化大环内酯类化合物的能力:
(培养基)
5%溶性淀粉,1%葡萄糖,3%pharmamedia,0.1%CaCO3、pH7.5
(HPLC测定条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%-55%甲醇(0-5分钟),55%甲醇(5-13分钟),55%-70%甲醇(13-21分钟)、70%甲醇(21-25分钟)
流速:1.2mL/分钟
检测:UV240nm
注入容量:5μL
柱温度:40℃。
[15]式(I)表示的16位羟基化大环内酯类化合物或其可药用盐或它们的水合物的制备方法,其特征在于在营养培养基中培养[1]-[14]任一项记载的基因重组微生物,从其培养液中收集式(I)表示的16位羟基化大环内酯类化合物。
[16]根据[15]中记载的方法,其特征在于使环糊精类存在于培养液中。
[17]根据[16]中记载的方法,所述环糊精类为选自于β-环糊精、γ-环糊精、部分甲基化β-环糊精、二甲基-β-环糊精、三甲基-β-环糊精、糖基-β-环糊精和羟丙基-β-环糊精中的环糊精类。
[18]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
[19]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
[20]含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
[21]由[18]-[20]任一项中记载的DNA变体编码的多肽。
并且,本说明书中的各种用语的定义如下所述。
所谓“基因重组微生物”是指使用基因重组技术在特定的微生物中导入其它生物来源的基因的微生物(细菌、放线菌、酵母、丝状菌等),其中使用的基因导入方法包括使用质粒等载体的基因重组法以及同源重组等方法。
所谓“DNA变体”是指:
(1)在严紧条件下与原DNA杂交的DNA,
(2)与原DNA的碱基序列具有70%以上的同源性的碱基序列的DNA,
(3)具有与原DNA的碱基序列互补的碱基序列的DNA,或者
(4)由于遗传密码子的简并性,与原DNA在严紧条件下不杂交,但具有编码与由(1)项-(3)项任一项定义的DNA编码的氨基酸序列相同的序列的碱基序列的DNA。
而且,所谓“在严紧条件下杂交的DNA”是指例如以原DNA作为探针,通过使用菌落杂交法、噬菌斑杂交法或Southern杂交法等获得的DNA,具体而言,可以列举,使用固定了菌落或噬菌斑来源的DNA的滤膜,在0.7-1.0M的氯化钠存在下,于65℃进行杂交后,使用0.1-2倍浓度的SSC溶液(1倍浓度的SSC溶液是由150mM氯化钠、15mM柠檬酸钠构成的),通过于65℃条件清洗滤膜可以鉴定的DNA。
所谓“衍生物”是指赋予化学结构具有特征的主要骨架相同,而修饰的样式和侧链的形状等不相同的化合物。
所谓“16位羟基化酶活性”是指将大环内酯类化合物(II)的16位氢原子转化为羟基的活性。
所谓“6位羟基化酶活性”是指将下式(B)表示的大环内酯类化合物(有时称之为ME-265)的6位氢原子转化为羟基的活性。
Figure A20068001828900191
所谓“聚烯酮合成酶活性”是指合成下述式(E)表示的大环内酯类化合物的活性。
所谓“7位乙酰化酶活性”是指将下式(C)表示的大环内酯类化合物的7位羟基转化为乙酰基的活性。
Figure A20068001828900202
(但是,R表示氢原子或羟基)
所谓“18,19位环氧化酶活性”是指将式(D)表示的大环内酯类化合物的18,19位双键转换成环氧基的活性。
Figure A20068001828900203
(但是,R表示氢原子或羟基)
所谓“转录调节因子活性”是指调节编码参与大环内酯类化合物(II)的生物合成的多肽的DNA转录的活性。
通过本发明,可以获得具有编码参与大环内酯类化合物(II)的生物合成的多肽的DNA和编码具有大环内酯类化合物(II)的16位羟化酶活性的多肽的DNA、且可以直接发酵生产16位羟基化大环内酯类化合物(I)的基因重组微生物。而且,通过培养这种基因重组微生物,从培养液中收集,可以有效生产16位羟基化大环内酯类化合物(I)。
尤其是,通过在上述方法中使用编码将具有16位羟基化酶活性的多肽的氨基酸序列改变一部分的多肽的DNA,可以更有效地选择性生产16位羟基化大环内酯类化合物(I)。
附图说明
图1是表示Mer-11107株中普拉地内酯的生物合成途径的图。
图2是表示与Mer-11107株中普拉地内酯的生物合成途径相关的DNA的各ORF和粘粒的对应关系的图。
图3是表示质粒pKU253的结构的图。
图4是表示质粒pUC19aph::oriT::intphiC31的结构的图。
发明的详细说明
以下,对本发明的实施方式进行详细的说明。
在本发明中,编码参与大环内酯类化合物(II)的生物合成的多肽的DNA,可以按照本领域中公知的方法(例如,分子克隆第2版中记载的菌落杂交法),从具有生产该大环内酯类化合物能力的微生物的培养菌体中获得。作为这类微生物,如果是具有生产该大环内酯类化合物能力的微生物,则可以不论种和株的种类随意使用,但是作为优选微生物,可以列举属于链霉菌(Streptomyces)属放线菌的菌株。作为其中一例,可以列举从土壤分离的链霉菌属(Streptomyces sp.)Mer-11107株。Mer-11107株以保藏号FERM P-18144于平成12年12月19日保藏于日本305-8566茨城县筑波市东1丁目1番3号的工业技术院生命工学工业技术研究所,再于平成13年11月27日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-7812。
以下,以Mer-11107株的情况为例,对获得目的DNA的操作的概况进行简要的说明。首先,在大肠杆菌中整合通过将用适当的限制性酶部分分解Mer-11107株的基因组DNA所获得片段与用适当的限制性酶部分分解可以在大肠杆菌内复制的粘粒载体所获得片段相连接所获得的重组DNA,获得转化株。然后,以公知的羟基化酶(细胞色素P450酶)基因的片段作为探针,首先,筛选获得的大量转化株,选择与探针结合的转化株。然后,获得与存在于选择出的粘粒中的羟基化酶基因结合的DNA,测定其序列。再将其导入于大肠杆菌,在确认转化的大肠杆菌具有6位羟基化酶活性方面,可以通过使用编码该6位羟基化酶的DNA作为探针,进行Southern杂交,从先前获得的多个阳性克隆(粘粒)中选择含有与编码6位羟基化酶的DNA相邻的大环内酯类化合物的生物合成基因簇的粘粒,并进行排列来获得。对于所有这些操作的详细内容,记载于参考例1中,而且也记载于由本申请人申请的WO-A2006/009276的说明书中,可以参照这些记载。
含有编码参与这样获得的大环内酯类化合物(II)的生物合成的多肽的DNA的周边区域的核苷酸序列(在编码序列中的氨基酸序列)示于序列表的序列号1中。
在该序列号1所示的DNA中,包含pldA I(第8340-27935位碱基)、pldA II(第28021-49098位碱基)、pldA III(第49134-60269位碱基)、pldAIV(第60269-65692位碱基)、pldB(第65707-66903位碱基)、pldC(68160-66970位碱基)、pldD(第69568-68270位碱基)和pldR(第72725-70020位碱基)这8个开放阅读框(ORF)。
这些DNA中,pldA I、pldA II、pldA III和pldA IV中,存在几个分别含有与已经清楚的其它聚烯酮生物合成基因同样的称为模块的1个或1个以上的重复单位的几个转录解读框。于是,各模块,编码如后述的选自于与聚烯酮合成的缩合反应相关的酰基载体蛋白质(ACP)、β-酮酰基ACP合成酶(KS)、酰基转移酶(AT)和与β位羰基修饰反应相关的酮酰基还原酶(KR)、脱氢酶(DH)和烯酰基还原酶(ER)的所有区域或几个区域,最后的模块中存在由聚烯酮合成酶从聚烯酮链切离的硫酯酶(TE)区域。
图1中表示了Mer-11107株中大环内酯类化合物的生物合成途径。起始模块(loading module),与其它模块不同,其活性中心的半胱氨酸被置换成谷氨酰胺,从而清楚了pldA I与起始反应相关。而且,由于模块10中存在硫酯酶(TE)结构域,从而清楚了pldA IV与聚烯酮基本骨架合成的最后反应相关。这样一来,形成聚烯酮的基本骨架后,再受pldD编码的18,19位环氧化酶,pldC编码的7位乙酰化酶和由pldB编码的6位羟基化酶的修饰,就生物合成大环内酯类化合物(II)。而且,大环内酯类化合物(II)中,R为氢原子的化合物,可以通过改变成使pldB缺失,或使之功能不表达来进行制备。而且,pldR与编码除虫菌素(Avermectin)生物合成中转录调节因子的基因aveR同源性高,编码参与大环内酯类化合物的生物合成的DNA的转录调节因子。
在本发明中,编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA,可以按照本领域公知的方法(例如,分子克隆第2版中记载的菌落杂交法),从具有该大环内酯类化合物的16位羟基化能力的微生物的培养菌体中获得。作为这类微生物,如果是具有将该大环内酯类化合物的16位氢原子转化成羟基的能力的微生物,则不论是种和株的种类都可以随意使用,但作为优选微生物,可以列举属于放线菌的菌株。作为其实例,可以列举从土壤中分离的链霉菌属(Streptomyces sp.)A-1544株、链霉菌属(Streptomyces sp.)Mer-11107株或链霉菌属(Streptomyces sp.)A-1560株。A-1544株以保藏号FERM P-18943于平成14年7月23日保藏于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心,再于平成15年7月30日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-8446。A-1560株以保藏号FERMP-19585于平成15年11月13日保藏于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心,再于平成16年8月19日转移到位于日本305-8566茨城县筑波市东1丁目1番地1中央第6的独立行政法人产业技术综合研究所的专利生物保藏中心(IPOD),国际保藏号为FERM BP-10102。
以下,以A-1544株的情况为例,对获得目的DNA的操作的概况进行说明。首先,制备A-1544株的基因组DNA,然后基于公知的羟基化酶(细胞色素P450酶)基因的序列信息,制备引物,进行PCR反应,获得特异性扩增的DNA片段,测定其序列。可以通过再基于获得的序列信息,用逆向PCR法(细胞工程14卷,p.591-593,1995年),扩增跨越克隆的DNA片段的上游和下游区域的周边区域的碱基序列,克隆,并分析序列来获得。对于这些操作的所有内容详细记载于参考例2(A-1544株)、参考例3(Mer-11107株)和参考例4(A-1560株),而且也记载于2005年6月9日公开的WO-A2005/052152中,可以参照这些记载。
从这样的A-1544株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包括周边区域)示于序列表的序列号2中。该序列号2所示的DNA中包含psmA(第1322-2548位碱基)和psmB(第2564-2761位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
同样,从Mer-11107株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包含周边区域)示于序列表的序列号3中。该序列号3所示的DNA中含有bpmA(第420-1604位碱基)和bpmB(第1643-1834位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
从A-1560株中获得的编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA(包括周边区域)示于序列表的序列号4中。该序列号4所示的DNA中含有tpmA(第172-1383位碱基)和tpmB(第1399-1593位碱基)这两个开放阅读框(ORF),它们分别编码16位羟基化酶和铁氧还蛋白。
而且,上述的编码具有16位羟基化酶活性的多肽的各种DNA变体可以如下述方式获得。首先,基于原来的DNA的序列信息进行位点特异性的改变处理,然后将获得的位点特异性DNA变体整合到宿主中,以该基因重组微生物的16位羟基化酶活性的强度和选择性高度作为指标进行选择,可以获得这些变体。位点特异性的改变处理,可以使用例如以克隆了原来的DNA的质粒作为模板,使用基于其序列信息设计的引物,使用市售的试剂盒,例如QuickChangeTM Site-DirectedMutagenesis试剂盒(Stratagene Co.)等来进行。
这些变体中作为16位羟基化酶活性高且选择性高的变体,可以列举,例如从A-1544中获得的编码16位羟基化酶的psmA的情况,含有序列号2的第1322位碱基至第2548位碱基的连续的碱基序列,且含有选自于以下的1)-6)的1个或2个以上的改变部位的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的氨基酸优选地编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸优选地编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸优选地编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸优选地编码蛋氨酸的密码子的改变位点。
本发明的重组体,也就是带有前述“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”和“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的基因重组微生物,可以通过以下的A)-C)所示的方法进行制备。
A)在原本具有“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”的宿主中整合“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”。
B)在原本具有“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的宿主中整合“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”。
C)在原本不具有“编码参与大环内酯类化合物(II)的生物合成的多肽的DNA”且不具有“编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA”的宿主中整合这两种DNA。
本发明的重组体宿主只要是可以整合目的DNA,可以生产目的16位羟基化大环内酯化合物的微生物均可使用,并没有特别的限制,但作为优选微生物,可以例举属于链霉菌属(Streptomyces)的放线菌的菌株。例如,前述A)的情况,可以列举链霉菌属(Streptomyces sp.)Mer-11107株等、前述B)的情况,可以列举链霉菌属(Streptomyces sp.)A-1544株、链霉菌属(Streptomyces sp.)Mer-11107株或链霉菌属(Streptomycessp.)A-1560株等。而且,前述C)的情况,可以列举属于大肠杆菌(Escherichia coli)属的菌株等。
为了使目的DNA整合到宿主中进行表达,没有特别的限定,可以使用例如记载于分子克隆第2版,Current Protocols In MolecularBiology等中的方法来进行。宿主、质粒-载体系统如果是目的DNA可以在宿主中稳定保持并表达的系统,则没有特别的限制。而且,质粒除了目的DNA之外还可以包括自我复制序列,启动子序列,终止子序列,药物抗性基因等,作为质粒的种类,不仅可以是自我复制型质粒,还可以是与预定使用的宿主的基因组的一定区域具有同源序列的整合型质粒。整合目的DNA的部位可以是在质粒上或在宿主微生物的基因组上。
作为宿主,如果以放线菌或其衍生株作为宿主,可以利用自我复制型载体-pIJ6021(Gene 166,133-137(1995))和染色体整合型载体KC515〔Thebacteria,vol.9.Antibiotic-producing Streptomyces(Queener,S.E.和Day,L.E.编著).p.119-158.Academic Press,Orlando,Fgla.〕等。
作为自我复制序列,可以列举rep pIJ101(1988,J.Bacteriol.,170,4634-4651)、rep SCP2(1981,J.Gen.Microbiol.,126,427-442)、pUC19(Gene,33(1),103-119(1985)等,作为启动子序列,可以列举ermEp(Mol Microbiol.,1994,Nov;14(3):533-45.)、SnpAp(JBacteriol.,1992,May;174(9):2797-2808)等,作为终止子,可以列举ter(mmr)(Gene,1987:58(2-3):229-41)、fd终止子(Nucleic AcidsRes.,5(12),4495-4503(1978))等,作为药物抗性基因,可以列举hyg(Nucleic Acids Res.,4(14),1565-1581(1986))、tsr(Mol.Gen.Genet.,199(1),26-36(1985))等。而且,只要是本领域技术人员,按照本发明的说明书的记载就可以容易地制备本发明的基因重组微生物。
培养这样制备的基因重组微生物,通过以下方法评价16位羟基化大环内酯类化合物(I)的生产性,进行选择,可以获得该大环内酯类化合物的高产菌株。也就是说,具有每1L培养液生产50mg以上的该大环内酯类化合物的能力的基因重组微生物,可以以约40%的概率获得,具有每1L培养液生产100mg以上的能力的重组微生物,可以以约30%的概率获得,均可以以高概率获得。
(生产性评价方法)
将基因重组微生物接种于装入了30mL培养基(5%溶性淀粉,1%葡萄糖,3%pharmamedia,0.1%CaCO3、pH7.5)的容量为250mL的三角烧瓶中,于25℃振荡培养(220rpm)4天后,添加270mL乙腈进行提取,在下述测定条件下HPLC分析获得的提取液,定量16位羟基化大环内酯类化合物(I)的累积浓度。
(HPLC测定条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%-55%甲醇(0-5分钟),55%甲醇(5-13分钟),55%-70%甲醇(13-21分钟)、70%甲醇(21-25分钟)
流速:1.2mL/分钟
检测:UV240nm
注入容量:5μL
柱温度:40℃
在营养源培养基中接种本发明的基因重组微生物,通过好氧培养,可以从其培养液中收集16位羟基化大环内酯类化合物(I)或其药学上允许的盐或它们的水合物。
这些基因重组微生物的培养方法,原则上按照一般的微生物的培养方法,但优选在通过液体培养的振荡培养、通气搅拌培养等好氧条件下实施的方法。作为培养中可以使用的培养基,可以是含有这些微生物可以利用的营养源的培养基,也可以利用各种合成、半合成培养基、天然培养基等中的任一种。作为培养基的组成,可以单独或组合使用葡萄糖、蔗糖、果糖、甘油、糊精、淀粉、糖蜜、大豆油等作为碳源。作为氮源,可以单独或组合使用pharmamedia、蛋白胨、肉膏、大豆粉、酪蛋白、氨基酸、酵母提取物、尿素等有机氮源;硝酸钠、硫酸铵等无机氮源。其它例子,可以按照需要添加例如氯化钠、氯化钾、碳酸钙、硫酸镁、磷酸钠、磷酸钾、氯化钴等盐类、重金属类盐、维生素B和生物素等维生素类。而且,在培养中冒泡明显时,还可以在适当培养基中添加各种消泡剂。而且,根据需要还可以添加维持药物抗性基因所必需的药物。当添加消泡剂时,不对目的物质的生产产生大影响的浓度是理想的。
而且,培养本发明的基因重组微生物,在制备16位羟基化大环内酯类化合物(I)时,通过使环糊精存在于培养液中,可以增大16位羟基化大环内酯类化合物的累积浓度。作为可以在本发明中使用的环糊精类,可以例举β-环糊精、γ-环糊精、部分甲基化β-环糊精、二甲基-β-环糊精、三甲基-β-环糊精、糖基-β-环糊精和羟丙基-β-环糊精,可以单独或组合使用这些环糊精。
向培养液中添加环糊精的量优选是0.5%-5%。添加时,可以在培养初期或培养途中添加。
培养条件可以在该菌株良好生长且可以生产16位羟基化大环内酯类化合物(I)的范围内适当选择。例如,培养基的pH是5-9左右,通常理想的是中性附近。培养温度通常保持在20-40℃,优选可以保持在23-35℃。培养天数为2-12天左右,通常为3-10天左右。上述的各种培养条件,可以根据使用微生物的种类和特性、外部条件等适当改变,当然可以选择最适条件。为了分离纯化培养液中积累的16位羟基化大环内酯类化合物(I),可以利用用于从其培养液中分离微生物代谢产物的分离、纯化的方法。例如,其中适用使用甲醇、乙醇、丁醇、醋酸乙酯、氯仿、丙酮、甲苯等的有机溶剂提取、使用各种离子交换层析、SephadexLH-20等的凝胶过滤层析、通过活性碳、硅胶、吸附树脂(ダイヤイオンHP20)的吸附层析,或通过薄层层析的吸附脱吸附处理,或使用逆相柱等的高速液相层析等公知的所有方法时,不限于这里所示的方法。通过单独或按照任意顺序组合这些方法,并且反复使用,可以分离纯化16位羟基化大环内酯类化合物(I)。
实施例
以下,通过列举实施例对本发明进行具体的说明,但是本发明并不受这些实施例的任何限制。而且,下述的说明中,对培养基成分,只要没有特别的说明,以重量%表示浓度。
参考例1:编码参与大环内酯类化合物(II)的生物合成的多肽的DNA的获得
(1)Mer-11107株的培养和基因组DNA的获得
将链霉菌属(Streptomyces sp.)Mer-11107株的菌丝接种于25mL的Tryptic Soy Broth中,于28℃振荡培养3天。按照D.A.Hopwood等人的放线菌基因实验书Practical Streptomyces Genetics(The John InnesFoundation,Norwich,England,2000)的Isolation genomic DNA(P162~170)中记载的方法从获得的培养液中制备基因组DNA。
(2)Mer-11107株的基因组文库的制备
混合160μl灭菌纯化水,200μl Mer-11107株的基因组DNA溶液(1mg/ml),40μl 10倍浓度的M缓冲液[100mM Tris-HCl(pH7.5),100mMMgCl2,10mM二硫苏糖醇,500mM NaCl]和1μl限制性酶Sau3AI(1单位/μl),于37℃温育3分钟。然后,取出50μl,用50μl的酚-氯仿混液(酚∶氯仿∶异戊醇=25∶24∶1,容量比)提取,回收水相,再用50μl氯仿提取,并回收水相。向该溶液中加入5μl的3M醋酸钠(pH6.0)和150μl的乙醇,于-80℃放置30分钟,通过离心沉淀,回收DNA。用70%乙醇清洗该DNA后,溶解于90μl的灭菌纯化水中,加入10μl的10倍浓度BAP缓冲液[500mM Tris-HCl(pH9.0),10mM MgCl2]和5μl细菌碱性磷酸酶(0.5单位/μl、TakaraBio公司),于37℃温育3小时。用100μl酚-氯仿混液(酚∶氯仿∶异戊醇=25∶24∶1,容量比)提取该反应液,回收水相,再用100μl的氯仿提取,并回收水相。向该溶液中加入10μl的3M醋酸钠(pH6.0)和300μl的乙醇,于-80℃放置30分钟,通过离心沉淀,回收DNA。用70%乙醇清洗该DNA后,溶解于20μl的TE缓冲液[10mMTris-HCl(pH8.0),1mM EDTA]中。
另一方面,按照Stratagene公司的手册用限制性酶XbaI消化10μgSuperCos粘粒载体(Stratagene公司)后,用牛肠碱性磷酸酶(TakaraBio公司)进行DNA末端的脱磷酸化,进而用限制性酶BamHI消化,纯化后,溶解于10μl的TE缓冲液中。向1μl该粘粒DNA溶液中加入2.5μl前述的Mer-11107株DNA的Sau3A1部分分解物的溶液,再依次加入1.5μl灭菌纯化水,5μl DNA连接试剂盒(TakaraBio公司)的溶液II,10μl的溶液I后,于23℃温育10分钟。用Gigapack III XL试剂盒(Stratagene公司)将4μl该反应液包裹入λ噬菌体。对于获得的包装液(总量为500μl)实施转导试验,检测菌落形成能力的结果为380cfu(菌落形成单位)/μl。
(3)各种探针的制备
(3-1)含有酮合成酶编码区域的探针的制备
一般基于聚烯酮合成酶的酮合成酶结构域(keto synthase domain)中保守的序列,分别合成包含以下所述的序列构成的2种引物、即KS-3F和KS-4R(参照序列号5和6)。
KS-3F:5’-GACCGCGGCTGGGACGTGGAGGG-3’
KS-4R:5’-GTGCCCGATGTTGGACTTCAACGA-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                        31μl
2倍浓缩GC缓冲液                                   50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)       16μl
KS-3F(100pmol/μl)                                0.5μl
KS-4R(100pmol/μl)                                0.5μl
Mer-11107株总DNA(100ng/μl)                       1μl
LA Taq聚合酶(5u/μl,TakaraBio公司)               1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟)    30个循环
72℃5分钟
在0.8%琼脂糖凝胶上电泳由该反应最终扩增的930bp DNA片段,切出分离的930bp DNA片段,用SUPREC-01(TakaraBio公司)回收纯化DNA。进而,以获得的10ng DNA片段作为模板,除反应循环数为20个循环外,在与前述PCR相同的反应条件下再扩增含有酮合成酶编码区域的930bp DNA片段。用SUPREC-02(TakaraBio公司)浓缩纯化该DNA片段,以获得的50μl TE溶液作为探针溶液。
(3-2)含有细胞色素P450基因区域的探针的制备
为了制备细胞色素P450基因探针,从放线菌中扩增公知的2种细胞色素P450基因。也就是说,为了扩增耐热链霉菌(Streptomycesthermotolerans)ATCC11416来源的ORF-A基因(Biosci.Biotechnol.Biochem.59:582-588,1995),合成包含如下所示的序列的两种引物,即CB-1F和CB-2R(参照序列号7和8)。
CB-1F:5’-ATGACAGCTTTGAATCTGATGGATCCC-3’
CB-2R:5’-TCAGAGACGGACCGGCAGACTCTTCAGACG-3’
另一方面,为了扩增委内瑞拉链霉菌(Streptomyces venezuelae)ATCC15439来源的pikC基因(Chem.Biol.5:661-667,1998),分别合成包含如下所示的序列的两种引物,即PKC-1F和PKC-2R。
PKC-1F:5’-GTGCGCCGTACCCAGCAGGGAACGACC-3’
PKC-2R:5’-TCACGCGCTCTCCGCCCGCCCCCTGCC-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                        31μl
2倍浓缩GC缓冲液                                   50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)       16μl
引物-F(100pmol/μl)                               0.5μl
引物-R(100pmol/μl)                               0.5μl
ATCC11416株或ATCC15439株的基因组DNA(100ng/μl)    1μl
LA Taq聚合酶(5u/μl,TakaraBio公司)               1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟)    30个循环
72℃5分钟
用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化由该反应最终扩增的两种1.2kb DNA片段后,制备含有各个DNA片段各10ng/μl的等量混合溶液,制成探针溶液。
(4)采用含有酮合成酶编码区域的探针进行筛选
使用前述(2)中制备的Mer-11107株的基因组DNA文库的包装液,以大肠杆菌XL-1Blue MR(Stratagene公司)作为宿主,按照Stratagene公司的手册进行转导。将转导操作后的菌液分注于10个LB-50μg/ml氨苄青霉素-1.5%琼脂培养基培养皿(内径90mm、高度15mm)中,涂覆,于37℃培养18小时。将各培养皿中生长的菌落转移到HybondoN+滤膜(amersham biosciences公司)上,按HybondoN+滤膜附带的手册中记载的条件进行碱处理、中和处理,于80℃干燥2小时,从而将菌落来源的DNA固定在滤膜上。
以100ng前述(3-1)制备的含有酮合成酶区域的930bp DNA片段作为探针,使用AlkPhos Direct System(amersham biosciences公司)通过菌落杂交法筛选基因组DNA文库。杂交在0.5M NaCl盐浓度下于65℃进行2小时。对于探针DNA的标识、杂交和检测的条件,按照AlkPhos Direct System附带的手册中记载的条件。在试验的约7,600个菌落中,分离出与用碱性磷酸酶标识的探针强力杂交的59个菌落。从由该菌落中衍生的大肠杆菌克隆中提取纯化粘粒。
(5)用含有细胞色素P450基因区域的探针进行具有普拉地内酯生物合成基因区域的粘粒克隆的选择确认
将2μl前述(4)中获得的各粘粒的DNA溶液点样于HybondoN+滤膜上,在附带的手册中记载的条件下进行碱处理、中和处理,进而于80℃干燥2小时,从而将DNA固定于滤膜上。使用该滤膜,以实施例3中记载的细胞色素P450基因片段作为探针,在与实施例4相同的条件下进行杂交。结果选择了与该探针强力杂交的1个粘粒,命名为pKS58。
用限制性酶Sau3AI部分分解pKS58DNA后,用噬菌体载体ZapExpress、BamHI-CIAP处理后(Stratagene公司)连接,用Gigapack III XL试剂盒(Stratagene公司)包装入λ噬菌体。使该噬菌体液感染大肠杆菌XL1-Blue MRF’,使噬菌斑形成。通过使用前述(3-2)中制备的细胞色素P450基因探针进行噬菌斑杂交,亚克隆约2kb的含有细胞色素P450基因的DNA片段。
测定该细胞色素P450基因DNA片段的序列,由被视为细胞色素P450编码区域的N-末端和C-末端分别合成包含如下所示的序列的两种引物、即PDL58-1F和PDL58-2R(参见序列号11和12)。
PDL58-1F:5’-GCCCCGCATATGGATCTGGAAACCCAACTTCTC-3’
PDL58-2R:5’-GCACTAGTCAGCCGCGCTCGACGAGGAGGTG-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                        31μl
2倍浓缩GC缓冲液                                   50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)       16μl
PDL58-1F(100pmol/μl)                             0.5μl
PDL58-2R(100pmol/μl)                             0.5μl
pKS58DNA(10ng/μl)                                1μl
LA Taq聚合酶(5u/μl,TakaraBio公司)               1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟)    20个循环
72℃5分钟
用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化由该反应最终扩增的1.2kb DNA片段后,用限制性酶NdeI和SpeI分解。反应后在0.8%琼脂糖凝胶上电泳DNA,切出分离的1.2kb DNA片段,用QIAGEN Gel提取试剂盒(QIAGEN公司)回收纯化DNA。通过将该DNA片段插入到细胞色素P450基因表达用质粒pT7NS-camAB(参照参考例5和WO03/087381)的NdeI和SpeI位点,构建出pPDL96。
用该质粒转化大肠杆菌BL21(DE3),在M9CG培养基(1.28%Na2HPO4·7H2O、0.3%KH2PO4、0.05%NaCl、0.1%NH4Cl、1%酪蛋白氨基酸、0.4%葡萄糖、1mM MgCl2、100μM CaCl2、50μg/ml氨苄青霉素)中培养直至菌密度OD600(600nm处的光密度)达到0.8。分别以80μg/ml、0.1mM的终浓度添加5-氨基乙酰丙酸和IPTG后,于22℃继续培养25小时,使细胞色素P450蛋白质诱导。诱导后,收集菌体,悬浮于5mlCV缓冲液[50mM磷酸钠(pH7.3)、1mM EDTA、10%甘油、1mM葡萄糖]。用试管取1ml该溶液,添加5μl普拉地内酯B的6位脱氧体ME-265的DMSO溶液(50mg/ml),于28℃温育15小时。向该反应液中加入1ml的乙腈,混合后,分离离心,通过在下述条件下用HPLC分析上清,确认了向普拉地内酯B的转变。由此确认了pKS58中含有普拉地内酯生物合成基因区域。
(HPLC的分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
        55%      甲醇(5~13分钟)
        55%~70%甲醇(13~21分钟)
        45%      甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注射容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:ME-265:20分钟;普拉地内酯B:13分钟
(6)含有与细胞色素P450基因相邻的生物合成基因簇的粘粒的选定
在前述(4)中获得的59个粘粒DNA中,选定前述(5)中获得的含有与细胞色素P450基因相邻的生物合成基因簇的粘粒。
用限制性酶EcoRI、BamHI消化59个粘粒DNA,对获得的各个DNA进行琼脂糖凝胶电泳,用除虫菌素(Avermectin)糖苷配基合成酶基因(参照Proc.Natl.Acad.Sci.USA 96(1999)9509-9514、特开平2000-245457号公报或WO 00/50605小册子)的KS结构域的DNA(aveA2的KS6结构域)、AT结构域的DNA(aveA1的AT2结构域)、和前述(5)中获得的细胞色素P450基因作为探针进行Southern杂交。
根据经限制性酶EcoRI、BamHI消化的DNA的电泳图谱和与各探针杂交的条带图型的结果,首先将具有以相同长度杂交的DNA片段的粘粒分组。其中,对于显示出几乎同等图型的粘粒,削除1个、残留的粘粒中,将条带图型部分一致的粘粒整列。然后,以前述(5)中获得的含有细胞色素P450基因的粘粒pKS58为中心,选择pKS54作为与自细胞色素P450基因侧与含有聚烯酮合成酶基因侧相邻的粘粒,再选择pKS35作为与pKS54相邻的粘粒。此外,选择粘粒pKS58和作为自细胞色素P450基因侧与不含有聚烯酮合成酶基因侧相邻的粘粒pKS23。其结果是,如图2所示,选定pKS23,pKS58,pKS54,pKS35作为包括普拉地内酯生物合成基因簇的粘粒克隆。
(7)普拉地内酯生物合成基因簇的碱基序列的确定
确定了编码普拉地内酯生物合成基因的一组DNA的碱基序列。用氯化铯法分离前述(6)选择出的各粘粒后,用HydroShear(Genomic solutions公司)剪断成约1kb,用BKL试剂盒(TakaraBio公司)亚克隆。
对获得的亚克隆,进行采用荧光标识引物的循环测序反应(amershambiosciences公司),确定各片段的碱基序列(MegaBACE 1000:amershambiosciences公司),从而测定含有与普拉地内酯生物合成相关的DNA的约75kb的碱基序列(参照序列号1)。
(8)普拉地内酯的6位羟化酶基因(pldB)缺陷株的制备
根据前述(7)中测定的含有与普拉地内酯生物合成相关的DNA的约75kb的碱基序列(参照序列号1),清楚了普拉地内酯由图1中所示的生物合成途径进行生物合成。于是,认为通过只破坏其中的细胞色素P450基因pldB,可以获得只生产普拉地内酯B的6位脱氧体ME-265的菌株,因此用以下方法制备pldB缺陷株。
基于序列号1记载的碱基序列分别合成包含下述序列的4种引物,即pldB-L-Bgl2F、pldB-L-Hind3R、pldB-R-Hind3F和pldB-R-Bgl2R(参照序列号13,14,15和16)。
pldB-L-Bgl2F:5’-GGGAGATCTAGAGGCCGGTTACCTCTACGAGTA-3’
pldB-L-Hind3R:5’-GGGAAGCTTGCGATGAGCTGTGCCAGATAG-3’
pldB-R-Hind3F:5’-GGGAAGCTTGAACTGGCGCGACAGTGTCTT-3’
pldB-R-Bgl2R:5’-GGGAGATCTGCAGCGGATCGTCTTCGAGACCCTT-3’
采用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                     30μl
2倍浓缩GC缓冲液                                50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)    16μl
pldB-L-Bgl2F或pldB-R-Hind3F(50pmol/μl)        1μl
pldB-L-Hind3R或pldB-R-Bgl2R(50pmol/μl)        1μl
Mer-11107株总DNA(100ng/μl)                    1μl
LA Taq聚合酶(5u/μl,TakaraBio公司)            1μl
(反应温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟)    30个循环
72℃5分钟
该反应的结果是,由使用pldB-L-Bgl2F和pldB-L-Hind3R的反应扩增含有序列号1的第64756位碱基至第66302位碱基的1.57kb DNA片段(DNA片段L1),由使用pldB-R-Hind3F与pldB-R-Bgl2R的反应扩增出含有序列号1的第66849位碱基至第68368位碱基的1.54kb DNA片段(DNA片段R1)。用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化DNA片段L1和R1后,用限制性酶BglII和HindIII消化。
用DNA ligation kit ver.2.1(TakaraBio公司)将经限制性酶BglII和HindIII消化的DNA片段L1和R1与经限制性酶HindIII消化的2.3kb潮霉素B抗性基因(由pHP45omegahyg:Gene 190,315-317,1997获得。以下存在简称为hyg的情况)和经限制性酶BamHI消化的穿梭载体pKU253(参照图3)共四种物质连接。这样构建出在DNA片段L1与R1间插入了潮霉素B抗性基因的约5.4kb DNA片段,插入于pKU253中的约21.4kb的质粒pKU253-L1-hyg-R1。
用获得的pKU253-L1-hyg-R1以电穿孔法转化接合大肠杆菌S17-1,获得了S17-1/pKU253-L1-hyg-R1株。将获得的S17-1/pKU253-L1-hyg-R1株接种于10ml含有25μg/ml卡那霉素和100μg/ml潮霉素B的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pKU253-L1-hyg-R1株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pKU253-L1-hyg-R1转化株。
将获得的pKU253-L1-hyg-R1转化株接种于10ml不含有核糖霉素的TSB培养基中,于30℃振荡培养24小时。收集pKU253-L1-hyg-R1转化株培养液中的菌体,用10ml灭菌水清洗2次后,悬浮于10ml灭菌水中。将适当稀释的悬浮液涂布于含有200μg/ml潮霉素B的YMS琼脂培养基(0.4%酵母提取物、1%麦芽提取物、0.4%溶性淀粉、2%琼脂、10mM氯化钙)中,于30℃培养4天。将在含有潮霉素B的YMS琼脂培养基中生长的单菌落转接种于含有200μg/ml潮霉素B的YMS琼脂培养基和含有200μg/ml核糖霉素的YMS琼脂培养基中,于30℃培养2天。培养后,以潮霉素B抗性选择核糖霉素敏感性株。获得的菌株是缺失基因组中pldB基因内的546bp(序列号1的第66303位碱基至第66848位碱基),其间插入了潮霉素B抗性基因的pldB缺陷株,称为Mer-11107pldB::hyg株。
(9)普拉地内酯的6位羟化酶基因(pldB)缺陷株的普拉地内酯生产性试验
将200μl前述(8)中获得的Mer-11107pldB::hyg株的冷冻种子接种于20ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.5%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3pH无调整)中,于25℃培养两天。将300μl获得的种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、2%β-环糊精、0.1%CaCO3 pH7.5)中,于25℃培养4天和5天。培养终止后,对20ml获得的培养液添加等量乙腈进行提取。分取其提取液的一部分,用乙腈稀释成5倍量。在下述条件下用HPLC测定普拉地内酯B和ME-265的量。测定结果示于表1中。
(HPLC分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm ×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
        55%      甲醇(5~13分钟)
        55%~70%甲醇(13~17分钟)
        70%      甲醇(17~35分钟)
        45%      甲醇(35~40分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:10μl
柱温度:40℃
分析时间:35分钟
保留时间:ME-265:22分钟;普拉地内酯B:16分钟
表1
  Mer-11107pldB::hyg株   ME-265(mg/L)   普拉地内酯B(mg/L)
  培养4天(96小时)   1247.7   0.0
  培养5天(120小时)   1316.6   0.0
参考例2:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-1
(1)链霉菌属菌株A-1544株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种A-1544株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood&Cell Culture kit(QIAGEN公司)从该菌体制备基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌(Streptomyces coelicolor)A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5Dm-3R(参照序列号17和18)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5Dm-3R:5’-GTTGATSAYSGASGTSGAGAA-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5Dm-3R)并以上述(1)获得的A-1544株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约500bp大小的DNA片段(以下称为DNA片段-A1)。该DNA片段-A1为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。PCR反应所扩增的DNA片段-A1通过SUPREC PCR(TakaraBio公司)自反应液回收。
接下来,为了获得对于分析所得到的DNA片段-A1的碱基序列而言足量的DNA片段-A1,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A1连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司)自增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A1。
(3)经克隆的DNA片段-A1的碱基序列分析
将前项(2)所获得的DNA片段-A1的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A1为约500bp,但碱基序列分析的结果表明确切地为528bp(参见序列号2的第1775-2302位碱基)。由于在所克隆的上述528bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A1是由这2种引物(5Dm-3F和5Dm-3R)特异性扩增的。
(4)DNA片段-A1的邻近区域的分析
如上所述,由于确定了编码来自A-1544株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将A-1544株基因组DNA(参见前项(1))于H缓冲液(50mMTris-HCl,pH7.5,10mM MgCl2,10mM二硫苏糖醇,100mM NaCl)中分别使用限制酶PstI和SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A1的碱基序列设计并制备以下引物(6PIN-2F和6PIN-2R)(参照序列号19和20)。
6PIN-2F:5’-GCTGCGCCTGGCCCTGGAGGACATCGAGAT-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(6PIN-2F和6PIN-2R)并以上述经自身环化的A-1544株基因组DNA作为模板进行PCR反应。PCR反应使用了TakaraLA Taq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约3.5kbp大小的DNA片段(DNA片段-B1)和约2.8kbp大小的DNA片段(DNA片段-C1),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)从该PCR扩增反应液回收DNA片段-B1、DNA片段-C1。接下来,对于DNA片段-B1、DNA片段-C1,为了获得足量用于碱基序列分析的各DNA片段,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kit ver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B1(约3.5kbp大小)、DNA片段-C1(约2.8kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B1、DNA片段-C1的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B1、DNA片段-C1序列中得到序列号2所示的3793bp的碱基序列这一信息。
对该3793bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号2的第1322~2548位碱基中存在编码包含与细胞色素P450具有高同源性的409个氨基酸的蛋白质的ORF(以下称为psmA)。于是,psmA与推定为天蓝色链霉菌A3(2)的细胞色素P450(CYP105D5)的氨基酸序列以及与推定为变铅青链霉菌的细胞色素P450(CYP105D4)的氨基酸序列具有最高的同源性(同源性72.6%)、与灰色链霉菌的细胞色素P450soy(SoyC)也具有比较高的同源性(同源性69.4%)。由此认为psmA为编码细胞色素P450类的羟化酶的基因的可能性高。
另外,在紧挨psmA的下游(序列号2的第2564~2761位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为psmB)。psmB编码的蛋白质包含66个氨基酸,与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列具有最高的同源性(83.3%)、与灰色链霉菌的铁氧还蛋白soy(SoyB)也具有较高的同源性(同源性57.6%)。因此认为psmB用于电子转移,与psmA一同编码进行羟化的铁氧还蛋白。
(6)质粒pTC-tpmAB的构建
将pT7NS-CamAB(参见参考例5和WO03/087381)在H缓冲液(50mMTris-HCl,pH7.5,10mM MgCl2,10mM二硫苏糖醇,100mM NaCl)中通过限制酶NdeI和SpeI消化得到质粒消化物。另一方面,参考序列号2的碱基序列,设计并制备了在5’末端添加有NdeI位点的引物DM-NdeF(5’-GCCCCCATATGACGGAACTGACGGACATCA-3’:参照序列号33)和5’末端添加有SpeI位点的引物DM-SpeR(5’-GGGCCACTAGTCAGCCGGCCGGTTCGGTCA-3’:参照序列号34)。然后,接下来,利用这2种引物(DM-NdeF和DM-SpeR)并以前述(1)所获得的A-1544株基因组DNA为模板,进行PCR反应。PCR反应使用Takara LA Taq(宝酒造社)和PCR扩增装置(Biometra社TGradient),将98℃变性20秒、68℃退火和延伸2分钟的2阶段反应重复进行30次。从该PCR扩增反应液中通过SUPREC PCR(宝酒造社)回收含有psmA和psmB的约1.5kbp大小的DNA片段。用限制性酶NdeI和SpeI消化获得的DNA片段,使用DNA Ligation Kit ver.2(TakaraBio公司)连接该消化物和前述pT7NS-camAB质粒消化物。由此,构建了内部含有psmA和spmB这两者的DNA片段和质粒pT7NS-camAB连接的约9.5kbp大小的质粒(有时称为质粒pTC-DM)。
参考例3:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-2
(1)链霉菌属菌株Mer-11107株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种Mer-11107株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood&Cell Culture kit(QIAGEN公司)从该菌体制备基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5D-1R(参照序列号17和21)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5D-1R:5’-AGGTGCCCAGCGAGATCATGTT-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5D-1R)并以上述(1)获得的Mer-11107株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约300bp大小的DNA片段(以下称为DNA片段-A2)。该DNA片段-A2为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。PCR反应所扩增的DNA片段-A2通过SUPREC PCR(TakaraBio公司)自反应液回收。
接下来,为了分析对产生的DNA片段-A2的碱基序列,获得足量的DNA片段-A2,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A2连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司)自增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A2。
(3)经克隆的DNA片段-A2的碱基序列分析
将前项(2)所获得的DNA片段-A2的碱基序列使用分析装置(PEBiosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A2为约300bp,但碱基序列分析的结果表明确切地为325bp(参见序列号3的第837-1161位碱基)。由于在所克隆的上述325bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A2是由这2种引物(5Dm-3F和5D-1R)特异性扩增的。
(4)DNA片段-A2的邻近区域的分析
如上所述,由于确定了编码来自Mer-11107株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将Mer-11107株基因组DNA(参见前项(1))于K缓冲液(50mMTris-HCl,pH8.5,10mM MgCl2,1mM二硫苏糖醇,100mM KCl)中使用限制酶BamHI、于H缓冲液(50mM Tris-HCl,pH7.5,10mM MgCl2,1mM二硫苏糖醇,100mM NaCl)中使用限制酶SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A2的碱基序列设计并制备以下引物(7PIN-2F和6PIN-2R)(参照序列号22和20)。
7PIN-2F:5’-CCATGATCCTGCTGGTGGCCGGCCATGAGA-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(7PIN-2F和6PIN-2R)并以上述经自身环化的Mer-11107株基因组DNA作为模板进行PCR反应。PCR反应使用了Takara LA Taq(TakaraBio公司)和PCR扩增装置(Biometra社TGradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约1.3kbp大小的DNA片段(DNA片段-B2)、约1.4kbp大小的DNA片段(DNA片段-C2),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)从该PCR扩增反应液回收DNA片段-B2和DNA片段-C2。接下来,对于DNA片段-B2、DNA片段-C2,为了获得足量用于碱基序列分析的各DNA片段,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kit ver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilter Plasmid MidiKit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B2(约1.3kbp大小)、DNA片段-C2(约1.4kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B2、DNA片段-C2的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B2、DNA片段-C2序列中得到序列号3所示的2329bp的碱基序列这一信息。
对该2329bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号3的第420~1604位碱基中存在编码由与细胞色素P450具有高同源性的395个氨基酸构成的蛋白质的ORF(以下称为bpmA)。于是,bpmA与自A-1544株分离的psmA的氨基酸序列具有最高的同源性(同源性67.4%)、与灰色链霉菌的细胞色素P450soy(SoyC)也具有比较高的同源性(同源性64.8%)。由此认为bpmA编码细胞色素P450类的羟化酶的可能性高。
另外,在紧挨bpmA的下游(序列号3的第1643~1834位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为bpmB)。bpmB编码的蛋白质由64个氨基酸构成,与自A-1544株分离的psmB的氨基酸序列具有最高的同源性(同源性81.0%),与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列也具有比较高的同源性(76.2%)。因此认为bpmB用于电子转移,与bpmA一同进行羟化。
参考例4:编码具有大环内酯类化合物(II)的16位羟基化酶活性的多肽的DNA-3
(1)A-1560株的基因组DNA的制备
向由1%葡萄糖、0.4%麦芽提取物、1%酵母提取物构成的培养基接种A-1560株,于28℃培养3天。将获得的培养液3000转/分钟离心10分钟收集菌体。使用Blood & Cell Culture kit(QIAGEN公司)从该菌体制备A-1560株的基因组DNA。
(2)克隆编码具有大环内酯类化合物11107B的16位羟化活性的蛋白质的DNA的部分序列
参考推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列,设计并制备以下的混合引物(5Dm-3F和5Dm-2R(参照序列号17和23)。
5Dm-3F:5’-TTCGCSCTSCCSGTCCCSTCSATGGTSAT-3’
5Dm-2R:5’-CTGGATSGTGTCSCCSGGYTT-3’
考虑到密码子的摇摆性,为了提高反应性,使用了混合碱基S(=C+G)、Y(=C+T)。
接下来,使用这2种引物(5Dm-3F和5Dm-2R)并以上述(1)获得的A-1560株基因组DNA为模板进行PCR反应。PCR反应使用Takara LATaq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、50℃退火2分钟、68℃延伸30秒的3阶段反应重复进行35次。结果扩增到约750bp大小的DNA片段(以下称为DNA片段-A3)。该DNA片段-A3为编码具有羟化活性的蛋白质的DNA的一部分的可能性高。通过SUPREC PCR(TakaraBio公司)从反应液中回收PCR反应所扩增的DNA片段-A3。
接下来,为了分析对产生的DNA片段-A3的碱基序列,获得足量的DNA片段-A3,使用DNA Ligation kit ver.2(TakaraBio公司)将DNA片段-A3连接入质粒载体pT7Blue T(Novagen公司),转化大肠杆菌JM109株(Stratagene公司)。然后,使用含有氨苄青霉素(50μg/mL)、X-gal(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;40μg/mL)、IPTG(异丙基-β-D-硫代吡喃半乳糖苷;100μM)的L-肉汤琼脂培养基(1.0%细菌用胰胨、0.5%酵母提取物、0.5%NaCl、1.5%琼脂)选择所转化的大肠杆菌。将由此分离的转化大肠杆菌的菌落用含有氨苄青霉素(50μg/mL)的L-肉汤液体培养基(1%细菌用胰胨、0.5%酵母提取物、0.5%NaCl)培养。使用质粒纯化试剂盒(QIAfilterPlasmid Midi Kit,QIAGEN公司)从增殖的转化大肠杆菌菌体分离纯化质粒DNA,获得一定量的DNA片段-A3。
(3)经克隆的DNA片段-A3的碱基序列分析
将前项(2)所获得的DNA片段-A3的碱基序列使用分析装置(PEBiosystems 377XL)通过染料终止子循环测序法分析DNA碱基序列。虽然通过电泳测定的PCR反应所扩增DNA片段-A3为约750bp,但碱基序列分析的结果表明确切地为741bp(参见序列号4的第616-1356位碱基)。由于在所克隆的上述741bp DNA序列的两端发现有与进行上述PCR反应时使用的2种引物对应的DNA序列,因此明确了上述PCR反应中DNA片段-A3是由这2种引物(5Dm-3F和5Dm-2R)特异性扩增的。
(4)DNA片段-A3的邻近区域的分析
如上所述,由于确定了编码来自A-1560株的、具有羟化活性的蛋白质的部分DNA序列,通过反向PCR法(细胞工学14卷,p.591-593,1995年)对跨越克隆片段的上游、下游域的邻近区域的碱基序列进行扩增、克隆、序列分析。即,将A-1560株基因组DNA(参见前项(1))于K缓冲液(50mMTris-HCl,pH8.5,10mM MgCl2,1mM二硫苏糖醇,100mM KCl)中使用限制酶BamHI、于L缓冲液(10mM Tris-HCl,pH7.5,10mM MgCl2,1mM二硫苏糖醇)中使用限制酶KpnI、于H缓冲液(50mM Tris-HCl,pH7.5,10mMMgCl2,1mM二硫苏糖醇,100mM NaCl)中使用限制酶SalI分别消化。将获得的各限制酶切断的DNA片段使用DNA Ligation Kit ver.2(TakaraBio公司)进行自身环化。
另一方面,自DNA片段-A3的碱基序列设计并制备以下引物(5PIN-2F和6PIN-2R(参照序列号24和20))。
5PIN-2F:5’-CGGAATCCACCAGTGCCTCGGCCAGAACCT-3’
6PIN-2R:5’-CTGTTCCTCGAAGAACTCGTGGTCGGCGTA-3’
接下来,使用这2种引物(5PIN-2F和6PIN-2R)并以上述经自身环化的A-1560株基因组DNA作为模板进行PCR反应。PCR反应使用了TakaraLA Taq(TakaraBio公司)和PCR扩增装置(Biometra社T Gradient),将98℃变性20秒、68℃退火和延伸5分钟的2阶段反应重复35次。
结果扩增了约4.5kbp大小的DNA片段(DNA片段-B3)、约3.0kbp大小的DNA片段(DNA片段-C3)和约1.7kbp大小的DNA片段(DNA片段-D3),它们极有可能为编码具有羟化活性的蛋白质的DNA以及具有包含其上游和下游区域的DNA序列的DNA。
通过SUPREC PCR(TakaraBio公司)自该PCR扩增反应液回收DNA片段-B3、DNA片段-C3和DNA片段-D3。接下来,为了获得足量用于碱基序列分析的各DNA片段:DNA片段-B3、DNA片段-C3和DNA片段-D3,与上述(2)同样,使用质粒载体pT7Blue T(Novagen公司)、DNA Ligation kitver.2(TakaraBio公司)、大肠杆菌JM109株和质粒纯化试剂盒(QIAfilterPlasmid Midi Kit,QIAGEN公司),获得一定量的各DNA片段。
(5)DNA片段-B3(约4.5kbp大小)、DNA片段-C3(约3.0kbp大小)和DNA片段-D3(约1.7kbp大小)的碱基序列分析
将前项(4)所得的DNA片段-B3、DNA片段-C3和DNA片段-D3的碱基序列使用DNA碱基序列分析装置(PE Biosystems 377XL),通过染料终止子循环测序法分析。进行这样的碱基序列分析了解到自DNA片段-B3、DNA片段-C3和DNA片段-D3的序列中得到序列号4所示的1860bp的碱基序列这一情报。
对该1860bp中的开放式阅读框(ORF)进行检索,确定了有2种蛋白质得到编码。将这些蛋白质的氨基酸序列通过BLAST search检索的结果为:序列号4的第172~1383位碱基中存在编码包含与细胞色素P450具有高同源性的404个氨基酸的蛋白质的ORF(以下称为tpmA)。tpmA与推定为天蓝色链霉菌A3(2)的细胞色素P450(CYP105D5)的氨基酸序列具有最高的同源性(同源性77.4%)、与自A-1544株分离的psmA的氨基酸序列也具有高的同源性(同源性76.6%)。由此认为tpmA为编码细胞色素P450类的羟化酶的基因的可能性高。
另外,在紧挨tpmA的下游(序列号4的第1399~1593位碱基)存在编码与2Fe-2S类的铁氧还蛋白具有高同源性的蛋白质的ORF(以下称为tpmB)。tpmB编码的蛋白质包含65个氨基酸,与自A-1544株分离的psmB的氨基酸序列具有最高的同源性(同源性87.3%),与紧挨推定为天蓝色链霉菌A3(2)细胞色素P450(CYP105D5)的氨基酸序列下游的推定为铁氧还蛋白的氨基酸序列也具有高同源性(82.5%)。因此认为tpmB用于电子转移,编码与tpmA一同进行羟化的铁氧还蛋白。
参考例5:质粒pT7NS-camAB的构建
以恶臭假单胞菌(Pseudomonas putida)ATCC 17453的基因组DNA为模板,用包含以下所示序列的引物PRR-1F(参照序列号29)和PRR-2R(参照序列号30)在下述条件下进行PCR。
PRR-1F:5’-GCCCCCCATATGAACGCAAACGACAACGTGGTCATC-3’
PRR-2R:5’-GCGGATCCTCAGGCACTACTCAGTTCAGCTTTGGC-3’
(PCR反应液组成)
灭菌纯化水                                      15μl
2倍浓缩GC缓冲液I(宝酒造)                        25μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)     8μl
PRR-1F引物(100pmol/μl)                         0.5μl
PRR-2R引物(100pmol/μl)                           0.5μl
恶臭假单胞菌ATCC 17453株的基因组DNA(10ng/μl)     0.5μl
LA Taq聚合酶(5u/μl,TakaraBio公司)               0.5μl
(温度条件)
95℃3分钟
(98℃20秒,63℃30秒,68℃2分钟)    30个循环
72℃5分钟
在用限制性酶NdeI和BamHI处理含有获得的恶臭假单胞氧还蛋白还原酶(putidaredoxin reductase)基因(camA)及其基因附近下游的恶臭假单胞氧还蛋白基因(camB)的1.5kb的扩增的片段(camAB片段)后,用0.8%琼脂糖凝胶进行电泳。泳动后,用SUPREC-01(宝酒造)从由凝胶中切出的含有camAB片段的凝胶切片中回收纯化同一片段。用T4DNA连接酶将该片段连接到大肠杆菌质粒载体pET11a(Stratagene公司)的NdeI位点和BamHI位点后,转化大肠杆菌DH5α,构建出质粒pT7-camAB。然后,用T4DNA连接酶将接头1分子连接到该质粒的NdeI位点,其中所述接头1分子是通过将由以下所示的序列构成的两种合成寡DNA SP-1(参照序列号31)和SP-2(参照序列号32)进行退火获得的,转化大肠杆菌DH5α,构建出质粒pT7NS-camAB。
SP-1:5’-TATGCGTCACTAGTCGGGAGTGCGTTA-3’
SP-2:5’-TATAACGCACTCCCGACTAGTGACGCA-3’
实施例1:连接了pldA启动子和psmAB的质粒pPapsmAB的制备
为了使psmAB与普拉地内酯B生物合成基因连动表达,将普拉地内酯B生物合成基因的pldA的启动子区域与psmAB连接。以序列号1的碱基序列信息为基础,为了扩增pldA的启动子区域,合成了如下所示的序列构成的两种引物,pldApro-SpeNdeF(在5’端添加了SpeI和NdeI位点,参照序列号25)和pldApro-NdeR(在5’端添加了NdeI位点,参照序列号26)。
pldApro-SpeNdeF:5’-GGGCATATGACTAGTAGCCGTGTCCTGCCCGCC-3’
pldApro-NdeR:5’-GGGCATATGTTCGGACGTGAATTCATTCG-3’
使用这些引物在以下的条件下进行PCR。
(PCR反应液组成:使用东洋纺织社KOD-plus-)
灭菌纯化水                               71μl
10倍浓缩PCR缓冲液                        10μl
dNTP混合溶液(dATP,dGTP,dCTP,dTTP各2mM)10μl
MgSO4(25mM)                              4μl
KOD+                                     2μl
pldApro-SpeNdeF(50pmol/μl)              1μl
pldApro-NdeR(50pmol/μl)                 1μl
pKS35(参考例1(6)10ng/μl)                1μl
(反应条件:使用Biometra社T GRADIENT)
95℃5分钟
(98℃20秒,63℃1分钟,68℃1分钟)    25个循环
72℃5分钟
该反应的结果是,用QIAquick PCR纯化试剂盒(QIAGEN公司)回收扩增的360bp的DNA片段。用限制性酶NdeI消化获得的360bp的DNA片段。同样,用限制性酶NdeI消化质粒pTC-DM(参考例2(6))。用DNALigation Kit ver.2(TakaraBio公司)连接获得的360bp的DNA片段的消化物和质粒消化物。由此,构建了使pldA启动子和psmAB连接的约9.9kbp大小的质粒pPapsmAB。
实施例2:重组导入用质粒的制备
用限制性酶SpeI消化实施例1中制备的质粒pPapsmAB后,用BKL试剂盒(TakaraBio公司)将末端平端化。在0.8%的分子生物琼脂糖(注册商标、BIO-RAD公司)上对获得的DNA进行电泳(Mupid-ex:advance公司),切出分离的1.8kbp的含有pldA启动子和psmAB的DNA片段(以后,有时也称为PapsmAB),用QIAquick Gel提取试剂盒(QIAGEN公司)回收纯化。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31后,用BKL试剂盒(TakaraBio公司)将末端变为平端。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接所获得的载体和PapsmAB。由此,构建了在整合导入用载体pUC19aph::oriT::intphiC31中插入了PapsmAB的重组导入用质粒pAOC::PapsmAB。
实施例3:重组导入用质粒pAOC::PapsmAB向Mer-11107株中导入
用电穿孔法将获得的pAOC::PapsmAB转化接合大肠杆菌S17-1(ATCC47055),获得了S17-1/pAOC::PapsmAB株。将获得的S17-1/pAOC::PapsmAB株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pAOC::PapsmAB株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5mlSNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pAOC::PapsmAB转化株Mer-11107::pAOC::PapsmAB株。
实施例4:Mer-11107::pAOC::PapsmAB株的普拉地内酯生产试验
对于以实施例3中获得的Mer-11107::pAOC::PapsmAB株和作为对照的亲本株Mer-11107株,进行普拉地内酯B和16位羟基化体的普拉地内酯D的生产性试验。
分别将Mer-11107::pAOC::PapsmAB株和Mer-11107株的冷冻种子300μl接种于60ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的600μl种子培养液接种于60ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol(アデカノ一ル)LG-126、0.1%CaCO3pH7.5),于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体的普拉地内酯D的量。测定结果示于表2中。
此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
        55%      甲醇(5~13分钟)
        55%~70%甲醇(13~21分钟)
        70%      甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
          普拉地内酯D 4.3分钟
表2
Figure A20068001828900541
Figure A20068001828900551
该结果确认了,与亲本株Mer-11107株中几乎没发现生产普拉地内酯D相反,在导入了pAOC::PapsmAB的菌株Mer-11107::pAOC::PapsmAB株中生产普拉地内酯D。由此表明,通过在普拉地内酯B生产菌株Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB,可以直接生产普拉地内酯D。
实施例5:添加β-CD对于Mer-11107::pAOC::PapsmAB株的普拉地内酯D生产的效果
对于实施例3中获得的Mer-11107::pAOC::PapsmAB株中普拉地内酯B及其16位羟基化体普拉地内酯D的生产性,研究了β-环糊精(β-CD)的添加效果。将300μl Mer-11107::pAOC::PapsmAB株的冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml添加了2%β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、2%β-CD、0.1%CaCO3 pH7.5),或接种于30ml未添加β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、0.1%CaCO3 pH7.5),于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体-普拉地内酯D的量。测定结果示于表3中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
        55%      甲醇(5~13分钟)
55%~70%甲醇(13~21分钟)
70%      甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B  12.4分钟
          普拉地内酯D 4.3分钟
表3
Figure A20068001828900561
该结果是,由于添加了2%β-CD,普拉地内酯D的累积量增大至约1.4倍,由此表明β-CD的添加对普拉地内酯D的直接生产有效果。
实施例6:Mer-11107::pAOC::PapsmAB株的普拉地内酯生产(2)
将300μl实施例3制备的Mer-11107::pAOC::PapsmAB株的冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、1%大豆粉(J-オイルミルズ社:丰年soypro)、0.05%Adekanol LG-126、2%β-CD、0.1%CaCO3 pH7.5),于25℃培养3天、4天、5天、6天和7天。
培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体普拉地内酯D的量。测定结果示于表4中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相(容量%):45%~55%甲醇(0~5分钟)
                55%      甲醇(5~13分钟)
                55%~70%甲醇(13~21分钟)
                70%      甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
          普拉地内酯D 4.3分钟
表4
  普拉地内酯B(mg/L)   普拉地内酯D(mg/L)
  培养3天(72小时)   378.3   230.6
  培养4天(96小时)   601.4   567.9
  培养5天(120小时)   480.4   874.2
  培养6天(144小时)   387.4   985.4
  培养7天(168小时)   439.1   1215.9
将50ml通过在前述的培养液中加入等量的乙腈获得的提取液过滤后,用30ml水清洗菌体。在滤液中加入70ml水,用100ml醋酸乙酯提取1次,50mL提取2次。合并醋酸乙酯层,用50ml饱和食盐水清洗2次后,使用无水硫酸钠干燥。除去溶剂后,通过将获得的残渣经薄层层析(MERCKSilicagel 60 F254 0.5mm展开液;甲苯∶丙酮=1∶1)纯化,获得了12.8mg普拉地内酯B,23.1mg普拉地内酯D。普拉地内酯B和普拉地内酯D的1H-NMR分析结果如下。
普拉地内酯B;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.93(3H,d,J=7.0Hz),0.94(3H,d,J=6.8Hz),0.98(3H,t,J=8.0Hz),1.12(3H,d,J=6.8Hz),1.23(3H,s),1.25(1H,m),1.42(2H,m),1.53-1.70(6H,m),1.79(3H,d,J=1.0Hz),2.10(3H,s),2.52(1H,m),2.56(2H,m),2.60(1H,m),2.70(1H,dd,J=2.4,8.3Hz),2.76(1H,dt,J=2.4,5.7Hz),3.56(1H,dt,J=8.3,4.4Hz),3.82(1H,m),5.08(2H,d,J=9.8Hz),5.60(1H,dd,J=9.8,15.2Hz),5.70(1H,dd,J=8.3,15.2Hz),5.74(1H,dd,J=9.8,15.2Hz),6.13(1H,d,J=9.8Hz),6.36(1H,dd,J=9.8,15.2Hz)
普拉地内酯D;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.93(3H,d,J=7.0Hz),0.95(3H,d,J=6.8Hz),0.98(3H,t,J=8.0Hz),1.23(3H,s),1.30(1H,m),1.36-1.66(9H,m),1.70(1H,dd,J=6.4,14.2Hz),1.82(3H,d,J=1.0Hz),1.90(1H,dd,J=6.4,14.2Hz),2.10(3H,s),2.52(2H,m),2.62(1H,m),2.72(1H,dd,J=2.4,8.3Hz),2.94(1H,dt,J=2.4,5.7Hz)3.55(1H,dt,J=8.3,4.4Hz),3.82(1H,m),5.10(1H,d,J=9.8Hz),5.11(1H,d,J=10.8),5.60(1H,dd,J=9.8,15.2Hz),5.74(1H,dd,J=8.3,15.2Hz),5.92(1H,d,J=15.2Hz),6.18(1H,d,J=10.8Hz),6.57(1H,dd,J=10.8,15.2Hz),
实施例7:重组导入用质粒pAOC::PapsmAB向Mer-11107pldB::hyg株的导入
将实施例3中获得的S17-1/pAOC::PapsmAB株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时,将参考例1(8)制备的Mer-11107pldB::hyg株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pAOC::PapsmAB株供体菌悬浮液和10μl Mer-11107pldB::hyg株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pAOC::PapsmAB转化株Mer-11107pldB::hyg::pAOC::PapsmAB株。
实施例8:Mer-11107pldB::hyg::pAOC::PapsmAB株的普拉地内酯生产试验
对于实施例7获得的Mer-11107pldB::hyg::pAOC::PapsmAB株和作为对照的亲本株的Mer-11107pldB::hyg株,对ME-265及其16位羟基化体ME-282的生产性进行试验。分别将Mer-11107pldB::hyg::pAOC::PapsmAB株和Mer-11107pldB::hyg株300μl冷冻种子接种于30ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将300μl获得的种子培养液接种于30ml添加了2%的β-CD的主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.05%Adekanol LG-126、2.0%β-CD、0.1%CaCO3pH7.5)中,于25℃培养3天、4天、5天和6天。培养终止后,对获得的培养液添加4倍量的乙腈进行提取。对获得的提取液,用HPLC测定ME-265及其16位羟基化体ME-282的量。测定结果示于表5。而且,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%~55%甲醇(0~5分钟)
        55%      甲醇(5~13分钟)
        55%~70%甲醇(13~17分钟)
70%甲醇(17~35分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:35分钟
保留时间:ME-26521.0分钟
          ME-28215.6分钟
表5
Figure A20068001828900601
该结果确认了,与亲本株Mer-11107pldB::hyg株中几乎没发现生产ME-282相反,在导入了pAOC::PapsmAB的菌株Mer-11107pldB::hyg::pAOC::PapsmAB株中生产ME-282。由此表明,通过向ME-265生产菌株Mer-11107pldB::hyg株中导入ME-265的16位羟基化酶基因psmAB,可以直接生产ME-282。
向约90ml通过在前述的Mer-11107pldB::hyg::pAOC::PapsmAB株的培养液中添加等量的乙腈获得的提取液中添加过滤助剂并混合后,用桐山ロ一ト60φ(桐山滤纸No.4)过滤,分离菌体。用50ml水清洗菌体,获得菌体分离滤液。用100ml醋酸乙酯提取菌体分离滤液2次。用无水硫酸钠干燥后,除去溶剂获得残渣。通过薄层层析(MERCK Silicagel 60 F254 0.5mm展开液;甲苯∶丙酮=1∶1)纯化,获得了0.5mg ME-265,12.5mgME-282。ME-265和ME-282的1H-NMR分析结果如下。
ME-265;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重度,结合常数J(Hz)):0.87(3H,d,J=7.0Hz),0.90(3H,d,J=7.0Hz),0.94(3H,d,J=7.3Hz),0.97(3H,d,J=7.0Hz),1.08(3H,d,J=7.0Hz),1.17-1.21(1H,m),1.24-1.36(2H,m),1.42-1.52(3H,m),1.61-1.66(3H,m),1.74(3H,d,J=1.1Hz),1.89-1.96(1H,m),2.00(3H,s),2.41-2.47(1H,m),2.43(1H,dd,J=5.5,13.9Hz),2.51-2.58(1H,m),2.56(1H,dd,J=3.7,13.9Hz),2.65(1H,dd,J=2.2,8.1Hz),2.72(1H,dt,J=2.2,5.9Hz),3.51(1H,dt,J=4.4,8.4Hz),3.75-3.80(1H,m),4.91(1H,dd,J=8.8,10.6Hz),5.00(1H,d,J=10.6Hz),5.42(1H,dd,J=9.2,15.0Hz),5.49(1H,dd,J=9.2,15.0Hz),5.65(1H,dd,J=8.4,15.0Hz),6.08(1H,d,J=10.6Hz),6.32(1H,dd,J=10.6,15.0Hz)
ME-282;
1H-NMR谱(CD3OD,500MHz):δppm(积分,多重性,结合常数J(Hz)):0.87(3H,d,J=7.0Hz),0.90(3H,d,J=7.0Hz),0.94(3H,d,J=7.3Hz),0.97(3H,d,J=6.6Hz),1.21-1.26(1H,m),1.29-1.37(3H,m),1.34(3H,s),1.42-1.52(2H,m),1.60-1.64(1H,m),1.65(1H,dd,J=6.2,13.9Hz),1.77(3H,d,J=1.1Hz),1.86(1H,dd,J=5.4,13.9Hz),1.89-1.94(1H,m)2.00(3H,s),2.43(1H,dd,J=5.5,13.9Hz),2.50-2.60(1H,m),2.56(1H,dd,J=3.3,13.9Hz),2.66(1H,dd,J=2.2,7.7Hz),2.89(1H,dt,J=2.2,6.2Hz),3.52(1H,dt,J=4.8,8.4Hz),3.75-3.80(1H,m),4.90(1H,与D2O重叠),5.01(1H,d,J=10.6Hz),5.42(1H,dd,J=9.2,15.0Hz),6.13(1H,d,J=10.6Hz),6.52(1H,dd,J=11.0,15.0Hz)
实施例9:制备连接了ermE启动子和psmAB的质粒pPepsmAB
为了使用ermE启动子表达psmAB,使ermE启动子区域与psmAB连接。以序列号2的碱基序列信息为基础,合成用于扩增psmAB的由如下所示的序列构成的两条引物,eDM-SphF(5’末端添加了SphI位点:参照序列号27)和eDM-SphR(5’末端添加了SphI位点:参照序列号28)。
eDM-SphF:5’-TCCCCGCATGCCGGAACTGACGGACATCAC-3’
eDM-SphR:5’-CCCGGGCATGCAGACGACGACGTAGAGGAA-3’
使用这些引物在以下条件下进行PCR。
(PCR反应液组成:使用TakaraBio公司LA Taq)
灭菌纯化水                               17μl
2倍浓缩GC缓冲液II                        25μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2mM)5μl
LA Taq                                   0.5μl
eDM-SphF(50pmol/μl)                     0.5μl
eDM-SphR(50pmol/μl)                     0.5μl
链霉菌A-1544株基因组DNA
(参考例2(1)10ng/μl)                     1μl
(反应条件:使用Biometra公司T GRADIENT)
95℃3分钟
(98℃20秒,68℃4分钟)    30个循环
68℃5分钟
该反应的结果是,用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化扩增的1570bp的含有psmAB的DNA片段。用限制性酶SphI消化获得的1570bp的DNA片段。同样,用限制性酶SphI消化质粒pSK117(参照J.Bacteriol.vol.2002 184,6417-6423)。用DNA Ligation Kitver.2.1(TakaraBio公司)连接获得的1570bp的含有psmAB的DNA片段的消化物和质粒消化物。由此,构建了使ermE启动子和psmAB连接的质粒pPepsmAB。
实施例10:载入了与ermE启动子相连接的psmAB的重组导入用质粒的制备
用限制性酶KpnI和BglII消化实施例9中制备的质粒pPepsmAB,用BKL试剂盒(TakaraBio公司)将末端平端化。在0.8%的分子生物学琼脂糖(注册商标、BIO-RAD公司)上对获得的DNA进行电泳(Mupid-ex:advance公司),切出分离的2060bp的含有ermE启动子和psmAB的DNA片段(以后,称为PepsmAB),用QIAquick Gel提取试剂盒(QIAGEN公司)回收纯化。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31后,用BKL试剂盒(TakaraBio公司)将末端变为平端化。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接所获得的载体和PepsmAB。由此,构建了在重组导入用载体pUC19aph::oriT::intphiC31中插入了PepsmAB的重组导入用质粒pAOC::PepsmAB。
实施例11:载入了天然型psmAB的重组导入用质粒的制备
参考序列号2的碱基序列,设计并制备了在5’末端添加有BglII位点的引物DM-BglF(5’-CGCATAGATCTTCACCCGAGCGGGTGATCA-3’:参照序列号35)和5’末端添加有BglII位点的引物DM-BglR(5’-TCCCGAGATCTTGAAGGTCCGCGTCACCGT-3’:参照序列号36)。然后,接下来,利用这2种引物(DM-BglF和DM-BglR)并以参考例2(1)所获得的A-1544株基因组DNA为模板,进行PCR反应。PCR反应使用Takara LA Taq(TakaraBio公司)和PCR扩增装置(Biometra公司T Gradient),将98℃变性20秒、63℃退火30秒,68℃延伸4分钟的3阶段反应重复进行30次。自该PCR扩增反应液中通过琼脂糖凝胶电脉和SUPREC 01(TakaraBio公司)回收含有天然型psmA和psmB的约3.5kbp大小的DNA片段(以后称为PopsmAB)。用限制性酶BglII消化获得的DNA片段。而且,用限制性酶BamHI消化图4所示的重组导入用载体pUC19aph::oriT::intphiC31。用DNA Ligation Kit ver.2.1(TakaraBio公司)连接这样获得的载体和PopsmAB。由此,构建了在重组导入用载体pUC19aph::oriT::intphiC31中插入了PopsmAB的重组导入用质粒pAOC::PopsmAB。
实施例12:重组导入用质粒pUC19aph::oriT::intphiC31、pAOC::PepsmAB和pAOC::PopsmAB向Mer-11107株中导入
用电穿孔法分别将获得的重组导入用载体pUC19aph::oriT::intphiC31和实施例10和11中获得的pAOC::PepsmAB和pAOC::PopsmAB转化接合大肠杆菌S17-1(ATCC47055),分别获得了S17-1/pUC19aph::oriT::intphiC31株、S17-1/pAOC::PepsmAB株、S17-1/pAOC::PopsmAB株。将获得的这3个菌株接种于10ml含有25μg/ml卡那霉素的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药公司)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。分别将所获得的这3个菌株的供体菌悬浮液各500μl与10μlMer-11107株受体菌悬浮液混合,涂布于Actino Medium No.4琼脂培养基(日本制药公司)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素(Ribostamycin)的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pUC19aph::oriT::intphiC31转化株Mer-11107::pAOC株、pAOC::PepsmAB转化株Mer-11107::pAOC::PepsmAB株和pAOC::PopsmAB转化株Mer-11107::pAOC::PopsmAB株。
实施例13:Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株的普拉地内酯生产试验
对于以实施例12中获得的Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株,进行普拉地内酯B和16位羟基化体普拉地内酯D的生产性试验。将Mer-11107::pAOC株、Mer-11107::pAOC::PepsmAB株、Mer-11107::pAOC::PopsmAB株的冷冻种子各300μl接种于20ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将获得的300μl种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、0.1%CaCO3 pH7.5),于25℃培养4天。培养终止后,对获得的培养液添加9倍量的乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯B和其16位羟基化体普拉地内酯D的量。测定结果示于表6中。此外,HPLC的测定条件如下所示。
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相(容量%):45%~55%甲醇(0~5分钟)
                55%      甲醇(5~13分钟)
                55%~70%甲醇(13~21分钟)
                70%      甲醇(21~25分钟)
流速:1.2ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:25分钟
保留时间:普拉地内酯B 12.4分钟
          普拉地内酯D 4.3分钟
表6
  Mer-11107::pAOC株   Mer-11107::pAOC::PepsmAB株   Mer-11107::pAOC::PopsmAB株
  普拉地内酯B(mg/L)   243.0   309.0   241.3
  普拉地内酯D(mg/L)   0.0   54.8   18.8
该结果确认了,与只导入载体的Mer-11107::pAOC株中几乎没发现生产普拉地内酯D相反,在导入了pAOC::PepsmAB或pAOC::PopsmAB的菌株Mer-11107::pAOC::PepsmAB株和Mer-11107::pAOC::PopsmAB株中生产普拉地内酯D。由此表明,通过在普拉地内酯B生产菌株Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB,可以直接生产普拉地内酯D。
实施例14:包含变异型psmA的pPampsmAB的制备
为了在psmA中导入位点特异性变异,以实施例1制备的pPapsmAB为模板,使用QuickChangeTM位点导向性诱变试剂盒导入变异,制备了pPampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY。
首先,合成由如下所示的序列构成的引物R91C-F和R91C-R(参照序列号37和38),
R91C-F:5’-TTCGCGGCCGTCTGCGACCGGCGGGTG-3’
R91C-R:5’-CACCCGCCGGTCGCAGACGGCCGCGAA-3’
以pPapsmAB作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第91位的精氨酸替代为半胱氨酸的pPampsmAB-C。然后,合成以下所示的序列构成的引物R195L-F和R195L-R(参照序列号39和40),
R195L-F:5’-TCGCAAGGGGCGCTCGAGCGGCTCGAG-3’
R195L-R:5’-CTCGAGCCGCTCGAGCGCCCCTTCCGA-3’
以pPampsmAB-C作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第195位的精氨酸替代为亮氨酸的pPampsmAB-CL。然后,合成以下所示的序列构成的引物L403M-F和L403M-R(参照序列号41和42),
L403M-F:5’-ACGATCCAGGGGATGATGGAACTCCCCGTGA-3’
L403M-R:5’-TCACGGGGAGTTCCATCATCCCCTGGATCG-3’
以pPampsmAB-CL作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第403位的亮氨酸替代为蛋氨酸的pPampsmAB-CLM。然后,合成以下所示的序列构成的引物R236L-F和R236L-R(参照序列号43和44),
R236L-F:5’-AGCTGGACCGACTCGACGTGGTGGCGCTGG-3’
R236L-R:5’-AGCGCCACCACGTCGAGTCGGTCCAGCTC-3’
以pPampsmAB-CLM作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第236位的精氨酸替代为亮氨酸的pPampsmAB-CLLM。然后,合成以下所示的序列构成的引物I244F-F和I244F-R(参照序列号45和46),
I244F-F:5’-TGGCGCTGGCCGTCTTCCTGCTCGTGG-3’
I244F-R:5’-CCACGAGCAGGAAGACGGCCAGCGCCACCA-3’
以pPampsmAB-CLM作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第244位的异亮氨酸替代为苯丙氨酸的pPampsmAB-CLFM。然后,合成以下所示的序列构成的引物M112T-F和M112T-R(参照序列号47和48),
M112T-F:5’-CAGCGGCGGATGACGATCCCGTCGTTC-3’
M112T-R:5’-GAACGACGGGATCGTCATCCGCCGCTG-3’
以pPapsmAB作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第112位的蛋氨酸替代为苏氨酸的pPampsmAB-T。然后,合成以下所示的序列构成的引物R195Y-F和R195Y-R(参照序列号49和50),
R195Y-F:5’-AGGGGCGCGCGAGTACCTCGAGGAGTACCT-3’
R195Y-R:5’-GGTACTCCTCGAGGTACTCGCGCGCCCCTT-3’
以pPapsmAB-T作为模板,用QuickChangeTM位点导向性诱变试剂盒制备将PsmA的第195位的精氨酸替代为酪氨酸的pPampsmAB-TY。
实施例15:通过双同源重组制备导入质粒
通过确定参考例1(7)普拉地内酯生物合成基因簇的碱基序列,我们认为可以使用确定的含有参与普拉地内酯的生物合成的DNA及其周边的DNA的碱基序列,通过双同源重组导入psmAB或其变体,用以下的方法制备导入用质粒。
为了扩增用于双同源重组的同源序列,基于参与普拉地内酯的生物合成的DNA的下游的碱基序列,合成由以下序列构成的4条引物,pldout-L-Bgl2F、pldout-L-Sph1R、pldout-R-Sph1F和p1dout-R-Bgl2R(参照序列号51、52、53和54)。
pldout-L-Bgl2F:5’-GGGAGATCTGCAGGTCATCGGGGGGAAGAACCACA-3’
pldout-L-Sph1R:5’-TCTCCAGCCGCATGCGGTCCCGGGTCACCGT-3’
pldout-R-Sph1F:5’CCCGCATGCGGCTGGAGATCATCCAGAGCGCA-3’
pldout-R-Bgl2R:5’-GGGAGATCTAGAACATGCCGGGCCAGAGGCTGAC-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                     30μl
2倍浓缩GC缓冲液II                              50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)    16μl
pldout-L-Bgl2F或pldout-R-Sph1F(50pmol/μl)     1μl
pldout-L-Sph1R或pldout-R-Bgl2R(50pmol/μl)     1μl
Mer-11107株总DNA(100ng/μl)                    1μl
LA Taq聚合酶(5u/μl,宝酒造社)                 1μl
(反应温度条件)
95℃3分钟
(98℃20秒,65℃30秒,68℃3分钟)    30个循环
72℃5分钟
该反应的结果是,由使用pldout-L-Bgl2F和pldout-L-Sph1R的反应扩增2.08kb DNA片段(DNA片段LZ),由使用pldout-R-Sph1F与pldout-R-Bgl2R的反应扩增出2.73kb DNA片段(DNA片段RX)。用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化DNA片段LZ和RX后,用限制性酶BglII和SphI消化。
然后,为了扩增潮霉素抗性基因,基于碱基序列,合成由下述序列构成的两种引物hyg-SpeSphF和hyg2-SphR(参照序列号55和56)。
hyg-SpeSphF:5’-GGGGCATGCGGACTAGTACACCGTCGCCTCGGT-3’
hyg2-SphR:5’-GCCGCATGCGTCAGGCGCCGGGGGCGGTGT-3’
用这些引物在下述条件下进行PCR。
(PCR反应液组成)
灭菌纯化水                                     30μl
2倍浓缩GC缓冲液II                              50μl
dNTP混合溶液(dATP,dGTP,dTTP,dCTP各2.5mM)    16μl
hyg-SpeSphF(50pmol/μl)                        1μl
hyg2-SphR  (50pmol/μl)                        1μl
吸水链霉菌(Streptomyces hygroscopicus)JM 4772株总DNA(100ng/μl)                                     1μl
LA Taq聚合酶(5u/μl,宝酒造社)                 1μl
(反应温度条件)
95℃6分钟
(98℃20秒,63℃30秒,68℃2分钟)    30个循环
72℃5分钟
该反应的结果是,用QIAGEN PCR纯化试剂盒(QIAGEN公司)纯化扩增的1.21kb的DNA片段(DNA片段hyg2),用限制性酶SphI消化。
用DNA ligation kit ver.2.1(TakaraBio公司)将经限制性酶BglII和SphI消化的DNA片段LZ和RX,经限制性酶SphI消化的DNA片段hyg2和经限制性酶BamHI消化的穿梭质粒pKU253(参照图3)这四者连接。这样在DNA片段LZ与RX间插入了DNA片段hyg2的约6.0kb的DNA片段通过插入至pKU253中的约22kb的双同源重组构建了导入用质粒pKU253-LZ-hyg2-RX。
实施例16:通过双同源重组向导入用质粒pKU253-LZ-hyg2-RX插入psmAB或其变体
用限制性酶SpeI消化实施例1中构建的pPapsmAB和实施例14中构建的pPampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY。用限制性酶SpeI消化的各DNA在0.8%的CertifiedTM分子生物学琼脂糖(BIO-RAD公司)上进行电泳(Mupid-ex:advance公司),切出分离的1.8kbp的含有pldA启动子和psmAB或其变体的DNA片段(下文中有时也称为PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY),用QIAquick凝胶提取试剂盒(QIAGEN公司)回收并纯化。用DNA ligation kit ver.2.1(TakaraBio公司)将这样获得的各DNA  片段(PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY)与经限制性酶SpeI消化的实施例15中制备的pKU253-LZ-hyg2-RX相连接。通过双同源重组构建了在pKU253-LZ-hyg2-RX的hyg2的上游插入了以上各DNA片段(PapsmAB,PampsmAB-CLM,pPampsmAB-CLLM,pPampsmAB-CLFM,pPampsmAB-TY)的约24kb的psmAB或其变体导入质粒pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX。
实施例17:通过双同源重组向Mer-11107株插入psmAB或其变体
采用电穿孔法分别以pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化接合大肠杆菌S17-1,获得了S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株。将获得的S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株分别接种于10ml含有25μg/ml卡那霉素和100μg/ml潮霉素B的LB培养基(1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl)中,于30℃振荡培养2小时后,收集菌体,用10ml LB培养基清洗2次后,悬浮于5ml LB培养基中。以其作为供体菌悬浮液。
在制备供体菌悬浮液的同时将Mer-11107株接种于10ml TSB培养基(Trypto-Soya broth:日水制药社)中,于30℃振荡培养5小时后,收集菌体,用10ml灭菌水清洗2次后,悬浮于1ml灭菌水中。以其作为受体菌悬浮液。混合500μl所获得的S17-1/pKU253-LZ-hyg2-PapsmAB-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLLM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-CLFM-RX株,S17-1/pKU253-LZ-hyg2-PampsmAB-TY-RX株供体菌悬浮液和10μl Mer-11107株受体菌悬浮液,涂布于Actino Medium No.4琼脂培养基(日本制药社)上。于30℃培养18小时后,再铺一层含有2mg/ml核糖霉素的2.5ml SNA(0.8%营养培养基:Difco公司、0.4%琼脂)。于30℃培养7天,获得了对核糖霉素有抗性的pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株。将获得的pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株分别接种于10ml不含有核糖霉素的TSB培养基中,于30℃振荡培养24小时。收集pKU253-LZ-hyg2-PapsmAB-RX,pKU253-LZ-hyg2-PampsmAB-CLM-RX,pKU253-LZ-hyg2-PampsmAB-CLLM-RX,pKU253-LZ-hyg2-PampsmAB-CLFM-RX,pKU253-LZ-hyg2-PampsmAB-TY-RX转化株培养液中的菌体,用10ml灭菌水清洗2次后,悬浮于10ml灭菌水中。将适当稀释的悬浮液涂布于含有200μg/ml潮霉素B的YMS琼脂培养基(0.4%酵母提取物、1%麦芽提取物、0.4%溶性淀粉、2%琼脂、10mM氯化钙)中,于30℃培养4天。将在含有潮霉素B的YMS琼脂培养基中生长的单菌落转接种于含有200μg/ml潮霉素B的YMS琼脂培养基和含有200μg/ml核糖霉素的YMS琼脂培养基中,于30℃培养2天。培养后,以潮霉素B抗性选择核糖霉素敏感性株。获得的菌株是在基因组中的参与普拉地内酯的生物合成的DNA下游(序列号1的第73362位碱基和第73369位之间)插入了潮霉素B抗性基因的hyg2和psmAB或其变体的菌株,分别称为Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株。
实施例18:Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株的普拉地内酯生产
将实施例17获得的Mer-11107-ZX::hyg2::PapsmAB株,Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株的冷冻种子各500μl接种于25ml种子培养基(2%溶性淀粉、2%大豆粉(味之素公司:エスサンミ一ト)、0.3%酵母提取物、0.1%K2HPO4、0.25%MgSO4·7H2O、0.3%CaCO3 pH无调整)中,于25℃培养3天。将300μl获得的种子培养液接种于30ml主培养培养基(5%溶性淀粉、1%葡萄糖、3%pharmamedia、1%soypro、0.05%Adekanol LG-126、2%β-环糊精、0.1%CaCO3 pH7.5)中,于25℃培养6天。
培养终止后,对获得的培养液添加4倍量乙腈进行提取。对获得的提取液,用HPLC测定普拉地内酯D,普拉地内酯D的20位羟基化体普拉地内酯H13和普拉地内酯D的21位酮体普拉地内酯C2,普拉地内酯D的20位羟基化、21位酮体普拉地内酯C3的量。测定结果示于表7中。此外,HPLC的测定条件如下所示。
(HPLC分析条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(4.6×50mm 3μm)
移动相:20%~35%乙腈(0~13分钟)
        35%-100%乙腈(13~17分钟)
        20%乙腈(17~22分钟)
流速:1.0ml/分钟
检测:UV240nm
注入容量:5μl
柱温度:40℃
分析时间:22分钟
保留时间:普拉地内酯H13;5.5分钟、
          普拉地内酯C3;8.3分钟、
          普拉地内酯D;9.0分钟、
          普拉地内酯C2;11.1分钟
Figure A20068001828900741
该结果确认了,与导入了PapsmAB的Mer-11107-ZX::hyg2::PapsmAB株中普拉地内酯D的生产和大量生产普拉地内酯D的分解物-普拉地内酯H13、普拉地内酯C2、普拉地内酯C3相反,在导入了PampsmAB-CLM,PampsmAB-CLLM,PampsmAB-CLFM,PampsmAB-TY的菌株Mer-11107-ZX::hyg2::PampsmAB-CLM株,Mer-11107-ZX::hyg2::PampsmAB-CLLM株,Mer-11107-ZX::hyg2::PampsmAB-CLFM株,Mer-11107-ZX::hyg2::PampsmAB-TY株中生产普拉地内酯D,并且普拉地内酯D的分解物-普拉地内酯H13、普拉地内酯C2、普拉地内酯C3的生产减少到约四分之一。由此表明,通过在普拉地内酯B生产菌株-Mer-11107株中导入普拉地内酯B的16位羟基化酶基因psmAB的变体,可以直接生产普拉地内酯D并且降低普拉地内酯D的分解物的生产。
序列表
<110>卫材R&D管理有限公司
<110>美露香株式会社
<120>基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
<130>06011PCT
<150>2005-154114
<151>2005-05-26
<160>56
<210>1
<211>74342
<212>DNA
<213>链霉菌属(Streptomyces sp.)
<400>1
cgattttgca ccttgtccat cgctggtggt gtgaggcatg ctcctattgg aacataaaac    60
ctctgaacct ttaagaggtt atggcggagg ctttcgacgc gacacgaggg agaagcggat    120
gagaatcgtg gggattcacc gggagggcgc aggcatagag gtggcccggc tgtcggacga    180
cgggcggcgg gcagtcgtgc tggccccgct cgaagtcttc tgggccgacg ccaccggcca    240
tctggcgcgc ggggacggtg gaccagtcgt cccggtgtcc gcggtggagc tggtaccgcc    300
ggttctgccg gacgcgcggg tgatctgcat cgggctcaac tacctcaagc atgtggccga    360
gggaacctac cgcgaccagg aagtccccga gcaccccacg ctgttcgccc gctggacacg    420
gtcgctgacc gtggacggag ccgaggtccc ggtgccctcg gacgaggccg ggctggactg    480
ggagggtgag gtggtggcct gggtgggcgc accactcgtg gacgccacgc cggaggaggc    540
gctgaccgcc gtcatcggct actccctctt caacgacctc acctcccggc gggctcagaa    600
gctcacctct cagtggaccc tgggcaagaa cggggacaac tccggcccgc tcgggccgat    660
ggtgccggct gccgaggtgg gcgacctgcg cgacgggctg cgggtacaga cccgggtcaa    720
cggggagacg atgcaggatg gcagcacgga cgagatggtc tacaccgtgg gtgacacgct    780
cgcgcacatc tcccgcacct tcatcctgcg tcccggcgac ctgctggcga cgggcacccc    840
gtccggagtc ggctacgccc ggaccccacc gcagctcctg cagccgggag acgtcgtcga    900
ggtggaggtc gaacggctcg gcgtgctgcg caaccccgtg gtgtccaacg acgcccggct    960
gcgcgcaccc aagtgaggac gcaagaggcc ccgcgcccgc ccgcggaacg cgggtgctcg    1020
ccctgcggca cacgccgcag gacacacctg gtcaccgtcc tgcgtcgccg ggtcctgcgg    1080
tggggcaccg ttgaccgtgg tcaaggacta caccgagaac cagaagcgcc cggactgagc    1140
gcggcccgat cgtgggagca ttccgaagcg aggcggcggc gctccgcgcc gccttgctca    1200
ggatgcgttt cctcccgggc gtgaacgccc ggggttcctc gcacggtcag gctgagactt    1260
ctctcacatg gggagtccag tcgtcggccg gatctgcggc cggagccggt accggcggcg    1320
agggctggaa cggcgaactc acgtactcct ccacgagcgg attacggtgc gggacacgaa    1380
aggtcggaga ccagggggcg gctcgggccg gggattaggc gtaggggtgg ctgatggtgt    1440
gctggcgccg ggcggtggcc aggacgttgt cagggaagcg ggagccggcg acgtagtggc    1500
ggcccttggt ctgccccacc gccgtcagca gctccgcctt ggtcagggcc tgcaggtccc    1560
gtgtggcctg ctgggtgttg agggcctcgg ctcgctcata gcgcgagcgg cgaacccggc    1620
ccaccatcgc cacctcgtgc agcgcggtga tctgccgctc ggtgatcccg aggctgtcgg    1680
cggcgtccat gagctgcctc cagcagtcgt tggagcggtc gacgcggcgc tgcacccgct    1740
gggtctgctg gtggtaggcg agcaggttga agcggatcca cggcccggtg tcgcgcttcg    1800
gtgagtagac cgggccgccg acctcgcgca gcgctttgta gtactcccag gtgttgcccg    1860
gcatgcccag ccactcctcg atggaggaga actccggcgc cagcactccg ccccgggcga    1920
tgaccagcgt ctgcagggag cgggacatcc gcccgttccc gtccgaccac gggtggatct    1980
tcaccaggtt caggtgcgcc atcgccgccc gcaccaggac gtgggcgtcc aggtcgccgt    2040
cgttgagcca gtccaccagc tcgcccatca ggcccggcag caggtcggcg tccgggcctt    2100
cgtagtcggt ggccagctcg tcgccggggg cggtgatgcg gatcgcagtg cgacgccact    2160
ggccggccag ccgcagcgga tggtggtggc cctgcagcat ccagtgcagc gagttgagca    2220
actccttgct gtagctgaag tcgcctacgt cgtgcaggga ctggatgtag gccatcgcct    2280
gctggtaggc cagcgtctcg gccttgttct cctcgctggc atccacggca tcgcgttcgc    2340
cgtccatcag gtccgcgaca tccttcgcat cgacctggta accctcgatg gtgttggacg    2400
ccgcgatcgc gctggccgtc agcgccttgc gcagatcctg cgtccacttc gtcggcacct    2460
gctgcaccgc gtggcgcagc tgctcctgca gggaattgat ctcctccagg acccggcggt    2520
cgtcggtggt gaggtgaggc gtctgataca gcataagtga atgatacctg actcctatca    2580
ttccttcaac gctgcggctt catcaccgtc cgtccacgat gaacatgaac tcgcccagct    2640
cgacgagcag ggccaccggc ctgccgaccc acgctggtca ctgatcaaca caccaggtca    2700
acgagtacgt ctgcaggact ggatggagtg acaggcagcg cggggcagcc aagcaggcgg    2760
cgcgaccacg taacggaccg gcgaacccga gctgagcacc ggtgagctcc gcgaccggct    2820
gactgccctc agctacaaca tcgagaacag ctggccgagc ttgcccggag ccggcggcgc    2880
ggatcacgtc cgccgtgtgt gcgaggggcg cgccgcttcc ggcggtgtcg tcgacgccag    2940
gcccgccaag ttgctgagcg acgcggcgtt ccggacgtcc gcacgtcgcg gatcccgaga    3000
cgaggggtga gccaagccgc cgggatcacg ccgccgcgca tgatgcctac cacggcttgc    3060
cgatgtggag gctgggcaga gatcccctca gcctccggta cgtcgacggg caggcacccg    3120
cctggccgga gctccgtgcg gggccgttgg agcggagtgt gcccccgcac cggagacccg    3180
ccaggactcc gtgcgaccaa aagactcttc gtctcacctg gtctcacaca tctctcacaa    3240
acgagagcgc acgggagcac gcgagaacct ctgacctgga cattcgctgt cgccacggac    3300
cacggcggac caggtagaca ttacataggc taggactcga ttctagtgat caagtcaaat    3360
gcccaggtca gaggctgttt ttgctgttcg ccgagggctg atatctcaca tatttattgc    3420
tggaactgcg gcacaaggtc gagatccatc ggatgaccgg gcgggtcgtc gagtgctcga    3480
tcgacgaggt ggaccgcccg cgggtatcca aggacgccgc cctgcggatc ccgccgaccg    3540
agctggaggt caggcgctgt tcatcggctg ggttggcgag ctggcgactt gccgcaagtt    3600
cgccctcacc gcgcggaact acaccgcatc gaaactgatg tcgtaggtcg ggctcggggt    3660
gagcgaggca tgcaaactcg acctggccga catcaagtgg gacctgggcc gcttcggcaa    3720
gctccatgtg cgtcacggcg agggcgcccg cggctcgggt ccgcgcgagc ggatggtgcc    3780
gctgatcaac ggcgccgacc gcatgctgcg gtggttcatc gaggacgtcc ggggccagtt    3840
cgacgacgac cgcacccgcc ccggtgcccc gctgttcccc tctgagcgca agaacgccgt    3900
cggctcctcg cgcctcgtcg gcgacgacgc gttgcgcaac ggtctggccg ccgcggcgga    3960
ggtcgcgtcc aaaaggtggt gtaaaaggcg acgagcgaaa gtttcgtact gaacagccaa    4020
gttcgtacga aaggacccac gctcgtgtag tcacgagtgt cacccatcga ggcgatccat    4080
gccgagatcg atgccgtctt cgcctagtac tgcaacggtg tttgccgtga cggttgggca    4140
ggctggtcgt tggtctgagc atgggtgggg accttgctga tgtcggggtg tgggccagtg    4200
aagtggacgc tgtgcacgag aggttcgtgc accggttttc cagggcggag ccgcgggagt    4260
cggcgcttgc ctatatgcgg ggactgaccg ctccgctgga gcggaagaac ggctggacac    4320
tggccgaaca ggccggtcat gtcgctccgg accgtattca tcgactgctg aaccggatcg    4380
agtgggaagc cgatgaggtc ctggccgatg tgcgcgacta cgtcatggag aacctcggcg    4440
accccgaggc cctcatcgtg gacgacaccg gcttcctgaa gaaggggacc cgttcggcag    4500
ggggccggcg tcagtactcc gggaccgcgg gggcctgtat ttcaattact gctcggtgaa    4560
cgggtgttgg cgggacaatg agatgtgact gcgcgcacgg ccgctcgggc ctcagttgtg    4620
gctttgaggg cgaagttcga tcagttcctt ccccatctcg atgagcggcg ccgtcggatc    4680
tacctggcca gcgaggccgc cgcgcttggc cacggcggga tcacgctggt ggccaccgct    4740
tccggcgcca gtgcggccac catcgcacgc gggatcgccg agctgtccgg gcacactctg    4800
ccggccgggc ggatccgggc tccgggagcc ggccgcaagc cggtcacggt caccgacccc    4860
ggtctgctgc ccgcgcttga agctctgatc gagccgcaca cccggggcga tccggtctcg    4920
ccattgcgct ggaccacgct ctcgctgcgg tccctggcct cggcgctgac cactcagggc    4980
cacccggtca gcgcggcgac cgtcggacgc ctgctacatg ccctgggata cagcctgcag    5040
ggcaccgcca agaccacgga aggggccagt catcccgacc gggatgctca gttcacgcac    5100
atcaacgcca ccgccgcgga cttcctcgaa gacaaccagc cggtgatcag cgtcgacacc    5160
aaggccaagg agtggctcgg caaccgcgac cgacccggac gcacctggcg accgggcaag    5220
aaccctatcc gtgtggactg ccacacgttc accaccagtg accagccagt agccatcccc    5280
tacgggatct acgacatcgc tcgcaacacc ggctgggtca acgtcgggac cgaccacgac    5340
acgggcgagt tcgcggtgga atccatccgc cgctggtggt agcagcacgg acgcggcgac    5400
cacccggacg ccggccgact gctcatcacc gccgactgcg gtggttccaa cgacccccgc    5460
cgctggacat ggaagaagca tctcgccgcc ttcgccctgg aaagcggact cgagatcacg    5520
gtctgccact tcccacccgg aacatcgaag tggaacaaga tcgaacaccg gatgttctgc    5580
cacatcaccg cgaactggcg cggcaggccc ctgaccagct accaggtcgt catcgagacc    5640
atcgccgcca cgaccactcg caccgggctc agcatcggcg ccgaactcga caccggccga    5700
tacgacctgg gcaccacagt cccacccgcc gagttccaag ccctgccaat cacaccccac    5760
accttccacg gcgactggaa ctacaccctg gcaccactcg caccccggct gcccgagccg    5820
gcaccgagcc gacaacggat cgaccccgcc ctgaccacga tgctcaccga cccggccctg    5880
accggcatgt cacgctccgc cttcgaccac ctggtcgcca tctcggaacc gtactgggac    5940
gccctggccg aggcggcatt ccaacgacgc ttccaccgcc cacgcagcta cctccacccg    6000
cagaccagca gcctcgacca ctaccaccgc ctgctgaccg ccctgttacg ccgccgcaga    6060
gccgtcacca gcacactgct ggcccagctc ctgaacgtcg gccgcaccaa cctgtccaac    6120
cagttccaag acggccaccg cctcctggac ctgcaccgca tcgcggtcac tccgctatct    6180
ggagccccgg cccgcaccct cgcccaacta caagcccgcc taccgccaca cgacgacacc    6240
cgcacagatc aactctgaca gttattcaga cacaggcccc cgggcggatc gagaactccc    6300
aggtcgccgt ctacctggtc taggcaggtg cccggggcca cgcggcggtg gaccgggaac    6360
tgtacgtgcc ccgttcctgg acctgtgacc agggccgctg cagggcggcg gggctcggcg    6420
aggacatcgt cttcgccacc aagccggagc tggcccgcac gatgatcgaa cggttcctgg    6480
acgccggaca ccacgtgggc tgggtcgctg gcgacgaggt ctacggcggc aacccgaagc    6540
tgcgatctgc gctggaggta cgcggcctcg gctatgtcct cgcggtggcc tgctcggccg    6600
aagtcaccac caaggcaggc aagttccgag ccgacacgct ggcggcgaag gtaccgaagc    6660
gggcctggca gaagctgtcg gcaggcgcgg gagccaaggg caaccgcttc tacgactggg    6720
ccgtcgtcga cctggccgag cccggccccg gccaccggca gctgctgatc cgccgcaacc    6780
gccgcaccgg tgaactggcc tactaccgat gccactccac ctcaccggtc ccgctcgcca    6840
ccctggtcag ggttgccgga tcacggtggc gggtggagga gacattccag accgagaagg    6900
gcctggccgg cctggacgag caccagctcc gccgctaccc ctcctgggcc cgctggggca    6960
ccctcgccat gctcgcccac gctttcctcg ccgtcgtccg cgccgacgaa cacacccgcc    7020
cgacccccga cgacctcatt ccgctgacct gcaacgagat ccagcacctg ttcctcgcgc    7080
tcgtcgtcca gccgctgtcc aacgtcgccc accgcctcgc ctggtccgag tggagacgac    7140
gtcatcaagc ccgatcacgc accagtcact accggcgaca agccgcaact cagacatgaa    7200
gatcacgatc tacagctgga gtattaggtc cccgaacaac aaccggggac agtcctaatg    7260
ggcgtcactt tcgtatcgaa ccagcaaaat ttggagggaa cgatattcga ctcgcatagc    7320
cttacggtcg gagcatatta cgaccaggtc aatgaattgc tccccgccat gcattctcag    7380
gcgggatgcc gtcgaggggg cgagggtctg tatgatgtcg ttgacatcgg ccgcagtggt    7440
gatggccttg agcggagtgc cgtgtccgtc acagatcagg tggtgtctgc tgccggtcct    7500
gcgccggtcg accggcgcag gaccggcgtc ggctcccccc tttcgcgcgg acatgagagc    7560
cgtccacgca cgcgcgtgac cagtcgagtt cgccggccgc gttgagttcg gcgagcggga    7620
tgcggtgcga ccctggtctg ctgccatcgt tccagccgcc gcaccgctgc tctcgcagat    7680
ccgctcgata gtccggccgg gacgctcacc gcgacacctc ttcgagggcg agggctaccc    7740
gacgccgacc ggccagcggt actgcatcaa ctcgatctcc ctgcggctga ttcccgacga    7800
gggctgagat ccgtatcgac acaccacgtc cgtggacgtg gcccacgggc gtccggtcaa    7860
gcgtgagtgt cgtggcatcg atctcctgcg cgctcagtga ccgcgcgagg cgggccggaa    7920
tcggcgagtt ggacggggtc ggggcgagcc tgcgtggctt tcttggccgt caactcgacg    7980
acgtggccgt gctgctggcc gtagccgtgt cctgcccgcc gggcgggtgg ctgtccgggg    8040
ctgcccgcct ccccgcggtc gttgccgcca ccaggccgca cgccactgag cagctgaccc    8100
ggcgcggact cgacgaggcc gccttcgtca ccgaactcgt cctgagggca ccgggtcacc    8160
aacgccttcc gttgctcccc agacctctct gggaagatca ataggggccc gtaaaggggg    8220
ggtgagggtt gaaaaagggg gggtattcaa aaataggctg agtccgctgc aaaaatcttg    8280
agaccggtcg gaacgggtgt agctgaatga ctgaatcgaa tgaattcacg tccgaagcgg    8340
tgctcagtgc ggctgatgat gcaatagcca tcatcggcat gtcttgccgg ctgccgcgag    8400
cagtcaatcc tcaggagttc tgggaactcc tgaggaatgg tgagagcggg attaccgagg    8460
tgccgcccca gcggtgggac gcgaactccc tcttcgatgc ggaacggtcc acgcccggga    8520
cgatgaatac acgctggggc gggttcatcg acggcgtgga ccagttcgac cccggcttct    8580
tcgggatctc ctcccgcgaa gcggtcgcca tggatccgca gcaacggctc gtactggagc    8640
tgagctggga ggccctggag gacgcgcgaa tcgtcccgga gcgccttcgc cacaccgcta    8700
ccggtgtctt cgtcggcgcg atctgggacg actacgcatc attgatgagc gcgcgaggcc    8760
gagaagcggt gacccatcac accgtgaccg gtacgcaccg cagcatcatt gccaaccggg    8820
tgtcgtacgc cctcggccta caggggccga gcatggcggt ggactccggg cagtcgtcgt    8880
cactggtctc cgtccatctg gcctgcgaga gcctgcgcag gggggagtcc acgctcgcgc    8940
tggccggcgg ggtgaatctc aaccttgtcc cggagagcac catcggcatg gcgaagttcg    9000
gcgggctctc ccccgatggc cgctgcttca ccttcgacac ccgcgccaac ggctacgtgc    9060
ggggtgaggg cggcggtgtg gtcgtcctca aaccgctggc ggacgcgatc gcggaccagg    9120
acccgatcta ctgcgtcatc cgtggcagcg ccgtcaacaa cgacggttcc ggtgagaacc    9180
tgaccacgcc gaactcccag gcgcaggcag ctgtgctgcg cgaggcctac cgccgcgccg    9240
gcgtggaccc ggcccaggtc cagtacgtgg aactgcacgg taccgggacc cctgtcggcg    9300
acccgattga agccgaggcc ctcggcgcgg tgatcggtgc cgcccggccg ccgggtgacc    9360
ccctgtgggt gggatcggcg aagaccaaca tcggccatct ggaggccgcc gccggcatcg    9420
ccggcctgct caaggtcgtg ctgtccatca gccaccggga gctcccggcc agtctcaact    9480
tcgccacggc caatccgcgg attccactgg actccctgaa cctgcgcgtg ggcgacgagc    9540
tcacatcgtg gccgtctgcc ggtcggccga tgctcgccgg tgtgagcgcg ttcggcatgg    9600
gcggtaccaa cgcccacgcc gtggtcgaac aatctcccgt agcagcgcgg cagattccgg    9660
ctcccggagg cacgccgacg gatcaggggg ggccggtgcc gtggttgttg tcgggtgggt    9720
cggtggcggc ggtgcggggt caggcggcgc ggttgttgtc gcatctggag ggtcggtcgg    9780
gtctgcgtgc ggtggatgtc ggctggtcgc tggccacgac tcgttccgtg ttccctcatc    9840
gtgctgttgt cgttgccgac gatggtggtt acggccagag tctcgccgcg ctggccgcgg    9900
gttccgtgga tgccggggtg gttgagggcc ttgccgatgt gagtggcaag acggtgttcg    9960
tcttccccgg tcagggttcg cagtgggtgg gtatggccgt tgagctgctg gacggctcgg    10020
aggttttcgc cgagcatatg gccgcctgcg ccagggccct ggaaccgttt gtgggctggt    10080
ccctggagga tgtcctgcgt caggtggacg gtacgtggtc actggatcgt gtggatgtgg    10140
tccagcctgt gctgtgggcg gtcatggtct cgctcgcggg actgtggcag gcacatggcg    10200
ttgagcctgc tgcggtgctg ggccactccc aaggtgagat cgctgcggct tgcgtggcgg    10260
gtgcgctgag tctggaagac ggagcccggg tggtggctct tcgcagccgc gccatcgccg    10320
aggcccttgc gggccatggc gggatgctgt cgatagccgc ccccgccacc gaagtcacgg    10380
ccctgatcac cccctggggc aggcagatca ccattgccac ggtcaacgga ccgcattcgg    10440
tggtggtcgc aggagaccct gacgcgctcg aggcactccg cggcgaactg gagacccgtg    10500
gtctccgcaa tcgtcgcatc ccggtcgact acgcctcaca cacccctcac gtcgaggcga    10560
tccgtgaacg gctcctggcc gacctggcag tgatccagcc acgtgccgcg agcattcccg    10620
tgctgtccac cgtcaccggc gcatggctcg acaccaccgt gatggacgcc gagtactggt    10680
accgcaacct acgtcagacc gtggagttcg aagcagccac ccgcactctc ctcgaccagg    10740
accaccgcta cttcgtcgag atcagcccgc accccgtact caccaccgcg atccaggaaa    10800
ccctcgacgt cacagacacc gccgccgtcg ccaccggaac cctgcgacgc aacgaaggca    10860
gcctccggcg tttccagctc gcccttgccg aactcgtcac ccgtggcctc accccgcact    10920
ggcccgccct ctatcccgac gcccgccaca cggacctccc cacctatccc ttccaacgcg    10980
agcgctactg ggtcggcagc tcctcggtgc gggacgcggc gccggctccg caaccggacc    11040
cggcaactgg gcgagcggcc ggtccggctt cgggccgggc cgccgtcgat ggcggcgacg    11100
ggcccgcgga gctgctggct ctggtgcgtg cccacgtggc cgtggtgctc ggtgagacga    11160
cgccggacag tgtcgatccg aaactgacct tcaagcagct cggcttcgac tcggtcatgt    11220
ccgtcgagct ccggaaccgg ctgagctccg ccaccggatc gtctctgccg agcacagtgc    11280
tgttcaacca ccccacgccg gaccggctcg cccgccatct gtccgccgag gcgtccagcc    11340
aggtggaagg cgcgcacgac gcggcgccga cgggtgccgc cgacgagccg atcgcgatcg    11400
tgggtatggg atgcaggtac cccggaggag tcgcgtcgcc ggaggacttg tggcggctgg    11460
tgacatccgg gggcgatgcg atctccggct tccccacgga ccgtggctgg gacctcgagg    11520
tcatgtacga cccggaccat cggcggcccg gcaccagcag tacccgcgag ggcgggttcc    11580
tgtacgaggc cggtgacttc gacgccggtt tcttcggcat cagcccgcgc gaggcgtcgg    11640
ccatggaccc gcagcagcgc ctgctgctcg agacttcctg ggaggccgtg gaacgggcgg    11700
gcatcgaccc gctgtcgctg cacggtacgc gggccggggt tttcgtcggg gccatggccc    11760
aggagtacgg cccgcgtctg gacgagggcg cggacggcta tgagggcttc ctgctgaccg    11820
gtggcctgac gagcgtgttg tccgggcggc tggcctacag cctggggttg gagggacccg    11880
cggtcaccgt ggacaccgcg tgctcgtcgt cgctggtcgc cgtgcacatg gccgcccagg    11940
ctctccgtca ggggcagtgt tccctggcgc tggcaggcgg ggtcaccgtc atgtccggcc    12000
ccgggatatt cctggagttc agcaggcaga gcggactggc accggacggc cgctgcaagg    12060
cgttcgcggc cggagctgac ggcacgggct gggccgaagg cgtcggcgtg ctggtgctgg    12120
agcggctctc cgacgcccgg cgcaacggac atccggtgct ggcggtggta cgggggtcgg    12180
cgatcaacca ggacggtgcc tcgaacggcc tgacggcacc gaacgggctc gcgcaggagc    12240
gggtgatccg tgaggccctg acggacgcag ggctgtctcc cgccgacgtc gacctggtcg    12300
aggcccacgg caccggcacc accttgggtg acccgatcga ggcgcaggcc ctgatcgcga    12360
cctacggaca gggccgtccg gcggaccggc cgctgcgact gggctcgctg aagtccaaca    12420
tcggccacgc ccaggcggca gccggagtgg gcggagtcat caagacggtg atggcggtgc    12480
ggcacgcaac catgccccag accctgcatg tcgacgcgcc gtcaccgcat gtggactggt    12540
cgtccggcca ggtccggctg ctgaccgagg cagtgccgtg gcccgagtcc gaccaccccc    12600
ggagggcggc ggtctcgtcc ttcgggatca gcggcaccaa cgctcacgtt gtcgttgagc    12660
agcccccggc ggaggtgtcc gcggtcaccg ggccatcacc tatggcgccg gacgaggccg    12720
taccggcccc ggggcagccg gtgccctggc tgctgtcggg caagtcaccg gaagcggtgc    12780
gcgagcaagc ggcgcggctg cggtcgtacc tggccgaccg gcccggcgcc ggtctcgccg    12840
acatcggctg gtccctggcg tcgacccggt cggcgttcga gcaccgtacg gtggtggtcg    12900
cggcggacca tgggcagttc cgtgaggcgc tgggcgcggc cgcggcgggt tcggcggatg    12960
cccgggtcgt cgagggcgtg gccgacatcg acggcaagac cgtcttcgtc ttccccggcc    13020
agggcgcgca gtgggccggc atggccgggg aactcctgga ctcctccgag gtgttcgccg    13080
cccggatggc cgactgcgcg cgggctttgg ccccgttcgt cggctggtcg ttgcaggatg    13140
tcgtccggca ggccgagggc gccccgccgc tggaccgggt cgacgtcgtc cagccggtgc    13200
tgtgggcggt catggtgtcg ctggccgacc tatggcgtgc tcatggcgtt gagccctcgg    13260
ccgtggtggg ccactcgcag ggtgagatcg cggccgcctg cgtcgccggt gggctgacgc    13320
tggaagacgc cgcgcgggtg gtgtcgctgc ggagccgggc catcgccgaa gtactcgccg    13380
gacacggcgg catgctgtcg gtgaccgcgg cccgggaaca ggtcgaggag tggctgctcc    13440
cctgggaggg caggatttcg ctcgcaacca tcaacggaac cgaatccgtc gtggtcgccg    13500
gcgatcccga cgcgctggcg gaattccgcg cgtggttggg gaaccgacag atccgtagcc    13560
gcaccctgcc ggtcgattac gcctctcact cggcgcaggt cgaggctgtc caccagcgac    13620
tgctggacga cctggcgccg atccgccccc gtacgtgccg taccccgctg ctgtcctcgg    13680
tcaccggcca gtggctggac accgcctcga tggacgccga gtactggtac cagaacctgc    13740
gccggaccgt ggagttcgcc gcggcgaccc gcaccttggc cgacgggggg caccgcatct    13800
tcatcgaggt gagctcgcat ccggtgctgg tcggcgcgat acgggaaacc ctcgaagccg    13860
tcgaggtcca ggccgctgtc gccgggtcac tccggcgtga cgacggaggc ctgcggcgtt    13920
tccggctctc gcttgccgcg ctcgtcaccc gggggctggc ccccgactgg tccatgctct    13980
gccccggggt gagccgaacc gacctcccca cctacccttt ccagcgcagc cgttactgga    14040
tcaccgcctt ctcggggtcg cggagcgccg gtgaactcaa cgctgcggac tcacgcttct    14100
gggaggcggt cgacagcgag gaccccgggc ggctggccga ggtgctcagc ctcgacgacg    14160
acgcgtcgct cgaaccggtc ttcctggcac tgtcctcgtg gcggcgacgg caccgggtgc    14220
ggtccaccct ggacgactgg cgttatcggg tgacctggca gccgctgccc ggggccgccg    14280
tcccgttgac ggcggcaacc ctcggaggga cctggctggt ggccgtgccc cacgaggacg    14340
cctacgtctc ccaggtgctg cgcgggctgg gcgaccgcgg cgcgaccgtg atcaccctac    14400
gagccgacga cccgcgccac ggcccgctcg ccgagcgggt ccgggaggcg ctggccggag    14460
cgggcgagat caccggcgtg ctgtcgctgc tggcgttgga cgagcggccg cacccggaac    14520
atccggtcct tcccatgggc ctggcgctca acacggcgct ggtgcgggca ctggtggaca    14580
aggacgtccg ggctccgttg tggtgcgcca cgcggggcgc ggtgtcggtg ggccgatccg    14640
accggctggg cagccctgcc caggcgatgg tgtgggggct cggcctggtg gcggccctgg    14700
aacacccgcg gcactggggc gggctggtgg atctgcccga aaccgtggac gagcgggtgc    14760
tgaaccggct ggtgaccgtg atctcgggcc aacgagtcca cggacaggga gccccgggcc    14820
aggacggcga aaacccgggc gatgaggacc agcttgcggt gcgggcgtcc ggagtgttcg    14880
cgcggcggct gtcgcacgcg cccgtgtcgg gcagccgcaa ccgggagtgg acgccccggg    14940
gcaccgtgct ggtcaccgga ggcaccggtg gcgcgggcac ccaggtggct cgctggctgg    15000
cccgtaacgg cgccgaacac ctgctgctga ccagccgtcg tggcagggac gccgaggggg    15060
ccgccgagct ggcggccgaa ctcacggaag ccggcgtcag ggtcacggtc gccgcctgcg    15120
acgtagcgga ccgggacgcc ctggcccggc tgctcgccgg cgtaccggac gagctgccgc    15180
tgaccgccgt gattcatgcc gccggtgtgg tcaccaccgc cccgctggac agcaccggtc    15240
cggaggaact ggccgaggtg ctggcgggca aggtggccgg cgccgcccat ctggacgctc    15300
tgctcggcga ccggcagttg gacgccttcg tactgttctc ctccaacgcc ggcgtgtggg    15360
gcagcggcgg gcaggcggcc tacgccgcgg ccaacgccta cctggacgcc ctggcccagc    15420
agcggtcctc tatgggccag accgcgacct cagtggcctg gggtgcctgg ggcggggccg    15480
ggatggcggc cgaggaaggg ttcaaggagc ggctgcgccg gcggggcatc atcgaaatgg    15540
acccggagct ggccgtcacg gcgctcgtgc aggccgtcga gtccggagag gcgtcgatag    15600
ccgttgccga cgtcgattgg gcacgcttcg tgcccggctt cacctcgaac cggcccagtc    15660
cgctgatcgg cgacctgcct gaggtgcggg acgcgctgcg ggaggccgac agccggcccg    15720
ccgtcgatca gggcgggtcg gcgctcgcca cgcggctggc cgggctgtcc gtgctcgaac    15780
gggagcgggt cctgctcaac ctggtgcgca ccgaggtggc ctcggtactc ggtcacacca    15840
cggccgacat ggtcgatgcc cgtcgcccct tccgtgaact cgggttcgac tcgctgatcg    15900
cggtggagtt ccgcggccgg ttgaacgccg cgaccgggct gcggctgcct acctcggtcg    15960
ccttcgacca ccccaccccg gccgagctcg ccggccatct gcgggagttg ttcgccggat    16020
cccgcggtga caccgccatg cccgtgtcgg tgaccaccgc cggggacgac gaaccgatcg    16080
ccatcgtagc gatgtcctgc cggtacccgg gcggtgtgcg cactccggag gacctgtggc    16140
ggctggtggc cgagggccgg gacgcgatca cggacttccc caccgaccgc ggctgggata    16200
tcgaaagcct gtatgacccc gacccgggcc ggtccggcac ctcctacacc cggcggggcg    16260
gcttcctcga cgacgcggcg gccttcgatc cggcgttctt ccggatctcc ccccgcgagg    16320
ccctggccat ggacccgcag cagcggctgc tcctcgaaat gacgtgggag accctcgaac    16380
gggcgctcat cgacccaaca acgctgaagg gcagccaggc cggggtgttc atcggcaccg    16440
cacaccccgg ctacggcgag ggcatccacc acgagtcgca gggcgtcgag ggccagcagc    16500
tgttcggcgg ctcggccgcc gtggccgcag gccggatcgc ctacacgttc ggcctggaag    16560
ggccggcgat gacggtggac accatgtgct cgtcctcgct ggtggcactc catctggcct    16620
gccagtccct gcgcaccggc gagtcctcga tggcgctcgc cggcggggtc acggtaatgg    16680
cacggccgac cgctttcacc gagttcagcc ggcatcgggg actgtccccc gacggacggt    16740
gcaagtcctt ctccgacgcc gccgacggca ccggctgggc cgagggcgcc ggtgtgctcc    16800
ttctcgaacg gctctccgac gcccgtcgaa acggccaccc cgtgctggcc gtcatccgcg    16860
gcagcgccat caaccaggac ggcgccagca acggccttac cgcacccaac ggcccctccc    16920
agcaacgcgt catccagcag gccctggcga acgcgtccct gtcgccggcc gacgtcgccg    16980
ccgtcgaggc ccacggcacc ggtaccaccc tgggcgaccc gatcgaggcc caggccctga    17040
tcgccgccta cggacaggac cgcccgacgg accggccgct acggctgggc tcgctgaagt    17100
ccaacatcgg ccacgcgcag tccgcagccg cagtcggcgg cgtgatcaag atggtccagg    17160
ccatccggca cggcctcctc ccgcgcacgc tgcacgcgga gcagccctcc cgccacgtgg    17220
actggtccgc cggctcggtg gaactgctca ccgaggcgat gccgtggccg gacaacgacc    17280
aaccccggcg ggcgggtgtc tcggcgttcg gcggcagcgg caccaacgcc cacatgatca    17340
tcgagcaggc gcccgcgccg gacgagccgg agcacaccga cggcacgagc aggaccagcg    17400
gcgagagcgg cgccgaacag gccaggccgc tgccgatggt gccctgggtg ctgtccgcgc    17460
ggagtgacac cgcgctgcgg gcacaggccc ggcgcctgcg cgcctacgcg gccgccgccg    17520
aggcgggcag catctgcgac atcgggtggg cgctggcgac cacccgagcc acgctggacg    17580
accgggccgt ggtcgtggcc gcggaacggg aaggattcct caccgctctc gacgcgctgg    17640
ccgaggaccg gaccgccccc ggtctggtcc ggggggcggc tggaacagga gtgcggtcgg    17700
cattcctgtt ctccggccag ggctcacaaa gactcggcat ggggcgcgag ctgtacgaca    17760
cgtccctcgt gttcgccgag gcgctggacg aggtgtgcgc ccagctcgac gggcacctgg    17820
accggcccct cctgcgggtg ctgttcgcgg cggagggttc cgacgacgcg tcgatgctgg    17880
accagaccgc cttcacccag gccgcgttgt tcgcggtcga ggtggcgctg ttccgcctcg    17940
tctggtcctg gggcctgcgg cccgatttcc tcatcgggca ttccgtgggc gaagtcgcgg    18000
ccgcccatgt ctcgggcgtg ctgtccctcg ccgacgccgc gacactggtg gtcgcccgcg    18060
gtcggctgat gcaggcgttg ccctccggcg gcgcgatggt ggccttgcaa gcgggtgagg    18120
aggaagtacg gctgtccctg gcgggactgg aggacgttgt cggcgtcgcc gccctcaacg    18180
gccccgcctc gaccgtgatc tctggcgacg aggaggccgt cctcccggtg gccgcgcact    18240
ggcgcgcgca gggccgcaag acgcgtcgcc tcaaggtgag ccacgccttc cactcacccc    18300
gtatggaacc catgttgcac cggttccacg ccgtgctcaa aacgctttcc ttcgccgagc    18360
cggccattcc cgtggtctcg aatgtgaccg gccgtcccgc cgagcggacc gaactgtgcg    18420
cggcggacta ctgggtgcgc catgtccggc atacggtgcg cttccatgac ggcatccgcg    18480
cgctggaggc cgaaggcgtc agcgcattcc tggagttggg gcccgacggc acactctcgg    18540
cgatggtccg cgactgcctg gacaccagcc gcccggtggt cacggcaccg gttttgcgac    18600
gtgaccgtac cgatgtgtct gccgcgttga cggcactggc cgaagcgcac gggcacgggg    18660
tgccggtgga ctgggcgtcg ctcttcgccg gctcgaccgc ccgggcggtc gagctgccga    18720
cgtacccgtt ccagcgggaa cacttctggc tggattccgt cacgggcagc agtgacatga    18780
gcacggccgg actggcgtcc cccgatcatc cgctgttggg agccgtgacg acggtggccg    18840
gcgaggacgg cctcctcttc accggcaacc tgtcggtacg gacgcaccca tggctggccg    18900
accacaggat caccggttcg gtcctgctgc ccggcacggc gttcctggaa ctggccgtcc    18960
aggccgggga ccaggccggc tgcgggcggg tcgaggacct gacgctgctg gctccgctcg    19020
tactgcccga agagggcagc gtcagggtcc agatgaaggt gggggagccc gacgccacgg    19080
gccgccgcac catcgaggtg tactcctcgg accagcaggc ccccggccgg gaacgctggg    19140
tcctcaacgc gagcgggatg cttgccggcg aaccggtgga ggccccgccg agtctcacca    19200
cctggccccc ggaaggcgct gtccccgttc cgctggacgg cttccacgac cggctggcgg    19260
cacgcggcta cggctacggc ccgacattcc gcgggctgag cgccgcgtgg tcacgcggtg    19320
acgagatctt cgccgaagcg gcgctcccct cgggccatcg gcaggatgcc gcccgctatg    19380
gactccaccc cgccctactc gacgctgccc tgcacgccat ggaactccgg gaaccccgcc    19440
cggccggcga cggagtccgg cttccgttcg cctggaacgg cttctccctg cacgcgtcgg    19500
gtgccgaagc ggtacggctg cgcctcgcgc cgacgggcgc cgacgctctg tcggtgaccc    19560
tcgccgatgc catcggtcgc ccggttgcct cagcccgctc gctggccctg cgggagctct    19620
cgtccgacct gctgcgcccg gcgtccgtct cgtacgggga ctcgctgttc cgcaccgctt    19680
ggatacccgc cctcgtcggc ccggaggcgg agtccgggcc ggtgcgaccg tccgccggct    19740
gggcggtgct gggccccgat ccgctcggcg cggccaacgc cctgaacctc acgggaacct    19800
cctgctcctg ctatccggac ctggcggcgc tgatcgcggc cgtcgacggc ggagccgcgg    19860
tgcccgaggc cgtactcgcg ccgtacgcgg cggagccagc cccggacgcg ggatctcccg    19920
cggacgccgt acgggcctcg accggccggg cgctgcaact gctgcaatcc tggctgtccg    19980
aggaccggtt ggagcgaagc cggctgatcg tgctcacccg gggggcggtg gccgtcggta    20040
cggacgaagg cgtcaccgac ctggtgagtg cgtcggtccg gggtctggtc cgttcggcgc    20100
aggccgagca ccctggcagg ttctccctgg tcgacatcga cgaccgggag gagtcctggg    20160
ccgtcctgag cgcggcggcg gtatccgatg agccacaact cgccctgcgc tgcggccaga    20220
tgaaggtgcc ccgcctcggc tccgtcgacg ttcccacgac cggtatgcct gagatgcccg    20280
acgtttgggg tgttgacggt accgtgttga tcactggcgg gaccggtgtg ctgggtgggc    20340
tcgtcgcccg tcatctggtc gccgggcatg gggtccgtcg tctgttgctc tgcagcaggc    20400
ggggccctga tgcgccgggt gcggtggagc tggtcgccga gctcaccgct ctgggtgcgg    20460
atgtcaccgt tgccgcctgc gacgcggccg accgggatgc gctggccgcg ctcttggaca    20520
ccgttcccgc cacgcaccct ctgactggtg tcgtgcatac cgctggtgtc atcgatgacg    20580
ccactgtcac caccctcact cccgagcgca tcgacgcggt cctacgcccc aaggtcgacg    20640
ccgcgctcaa cctccatcag ctgacggcgc atctcggctt gacccgcttt gtgctcttct    20700
cctccgccgc cgggctcttc ggcggcgcgg gccagggtaa ctacgcggcc gccaacgcct    20760
tcctcgacgc actggcccaa caccggcggg ccaacggcct caatgcccag tccctggcgt    20820
ggggactgtg ggcggaagcc agcgggatga ccgggcacct ggacgcggcc gacctcgccc    20880
gggtggcccg ttccggcctc accgcgatgc ccaccgggga cgggctggcg ctgctcgaca    20940
ccgctcagcg ggtggacgaa gccaccctgg tcacggccgc gctggacacc cgggccctgc    21000
atgcccgggc cgcagacggc acgctgccgg cgctgttcca cgcactcgtg cccgtaccgc    21060
gccgatccgc gacctccccg gcggcccagg ccgcggggcc ggatggactc cgccagcggt    21120
tgtcggggtt ggtcgagggg gagcgtcgag cggcgctgct ggatttggtg tgtggtcatg    21180
tcgcgagggt gctggggcac gcggacccga gcagcattga ggagacccgg cccttcaagg    21240
acaccggctt cgactcattg accgctgtgg agctgcgcaa tgtgctgcac ggtgcgaccg    21300
ggttgcggct gccggccacg ctggtcttcg actacccgac gcctgcagct ctcaccgatc    21360
acctctacga cgagcttctg ggttcccgcg aggacgccgt gctcgccccg atcaccaggg    21420
ccgcgtacga cgagccgatc gcgatcgtgg ggatggcctg ccgctatccg ggcggggtgg    21480
agtccccgga ggacctgtgg cagctggtcg ccgacggccg tgacgccatc tccgacttcc    21540
ccgccgaccg gggctggaac gtcgagagcc tctaccaccc cgaccccgac caccccggca    21600
ccagctacac ccgtgccgga ggcttcctgc acgacgcggc ggacttcgac ccggagttct    21660
tcgggatctc accgcgtgag gcactggcca ccgaccccca gcagcgactg ctgctggaga    21720
cgacgtggga ggccttcgaa cacgccgggg tcggcccggc gtcactgcgt ggcagccgga    21780
ccggcgtctt cgtcggcgtg atgtacaacg actacgcctc gcgtatccgg cacatcccag    21840
agagcgtcga gggcggtctg accaccaaca gcgcggggag tgtggcgtcg ggccgggtct    21900
cgtacacgtt cggtctggag ggaccggccg tcacggtgga taccgcgtgt tcgtcgtcgc    21960
tggtggcgtt gcatctggcc gcgcaggcgt tgcgcaacgg tgagtgcact ctggctctgg    22020
cgggcggtgt tgcggtgatg tccactcctg ccacgtttgt cgagttcagc cggcagcggg    22080
ggctggcagc tgatgggcgg tgcaaagcct tcgcggacgc tgccgacggc accggctggg    22140
gcgaaggcgt cggtgtgctg ctggtggagc gtttgtcgga cgcgcgccgc aacgggcatc    22200
cggtgctggc ggtcgtttcg ggcagtgctg tcaaccagga cggggccagc aatggtctga    22260
cggcgcccaa tggtccttcg cagcaacggg tgatccaaca ggcgctggcc aatgcggggt    22320
tggcgggggc ggatgtcgat gccgtggagg cgcacggcac gggaacccgg ctgggcgacc    22380
cgatcgaggc gcaagcgttg atcgccacct acggacaggc ccggtcggcg gaccggccgt    22440
tgtggctggg ttcgctgaag tccaacatcg gtcacaccca ggccgccgcg ggcgtcgccg    22500
gcgtcatcaa aatggtgcag gcgatgcagc acgggactct gccgcccacc ctgcacatcg    22560
accagcccac gggccaggtc gactgggcta cgggtgcagt ggagctgctg accgaggccg    22620
tgccctggcc ggacagtgac cggccccgcc gggtggctgt ctcctcgttc ggtgtcagcg    22680
gtaccaacgc ccacgtcatc atcgaacaca ccccacacac cccacacacc acccgcacct    22740
cccaatcctc ccaatccccc caggccccgc agactgtgca ggcccatcgg ccggtgccgt    22800
ggctgctgtc ggcgaagacc tcgcaggccc tggccgcgca ggcccggcgc ctgtcagctc    22860
acttgcgagc caaccccgat ctgcgttcgg ctgatgtggc gcattccctg ctcaccacgc    22920
ggtctgtcca cgccgagcgc gccgtcttca tcgccggtga ccgggatgag gctcttgccg    22980
ccctggacgc actggccgac ggcacccctg cccctcacct cgttcagggc cttgccgatg    23040
tgagtggcaa gacggtgttc gtcttccccg gtcagggttc gcagtgggtg ggtatggccg    23100
ttgagctgct ggacggctcg gaggttttcg ccgagcatat ggccgcctgc gccagggccc    23160
tggaaccgtt tgtggactgg tccctggagg acgtcctacg ccagacggac ggtacgtggc    23220
cactggaacg cgtcgaagtg gtccagcccg tgctgtgggc ggtcatggtc tcgctcgcgg    23280
gactgtggca ggcacatggc gttgagcctg ctgcggtgct gggccactcc caaggtgaga    23340
tcgctgcggc ttgcgtggcg ggagccctga gtctggaaga cggagcccgc gttgtcgcgc    23400
ttcgcagcca agccatcgcc gaaaccctcg caggacacgg cggaatgctc tcaatcgccg    23460
cccccgccac cgacatcgca cccctgatcg cccgctggaa cgagcggatc tccatcgcca    23520
cggtcaacgg accgcattcg gtggtggtcg caggagaccc tgacgcgctc gaggcactcc    23580
gcggcgaact ggagacccgt ggtctccgca atcgtcgcat cccggtcgac tacgcctcac    23640
acacccctca cgtcgaggcg atccgtgaac ggctcctggc cgacctggca gtgatccagc    23700
cacgtgccgc gagcattccc gtgctgtcca ccgtcaccgg cgcatggctc gacaccaccg    23760
tgatggacgc cgagtactgg taccgcaacc tacgtcagac cgtggagttc gaagcagcca    23820
cccgcactct cctcgaccag gaccaccgct acttcgtcga gatcagcccg caccccgtac    23880
tcaccatcgg tctacagcag accatcgagg aaaccaccgc tccggcccgg accctctcca    23940
ccctccgacg caacgaaggc accctccggc acctgttcac ttccctcgcc caggcccacg    24000
cccacggcct gaccatcgac tggacccccg ccttcaccca caccgagccc cgcaccaccc    24060
ccctgcccac ctaccccttc caacacgaac gctactggct ggaggacgga gctccgaagt    24120
ccggggacgt ggcttcggcc ggactcggct cggcggacca tccgctgctg ggcgccgctg    24180
tgccgctgcc cgattccggg ggcttcctgt tcaccggcca gttgtcgctg cggagtcacc    24240
cctggttcgc cgaccacgcg gtacacggca ccgtgctgct gccgggcacc gcgttcgtgg    24300
aactggcgct ccaggccggt ggccgtctcg gctgcgggct gctggaggaa ctcaccctgg    24360
aggcaccgct ggtgctgccg gaaaacagct ccgtccagct ccaactcgtg gtgaacgccc    24420
cggacgccca ggacgactcg ggcggcagga ccttcagcgt gtactcgcgc ccgcaggacc    24480
gtactgcgga cgcgccctgg gtgcggcacg ccaccggagt ggtccggtcc ggaggcgcgc    24540
cggagccgga gggactgacc gtgtggccgc cgaccggagc ggtcgcggtg ccggtcgagg    24600
acttctacca ggtgctcggt gaccgtggct atgactacgg acctgcgttc cgtggggtaa    24660
gggccgcgtg gcgccacggt gacgtggtgt atgccgaggc cgcactggcc gaggagcagc    24720
agtcggacgc cgcgctgttc cacctccacc cggccctgct cgactcggcg ctgcacggga    24780
tgggactgat gccctcggcg agcgcggagc agacccggct gccgttcgcg tggcgcggtg    24840
tgacgctgca tgcggtgggg gcgtcggccc ttcgggtgag tcttaggccc gccgggcccg    24900
acacggtgga ggtcctactg gccgatggcg caggtcggcc ggtcgcttcg gccgacgcac    24960
tggtggtccg gccgctccga caggaggaac tggcggtctg gcaggacgcg taccgcgact    25020
ggctgtaccg ggtcgactgg cccgagttgc cggaggtccc cctggtggct ccggccgggc    25080
catgggccgt cctgggcggg aacgccggcg ggatactcgg caccgatggc tcggccgggt    25140
tgctggccgg ggtcccgatc gacgcctatc gggacctggc ggagctgcgc gaccggacgg    25200
gcccgagcag cgcgttcccg gccgtggtgg tcgcgccggt cgccacggga accggtgccg    25260
cgccggacgc ggtgcgggag gtgacgtacc aggtgctgga catgatccag tcatggctcg    25320
ccgacgatcg ttccgcctcg tcgacccttc tcctggtgac ccgcggcgcg gtgtccaccg    25380
gcttcgggga cgacctggtc gatctggggc aggcggcggt atgggggttg gtgagggccg    25440
cgcagtcgga gaacccggac cgcttcgtcc tcctcgacct cgacgggagc gagccggtcg    25500
ggcctctccc gacggcggcg ctgctctccg gggagccgca actggcgttc cgggagggca    25560
aggtgctgac cgcccggctg gaccgggtgt cgtccgacgc gggaacgctg ctgccgcccg    25620
ccgggccgga cccgtggcga ctcgacgtca ccagccgggg cacgctcgac aacctcgcgc    25680
tcctcgcggc gccgcaggtg tcggcgccgc tcgccgaggg acaggtccgg gtcgcggtgc    25740
acgcggccgg cctgaacttc cgcgatgtgc tggtcgctct gggcatgtac ccgggtgagg    25800
gttcgatggg cagcgaaggc gccggcgtgg tgctggaggt cgggcccggc gttgagcggc    25860
tggccccggg cgaccgggtg atgggcatgc tcgcgggcgg cttcttcggg ccggtcgccg    25920
taaccgacca gcgcatggtg accaagcttc cggacggctg gtcgttcacc gagggcgcat    25980
cggtaccgat cgtcttcctc accgcgtact acggactggt cgacctgggc ggcctgcgcg    26040
ccggccagtc gctgctggtg catgcggcga ccggtggtgt gggaatggcg gctacgcagc    26100
tggcccggca cctcggcgct gaggtgttcg gcacggcgag ccccggcaag tgggaggcgc    26160
tgcgggggat gggattggac gaggagcaca tcgcctcgtc gcgggacctg gacttcgaga    26220
agaagttctc ggccgcgacc ggtggccgcg gtgtcgacgt ggtgctgaac tcgctggccc    26280
gggagttcgt ggacgcgtcg ctgcggctgc tgccgcgcgg cggtcgattc gtggagatgg    26340
gcaagaccga catccgtgac gccgaggcgg ttgccgccgg gcatcccggc gtcgtctacc    26400
gggccttcga cctgctggac gccgcggggc cggaccgtat ccaggagatg ctggccgagt    26460
tgctcgcgct cttcgaggcg ggggtgatcg agccgctgcc gctgacgacc tgggacatcc    26520
ggcgtgcccc ggaggcgctg cggcacctga gccaggcacg gcacatcggc aagatggtct    26580
tcaccctgcc gcccgccccg gacccggacg gtacgttcct gatcacgggt gtgcccggag    26640
cgctgggcaa cctggtcgcc cgccatctgg tgaccgaggg tggcatacgg aacctgctgc    26700
tcgtcagccg ccgggggccg gcggcccccg gcgcggaggg gctggccacc gagctggccg    26760
ggctgggggc gacggtgacc ctggcggcct gtgacgtggc cgaccgccag gccctggccg    26820
ggctgctcgc cgacatcccg gcggagcatc cgctgacggg tgtggtgcac gccgccggtg    26880
tgctggacga cgggatcgtg gcatccctga cccgcgaacg gctggacgcg gtctaccgcc    26940
ccaaggtgga cgccgcctgg aacctgcacg agctgaccaa ggacagcggc ctggccgcgt    27000
tcgtactgtt ctcctcggcc gccgcgacgc tcggcagcgc aggccagggc aactatgcag    27060
cggccaacgc cttcctcgac gccttggccc aattccgcca ggcccagggc ctggcggcca    27120
gctccctcgg ctggggattc tgggccgaga gcggtgagat gaccggtcac ctgggggcct    27180
ccgacctggc acggatggca cgttcgggca tcgccgccct gacggtcgag cagggcctgg    27240
ccctgttcga ctccgcacgg tcgggtgtct gtgcgtcagt gctgccggta cggctggaac    27300
tcaccgggcc cggtgcgcgg gccgggtcgg gaacggtgcc ggcgctgatg cgggggctgg    27360
tgcgggcacc ggcccggcgg gtggtggaaa caaccacggg cggtgccgtc acaggcctgc    27420
gccaacggct ggcgccgctg tccggcgcgg accgcgaccg cgccctccaa gagctggtgt    27480
gctcgcatgc ggccaccgtg ctggggcaca gccgttccgg atcggtgccc gcgcagcggg    27540
cgttcaagga gctcggcttc gattcgctga cagccgtcga gttgcgcaac cggctcaacg    27600
tggcgaccgg cctccggctc cccgcgactc tggtgttcga ccacccgacc ccgctggcga    27660
tggcggaaca gctccggaag gagctgttcg cggacgagat cccggtggcg ccgcaggttt    27720
tggaggaact ggaccgtctg gaggcggcgt tcgccgtctc ctccgccggc gacctccagc    27780
agtcgggagc cgcggcacgg ctgagggcac tgctgaggcg gatcggcacc gtcactccgg    27840
cgggagggga cgctgccgac ggcctcgccg tagagctcga aacagccacc cacgacgaga    27900
tcttcgccct tatcgacgag gaggtagggg acgtgtgacc ggtcggtcgc tcccccctca    27960
cccctacccc ccgcccggac tagcagcatg gatgagatca cgatgactga tgagaccgct    28020
gtgcccaaaa cagagaccac cgaggagaag ctcttctcct acctgaagaa ggccacctcc    28080
gaactccagc agagccgccg ccgggtggca gagctggagg cggcggaggc ggagcccatc    28140
gcgatcgtgg gcacggcctg ccggtacccg ggtggagtac gttccccgga ggacctgtgg    28200
cggttggtcg cggaggggca gcacgcgatc tccagcttcc cgacggaccg cggctgggat    28260
ctcgaagacc tctacgaccc ggacccggac cggcccggca agtcctacgc ccgggacggc    28320
ggcttcctcg acggtgccgc ccagttcgac gcggcgttct tcgggatctc gccacgtgag    28380
gcgctggcca tggacccgca gcagaggctg ctgctcgaga cgacgtggga ggtcttcgag    28440
cgcgccggga tcgacccgac atcgctccgt ggcagccgga ccggggtgtt cgccggcatc    28500
agccaccagg actacgctgc cggacagcgc ccgtcggccg aggtctccga ggggcacctg    28560
atgaccggca ccgcggtcag cgtggtgtcc gggcgggtcg cctatgcctt cggcctggaa    28620
gggccggcca tgacggtgga cacggcctgc tcctcgtcgc tggtggcgtt gcacctggcc    28680
gcgcaggcgt tgcgcaatgg tgagtgcacg ctggcggtgg ccggcggcgt caccgtcatg    28740
gccacgccgg gcgccttcac caggttcagc cgggagcggg gcctggcccc ggacgggcgc    28800
tgcaaggcct tcagctcgga cgccgacggc accggcttca gcgagggtgt gggtgtgctg    28860
ctggtggagc gtttgtcgga cgcgcgccgc aacgggcatc cggtgctggc ggtcgtttcg    28920
ggcagtgctg tcaaccagga cggggccagc aatggtctga cggcgcccaa tggtccttcg    28980
cagcaacggg tgatccaaca ggcgctggcc aatgcggggt tggcgggggc ggatgtcgat    29040
gccgtggagg cgcacggcac gggaacccgg ctgggtgacc cgatcgaggc gcaggcgttg    29100
atcgcgacgt atggacaggc ccggtcggcg gaccggccgt tgtggctggg ttcgctgaag    29160
tccaacatcg gccacaccca ggccgccgcg ggcgtcgccg gcgtcatcaa gatgatccag    29220
gccatgggtc acgggacgct gccccgtacg ctgcatgtca accagccctc gccccaggtc    29280
gactgggcgg caggcgcggt ggagctactg accgaagcca tgccctggcc cgagggtgac    29340
cggccccgcc gggccggaat ctcctccttc ggaatcagcg gtaccaacgc ccacgtcatc    29400
atcgaacagg gggccccgcc acggacagcg tccgaccccg gtgaaagtcg tgctgacgag    29460
cccggcgtac ggggcggcgc tcccgtccct gccaccacgg agtcggccac cgaaccgcag    29520
ccggttccct ggctgctgtc cgggcacagc gcgaccgcgc tgcgggcgca ggcggatcgc    29580
ttgaagtcgt acgcggccaa caacaccggc atccgtccgg ccgacatcgg cttctcgctg    29640
gtcaccaccc gggccgcgct ggaacaccgc gctgtcgtcg tggcagccga ccatgccggt    29700
ttcacggctg gtctcgacgc gctggccgag ggccggacag ctcccggagt ggtgagcgga    29760
acggtcgtcg ccggtgcccg gagcgcgttc ctcttctccg gtcagggctc gcagcgggtc    29820
ggcatggggc gcgagctcca gcaggcgttc ccggttttcg ccgaggcttt cgaagcagtc    29880
tgcgcccagg tcgacccgta cctggagcac ccacttctcg atgtcgtact cgccgcgccg    29940
gacagcgact tcggcgcgtt gctccatcag accgcctaca cgcagccggc actgttcgcc    30000
ctcgaagtgg ccctgttccg gctggtcgaa tcctggggtg tcaggccgga ttacgttgcc    30060
gggcattcgg tcggtgagat cgcggcggcc catgtggcgg gggtgttctc gctggaggat    30120
gcggctcgtc tggtggtggc gcgcggacag ttgatgcagg cgttgccggc tgaaggcgcg    30180
atggtggcgc tccaggtgtc cgaggacgag gtcctgccgt ccctgactcc ttggctggag    30240
caggaccggg tggatgtcgc ggcggtcaac ggcgcagcat ccacagtggt gtcgggcgat    30300
gaggaggcgg tcctggcggt tgccgagcac tggcaggcgc ggggccgcaa ggttcgtcgg    30360
ctcactgtca gccatgcctt ccactcacct cgtatggacc cgatgctcga ccagttccgt    30420
gtggtcgtgg agggtatccg tttcgcggag ccggccatcc cggtcgtctc cagcgtcacc    30480
ggtcgtcttg ccgagcccgg gcagttgacc actgcggact actgggtgcg ccacgtccgt    30540
caaacggtcc gcttccacga cgccctccag accctccaga ccgagaatgt gaccgcgttt    30600
ctggagatcg gtcccgacgg gcaactctcg gcaatgaccc gcgacttcct gaccgatacc    30660
ggggcccacg ccgccgtcgc acccctcctg cggcgcgaac gtcccgaggc acccagcgcg    30720
ctcaccgcaa tcgccgggct gcacacccac ggcgtctcga tcgactggcg cacgtacttc    30780
accagcacca gcaccagcac cagcaccagc accggtaccg gtaccggtac ggggcaggcc    30840
actgccgaca cgcccgtcca gctgcccacg tacgccttcc agcaccagtc cttctggctc    30900
ggccccacgg cccctgtcgg cgacgtcagc accgccgggc tcacctcgcc cgaccacccc    30960
ctgctcagcg cagccaccac caccgctgtc gacggcagcc tcctgctcac cggcaggctg    31020
tcgcagcggt cgcccgcgtg gatcggcgac caccgcatcg gcggtgtggt cctgctgcca    31080
ggcaccgctc tcgtggaact cgtcgtacgc gccggggacc aggccggttg cagccgcatc    31140
gacgaactca tcatgctcac gccgctgacg ctgcccgagc atggtgccgt gcggatccag    31200
gtcgccgtcg gcggcccggc ccacgacggc cgccgcccgg tgcacatcca ctccagcacc    31260
tcggacacga ccggcgacga acagtggacc ctcaacgcca gcggtctgct caccgtcgag    31320
atgaccgatc cgcccgccga tctcaccccc tggccgccgc agcacgccac ccgcataccg    31380
ctcgacggcc tctacgagcg gctcgccgaa agcggctacg gatacggccc ggtcttccag    31440
ggcctgcgcg ctgcctggac actcggcgac gacacctacg ccgaggtcga gatccccgcc    31500
ggcgaccaga ccgacaccga ccgctacgaa ctccaccccg cgctcctcga cgccgcgctg    31560
cacgcgtcct ccctccaggg cgacgaggcc ggggccgggc agctgctgcc gttcgcctgg    31620
accggggtgt cgctgtacgc ggccggcgcc tcggccctgc tcgtcaaggt gtcccgtacc    31680
ggtccggaca ccatggcgct gctcgtggcc gacaccgagg gccacccggt cgccaccgtc    31740
gactcactga ctgtccggcc gatggccatc gaccagaccg cccggagcac cagccaccct    31800
gacgcgctgt tcaccgtggg gctggagtgg gcccaagccc gggagggcaa ccggaccatc    31860
cccctgtccg actgcgccat gctggctccg gacgaaccgg acctcacctc cgccccggcc    31920
tggcccgggt cctccgcgca gcggtacgcc ggcctcgcgg cgctcgctga gatctgcgga    31980
acggacgggc cggtacctgc cgtggtactg gcgcccttcc tccccggcga tgccgcgccc    32040
gccgacaccg ccgccgcgac gcacgcgacg acgcgccgcg ccgccgctct catcaagggc    32100
tggctgggcg acgaccgttt caccgactcg cgtctggtct tcgtcacccg tggcgcggtg    32160
gccaccagcg gccgggacga actgcacgac ctggaacact ccacggtctg gggtctggtc    32220
cggtcggccc agaccgagaa ccccggcagg ttcgcgctgc tcgatctcga cgacccggac    32280
accgtcaccg aactgccgga agccatcctg gccgatcagg cacagctggt cctgcgggac    32340
gggcggctgg gaaacctccg gctggccaag ggcgctgcga tacaggatcc cgacccgggt    32400
tggggtgttg acggtaccgt gttgatcact ggcgggaccg gtgtgctggg tgggctcgtc    32460
gcccgtcatc tggtcgccgg gcatggggtc cgtcgtctgt tgctctgcag caggcggggc    32520
cctgatgcgc cgggtgcggt ggagctggtc gccgagctca ccgctctggg tgcggatgtc    32580
accgttgccg cctgcgacgc ggctgaccgg gatgcgctgg ccgcgctctt ggacaccgtt    32640
cccgccacgc accctctgac tggtgtcgtg cataccgctg gtgtcatcga tgacgccact    32700
gtcaccaccc tcactcccga gcgcatcgac gcggtcctac gccccaaggt cgacgccgcg    32760
ctcaacctcc atcagctgac ggcgcatctc ggcttgaccc gctttgtgct cttctcctcc    32820
gccgccgggc tcttcggcgg cgcgggccag ggtaactacg cggccgccaa cgccttcctc    32880
gacgcactgg cgcagctgcg gaagcggcag ggactgccgg gcgtgtcgct ggcctggggt    32940
gcctgggtcc aggacggcgg aatgaccgca acgctggacg cgggcgacgt cgagcggatg    33000
gcgcgcggcg gtgtgctgcc gctcagccac gagcagggcc tgaacctgtt cgacctggca    33060
gtggcagggt ccgagccgct ggtggcaccg atgcggctgg acaccaccgc gctgcgcgag    33120
tccggtgcca ccgtgccgga gatgctgcgc gggttggtgc gtgagcggtc acgccgccgg    33180
gtcggaccct cgcacacgac gtccgccgcc atggcgctgg aacaacggtt gtcggggttg    33240
gtcgaggggg agcgtcgagc ggcgctgctg gatttggtgt gtggtcatgt cgcgagggtg    33300
ctggggcacg cggacccgag cagcattgag gagacccggc ccttcaagga caccggcttc    33360
gactcattga ccgctgtgga gctgcgcaat gtgctgcacg gtgcgaccgg gttgcggctg    33420
ccggccacgc tggtcttcga ctacccgacg cctgcagctc tcaccgatca cctctacgac    33480
gagcttctgg gttcccgcga ggacgccgtg ctcgccccga tcaccagggc cgcgtacgac    33540
gagccgatcg ccatcgtagc gatgtcctgc cggtacccgg gcggtgtctg cactccggag    33600
gacctgtggc ggctggtggc cgagggccgg gacacgatca cggacttccc ggacgaccgc    33660
ggctgggata tcgacgccct gtatgacccc gacccgggcc accccggcac ctcctacacc    33720
cggcggggcg gcttcctgtc cgacgcggcg ggtttcgatc cggcgttctt ccggatctcc    33780
ccccgcgagg cgctggccat ggacccgcag cagcggctgc tgctcgaaat gacgtgggag    33840
atgttcgaac gggcgctcat cgacccaaca acgctgaagg gcagccaggc cggggtgttc    33900
atcggcaccg ccggccccgg ctacggcggc cgcatccacc acgagtcgca gggcgtcgag    33960
ggccagcagc tgttcggcgg ctcggccgcc gtgacctcag gccggatctc gtacacgttc    34020
ggcctggaag ggccggcgat gacggtggac accatgtgct cgtcctcgct ggtggccctg    34080
cacctggccg tccagtccct gcgcaacggc gagtcctcga tggcgctcgc cggcggggtc    34140
acggtgatgt cccggccggc cgcgttcacc gagttcagcc ggcagcgggg gctgtccccc    34200
gacgggcggt gcaagtcgtt cgccgacgcg gccgacggca ccggctgggg cgagggcgcc    34260
ggcgtgctcc tcctcgagcg gctctccgac gcccgtcgca acggccaccc ggtgctggcc    34320
gtcatccgcg gcagcgccgt caaccaggac ggcgccagca acggcctcac ggcacccaac    34380
ggcccctcgc agcaacgcgt catccgccag gccctggcga acgcgtccct gtcgccggcc    34440
gacgtcgacg ccgtcgaggc ccacggcacc gggacccccc tgggcgaccc gatcgaggcg    34500
caggccctga tcgccaccta cggacaggac cgcccggcgg accggccgct gcggctgggc    34560
tcggtgaagt ccaacatcgc ccacgcgcag gccgcagccg cagtcggcgg cgtcatcaag    34620
atggtccagg cgatccggca cggcctcctc ccgaagaccc tgcacgtgga gcagccctcc    34680
cgccacgtcg actggtccgc cggctcggtg gagctgctca ccgaggcgat gccgtggccg    34740
gagaccgacc aaccccggcg ggccggtgtc tcggcgttcg gcggcagcgg caccaacgcc    34800
cacatgatca tcgagcaggc gcccgcgccg gacgaggagc acaccgacgg cacgagcagg    34860
accagcggcg agagcggcgc cgaacaggcc aggccgctgc cgatggtgcc ctggctgctg    34920
tcggcgaaga cctcgcaggc cctggccgcg caggcccggc gcctgtcagc tcacttgcga    34980
gccaaccccg atctgcgttc ggctgatgtg gcgcattccc tgctcaccac gcggtctgtc    35040
cacgccgagc gcgccgtctt catcgccggt gaccgggatg aggctcttgc cgccctggac    35100
gcactggccg acggcacccc tgcccctcac ctcgttcagg gccttgccga tgtgagtggc    35160
aagacggtgt tcgtcttccc cggtcagggt tcgcagtggg tgggtatggc cgttgagctg    35220
ctggacggct cggaggtttt cgccgagcat atggccgcct gcgccagggc cctggaaccg    35280
tttgtggact ggtccctgga ggacgtccta cgccagacgg acggtacgtg gccactggaa    35340
cgcgtcgaag tggtccagcc cgtgctgtgg gcggtcatgg tctcgctcgc gggactgtgg    35400
caggcacatg gcgttgagcc tgctgcggtg ctgggccact cccaaggtga gatcgctgcg    35460
gcttgcgtgg cgggagccct gagtctggaa gacggagccc gcgttgtcgc gcttcgcagc    35520
caagccatcg ccgaaaccct cgcaggacac ggcggaatgc tctcaatcgc cgcccccgcc    35580
accgacatcg cacccctgat cgcccgctgg aacgagcgga tctccatcgc cacggtcaac    35640
ggaccgcatt cggtggtggt cgcaggagac cctgacgcgc tcgaggcact ccgcggcgaa    35700
ctggagaccc gtggtctccg caatcgtcgc atcccggtcg actacgcctc acacacccct    35760
cacgtcgagg cgatccgtga acggctcctg gccgacctgg cagtgatcca gccacgtgcc    35820
gcgagcattc ccgtgctgtc caccgtcacc ggcgcatggc tcgacaccac cgtgatggac    35880
gccgagtact ggtaccgcaa cctacgtcag accgtggagt tcgaagcagc cacccgcact    35940
ctcctcgacc aggaccaccg ctacttcgtc gagatcagcc cgcaccccgt actctcggcg    36000
atggtccgcg actgcctgga caccagccgc ccggtggtca cggcacccac cctccgacgt    36060
gaccgtaccg atgccactgc cgcgttgacg gcactggccg aagcgcacgg gcacggggtg    36120
ccggtcgact gggcgtcgct cttcgccggc tcgaccgccc gggcggtcca cctgccgacg    36180
taccccttcc agcggcaaca ctactggctg gattccggta cgggcagcag tgacatgagc    36240
acggccggac tggcgtcccc cgatcatccg ctgttgggag ccgtgacgac ggtggccggc    36300
gaggacggcc acctcttcac cggccggctg tcggtacgga cgcacccatg gctggccgac    36360
caccagatca ccggttcggt cctgttgccg ggcacggcct tcgtcgaact ggccgtccgg    36420
gccggggacc aggccggctg cgggcgggtc gaggagctga cgctgctggc tccgctcgta    36480
ctgcccgaag agggcagcgt cagggtccag atgaaggtgg gggagcccga cgccacgggc    36540
cgccgcacca tcgaggtgta ctcctcggac cagcaggccc ccggccggga acgctgggtc    36600
ctcaacgcga gcgggatgct tgccggcgaa ccggtggagg ccccgccgag tctcaccacc    36660
tggcccccgg aaggcgctgt ccccgttccg ctggacggct tccacgaccg gctggcggca    36720
cgcggcttcg gctacggtcc gacattccgc gggctgagcg ccgcgtggtc acgcggtgac    36780
gagatcttcg ccgaagcggc gctcccctcg ggccatcggc aggatgccgc ccggttcgga    36840
ctccacccgg cgctactcga cgctgccctg cacgccatgg aactccggga accccgcccg    36900
gccggcgacg gagtccggct tccgttcgcc tggaacggct tctccctgca cgcgtcgggt    36960
gccgaagcgg tacggctgcg cctcgcgccg acgggcgccg acgctctgtc ggtgaccctc    37020
gccgatgcca tcggtcgccc ggttgcctca gcccgctcgc tggccctgcg ggagctctcg    37080
tccgacctgc tgcgcccggc gtccgtctcg tacggggact cgctgttccg caccgcttgg    37140
atacccgccc tcgtcggccc ggaggcggag tccgggccgg ggcgaccgtc cgccggctgg    37200
gcggtgctgg gccccgatcc gctcggcgcg gccaacgccc tgaacctcac gggaacctcc    37260
tgctcctgct atccggacct ggcggcgctg atcgcggccg tcgacggcgg agccgcggtg    37320
cccgaggccg tactcgcgcc gtacgcggcg gagccagccc cggacgcggg atctcccgcg    37380
gacgccgtac gggcctcgac cggccgggcg ctgcaactgc tgcaatcctg gctgtccgag    37440
gaccggttgg agcgaagccg gctgatcgtg ctcacccggg gggcggtggc cgtcggtacg    37500
gacgaaggcg tcaccgacct ggtgagtgcg tcggtccggg gtctggtccg ttcggcgcag    37560
gccgagcacc ctggcaggtt ctccctggtc gacatcgacg accgggagga gtcctgggcc    37620
gtcctgagcg cggcggcggt atccggtgag ccgcaggtcg ccctgcgctg cggccagatg    37680
aaggtgcccc gcctcggctc cgtcgacgtt cccacgaccg gtatgcctga gatgcccgac    37740
gtttggggtg ttgacggtac cgtgttgatc actggcggga ccggtgtgct gggtgggctc    37800
gtcgcccgtc atctggtcgc cgggcatggg gtccgtcggt tgttgctctg cagcaggcgg    37860
ggccctgatg cgccgggtgc ggtggagctg gtggccgagc tcaccgctct gggtgcggat    37920
gtcaccgttg ccgcctgtga tgcggccgac cgggatgcgc tggccgcgct cttggacacc    37980
gttcccgcca cgcaccctct gactggtgtc gtgcataccg ctggtgtcat cgatgacgcc    38040
actgtcacca ccctcactcc cgagcgcatc gacgcggtcc tacgccccaa ggtcgacgcc    38100
gcgctcaacc tccatcagct gacggcgcat ctcggcttga cccgctttgt gctcttctct    38160
tcggccgccg ggctcttcgg cggcgcgggg cagggcaact acgcggcggc caacgccttc    38220
ctcgacgcac tggcccaaca ccgccgggcc aacggcctca atgcccagtc cctggcgtgg    38280
ggactgtggg cggaagccag cgggatgacc gggcacctgg acgcggccga cctcgcccgg    38340
atgggccgtt ccggcctcac cgcgatgccc accggggacg ggctggcgct gctcgacacc    38400
gcccagcggg tggacgaagc caccctggtc acggccgcgc tggacacccg ggccctgcat    38460
gcccgggccg cagacggcac gctgccggcg ctgttccacg cactcgtgcc cgtaccgcgc    38520
cgatccgcga cctccccggc ggcccaggcc gcggggccgg atggactccg ccagcggttg    38580
tcggggctgg tcgtggggga gcgccgagcg gcgctgctgg atttggtgtg tggtcatgtc    38640
gcgagggtgc tggggcacgc ggacccgagc agcattgagg agaacaaggg cttcaaggac    38700
accggcttcg actccttgag cgcggtggag ttccgcaacc ggctgcacgg tgcgaccggg    38760
ttgcggctgc cggccacgct ggtcttcgac tacccgacgc ctgcagctct caccgatcac    38820
ctctacgacg agcttctggg ttcccgcgag gacgccgtgc tcgccccgat caccagggcc    38880
gcgtacgacc cggtggactt cgactacccg acgcctgcag ctctcaccga tcacctctac    38940
gacgagcttc tgggttcccg cgaggacgcc gtgctcgccc cgatcaccag ggccgcgtac    39000
gacgagccga tcgcgatcgt ggggatggcc tgccgctatc cgggcggggt ggagtccccg    39060
gaggacctgt ggcagctggt cgccgacggc cgtgacgcca tctccgactt ccccgccgac    39120
cggggctgga acgtcgagag cctctaccac cccgaccccg accaccccgg caccagctac    39180
acccgtgccg gaggcttcct gcacgacgcg gcggacttcg acccggagtt cttcgggatc    39240
tcaccgcgtg aggcactggc caccgacccc cagcagcgac tgctgctgga aaccagctgg    39300
gaagccatgg aacgggcggg aatcaacccc tccaccctga agggcacccc caccggcgtc    39360
ttcctcggcg tcatgtacaa cgactacggc actgccatgc agcaggcggc agaggtcttc    39420
gagggccata tggccagcgg tagcgcgggg agtgtggcgt cgggccgggt ctcgtacacg    39480
ttcggtctgg agggaccggc cgtcacggtg gataccgcgt gttcgtcgtc gctggtggcg    39540
ttgcatctgg ccgcgcaggc gttgcgcaac ggtgagtgca ctctggctct ggcgggcggt    39600
gttgcggtga tgtccactcc tgccacgttt gtcgagttca gccggcagcg ggggctggca    39660
gctgatgggc ggtgcaaagc cttcgcggac gctgccgacg gcaccggctg gggcgaaggc    39720
gtcggtgtgc tgctggtgga gcgtttgtcg gacgcgcgcc gcaacgggca tccggtgctg    39780
gcggtcgttt cgggcagtgc tgtcaaccag gacggggcca gcaatggtct gacggcgccc    39840
aatggtcctt cgcagcaacg ggtgatccaa caggcgctgg ccaatgcggg gttggcgggg    39900
gcggatgtcg atgccgtgga ggcgcacggc acgggaaccc ggctgggcga cccgatcgag    39960
gcgcaagcgt tgatcgccac ctacggacag gcccggtcgg cggaccggcc gttgtggctg    40020
ggttcgctga agtccaacat cggtcacacc caggccgccg cgggcgtcgc cggcgtcatc    40080
aaaatggtgc aggcgatgca gcacgggact ctgccgccca ccctgcacat cgaccagccc    40140
acgggccagg tcgactgggc tacgggtgca gtggagctgc tgaccgaggc cgtgccctgg    40200
ccggacagtg accggccccg ccgggtggct gtctcctcgt tcggtgtcag cggtaccaac    40260
gcccacgtca tcatcgaaca caccccacac accccacaca ccacccgcac ctgcccaatc    40320
ctcccaatcc ccccaggccc cgcagactgt gcaggcccat cggccggtgc gtggctgctg    40380
tcggcgaaga cctcgcaggc cctggccgcg caggcccggc gcctgtcagc tcacttgcga    40440
gccaaccccg atctgcgttc ggctgatgtg gcgcattccc tgctcaccac gcggtctgtc    40500
cacgccgagc gcgccgtctt catcgccggt gaccgggatg aggctcttgc cgccctggac    40560
gcactggccg acggcacccc tgcccctcac ctcgttcagg gccttgccga tgtgagtggc    40620
aagacggtgt tcgtcttccc cggtcagggt tcgcagtggg tgggtatggc cgttgagctg    40680
ctggacggct cggaggtttt cgccgagcat atggccgcct gcgccagggc cctggaaccg    40740
tttgtggact ggtccctgga ggacgtccta cgccagacgg acggtacgtg gccactggaa    40800
cgcgtcgaag tggtccagcc cgtgctgtgg gcggtcatgg tctcgctcgc gggactgtgg    40860
caggcacatg gcgttgagcc tgctgcggtg ctgggccact cccaaggtga gatcgctgcg    40920
gcttgcgtgg cgggagccct gagtctggaa gacggagccc gcgttgtcgc gcttcgcagc    40980
caagccatcg ccgaaaccct cgcaggacac ggcggaatgc tctcaatcgc cgcccccgcc    41040
accgacatcg cacccctgat cgcccgctgg aacgagcgga tctccatcgc cacggtcaac    41100
ggaccgcatt cggtggtggt cgcaggagac cctgacgcgc tcgaggcact ccgcggcgaa    41160
ctggagaccc gtggtctccg caatcgtcgc atcccggtcg actacgcctc acacacccct    41220
cacgtcgagg cgatccgtga acggctcctg gccgacctgg cagtgatcca gccacgtgcc    41280
gcgagcattc ccgtgctgtc caccgtcacc ggcgcatggc tcgacaccac cgtgatggac    41340
gccgagtact ggtaccgcaa cctacgtcag accgtggagt tcgaagcagc cacccgcact    41400
ctcctcgacc aggaccaccg ctacttcgtc gagatcagcc cgcaccccgt actcaccatc    41460
ggtctacagc agaccatcga ggaaaccacc gctccggccc ggaccctctc caccctccga    41520
cgcaacgaag gcaccctccg gcacctgttc acttccctcg cccaggccca cgcccacggc    41580
ctgaccatcg actggacccc cgccttcacc cacaccgagc cccgcaccac ccccctgccc    41640
acctacccct tccaacacga acgctactgg ctggacacgg cggagccgcc tgttgggcag    41700
ggagccggca ccgacaccgt cgagagcggt ttttgggacg ccgtcgaggg cgaggagtgg    41760
cagacgttgg ccgacacgct cggcgttacc gccgacgcgc cgttcgactc cgtgatgtcc    41820
gccctgtcgt cctggcggct ccgacagcgt gagcagtcct tggtggacgg ctggcgttac    41880
cggatcgagt ggaagccgtt ccgcgccccc gtgtcggcac cggattccgt gtcgggcacc    41940
tggtgggtgg tcgttcccgc ccatgccggc gacgcggacc gggagagggc gcaagccgtg    42000
cggggcacgc tggagtcctc cggccgtgcg cggacgatcc tggtcgcggt ggacccggcc    42060
gccgacgacc gggggtcgct cgaactgaaa ctcagggacg ccgcgaccga ggcgggtccg    42120
ccggccgggg tgctgtccct gctggccacc gacgaacgtc ccctccccgg gcatgatgtg    42180
gtgcccgggg ggctggcagc caacctggct ctcgtccagg cactgggcga cgcgcagatc    42240
gatgccccgc tctgggtggg cacctgcggg gcggtctccg ccggccggtc cgaccggctg    42300
gcgaaccccg ggcaggccgc ggtctggggg ctcggacggg tggtcgccct ggagcacccg    42360
gaacgctggg gcggtctgat cgatctgccc gtggtcctcg acccgcgcgc tgtggaacgg    42420
ctggtgacag tacttgccgc gtcgggcgag gaggaccagc tcgccgtacg ggcgtcgggg    42480
gtcctcgtgc gcaggctcgt gcgggtaccc gcacgccaag tgccggacgg cgtgcagtgg    42540
aagcccgagg ggacggtcct ggtgaccggt gggaccggag cgctgggcgc ggaggtcgcg    42600
cggtggctgg ctcatggcgg cgccgaacac ctggtgctga ccagccgtcg cggcggctcg    42660
gcgcccggtg cggccgagct gacggacgag ctgcttgccc tcgggacgga agtgacactg    42720
gccgcctgtg acatggcaga ccgggacgcg gtcgccgcgc tgctcgccga gcacgcgccg    42780
agctcggtgg tgcacaccgc cggcgtcctc gacgacggtg tactggacag cctggaccgc    42840
gggcggctgg agtcggttct gctgccgaag gtggccgccg ctcggcacct gcacgagttg    42900
acgaaggacg cgaacgtgtc ggcattcgtg ttgttctcgt ccgccgcagg cgtgctcggc    42960
agcgcaggcc agggcaacta cgcagccgcc aacgcctacc tggacgccct ggccgaacag    43020
cgcagggccg atggactggt cgcccattcg atcgcctggg gcgcgtggga cggcggtggg    43080
ctggccgtgg gcgacagcgt ggtcgaggaa cggctgcgcc acggaggagt ggtccccatg    43140
cgcccgcagc tggcgatcac ggcgctccag cagacgttgg accgggcgga gaccgcggtg    43200
gtcatcgctg acgttgactg gccgcgctac ctcaccgcgg tcacaccgcg cccatggctg    43260
gcggacctgc cggaggtcgc ccaggccctt aacgccgacg acgcggctgg tgccccttgc    43320
ggcacagccg ggcagggctc gtccccgctg gccgagcgtc tctccgggcg cccggcaccc    43380
gagcagcggc gactggtgct cgacctggtc cgtacgaacg tggcggcggt gctcggccac    43440
gccggtgcgg agtcgatcga gtccggccgg gccttccgcg agctgggctt cgactctctg    43500
accgccgtcg agctgcgcaa caggctggct gcggccaccg ggctgcggct gcccaccacc    43560
ctggtgttcg actacccgag cgctgccgtg ctcgccgatc acctgtacgc gcaggcgatc    43620
ggttcggacg aggggcccgt ggcggatctg tcctccggcg ccgatccggc ggccggaccg    43680
gacgacgagc ccatcgccat cgtgtcgatg agctgccgtt tccccggcgg tgtctcctcc    43740
ccggaggagc tgtggcagct gctgctggcc ggtgaggaca cgattaccgg gttcccggac    43800
gaccgggact gggatgtcga cgccctgtac gacccggacc cggaccaccc ggggaccacg    43860
tattcccgca gcggcgcgtt cctgtccgac gcggccggtt tcgacgcgac gctgttcggg    43920
atctcgccgc gtgaggcgct ggccatggac ccgcagcagc ggctgctgct ggagacggca    43980
tgggaggtgt tcgagcgggc gggcatcgat cccacctcgg tacgtggcag ccgggccggc    44040
gttttcgtcg ggaccaacgg ccaggactac gcccgccatg tgccccagga accgatcggc    44100
gtggaggggt atctgctggc gggcaatgcg gccagcgtca tctccggccg tctgtcgtac    44160
acgtttggtc tggaggggcc ggccgtcacg gtggacaccg cgtgttcgtc ctcgctggtc    44220
gccctgcacc tcgccgtcca ggccttgcgc aacggcgaat gctccatagc cctggcggga    44280
ggcgtgtcgg tgatgtccac cccggcggcg ttcgtggaat tcagccggca gcgggggctg    44340
gcggctgacg ggcggtgcaa ggcgttcgcg gacgcggcgg acggcaccgg ctggggcgag    44400
ggggttggcg tgctcctcgt ggagcgtctg tccgacgcgc gccgcaacgg tcacccggtg    44460
ctggccgtcg tacgcggcag cgccgttaac caggacggcg ccagcaacgg cctcacggcg    44520
cccaacggac cctcgcagca acgcgtcatc cgccaggcac tcgttgacgc cgcgctgacc    44580
ggtagcgaca tcgacgccgt cgaagcccac ggcaccggga cccggctggg tgacccgatc    44640
gaggcgcagg ccctgatcgc cacctacggt caggaccgcc cggcgaaccg gcccctgtgg    44700
ctgggctcgg tcaaatccaa catcgcacac acgcaggccg ccgcgggcgt cgccggcgtc    44760
atcaagatgg tccaggcgat ccgccatggc gtacttccca agaccctgca cgtggaccgg    44820
ccgaccagcc acgtcgactg ggaggcaggc gcggtggagt tgctgaccga ggccatgccc    44880
tggccggaga ccgaccggcc gcgtcgggcc ggcatctctt ccttcggcgt cagcggcacc    44940
aacgcacaca ccatcgtgga gcaggcacct gcggcggaag acgagccgga aacggggcca    45000
cccgccgatg ctccgcccac ggtggtgccc tgggtgctct ccgctgccac cgaggacgcg    45060
ctgcgagagc aggccgcacg cctcgccacg tacctcgacg agcgccccga gccaagcccg    45120
gccgacatcg ggtcctccct ggtcaccacg cgtgcagccc ttgaccaccg ggcggtggtg    45180
ctcggtgagg accgcgacgc tctgcgggcc gggctggttc tgctggcgaa cgggaagtcc    45240
ggtcccgctg tcgtccgtgg cctcgccagg cccggacaga aggtggcgtt cctgttcacc    45300
gggcagggca gccagcgact gggcatgggc agggagctcc atcgccacct gccggtgttc    45360
cggcagttct tcgacgaggc gtgcgccgcg ctcgacgcac acctgccggt accgatagcg    45420
gccgcgctgt tcgcgcaggc ggatggggcg gatgcggggc tgatcgatgg gacggaattc    45480
gcgcagccgg cgttgttcgc gctggaggtg gcgttgtgcc ggacgttgga gttctgcggt    45540
gtcaggccgg tttacgttgc cgggcattcg gtcggtgaga tcgcggcggc ccatgtggcg    45600
ggggtgttct cgctggagga tgcggctcgt ctggtggtgg cgcgcggaca gttgatgcag    45660
gcgttgccgg ccggtggtgc gatggtcgcg ctccaggtgt ccgaagacga cctcctgcca    45720
tccttgactc cttggctgga gcaggaccgg ctgggtatcg cggcggtcaa cggcgcagca    45780
tccacagtgg tgtcgggcga tgaggaggcg gtcctggcgg ttgccgagca ctggcaggcg    45840
cggggccgca aggttcgtcg gctcactgtc agccatgcct tccactcacc tcgtatggac    45900
ccgatgctcg accagttccg tgtggtcgtg gagggtatcc gtttcgcgga gccggccatc    45960
ccggtcgtct ccagcgtcac cggtcgtctt gccgagcccg ggcagttgac cactgcggac    46020
tactgggtgc gccacgtccg tcaaacggtc cgcttccacg acgccctcca gaccctccag    46080
accgagaatg tgaccgcgtt tctggagatc ggtcccgacg ggcaactctc ggcaatggcc    46140
caggagacgc tcaccgccca ggtccatacc atccccaccc tccgaaagaa ccggtctgag    46200
accaccggct tgctcaccgc actggcgcaa ctccacacca ccggcaccgt ccccgactgg    46260
accgcttacc tcaaccacca ccccacaccc tccacacccg tgcccaccta ccccttccaa    46320
caccaccact actggatgca cggcggtacc caggccaccg atgtcagctc cgccggcctg    46380
tcaggagcca accacccgct gctgggggcc gcggtcccgc tggccggtgg ggagggccac    46440
ctgttcaccg gccggctgtc ggtgcggacc caccgctggc tggccgacca ccaggtcggc    46500
agcaccgtcg tgttgccggg cactgccttc gtcgaactgg cggtacgggc cggtgaccag    46560
gtcggctgcg gccacgtgga ggagctgacg ctggaagcgc cgctcgtgct gcccgagagc    46620
ggcgccgtac agatacagct ccggctgcgc cgggcggacg aatccggacg gcgtgaactc    46680
gtcgtgtacg ggcggctcgc gacggaccgt gaggacctgt ggtccgagga ggaatggacc    46740
cggcacgcca gcggtgtcgt cgtcgcagca gcgccctcgg cccccgagcc cgtccaactg    46800
accgtatggc ccccggaagg cgccaccgag ctcatcgtga aggacctcta cgaacggatc    46860
gccggcacca gcttcggcta cggtcccgcc ttccaagggc tgcgcgccgc ctggcggctg    46920
gacgacgcgg tgttcgcgga ggtcgtgctg ccacaggatc agtacgccgt cgcgagccgg    46980
ttcggactcc acccggcgct gctcgacgcc gccctccacg gggtcgcgct ggggcagccg    47040
gcggctgaca ccgccgagcc gcacaccgac cggatgccct tctcctggag cggcgttacc    47100
ctctacgccg ccggtgccac cgcactgcgg gtgcggttgg acatcgcttc gcccgaggac    47160
gtgtcgctgc tcgtcgccga tggctcgggg gctccggtgg ccgcggtgaa ctcgctgaag    47220
ctgcgcccgg tcgcggccga cctggccagt gccggtgtcg ccgactcgct gttccggctg    47280
gagtggtcga aggcggtcga cgacgagccc ggccgggccg aaccggggca atgggccctg    47340
atcggaacgc cgcccggtgc cgacttcacg ccgggcgagg acggcgtcat catcggaagc    47400
tacccggaca tggccgcgtt gaccgacgcg ctcgacaagg gagtcgccgt cccgcagcgg    47460
gtgttgttgt ccgccccgtc ggaggaggag caggaccagg cgcacgatct cgcgagcgcg    47520
gtggacaagg ccacgaacgc gctgctcgca gtgctccagc agtggctgtc cgacgaccgg    47580
ttcgactcct ccaggctggc tgtgctgacc cgtcacgcgg tgtccacggc tgggcaggag    47640
gacgtgacgg accttgccca cgcctcgtgg tggggactcg ttcgctcggc gcagtccgaa    47700
catcccgacc ggttcgtgct ggccgacacc gacggcaccc agatcagtca cgctgccctt    47760
ctgcccgctt tgctgtccgg tgagccgcag gtcgcgctgc gtgacggaac ccggtatgtg    47820
ccgcggctgg ccagggccgt tgcgtccggg gacgggccgg tggcgcgggt ggacccggcg    47880
gggacggtgt tggtgaccgg tggtacgggg actctggggt cttcgctggc caggcatttg    47940
gtggttgagc acggggtgcg gcggttgttg ctggtgagcc gtcggggcgg ggagtcggag    48000
ggcgcggcgg agttggtggc tgagctgacc gggctcgggg cggatgtcac ggtggcggcg    48060
tgtgatgtgg gggaccgggg ggccgtggcg gagttgctgg cggggattcc ggccggtcat    48120
ccgttgacgg cggtggtgca tgcctcgggg gtcactgatg acgcggtgat cgaggcgttg    48180
actgcggagc aggtcggccg ggtgctgcgg tcgaaggtcg atggggcggt caatctgcat    48240
gagttgacgc gggggctgga tctgtcggcg tttgtgttgt tctcttcggc ggccggtgtg    48300
ttcgggaatc cggggcaggg caactacgcg gcggccaatg cctttctgga tgcgttggcg    48360
gtgcggcgcc gggcggaggg cctggctgcg cggtcgctgg cctggggtct gtgggaggag    48420
gccagcgcga tgacgagccg gctggccggg gccgatctgg tccggatggg ccgtgcgggc    48480
ctgcttcccc tcaccaccgg gcaagggctc gccctcttcg acgccgccca ccggacagac    48540
gagcccctgg tactgccgat gaggctggac accacggccc tgcgctccac caccggacag    48600
ccgccggcgc tgctgcgcaa cctggtccgg gtccaggctc gccggacggc gggcgcggcc    48660
cccggaccgg acgcggccgc caccttccag cagcagctca tcagcctgtc cgtcgcggag    48720
cgcgggcggg tgctgctgga gaccgtacgc ggccacgcgg ccgccgtgct cgggcactcc    48780
ggcccggaag ccgtcgatgt cgacaagggc ttcatggaag cgggcttcga ctccttgagc    48840
gcggtggagt tccggaaccg gctgacgtcc accaccgggc tgcggatgcc ggccaccgtc    48900
acgttcgact acccgagccc ggccgcgctg gccgagcacc tgctgacgcg gttggttccc    48960
gaggtcgcca tgcccgcgga ggagcagcac ccgcacaccc ggcccgaaga cgggccggtg    49020
gacaggcccg gagacgaaca ggggggcgcg atcgacgaca tggacgtcga cagcctcgta    49080
gaactcgccc tcggcgaatg attcctgatg ccgcatcgat ccgggaggac agcatgagca    49140
agccccatga aaaagtagtc gcggcgctcc gggcgtcgct gaaggccaac gaacgcctgc    49200
gggagctcaa cgacgagctc gcctcggcgt cccgcgaacc ggtcgccatc gtcggcatgg    49260
cgtgccggta tcccggcggg gtgacgtccc ccgaggaact gtgggacctg gtcgccggcg    49320
gcaccgacgc ggtgtcggag ttccccgccg accgtggctg gaacgtcgag gagctctacc    49380
acccggaccc ggaccactcg ggcacctcct acgtgaggga gggaggcttc ctgcatgagg    49440
cggcggagtt cgatccggtg ttcttcggca tgtccccacg ggaggcgctg gccacggatc    49500
cgcaacagcg gctgctcctg gaaacggcat gggaggcctt cgagcggggc ggtatcgacc    49560
cactccggct ccggggcagc cggaccggcg tattcgtcgg cgtcatgtac aacgactacc    49620
tcacccgcct ccagccggcc cccgcggact tcgaggggca gctcggcaac ggcagcgcgg    49680
gcagcgtcgc caccggccgg ctggcctaca cgttcgggct ggaggggccg gcggtcacgg    49740
tggacacggc gtgttcgtcc tcactggtcg ctctgcacct cgccgcccag gcgctgcgca    49800
acggcgaatg caccatggcg ctggcaggcg gggtcgccgt gatggccacc ccggggccct    49860
tcaccgagtt cagccggcag cgcggtctcg cggtggacgg ccggtgcaag ccgttcgccg    49920
cggcggcgga cggcaccggc tgggcagagg gcgtcggcct gctgctggtc gagcggctct    49980
cggacgcccg gcgcaacgga cacccggtgc tggctgtcat acgcggaacg gcggtgaacc    50040
aggacggtgc cagcagcggc ctgaccgtgc ccaatggccc ctcgcagcag cgcgtcatcc    50100
ggcaggcact ggcgaacgcg ggcctgtcgg ccgccgacgt cgacgcggtg gaggcacacg    50160
gcacgggcac cccgctgggg gacccgatcg aggcccaggc cctgatcgcc acctacgggc    50220
aggaccgccc ggccggccgg ccgttgtggc ttggttcgct gaagtccaac atcggccaca    50280
cccaggccgc cgcgggcgcc gccggagtca tgaagatggt ccaggccatg cgccacggga    50340
ccctcccgaa gagcctgcac atcgacgccc ccacgcccca ggtcgactgg gaggccgggg    50400
cggtggaact gctcaccgag gccgtgccgt ggcacgagac cgaccggccc cgcagggcgg    50460
gcgtgtcctc cttcggggtc agtggcacca acgcccacgt gatcatcgag gaggctcccc    50520
cgaccgaagc tcccgagggc gtgacggcgc gggcgccgct caacgccgag accttgccgt    50580
gggtggtctc gggccgtggc gtagaggccg tccgggcgca ggccgggcag ctgcgctcct    50640
atctgtcgga gcgtcaggac tcgtcactgg agggcatcgg actctctctg gccaccacgc    50700
ggtcggcgtt ccagcaccgg gccgtcgtac tggcggccga ccacgatggc ttcatggccg    50760
ggctggacgc gctggccacc ggggaaccgg cgaagggctt ggtcgatggg gaggccgtat    50820
cgggcggcgg agtcgccctg gtcttccccg gccagggctc ccaatgggcc ggaatggcgc    50880
tcgaactgct ggactcctca tccgtgttca gagaccggat ggaagcctgc gcgcaggcgc    50940
tgagccccta catcgactgg tcactgaccg aggtcctgcg ctcctgcgaa ggcgagctgg    51000
aacgggtgga cgtggtccag cccgcgctgt gggccgtgat ggtctcgctg gccgaactat    51060
ggcgttcctt cggagtccgg cccgccgcgg tcctgggcca ctcgcagggc gagatagcgg    51120
cggcctgtgt ggccggcgcg ctcagcttgg aggacgccgc gctggtggtc gcgctgcgca    51180
gccaggccat cgcgaccgag ctggccggcc ggggcgcaat gctgtccgtc gccctgccga    51240
aggcacgggc ccaggactgg atgacggggc gggcggaacg gctgtcggtc gcggcggtca    51300
acgggcccgg atcagttgtg gtctccgggg acgtggacgc ggtggaggag ctgcgggcgg    51360
agctggccgc cgagggggtg cgggtccgca ggcttccggt cgactacgcc tcgcacagct    51420
cgcatgtgga gcggatccgc acacgtctgc tggcggcgct cgccccggtc tccccgcgcc    51480
cttccgagat caccctgtac tcgtccgtga ccggtggtcc catcgacacc acgaccatgg    51540
acgccgagta ctggtaccgg aacctgcggc agaccgtgga gttcgagcgg gcggtccgca    51600
cctcgatgtc cgacggctac cggttcttca tcgagtccag cccgcacccg gtgctgacga    51660
cgggcatcga ggagaccgcg gaggacgctg accggttcgc ggcggcggtc ggttcgctgc    51720
gccgttcgga cggtggcccc gacaggttcc tgactgcgct cgcggaggct cacgtgcgcg    51780
gcgtgccggt ggagtgggcg gtgatgttcg ccggccggcc cgtgagtcag cccgatctcc    51840
cgacgtactc cttccagcgg cagcggtatt ggctggcccc cgacacgtcc cccggcgacg    51900
acggcggcgg cgacgaacgc tcggagacgc ggttctggga ggctgtcgag cgccaggacc    51960
tcggcgaact gagcgagacc ctgcggatcg gtgacgcgga ccggcaggcg tcgttgggtg    52020
agttgttgcc ggccctgtgg acgtggcgtg agcagaaccg gtccgccgcc gtcctggaca    52080
gctggcggta ccgggtctca tggcggcccg tctccccggc gtccgatcca gccttgccgg    52140
gcacctggct gatcgtggtc ccggcgggga cggcggacca gcagtgggcc gaagcgctct    52200
cccgagccgc cgagggcctg ggagaccagg ctgtccgggt cgaactgggc agggccgaag    52260
ccggccggga ggagtacgcg gccaggctcg ccgaggcggc ggccggcggt ccggtggccg    52320
gcgtgctttc cctgctcgcc ctggccgagg agccggcgga cgccgacccg gtgtggcgcc    52380
cgtatgtcac cagcacgctg gcacttatgc aggcgctggg cgacgcgggg atcggcgcgc    52440
cgctgtggct ggccacccgg ggcgcggtct cgatcgggcg gtccgacaag ccggtcccgt    52500
cgacagccgc acaggcccag ctgtggggcc tgggccgggt catgggactc gaacaccccg    52560
aacggtgggg tgggctcgtt gatctgccgg agacggccga cgctcgtgcg acggcgcggc    52620
tggccggcat cctggccggc ggtctcggcc ccgaggacca gtgcgcggtg cggtcctccg    52680
gcgtgtacgt acggcgtctg gtccgcgcac cgctcgaccg gcgagcgcgg aggccgtcct    52740
ggcacacgtc ccgtacggcc ctggtcaccg gtggcaccgg cggtctcggg gcgcacgtcg    52800
cccgatggct ggcgagcacc ggcgcggaac acctggtgct caccagcagg cgcggcccgg    52860
acgcccctgg gacggacgag ctgtgcgccg aactgtccgc cctcggggtg cgggtgagcg    52920
tggtggcctg cgatgtgtcc gaccgggacc aactggccgc cacattggca cgattgaccg    52980
ccgacggcca caccgtccgt acggtggtac atgccgccgg ggtcagtacg ccgggcgcgc    53040
tggccgacct cgggcccgcc gagttcgccg aggccgtcgc gggcaaggcg gcgggcgccg    53100
cgcacctcga cgaactgctc ggcgacgcgg agctggacgc cttcgtgctc ttctcatcca    53160
acgccggcgt gtggggcggc ggcggccagg gcgcctatgc cgccgccaac gcctacctgg    53220
acgcgctggc caaacggcgc cggtcccgcg gccgcgtcgc gacctccgtc gcatgggggg    53280
cttgggccgg cggcggcatg gccgcggagc gtaccgccga cgagcagctg cgccgccgag    53340
gggtgcgggc gatggaccca gcgatggcga tctccgcact ccaggaggcg ctggagcacg    53400
aggagacgtt tctcgcggtg gccgacatgg actgggaccg tttcctcccg tccttcacca    53460
tggcccggcc ccgccccctc ctcgacgacc tgccggaggt ccagcggcag cggctgagcg    53520
cggccccgtc atgggccacc gcggagaccg acggcccggc actcgcgcag cagctcgccg    53580
gggtctttga accggagcgc gggcggcgcc tgctcgacct ggtgcgcaag cacgcggcgg    53640
cggtgctcgg ctacgccggc ccgaacgagg tcgaggcgga acgggccttc cgggagctgg    53700
gcttcgactc cctcaccgcg gtggagatgc gcaaccgact ccagccggcg accgggctga    53760
cgctgcccgc caccctggtc ttcgaccacc cgacgccccg cgctctggcc gcgcatctgc    53820
gggatgagct gttcggtgtg caggacgaca cgccggaacc ggcgcgggcg tcggcaccgg    53880
acgacgaccc gatcgccatc gtgtcgatgg gctgccgttt ccccggtggt gtctcctccc    53940
cggaggggct gtgggagctg ctgctgtccg gccgtgacgc catgtcgtcg ttcccagtgg    54000
accgaggctg ggacctggac agccttgccg gtgacggccc cggacagatc ggcggcggtt    54060
acacccttga gggcggcttc ctcgatgacg cggccggttt cgacgcggcg ctgttcggga    54120
tctcgccgcg tgaggcgctg gccatggacc cacagcagcg gctgctgctg gaggcttcgt    54180
gggaggcctt cgaacgagcg ggcatcccct cggccgacct gcggtccagc cggaccgggg    54240
tgttcatcgg cgcttcctca cagggatacg cccaggtcgc cgcggagtcc gcggaaggag    54300
tcgagggaca tgtggtgacc ggtgacgcgg ccagcgtcat gtccggccgt ctgtcgtaca    54360
cgttcggtct ggagggaccg gccgtcacgg tggataccgc gtgttcgtcg tcgctggtgg    54420
cgttgcacct ggctgcgcag gcgttgcgca acggtgagtg cactctggct ctggcgggcg    54480
gggtcgcggt gatggtgacc ccggcggcgt ttgtcgagtt cagccggcag cgggggctgg    54540
cagctgatgg gcggtgcaaa gccttcgcgg acgctgccga cggcaccggc tggggcgaag    54600
gcgtcggtgt gctgctggtg gagcgtttgt cggacgcgcg ccgcaacggg catccggtgc    54660
tggcggtcgt ttcgggcagt gctgtcaacc aggacggggc cagcaatggt ctgacggcgc    54720
ccaatggtcc ttcgcagcaa cgggtgatcc aacaggcgct ggccaatgcg gggttggcgg    54780
gggcggatgt cgatgccgtg gaggcgcacg gcacgggaac ccggctgggc gacccgatcg    54840
aggcgcaggc gttgatcgcc acctacggac aggcccggtc ggcggaccgg ccgttgtggc    54900
tgggttcgct gaagtccaac atcggccaca cccaggccgc cgcgggcgtc gccggcgtca    54960
tcaagatgat ccaggccatg ggtcacggga cgctgccccg tacgctgcat gtcgaccggc    55020
cctcgtccca ggtggattgg gaagccggcg cggtggagct gctgaccgaa gccatgccct    55080
ggcccgaggc cgaccggccc cgccgggcag cagtctcctc gttcggtgtc agtggtacga    55140
acgcgcacgt catcatcgaa cacgccccgc aggtcactcc cgcctcccag gccccggaac    55200
cggtgaagtc cccggatgct gtggaggctg atcgaccggt cccgtggctg ctgtcggcgg    55260
gcagtgacgc ggcgttgggc gaggtggccg aacggctggc cgcctacgcc gaatcgcacc    55320
cggaggtcag tgcggccgag gtcgcgttct cgctcgcgac cacccggtcc ctgttgccgt    55380
gccgcgccgc cgtcgttggc gcggaccgcg acgagctggt ccagcgcatc cggtccgtgg    55440
gcgggggcac caccgccccg ggcgtcttct gcgggacggc gagttcggag tgcaccacgg    55500
cgttcctgtt ctccgggcag ggcagccagc gactgggcat ggggcatgag ctgtacgccg    55560
cgcacccgga gttcgccgag gcgctcgacg aggtctgcgg tcacctcgac gtgttcgggg    55620
accggccgtt gaaggaggtg ctgttcgcgc aggcggatgg ggcggatgcg gggctgatcg    55680
acggggcggg gttcgcgcag ccggcgttgt tcgcactgga ggtcgcgctg taccggaccc    55740
tggaagcatg gggcatcacc cccgactatc tggccgggca ctcccttggt gagatcgcgg    55800
cggctcatgt cgccggggtg ttcagcctgg aggacgccgc tcgcctggtc acggcgcggg    55860
ggcagctcat gcaggccctg cccggcggtg gcgcgatggt ggccgtccag gcctccgagg    55920
acgagatcct ggccatctcg gcgccgtggc tggaggggga cggggtcggc atcgccgccg    55980
tcaacggtcc cgcctcggtc gtcgtctccg gggacgagga agccgtcctg gcgatcgccg    56040
ggcactggcg ggcacagggc cgcaagaccc gtcggctcag cgtcagccac gccttccact    56100
caccccacat ggatcccatg ctcgacgggt tccgccgggt cgtcgacggc atgcaccttg    56160
tcgagccggt cattccggtc atctccaacc tcaccggtcg cctcgccgat cccgggcagc    56220
tgaccagcgc cgactactgg gtccggcacg tccgccaagc cgtccggttc cacgacggcc    56280
tacagaccct gcacgatcag ggcgtcacca cctacctgga aatcggccct gacgcccagc    56340
tcacggccat ggctcaggag gccctgagcc cccagtccca caccgtctcc accctgcgca    56400
ggaaccagcc cgaaaccacc agtctgctca ccacgctcgc gcgactccac accaccggta    56460
ccacccccga ctggatcacc tacctcaacc accgaccctc atccccgaca ccgctgccca    56520
cctacccctt ccaacaccac cgctactggc cgcgcggcga tgctcaggcc gccgatgtca    56580
gctccgccgg cctgtccggt gcgaaccatc cactgctggg agccgcggtc ccgctggccg    56640
acggcgacgg ccatctgttc accgggcggc tgtcggcacg gacgcaccgc tggctggccg    56700
accaccaggt cggcggcaac gtcgtactgc cgggcaccgc cttcgtggaa ctggcggtac    56760
gggctggtga ccaggtcggc tgcagccagg ttgaagaact gacgctggaa gcgccgctgg    56820
tgctgcccga gagcggcgcg gtccaggtac agctccggct gggccgggcg gacgagtccg    56880
gccgacgtga cctcaccgtc tacgggcgac tggcgggggg cggcgaggac ctgtggctcg    56940
aggaggagtg gacccggcac gccagcgggg tcctctccag cgcctcggcc cccgaacccg    57000
tcgcactgac cgtatggccg ccgtccgccg ccgaggccgt gccggtggag ggcttctaca    57060
ccggtctggc cgagagcggg tacggctacg gccccgcctt ccagggcctg cgggccgcct    57120
ggcgtcaggg cgacacggtc ttcgccgagg tccaactccc tgaggtggta cgggaggagg    57180
ccgcctccta caccatccac ccggctctcc tggatgccgc cctccaagcc gtcggtttcg    57240
tcacggacgg gagcgacaac cccgtggtac ggatgccgtt cgcctggtcc ggcgtgtcca    57300
tgtacgcgtc cggcgcctcc gagctgcggg tgcggctcgc ccggacagga ccggagacgg    57360
tcaccttcgc cgtcaccgac cccaccggcc gccccgtggc ctcggtcggc tcgctcgtca    57420
tgcgcccggt cgccaccgga gtaccgcgcc tgacacgcaa cgggctccac gaggtggtct    57480
gggagcaact cctcgatgcg ccggccaccc ccgcgaccga gtgcgccgtc atcggggacg    57540
cggacgcggc ggcgctgctg ggcgcggagg cgcacccgga cctggcgtcg ttgggggaag    57600
cggtgccccc gctggtggtg gccgtggccg gcggcgacgg tacacgggcg gcactggagc    57660
gcgcccttgg ctgggtgcag ggatggatgg cggaggagcg gttcgccggt tcccggctcg    57720
ccgtcgtcac ccgtggtgcg gtggcggtcg gtgcgggcga ggtgctggcg gacgctgcgg    57780
gtgccgccgt gaccggcctg gtgaagtcgg cggagtcgga gaacccgggc cgcttcctgc    57840
tggtggatgt ggacggcacc accgagtcct ggcgggcgct gccgactctc ggcggcggcg    57900
acgagccgca gatcgcgctc cgcgacgggc aggcgtacgt cccccgcctg gtgcgtgccg    57960
gtgaggacgg cggctcgctg ctgcccccgg ccggggcgga cgcctggcgc ctggagacag    58020
gcgaggccgg cagcctggac gggctccggc tcgcccctgc cgaggacgcg caggcggcgc    58080
tgctgccggg gcaggtgcgg atcgcggtcc gtgccgcagg cctcaacttc cgtgacgtcc    58140
tcggtgcgct cggcatgtac cccggcggac tcgacctcct cggcagcgag atcgccggcg    58200
aggtgctgga gaccggcgat ggggtgaccg gcctcgcggt gggcgaccgg gtcatgggcc    58260
tggtcgccgg cggcttcggt ccgatggccg tcgccgacag ctggcgggtc gtacggatac    58320
cgtccggctg gaccttcacc cgcgcggccg gtgttccggt cgccttcctc accgccctgt    58380
acggactgcg tgaactgggt gggctggcgg cgggccagcg ggtgcttgtg cacgcggccg    58440
ccggtggcgt gggtacggcg gcggtgcaac tcgcccggct attgggggct gaggtgtacg    58500
ccacggccag cgcccccaag caggagtatg tggcggatct gggcgtggac cgcgcccgta    58560
tcgcctcctc ccgcaccctg gacttcgctt ccagcttccc tgaggtcgac gtcgtgctga    58620
actccctggc cggggagtac gtggacgcct cgctggggtt gttgcgcgag ggcggccggt    58680
tcgtggagat gggcaagacc gatgttcggg atgctgccgc gtacgacggt gtgacgtacc    58740
ggacgttcga cctggggcag gccggtccgg agctgatcgc ccgaatgctg ggtgagttgg    58800
tggagtggtt cgaggccggg gaactcactc cggtccgcac agccgcctgg gatgtccggc    58860
gcgcggtggg cgcgttccgt tggatgagcc aggcccggca cacaggcaag atcgtcctga    58920
cggtgccgcg cgacctggac gccgacggca cggtcctgat caccggcggc accggcacgc    58980
tgggcggtct gctcgcccgg cacctggtca ccgaacacgg cgtacgacac ctgctgctgg    59040
tctcccgcac gggagaacgg gccgctctcc gtcgtgaact ggaggagctg ggcgccgagg    59100
tacggatcgc ggcctgcgac atggctgacc gcgcggcggt ggccgaactc ctcgacggca    59160
tcccgtcgga gcacccgctg accggtgtgt tccacgcggc gggtgtcctg gacgacggcg    59220
tggtcaccgg cctcgactcc gctcggctgg cacgggtgct ggctccgaag gtggacggcg    59280
ccctccacct gcacgaactg acggcggagc tggacctctc ggcgttcgtc ctgttctcct    59340
ctatgtcggg tctcctcggc gcctccggcc aggccgggta cgcggcggcg aacatgttcc    59400
tcgacgcgct cgcccagcag cggcgtgccc agggcctgcc cgcgctgtcg ctggcgtggg    59460
gtttgtggga gaccgcgagc gcgatgaccg cgcacctgag cgacaccgac ctgcgccgca    59520
tgggcgggat cggcatgctc gggctcaccc gcaacgaggg catggaactc ctcgacgcgg    59580
cctggcagag cggcgaggcg ctgctggtcc cggtccgctg ggaccaccgg gtgctgcggg    59640
agcgggcctc ctcgggcgcc cgggtgccct ccctgctgcg gaggctggtg cgggcgccga    59700
ggcgccgtac ggtgccggag agcgccaagg gcgcgggcgg cgggctgcgg gagcggctgg    59760
cgacgctgcc ggaggcggag cgccggggca tgctcatcga gctggtggcg gggcacgtgg    59820
ccgcggtgct gggccatgcg ggcaccgatg cggtgtcggt ggaccgcccg ttcaaggagc    59880
tcggcttcga ctcgctgacc tccgtggagt tccgcaaccg gctgaacgaa gcgaccgggc    59940
tgcggctgcc ttcgaccctg gtgttcgacc accccacacc taccacgctg gcggcccggc    60000
tcgacgccct gctgccgggg gcagagacgg cgacaacggt tgctgccccc acctcgccgc    60060
acgaggaact cgaccgactg gcaacggtgc tgctgtcacc cgcgttgaac atggcggatc    60120
gggacggcct cgccgcccgg ctccgagccc tggcttccca gcttggcgag ccgactggtc    60180
cggccgatgg cagcaccgtc gccgaccgga tccagtcggc caccgatgac gagctcttcg    60240
agttgctcga cgacaggttc gagaactcat gagccaacac gacgatgctt ctgacgcgct    60300
gaggacgggc gatgttccga tgacacagtt tccgacgaac gaggacaagc tccgcgacta    60360
tctgaagcgg gcggtcaccg acctgcacca cacccgtgag cagctggccg cggccgaggc    60420
caagaaccgg gaaccgctgg cgatcgtgtc gatgagctgt cgcttccctg gcggagtcag    60480
gtcgcccgaa gccttgtggc agctggtgcg tgccggtgaa gacgtgatct cgtcgtttcc    60540
caccgaccgt ggatgggacc tcgacggcct ctacaacccg gatccgggga acagtggcac    60600
cacctacgtg cgagagggcg ggttcctgtc cgacgcgacg gagttcgacc ccgccgtgtt    60660
cgggatctcc ccgcgtgagg cgctgggaat ggacccgcag cagcggctga tgctggagac    60720
ctcgtgggag gccttcgagc gggccggcat cggtccggca tcggcacgcg gcagccggac    60780
cggtgtgttc atcggcgcct ccgcccaggg ctacagcttg ctgttccaga actcgcggga    60840
ggaggccgag ggcctcctgg ccaccggtga ctcggccagc gtgatctccg gccgggtctc    60900
ctacaccttc ggcctcgaag gacctgcggt cacactcgac accgcgtgct cctcgtccct    60960
ggtcgctctt cacctggccg tgcgctcggt tcggcagggc gagtgctcca tggcgttggt    61020
gggcggcgtc tcggtgatgt gcacgccggc gatcttcatc gagttcagcc gccagcgagg    61080
tctcgcggcg gacggccggt gcaagccgtt cgccgcggcg gcggacggca ccagctgggg    61140
ggaaggcgcc ggagtcgtcc tcatcgagcg gctggaggac gcccgacgca acgggcaccc    61200
ggtgctggcc gtcatccgcg gcagtgccat caaccaggac ggtgccagca acggcctgac    61260
tgccccgcac gggccgtcgc agcggcggct gatccagcag gcgctggcgg acgcccagct    61320
gtcgcccggc cagatcgaca tggtcgaggc acacggcacc ggcacctcgc tgggggatcc    61380
gatcgaggcg caggcactgc tggaaacgta cggtgccaac cgccccgcgg accgcccgct    61440
ctggctcggt tccgtcaagt ccaacatcgg acacacccag gcggcggccg gtctcgcgtc    61500
cgtcatcaag accgtacagg cgctgcgaca cgcccacctg gccaggacac tgcacgtcga    61560
ccggccgacc ccgcgcgtgg actggtcgtc gggtggggtg gaactgctgg ccgacgacca    61620
gccgtggccc gagacggggc agccccgccg agccgccgtg tcctcgttcg gggtcagcgg    61680
caccaacgcg cacgtcgtcc tcgaacaggc gcccgcctcg gagaacccgc ccctccgccg    61740
tccgggaggg gaccgcgtcg cggcgcgccg ggtactcccg ctggtgatct ccggcaagac    61800
gccggaagcc ctgcgggctc aggcggggaa cctggtgtcc catgtgcgcg agcacccgga    61860
cctccggctg gaggacctcg ggtactcgct ggccaccacc aggtcggccc tcggacaccg    61920
ggccgtcgtc gtggcggaca cccccgacgg attcctccgt ggctgcgagg cggtggagcg    61980
cggcgagacc ccggcgtcgg tggaccgggg cgtggtccgg gggcgcggca cgaccgcgtt    62040
cctgttcacg gggcagggcg cccagcgggt cggcatgggc cggcagctct acgcggcgat    62100
ccccgcgttc gcgcggttcc tcgacgaggc ctgctcccat ctcgaccgct ttacgaagca    62160
gcccctgagg gacgtgctgt tcgctgccga gggcagcgcc gaggcagcgc tcctggaccg    62220
taccggattc gcccagccgg ccctgttcgc cctggaggtg gcgctgttcc gcaccctgga    62280
gtcctggggt gtgaccccgg actacctcgc cggacactcc atcggtgagc tcgctgccgc    62340
ccatgtggcc ggtgtgctct cgctgggaga cgccacccgg ctggtgaccg cgcgtggcaa    62400
cctcatggaa cagctccccg cggggggcgg catgctcgcc ctgcaagctt ccgaagccgg    62460
ggtgctcccg ctcctcgacg gcgccgatgg cctggtgtcc gtcgccgccg tcaacagccc    62520
ccgctccacc gtggttgccg gagacagcga cgccctcgcc gccctcgccg gccaggcccg    62580
ctctcagggc atcaaggccc gccacctcac tgtcagccac gccttccact ccccgctgat    62640
ggaccccgtc ctcgacgcct accgcgagac cgccgagcag ctctcctacc acccgccgcg    62700
tatcccgatc atctcgaccg tcaccggccg gtccgtcacc accgagatgt ccgaacccgg    62760
ctactgggtc cggcacgccc gcgaggccgt ccggttcacc gatgccgtgg ccacgctccg    62820
gcagcacggc accaccgcct acctggaact cggccccgac gccgtcctca ctgccatgac    62880
ccgcgaacac ctggcgggcg acggcacctc gggcaaggag tccaccttcg cggcggtgat    62940
gcgcaggaac cggccggagc cggaggtcct gaccagcgcc gtgtcccagc tgttcgcccg    63000
gggcacccgc gtcgactggc gggccgtgtt cgcggatgtg gatgggcagg tcgtccagct    63060
gccgacctac gccttccagc gcagccggta ctggccgcag gcatcactga cccggccggc    63120
cgggggcgcc tccgcgacgt cgctgttcca cctgcgctgg gtgccggtga cggcccagga    63180
cacggcgccg gcggacgact gggcgttgct cggcggggcc gacgcgctgc ccggccaggg    63240
cttcgccgac ctggcgtccc tgggggagac gatcgacggc ggatcggccg caccccgcac    63300
ggtgtgtgtg ccgttgctgc ctccggccga cggcgcccag gattccgccg ccacgcacga    63360
cgccgcccac cgggcgctgg cgctggctca ggcttggctc gccgacgatc gcttcacctc    63420
ctcccggctg gtgttcctca cccgtggtgc ggtggccgtg accgacgagg aataccccga    63480
ggactccgtc gacgccttcg catacgcctc cgtgtggggt ctgctgcgtt cggcccagac    63540
ggagaacccg ggccggttcg gcctggtgga cctcgacccc gacgccgacc cggacgcggc    63600
cgggcagcgg tgcccggtcc cggccgccgc cctggacggc gacgaaccgc agctggcgat    63660
gcgccgaggc gtggtccacg ctccccggct cacccgggtc acggccgcgc ccaaggaccc    63720
ggaccgggca cccgccgggt tcgaccacgg cggaaccgtg ctgatcacgg gcgccaccgg    63780
tggactcgga ccgctgctgg cccgccatct ggtcgtcgag cacggcgtac gccacctgct    63840
gctgacgagc cgtcgcggcg cggcggcgag cggcgcccag gcactgctgg acgagctcgc    63900
cgacctgggt gccgaggcca ccgtggtctc ctgcgacctg gctgaccggg aggcggtggc    63960
cggcctgctg gcccaggtgc cgcccgcgcg tccgctgacc gcggtggtgc acgccgcggg    64020
cgtcctggac gacggcgtga tcccgtccct gagcccggaa cgcgtcgacg gggtactgcg    64080
gccgaaggcg gacggggccc tgcacctgca tgagctgacc aaggatctgg acctggccca    64140
cttcatcctg ttctcctcga ccgccggtgt cctcggcagt gccggccagg gcaactacgc    64200
ggccgcgaac acgttcctgg acgcgctggc ccagcaccgg cgggcagcag ggctggccgc    64260
tgtctcgctc gcctggggaa cgtgggaacc gagcggcggc atgaccggcg ggctgacgcg    64320
cgcagacctg gagcgcatga cgaagggagg catgccaccg ttgtcccccc gggacgggct    64380
ggcgctcttc gatgccgcca tcgcttcggg gcgggccctg gtggtgccgg ccgtgctcga    64440
tctcgacctg ctgcgttccc ggatcgggac gaacgtaccg gcgctgctgc gcggcctcat    64500
cgagccccgg cccgtggagc cgtctgcccc aggggaggca gccgaggcac tcgccctgcg    64560
gatggcctcc tgctccgccg cggagcgcac gggcgtactc ctggacctgg tccgcgccga    64620
cgcggccacg gtgctgggac atgacggtcc gcacgccatc gacccggagc gtggactgct    64680
cgaagcgggc ttcgactccc tgacgacgct ggagctgcgc aaccggctgg ccgaggccac    64740
cggactggcc gtcccggccg gttacctcta cgagtacccc accccgaacc tgcttgccga    64800
acacctggcg gccgcgttgg ccgagtcgcc gcagtccggc gcggcgaccg gagccgacgg    64860
accggccgag ccgctgagcg tgctcttcca gcaggcgtat gacctcggca aggtcaccga    64920
gggcatgacc ctgctcagga gcgcgtccgc gctccgcccg acctacgaca ccccttcgga    64980
cctcagtgaa ctgccgcagc ccactcgcct ggcccgtggc cccgaacgtg ccacgctgct    65040
gtgcttctcc gccatcgtgg cactcgcggg ctcgcaccag tactcgcgct tcgcctcgtc    65100
cttccgcgag gaacgggacg tctcggtcct ctacgcgccg gggttcttcg ccggggagct    65160
cctgccgacc agcctcgaaa cggtcatcga cacccaggtg gaaaccgtgc ggcagcaggc    65220
cgcggacggt ccggtggtgc tcgtcggcgc gtcttccggc ggctggctcg cccatgccgc    65280
cgccgcccgg ctggaggcgc tgggaacacc accggcagcc gtggtcctgc tggacaccta    65340
cctgccggac gaccagttcc tcgcccgtga ccaggaccgt ttcatcggcg gagtcttcga    65400
ccggcaggac cggttctcca tccgggagga cgtcagcctg tccgcgatgg gctggtatct    65460
gcacctgttc gacggctgga agcccaccgc gatctccgtc ccggaactgc tggtccgggc    65520
gagtgagccg ctgcccagcc cttccggccg cccgccgagg gccgccgact ggcggacctc    65580
atggcatgtg gcacagcaca gcgtcgaggt gcccggcgat cacttcacga tgctggagga    65640
attcaacgac gccacggccg acgccgtccg acgctggctt ctcgacattg actgaaaggc    65700
ctgtccatgg atctggaaac ccaacttctc tccccggcat acctacggaa cccgcacccg    65760
ctcaacgccg cattgcgttc cgccgaccct gttcaacgtg ccgtggcttc ggggggcctg    65820
tccgtctggg tggtgacccg ctacgaggac gtgcgcgcgc tgctcgccga ttccaggctg    65880
ggcaaaggcg tcacgcagct ccgcgaggcg gtactgctca acgcgggtga cgacgagcgg    65940
atcagccagt tcaccgactc cctcaccgag cacatgctca acagcgaccc acccgaccac    66000
acccggctgc gccgcctggt cggcaaggcg ttcaccgccg gccgcataga acagcttcgc    66060
cccaggatca cggagatcgt cgacaatcta ctggaccggc tgagtcccgg tcaggaggtc    66120
gacctcgtcc ctgtcttcgc cctgcccatg ccgaccactg tgatctgcga actgctcggc    66180
gtgccgtccg tcgaccggtc gtcgttcagc cactggtcca atgtgctggt gtcgaccgcg    66240
gaagtcggcg aactggccga ggccggcgga gcgatggtcg cctatctggc acagctcatc    66300
gcggacaaac gcgccaaccc ctgtgacgac ctgctcacca agctggtgca agccaccgac    66360
aacggcgacc agctctccga gacggaactc gtggcgacgg ccttcctgct gctgtccgcc    66420
gggcacgaga ccacggtgaa cctcattgcc gccggtacgc tcactctgct ccagaacccg    66480
gaccagctcg cccggttgcg ctccgacctc acgctgctgc ccggcgcgat cgaggagctc    66540
atacggtacg acgggcccgg cggcatggtg ctccggcaca ccctggagcc ggtcgaggtc    66600
ggcggtgtga ccatcccggc ccagcaggtc gtcctgctct cgctgtcctc ggcgggccgc    66660
gactccaccc ggttcagcga cgccgaccgg ctcgacatcg gccgtcccat cgggggcagc    66720
gtggggttcg ggcacggtat ccaccactgc atcggcgccc cgctcgccag gctggagggc    66780
gagatcgcgt tccgggccct gctcacccgc ttccccgacc tgcggctcgc ggtcccgccg    66840
gaggagctga actggcgcga cagtgtcttc atccgcggcc cggaatcgct gcccgtggtg    66900
ctgtgacgcg catggggaga ggggaccgac ccgtcagtgt cggtcccctc tccccatacc    66960
cggcggctac gccgacatga ggatccgacg ggtgctttcg actacctcgg cgatctgccg    67020
atgcccgaag cagctgggcg aatacgggac ttccagggcc agccggccct ccacggtgat    67080
cgccgacacc accagcggcc cccgcccctg ctccggcgac cagttctccg gtaccgggat    67140
ccaccgcaaa ccgcccagct cgagcccggg gggtgccacc aggtccgcga cacggcccag    67200
gttggtgagc acgagactgg ccgccagcag agcgggattc tcaaagaagt ggcgcaccgc    67260
gaggatctcg cgttcgggat cgccccgctc gacacccgcg cgaagccggt cgtagaccag    67320
ccggccgagc gtgcgcacat ccgcccgcgg ggagacttcg acaatgtcgt agaacgacgc    67380
ggcggccagc accagggtct cctctgccag cggtggagtg acccggtgcc ggaagtcgac    67440
gggggacgcc aaggccagcg aaaggggtgc gtcggtcgct tcgagggcgc ggcgcaccgc    67500
gatgagcagt gccgccgcca ccaggccctg taccgagatc ccggcggccc gggcggatcc    67560
ggcgagccgc gtcgtctcgt cggaagtgag ccggagggtc cttacgtgta tctcgccctg    67620
ctccggcgct tccacgcccg ggtcccccag atagggcagc agcacggggg gaaggcgctt    67680
cgcctgctcg gcccggcggg ccgcgtaggc gaggacatcc gcctccgggt gatggccgag    67740
acgggtctcg atgggcgccg ggtagctgtc ggccacgtgt gccgaggacg ccatcggccc    67800
ttcgcccagc gcggcgtacg tccgccacac cgccgacagc aaggcgacca cgctgcggcc    67860
gtcgcagatc cggtgatcga catggagtat gaaggtgtcc tccgccgcgc cgcgcagcag    67920
ggtggcgcgg accagcgggc cgcagcggtc cagccggctc cgcatctccc ggtcgaggtc    67980
ccaggagccg gcccggcgga cgacgagttc gggcggcccg tcgtccagcg ggtgcagcac    68040
caactcggta ccgtccggcg atatccggct ccgcaaggag gggtgcgcgg ccacggacga    68100
ggcgaaggcc cgttggagaa gctgttcgtt ggtatcgccc cgtaccgtgc acagcgccat    68160
gattctcgtg agacctggcc cggagagcat gagctctccc gtggacagct cacgtcgggt    68220
attcggttgc atgtttgctt gcgcctttcc gttgcccggg gccgagctac tggggcgagc    68280
cgacgatgga ttcccgttcc cgggaggtga gagggggccc ggtgagcggc ggccgggtag    68340
ggccgagaag ggtctcgaag acgatccggg gcgtcatcag ccgggtcagc ggggccgaca    68400
gggtgaacgt gtccgacacc gcggcggcca cccgggggcg gtcggctgcg gtcttggtca    68460
cccggttgac atagcgccgc tgcatccgcg cggccagccc cggccgccgg ccactcacat    68520
tcgggtagaa gatgtcctgt cctgtggcca tcgcccacgc attgttgacg gcgcccgcga    68580
cggcggcctg tgtggcgcgg ctcgtcccgg ccaccaaccc gtcgctccgc aggacgtcgc    68640
gcagcgccga agcgctcatg gcggccaccg acatgccgtg cccgtacacc gggttcaggg    68700
cggccgcggc gtcgccgagc accacgaagc ccttcggcca gtcggccagt tcctcgtagt    68760
agcggcggcg gttgaccgtg gtgcgactgc tgtggatcgg cccgatcggc tcggcgttcg    68820
cgatgaggtc cccgatcacc gaatgccgca gtctccgggc gaacgccacg aagccttccg    68880
gatcacgcgg cggctcgcac ccacgggtcc cggtcagcgt gacgatccac tgtccgtcct    68940
cgatcggcag cagcaccgcg ccctggcccg gctggtcgtc ctccgggtcc ggcagcacgt    69000
tcacgatggg aaagccgctc tccgccccgg ccggcgcgcg gtaccggcgg gtggcgtagg    69060
agagcccgat gtcgatcttc acctcgcgca cggcgggcag accgagcgcc tggagccagg    69120
tgttcgcgcc ggatccacgg ccggtggcgt ccaccacgaa gtccgcgtcc agccggagcg    69180
attccccgga cgcccggtcc tgggcctgga ccccggtcac ccgggtggca tcgccgtcga    69240
gcccctggac gtcaacaccg ctccgcaggg tgatgcggtc gtcttccagg acgaggcgcc    69300
gcagcgtcca gtccagcagc ggacgaccac aggtgaccat gaactgggcg ccgggcatcc    69360
ttcgggccca cccctgccgt gagcaggaga cgagcccgct gggtacctcg gtccggtgcg    69420
caccggcggc cagcaggcgg tggaggctcc cgggcaccag cgagtcgatg gtccgtgcgc    69480
cgttcgacat caggatgtgc gagtggaggg tctgtggggt gccctttctg acttccgggc    69540
cgtccggtac ctggtcccgg tccagcatca ctacctcgtc cacgaacttc gcgagcacgg    69600
atgccgtaag ggcaccagcc agaccgctgc cgagaactat tgcgcgattc accatatcca    69660
tcgtcctttc aacgtcgcag aacacgtaat taatacgccg aattcaagcc gtgatttctc    69720
cgacttagtg cgacggggat cgcgcctcaa tactcctggg ccccctcggt ctccccgtgc    69780
gtgcagagtg gatgggttta tatccgttgc cgttcgatga ggtcggcaag gaaaacaatg    69840
tggtttgcgc gacgctaccg gtgtttccct ctccggggtg atcgccttcg tcgtgccgtt    69900
gattggaggt tcccctgaag attcttttcg gtaatcgcta tggcgccgcg caggcctgcg    69960
gccggcatgg tcatgccgcc ggggcggccg tgcacccagg tcctgtccgg gtctcctcat    70020
gccgtctggg gcagggccag ctggagctcg agaggcaact cctcccggcg ggtgatgtcg    70080
agcttgcggt acacgcgggt caggtgctgc tccaccgtgc tcatcgtgat gaacaacttg    70140
gccgagattt cacggttggt cagacccttg gccgccagtg cggcaactcg gcgctcggac    70200
tcgctcagat tggcgccgac gtccgctccg cggaattcga gcgccgagga catgccaccc    70260
tcgggggagg gacgatggct ggagccgatc ggctcggacg ggacctccgc actgcaatcg    70320
cctgcgatct gccgcgccat atggcggatg gcgtcggcac gcctgcccac gcccagttcc    70380
tcgtaggtgg acgccaggtc agcgaggacc ttggccagtt gcagccggtc cccggtctcc    70440
tgtaaccgct cggcagcctg gatgagcagt cgtgtccgtt cgcccggctc ggcgaacatc    70500
gcgcggacgc gcagcactgc accgtccgtc gccgcgccta tgccggccgt cgcgctgtcg    70560
tactcggcca gcatccgttc cgcctgctcc cgatcgttga gccggagcca ggcatgggcg    70620
gagtccacct gccagggcag ttctgccgac ggagccagac cccagcgctc cgcgagccgg    70680
ccgatgctga ggaagtcgga gagcgcgagg tggggccggt tgacggccag ggcgtagtgg    70740
ccgcgggcac ggagatacgg gagcccgtag acactccgga acagcgcctc gggaaccggg    70800
cggtccagca gatgagcgac gtccttgtaa cgtcccatct cggtgtagac agtcatcagg    70860
acggtcagcg ggccgccgtg cagccaggtg ctggacggtt cggcgaggcc gtccagggac    70920
atccatgcga acgtctcggc ctcggtcagc ttgccctgtc tcagcgcgat atcggctcgc    70980
acggcggcga acagccgttg ccagcccggg ataccccgca cggtcgcgtt cttcaggaaa    71040
acgtcgcacc acgtagccgc cagatccagc cggccgaccc gcgtgagcga gttcagctcg    71100
gtgaggatga ggctgagcgt catgtcggac agcggcgtgg tccgcagcag tttctccgag    71160
tcctggatat ccccgggctt gcgtcccagc tccttgatcc aagtggccag cgcccccagc    71220
gcgtcgctgc gggaggtgcc atcggcgcag tcctttccgg acagaccgtc cgccagagcg    71280
cgggatccgg cacaccaggc cgccggcatg ccggtcatcg gggggaagaa ccacagccac    71340
gtgttgccga cgaccgtcag gtccgttgta ctgcgaagac cgcgcagggt gggccgtacc    71400
tcccgcagca gttctcccgc ttcctccacg cggcccaggc tgaccagcag ttggatcagc    71460
agaacggcat cgacggggca gagctcgggt cccggtgccc gctccccgca gtagccgtcg    71520
agatggtggc gttcgacgga acaggggtcg acgcgccacc tgacgagtgc ccgcttcagg    71580
cggatgtggc cccgctccca ggagtcggtg gaggcgtcat gggccagttc gaggtacgcg    71640
ccggcctgtt cggcgtcgtc cgagtccaac gcctcctcgg cggcgtgccg cagggctccc    71700
acatgccagg gttccgtcgc cgagcccgct tcgagcaggt ggcgggcgat cgtacggctg    71760
ccgacgccgt gccgactcag cagttccgcg gcccggtggc gcagttcggc gcgctgcttg    71820
gggccgatga tgttcagggt cgcgcgctcg accaaggggt gctggaaacg gtagccgtcg    71880
accagtccgg ccgaggccaa cgcaaggata ccgcgcgcga tctcggcggc gttcagcccg    71940
agcagctcct ccaacagttc cggcctggag tcctcgccca ggaccgcgat gccggtggcg    72000
agggacacca ccgcggggtc gttgccctgc acgcagttga ccgcggcctg cgcgaagagg    72060
ccgtcggcgg caggccacgg ggcggtttgg cctgcggcgt tgcggacccg gtgttcttcc    72120
aacagcgccc gcacgagcag ggggttgccg ccgctcagcc ggaacacgtc gtccaggaag    72180
gtgtcctccg ccggccggcc ctccagggcg ccgaccaggt cgacgacatg gtcccgggtc    72240
attgggcgca gcgcgatccg gtggagattg ggctgccgca ggagctcgca gtggaactcc    72300
ggcccgagtg atgtgcggag tgcctgtacg acgatcagca tcagcctgct ggaccggagc    72360
ctggcccgtg tggcctccag cagccagcgc cagctcaggc tgtcgagatc ctgtaggtcg    72420
tcgaggcaga cgaccaccgg tgaccggtcg gccagggcct cgagtcggcc gcagaactcc    72480
acgaactcgg cggtttgtgc cgaactcatc gagctcatcc tgggaacatt gtcgaatcca    72540
aggtcgcggg cgttcaccac gaccgctccg gaggccttca catgctcgcc gaaatttacc    72600
agtaattcgc ttttcccgca gtaggcaccg ccctccaata ccacggtcac agccttgccg    72660
atctcgcatt cgacaagcaa ggatttcagt agatcaagtt ccgagtcccg cccgaagaga    72720
tgcatccgaa ttgaatcccc aatctccacc acgaaatgag tgccacgatc gactccggtt    72780
gcaaatcggg ccggccggcg ggttggttgc catacggttc gcctcgctcg tggccgaatc    72840
taagcgctgt cacgcggcga ttggggcact acaccgggca agtaagcggc aactcaggca    72900
ggtgacgtgc cgcccggctc gactggacgc ccgggttgca gaacacccgc cgaatgtggc    72960
cggaggactc gcttttccag aagacgccct ggtgtcggcc gagcccgcgg ttgagcgctt    73020
ccggccactt ctggccggcg cccgaatcgt cacgaccgaa accggtccgc accaggatcc    73080
atccgagacc caggcgcgct gcacgatcgg gcggagtgaa cgtctccgtc gactccaacc    73140
gcccgccgca ccgttcaagg caccgagtcc gtggggtcgg tcagccggtt gatcagcacc    73200
tcccgcacaa agggggacgt cacgcggacg gctcggttac tcctgctcgg ccgtcaggac    73260
ggacaggcag tgccggagtt ccccggcctc cgacggccgc catgggattc gacgacaagg    73320
agcgcccatc cccgcctcgc gggccgacgg tgacccggga ccagatctgg ctggagatca    73380
tccagagcgc actcgaccgt gcaccggctc ctacggcgcg gcgctgacac gctacgtgca    73440
caccgaaggc gtcacggtca tcgaggtcaa ccagccggac taggccaccc gccgccgacg    73500
cggcaagacc gacgctcgac gcggcgccgc cgcccaagcg gtgctgtccg gccgcgccac    73560
cgccaacgcc aagaccggcg gcagagacaa ccctgaacgg atggtcagcg aggcatcctt    73620
cgccgcactc ggcggcgtca gcccggtgga gtcatcctca gccaggaccc aacgccgcag    73680
gttcaaccgc ggcggcgacc gccaagccaa cggtgcgacg tcacatgtcg ggaacacccc    73740
gccgtcagcc acgtactggc ggagggtcag gggccgaagg cactggttct ggctcccgga    73800
aacgatgtga gcgtgccccg ggtcaggttc tggatccggg cacctgcgtt gtcacctgcg    73860
ggagttgtcg ggcactccca tcgcggcgaa caacgcgtcc gccgcaccac gtacatccga    73920
tgctcgcatc gcgccgagag cctgagcggc ctgggccata cacgccacgc actcgactgg    73980
gtgagctgca aggcgcgctc cgcgtcgtcc gtggcctccg tcggacggcc gagacggtga    74040
aggacgtcga ccgaacgtcg cgagggccag cgcgacgttg ccccggatcc cgcgtctcgt    74100
cgcacaactg ccgggccgta acccgctctt ggaccaccgc atggtagcgc cttgccgggc    74160
tccaggggag gagtggtcgg cacgcgctct tggattgccc cgcgatgctg attctggtgc    74220
ctcgacccaa ccttcgagcg gatccaggac gttgaacctc agctgctcct tcgtgtggtc    74280
cgctgtcaag cccctctgca cgtgacgtgc atgaaatctt ccgatgcagg gtgcgtttga    74340
ac    丂                                                             74342
<210>2
<211>3793
<212>DNA
<213>链霉菌属
<220>
<221>CDS
<222>(1322)..(2548)
<220>
<221>CDS
<222>(2564)..(2761)
<400>2
ctgcagctcg acgtgcgggt cggacttcac gttgaagtac cagaccggat gcttgggcgc    60
accgcccagc gaggcgaccg ccgcgtaact cccctcgtgc tcgacccgca tcagcggcgt    120
cttgcggatc tttccgctgc gcgcgccccg ggtggtgagc acgatgaccg gcagcccggt    180
gtcccgcagc gtggtgccct tggtgccccc ggaactctcg tacagctcga cctgctcgcg    240
cacccactgc gtcgggctgg gctcgtactc gccctcaagt ggcaagggat ccgtctcctt    300
cgtcggtccg gcggatggtg ctccggacgg tcccaactcc cgcggccgcc cggatcatcc    360
gtaccgcatg ccccttcgcc cgagcgggtg atcaccgttc cggccatccg gtcgtccgca    420
ccgcgagcac caggatcacg gcgctggaga gcagggccgt gaccagccgc ccccggtggc    480
ccgtcagggc gcgacccagc agcgcgcccc cgcccgccag cagtagctgc cagctcgcgg    540
acgcggcgaa ggccgccgcg gcgaacaccg cccgtttcag cggccgtgcc gcaccggcgg    600
cgccgctgcc gagcaccagc gccacgaagt agaccaccgt catgggattg agcagggtga    660
tcccgagaag gccgagataa gcccctgccg cgcctggaac cggccgttcc gggcgggtgg    720
tgagccgatg ggcgcggtac tgccgcaggg cgagcagcgc cgcccgcagc gcgagcaccg    780
cgaggaccag cgccgaggcc cagcgcagcg ggtccagcac cggccgcagc tgtgccgcga    840
gggcggcgcc gcccacggtc gcgagcagcg cgtacagccc gtcggccgtg gcgacgccga    900
gcgccgccga ggcgccggtg cgcagcgagg tgcgggcggt gagggagacc agataggtcc    960
cgaccgcgcc gacgggcacc gcgatgccgt acccggcgag caggcccgcg agcagcgcgc    1020
ccgtcacggg cgtgcgggac tggttcctcc ggggacggcg gggctgctgt cggcccggca    1080
ccgcgggggc ggtggcagcg ggcgtcggca ggagggaggc tgtaggaggc atgggccgat    1140
cctggggccg ccgcgcccgc accggcaaat gaattacggc gcgttccagc ccccggccgg    1200
ctcgctcttc ggccacttca ccgcgtacgg cgatctggcc gaacttgctg tcgccccata    1260
ggtgcctcgg gcatctaatg aagatcggca cgacgcacct cttcgtctgc gaggtctttc    1320
c atg acg gaa ctg acg gac atc acc ggc ccg ggg acc ccg gcc gaa        1366
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Gly Thr Pro Ala Glu
1                 5                  10                  15
ccc gtc gca ttc ccc cag gac cgc acc tgc ccc tac cac ccc ccc acc    1414
Pro Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr
                 20                  25                  30
gga tac ggc ccg ctg cgc gac ggg cgc agc ctg tcc cgc gtc acc ctc    1462
Gly Tyr Gly Pro Leu Arg Asp Gly Arg Ser Leu Ser Arg Val Thr Leu
             35                  40                  45
ttc gac ggc cgt gag gtc tgg atg gtc acg ggc cac gcc acc gcc cgc    1510
Phe Asp Gly Arg Glu Val Trp Met Val Thr Gly His Ala Thr Ala Arg
         50                  55                  60
gcg ctg ctc gcg gac ccc cgg ctg tcc acc gac cgc acc ctc ccg ggc    1558
Ala Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Thr Leu Pro Gly
     65                  70                  75
ttc ccc gtg tcc acg gcc cgc ttc gcg gcc gtc cgc gac cgg cgg gtg    1606
Phe Pro Val Ser Thr Ala Arg Phe Ala Ala Val Arg Asp Arg Arg Val
 80                  85                  90                  95
gcg ctg ctc ggc gtg gac gac ccg gtc cac cag acc cag cgg cgg atg    1654
Ala Leu Leu Gly Val Asp Asp Pro Val His Gln Thr Gln Arg Arg Met
                100                 105                 110
atg atc ccg tcg ttc acc ctc aag cgc gcg gcc ggg ctg cgg ccc acc    1702
Met Ile Pro Ser Phe Thr Leu Lys Arg Ala Ala Gly Leu Arg Pro Thr
            115                 120                 125
atc cag cgg acc gtc gac ggg ctg ctg gac gcg atg atc gag aag ggg    1750
Ile Gln Arg Thr Val Asp Gly Leu Leu Asp Ala Met Ile Glu Lys Gly
        130                 135                 140
ccg ccg gcc gag ctg gtc tcc gcc ttc gcc ctg ccc gtg ccc tcg atg    1798
Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met
    145                 150                 155
gtc atc tgc ggc ctg ctc ggc gtg ccg tac gcc gac cac gag ttc ttc    1846
Val Ile Cys Gly Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe
160                 165                 170                 175
gag gaa cag tcc cgc acg ctg ctg cgc ggt ccc acg gcc gcc gac tcg    1894
Glu Glu Gln Ser Arg Thr Leu Leu Arg Gly Pro Thr Ala Ala Asp Ser
                180                 185                 190
caa ggg gcg cgc gag cgg ctc gag gag tac ctc ggc ggg ctg atc gac    1942
Gln Gly Ala Arg Glu Arg Leu Glu Glu Tyr Leu Gly Gly Leu Ile Asp
            195                 200                 205
gac aag gag cgg cag gcc gaa ccc ggc gac ggc gtc ctg gac gac ctc    1990
Asp Lys Glu Arg Gln Ala Glu Pro Gly Asp Gly Val Leu Asp Asp Leu
        210                 215                 220
gtc cac cag cgg ctg cgc acc ggc gag ctg gac cga cgc gac gtg gtg    2038
Val His Gln Arg Leu Arg Thr Gly Glu Leu Asp Arg Arg Asp Val Val
    225                 230                 235
gcg ctg gcc gtc atc ctg ctc gtg gcc ggg cac gag acg acc gcc aac    2086
Ala Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn
240                 245                 250                 255
atg atc tcc ctc ggc acc tac acg ctg ctg cgg cac ccc ggc cgg ctg    2134
Met Ile Ser Leu Gly Thr Tyr Thr Leu Leu Arg His Pro Gly Arg Leu
                260                 265                 270
gcc gag ctg cgc gcc gac ccg gcg ctg ctg ccc gcc gcc gtg gag gag    2182
Ala Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Ala Val Glu Glu
            275                 280                 285
ctg atg cgg atg ctc tcg atc gcg gac ggg ctg ctg cgc ctg gcc ctg    2230
Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu Arg Leu Ala Leu
        290                 295                 300
gag gac atc gag atc gcc ggc gcc acg atc cgg gcc ggc gag ggc gtc    2278
Glu Asp Ile Glu Ile Ala Gly Ala Thr Ile Arg Ala Gly Glu Gly Val
    305                 310                 315
ctg ttc tcc acc tcg ctg atc aac cgc gac gag tcc gtg ttc gac gac    2326
Leu Phe Ser Thr Ser Leu Ile Asn Arg Asp Glu Ser Val Phe Asp Asp
320                 325                 330                 335
ccc gac acc ctg gac ttc cac cgc tcc acc cgc cac cac gtg gcc ttc    2374
Pro Asp Thr Leu Asp Phe His Arg Ser Thr Arg His His Val Ala Phe
                340                 345                 350
ggt ttc ggc atc cac cag tgc ctg ggc cag aac cta gcc cgc gcc gag    2422
Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu
            355                 360                 365
ctg gag atc gcc ctg ggc acg ctc ctg gag cgg ctc ccc ggc ctc cgg    2470
Leu Glu Ile Ala Leu Gly Thr Leu Leu Glu Arg Leu Pro Gly Leu Arg
        370                 375                 380
ctg gcc gcg ccc gcc gag gag atc ccg ttc aaa ccc ggc gac acg atc    2518
Leu Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile
    385                 390                 395
cag ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggctctgg tc atg cac  2569
Gln Gly Met Leu Glu Leu Pro Val Thr Trp                   Met His
400                 405                                   410
atc gac atc gac aag gac cgc tgc atc ggc gcc ggc cag tgc gcg ctg    2617
Ile Asp Ile Asp Lys Asp Arg Cys Ile Gly Ala Gly Gln Cys Ala Leu
            415                 420                 425
gcc gcc ccg ggc gtg ttc acc cag gac gac gac ggc tac agc acc ctg    2665
Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr Leu
        430                 435                 440
ctc ccc ggc cgc gag gac ggc ggg ggc gac ccg atg gtc cgg gag gcg    2713
Leu Pro Gly Arg Glu Asp Gly Gly Gly Asp Pro Met Val Arg Glu Ala
    445                 450                 455
gcc cgc gcc tgc ccg gtg agc gcc atc cgg gtg acc gaa ccg gcc ggc    2761
Ala Arg Ala Cys Pro Val Ser Ala Ile Arg Val Thr Glu Pro Ala Gly
460                 465                 470                 475
tga ggcggggccc ggcggccgcg gcccgctgcc gggaccgccg ttcccagttc agtagg  2820
gtcgtgcgat gacctcacag gccgggaagc ccttcctcta cgtcgtcgtc tgcgcggccg  2880
ggaccgccgc cggagtcacc acgctgatcg gcgccgccca ggcgcggggc tgggaggtgg  2940
gggtcctggc cacgccggtg gcgatgggcg ggttcttcga cacggctgcg gtcgaggaga  3000
tgacgggccg gcccatccgc tcggcctggc gctcgccggc cgatccgcgc ccgttcccgc  3060
cgccgggcgc cgtggtggtg gcgcccgcca ccttcaacac cgtcaacaag tgggcggccg  3120
gtctcgccga cacgctcgcc gtcggcacgc tctgcgaggc ggcgggcctc ggcgtgccga  3180
tcgccgtcct gccctgcgtg gcggacgcgc tggccgccca ccccgcgtac cgggagggcc  3240
ttctccggct gcgtgggatg ggcgtccgct tcggcgagcc gtacgccggc ccgccggggg  3300
aggacggcga ggcggacggc gcacggcccg ggttcgcctg ggagaacgcc ctggacctgc    3360
tggagcgggc ctgaacccgc tccccgaccc gtagggcctg tctgacactg tcagacaggc    3420
cctaacggca ggtcagcgcc ggcccggcca gcatgccgcc ggtgtagagg tcctggcccc    3480
gcggcagcca gtagcccagc ctggagacca ccgtggagca gtcaggcccg acggtgacgc    3540
ggaccttcac cgtctcggga cggccgggct gcagcgcggt cagcgcgcag tccagggagt    3600
acgcgagccg ggtcttcgag gtaccggccg accagcgggt tgacgcagcg ggcgtcgtcc    3660
gtggcgatcc gcaccccggt gcccgccccg ccgatgagtc cgagccgggc gctgccgtcg    3720
ccctcgtcgc tgtcccggcg gaccgtgtag gtcagcgtgg tggtggcgtc gcgccgcagg    3780
gtgtccggtc gac                                                       3793
<210>3
<211>2329
<212>DNA
<213>链霉菌属
<220>
<221>CDS
<222>(420)..(1604)
<220>
<221>CDS
<222>(1643)..(1834)
<400>3
ggatccacgg gtggccgccg cgctcgcccg ggtgaccgac cggcgtatcg gctatgtcgc    60
cgcgctcttc gcggcgctgg gcttccccga gggcgaggcg cgggaccgcg gcctgctggc    120
gtacaccgcc tacctcggcc acacccagct cggacatgcc gtccgacaga gcctgccggc    180
cgaggcggca cacgaccgct atctggatgg cgtgatcgac accctcgtac ggccgcggga    240
cggaggcgat gaagccgaac atgtcacaat ctgaacgagg ttggcggaac tgcgcgcaga    300
acatgcccgg tatccgcggc atgaggtgag atcggcgcgg cgaaacacgg tgcgccacag    360
cgttgccatc tcacacacga gcaactcgag ccacttgaga ctcgtacggg aggaaattc     419
gtg acc gaa gcc atc ccc tac ttt cag aac cgc acc tgt ccc tac cac      467
Val Thr Glu Ala Ile Pro Tyr Phe Gln Asn Arg Thr Cys Pro Tyr His
1                 5                  10                  15
ccg ccc gcc gcc tat cag cca ctg cgc ggg gcc ggc ccg ctg agc cat    515
Pro Pro Ala Ala Tyr Gln Pro Leu Arg Gly Ala Gly Pro Leu Ser His
             20                  25                  30
gtc acg ttc tac gac ggc cgg aag gtg tgg gcg gtc acc ggc cac ccc    563
Val Thr Phe Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Pro
         35                  40                  45
gag gca cgg gcg ctg ctg acc gac cag cga ctc tcc gcc gac cgg cag    611
Glu Ala Arg Ala Leu Leu Thr Asp Gln Arg Leu Ser Ala Asp Arg Gln
     50                  55                  60
aac ccg gcc ttc ccg gtc ccc ttc gaa cgc ttc gcg gcc atc cgc cgg    659
Asn Pro Ala Phe Pro Val Pro Phe Glu Arg Phe Ala Ala Ile Arg Arg
65                  70                   75                  80
gtc cgg acg ccg ctg atc ggg gtc gac gac ccg gag cac aac acc cag    707
Val Arg Thr Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
                 85                  90                  95
cgc cgg atg ctg atc ccc agc ttc agc ctc aag cgg acc gcc gca ctg    755
Arg Arg Met Leu Ile Pro Ser Phe Ser Leu Lys Arg Thr Ala Ala Leu
            100                 105                 110
cgg ccg gag atc cag cgg atc gtc gac ggg ctg ctc gac cgg atg ctg    803
Arg Pro Glu Ile Gln Arg Ile Val Asp Gly Leu Leu Asp Arg Met Leu
        115                 120                 125
gat cag ggc ccg ccc acc gag ctg gtc tcc gcg ttc gcc ctg ccg gtc    851
Asp Gln Gly Pro Pro Thr Glu Leu Val Ser Ala Phe Ala Leu Pro Val
    130                 135                 140
ccg tcg atg gtg atc tgc gca ctg ctc gga gtc tca tac gcc gac cat    899
Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Ser Tyr Ala Asp His
145                 150                 155                 160
gag ttc ttc gag gag gag tcc cgc cgc atc ctg cgc ggc cgg tcg gcc    947
Glu Phe Phe Glu Glu Glu Ser Arg Arg Ile Leu Arg Gly Arg Ser Ala
                165                 170                 175
gag gag gcg gag gac gcc cgg ctg aag ctg gag gag tac ttc acc ggg    995
Glu Glu Ala Glu Asp Ala Arg Leu Lys Leu Glu Glu Tyr Phe Thr Gly
            180                 185                 190
ctg atc gcc gcc aag gag aag aac ccg ggc gac ggg ctg ctg gac gag    1043
Leu Ile Ala Ala Lys Glu Lys Asn Pro Gly Asp Gly Leu Leu Asp Glu
        195                 200                 205
ctg atc gag gac cgg ctg cgg acc ggc gcg ctc acc cgc gac gag ctg    1091
Leu Ile Glu Asp Arg Leu Arg Thr Gly Ala Leu Thr Arg Asp Glu Leu
    210                 215                 220
gtc cgg ctc gcc atg atc ctg ctg gtg gcc ggc cat gag acc acc gcc    1139
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225                 230                 235                 240
aac atg atc tcg ctc ggc acc ttc acc ctg ctg gac cac ccc gag cag    1187
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Asp His Pro Glu Gln
                245                 250                 255
ctg gcg cag ctc aag gcc gac gag ggc ctg atg ccg gcc gcc atc gag    1235
Leu Ala Gln Leu Lys Ala Asp Glu Gly Leu Met Pro Ala Ala Ile Glu
            260                 265                 270
gag ctg ctg cga ttc ctg tcc atc gcg gac ggc ctg ctg cgg gtg gcg    1283
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
        275                 280                 285
acg gag gac atc gag atc ggc ggt cag gtg atc cgg gcc gac gac gcg    1331
Thr Glu Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Ala
    290                 295                 300
gtc ctg ttc ccc gcc tca ctg atc aac cgg gac gag gcc gcc tat ccg    1379
Val Leu Phe Pro Ala Ser Leu Ile Asn Arg Asp Glu Ala Ala Tyr Pro
305                 310                 315                 320
gca ccc gac gag ctg gac ctc ggc cgt tcg gcc cgc cat cac gtg gcg    1427
Ala Pro Asp Glu Leu Asp Leu Gly Arg Ser Ala Arg His His Val Ala
                325                 330                 335
tcc ggc ttc ggg atc cac cag tgc ctg ggg cag aac ctc gcc cgc gcg    1475
Ser Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
            340                 345                 350
gag atg gag atc gcg ctg cgc tca ctg ttc acc agg atc ccg cag ctg    1523
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Thr Arg Ile Pro Gln Leu
        355                 360                 365
cgg ctc gcc gtg ccg gcc gcc gag att ccg ttc aag gac gga gac acc      1571
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Asp Gly Asp Thr
    370                 375                 380
ctg caa ggc atg atc gaa ctg ccg ctg gcc tgg tag cagccaggac ggcaga    1623
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385                 390                 395
ccaaagaaag gggtccgga atg cgg atc gcg atc gac acc gac cgc tgt atc     1675
                     Met Arg Ile Ala Ile Asp Thr Asp Arg Cys Ile
                                     400                 405
ggc gcc ggc cag tgt gcc ctg acc gcg ccc ggg ggt ttc acc cag gat      1723
Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Gly Phe Thr Gln Asp
            410                 415                 420
gac gac ggt ttc agt gca ctg ctg ccc ggc cgg gag gac ggc gcc ggc      1771
Asp Asp Gly Phe Ser Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly
        425                 430                 435
gac ccg ctg gtg cgg gaa gcc gcc cgc gcc tgc ccc gtg cag gcc att      1819
Asp Pro Leu Val Arg Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile
    440                 445                 450
gcg gtc acc gac gat tag cagcaccccc gcggacgacc cggcagacgc gcgcggcc    1875
Ala Val Thr Asp Asp
455
ccggctgaca cccggcgccc gaggcgcgcc cgagccgtcc gcccctccac ttgtccctac    1935
ggcatccacc ccatccgcta ccgcaacacc ccttgggtga cgggcagttt cgaggacccc    1995
ggtgtgcccg gggcgtactg gtgaccgtca ccggcttcac gccgcgattg cccacatagg    2055
cgtcgtcgct cgcggcgatc acgaagcgcg gtcggtgccc cggctcgtaa cggtgcacga    2115
tgcccggcag ttccacggtg aaccgccggg ccacatcggg cacccgggcc ggggccacca    2175
acaggtgcac cagcgtcttc ctgccgttcg gcgcgacatc gtagagcttg gcgaacagca    2235
ccagcttgtc cgccgcatcc gcggaccgct gcgcccgccc ggcctgcggc gaggcaacct    2295
tcagcgtcac cctcggcgcg cccaccacgt cgac                                2329
<210>4
<211>1860
<212>DNA
<213>A-1560株
<220>
<221>CDS
<222>(172)..(1383)
<220>
<221>CDS
<222>(1399)..(1593)
<400>4
cggggatcgt acgccgtacc gtttcggggc aaccgaatta cgatgcggaa tggatggttc    60
ccagccagat cccgcaggta gccgatctgg ccgaacttga tgtcgtgcac tggatgcctc    120
gggcatctaa tgaagatcgg cacgacgcat ccttcgtctg cgaggtctcc c atg aca     177
                                                        Met Thr
                                                        1
gac acg aca gac ctg acc gag ctg tca gat ccc gtc tcc ttc ccc cag    225
Asp Thr Thr Asp Leu Thr Glu Leu Ser Asp Pro Val Ser Phe Pro Gln
          5                  10                  15
gac cgg agc tgc ccc tac cac ccg ccc acc ggg tac gac ccg ctg cgc    273
Asp Arg Ser Cys Pro Tyr His Pro Pro Thr Gly Tyr Asp Pro Leu Arg
     20                  25                  30
acc gaa cgg ccg ccc gcc cgc atc cgg ctc tac gac ggc cgc ccc gcc    321
Thr Glu Arg Pro Pro Ala Arg Ile Arg Leu Tyr Asp Gly Arg Pro Ala
 35                  40                  45                  50
tgg ctc gtc acc ggc cac gcc gtc gcc cgt gac ctg ctg gtc gac ccc    369
Trp Leu Val Thr Gly His Ala Val Ala Arg Asp Leu Leu Val Asp Pro
                 55                  60                  65
cgc ctg tcc acg gac cgc acc cgc tcg ggc ttc ccg gcc aca act ccc    417
Arg Leu Ser Thr Asp Arg Thr Arg Ser Gly Phe Pro Ala Thr Thr Pro
             70                  75                  80
cgc ttc gcc gcg gtc cgc gac cgc aag ccg gcg ctc ctc ggc gtc gac    465
Arg Phe Ala Ala Val Arg Asp Arg Lys Pro Ala Leu Leu Gly Val Asp
         85                  90                  95
gac ccc aag cac cgc acc cag cgg tgg atg atg atc ccg agc ttc acc    513
Asp Pro Lys His Arg Thr Gln Arg Trp Met Met Ile Pro Ser Phe Thr
    100                 105                 110
ctc agg cgc gcc acc gag ctc agg ccg cgc atc cag gag atc gtc gac    561
Leu Arg Arg Ala Thr Glu Leu Arg Pro Arg Ile Gln Glu Ile Val Asp
115                 120                 125                 130
gaa ctg ctg gac gtg atg atc gcc cag gga ccc ccg gcc gac ctg gtg    609
Glu Leu Leu Asp Val Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val
                135                 140                 145
cgt tcc ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctg ctc    657
Arg Ser Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu
            150                 155                 160
ggc gtg ccc tac gcc gac cac gag ttc ttc gag gac cag tcc agg cgg    705
Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu Asp Gln Ser Arg Arg
        165                 170                 175
ctg ctg cgc gga ccg gcg gcc gag gac acg cag gac gcc cgg gac cgg    753
Leu Leu Arg Gly Pro Ala Ala Glu Asp Thr Gln Asp Ala Arg Asp Arg
    180                 185                 190
ctc gcc gcg tac ctg gag gac ctg atc gac gag aag cgg cgc cgg ccc    801
Leu Ala Ala Tyr Leu Glu Asp Leu Ile Asp Glu Lys Arg Arg Arg Pro
195                 200                 205                 210
ggt gac ggc ctg ctg gac gaa ctc gtc cag cag cgt ctg aac gaa ggc    849
Gly Asp Gly Leu Leu Asp Glu Leu Val Gln Gln Arg Leu Asn Glu Gly
                215                 220                 225
gag ctc gac cgg gag gaa ctg acc gcg ctg gcg atg atc ctg ctg gtc    897
Glu Leu Asp Arg Glu Glu Leu Thr Ala Leu Ala Met Ile Leu Leu Val
            230                 235                 240
gcg ggc cac gag acc acc gcc aac atg atc tcc ctg ggc acc tac acg    945
Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Tyr Thr
        245                 250                 255
ctc ctg ctg cac ccc gaa cgg ctg acc gag ctg cgc gcc gac ccc gcg    993
Leu Leu Leu His Pro Glu Arg Leu Thr Glu Leu Arg Ala Asp Pro Ala
    260                 265                 270
ctg ctg ccg gcc gcc gtc gag gaa ctg atg cgg atg ctg tcc atc gcg    1041
Leu Leu Pro Ala Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala
275                 280                 285                 290
gac gga ctg ctg cgg cag gcc acc gag gac atc gag atc gcc ggg acc    1089
Asp Gly Leu Leu Arg Gln Ala Thr Glu Asp Ile Glu Ile Ala Gly Thr
                295                 300                 305
acc atc agg gcc ggg gac ggc gtg gtc ttc tcc acc tct gtc atc aac    1137
Thr Ile Arg Ala Gly Asp Gly Val Val Phe Ser Thr Ser Val Ile Asn
            310                 315                 320
cgc gac gag gac gtc tac ccg gcc ccc gac acc ctc gac ttc cac cgc    1185
Arg Asp Glu Asp Val Tyr Pro Ala Pro Asp Thr Leu Asp Phe His Arg
        325                 330                 335
tcg acc cgc cac cac gtc gcc ttc ggt ttc gga atc cac cag tgc ctc    1233
Ser Thr Arg His His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu
    340                 345                 350
ggc cag aac ctc gcc cgc acc gaa ctg gag atc gcc ctg cgc acg ctc    1281
Gly Gln Asn Leu Ala Arg Thr Glu Leu Glu Ile Ala Leu Arg Thr Leu
355                 360                 365                 370
ctc gaa cgg ctg ccc acg ctc cgg ctc gcc gcc cca ccg gag gaa atc    1329
Leu Glu Arg Leu Pro Thr Leu Arg Leu Ala Ala Pro Pro Glu Glu Ile
                375                 380                 385
ccc ttc aaa ccc ggc gac acc atc cag ggg atg ctg gaa ctc ccc gtc    1377
Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val
            390                 395                 400
agc tgg taa gaggctgccg tc atg cat atc gag atc gac aag gac cgc tgc    1428
Ser Trp                   Met His Ile Glu Ile Asp Lys Asp Arg Cys
                          405                 410
atc ggc gcc gga cag tgc gcc ctg acc gcc ccg ggt gtg ttc acc cag    1476
Ile Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Val Phe Thr Gln
                420                 425                 430
gac gac gac ggc ttc agt gac ctg ttg ccc ggc cgg gag gac ggc gcc    1524
Asp Asp Asp Gly Phe Ser Asp Leu Leu Pro Gly Arg Glu Asp Gly Ala
415             435                 440                 445
ggc gac ccg atg gtc cgg gag gcc gcc agg gcc tgc ccc gtg agt gcc    1572
Gly Asp Pro Met Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala
            450                 455                 460
atc acg ctg tcc gag gac ggg tag ggggccgagc cgcgccgccc gccggtccgc    1626
Ile Thr Leu Ser Glu Asp Gly
        465
tgccgcggcg ccgtgccgac gcggcggccg gccggcccgt ccggtgcccg tcgcgtcgcc    1686
ccgtggcccc ggcggcggct gattgactag ggttcccggg tgagcgaaca ggcccagaag    1746
ccctccgggg cgccgcccgc gaaagacacc gggacggcgc ccgggaaacc ccttcctcta    1806
cgtcgtcgtc  tgcgccgccg gcatcgccga aggcgtcagc aagctgatca ccgc         1860
<210>5
<211>23
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:KS-3F引物
<400>5
     gaccgcggct gggacgtgga ggg                                      23
<210>6
<211>24
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:KS-4R引物
<400>6
     gtgcccgatg ttggacttca acga                                    24
<210>7
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:CB-1F引物
<400>7
     atgacagctt tgaatctgat ggatccc                                 27
<210>8
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:CB-2R引物
<400>8
     tcagagacgg accggcagac tcttcagacg                            30
<210>9
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PKC-1F引物
<400>9
     gtgcgccgta cccagcaggg aacgacc                               27
<210>10
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PKC-2R引物
<400>10
     tcacgcgctc tccgcccgcc ccctgcc                            27
<210>11
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PDL58-1F引物
<400>11
     gccccgcata tggatctgga aacccaactt ctc                     33
<210>12
<211>31
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PDL58-2R引物
<400>12
     gcactagtca gccgcgctcg acgaggaggt g                       31
<210>13
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-L-Bgl2F引物
<400>13
     gggagatcta gaggccggtt acctctacga gta                        33
<210>14
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-L-Hind3R引物
<400>14
     gggaagcttg cgatgagctg tgccagatag                            30
<210>15
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-R-Hind3F引物
<400>15
     gggaagcttg aactggcgcg acagtgtctt                            30
<210>16
<211>34
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldB-R-Bgl2R引物
<400>16
     gggagatctg cagcggatcg tcttcgagac cctt                        34
<210>17
<211>29
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-3F引物
<400>17
     ttcgcsctsc csgtcccstc satggtsat                              29
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-3R引物
<400>18
     gttgatsays gasgtsgaga a                                      21
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:6PIN-2F引物
<400>19
      gctgcgcctg gccctggagg acatcgagat                        30
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:6PIN-2R引物
<400>20
     ctgttcctcg aagaactcgt ggtcggcgta                         30
<210>21
<211>22
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5D-1R引物
<400>21
     aggtgcccag cgagatcatg tt                    22
<210>22
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:7PIN-2F引物
<400>22
     ccatgatcct gctggtggcc ggccatgaga            30
<210>23
<211>21
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5Dm-2R引物
<400>23
     ctggatsgtg tcsccsggyt t                     21
<210>24
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:5PIN-2F引物
<400>24
     cggaatccac cagtgcctcg gccagaacct                    30
<210>25
<211>33
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldApro-SpeNdeF引物
<400>25
     gggcatatga ctagtagccg tgtcctgccc gcc                33
<210>26
<211>29
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:pldApro-NdeR引物
<400>26
     gggcatatgt tcggacgtga attcattcg                     29
<210>27
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:eDM-SphF引物
<400>27
     tccccgcatg ccggaactga cggacatcac                30
<210>28
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:eDM-SphR引物
<400>28
     cccgggcatg cagacgacga cgtagaggaa                30
<210>29
<211>36
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PRR-1F引物
<400>29
     gccccccata tgaacgcaaa cgacaacgtg gtcatc         36
<210>30
<211>35
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:PRR-2R引物
<400>30
     gcggatcctc aggcactact cagttcagct ttggc            35
<210>31
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:SP-1
<400>31
     tatgcgtcac tagtcgggag tgcgtta                     27
<210>32
<211>27
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:SP-2
<400>32
     tataacgcac tcccgactag tgacgca                     27
<210>33
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-NdeF
<400>33
     gcccccatat gacggaactg acggacatca                30
<210>34
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-SpeR
<400>34
     gggccactag tcagccggcc ggttcggtca                30
<210>35
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-BglF
<400>35
     cgcatagatc ttcacccgag cgggtgatca                30
<210>36
<211>30
<212>DNA
<213>人工序列
<220>
<223>链:单链
<220>
<223>拓扑结构:线性
<220>
<223>人工序列的描述:DM-BglR
<400>36
     tcccgagatc ttgaaggtcc gcgtcaccgt                30
<210>37
<211>27
<212>DNA
<213>人工序列
<220>
<223>R91C-F引物
<400>37
     ttcgcggccg tctgcgaccg gcgggtg                   27
<210>38
<211>27
<212>DNA
<213>人工序列
<220>
<223>R91C-R引物
<400>38
     cacccgccgg tcgcagacgg ccgcgaa                   27
<210>39
<211>27
<212>DNA
<213>人工序列
<220>
<223>R195L-F引物
<400>39
     tcgcaagggg cgctcgagcg gctcgag                27
<210>40
<211>27
<212>DNA
<213>人工序列
<220>
<223>R195L-R引物
<400>40
     ctcgagccgc tcgagcgccc cttccga                27
<210>41
<211>31
<212>DNA
<213>人工序列
<220>
<223>L403M-F引物
<400>41
     acgatccagg ggatgatgga actccccgtg a           31
<210>42
<211>30
<212>DNA
<213>人工序列
<220>
<223>L403M-R引物
<400>42
     tcacggggag ttccatcatc ccctggatcg             30
<210>43
<211>30
<212>DNA
<213>人工序列
<220>
<223>R236L-F引物
<400>43
     agctggaccg actcgacgtg gtggcgctgg            30
<210>44
<211>29
<212>DNA
<213>人工序列
<220>
<223>R236L-R引物
<400>44
     agcgccacca cgtcgagtcg gtccagctc             29
<210>45
<211>27
<212>DNA
<213>人工序列
<220>
<223>I244F-F引物
<400>45
     tggcgctggc cgtcttcctg ctcgtgg               27
<210>46
<211>30
<212>DNA
<213>人工序列
<220>
<223>I244F-R引物
<400>46
     ccacgagcag gaagacggcc agcgccacca            30
<210>47
<211>27
<212>DNA
<213>人工序列
<220>
<223>M112T-F引物
<400>47
     cagcggcgga tgacgatccc gtcgttc                27
<210>48
<211>27
<212>DNA
<213>人工序列
<220>
<223>M112T-R引物
<400>48
     gaacgacggg atcgtcatcc gccgctg                27
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>R195Y-F引物
<400>49
     aggggcgcgc gagtacctcg aggagtacct             30
<210>50
<211>30
<212>DNA
<213>人工序列
<220>
<223>R195Y-R引物
<400>50
     ggtactcctc gaggtactcg cgcgcccctt             30
<210>51
<211>35
<212>DNA
<213>人工序列
<220>
<223>pldout-L-Bgl2F引物
<400>51
     gggagatctg caggtcatcg gggggaagaa ccaca            35
<210>52
<211>31
<212>DNA
<213>人工序列
<220>
<223>pldout-L-Sph1R引物
<400>52
     tctccagccg catgcggtcc cgggtcaccg                  31
<210>53
<211>32
<212>DNA
<213>人工序列
<220>
<223>pldout-R-Sph1F引物
<400>53
     cccgcatgcg gctggagatc atccagagcg ca               32
<210>54
<211>34
<212>DNA
<213>人工序列
<220>
<223>pldout-R-Bgl2R引物
<400>54
     gggagatcta gaacatgccg ggccagaggc tgac             34
<210>55
<211>33
<212>DNA
<213>人工序列
<220>
<223>hyg-SpeSphF引物
<400>55
     ggggcatgcg gactagtaca ccgtcgcctc ggt              33
<210>56
<211>30
<212>DNA
<213>人工序列
<220>
<223>hyg-SphR引物
<400>56
     gccgcatgcg tcaggcgccg ggggcggtgt            30

Claims (21)

1.具有生产式(I)
Figure A2006800182890002C1
(但是,R表示氢原子或羟基)表示的16位羟基化大环内酯类化合物的能力的微生物,其为具有(a)编码参与式(II)
Figure A2006800182890002C2
(但是,R表示氢原子或羟基)表示的大环内酯类化合物的生物合成的多肽的部分或全部的DNA以及(b)编码具有前述式(II)表示的大环内酯类化合物的16位羟基化酶活性的多肽的部分或全部的DNA的基因重组微生物。
2.根据权利要求1记载的基因重组微生物,前述(a)表示的DNA为编码具有聚烯酮合成酶活性的多肽、具有7位乙酰化酶活性的多肽、具有18,19位环氧化酶活性的多肽和具有转录调节因子活性的多肽的部分或全部的DNA。
3.根据权利要求1或2记载的基因重组微生物,前述(a)表示的DNA为含有
(a-1)序列号1的第8340-27935位碱基的连续的碱基序列
(a-2)序列号1的第28021-49098位碱基的连续的碱基序列
(a-3)序列号1的第49134-60269位碱基的连续的碱基序列
(a-4)序列号1的第60269-65692位碱基的连续的碱基序列
(a-5)序列号1的第68160-66970位碱基的连续的碱基序列
(a-6)序列号1的第69568-68270位碱基的连续的碱基序列
(a-7)序列号1的第72725-70020位碱基的连续的碱基序列的DNA或其变体。
4.根据权利要求2或3记载的基因重组微生物,前述(a)表示的DNA还包含编码具有6位羟基化酶活性的多肽的部分或全部的DNA。
5.根据权利要求4记载的基因重组微生物,编码具有6位羟基化酶活性的多肽的部分或全部的DNA是含有序列号1的第65707-66903位的连续的碱基序列的DNA或其变体。
6.根据权利要求1-5任一项记载的基因重组微生物,前述(b)表示的DNA是选自于下组的DNA或其变体:
(b-1)序列号2的第1322-2548位的连续的碱基序列、
(b-2)序列号3的第420-1604位的连续的碱基序列,和
(b-3)序列号4的第172-1383位的连续的碱基序列。
7.根据权利要求1-6任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的氨基酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
8.根据权利要求1-6任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
9.根据权利要求1-6任一项记载的基因重组微生物,前述(b)表示的DNA是含有序列号2的第1322-2548位的连续的碱基序列的DNA的变体,并且具有选自于以下的1)-6)构成的组的1个或2个以上改变位点:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
10.根据权利要求1记载的基因重组微生物,其在具有前述(a)表示的DNA的宿主中整合了异种微生物来源的前述(b)表示的DNA。
11.根据权利要求1记载的基因重组微生物,其在具有前述(b)表示的DNA的宿主中整合了异种微生物来源的前述(a)表示的DNA。
12.根据权利要求1记载的基因重组微生物,其在不具有前述(a)和(b)表示的任一DNA的宿主中整合了异种微生物来源的前述(a)和(b)表示的两种DNA。
13.根据权利要求1-12任一项记载的基因重组微生物,具有生产式(I)表示的16位羟基化大环内酯类化合物的能力的基因重组微生物为属于链霉菌(Streptomyces)属的菌株。
14.根据权利要求1-13任一项记载的基因重组微生物,在装入了30ml下述培养基的容积为250ml的三角烧瓶中接种基因重组微生物,于25℃旋转振荡培养4天后(220转/分钟),通过加入270ml乙腈进行提取,在下述测定条件下对获得的提取液进行HPLC分析、定量式(I)表示的16位羟基化大环内酯类化合物时,所述基因重组微生物具有每1L培养液生产50mg以上的式(I)表示的16位羟基化大环内酯类化合物的能力:
(培养基)
5%溶性淀粉,1%葡萄糖,3%pharmamedia,0.1%CaCO3,pH7.5
(HPLC测定条件)
分析装置:Shimadzu HPLC 10Avp
柱:Develosil ODS UG-3(φ4.6mm×50mm 3μm)
移动相:45%-55%甲醇(0-5分钟),55%甲醇(5-13分钟),55%-70%甲醇(13-21分钟)、70%甲醇(21-25分钟)
流速:1.2mL/分钟
检测:UV240nm
注入容量:5μL
柱温度:40℃。
15.式(I)表示的16位羟基化大环内酯类化合物或其可药用盐或它们的水合物的制备方法,其特征在于在营养培养基中培养权利要求1-14任一项记载的基因重组微生物,从其培养液中收集式(I)表示的16位羟基化大环内酯类化合物。
16.根据权利要求15中记载的方法,其特征在于使环糊精类存在于培养液中。
17.根据权利要求16中记载的方法,所述环糊精类为选自于β-环糊精、γ-环糊精、部分甲基化β-环糊精、二甲基-β-环糊精、三甲基-β-环糊精、糖基-β-环糊精和羟丙基-β-环糊精中的环糊精类。
18.含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码精氨酸之外的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码蛋氨酸之外的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码精氨酸之外的氨基酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码异亮氨酸之外的氨基酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码亮氨酸之外的氨基酸的密码子的改变位点。
19.含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸、蛋氨酸或脯氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸或丝氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸、脯氨酸、酪氨酸或苯丙氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸、异亮氨酸或脯氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸或缬氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸、半胱氨酸或异亮氨酸的密码子的改变位点。
20.含有序列号2的第1322位碱基-第2548位的连续碱基序列的DNA的变体,其为含有1个或2个以上的选自于以下1)-6)构成的组的改变位点的DNA变体:
1)将第1592-1594位碱基中的序列cgc改变成编码半胱氨酸的密码子的改变位点
2)将第1655-1657位碱基中的序列atg改变成编码苏氨酸的密码子的改变位点
3)将第1904-1906位碱基中的序列cgc改变成编码亮氨酸或酪氨酸的密码子的改变位点
4)将第2027-2029位碱基中的序列cgc改变成编码亮氨酸的密码子的改变位点
5)将第2054-2056位碱基中的序列atc改变成编码苯丙氨酸的密码子的改变位点
6)将第2528-2530位碱基中的序列ctg改变成编码蛋氨酸的密码子的改变位点。
21.由权利要求18-20任一项中记载的DNA变体编码的多肽。
CN2006800182893A 2005-05-26 2006-05-24 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法 Expired - Fee Related CN101184838B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP154114/2005 2005-05-26
JP2005154114 2005-05-26
PCT/JP2006/310835 WO2006126723A1 (ja) 2005-05-26 2006-05-24 遺伝子組換え微生物およびそれらの微生物を用いるマクロライド系化合物の製造方法

Publications (2)

Publication Number Publication Date
CN101184838A true CN101184838A (zh) 2008-05-21
CN101184838B CN101184838B (zh) 2011-06-15

Family

ID=37452135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800182893A Expired - Fee Related CN101184838B (zh) 2005-05-26 2006-05-24 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法

Country Status (15)

Country Link
US (1) US20090215134A1 (zh)
EP (1) EP1911843B1 (zh)
JP (1) JPWO2006126723A1 (zh)
KR (1) KR20080012845A (zh)
CN (1) CN101184838B (zh)
AU (1) AU2006250304B2 (zh)
BR (1) BRPI0610145A2 (zh)
CA (1) CA2608841A1 (zh)
IL (1) IL187081A0 (zh)
NO (1) NO20075911L (zh)
NZ (1) NZ562921A (zh)
RU (1) RU2394906C2 (zh)
SG (1) SG148168A1 (zh)
TW (1) TW200716744A (zh)
WO (1) WO2006126723A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110408643A (zh) * 2018-11-30 2019-11-05 云南大学 一种提高自溶链霉菌洋橄榄叶素及其衍生物产量的方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834488B1 (ko) * 2004-07-20 2008-06-09 에자이 알앤드디 매니지먼트 가부시키가이샤 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
JPWO2007043621A1 (ja) 2005-10-13 2009-04-16 エーザイ・アール・アンド・ディー・マネジメント株式会社 プラジエノライドb及びプラジエノライドdの全合成方法
EP2168961A1 (en) 2007-07-06 2010-03-31 Eisai R&D Management Co., Ltd. Process for producing macrolide compound and intermediate therefor
JP5524053B2 (ja) * 2008-06-04 2014-06-18 エーザイ・アール・アンド・ディー・マネジメント株式会社 ハーボキシジエンの生合成に関与するポリペプチドをコードするdna
ME03417B (me) * 2014-05-15 2020-01-20 Eisai R&D Man Co Ltd Jedinjenje pladienolid piridina i postupci primjene
MX2018006155A (es) * 2015-11-18 2018-08-01 Eisai R&D Man Co Ltd Una forma en estado solido de compuestos de pladienolida piridina y metodos de uso.
CN115247179B (zh) * 2021-04-25 2024-03-12 上海健康医学院 一种聚酮化合物骨架及其后修饰物的生物合成基因簇及其应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5824513A (en) * 1991-01-17 1998-10-20 Abbott Laboratories Recombinant DNA method for producing erythromycin analogs
MXPA01003376A (es) * 1998-10-02 2002-11-07 Kosan Biosciences Inc Enzimas policetido sintetasa y construcciones de acido desoxirribonucleico recombinante para las mismas.
TWI312681B (en) * 2001-02-01 2009-08-01 Novel physiologically active substance
ATE536409T1 (de) * 2001-10-19 2011-12-15 Sumitomo Chemical Co Unkrautbekämpfungsstoffwechselproteine, gene dafür und ihre verwendung
ATE426671T1 (de) * 2002-04-12 2009-04-15 Mercian Corp Expressionssystem des aus actinomyceten stammenden cytochrom p-450 in escherichia coli
AU2003252299A1 (en) * 2002-07-31 2004-02-16 Eisai Co., Ltd. Novel physiologically active substance
RU2338741C2 (ru) * 2002-07-31 2008-11-20 Мершан Корпорейшн Новые физиологически активные вещества
NZ540103A (en) * 2002-11-29 2007-05-31 Mercian Corp Process for producing macrolide compound
JP2007525148A (ja) * 2003-01-21 2007-09-06 エコピア バイオサイエンシーズ インク ポリエンポリケチド、その生成方法及び医薬品としての使用[関連出願]本出願は、2003年1月21日出願の米国仮出願第60/441,123号、2003年8月13日出願の米国仮出願第60/494,568号、2003年5月13日出願の米国仮出願第60/469,810号及び2003年8月1日出願の米国仮出願第60/491,516号に対する優先権を主張するものである。
CN1886505A (zh) * 2003-11-27 2006-12-27 美露香株式会社 参与大环内酯类化合物的羟化作用的dna
KR100834488B1 (ko) * 2004-07-20 2008-06-09 에자이 알앤드디 매니지먼트 가부시키가이샤 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110408643A (zh) * 2018-11-30 2019-11-05 云南大学 一种提高自溶链霉菌洋橄榄叶素及其衍生物产量的方法
CN110408643B (zh) * 2018-11-30 2023-08-22 云南大学 一种提高自溶链霉菌洋橄榄叶素及其衍生物产量的方法

Also Published As

Publication number Publication date
SG148168A1 (en) 2008-12-31
NZ562921A (en) 2009-06-26
TW200716744A (en) 2007-05-01
RU2007148928A (ru) 2009-07-10
IL187081A0 (zh) 2008-02-09
AU2006250304B2 (en) 2010-12-09
BRPI0610145A2 (pt) 2010-06-01
EP1911843A1 (en) 2008-04-16
US20090215134A1 (en) 2009-08-27
EP1911843B1 (en) 2012-03-14
EP1911843A4 (en) 2009-01-07
WO2006126723A1 (ja) 2006-11-30
KR20080012845A (ko) 2008-02-12
CA2608841A1 (en) 2006-11-30
RU2394906C2 (ru) 2010-07-20
NO20075911L (no) 2008-02-26
AU2006250304A1 (en) 2006-11-30
JPWO2006126723A1 (ja) 2008-12-25
CN101184838B (zh) 2011-06-15

Similar Documents

Publication Publication Date Title
CN101184838B (zh) 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
KR20070033979A (ko) 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
CN101809030A (zh) 硫肽前体蛋白质、编码该蛋白质的基因及其用途
CN101275141A (zh) 阿嗪霉素的生物合成基因簇
CN101818158B (zh) Fr901464的生物合成基因簇
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN101157929A (zh) 番红霉素的生物合成基因簇
KR20040099138A (ko) 항생물질의 생합성을 위한 스트렙토마이세스시아네오그리세우스 아종 논시아노게누스 유래의 유전자클로닝 및 사용 방법
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
EP0929681A1 (en) Rifamycin biosynthesis gene cluster
CN111378008B (zh) 脂肽类化合物Totopotensamides及其制备方法和应用
CN107540682A (zh) 曲张链丝菌素衍生物及其制备方法和应用
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
CN101586112B (zh) 诺丝七肽的生物合成基因簇
CN101063140B (zh) 万古霉素生物合成基因簇
CN101578268A (zh) 新的化合物及其生产方法
CN103215282A (zh) 越野他汀的生物合成基因簇及其应用
US7364877B2 (en) Polynucleotides encoding disorazole polyketide synthase polypeptides
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
CN102517309A (zh) 一种手霉素类抗生素生物合成基因簇
KR102159415B1 (ko) Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR20190031865A (ko) 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법
CN101684471A (zh) 诺卡噻唑菌素的生物合成基因簇
CN101142313A (zh) 编码产生地索拉唑类的合成途径的基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: JAPAN MAIKORO BIOPHARMACEUTICAL CO., LTD.

Free format text: FORMER OWNER: MERCIAN CORPRATION

Effective date: 20120222

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120222

Address after: Tokyo, Japan, Japan

Co-patentee after: MICROBIOPHARM JAPAN CO., LTD.

Patentee after: Eisai R. & D. Man Co., Ltd.

Address before: Tokyo, Japan, Japan

Co-patentee before: Mercian Corpration

Patentee before: Eisai R. & D. Man Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110615

Termination date: 20150524

EXPY Termination of patent right or utility model