CN1325959A - 来自基因簇的基因 - Google Patents

来自基因簇的基因 Download PDF

Info

Publication number
CN1325959A
CN1325959A CN01119655A CN01119655A CN1325959A CN 1325959 A CN1325959 A CN 1325959A CN 01119655 A CN01119655 A CN 01119655A CN 01119655 A CN01119655 A CN 01119655A CN 1325959 A CN1325959 A CN 1325959A
Authority
CN
China
Prior art keywords
seq
polynucleotide
dna
sequence
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01119655A
Other languages
English (en)
Other versions
CN1325959B (zh
Inventor
阿部有生
小野千穗
吉川博治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sankyo Co Ltd
Original Assignee
Sankyo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Co Ltd filed Critical Sankyo Co Ltd
Publication of CN1325959A publication Critical patent/CN1325959A/zh
Application granted granted Critical
Publication of CN1325959B publication Critical patent/CN1325959B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/385Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

ML-236B为HMG-CoA还原酶的抑制剂并用于制备另一抑制剂-帕伐他丁。使用编码与存在于产ML-236B的微生物中的聚酮化合物合成酶簇有关的基因的多核苷酸,可以提高使用这种微生物的ML-236B的制备。

Description

来自基因簇的基因
本发明涉及一基因簇,尤其是来自基因簇的基因。
更具体地说,本发明涉及多核苷酸,如DNA,当将其导入产ML-236B的微生物中时它加速HMG-CoA还原酶抑制剂,ML-236B在该产ML-236B的微生物中的生物合成。本发明还涉及插入所述多核苷酸的载体、由所述载体转化的宿主细胞、由所述载体表达的蛋白质、一种使用所述多核苷酸和/或蛋白质生产ML-236B的方法,该方法包括从所述宿主细胞培养物中回收ML-236B,并且本发明还涉及其它相关方面。
帕伐他丁为HMG-CoA还原酶抑制剂。帕伐他丁钠已用于治疗血脂过多或高脂血症,并具有能降低血清胆固醇的有用药理效应。使用嗜碳酸气链霉菌通过微生物转化由柑桔青霉产生的ML-236B可以获得帕伐他丁[记载于Endo,A.等人的“抗生素杂志”29,1346(1976);Matsuoka,T.等人的“欧洲生物化学杂志”184,707(1989)和JP-昭57-2240A]。
已显示,ML-236B,一种帕伐他丁前体,以及洛伐他丁,一种HMG-CoA抑制剂,都具有部分相同结构。它们都是由聚酮化合物经生物合成的[记载于Moore,R.N.等人的“美国化学学会杂志”107,3694(1985);Shiao,M.和Don,H.S.的“中国科学院院报”11,23(1987)]。
聚酮化合物为由低分子量羧酸如乙酸、丙酸、丁酸等连续缩合反应产生的β-酮碳链衍生的化合物。根据每个β-酮羰基的缩合或还原的路径可以获得不同结构[记载于Hopwood,D.A.和Sherman,D.H.的“基因工程年鉴”24,37-66(1990);Hutchinson,C.R.和Fujii,I.“微生物学年鉴”49,201-238(1995)]。
有利于聚酮化合物合成的聚酮化合物合成酶(本文后面称之为PKS)为已知存在于丝状真菌和细菌中的酶。已使用分子生物学技术对这些丝状真菌酶进行了研究[如记载于Feng,G.H.和Leonard,T.J.的“细菌学杂志”177,6246(1995);Takano,Y.等人的“分子基因的基因工程”249,162(1995)]。在为产生洛伐他丁微生物的土曲霉中,已对与洛伐他丁生物合成有关的PKS基因进行了分析[记载于在日本的国际申请公开号平9-504436A并参见相应的WO9512661,它要求保护编码三醇聚酮化合物合成酶的DNA]。
与生物合成丝状真菌的二级代谢物有关的基因经常在基因组上形成一簇。在生物合成聚酮化合物的路径中,已知存在参与所述路径的基因簇。在生物合成黄曲霉毒素(它是由黄曲霉和寄生曲霉产生的聚酮化合物)时,已知编码参与所述生物合成的酶蛋白质(例如PKS)的基因形成簇结构。进行基因组分析并将每个微生物中参与生物合成黄曲霉毒素的基因进行比较[参见Yu, J.等人的“环境微生物应用”61,2365(1995)]。已报道,参与生物合成由构巢曲霉产生的柄曲霉素的基因在其基因组上形成约60kb连续区域的簇结构[记载于Brown,D.W.等人的“美国国家科学院院报”93,1418(1996)]。
已研究了在洛伐他丁合成过程中通过辅助蛋白对聚酮化合物合成酶活性的调节[参见Kennedy,J.等人的“科学”第284卷,1368(1999)]。
然而,时至今日,对ML-236B的生物合成和调节该合成的因子的分子生物学分析还不够。本发明打算解决该问题。
根据本发明,提供了一种适合用于加速ML-236B的生物合成的多核苷酸。
该多核苷酸典型地为编码包括氨基酸序列SEQ ID NO38、42、44、46、48或50或者由这些序列组成的蛋白质的多核苷酸。还提供了编码具有至少一个缺失、添加、替代或改变的修饰氨基酸序列的该多核苷酸变体。
序列表构成本专利说明书的一部分。为了帮助理解,我们列出了以下所列序列的表格。SEQ ID NO特性
1     pML48插入片段
2     与SEQ ID NO1互补
3     实施例4的PCR引物
4     实施例4的PCR引物
5     实施例8中5′-RACE的寡核苷酸DNA(1)
6     实施例8中5′-RACE的寡核苷酸DNA(1)
7     实施例8中5′-RACE的寡核苷酸DNA(1)
8     实施例8中5′-RACE的寡核苷酸DNA(1)
9     实施例8中5′-RACE的寡核苷酸DNA(1)
10    实施例8中5′-RACE的寡核苷酸DNA(1)
11    实施例8中5′-RACE的寡核苷酸DNA(2)
12    实施例8中5′-RACE的寡核苷酸DNA(2)
13    实施例8中5′-RACE的寡核苷酸DNA(2)
14    实施例8中5′-RACE的寡核苷酸DNA(2)
15    实施例8中5′-RACE的寡核苷酸DNA(2)
16    实施例8中5′-RACE的寡核苷酸DNA(2)
17    实施例8中5′-端cDNA片段
18    实施例8中5′-端cDNA片段
19    实施例8中5′-端cDNA片段
20    实施例8中5′-端cDNA片段
21    实施例8中5′-端cDNA片段
22    实施例8中5′-端cDNA片段
23    实施例8中3′-RACE的寡核苷酸DNA(3)
24    实施例8中3′-RACE的寡核苷酸DNA(3)
25    实施例8中3′-RACE的寡核苷酸DNA(3)
26    实施例8中3′-RACE的寡核苷酸DNA(3)
27    实施例8中3′-RACE的寡核苷酸DNA(3)
28    实施例8中3′-RACE的寡核苷酸DNA(3)
29    实施例8中3′-端cDNA片段
30    实施例8中3′-端cDNA片段
31    实施例8中3′-端cDNA片段
32    实施例8中3′-端cDNA片段
33    实施例8中3′-端cDNA片段
34    实施例8中3′-端cDNA片段
35    实施例9中的RT-PCR引物
36    实施例9中的RT-PCR引物
37    mlcE;cDNA核苷酸序列和推断氨基酸序列
38    推断mlcE多肽
39    实施例12中的RT-PCR引物
40    实施例12中的RT-PCR引物
41    mlcR;cDNA核苷酸序列和推断氨基酸序列
42    推断mlcR多肽
43    mlcA;cDNA核苷酸序列和推断氨基酸序列
44    推断mlcA多肽
45    mlcB;cDNA核苷酸序列和推断氨基酸序列
46    推断mlcB多肽
47    mlcC;cDNA核苷酸序列和推断氨基酸序列
48    推断mlcC多肽
49    mlcD;cDNA核苷酸序列和推断氨基酸序列
50    推断mlcD多肽
51    实施例17中的RT-PCR引物
52    实施例17中的RT-PCR引物
53    实施例17中的RT-PCR引物
54    实施例17中的RT-PCR引物
55    实施例17中的RT-PCR引物
56    实施例17中的RT-PCR引物
57    实施例17中的RT-PCR引物
58    实施例17中的RT-PCR引物
59    实施例17中的RT-PCR引物
60    实施例17中的RT-PCR引物
61    实施例17中的RT-PCR引物
62    实施例17中的RT-PCR引物
编码SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸可以为cDNA、基因组DNA或mRNA。将编码这六个序列的每个基因组DNA分别称之为结构基因mlcE、mlcR、mlcA、mlcB、mlcC和mlcD。不依赖这些赋值,我们相信,结构基因编码具有以下功能的蛋白质:
mlcA               聚酮化合物合成酶
mlcB               聚酮化合物合成酶
mlcC               P450-氧合酶
mlcD               HMG-CoA还原酶
mlcE               外排泵
mlcR               转录因子
我们已发现,导入mlcE或相应于mlcE的cDNA可以加速ML-236B的生物合成,导入mlcR或相应于mlcR的cDNA可以加速ML-236B的生物合成。而且,mlcR刺激mlcA-D的转录表达。通过基因破坏研究显示,在ML-236B的生产中单独地或共同地包括mlcA、B、C和D。
通过天然或人工改变获得的mlcA、B和/或C变体可用于生产ML-236B衍生物,包括例如帕伐他丁或洛伐他丁的抑制素。在这方面,使用这些变体以及仅一步发酵步骤就可以生产帕伐他丁,而不需目前使用嗜碳酸气链霉菌将ML-236B经微生物转换成帕伐他丁。
一优选的多核苷酸包括一含有SEQ ID NO37或者含有能够加速ML-236B生物合成的其突变体或变体的序列。这种DNA多核苷酸可由转化的大肠杆菌pSAKexpESANK72499(FERMBP-7005)获得。
另一优选的多核苷酸包括一含有SEQ ID NO41或者含有能够加速ML-236B生物合成的其突变体或变体的序列。这种DNA多核苷酸可从转化的大肠杆菌pSAKexpR SANK 72599(FERM BP-7006)获得。
本发明的多核苷酸可用于与一个或多个多核苷酸可操作地组合。优选组合适合用于提高产ML-236B的微生物中的ML236B产量。
这些组合的例子包括SEQ ID NO37或其具有相似功能的变体与一个或多个选自SEQ ID NO37本身、41、43、45、47或49的序列组合;以及SEQ ID NO41或其具有相似功能的变体与一个或多个选自SEQ ID NO37、41本身、43、45、47或49的组合。
一方面,该多核苷酸优选为编码包括氨基酸序列SEQ ID NO38、42、44、46、48或50或由这些氨基酸序列组成并且单独或与SEQ ID NO37、SEQ ID NO41的多核苷酸或其具有相似功能的变体结合能加速ML-236B的生物合成的蛋白质的多核苷酸。
本发明还延伸到能够在严格条件下与本发明的多核苷酸杂交的多核苷酸。这些多核苷酸延伸到当导入产ML-236B的微生物中时适合加速产ML-236B的微生物中的ML-236B的生物合成的多核苷酸。
该多核苷酸典型地为DNA、cDNA或基因组DNA或RNA,并且可以为有义或反义。该多核苷酸典型地为纯化多核苷酸,例如没有其他细胞组分的多核苷酸。
本发明延伸至编码图示SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸变体,其中一个或多个核苷酸已改变。这些变化可以自然发生,并且可以在丰余或简并的遗传密码三联体内进行。这些简并地改变的多核苷酸因此编码相同氨基酸序列。在这些多核苷酸变体中,我们包括具有外显子和内含子的基因组DNA,而不是简单的cDNA序列。
本发明还延伸至编码图示SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸变体,它们编码具有至少一个缺失、添加、替代或改变的修饰氨基酸序列。因此,本发明延伸至编码比图示序列所编码的序列长度短、长或与之相等的氨基酸序列的图示序列的多核苷酸变体。优选这些变体多肽保留了加速ML-236B合成的能力,并优选具有与引起变体序列的亲代序列的活性基本上相似或者比之更好的活性。
这些多核苷酸变体保留了与亲代一定程度的同一性。该同一性适宜地为至少60%、至少80%、至少90%或至少95%或100%。变体的同一性优选由计算机软件来评定,例如使用进行同源性检索的算法的BLAST程序。
一方面,本发明的优选多核苷酸为选自以下的DNA:
(a)包括序列表中SEQ ID NO37的第1个核苷酸至第1662个核苷酸中所示一个或多个核苷酸序列的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(b)在严格条件下与(a)中所述DNA杂交的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(c)包括序列表中SEQ ID NO41的第1个核苷酸至第1380个核苷酸中所示一个或多个核苷酸序列的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(d)在严格条件下与(c)中所述DNA杂交的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成。
本发明的多核苷酸在产ML-236B的微生物中加速ML-236B的生物合成。产ML-236B的微生物的例子包括青霉种,例如柑桔青霉、短密青霉[记载于Brown,A.G.等人的“帕金化学学会杂志-1”1165(1976)]、圆弧青霉[记载于Doss,S.L.等人的“国家产品杂志”49,357(1986)]等。其它例子包括:真青霉种M6603[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、绿色拟青霉FERMP-6236[记载于JP-昭58-98092A]、拟青霉种M2016[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、长臂木霉M6735[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、金精隐壳霉(Hypomyceschrysospermus)IFO7798[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、胶霉种YJ-9515[记载于WO9806867]、绿色木霉IFO5836[记载于JP-昭62-19159B]、网状孢子真青霉IFO9022[记载于JP-昭62-19159B]或任意其它适宜生物体。
在这些产ML-236B的微生物中,优选柑桔青霉,并且更优选桔青霉菌株SANK13380。根据微生物保藏的布达佩斯条约,柑桔青霉SANK13380菌株于1992年12月22日以保藏号FERM BP-4129保藏在工业科技署的生命科学和技术研究院。产ML-236B的微生物的例子还包括从天然源分离的那些以及天然或人工突变的那些。
本发明还提供了含有本发明多核苷酸的载体。例如由大肠杆菌pSAKexpESANK72499(FERM BP-7005)或大肠杆菌pSAKexpR SANK72599(FERM BP-7006)获得的载体。本发明的这些载体包括表达载体。
还提供了由本发明载体转化的宿主细胞,包括产ML-236B的微生物。本发明的宿主细胞包括柑桔青霉和大肠杆菌,例如大肠杆菌pSAKexpE SANK72499(FERM BP-7005)或大肠杆菌pSAKexpR SANK 72599(FERM BP-7006)。
此外,本发明延伸至由本发明多核苷酸编码的多肽。本发明多肽的例子包括序列SEQ ID NO38或42、或具有与SEQ ID NO38或42的一定程度同一性且能加速产ML236B的微生物中ML236B产生的其变体。其它多肽是由本发明的其它多核苷酸序列编码的那些,以及保留一定程度同一性的变体。
多肽变体与SEQ ID NO38或42的同一性适宜地为至少80%、至少90%或至少95%或100%。变体的同一性优选由计算机软件评定,例如使用进行同源性检索的算法的BLAST程序。
本发明的多肽包括SEQ ID NO38或42或变体的更短或更长序列。更短多肽包括SEQ ID NO38、42或其变体的部分氨基酸序列,并且优选保留了加速ML236B生物合成的能力。更长多肽包括SEQ ID NO38、42或其变体的全部或部分氨基酸序列,并且优选保留了加速ML236B生物合成的能力。更长多肽包括融合蛋白,例如Fc-融合蛋白。
本发明的多肽包括具有序列SEQ ID NO38、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48之一、或具有相似功能的其变体。本发明还提供了这些多肽的抗体。本发明既提供了多克隆抗体又提供了单克隆抗体。
所述抗体可用于调控ML-236B的生成并产生ML-236B的衍生物如包括帕伐他丁和洛伐他丁的抑制素。并且,所述抗体可优选用于ML-236B生物合成和其调控机制的分析。这种分析可用于调控ML-236B生成及产生ML-236B的衍生物。
具有本发明载体的本发明的宿主细胞可用于一种生产ML-236B的方法中,包括培养这种宿主细胞,然后从该培养物中回收ML-236B。在一种方法中,该载体包括mlcE或mlcR,不包括如mlcA、mlcB、mlcC或mlcD的其它基因。
通过本发明的方法的生产可以在没有相应于SEQ ID NO44、SEQ ID NO46、SEQ ID NO48或SEQ ID NO50的重组mlcA、mlcB、mlcC和/或mlcD(多肽)时进行。
下面将详细描述本发明。
本发明的发明人已克隆出含有参与柑桔青霉中ML-236B的生物合成的基因组DNA。该基因组DNA以下称之为与ML-236B生物合成有关的基因组DNA,并由产ML-236B的微生物的基因组DNA文库克隆。该基因组DNA经分析,发现所述基因组DNA上的结构基因,然后使用含有柑桔青霉的mRNA的总RNA作为模板通过反转录-聚合酶链反应(以下称之为“RT-PCR”)获得相应于所述结构基因的cDNA。发现,当由含有所述cDNA的重组DNA载体转化产ML-236B的微生物时在该产ML-236B的微生物中的ML-236B的生物合成加速。
本发明尤其涉及cDNA(以下称之为加速ML-236B生物合成的cDNA),当将其导入所述产ML-236B的微生物中时它加速该产ML-236B的微生物中的ML-236B的生物合成。
本发明的加速ML-236B生物合成的多核苷酸,例如加速ML-236B生物合成的cDNA,例如包括:
(Ⅰ)使用参与ML-236B的生物合成并存在于产ML-236B的微生物中的基因组DNA中的结构基因的转录产物(信使RNA,以下称之为mRNA)作为模板通过合成获得的DNA;
(Ⅱ)DNA(Ⅰ)与使用DNA(Ⅰ)作为第一链合成的第二链DNA缔合形成的双链DNA;
(Ⅲ)双链DNA(Ⅱ)例如通过克隆等方法复制或扩增形成的双链DNA;
(Ⅳ)可以在严格条件下于上述DNA或mRNA杂交的DNA。DNA(Ⅳ)可以是本文中任意结构基因序列所示的那些,例如序列表中SEQID NO37的第1个核苷酸至第1662个核苷酸或者SEQ ID NO41中第1个核苷酸至第1380个核苷酸,其中一个或多个核苷酸任选地经替换、缺失和/或添加,并且当将其导入产ML-236B的微生物中时它能加速该产ML-236B的微生物中的ML-236B的生物合成。
当两个单链核酸杂交时,它们在彼此互补或高度互补的区域形成双链分子,并且“严格条件”适宜地是指杂交溶液为6×SSC的情况[1×SSC为150mMNaCl和15mM柠檬酸钠的组合物],并且杂交温度为55℃。
加速ML-236B生物合成的cDNA例如可以通过从产ML-236B的微生物的cDNA文库中分离含该cDNA的克隆。或者,可以使用以与ML-236B生物合成有关的基因组DNA的核苷酸序列和产ML-236B的微生物的mRNA或总RNA为基础设计的一对引物进行RT-PCR。
产ML-236B的微生物为固有地具有产生ML-236B的能力的微生物。正如前面所述的,产ML-236B的微生物的例子包括青霉种,例如柑桔青霉、短密青霉、圆弧青霉等。并且其它例子包括:真青霉种M6603、绿色拟青霉FERMP-6236、拟青霉种M2016、长臂木霉M6735、金精隐壳霉IFO7798、胶霉种YJ-9515、绿色木霉IFO5836、网状孢子真青霉IFO9022或任意其它适宜生物体。
在这些产ML-236B的微生物中,优选柑桔青霉,并且更优选柑桔青霉菌株SANK13380。根据微生物保藏的布达佩斯条约,柑桔青霉SANK13380菌株于1992年12月22日以保藏号FERM BP-4129保藏在工业科技署的生命科学和技术研究院。产ML-236B的微生物的例子还包括从天然源分离的那些以及天然或人工突变的那些。
可以用适宜探针筛选产ML-236B的微生物的基因组DNA文库来获得与ML-236B生物合成有关的基因组DNA。适宜地以预测对ML-236B生物合成起作用的DNA序列为基础设计该探针,适宜地来源于丝状真菌。
对创建基因组DNA文库的方法的选择没有限制,可以使用任意适宜方法,优选为构建真核生物的基因组DNA文库的常规方法。其例子包括Maniatis等人的方法[Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]。其它适宜的方法在本领域中为已知。
概括地,可以从所述产ML-236B的微生物的培养物中回收细胞,物理破碎这些细胞,提取存在于其核中的DNA并将所述DNA提纯,获得来自产ML-236B的微生物的基因组DNA。
可以在适合特定产ML-236B的微生物的条件下培养产ML-236B的微生物。例如,将细胞接种于MBG3-8培养基[组成:7%(w/v)甘油、3%(w/v)葡萄糖、1%(w/v)大豆粉、1%(w/v)蛋白胨(由Kyokuto Seivaku Kogyo公司生产)、1%(w/v)玉米浆(由Honen公司生产)、0.5%(w/v)硝酸钠、0.1%(w/v)硫酸镁七水合物(pH6.5)]中,并在22-28℃下摇动培养3-7天,可以将柑桔青霉(一种优选的产ML-236B的微生物)培养。通过将熔融的PGA琼脂培养基[组成:200g/L马铃薯浸出物、15%(w/v)甘油、2%(w/v)琼脂]倒入试管,并以一角度使琼脂固化,从而可以制备贮藏细菌用的斜面。然后使用铂针将柑桔青霉接种于该斜面中,接着在22-28℃下培养7-15天。通过将该斜面贮藏在0-4℃下可以在该斜面上连续地保持以这种方式生长的微生物或细菌。
通过离心可以回收在液体培养基中培养的产ML-236B的微生物的细胞,使用刮刀等从固体培养基刮下可以回收在固体培养基上培养的细胞。
在用液氮等将细胞冷冻之后,使用研棒和研钵研磨这些细胞可以将这些细胞物理破碎。使用例如十二烷基硫酸钠(下文称之为SDS)的表面活性剂或其它适宜的表面活性剂可以提取破碎细胞核心中的DNA。提取的基因组DNA适宜地用苯酚-氯仿处理以除去蛋白质,并通过乙醇沉淀以沉淀物回收。
通过适宜限制酶消化使所得基因组DNA片段化。对可用于限制消化的限制酶没有限制,一般优选可以获得的限制酶。其例子包括Sau3AI。其它适宜的酶在本领域中为已知。经过消化的DNA然后经过凝胶电泳,并从该凝胶中回收具有适宜大小的基因组DNA。DNA片段的大小没有特别的限制,但是优选20kb或之上。
同样,对用于构建基因组DNA文库的DNA载体没有限制,只要该载体具有在通过该载体转化的宿主细胞中复制所必需的DNA序列。适宜载体的例子包括质粒载体、噬菌体载体、粘粒载体、BAC载体等,优选粘粒载体。该DNA载体优选为表达载体。更优选地,该DNA载体包括在通过该载体转化的宿主细胞上赋予选择性表型的DNA或核苷酸序列。
该DNA载体适宜地为能用于克隆和表达的载体。优选地,该载体为能用于转化一个以上微生物宿主的穿梭载体。该穿梭载体适宜地具有能在宿主细胞中复制的DNA序列,并优选能在来自不同微生物组如细菌和真菌的大量不同宿主细胞中复制的序列。而且,该穿梭载体优选含有一能向一定范围的不同宿主细胞,例如来自不同微生物组的细胞提供选择性表型的DNA序列。
微生物组和通过该穿梭载体转化的宿主细胞的组合的选择没有特别限制,只要微生物组之一可用于克隆,另一具有产ML-236B的能力。这种组合例如可以是细菌与丝状真菌的组合,酵母与丝状真菌的组合,细菌与丝状真菌的组合为优选。对细菌的选择没有特别限制,只要它一般能用于生物工程,例如大肠杆菌、枯草芽胞杆菌等。优选大肠杆菌,更优选大肠杆菌XL1-Blue MR。相似地,对酵母种没有限制,只要它一般能用于生物工程,例如酿酒酵母等。丝状真菌的例子包括上述产ML-236B的微生物。微生物的其它适宜例子在本领域中为已知。
在本发明中,微生物组可选自细菌、丝状真菌和酵母。
上述穿梭载体的例子包括具有用于选择表型和cos位点的适宜标记基因的粘粒载体。其它适宜的载体在本领域中为已知。优选的载体为pSAKcosl,它是将来自粘粒载体pWE15(由STRATAGENE生产)的cos位点插入质粒pSAK333中构建的,含有大肠杆菌潮霉素B磷酸转移酶基因序列[记载于JP-平3-262486A]。构建pSAKcosl的一种方法示于图1中。本发明不限于该载体。
通过将穿梭载体引入宿主细胞可以制备基因组DNA文库,所述载体含有来自产ML-236B的微生物的基因组DNA片段。所用宿主细胞优选为大肠杆菌,更优选为大肠杆菌XL1-Blue MR。当宿主细胞为大肠杆菌时,可以通过体外包装进行引入。在本发明中,转化还包括通过体外包装引入外来DNA,并且转化的细胞还包括通过体外包装引入外来DNA的细胞。
可以使用抗体或核酸探针对基因组文库进行筛选以鉴定所需的克隆,优选使用核酸探针。优选以聚酮化合物生物合成有关的基因或DNA的核苷酸序列(优选由丝状真菌获得的序列)为基础制备该核酸探针。对特定基因的选择没有限制,只要其包含在聚酮化合物的生物合成中,并且其核苷酸序列为已知。这些基因的例子包括黄曲霉和寄生曲霉的黄曲霉毒素PKS基因、构巢曲霉的柄曲霉素PKS基因等。
例如通过合成含有上述已知基因组DNA序列部分的寡核苷酸探针、或者使用聚合酶链反应[下文称之为“PCR”,记载于Saiki,R.K.倒入的“科学”239,487(1988)]并使用基因组DNA为模板通过制备寡核苷酸引物并扩增靶DNA、或者使用mRNA为模板通过RT-PCR,可以获得适宜的核酸探针。获得这些探针的其它适宜方法在本领域中众所周知。
可以由产ML-236B的微生物例如使用PCR或RT-PCR获得核酸探针。优选以与聚酮化合物生物合成有关的基因的核苷酸序列(该核苷酸序列为已知)为基础进行用于PCR或RT-PCR的引物(下文称之为“用于PCR的引物)的设计。优选该基因为黄曲霉、寄生曲霉的黄曲霉毒素PKS基因、或者构巢曲霉的柄曲霉素PKS基因。
用于PCR的引物经适宜设计以含有编码在PKS基因中高度保守的氨基酸序列的核苷酸序列。鉴定相应于给定氨基酸序列的核苷酸序列的方法包括以宿主细胞的密码子使用为基础的推断法和使用多密码子制备混合寡核苷酸序列的方法(下文称之为“简并寡核苷酸”)。在后面的情况下,通过向其核苷酸序列引入次黄嘌呤可以降低寡核苷酸的多重性。
用于PCR的引物可以包括经设计与模板链退火的核苷酸序列,该引物与添加的5′序列相连。对这种添加的5′核苷酸序列的选择没有特别限制,只要该引物可用于PCR或RT-PCR。这种添加的5′序列例如可以为易于PCT产物克隆操作的核苷酸序列。这种核苷酸序列例如可以为限制酶切割位点或含有限制酶切割位点的核苷酸序列。
而且,在设计用于PCR的引物时,优选鸟嘌呤(G)和胞嘧啶(C)碱基的总数为碱基总数的40-60%。而且,优选给定引物几乎没有或者没有自退火,在成对引物情况下,优选在引物之间几乎没有或者没有退火。
组成用于PCR的引物的核苷酸的数量没有特别限制,只要它可用于PCR。该数量的下限一般为10-14个核苷酸,上限为40-60个核苷酸。优选地,引物为14-40个寡核苷酸长。
用于PCR的引物优选为DNA。引物中的核苷酸可以为脱氧腺嘌呤、脱氧胞嘧啶、脱氧胸腺嘧啶和脱氧鸟嘌呤,以及其它脱氧肌苷。在用于PCR的引物的5′-端的核苷酸的5′-位置适宜为一羟基或者通过酯键与一磷酸相连的羟基。
可以通过常用于合成核酸的方法,例如亚磷酰胺法,合成用于PCR的引物。可优选将自动化DNA合成器用于该方法。
来自产ML-236B的微生物的基因组DNA和mRNA可分别用作PCR或RT-PCR的模板。总RNA也可代替mRNA用作RT-PCR的模板。
PCR产物或RT-PCR产物可通过插入适宜DNA载体克隆。对用于该克隆步骤的DNA载体的选择一般没有限制。易于PCR和RT-PCR产物克隆的试剂盒可商购获得。例如,Orignal TA Cloning Kit(由Invitrogen生产;使用pCR2.1为DNA载体)适宜用于这种克隆。
为了获得经过克隆的PCR产物,将含有所需PCR产物的质粒的转化过的宿主细胞培养,然后将这些质粒从这些细胞中提取并提纯。然后从所得质粒中回收插入的DNA片段。
在适合宿主细胞的条件下将转化过的宿主细胞进行适宜培养。优选的宿主细胞,大肠杆菌,可以在LB培养基[1%(w/v)胰蛋白胨、0.5%(w/v)酵母浸出物、0.5%(w/v)氯化钠]中在30-37℃下摇动培养18小时至2天。
通过回收宿主细胞并使质粒分离成不含其它细胞组分如基因组DNA或宿主蛋白,可以制备来自转化过的宿主细胞的培养物的质粒。按照Maniatis的碱性法[Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]可以制备来自大肠杆菌培养物的质粒DNA。用于获得具有高纯度质粒的试剂盒可商购获得。优选Plasmid Mini Kit[由QIAGENAG生产]。而且,用于大量生产质粒的试剂盒可商购获得。优选Plasmid Maxi Kit(由QIAGENAG生产)。
在DNA样品适当稀释之后,可以在260nm的波长下通过测定吸光度,并以吸光度OD260为1的溶液含有50μg/ml DNA为基础计算来确定所得质粒DNA的浓度(记载于Maniatis等人的,参见上面)。
由波长在280和260nm下的吸光度的比可以计算DNA的纯度(记载于Maniatis等人的,参见上面)。
标记核酸探针的方法通常分为放射性标记和非放射性标记。对用于放射性标记的放射性核苷酸的选择一般没有限制,并且例如可以为32P、35S、14C等。优选在标记中使用32P。对用于非放射性标记的试剂的选择一般也没有限制,只要它可常用于标记核酸,并且例如可以为地高辛配基、生物素等,优选地高辛配基。
核酸探针的标记方法一般也没有限制。优选常用方法,例如将探针插入使用标记的核苷酸底物通过PCR或RT-PCR获得的产物中的方法、切口平移法、使用随机引物、末端标记法以及使用标记过的核苷酸底物合成寡核苷酸DNA的方法。适宜方法可以根据核酸探针的种类从这些方法中选择。
通过与所述产ML-236B的微生物的基因组DNA的Southern印迹杂交,可以证实产ML-236B的微生物的基因组中存在的核苷酸序列与特定核酸探针的核苷酸序列相同。
按照Maniatis的方法(记载于Maniatis等人的,参见上面)可以进行Southern印迹杂交。
如上所述制备的标记过的核酸探针可用于筛选基因组DNA文库。对筛选方法的选择没有特别限制,只要它一般适宜基因克隆,但优选该克隆杂交法[记载于Maniatis等人的,参见上面]。
将用于菌落杂交的菌落在适合宿主细胞的条件下进行适宜培养。可以将一种优选宿主——大肠杆菌通过在LB琼脂培养基[1%(w/v)胰蛋白胨、0.5%(w/v)酵母浸出物、0.5%(w/v)氯化钠、1.5%(w/v)琼脂糖]中在30-37℃下培养18小时至2天进行培养。
通常通过从阳性克隆的培养物中提取质粒并将其提纯来制备来自通过菌落杂交获得的阳性克隆的重组DNA载体。
根据微生物保藏的布达佩斯条约,根据本发明获得的代表阳性克隆的转化大肠杆菌菌株,大肠杆菌pML48 SANK71199于1999年7月7日保藏在工业科技署的生命科学和技术研究院,并且记录的登记号为FERM BP-6780。
由大肠杆菌pMIA8 SANK71199携带的典型DNA载体被命名为pMIA8。
通过测定重组DNA载体插入片段的核苷酸序列、Southern印迹杂交或该插入片段表达以确定功能,可以适宜地评价证实存在于阳性克隆中的重组DNA载体含有与ML-236B生物合成有关的基因组DNA。
可以根据Maxam和Gilbert化学修饰技术[记载于Maxam,A.M.M.和Gilbert,W.的“酶学方法”65,499(1980)]或双脱氧链终止法[记载于Messing,J.和Vieira,J.的“基因学”19,269(1982)]测定DNA的核苷酸序列。其它适宜方法在本领域中众所周知。如上所述,用于测定核苷酸序列的质粒DNA优选为高纯度样品。
pML48插入片段的核苷酸序列示于序列表的SEQ ID NO1。在序列表的SEQID NO2中所示的核苷酸序列与SEQ ID NO1所示的核苷酸序列完全互补。通常,在一个种中基因组DNA的核苷酸序列能够具有遗传多态性,即同种异型差异。而且,在DNA克隆和测序过程中,已知核苷酸替代或其它改变可以一定频率发生。因此,本发明中与ML-236B生物合成有关的基因组DNA还包括可与序列表的SEQ ID NO1或2的第1个核苷酸至第34203个核苷酸的DNA杂交的基因组DNA和其它DNA。优选基因组或其它DNA可以在严格条件下与序列表的SEQ ID NO1或2的第1个核苷酸至第34203个核苷酸的DNA杂交,其中一个或多个核苷酸被替代、缺失和/或添加。此外,这些杂交基因组或其它DNA可以包括来源于除柑桔青霉SANK13380的产ML-236B的微生物的DNA。优选当将其导入产ML-236B的微生物中时它们能提高ML-236B的产量。
适宜地根据以下方法1)-3)分析与ML-236B生物合成有关的基因组DNA。
1)用基因分析软件分析
可以使用寻找基因的程序(下文称之为“GRAIL”)和检索同源序列的程序(BLASTN和BLASTX)定位基因组DNA内的基因。
GRAIL为检索基因组DNA中的结构基因的程序:通过将基因组序列分成7个评价基因序列外观的参数,使用神经网络法整合结果[记载于Uberbacher,E.C.和Mural,R.J.的“美国国家科学院院报”88,11261(1991)]。例如可以使用ApoComGRAIL Toolkit[由Apocom公司生产]。
BLAST为使用进行核苷酸序列和氨基酸序列同源性检索的算法的程序[记载于Altschul,S.F.、Madden,T.L.等人“核酸检索”25,3389(1997)]。
通过将DNA序列分成适宜长度并使用BLASTN进行遗传数据库的同源性检索,可以预测在样品基因组DNA序列上结构基因的定位和方向。在待测DNA序列上结构基因的定位和方向还可以通过将细分的基因组DNA序列翻译成6个翻译片段(三个在有义链上,其它三个在反义链上)并使用BLASTX在肽数据库中进行所得氨基酸序列的同源性检索来进行预测。
在真核生物体中基因组DNA中的结构基因的编码区有时与内含子断裂。为了分析具有这些缺口的结构基因,用于含缺口序列的BLAST程序更有效,优选有缺口的BLAST程序(安装于BLAST2:WISCONSIN GCG包10.0版)。
2)根据Northern印迹杂交法分析
可以使用Northern印迹杂交法研究通过段1)中所述分析方法预测的结构基因的表达。
适宜地,来自产ML-236B的微生物的总RNA从微生物培养物中获得。优选产ML-236B的微生物柑桔青霉的培养物可通过以下获得:将来自斜面的所述微生物接种到MGB3-8培养基中,接着摇动培养,在22-28℃下培养1-4天。
对从产ML-236B的微生物中提取RNA的方法的选择没有限制,优选硫氰酸胍-热酚法、硫氰酸胍-盐酸胍法等。用于制备高纯度总RNA的可商购获得的试剂盒的例子包括RNeasy Plant Mini Kit(由Qiagen AG生产)。而且,通过将总RNA涂敷到寡(dT)柱上并回收吸附在该柱中的组分可以获得mRNA。
可以与上述Southern印迹杂交法相似的方式向膜转移RNA、制备探针、杂交并监测信号。
3)转录物的5′-端和3′-端的分析
可以按照“RACE”(快速扩增cDNA末端)法分析每个转录物的5′-端和3′-端。RACE为使用以mRNA为模板的RT-PCR获得在基因的5′-端或3′-端含有已知核苷酸区和未知区的cDNA的方法[记载于Frohman,M.A.的“酶学法”218,340(1998)]。
可以按照以下方法进行5′-RACE。使用mRNA为模板根据反转录酶反应合成cDNA的第一链。作为引物,使用对核苷酸序列的已知部分经设计的反义寡核苷酸(1)。使用末端脱氧核苷酸转移酶将一均聚核苷酸链(由一种碱组成)加到该cDNA第一链的3′-端。然后,使用cDNA的第一链作模板通过PCR将5′-端区域中的双链cDNA扩增。为了扩增,使用2个引物;来自含有与均聚序列互补的序列的有义链的DNA寡核苷酸以及在反义链上且在寡核苷酸DNA(1)的3′-端侧的寡核苷酸(2)[记载于Frohman,MA.的“酶学法”218,340(1993)]。有义5′-RACE的试剂盒可商购获得,适宜地为用于快速扩增cDNA端的5′RACE系统,2.0版(由GIBCO公司生产)。
3′RACE为一种使用存在于mRNA的3′-端的多腺苷酸区的方法。具体地说,使用mRNA为模板以及寡d(T)衔接子为引物通过反转录酶反义合成cDNA的第一链。然后,使用该cDNA的第一链为模板通过PCR在3′-端扩增双链cDNA。作为引物,使用在有义链上根据有义链的核苷酸序列的已知部分经设计的DNA寡核苷酸(3)以及反义链上的寡d(T)衔接子。用于3′RACE的试剂盒可商购获得,适宜地有Ready-To-GoT-primed First-StrandKit(Phramacia公司)。
在以感兴趣核苷酸序列的已知部分为基础的引物设计中,优选将上面1)和2)的分析结果用于该RACE步骤。
使用上面1)-3)中的分析方法,可以推断结构基因在基因组DNA序列上的方向,转录起始位点位于结构基因中的定位、翻译起始密码子和翻译终止密码子位于其中的位置。以上述信息为基础,可以获得每个结构基因及其cDNA,即加速ML-236B生物合成的cDNA。
假设在根据本发明获得的重组DNA载体pML48中6个结构基因存在于该插入的序列上。它们被分别命名为mlcA、mlcB、mlcC、mlcD、mlcE和mlcR。其中,假设在序列表的SEQ ID NO2所示的核苷酸序列上mlcA、mlcB、mlcE和mlcR具有编码区。假设在序列表的SEQ ID NO1所示的核苷酸序列上mlcC和mlcD具有编码区。
获得相应于上述结构基因的特定加速ML-236B生物合成的cDNA的方法的例子包括:使用基于每个结构基因的序列及其侧翼DNA设计的引物用RT-PCR克隆,使用基于已知核苷酸序列设计的适宜DNA探针由cDNA文库克隆。其它适宜方法在本领域中为公众所知。为了在功能上表达根据这些方法获得的cDNA,优选获得全长cDNA。
下面解释使用RT-PCR获得加速ML-236B生物合成的cDNA的方法。
用于RT-PCR并用于获得加速ML-236B生物合成的cDNA的一对引物需要经设计,以便它选择性地与每个模板链退火,从而获得cDNA。然而,用于RT-PCR的引物与每对模板链完全互补并不是必要的,只要它们满足上述条件。用于RT-PCR能与反义链退火的适宜引物(下文称之为“有义引物”)为与一对反义链完全互补的有义引物(下文称之为“未替代的有义引物”)或者为与一对反义链不完全互补的有义引物(下文称之为“部分替代的有义引物”)。用于RT-PCR且能与有义链退火的其它适宜引物(下文称之为“反义引物”)为与一对有义链完全互补的反义引物(下文称之为“未替代的反义引物”)或者为与一对有义链不完全互补的反义引物(下文称之为“部分替代的反义引物”)。
有义引物经适宜设计,以便使用其获得的RT-PCR产物在翻译起始的起始位置含有密码子ATG。该RT-PCR产物适宜地还仅在具有原始ATG起始位点的读框中含有正确翻译终止密码子,并且没有其它(假)翻译终止位点。本发明预测的这些结构基因的翻译起始密码子的位置示于用于定位于序列表的SEQID NO1和SEQ ID NO2中的基因的表5中。
未替代的有义引物的5’-端适宜地为翻译起始密码子ATG的核苷酸“A”或者存在于其5’-端的碱基。
部分替代的有义引物选择性地与序列表的SEQ ID NO1或SEQ ID NO2中的特定区退火,序列表的SEQ ID NO2的核苷酸序列与序列表SEQ ID NO2的核苷酸序列完全互补。
当部分替代的有义引物含有存在于翻译起始密码子ATG的3’-端的核苷酸序列时,在该区域它适宜地不含在与该ATG相同的读框中为终止密码子(TAA、TAG或TGA)的核苷酸序列。
部分替代的有义引物可以含有核苷酸“A”、核苷酸序列“AT”或“ATG”(下文称之为“核苷酸或核苷酸序列m′”),它们与翻译起始密码子的核苷酸“A”、核苷酸序列“AT”或“ATG”(下文称之为“核苷酸或核苷酸序列m”)相对应。当该核苷酸m′为与序列“m”的“A”相对应的“A”时,我们优选m′“A”位于部分替代的有义引物的3′-端。类似地,当m′为“AT”时,我们优选该m′“AT”序列位于部分替代的有义引物的3′-端。当该核苷酸或核苷酸序列m为相应于m′“ATG”的“ATG”时,我们优选这些为引物中的3’-ATG的三核苷酸不是终止密码子。换句话说,对三核苷酸而言,其中在3′-端方向从m′“ATG”的A数起5′-端核苷酸为第(3×n+1)个核苷酸(n代表≥1的整数),该三核苷酸的核苷酸序列优选既不是TAA、TAG,也不是TGA。上述引物可用于获得在相应于用作RT-PCR模板的mRNA的翻译起始密码子的位置具有甲硫氨酸密码子的cDNA。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+1)时,在使用部分替代的有义引物作为一个引物并且产ML-236B的微生物的RNA或mRNA为模板获得的RT-PCR产物中,或者在使用基因组DNA或cDNA为模板获得的PCR产物中,从该位置开始的该三核苷酸最好不是TAA、TAG或TGA。在3′-端方向从翻译起始密码子“ATG”的“A”计数该核苷酸位置,其中“n”代表1的整数。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+2)时,位置3×n+2为中心核苷酸的三联体最好不是上面获得的PCR或RT-PCR产物的序列TAA、TAG或TGA。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+3)时,位置(3×n+3)为该3′核苷酸的三联体最好不是序列TAA、TAG或TGA。
对有义引物的要求如上面讨论的。
设计一反义引物,以便当与有义引物一起配对时,编码每个结构基因(mlcA、mlcB、mlcC、mlcD、mlcE和mlcR)的cDNA可以使用RT-PCR在与相应肽的N-端至C-端相同的方向扩增。
对未替代的反义引物的选择没有限制,只要它为具有与位于cDNA的翻译终止位点区的核苷酸序列互补的核苷酸序列的反义引物。然而,优选具有与翻译终止密码子的3′端的碱基互补的5′-端碱基的引物,或者具有在所示引物碱基的5′-端的碱基的引物。更优选含有三个与翻译终止密码子互补的碱基的引物。表8-10显示了每个结构基因的翻译终止密码子,与该翻译终止密码子互补的序列、在每个结构基因编码的肽的C-端的氨基酸残基、编码该氨基酸残基的核苷酸序列、及其在SEQ ID NO1或SEQ ID NO2的位置。
部分替代的反义引物选择性地与序列表的SEQ ID NO1或SEQ ID NO2的核苷酸序列中的特定区域退火。
上面是对反义引物的要求。
可以向部分替代的有义引物和部分替代的反义引物的5′-端插入适宜的核苷酸序列,只要满足上述要求。对这种核苷酸序列的选择没有特别限制,只要该引物可用于PCR。适宜序列的例子包括便于PCR产物克隆的核苷酸序列,例如限制酶切割位点和含有适宜限制酶切割位点的核苷酸序列。
此外,根据上述说明并根据用于PCR的引物的常规设计,将该有义引物和反义引物适宜地设计。
如上所述,来自产ML-236B的微生物的mRNA或总RNA可用作RT-PCR的模板。在本发明中,相应于结构基因mlcE的加速ML-236B生物合成的cDNA是通过设计和合成适宜扩增pML48插入片段序列中结构基因mlcE的所有编码区的一对引物,然后使用SANK13380的总RNA作模板[序列表中核苷酸序列SDQ ID NO35和36分别代表的引物]进行RT-PCR获得的。
使用序列表的核苷酸序列SEQ ID NO39和40所代表的引物以相似方式获得相应于结构基因mlcR的加速ML-236B生物合成的cDNA。
如上所述,该RT-PCR产物可以通过插入到适宜DNA载体中经克隆。对用于这种克隆的DNA载体的选择没有限制,它适宜地为常用于DNA片段克隆的DNA载体。易于进行RT-PCR产物克隆的试剂盒可商购获得。并优选Original TA Cloning Kit[由Invitrogen生产:使用pGR2.1作DNA载体]。
通过将cDNA克隆到适合在产ML-236B的微生物中功能性表达的DNA载体中,可以获得在产ML-236B的微生物中使用上面方法获得的加速ML-236B生物合成的cDNA的功能性表达的证明。然后用重组DNA载体转化适合的细胞,并将转化细胞的ML-236B生物合成能力与未转化的宿主细胞比较。如果在转化细胞中功能性地表达加速ML-236B生物合成的cDNA,那么与宿主细胞的ML-236B生物合成能力相比,转化细胞的ML-236B生物合成能力得到提高。
对适合在产ML-236B的微生物中表达的DNA载体[下文称之为功能性表达载体]的选择没有特别限制,只要它可用于转化产ML-236B的微生物并且可以功能性地表达在该生物体中由加速ML-236B生物合成的cDNA编码的多肽。优选该载体在宿主细胞中稳定,并且具有能在宿主细胞中复制的核苷酸序列。
用于功能性表达的载体可以含有一个以上加速ML-236B生物合成的cDNA,例如相应于结构基因mlcE和/或mlcR的cDNA。
除导入产ML-236B的微生物中时加速ML-236B生物合成且相应于结构基因mlcE和/或mlcR的cDNA之外,用于功能性表达的载体可以含有一种以上的DNA。这种DNA的例子包括:相应于结构基因mlcA、mlcB、mlcC或mlcD的cDNA、与ML-236B生物合成有关的基因组DNA、编码本发明的加速ML-236B生物合成的cDNA的表达调节因子的DNA等。
用于功能性表达的载体优选包括向宿主细胞中的质粒提供选择性表型的核苷酸序列,并优选为穿梭载体。
而且,该选择性表型可以为药物抗性表型等,优选抗抗生素,更优选抗氨苄西林或者抗潮霉素B。
当表达载体为穿梭载体时,该载体适宜地含有允许该载体在一微生物组的宿主细胞中复制的核苷酸序列,以及由该载体插入片段编码的多肽在另一宿主细胞类型中表达所必需的核苷酸序列。优选该载体向转化的不同微生物组的每个宿主细胞提供不同选择性表型。微生物组组合的要求与用于本说明书中所述与ML-236B生物合成有关的DNA的克隆和表达的穿梭载体的要求相似。
在本发明中,适宜的穿梭载体DNA载体为pSAK700,它是由来源于存在于DNA载体pSAK333的构巢曲霉(记载于JP-平3-262486A)的3-磷酸甘油酯激酶(下文称之为“pak”)、用于插入外来基因的衔接子和存在于该DNA的pgk终止子按该顺序(参见图4)组合构建的。
通过将相应于上述结构基因mlcE的cDNA插入上述的表达载体中,可以在产ML-236B的微生物中表达多肽。在本发明中,已通过将相应于结构基因mlcE的cDNA插入pSAK700的衔接子位点获得重组cDNA表达载体pSAKexpE。在pSAKexpE中插入的序列,即相应于结构基因mlcE的cDNA的核苷酸序列示于序列表的SEQ ID NO37中。类似地,已通过将相应于结构基因mlcR的cDNA插入pSAK700的衔接子位点获得重组cDNA表达载体pSAKexpR。在pSAKexpR中插入的序列,即相应于结构基因mlcR的cDNA的核苷酸序列示于序列表的SEQ ID NO41中。
大肠杆菌pSAKexpE SANK72499,为由pSAKexpE转化的大肠杆菌菌株,根据微生物保藏的布达佩斯条约,2000年1月25日以保藏号FERM BP-7005保藏在工业科技署的生命科学和技术研究院。大肠杆菌pSAKexpR SANK72599,为由pSAKexpR转化的大肠杆菌菌株,根据微生物保藏的布达佩斯条约,2000年1月25日以保藏号FERM BP-7006保藏在工业科技署的生命科学和技术研究院。
可以根据宿主细胞适当地选择适合的转化方法,从而获得加速ML-236B生物合成的cDNA的表达、与ML-236B生物合成有关的基因组DNA或其片段。柑桔青霉(一种优选的产ML-236B的微生物)的转化可以通过以下进行:由柑桔青霉孢子制备原生质体,然后将重组DNA载体导入该原生质体[记载于Nara,F.等人的“当前基因技术”23,28(1993)]。
适宜地将来自柑桔青霉培养物斜面的孢子接种到PGA琼脂培养基的平皿上并在22-28℃下培养10-14天。然后从该平皿收获这些孢子,并将1×107-1×109个孢子接种到50-100ml YPL-20培养基[组成:0.1%(w/v)酵母浸出物(由Difco公司生产)、0.5%(w/v)聚胨(由Nihon Seiyaku公司生产)、20%(w/v)乳糖,pH5.0]中,然后在22-28℃下培养18小时-2天。从培养物中回收萌发孢子,并用细胞壁降解酶处理,从而获得原生质体。对细胞壁降解酶的选择没有特别限制,只要其可降解柑桔青霉的细胞壁,并且对微生物没有有害影响。其例子包括:酶解酶、壳质酶等。
在适宜条件下将含有加速ML-236B生物合成的cDNA的重组DNA载体和产ML-236B的微生物或其原生质体混合使重组DNA载体导入所述原生质体中,从而提供转化体。
在适合每个宿主细胞的条件下对产ML-236B的微生物的转化体进行适宜培养。柑桔青霉,一种优选的产ML-236B的微生物,的培养可以通过以下进行:在适宜再生细胞壁的条件下培养预先转化的原生质体,然后培养。即,可以将柑桔青霉的转化原生质体加入VGS中间层琼脂培养基[组成:Vogel最小化培养基、2%(w/v)葡萄糖、1M葡糖醇、2%(w/v)琼脂]。然后将该VGS中间层琼脂夹在VGS下层琼脂培养基[组成:Vogel最小化培养基、2%(w/v)葡萄糖、1M葡糖醇、2.7%(w/v)琼脂]和含800μg/ml潮霉素B的VGS上层琼脂培养基[组成:Vogel最小化培养基、2%(m/v)葡萄糖、1M葡糖醇、1.5%(w/v)琼脂]之间,然后在22-28℃下培养7-15天。所得菌株在PGA培养基上在22-28℃下温育进行传代培养。用铂针将该菌株接种到由PGA培养基制成的斜面上,在22-28℃下培养10-14天,然后在0-4℃下保藏。
如上所述,通过将从所述斜面获得且具有再生细胞壁的柑桔青霉转化体接种到MBG3-8培养基中,接着摇动在22-28℃下培养7-12天,可以有效地生产ML-236B。作为宿主的柑桔青霉可以在液体培养基中培养,也可以产生ML-236B。
通过将用于提纯天然产物的不同方法组合,可以提纯来自产ML-236B的微生物的转化体的培养物的ML-236B。对这些方法的选择没有特别限制,例如可以是通过离心、过滤分离固体和液体、用碱或酸处理、用有机溶剂提取、溶解、如吸附色谱法、分配色谱法等的色谱法、以及结晶法等。ML-236B可以为羟酸或内酯形式,它们可以相互转换。羟酸可转变成其更稳定的盐。使用这些物理性能,可以获得ML-236B羟酸形式(下文称之为羟酸)、ML-236B羟酸的盐(下文称之为羟酸盐)或者ML-236B内酯形式(下文称之为内酯)。
为了将环打开并转变成羟酸盐,该培养物在高温或室温下经过碱水解,然后反应溶液经酸化,接着过滤。滤液用有机溶剂提取,使其与水分离,从而得到为自由羟酸的想要产物。对有机溶剂的选择没有特别限制。其例子包括:脂族烃如己烷、庚烷等;芳族烃如苯、甲苯等;卤代烃如二氯甲烷、氯仿等;醚如二乙醚等;酯如甲酸乙酯、乙酸乙酯等;或由两种或多种溶剂组成的混合物。
可以将该自由羟酸溶于如氢氧化钠的碱金属盐水溶液中以羟酸盐形式获得想要化合物。
而且,可以通过在脱水的有机溶剂中加热自由羟酸或者通过其它适宜方法以内酯获得想要化合物。
可以使用柱色谱法等提纯和分离因此获得的自由羟酸、羟酸或内酯。用于色谱法的柱的载体没有特别限制。其例子包括:Sephadex LH-20(由Pharmacia公司生产)、Diaion HP-20(由Mitsubishi Kagaku公司生产)、硅胶、逆相载体等,优选C18系列载体。
对ML-236B的定量方法的选择没有特别限制,优选常用于定量有机化合物的方法。其例子包括:逆相高效液相色谱法(下文称之为“逆相HPLC”)等。按照逆相HPLC的定量如下:通过使产ML-236B的微生物的培养物经过碱水解,使用C18柱使水溶性部分经过逆相HPLC,测定UV吸收,将吸收值转换成ML-236B的量。对C18柱的选择没有特别限制,液相用于常规逆相HPLC的C18柱。其例子包括:SSC-ODS-262(直径6mm,长100mm,由Senshu Kagaku公司生产)等。对用于移动相的溶剂的选择没有特别限制,只要它为常用于逆相HPLC的溶剂。例如它为75%(w/v)甲醇-0.1%(w/v)三乙胺-0.1%(w/v)乙酸等。当在室温下将ML-236B加入SSC-ODS-262柱时,在使用75%(w/v)甲醇-0.1%(w/v)三乙胺-0.1%(w/v)酸作为以2ml/min的速度的移动相时,4.0分钟之后将ML-236B冲洗。使用用于HPLC的UV检测器测定ML-236B。用于UV测定的吸收波长为220-280nm,优选220-260nm,更优选236nm。
提供了含有使用本发明获得的ML-236B和药用载体的药用组合物。
还提供了含有由使用本发明获得的ML-236B转变的帕伐他丁和药用载体的药用组合物。
本发明的药用组合物可以为常规以及与ML-236B或帕伐他丁的现有制剂所用的相同。
治疗方法也为本发明的一部分,使用这些化合物或组合物治疗高脂血和其它病症。
现在参照以下附图和实施例更详细地描述本发明。这些实施例为描述性,并不用于限制本发明。
图1为DNA载体pSAKcosl的结构的图示图;
图2为pML48的插入序列的结构基因分析的结果;
图3显示了pML48的插入序列的Northern印迹杂交。
图4为cDNA表达载体pSAK700的结构的图示图;和
图5显示了用于在pSAKexpR转化体中转录mlcA-E和R的RT-PCR分析。
图5显示了用于在pSAKexpE转化体中转录mlcE的RT-PCR分析。
实施例1:pSAKcosl载体的构建
来源于大肠杆菌(JP-平3-262486A)的含有潮霉素B磷酸转移酶基因(下文称之为“HPT”)的质粒pSAK333用限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)消化,经处理形成具有T4DNA聚合酶(由日本Takara Shuzo有限公司生产)的平端。
如上面获得的DNA片段使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)自连接成环状,然后用其转化大肠杆菌的感受态细胞JM109(由日本Takara Shuzo有限公司生产)。从转化大肠杆菌中选择具有缺失BamHⅠ位点的质粒的菌株,并命名为pSAK360。
pSAK360用限制酶PvuⅡ消化,然后用碱性磷酸酶处理,产生在5′-端去磷酸化的片段。由粘粒载体pWE15(由STRATAGENE生产)获得含有cos位点的SalⅠ-ScaⅠ片段(约3kb)并经处理形成具有T4DNA聚合酶的平端。接着将其连接到pSAK360的PvuⅡ位点上。JM109用该DNA转化。从转化大肠杆菌中选择质粒中在PvuⅡ位点插入SalⅠ-ScaⅠ片段(约3kb)的这些菌株,并将这些菌株所载有的质粒命名为pSAKcosl。pSAKcosl含有用于限制酶BamHⅠ、EcoRⅠ和NotⅠ的切割位点,每个位点来源于pWE15。pSAKcosl具有一抗氨苄西林的基因和抗潮霉素的基因作为选择标记。
在以下实施例中,当将大肠杆菌用作宿主时,通过将40μg/ml氨苄西林(氨苄西林:由Sigma公司生产)加入相关培养基中进行pSAKcosl转化体、或者含外来基因插入片段的pSAKcosl的转化体的选择。当柑桔青霉SANK13380用作宿主时,通过将200μg/ml潮霉素(潮霉素B:由Sigma公司生产)加入相关培养基中进行pSAKcosl转化体、或者含外来基因插入片段的pSAKcosl的转化体的选择。
pSAKcosl的构建方法示于图1中。
实施例2:制备柑桔青霉SANK13380的基因组DNA
1)柑桔青霉SANK13380的培养物
在PGA琼脂培养基的斜面上进行柑桔青霉SANK13380的种子培养。即,使用铂针向琼脂接种柑桔青霉SANK13380,并在26℃下保持14天。将该斜面保持在4℃下。
通过液体充气培养进行主培养。将来自5mm2的上述斜面的细胞接种在于500ml锥形瓶中的50ml MBG3-8培养基中,在26℃下边以210rpm摇动培养5天。
2)由柑桔青霉SANK13380制备基因组DNA
在室温下将步骤1)中获得的培养物在10000×G下离心10分钟,并将细胞收获。在用干冰冷却的研钵中将3g(净重)细胞破碎,使其为粉末状。将这些破碎的细胞放在填充有20ml 62.5mM EDTA-2Na(由Wako Pure Chemical Industries有限公司生产)-5%(w/v)SDS-50mM Tris-HCl(由Wako Pure Chemical Industries有限公司生产)缓冲液(pH8.0)的离心管中,缓慢混合,然后在0℃下静置1小时。向其中添加10ml用10mM Tris-HCl-0.1mM EDTA.2Na(pH8.0,下文称之为“TE”)饱和的苯酚,然后将该混合物在50℃下缓慢搅拌1小时。
在室温下以10000×G离心10分钟之后,将15ml上层(水相)放入另一离心管中。向该溶液中加入0.5倍体积的TE饱和的苯酚和0.5倍体积的氯仿溶液。将该混合物搅拌2分钟,在室温下以10000×G离心10分钟(下文称之为“苯酚氯仿提取液”)。向10ml上层(水相)中加入10ml 8M乙酸铵(pH7.5)和25ml 2-丙醇(由Wako Pure Chemical Industries有限公司生产),接着在80℃下冷却15分钟,并在4℃下以10000×G离心10分钟。
沉淀之后,将沉淀物溶于5ml的TE中,之后向其中加入20μl的10mg/ml核糖核酸酶A(由Sigma公司生产)和250U核糖核酸酶T1(由GIBCO公司生产),接着在37℃下培养20分钟。将20ml 2-丙醇加入其中,缓慢混合。接着,将几缕基因组DNA汇集在巴氏滴管的尖端,并溶于1mlTE中。
接下来,将0.1倍体积的3M乙酸钠(pH6.5)和2.5倍体积的乙醇加入该DNA溶液中。将该溶液在-80℃下冷却15分钟,然后在4℃下以10000×G离心5分钟(下文称之为“乙醇沉淀”)。所得沉淀物溶于200μl的TE中,即为基因组DNA部分。
实施例3:柑桔青霉SANK13380的基因组DNA文库的制备
1)基因组DNA片段的制备
将0.25U的Sau3AⅠ(日本Takara Shuzo有限公司)加入100μl的实施例2中获得的柑桔青霉SANK13380的基因组DNA(50μg)的水溶液中。间隔10、30、60、90和120秒后,取出20μl混合物样品,向每个样品中加入0.5M EDTA(pH8.0),使限制酶反应终止。通过琼脂糖凝胶电泳将所得部分消化过的DNA片段分离,回收含有30kb以上DNA片段的琼脂糖凝胶。
将所回收的凝胶细碎,放入Ultra Free C3离心过滤装置(由日本Milipore公司生产)中。在-80℃下将该凝胶冷却15分钟直至冷冻,然后通过在37℃下培养10分钟将该凝胶熔化。以5000×G离心5分钟,从而提取DNA。该DNA经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于少量且适量的TE中。
2)DNA载体pSAKcosl的预处理
将pSAKcosl用限制酶BamHI(日本Takara Shuzo有限公司)消化,然后在65℃下经碱性磷酸酶(日本Takara Shuzo有限公司)处理30分钟。所得反应溶液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀溶于少量TE中。
3)连接和体外包装
将上面步骤1)中所述的基因组DNA片段(2μg)和经过上述预处理的pSAKcosl(1μg)混合,然后使用DNA连接试剂盒Ver.2(日本Takara Shuzo有限公司)在16℃下连接16小时。所得反应液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于5μl的TE中。使用GIGAPAK Ⅱ Gold试剂盒(由STRATAGENE公司生产)将该连接产物溶液经过体外包装,从而提供含有重组DNA载体的大肠杆菌转化体。将3ml LB培养基倒在形成了大肠杆菌转化体菌落的平皿上,然后使用细胞刮棒回收在平皿上的菌落(称之为“回收液1”)。再用3ml LB培养基将该平皿冲洗,并回收细胞(称之为“回收液2”)。将甘油加入回收液1和2的混合物中,使最终浓度达到18%(称之为大肠杆菌细胞液),将其保藏在-80℃下作为柑桔青霉SANK13380的基因组DNA文库。
实施例4:使用柑桔青霉SANK13380的基因组DNA作模板通过PCR扩增PKS基因片段
1)用于PCR的引物的设计和合成
以黄曲霉PKS基因的氨基酸序列(记载于Brown,D.W.等人的“美国国家科学院院报”93,1418(1996))为基础,设计和合成序列表的SEQ ID NO3和4中所示的简并引物。根据亚磷酰胺法进行该合成。
序列表的SEQ ID NO3:
gayacngcntgyasttc
序列表的SEQ ID NO4:
tcnccnknrcwgtgncc
在SEQ ID NO3和4的核苷酸序列中,n代表肌苷(次黄嘌呤),y代表t或c,s代表g或c,k代表g或t,r代表g或a,w代表a或t。
2)通过PCR扩增DNA片段
制备50μl反应液,它含有用于上述步骤1中所述PCR的引物(每个100pmol)、实施例2中获得的柑桔青霉SANK13380的基因组DNA(500ng)、0.2mMdATP、0.2mMdCTP、0.2mMdGTP、0.2mMdTTP、50mM氯化钾、2mM氯化镁和1.25UEx.TacDNA聚合酶(日本Takara Shuzo有限公司)。该溶液经过由以下三个连续步骤组成的反应循环:在94℃下1分钟、在58℃下2分钟和70℃下3分钟。重复该循环30次,从而将该DNA片段扩增。使用TaKaRaPCRThermal Cycler MP TP3000(由日本Takara Shuzo有限公司生产)进行PCR。
扩增的DNA片段经过琼脂糖凝胶电泳,然后将含有大小约为1.0-2.0kb的DNA片段的琼脂糖回收。从该凝胶中回收DNA,并经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于少量TE中。
3)连接和转化
使用TA克隆系统pCR2.1(由Invitrogen公司生产)将步骤2)中获得的DNA片段连接到质粒pCR2.1上,该质粒是以试剂盒的一部分提供的。该质粒转化成大肠杆菌JM109,从而提供转化体。
从所得转化体中选出几个菌落,并按照Maniatis等人的方法[记载于Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]将其培养。即,将每个菌落接种于24ml含有2ml LB培养基的试管中,并在37℃下摇动培养18小时。
根据碱性法[记载于Maniatis,T等人的,参见上面]由培养物制备重组DNA载体。即,在室温和10000×G下将1.5ml培养液离心2分钟。然后由沉淀物回收细胞。向这些细胞中加入100μl的50mM葡萄糖溶液、25mM Tris-HCl、10mMEDTA(pH8.0),从而形成一悬浮液。向其中加入20μl的0.2N氢氧化钠-1%(w/v)SDS。将该悬浮液缓慢搅拌至微生物裂解。然后加入150μl的3M乙酸钾-11.5%(w/v)乙酸,使所有蛋白质变性,接着在室温及10000×G下离心10分钟。回收上层液。将上层液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于50μl含有40μg/ml核糖核酸酶A(由Sigma公司生产)的TE中。
每个重组DNA载体用限制酶消化,并经过电泳。使用电泳时对所有插入片段具有不同消化图案的DNA测序器(377型:由日本Perkin Elmer生产)测定在这些重组DNA载体中的DNA插入片段的核苷酸序列。
以这种方式鉴定菌株为含有由柑桔青霉获得的PKS片段的重组DNA载体。
实施例5:柑桔青霉SANK13380的基因组Southern印迹杂交
1)电泳并转移到膜上
将实施例2中获得的柑桔青霉SANK13380的基因组DNA(10μg)用限制酶EcoRⅠ、SalⅠ、HindⅢ或Sacl(都是由日本Takara Shuzo有限公司生产的)消化,然后经过琼脂糖凝胶电泳。该凝胶是使用琼脂糖L03“TAKARA”(日本TakaraShuzo有限公司)制备的。电泳之后,将该凝胶浸泡在0.25N盐酸(由Wako Pure化学工业有限公司生产)中并在缓慢摇动下在室温下培养10分钟。将该凝胶转移到0.4N氢氧化钠(由Wako Pure化学工业有限公司生产)中,在室温下温和培养30分钟。使用Maniatis等人的碱性转移法(参见上面),将凝胶中的DNA转移到尼龙膜HybondTM-N+(由Amersham公司生产)上,并在其上固定。将该膜用2×SSC(1×SSC含有150mM NaCl、15mM柠檬酸钠)洗涤,然后经空气干燥。
2)杂交和信号的测定
将步骤1)中获得的膜与作为探针的实施例4中获得的PKS基因片段杂交。
作为探针,将1μg实施例4中获得的PKS基因插入片段用DIG DNA标记试剂盒(由Boeringer-Mannheim生产)标记并煮沸10分钟,然后在使用前快速冷却。
将步骤1)中所述的膜浸泡在杂交液(DIG Easy Hyb:由Boeringer-Mannheim生产)中,然后在20rpm的摇动下在42℃预杂交2小时。然后,将上述标记的探针加入杂交液中,使用Multishaker Oven HB(由TAITEC公司生产)在20rpm的摇动下在42℃杂交18小时。然后将经过杂交的膜使用2×SSC在室温下冲洗3次,每次20分钟,使用0.1×SSC在55℃下冲洗2次,每次30分钟。
将冲洗过的膜用用于核酸的DIG发光检测试剂盒(由Boeringer-Mannhbeim生产)处理并将其曝光于X射线胶卷(Luumifilm,由Boeringer-Manmheim生产)上。使用Fuji医用胶卷处理器FPM800A(由Fuji胶卷公司生产)进行曝光。
结果证明,实施例4中获得的PKS基因片段存在于柑桔青霉的基因组上。
实施例6:使用PKS基因片段作探针筛选柑桔青霉SANK13380的基因组DNA文库
使用菌落杂交法克隆含有PKS基因的基因组DNA片段。
1)膜的制备
将以柑桔青霉SANK13380的基因组DNA文库(实施例3中所述)保藏的大肠杆菌细胞液稀释并涂布在LB琼脂培养基平皿上,以使每个平皿中可以生长5000-10000个菌落。将该平皿在26℃下保持18小时,并在4℃下冷却1小时。将HybondTM-N+膜(由Amersham公司生产)放在平皿上,并与其接触1分钟。将粘附有菌落的膜小心地从平皿重取出。将已与菌落接触的表面朝上并浸泡在200ml的1.5M氯化钠、0.5M Tris-HCl、1mM EDTA(pH7.5)溶液中持续3分钟,浸泡2次,然后用400ml的2×SSC冲洗。冲洗过的膜经空气干燥30分钟。
2)杂交
将实施例4中获得的PKS基因插入片段DNA(1μg)用作探针。使用DIGDNA标记试剂盒(由Boeringer-Mannheim生产)标记该DNA并煮沸10分钟,在使用前快速冷却。
将步骤1)中所述的膜浸泡在杂交液(DIG Easy Hyb:由Boeringer-Mannheim生产)中,然后在20rpm的摇动下在42℃预杂交2小时。然后,将上述标记的探针加入杂交液中,使用Multishaker Oven HB(由TAITEC公司生产)在20rpm的摇动下在42℃杂交18小时。然后将经过杂交的膜使用2×SSC在室温下冲洗3次,每次20分钟,使用0.1×SSC在68℃下冲洗2次,每次30分钟。
将冲洗过的膜用用于核酸的DIG发光检测试剂盒(由Boeringer-Mannheim生产)处理并将其曝光于X射线胶卷(Lumifilm,由Boeringer-Mannheim生产)上。使用Fuji医用胶卷处理器FPM800A(由Fuji胶卷公司生产)进行曝光。
将上面步骤1)和2)称之为筛选。
将在第一次筛选时检测为阳性信号的平皿上菌落刮下并回收悬浮于LB培养基中的细胞。然后,将细胞适当稀释并涂布在适宜平皿上。接着,进行第二次筛选,以提纯阳性克隆。
在本实施例中获得的阳性克隆,即转化大肠杆菌,大肠杆菌pML48SANK71199菌株,根据微生物保藏的布达佩斯条约,于1999年7月7日以保藏号FERM BP-6780保藏在工业科技署的生命科学和技术研究院。
实施例7:分析重组DNA载体pML48(1)的插入序列
以实施例4中所述的相似方式培养实施例6中获得的大肠杆菌pML48SANK71199菌株并由该培养物制备重组DNA载体。
获得的DNA载体命名为pML48。与ML-236B生物合成有关的基因组DNA的pML48的插入片段用各种限制酶消化,并将所得片段亚克隆到pUC119(由日本Takara Shuzo有限公司生产)中。使用所得亚克隆作为探针,通过与实施例5中所述的相似的方法进行Southern印迹杂交。即,通过用各种限制酶消化pML48获得的产物经过电泳,将这些DNA转移到一膜上,并经过杂交。结果,使用本领域的标准技术制备pML48插入序列的限制酶切割图。
使用377型DNA测序器(由日本Perkin Elmer有限公司生产)测定每个亚克隆插入序列的核苷酸序列,接着测定pML48的整个核苷酸序列。
pML48的插入序列由总共34203个碱基组成。
pML48插入序列的核苷酸序列记载于序列表的SEQ ID NO1和2中。序列表的SEQ ID NO1和2中所述的序列彼此完全互补。
使用基因检索程序GRAIL(ApoCom GRAIL Toolkit:由Apocom公司生产)和同源性检索程序BLAST(有缺口的BLAST(BLAST2):安装于WISCONSINGCG包10.0版中)分析pML48插入序列中结构基因的存在。
结果,预测在pML48的插入序列中存在6个不同结构基因,分别将其命名为mlcA、mlcB、mlcC、mlcD、mlcE和mlcR。而且,预测mlcA、mlcB、mlcE和mlcR在序列表的SEQ ID NO2的核苷酸序列中具有编码区,并且mlcC和mlcD在序列表的SEQ ID NO1的核苷酸序列中具有编码区。还预测了该插入序列中每个假定结构基因的相关位置和长度。
本实施例的结果示于图2中。每个箭头表示每个结构基因在pML48插入物上的位置、方向和相对大小。指向左边的箭头说明在ID SEQ NO2上存在结构基因(mlcA、B、E或R)的编码区。指向右边的箭头说明在ID SEQ NO1上存在结构基因(mlcC或D)的编码区。
实施例8:分析重组DNA载体pML48(2)的插入序列通过Northem印迹杂交分析在实施例7中预测存在的结构基因的表达。分析5′-端和3′-端区域。
1)柑桔青霉SANK13380的总RNA的制备
将来自柑桔青霉SANK13380斜面培养物(实施例2中所述)的5mm2的细胞接种在于100ml锥形瓶的10ml MGB3-8培养基中,并在26℃下摇动培养3天。
使用异硫氰酸胍法用RNeasy Plant Mini Kit(由Qiagen AG生产)由该培养物制备总RNA。即,在室温下以5000×G将该培养物离心10分钟,回收细胞。接着,用液氮将2g(湿重)细胞冷冻,然后在研钵中破碎成粉末。将破碎的细胞悬浮在4ml裂解缓冲液中(含在试剂盒中)。将450μl悬浮液倒入试剂盒中所含的10个QIAshredder自旋柱每一个中,然后在室温下以1000×G离心10分钟。将所得的每个洗脱液回收,向其中加入225μl乙醇,然后将其加入试剂盒中所含的RNA小自旋柱中。用冲洗试剂盒中所含物质的缓冲液冲洗柱,接着用50μl无核糖核酸酶的蒸馏水洗脱每个柱中所吸附物。将该洗脱液作为总RNA部分。
2)Northern印迹杂交
通过将2.25μl含20μg柑桔青霉SANK13380的总RNA的水溶液加入1μl10×MOPS(组成:200mM3-吗啉基丙烷磺酸、50mM乙酸钠、10mM EDTA.2Na;pH7.0;在高压锅中在121℃下灭菌20分钟之后使用;由Dojinkagaku Laboratory有限公司生产)、1.75μl甲醛和5μl甲酰胺中,接着混合,生产一RNA样品。将该RNA样品在65℃下保持10分钟,然后在冰水中快速冷却,并经过琼脂糖凝胶电泳。用于电泳的凝胶的制备如下:将10ml10×MOPS和1g琼脂糖L03“TAKARA”(由日本Takara Shuzo有限公司生产)与72ml二碳酸二乙酯处理水(由Sigma公司生产)混合,加热使该琼脂糖溶解,然后冷却,接着加入18ml甲醛。使用1×MOPS(用10倍水稀释10×MOPS制成)作为缓冲液样品。将凝胶中的RNA转移到10×SSC中的HybondTM-N+(由Amersham公司生产)上。
将通过用下表1所示的限制酶1和2消化pML48的插入序列获得的DNA片段a、b、c、d和e用作探针。在图3的上方格中显示了每个探针在pML48上的位置。
表1
用于Northern印迹杂交的探针
探针 限制酶1    限制酶位点的核苷酸号* 限制酶2    限制酶位点的核苷酸号*
 a  EcoRⅠ  6319-6324  EcoRⅠ  15799-15804
 b  BamHⅠ  16793-16798  PstⅠ  18164-18169
 c  KpnⅠ  26025-26030  BamHⅠ  27413-27418
 d  SalⅠ  28691-28696  SalⅠ  29551-29556
 e  HindⅢ  33050-33055  SacⅠ  34039-34044
*每个核苷酸号存在于序列表的SEQ ID NO1上
按照实施例5中所述的Southern印迹杂交进行探针的标记、杂交和信号的检测。
实施例的结果示于图3的下面方格中。
每个信号显示了存在于每个探针的核苷酸序列同源的转录产物。
结果暗示,预测存在于本实施例中的pML48的插入序列中的结构基因,即mlcA、mlcB、mlcC、mlcD、mlcE和mlcR被转录到柑桔青霉SANK13380中。
每个信号的位置未显示转录产物的相关大小。
3)按照5′RACE测定5′-端序列
使用快速扩增cDNA端的5′RACE系统,2.0版(由GIBCO公司生产)获得
含有每个结构基因的5′-端区域的cDNA。
生产两种反义寡核苷酸DNA。如实施例7的结果和本实施例的第2)项所预测的,该设计以推定在pML48的插入序列的编码区中和每个结构基因的5′-端附近的核苷酸序列为基础。
表2显示了以每个结构基因的3′-端的核苷酸序列为基础设计的反义寡核苷酸DNA(1)的核苷酸序列。表3显示了以每个结构基因的5′-端的核苷酸序列为基础设计的反义寡核苷酸DNA(2)的核苷酸序列。
表2:用于按照5′RACE测定5′-端序列的寡核苷酸DNA(1)
基因 序列表的SEQ IDNO 核苷酸序列
 mlcA  SEQ ID NO5  Gcatgttcaatttgctctc
 mlcB  SEQ ID NO6  Ctggatcagactttctgc
 mlcC  SEQ ID NO7  Gtcgcagtagcatgggcc
 mlcD  SEQ ID NO8  Gtcagagtgatgctcttctc
 mlcE  SEQ ID NO9  Gttgagaggattgtgagggc
 mlcR  SEQ ID NO10  Ttgcttgtgttggattgtc
表3:用于按照5′RACE测定5′-端序列的寡核苷酸DNA(2)
基因 序列表的SEQ IDNO  核苷酸序列
 mlcA  SEQ ID NO11  Catggtactctcgcccgttc
 mlcB  SEQ ID NO12  Ctccccagtacgtaagctc
 mlcC  SEQ ID NO13  Ccataatgagtgtgactgttc
 mlcD  SEQ ID NO14  Gaacatctgcatccccgtc
 mlcE  SEQ ID NO15  Ggaaggcaaagaaagtgtac
 mlcR  SEQ ID NO16  Agattcattgctgttggcatc
使用寡核苷酸DNA(1)作引物,并使用柑桔青霉SANK13380的总RNA作模板按照反转录反应合成cDNA第一链。即,将24μl的含有1μg总RNA、2.5pmol寡核苷酸DNA(1)和1μl SUPER SCRIPTTMⅡ反转录酶(含在试剂盒中)的反应混合物在16℃下培养1小时,将该反应产物添加到试剂盒中所含的GLASSMAX自旋柱体,从而提纯cDNA的第一链。
使用试剂盒中所含的末端脱氧核糖核苷酸转移酶将多胞嘧啶链加入cDNA第一链的3′-端。
将50μl的含有已加入3′-端多胞嘧啶链的cDNA的第一链的反应混合物与40pmol寡核苷酸DNA(2)和40pmol Abriged锚定引物(试剂盒中所含的)混合,然后在94℃下培养2分钟。然后将94℃下30秒、55℃下30秒和72℃下2分钟的培养循环重复35次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式克隆。
上述操作为5′-RACE。
测定含有5′-端的cDNA片段的核苷酸序列,并预测转录起始点和翻译起始密码子的位置。
表4显示了描述相应于通过5′RACE获得的每个结构基因的5′-端cDNA片段的核苷酸序列SEQ ID NO。表5显示了SEQ ID NO,其中每个结构基因存在转录起始点和翻译起始点,并描述了转录起始点和翻译起始点的位置。
表4:显示5′-端cDNA片段的核苷酸序列的SEQ ID NO
基因 序列表的SEQ ID NO
 mlcA  SEQ ID NO17
 mlcB  SEQ ID NO18
 mlcC  SEQ ID NO19
 mlcD  SEQ ID NO20
 mlcE  SEQ ID NO21
 mlcR  SEQ ID NO22
表5:每个基因的转录起始点和翻译起始点的位置
基因号 存在翻译起始密码子的SEQ ID NO  SEQ ID NO1或SEQ ID NO2中的核苷酸号
转录起始点 翻译起始密码子
 mlcA  SEQ ID NO2  22913  23045-23047
 mlcB  SEQ ID NO2  11689  11748-11750
 mlcC  SEQ ID NO1  11631  11796-11798
 mlcD  SEQ ID NO1  24066  24321-24323
 mlcE SEQ ID NO2  3399  3545-3547
 mlcR SEQ ID NO2  365  400-402
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
4)按照3′RACE测定3′-端序列
使用Ready To Go:T-引发的第一链试剂盒(由Pharmacia公司生产)获得含有每个结构基因的3′-端的cDNA。
由实施例7的结果和本实施例的第2)项预测,生产假设在编码区中和在pML48的插入序列的每个结构基因的3′-端附近的一种有义寡核苷酸DNA(3)。
对每个结构基因所产生的寡核苷酸DNA(3)的核苷酸序列示于表6中。
表6:按照3′RACE用于测定3′-端序列的寡核苷酸DNA(3)
基因 序列表的SEQ ID NO 核苷酸序列
mlcA  SEQ ID NO23  Atcataccatcttcaacaac
mlcB  SEQ ID NO24  Gctagaataggttacaagcc
mlcC  SEQ ID NO25  Acattgccaggcacccagac
mlcD  SEQ ID NO26  Caacgcccaagctgccaatc
mlcE  SEQ ID NO27  Gtcttttcctactatctacc
mlcR  SEQ ID NO28  Ctttcccagctgctactatc
使用NotⅠ-d(T)18引物(试剂盒中所含的)以及柑桔青霉SANK13380(1μg)的总RNA作模板通过反转录反应合成cDNA的第一链。
将100μl的含有cDNA的第一链的反应混合物、40pmol寡核苷酸DNA(3)和NotⅠ-d(T)18引物(试剂盒中所含的)在94℃下保持2分钟。将94℃下30秒、55℃下30秒和72℃下2分钟的培养循环重复35次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,然后从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式克隆。
上述操作为3′-RACE。
测定3′-端的cDNA的核苷酸序列,并预测翻译终止密码子的位置。
表7显示了描述相应于通过3′RACE获得的每个结构基因的3′-端cDNA片段的核苷酸序列的序列表的SEQ ID NO。表8显示了以序列表的SEQ ID NO1和2为基础的翻译终止密码子和该密码子的位置。
表7:显示3′-端cDNA片段的核苷酸序列的SEQ ID NO
基因 序列表的SEQ ID NO
 mlcA  SEQ ID NO29
 mlcB  SEQ ID NO30
 mlcC  SEQ ID NO31
 mlcD  SEQ ID NO32
 mlcE  SEQ ID NO33
 mlcR  SEQ ID NO34
表8:每个结构基因的翻译终止密码子和该翻译终止密码子的位置
基因 翻译终止密码子 存在翻译终止密码子的SEQ ID NO 翻译终止密码子在SEQ IDNO1或SEQ ID NO2中的核苷酸号
mlcA  tag  SEQ ID NO2  32723-32725
mlcB  taa  SEQ ID NO2  19840-19842
mlcC  taa  SEQ ID NO1  13479-13481
mlcD  tga  SEQ ID NO1  27890-27892
mlcE  tga  SEQ ID NO2  5730-5732
mlcR  tag  SEQ ID NO2  1915-1917
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
表9显示了预测由每个结构基因编码的多肽的C-端氨基酸残基,编码该氨基酸残基的三核苷酸的核苷酸序列和该三核苷酸的位置。
表9:由每个结构基因编码的多肽的C-端氨基酸残基
 基因 C-端氨基酸残基 编码氨基酸的三核苷酸的核苷酸序列  存在三核苷酸的SEQ ID 三核苷酸在SEQID NO1或2中的核苷酸号
 mlcA 丙氨酸 gcc  SEQ ID NO2  32720-32722
 mlcB 丝氨酸 agt  SEQ ID NO2  19837-19839
 mlcC 半胱氨酸 tgc  SEQ ID NO1  13476-13478
 mlcD 精氨酸 cgc  SEQ ID NO1  27887-27889
 mlcE 丙氨酸 gct  SEQ ID NO2  5727-5729
 mlcR 丙氨酸 gct  SEQ ID NO2  1912-1914
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
表10汇集了与表8中所示翻译终止密码子互补的序列,存在该互补序列的SEQ ID以及该互补序列的位置。
表10:与每个结构基因的翻译终止密码子互补的序列
 基因 与翻译终止密码子互补的序列  存在互补序列的SEQ ID NO 该互补序列在SEQ ID NO1或SEQ ID NO2中的核苷酸号
 mlcA  cta  SEQ ID NO1  1479-1481
 mlcB  tta  SEQ ID NO1  14362-14364
 mlcC  tta  SEQ ID NO2  20723-20725
 mlcD  tca  SEQ ID NO2  6312-6314
 mlcE  tca  SEQ ID NO1  28472-28474
 mlcR  cta  SEQ ID NO1  32287-32289
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
如上所述,确定了每个结构基因的位置、其方向及其位置。以上述信息为基础,可以获得每个结构基因的转录产物和翻译产物。
实施例9:获得相应于结构基因mlcE的cDNA
1)制备总RNA
按照实施例8的方法制备柑桔青霉的总RNA。
2)设计引物
为了获得相应于实施例8中测得的结构基因mlcE的全长cDNA,设计并合成以下引物:
有义引物5′-gttaacatgtcagaacctctaccccc-3′(参见序列表的SEQ ID35);和反义引物5′-aatatttcaagcatcagtctcaggcac-3′(参见序列表的SEQ ID36)。
这些引物分别由结构基因mlcE的5′-端上游区上的序列和3′-端下游区的序列获得。按照亚磷酰胺法进行合成。
3)RT-PCR
为了获得编码mlcE基因产物的全长cDNA,使用Takara RNA LA PCR试剂盒(AWV)1.1版。
具体地说,将20μl的含有1μg总RNA、2.5pmol随机9聚引物(试剂盒中所含的)和1μl反转录酶(试剂盒中所含的)的反应混合物在42℃下培养30分钟,制得cDNA的第一链。然后通过在99℃下加热5分钟使反转录酶失活。
将100μl的含有所有量的cDNA的第一链的反应混合物(上面)、40pmol有义引物和40pmol反义引物的第二个反应混合物在94℃下培养2分钟。将94℃下30秒、60下30秒和72℃下2分钟的培养循环重复30次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式转化大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)。从转化的大肠杆菌中选择载有带DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pCRexpE。
测定所得重组DNA载体pCRexpE的插入DNA的核苷酸序列。该插入DNA含有相应于结构基因mlcE的全长cDNA。其核苷酸序列以及由该核苷酸序列推断的肽的氨基酸序列示于序列表的SEQ ID NO37和/或SEQ ID NO38中。
mlcE(多肽)的最近已知序列为与洛伐他丁的生物合成有关的基因簇上的ORF10,具有70%的同一性。
实施例10:构建表达载体pSAK700
使用实施例1中所述的载体pSAK333和pSAK360构建cDNA表达载体pSAK700。
pSAK333用限制酶BamHⅠ和HindⅢ(由日本Takara Shuzo有限公司生产)消化,然后经过琼脂糖凝胶电泳。从该凝胶中回收一4.1kb片段,并用T4-DNA聚合酶(由日本Takara Shuzo有限公司生产)使该DNA端平头。
使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将EcoRⅠ-NotⅠ-BamHⅠ衔接子(由日本Takara Shuzo有限公司生产)连接到上述DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)转化。从转化的大肠杆菌中选择载有带该衔接子的质粒的菌株,并将该菌株所载的质粒命名为pSAK410。
pSAK360用限制酶PuvⅡ和SspⅠ消化,并经过电泳。从该凝胶中回收含有3-磷酸甘油酯激酶(下文称之为“pgk”)基因的启动子和终止子和来源于大肠杆菌的HPT的DNA片段(约2.9kb)。
使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将回收的上述DNA片段连接到pSAK410的PvuⅡ位点上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。从转化的大肠杆菌中选择载有带该DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pSAK700。
pSAK700的构建示于图4。
pSAK700具有酶BamHⅠ和NotⅠ的单一限制酶位点。pSAK700还具有抗氨苄西林的基因(下文称之为“Amp”)和抗潮霉素的基因HTP作为选择标记。在以下实施例中,当使用大肠杆菌作为宿主时,通过将40μg/ml氨苄西林加到相应培养基中对由pSAK700或含有外来DNA的pSAK700转化的细胞进行选择。当柑桔青霉SANK13380用作宿主时,通过将200μg/ml潮霉素加到相应培养基中对由pSAK700或含有外来DNA的pSAK700转化的细胞进行选择。
实施例11:构建cDNA表达载体pSAKexpE
在有限制酶HpaⅠ和SspⅠ(由日本Takara Shuzo有限公司生产)的情况下将实施例9中获得的重组DNA载体pCRexpE在37℃下反应2小时,并使反应产物经过琼脂糖凝胶电泳。从该凝胶回收含有约1.7kbmlcE全长cDNA的带。
在pSAK700与限制酶Notl(由日本Takara Shuzo有限公司生产)在37℃下反应1小时之后,用T4DNA聚合酶(日本Takara Shuzo有限公司)在37℃下持续5分钟使该载体的末端平头。然后,该载体经过苯酚氯仿提取和乙醇沉淀。将该沉淀物DNA溶于少量TE中。向其中加入碱性磷酸酶并在65℃下培养30分钟。使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将如上所述制备的pSAK700连接到步骤1)中获得的1.7kb的DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。获得由cDNA表达载体转化的大肠杆菌菌株。
根据微生物保藏的布达佩斯条约,将本实施例中获得的转化的大肠杆菌(命名为大肠杆菌pSAKexpE SANK 72499)于2000年1月25日以保藏号FERMBP-7005保藏在工业科技署的生命科学和技术研究院。
实施例12:获得相应于结构基因mlcR的cDNA
1)制备总RNA
按照实施例8的方法制备柑桔青霉的总RNA。
2)设计引物
为了获得相应于实施例8中测得的结构基因mlcR的全长cDNA,设计并合成以下引物:
有义引物5′-ggatccatgtccctgccgcatgcaacgattc-3′(参见序列表的SEQ ID 39);和反义引物5′-ggatccctaagcaatattgtgtttcttcgc-3′(参见序列表的SEQ ID 40)。
这些引物分别由结构基因mlcR的5′-端上游区上的序列和3′-端下游区的序列获得。按照亚磷酰胺法进行合成。
3)RT-PCR
为了获得编码mlcR基因产物的全长cDNA,使用Takara RNA LA PCR试剂盒(AWV)1.1版。
具体地说,将20μl的含有1μg总RNA、2.5pmol随机9聚引物(试剂盒中所含的)和1μl反转录酶(试剂盒中所含的)的反应混合物在42℃下培养30分钟,制得cDNA的第一链。然后通过在99℃下加热5分钟使反转录酶失活。
将100μl的含有所有量的cDNA的第一链的反应混合物(上面)、40pmol有义引物和40pmol反义引物的第二个反应混合物在94℃下培养2分钟。将94℃下30秒、60℃下30秒和72℃下2分钟的培养循环重复30次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式转化大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)。从转化的大肠杆菌中选择载有带DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pCRexpR。
测定所得重组DNA载体pCRexpR的插入DNA的核苷酸序列。该插入DNA含有相应于结构基因mlcR的全长cDNA。其核苷酸序列以及由该核苷酸序列推断的肽的氨基酸序列示于序列表的SEQ ID NO41和/或SEQ ID NO42中。
mlcR(多肽)的最近已知序列为与洛伐他丁的生物合成有关的基因簇上的lovE,具有34%的相同性。
实施例13:构建cDNA表达载体pSAKexpR
在有限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)的情况下将实施例12中获得的重组DNA载体pCRexpR在37℃下反应2小时,并使反应产物经过琼脂糖凝胶电泳。从该凝胶回收含有约1.4kb mlcR全长cDNA的带。
在pSAK700与限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)在37℃下反应1小时之后,加入碱性磷酸酶(由日本Takara Shuzo有限公司生产)并在65℃下反应30分钟。使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将如上所述用BamHⅠ消化的pSAK700连接到步骤1)中获得的1.4kb的DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。获得由cDNA表达载体转化的大肠杆菌菌株。
根据微生物保藏的布达佩斯条约,将本实施例中获得的转化的大肠杆菌(命名为大肠杆菌pSAKexpR SANK 72599)于2000年1月25日以保藏号FERMBP-7006保藏在工业科技署的生命科学和技术研究院。
实施例14:转化产ML-236B的微生物
1)制备原生质体
将来自柑桔青霉SANK 13380菌株的培养物斜面的孢子接种到PGA琼脂培养基上,然后在26℃下培养14天。然后从该培养物中回收柑桔青霉SANK1 3380菌株的孢子,并将1×108个孢子接种到80ml YPL-20培养基中,在26℃下培养1天。通过显微镜下观察证实孢子发芽之后,在室温下以5000×G将发芽的孢子离心10分钟,并回收沉淀物。
孢子用无菌水冲洗3次,形成原生质体。即,将200mg酶解酶20T(由SeikagakuKogyo公司生产)和100mg壳质酶(由Sigma公司生产)溶于10ml 0.55M氯化镁溶液中,在室温下以5000×G离心10分钟。所得上层液用作酶溶液。将20ml该酶溶液和0.Sg(湿重)发芽孢子放入100ml锥形瓶中并在30℃下缓慢摇动培养60分钟。使用显微镜证实发芽的孢子变成原生质体之后,将反应液通过3G-2玻璃滤器(由HARIO公司生产)过滤。滤液在室温下以1000×G离心10分钟,然后回收沉淀物原生质体。
2)转化
将步骤1)中获得的原生质体用30ml 0.55M氯化镁冲洗2次,用30ml由0.55M氯化镁、50mM氯化钙和10mM 3-吗啉基丙烷磺酸酯组成的溶液(pH6.3或更低,下文称之为MCM溶液)冲洗1次。然后将原生质体悬浮于100μl的4%(w/v)聚乙二醇8000、10mM 3-吗啉基丙烷磺酸酯、0.0025%(w/v)肝素(由Sigma公司生产)、50mM氯化镁的溶液(pH6.3或更低,下文称之为“转化液”)中。
将96μl含有约5×107个原生质体和10μl含有120μg pSAKexpE或pSAKexpR的TE混合,在冰上静置30分钟。向其中加入1.2ml的20%(w/v)聚乙二醇、50mM氯化镁、10mM 3-吗啉基丙烷磺酸的溶液(pH6.3)。然后将该液体缓慢移液,在室温下静置20分钟。向其中加入10ml MCM溶液,接着缓慢混合,在室温下以1000×G离心10分钟。从沉淀物中回收转化的原生质体。
3)转化原生质体的细胞壁的再生
将步骤2)中获得的转化原生质体悬浮于5ml液体VGS中间层琼脂培养基中,并放在10ml固体VGS下层琼脂培养基平皿上。在26℃下将该平皿培养1天,之后在每个平皿的上面放10ml含有5mg潮霉素B的液体VGS上层琼脂培养基(潮霉素的最终浓度为200μg/ml)。在26℃下培养14天之后,将两个菌株(即由pSAKexpE或pSAKexpR转化的原生质体获得的那些菌株)在含有200μg/ml PGA琼脂培养基上传代培养,并在用PGA琼脂培养基制备的斜面上亚培养,在26℃下培养14天。
将这些斜面保藏在4℃下。
测定实施例1:比较转化的菌株和原始菌株中的ML-236B生物合成能力
将实施例14中获得的转化菌株和柑桔青霉SANKl3380培养并测定每个培养物中的ML-236B的量。
将涉及柑桔青霉SANK13380的来自实施例14所述培养转化菌株的斜面和来自实施例2中所述的斜面的5mm2接种物孢子培养。将细胞接种到在100ml锥形瓶中的10ml MBG3-8培养基中。然后在24℃下摇动培养2天,接着加入3.5ml50%(w/v)甘油溶液。然后,在24℃下连续摇动培养10天。
向10ml该培养物中加入50ml 0.2N氢氧化钠,接着在26℃下摇动培养1小时。在室温下将该培养物以3000×G离心2分钟。回收1ml上层液,用9ml75%甲醇混合,并进行HPLC。
使用SSC-ODS-262(直径为6mm,长100mm,由Senshu Kagaku有限公司生产)作为HPLC柱,使用75%(w/v)甲醇-0.1%(m/v)三乙胺-0.1%(w/v)乙酸作为移动相。在室温下以2ml/min的流速进行冲洗。在这些条件下,加入到该柱之后,将ML-236B冲洗4分钟。在236nm的吸收波长下用UV检测器进行测定。
在8个pSAKexpE转化菌株中的3个菌株的ML-236B生物合成能力增加。与原始菌株相比,这些菌株的ML-236B生物合成能力平均高10%。在例如单孢子处理等的传代培养之后,这3个菌株中也能稳定地保持ML-236B生物合成能力。这些结果说明,pSAKexpE的插入片段为加速ML-236B生物合成的cDNA。
在这些pSAKexpR转化菌株中有5个菌株的ML-236B生物合成能力增加。与原始菌株相比,这些菌株的ML-236B生物合成能力平均高15%。在例如单孢子处理等的传代培养之后,这5个菌株中也能稳定地保持ML-236B生物合成能力。这些结果说明,pSAKexpE的插入片段为加速ML-236B生物合成的cDNA。
因此,按照本发明从产ML-236B的微生物中获得的加速ML-236B生物合成的cDNA当导入产ML-236B的微生物中时加速了该产ML-236B的微生物的ML-236B生物合成。
实施例15:相应于结构基因mlcA-D的cDNA的序列测定
测定相应于结构基因mlcA的cDNA的序列。
用TAKARA LA PCR试剂盒ver1.1(Takara Shuzo有限公司)合成第一链cDNA。为了扩增cDNA的全部或部分区域,使用该第一链cDNA为模板并使用几对不同的寡核苷酸作引物进行几次PCR。
使用Big Dye Primer/终止循环测序试剂盒和ABI Prism377序列(PE应用生物系统)将94℃下30秒、60℃下30秒和72℃下5分钟的循环重复30次。
将每个反应产物分别插入质粒pCR2.1。
获得每个重组质粒的大肠杆菌转化体。
测定由所述转化体获得的重组质粒的每个插入片段的核苷酸序列。
在比较上述几个RT-PCR产物和结构基因mlcA的核苷酸序列的基础上测定外显子和内含子的序列。
然后,测定相应于结构基因mlc A的cDNA的序列(SEQ ID NO43)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO44),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcA(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的LNKS(lovB),具有60%同一性。
以相似方式,测定相应于结构基因mlcB的cDNA的序列(SEQ ID NO45)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO46),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcB(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的LDKS(lovF),具有61%同一性。
相似地,测定相应于结构基因mlc C的cDNA的序列(SEQ ID NO47)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO48),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcC(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的lovA,具有72%同一性。
而且,测定相应于结构基因mlc D的cDNA的序列(SEQ ID NO49)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO50),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcD(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的ORF8,具有63%同一性。
测定在SEQ ID NO1或SEQ ID NO2上的每个结构基因的外显子的位置,如下:
表11:mlcA-D的外显子在pML48插入片段中的位置
存在外显子的SEQ ID 外显子号 SEQ ID NO1或SEQ ID NO2的核苷酸号
MlcA  2  1  22913 -  22945
 2  23003 -  23846
 3  23634 -  23846
 4  23918 -  24143
 5  24221 -  24562
 6  24627 -  27420
 7  27479 -  27699
 8  27761 -  30041
 9  30112 -  30454
 10  30514 -  30916
 11  30972 -  32910
 MlcB  2  1  11689 -  12002
 2  12106 -  12192
 3  12247 -  12304
 4  12359 -  12692
 5  12761 -  13271
 6  13330 -  13918
 7  13995 -  20052
 MlcC  1  1  11631 -  12140
 2  12207 -  12378
 3  12442 -  13606
 MlcD  1  1  24066 -  24185
 2  24270 -  27463
 3  27514 -  28130
测定的SEQ ID NO1或SEQ ID NO2上每个结构基因的转录终止位点的位置如下:
表12:结构基因mlcA-E和R的转录终止位点在pML48插入片段中的位置
 基因  存在转录终止位点的SEQ ID NO 转录终止位点在SEQ ID NO1或SEQ IDNO2中的核苷酸号
 mlcA  SEQ ID NO2  32910
 mlcB  SEQ ID NO2  20052
 mlcC  SEQ ID NO1  13606
 mlcD  SEQ ID NO1  28130
 mlcE  SEQ ID NO2  5814
 mlcR  SEQ ID NO2  1918
实施例16:基因破坏的研究
使用同源重组经定点诱变破坏柑桔青霉的结构基因mlcA、B或D。
使用质粒pSAK333构建用于获得结构基因mlcA遭破坏的柑桔青霉突变体的重组质粒。
将在该pML48插入片段上的mlcA基因座的4.1-kb内KanⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并连接到PuuⅡ消化过的pSAK333上。所得质粒命名为pdismlcA。
由pdismlcA转化柑桔青霉SANK13380。
对pdismlcA转化体的基因组DNA进行Southern杂交,以证实结构基因mlcA已破坏。
所得mlcA已破坏的突变体不再产生ML-236B或其前体。
使用质粒pSAK333构建用于获得结构基因mlcB遭破坏的柑桔青霉突变体的重组质粒。
将在该pML48插入片段上的mlcA基因座的1.4-Kb PsⅠ-BamHⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并与PuuⅡ消化过的pSAK333相连。所得质粒命名为pdismlcB。
由pdismlcB转化柑桔青霉SANK13380。
对pdismlcB转化体的基因组DNA进行Southern杂交,以证实结构基因mlcB已破坏。
所得mlcB已破坏的突变体不产生ML-236B,但产生ML-236A或ML-236B的前体。
使用质粒pSAK333构建用于获得结构基因mlcD遭破坏的柑桔青霉突变体的重组质粒。
将在该pMLA8插入片段上的mlcD基因座的1.4-Kb KpnⅠ-BamHⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并与PuuⅡ消化过的pSAK333相连。所得质粒命名为pdismlcD。
由pdismlcD转化柑桔青霉SANK13380。
对pdismlcD转化体的基因组DNA进行Southern杂交,以证实结构基因mlcD已破坏。
由所得mlcD已破坏的突变体产生的ML-236B的量为未转化的对照宿主的30%。
实施例17:在pSAKexpR转化体中的mlcR的功能分析
将实施例12中获得的两个pSAKexpR转化体分别命名为TR1和TR2,并且将未转化的宿主细胞——柑桔青霉SANK13380接种于MBG3-8培养基中,单独如实施例8中所述进行培养。
从实施例8中所述的每个培养物中提取总RNA。
使用所述总RNA为模板并以结构基因mlcA、B、C、D、E或R的核苷酸序列为基础设计的一对寡核苷酸为引物进行RT-PCR。
表13:用于RT-PCR的引物对的核苷酸序列
T-PCR的靶              引物1   SEQID NO                引物2  SEQ IDNO
 mlcA     5′-gcaagctctgctaccagcac-3′     51     5′-ctaggccaacttcagagccg-3′    52
 mlcB     5′-agtcatgcaggatctgggtc-3′     53     5′-gcagacacatcggtgaagtc-3′    54
 mlcC     5′-aaaccgcacctgtctattcc-3′     55     5′-ctttgtggttggatgcatac-3′    56
 mlcD     5′-cgctctatcatttcgaggac-3′     57     5′-tcaatagacggcatggagac-3′    58
 mlcE     5′-atgtcagaacctctaccccc-3′     59     5′-tcaagcatcagtctcaggca-3′    60
 mlcR     5′-atgtccctgccgcatgcaac-3′     61     5′-ctaagcaatattgtgtttct-3′    62
图5示出了未转化的柑桔青霉13380和两个命名为TR1、TR2的转化体的RT-PCR分析的结果。
在pSAKexpR转化体培养的第一、第二和第三天使结构基因mlcA、B、C、D和R表达。
与之相反,仅在未转化的宿主细胞培养的第三天使所有这些结构基因表达。
在结构基因mlcE表达时在pSAKexpR转化体和未转化的宿主细胞之间没有差异。
结果暗示,由相应于结构基因mlcR的cDNA编码的蛋白质诱导位于与ML-236B生物合成有关的基因簇中其它一些结构基因(例如mlc A、B、C、D)转录。
实施例18:在pSAKexpE转化体中的mlcE的功能分析
将实施例12中获得的pSAKexpE转化体命名为TE1,并且将其未转化的宿主细胞——柑桔青霉SANK13380接种于MBG3-8培养基中,并如实施例8中所述单独进行培养。
从实施例8中所述的每个培养物中提取总RNA。
使用所述总RNA为模板并以结构基因mlcA、B、C、D、E或R的核苷酸序列为基础设计的一对寡核苷酸为引物进行RT-PCR。用于本实施例的引物与上面实施例的表中的那些相同。
图6示出了未转化的柑桔青霉13380和命名为TE1的转化体的RT-PCR分析的结果。
在pSAKexpE转化体培养的第一、第二和第三天使结构基因mlcE表达。
与之相反,仅在未转化的宿主细胞培养的第三天使结构基因mlcE表达。
另一方面,在结构基因mlc A、B、C、D和R表达时在pSAKexpE转化体和未转化的宿主细胞之间没有差异(数据未显示)。
结果暗示,由相应于结构基因mlcE的cDNA编码的蛋白质不依赖于结构基因mlcA、B、C、D和R而加速ML-236B生物合成。
                  序列表<110>Sankyo有限公司<120>来自基因簇的基因<130>EPP83481<150>JP2000-116591<151>2000-04-18<150>JP2000-117458<151>2000-04-19<160>62<170>PatentIn version3.0<210>1<211>34203<212>DNA<213>柑桔青霉<400>1gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca     60gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc    120gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat    180attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata    240tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat    300gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc    360cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg    420gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt    480ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat    540gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc    600cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg    660tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca    720gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt    780ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt    840tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc    900acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc    960caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt   1020ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc   1080accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata   1140tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt   1200tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta   1260acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa   1320agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt   1380caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac   1440actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg   1500ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca   1560gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc   1620cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt   1680ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg   1740aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct   1800agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg   1860tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc   1920aggggaagca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg   1980gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg   2040taggcggcca ggtagaactg catgggggtt gccttgtgct tgcggctccg ctctttgatt   2100cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc   2160tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc   2220acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc   2280cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc   2340gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct   2400gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg   2460ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc   2520tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact   2580ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca   2640tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc   2700cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag   2760atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac   2820ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc   2880tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt   2940ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc   3000ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca   3060ccgccaagta ccctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg   3120acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg   3180ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact   3240ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg   3300ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc   3360tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg   3420gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt   3480aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg   3540gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa   3600catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc   3660gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg   3720atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc   3780agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact   3840gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag   3900aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc   3960tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg   4020gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca   4080ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt   4140gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat   4200gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc   4260gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag   4320caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga   4380cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt   4440gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc   4500gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat   4560atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact   4620gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt   4680ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg   4740agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga   4800cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt   4860gacgcagaag attgggggct ccataatcag aattgatgca tcagagccaa aggactgagc   4920gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc   4980ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat   5040agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact   5100gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta   5160gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc   5220ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc   5280cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt   5340cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc   5400gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa   5460aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg   5520cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg   5580gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag   5640aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag   5700ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc   5760cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat   5820gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa   5880tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa   5940gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc   6000aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt   6060ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg   6120ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat   6180gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag   6240atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc   6300aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc   6360cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt   6420cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt   6480acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag   6540caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg   6600tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc   6660gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg   6720agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg   6780tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac   6840cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc   6900tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg   6960atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc   7020aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg   7080aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca   7140acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca   7200cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc   7260gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag   7320cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc   7380aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa   7440gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct   7500ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg   7560ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg   7620ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga   7680caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact   7740tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg   7800atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc   7860atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt   7920agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag   7980gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga   8040agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat   8100gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag   8160ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca   8220aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg   8280gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt   8340tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac   8400aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt   8460tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg   8520gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg   8580tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc   8640aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt   8700gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt   8760gcgtcatcgt acgacatacc tgccgctagc atagcgcctg tctggccgct tggagaagag   8820gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg   8880atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg   8940aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga   9000ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca   9060tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct   9120tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac   9180tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg   9240aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc   9300ttgttgtgtg ctgcaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta   9360tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct   9420agcgttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca   9480tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac   9540tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct   9600aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac   9660tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa   9720gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat   9780cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc   9840cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct   9900gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg   9960gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc  10020aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg  10080cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg  10140gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata  10200ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt  10260ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt  10320gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag  10380cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta  10440caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc  10500ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt  10560cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct  10620caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag  10680gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc  10740acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga  10800aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc  10860ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca  10920aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga  10980gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt  11040acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga  11100aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata  11160actgctgatc ctgtttttgg gcgataggat tgggattaaa ccttgtcttg cgtcagtaga  11220tcttctcact gcatgccggg cacaacattt gttcttacag aatcgcagag ttgaatctct  11280gagcgaacaa gccggccttg caaccgatac cgtcgttata tttacttgca cgtatcagta  11340ctcatctaga ttcggacaat ttcaagatcc attctagtac tcaaatgccc ccacttccca  11400gcaatgcaag ctcggcacct agcaaaccct cccggcgtca ttcggtgcac gaatagccat  11460tcctccatac ggcgttattc ggtcacacga ggctgaatga atcaaacgtg aatatcaatt  11520ggctgtatca aggtgaaacc gagtttttca ctcggattgt tcttgtgctg ctcggtgaag  11580ctgctcctaa aggaaacaac cgaactgccc catccaggta aacttcgatt gggggggggg  11640tttttttttt ttcaaggttg actggaagag tgctctcggc cacaaaatcc cagaagcatt  11700agtgctgtta ttcgattata aaccgtcgca gcgctctcat tcttcgctct ttcttctttt  11760ccactggtgt gcataggtcc tatctgtctc acgcaatgct cggccaggtt cttctgaccg  11820tcgaatcgta ccaatgggta tcgacccctc aagcccttgt ggcggtcgca gtgcttctta  11880gtctcatcgc ctaccgtttg cgggggcgcc agtccgaact gcaagtctat aatcccaaaa  11940aatggtggga gttgacgacc atgagggcta ggcaggactt cgatacgtat ggtccgagct  12000ggatcgaagc ttggttctcg aaaaacgaca agcccctgcg cttcattgtt gattccggct  12060attgcaccat cctcccatcg tccatggccg acgagtttcg gaaaatcaaa gatatgtgca  12120tgtacaagtt tttggcggat gtatgacctc tgaattttcc attgttgtaa ctcaatgacg  12180tctctaagat tctgatgaat gtataggact ttcactctca tctccctgga ttcgacgggt  12240tcaaggaaat ctgccaggat gcacatcttg tcaacaaagt tgttttgaac cagttacaaa  12300cccaagcccc caagtacaca aagccattgg ctaccttggc cgacgctact attgccaagt  12360tgttcggtaa aagcgagggt aagtgtcaat ttttctgtct tgagcattga gcctctggct  12420gacataccgc gaatatacta gagtggcaaa ccgcacctgt ctattccaat ggattggacc  12480ttgtcacacg aacagtcaca ctcattatgg tcggcgacaa aatctgccac aatgaggagt  12540ggctggatat tgcaaagaac catgccgtga gtgtggcggt acaagctcgc caacttcgcg  12600tatggcccat gctactgcga ccgctcgctc actggtttca accgcaagga cgcaaattgc  12660gtgaccaagt gcgccgcgca cgaaagatca ttgatcctga gattcagcga cgacgtgctg  12720aaaaggccgc atgtgtagcg aagggcgtgc agccgcccca gtacgtcgat accatgcaat  12780ggtttgaaga caccgccgac ggccgctggt acgatgtggc gggtgctcag ctcgctatgg  12840atttcgccgg catctacgcc tcgacggatc ttttcgtcgg tgcccttgtg gacattgcca  12900ggcacccaga ccttattcag cctctccgcc aagagatccg cactgtaatc ggagaagggg  12960gctggacgcc tgcctctctg ttcaagctga agctcctcga cagctgcatg aaagagacgc  13020agcgaatcaa gccggtcgag tgcgccacta tgcgcagtac cgctctcaga gacatcactc  13080tatccaatgg cctcttcatt cccaagggcg agttggccgc tgtggctgca gaccgcatga  13140acaaccctga tgtgtgggaa aaccccgaaa attatgatcc ctaccgattt atgcgcatgc  13200gcgaggatcc agacaaggcc ttcaccgctc aattggagaa taccaacggt gatcacatcg  13260gcttcggctg gaacccacgc gcttgtcccg ggcggttctt cgcctcgaag gaaatcaaga  13320ttctcctcgc tcatatactg attcagtatg atgtgaagcc tgtaccagga gacgatgaca  13380aatactaccg tcacgctttt agcgttcgta tgcatccaac cacaaagctc atggtacgcc  13440ggcgcaacga ggacatcccg ctccctcatg accggtgcta agatataaca cgcaaactaa  13500aacaaatatg catccgtccc caggcttatt ccaatagttt ccgtcccaga gaaactaggt  13560gctgtattag tcgagtaggt tagtaaaata aaacgcattt tattcgattg tgatgccttc  13620tttgtaatcg aacgtggtgt agactttggc tatgtgcgag agacagaaac acagagagag  13680agaagggaga gagtgtgtat tcctgctacg cagagcggcc atctgcttct ataccgccag  13740ctacaccgcc acgtagggaa gtcggcagta atgaagcttt tctcccggta caatcaccga  13800tctccccatt ctctcaggcg ttgactggcg cttacgatga cgagggctta ggctctgtta  13860agtcttgatg ttcctactca acatccccga ctaggcgaaa gagaggacgg cgcaacgacg  13920tggacacaag tactccctcc cgccttccga ctacatatcc acaatctgta cccactgccc  13980gtgccaacgc ctttcgaccg ttcaacgcgc atttacaagg cttgcgggaa tcataatgga  14040gagaaaaaga gagaactttt gacagtcaag cctccgaggt gctaagacag cttccctggt  14100agtataaaaa gcattcactc ttccgacttc gagaacgagt gcacatgtgt actttgttgc  14160ttctcagggc cactgtaatg gtatttcagg tatctctatt tactgctatc cagaagtcag  14220gcattaaata gtcaggctca gcccaggctc gattcagatt ggattcaggc ttcagaccat  14280ggccgctatg ctccttcgta ctatacctcc gtcgagctat acccgcttgg ccagacaaaa  14340ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc  14400gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat  14460ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga  14520cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt  14580gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc  14640atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta  14700tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg  14760ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca  14820caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat  14880tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac  14940catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc  15000gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac  15060aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact  15120accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag  15180cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc  15240ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag  15300atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct  15360cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc  15420aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa  15480ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac  15540atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg  15600gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc  15660ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga  15720gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc  15780aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc  15840tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc  15900gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc  15960gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg  16020ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc  16080gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg  16140gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg  16200cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct  16260gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa  16320gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag  16380accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc  16440ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag  16500acgacgcccg ggttgctcga acggctgcag tgtgacctca accgcttctt ggtccttcca  16560gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa  16620ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag  16680ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc  16740gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc  16800ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc  16860ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc  16920aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct  16980agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg  17040gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc  17100ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg  17160aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt  17220agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag  17280tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc  17340cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg  17400caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg  17460atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc  17520acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt  17580ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc  17640caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc  17700gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat  17760catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg  17820agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg  17880ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag  17940gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat  18000atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag  18060gtccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca  18120agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt  18180gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc  18240ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa  18300cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc  18360cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct  18420ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc  18480ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg  18540catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattgttttg  18600aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc  18660ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc  18720ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca  18780gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt  18840ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc  18900ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt  18960gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat  19020gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat  19080atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg  19140tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac tgccgcgagg  19200ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt  19260cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc  19320cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga  19380aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt  19440gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc  19500tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag  19560catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc  19620agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt  19680gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat  19740gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg  19800taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg  19860actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac  19920attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg  19980cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga  20040taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt  20100tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag  20160tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc  20220tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa  20280cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat  20340cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc  20400cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt  20460ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt  20520ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc  20580cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca  20640agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac  20700cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc  20760gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac  20820agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga  20880aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt  20940tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca  21000agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg  21060tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg  21120aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt  21180acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct  21240gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct  21300ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta  21360ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg  21420agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact  21480ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc  21540gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa  21600gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac  21660gctgggacca cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt  21720gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc  21780gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat  21840accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc  21900actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg  21960tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac  22020ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg  22080tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat  22140gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca  22200cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg  22260ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg  22320ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag  22380agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg  22440cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat  22500aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag  22560ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata  22620ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag  22680aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg  22740ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg  22800aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac  22860caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa  22920ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca  22980acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata  23040tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct  23100tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc  23160ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga  23220agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat  23280ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa  23340actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata  23400ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca  23460tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta  23520ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt  23580gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc  23640tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag  23700gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat  23760tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat  23820aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc  23880agtgcaattg gtcctactat cctttgcttg gtacccctta ccaattatac cctaggcagc  23940agttgacacc ggtcatgaat ccattcataa aggtggacca gatgcaggga taaggaagcg  24000aatctttccg ctgcctcagc ctcaggggcg cgcgccattt gttattttct tctactcatt  24060tcccgtacct aggaactgtt cagttgtccc tcccaacccc ttgggccgaa caaccttcct  24120ccaatctacg acggcagatt atacctaggc gcctaaccga ttaggttgct cattcgattt  24180tggaggtatg cactttatct caagccctaa ttcccaattg aagtgctttt ccgtccccat  24240ttgcagagct gactagattc ttttctcaga gactacctag ctataggtac cactccaagc  24300tgtagcacag acctttcagc atggtcgctt cgttgctacc ctctcgcttt cgcggtaggg  24360aatcaatgaa tcagcagcac cctctacgct cgggaaatcg ggcattgacc tccacactcc  24420aatttctatc caaaacggcg tgtctacacc cgatccatac cgtttgcacc atagctattc  24480tagctagtac cacatacgtt ggactactca aagacagctt cttccatggc cccgcaaacg  24540ttgataaagc agaatggggc tctttggtcg aaggaagtcg aagcttgatc accggcccac  24600agaatggctg gaagtggcag agcttcgacg gggatgcaga tgttctcgga gatttcaacc  24660atcaagcact aatgaccttg gtattcccgg ggtcatatgg ggttgcatct caagcagcct  24720caccattcct tgctcccctc cctgtgaacc tatctgtgat tgaccttccc tcaacgtcga  24780gccctttaac cgcctattcg aaagataaag ttttcgcctt ctctgtggaa tacagcagcg  24840cgccggaact cgtggctgct gttcaagaaa tccccaacaa cagtgccgac ctgaaattgc  24900aggagacgca attgatcgag atggaacgcc agatgtggat catgaaggct gccagggctc  24960acacaaaacg cagccttgct caatgggtgc acgatacctg gacagagtct cttgatctta  25020tcaagagcgc tcaaacgctc gacgtggttg tcatggtgct aggttatata tcaatgcact  25080tgactttcgt ctcactcttc ctcagcatga aaaaattggg atcgaaggtt tggctggcta  25140caagcgtcct tttgtcgtca acatttgcct ttctcctcgg tctcgacgtg gccataagac  25200taggggttcc gatgagcatg aggttgctat ccgaaggcct ccccttcttg gtggtgatcg  25260ttggctttga gaagagcatc actctgacca gggctgtttt gtcctatgct gtgcagcacc  25320gaaagcccca gaagatacag tctgaccagg gtagcgtgac agccattgct gaaagtacca  25380tcaattacgc cgtacgaagc gccattcggg agaagggtta caatatcgtg tgccactacg  25440tggtcgagat cctgctccta gttatcggtg ctgtcttagg catccaaggt gggctacagc  25500acttctgtgt tctagctgca ttgatcctgt tctttgactg tctgctgctg tttacattct  25560acactgcgat tctgtctatc aagctcgagg taaaccgcct caaacgtcat atcaacatgc  25620ggtacgcgtt ggaagatgag ggtctcagtc agcggacggc ggagagtgtc gcgaccagca  25680atgatgccca agacagtgca cgtacatatc tgtttggcaa tgatatgaaa ggcagcagtg  25740ttccgaagtt caaattctgg atggtcgttg gtttccttat cgtcaacctc gtcaacatcg  25800gctccaccct tttccaagcc tcttctagtg gatcgttgtc cagtatatca tcttggaccg  25860aaagtctgag cggatcggcc attaaacccc cgcttgagcc cttcaaggta gctggaagtg  25920gactagatga actacttttc caggcaagag ggcgcggtca atcgactatg gtcactgtcc  25980tcgcccccat caagtacgaa ctagagtatc cttccattca ccgtggtacc tcgcagctac  26040acgagtatgg agttggtgga aaaatggtcg gtagcctgct caccagcctg gaagatcccg  26100tcctctccaa atgggtgttt gtggcacttg ccctaagtgt cgctctgaac agctatctgt  26160tcaaggccgc cagactggga atcaaagatc ctaatctccc gagtcaccca gttgatccag  26220ttgagcttga ccaggccgaa agcttcaacg ctgcccagaa ccagacccct cagattcaat  26280caagtctcca agctcctcag accagagtgt tcactcctac caccaccgac agtgacagtg  26340atgcctcatt agtcttaatt aaagcatctc taaaggtcac taagcgagca gaaggaaaga  26400cagccactag tgaacttccc gtgtctcgca cacaaatcga actggacaat ttgctgaagc  26460agaacacaat cagcgagttg aacgatgagg atgtcgttgc cttgtctttg cggggaaagg  26520ttcccgggta tgccctagag aagagtctca aagactgcac tcgtgccgtc aaggttcgcc  26580gctctatcat ttcgaggaca ccggctaccg cagagcttac aagtatgctg gagcactcga  26640agctgccgta cgaaaactac gcctgggaac gcgtgctcgg tgcatgttgc gagaacgtta  26700ttggctatat gccagtccct gttggcgtcg ccggtcctat tgttatcgac ggcaagagtt  26760atttcattcc tatggcaacc accgagggcg tcctcgtcgc tagtgctagc cgtggcagta  26820aggcaatcaa cctcggtggc ggtgccgtga cagtcctgac tggcgacggt atgacacgag  26880gcccgtgtgt gaagtttgat gtccttgaac gagctggtgc tgctaagatc tggctcgatt  26940cggacgtcgg ccagaccgta atgaaagaag ccttcaattc aaccagcaga tttgcgcgct  27000tacaaagtat gcggacaact atcgccggta ctcacttata tattcgattt aagactacta  27060ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta  27120tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta  27180cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg  27240aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg  27300ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct  27360tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg  27420cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc  27480gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt  27540ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg  27600cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc  27660acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc  27720tgccctagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc  27780atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc  27840taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg  27900gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca  27960tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg  28020caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac  28080gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta  28140ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga  28200gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca  28260atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg  28320ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg  28380caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga  28440ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg  28500tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg  28560ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa  28620cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca  28680cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa  28740agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga  28800gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct  28860ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa  28920gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac  28980gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga  29040aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca  29100aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc  29160gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt  29220gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga  29280attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag  29340tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa  29400caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg  29460ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg  29520ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa  29580atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg  29640gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg  29700tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata  29760taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac  29820atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca  29880atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca  29940tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt  30000cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt  30060gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca  30120ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca  30180ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg  30240tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt  30300tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc  30360cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg  30420gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg  30480ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc  30540ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt  30600tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc  30660gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt  30720ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg  30780ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt  30840gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca  30900caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc  30960tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat  31020tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc  31080caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca  31140tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc  31200tgggcaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt  31260tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat  31320gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg  31380tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt  31440ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg  31500agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt  31560caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc  31620taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac  31680ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag  31740aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt  31800atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca  31860agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag  31920ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt  31980tgatgatctc aaattgagat ggcgagcgct ggatctggga aattggtagt gggattggta  32040tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg  32100atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat  32160gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc  32220ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt  32280acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg  32340caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc  32400gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc  32460aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca  32520gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag  32580acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact  32640caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg  32700gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc  32760ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct  32820ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga  32880tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg  32940cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag  33000tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg  33060acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt  33120gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag  33180actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc  33240ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc  33300aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa  33360tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt  33420atcatagaat tgcagggttg ccgctgatgg ttctgataat gtttccttga gtgccgaggt  33480gccaatatgc gtaggtggtg agcagtaagg tggaggagtc tctgccaatg atgagaagac  33540cgtagaagat gtcgcggtca tcggttgtga ggtttctgtg gctcttgtag ttccagctgc  33600ggcttcttta tgtaaattgc gcttgggtag cctttcgctg tacacacacc ttaatccggc  33660ttgttgacaa cgttgacact gagcacggac taaattggca ttgctaccgg tacatttgag  33720cttttgtgca tgacaccggt cacatgagcg tcgaaacgcg cgacggcgta ggttcgtcgg  33780aatcgttgca tgcggcaggg acataattat tggattaaga tcaaataatg tgaggtgaga  33840ctttgcatgt tcctggatct ttatgtattg gaattggaga gtaagctcgt gcaggagata  33900agttcaggtc gtcttgctgg aagacttact aagttatatg caaacaagtg ttttcgagcg  33960gacaccaaaa gccaatagtc ttactatgaa tgtcttttca gtcacccgga gaaatactct  34020tagcctctgc tcttatgcga gctcatcaaa gctgggcata cataccccat ccagcgccac  34080gtattacact agaaagagtt ctaaaagaaa tagattcggc cccccatctg gctatcatat  34140atgccagatg aaatacctgt aacgtggggc ataaaaaggc aggctctagt ctaccagcag  34200atc                                                                34203<210>2<211>34203<212>DNA<213>柑桔青霉<400>2gatctgctgg tagactagag cctgcctttt tatgccccac gttacaggta tttcatctgg     60catatatgat agccagatgg ggggccgaat ctatttcttt tagaactctt tctagtgtaa    120tacgtggcgc tggatggggt atgtatgccc agctttgatg agctcgcata agagcagagg    180ctaagagtat ttctccgggt gactgaaaag acattcatag taagactatt ggcttttggt    240gtccgctcga aaacacttgt ttgcatataa cttagtaagt cttccagcaa gacgacctga    300acttatctcc tgcacgagct tactctccaa ttccaataca taaagatcca ggaacatgca    360aagtctcacc tcacattatt tgatcttaat ccaataatta tgtccctgcc gcatgcaacg    420attccgacga acctacgccg tcgcgcgttt cgacgctcat gtgaccggtg tcatgcacaa    480aagctcaaat gtaccggtag caatgccaat ttagtccgtg ctcagtgtca acgttgtcaa    540caagccggat taaggtgtgt gtacagcgaa aggctaccca agcgcaattt acataaagaa    600gccgcagctg gaactacaag agccacagaa acctcacaac cgatgaccgc gacatcttct    660acggtcttct catcattggc agagactcct ccaccttact gctcaccacc tacgcatatt    720ggcacctcgg cactcaagga aacattatca gaaccatcag cggcaaccct gcaattctat    780gatacatcaa tcaactttga tgatcccgag tcgtttcccg gcggctggcc tcagccaaat    840acatttcgcg acgatgccaa cagcaatgaa tcttcgggga taccagatct aggctacgac    900tttgaaggcc ctttggatgc aacggcgcct gtctcgccat cgctgtttga cctcgaagta    960gaggggaact cgtcatccgg acaatccaac acaagcaaca cgcaacgaga ccttttcgaa   1020agtctgtcgg atgtgtcaca ggacctagag gtaatactcc acggggtgac tgtggaatgg   1080cccaagcaaa aaattttaag ctgtgagatt ttcaattctg cctgtttact gcctcttgat   1140tgtcgctaaa gcttcttcct agacccgata ggggactttt tgaatgcctt tggtagattg   1200ctactacatc ttcaagaacg tgtgatcacg agcagcaata gcagcatgtt agatgggtgt   1260ctgcaaacca agaacttgtt catggcggtg cattgctaca tgttgtctgt caaaatcatg   1320acatcacttt cccagctgct actatccgag gtgatgaaag cccaaccttg tggacaaaag   1380caaagcacac gaatggattg gtactggtct ggctcaacca ctagaaatga caatggaaga   1440gccgaagcac ttccctcgtt tcactctaat cttcatatcg gcgagctcat ttcacatctc   1500gacccattca tgcacgcctt atcttctgca tgcacgacat tgcgtgtaag ccttcgacta   1560ttgagtgaga ttgagactgc tttggggata gcacaggagc acggggctgc ggcatctatt   1620cgtctagtaa gtgggaccga taaccaccag tcttttcttc ccttgcatac atcagcaatg   1680cgctgaccgg gagaggggga ataggtccta tcagatatgc caagcacatc gtggcaaatc   1740cttggcgctg aaaataaaac cataacgccg gcctctcgtc tcctatctgt gctttggagt   1800gacgaagccg gagacgaaga gcccaagtca acaaaggcct cagggaagac gataaatgtg   1860ttgcgacgtt gctataagga aatattcgca ttagcgaaga aacacaatat tgcttagtac   1920cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt   1980gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc   2040gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta   2100gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt   2160ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca   2220tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg   2280cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga   2340acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt   2400gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg   2460tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga   2520cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg   2580ttagccccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa   2640ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat   2700tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc   2760gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt   2820tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag   2880ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag   2940gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc   3000ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat   3060atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca   3120ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa   3180ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt   3240ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc   3300ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa   3360agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc   3420tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta   3480tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg   3540cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag   3600tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct   3660cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat   3720tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc   3780agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt   3840acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta   3900cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt   3960atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct   4020cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg   4080gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta   4140agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg   4200ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc   4260tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc   4320cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg   4380tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt   4440ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc   4500cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa   4560atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat   4620gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat   4680cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt   4740tggcgatgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc   4800ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat   4860ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg   4920aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg   4980tacacatttt tctccacccc gtccatttct atggctcctt tcttgccaca accgtctgac   5040atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact   5100atttgccttg ggccctaggc agcgctgttc tcgtcgccat aggcgcaggt ctggtatcca   5160ccttccagcc ccatacatca actgtgaaat gggtcatgta ccaatttatc gcgggcttcg   5220gtcgtggttg tggcatgcaa acggtaagct atgaaacctt tgatcatctc tcacgctttc   5280ggctttgtat caaagcaaga agagcatgca accgctagac gctgacatca atactcaatg   5340gccagcctat catcgccatc caaagcacgc tttcgcccga acaaggtgcc ctcggaattt   5400ctctcgccgt gtttggacag acgtttggag gatcgctctt cctggacttt gctaaccttg   5460tctttgggtc cggtttgaga actggcctga gcaagtatgc gcccactgtc gacacgcagg   5520ccgtgacggc agcaggggcg actggcttca gagatgtggt cagcaagaat aaccttccag   5580gggttgtaaa agcttacagt ctcgccgttg atcatacttt ttacttagca gtgggagcta   5640cggcgtgcac gtttgtgttt gcctttggaa tgggatggcg gaagattgca accaaaaacg   5700acacccgggc tgtgcctgag actgatgctt gaccgcgttg ctagatagac acattaccgt   5760gcctccacaa agaatctcca catacttaat taatgtcgat ttcaaagatt ctatatgtca   5820ttgcccgcga cccatgtcta gtctaagtcc atctcaaggt tctagtcacc gtggctagat   5880tggcaacata taactatgtt gagattcata gttagttagt tacggcatct gacaatggat   5940gattgatgtt tcaggcatca atcctgatac ctcaggaatg aatcagatca acattcaacc   6000tactcagtaa gttatagctt gaacaaagct ttcactcatt aaataattat gagggatcag   6060acctaaacac tctctggaaa aggaccatct ctttatatat tcttcttccc tactacttgc   6120atcgtaaatt tcaacaacat ataaacatga gatacccttt ctggccgttc actctaccac   6180ctgcctgtct cattgcattg tgcttttgaa aattatgaca ataacaacca atgagaaaaa   6240atatgatcct cctgcaatga atccactgga gggggtacgg agcttggaat gctcctaaga   6300ttccgaccta atcagcgtcg agcccgatca gtagctgcag cactcggcct cagtgcattg   6360ttaggaacag ggactgtcct ggttccgcct gacggggaga cacttcgaga aggggctgaa   6420gatgccgggg cagaacggtt gtgcgccatg tgcgccttga ccaggtgacc ggcggctagg   6480gcagcacata gcgagagctc cccagccaaa acagcgcttc cgatgatgcg cgcaagttga   6540cgtgcattct caccgggagt ggtcgggtgt gatccgcgga caccaagcat gtcaagcatt   6600gcgccctggg gctccagaat cgtaccaccg cccaacgttc caacctcaat agacggcatg   6660gagacagaga tttgaagcga tccgcgaaga ctaaacagga ttagtgaatg tttccaagta   6720agcggccgct ttcaacttac ttgttcatga gagtgatgca gttagcgctc tccacaactt   6780gcgccggatc ctgacctgtg gcaatgaaaa tggctgccgc aagattggca gcttgggcgt   6840tgaagccgcc aactgagcca gccatagcgg acccaatcag atttttcgat atgttgagct   6900gaaccatgct atccacatcg ctctttaaga catccctgac aacgttcgcc ggtatgatgg   6960cttcggccac aatgcccttg ccccgtccat cgatccaatt caaagctgaa ggtttcttat   7020ccgtacagta atttcctgat agggtaataa tattcatatc gctgaaacct gcctctgtcg   7080ccataacatt cagtgcatgc tccacgccct tagaaatcat attcattccc atagcgtcgc   7140cagtagtagt cttaaatcga atatataagt gagtaccggc gatagttgtc cgcatacttt   7200gtaagcgcgc aaatctgctg gttgaattga aggcttcttt cattacggtc tggccgacgt   7260ccgaatcgag ccagatctta gcagcaccag ctcgttcaag gacatcaaac ttcacacacg   7320ggcctcgtgt cataccgtcg ccagtcagga ctgtcacggc accgccaccg aggttgattg   7380ccttactgcc acggctagca ctagcgacga ggacgccctc ggtggttgcc ataggaatga   7440aataactctt gccgtcgata acaataggac cggcgacgcc aacagggact ggcatatagc   7500caataacgtt ctcgcaacat gcaccgagca cgcgttccca ggcgtagttt tcgtacggca   7560gcttcgagtg ctccagcata cttgtaagct ctgcggtagc cggtgtcctc gaaatgatag   7620agcggcgaac cttgacggca cgagtgcagt ctttgagact cttctctagg gcatacccgg   7680gaacctttcc ccgcaaagac aaggcaacga catcctcatc gttcaactcg ctgattgtgt   7740tctgcttcag caaattgtcc agttcgattt gtgtgcgaga cacgggaagt tcactagtgg   7800ctgtctttcc ttctgctcgc ttagtgacct ttagagatgc tttaattaag actaatgagg   7860catcactgtc actgtcggtg gtggtaggag tgaacactct ggtctgagga gcttggagac   7920ttgattgaat ctgaggggtc tggttctggg cagcgttgaa gctttcggcc tggtcaagct   7980caactggatc aactgggtga ctcgggagat taggatcttt gattcccagt ctggcggcct   8040tgaacagata gctgttcaga gcgacactta gggcaagtgc cacaaacacc catttggaga   8100ggacgggatc ttccaggctg gtgagcaggc taccgaccat ttttccacca actccatact   8160cgtgtagctg cgaggtacca cggtgaatgg aaggatactc tagttcgtac ttgatggggg   8220cgaggacagt gaccatagtc gattgaccgc gccctcttgc ctggaaaagt agttcatcta   8280gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac   8340tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg   8400agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg   8460gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat   8520cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt   8580accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag   8640tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga   8700agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga   8760ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat   8820tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct   8880ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc   8940caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc   9000ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc   9060ttgtagccag ccaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag   9120tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct   9180tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg   9240tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct   9300cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg   9360gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag   9420ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg   9480gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt   9540gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat   9600tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat   9660caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag   9720ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa   9780attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg   9840attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct   9900acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg   9960caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct  10020ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat  10080tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg  10140ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag  10200attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca  10260actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc  10320actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa  10380tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta  10440ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac  10500tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac  10560atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc  10620ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt  10680gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat  10740gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc  10800cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc  10860agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct  10920caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag  10980gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg  11040tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa  11100aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct  11160gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat  11220tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa  11280accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt  11340ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag  11400cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt  11460tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta  11520cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc  11580gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg  11640cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt  11700tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc  11760ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt  11820gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg  11880caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg  11940tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt  12000ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg  12060agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt  12120ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca  12180gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt  12240ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag  12300agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc  12360ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac  12420cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact  12480ggcaactcag gaacaatgct ttcgaaccgg atatcacact tctacgactt acgtggtccc  12540agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag  12600agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat  12660cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc  12720gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta  12780tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc  12840tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc  12900gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg  12960cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct  13020cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa  13080tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc  13140atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg  13200gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa  13260agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat  13320gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca  13380tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat  13440cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt  13500agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa  13560gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac  13620ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca  13680tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag  13740tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag  13800ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag  13860gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt  13920aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc  13980acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta  14040ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg  14100ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct  14160ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc  14220aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc  14280aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac  14340agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg  14400ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc  14460cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat  14520aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag  14580actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt  14640atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc  14700aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca  14760atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc  14820ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc  14880aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga  14940gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga  15000gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc  15060tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca  15120gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc  15180ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc  15240atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca  15300gaagcagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca  15360aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa  15420cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg  15480gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc  15540tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga  15600attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct  15660atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc  15720caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca  15780aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct  15840ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca  15900gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt  15960gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac  16020gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc  16080acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg  16140gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct  16200gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg  16260gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct  16320gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt  16380tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg  16440atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca  16500aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt  16560ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac  16620accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg  16680cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc  16740gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc  16800ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct  16860gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc  16920ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc  16980actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag  17040gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga  17100aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg  17160ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt  17220tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt  17280cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc  17340accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc  17400tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat  17460aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag  17520tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag  17580gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg  17640cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt  17700cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac  17760gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc  17820ggtctcaatt ttcgggatgt catggttgcc atgggtcaat tggaggccaa ccgtgtgatg  17880ggcttcgaat gcgccggagt gatcacaaag ctcggtggag ctgctgccgc tagccaaggc  17940ctcagattag gggaccgcgt atgtgcacta ctgaaaggcc attgggcgac cagaacacag  18000acgccgtaca ctaatgtcgt ccgtattccg gacgaaatgg gcttcccaga agccgcttcg  18060gtccccctgg ctttcactac cgcatatatt gcgctttata ccacggcaaa gctacgacga  18120ggcgaaagag tcttgatcca cagtggagct ggaggcgtcg gtcaagcagc gatcattttg  18180tcccagcttg cgggtgccga ggtcttcgtc acagcgggaa ctcaagccaa gcgtgacttt  18240gtcggcgata aattcggcat caatccggat catatcttct cgagcaggaa tgacttattc  18300gtcgacggca tcaaagccta cacgggcgga cttggcgttc atgtcgttct aaactcattg  18360gcaggtcaac tcctccaagc aagctttgac tgcatggccg aattcggcag atttgttgag  18420attggaaaaa aggacctgga gcaaaacagc agacttgaca tgctgccatt cacccgggac  18480gtctctttca catcaattga tcttctctcg tggcaaagag ccaaaagtga agaagtatcc  18540gaagcgttga accatgtcac aaaactcctc gagacaaaag cgattggctt gattggtcca  18600atccagcagc actccttgtc aaacatcgag aaggccttcc gtacgatgca gagtggtcag  18660catgttggca aagttgtggt caatgtatct ggggacgaac tggtcccagt cggcgatgga  18720gggttctcgc tgaagctgaa gcctgacagt tcttacctag ttgctggtgg gctgggggga  18780attggaaagc agatctgtca gtggcttgtt gatcatggcg cgaagcactt gattatccta  18840tcgagaagtg caaaggccag tccattcata accagcttgc aaaatcaaca gtgcgctgtc  18900tatctacacg catgtgacat ctcagatcaa gatcaggtca ccaaggtgct ccggttgtgc  18960gaagaagcac atgcaccgcc aattcgaggt atcatacaag gtgccatggt tctcaaggac  19020gcgcttctat cgcgaatgac attggatgaa tttaatgcag caacacgccc aaaagtacag  19080ggtagttggt atcttcacaa gatcgcacag gatgttgact tcttcgtgat gctctcatcc  19140cttgttgggg tcatgggtgg ggcaggccag gccaattacg cagctgctgg tgcattccag  19200gacgcacttg cgcaccaccg gagagcccat ggcatgccgg ctgtcaccat tgacttgggc  19260atggtcaagt ctgttggata cgtggctgaa actggccgtg gtgtggccga ccggctcgct  19320agaataggtt acaagcctat gcatgaaaag gacgtcatgg atgtgttgga gaaggcaatc  19380ctgtgttctt cccctcaatt tccatcacct cccgcagctg tggttacagg aatcaacaca  19440tccccgggtg ctcactggac cgaggcaaac tggatacagg aacagcggtt tgtgggactt  19500aaataccgcc aagtccttca tgcagaccaa tcctttgtct cttcgcataa aaaaggacca  19560gatggcgtgc gggcccaact aagcagggtc acctctcacg acgaggccat ttctatcgtc  19620ctcaaagcaa tgacggaaaa gctgatgcga atgtttggtc tggcagaaga cgacatgtcc  19680tcgtccaaaa acctggcagg tgtcggcgta gactcactcg tcgccattga acttcgaaac  19740tggatcacat ctgaaatcca tgttgatgtg tcgatctttg agctcatgaa tggtaacacc  19800atcgccggcc tcgtcgagtt agttgtggcg aaatgcagtt aagttgaagg gttcagtgaa  19860gccttttgtc tggccaagcg ggtatagctc gacggaggta tagtacgaag gagcatagcg  19920gccatggtct gaagcctgaa tccaatctga atcgagcctg ggctgagcct gactatttaa  19980tgcctgactt ctggatagca gtaaatagag atacctgaaa taccattaca gtggccctga  20040gaagcaacaa agtacacatg tgcactcgtt ctcgaagtcg gaagagtgaa tgctttttat  20100actaccaggg aagctgtctt agcacctcgg aggcttgact gtcaaaagtt ctctcttttt  20160ctctccatta tgattcccgc aagccttgta aatgcgcgtt gaacggtcga aaggcgttgg  20220cacgggcagt gggtacagat tgtggatatg tagtcggaag gcgggaggga gtacttgtgt  20280ccacgtcgtt gcgccgtcct ctctttcgcc tagtcgggga tgttgagtag gaacatcaag  20340acttaacaga gcctaagccc tcgtcatcgt aagcgccagt caacgcctga gagaatgggg  20400agatcggtga ttgtaccggg agaaaagctt cattactgcc gacttcccta cgtggcggtg  20460tagctggcgg tatagaagca gatggccgct ctgcgtagca ggaatacaca ctctctccct  20520tctctctctc tgtgtttctg tctctcgcac atagccaaag tctacaccac gttcgattac  20580aaagaaggca tcacaatcga ataaaatgcg ttttatttta ctaacctact cgactaatac  20640agcacctagt ttctctggga cggaaactat tggaataagc ctggggacgg atgcatattt  20700gttttagttt gcgtgttata tcttagcacc ggtcatgagg gagcgggatg tcctcgttgc  20760gccggcgtac catgagcttt gtggttggat gcatacgaac gctaaaagcg tgacggtagt  20820atttgtcatc gtctcctggt acaggcttca catcatactg aatcagtata tgagcgagga  20880gaatcttgat ttccttcgag gcgaagaacc gcccgggaca agcgcgtggg ttccagccga  20940agccgatgtg atcaccgttg gtattctcca attgagcggt gaaggccttg tctggatcct  21000cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt  21060tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg  21120atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc  21180gctgcgtctc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc  21240agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt  21300gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga  21360aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa  21420accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct  21480tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt  21540cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc  21600atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca  21660gccactcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga  21720caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat  21780gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga  21840acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt  21900gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct  21960tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag  22020agacgtcatt gagttacaac aatggaaaat tcagaggtca tacatccgcc aaaaacttgt  22080acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc  22140aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga  22200tccagctcgg accatacgta tcgaagtcct gcctagccct catggtcgtc aactcccacc  22260attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga  22320gactaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt  22380cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag  22440tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc  22500actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa  22560aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag  22620cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca  22680gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga  22740ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat  22800tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat  22860gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg  22920ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga  22980agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc  23040agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg  23100gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga  23160tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg  23220cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg  23280ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca  23340aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg  23400ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat  23460cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt  23520ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca  23580ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga  23640tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa  23700cgggcgagag taccatggcg gttgcagccg gtgcgaatct gatattgggc cccatgacct  23760ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg  23820ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa  23880agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct  23940gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac  24000cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga  24060agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg  24120ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa  24180gttgcagaaa gtctctctct ccctaacacg aagatcccag gaactggtac accagccggt  24240gacccacagg aagctgaggc tattgcaaca gccttcttcg gacacaagga tggaacaatc  24300gacagcgacg gcgagaaaga tgagcttttt gtcggcagca tcaagacagt tctcggtcac  24360acggaaggca ctgctggtat tgcgggctta atgaaggcat cgtttgctgt acgaaatggc  24420gtgatcccgc caaacctgct gtttgagaag atcagtcccc gtgtcgctcc gttctatacg  24480cacttgaaaa ttgcaacgga ggccacagaa tggccgattg ttgcgcccgg gcagcctcgc  24540agagtcagcg ttaattcatt tggtaaggat tcaactgcac ttcttgagaa cgaaagtgaa  24600gttagctaaa catataaaca catcaggatt tggtggtaca aatgcccatg ctattatcga  24660agagtatatg gctcctccac acaagccgac agcagtggta acagaggtga cctcagatgc  24720agatgcatgc agcttgcccc ttgtgctttc atcgaagtcg cagcgctcca tgaaggcaac  24780gctagaaaat atgctccaat ttctggaaac gcatgatgac gtggacatgc atgatatcgc  24840atatacctta cttgagaaac ggtctatctt gcccttccgt cgtgcgattg cagcacacaa  24900caaggaagta gcccgcgcgg cactggaggc tgccatcgcg gacggtgagg tcgtcaccga  24960cttccgcacc gacgcgaatg acaaccctcg cgtactaggt gtctttactg gccaaggtgc  25020acagtggccg ggcatgctga agaagctcat ggtgggtatg ccatttgtga gaggcattct  25080cgaagagctg gataattcac tgcaaacact gcctgaaaag tatcggccta cgtggacact  25140gtatgaccag ctcatgcttg aaggggatgc ctcaaacgtc agactcgcca gcttctccca  25200gcctctatgc tgcgccgtac aaatcgttct ggtccgactt ctcgctgcag ctggtatcga  25260gttcagtgca attgtcggcc acagttcagg tgagattgcc tgtgcctttg cggcaggatt  25320catcagtgcc actcaagcta tccgtattgc gcatctgcgt ggagttgtgt ccgcggagca  25380tgcctcttct ccaagcggcc agacaggcgc tatgctagcg gcaggtatgt cgtacgatga  25440cgcaaaggaa ctatgcgagc tcgaagcctt tgagggtcgg gtctgcgtcg ccgctagcaa  25500ttcaccggat agtgtgacct tctccggcga catggatgct atccagcacg ttgaaggtgt  25560cttggaggat gaatccactt ttgccagaat cttgagagtt gacaaggcct accattcgca  25620tcacatgcac ccatgcgcag ctccatatgt caaggcattg ctggagtgcg actgtgctgt  25680tgccgatggc caaggtaacg atagtgttgc ttggttctct gccgtccacg agaccagcaa  25740gcaaatgact gtacaggatg tgatgcccgc ttattggaaa gacaatctcg tctctccggt  25800cttgttctcg caggctgtgc agaaagcagt catcactcat cgtctaatcg acgtcgccat  25860cgaaattggc gcccaccctg ctctcaaggg tccgtgtcta gccaccatca aggatgctct  25920tgccggtgtg gagctgccgt ataccgggtg cttggcacga aacgttgacg atgtggacgc  25980ttttgctgga ggtctgggat acatttggga gcgtttcgga gttcggagta tcgacgccga  26040gggcttcgta caacaagtcc ggcccgatcg tgccgttcaa aacctgtcaa agtcattgcc  26100cacatactct tgggatcata ctcgtcaata ctgggcagaa tctcgctcca cccgccagca  26160tcttcgtgga ggtgcgcccc atcttctgct tggaaagctt tcttcttaca gcacagcatc  26220gaccttccag tggacaaact tcatcaggcc ccgggatctg gaatggctcg acggtcatgc  26280gctacaaggc cagactgtgt tccccgctgc tgggtacata attatggcca tggaagctgc  26340catgaaggtg gctggtgagc gtgccgccca agttcagctc ctggaaatct tggacatgag  26400catcaacaaa gccatcgtgt ttgaagatga aaacacctcc gtggagctga acttgacagc  26460cgaagtcacc agtgacaatg atgcggatgg ccaagtcacg gtcaaatttg ttattgattc  26520ctgtctggca aaggagagtg agctttcgac atccgccaaa ggccaaatcg tcataaccct  26580tggcgaggca tcaccgtcat cgcagctttt gccgccacct gaggaagagt acccccagat  26640gaacaatgtc aacatcgatt tcttctatcg ggaacttgac ctccttgggt atgactacag  26700caaagacttc cgtcgtttgc agaccatgag aagggccgac tccaaagcta gcggcacctt  26760ggctttcctt ccacttaagg atgaattgcg caatgagccc ctcttgctcc acccagcgcc  26820cctggacatc gcgttccaga ctgtcattgg agcgtattcc tctccaggag atcgtcgcct  26880acgctcattg tacgtgccta ctcacgttga cagagtgact ctgattccat cgctctgtat  26940atcggcgggt aattctggtg aaaccgagct tgcgtttgac acaatcaaca cacacgacaa  27000gggtgatttc ctgagcggcg acatcacggt gtacgattcg accaagacaa cgcttttcca  27060agttgataac attgtcttta agcctttctc tcccccgact gcttcgaccg accaccgaat  27120cttcgcaaag tgggtctggg gacccctcac gcccgaaaaa ctgctggagg accctgcgac  27180gttgatcata gctcgggaca aggaggacat tctgaccatc gagcgaatcg tttacttcta  27240catcaaatcc ttcctagccc agataacccc cgacgaccgt caaaatgccg acctccattc  27300ccagaagtac attgaatggt gtgaccaggt tcaggccgat gctcgggctg gccaccatca  27360gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag  27420gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca  27480actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg  27540ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact  27600ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa  27660ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta  27720agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc  27780acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc  27840tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag  27900tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac  27960gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct  28020cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc  28080gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac  28140gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga  28200gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct  28260gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct  28320ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa  28380cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg  28440ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg  28500gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct  28560cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc  28620caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga  28680acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa  28740cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag  28800cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct  28860aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag  28920acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca  28980accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt  29040cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag  29100ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga  29160tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc  29220gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct  29280agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc  29340gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact  29400ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac  29460gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac  29520cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg  29580tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag  29640gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact  29700gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct  29760gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag  29820gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat  29880ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat  29940ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc  30000aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac  30060atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc  30120caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt  30180tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca  30240ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg  30300gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt  30360tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc  30420tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg  30480catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt  30540tacggtgtag ggtttgtcac gagggccgag atggaggagg actttgatgc tatccgtttc  30600atgtttgact cagttgaaga gcatgagctg cacacgcttt tcgccgaagc ggtcgtgtct  30660gaccagcgtg cccggcagca accacagcgc aagacggtca ttgacatggc ggaccttgag  30720cttaccacgg gtatcccaga tcttgaccct gcgcttcaag atcgaattat ttacttcaac  30780gaccctcgtt tcggaaactt caaaattccc ggtcaacgcg gagacggtgg cgacaatgga  30840tcagggtcta aaggctccat tgccgaccag ctcaaacaag caacaacttt agaccaagtt  30900cggcaaatcg tgattggtaa gttatctctc atgcgtttcc tgatatcgag ttcaaactaa  30960caaagttgca gatggtctat ctgagaaact ccgtgttacc ctccaagttt cggacgggga  31020gagcgtggac ccaaccattc ctctcattga tcaaggtgtc gactccttgg gtgcagtgac  31080tgtcggctca tggttctcaa agcaactcta ccttgacctc ccactcttga gggtacttgg  31140cggtgcttct gtcgctgatc ttgccgacga cgcggccacc cgactcccag ctacatccat  31200tccgctgctg ttgcaaattg gtgattccac gggaacctcg gacagcgggg cttctccgac  31260accaacagac agccatgatg aagcaagctc tgctaccagc acagatgcgt cgtcagccga  31320agaggatgaa gagcaagagg acgataatga gcagggaggc cgtaagattc ttcgtcgcga  31380gaggttgtcc cttggccagg agtattcctg gaggcagcaa caaatggtaa aagatcatac  31440catcttcaac aacactattg gcatgttcat gaagggtacc attgacctcg accggttgag  31500gcgggctctg aaagcctcat tgcgccgtca cgagatcttc cgtacgtgct ttgttactgg  31560cgatgactat agcagcgatt taaatggtcc cgtccaagtg gttctcaaga acccggagaa  31620cagagtgcac tttgttcagg tgaacaacgc tgcggaggca gaggaagagt accggaaact  31680cgagaagaca aactatagca tctccacagg tgacactctc agactcgttg atttctactg  31740gggcacagat gaccacctgt tggtaatcgg ctaccacaga ttagttggtg atggctcaac  31800aacagaaaac ctgttcaatg agatcgggca gatttacagc ggggtgaaaa tgcagcgacc  31860atcgacccaa ttctctgatc tagccgtcca acagcgggaa aacctggaaa atgggcgaat  31920gggggacgat atcgcgttct ggaagtccat gcatagcaaa gtctcgtcat ctgcgccaac  31980cgtgcttccc atcatgaatc tgatcaatga ccctgctgcc aattcagagc agcagcaaat  32040acagccattc acgtggcagc agtatgaagc aattgctcgt ttagatccca tggtcgcctt  32100ccgaatcaaa gagcggagcc gcaagcacaa ggcaaccccc atgcagttct acctggccgc  32160ctaccacgtt ttgttggcgc gtcttaccgg cagcaaagac ataaccatcg gcctcgccga  32220aaccaaccga tccaccatgg aagaaatttc ggcgatgggc tttttcgcta acgtgcttcc  32280cctgcgcttt gatgagttcg tcggcagcaa gacattcggc gagcaccttg tagccaccaa  32340ggacagtgtg cgtgaggcca tgcaacacgc gcgggtgccg tatggcgtca tcctcgactg  32400tctaggcctg aatctcccta cctcaggcga ggaacccaag actcagacac acgccccctt  32460gttccaggct gtctttgatt acaagcaggg tcaagcggag agtggctcaa ttggcaatgc  32520caaaatgacg agtgttctcg cttcccgtga gcgcactcct tatgacatcg ttctcgagat  32580gtgggatgac cctaccaagg acccactcat tcatgtcaaa cttcagagct cgctgtatgg  32640ccctgagcac gctcaggcct ttgtagacca cttttcttca atcctcacta tgttctcgat  32700gaacccggct ctgaagttgg cctagatcgt tcagcgccgt gaattcagat gtgtggtttg  32760agtgttgttc atgataaaga tggattagaa attggcaata gagcagatgg caaatctatc  32820ctgaattcgg cgtcaattga cacacgcata ttcatctaca aatagcgaat tcgtcttgta  32880tctttgtcaa aattacttct accttcgttg ctcttcttta ttgcagcaat cgtaacatca  32940agttagatag cgcggttcag agtaccgtaa cggtgataaa tatacctcgg tagcgcgttt  33000cgaaagactc tgtgaggaag gtgaaacctc caaggcttgg aattgatttc aatccatcct  33060gtatataaat tcgacgccat tgcaaatagt tccatagtta ctggtttagt gccttgttgt  33120ggtgatcgag tggttttaga tgtctgtcat gcctgttcag aacgagcctt ccatgatcta  33180tccaaaatat gttcacgaaa tatttatgag atggtcgcga ccactataac taaatcaccc  33240ttggaaggtg agcattcaaa ccgtgtaaga ttagaactat tcaaatttgt tcagtaaaaa  33300tgtggtatgg actaggcatg agagccagag ccttgctata taccctgttg tctcacctag  33360acaaatgaac ctgacatctt gaccttttga tatagctgtt ggaagcgctt gaccgtctcc  33420tggacatcac tcggtctgtt gggaaaatta tgctttccct gaaactcgag tacatctgca  33480ttctgaggca ggtaatgtgt ttcaaccatc tgtctcgacc cttggagagc aaaatcttga  33540cgaccgtgaa gatgcagtgt cggcacgttg attattagct tgtcgtcgtc gtcttgcgcc  33600tcggctctca tgtaatctct ggcttcatcg ctatagaaac agcaaatcaa aacagcaatg  33660ctcattttcg gaaaccatgg cagttttccc atttgctgtt gatggagcag caaagtggcg  33720accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata  33780gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc  33840gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga  33900cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc  33960gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg  34020aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct  34080ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc  34140gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg  34200atc                                                                34203<210>3<211>17<212>DNA<213>人工序列<220><221>misc feature<223>人工序列的说明:具有由黄曲霉PKS的氨基酸序列推断的
 DNA序列的混合引物<220><221>修饰碱基<222>(6)..(6)<223>i<220><221>修饰碱基<222>(9)..(9)<223>i<400>3gayacngcnt gyasttc                                                   17<210>4<211>17<212>DNA<213>人工序列<220><221>misc feature<223>人工序列的说明:具有由黄曲霉PKS的氨基酸序列推断的
 DNA序列的混合引物<220><221>修饰碱基<222>(3)..(3)<223>i<220><221>修饰碱基<222>(6)..(6)<223>i<220><221>修饰碱基<222>(8)..(8)<223>i<220><221>修饰碱基<222>(15)..(15)<223>i<400>4tcnccnknrc wgtgncc                                       17<210>5<211>19<212>DNA<213>柑桔青霉<400>5gcatgttcaa tttgctctc                                     19<210>6<211>19<212>DNA<213>柑桔青霉<400>6ctggatcaga cttttctgc                                     19<210>7<211>18<212>DNA<213>柑桔青霉<400>7gtcgcagtag catgggcc                                      18<210>8<211>20<212>DNA<213>柑桔青霉<400>8gtcagagtga tgctcttctc                                    20<210>9<211>20<212>DNA<213>柑桔青霉<400>9gttgagagga ttgtgagggc                        20<210>10<211>19<212>DNA<213>柑桔青霉<400>10ttgcttgtgt tggattgtc                        19<210>11<211>20<212>DNA<213>柑桔青霉<400>11catggtactc tcgcccgttc                       20<210>12<211>19<212>DNA<213>柑桔青霉<400>12ctccccagta cgtaagctc                        19<210>13<211>21<212>DNA<213>柑桔青霉<400>13ccataatgag tgtgactgtt c                     21<210>14<211>19<212>DNA<213>柑桔青霉<400>14gaacatctgc atccccgtc                        19<210>15<211>20<212>DNA<213>柑桔青霉<400>15ggaaggcaaa gaaagtgtac                       20<210>16<211>21<212>DNA<213>柑桔青霉<400>16agattcattg ctgttggcat c                                               21<210>17<211>722<212>DNA<213>柑桔青霉<400>17ggccacgcgt cgactagtac gggggggggg gggggggggg gcttgttcgc tcagagattc     60aactctgcga ttctgtttaa tcccaatcct atcgcccaaa aacaggatca gcagttatgg    120atcaagccaa ctatccaaac gagccaattg tggtagtggg aagcggttgt cggtttccag    180gtggtgtcaa cacaccatca aaactttggg agctgctcaa agagccccgg gatgtacaga    240ccaagatccc taaggagaga tttgacgtcg atacatttta cagccccgat ggcactcacc    300ccgggcgcac gaacgcaccc tttgcatact tgctgcagga ggatctacgc ggttttgatg    360cctctttctt caacatccaa gctggagagg ccgaaacgat tgacccacag caaaggctgc    420tgctggagac ggtctatgaa gctgtatcca acgcaggcct acggatccaa ggccttcaag    480gatcctctac tgctgtgtac gtcggtatga tgacgcatga ctatgagact atcgtgacgc    540gtgaattgga tagtattcct acatactctg ccacgggggt agctgtcagt gtggcctcca    600accgtgtatc atacttcttc gactggcatg ggccgagtat gacgatcgac acagcctgta    660gttcatcctt agctgccgtg catctggccg tccaacagct tagaacgggc gagagtacca    720tg                                                                   722<210>18<211>760<212>DNA<213>柑桔青霉<400>18ggccacgcgt cgactagtac gggggggggg gggggggggg gactatcaac ggttttatca     60ccagggcgac tgatatatca gtcaatgaaa caacgttgga atgaacaata cccccgccgt    120aaccgcaacc gcaaccgcaa ccgcaaccgc aaccgcaatg gcaggctcgg cttgctctaa    180cacatccacg cccattgcca tagttggaat gggatgtcga tttgctggag atgcaacgag    240tccacagaag ctttgggaaa tggttgaaag aggaggcagt gcctggtcta aggtcccctc    300ctcgcgattc aatgtgagag gagtatacca cccgaatggc gaaagggtcg ggtccaccca    360cgtaaagggt ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa    420catgaccaca gaggtcgcca gctgcatgga tccgcagtat cggcttatgc ttgaggtggt    480ctacgaatcg ctggagagtg ccggtatcac catcgatggt atggcaggct ctaatacgtc    540ggtgtttggg ggtgtcatgt accacgacta tcaggattcg ctcaatcgtg accccgagac    600agttccgcgt tatttcataa ctggcaactc aggaacaatg ctttcgaacc ggatatcaca    660cttctacgac ttacgtggtc ccagcgtgac ggttgacacg gcctgttcga cgacattgac    720cgcactgcac ttggcgtgcc agagcttacg tactggggag                          760<210>19<211>773<212>DNA<213>柑桔青霉<400>19ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag     60agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg    120cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc    180tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc    240tcaagccctt gtggcggtcg cagtgcttct tagtctcatc gcctaccgtt tgcgggggcg    300ccagtccgaa ctgcaagtct ataatcccaa aaaatggtgg gagttgacga ccatgagggc    360taggcaggac ttcgatacgt atggtccgag ctggatcgaa gcttggttct cgaaaaacga    420caagcccctg cgcttcattg ttgattccgg ctattgcacc atcctcccat cgtccatggc    480cgacgagttt cggaaaatca aagatatgtg catgtacaag tttttggcgg atgactttca    540ctctcatctc cctggattcg acgggttcaa ggaaatctgc caggatgcac atcttgtcaa    600caaagttgtt ttgaaccagt tacaaaccca agcccccaag tacacaaagc cattggctac    660cttggccgac gctactattg ccaagttgtt cggtaaaagc gaggagtggc aaaccgcacc    720tgtctattcc aatggattgg accttgtcac acgaacagtc acactcatta tgg           773<210>20<211>527<212>DNA<213>柑桔青霉<400>20ggccacgcgt cgactagtac gggggggggg gtacctagga actgttcagt tgtccctccc     60aaccccttgg gccgaacaac cttcctccaa tctacgacgg cagattatac ctaggcgcct    120aaccgattag gttgctcatt cgattttgga gagactacct agctataggt accactccaa    180gctgtagcac agacctttca gcatggtcgc ttcgttgcta ccctctcgct ttcgcggtag    240ggaatcaatg aatcagcagc accctctacg ctcgggaaat cgggcattga cctccacact    300ccaatttcta tccaaaacgg cgtgtctaca cccgatccat accgtttgca ccatagctat    360tctagctagt accacatacg ttggactact caaagacagc ttcttccatg gccccgcaaa    420cgttgataaa gcagaatggg gctctttggt cgaaggaagt cgaagcttga tcaccggccc    480acagaatggc tggaagtggc agagcttcga cggggatgca gatgttc                  527<210>21<211>522<212>DNA<213>柑桔青霉<400>21ggccacgcgt cgactagtac gggggggggg gggggggggg ggatccatca atctgacttc     60aggctagcgg accttaacga aacaacgaga gcgagatcat tcatacacca aaacacaggt    120actatagaag cgccgcgcag tagagattca caccgcccct tgaagcaaaa gtcggaagga    180attgcgcgat gtcagaacct ctacccccta aagaagggga accaaggcca cagaaggaag    240aaagtcaaaa tgacacgctc gaagcgactg agtccaagtc ccagcacatc acaggcctca    300agctcgggct ggtggttgct tcagttactt tcgtagcatt tttgatgctc cttgatatgt    360ccattatcgt cacggcaatc ccacatatca caagcgagtt ccactctctg aacgatgtag    420ggtggtacgg cagtgcttat cttctggcta actgtgctct ccagcccctg gccggtaaat    480tgtatacact cttgggcttg aagtacactt tctttgcctt cc                       522<210>22<211>541<212>DNA<213>柑桔青霉<400>22ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc     60aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg    120acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt    180agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag    240gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac    300ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc    360accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga    420accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc    480gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc    540t                                                                    541<210>23<211>20<212>DNA<213>柑桔青霉<400>23atcataccat cttcaacaac                                                 20<210>24<211>20<212>DNA<213>柑桔青霉<400>24gctagaatag gttacaagcc                                                 20<210>25<211>20<212>DNA<213>柑桔青霉<400>25acattgccag gcacccagac                                                 20<210>26<211>20<212>DNA<213>柑桔青霉<400>26caacgcccaa gctgccaatc                                                 20<210>27<211>20<212>DNA<213>柑桔青霉<400>27gtcttttcct actatctacc                                                 20<210>28<211>20<212>DNA<213>柑桔青霉<400>28ctttcccagc tgctactatc                                                 20<210>29<211>1524<212>DNA<213>柑桔青霉<400>29aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttcaa cgaaggtaga     60agtaattttg acaaagatac aagacgaatt cgctatttgt agatgaatat gcgtgtgtca    120attgaagccg aattcaggat agatttgcca tctgctctat tgccaatttc taatccatct    180ttatcatgaa caacactcaa accacacatc tgaattcacg gcgctgaacg atctaggcca    240acttcagagc cgggttcatc gagaacatag tgaggattga agaaaagtgg tctacaaagg    300cctgagcgtg ctcagggcca tacagcgagc tctgaagttt gacatgaatg agtgggtcct    360tggtagggtc atcccacatc tcgagaacga tgtcataagg agtgcgctca cgggaagcga    420gaacactcgt cattttggca ttgccaattg agccactctc cgcttgaccc tgcttgtaat    480caaagacagc ctggaacaag ggggcgtgtg tctgagtctt gggttcctcg cctgaggtag    540ggagattcag gcctagacag tcgaggatga cgccatacgg cacccgcgcg tgttgcatgg    600cctcacgcac actgtccttg gtggctacaa ggtgctcgcc gaatgtcttg ctgccgacga    660actcatcaaa gcgcagggga agcacgttag cgaaaaagcc catcgccgaa atttcttcca    720tggtggatcg gttggtttcg gcgaggccga tggttatgtc tttgctgccg gtaagacgcg    780ccaacaaaac gtggtaggcg gccaggtaga actgcatggg ggttgccttg tgcttgcggc    840tccgctcttt gattcggaag gcgaccatgg gatctaaacg agcaattgct tcatactgct    900gccacgtgaa tggctgtatt tgctgctgct ctgaattggc agcagggtca ttgatcagat    960tcatgatggg aagcacggtt ggcgcagatg acgagacttt gctatgcatg gacttccaga   1020acgcgatatc gtcccccatt cgcccatttt ccaggttttc ccgctgttgg acggctagat   1080cagagaattg ggtcgatggt cgctgcattt tcaccccgct gtaaatctgc ccgatctcat   1140tgaacaggtt ttctgttgtt gagccatcac caactaatct gtggtagccg attaccaaca   1200ggtggtcatc tgtgccccag tagaaatcaa cgagtctgag agtgtcacct gtggagatgc   1260tatagtttgt cttctcgagt ttccggtact cttcctctgc ctccgcagcg ttgttcacct   1320gaacaaagtg cactctgttc tccgggttct tgagaaccac ttggacggga ccatttaaat   1380cgctgctata gtcatcgcca gtaacaaagc acgtacggaa gatctcgtga cggcgcaatg   1440aggctttcag agcccgcctc aaccggtcga ggtcaatggt acccttcatg aacatgccaa   1500tagtgttgtt gaagatggta tgat                                          1524<210>30<211>784<212>DNA<213>柑桔青霉<400>30aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc tttgttgctt     60ctcagggcca ctgtaatggt atttcaggta tctctattta ctgctatcca gaagtcaggc    120attaaatagt caggctcagc ccaggctcga ttcagattgg attcaggctt cagaccatgg    180ccgctatgct ccttcgtact atacctccgt cgagctatac ccgcttggcc agacaaaagg    240cttcactgaa cccttcaact taactgcatt tcgccacaac taactcgacg aggccggcga    300tggtgttacc attcatgagc tcaaagatcg acacatcaac atggatttca gatgtgatcc    360agtttcgaag ttcaatggcg acgagtgagt ctacgccgac acctgccagg tttttggacg    420aggacatgtc gtcttctgcc agaccaaaca ttcgcatcag cttttccgtc attgctttga    480ggacgataga aatggcctcg tcgtgagagg tgaccctgct tagttgggcc cgcacgccat    540ctggtccttt tttatgcgaa gagacaaagg attggtctgc atgaaggact tggcggtatt    600taagtcccac aaaccgctgt tcctgtatcc agtttgcctc ggtccagtga gcacccgggg    660atgtgttgat tcctgtaacc acagctgcgg gaggtgatgg aaattgaggg gaagaacaca    720ggattgcctt ctccaacaca tccatgacgt ccttttcatg cataggcttg taacctattc    780tagc                                                                 784<210>31<211>764<212>DNA<213>柑桔青霉<400>31aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc gaataaaatg     60cgttttattt tactaaccta ctcgactaat acagcaccta gtttctctgg gacggaaacc    120attggaataa gcctggggac ggatgcatat ttgttttagt ttgcgtgtta tatcttagca    180ccggtcatga gggagcggga tgtcctcgtt gcgccggcgt accatgagct ttgtggttgg    240atgcatacga acgctaaaag cgtgacggta gtatttgtca tcgtctcctg gtacaggctt    300cacatcatac tgaatcagta tatgagcgag gagaatcttg atttccttcg aggcgaagaa    360ccgcccggga caagcgcgtg ggttccagcc gaagccgatg tgatcaccgt tggtattctc    420caattgagcg gtgaaggcct tgtctggatc ctcgcgcatg cgcataaatc ggtagggatc    480ataattttcg gggttttccc acacatcagg gttgttcatg cggtctgcag ccacagcggc    540caactcgccc ttgggaatga agaggccatt ggatagagtg atgtctctga gagcggtact    600gcgcatagtg gcgcactcga ccggcttgat tcgctgcgtc tctttcatgc agctgtcgag    660gagcttcagc ttgaacagag aggcaggcgt ccagccccct tctccgatta cagtgcggat    720ctcttggcgg agaggctgaa taaggtctgg gtgcctggca atgt                     764<210>32<211>765<212>DNA<213>柑桔青霉<400>32aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttctgg aaaaggacca     60tctctttata tattcttctt ccctactact tgcatcgtaa atttcaacaa catataaaca    120tgagataccc tttctggccg ttcactctac cacctgcctg tctcattgca ttgtgctttt    180gaaaattatg acaataacaa ccaatgagaa aaaatatgat cctcctgcaa tgaatccact    240ggagggggta cggagcttgg aatgctccta agattccgac ctaatcagcg tcgagcccga    300tcagtagctg cagcactcgg cctcagtgca ttgttaggaa cagggactgt cctggttccg    360cctgacgggg agacacttcg agaaggggct gaagatgccg gggcagaacg gttgtgcgcc    420atgtgcgcct tgaccaggtg accggcggct agggcagcac atagcgagag ctccccagcc    480aaaacagcgc ttccgatgat gcgcgcaagt tgacgtgcat tctcaccggg agtggtcggg    540tgtgatccgc ggacaccaag catgtcaagc attgcgccct ggggctccag aatcgtacca    600ccgcccaacg ttccaacctc aatagacggc atggagacag agatttgaag cgatccgcga    660agattgttca tgagagtgat gcagttagcg ctctccacaa cttgcgccgg atcctgacct    720gtggcaatga aaatggctgc cgcaagattg gcagcttggg cgttg                    765<210>33<211>802<212>DNA<213>柑桔青霉<400>33aactggaaga attcgcggcc gcaggaattt tttttttttt tttttataga atctttgaaa     60tcgacattaa ttaagtatgt ggagattctt tgtggaggca cggtaatgtg tctatctagc    120aacgcggtca agcatcagtc tcaggcacag cccgggtgtc gtttttggtt gcaatcttcc    180gccatcccat tccaaaggca aacacaaacg tgcacgccgt agctcccact gctaagtaaa    240aagtatgatc aacggcgaga ctgtaagctt ttacaacccc tggaaggtta ttcttgctga    300ccacatctct gaagccagtc gcccctgctg ccgtcacggc ctgcgtgtcg acagtgggcg    360catacttgct caggccagtt ctcaaaccgg acccaaagac aaggttagca aagtccagga    420agagcgatcc tccaaacgtc tgtccaaaca cggcgagaga aattccgagg gcaccttgtt    480cgggcgaaag cgtgctttgg atggcgatga taggcgtttg catgccacaa ccacgaccga    540agcccgcgat aaattggtac atgacccatt tcacagttga tgtatggggc tggaaggtgg    600ataccagacc tgcgcctatg gcgacgagaa cagcgctgcc tagggcccaa ggcaaatagt    660atcctgtctt tccaattgcg aagccagaaa ccatagccat aatgacttgt ccaagaattc    720caggcaacat gtacacacca ctcagtgtgg gagaaacatc cttcacagcc tggaagtaga    780tcggtagata gtaggaaaag ac                                             802<210>34<211>562<212>DNA<213>柑桔青霉<400>34aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttttac taagcaatat     60tgtgtttctt cgctaatgcg aatatttcct tatagcaacg tcgcaacaca tttatcgtct    120tccctgaggc ctttgttgac ttgggctctt cgtctccggc ttcgtcactc caaagcacag    180ataggagacg agaggccggc gttatggttt tattttcagc gccaaggatt tgccacgatg    240tgcttggcat atctgatagg actagacgaa tagatgccgc agccccgtgc tcctgtgcta    300tccccaaagc agtctcaatc ccactcaata gtcgaaggct tacacgcaat gtcgtgcatg    360cagaagataa ggcgtgcatg aatgggtcga gatgtgaaat gagctcgccg atatgaagat    420tagagtgaaa cgagggaagt gcttcggctc ttccattgtc atttctagtg gttgagccag    480accagtacca atccattcgt gtgctttgct tttgtccaca aggttgggct ttcatcacct    540cggatagtag cagctgggaa ag                                             562<210>35<211>26<212>DNA<213>柑桔青霉<400>35gttaacatgt cagaacctct accccc                                          26<210>36<211>27<212>DNA<213>柑桔青霉<400>36aatatttcaa gcatcagtct caggcac                                         27<210>37<211>1662<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1662)<400>37atg tca gaa cct cta ccc cct aaa gaa ggg gaa cca agg cca cag aag       48Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys1               5                   10                  15gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag       96Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
        20                  25                  30cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc      144His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
    35                  40                  45gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc      192Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50                  55                  60cca cat atc aca agc gag ttc cac tct ctg aac gat gta ggg tgg tac      240Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr65                  70                  75                  80ggc agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt      288Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
            85                  90                  95aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc ctc      336Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
        100                 105                 110tgt att ttt gaa cta ggc tcg gtg cta tgc ggt gcc gca aga tct tcc      384Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
    115                 120                 125acc atg ttg att gtt ggg cgg gcc gtt gct gga atg gga ggc tca ggt      432Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130                 135                 140ctt gtc aac gga gcc ctc aca atc ctc tca aca gct gct cct aag cac      480Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His145                 150                 155                 160aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc      528Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
            165                 170                 175att gtc tgt gga cca ctg ctc gga ggt gct ttc act caa cac gcc act      576Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
        180                 185                 190tgg cga tgg tgc ttt tat atc aat ctc ccc atc ggc gct gtc gct gca      624Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
    195                 200                 205ttc ctc ctt ctc gtc atc acc ata ccc gac cga att tca tcc acg gac      672Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210                 215                 220agc gaa ctc tcg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt      720Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu225                 230                 235                 240cgc aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc      768Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
            245                 250                 255atg att tcc ctc gca cta gaa tgg gga ggg tcg acc tac acc tgg cga      816Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
        260                 265                 270agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt gct ctg att      864Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
    275                 280                 285gcg ttc gtg cta tgg gag cgt cat gtt ggc gat gct gtt gcc atg att      912Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290                 295                 300cct ggc tca gtg gct ggt aaa cga caa gtg tgg tgc tct tgt tta ttt      960Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe305                 310                 315                 320atg ggc ttt ttc tct ggc tcc ttg ctt gtc ttt tcc tac tat cta ccg     1008Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
            325                 330                 335atc tac ttc cag gct gtg aag gat gtt tct ccc aca ctg agt ggt gtg     1056Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
        340                 345                 350tac atg ttg cct gga att ctt gga caa gtc att atg gct atg gtt tct     1104Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
    355                 360                 365ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc cta ggc     1152Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370                 375                 380agc gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag     1200Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln385                 390                 395                 400ccc cat aca tca act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc     1248Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
            405                 410                 415ttc ggt cgt ggt tgt ggc atg caa acg cct atc atc gcc atc caa agc     1296Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
        420                 425                 430acg ctt tcg ccc gaa caa ggt gcc ctc gga att tct ctc gcc gtg ttt     1344Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
    435                 440                 445gga cag acg ttt gga gga tcg ctc ttc ctg gac ttt gct aac ctt gtc     1392Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450                 455                 460ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg ccc act gtc     1440Phe Gly Set Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val465                 470                 475                 480gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg     1488Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
            485                 490                 495gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc     1536Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
        500                 505                 510gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt     1584Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
    515                 520                 525gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac     1632Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530                 535                 540acc cgg gct gtg cct gag act gat gct tga                             1662Thr Arg Ala Val Pro Glu Thr Asp Ala545                 550<210>38<211>553<212>PRT<213>柑桔青霉<400>38Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys1               5                   10                  15Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
        20                  25                  30His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
    35                  40                  45Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50                  55                  60Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr65                  70                  75                  80Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
            85                  90                  95Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
        100                 105                 110Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
    115                 120                 125Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130                 135                 140Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His145                 150                 155                 160Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
            165                 170                 175Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
        180                 185                 190Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
    195                 200                 205Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210                 215                 220Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu225                 230                 235                 240Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
            245                 250                 255Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
        260                 265                 270Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
    275                 280                 285Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290                 295                 300Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe305                 310                 315                 320Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
            325                 330                 335Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
        340                 345                 350Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
    355                 360                 365Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370                 375                 380Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln385                 390                 395                 400Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
            405                 410                 415Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
        420                 425                 430Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
    435                 440                 445Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450                 455                 460Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val465                 470                 475                 480Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
            485                 490                 495Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
        500                 505                 510Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
    515                 520                 525Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530                 535                 540Thr Arg Ala Val Pro Glu Thr Asp Ala545                 550<210>39<211>31<212>DNA<213>柑桔青霉<400>39ggatccatgt ccctgccgca tgcaacgatt c                                  31<210>40<211>30<212>DNA<213>柑桔青霉<400>40ggatccctaa gcaatattgt gtttcttcgc                                    30<210>41<211>1380<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1380)<400>41atg tcc ctg ccg cat gca acg att ccg acg aac cta cgc cgt cgc gcg     48Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala1               5                   10                  15ttt cga cgc tca tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc       96Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
        20                  25                  30ggt agc aat gcc aat tta gtc cgt gct cag tgt caa cgt tgt caa caa      144Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
    35                  40                  45gcc gga tta agg tgt gtg tac agc gaa agg cta ccc aag cgc aat tta      192Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50                  55                  60cat aaa gaa gcc gca gct gga act aca aga gcc aca gaa acc tca caa      240His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln65                  70                  75                  80ccg atg acc gcg aca tct tct acg gtc ttc tca tca ttg gca gag act      288Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
            85                  90                  95cct cca cct tac tgc tca cca cct acg cat att ggc acc tcg gca ctc      336Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
        100                 105                 110aag gaa aca tta tca gaa cca tca gcg gca acc ctg caa ttc tat gat      384Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
    115                 120                 125aca tca atc aac ttt gat gat ccc gag tcg ttt ccc ggc ggc tgg cct      432Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130                 135                 140cag cca aat aca ttt cgc gac gat gcc aac agc aat gaa tct tcg ggg      480Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly145                 150                 155                 160ata cca gat cta ggc tac gac ttt gaa ggc cct ttg gat gca acg gcg      528Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
            165                 170                 175cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tca      576Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
        180                 185                 190tcc gga caa tcc aac aca agc aac acg caa cga gac ctt ttc gaa agt      624Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
    195                 200                 205ctg tcg gat gtg tca cag gac cta gag gta ata ctc cac ggg gtg act      672Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210                 215                 220gtg gaa tgg ccc aag caa aaa att tta agc tac ccg ata ggg gac ttt      720Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe225                 230                 235                 240ttg aat gcc ttt ggt aga ttg cta cta cat ctt caa gaa cgt gtg atc      768Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
            245                 250                 255acg agc agc aat agc agc atg tta gat ggg tgt ctg caa acc aag aac      816Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
        260                 265                 270ttg ttc atg gcg gtg cat tgc tac atg ttg tct gtc aaa atc atg aca      864Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
    275                 280                 285tca ctt tcc cag ctg cta cta tcc gag gtg atg aaa gcc caa cct tgt      912Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290                 295                 300gga caa aag caa agc aca cga atg gat tgg tac tgg tct ggc tca acc      960Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr305                 310                 315                 320act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tct     1008Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
            325                 330                 335aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac     1056Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
        340                 345                 350gcc tta tct tct gca tgc acg aca ttg cgt gta agc ctt cga cta ttg     1104Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
    355                 360                 365agt gag att gag act gct ttg ggg ata gca cag gag cac ggg gct gcg     1152Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370                 375                 380gca tct att cgt cta gtc cta tca gat atg cca agc aca tcg tgg caa     1200Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln385                 390                 395                 400atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tct cgt ctc cta     1248Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
            405                 410                 415tct gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca     1296Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
        420                 425                 430aag gcc tca ggg aag acg ata aat gtg ttg cga cgt tgc tat aag gaa     1344Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
    435                 440                 445ata ttc gca tta gcg aag aaa cac aat att gct tag                     1380Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450                 455<210>42<211>459<212>PRT<213>柑桔青霉<400>42Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala1               5                   10                  15Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
        20                  25                  30Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
    35                  40                  45Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50                  55                  60His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln65                  70                  75                  80Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
            85                  90                  95Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
        100                 105                 110Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
    115                 120                 125Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130                 135                 140Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly145                 150                 155                 160Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
            165                 170                 175Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
        180                 185                 190Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
    195                 200                 205Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210                 215                 220Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe225                 230                 235                 240Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
            245                 250                 255Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
        260                 265                 270Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
    275                 280                 285Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290                 295                 300Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr305                 310                 315                 320Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
            325                 330                 335Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
        340                 345                 350Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
    355                 360                 365Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370                 375                 380Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln385                 390                 395                 400Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
            405                 410                 415Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
        420                 425                 430Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
    435                 440                 445Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450                 455<210>43<211>9099<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(9099)<400>43atg gat caa gcc aac tat cca aac gag cca att gtg gta gtg gga agc       48Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser1               5                   10                  15ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tca aaa ctt tgg gag       96Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
        20                  25                  30ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga      144Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
    35                  40                  45ttt gac gtc gat aca ttt tac agc ccc gat ggc act cac ccc ggg cgc      192Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50                  55                  60acg aac gca ccc ttt gca tac ttg ctg cag gag gat cta cgc ggt ttt      240Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe65                  70                  75                  80gat gcc tct ttc ttc aac atc caa gct gga gag gcc gaa acg att gac      288Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
            85                  90                  95cca cag caa agg ctg ctg ctg gag acg gtc tat gaa gct gta tcc aac      336Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
        100                 105                 110gca ggc cta cgg atc caa ggc ctt caa gga tcc tct act gct gtg tac      384Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
    115                 120                 125gtc ggt atg atg acg cat gac tat gag act atc gtg acg cgt gaa ttg      432Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130                 135                 140gat agt att cct aca tac tct gcc acg ggg gta gct gtc agt gtg gcc      480Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala145                 150                 155                 160tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg      528Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
            165                 170                 175atc gac aca gcc tgt agt tca tcc tta gct gcc gtg cat ctg gcc gtc      576Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
        180                 185                 190caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg      624Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
    195                 200                 205aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac      672Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210                 215                 220atg ctg tcc ccc aat ggt aga tct cga atg tgg gat gct gct gcc gat      720Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp225                 230                 235                 240gga tat gcc aga gga gaa ggt gtt tgc tct att gtc ctg aaa acg ctg      768Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
            245                 250                 255agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc cga gag      816Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
        260                 265                 270acc ggt atc aac caa gat ggc cga acg aca ggt atc aca atg cca aac      864Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
    275                 280                 285cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag gct ggt      912His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290                 295                 300ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gaa gcc cat      960Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His305                 310                 315                 320gga act ggt aca cca gcc ggt gac cca cag gaa gct gag gct att gca     1008Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
            325                 330                 335aca gcc ttc ttc gga cac aag gatgga aca atc gac agc gac ggc gag      1056Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
        340                 345                 350aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg     1104Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
    355                 360                 365gaa ggc act gct ggt att gcg ggc tta atg aag gca tcg ttt gct gta     1152Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370                 375                 380cga aat ggc gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc     1200Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro385                 390                 395                 400cgt gtc gct ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca     1248Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
            405                 410                 415gaa tgg ccg att gtt gcg ccc ggg cag cct cgc aga gtc agc gtt aat     1296Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
        420                 425                 430tca ttt gga ttt ggt ggt aca aat gcc cat gct att atc gaa gag tat     1344Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
    435                 440                 445atg gct cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tca     1392Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450                 455                 460gat gca gat gca tgc agc ttg ccc ctt gtg ctt tca tcg aag tcg cag     1440Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln465                 470                 475                 480cgc tcc atg aag gca acg cta gaa aat atg ctc caa ttt ctg gaa acg     1488Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
            485                 490                 495cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa     1536His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
        500                 505                 510cgg tct atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa     1584Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
    515                 520                 525gta gcc cgc gcg gca ctg gag gct gcc atc gcg gac ggt gag gtc gtc     1632Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530                 535                 540acc gac ttc cgc acc gac gcg aat gac aac cct cgc gta cta ggt gtc     1680Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val545                 550                 555                 560ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg     1728Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
            565                 570                 575gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tca     1776Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
        580                 585                 590ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac     1824Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
    595                 600                 605cag ctc atg ctt gaa ggg gat gcc tca aac gtc aga ctc gcc agc ttc     1872Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610                 615                 620tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc cga ctt ctc     1920Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu625                 630                 635                 640gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tca ggt     1968Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
            645                 650                 655gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct     2016Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
        660                 665                 670atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tct     2064Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
    675                 680                 685tct cca agc ggc cag aca ggc gct atg cta gcg gca ggt atg tcg tac     2112Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690                 695                 700gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc     2160Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val705                 710                 715                 720tgc gtc gcc gct agc aat tca ccg gat agt gtg acc ttc tcc ggc gac     2208Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
            725                 730                 735atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act     2256Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
        740                 745                 750ttt gcc aga atc ttg aga gtt gac aag gcc tac cat tcg cat cac atg     2304Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
    755                 760                 765cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt     2352His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770                 775                 780gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tct gcc     2400Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala785                 790                 795                 800gtc cac gag acc agc aag caa atg act gta cag gat gtg atg ccc gct     2448Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
            805                 810                 815tat tgg aaa gac aat ctc gtc tct ccg gtc ttg ttc tcg cag gct gtg     2496Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
        820                 825                 830cag aaa gca gtc atc act cat cgt cta atc gac gtc gcc atc gaa att     2544Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
    835                 840                 845ggc gcc cac cct gct ctc aag ggt ccg tgt cta gcc acc atc aag gat     2592Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850                 855                 860gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca cga aac     2640Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Ash865                 870                 875                 880gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag     2688Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
            885                 890                 895cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc     2736Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
        900                 905                 910cgg ccc gat cgt gcc gtt caa aac ctg tca aag tca ttg ccc aca tac     2784Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
    915                 920                 925tct tgg gat cat act cgt caa tac tgg gca gaa tct cgc tcc acc cgc     2832Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930                 935                 940cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tct     2880Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser945                 950                 955                 960tct tac agc aca gca tcg acc ttc cag tgg aca aac ttc atc agg ccc     2928Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
            965                 970                 975cgg gat ctg gaa tgg ctc gac ggt cat gcg cta caa ggc cag act gtg     2976Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
        980                 985                 990ttc ccc gct gct ggg tac ata att atg gcc atg gaa gct gcc atg aag     3024Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
    995                 1000                1005gtg gct  ggt gag cgt gcc gcc  caa gtt cag ctc ctg  gaa atc ttg      3069Val Ala  Gly Glu Arg Ala Ala  Gln Val Gln Leu Leu  Glu Ile Leu
1010                 1015                 1020gac atg  agc atc aac aaa gcc  atc gtg ttt gaa gat  gaa aac acc      3114Asp Met  Ser Ile Asn Lys Ala  Ile Val Phe Glu Asp  Glu Asn Thr
1025                 1030                 1035tcc gtg  gag ctg aac ttg aca  gcc gaa gtc acc agt  gac aat gat      3159Ser Val  Glu Leu Asn Leu Thr  Ala Glu Val Thr Ser  Asp Asn Asp
1040                 1045                 1050gcg gat  ggc caa gtc acg gtc  aaa ttt gtt att gat  tcc tgt ctg      3204Ala Asp  Gly Gln Val Thr Val  Lys Phe Val Ile Asp  Ser Cys Leu
1055                 1060                 1065gca aag  gag agt gag ctt tcg  aca tcc gcc aaa ggc  caa atc gtc      3249Ala Lys  Glu Ser Glu Leu Ser  Thr Ser Ala Lys Gly  Gln Ile Val
1070                 1075                 1080ata acc  ctt ggc gag gca tca  ccg tca tcg cag ctt  ttg ccg cca      3294Ile Thr  Leu Gly Glu Ala Ser  Pro Ser Ser Gln Leu  Leu Pro Pro
1085                 1090                 1095cct gag  gaa gag tac ccc cag  atg aac aat gtc aac  atc gat ttc      3339Pro Glu  Glu Glu Tyr Pro Gln  Met Asn Asn Val Asn  Ile Asp Phe
1100                 1105                 1110ttc tat  cgg gaa ctt gac ctc  ctt ggg tat gac tac  agc aaa gac      3384Phe Tyr  Arg Glu Leu Asp Leu  Leu Gly Tyr Asp Tyr  Ser Lys Asp
1115                 1120                 1125tt cgt  cgt ttg cag acc atg  aga agg gcc gac tcc  aaa gct agc      3429Phe Arg  Arg Leu Gln Thr Met  Arg Arg Ala Asp Ser  Lys Ala Ser
1130                 1135                 1140ggc acc  ttg gct ttc ctt cca  ctt aag gat gaa ttg  cgc aat gag      3474Gly Thr  Leu Ala Phe Leu Pro  Leu Lys Asp Glu Leu  Arg Asn Glu
1145                 1150                 1155ccc ctc  ttg ctc cac cca gcg  ccc ctg gac atc gcg  ttc cag act      3519Pro Leu  Leu Leu His Pro Ala  Pro Leu Asp Ile Ala  Phe Gln Thr
1160                 1165                 1170gtc att  gga gcg tat tcc tct  cca gga gat cgt cgc  cta cgc tca      3564Val Ile  Gly Ala Tyr Ser Ser  Pro Gly Asp Arg Arg  Leu Arg Ser
1175                 1180                 1185ttg tac  gtg cct act cac gtt  gac aga gtg act ctg  att cca tcg      3609Leu Tyr  Val Pro Thr His Val  Asp Arg Val Thr Leu  Ile Pro Ser
1190                 1195                 1200ctc tgt  ata tcg gcg ggt aat  tct ggt gaa acc gag  ctt gcg ttt      3654Leu Cys  Ile Ser Ala Gly Asn  Ser Gly Glu Thr Glu  Leu Ala Phe
1205                 1210                 1215gac aca  atc aac aca cac gac  aag ggt gat ttc ctg  agc ggc gac      3699Asp Thr  Ile Asn Thr His Asp  Lys Gly Asp Phe Leu  Ser Gly Asp
1220                 1225                 1230atc acg  gtg tac gat tcg acc  aag aca acg ctt ttc  caa gtt gat      3744Ile Thr  Val Tyr Asp Ser Thr  Lys Thr Thr Leu Phe  Gln Val Asp
1235                 1240                 1245aac att  gtc ttt aag cct ttc  tct ccc ccg act gct  tcg acc gac      3789Asn Ile  Val Phe Lys Pro Phe  Ser Pro Pro Thr Ala  Ser Thr Asp
1250                 1255                 1260cac cga  atc ttc gca aag tgg  gtc tgg gga ccc ctc  acg ccc gaa      3834His Arg  Ile Phe Ala Lys Trp  Val Trp Gly Pro Leu  Thr Pro Glu
1265                 1270                 1275aaa ctg  ctg gag gac cct gcg  acg ttg atc ata gct  cgg gac aag      3879Lys Leu  Leu Glu Asp Pro Ala  Thr Leu Ile Ile Ala  Arg Asp Lys
1280                 1285                 1290gag gac  att ctg acc atc gag  cga atc gtt tac ttc  tac atc aaa      3924Glu Asp  Ile Leu Thr Ile Glu  Arg Ile Val Tyr Phe  Tyr Ile Lys
1295                 1300                 1305tcc ttc  cta gcc cag ata acc  ccc gac gac cgt caa  aat gcc gac      3969Ser Phe  Leu Ala Gln Ile Thr  Pro Asp Asp Arg Gln  Asn Ala Asp
1310                 1315                 1320ctc cat  tcc cag aag tac att  gaa tgg tgt gac cag  gtt cag gcc      4014Leu His  Ser Gln Lys Tyr Ile  Glu Trp Cys Asp Gln  Val Gln Ala
1325                 1330                 1335gat gct  cgg gct ggc cac cat  cag tgg tac cag gag  tct tgg gag      4059Asp Ala  Arg Ala Gly His His  Gln Trp Tyr Gln Glu  Ser Trp Glu
1340                 1345                 1350gag gac  act tct gtt cac att  gag caa atg tgt gaa  agc aac tcg      4104Glu Asp  Thr Ser Val His Ile  Glu Gln Met Cys Glu  Ser Asn Ser
1355                 1360                 1365tcc cac  cca cat gtg cgc ctg  atc caa agg gta ggc  aaa gaa tta      4149Ser His  Pro His Val Arg Leu  Ile Gln Arg Val Gly  Lys Glu Leu
1370                 1375                 1380att tca  att gtt cgc ggg aac  ggg gat cct ttg gat  atc atg aac      4194Ile Ser  Ile Val Arg Gly Asn  Gly Asp Pro Leu Asp  Ile Met Asn
1385                 1390                 1395cgc gat  ggg ttg ttc acc gag  tac tat acc aac aag  ctc gcc ttt      4239Arg Asp  Gly Leu Phe Thr Glu  Tyr Tyr Thr Asn Lys  Leu Ala Phe
1400                 1405                 1410ggc tca  gca ata cac gtc gtt  cag gat ctg gtt agc  caa att gct      4284Gly Ser  Ala Ile His Val Val  Gln Asp Leu Val Ser  Gln Ile Ala
1415                 1420                 1425cat cgc  tac caa tcc att gat  atc ctt gag atc ggc  ttg ggt aca      4329His Arg  Tyr Gln Ser Ile Asp  Ile Leu Glu Ile Gly  Leu Gly Thr
1430                 1435                 1440ggc atc  gcc acg aag cgc gtt  ctt gca tca cct caa  ctt ggt ttc      4374Gly Ile  Ala Thr Lys Arg Val  Leu Ala Ser Pro Gln  Leu Gly Phe
1445                 1450                 1455aac agt  tac act tgc act gac  atc tcg gcg gat gtt  att ggc aag      4419Asn Ser  Tyr Thr Cys Thr Asp  Ile Ser Ala Asp Val  Ile Gly Lys
1460                 1465                 1470gcc cgt  gaa caa ctt tcc gaa  ttc gac ggt ctc atg  cag ttt gag      4464Ala Arg  Glu Gln Leu Ser Glu  Phe Asp Gly Leu Met  Gln Phe Glu
1475                 1480                 1485gca cta  gac atc aac aga agc  cca gca gag caa gga  ttc aag cct      4509Ala Leu  Asp Ile Asn Arg Ser  Pro Ala Glu Gln Gly  Phe Lys Pro
1490                 1495                 1500cac tcc  tac gat ctg att att  gca tcc gat gtc ctc  cat gcc agc      4554His Ser  Tyr Asp Leu Ile Ile  Ala Ser Asp Val Leu  His Ala Ser
1505                 1510                 1515tcc aac  ttc gag gaa aaa ttg  gct cac ata agg tcc  ttg ctc aag      4599Ser Asn  Phe Glu Glu Lys Leu  Ala His Ile Arg Ser  Leu Leu Lys
1520                 1525                 1530ccg ggt  ggt cac ttg gtt act  ttc ggg gtc acc cat  cgc gag cct      4644Pro Gly  Gly His Leu Val Thr  Phe Gly Val Thr His  Arg Glu Pro
1535                 1540                 1545gct cgc  ctc gcc ttc atc tct  ggg ctt ttc gct gat  cga tgg act      4689Ala Arg  Leu Ala Phe Ile Ser  Gly Leu Phe Ala Asp  Arg Trp Thr
1550                 1555                 1560gga gaa  gac gaa act cgt gct  ttg agt gcc tcg ggg  tcc gtt gac      4734Gly Glu  Asp Glu Thr Arg Ala  Leu Ser Ala Ser Gly  Ser Val Asp
1565                 1570                 1575caa tgg  gag cat acc ctc aag  aga gtt ggg ttc tct  ggc gtc gat      4779Gln Trp  Glu His Thr Leu Lys  Arg Val Gly Phe Ser  Gly Val Asp
1580                 1585                 1590agt cgg  aca ctt gat cga gag  gat gat ttg atc ccg  tct gtc ttc      4824Ser Arg  Thr Leu Asp Arg Glu  Asp Asp Leu Ile Pro  Ser Val Phe
1595                 1600                 1605agt aca  cat gct gtg gat gcc  acc gtt gag cgt ttg  tat gat cca      4869Ser Thr  His Ala Val Asp Ala  Thr Val Glu Arg Leu  Tyr Asp Pro
1610                 1615                 1620ctt tct  gct cca ttg aag gac  tca tac ccg cca tta  gtg gtt atc      4914Leu Ser  Ala Pro Leu Lys Asp  Ser Tyr Pro Pro Leu  Val Val Ile
1625                 1630                 1635ggt ggc  gaa tcg aca aaa acc  gaa cgc att ttg aac  gac atg aaa      4959Gly Gly  Glu Ser Thr Lys Thr  Glu Arg Ile Leu Asn  Asp Met Lys
1640                 1645                 1650gct gcc  cta ccg cat aga cac  atc cac tcc gtc aag  cgg ctg gaa      5004Ala Ala  Leu Pro His Arg His  Ile His Ser Val Lys  Arg Leu Glu
1655                 1660                 1665agt gtt  ctc gac gac ccg gcc  ttg cag cct aag tcg  act ttt gtc      5049Ser Val  Leu Asp Asp Pro Ala  Leu Gln Pro Lys Ser  Thr Phe Val
1670                 1675                 1680atc ctc  tcg gaa ctt gat gat  gaa gtg ttt tgc aac  ctt gaa gag      5094Ile Leu  Ser Glu Leu Asp Asp  Glu Val Phe Cys Asn  Leu Glu Glu
1685                 1690                 1695gac aag  ttt gag gca gtc aag  tct ctt ctc ttc tac  gcc gga cgc      5139Asp Lys  Phe Glu Ala Val Lys  Ser Leu Leu Phe Tyr  Ala Gly Arg
1700                 1705                 1710atg atg  tgg ctg aca gag aat  gcc tgg att gat cat  ccc cac cag      5184Met Met  Trp Leu Thr Glu Asn  Ala Trp Ile Asp His  Pro His Gln
1715                 1720                 1725gcc agc  acc atc gga atg ttg  agg aca atc aag ctc  gag aac cct      5229Ala Ser  Thr Ile Gly Met Leu  Arg Thr Ile Lys Leu  Glu Asn Pro
1730                 1735                 1740gac ttg  gga acg cac gtc ttc  gat gtc gat act gtg  gag aac cta      5274Asp Leu  Gly Thr His Val Phe  Asp Val Asp Thr Val  Glu Asn Leu
1745                 1750                 1755gac acc  aaa ttc ttc gtt gag  caa ctt ttg cgc ttc  gag gag agc      5319Asp Thr  Lys Phe Phe Val Glu  Gln Leu Leu Arg Phe  Glu Glu Ser
1760                 1765                 1770gat gat  cag ctt ttg gaa tca  ata aca tgg act cat  gag ccc gaa      5364Asp Asp  Gln Leu Leu Glu Ser  Ile Thr Trp Thr His  Glu Pro Glu
1775                 1780                 1785gtg tac  tgg tgc aag ggt cgt  gcc tgg gtc cct cgt  ttg aag cag      5409Val Tyr  Trp Cys Lys Gly Arg  Ala Trp Val Pro Arg  Leu Lys Gln
1790                 1795                 1800gat att  gct agg aac gac cgt  atg aac tcg tct cgt  cgt cca att      5454Asp Ile  Ala Arg Asn Asp Arg  Met Asn Ser Ser Arg  Arg Pro Ile
1805                 1810                 1815ttc ggt  aac ttt aat tcg tcc  aag acg gcc att gca  ctg aaa gag      5499Phe Gly  Asn Phe Asn Ser Ser  Lys Thr Ala Ile Ala  Leu Lys Glu
1820                 1825                 1830gcg agg  gga gca tcc tca tcg  atg tac tat ctt gag  tca acc gag      5544Ala Arg  Gly Ala Ser Ser Ser  Met Tyr Tyr Leu Glu  Ser Thr Glu
1835                 1840                 1845acg tgt  gat tcg tta gaa gac  gct cgt cat gct gga  aaa gca act      5589Thr Cys  Asp Ser Leu Glu Asp  Ala Arg His Ala Gly  Lys Ala Thr
1850                 1855                 1860gtt cgt  gtt cgc tac gct ctt  ccc cag gca att cgc  gtg ggc cat      5634Val Arg  Val Arg Tyr Ala Leu  Pro Gln Ala Ile Arg  Val Gly His
1865                 1870                 1875ctc gga  tac ttc cat gtc gtg  cag ggc agt att ctg  gag aat aca      5679Leu Gly  Tyr Phe His Val Val  Gln Gly Ser Ile Leu  Glu Asn Thr
1880                 1885                 1890tgt gag  gtg cct gta gtc gcc  ctg gct gag aag aat  gga tct ata      5724Cys Glu  Val Pro Val Val Ala  Leu Ala Glu Lys Asn  Gly Ser Ile
1895                 1900                 1905ctg cat  gta ccg aga aac tac  atg cat agt ctg ccc  gat aac atg      5769Leu His  Val Pro Arg Asn Tyr  Met His Ser Leu Pro  Asp Asn Met
1910                 1915                 1920gcg gaa  ggc gag gat agt tcc  ttc ttg ttg tcc aca  gct gca gcc      5814Ala Glu  Gly Glu Asp Ser Ser  Phe Leu Leu Ser Thr  Ala Ala Ala
1925                 1930                 1935ctc ctt  gcc gaa aca att ctc  tct agc gct cag tcc  ttt ggc tct      5859Leu Leu  Ala Glu Thr Ile Leu  Ser Ser Ala Gln Ser  Phe Gly Ser
1940                 1945                 1950gat gca  tca att ctg att atg  gag ccc cca atc ttc  tgc gtc aaa      5904Asp Ala  Ser Ile Leu Ile Met  Glu Pro Pro Ile Phe  Cys Val Lys
1955                 1960                 1965gca att  ctg gag tcg gcc aaa  acc tac ggt gtt cag  gtt catttg       5949Ala Ile  Leu Glu Ser Ala Lys  Thr Tyr Gly Val Gln  Val His Leu
1970                 1975                 1980gca aca  act ctg tcc gac gtc  aaa act att ccg gct  cct tgg atc      5994Ala Thr  Thr Leu Ser Asp Val  Lys Thr Ile Pro Ala  Pro Trp Ile
1985                 1990                 1995cga tta  cat gcc aag gaa acc  gac gct cgg ctg aaa  cac agc ctg      6039Arg Leu  His Ala Lys Glu Thr  Asp Ala Arg Leu Lys  His Ser Leu
2000                 2005                 2010ccg aca  aac atg atg gca ttc  ttt gac ttg tct acc  gac cgg act      6084Pro Thr  Asn Met Met Ala Phe  Phe Asp Leu Ser Thr  Asp Arg Thr
2015                 2020                 2025gct gcc  ggg ata acc aac cgt  ttg gcc aag ttg cta  cca ccc agt      6129Ala Ala  Gly Ile Thr Asn Arg  Leu Ala Lys Leu Leu  Pro Pro Ser
2030                 2035                 2040tgc ttc  atg tac agt ggt gac  tat ctt atc cga agt  aca gct tcc      6174Cys Phe  Met Tyr Ser Gly Asp  Tyr Leu Ile Arg Ser  Thr Ala Ser
2045                 2050                 2055aca tac  aaa gtt agt cat gtt  gag gat att cca atc  ctc gag cac      6219Thr Tyr  Lys Val Ser His Val  Glu Asp Ile Pro Ile  Leu Glu His
2060                 2065                 2070tct gtg  gca atg gca aaa aat  acc gtc tct gcg tcg  act gtc gac      6264Ser Val  Ala Met Ala Lys Asn  Thr Val Ser Ala Ser  Thr Val Asp
2075                 2080                 2085gac act  gag aaa gtt att aca  gcc aca caa att ctc  ttg cct ggt      6309Asp Thr  Glu Lys Val Ile Thr  Ala Thr Gln Ile Leu  Leu Pro Gly
2090                 2095                 2100cag ctc  tct gtc aac cac aat  gac caa cgc ttc aat  ctg gcc acc      6354Gln Leu  Ser Val Asn His Asn  Asp Gln Arg Phe Asn  Leu Ala Thr
2105                 2110                 2115gtc atc  gac tgg aag gaa aat  gag gtg tcc gct agg  att tgc ccc      6399Val Ile  Asp Trp Lys Glu Asn  Glu Val Ser Ala Arg  Ile Cys Pro
2120                 2125                 2130atc gac  tct ggt aac tta ttt  tcc aac aag aag acg  tat ttg ctt      6444Ile Asp  Ser Gly Asn Leu Phe  Ser Asn Lys Lys Thr  Tyr Leu Leu
2135                 2140                 2145gtt ggt  ctt acc ggg gac ctt  ggt cgc tct ctc tgt  cgc tgg atg      6489Val Gly  Leu Thr Gly Asp Leu  Gly Arg Ser Leu Cys  Arg Trp Met
2150                 2155                 2160atc ttg  cat ggc gcc cgc cat  gtt gtg ctc act agc  cgg aac cct      6534Ile Leu  His Gly Ala Arg His  Val Val Leu Thr Ser  Arg Asn Pro
2165                 2170                 2175cga ctt  gat ccc aaa tgg atc  gcc aac atg gag gca  ctt ggt ggt      6579Arg Leu  Asp Pro Lys Trp Ile  Ala Asn Met Glu Ala  Leu Gly Gly
2180                 2185                 2190gac atc  acc gtt ctg tca atg  gat gtt gcc aat gag  gat tca gtc      6624Asp Ile  Thr Val Leu Ser Met  Asp Val Ala Asn Glu  Asp Ser Val
2195                 2200                 2205gat gct  ggc ctt ggc aag ctt  gtc gat atg aag ttg  cca cct gtt      6669Asp Ala  Gly Leu Gly Lys Leu  Val Asp Met Lys Leu  Pro Pro Val
2210                 2215                 2220gcc ggc  atc gcg ttc ggg cct  ttg gtg ctg cag gat  gtc atg ctg      6714Ala Gly  Ile Ala Phe Gly Pro  Leu Val Leu Gln Asp  Val Met Leu
2225                 2230                 2235aag aac  atg gac cac cag atg  atg gac atg gtg ttg  aag ccc aag      6759Lys Asn  Met Asp His Gln Met  Met Asp Met Val Leu  Lys Pro Lys
2240                 2245                 2250gta caa  gga gca cgc att ctt  cat gaa cgg ttc tcc  gaa cag acg      6804Val Gln  Gly Ala Arg Ile Leu  His Glu Arg Phe Ser  Glu Gln Thr
2255                 2260                 2265ggc agc  aag gcg ctc gac ttc  ttc atc atg ttt tcg  tcc att gtt      6849Gly Ser  Lys Ala Leu Asp Phe  Phe Ile Met Phe Ser  Ser Ile Val
2270                 2275                 2280gca gtt  att ggc aat cct ggc  cag tcc aac tat ggc  gct gcg aat      6894Ala Val  Ile Gly Asn Pro Gly  Gln Ser Asn Tyr Gly  Ala Ala Asn
2285                 2290                 2295gcc tac  cta cag gct ctg gcc  cag caa cgg tgc gcc  aga gga ttg      6939Ala Tyr  Leu Gln Ala Leu Ala  Gln Gln Arg Cys Ala  Arg Gly Leu
2300                 2305                 2310gcg gga  tca acc atc gat att  ggt gcc gtt tac ggt  gta ggg ttt      6984Ala Gly  Ser Thr Ile Asp Ile  Gly Ala Val Tyr Gly  Val Gly Phe
2315                 2320                 2325gtc acg  agg gcc gag atg gag  gag gac ttt gat gct  atc cgt ttc      7029Val Thr  Arg Ala Glu Met Glu  Glu Asp Phe Asp Ala  Ile Arg Phe
2330                 2335                 2340atg ttt  gac tca gtt gaa gag  cat gag ctg cac acg  ctt ttc gcc      7074Met Phe  Asp Ser Val Glu Glu  His Glu Leu His Thr  Leu Phe Ala
2345                 2350                 2355gaa gcg  gtc gtg tct gac cag  cgt gcc cgg cag caa  cca cag cgc      7119Glu Ala  Val Val Ser Asp Gln  Arg Ala Arg Gln Gln  Pro Gln Arg
2360                 2365                 2370aag acg  gtc att gac atg gcg  gac ctt gag ctt acc  acg ggt atc      7164Lys Thr  Val Ile Asp Met Ala  Asp Leu Glu Leu Thr  Thr Gly Ile
2375                 2380                 2385cca gat  ctt gac cct gcg ctt  caa gat cga att att  tac ttc aac      7209Pro Asp  Leu Asp Pro Ala Leu  Gln Asp Arg Ile Ile  Tyr Phe Asn
2390                 2395                 2400gac cct  cgt ttc gga aac ttc  aaa att ccc ggt caa  cgc gga gac      7254Asp Pro  Arg Phe Gly Asn Phe  Lys Ile Pro Gly Gln  Arg Gly Asp
2405                 2410                 2415ggt ggc  gac aat gga tca ggg  tct aaa ggc tcc att  gcc gac cag      7299Gly Gly  Asp Asn Gly Ser Gly  Ser Lys Gly Ser Ile  Ala Asp Gln
2420                 2425                 2430ctc aaa  caa gca aca act tta  gac caa gtt cgg caa  atc gtg att      7344Leu Lys  Gln Ala Thr Thr Leu  Asp Gln Val Arg Gln  Ile Val Ile
2435                 2440                 2445gat ggt  cta tct gag aaa ctc  cgt gtt acc ctc caa  gtt tcg gac      7389Asp Gly  Leu Ser Glu Lys Leu  Arg Val Thr Leu Gln  Val Ser Asp
2450                 2455                 2460ggg gag  agc gtg gac cca acc  att cct ctc att gat  caa ggt gtc      7434Gly Glu  Ser Val Asp Pro Thr  Ile Pro Leu Ile Asp  Gln Gly Val
2465                 2470                 2475gac tcc  ttg ggt gca gtg act  gtc ggc tca tgg ttc  tca aag caa      7479Asp Ser  Leu Gly Ala Val Thr  Val Gly Ser Trp Phe  Ser Lys Gln
2480                 2485                 2490ctc tac  ctt gac ctc cca ctc  ttg agg gta ctt ggc  ggt gct tct      7524Leu Tyr  Leu Asp Leu Pro Leu  Leu Arg Val Leu Gly  Gly Ala Ser
2495                 2500                 2505gtc gct  gat ctt gcc gac gac  gcg gcc acc cga ctc  cca gct aca      7569Val Ala  Asp Leu Ala Asp Asp  Ala Ala Thr Arg Leu  Pro Ala Thr
2510                 2515                 2520tcc att  ccg ctg ctg ttg caa  att ggt gat tcc acg  gga acc tcg      7614Ser Ile  Pro Leu Leu Leu Gln  Ile Gly Asp Ser Thr  Gly Thr Ser
2525                 2530                 2535gac agc  ggg gct tct ccg aca  cca aca gac agc cat  gat gaa gca      7659Asp Ser  Gly Ala Ser Pro Thr  Pro Thr Asp Ser His  Asp Glu Ala
2540                 2545                 2550agc tct  gct acc agc aca gat  gcg tcg tca gcc gaa  gag gat gaa      7704Ser Ser  Ala Thr Ser Thr Asp  Ala Ser Ser Ala Glu  Glu Asp Glu
2555                 2560                 2565gag caa  gag gac gat aat gag  cag gga ggc cgt aag  att ctt cgt      7749Glu Gln  Glu Asp Asp Asn Glu  Gln Gly Gly Arg Lys  Ile Leu Arg
2570                 2575                 2580cgc gag  agg ttg tcc ctt ggc  cag gag tat tcc tgg  agg cag caa      7794Arg Glu  Arg Leu Ser Leu Gly  Gln Glu Tyr Ser Trp  Arg Gln Gln
2585                 2590                 2595caa atg  gta aaa gat cat acc  atc ttc aac aac act  att ggc atg      7839Gln Met  Val Lys Asp His Thr  Ile Phe Asn Asn Thr  Ile Gly Met
2600                 2605                 2610ttc atg  aag ggt acc att gac  ctc gac cgg ttg agg  cgg gct ctg      7884Phe Met  Lys Gly Thr Ile Asp  Leu Asp Arg Leu Arg  Arg Ala Leu
2615                 2620                 2625aaa gcc  tca ttg cgc cgt cac  gag atc ttc cgt acg  tgc ttt gtt      7929Lys Ala  Ser Leu Arg Arg His  Glu Ile Phe Arg Thr  Cys Phe Val
2630                 2635                 2640act ggc  gat gac tat agc agc  gat tta aat ggt ccc  gtc caa gtg      7974Thr Gly  Asp Asp Tyr Ser Ser  Asp Leu Asn Gly Pro  Val Gln Val
2645                 2650                 2655gtt ctc  aag aac ccg gag aac  aga gtg cac ttt gtt  cag gtg aac      8019Val Leu  Lys Asn Pro Glu Asn  Arg Val His Phe Val  Gln Val Asn
2660                 2665                 2670aac gct  gcg gag gca gag gaa  gag tac cgg aaa ctc  gag aag aca      8064Asn Ala  Ala Glu Ala Glu Glu  Glu Tyr Arg Lys Leu  Glu Lys Thr
2675                 2680                 2685aac tat  agc atc tcc aca ggt  gac act ctc aga ctc  gtt gat ttc      8109Asn Tyr  Ser Ile Ser Thr Gly  Asp Thr Leu Arg Leu  Val Asp Phe
2690                 2695                 2700tac tgg  ggc aca gat gac cac  ctg ttg gta atc ggc  tac cac aga      8154Tyr Trp  Gly Thr Asp Asp His  Leu Leu Val Ile Gly  Tyr His Arg
2705                 2710                 2715tta gtt  ggt gat ggc tca aca  aca gaa aac ctg ttc  aat gag atc      8199Leu Val  Gly Asp Gly Ser Thr  Thr Glu Asn Leu Phe  Asn Glu Ile
2720                 2725                 2730ggg cag  att tac agc ggg gtg  aaa atg cag cga cca  tcg acc caa      8244Gly Gln  Ile Tyr Ser Gly Val  Lys Met Gln Arg Pro  Ser Thr Gln
2735                 2740                 2745ttc tct  gat cta gcc gtc caa  cag cgg gaa aac ctg  gaa aat ggg      8289Phe Ser  Asp Leu Ala Val Gln  Gln Arg Glu Asn Leu  Glu Asn Gly
2750                 2755                 2760cga atg  ggg gac gat atc gcg  ttc tgg aag tcc atg  cat agc aaa      8334Arg Met  Gly Asp Asp Ile Ala  Phe Trp Lys Ser Met  His Ser Lys
2765                 2770                 2775gtc tcg  tca tct gcg cca acc  gtg ctt ccc atc atg  aat ctg atc      8379Val Ser  Ser Ser Ala Pro Thr  Val Leu Pro Ile Met  Asn Leu Ile
2780                 2785                 2790aat gac  cct gct gcc aat tca  gag cag cag caa ata  cag cca ttc      8424Asn Asp  Pro Ala Ala Asn Ser  Glu Gln Gln Gln Ile  Gln Pro Phe
2795                 2800                 2805acg tgg  cag cag tat gaa gca  att gct cgt tta gat  ccc atg gtc      8469Thr Trp  Gln Gln Tyr Glu Ala  Ile Ala Arg Leu Asp  Pro Met Val
2810                 2815                 2820gcc ttc  cga atc aaa gag cgg  agc cgc aag cac aag  gca acc ccc      8514Ala Phe  Arg Ile Lys Glu Arg  Ser Arg Lys His Lys  Ala Thr Pro
2825                 2830                 2835atg cag  ttc tac ctg gcc gcc  tac cac gtt ttg ttg  gcg cgt ctt      8559Met Gln  Phe Tyr Leu Ala Ala Tyr His Val Leu Leu  Ala Arg Leu
2840                 2845                 2850acc ggc  agc aaa gac ata acc  atc ggc ctc gcc gaa  acc aac cga      8604Thr Gly  Ser Lys Asp Ile Thr  Ile Gly Leu Ala Glu  Thr Asn Arg
2855                 2860                 2865tcc acc  atg gaa gaa att tcg  gcg atg ggc ttt ttc  gct aac gtg     8649Ser Thr  Met Glu Glu Ile Ser  Ala Met Gly Phe Phe  Ala Asn Val
2870                 2875                 2880ctt ccc  ctg cgc ttt gat gag  ttc gtc ggc agc aag  aca ttc ggc      8694Leu Pro  Leu Arg Phe Asp Glu  Phe Val Gly Ser Lys  Thr Phe Gly
2885                 2890                 2895gag cac  ctt gta gcc acc aag  gac agt gtg cgt gag  gcc atg caa     8739Glu His  Leu Val Ala Thr Lys  Asp Ser Val Arg Glu  Ala Met Gln
2900                 2905                 2910cac gcg  cgg gtg ccg tat ggc  gtc atc ctc gac tgt  cta ggc ctg     8784His Ala  Arg Val Pro Tyr Gly  Val Ile Leu Asp Cys  Leu Gly Leu
2915                 2920                 2925aat ctc  cct acc tca ggc gag  gaa ccc aag act cag  aca cac gcc     8829Asn Leu  Pro Thr Ser Gly Glu  Glu Pro Lys Thr Gln  Thr His Ala
2930                 2935                 2940ccc ttg  ttc cag gct gtc ttt  gat tac aag cag ggt  caa gcg gag     8874Pro Leu  Phe Gln Ala Val Phe  Asp Tyr Lys Gln Gly  Gln Ala Glu
2945                 2950                 2955agt ggc  tca att ggc aat gcc  aaa atg acg agt gtt  ctc gct tcc     8919Ser Gly  Ser Ile Gly Asn Ala  Lys Met Thr Ser Val  Leu Ala Ser
2960                 2965                 2970cgt gag  cgc act cct tat gac  atc gtt ctc gag atg  tgg gat gac     8964Arg Glu  Arg Thr Pro Tyr Asp  Ile Val Leu Glu Met  Trp Asp Asp
2975                 2980                 2985cct acc  aag gac cca ctc att  cat gtc aaa ctt cag  agc tcg ctg     9009Pro Thr  Lys Asp Pro Leu Ile  His Val Lys Leu Gln  Ser Ser Leu
2990                 2995                 3000tat ggc  cct gag cac gct cag  gcc ttt gta gac cac  ttt tct tca     9054Tyr Gly  Pro Glu His Ala Gln  Ala Phe Val Asp His  Phe Ser Ser
3005                 3010                 3015atc ctc  act atg ttc tcg atg  aac ccg gct ctg aag  ttg gcc tag     9099Ile Leu  Thr Met Phe Ser Met  Asn Pro Ala Leu Lys  Leu Ala
3020                 3025                 3030<210>44<211>3032<212>PRT<213>柑桔青霉<400>44Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser1               5                   10                  15Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
        20                  25                  30Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
    35                  40                  45Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50                  55                  60Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe65                  70                  75                  80Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
            85                  90                  95Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
        100                 105                 110Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
    115                 120                 125Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130                 135                 140Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala145                 150                 155                 160Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
            165                 170                 175Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
        180                 185                 190Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
    195                 200                 205Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210                 215                 220Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp225                 230                 235                 240Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
            245                 250                 255Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
        260                 265                 270Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
    275                 280                 285His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290                 295                 300Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His305                 310                 315                 320Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
            325                 330                 335Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
        340                 345                 350Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
    355                 360                 365Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370                 375                 380Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro385                 390                 395                 400Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
            405                 410                 415Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
        420                 425                 430Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
    435                 440                 445Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450                 455                 460Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln465                 470                 475                 480Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
            485                 490                 495His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
        500                 505                 510Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
    515                 520                 525Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530                 535                 540Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val545                 550                 555                 560Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
            565                 570                 575Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
        580                 585                 590Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
    595                 600                 605Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610                 615                 620Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu625                 630                 635                 640Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
            645                 650                 655Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
        660                 665                 670Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
    675                 680                 685Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690                 695                 700Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val705                 710                 715                 720Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
            725                 730                 735Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
        740                 745                 750Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
    755                 760                 765His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770                 775                 780Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala785                 790                 795                 800Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
            805                 810                 815Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
        820                 825                 830Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
    835                 840                 845Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850                 855                 860Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn865                 870                 875                 880Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
            885                 890                 895Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
        900                 905                 910Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
    915                 920                 925Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930                 935                 940Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser945                 950                 955                 960Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
            965                 970                 975Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
        980                 985                 990Phe Pro Ala Ala Gly Tyr Ile Ile  Met Ala Met Glu Ala  Ala Met Lys
    995                 1000                 1005Val Ala  Gly Glu Arg Ala Ala  Gln Val Gln Leu Leu  Glu Ile Leu
1010                 1015                 1020Asp Met  Ser Ile Asn Lys Ala  Ile Val Phe Glu Asp  Glu Asn Thr
1025                 1030                 1035Ser Val  Glu Leu Asn Leu Thr  Ala Glu Val Thr Ser  Asp Asn Asp
1040                 1045                 1050Ala Asp  Gly Gln Val Thr Val  Lys Phe Val Ile Asp  Ser Cys Leu
1055                 1060                 1065Ala Lys  Glu Ser Glu Leu Ser  Thr Ser Ala Lys Gly  Gln Ile Val
1070                 1075                 1080Ile Thr  Leu Gly Glu Ala Ser  Pro Ser Ser Gln Leu  Leu Pro Pro
1085                 1090                 1095Pro Glu  Glu Glu Tyr Pro Gln  Met Asn Asn Val Asn  Ile Asp Phe
1100                 1105                 1110Phe Tyr  Arg Glu Leu Asp Leu  Leu Gly Tyr Asp Tyr  Ser Lys Asp
1115                 1120                 1125Phe Arg  Arg Leu Gln Thr Met  Arg Arg Ala Asp Ser  Lys Ala Ser
1130                 1135                 1140Gly Thr  Leu Ala Phe Leu Pro  Leu Lys Asp Glu Leu  Arg Asn Glu
1145                 1150                 1155Pro Leu  Leu Leu His Pro Ala  Pro Leu Asp Ile Ala  Phe Gln Thr
1160                 1165                 1170Val Ile  Gly Ala Tyr Ser Ser  Pro Gly Asp Arg Arg  Leu Arg Ser
1175                 1180                 1185Leu Tyr  Val Pro Thr His Val  Asp Arg Val Thr Leu  Ile Pro Ser
1190                 1195                 1200Leu Cys  Ile Ser Ala Gly Asn  Ser Gly Glu Thr Glu  Leu Ala Phe
1205                 1210                 1215Asp Thr  Ile Asn Thr His Asp  Lys Gly Asp Phe Leu  Ser Gly Asp
1220                 1225                 1230Ile Thr  Val Tyr Asp Ser Thr  Lys Thr Thr Leu Phe  Gln Val Asp
1235                 1240                 1245Asn Ile  Val Phe Lys Pro Phe  Ser Pro Pro Thr Ala  Ser Thr Asp
1250                 1255                 1260His Arg  Ile Phe Ala Lys Trp  Val Trp Gly Pro Leu  Thr Pro Glu
1265                 1270                 1275Lys Leu  Leu Glu Asp Pro Ala  Thr Leu Ile Ile Ala  Arg Asp Lys
1280                 1285                 1290Glu Asp  Ile Leu Thr Ile Glu  Arg Ile Val Tyr Phe  Tyr Ile Lys
1295                 1300                 1305Ser Phe  Leu Ala Gln Ile Thr  Pro Asp Asp Arg Gln  Asn Ala Asp
1310                 1315                 1320Leu His  Ser Gln Lys Tyr Ile  Glu Trp Cys Asp Gln  Val Gln Ala
1325                 1330                 1335Asp Ala  Arg Ala Gly His His  Gln Trp Tyr Gln Glu  Ser Trp Glu
1340                 1345                 1350Glu Asp  Thr Ser Val His Ile  Glu Gln Met Cys Glu  Ser Asn Ser
1355                 1360                 1365Ser His  Pro His Val Arg Leu  Ile Gln Arg Val Gly  Lys Glu Leu
1370                 1375                 1380Ile Ser  Ile Val Arg Gly Asn  Gly Asp Pro Leu Asp  Ile Met Asn
1385                 1390                 1395Arg Asp  Gly Leu Phe Thr Glu  Tyr Tyr Thr Asn Lys  Leu Ala Phe
1400                 1405                 1410Gly Ser  Ala Ile His Val Val  Gln Asp Leu Val Ser  Gln Ile Ala
1415                 1420                 1425His Arg  Tyr Gln Ser Ile Asp  Ile Leu Glu Ile Gly  Leu Gly Thr
1430                 1435                 1440Gly Ile  Ala Thr Lys Arg Val  Leu Ala Ser Pro Gln  Leu Gly Phe
1445                 1450                 1455Asn Ser  Tyr Thr Cys Thr Asp  Ile Ser Ala Asp Val  Ile Gly Lys
1460                 1465                 1470Ala Arg  Glu Gln Leu Ser Glu  Phe Asp Gly Leu Met  Gln Phe Glu
1475                 1480                 1485Ala Leu  Asp Ile Asn Arg Ser  Pro Ala Glu Gln Gly  Phe Lys Pro
1490                 1495                 1500His Ser  Tyr Asp Leu Ile Ile  Ala Ser Asp Val Leu  His Ala Ser
1505                 1510                 1515Ser Asn  Phe Glu Glu Lys Leu  Ala His Ile Arg Ser  Leu Leu Lys
1520                 1525                 1530Pro Gly  Gly His Leu Val Thr  Phe Gly Val Thr His  Arg Glu Pro
1535                 1540                 1545Ala Arg  Leu Ala Phe Ile Ser  Gly Leu Phe Ala Asp  Arg Trp Thr
1550                 1555                 1560Gly Glu  Asp Glu Thr Arg Ala  Leu Ser Ala Ser Gly  Ser Val Asp
1565                 1570                 1575Gln Trp  Glu His Thr Leu Lys  Arg Val Gly Phe Ser  Gly Val Asp
1580                 1585                 1590Ser Arg  Thr Leu Asp Arg Glu  Asp Asp Leu Ile Pro  Ser Val Phe
1595                 1600                 1605Ser Thr  His Ala Val Asp Ala  Thr Val Glu Arg Leu  Tyr Asp Pro
1610                 1615                 1620Leu Ser  Ala Pro Leu Lys Asp  Ser Tyr Pro Pro Leu  Val Val Ile
1625                 1630                 1635Gly Gly  Glu Ser Thr Lys Thr  Glu Arg Ile Leu Asn  Asp Met Lys
1640                 1645                 1650Ala Ala  Leu Pro His Arg His  Ile His Ser Val Lys  Arg Leu Glu
1655                 1660                 1665Ser Val  Leu Asp Asp Pro Ala  Leu Gln Pro Lys Ser  Thr Phe Val
1670                 1675                 1680Ile Leu  Ser Glu Leu Asp Asp  Glu Val Phe Cys Asn  Leu Glu Glu
1685                 1690                 1695Asp Lys  Phe Glu Ala Val Lys  Ser Leu Leu Phe Tyr  Ala Gly Arg
1700                 1705                 1710Met Met  Trp Leu Thr Glu Asn  Ala Trp Ile Asp His  Pro His Gln
1715                 1720                 1725Ala Ser  Thr Ile Gly Met Leu  Arg Thr Ile Lys Leu  Glu Asn Pro
1730                 1735                 1740Asp Leu  Gly Thr His Val Phe  Asp Val Asp Thr Val  Glu Asn Leu
1745                 1750                 1755Asp Thr  Lys Phe Phe Val Glu  Gln Leu Leu Arg Phe  Glu Glu Ser
1760                 1765                 1770Asp Asp  Gln Leu Leu Glu Ser  Ile Thr Trp Thr His  Glu Pro Glu
1775                 1780                 1785Val Tyr  Trp Cys Lys Gly Arg  Ala Trp Val Pro Arg  Leu Lys Gln
1790                 1795                 1800Asp Ile  Ala Arg Asn Asp Arg  Met Asn Ser Ser Arg  Arg Pro Ile
1805                 1810                 1815Phe Gly  Asn Phe Asn Ser Ser  Lys Thr Ala Ile Ala  Leu Lys Glu
1820                 1825                 1830Ala Arg  Gly Ala Ser Ser Ser  Met Tyr Tyr Leu Glu  Ser Thr Glu
1835                 1840                 1845Thr Cys  Asp Ser Leu Glu Asp  Ala Arg His Ala Gly  Lys Ala Thr
1850                 1855                 1860Val Arg  Val Arg Tyr Ala Leu  Pro Gln Ala Ile Arg  Val Gly His
1865                 1870                 1875Leu Gly  Tyr Phe His Val Val  Gln Gly Ser Ile Leu  Glu Asn Thr
1880                 1885                 1890Cys Glu  Val Pro Val Val Ala  Leu Ala Glu Lys Asn  Gly Ser Ile
1895                 1900                 1905Leu His  Val Pro Arg Asn Tyr  Met His Ser Leu Pro  Asp Asn Met
1910                 1915                 1920Ala Glu  Gly Glu Asp Ser Ser  Phe Leu Leu Ser Thr  Ala Ala Ala
1925                 1930                 1935Leu Leu  Ala Glu Thr Ile Leu  Ser Ser Ala Gln Ser  Phe Gly Ser
1940                 1945                 1950Asp Ala  Ser Ile Leu Ile Met  Glu Pro Pro Ile Phe  Cys Val Lys
1955                 1960                 1965Ala Ile  Leu Glu Ser Ala Lys  Thr Tyr Gly Val Gln  Val His Leu
1970                 1975                 1980Ala Thr  Thr Leu Ser Asp Val  Lys Thr Ile Pro Ala  Pro Trp Ile
1985                 1990                 1995Arg Leu  His Ala Lys Glu Thr  Asp Ala Arg Leu Lys  His Ser Leu
2000                 2005                 2010Pro Thr  Asn Met Met Ala Phe  Phe Asp Leu Ser Thr  Asp Arg Thr
2015                 2020                 2025Ala Ala  Gly Ile Thr Asn Arg  Leu Ala Lys Leu Leu  Pro Pro Ser
2030                 2035                 2040Cys Phe  Met Tyr Ser Gly Asp  Tyr Leu Ile Arg Ser  Thr Ala Ser
2045                 2050                 2055Thr Tyr  Lys Val Ser His Val  Glu Asp Ile Pro Ile  Leu Glu His
2060                 2065                 2070Ser Val  Ala Met Ala Lys Asn  Thr Val Ser Ala Ser  Thr Val Asp
2075                 2080                 2085Asp Thr  Glu Lys Val Ile Thr  Ala Thr Gln Ile Leu  Leu Pro Gly
2090                 2095                 2100Gln Leu  Ser Val Asn His Asn  Asp Gln Arg Phe Asn  Leu Ala Thr
2105                 211                  2115Val Ile  Asp Trp Lys Glu Asn  Glu Val Ser Ala Arg  Ile Cys Pro
2120                 2125                 2130Ile Asp  Ser Gly Asn Leu Phe  Ser Asn Lys Lys Thr  Tyr Leu Leu
2135                 2140                 2145Val Gly  Leu Thr Gly Asp Leu  Gly Arg Ser Leu Cys  Arg Trp Met
2150                 2155                 2160Ile Leu  His Gly Ala Arg His  Val Val Leu Thr Ser  Arg Asn Pro
2165                 2170                 2175Arg Leu  Asp Pro Lys Trp Ile  Ala Asn Met Glu Ala  Leu Gly Gly
2180                 2185                 2190Asp Ile  Thr Val Leu Ser Met  Asp Val Ala Asn Glu  Asp Ser Val
2195                 2200                 2205Asp Ala  Gly Leu Gly Lys Leu  Val Asp Met Lys Leu  Pro Pro Val
2210                 2215                 2220Ala Gly  Ile Ala Phe Gly Pro  Leu Val Leu Gln Asp  Val Met Leu
2225                 2230                 2235Lys Asn  Met Asp His Gln Met  Met Asp Met Val Leu  Lys Pro Lys
2240                 2245                 2250Val Gln  Gly Ala Arg Ile Leu  His Glu Arg Phe Ser  Glu Gln Thr
2255                 2260                 2265Gly Ser  Lys Ala Leu Asp Phe  Phe Ile Met Phe Ser  Ser Ile Val
2270                 2275                 2280Ala Val  Ile Gly Asn Pro Gly  Gln Ser Asn Tyr Gly  Ala Ala Asn
2285                 2290                 2295Ala Tyr  Leu Gln Ala Leu Ala  Gln Gln Arg Cys Ala  Arg Gly Leu
2300                 2305                 2310Ala Gly  Ser Thr Ile Asp Ile  Gly Ala Val Tyr Gly  Val Gly Phe
2315                 2320                 2325Val Thr  Arg Ala Glu Met Glu  Glu Asp Phe Asp Ala  Ile Arg Phe
2330                 2335                 2340Met Phe  Asp Ser Val Glu Glu  His Glu Leu His Thr  Leu Phe Ala
2345                 2350                 2355Glu Ala  Val Val Ser Asp Gln  Arg Ala Arg Gln Gln  Pro Gln Arg
2360                 2365                 2370Lys Thr  Val Ile Asp Met Ala  Asp Leu Glu Leu Thr  Thr Gly Ile
2375                 2380                 2385Pro Asp  Leu Asp Pro Ala Leu  Gln Asp Arg Ile Ile  Tyr Phe Asn
2390                 2395                 2400Asp Pro  Arg Phe Gly Asn Phe  Lys Ile Pro Gly Gln  Arg Gly Asp
2405                 2410                 2415Gly Gly  Asp Asn Gly Ser Gly  Ser Lys Gly Ser Ile  Ala Asp Gln
2420                 2425                 2430Leu Lys  Gln Ala Thr Thr Leu  Asp Gln Val Arg Gln  Ile Val Ile
2435                 2440                 2445Asp Gly  Leu Ser Glu Lys Leu  Arg Val Thr Leu Gln  Val Ser Asp
2450                 2455                 2460Gly Glu  Ser Val Asp Pro Thr  Ile Pro Leu Ile Asp  Gln Gly Val
2465                 2470                 2475Asp Ser  Leu Gly Ala Val Thr  Val Gly Ser Trp Phe  Ser Lys Gln
2480                 2485                 2490Leu Tyr  Leu Asp Leu Pro Leu  Leu Arg Val Leu Gly  Gly Ala Ser
2495                 2500                 2505Val Ala  Asp Leu Ala Asp Asp  Ala Ala Thr Arg Leu  Pro Ala Thr
2510                 2515                 2520Ser Ile  Pro Leu Leu Leu Gln  Ile Gly Asp Ser Thr  Gly Thr Ser
2525                 2530                 2535Asp Ser  Gly Ala Ser Pro Thr  Pro Thr Asp Ser His  Asp Glu Ala
2540                 2545                 2550Ser Ser  Ala Thr Ser Thr Asp  Ala Ser Ser Ala Glu  Glu Asp Glu
2555                 2560                 2565Glu Gln  Glu Asp Asp Asn Glu  Gln Gly Gly Arg Lys  Ile Leu Arg
2570                 2575                 2580Arg Glu  Arg Leu Ser Leu Gly  Gln Glu Tyr Ser Trp  Arg Gln Gln
2585                 2590                 2595Gln Met  Val Lys Asp His Thr  Ile Phe Asn Asn Thr  Ile Gly Met
2600                 2605                 2610Phe Met  Lys Gly Thr Ile Asp  Leu Asp Arg Leu Arg  Arg Ala Leu
2615                 2620                 2625Lys Ala  Ser Leu Arg Arg His  Glu Ile Phe Arg Thr  Cys Phe Val
2630                 2635                 2640Thr Gly  Asp Asp Tyr Ser Ser  Asp Leu Asn Gly Pro  Val Gln Val
2645                 2650                 2655Val Leu  Lys Asn Pro Glu Asn  Arg Val His Phe Val  Gln Val Asn
2660                 2665                 2670Asn Ala  Ala Glu Ala Glu Glu  Glu Tyr Arg Lys Leu  Glu Lys Thr
2675                 2680                 2685Asn Tyr  Ser Ile Ser Thr Gly  Asp Thr Leu Arg Leu  Val Asp Phe
2690                 2695                 2700Tyr Trp  Gly Thr Asp Asp His  Leu Leu Val Ile Gly  Tyr His Arg
2705                 2710                 2715Leu Val  Gly Asp Gly Ser Thr  Thr Glu Asn Leu Phe  Asn Glu Ile
2720                 2725                 2730Gly Gln  Ile Tyr Ser Gly Val  Lys Met Gln Arg Pro  Ser Thr Gln
2735                 2740                 2745Phe Ser  Asp Leu Ala Val Gln  Gln Arg Glu Asn Leu  Glu Asn Gly
2750                 2755                 2760Arg Met  Gly Asp Asp Ile Ala  Phe Trp Lys Ser Met  His Ser Lys
2765                 2770                 2775Val Ser  Ser Ser Ala Pro Thr  Val Leu Pro Ile Met  Asn Leu Ile
2780                 2785                 2790Asn Asp  Pro Ala Ala Asn Ser  Glu Gln Gln Gln Ile  Gln Pro Phe
2795                 2800                 2805Thr Trp  Gln Gln Tyr Glu Ala  Ile Ala Arg Leu Asp  Pro Met Val
2810                 2815                 2820Ala Phe  Arg Ile Lys Glu Arg  Ser Arg Lys His Lys  Ala Thr Pro
2825                 2830                 2835Met Gln  Phe Tyr Leu Ala Ala  Tyr His Val Leu Leu  Ala Arg Leu
2840                 2845                 2850Thr Gly  Ser Lys Asp Ile Thr  Ile Gly Leu Ala Glu  Thr Asn Arg
2855                 2860                 2865Ser Thr  Met Glu Glu Ile Ser  Ala Met Gly Phe Phe  Ala Asn Val
2870                 2875                 2880Leu Pro  Leu Arg Phe Asp Glu  Phe Val Gly Ser Lys  Thr Phe Gly
2885                 2890                 2895Glu His  Leu Val Ala Thr Lys  Asp Ser Val Arg Glu  Ala Met Gln
2900                 2905                 2910His Ala  Arg Val Pro Tyr Gly  Val Ile Leu Asp Cys  Leu Gly Leu
2915                 2920                 2925Asn Leu  Pro Thr Ser Gly Glu  Glu Pro Lys Thr Gln  Thr His Ala
2930                 2935                 2940Pro Leu  Phe Gln Ala Val Phe  Asp Tyr Lys Gln Gly  Gln Ala Glu
2945                 2950                 2955Ser Gly  Ser Ile Gly Asn Ala  Lys Met Thr Ser Val  Leu Ala Ser
2960                 2965                 2970Arg Glu  Arg Thr Pro Tyr Asp  Ile Val Leu Glu Met  Trp Asp Asp
2975                 2980                 2985Pro Thr  Lys Asp Pro Leu Ile  His Val Lys Leu Gln  Ser Ser Leu
2990                 2995                 3000Tyr Gly  Pro Glu His Ala Gln  Ala Phe Val Asp His  Phe Ser Ser
3005                 3010                 3015Ile Leu  Thr Met Phe Ser Met  Asn Pro Ala Leu Lys  Leu Ala
3020                 3025                 3030<210>45<211>7692<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(7692)<400>45atg aac aat acc ccc gcc gta acc gca acc gca acc gca acc gca acc       48Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thrl               5                   10                  15gca acc gca atg gca ggc tcg gct tgc tct aac aca tcc acg ccc att       96Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
        20                  25                  30gcc ata gtt gga atg gga tgt cga ttt gct gga gat gca acg agt cca      144Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
    35                  40                  45cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tct aag      192Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50                  55                  60gtc ccc tcc tcg cga ttc aat gtg aga gga gta tac cac ccg aat ggc      240Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly65                  70                  75                  80gaa agg gtc ggg tcc acc cac gta aag ggt gga cac ttc atc gac gag      288Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
            85                  90                  95gat cct gct tta ttt gac gcc gcg ttc ttc aac atg acc aca gag gtc      336Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
        100                 105                 110gcc agc tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac      384Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
    115                 120                 125gaa tcg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tct      432Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130                 135                 140aat acg tcg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat tcg      480Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser145                 150                 155                 160ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac      528Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
            165                 170                 175tca gga aca atg ctt tcg aac cgg ata tca cac ttc tac gac tta cgt      576Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
        180                 185                 190ggt ccc agc gtg acg gtt gac acg gcc tgt tcg acg aca ttg acc gca      624Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
    195                 200                 205ctg cac ttg gcg tgc cag agc tta cgt act ggg gag tca gat aca gcc      672Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210                 215                 220atc gtt atc ggt gca aat ctt ctg ctc aat ccc gat gtt ttt gtt acg      720Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr225                 230                 235                 240atg tca aac ctg gga ttt ttg tcc ccg gat ggt atc tcg tac tct ttt      768Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
            245                 250                 255gat cct cga gcg aat gga tat ggt cgc ggg gaa gga att gcc gct ctg      816Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
        260                 265                 270gta ata aag gcc ctc cct aac gcg ttg cga gac caa gac cct atc cga      864Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
    275                 280                 285gcc gtc att cga gag aca gcg ctg aac cag gat ggc aaa aca ccc gca      912Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290                 295                 300att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt      960Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys305                 310                 315                 320tac gat aag gct ggg cta gat atg tcg ttg acc tcg tac gtg gag gcc     1008Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
            325                 330                 335cac gga act gga aca cca act ggt gac ccc ctt gaa atc tca gca att     1056His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
        340                 345                 350tca gca gct ttt aaa gga cat cct ctg cac ctt ggc tct gtg aaa gca     1104Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
    355                 360                 365aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag     1152Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370                 375                 380gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc     1200Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe385                 390                 395                 400ctg caa aag aac agc aag ctg atg ctt gac caa aag aac atc aag atc     1248Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
            405                 410                 415ccc atg tct gct caa gac tgg cct gtg aaa gat ggg act cgt cgc gca     1296Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
        420                 425                 430tct gtc aat aac ttc ggc ttt ggt ggt tcg aat gct cac gtc att ttg     1344Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
    435                 440                 445gaa tca tat gat cgc gca tca ttg gcc ctg cca gag gat caa gtg cat     1392Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450                 455                 460gtc aat ggt aac tct gag cat ggt agg gtt gag gat ggt tcc aaa cag     1440Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln465                 470                 475                 480agc cgc ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg cga     1488Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
            485                 490                 495acg ata gca agc ctg cga gac tac att aaa tcc gtc gct gac att gac     1536Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
        500                 505                 510ggg gaa ccc ttc ctc gcc agc ctc gcc tat aca cta ggc tct cgc cgt     1584Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
    515                 520                 525tcc att ctg cca tgg acg tca gtg tat gta gca gac agc ctt ggc ggc     1632Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530                 535                 540ctt gtt tct gcc ctc agc gat gag tcc aat caa cca aaa cga gcg aat     1680Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn545                 550                 555                 560gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg     1728Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
            565                 570                 575cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag     1776His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
        580                 585                 590gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg     1824Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
    595                 600                 605aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat     1872Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610                 615                 620gat gcc gaa tac agt cta cca ctg tca acc gct atc caa att gca ctt     1920Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu625                 630                 635                 640gtg cgt ctc ctt tgg tca tgg gga att cgg cca acg ggg ata acc agt     1968Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
            645                 650                 655cac tca agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc     2016His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
        660                 665                 670gcg cgg tcg gcc att ggg atc act tat ata cgc ggt gta ttg acc act     2064Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
    675                 680                 685aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt     2112Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690                 695                 700ctt ggt cgc agt gag acc aat gtt tac att tcg cgt ctc aac cag gag     2160Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu705                 710                 715                 720gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg     2208Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
            725                 730                 735gtg tcg gga gat ttg ggt gca atc gag aaa ctt gaa aag ttg tta cac     2256Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
        740                 745                 750gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat     2304Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
    755                 760                 765tca agc cac atg cga cca atg gca gat gcc ttt ggg gcg tca ctg aga     2352Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770                 775                 780gat ctg ttc aac tcg gat aac aac aac gac aat ccc aat gct gac acc     2400Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr785                 790                 795                 800tca aag ggt gta tta tat tca tca cct aag act ggt agt cgc atg acc     2448Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
            805                 810                 815gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta     2496Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
        820                 825                 830cag ccg gta gag ttc gag tcc tca ctc cgc gag atg tgc ttt gat ccc     2544Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
    835                 840                 845aac acc aaa gag aaa gcc gtc gat gtg att att gaa ata ggg cct cac     2592Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850                 855                 860gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg     2640Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu865                 870                 875                 880aaa gga aca gat ata aac tat ctc agt tgc ctt tct cgc ggc aga agc     2688Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
            885                 890                 895tcg ttg gag aca atg tat cgt gct gct acg gag ttg ata agc aag ggt     2736Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
        900                 905                 910tat ggg ctc aaa atg gac gct ata aac ttt cct cat gga aga aaa gag     2784Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
    915                 920                 925ccc aga gtg aag gta ctg agc gat ttg ccg gcg tac ccg tgg aat cac     2832Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930                 935                 940caa acc cgt tat tgg aga gag cct cgc ggc agt cgt gag tcc aaa cag     2880Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln945                 950                 955                 960aga acc cat ccg cct cac act ttg ata ggc tca cgg gaa tct ctc tct     2928Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
            965                 970                 975cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tca gat att     2976Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
        980                 985                 990cca tgg ata cga gat cac gtc gtt  ggt tcg agc atc atc  ttt ccg gga   3024Pro Trp Ile Arg Asp His Val Val  Gly Ser Ser Ile Ile  Phe Pro Gly
    995                 1000                 1005gct ggc  ttc atc agc atg gcc  atc gag ggg ttt tca  caa gtc tgc      3069Ala Gly  Phe Ile Ser Met Ala  Ile Glu Gly Phe Ser  Gln Val Cys
1010                 1015                 1020cca cca  gtt gcg ggg gct agc  atc aac tac aac ttg  cgt gac gtt      3114Pro Pro  Val Ala Gly Ala Ser  Ile Asn Tyr Asn Leu  Arg Asp Val
1025                 1030                 1035gaa ctc  gcg cag gct ctc ata  ata ccc gct gat gca  gaa gca gag      3159Glu Leu  Ala Gln Ala Leu Ile  Ile Pro Ala Asp Ala  Glu Ala Glu
1040                 1045                 1050gtt gac  ctg cgc cta acg atc  cgt tca tgt gag gaa  agg tcc ctc      3204Val Asp  Leu Arg Leu Thr Ile  Arg Ser Cys Glu Glu  Arg Ser Leu
1055                 1060                 1065ggc aca  aag aac tgg cat caa  ttt tct gtg cac tca  att tcg ggc      3249Gly Thr  Lys Asn Trp His Gln  Phe Ser Val His Ser  Ile Ser Gly
1070                 1075                 1080gaa aat  aat acc tgg aca gaa  cac tgc acc gga tta  ata cgt tcg      3294Glu Asn  Asn Thr Trp Thr Glu  His Cys Thr Gly Leu  Ile Arg Ser
1085                 1090                 1095gag agc  gaa aga agc cac ctt  gac tgt tca act gtg  gaa gcc tca      3339Glu Ser  Glu Arg Ser His Leu  Asp Cys Ser Thr Val  Glu Ala Ser
1100                 1105                 1110cgc agg  ttg aat cta ggc tca  gat aac cgg agc att  gat ccc aac      3384Arg Arg  Leu Asn Leu Gly Ser  Asp Asn Arg Ser Ile  Asp Pro Asn
1115                 1120                 1125gat ctc  tgg gag tcc tta cac  gcg aat ggg ata tgc  cac gga ccc      3429Asp Leu  Trp Glu Ser Leu His  Ala Asn Gly Ile Cys  His Gly Pro
1130                 1135                 1140att ttt  cag aac att cag cga  att caa aac aat gga  cag ggc tcg      3474Ile Phe  Gln Asn Ile Gln Arg  Ile Gln Asn Asn Gly  Gln Gly Ser
1145                 1150                 1155ttt tgc  aga ttt tcc att gct  gac act gcc tcg gct  atg cct cac      3519Phe Cys  Arg Phe Ser Ile Ala  Asp Thr Ala Ser Ala  Met Pro His
1160                 1165                 1170tcg tac  gag aat cga cac atc  gtc cat cct act act  ctg gac tcg      3564Ser Tyr  Glu Asn Arg His Ile  Val His Pro Thr Thr  Leu Asp Ser
1175                 1180                 1185gtg atc  cag gcg gca tac acg  gtg tta ccc tac gcg  gga aca cgt      3609Val Ile  Gln Ala Ala Tyr Thr  Val Leu Pro Tyr Ala  Gly Thr Arg
1190                 1195                 1200atg aaa  acg gcc atg gta cca  agg agg cta aga aat  gtc aaa ata      3654Met Lys  Thr Ala Met Val Pro  Arg Arg Leu Arg Asn  Val Lys Ile
1205                 1210                 1215tcc tct  agc ctg gct gac ttg  gag gct ggt gat gct  ctg gac gca      3699Ser Ser  Ser Leu Ala Asp Leu  Glu Ala Gly Asp Ala  Leu Asp Ala
1220                 1225                 1230cag gcc  agc atc aag gat cgc  aac tct caa tcc ttc  tct acc gac      3744Gln Ala  Ser Ile Lys Asp Arg  Asn Ser Gln Ser Phe  Ser Thr Asp
1235                 1240                 1245ttg gca  gtg ttt gat gac tat  gat agc ggt tct tct  ccc tcg gac      3789Leu Ala  Val Phe Asp Asp Tyr  Asp Ser Gly Ser Ser  Pro Ser Asp
1250                 1255                 1260gga atc  cca gtc ata gag att  gaa ggc ctt gtt ttc  cag tcg gtt      3834Gly Ile  Pro Val Ile Glu Ile  Glu Gly Leu Val Phe  Gln Ser Val
1265                 1270                 1275gga agc  agc ttc tct gac caa  aag tca gac tcc aac  gac aca gaa      3879Gly Ser  Ser Phe Ser Asp Gln  Lys Ser Asp Ser Asn  Asp Thr Glu
1280                 1285                 1290aat gcc  tgc agc tcc tgg gtt  tgg gcc cct gac atc  agc ttg ggt      3924Asn Ala  Cys Ser Ser Trp Val  Trp Ala Pro Asp Ile  Ser Leu Gly
1295                 1300                 1305gac tcc  act tgg ctc aaa gaa  aag ttg agc act gag  gct gag acg      3969Asp Ser  Thr Trp Leu Lys Glu  Lys Leu Ser Thr Glu  Ala Glu Thr
1310                 1315                 1320aaa gaa  acg gaa ctc atg atg  gac ctc cga aga tgc  acg atc aac      4014Lys Glu  Thr Glu Leu Met Met  Asp Leu Arg Arg Cys  Thr Ile Asn
1325                 1330                 1335ttt ata  cag gag gct gtc act  gat ttg aca aat tct  gat atc caa      4059Phe Ile  Gln Glu Ala Val Thr  Asp Leu Thr Asn Ser  Asp Ile Gln
1340                 1345                 1350cat ctg  gat ggc cac ctt cag  aag tat ttc gat tgg  atg aat gtc      4104His Leu  Asp Gly His Leu Gln  Lys Tyr Phe Asp Trp  Met Asn Val
1355                 1360                 1365caa ttg  gac ctt gcg aga caa  aac aag ctc agc cca  gcc agt tgc      4149Gln Leu  Asp Leu Ala Arg Gln  Asn Lys Leu 8er Pro  Ala Ser Cys
1370                 1375                 1380gac tgg  cta agt gac gat gct  gag cag aag aaa tgc  cta cag gcc      4194Asp Trp  Leu Ser Asp Asp Ala  Glu Gln Lys Lys Cys  Leu Gln Ala
1385                 1390                 1395aga gtc  gct gga gaa agc gtc  aat ggc gag atg att  tct cgt cta      4239Arg Val  Ala Gly Glu Ser Val  Asn Gly Glu Met Ile  Ser Arg Leu
1400                 1405                 1410gga cct  cag tta ata gca atg  cta cgc cgc gaa aca  gag cca ctt      4284Gly Pro  Gln Leu Ile Ala Met  Leu Arg Arg Glu Thr  Glu Pro Leu
1415                 1420                 1425gag ttg  atg atg caa gat cag  ctg cta agc aga tac  tac gtc aac      4329Glu Leu  Met Met Gln Asp Gln  Leu Leu Ser Arg Tyr  Tyr Val Asn
1430                 1435                 1440gca atc  aaa tgg agc cga tca  aac gca caa gcc agc  gag ctg atc      4374Ala Ile  Lys Trp Ser Arg Ser  Asn Ala Gln Ala Ser  Glu Leu Ile
1445                 1450                 1455cga ctt  tgc gcc cac aag aac  ccg cgt tct cgc att  ttg gag att      4419Arg Leu  Cys Ala His Lys Asn  Pro Arg Ser Arg Ile  Leu Glu Ile
1460                 1465                 1470ggc gga  ggc acg ggc ggc tgc  aca aag ctt att gtc  aat gca ttg      4464Gly Gly  Gly Thr Gly Gly Cys  Thr Lys Leu Ile Val  Asn Ala Leu
1475                 1480                 1485gga aac  acc aag ccg atc gat  cgt tat gac ttc acc  gat gtg tct      4509Gly Asn  Thr Lys Pro Ile Asp  Arg Tyr Asp Phe Thr  Asp Val Ser
1490                 1495                 1500gcc ggg  ttt ttc gag tcg gcg  cgt gag caa ttt gcg  gat tgg caa      4554Ala Gly  Phe Phe Glu Ser Ala  Arg Glu Gln Phe Ala  Asp Trp Gln
1505                 1510                 1515gac gtg  atg act ttc aaa aaa  ttg gat att gaa agc  gat ccc gag      4599Asp Val  Met Thr Phe Lys Lys  Leu Asp Ile Glu Ser  Asp Pro Glu
1520                 1525                 1530caa caa  ggg ttt gaa tgt gcc  acc tac gat gtg gtc  gtg gct tgc      4644Gln Gln  Gly Phe Glu Cys Ala  Thr Tyr Asp Val Val  Val Ala Cys
1535                 1540                 1545cag gtc  ctg cat gca act cga  tgc atg aaa cga aca  ctg agt aac      4689Gln Val  Leu His Ala Thr Arg  Cys Met Lys Arg Thr  Leu Ser Asn
1550                 1555                 1560gtt cga  aaa ttg ctc aag cct  ggg ggc aac ttg att  ttg gtt gag      4734Val Arg  Lys Leu Leu Lys Pro  Gly Gly Asn Leu Ile  Leu Val Glu
1565                 1570                 1575act acc  agg gat cag ctc gat  ttg ttc ttt acc ttc  gga ctg ttg      4779Thr Thr  Arg Asp Gln Leu Asp  Leu Phe Phe Thr Phe  Gly Leu Leu
1580                 1585                 1590cca ggt  tgg tgg ctc agt gag  gag cct gag cgg aag  tcg acg cca      4824Pro Gly  Trp Trp Leu Ser Glu  Glu Pro Glu Arg Lys  Ser Thr Pro
1595                 1600                 1605tcg ctc  act acc gat ctt tgg  aac acc atg ttg gac  acg agc ggt      4869Ser Leu  Thr Thr Asp Leu Trp  Asn Thr Met Leu Asp  Thr Ser Gly
1610                 1615                 1620ttc aac  ggt gtg gaa ttg gag  gtt cgt gat tgt gaa  gac gat gag      4914Phe Asn  Gly Val Glu Leu Glu  Val Arg Asp Cys Glu  Asp Asp Glu
1625                 1630                 1635ttt tac  atg atc agc aca atg  cta tcg acg gct aga  aaa gag aat      4959Phe Tyr  Met Ile Ser Thr Met  Leu Ser Thr Ala Arg  Lys Glu Asn
1640                 1645                 1650aca acc  ccg gat aca gtg gca  gaa tcg gag gtg ctt  ttg ctg cac      5004Thr Thr  Pro Asp Thr Val Ala  Glu Ser Glu Val Leu  Leu Leu His
1655                 1660                 1665gga gcg  ctc cga cct cct tca  tct tgg ctg gaa agt  ctc cag gca      5049Gly Ala  Leu Arg Pro Pro Ser  Ser Trp Leu Glu Ser  Leu Gln Ala
1670                 1675                 1680gca att  tgt gaa aag acc agt  tct agc cca tcg atc  aac gct ctg      5094Ala Ile  Cys Glu Lys Thr Ser  Ser Ser Pro Ser Ile  Asn Ala Leu
1685                 1690                 1695ggc gag  gta gat acc act gga  agg aca tgc att ttt  ctt ggg gaa      5139Gly Glu  Val Asp Thr Thr Gly  Arg Thr Cys Ile Phe  Leu Gly Glu
1700                 1705                 1710atg gag  tcc tcg ctc ctt gga  gag gtg gga agc gag  acc ttc aaa      5184Met Glu  Ser Ser Leu Leu Gly  Glu Val Gly Ser Glu  Thr Phe Lys
1715                 1720                 1725tcc atc  acc gcg atg ctg aat  aac tgc aac gca ctt  ctc tgg gtg      5229Ser Ile  Thr Ala Met Leu Asn  Asn Cys Asn Ala Leu  Leu Trp Val
1730                 1735                 1740tct aga  gga gca gcc atg agc  tcc gag gat cca tgg  aaa gct cta      5274Ser Arg  Gly Ala Ala Met Ser  Ser Glu Asp Pro Trp  Lys Ala Leu
1745                 1750                 1755cat att  ggt ctg ctg cgt acc  atc cgc aac gaa aat  aac ggg aag      5319His Ile  Gly Leu Leu Arg Thr  Ile Arg Asn Glu Asn  Asn Gly Lys
1760                 1765                 1770gaa tat  gta tcg ttg gat ctc  gat cct tct cga aac  gca tac acc      5364Glu Tyr  Val Ser Leu Asp Leu  Asp Pro Ser Arg Asn  Ala Tyr Thr
1775                 1780                 1785cac gag  tcc ctg tat gct atc  tgc aat atc ttc aat  ggc cgc ctc      5409His Glu  Ser Leu Tyr Ala Ile  Cys Asn Ile Phe Asn  Gly Arg Leu
1790                 1795                 1800ggc gac  ctt tcc gaa gac aag  gag ttt gaa ttt gca  gag aga aac      5454Gly Asp  Leu Ser Glu Asp Lys  Glu Phe Glu Phe Ala  Glu Arg Asn
1805                 1810                 1815ggc gtc  atc cac gta ccg cga  ctt ttc aat gac ccg  cac tgg aag      5499Gly Val  Ile His Val Pro Arg  Leu Phe Asn Asp Pro  His Trp Lys
1820                 1825                 1830gac caa  gaa gcg gtt gag gtc  aca ctg cag ccg ttc  gag caa ccc      5544Asp Gln  Glu Ala Val Glu Val  Thr Leu Gln Pro Phe  Glu Gln Pro
1835                 1840                 1845ggg cgt  cgt ctg cgg atg gag  gtt gag acg cca ggg  ctc tta gac      5589Gly Arg  Arg Leu Arg Met Glu  Val Glu Thr Pro Gly  Leu Leu Asp
1850                 1855                 1860tcc ctg  caa ttt cga gac gac  gaa gga cgt gaa ggc  aag gat ctt      5634Ser Leu  Gln Phe Arg Asp Asp  Glu Gly Arg Glu Gly  Lys Asp Leu
1865                 1870                 1875ccg gat  gat tgg gta gaa atc  gaa ccc aaa gct ttc  ggt ctc aat      5679Pro Asp  Asp Trp Val Glu Ile  Glu Pro Lys Ala Phe  Gly Leu Asn
1880                 1885                 1890ttt cgg  gat gtc atg gtt gcc  atg ggt caa ttg gag  gcc aac cgt      5724Phe Arg  Asp Val Met Val Ala  Met Gly Gln Leu Glu  Ala Asn Arg
1895                 1900                 1905gtg atg  ggc ttc gaa tgc gcc  gga gtg atc aca aag  ctc ggt gga      5769Val Met  Gly Phe Glu Cys Ala  Gly Val Ile Thr Lys  Leu Gly Gly
1910                 1915                 1920gct gct  gcc gct agc caa ggc  ctc aga tta ggg gac  cgc gta tgt      5814Ala Ala  Ala Ala Ser Gln Gly  Leu Arg Leu Gly Asp  Arg Val Cys
1925                 1930                 1935gca cta  ctg aaa ggc cat tgg  gcg acc aga aca cag  acg ccg tac      5859Ala Leu  Leu Lys Gly His Trp  Ala Thr Arg Thr Gln  Thr Pro Tyr
1940                 1945                 1950act aat  gtc gtc cgt att ccg  gac gaa atg ggc ttc  cca gaa gcc      5904Thr Asn  Val Val Arg Ile Pro  Asp Glu Met Gly Phe  Pro Glu Ala
1955                 1960                 1965gct tcg  gtc ccc ctg gct ttc  act acc gca tat att  gcg ctt tat      5949Ala Ser  Val Pro Leu Ala Phe  Thr Thr Ala Tyr Ile  Ala Leu Tyr
1970                 1975                 1980acc acg  gca aag cta cga cga  ggc gaa aga gtc ttg  atc cac agt      5994Thr Thr  Ala Lys Leu Arg Arg  Gly Glu Arg Val Leu  Ile His Ser
1985                 1990                 1995gga gct  gga ggc gtc ggt caa  gca gcg atc att ttg  tcc cag ctt      6039Gly Ala  Gly Gly Val Gly Gln  Ala Ala Ile Ile Leu  Ser Gln Leu
2000                 2005                 2010gcg ggt  gcc gag gtc ttc gtc  aca gcg gga act caa  gcc aag cgt      6084Ala Gly  Ala Glu Val Phe Val  Thr Ala Gly Thr Gln  Ala Lys Arg
2015                 2020                 2025gac ttt  gtc ggc gat aaa ttc  ggc atc aat ccg gat  cat atc ttc      6129Asp Phe  Val Gly Asp Lys Phe  Gly Ile Asn Pro Asp  His Ile Phe
2030                 2035                 2040tcg agc  agg aat gac tta ttc  gtc gac ggc atc aaa  gcc tac acg      6174Ser Ser  Arg Asn Asp Leu Phe  Val Asp Gly Ile Lys  Ala Tyr Thr
2045                 2050                 2055ggc gga  ctt ggc gtt cat gtc  gtt cta aac tca ttg  gca ggt caa      6219Gly Gly  Leu Gly Val His Val  Val Leu Asn Ser Leu  Ala Gly Gln
2060                 2065                 2070ctc ctc  caa gca agc ttt gac  tgc atg gcc gaa ttc  ggc aga ttt      6264Leu Leu  Gln Ala Ser Phe Asp  Cys Met Ala Glu Phe  Gly Arg Phe
2075                 2080                 2085gtt gag  att gga aaa aag gac  ctg gag caa aac agc  aga ctt gac      6309Val Glu  Ile Gly Lys Lys Asp  Leu Glu Gln Asn Ser  Arg Leu Asp
2090                 2095                 2100atg ctg  cca ttc acc cgg gac  gtc tct ttc aca tca  att gat ctt      6354Met Leu  Pro Phe Thr Arg Asp  Val Ser Phe Thr Ser  Ile Asp Leu
2105                 2110                 2115ctc tcg  tgg caa aga gcc aaa  agt gaa gaa gta tcc  gaa gcg ttg      6399Leu Ser  Trp Gln Arg Ala Lys  Ser Glu Glu Val Ser  Glu Ala Leu
2120                 2125                 2130aac cat  gtc aca aaa ctc ctc  gag aca aaa gcg att  ggc ttg att      6444Asn His  Val Thr Lys Leu Leu  Glu Thr Lys Ala Ile  Gly Leu Ile
2135                 2140                 2145ggt cca  atc cag cag cac tcc  ttg tca aac atc gag  aag gcc ttc      6489Gly Pro  Ile Gln Gln His Ser  Leu Ser Asn Ile Glu  Lys Ala Phe
2150                 2155                 2160cgt acg  atg cag agt ggt cag  cat gtt ggc aaa gtt  gtg gtc aat      6534Arg Thr  Met Gln Ser Gly Gln  His Val Gly Lys Val  Val Val Asn
2165                 2170                 2175gta tct  ggg gac gaa ctg gtc  cca gtc ggc gat gga  ggg ttc tcg      6579Val Ser  Gly Asp Glu Leu Val  Pro Val Gly Asp Gly  Gly Phe Ser
2180                 2185                 2190ctg aag  ctg aag cct gac agt  tct tac cta gtt gct  ggt ggg ctg      6624Leu Lys  Leu Lys Pro Asp Ser  Ser Tyr Leu Val Ala  Gly Gly Leu
2195                 2200                 2205ggg gga  att gga aag cag atc  tgt cag tgg ctt gtt  gat cat ggc      6669Gly Gly  Ile Gly Lys Gln Ile  Cys Gln Trp Leu Val  Asp His Gly
2210                 2215                 2220gcg aag  cac ttg att atc cta  tcg aga agt gca aag  gcc agt cca      6714Ala Lys  His Leu Ile Ile Leu  Ser Arg Ser Ala Lys  Ala Ser Pro
2225                 2230                 2235ttc ata  acc agc ttg caa aat  caa cag tgc gct gtc  tat cta cac      6759Phe Ile  Thr Ser Leu Gln Asn  Gln Gln Cys Ala Val  Tyr Leu His
2240                 2245                 2250gca tgt  gac atc tca gat caa  gat cag gtc acc aag  gtg ctc cgg      6804Ala Cys  Asp Ile Ser Asp Gln  Asp Gln Val Thr Lys  Val Leu Arg
2255                 2260                 2265ttg tgc  gaa gaa gca cat gca  ccg cca att cga ggt  atc ata caa      6849Leu Cys  Glu Glu Ala His Ala  Pro Pro Ile Arg Gly  Ile Ile Gln
2270                 2275                 2280ggt gcc  atg gtt ctc aag gac  gcg ctt cta tcg cga  atg aca ttg      6894Gly Ala  Met Val Leu Lys Asp  Ala Leu Leu Ser Arg  Met Thr Leu
2285                 2290                 2295gat gaa  ttt aat gca gca aca  cgc cca aaa gta cag  ggt agt tgg      6939Asp Glu  Phe Asn Ala Ala Thr  Arg Pro Lys Val Gln  Gly Ser Trp
2300                 2305                 2310tat ctt  cac aag atc gca cag  gat gtt gac ttc ttc  gtg atg ctc      6984Tyr Leu  His Lys Ile Ala Gln  Asp Val Asp Phe Phe  Val Met Leu
2315                 2320                 2325tca tcc  ctt gtt ggg gtc atg  ggt ggg gca ggc cag  gcc aat tac      7029Ser Ser  Leu Val Gly Val Met  Gly Gly Ala Gly Gln  Ala Asn Tyr
2330                 2335                 2340gca gct  gct ggt gca ttc cag  gac gca ctt gcg cac  cac cgg aga      7074Ala Ala  Ala Gly Ala Phe Gln  Asp Ala Leu Ala His  His Arg Arg
2345                 2350                 2355gcc cat  ggc atg ccg gct gtc  acc att gac ttg ggc  atg gtc aag      7119Ala His  Gly Met Pro Ala Val  Thr Ile Asp Leu Gly  Met Val Lys
2360                 2365                 2370tct gtt  gga tac gtg gct gaa  act ggc cgt ggt gtg  gcc gac cgg      7164Ser Val  Gly Tyr Val Ala Glu  Thr Gly Arg Gly Val  Ala Asp Arg
2375                 2380                 2385ctc gct  aga ata ggt tac aag  cct atg cat gaa aag  gac gtc atg      7209Leu Ala  Arg Ile Gly Tyr Lys  Pro Met His Glu Lys  Asp Val Met
2390                 2395                 2400gat gtg  ttg gag aag gca atc  ctg tgt tct tcc cct  caa ttt cca      7254Asp Val  Leu Glu Lys Ala Ile  Leu Cys Ser Ser Pro  Gln Phe Pro
2405                 2410                 2415tca cct  ccc gca gct gtg gtt  aca gga atc aac aca  tcc ccg ggt      7299Ser Pro  Pro Ala Ala Val Val  Thr Gly Ile Asn Thr  Ser Pro Gly
2420                 2425                 2430gct cac  tgg acc gag gca aac  tgg ata cag gaa cag  cgg ttt gtg      7344Ala His  Trp Thr Glu Ala Asn  Trp Ile Gln Glu Gln  Arg Phe Val
2435                 2440                 2445gga ctt  aaa tac cgc caa gtc  ctt cat gca gac caa  tcc ttt gtc      7389Gly Leu  Lys Tyr Arg Gln Val  Leu His Ala Asp Gln  Ser Phe Val
2450                 2455                 2460tct tcg  cat aaa aaa gga cca  gat ggc gtg cgg gcc  caa cta agc      7434Ser Ser  His Lys Lys Gly Pro  Asp Gly Val Arg Ala  Gln Leu Ser
2465                 2470                 2475agg gtc  acc tct cac gac gag  gcc att tct atc gtc  ctc aaa gca      7479Arg Val  Thr Ser His Asp Glu  Ala Ile Ser Ile Val  Leu Lys Ala
2480                 2485                 2490atg acg  gaa aag ctg atg cga  atg ttt ggt ctg gca  gaa gac gac      7524Met Thr  Glu Lys Leu Met Arg  Met Phe Gly Leu Ala  Glu Asp Asp
2495                 2500                 2505atg tcc  tcg tcc aaa aac ctg  gca ggt gtc ggc gta  gac tca ctc      7569Met Ser  Ser Ser Lys Asn Leu  Ala Gly Val Gly Val  Asp Ser Leu
2510                 2515                 2520gtc gcc  att gaa ctt cga aac  tgg atc aca tct gaa  atc cat gtt      7614Val Ala  Ile Glu Leu Arg Asn  Trp Ile Thr Ser Glu  Ile His Val
2525                 2530                 2535gat gtg  tcg atc ttt gag ctc  atg aat ggt aac acc  atc gcc ggc      7659Asp Val  Ser Ile Phe Glu Leu  Met Asn Gly Asn Thr  Ile Ala Gly
2540                 2545                 2550ctc gtc  gag tta gtt gtg gcg  aaa tgc agt taa                       7692Leu Val  Glu Leu Val Val Ala  Lys Cys Ser
 2555                2560<210>46<211>2563<212>PRT<213>柑桔青霉<400>    46Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr1               5                   10                  15Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
        20                  25                  30Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
    35                  40                  45Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50                  55                  60Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly65                  70                  75                  80Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
            85                  90                  95Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
        100                 105                 110Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
    115                 120                 125Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130                 135                 140Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser145                 150                 155                 160Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
            165                 170                 175Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
        180                 185                 190Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
    195                 200                 205Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210                 215                 220Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr225                 230                 235                 240Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
            245                 250                 255Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
        260                 265                 270Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
    275                 280                 285Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290                 295                 300Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys305                 310                 315                 320Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
            325                 330                 335His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
        340                 345                 350Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
    355                 360                 365Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370                 375                 380Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe385                 390                 395                 400Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
            405                 410                 415Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
        420                 425                 430Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
    435                 440                 445Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450                 455                 460Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln465                 470                 475                 480Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
            485                 490                 495Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
        500                 505                 510Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
    515                 520                 525Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530                 535                 540Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn545                 550                 555                 560Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
            565                 570                 575His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
        580                 585                 590Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
    595                 600                 605Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610                 615                 620Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu625                 630                 635                 640Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
            645                 650                 655His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
        660                 665                 670Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
    675                 680                 685Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690                 695                 700Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu705                 710                 715                 720Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
            725                 730                 735Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
        740                 745                 750Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
    755                 760                 765Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770                 775                 780Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr785                 790                 795                 800Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
            805                 810                 815Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
        820                 825                 830Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
    835                 840                 845Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850                 855                 860Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu865                 870                 875                 880Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
            885                 890                 895Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
        900                 905                 910Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
    915                 920                 925Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930                 935                 940Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln945                 950                 955                 960Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
            965                 970                 975Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
        980                 985                 990Pro Trp Ile Arg Asp His Val Val  Gly Ser Ser Ile Ile  Phe Pro Gly
    995                 1000                 1005Ala Gly  Phe Ile Ser Met Ala  Ile Glu Gly Phe Ser  Gln Val Cys
1010                 1015                 1020Pro Pro  Val Ala Gly Ala Ser  Ile Asn Tyr Asn Leu  Arg Asp Val
1025                 1030                 1035Glu Leu  Ala Gln Ala Leu Ile  Ile Pro Ala Asp Ala  Glu Ala Glu
1040                 1045                 1050Val Asp  Leu Arg Leu Thr Ile  Arg Ser Cys Glu Glu  Arg Ser Leu
1055                 1060                 1065Gly Thr  Lys Asn Trp His Gln  Phe Ser Val His Ser  Ile Ser Gly
1070                 1075                 1080Glu Asn  Asn Thr Trp Thr Glu  His Cys Thr Gly Leu  Ile Arg Ser
1085                 1090                 1095Glu Ser  Glu Arg Ser His Leu  Asp Cys Ser Thr Val  Glu Ala Ser
1100                 1105                 1110Arg Arg  Leu Asn Leu Gly Ser  Asp Asn Arg Ser Ile  Asp Pro Asn
1115                 1120                 1125Asp Leu  Trp Glu Ser Leu His  Ala Asn Gly Ile Cys  His Gly Pro
1130                 1135                 1140Ile Phe  Gln Asn Ile Gln Arg  Ile Gln Asn Asn Gly  Gln Gly Ser
1145                 1150                 1155Phe Cys  Arg Phe Ser Ile Ala  Asp Thr Ala Ser Ala  Met Pro His
1160                 1165                 1170Ser Tyr  Glu Asn Arg His Ile  Val His Pro Thr Thr  Leu Asp Ser
1175                 1180                 1185Val Ile  Gln Ala Ala Tyr Thr  Val Leu Pro Tyr Ala  Gly Thr Arg
1190                 1195                 1200Met Lys  Thr Ala Met Val Pro  Arg Arg Leu Arg Asn  Val Lys Ile
1205                 1210                 1215Ser Ser  Ser Leu Ala Asp Leu  Glu Ala Gly Asp Ala  Leu Asp Ala
1220                 1225                 1230Gln Ala  Ser Ile Lys Asp Arg  Asn Ser Gln Ser Phe  Ser Thr Asp
1235                 1240                 1245Leu Ala  Val Phe Asp Asp Tyr  Asp Ser Gly Ser Ser  Pro Ser Asp
1250                 1255                 1260Gly Ile  Pro Val Ile Glu Ile  Glu Gly Leu Val Phe  Gln Ser Val
1265                 1270                 1275Gly Ser  Ser Phe Ser Asp Gln  Lys Ser Asp Ser Asn  Asp Thr Glu
1280                 1285                 1290Asn Ala  Cys Ser Ser Trp Val  Trp Ala Pro Asp Ile  Ser Leu Gly
1295                 1300                 1305Asp Ser  Thr Trp Leu Lys Glu  Lys Leu Ser Thr Glu  Ala Glu Thr
1310                 1315                 1320Lys Glu  Thr Glu Leu Met Met  Asp Leu Arg Arg Cys  Thr Ile Asn
1325                 1330                 1335Phe Ile  Gln Glu Ala Val Thr  Asp Leu Thr Asn Ser  Asp Ile Gln
1340                 1345                 1350His Leu  Asp Gly His Leu Gln  Lys Tyr Phe Asp Trp  Met Asn Val
1355                 1360                 1365Gln Leu  Asp Leu Ala Arg Gln  Asn Lys Leu Ser Pro  Ala Ser Cys
1370                 1375                 1380Asp Trp  Leu Ser Asp Asp Ala  Glu Gln Lys Lys Cys  Leu Gln Ala
1385                 1390                 1395Arg Val  Ala Gly Glu Ser Val  Asn Gly Glu Met Ile  Ser Arg Leu
1400                 1405                 1410Gly Pro  Gln Leu Ile Ala Met  Leu Arg Arg Glu Thr  Glu Pro Leu
1415                 1420                 1425Glu Leu  Met Met Gln Asp Gln  Leu Leu Ser Arg Tyr  Tyr Val Asn
1430                 1435                 1440Ala Ile  Lys Trp Ser Arg Ser  Asn Ala Gln Ala Ser  Glu Leu Ile
1445                 1450                 1455Arg Leu  Cys Ala His Lys Asn  Pro Arg Ser Arg Ile  Leu Glu Ile
1460                 1465                 1470Gly Gly  Gly Thr Gly Gly Cys  Thr Lys Leu Ile Val  Asn Ala Leu
1475                 1480                 1485Gly Asn  Thr Lys Pro Ile Asp  Arg Tyr Asp Phe Thr  Asp Val Ser
1490                 1495                 1500Ala Gly  Phe Phe Glu Ser Ala  Arg Glu Gln Phe Ala  Asp Trp Gln
1505                 1510                 1515Asp Val  Met Thr Phe Lys Lys  Leu Asp Ile Glu Ser  Asp Pro Glu
1520                 1525                 1530Gln Gln  Gly Phe Glu Cys Ala  Thr Tyr Asp Val Val  Val Ala Cys
1535                 1540                 1545Gln Val  Leu His Ala Thr Arg  Cys Met Lys Arg Thr  Leu Ser Asn
1550                 1555                 1560Val Arg  Lys Leu Leu Lys Pro  Gly Gly Asn Leu Ile  Leu Val Glu
1565                 1570                 1575Thr Thr  Arg Asp Gln Leu Asp  Leu Phe Phe Thr Phe  Gly Leu Leu
1580                 1585                 1590Pro Gly  Trp Trp Leu Ser Glu  Glu Pro Glu Arg Lys  Ser Thr Pro
1595                 1600                 1605Ser Leu  Thr Thr Asp Leu Trp  Asn Thr Met Leu Asp  Thr Ser Gly
1610                 1615                 1620Phe Asn  Gly Val Glu Leu Glu  Val Arg Asp Cys Glu  Asp Asp Glu
1625                 1630                 1635Phe Tyr  Met Ile Ser Thr Met  Leu Ser Thr Ala Arg  Lys Glu Asn
1640                 1645                 1650Thr Thr  Pro Asp Thr Val Ala  Glu Ser Glu Val Leu  Leu Leu His
1655                 1660                 1665Gly Ala  Leu Arg Pro Pro Ser  Ser Trp Leu Glu Ser  Leu Gln Ala
1670                 1675                 1680Ala Ile  Cys Glu Lys Thr Ser  Ser Ser Pro Ser Ile  Asn Ala Leu
1685                 1690                 1695Gly Glu  Val Asp Thr Thr Gly  Arg Thr Cys Ile Phe  Leu Gly Glu
1700                 1705                 1710Met Glu  Ser Ser Leu Leu Gly  Glu Val Gly Ser Glu  Thr Phe Lys
1715                 1720                 1725Ser Ile  Thr Ala Met Leu Asn  Asn Cys Asn Ala Leu  Leu Trp Val
1730                 1735                 1740Ser Arg  Gly Ala Ala Met Ser  Ser Glu Asp Pro Trp  Lys Ala Leu
1745                 1750                 1755His Ile  Gly Leu Leu Arg Thr  Ile Arg Asn Glu Asn  Asn Gly Lys
1760                 1765                 1770Glu Tyr  Val Ser Leu Asp Leu  Asp Pro Ser Arg Asn  Ala Tyr Thr
1775                 1780                 1785His Glu  Ser Leu Tyr Ala Ile  Cys Asn Ile Phe Asn  Gly Arg Leu
1790                 1795                 1800Gly Asp  Leu Ser Glu Asp Lys  Glu Phe Glu Phe Ala  Glu Arg Asn
1805                 1810                 1815Gly Val  Ile His Val Pro Arg  Leu Phe Asn Asp Pro  His Trp Lys
1820                 1825                 1830Asp Gln  Glu Ala Val Glu Val  Thr Leu Gln Pro Phe  Glu Gln Pro
1835                 1840                 1845Gly Arg  Arg Leu Arg Met Glu  Val Glu Thr Pro Gly  Leu Leu Asp
1850                 1855                 1860Ser Leu  Gln Phe Arg Asp Asp  Glu Gly Arg Glu Gly  Lys Asp Leu
1865                 1870                 1875Pro Asp  Asp Trp Val Glu Ile  Glu Pro Lys Ala Phe  Gly Leu Asn
1880                 1885                 1890Phe Arg  Asp Val Met Val Ala  Met Gly Gln Leu Glu  Ala Asn Arg
1895                 1900                 1905Val Met  Gly Phe Glu Cys Ala  Gly Val Ile Thr Lys  Leu Gly Gly
1910                 1915                 1920Ala Ala  Ala Ala Ser Gln Gly  Leu Arg Leu Gly Asp  Arg Val Cys
1925                 1930                 1935Ala Leu  Leu Lys Gly His Trp  Ala Thr Arg Thr Gln  Thr Pro Tyr
1940                 1945                 1950Thr Asn  Val Val Arg Ile Pro  Asp Glu Met Gly Phe  Pro Glu Ala
1955                 1960                 1965Ala Ser  Val Pro Leu Ala Phe  Thr Thr Ala Tyr Ile  Ala Leu Tyr
1970                 1975                 1980Thr Thr  Ala Lys Leu Arg Arg  Gly Glu Arg Val Leu  Ile His Ser
1985                 1990                 1995Gly Ala  Gly Gly Val Gly Gln  Ala Ala Ile Ile Leu  Ser Gln Leu
2000                 2005                 2010Ala Gly  Ala Glu Val Phe Val  Thr Ala Gly Thr Gln  Ala Lys Arg
2015                 2020                 2025Asp Phe  Val Gly Asp Lys Phe  Gly Ile Asn Pro Asp  His Ile Phe
2030                 2035                 2040Ser Ser  Arg Asn Asp Leu Phe  Val Asp Gly Ile Lys  Ala Tyr Thr
2045                 2050                 2055Gly Gly  Leu Gly Val His Val  Val Leu Asn Ser Leu  Ala Gly Gln
2060                 2065                 2070Leu Leu  Gln Ala Ser Phe Asp  Cys Met Ala Glu Phe  Gly Arg Phe
2075                 2080                 2085Val Glu  Ile Gly Lys Lys Asp  Leu Glu Gln Asn Ser  Arg Leu Asp
2090                 2095                 2100Met Leu  Pro Phe Thr Arg Asp  Val Ser Phe Thr Ser  Ile Asp Leu
2105                 2110                 2115Leu Ser  Trp Gln Arg Ala Lys  Ser Glu Glu Val Ser  Glu Ala Leu
2120                 2125                 2130Asn His  Val Thr Lys Leu Leu  Glu Thr Lys Ala Ile  Gly Leu Ile
2135                 2140                 2145Gly Pro  Ile Gln Gln His Ser  Leu Ser Asn Ile Glu  Lys Ala Phe
2150                 2155                 2160Arg Thr  Met Gln Ser Gly Gln  His Val Gly Lys Val  Val Val Asn
2165                 2170                 2175Val Ser  Gly Asp Glu Leu Val  Pro Val Gly Asp Gly  Gly Phe Ser
2180                 2185                 2190Leu Lys  Leu Lys Pro Asp Ser  Ser Tyr Leu Val Ala  Gly Gly Leu
2195                 2200                 2205Gly Gly  Ile Gly Lys Gln Ile  Cys Gln Trp Leu Val  Asp His Gly
2210                 2215                 2220Ala Lys  His Leu Ile Ile Leu  Ser Arg Ser Ala Lys  Ala Ser Pro
2225                 2230                 2235Phe Ile  Thr Ser Leu Gln Asn  Gln Gln Cys Ala Val  Tyr Leu His
2240                 2245                 2250Ala Cys  Asp Ile Ser Asp Gln  Asp Gln Val Thr Lys  Val Leu Arg
2255                 2260                 2265Leu Cys  Glu Glu Ala His Ala  Pro Pro Ile Arg Gly  Ile Ile Gln
2270                 2275                 2280Gly Ala  Met Val Leu Lys Asp  Ala Leu Leu Ser Arg  Met Thr Leu
2285                 2290                 2295Asp Glu  Phe Asn Ala Ala Thr  Arg Pro Lys Val Gln  Gly Ser Trp
2300                 2305                 2310Tyr Leu  His Lys Ile Ala Gln  Asp Val Asp Phe Phe  Val Met Leu
2315                 2320                 2325Ser Ser  Leu Val Gly Val Met  Gly Gly Ala Gly Gln  Ala Asn Tyr
2330                 2335                 2340Ala Ala  Ala Gly Ala Phe Gln  Asp Ala Leu Ala His  His Arg Arg
2345                 2350                 2355Ala His  Gly Met Pro Ala Val  Thr lle Asp Leu Gly  Met Val Lys
2360                 2365                 2370Ser Val  Gly Tyr Val Ala Glu  Thr Gly Arg Gly Val  Ala Asp Arg
2375                 2380                 2385Leu Ala  Arg Ile Gly Tyr Lys  Pro Met His Glu Lys  Asp Val Met
2390                 2395                 2400Asp Val  Leu Glu Lys Ala Ile  Leu Cys Ser Ser Pro  Gln Phe Pro
2405                 2410                 2415Ser Pro  Pro Ala Ala Val Val  Thr Gly Ile Asn Thr  Ser Pro Gly
2420                  2425                2430Ala His  Trp Thr Glu Ala Asn  Trp Ile Gln Glu Gln  Arg Phe Val
2435                 2440                 2445Gly Leu  Lys Tyr Arg Gln Val  Leu His Ala Asp Gln  Ser Phe Val
2450                  2455                2460Ser Ser  His Lys Lys Gly Pro  Asp Gly Val Arg Ala  Gln Leu Ser
2465                 2470                 2475Arg Val  Thr Ser His Asp Glu  Ala Ile Ser Ile Val  Leu Lys Ala
2480                 2485                 2490Met Thr  Glu Lys Leu Met Arg  Met Phe Gly Leu Ala  Glu Asp Asp
2495                 2500                 2505Met Ser  Ser Ser Lys Asn Leu  Ala Gly Val Gly Val  Asp Ser Leu
2510                 2515                 2520Val Ala  Ile Glu Leu Arg Asn  Trp Ile Thr Ser Glu  Ile His Val
2525                 2530                 2535Asp Val  Ser Ile Phe Glu Leu  Met Asn Gly Asn Thr  Ile Ala Gly
2540                 2545                 2550Leu Val  Glu Leu Val Val Ala  Lys Cys Ser
2555                 2560<210>47<211>1557<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1557)<400>47atg ctc ggc cag gtt ctt ctg acc gtc gaa tcg tac caa tgg gta tcg       48Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser1               5                   10                  15acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc       96Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
        20                  25                  30tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa      144Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
    35                  40                  45aaa tgg tgg gag ttg acg acc atg agg gct agg cag gac ttc gat acg      192Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50                  55                  60tat ggt ccg agc tgg atc gaa gct tgg ttc tcg aaa aac gac aag ccc      240Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro65                  70                  75                  80ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca tcg tcc      288Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
            85                  90                  95atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt      336Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
        100                 105                 110ttg gcg gat gac ttt cac tct cat ctc cct gga ttc gac ggg ttc aag      384Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
    115                 120                 125gaa atc tgc cag gat gca cat ctt gtc aac aaa gtt gtt ttg aac cag      432Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130                 135                 140tta caa acc caa gcc ccc aag tac aca aag cca ttg gct acc ttg gcc      480Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala145                 150                 155                 160gac gct act att gcc aag ttg ttc ggt aaa agc gag gag tgg caa acc      528Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
            165                 170                 175gca cct gtc tat tcc aat gga ttg gac ctt gtc aca cga aca gtc aca      576Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
        180                 185                 190ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat      624Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
    195                 200                 205att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt      672Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210                 215                 220cgc gta tgg ccc atg cta ctg cga ccg ctc gct cac tgg ttt caa ccg      720Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro225                 230                 235                 240caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca cga aag atc att      768Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
            245                 250                 255gat cct gag att cag cga cga cgt gct gaa aag gcc gca tgt gta gcg      816Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
        260                 265                 270aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa      864Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
    275                 280                 285gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct      912Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290                 295                 300atg gat ttc gcc ggc atc tac gcc tcg acg gat ctt ttc gtc ggt gcc      960Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala305                 310                 315                 320ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa     1008Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
            325                 330                 335gag atc cgc act gta atc gga gaa ggg ggc tgg acg cct gcc tct ctg     1055Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
        340                 345                 350ttc aag ctg aag ctc ctc gac agc tgc atg aaa gag acg cag cga atc     1104Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
    355                 360                 365aag ccg gtc gag tgc gcc act atg cgc agt acc gct ctc aga gac atc     1152Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370                 375                 380act cta tcc aat ggc ctc ttc att ccc aag ggc gag ttg gcc gct gtg     1200Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val385                 390                 395                 400gct gca gac cgc atg aac aac cct gat gtg tgg gaa aac ccc gaa aat     1248Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
            405                 410                 415tat gat ccc tac cga ttt atg cgc atg cgc gag gat cca gac aag gcc     1296Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
        420                 425                 430ttc acc gct caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc     1344Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
    435                 440                 445tgg aac cca cgc gct tgt ccc ggg cgg ttc ttc gcc tcg aag gaa atc     1392Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450                 455                 460aag att ctc ctc gct cat ata ctg att cag tat gat gtg aag cct gta     1440Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val465                 470                 475                 480cca gga gac gat gac aaa tac tac cgt cac gct ttt agc gtt cgt atg     1488Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
            485                 490                 495cat cca acc aca aag ctc atg gta cgc cgg cgc aac gag gac atc ccg     1536His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
        500                 505                 510ctc cct cat gac cgg tgc taa                                         1557Leu Pro His Asp Arg Cys
    515<210>48<211>518<212>PRT<213>柑桔青霉<400>    48Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser1               5                   10                  15Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
        20                  25                  30Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
    35                  40                  45Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50                   55                 60Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro65                  70                  75                  80Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
            85                  90                  95Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
        100                 105                 110Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
    115                 120                 125Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130                 135                 140Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala145                 150                 155                 160Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
            165                 170                 175Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
        180                 185                 190Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
    195                 200                 205Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210                 215                 220Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro225                 230                 235                 240Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
            245                 250                 255Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
        260                 265                 270Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
    275                 280                 285Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290                 295                 300Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala305                 310                 315                 320Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
            325                 330                 335Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
        340                 345                 350Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
    355                 360                 365Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370                 375                 380Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val385                 390                 395                 400Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
            405                 410                 415Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
        420                 425                 430Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
    435                 440                 445Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450                 455                 460Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val465                 470                 475                 480Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
            485                 490                 495His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
        500                 505                 510Leu Pro His Asp Arg Cys
    515<210>49<211>3522<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(3522)<400>49atg gtc gct tcg ttg eta ccc tct cgc ttt cgc ggt agg gaa tca atg       48Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met1               5                   10                  15aat cag cag cac cct cta cgc tcg gga aat cgg gca ttg acc tcc aca       96Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
        20                  25                  30ctc caa ttt cta tcc aaa acg gcg tgt cta cac ccg atc cat acc gtt      144Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
    35                  40                  45tgc acc ata gct att cta gct agt acc aca tac gtt gga cta ctc aaa      192Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50                  55                  60gac agc ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc      240Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly65                  70                  75                  80tct ttg gtc gaa gga agt cga agc ttg atc acc ggc cca cag aat ggc      288Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
            85                  90                  95tgg aag tgg cag agc ttc gac ggg gat gca gat gtt ctc gga gat ttc      336Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
        100                 105                 110aac cat caa gca cta atg acc ttg gta ttc ccg ggg tca tat ggg gtt      384Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
    115                 120                 125gca tct caa gca gcc tca cca ttc ctt gct ccc ctc cct gtg aac cta      432Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130                 135                 140tct gtg att gac ctt ccc tca acg tcg agc cct tta acc gcc tat tcg      480Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser145                 150                 155                 160aaa gat aaa gtt ttc gcc ttc tct gtg gaa tac agc agc gcg ccg gaa      528Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
            165                 170                 175ctc gtg gct gct gtt caa gaa atc ccc aac aac agt gcc gac ctg aaa      576Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
        180                 185                 190ttg cag gag acg caa ttg atc gag atg gaa cgc cag atg tgg atc atg      624Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
    195                 200                 205aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac      672Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210                 215                 220gat acc tgg aca gag tct ctt gat ctt atc aag agc gct caa acg ctc      720Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu225                 230                 235                 240gac gtg gtt gtc atg gtg cta ggt tat ata tca atg cac ttg act ttc      768Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
            245                 250                 255gtc tca ctc ttc ctc agc atg aaa aaa ttg gga tcg aag gtt tgg ctg      816Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
        260                 265                 270gct aca agc gtc ctt ttg tcg tca aca ttt gcc ttt ctc ctc ggt ctc      864Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
    275                 280                 285gac gtg gcc ata aga cta ggg gtt ccg atg agc atg agg ttg cta tcc      912Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290                 295                 300gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc      960Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile305                 310                 315                 320act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac cga aag ccc     1008Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
            325                 330                 335cag aag ata cag tct gac cag ggt agc gtg aca gcc att gct gaa agt     1056Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
        340                 345                 350acc atc aat tac gcc gta cga agc gcc att cgg gag aag ggt tac aat     1104Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
    355                 360                 365atc gtg tgc cac tac gtg gtc gag atc ctg ctc cta gtt atc ggt gct     1152Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370                 375                 380gtc tta ggc atc caa ggt ggg cta cag cac ttc tgt gtt cta gct gca     1200Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala385                 390                 395                 400ttg atc ctg ttc ttt gac tgt ctg ctg ctg ttt aca ttc tac act gcg     1248Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
            405                 410                 415att ctg tct atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac     1296Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
        420                 425                 430atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag     1344Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
    435                 440                 445agt gtc gcg acc agc aat gat gcc caa gac agt gca cgt aca tat ctg     1392Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450                 455                 460ttt ggc aat gat atg aaa ggc agc agt gtt ccg aag ttc aaa ttc tgg     1440Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp465                 470                 475                 480atg gtc gtt ggt ttc ctt ate gtc aac ctc gtc aac atc ggc tcc acc     1488Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
            485                 490                 495ctt ttc caa gcc tct tct agt gga tcg ttg tcc agt ata tca tct tgg     1536Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
        500                 505                 510acc gaa agt ctg agc gga tcg gcc att aaa ccc ccg ctt gag ccc ttc     1584Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
    515                 520                 525aag gta gct gga agt gga cta gat gaa cta ctt ttc cag gca aga ggg     1632Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530                 535                 540cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa     1680Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu545                 550                 555                 560cta gag tat cct tcc att cac cgt ggt acc tcg cag cta cac gag tat     1728Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
            565                 570                 575gga gtt ggt gga aaa atg gtc ggt agc ctg ctc acc agc ctg gaa gat     1776Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
        580                 585                 590ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc cta agt gtc gct     1824Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
    595                 600                 605ctg aac agc tat ctg ttc aag gcc gcc aga ctg gga atc aaa gat cct     1872Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610                 615                 620aat ctc ccg agt cac cca gtt gat cca gtt gag ctt gac cag gcc gaa     1920Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu625                 630                 635                 640agc ttc aac gct gcc cag aac cag acc cct cag att caa tca agt ctc     1968Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
            645                 650                 655caa gct cct cag acc aga gtg ttc act cct acc acc acc gac agt gac     2016Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
        660                 665                 670agt gat gcc tca tta gtc tta att aaa gca tct cta aag gtc act aag     2064Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
    675                 680                 685cga gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tct cgc aca     2112Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690                 695                 700caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc agc gag ttg     2160Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu705                 710                 715                 720aac gat gag gat gtc gtt gcc ttg tct ttg cgg gga aag gtt ccc ggg     2208Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
            725                 730                 735tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt     2256Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
        740                 745                 750cgc cgc tct atc att tcg agg aca ccg gct acc gca gag ctt aca agt     2304Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
    755                 760                 765atg ctg gag cac tcg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc     2352Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770                 775                 780gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct     2400Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro785                 790                 795                 800gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att     2448Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
            805                 810                 815cct atg gca acc acc gag ggc gtc ctc gtc gct agt gct agc cgt ggc     2496Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
        820                 825                 830agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc     2544Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
    835                 840                 845gac ggt atg aca cga ggc ccg tgt gtg aag ttt gat gtc crt gaa cga     2592Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850                 855                 860gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta     2640Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val865                 870                 875                 880atg aaa gaa gcc ttc aat tca acc agc aga ttt gcg cgc tta caa agt     2688Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
            885                 890                 895atg cgg aca act atc gcc ggt act cac tta tat att cga ttt aag act     2736Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
        900                 905                 910act act ggc gac gct atg gga atg aat atg att tct aag ggc gtg gag     2784Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
    915                 920                 925cat gca ctg aat gtt atg gcg aca gag gca ggt ttc agc gat atg aat     2832His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930                 935                 940att att acc cta tca gga aat tac tgt acg gat aag aaa cct tca gct     2880Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala945                 950                 955                 960ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc     2928Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
            965                 970                 975ata ccg gcg aac gtt gtc agg gat gtc tta aag agc gat gtg gat agc     2976Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
        980                 985                 990atg gtt cag ctc aac ata tcg aaa  aat ctg att ggg tcc  gct atg gct   3024Met Val Gln Leu Asn Ile Ser Lys  Asn Leu Ile Gly Ser  Ala Met Ala
    995                 1000                 1005ggc tca  gtt ggc ggc ttc aac  gcc caa gct gcc aat  ctt gcg gca      3069Gly Ser  Val Gly Gly Phe Asn  Ala Gln Ala Ala Asn  Leu Ala Ala
1010                 1015                 1020gcc att  ttc att gcc aca ggt  cag gat ccg gcg caa  gtt gtg gag      3114Ala Ile  Phe Ile Ala Thr Gly  Gln Asp Pro Ala Gln  Val Val Glu
1025                 1030                 1035agc gct  aac tgc atc act ctc  atg aac aat ctt cgc  gga tcg ctt      3159Ser Ala  Asn Cys Ile Thr Leu  Met Asn Asn Leu Arg  Gly Ser Leu
1040                 1045                 1050caa atc  tct gtc tcc atg ccg  tct att gag gtt gga  acg ttg ggc      3204Gln Ile  Ser Val Ser Met Pro  Ser Ile Glu Val Gly  Thr Leu Gly
1055                 1060                 1065ggt ggt  acg att ctg gag ccc  cag ggc gca atg ctt  gac atg ctt      3249Gly Gly  Thr Ile Leu Glu Pro  Gln Gly Ala Met Leu  Asp Met Leu
1070                 1075                 1080ggt gtc  cgc gga tca cac ccg  acc act ccc ggt gag  aat gca cgt      3294Gly Val  Arg Gly Ser His Pro  Thr Thr Pro Gly Glu  Asn Ala Arg
1085                 1090                 1095caa ctt  gcg cgc atc atc gga  agc gct gtt ttg gct  ggg gag ctc      3339Gln Leu  Ala Arg Ile Ile Gly  Ser Ala Val Leu Ala  Gly Glu Leu
1100                 1105                 1110tcg cta  tgt gct gcc cta gcc  gcc ggt cac ctg gtc  aag gcg cac      3384Ser Leu  Cys Ala Ala Leu Ala  Ala Gly His Leu Val  Lys Ala His
1115                 1120                 1125atg gcg  cac aac cgt tct gcc  ccg gca tct tca gcc  cct tct cga      3429Met Ala  His Asn Arg Ser Ala  Pro Ala Ser Ser Ala  Pro Ser Arg
1130                 1135                 1140agt gtc  tcc ccg tca ggc gga  acc agg aca gtc cct  gtt cct aac      3474Ser Val  Ser Pro Ser Gly Gly  Thr Arg Thr Val Pro  Val Pro Asn
1145                 1150                 1155aat gca  ctg agg ccg agt gct  gca gct act gat cgg  gct cga cgc      3519Asn Ala  Leu Arg Pro Ser Ala  Ala Ala Thr Asp Arg  Ala Arg Arg
1160                 1165                 1170tga                                                                      3522<210>50<211>1173<212>PRT<213>柑桔青霉<400>50Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met1               5                   10                  15Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
        20                  25                  30Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
    35                  40                  45Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50                  55                  60Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly65                  70                  75                  80Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
            85                  90                  95Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
        100                 105                 110Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
    115                 120                 125Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130                 135                 140Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser145                 150                 155                 160Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
            165                 170                 175Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
        180                 185                 190Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
    195                 200                 205Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210             215             220Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu225                 230                 235                 240Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
            245                 250                 255Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
        260                 265                 270Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
    275                 280                 285Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290                 295                 300Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile305                 310                 315                 320Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
            325                 330                 335Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
        340                 345                 350Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
    355                 360                 365Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370                 375                 380Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala385                 390                 395                 400Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
            405                 410                 415Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
        420                 425                 430Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
    435                 440                 445Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450                 455                 460Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp465                 470                 475                 480Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
            485                 490                 495Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
        500                 505                 510Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
    515                 520                 525Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530                 535                 540Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu545                 550                 555                 560Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
            565                 570                 575Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
        580                 585                 590Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
    595                 600                 605Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610                 615                 620Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu625                 630                 635                 640Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
            645                 650                 655Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
        660                 665                 670Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
    675                 680                 685Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690                 695                 700Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu705                 710                 715                 720Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
            725                 730                 735Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
        740                 745                 750Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
    755                 760                 765Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770                 775                 780Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro785                 790                 795                 800Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
            805                 810                 815Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
        820                 825                 830Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
    835                 840                 845Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850                 855                 860Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val865                 870                 875                 880Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
            885                 890                 895Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
        900                 905                 910Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
    915                 920                 925His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930                 935                 940Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala945                 950                 955                 960Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
            965                 970                 975Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
        980                 985                 990Met Val Gln Leu Asn Ile Ser Lys  Asn Leu Ile Gly Ser  Ala Met Ala
    995                 1000                 1005Gly Ser  Val Gly Gly Phe Asn  Ala Gln Ala Ala Asn  Leu Ala Ala
1010                 1015                 1020Ala Ile  Phe Ile Ala Thr Gly  Gln Asp Pro Ala Gln  Val Val Glu
1025                 1030                 1035Ser Ala  Asn Cys Ile Thr Leu  Met Asn Asn Leu Arg  Gly Ser Leu
1040                 1045                 1050Gln Ile  Ser Val Ser Met Pro  Ser Ile Glu Val Gly  Thr Leu Gly
1055                 1060                 1065Gly Gly  Thr Ile Leu Glu Pro  Gln Gly Ala Met Leu  Asp Met Leu
1070                 1075                 1080Gly Val  Arg Gly Ser His Pro  Thr Thr Pro Gly Glu  Asn Ala Arg
1085                 1090                 1095Gln Leu  Ala Arg Ile Ile Gly  Ser Ala Val Leu Ala  Gly Glu Leu
1100                 1105                 1110Ser Leu  Cys Ala Ala Leu Ala  Ala Gly His Leu Val  Lys Ala His
1115                 1120                 1125Met Ala  His Asn Arg Ser Ala  Pro Ala Ser Ser Ala  Pro Ser Arg
1130                 1135                 1140Ser Val  Ser Pro Ser Gly Gly  Thr Arg Thr Val Pro  Val Pro Asn
1145                 1150                 1155Asn Ala  Leu Arg Pro Ser Ala  Ala Ala Thr Asp Arg  Ala Arg Arg
1160                 1165                 1170<210>51<211>20<212>DNA<213>柑桔青霉<400>51gcaagctctg ctaccagcac                                             20<210>52<211>20<212>DNA<213>柑桔青霉<400>52ctaggccaac ttcagagccg                                             20<210>53<211>20<212>DNA<213>柑桔青霉<400>53agtcatgcag gatctgggtc                                             20<210>54<211>20<212>DNA<213>柑桔青霉<400>54gcagacacat cggtgaagtc                               20<210>55<211>20<212>DNA<213>柑桔青霉<400>55aaaccgcacc tgtctattcc                               20<210>56<211>20<212>DNA<213>柑桔青霉<400>56ctttgtggtt ggatgcatac                               20<210>57<211>20<212>DNA<213>柑桔青霉<400>57cgctctatca tttcgaggac                               20<210>58<211>20<212>DNA<213>柑桔青霉<400>58tcaatagacg gcatggagac                               20<210>59<211>20<212>DNA<213>柑桔青霉<400>59atgtcagaac ctctaccccc                              20<210>60<211>20<212>DNA<213>柑桔青霉<400>60tcaagcatca gtctcaggca                              20<210>61<211>20<212>DNA<213>柑桔青霉<400>61atgtccctgc cgcatgcaac                  20<210>62<211>20<212>DNA<213>柑桔青霉<400>62ctaagcaata ttgtgtttct                  20

Claims (41)

1.一种多核苷酸,选自以下:
(a)编码具有氨基酸序列SEQ ID NO38的蛋白质的多核苷酸,或者编码具有至少一个缺失、添加、取代或改变的修饰氨基酸序列的其多核苷酸变体,所述变体多核苷酸适合用于加速ML-236B的生物合成;和
(b)编码具有氨基酸序列SEQ ID NO42的蛋白质的多核苷酸,或者编码具有至少一个缺失、取代或改变的修饰氨基酸的其多核苷酸变体,所述变体多核苷酸适合用于加速ML-236B的生物合成。
2.如权利要求1的多核苷酸,含有SEQ ID NO37或者含有其突变体或变体,它适合用于加速ML-236B的生物合成。
3.如权利要求1或2的多核苷酸,含有SEQ ID NO37。
4.如权利要求1-3任一项的多核苷酸,含有由转化的大肠杆菌pSAKexpESANK72499(FERMBP-7005)获得的DNA。
5.如权利要求1的多核苷酸,含有SEQ ID NO41,或者含有其变体,它适合用于加速ML-236B的生物合成。
6.如权利要求1或5的多核苷酸,含有SEQ ID NO41。
7.如权利要求1、5或6的多核苷酸,含有由转化的大肠杆菌pSAKexpRSANK 72599(FERM BP-7006)获得的DNA。
8.如前面任意权利要求的多核苷酸,与一种或多种多核苷酸可操作地组合,所述组合适合用于提高产ML-236B的微生物的ML-236B的产量。
9.如权利要求8的多核苷酸,含有SEQ ID NO37的多核苷酸、或者其具有相似功能的变体,它与选自SEQ ID NO37、41、43、45、47或49、或者其具有相似功能的变体的一个或多个序列组合。
10.如权利要求8的多核苷酸,含有SEQ ID NO41的多核苷酸、或者其具有相似功能的变体,它与选自SEQ ID NO37、41、43、45、47或49、或者其具有相似功能的变体的一个或多个序列组合。
11.能够在严格条件下与前面任意权利要求的多核苷酸杂交的多核苷酸。
12.如权利要求11的多核苷酸,当其导入产ML-236B的微生物中时适合加速该产ML-236B的微生物中的ML-236B的生物合成。
13.如权利要求11或12的多核苷酸,它是RNA。
14.含有如前面任意权利要求的多核苷酸的载体。
15.如权利要求14的载体,能由大肠杆菌pSAKexpE SANK72499(FERMBP-7005)或大肠杆菌pSAKexpR SANK72599(FERM BP-7006)获得。
16.如权利要求14或15的载体,它是表达载体。
17.由权利要求14-16任一项的载体转化的宿主细胞。
18.如权利要求17的宿主细胞,其特征在于其为产ML-236B的微生物。
19.如权利要求18的宿主细胞,其特征在于其为柑桔青霉。
20.如权利要求17的宿主细胞,其特征在于其为大肠杆菌。
21.如权利要求20的宿主细胞,其特征在于其为大肠杆菌pSAKexpE SANK72499(FERM BP-7005)。
22.如权利要求20的宿主细胞,特征在于其为大肠杆菌pSAKexpR SANK72599(FERM BP-7006)。
23.由权利要求1-13任一项的多核苷酸编码的多肽。
24.一种多肽,含有序列SEQ ID NO38,或者与SE ID NO38具有至少80%同一性的其变体,它能加速产ML236B的生物体中的ML236B生产。
25.如权利要求24的多肽,具有序列SEQ ID NO38。
26.一种多肽,含有序列SEQ ID NO42,或者与SE ID NO42具有至少80%同一性的其变体,它能加速产ML236B的生物体中的ML236B生产。
27.如权利要求26的多肽,具有序列SEQ ID NO42。
28.一种生产ML-236B的方法,包括将权利要求17-19任一项的宿主细胞培养,然后从该培养物中回收ML-236B。
29.如权利要求28的方法,其中所述宿主细胞用含有SEQ ID NO37或SEQID NO41的载体转化。
30.如权利要求29的方法,其中所述载体不包括其它基因。
31.如权利要求28-30任一项的方法,其中在没有相应于SEQ ID NO44、46、48或50的重组mlcA、B、C或D的情况下进行生产。
32.通过权利要求28-31任一项的方法生产的ML-236B。
33.一种生产帕伐他丁的方法,包括进行权利要求28-31任一项的方法,并将ML-236B转变成帕伐他丁。
34.与SEQ ID NO38或SEQ ID NO42的蛋白质反应的抗体。
35.一种编码具有选自SEQ ID NO44、46、48或50的氨基酸序列的蛋白质的多核苷酸,或者编码具有缺失、取代、添加或改变的所述氨基酸序列修饰的变体多核苷酸,所述变体适合用于加速ML-236B的生物合成。
36.如权利要求35的多核苷酸,选自由SEQ ID NO43、45、47或49组成的组。
37.如权利要求35或36的多核苷酸,所述多核苷酸能单独或者与SEQ ID NO37或SEQ ID NO41的多核苷酸相连加速ML-236B的生物合成。
38.含有如权利要求35-37任一项的多核苷酸的载体。
39.含有如权利要求38的载体的宿主细胞。
40.由权利要求35-37任一项的多核苷酸编码的多肽。
41.一种生产ML236B的方法,包括培养权利要求39的宿主细胞,然后从该培养物中回收ML-236B。
CN011196556A 2000-04-18 2001-04-18 来自基因簇的基因 Expired - Fee Related CN1325959B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP116591/2000 2000-04-18
JP116591/00 2000-04-18
JP2000116591 2000-04-18
JP2000117458 2000-04-19
JP117458/2000 2000-04-19

Publications (2)

Publication Number Publication Date
CN1325959A true CN1325959A (zh) 2001-12-12
CN1325959B CN1325959B (zh) 2010-05-05

Family

ID=26590305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN011196556A Expired - Fee Related CN1325959B (zh) 2000-04-18 2001-04-18 来自基因簇的基因

Country Status (24)

Country Link
US (3) US7056710B2 (zh)
EP (1) EP1149919B1 (zh)
KR (1) KR100632174B1 (zh)
CN (1) CN1325959B (zh)
AR (1) AR034550A1 (zh)
AT (1) ATE373101T1 (zh)
AU (1) AU783319B2 (zh)
BR (1) BR0101518A (zh)
CA (1) CA2342397C (zh)
CY (1) CY1106985T1 (zh)
CZ (1) CZ20011367A3 (zh)
DE (1) DE60130394T2 (zh)
DK (1) DK1149919T3 (zh)
ES (1) ES2293966T3 (zh)
HK (1) HK1037683A1 (zh)
HU (1) HUP0101569A3 (zh)
IL (1) IL142619A (zh)
MX (1) MXPA01003913A (zh)
NO (1) NO328653B1 (zh)
NZ (1) NZ511166A (zh)
PL (1) PL202457B1 (zh)
PT (1) PT1149919E (zh)
RU (1) RU2236463C2 (zh)
TW (1) TWI312807B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2029750T3 (da) * 2006-06-22 2011-10-17 Dsm Ip Assets Bv Fremstilling af pravastatin
EP2334781A1 (en) * 2008-09-24 2011-06-22 DSM IP Assets B.V. Improved statin production
WO2010069914A1 (en) * 2008-12-19 2010-06-24 Dsm Ip Assets B.V. Statin transcription regulators
EP3134098A1 (en) * 2014-04-23 2017-03-01 Danmarks Tekniske Universitet Statin resistance and export

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS572240A (en) 1980-06-06 1982-01-07 Sankyo Co Ltd Ml-236b derivative
US5179013A (en) 1987-02-02 1993-01-12 Sankyo Company, Limited Cytochrome P-450 enzymes
WO1995012661A1 (en) 1993-11-02 1995-05-11 Merck & Co., Inc. Dna encoding triol polyketide synthase
KR100186758B1 (ko) * 1996-08-09 1999-04-01 영진약품공업 주식회사 프라바스타틴(pravastatin)전구체의제조방법
US6391583B1 (en) 1998-12-18 2002-05-21 Wisconsin Alumni Research Foundation Method of producing antihypercholesterolemic agents
AU6475800A (en) 1999-08-11 2001-03-13 Sankyo Company Limited Ml-236b biosynthesis-associated dna
FR2801648B1 (fr) * 1999-11-30 2002-06-21 Commissariat Energie Atomique Injecteur a vapeur haute pression comportant un drain axial

Also Published As

Publication number Publication date
ES2293966T3 (es) 2008-04-01
NZ511166A (en) 2002-11-26
PL202457B1 (pl) 2009-06-30
EP1149919A2 (en) 2001-10-31
HUP0101569A2 (hu) 2002-05-29
US7056710B2 (en) 2006-06-06
ATE373101T1 (de) 2007-09-15
US20070111293A1 (en) 2007-05-17
AR034550A1 (es) 2004-03-03
CN1325959B (zh) 2010-05-05
NO20011890D0 (no) 2001-04-17
HK1037683A1 (en) 2002-02-15
RU2236463C2 (ru) 2004-09-20
US20050214909A1 (en) 2005-09-29
KR20010098713A (ko) 2001-11-08
KR100632174B1 (ko) 2006-10-11
TWI312807B (en) 2009-08-01
HUP0101569A3 (en) 2005-01-28
IL142619A (en) 2008-03-20
CA2342397C (en) 2011-08-23
PL347118A1 (en) 2001-10-22
NO20011890L (no) 2001-10-19
DE60130394D1 (de) 2007-10-25
CZ20011367A3 (cs) 2001-12-12
BR0101518A (pt) 2001-11-13
PT1149919E (pt) 2007-12-17
NO328653B1 (no) 2010-04-19
DE60130394T2 (de) 2008-06-19
MXPA01003913A (es) 2003-08-20
AU3709201A (en) 2001-10-25
HU0101569D0 (en) 2001-06-28
CA2342397A1 (en) 2001-10-18
US20030078395A1 (en) 2003-04-24
EP1149919B1 (en) 2007-09-12
CY1106985T1 (el) 2012-09-26
AU783319B2 (en) 2005-10-13
EP1149919A3 (en) 2002-02-06
DK1149919T3 (da) 2007-12-03

Similar Documents

Publication Publication Date Title
CN1267557C (zh) 合成抗病原体物质的基因
CN1298447A (zh) 生产刺糖噻杀虫剂所用的生物合成基因
CN1314950A (zh) 微生物和植物中的维生素c生产
CN1415014A (zh) 通过基因扩增增加赖氨酸产量
CN1305529A (zh) 利用微生物生产类异戊二烯化合物的方法和检测具有抗菌或除草活性的化合物的方法
CN1065277C (zh) 阿凡曼菌素的制备方法
CN1094707A (zh) 六氢化萘酯衍生物、它们的制备和它们在治疗方面的应用
CN1845925A (zh) 取代的杂环化合物
CN1705662A (zh) 埃坡霉素b的制备、分离和纯化的方法,及埃坡霉素b的x-射线晶体结构
CN1717493A (zh) 大环内酯化合物的产生方法
CN1221453A (zh) 提高丝状真菌中血红素蛋白产量的方法
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN1849391A (zh) 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
CN1886505A (zh) 参与大环内酯类化合物的羟化作用的dna
CN1110554C (zh) 米曲霉5-氨基乙酰丙酸合成酶及编码此酶的核酸
CN1325959A (zh) 来自基因簇的基因
CN1514880A (zh) 生产依马菌素的方法和组合物
CN1307137A (zh) 携带新黄素裂解酶基因的转基因植物
CN1092811A (zh) 新的thiomarinol衍生物及其制备方法
CN1753996A (zh) 参与番红菌素生物合成的基因簇及其用于遗传工程的用途
CN1434867A (zh) 具有各种特性的稻子过氧化物酶
CN101063140A (zh) 万古霉素生物合成基因簇
CN1034498C (zh) 用于抑制胆固醇生物合成的八氢萘肟衍生物,其制备方法和用途
CN1521180A (zh) 介导除虫菌素b2:b1比例的除虫链霉菌基因
CN1637143A (zh) 生成合成胆固醇合成抑制剂莫那可林k的相关基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100505

Termination date: 20130418