CN1325959A - 来自基因簇的基因 - Google Patents
来自基因簇的基因 Download PDFInfo
- Publication number
- CN1325959A CN1325959A CN01119655A CN01119655A CN1325959A CN 1325959 A CN1325959 A CN 1325959A CN 01119655 A CN01119655 A CN 01119655A CN 01119655 A CN01119655 A CN 01119655A CN 1325959 A CN1325959 A CN 1325959A
- Authority
- CN
- China
- Prior art keywords
- seq
- polynucleotide
- dna
- sequence
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/385—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/06—Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/181—Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
ML-236B为HMG-CoA还原酶的抑制剂并用于制备另一抑制剂-帕伐他丁。使用编码与存在于产ML-236B的微生物中的聚酮化合物合成酶簇有关的基因的多核苷酸,可以提高使用这种微生物的ML-236B的制备。
Description
本发明涉及一基因簇,尤其是来自基因簇的基因。
更具体地说,本发明涉及多核苷酸,如DNA,当将其导入产ML-236B的微生物中时它加速HMG-CoA还原酶抑制剂,ML-236B在该产ML-236B的微生物中的生物合成。本发明还涉及插入所述多核苷酸的载体、由所述载体转化的宿主细胞、由所述载体表达的蛋白质、一种使用所述多核苷酸和/或蛋白质生产ML-236B的方法,该方法包括从所述宿主细胞培养物中回收ML-236B,并且本发明还涉及其它相关方面。
帕伐他丁为HMG-CoA还原酶抑制剂。帕伐他丁钠已用于治疗血脂过多或高脂血症,并具有能降低血清胆固醇的有用药理效应。使用嗜碳酸气链霉菌通过微生物转化由柑桔青霉产生的ML-236B可以获得帕伐他丁[记载于Endo,A.等人的“抗生素杂志”29,1346(1976);Matsuoka,T.等人的“欧洲生物化学杂志”184,707(1989)和JP-昭57-2240A]。
已显示,ML-236B,一种帕伐他丁前体,以及洛伐他丁,一种HMG-CoA抑制剂,都具有部分相同结构。它们都是由聚酮化合物经生物合成的[记载于Moore,R.N.等人的“美国化学学会杂志”107,3694(1985);Shiao,M.和Don,H.S.的“中国科学院院报”11,23(1987)]。
聚酮化合物为由低分子量羧酸如乙酸、丙酸、丁酸等连续缩合反应产生的β-酮碳链衍生的化合物。根据每个β-酮羰基的缩合或还原的路径可以获得不同结构[记载于Hopwood,D.A.和Sherman,D.H.的“基因工程年鉴”24,37-66(1990);Hutchinson,C.R.和Fujii,I.“微生物学年鉴”49,201-238(1995)]。
有利于聚酮化合物合成的聚酮化合物合成酶(本文后面称之为PKS)为已知存在于丝状真菌和细菌中的酶。已使用分子生物学技术对这些丝状真菌酶进行了研究[如记载于Feng,G.H.和Leonard,T.J.的“细菌学杂志”177,6246(1995);Takano,Y.等人的“分子基因的基因工程”249,162(1995)]。在为产生洛伐他丁微生物的土曲霉中,已对与洛伐他丁生物合成有关的PKS基因进行了分析[记载于在日本的国际申请公开号平9-504436A并参见相应的WO9512661,它要求保护编码三醇聚酮化合物合成酶的DNA]。
与生物合成丝状真菌的二级代谢物有关的基因经常在基因组上形成一簇。在生物合成聚酮化合物的路径中,已知存在参与所述路径的基因簇。在生物合成黄曲霉毒素(它是由黄曲霉和寄生曲霉产生的聚酮化合物)时,已知编码参与所述生物合成的酶蛋白质(例如PKS)的基因形成簇结构。进行基因组分析并将每个微生物中参与生物合成黄曲霉毒素的基因进行比较[参见Yu, J.等人的“环境微生物应用”61,2365(1995)]。已报道,参与生物合成由构巢曲霉产生的柄曲霉素的基因在其基因组上形成约60kb连续区域的簇结构[记载于Brown,D.W.等人的“美国国家科学院院报”93,1418(1996)]。
已研究了在洛伐他丁合成过程中通过辅助蛋白对聚酮化合物合成酶活性的调节[参见Kennedy,J.等人的“科学”第284卷,1368(1999)]。
然而,时至今日,对ML-236B的生物合成和调节该合成的因子的分子生物学分析还不够。本发明打算解决该问题。
根据本发明,提供了一种适合用于加速ML-236B的生物合成的多核苷酸。
该多核苷酸典型地为编码包括氨基酸序列SEQ ID NO38、42、44、46、48或50或者由这些序列组成的蛋白质的多核苷酸。还提供了编码具有至少一个缺失、添加、替代或改变的修饰氨基酸序列的该多核苷酸变体。
序列表构成本专利说明书的一部分。为了帮助理解,我们列出了以下所列序列的表格。SEQ ID NO特性
1 pML48插入片段
2 与SEQ ID NO1互补
3 实施例4的PCR引物
4 实施例4的PCR引物
5 实施例8中5′-RACE的寡核苷酸DNA(1)
6 实施例8中5′-RACE的寡核苷酸DNA(1)
7 实施例8中5′-RACE的寡核苷酸DNA(1)
8 实施例8中5′-RACE的寡核苷酸DNA(1)
9 实施例8中5′-RACE的寡核苷酸DNA(1)
10 实施例8中5′-RACE的寡核苷酸DNA(1)
11 实施例8中5′-RACE的寡核苷酸DNA(2)
12 实施例8中5′-RACE的寡核苷酸DNA(2)
13 实施例8中5′-RACE的寡核苷酸DNA(2)
14 实施例8中5′-RACE的寡核苷酸DNA(2)
15 实施例8中5′-RACE的寡核苷酸DNA(2)
16 实施例8中5′-RACE的寡核苷酸DNA(2)
17 实施例8中5′-端cDNA片段
18 实施例8中5′-端cDNA片段
19 实施例8中5′-端cDNA片段
20 实施例8中5′-端cDNA片段
21 实施例8中5′-端cDNA片段
22 实施例8中5′-端cDNA片段
23 实施例8中3′-RACE的寡核苷酸DNA(3)
24 实施例8中3′-RACE的寡核苷酸DNA(3)
25 实施例8中3′-RACE的寡核苷酸DNA(3)
26 实施例8中3′-RACE的寡核苷酸DNA(3)
27 实施例8中3′-RACE的寡核苷酸DNA(3)
28 实施例8中3′-RACE的寡核苷酸DNA(3)
29 实施例8中3′-端cDNA片段
30 实施例8中3′-端cDNA片段
31 实施例8中3′-端cDNA片段
32 实施例8中3′-端cDNA片段
33 实施例8中3′-端cDNA片段
34 实施例8中3′-端cDNA片段
35 实施例9中的RT-PCR引物
36 实施例9中的RT-PCR引物
37 mlcE;cDNA核苷酸序列和推断氨基酸序列
38 推断mlcE多肽
39 实施例12中的RT-PCR引物
40 实施例12中的RT-PCR引物
41 mlcR;cDNA核苷酸序列和推断氨基酸序列
42 推断mlcR多肽
43 mlcA;cDNA核苷酸序列和推断氨基酸序列
44 推断mlcA多肽
45 mlcB;cDNA核苷酸序列和推断氨基酸序列
46 推断mlcB多肽
47 mlcC;cDNA核苷酸序列和推断氨基酸序列
48 推断mlcC多肽
49 mlcD;cDNA核苷酸序列和推断氨基酸序列
50 推断mlcD多肽
51 实施例17中的RT-PCR引物
52 实施例17中的RT-PCR引物
53 实施例17中的RT-PCR引物
54 实施例17中的RT-PCR引物
55 实施例17中的RT-PCR引物
56 实施例17中的RT-PCR引物
57 实施例17中的RT-PCR引物
58 实施例17中的RT-PCR引物
59 实施例17中的RT-PCR引物
60 实施例17中的RT-PCR引物
61 实施例17中的RT-PCR引物
62 实施例17中的RT-PCR引物
编码SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸可以为cDNA、基因组DNA或mRNA。将编码这六个序列的每个基因组DNA分别称之为结构基因mlcE、mlcR、mlcA、mlcB、mlcC和mlcD。不依赖这些赋值,我们相信,结构基因编码具有以下功能的蛋白质:
mlcA 聚酮化合物合成酶
mlcB 聚酮化合物合成酶
mlcC P450-氧合酶
mlcD HMG-CoA还原酶
mlcE 外排泵
mlcR 转录因子
我们已发现,导入mlcE或相应于mlcE的cDNA可以加速ML-236B的生物合成,导入mlcR或相应于mlcR的cDNA可以加速ML-236B的生物合成。而且,mlcR刺激mlcA-D的转录表达。通过基因破坏研究显示,在ML-236B的生产中单独地或共同地包括mlcA、B、C和D。
通过天然或人工改变获得的mlcA、B和/或C变体可用于生产ML-236B衍生物,包括例如帕伐他丁或洛伐他丁的抑制素。在这方面,使用这些变体以及仅一步发酵步骤就可以生产帕伐他丁,而不需目前使用嗜碳酸气链霉菌将ML-236B经微生物转换成帕伐他丁。
一优选的多核苷酸包括一含有SEQ ID NO37或者含有能够加速ML-236B生物合成的其突变体或变体的序列。这种DNA多核苷酸可由转化的大肠杆菌pSAKexpESANK72499(FERMBP-7005)获得。
另一优选的多核苷酸包括一含有SEQ ID NO41或者含有能够加速ML-236B生物合成的其突变体或变体的序列。这种DNA多核苷酸可从转化的大肠杆菌pSAKexpR SANK 72599(FERM BP-7006)获得。
本发明的多核苷酸可用于与一个或多个多核苷酸可操作地组合。优选组合适合用于提高产ML-236B的微生物中的ML236B产量。
这些组合的例子包括SEQ ID NO37或其具有相似功能的变体与一个或多个选自SEQ ID NO37本身、41、43、45、47或49的序列组合;以及SEQ ID NO41或其具有相似功能的变体与一个或多个选自SEQ ID NO37、41本身、43、45、47或49的组合。
一方面,该多核苷酸优选为编码包括氨基酸序列SEQ ID NO38、42、44、46、48或50或由这些氨基酸序列组成并且单独或与SEQ ID NO37、SEQ ID NO41的多核苷酸或其具有相似功能的变体结合能加速ML-236B的生物合成的蛋白质的多核苷酸。
本发明还延伸到能够在严格条件下与本发明的多核苷酸杂交的多核苷酸。这些多核苷酸延伸到当导入产ML-236B的微生物中时适合加速产ML-236B的微生物中的ML-236B的生物合成的多核苷酸。
该多核苷酸典型地为DNA、cDNA或基因组DNA或RNA,并且可以为有义或反义。该多核苷酸典型地为纯化多核苷酸,例如没有其他细胞组分的多核苷酸。
本发明延伸至编码图示SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸变体,其中一个或多个核苷酸已改变。这些变化可以自然发生,并且可以在丰余或简并的遗传密码三联体内进行。这些简并地改变的多核苷酸因此编码相同氨基酸序列。在这些多核苷酸变体中,我们包括具有外显子和内含子的基因组DNA,而不是简单的cDNA序列。
本发明还延伸至编码图示SEQ ID NO38、42、44、46、48或50的氨基酸序列的多核苷酸变体,它们编码具有至少一个缺失、添加、替代或改变的修饰氨基酸序列。因此,本发明延伸至编码比图示序列所编码的序列长度短、长或与之相等的氨基酸序列的图示序列的多核苷酸变体。优选这些变体多肽保留了加速ML-236B合成的能力,并优选具有与引起变体序列的亲代序列的活性基本上相似或者比之更好的活性。
这些多核苷酸变体保留了与亲代一定程度的同一性。该同一性适宜地为至少60%、至少80%、至少90%或至少95%或100%。变体的同一性优选由计算机软件来评定,例如使用进行同源性检索的算法的BLAST程序。
一方面,本发明的优选多核苷酸为选自以下的DNA:
(a)包括序列表中SEQ ID NO37的第1个核苷酸至第1662个核苷酸中所示一个或多个核苷酸序列的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(b)在严格条件下与(a)中所述DNA杂交的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(c)包括序列表中SEQ ID NO41的第1个核苷酸至第1380个核苷酸中所示一个或多个核苷酸序列的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成;
(d)在严格条件下与(c)中所述DNA杂交的DNA,并且它的特征在于当将其导入所述产ML-236B的微生物中时在该产ML-236B的微生物中加速ML-236B的生物合成。
本发明的多核苷酸在产ML-236B的微生物中加速ML-236B的生物合成。产ML-236B的微生物的例子包括青霉种,例如柑桔青霉、短密青霉[记载于Brown,A.G.等人的“帕金化学学会杂志-1”1165(1976)]、圆弧青霉[记载于Doss,S.L.等人的“国家产品杂志”49,357(1986)]等。其它例子包括:真青霉种M6603[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、绿色拟青霉FERMP-6236[记载于JP-昭58-98092A]、拟青霉种M2016[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、长臂木霉M6735[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、金精隐壳霉(Hypomyceschrysospermus)IFO7798[记载于Endo,A.等人的“东京抗生素杂志”39,1609(1986)]、胶霉种YJ-9515[记载于WO9806867]、绿色木霉IFO5836[记载于JP-昭62-19159B]、网状孢子真青霉IFO9022[记载于JP-昭62-19159B]或任意其它适宜生物体。
在这些产ML-236B的微生物中,优选柑桔青霉,并且更优选桔青霉菌株SANK13380。根据微生物保藏的布达佩斯条约,柑桔青霉SANK13380菌株于1992年12月22日以保藏号FERM BP-4129保藏在工业科技署的生命科学和技术研究院。产ML-236B的微生物的例子还包括从天然源分离的那些以及天然或人工突变的那些。
本发明还提供了含有本发明多核苷酸的载体。例如由大肠杆菌pSAKexpESANK72499(FERM BP-7005)或大肠杆菌pSAKexpR SANK72599(FERM BP-7006)获得的载体。本发明的这些载体包括表达载体。
还提供了由本发明载体转化的宿主细胞,包括产ML-236B的微生物。本发明的宿主细胞包括柑桔青霉和大肠杆菌,例如大肠杆菌pSAKexpE SANK72499(FERM BP-7005)或大肠杆菌pSAKexpR SANK 72599(FERM BP-7006)。
此外,本发明延伸至由本发明多核苷酸编码的多肽。本发明多肽的例子包括序列SEQ ID NO38或42、或具有与SEQ ID NO38或42的一定程度同一性且能加速产ML236B的微生物中ML236B产生的其变体。其它多肽是由本发明的其它多核苷酸序列编码的那些,以及保留一定程度同一性的变体。
多肽变体与SEQ ID NO38或42的同一性适宜地为至少80%、至少90%或至少95%或100%。变体的同一性优选由计算机软件评定,例如使用进行同源性检索的算法的BLAST程序。
本发明的多肽包括SEQ ID NO38或42或变体的更短或更长序列。更短多肽包括SEQ ID NO38、42或其变体的部分氨基酸序列,并且优选保留了加速ML236B生物合成的能力。更长多肽包括SEQ ID NO38、42或其变体的全部或部分氨基酸序列,并且优选保留了加速ML236B生物合成的能力。更长多肽包括融合蛋白,例如Fc-融合蛋白。
本发明的多肽包括具有序列SEQ ID NO38、SEQ ID NO42、SEQ ID NO44、SEQ ID NO46、SEQ ID NO48之一、或具有相似功能的其变体。本发明还提供了这些多肽的抗体。本发明既提供了多克隆抗体又提供了单克隆抗体。
所述抗体可用于调控ML-236B的生成并产生ML-236B的衍生物如包括帕伐他丁和洛伐他丁的抑制素。并且,所述抗体可优选用于ML-236B生物合成和其调控机制的分析。这种分析可用于调控ML-236B生成及产生ML-236B的衍生物。
具有本发明载体的本发明的宿主细胞可用于一种生产ML-236B的方法中,包括培养这种宿主细胞,然后从该培养物中回收ML-236B。在一种方法中,该载体包括mlcE或mlcR,不包括如mlcA、mlcB、mlcC或mlcD的其它基因。
通过本发明的方法的生产可以在没有相应于SEQ ID NO44、SEQ ID NO46、SEQ ID NO48或SEQ ID NO50的重组mlcA、mlcB、mlcC和/或mlcD(多肽)时进行。
下面将详细描述本发明。
本发明的发明人已克隆出含有参与柑桔青霉中ML-236B的生物合成的基因组DNA。该基因组DNA以下称之为与ML-236B生物合成有关的基因组DNA,并由产ML-236B的微生物的基因组DNA文库克隆。该基因组DNA经分析,发现所述基因组DNA上的结构基因,然后使用含有柑桔青霉的mRNA的总RNA作为模板通过反转录-聚合酶链反应(以下称之为“RT-PCR”)获得相应于所述结构基因的cDNA。发现,当由含有所述cDNA的重组DNA载体转化产ML-236B的微生物时在该产ML-236B的微生物中的ML-236B的生物合成加速。
本发明尤其涉及cDNA(以下称之为加速ML-236B生物合成的cDNA),当将其导入所述产ML-236B的微生物中时它加速该产ML-236B的微生物中的ML-236B的生物合成。
本发明的加速ML-236B生物合成的多核苷酸,例如加速ML-236B生物合成的cDNA,例如包括:
(Ⅰ)使用参与ML-236B的生物合成并存在于产ML-236B的微生物中的基因组DNA中的结构基因的转录产物(信使RNA,以下称之为mRNA)作为模板通过合成获得的DNA;
(Ⅱ)DNA(Ⅰ)与使用DNA(Ⅰ)作为第一链合成的第二链DNA缔合形成的双链DNA;
(Ⅲ)双链DNA(Ⅱ)例如通过克隆等方法复制或扩增形成的双链DNA;
(Ⅳ)可以在严格条件下于上述DNA或mRNA杂交的DNA。DNA(Ⅳ)可以是本文中任意结构基因序列所示的那些,例如序列表中SEQID NO37的第1个核苷酸至第1662个核苷酸或者SEQ ID NO41中第1个核苷酸至第1380个核苷酸,其中一个或多个核苷酸任选地经替换、缺失和/或添加,并且当将其导入产ML-236B的微生物中时它能加速该产ML-236B的微生物中的ML-236B的生物合成。
当两个单链核酸杂交时,它们在彼此互补或高度互补的区域形成双链分子,并且“严格条件”适宜地是指杂交溶液为6×SSC的情况[1×SSC为150mMNaCl和15mM柠檬酸钠的组合物],并且杂交温度为55℃。
加速ML-236B生物合成的cDNA例如可以通过从产ML-236B的微生物的cDNA文库中分离含该cDNA的克隆。或者,可以使用以与ML-236B生物合成有关的基因组DNA的核苷酸序列和产ML-236B的微生物的mRNA或总RNA为基础设计的一对引物进行RT-PCR。
产ML-236B的微生物为固有地具有产生ML-236B的能力的微生物。正如前面所述的,产ML-236B的微生物的例子包括青霉种,例如柑桔青霉、短密青霉、圆弧青霉等。并且其它例子包括:真青霉种M6603、绿色拟青霉FERMP-6236、拟青霉种M2016、长臂木霉M6735、金精隐壳霉IFO7798、胶霉种YJ-9515、绿色木霉IFO5836、网状孢子真青霉IFO9022或任意其它适宜生物体。
在这些产ML-236B的微生物中,优选柑桔青霉,并且更优选柑桔青霉菌株SANK13380。根据微生物保藏的布达佩斯条约,柑桔青霉SANK13380菌株于1992年12月22日以保藏号FERM BP-4129保藏在工业科技署的生命科学和技术研究院。产ML-236B的微生物的例子还包括从天然源分离的那些以及天然或人工突变的那些。
可以用适宜探针筛选产ML-236B的微生物的基因组DNA文库来获得与ML-236B生物合成有关的基因组DNA。适宜地以预测对ML-236B生物合成起作用的DNA序列为基础设计该探针,适宜地来源于丝状真菌。
对创建基因组DNA文库的方法的选择没有限制,可以使用任意适宜方法,优选为构建真核生物的基因组DNA文库的常规方法。其例子包括Maniatis等人的方法[Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]。其它适宜的方法在本领域中为已知。
概括地,可以从所述产ML-236B的微生物的培养物中回收细胞,物理破碎这些细胞,提取存在于其核中的DNA并将所述DNA提纯,获得来自产ML-236B的微生物的基因组DNA。
可以在适合特定产ML-236B的微生物的条件下培养产ML-236B的微生物。例如,将细胞接种于MBG3-8培养基[组成:7%(w/v)甘油、3%(w/v)葡萄糖、1%(w/v)大豆粉、1%(w/v)蛋白胨(由Kyokuto Seivaku Kogyo公司生产)、1%(w/v)玉米浆(由Honen公司生产)、0.5%(w/v)硝酸钠、0.1%(w/v)硫酸镁七水合物(pH6.5)]中,并在22-28℃下摇动培养3-7天,可以将柑桔青霉(一种优选的产ML-236B的微生物)培养。通过将熔融的PGA琼脂培养基[组成:200g/L马铃薯浸出物、15%(w/v)甘油、2%(w/v)琼脂]倒入试管,并以一角度使琼脂固化,从而可以制备贮藏细菌用的斜面。然后使用铂针将柑桔青霉接种于该斜面中,接着在22-28℃下培养7-15天。通过将该斜面贮藏在0-4℃下可以在该斜面上连续地保持以这种方式生长的微生物或细菌。
通过离心可以回收在液体培养基中培养的产ML-236B的微生物的细胞,使用刮刀等从固体培养基刮下可以回收在固体培养基上培养的细胞。
在用液氮等将细胞冷冻之后,使用研棒和研钵研磨这些细胞可以将这些细胞物理破碎。使用例如十二烷基硫酸钠(下文称之为SDS)的表面活性剂或其它适宜的表面活性剂可以提取破碎细胞核心中的DNA。提取的基因组DNA适宜地用苯酚-氯仿处理以除去蛋白质,并通过乙醇沉淀以沉淀物回收。
通过适宜限制酶消化使所得基因组DNA片段化。对可用于限制消化的限制酶没有限制,一般优选可以获得的限制酶。其例子包括Sau3AI。其它适宜的酶在本领域中为已知。经过消化的DNA然后经过凝胶电泳,并从该凝胶中回收具有适宜大小的基因组DNA。DNA片段的大小没有特别的限制,但是优选20kb或之上。
同样,对用于构建基因组DNA文库的DNA载体没有限制,只要该载体具有在通过该载体转化的宿主细胞中复制所必需的DNA序列。适宜载体的例子包括质粒载体、噬菌体载体、粘粒载体、BAC载体等,优选粘粒载体。该DNA载体优选为表达载体。更优选地,该DNA载体包括在通过该载体转化的宿主细胞上赋予选择性表型的DNA或核苷酸序列。
该DNA载体适宜地为能用于克隆和表达的载体。优选地,该载体为能用于转化一个以上微生物宿主的穿梭载体。该穿梭载体适宜地具有能在宿主细胞中复制的DNA序列,并优选能在来自不同微生物组如细菌和真菌的大量不同宿主细胞中复制的序列。而且,该穿梭载体优选含有一能向一定范围的不同宿主细胞,例如来自不同微生物组的细胞提供选择性表型的DNA序列。
微生物组和通过该穿梭载体转化的宿主细胞的组合的选择没有特别限制,只要微生物组之一可用于克隆,另一具有产ML-236B的能力。这种组合例如可以是细菌与丝状真菌的组合,酵母与丝状真菌的组合,细菌与丝状真菌的组合为优选。对细菌的选择没有特别限制,只要它一般能用于生物工程,例如大肠杆菌、枯草芽胞杆菌等。优选大肠杆菌,更优选大肠杆菌XL1-Blue MR。相似地,对酵母种没有限制,只要它一般能用于生物工程,例如酿酒酵母等。丝状真菌的例子包括上述产ML-236B的微生物。微生物的其它适宜例子在本领域中为已知。
在本发明中,微生物组可选自细菌、丝状真菌和酵母。
上述穿梭载体的例子包括具有用于选择表型和cos位点的适宜标记基因的粘粒载体。其它适宜的载体在本领域中为已知。优选的载体为pSAKcosl,它是将来自粘粒载体pWE15(由STRATAGENE生产)的cos位点插入质粒pSAK333中构建的,含有大肠杆菌潮霉素B磷酸转移酶基因序列[记载于JP-平3-262486A]。构建pSAKcosl的一种方法示于图1中。本发明不限于该载体。
通过将穿梭载体引入宿主细胞可以制备基因组DNA文库,所述载体含有来自产ML-236B的微生物的基因组DNA片段。所用宿主细胞优选为大肠杆菌,更优选为大肠杆菌XL1-Blue MR。当宿主细胞为大肠杆菌时,可以通过体外包装进行引入。在本发明中,转化还包括通过体外包装引入外来DNA,并且转化的细胞还包括通过体外包装引入外来DNA的细胞。
可以使用抗体或核酸探针对基因组文库进行筛选以鉴定所需的克隆,优选使用核酸探针。优选以聚酮化合物生物合成有关的基因或DNA的核苷酸序列(优选由丝状真菌获得的序列)为基础制备该核酸探针。对特定基因的选择没有限制,只要其包含在聚酮化合物的生物合成中,并且其核苷酸序列为已知。这些基因的例子包括黄曲霉和寄生曲霉的黄曲霉毒素PKS基因、构巢曲霉的柄曲霉素PKS基因等。
例如通过合成含有上述已知基因组DNA序列部分的寡核苷酸探针、或者使用聚合酶链反应[下文称之为“PCR”,记载于Saiki,R.K.倒入的“科学”239,487(1988)]并使用基因组DNA为模板通过制备寡核苷酸引物并扩增靶DNA、或者使用mRNA为模板通过RT-PCR,可以获得适宜的核酸探针。获得这些探针的其它适宜方法在本领域中众所周知。
可以由产ML-236B的微生物例如使用PCR或RT-PCR获得核酸探针。优选以与聚酮化合物生物合成有关的基因的核苷酸序列(该核苷酸序列为已知)为基础进行用于PCR或RT-PCR的引物(下文称之为“用于PCR的引物)的设计。优选该基因为黄曲霉、寄生曲霉的黄曲霉毒素PKS基因、或者构巢曲霉的柄曲霉素PKS基因。
用于PCR的引物经适宜设计以含有编码在PKS基因中高度保守的氨基酸序列的核苷酸序列。鉴定相应于给定氨基酸序列的核苷酸序列的方法包括以宿主细胞的密码子使用为基础的推断法和使用多密码子制备混合寡核苷酸序列的方法(下文称之为“简并寡核苷酸”)。在后面的情况下,通过向其核苷酸序列引入次黄嘌呤可以降低寡核苷酸的多重性。
用于PCR的引物可以包括经设计与模板链退火的核苷酸序列,该引物与添加的5′序列相连。对这种添加的5′核苷酸序列的选择没有特别限制,只要该引物可用于PCR或RT-PCR。这种添加的5′序列例如可以为易于PCT产物克隆操作的核苷酸序列。这种核苷酸序列例如可以为限制酶切割位点或含有限制酶切割位点的核苷酸序列。
而且,在设计用于PCR的引物时,优选鸟嘌呤(G)和胞嘧啶(C)碱基的总数为碱基总数的40-60%。而且,优选给定引物几乎没有或者没有自退火,在成对引物情况下,优选在引物之间几乎没有或者没有退火。
组成用于PCR的引物的核苷酸的数量没有特别限制,只要它可用于PCR。该数量的下限一般为10-14个核苷酸,上限为40-60个核苷酸。优选地,引物为14-40个寡核苷酸长。
用于PCR的引物优选为DNA。引物中的核苷酸可以为脱氧腺嘌呤、脱氧胞嘧啶、脱氧胸腺嘧啶和脱氧鸟嘌呤,以及其它脱氧肌苷。在用于PCR的引物的5′-端的核苷酸的5′-位置适宜为一羟基或者通过酯键与一磷酸相连的羟基。
可以通过常用于合成核酸的方法,例如亚磷酰胺法,合成用于PCR的引物。可优选将自动化DNA合成器用于该方法。
来自产ML-236B的微生物的基因组DNA和mRNA可分别用作PCR或RT-PCR的模板。总RNA也可代替mRNA用作RT-PCR的模板。
PCR产物或RT-PCR产物可通过插入适宜DNA载体克隆。对用于该克隆步骤的DNA载体的选择一般没有限制。易于PCR和RT-PCR产物克隆的试剂盒可商购获得。例如,Orignal TA Cloning Kit(由Invitrogen生产;使用pCR2.1为DNA载体)适宜用于这种克隆。
为了获得经过克隆的PCR产物,将含有所需PCR产物的质粒的转化过的宿主细胞培养,然后将这些质粒从这些细胞中提取并提纯。然后从所得质粒中回收插入的DNA片段。
在适合宿主细胞的条件下将转化过的宿主细胞进行适宜培养。优选的宿主细胞,大肠杆菌,可以在LB培养基[1%(w/v)胰蛋白胨、0.5%(w/v)酵母浸出物、0.5%(w/v)氯化钠]中在30-37℃下摇动培养18小时至2天。
通过回收宿主细胞并使质粒分离成不含其它细胞组分如基因组DNA或宿主蛋白,可以制备来自转化过的宿主细胞的培养物的质粒。按照Maniatis的碱性法[Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]可以制备来自大肠杆菌培养物的质粒DNA。用于获得具有高纯度质粒的试剂盒可商购获得。优选Plasmid Mini Kit[由QIAGENAG生产]。而且,用于大量生产质粒的试剂盒可商购获得。优选Plasmid Maxi Kit(由QIAGENAG生产)。
在DNA样品适当稀释之后,可以在260nm的波长下通过测定吸光度,并以吸光度OD260为1的溶液含有50μg/ml DNA为基础计算来确定所得质粒DNA的浓度(记载于Maniatis等人的,参见上面)。
由波长在280和260nm下的吸光度的比可以计算DNA的纯度(记载于Maniatis等人的,参见上面)。
标记核酸探针的方法通常分为放射性标记和非放射性标记。对用于放射性标记的放射性核苷酸的选择一般没有限制,并且例如可以为32P、35S、14C等。优选在标记中使用32P。对用于非放射性标记的试剂的选择一般也没有限制,只要它可常用于标记核酸,并且例如可以为地高辛配基、生物素等,优选地高辛配基。
核酸探针的标记方法一般也没有限制。优选常用方法,例如将探针插入使用标记的核苷酸底物通过PCR或RT-PCR获得的产物中的方法、切口平移法、使用随机引物、末端标记法以及使用标记过的核苷酸底物合成寡核苷酸DNA的方法。适宜方法可以根据核酸探针的种类从这些方法中选择。
通过与所述产ML-236B的微生物的基因组DNA的Southern印迹杂交,可以证实产ML-236B的微生物的基因组中存在的核苷酸序列与特定核酸探针的核苷酸序列相同。
按照Maniatis的方法(记载于Maniatis等人的,参见上面)可以进行Southern印迹杂交。
如上所述制备的标记过的核酸探针可用于筛选基因组DNA文库。对筛选方法的选择没有特别限制,只要它一般适宜基因克隆,但优选该克隆杂交法[记载于Maniatis等人的,参见上面]。
将用于菌落杂交的菌落在适合宿主细胞的条件下进行适宜培养。可以将一种优选宿主——大肠杆菌通过在LB琼脂培养基[1%(w/v)胰蛋白胨、0.5%(w/v)酵母浸出物、0.5%(w/v)氯化钠、1.5%(w/v)琼脂糖]中在30-37℃下培养18小时至2天进行培养。
通常通过从阳性克隆的培养物中提取质粒并将其提纯来制备来自通过菌落杂交获得的阳性克隆的重组DNA载体。
根据微生物保藏的布达佩斯条约,根据本发明获得的代表阳性克隆的转化大肠杆菌菌株,大肠杆菌pML48 SANK71199于1999年7月7日保藏在工业科技署的生命科学和技术研究院,并且记录的登记号为FERM BP-6780。
由大肠杆菌pMIA8 SANK71199携带的典型DNA载体被命名为pMIA8。
通过测定重组DNA载体插入片段的核苷酸序列、Southern印迹杂交或该插入片段表达以确定功能,可以适宜地评价证实存在于阳性克隆中的重组DNA载体含有与ML-236B生物合成有关的基因组DNA。
可以根据Maxam和Gilbert化学修饰技术[记载于Maxam,A.M.M.和Gilbert,W.的“酶学方法”65,499(1980)]或双脱氧链终止法[记载于Messing,J.和Vieira,J.的“基因学”19,269(1982)]测定DNA的核苷酸序列。其它适宜方法在本领域中众所周知。如上所述,用于测定核苷酸序列的质粒DNA优选为高纯度样品。
pML48插入片段的核苷酸序列示于序列表的SEQ ID NO1。在序列表的SEQID NO2中所示的核苷酸序列与SEQ ID NO1所示的核苷酸序列完全互补。通常,在一个种中基因组DNA的核苷酸序列能够具有遗传多态性,即同种异型差异。而且,在DNA克隆和测序过程中,已知核苷酸替代或其它改变可以一定频率发生。因此,本发明中与ML-236B生物合成有关的基因组DNA还包括可与序列表的SEQ ID NO1或2的第1个核苷酸至第34203个核苷酸的DNA杂交的基因组DNA和其它DNA。优选基因组或其它DNA可以在严格条件下与序列表的SEQ ID NO1或2的第1个核苷酸至第34203个核苷酸的DNA杂交,其中一个或多个核苷酸被替代、缺失和/或添加。此外,这些杂交基因组或其它DNA可以包括来源于除柑桔青霉SANK13380的产ML-236B的微生物的DNA。优选当将其导入产ML-236B的微生物中时它们能提高ML-236B的产量。
适宜地根据以下方法1)-3)分析与ML-236B生物合成有关的基因组DNA。
1)用基因分析软件分析
可以使用寻找基因的程序(下文称之为“GRAIL”)和检索同源序列的程序(BLASTN和BLASTX)定位基因组DNA内的基因。
GRAIL为检索基因组DNA中的结构基因的程序:通过将基因组序列分成7个评价基因序列外观的参数,使用神经网络法整合结果[记载于Uberbacher,E.C.和Mural,R.J.的“美国国家科学院院报”88,11261(1991)]。例如可以使用ApoComGRAIL Toolkit[由Apocom公司生产]。
BLAST为使用进行核苷酸序列和氨基酸序列同源性检索的算法的程序[记载于Altschul,S.F.、Madden,T.L.等人“核酸检索”25,3389(1997)]。
通过将DNA序列分成适宜长度并使用BLASTN进行遗传数据库的同源性检索,可以预测在样品基因组DNA序列上结构基因的定位和方向。在待测DNA序列上结构基因的定位和方向还可以通过将细分的基因组DNA序列翻译成6个翻译片段(三个在有义链上,其它三个在反义链上)并使用BLASTX在肽数据库中进行所得氨基酸序列的同源性检索来进行预测。
在真核生物体中基因组DNA中的结构基因的编码区有时与内含子断裂。为了分析具有这些缺口的结构基因,用于含缺口序列的BLAST程序更有效,优选有缺口的BLAST程序(安装于BLAST2:WISCONSIN GCG包10.0版)。
2)根据Northern印迹杂交法分析
可以使用Northern印迹杂交法研究通过段1)中所述分析方法预测的结构基因的表达。
适宜地,来自产ML-236B的微生物的总RNA从微生物培养物中获得。优选产ML-236B的微生物柑桔青霉的培养物可通过以下获得:将来自斜面的所述微生物接种到MGB3-8培养基中,接着摇动培养,在22-28℃下培养1-4天。
对从产ML-236B的微生物中提取RNA的方法的选择没有限制,优选硫氰酸胍-热酚法、硫氰酸胍-盐酸胍法等。用于制备高纯度总RNA的可商购获得的试剂盒的例子包括RNeasy Plant Mini Kit(由Qiagen AG生产)。而且,通过将总RNA涂敷到寡(dT)柱上并回收吸附在该柱中的组分可以获得mRNA。
可以与上述Southern印迹杂交法相似的方式向膜转移RNA、制备探针、杂交并监测信号。
3)转录物的5′-端和3′-端的分析
可以按照“RACE”(快速扩增cDNA末端)法分析每个转录物的5′-端和3′-端。RACE为使用以mRNA为模板的RT-PCR获得在基因的5′-端或3′-端含有已知核苷酸区和未知区的cDNA的方法[记载于Frohman,M.A.的“酶学法”218,340(1998)]。
可以按照以下方法进行5′-RACE。使用mRNA为模板根据反转录酶反应合成cDNA的第一链。作为引物,使用对核苷酸序列的已知部分经设计的反义寡核苷酸(1)。使用末端脱氧核苷酸转移酶将一均聚核苷酸链(由一种碱组成)加到该cDNA第一链的3′-端。然后,使用cDNA的第一链作模板通过PCR将5′-端区域中的双链cDNA扩增。为了扩增,使用2个引物;来自含有与均聚序列互补的序列的有义链的DNA寡核苷酸以及在反义链上且在寡核苷酸DNA(1)的3′-端侧的寡核苷酸(2)[记载于Frohman,MA.的“酶学法”218,340(1993)]。有义5′-RACE的试剂盒可商购获得,适宜地为用于快速扩增cDNA端的5′RACE系统,2.0版(由GIBCO公司生产)。
3′RACE为一种使用存在于mRNA的3′-端的多腺苷酸区的方法。具体地说,使用mRNA为模板以及寡d(T)衔接子为引物通过反转录酶反义合成cDNA的第一链。然后,使用该cDNA的第一链为模板通过PCR在3′-端扩增双链cDNA。作为引物,使用在有义链上根据有义链的核苷酸序列的已知部分经设计的DNA寡核苷酸(3)以及反义链上的寡d(T)衔接子。用于3′RACE的试剂盒可商购获得,适宜地有Ready-To-GoT-primed First-StrandKit(Phramacia公司)。
在以感兴趣核苷酸序列的已知部分为基础的引物设计中,优选将上面1)和2)的分析结果用于该RACE步骤。
使用上面1)-3)中的分析方法,可以推断结构基因在基因组DNA序列上的方向,转录起始位点位于结构基因中的定位、翻译起始密码子和翻译终止密码子位于其中的位置。以上述信息为基础,可以获得每个结构基因及其cDNA,即加速ML-236B生物合成的cDNA。
假设在根据本发明获得的重组DNA载体pML48中6个结构基因存在于该插入的序列上。它们被分别命名为mlcA、mlcB、mlcC、mlcD、mlcE和mlcR。其中,假设在序列表的SEQ ID NO2所示的核苷酸序列上mlcA、mlcB、mlcE和mlcR具有编码区。假设在序列表的SEQ ID NO1所示的核苷酸序列上mlcC和mlcD具有编码区。
获得相应于上述结构基因的特定加速ML-236B生物合成的cDNA的方法的例子包括:使用基于每个结构基因的序列及其侧翼DNA设计的引物用RT-PCR克隆,使用基于已知核苷酸序列设计的适宜DNA探针由cDNA文库克隆。其它适宜方法在本领域中为公众所知。为了在功能上表达根据这些方法获得的cDNA,优选获得全长cDNA。
下面解释使用RT-PCR获得加速ML-236B生物合成的cDNA的方法。
用于RT-PCR并用于获得加速ML-236B生物合成的cDNA的一对引物需要经设计,以便它选择性地与每个模板链退火,从而获得cDNA。然而,用于RT-PCR的引物与每对模板链完全互补并不是必要的,只要它们满足上述条件。用于RT-PCR能与反义链退火的适宜引物(下文称之为“有义引物”)为与一对反义链完全互补的有义引物(下文称之为“未替代的有义引物”)或者为与一对反义链不完全互补的有义引物(下文称之为“部分替代的有义引物”)。用于RT-PCR且能与有义链退火的其它适宜引物(下文称之为“反义引物”)为与一对有义链完全互补的反义引物(下文称之为“未替代的反义引物”)或者为与一对有义链不完全互补的反义引物(下文称之为“部分替代的反义引物”)。
有义引物经适宜设计,以便使用其获得的RT-PCR产物在翻译起始的起始位置含有密码子ATG。该RT-PCR产物适宜地还仅在具有原始ATG起始位点的读框中含有正确翻译终止密码子,并且没有其它(假)翻译终止位点。本发明预测的这些结构基因的翻译起始密码子的位置示于用于定位于序列表的SEQID NO1和SEQ ID NO2中的基因的表5中。
未替代的有义引物的5’-端适宜地为翻译起始密码子ATG的核苷酸“A”或者存在于其5’-端的碱基。
部分替代的有义引物选择性地与序列表的SEQ ID NO1或SEQ ID NO2中的特定区退火,序列表的SEQ ID NO2的核苷酸序列与序列表SEQ ID NO2的核苷酸序列完全互补。
当部分替代的有义引物含有存在于翻译起始密码子ATG的3’-端的核苷酸序列时,在该区域它适宜地不含在与该ATG相同的读框中为终止密码子(TAA、TAG或TGA)的核苷酸序列。
部分替代的有义引物可以含有核苷酸“A”、核苷酸序列“AT”或“ATG”(下文称之为“核苷酸或核苷酸序列m′”),它们与翻译起始密码子的核苷酸“A”、核苷酸序列“AT”或“ATG”(下文称之为“核苷酸或核苷酸序列m”)相对应。当该核苷酸m′为与序列“m”的“A”相对应的“A”时,我们优选m′“A”位于部分替代的有义引物的3′-端。类似地,当m′为“AT”时,我们优选该m′“AT”序列位于部分替代的有义引物的3′-端。当该核苷酸或核苷酸序列m为相应于m′“ATG”的“ATG”时,我们优选这些为引物中的3’-ATG的三核苷酸不是终止密码子。换句话说,对三核苷酸而言,其中在3′-端方向从m′“ATG”的A数起5′-端核苷酸为第(3×n+1)个核苷酸(n代表≥1的整数),该三核苷酸的核苷酸序列优选既不是TAA、TAG,也不是TGA。上述引物可用于获得在相应于用作RT-PCR模板的mRNA的翻译起始密码子的位置具有甲硫氨酸密码子的cDNA。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+1)时,在使用部分替代的有义引物作为一个引物并且产ML-236B的微生物的RNA或mRNA为模板获得的RT-PCR产物中,或者在使用基因组DNA或cDNA为模板获得的PCR产物中,从该位置开始的该三核苷酸最好不是TAA、TAG或TGA。在3′-端方向从翻译起始密码子“ATG”的“A”计数该核苷酸位置,其中“n”代表1的整数。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+2)时,位置3×n+2为中心核苷酸的三联体最好不是上面获得的PCR或RT-PCR产物的序列TAA、TAG或TGA。
当部分替代的有义引物的3′-端为核苷酸位置(3×n+3)时,位置(3×n+3)为该3′核苷酸的三联体最好不是序列TAA、TAG或TGA。
对有义引物的要求如上面讨论的。
设计一反义引物,以便当与有义引物一起配对时,编码每个结构基因(mlcA、mlcB、mlcC、mlcD、mlcE和mlcR)的cDNA可以使用RT-PCR在与相应肽的N-端至C-端相同的方向扩增。
对未替代的反义引物的选择没有限制,只要它为具有与位于cDNA的翻译终止位点区的核苷酸序列互补的核苷酸序列的反义引物。然而,优选具有与翻译终止密码子的3′端的碱基互补的5′-端碱基的引物,或者具有在所示引物碱基的5′-端的碱基的引物。更优选含有三个与翻译终止密码子互补的碱基的引物。表8-10显示了每个结构基因的翻译终止密码子,与该翻译终止密码子互补的序列、在每个结构基因编码的肽的C-端的氨基酸残基、编码该氨基酸残基的核苷酸序列、及其在SEQ ID NO1或SEQ ID NO2的位置。
部分替代的反义引物选择性地与序列表的SEQ ID NO1或SEQ ID NO2的核苷酸序列中的特定区域退火。
上面是对反义引物的要求。
可以向部分替代的有义引物和部分替代的反义引物的5′-端插入适宜的核苷酸序列,只要满足上述要求。对这种核苷酸序列的选择没有特别限制,只要该引物可用于PCR。适宜序列的例子包括便于PCR产物克隆的核苷酸序列,例如限制酶切割位点和含有适宜限制酶切割位点的核苷酸序列。
此外,根据上述说明并根据用于PCR的引物的常规设计,将该有义引物和反义引物适宜地设计。
如上所述,来自产ML-236B的微生物的mRNA或总RNA可用作RT-PCR的模板。在本发明中,相应于结构基因mlcE的加速ML-236B生物合成的cDNA是通过设计和合成适宜扩增pML48插入片段序列中结构基因mlcE的所有编码区的一对引物,然后使用SANK13380的总RNA作模板[序列表中核苷酸序列SDQ ID NO35和36分别代表的引物]进行RT-PCR获得的。
使用序列表的核苷酸序列SEQ ID NO39和40所代表的引物以相似方式获得相应于结构基因mlcR的加速ML-236B生物合成的cDNA。
如上所述,该RT-PCR产物可以通过插入到适宜DNA载体中经克隆。对用于这种克隆的DNA载体的选择没有限制,它适宜地为常用于DNA片段克隆的DNA载体。易于进行RT-PCR产物克隆的试剂盒可商购获得。并优选Original TA Cloning Kit[由Invitrogen生产:使用pGR2.1作DNA载体]。
通过将cDNA克隆到适合在产ML-236B的微生物中功能性表达的DNA载体中,可以获得在产ML-236B的微生物中使用上面方法获得的加速ML-236B生物合成的cDNA的功能性表达的证明。然后用重组DNA载体转化适合的细胞,并将转化细胞的ML-236B生物合成能力与未转化的宿主细胞比较。如果在转化细胞中功能性地表达加速ML-236B生物合成的cDNA,那么与宿主细胞的ML-236B生物合成能力相比,转化细胞的ML-236B生物合成能力得到提高。
对适合在产ML-236B的微生物中表达的DNA载体[下文称之为功能性表达载体]的选择没有特别限制,只要它可用于转化产ML-236B的微生物并且可以功能性地表达在该生物体中由加速ML-236B生物合成的cDNA编码的多肽。优选该载体在宿主细胞中稳定,并且具有能在宿主细胞中复制的核苷酸序列。
用于功能性表达的载体可以含有一个以上加速ML-236B生物合成的cDNA,例如相应于结构基因mlcE和/或mlcR的cDNA。
除导入产ML-236B的微生物中时加速ML-236B生物合成且相应于结构基因mlcE和/或mlcR的cDNA之外,用于功能性表达的载体可以含有一种以上的DNA。这种DNA的例子包括:相应于结构基因mlcA、mlcB、mlcC或mlcD的cDNA、与ML-236B生物合成有关的基因组DNA、编码本发明的加速ML-236B生物合成的cDNA的表达调节因子的DNA等。
用于功能性表达的载体优选包括向宿主细胞中的质粒提供选择性表型的核苷酸序列,并优选为穿梭载体。
而且,该选择性表型可以为药物抗性表型等,优选抗抗生素,更优选抗氨苄西林或者抗潮霉素B。
当表达载体为穿梭载体时,该载体适宜地含有允许该载体在一微生物组的宿主细胞中复制的核苷酸序列,以及由该载体插入片段编码的多肽在另一宿主细胞类型中表达所必需的核苷酸序列。优选该载体向转化的不同微生物组的每个宿主细胞提供不同选择性表型。微生物组组合的要求与用于本说明书中所述与ML-236B生物合成有关的DNA的克隆和表达的穿梭载体的要求相似。
在本发明中,适宜的穿梭载体DNA载体为pSAK700,它是由来源于存在于DNA载体pSAK333的构巢曲霉(记载于JP-平3-262486A)的3-磷酸甘油酯激酶(下文称之为“pak”)、用于插入外来基因的衔接子和存在于该DNA的pgk终止子按该顺序(参见图4)组合构建的。
通过将相应于上述结构基因mlcE的cDNA插入上述的表达载体中,可以在产ML-236B的微生物中表达多肽。在本发明中,已通过将相应于结构基因mlcE的cDNA插入pSAK700的衔接子位点获得重组cDNA表达载体pSAKexpE。在pSAKexpE中插入的序列,即相应于结构基因mlcE的cDNA的核苷酸序列示于序列表的SEQ ID NO37中。类似地,已通过将相应于结构基因mlcR的cDNA插入pSAK700的衔接子位点获得重组cDNA表达载体pSAKexpR。在pSAKexpR中插入的序列,即相应于结构基因mlcR的cDNA的核苷酸序列示于序列表的SEQ ID NO41中。
大肠杆菌pSAKexpE SANK72499,为由pSAKexpE转化的大肠杆菌菌株,根据微生物保藏的布达佩斯条约,2000年1月25日以保藏号FERM BP-7005保藏在工业科技署的生命科学和技术研究院。大肠杆菌pSAKexpR SANK72599,为由pSAKexpR转化的大肠杆菌菌株,根据微生物保藏的布达佩斯条约,2000年1月25日以保藏号FERM BP-7006保藏在工业科技署的生命科学和技术研究院。
可以根据宿主细胞适当地选择适合的转化方法,从而获得加速ML-236B生物合成的cDNA的表达、与ML-236B生物合成有关的基因组DNA或其片段。柑桔青霉(一种优选的产ML-236B的微生物)的转化可以通过以下进行:由柑桔青霉孢子制备原生质体,然后将重组DNA载体导入该原生质体[记载于Nara,F.等人的“当前基因技术”23,28(1993)]。
适宜地将来自柑桔青霉培养物斜面的孢子接种到PGA琼脂培养基的平皿上并在22-28℃下培养10-14天。然后从该平皿收获这些孢子,并将1×107-1×109个孢子接种到50-100ml YPL-20培养基[组成:0.1%(w/v)酵母浸出物(由Difco公司生产)、0.5%(w/v)聚胨(由Nihon Seiyaku公司生产)、20%(w/v)乳糖,pH5.0]中,然后在22-28℃下培养18小时-2天。从培养物中回收萌发孢子,并用细胞壁降解酶处理,从而获得原生质体。对细胞壁降解酶的选择没有特别限制,只要其可降解柑桔青霉的细胞壁,并且对微生物没有有害影响。其例子包括:酶解酶、壳质酶等。
在适宜条件下将含有加速ML-236B生物合成的cDNA的重组DNA载体和产ML-236B的微生物或其原生质体混合使重组DNA载体导入所述原生质体中,从而提供转化体。
在适合每个宿主细胞的条件下对产ML-236B的微生物的转化体进行适宜培养。柑桔青霉,一种优选的产ML-236B的微生物,的培养可以通过以下进行:在适宜再生细胞壁的条件下培养预先转化的原生质体,然后培养。即,可以将柑桔青霉的转化原生质体加入VGS中间层琼脂培养基[组成:Vogel最小化培养基、2%(w/v)葡萄糖、1M葡糖醇、2%(w/v)琼脂]。然后将该VGS中间层琼脂夹在VGS下层琼脂培养基[组成:Vogel最小化培养基、2%(w/v)葡萄糖、1M葡糖醇、2.7%(w/v)琼脂]和含800μg/ml潮霉素B的VGS上层琼脂培养基[组成:Vogel最小化培养基、2%(m/v)葡萄糖、1M葡糖醇、1.5%(w/v)琼脂]之间,然后在22-28℃下培养7-15天。所得菌株在PGA培养基上在22-28℃下温育进行传代培养。用铂针将该菌株接种到由PGA培养基制成的斜面上,在22-28℃下培养10-14天,然后在0-4℃下保藏。
如上所述,通过将从所述斜面获得且具有再生细胞壁的柑桔青霉转化体接种到MBG3-8培养基中,接着摇动在22-28℃下培养7-12天,可以有效地生产ML-236B。作为宿主的柑桔青霉可以在液体培养基中培养,也可以产生ML-236B。
通过将用于提纯天然产物的不同方法组合,可以提纯来自产ML-236B的微生物的转化体的培养物的ML-236B。对这些方法的选择没有特别限制,例如可以是通过离心、过滤分离固体和液体、用碱或酸处理、用有机溶剂提取、溶解、如吸附色谱法、分配色谱法等的色谱法、以及结晶法等。ML-236B可以为羟酸或内酯形式,它们可以相互转换。羟酸可转变成其更稳定的盐。使用这些物理性能,可以获得ML-236B羟酸形式(下文称之为羟酸)、ML-236B羟酸的盐(下文称之为羟酸盐)或者ML-236B内酯形式(下文称之为内酯)。
为了将环打开并转变成羟酸盐,该培养物在高温或室温下经过碱水解,然后反应溶液经酸化,接着过滤。滤液用有机溶剂提取,使其与水分离,从而得到为自由羟酸的想要产物。对有机溶剂的选择没有特别限制。其例子包括:脂族烃如己烷、庚烷等;芳族烃如苯、甲苯等;卤代烃如二氯甲烷、氯仿等;醚如二乙醚等;酯如甲酸乙酯、乙酸乙酯等;或由两种或多种溶剂组成的混合物。
可以将该自由羟酸溶于如氢氧化钠的碱金属盐水溶液中以羟酸盐形式获得想要化合物。
而且,可以通过在脱水的有机溶剂中加热自由羟酸或者通过其它适宜方法以内酯获得想要化合物。
可以使用柱色谱法等提纯和分离因此获得的自由羟酸、羟酸或内酯。用于色谱法的柱的载体没有特别限制。其例子包括:Sephadex LH-20(由Pharmacia公司生产)、Diaion HP-20(由Mitsubishi Kagaku公司生产)、硅胶、逆相载体等,优选C18系列载体。
对ML-236B的定量方法的选择没有特别限制,优选常用于定量有机化合物的方法。其例子包括:逆相高效液相色谱法(下文称之为“逆相HPLC”)等。按照逆相HPLC的定量如下:通过使产ML-236B的微生物的培养物经过碱水解,使用C18柱使水溶性部分经过逆相HPLC,测定UV吸收,将吸收值转换成ML-236B的量。对C18柱的选择没有特别限制,液相用于常规逆相HPLC的C18柱。其例子包括:SSC-ODS-262(直径6mm,长100mm,由Senshu Kagaku公司生产)等。对用于移动相的溶剂的选择没有特别限制,只要它为常用于逆相HPLC的溶剂。例如它为75%(w/v)甲醇-0.1%(w/v)三乙胺-0.1%(w/v)乙酸等。当在室温下将ML-236B加入SSC-ODS-262柱时,在使用75%(w/v)甲醇-0.1%(w/v)三乙胺-0.1%(w/v)酸作为以2ml/min的速度的移动相时,4.0分钟之后将ML-236B冲洗。使用用于HPLC的UV检测器测定ML-236B。用于UV测定的吸收波长为220-280nm,优选220-260nm,更优选236nm。
提供了含有使用本发明获得的ML-236B和药用载体的药用组合物。
还提供了含有由使用本发明获得的ML-236B转变的帕伐他丁和药用载体的药用组合物。
本发明的药用组合物可以为常规以及与ML-236B或帕伐他丁的现有制剂所用的相同。
治疗方法也为本发明的一部分,使用这些化合物或组合物治疗高脂血和其它病症。
现在参照以下附图和实施例更详细地描述本发明。这些实施例为描述性,并不用于限制本发明。
图1为DNA载体pSAKcosl的结构的图示图;
图2为pML48的插入序列的结构基因分析的结果;
图3显示了pML48的插入序列的Northern印迹杂交。
图4为cDNA表达载体pSAK700的结构的图示图;和
图5显示了用于在pSAKexpR转化体中转录mlcA-E和R的RT-PCR分析。
图5显示了用于在pSAKexpE转化体中转录mlcE的RT-PCR分析。
实施例1:pSAKcosl载体的构建
来源于大肠杆菌(JP-平3-262486A)的含有潮霉素B磷酸转移酶基因(下文称之为“HPT”)的质粒pSAK333用限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)消化,经处理形成具有T4DNA聚合酶(由日本Takara Shuzo有限公司生产)的平端。
如上面获得的DNA片段使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)自连接成环状,然后用其转化大肠杆菌的感受态细胞JM109(由日本Takara Shuzo有限公司生产)。从转化大肠杆菌中选择具有缺失BamHⅠ位点的质粒的菌株,并命名为pSAK360。
pSAK360用限制酶PvuⅡ消化,然后用碱性磷酸酶处理,产生在5′-端去磷酸化的片段。由粘粒载体pWE15(由STRATAGENE生产)获得含有cos位点的SalⅠ-ScaⅠ片段(约3kb)并经处理形成具有T4DNA聚合酶的平端。接着将其连接到pSAK360的PvuⅡ位点上。JM109用该DNA转化。从转化大肠杆菌中选择质粒中在PvuⅡ位点插入SalⅠ-ScaⅠ片段(约3kb)的这些菌株,并将这些菌株所载有的质粒命名为pSAKcosl。pSAKcosl含有用于限制酶BamHⅠ、EcoRⅠ和NotⅠ的切割位点,每个位点来源于pWE15。pSAKcosl具有一抗氨苄西林的基因和抗潮霉素的基因作为选择标记。
在以下实施例中,当将大肠杆菌用作宿主时,通过将40μg/ml氨苄西林(氨苄西林:由Sigma公司生产)加入相关培养基中进行pSAKcosl转化体、或者含外来基因插入片段的pSAKcosl的转化体的选择。当柑桔青霉SANK13380用作宿主时,通过将200μg/ml潮霉素(潮霉素B:由Sigma公司生产)加入相关培养基中进行pSAKcosl转化体、或者含外来基因插入片段的pSAKcosl的转化体的选择。
pSAKcosl的构建方法示于图1中。
实施例2:制备柑桔青霉SANK13380的基因组DNA
1)柑桔青霉SANK13380的培养物
在PGA琼脂培养基的斜面上进行柑桔青霉SANK13380的种子培养。即,使用铂针向琼脂接种柑桔青霉SANK13380,并在26℃下保持14天。将该斜面保持在4℃下。
通过液体充气培养进行主培养。将来自5mm2的上述斜面的细胞接种在于500ml锥形瓶中的50ml MBG3-8培养基中,在26℃下边以210rpm摇动培养5天。
2)由柑桔青霉SANK13380制备基因组DNA
在室温下将步骤1)中获得的培养物在10000×G下离心10分钟,并将细胞收获。在用干冰冷却的研钵中将3g(净重)细胞破碎,使其为粉末状。将这些破碎的细胞放在填充有20ml 62.5mM EDTA-2Na(由Wako Pure Chemical Industries有限公司生产)-5%(w/v)SDS-50mM Tris-HCl(由Wako Pure Chemical Industries有限公司生产)缓冲液(pH8.0)的离心管中,缓慢混合,然后在0℃下静置1小时。向其中添加10ml用10mM Tris-HCl-0.1mM EDTA.2Na(pH8.0,下文称之为“TE”)饱和的苯酚,然后将该混合物在50℃下缓慢搅拌1小时。
在室温下以10000×G离心10分钟之后,将15ml上层(水相)放入另一离心管中。向该溶液中加入0.5倍体积的TE饱和的苯酚和0.5倍体积的氯仿溶液。将该混合物搅拌2分钟,在室温下以10000×G离心10分钟(下文称之为“苯酚氯仿提取液”)。向10ml上层(水相)中加入10ml 8M乙酸铵(pH7.5)和25ml 2-丙醇(由Wako Pure Chemical Industries有限公司生产),接着在80℃下冷却15分钟,并在4℃下以10000×G离心10分钟。
沉淀之后,将沉淀物溶于5ml的TE中,之后向其中加入20μl的10mg/ml核糖核酸酶A(由Sigma公司生产)和250U核糖核酸酶T1(由GIBCO公司生产),接着在37℃下培养20分钟。将20ml 2-丙醇加入其中,缓慢混合。接着,将几缕基因组DNA汇集在巴氏滴管的尖端,并溶于1mlTE中。
接下来,将0.1倍体积的3M乙酸钠(pH6.5)和2.5倍体积的乙醇加入该DNA溶液中。将该溶液在-80℃下冷却15分钟,然后在4℃下以10000×G离心5分钟(下文称之为“乙醇沉淀”)。所得沉淀物溶于200μl的TE中,即为基因组DNA部分。
实施例3:柑桔青霉SANK13380的基因组DNA文库的制备
1)基因组DNA片段的制备
将0.25U的Sau3AⅠ(日本Takara Shuzo有限公司)加入100μl的实施例2中获得的柑桔青霉SANK13380的基因组DNA(50μg)的水溶液中。间隔10、30、60、90和120秒后,取出20μl混合物样品,向每个样品中加入0.5M EDTA(pH8.0),使限制酶反应终止。通过琼脂糖凝胶电泳将所得部分消化过的DNA片段分离,回收含有30kb以上DNA片段的琼脂糖凝胶。
将所回收的凝胶细碎,放入Ultra Free C3离心过滤装置(由日本Milipore公司生产)中。在-80℃下将该凝胶冷却15分钟直至冷冻,然后通过在37℃下培养10分钟将该凝胶熔化。以5000×G离心5分钟,从而提取DNA。该DNA经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于少量且适量的TE中。
2)DNA载体pSAKcosl的预处理
将pSAKcosl用限制酶BamHI(日本Takara Shuzo有限公司)消化,然后在65℃下经碱性磷酸酶(日本Takara Shuzo有限公司)处理30分钟。所得反应溶液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀溶于少量TE中。
3)连接和体外包装
将上面步骤1)中所述的基因组DNA片段(2μg)和经过上述预处理的pSAKcosl(1μg)混合,然后使用DNA连接试剂盒Ver.2(日本Takara Shuzo有限公司)在16℃下连接16小时。所得反应液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于5μl的TE中。使用GIGAPAK Ⅱ Gold试剂盒(由STRATAGENE公司生产)将该连接产物溶液经过体外包装,从而提供含有重组DNA载体的大肠杆菌转化体。将3ml LB培养基倒在形成了大肠杆菌转化体菌落的平皿上,然后使用细胞刮棒回收在平皿上的菌落(称之为“回收液1”)。再用3ml LB培养基将该平皿冲洗,并回收细胞(称之为“回收液2”)。将甘油加入回收液1和2的混合物中,使最终浓度达到18%(称之为大肠杆菌细胞液),将其保藏在-80℃下作为柑桔青霉SANK13380的基因组DNA文库。
实施例4:使用柑桔青霉SANK13380的基因组DNA作模板通过PCR扩增PKS基因片段
1)用于PCR的引物的设计和合成
以黄曲霉PKS基因的氨基酸序列(记载于Brown,D.W.等人的“美国国家科学院院报”93,1418(1996))为基础,设计和合成序列表的SEQ ID NO3和4中所示的简并引物。根据亚磷酰胺法进行该合成。
序列表的SEQ ID NO3:
gayacngcntgyasttc
序列表的SEQ ID NO4:
tcnccnknrcwgtgncc
在SEQ ID NO3和4的核苷酸序列中,n代表肌苷(次黄嘌呤),y代表t或c,s代表g或c,k代表g或t,r代表g或a,w代表a或t。
2)通过PCR扩增DNA片段
制备50μl反应液,它含有用于上述步骤1中所述PCR的引物(每个100pmol)、实施例2中获得的柑桔青霉SANK13380的基因组DNA(500ng)、0.2mMdATP、0.2mMdCTP、0.2mMdGTP、0.2mMdTTP、50mM氯化钾、2mM氯化镁和1.25UEx.TacDNA聚合酶(日本Takara Shuzo有限公司)。该溶液经过由以下三个连续步骤组成的反应循环:在94℃下1分钟、在58℃下2分钟和70℃下3分钟。重复该循环30次,从而将该DNA片段扩增。使用TaKaRaPCRThermal Cycler MP TP3000(由日本Takara Shuzo有限公司生产)进行PCR。
扩增的DNA片段经过琼脂糖凝胶电泳,然后将含有大小约为1.0-2.0kb的DNA片段的琼脂糖回收。从该凝胶中回收DNA,并经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于少量TE中。
3)连接和转化
使用TA克隆系统pCR2.1(由Invitrogen公司生产)将步骤2)中获得的DNA片段连接到质粒pCR2.1上,该质粒是以试剂盒的一部分提供的。该质粒转化成大肠杆菌JM109,从而提供转化体。
从所得转化体中选出几个菌落,并按照Maniatis等人的方法[记载于Maniatis,T等人的“分子克隆”,实验室手则,第2版,冷泉港实验室,纽约冷泉港(1989)]将其培养。即,将每个菌落接种于24ml含有2ml LB培养基的试管中,并在37℃下摇动培养18小时。
根据碱性法[记载于Maniatis,T等人的,参见上面]由培养物制备重组DNA载体。即,在室温和10000×G下将1.5ml培养液离心2分钟。然后由沉淀物回收细胞。向这些细胞中加入100μl的50mM葡萄糖溶液、25mM Tris-HCl、10mMEDTA(pH8.0),从而形成一悬浮液。向其中加入20μl的0.2N氢氧化钠-1%(w/v)SDS。将该悬浮液缓慢搅拌至微生物裂解。然后加入150μl的3M乙酸钾-11.5%(w/v)乙酸,使所有蛋白质变性,接着在室温及10000×G下离心10分钟。回收上层液。将上层液经过苯酚-氯仿提取和乙醇沉淀。所得沉淀物溶于50μl含有40μg/ml核糖核酸酶A(由Sigma公司生产)的TE中。
每个重组DNA载体用限制酶消化,并经过电泳。使用电泳时对所有插入片段具有不同消化图案的DNA测序器(377型:由日本Perkin Elmer生产)测定在这些重组DNA载体中的DNA插入片段的核苷酸序列。
以这种方式鉴定菌株为含有由柑桔青霉获得的PKS片段的重组DNA载体。
实施例5:柑桔青霉SANK13380的基因组Southern印迹杂交
1)电泳并转移到膜上
将实施例2中获得的柑桔青霉SANK13380的基因组DNA(10μg)用限制酶EcoRⅠ、SalⅠ、HindⅢ或Sacl(都是由日本Takara Shuzo有限公司生产的)消化,然后经过琼脂糖凝胶电泳。该凝胶是使用琼脂糖L03“TAKARA”(日本TakaraShuzo有限公司)制备的。电泳之后,将该凝胶浸泡在0.25N盐酸(由Wako Pure化学工业有限公司生产)中并在缓慢摇动下在室温下培养10分钟。将该凝胶转移到0.4N氢氧化钠(由Wako Pure化学工业有限公司生产)中,在室温下温和培养30分钟。使用Maniatis等人的碱性转移法(参见上面),将凝胶中的DNA转移到尼龙膜HybondTM-N+(由Amersham公司生产)上,并在其上固定。将该膜用2×SSC(1×SSC含有150mM NaCl、15mM柠檬酸钠)洗涤,然后经空气干燥。
2)杂交和信号的测定
将步骤1)中获得的膜与作为探针的实施例4中获得的PKS基因片段杂交。
作为探针,将1μg实施例4中获得的PKS基因插入片段用DIG DNA标记试剂盒(由Boeringer-Mannheim生产)标记并煮沸10分钟,然后在使用前快速冷却。
将步骤1)中所述的膜浸泡在杂交液(DIG Easy Hyb:由Boeringer-Mannheim生产)中,然后在20rpm的摇动下在42℃预杂交2小时。然后,将上述标记的探针加入杂交液中,使用Multishaker Oven HB(由TAITEC公司生产)在20rpm的摇动下在42℃杂交18小时。然后将经过杂交的膜使用2×SSC在室温下冲洗3次,每次20分钟,使用0.1×SSC在55℃下冲洗2次,每次30分钟。
将冲洗过的膜用用于核酸的DIG发光检测试剂盒(由Boeringer-Mannhbeim生产)处理并将其曝光于X射线胶卷(Luumifilm,由Boeringer-Manmheim生产)上。使用Fuji医用胶卷处理器FPM800A(由Fuji胶卷公司生产)进行曝光。
结果证明,实施例4中获得的PKS基因片段存在于柑桔青霉的基因组上。
实施例6:使用PKS基因片段作探针筛选柑桔青霉SANK13380的基因组DNA文库
使用菌落杂交法克隆含有PKS基因的基因组DNA片段。
1)膜的制备
将以柑桔青霉SANK13380的基因组DNA文库(实施例3中所述)保藏的大肠杆菌细胞液稀释并涂布在LB琼脂培养基平皿上,以使每个平皿中可以生长5000-10000个菌落。将该平皿在26℃下保持18小时,并在4℃下冷却1小时。将HybondTM-N+膜(由Amersham公司生产)放在平皿上,并与其接触1分钟。将粘附有菌落的膜小心地从平皿重取出。将已与菌落接触的表面朝上并浸泡在200ml的1.5M氯化钠、0.5M Tris-HCl、1mM EDTA(pH7.5)溶液中持续3分钟,浸泡2次,然后用400ml的2×SSC冲洗。冲洗过的膜经空气干燥30分钟。
2)杂交
将实施例4中获得的PKS基因插入片段DNA(1μg)用作探针。使用DIGDNA标记试剂盒(由Boeringer-Mannheim生产)标记该DNA并煮沸10分钟,在使用前快速冷却。
将步骤1)中所述的膜浸泡在杂交液(DIG Easy Hyb:由Boeringer-Mannheim生产)中,然后在20rpm的摇动下在42℃预杂交2小时。然后,将上述标记的探针加入杂交液中,使用Multishaker Oven HB(由TAITEC公司生产)在20rpm的摇动下在42℃杂交18小时。然后将经过杂交的膜使用2×SSC在室温下冲洗3次,每次20分钟,使用0.1×SSC在68℃下冲洗2次,每次30分钟。
将冲洗过的膜用用于核酸的DIG发光检测试剂盒(由Boeringer-Mannheim生产)处理并将其曝光于X射线胶卷(Lumifilm,由Boeringer-Mannheim生产)上。使用Fuji医用胶卷处理器FPM800A(由Fuji胶卷公司生产)进行曝光。
将上面步骤1)和2)称之为筛选。
将在第一次筛选时检测为阳性信号的平皿上菌落刮下并回收悬浮于LB培养基中的细胞。然后,将细胞适当稀释并涂布在适宜平皿上。接着,进行第二次筛选,以提纯阳性克隆。
在本实施例中获得的阳性克隆,即转化大肠杆菌,大肠杆菌pML48SANK71199菌株,根据微生物保藏的布达佩斯条约,于1999年7月7日以保藏号FERM BP-6780保藏在工业科技署的生命科学和技术研究院。
实施例7:分析重组DNA载体pML48(1)的插入序列
以实施例4中所述的相似方式培养实施例6中获得的大肠杆菌pML48SANK71199菌株并由该培养物制备重组DNA载体。
获得的DNA载体命名为pML48。与ML-236B生物合成有关的基因组DNA的pML48的插入片段用各种限制酶消化,并将所得片段亚克隆到pUC119(由日本Takara Shuzo有限公司生产)中。使用所得亚克隆作为探针,通过与实施例5中所述的相似的方法进行Southern印迹杂交。即,通过用各种限制酶消化pML48获得的产物经过电泳,将这些DNA转移到一膜上,并经过杂交。结果,使用本领域的标准技术制备pML48插入序列的限制酶切割图。
使用377型DNA测序器(由日本Perkin Elmer有限公司生产)测定每个亚克隆插入序列的核苷酸序列,接着测定pML48的整个核苷酸序列。
pML48的插入序列由总共34203个碱基组成。
pML48插入序列的核苷酸序列记载于序列表的SEQ ID NO1和2中。序列表的SEQ ID NO1和2中所述的序列彼此完全互补。
使用基因检索程序GRAIL(ApoCom GRAIL Toolkit:由Apocom公司生产)和同源性检索程序BLAST(有缺口的BLAST(BLAST2):安装于WISCONSINGCG包10.0版中)分析pML48插入序列中结构基因的存在。
结果,预测在pML48的插入序列中存在6个不同结构基因,分别将其命名为mlcA、mlcB、mlcC、mlcD、mlcE和mlcR。而且,预测mlcA、mlcB、mlcE和mlcR在序列表的SEQ ID NO2的核苷酸序列中具有编码区,并且mlcC和mlcD在序列表的SEQ ID NO1的核苷酸序列中具有编码区。还预测了该插入序列中每个假定结构基因的相关位置和长度。
本实施例的结果示于图2中。每个箭头表示每个结构基因在pML48插入物上的位置、方向和相对大小。指向左边的箭头说明在ID SEQ NO2上存在结构基因(mlcA、B、E或R)的编码区。指向右边的箭头说明在ID SEQ NO1上存在结构基因(mlcC或D)的编码区。
实施例8:分析重组DNA载体pML48(2)的插入序列通过Northem印迹杂交分析在实施例7中预测存在的结构基因的表达。分析5′-端和3′-端区域。
1)柑桔青霉SANK13380的总RNA的制备
将来自柑桔青霉SANK13380斜面培养物(实施例2中所述)的5mm2的细胞接种在于100ml锥形瓶的10ml MGB3-8培养基中,并在26℃下摇动培养3天。
使用异硫氰酸胍法用RNeasy Plant Mini Kit(由Qiagen AG生产)由该培养物制备总RNA。即,在室温下以5000×G将该培养物离心10分钟,回收细胞。接着,用液氮将2g(湿重)细胞冷冻,然后在研钵中破碎成粉末。将破碎的细胞悬浮在4ml裂解缓冲液中(含在试剂盒中)。将450μl悬浮液倒入试剂盒中所含的10个QIAshredder自旋柱每一个中,然后在室温下以1000×G离心10分钟。将所得的每个洗脱液回收,向其中加入225μl乙醇,然后将其加入试剂盒中所含的RNA小自旋柱中。用冲洗试剂盒中所含物质的缓冲液冲洗柱,接着用50μl无核糖核酸酶的蒸馏水洗脱每个柱中所吸附物。将该洗脱液作为总RNA部分。
2)Northern印迹杂交
通过将2.25μl含20μg柑桔青霉SANK13380的总RNA的水溶液加入1μl10×MOPS(组成:200mM3-吗啉基丙烷磺酸、50mM乙酸钠、10mM EDTA.2Na;pH7.0;在高压锅中在121℃下灭菌20分钟之后使用;由Dojinkagaku Laboratory有限公司生产)、1.75μl甲醛和5μl甲酰胺中,接着混合,生产一RNA样品。将该RNA样品在65℃下保持10分钟,然后在冰水中快速冷却,并经过琼脂糖凝胶电泳。用于电泳的凝胶的制备如下:将10ml10×MOPS和1g琼脂糖L03“TAKARA”(由日本Takara Shuzo有限公司生产)与72ml二碳酸二乙酯处理水(由Sigma公司生产)混合,加热使该琼脂糖溶解,然后冷却,接着加入18ml甲醛。使用1×MOPS(用10倍水稀释10×MOPS制成)作为缓冲液样品。将凝胶中的RNA转移到10×SSC中的HybondTM-N+(由Amersham公司生产)上。
将通过用下表1所示的限制酶1和2消化pML48的插入序列获得的DNA片段a、b、c、d和e用作探针。在图3的上方格中显示了每个探针在pML48上的位置。
表1
用于Northern印迹杂交的探针
探针 | 限制酶1 | 限制酶位点的核苷酸号* | 限制酶2 | 限制酶位点的核苷酸号* |
a | EcoRⅠ | 6319-6324 | EcoRⅠ | 15799-15804 |
b | BamHⅠ | 16793-16798 | PstⅠ | 18164-18169 |
c | KpnⅠ | 26025-26030 | BamHⅠ | 27413-27418 |
d | SalⅠ | 28691-28696 | SalⅠ | 29551-29556 |
e | HindⅢ | 33050-33055 | SacⅠ | 34039-34044 |
*每个核苷酸号存在于序列表的SEQ ID NO1上
按照实施例5中所述的Southern印迹杂交进行探针的标记、杂交和信号的检测。
实施例的结果示于图3的下面方格中。
每个信号显示了存在于每个探针的核苷酸序列同源的转录产物。
结果暗示,预测存在于本实施例中的pML48的插入序列中的结构基因,即mlcA、mlcB、mlcC、mlcD、mlcE和mlcR被转录到柑桔青霉SANK13380中。
每个信号的位置未显示转录产物的相关大小。
3)按照5′RACE测定5′-端序列
使用快速扩增cDNA端的5′RACE系统,2.0版(由GIBCO公司生产)获得
含有每个结构基因的5′-端区域的cDNA。
生产两种反义寡核苷酸DNA。如实施例7的结果和本实施例的第2)项所预测的,该设计以推定在pML48的插入序列的编码区中和每个结构基因的5′-端附近的核苷酸序列为基础。
表2显示了以每个结构基因的3′-端的核苷酸序列为基础设计的反义寡核苷酸DNA(1)的核苷酸序列。表3显示了以每个结构基因的5′-端的核苷酸序列为基础设计的反义寡核苷酸DNA(2)的核苷酸序列。
表2:用于按照5′RACE测定5′-端序列的寡核苷酸DNA(1)
基因 | 序列表的SEQ IDNO | 核苷酸序列 |
mlcA | SEQ ID NO5 | Gcatgttcaatttgctctc |
mlcB | SEQ ID NO6 | Ctggatcagactttctgc |
mlcC | SEQ ID NO7 | Gtcgcagtagcatgggcc |
mlcD | SEQ ID NO8 | Gtcagagtgatgctcttctc |
mlcE | SEQ ID NO9 | Gttgagaggattgtgagggc |
mlcR | SEQ ID NO10 | Ttgcttgtgttggattgtc |
表3:用于按照5′RACE测定5′-端序列的寡核苷酸DNA(2)
基因 | 序列表的SEQ IDNO | 核苷酸序列 |
mlcA | SEQ ID NO11 | Catggtactctcgcccgttc |
mlcB | SEQ ID NO12 | Ctccccagtacgtaagctc |
mlcC | SEQ ID NO13 | Ccataatgagtgtgactgttc |
mlcD | SEQ ID NO14 | Gaacatctgcatccccgtc |
mlcE | SEQ ID NO15 | Ggaaggcaaagaaagtgtac |
mlcR | SEQ ID NO16 | Agattcattgctgttggcatc |
使用寡核苷酸DNA(1)作引物,并使用柑桔青霉SANK13380的总RNA作模板按照反转录反应合成cDNA第一链。即,将24μl的含有1μg总RNA、2.5pmol寡核苷酸DNA(1)和1μl SUPER SCRIPTTMⅡ反转录酶(含在试剂盒中)的反应混合物在16℃下培养1小时,将该反应产物添加到试剂盒中所含的GLASSMAX自旋柱体,从而提纯cDNA的第一链。
使用试剂盒中所含的末端脱氧核糖核苷酸转移酶将多胞嘧啶链加入cDNA第一链的3′-端。
将50μl的含有已加入3′-端多胞嘧啶链的cDNA的第一链的反应混合物与40pmol寡核苷酸DNA(2)和40pmol Abriged锚定引物(试剂盒中所含的)混合,然后在94℃下培养2分钟。然后将94℃下30秒、55℃下30秒和72℃下2分钟的培养循环重复35次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式克隆。
上述操作为5′-RACE。
测定含有5′-端的cDNA片段的核苷酸序列,并预测转录起始点和翻译起始密码子的位置。
表4显示了描述相应于通过5′RACE获得的每个结构基因的5′-端cDNA片段的核苷酸序列SEQ ID NO。表5显示了SEQ ID NO,其中每个结构基因存在转录起始点和翻译起始点,并描述了转录起始点和翻译起始点的位置。
表4:显示5′-端cDNA片段的核苷酸序列的SEQ ID NO
基因 | 序列表的SEQ ID NO |
mlcA | SEQ ID NO17 |
mlcB | SEQ ID NO18 |
mlcC | SEQ ID NO19 |
mlcD | SEQ ID NO20 |
mlcE | SEQ ID NO21 |
mlcR | SEQ ID NO22 |
表5:每个基因的转录起始点和翻译起始点的位置
基因号 | 存在翻译起始密码子的SEQ ID NO | SEQ ID NO1或SEQ ID NO2中的核苷酸号 | |
转录起始点 | 翻译起始密码子 | ||
mlcA | SEQ ID NO2 | 22913 | 23045-23047 |
mlcB | SEQ ID NO2 | 11689 | 11748-11750 |
mlcC | SEQ ID NO1 | 11631 | 11796-11798 |
mlcD | SEQ ID NO1 | 24066 | 24321-24323 |
mlcE | SEQ ID NO2 | 3399 | 3545-3547 |
mlcR | SEQ ID NO2 | 365 | 400-402 |
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
4)按照3′RACE测定3′-端序列
使用Ready To Go:T-引发的第一链试剂盒(由Pharmacia公司生产)获得含有每个结构基因的3′-端的cDNA。
由实施例7的结果和本实施例的第2)项预测,生产假设在编码区中和在pML48的插入序列的每个结构基因的3′-端附近的一种有义寡核苷酸DNA(3)。
对每个结构基因所产生的寡核苷酸DNA(3)的核苷酸序列示于表6中。
表6:按照3′RACE用于测定3′-端序列的寡核苷酸DNA(3)
基因 | 序列表的SEQ ID NO | 核苷酸序列 |
mlcA | SEQ ID NO23 | Atcataccatcttcaacaac |
mlcB | SEQ ID NO24 | Gctagaataggttacaagcc |
mlcC | SEQ ID NO25 | Acattgccaggcacccagac |
mlcD | SEQ ID NO26 | Caacgcccaagctgccaatc |
mlcE | SEQ ID NO27 | Gtcttttcctactatctacc |
mlcR | SEQ ID NO28 | Ctttcccagctgctactatc |
使用NotⅠ-d(T)18引物(试剂盒中所含的)以及柑桔青霉SANK13380(1μg)的总RNA作模板通过反转录反应合成cDNA的第一链。
将100μl的含有cDNA的第一链的反应混合物、40pmol寡核苷酸DNA(3)和NotⅠ-d(T)18引物(试剂盒中所含的)在94℃下保持2分钟。将94℃下30秒、55℃下30秒和72℃下2分钟的培养循环重复35次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,然后从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式克隆。
上述操作为3′-RACE。
测定3′-端的cDNA的核苷酸序列,并预测翻译终止密码子的位置。
表7显示了描述相应于通过3′RACE获得的每个结构基因的3′-端cDNA片段的核苷酸序列的序列表的SEQ ID NO。表8显示了以序列表的SEQ ID NO1和2为基础的翻译终止密码子和该密码子的位置。
表7:显示3′-端cDNA片段的核苷酸序列的SEQ ID NO
基因 | 序列表的SEQ ID NO |
mlcA | SEQ ID NO29 |
mlcB | SEQ ID NO30 |
mlcC | SEQ ID NO31 |
mlcD | SEQ ID NO32 |
mlcE | SEQ ID NO33 |
mlcR | SEQ ID NO34 |
表8:每个结构基因的翻译终止密码子和该翻译终止密码子的位置
基因 | 翻译终止密码子 | 存在翻译终止密码子的SEQ ID NO | 翻译终止密码子在SEQ IDNO1或SEQ ID NO2中的核苷酸号 |
mlcA | tag | SEQ ID NO2 | 32723-32725 |
mlcB | taa | SEQ ID NO2 | 19840-19842 |
mlcC | taa | SEQ ID NO1 | 13479-13481 |
mlcD | tga | SEQ ID NO1 | 27890-27892 |
mlcE | tga | SEQ ID NO2 | 5730-5732 |
mlcR | tag | SEQ ID NO2 | 1915-1917 |
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
表9显示了预测由每个结构基因编码的多肽的C-端氨基酸残基,编码该氨基酸残基的三核苷酸的核苷酸序列和该三核苷酸的位置。
表9:由每个结构基因编码的多肽的C-端氨基酸残基
基因 | C-端氨基酸残基 | 编码氨基酸的三核苷酸的核苷酸序列 | 存在三核苷酸的SEQ ID | 三核苷酸在SEQID NO1或2中的核苷酸号 |
mlcA | 丙氨酸 | gcc | SEQ ID NO2 | 32720-32722 |
mlcB | 丝氨酸 | agt | SEQ ID NO2 | 19837-19839 |
mlcC | 半胱氨酸 | tgc | SEQ ID NO1 | 13476-13478 |
mlcD | 精氨酸 | cgc | SEQ ID NO1 | 27887-27889 |
mlcE | 丙氨酸 | gct | SEQ ID NO2 | 5727-5729 |
mlcR | 丙氨酸 | gct | SEQ ID NO2 | 1912-1914 |
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
表10汇集了与表8中所示翻译终止密码子互补的序列,存在该互补序列的SEQ ID以及该互补序列的位置。
表10:与每个结构基因的翻译终止密码子互补的序列
基因 | 与翻译终止密码子互补的序列 | 存在互补序列的SEQ ID NO | 该互补序列在SEQ ID NO1或SEQ ID NO2中的核苷酸号 |
mlcA | cta | SEQ ID NO1 | 1479-1481 |
mlcB | tta | SEQ ID NO1 | 14362-14364 |
mlcC | tta | SEQ ID NO2 | 20723-20725 |
mlcD | tca | SEQ ID NO2 | 6312-6314 |
mlcE | tca | SEQ ID NO1 | 28472-28474 |
mlcR | cta | SEQ ID NO1 | 32287-32289 |
*序列表的SEQ ID NO1和2的核苷酸序列彼此完全互补。
如上所述,确定了每个结构基因的位置、其方向及其位置。以上述信息为基础,可以获得每个结构基因的转录产物和翻译产物。
实施例9:获得相应于结构基因mlcE的cDNA
1)制备总RNA
按照实施例8的方法制备柑桔青霉的总RNA。
2)设计引物
为了获得相应于实施例8中测得的结构基因mlcE的全长cDNA,设计并合成以下引物:
有义引物5′-gttaacatgtcagaacctctaccccc-3′(参见序列表的SEQ ID35);和反义引物5′-aatatttcaagcatcagtctcaggcac-3′(参见序列表的SEQ ID36)。
这些引物分别由结构基因mlcE的5′-端上游区上的序列和3′-端下游区的序列获得。按照亚磷酰胺法进行合成。
3)RT-PCR
为了获得编码mlcE基因产物的全长cDNA,使用Takara RNA LA PCR试剂盒(AWV)1.1版。
具体地说,将20μl的含有1μg总RNA、2.5pmol随机9聚引物(试剂盒中所含的)和1μl反转录酶(试剂盒中所含的)的反应混合物在42℃下培养30分钟,制得cDNA的第一链。然后通过在99℃下加热5分钟使反转录酶失活。
将100μl的含有所有量的cDNA的第一链的反应混合物(上面)、40pmol有义引物和40pmol反义引物的第二个反应混合物在94℃下培养2分钟。将94℃下30秒、60下30秒和72℃下2分钟的培养循环重复30次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式转化大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)。从转化的大肠杆菌中选择载有带DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pCRexpE。
测定所得重组DNA载体pCRexpE的插入DNA的核苷酸序列。该插入DNA含有相应于结构基因mlcE的全长cDNA。其核苷酸序列以及由该核苷酸序列推断的肽的氨基酸序列示于序列表的SEQ ID NO37和/或SEQ ID NO38中。
mlcE(多肽)的最近已知序列为与洛伐他丁的生物合成有关的基因簇上的ORF10,具有70%的同一性。
实施例10:构建表达载体pSAK700
使用实施例1中所述的载体pSAK333和pSAK360构建cDNA表达载体pSAK700。
pSAK333用限制酶BamHⅠ和HindⅢ(由日本Takara Shuzo有限公司生产)消化,然后经过琼脂糖凝胶电泳。从该凝胶中回收一4.1kb片段,并用T4-DNA聚合酶(由日本Takara Shuzo有限公司生产)使该DNA端平头。
使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将EcoRⅠ-NotⅠ-BamHⅠ衔接子(由日本Takara Shuzo有限公司生产)连接到上述DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)转化。从转化的大肠杆菌中选择载有带该衔接子的质粒的菌株,并将该菌株所载的质粒命名为pSAK410。
pSAK360用限制酶PuvⅡ和SspⅠ消化,并经过电泳。从该凝胶中回收含有3-磷酸甘油酯激酶(下文称之为“pgk”)基因的启动子和终止子和来源于大肠杆菌的HPT的DNA片段(约2.9kb)。
使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将回收的上述DNA片段连接到pSAK410的PvuⅡ位点上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。从转化的大肠杆菌中选择载有带该DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pSAK700。
pSAK700的构建示于图4。
pSAK700具有酶BamHⅠ和NotⅠ的单一限制酶位点。pSAK700还具有抗氨苄西林的基因(下文称之为“Amp”)和抗潮霉素的基因HTP作为选择标记。在以下实施例中,当使用大肠杆菌作为宿主时,通过将40μg/ml氨苄西林加到相应培养基中对由pSAK700或含有外来DNA的pSAK700转化的细胞进行选择。当柑桔青霉SANK13380用作宿主时,通过将200μg/ml潮霉素加到相应培养基中对由pSAK700或含有外来DNA的pSAK700转化的细胞进行选择。
实施例11:构建cDNA表达载体pSAKexpE
在有限制酶HpaⅠ和SspⅠ(由日本Takara Shuzo有限公司生产)的情况下将实施例9中获得的重组DNA载体pCRexpE在37℃下反应2小时,并使反应产物经过琼脂糖凝胶电泳。从该凝胶回收含有约1.7kbmlcE全长cDNA的带。
在pSAK700与限制酶Notl(由日本Takara Shuzo有限公司生产)在37℃下反应1小时之后,用T4DNA聚合酶(日本Takara Shuzo有限公司)在37℃下持续5分钟使该载体的末端平头。然后,该载体经过苯酚氯仿提取和乙醇沉淀。将该沉淀物DNA溶于少量TE中。向其中加入碱性磷酸酶并在65℃下培养30分钟。使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将如上所述制备的pSAK700连接到步骤1)中获得的1.7kb的DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。获得由cDNA表达载体转化的大肠杆菌菌株。
根据微生物保藏的布达佩斯条约,将本实施例中获得的转化的大肠杆菌(命名为大肠杆菌pSAKexpE SANK 72499)于2000年1月25日以保藏号FERMBP-7005保藏在工业科技署的生命科学和技术研究院。
实施例12:获得相应于结构基因mlcR的cDNA
1)制备总RNA
按照实施例8的方法制备柑桔青霉的总RNA。
2)设计引物
为了获得相应于实施例8中测得的结构基因mlcR的全长cDNA,设计并合成以下引物:
有义引物5′-ggatccatgtccctgccgcatgcaacgattc-3′(参见序列表的SEQ ID 39);和反义引物5′-ggatccctaagcaatattgtgtttcttcgc-3′(参见序列表的SEQ ID 40)。
这些引物分别由结构基因mlcR的5′-端上游区上的序列和3′-端下游区的序列获得。按照亚磷酰胺法进行合成。
3)RT-PCR
为了获得编码mlcR基因产物的全长cDNA,使用Takara RNA LA PCR试剂盒(AWV)1.1版。
具体地说,将20μl的含有1μg总RNA、2.5pmol随机9聚引物(试剂盒中所含的)和1μl反转录酶(试剂盒中所含的)的反应混合物在42℃下培养30分钟,制得cDNA的第一链。然后通过在99℃下加热5分钟使反转录酶失活。
将100μl的含有所有量的cDNA的第一链的反应混合物(上面)、40pmol有义引物和40pmol反义引物的第二个反应混合物在94℃下培养2分钟。将94℃下30秒、60℃下30秒和72℃下2分钟的培养循环重复30次,接着在72℃下培养5分钟,在4℃下培养18小时。所得产物经过琼脂糖凝胶电泳,并从该凝胶中回收DNA。产物通过苯酚-氯仿提取和乙醇沉淀提纯,并以与使用pCR2.1的实施例4中所述方法相似的方式转化大肠杆菌感受态细胞JM109菌株(由日本Takara Shuzo有限公司生产)。从转化的大肠杆菌中选择载有带DNA片段的质粒的菌株,并将该菌株所载的质粒命名为pCRexpR。
测定所得重组DNA载体pCRexpR的插入DNA的核苷酸序列。该插入DNA含有相应于结构基因mlcR的全长cDNA。其核苷酸序列以及由该核苷酸序列推断的肽的氨基酸序列示于序列表的SEQ ID NO41和/或SEQ ID NO42中。
mlcR(多肽)的最近已知序列为与洛伐他丁的生物合成有关的基因簇上的lovE,具有34%的相同性。
实施例13:构建cDNA表达载体pSAKexpR
在有限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)的情况下将实施例12中获得的重组DNA载体pCRexpR在37℃下反应2小时,并使反应产物经过琼脂糖凝胶电泳。从该凝胶回收含有约1.4kb mlcR全长cDNA的带。
在pSAK700与限制酶BamHⅠ(由日本Takara Shuzo有限公司生产)在37℃下反应1小时之后,加入碱性磷酸酶(由日本Takara Shuzo有限公司生产)并在65℃下反应30分钟。使用DNA连接试剂盒Ver.2(由日本Takara Shuzo有限公司生产)将如上所述用BamHⅠ消化的pSAK700连接到步骤1)中获得的1.4kb的DNA片段上。用该连接的DNA将大肠杆菌感受态细胞JM109菌株转化。获得由cDNA表达载体转化的大肠杆菌菌株。
根据微生物保藏的布达佩斯条约,将本实施例中获得的转化的大肠杆菌(命名为大肠杆菌pSAKexpR SANK 72599)于2000年1月25日以保藏号FERMBP-7006保藏在工业科技署的生命科学和技术研究院。
实施例14:转化产ML-236B的微生物
1)制备原生质体
将来自柑桔青霉SANK 13380菌株的培养物斜面的孢子接种到PGA琼脂培养基上,然后在26℃下培养14天。然后从该培养物中回收柑桔青霉SANK1 3380菌株的孢子,并将1×108个孢子接种到80ml YPL-20培养基中,在26℃下培养1天。通过显微镜下观察证实孢子发芽之后,在室温下以5000×G将发芽的孢子离心10分钟,并回收沉淀物。
孢子用无菌水冲洗3次,形成原生质体。即,将200mg酶解酶20T(由SeikagakuKogyo公司生产)和100mg壳质酶(由Sigma公司生产)溶于10ml 0.55M氯化镁溶液中,在室温下以5000×G离心10分钟。所得上层液用作酶溶液。将20ml该酶溶液和0.Sg(湿重)发芽孢子放入100ml锥形瓶中并在30℃下缓慢摇动培养60分钟。使用显微镜证实发芽的孢子变成原生质体之后,将反应液通过3G-2玻璃滤器(由HARIO公司生产)过滤。滤液在室温下以1000×G离心10分钟,然后回收沉淀物原生质体。
2)转化
将步骤1)中获得的原生质体用30ml 0.55M氯化镁冲洗2次,用30ml由0.55M氯化镁、50mM氯化钙和10mM 3-吗啉基丙烷磺酸酯组成的溶液(pH6.3或更低,下文称之为MCM溶液)冲洗1次。然后将原生质体悬浮于100μl的4%(w/v)聚乙二醇8000、10mM 3-吗啉基丙烷磺酸酯、0.0025%(w/v)肝素(由Sigma公司生产)、50mM氯化镁的溶液(pH6.3或更低,下文称之为“转化液”)中。
将96μl含有约5×107个原生质体和10μl含有120μg pSAKexpE或pSAKexpR的TE混合,在冰上静置30分钟。向其中加入1.2ml的20%(w/v)聚乙二醇、50mM氯化镁、10mM 3-吗啉基丙烷磺酸的溶液(pH6.3)。然后将该液体缓慢移液,在室温下静置20分钟。向其中加入10ml MCM溶液,接着缓慢混合,在室温下以1000×G离心10分钟。从沉淀物中回收转化的原生质体。
3)转化原生质体的细胞壁的再生
将步骤2)中获得的转化原生质体悬浮于5ml液体VGS中间层琼脂培养基中,并放在10ml固体VGS下层琼脂培养基平皿上。在26℃下将该平皿培养1天,之后在每个平皿的上面放10ml含有5mg潮霉素B的液体VGS上层琼脂培养基(潮霉素的最终浓度为200μg/ml)。在26℃下培养14天之后,将两个菌株(即由pSAKexpE或pSAKexpR转化的原生质体获得的那些菌株)在含有200μg/ml PGA琼脂培养基上传代培养,并在用PGA琼脂培养基制备的斜面上亚培养,在26℃下培养14天。
将这些斜面保藏在4℃下。
测定实施例1:比较转化的菌株和原始菌株中的ML-236B生物合成能力
将实施例14中获得的转化菌株和柑桔青霉SANKl3380培养并测定每个培养物中的ML-236B的量。
将涉及柑桔青霉SANK13380的来自实施例14所述培养转化菌株的斜面和来自实施例2中所述的斜面的5mm2接种物孢子培养。将细胞接种到在100ml锥形瓶中的10ml MBG3-8培养基中。然后在24℃下摇动培养2天,接着加入3.5ml50%(w/v)甘油溶液。然后,在24℃下连续摇动培养10天。
向10ml该培养物中加入50ml 0.2N氢氧化钠,接着在26℃下摇动培养1小时。在室温下将该培养物以3000×G离心2分钟。回收1ml上层液,用9ml75%甲醇混合,并进行HPLC。
使用SSC-ODS-262(直径为6mm,长100mm,由Senshu Kagaku有限公司生产)作为HPLC柱,使用75%(w/v)甲醇-0.1%(m/v)三乙胺-0.1%(w/v)乙酸作为移动相。在室温下以2ml/min的流速进行冲洗。在这些条件下,加入到该柱之后,将ML-236B冲洗4分钟。在236nm的吸收波长下用UV检测器进行测定。
在8个pSAKexpE转化菌株中的3个菌株的ML-236B生物合成能力增加。与原始菌株相比,这些菌株的ML-236B生物合成能力平均高10%。在例如单孢子处理等的传代培养之后,这3个菌株中也能稳定地保持ML-236B生物合成能力。这些结果说明,pSAKexpE的插入片段为加速ML-236B生物合成的cDNA。
在这些pSAKexpR转化菌株中有5个菌株的ML-236B生物合成能力增加。与原始菌株相比,这些菌株的ML-236B生物合成能力平均高15%。在例如单孢子处理等的传代培养之后,这5个菌株中也能稳定地保持ML-236B生物合成能力。这些结果说明,pSAKexpE的插入片段为加速ML-236B生物合成的cDNA。
因此,按照本发明从产ML-236B的微生物中获得的加速ML-236B生物合成的cDNA当导入产ML-236B的微生物中时加速了该产ML-236B的微生物的ML-236B生物合成。
实施例15:相应于结构基因mlcA-D的cDNA的序列测定
测定相应于结构基因mlcA的cDNA的序列。
用TAKARA LA PCR试剂盒ver1.1(Takara Shuzo有限公司)合成第一链cDNA。为了扩增cDNA的全部或部分区域,使用该第一链cDNA为模板并使用几对不同的寡核苷酸作引物进行几次PCR。
使用Big Dye Primer/终止循环测序试剂盒和ABI Prism377序列(PE应用生物系统)将94℃下30秒、60℃下30秒和72℃下5分钟的循环重复30次。
将每个反应产物分别插入质粒pCR2.1。
获得每个重组质粒的大肠杆菌转化体。
测定由所述转化体获得的重组质粒的每个插入片段的核苷酸序列。
在比较上述几个RT-PCR产物和结构基因mlcA的核苷酸序列的基础上测定外显子和内含子的序列。
然后,测定相应于结构基因mlc A的cDNA的序列(SEQ ID NO43)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO44),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcA(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的LNKS(lovB),具有60%同一性。
以相似方式,测定相应于结构基因mlcB的cDNA的序列(SEQ ID NO45)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO46),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcB(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的LDKS(lovF),具有61%同一性。
相似地,测定相应于结构基因mlc C的cDNA的序列(SEQ ID NO47)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO48),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcC(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的lovA,具有72%同一性。
而且,测定相应于结构基因mlc D的cDNA的序列(SEQ ID NO49)。推测由所述cDNA编码的多肽的相应氨基酸序列(SEQ ID NO50),并且在同源性检索基础上使用该氨基酸序列推定该多肽的功能。
mlcD(多肽)的最近已知序列为与洛伐他丁生物合成有关的基因簇上的ORF8,具有63%同一性。
测定在SEQ ID NO1或SEQ ID NO2上的每个结构基因的外显子的位置,如下:
表11:mlcA-D的外显子在pML48插入片段中的位置
存在外显子的SEQ ID | 外显子号 | SEQ ID NO1或SEQ ID NO2的核苷酸号 | |||
MlcA | 2 | 1 | 22913 | - | 22945 |
2 | 23003 | - | 23846 | ||
3 | 23634 | - | 23846 | ||
4 | 23918 | - | 24143 | ||
5 | 24221 | - | 24562 | ||
6 | 24627 | - | 27420 | ||
7 | 27479 | - | 27699 | ||
8 | 27761 | - | 30041 | ||
9 | 30112 | - | 30454 | ||
10 | 30514 | - | 30916 | ||
11 | 30972 | - | 32910 | ||
MlcB | 2 | 1 | 11689 | - | 12002 |
2 | 12106 | - | 12192 | ||
3 | 12247 | - | 12304 | ||
4 | 12359 | - | 12692 | ||
5 | 12761 | - | 13271 | ||
6 | 13330 | - | 13918 | ||
7 | 13995 | - | 20052 | ||
MlcC | 1 | 1 | 11631 | - | 12140 |
2 | 12207 | - | 12378 | ||
3 | 12442 | - | 13606 | ||
MlcD | 1 | 1 | 24066 | - | 24185 |
2 | 24270 | - | 27463 | ||
3 | 27514 | - | 28130 |
测定的SEQ ID NO1或SEQ ID NO2上每个结构基因的转录终止位点的位置如下:
表12:结构基因mlcA-E和R的转录终止位点在pML48插入片段中的位置
基因 | 存在转录终止位点的SEQ ID NO | 转录终止位点在SEQ ID NO1或SEQ IDNO2中的核苷酸号 |
mlcA | SEQ ID NO2 | 32910 |
mlcB | SEQ ID NO2 | 20052 |
mlcC | SEQ ID NO1 | 13606 |
mlcD | SEQ ID NO1 | 28130 |
mlcE | SEQ ID NO2 | 5814 |
mlcR | SEQ ID NO2 | 1918 |
实施例16:基因破坏的研究
使用同源重组经定点诱变破坏柑桔青霉的结构基因mlcA、B或D。
使用质粒pSAK333构建用于获得结构基因mlcA遭破坏的柑桔青霉突变体的重组质粒。
将在该pML48插入片段上的mlcA基因座的4.1-kb内KanⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并连接到PuuⅡ消化过的pSAK333上。所得质粒命名为pdismlcA。
由pdismlcA转化柑桔青霉SANK13380。
对pdismlcA转化体的基因组DNA进行Southern杂交,以证实结构基因mlcA已破坏。
所得mlcA已破坏的突变体不再产生ML-236B或其前体。
使用质粒pSAK333构建用于获得结构基因mlcB遭破坏的柑桔青霉突变体的重组质粒。
将在该pML48插入片段上的mlcA基因座的1.4-Kb PsⅠ-BamHⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并与PuuⅡ消化过的pSAK333相连。所得质粒命名为pdismlcB。
由pdismlcB转化柑桔青霉SANK13380。
对pdismlcB转化体的基因组DNA进行Southern杂交,以证实结构基因mlcB已破坏。
所得mlcB已破坏的突变体不产生ML-236B,但产生ML-236A或ML-236B的前体。
使用质粒pSAK333构建用于获得结构基因mlcD遭破坏的柑桔青霉突变体的重组质粒。
将在该pMLA8插入片段上的mlcD基因座的1.4-Kb KpnⅠ-BamHⅠ片段回收、提纯、用DNA Blunting Kit(Takara Shuzo有限公司)平端化并与PuuⅡ消化过的pSAK333相连。所得质粒命名为pdismlcD。
由pdismlcD转化柑桔青霉SANK13380。
对pdismlcD转化体的基因组DNA进行Southern杂交,以证实结构基因mlcD已破坏。
由所得mlcD已破坏的突变体产生的ML-236B的量为未转化的对照宿主的30%。
实施例17:在pSAKexpR转化体中的mlcR的功能分析
将实施例12中获得的两个pSAKexpR转化体分别命名为TR1和TR2,并且将未转化的宿主细胞——柑桔青霉SANK13380接种于MBG3-8培养基中,单独如实施例8中所述进行培养。
从实施例8中所述的每个培养物中提取总RNA。
使用所述总RNA为模板并以结构基因mlcA、B、C、D、E或R的核苷酸序列为基础设计的一对寡核苷酸为引物进行RT-PCR。
表13:用于RT-PCR的引物对的核苷酸序列
T-PCR的靶 | 引物1 | SEQID NO | 引物2 | SEQ IDNO |
mlcA | 5′-gcaagctctgctaccagcac-3′ | 51 | 5′-ctaggccaacttcagagccg-3′ | 52 |
mlcB | 5′-agtcatgcaggatctgggtc-3′ | 53 | 5′-gcagacacatcggtgaagtc-3′ | 54 |
mlcC | 5′-aaaccgcacctgtctattcc-3′ | 55 | 5′-ctttgtggttggatgcatac-3′ | 56 |
mlcD | 5′-cgctctatcatttcgaggac-3′ | 57 | 5′-tcaatagacggcatggagac-3′ | 58 |
mlcE | 5′-atgtcagaacctctaccccc-3′ | 59 | 5′-tcaagcatcagtctcaggca-3′ | 60 |
mlcR | 5′-atgtccctgccgcatgcaac-3′ | 61 | 5′-ctaagcaatattgtgtttct-3′ | 62 |
图5示出了未转化的柑桔青霉13380和两个命名为TR1、TR2的转化体的RT-PCR分析的结果。
在pSAKexpR转化体培养的第一、第二和第三天使结构基因mlcA、B、C、D和R表达。
与之相反,仅在未转化的宿主细胞培养的第三天使所有这些结构基因表达。
在结构基因mlcE表达时在pSAKexpR转化体和未转化的宿主细胞之间没有差异。
结果暗示,由相应于结构基因mlcR的cDNA编码的蛋白质诱导位于与ML-236B生物合成有关的基因簇中其它一些结构基因(例如mlc A、B、C、D)转录。
实施例18:在pSAKexpE转化体中的mlcE的功能分析
将实施例12中获得的pSAKexpE转化体命名为TE1,并且将其未转化的宿主细胞——柑桔青霉SANK13380接种于MBG3-8培养基中,并如实施例8中所述单独进行培养。
从实施例8中所述的每个培养物中提取总RNA。
使用所述总RNA为模板并以结构基因mlcA、B、C、D、E或R的核苷酸序列为基础设计的一对寡核苷酸为引物进行RT-PCR。用于本实施例的引物与上面实施例的表中的那些相同。
图6示出了未转化的柑桔青霉13380和命名为TE1的转化体的RT-PCR分析的结果。
在pSAKexpE转化体培养的第一、第二和第三天使结构基因mlcE表达。
与之相反,仅在未转化的宿主细胞培养的第三天使结构基因mlcE表达。
另一方面,在结构基因mlc A、B、C、D和R表达时在pSAKexpE转化体和未转化的宿主细胞之间没有差异(数据未显示)。
结果暗示,由相应于结构基因mlcE的cDNA编码的蛋白质不依赖于结构基因mlcA、B、C、D和R而加速ML-236B生物合成。
序列表<110>Sankyo有限公司<120>来自基因簇的基因<130>EPP83481<150>JP2000-116591<151>2000-04-18<150>JP2000-117458<151>2000-04-19<160>62<170>PatentIn version3.0<210>1<211>34203<212>DNA<213>柑桔青霉<400>1gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca 60gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc 120gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat 180attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata 240tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat 300gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc 360cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg 420gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt 480ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat 540gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc 600cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg 660tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca 720gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt 780ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt 840tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc 900acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc 960caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt 1020ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc 1080accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata 1140tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt 1200tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta 1260acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa 1320agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt 1380caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac 1440actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg 1500ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca 1560gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc 1620cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920aggggaagca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040taggcggcca ggtagaactg catgggggtt gccttgtgct tgcggctccg ctctttgatt 2100cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3060ccgccaagta ccctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 3360tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 3660gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 3960tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860gacgcagaag attgggggct ccataatcag aattgatgca tcagagccaa aggactgagc 4920gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt 6060ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg 7080aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760gcgtcatcgt acgacatacc tgccgctagc atagcgcctg tctggccgct tggagaagag 8820gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9060tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300ttgttgtgtg ctgcaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 9360tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420agcgttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 10380cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160actgctgatc ctgtttttgg gcgataggat tgggattaaa ccttgtcttg cgtcagtaga 11220tcttctcact gcatgccggg cacaacattt gttcttacag aatcgcagag ttgaatctct 11280gagcgaacaa gccggccttg caaccgatac cgtcgttata tttacttgca cgtatcagta 11340ctcatctaga ttcggacaat ttcaagatcc attctagtac tcaaatgccc ccacttccca 11400gcaatgcaag ctcggcacct agcaaaccct cccggcgtca ttcggtgcac gaatagccat 11460tcctccatac ggcgttattc ggtcacacga ggctgaatga atcaaacgtg aatatcaatt 11520ggctgtatca aggtgaaacc gagtttttca ctcggattgt tcttgtgctg ctcggtgaag 11580ctgctcctaa aggaaacaac cgaactgccc catccaggta aacttcgatt gggggggggg 11640tttttttttt ttcaaggttg actggaagag tgctctcggc cacaaaatcc cagaagcatt 11700agtgctgtta ttcgattata aaccgtcgca gcgctctcat tcttcgctct ttcttctttt 11760ccactggtgt gcataggtcc tatctgtctc acgcaatgct cggccaggtt cttctgaccg 11820tcgaatcgta ccaatgggta tcgacccctc aagcccttgt ggcggtcgca gtgcttctta 11880gtctcatcgc ctaccgtttg cgggggcgcc agtccgaact gcaagtctat aatcccaaaa 11940aatggtggga gttgacgacc atgagggcta ggcaggactt cgatacgtat ggtccgagct 12000ggatcgaagc ttggttctcg aaaaacgaca agcccctgcg cttcattgtt gattccggct 12060attgcaccat cctcccatcg tccatggccg acgagtttcg gaaaatcaaa gatatgtgca 12120tgtacaagtt tttggcggat gtatgacctc tgaattttcc attgttgtaa ctcaatgacg 12180tctctaagat tctgatgaat gtataggact ttcactctca tctccctgga ttcgacgggt 12240tcaaggaaat ctgccaggat gcacatcttg tcaacaaagt tgttttgaac cagttacaaa 12300cccaagcccc caagtacaca aagccattgg ctaccttggc cgacgctact attgccaagt 12360tgttcggtaa aagcgagggt aagtgtcaat ttttctgtct tgagcattga gcctctggct 12420gacataccgc gaatatacta gagtggcaaa ccgcacctgt ctattccaat ggattggacc 12480ttgtcacacg aacagtcaca ctcattatgg tcggcgacaa aatctgccac aatgaggagt 12540ggctggatat tgcaaagaac catgccgtga gtgtggcggt acaagctcgc caacttcgcg 12600tatggcccat gctactgcga ccgctcgctc actggtttca accgcaagga cgcaaattgc 12660gtgaccaagt gcgccgcgca cgaaagatca ttgatcctga gattcagcga cgacgtgctg 12720aaaaggccgc atgtgtagcg aagggcgtgc agccgcccca gtacgtcgat accatgcaat 12780ggtttgaaga caccgccgac ggccgctggt acgatgtggc gggtgctcag ctcgctatgg 12840atttcgccgg catctacgcc tcgacggatc ttttcgtcgg tgcccttgtg gacattgcca 12900ggcacccaga ccttattcag cctctccgcc aagagatccg cactgtaatc ggagaagggg 12960gctggacgcc tgcctctctg ttcaagctga agctcctcga cagctgcatg aaagagacgc 13020agcgaatcaa gccggtcgag tgcgccacta tgcgcagtac cgctctcaga gacatcactc 13080tatccaatgg cctcttcatt cccaagggcg agttggccgc tgtggctgca gaccgcatga 13140acaaccctga tgtgtgggaa aaccccgaaa attatgatcc ctaccgattt atgcgcatgc 13200gcgaggatcc agacaaggcc ttcaccgctc aattggagaa taccaacggt gatcacatcg 13260gcttcggctg gaacccacgc gcttgtcccg ggcggttctt cgcctcgaag gaaatcaaga 13320ttctcctcgc tcatatactg attcagtatg atgtgaagcc tgtaccagga gacgatgaca 13380aatactaccg tcacgctttt agcgttcgta tgcatccaac cacaaagctc atggtacgcc 13440ggcgcaacga ggacatcccg ctccctcatg accggtgcta agatataaca cgcaaactaa 13500aacaaatatg catccgtccc caggcttatt ccaatagttt ccgtcccaga gaaactaggt 13560gctgtattag tcgagtaggt tagtaaaata aaacgcattt tattcgattg tgatgccttc 13620tttgtaatcg aacgtggtgt agactttggc tatgtgcgag agacagaaac acagagagag 13680agaagggaga gagtgtgtat tcctgctacg cagagcggcc atctgcttct ataccgccag 13740ctacaccgcc acgtagggaa gtcggcagta atgaagcttt tctcccggta caatcaccga 13800tctccccatt ctctcaggcg ttgactggcg cttacgatga cgagggctta ggctctgtta 13860agtcttgatg ttcctactca acatccccga ctaggcgaaa gagaggacgg cgcaacgacg 13920tggacacaag tactccctcc cgccttccga ctacatatcc acaatctgta cccactgccc 13980gtgccaacgc ctttcgaccg ttcaacgcgc atttacaagg cttgcgggaa tcataatgga 14040gagaaaaaga gagaactttt gacagtcaag cctccgaggt gctaagacag cttccctggt 14100agtataaaaa gcattcactc ttccgacttc gagaacgagt gcacatgtgt actttgttgc 14160ttctcagggc cactgtaatg gtatttcagg tatctctatt tactgctatc cagaagtcag 14220gcattaaata gtcaggctca gcccaggctc gattcagatt ggattcaggc ttcagaccat 14280ggccgctatg ctccttcgta ctatacctcc gtcgagctat acccgcttgg ccagacaaaa 14340ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500acgacgcccg ggttgctcga acggctgcag tgtgacctca accgcttctt ggtccttcca 16560gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060gtccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattgttttg 18600aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac tgccgcgagg 19200ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21180acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21660gctgggacca cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880agtgcaattg gtcctactat cctttgcttg gtacccctta ccaattatac cctaggcagc 23940agttgacacc ggtcatgaat ccattcataa aggtggacca gatgcaggga taaggaagcg 24000aatctttccg ctgcctcagc ctcaggggcg cgcgccattt gttattttct tctactcatt 24060tcccgtacct aggaactgtt cagttgtccc tcccaacccc ttgggccgaa caaccttcct 24120ccaatctacg acggcagatt atacctaggc gcctaaccga ttaggttgct cattcgattt 24180tggaggtatg cactttatct caagccctaa ttcccaattg aagtgctttt ccgtccccat 24240ttgcagagct gactagattc ttttctcaga gactacctag ctataggtac cactccaagc 24300tgtagcacag acctttcagc atggtcgctt cgttgctacc ctctcgcttt cgcggtaggg 24360aatcaatgaa tcagcagcac cctctacgct cgggaaatcg ggcattgacc tccacactcc 24420aatttctatc caaaacggcg tgtctacacc cgatccatac cgtttgcacc atagctattc 24480tagctagtac cacatacgtt ggactactca aagacagctt cttccatggc cccgcaaacg 24540ttgataaagc agaatggggc tctttggtcg aaggaagtcg aagcttgatc accggcccac 24600agaatggctg gaagtggcag agcttcgacg gggatgcaga tgttctcgga gatttcaacc 24660atcaagcact aatgaccttg gtattcccgg ggtcatatgg ggttgcatct caagcagcct 24720caccattcct tgctcccctc cctgtgaacc tatctgtgat tgaccttccc tcaacgtcga 24780gccctttaac cgcctattcg aaagataaag ttttcgcctt ctctgtggaa tacagcagcg 24840cgccggaact cgtggctgct gttcaagaaa tccccaacaa cagtgccgac ctgaaattgc 24900aggagacgca attgatcgag atggaacgcc agatgtggat catgaaggct gccagggctc 24960acacaaaacg cagccttgct caatgggtgc acgatacctg gacagagtct cttgatctta 25020tcaagagcgc tcaaacgctc gacgtggttg tcatggtgct aggttatata tcaatgcact 25080tgactttcgt ctcactcttc ctcagcatga aaaaattggg atcgaaggtt tggctggcta 25140caagcgtcct tttgtcgtca acatttgcct ttctcctcgg tctcgacgtg gccataagac 25200taggggttcc gatgagcatg aggttgctat ccgaaggcct ccccttcttg gtggtgatcg 25260ttggctttga gaagagcatc actctgacca gggctgtttt gtcctatgct gtgcagcacc 25320gaaagcccca gaagatacag tctgaccagg gtagcgtgac agccattgct gaaagtacca 25380tcaattacgc cgtacgaagc gccattcggg agaagggtta caatatcgtg tgccactacg 25440tggtcgagat cctgctccta gttatcggtg ctgtcttagg catccaaggt gggctacagc 25500acttctgtgt tctagctgca ttgatcctgt tctttgactg tctgctgctg tttacattct 25560acactgcgat tctgtctatc aagctcgagg taaaccgcct caaacgtcat atcaacatgc 25620ggtacgcgtt ggaagatgag ggtctcagtc agcggacggc ggagagtgtc gcgaccagca 25680atgatgccca agacagtgca cgtacatatc tgtttggcaa tgatatgaaa ggcagcagtg 25740ttccgaagtt caaattctgg atggtcgttg gtttccttat cgtcaacctc gtcaacatcg 25800gctccaccct tttccaagcc tcttctagtg gatcgttgtc cagtatatca tcttggaccg 25860aaagtctgag cggatcggcc attaaacccc cgcttgagcc cttcaaggta gctggaagtg 25920gactagatga actacttttc caggcaagag ggcgcggtca atcgactatg gtcactgtcc 25980tcgcccccat caagtacgaa ctagagtatc cttccattca ccgtggtacc tcgcagctac 26040acgagtatgg agttggtgga aaaatggtcg gtagcctgct caccagcctg gaagatcccg 26100tcctctccaa atgggtgttt gtggcacttg ccctaagtgt cgctctgaac agctatctgt 26160tcaaggccgc cagactggga atcaaagatc ctaatctccc gagtcaccca gttgatccag 26220ttgagcttga ccaggccgaa agcttcaacg ctgcccagaa ccagacccct cagattcaat 26280caagtctcca agctcctcag accagagtgt tcactcctac caccaccgac agtgacagtg 26340atgcctcatt agtcttaatt aaagcatctc taaaggtcac taagcgagca gaaggaaaga 26400cagccactag tgaacttccc gtgtctcgca cacaaatcga actggacaat ttgctgaagc 26460agaacacaat cagcgagttg aacgatgagg atgtcgttgc cttgtctttg cggggaaagg 26520ttcccgggta tgccctagag aagagtctca aagactgcac tcgtgccgtc aaggttcgcc 26580gctctatcat ttcgaggaca ccggctaccg cagagcttac aagtatgctg gagcactcga 26640agctgccgta cgaaaactac gcctgggaac gcgtgctcgg tgcatgttgc gagaacgtta 26700ttggctatat gccagtccct gttggcgtcg ccggtcctat tgttatcgac ggcaagagtt 26760atttcattcc tatggcaacc accgagggcg tcctcgtcgc tagtgctagc cgtggcagta 26820aggcaatcaa cctcggtggc ggtgccgtga cagtcctgac tggcgacggt atgacacgag 26880gcccgtgtgt gaagtttgat gtccttgaac gagctggtgc tgctaagatc tggctcgatt 26940cggacgtcgg ccagaccgta atgaaagaag ccttcaattc aaccagcaga tttgcgcgct 27000tacaaagtat gcggacaact atcgccggta ctcacttata tattcgattt aagactacta 27060ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720tgccctagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200tgggcaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31800atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980tgatgatctc aaattgagat ggcgagcgct ggatctggga aattggtagt gggattggta 32040tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420atcatagaat tgcagggttg ccgctgatgg ttctgataat gtttccttga gtgccgaggt 33480gccaatatgc gtaggtggtg agcagtaagg tggaggagtc tctgccaatg atgagaagac 33540cgtagaagat gtcgcggtca tcggttgtga ggtttctgtg gctcttgtag ttccagctgc 33600ggcttcttta tgtaaattgc gcttgggtag cctttcgctg tacacacacc ttaatccggc 33660ttgttgacaa cgttgacact gagcacggac taaattggca ttgctaccgg tacatttgag 33720cttttgtgca tgacaccggt cacatgagcg tcgaaacgcg cgacggcgta ggttcgtcgg 33780aatcgttgca tgcggcaggg acataattat tggattaaga tcaaataatg tgaggtgaga 33840ctttgcatgt tcctggatct ttatgtattg gaattggaga gtaagctcgt gcaggagata 33900agttcaggtc gtcttgctgg aagacttact aagttatatg caaacaagtg ttttcgagcg 33960gacaccaaaa gccaatagtc ttactatgaa tgtcttttca gtcacccgga gaaatactct 34020tagcctctgc tcttatgcga gctcatcaaa gctgggcata cataccccat ccagcgccac 34080gtattacact agaaagagtt ctaaaagaaa tagattcggc cccccatctg gctatcatat 34140atgccagatg aaatacctgt aacgtggggc ataaaaaggc aggctctagt ctaccagcag 34200atc 34203<210>2<211>34203<212>DNA<213>柑桔青霉<400>2gatctgctgg tagactagag cctgcctttt tatgccccac gttacaggta tttcatctgg 60catatatgat agccagatgg ggggccgaat ctatttcttt tagaactctt tctagtgtaa 120tacgtggcgc tggatggggt atgtatgccc agctttgatg agctcgcata agagcagagg 180ctaagagtat ttctccgggt gactgaaaag acattcatag taagactatt ggcttttggt 240gtccgctcga aaacacttgt ttgcatataa cttagtaagt cttccagcaa gacgacctga 300acttatctcc tgcacgagct tactctccaa ttccaataca taaagatcca ggaacatgca 360aagtctcacc tcacattatt tgatcttaat ccaataatta tgtccctgcc gcatgcaacg 420attccgacga acctacgccg tcgcgcgttt cgacgctcat gtgaccggtg tcatgcacaa 480aagctcaaat gtaccggtag caatgccaat ttagtccgtg ctcagtgtca acgttgtcaa 540caagccggat taaggtgtgt gtacagcgaa aggctaccca agcgcaattt acataaagaa 600gccgcagctg gaactacaag agccacagaa acctcacaac cgatgaccgc gacatcttct 660acggtcttct catcattggc agagactcct ccaccttact gctcaccacc tacgcatatt 720ggcacctcgg cactcaagga aacattatca gaaccatcag cggcaaccct gcaattctat 780gatacatcaa tcaactttga tgatcccgag tcgtttcccg gcggctggcc tcagccaaat 840acatttcgcg acgatgccaa cagcaatgaa tcttcgggga taccagatct aggctacgac 900tttgaaggcc ctttggatgc aacggcgcct gtctcgccat cgctgtttga cctcgaagta 960gaggggaact cgtcatccgg acaatccaac acaagcaaca cgcaacgaga ccttttcgaa 1020agtctgtcgg atgtgtcaca ggacctagag gtaatactcc acggggtgac tgtggaatgg 1080cccaagcaaa aaattttaag ctgtgagatt ttcaattctg cctgtttact gcctcttgat 1140tgtcgctaaa gcttcttcct agacccgata ggggactttt tgaatgcctt tggtagattg 1200ctactacatc ttcaagaacg tgtgatcacg agcagcaata gcagcatgtt agatgggtgt 1260ctgcaaacca agaacttgtt catggcggtg cattgctaca tgttgtctgt caaaatcatg 1320acatcacttt cccagctgct actatccgag gtgatgaaag cccaaccttg tggacaaaag 1380caaagcacac gaatggattg gtactggtct ggctcaacca ctagaaatga caatggaaga 1440gccgaagcac ttccctcgtt tcactctaat cttcatatcg gcgagctcat ttcacatctc 1500gacccattca tgcacgcctt atcttctgca tgcacgacat tgcgtgtaag ccttcgacta 1560ttgagtgaga ttgagactgc tttggggata gcacaggagc acggggctgc ggcatctatt 1620cgtctagtaa gtgggaccga taaccaccag tcttttcttc ccttgcatac atcagcaatg 1680cgctgaccgg gagaggggga ataggtccta tcagatatgc caagcacatc gtggcaaatc 1740cttggcgctg aaaataaaac cataacgccg gcctctcgtc tcctatctgt gctttggagt 1800gacgaagccg gagacgaaga gcccaagtca acaaaggcct cagggaagac gataaatgtg 1860ttgcgacgtt gctataagga aatattcgca ttagcgaaga aacacaatat tgcttagtac 1920cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt 2160ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580ttagccccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740tggcgatgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980tacacatttt tctccacccc gtccatttct atggctcctt tcttgccaca accgtctgac 5040atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100atttgccttg ggccctaggc agcgctgttc tcgtcgccat aggcgcaggt ctggtatcca 5160ccttccagcc ccatacatca actgtgaaat gggtcatgta ccaatttatc gcgggcttcg 5220gtcgtggttg tggcatgcaa acggtaagct atgaaacctt tgatcatctc tcacgctttc 5280ggctttgtat caaagcaaga agagcatgca accgctagac gctgacatca atactcaatg 5340gccagcctat catcgccatc caaagcacgc tttcgcccga acaaggtgcc ctcggaattt 5400ctctcgccgt gtttggacag acgtttggag gatcgctctt cctggacttt gctaaccttg 5460tctttgggtc cggtttgaga actggcctga gcaagtatgc gcccactgtc gacacgcagg 5520ccgtgacggc agcaggggcg actggcttca gagatgtggt cagcaagaat aaccttccag 5580gggttgtaaa agcttacagt ctcgccgttg atcatacttt ttacttagca gtgggagcta 5640cggcgtgcac gtttgtgttt gcctttggaa tgggatggcg gaagattgca accaaaaacg 5700acacccgggc tgtgcctgag actgatgctt gaccgcgttg ctagatagac acattaccgt 5760gcctccacaa agaatctcca catacttaat taatgtcgat ttcaaagatt ctatatgtca 5820ttgcccgcga cccatgtcta gtctaagtcc atctcaaggt tctagtcacc gtggctagat 5880tggcaacata taactatgtt gagattcata gttagttagt tacggcatct gacaatggat 5940gattgatgtt tcaggcatca atcctgatac ctcaggaatg aatcagatca acattcaacc 6000tactcagtaa gttatagctt gaacaaagct ttcactcatt aaataattat gagggatcag 6060acctaaacac tctctggaaa aggaccatct ctttatatat tcttcttccc tactacttgc 6120atcgtaaatt tcaacaacat ataaacatga gatacccttt ctggccgttc actctaccac 6180ctgcctgtct cattgcattg tgcttttgaa aattatgaca ataacaacca atgagaaaaa 6240atatgatcct cctgcaatga atccactgga gggggtacgg agcttggaat gctcctaaga 6300ttccgaccta atcagcgtcg agcccgatca gtagctgcag cactcggcct cagtgcattg 6360ttaggaacag ggactgtcct ggttccgcct gacggggaga cacttcgaga aggggctgaa 6420gatgccgggg cagaacggtt gtgcgccatg tgcgccttga ccaggtgacc ggcggctagg 6480gcagcacata gcgagagctc cccagccaaa acagcgcttc cgatgatgcg cgcaagttga 6540cgtgcattct caccgggagt ggtcgggtgt gatccgcgga caccaagcat gtcaagcatt 6600gcgccctggg gctccagaat cgtaccaccg cccaacgttc caacctcaat agacggcatg 6660gagacagaga tttgaagcga tccgcgaaga ctaaacagga ttagtgaatg tttccaagta 6720agcggccgct ttcaacttac ttgttcatga gagtgatgca gttagcgctc tccacaactt 6780gcgccggatc ctgacctgtg gcaatgaaaa tggctgccgc aagattggca gcttgggcgt 6840tgaagccgcc aactgagcca gccatagcgg acccaatcag atttttcgat atgttgagct 6900gaaccatgct atccacatcg ctctttaaga catccctgac aacgttcgcc ggtatgatgg 6960cttcggccac aatgcccttg ccccgtccat cgatccaatt caaagctgaa ggtttcttat 7020ccgtacagta atttcctgat agggtaataa tattcatatc gctgaaacct gcctctgtcg 7080ccataacatt cagtgcatgc tccacgccct tagaaatcat attcattccc atagcgtcgc 7140cagtagtagt cttaaatcga atatataagt gagtaccggc gatagttgtc cgcatacttt 7200gtaagcgcgc aaatctgctg gttgaattga aggcttcttt cattacggtc tggccgacgt 7260ccgaatcgag ccagatctta gcagcaccag ctcgttcaag gacatcaaac ttcacacacg 7320ggcctcgtgt cataccgtcg ccagtcagga ctgtcacggc accgccaccg aggttgattg 7380ccttactgcc acggctagca ctagcgacga ggacgccctc ggtggttgcc ataggaatga 7440aataactctt gccgtcgata acaataggac cggcgacgcc aacagggact ggcatatagc 7500caataacgtt ctcgcaacat gcaccgagca cgcgttccca ggcgtagttt tcgtacggca 7560gcttcgagtg ctccagcata cttgtaagct ctgcggtagc cggtgtcctc gaaatgatag 7620agcggcgaac cttgacggca cgagtgcagt ctttgagact cttctctagg gcatacccgg 7680gaacctttcc ccgcaaagac aaggcaacga catcctcatc gttcaactcg ctgattgtgt 7740tctgcttcag caaattgtcc agttcgattt gtgtgcgaga cacgggaagt tcactagtgg 7800ctgtctttcc ttctgctcgc ttagtgacct ttagagatgc tttaattaag actaatgagg 7860catcactgtc actgtcggtg gtggtaggag tgaacactct ggtctgagga gcttggagac 7920ttgattgaat ctgaggggtc tggttctggg cagcgttgaa gctttcggcc tggtcaagct 7980caactggatc aactgggtga ctcgggagat taggatcttt gattcccagt ctggcggcct 8040tgaacagata gctgttcaga gcgacactta gggcaagtgc cacaaacacc catttggaga 8100ggacgggatc ttccaggctg gtgagcaggc taccgaccat ttttccacca actccatact 8160cgtgtagctg cgaggtacca cggtgaatgg aaggatactc tagttcgtac ttgatggggg 8220cgaggacagt gaccatagtc gattgaccgc gccctcttgc ctggaaaagt agttcatcta 8280gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060ttgtagccag ccaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat 9600tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa 10380tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480ggcaactcag gaacaatgct ttcgaaccgg atatcacact tctacgactt acgtggtccc 12540agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300gaagcagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820ggtctcaatt ttcgggatgt catggttgcc atgggtcaat tggaggccaa ccgtgtgatg 17880ggcttcgaat gcgccggagt gatcacaaag ctcggtggag ctgctgccgc tagccaaggc 17940ctcagattag gggaccgcgt atgtgcacta ctgaaaggcc attgggcgac cagaacacag 18000acgccgtaca ctaatgtcgt ccgtattccg gacgaaatgg gcttcccaga agccgcttcg 18060gtccccctgg ctttcactac cgcatatatt gcgctttata ccacggcaaa gctacgacga 18120ggcgaaagag tcttgatcca cagtggagct ggaggcgtcg gtcaagcagc gatcattttg 18180tcccagcttg cgggtgccga ggtcttcgtc acagcgggaa ctcaagccaa gcgtgacttt 18240gtcggcgata aattcggcat caatccggat catatcttct cgagcaggaa tgacttattc 18300gtcgacggca tcaaagccta cacgggcgga cttggcgttc atgtcgttct aaactcattg 18360gcaggtcaac tcctccaagc aagctttgac tgcatggccg aattcggcag atttgttgag 18420attggaaaaa aggacctgga gcaaaacagc agacttgaca tgctgccatt cacccgggac 18480gtctctttca catcaattga tcttctctcg tggcaaagag ccaaaagtga agaagtatcc 18540gaagcgttga accatgtcac aaaactcctc gagacaaaag cgattggctt gattggtcca 18600atccagcagc actccttgtc aaacatcgag aaggccttcc gtacgatgca gagtggtcag 18660catgttggca aagttgtggt caatgtatct ggggacgaac tggtcccagt cggcgatgga 18720gggttctcgc tgaagctgaa gcctgacagt tcttacctag ttgctggtgg gctgggggga 18780attggaaagc agatctgtca gtggcttgtt gatcatggcg cgaagcactt gattatccta 18840tcgagaagtg caaaggccag tccattcata accagcttgc aaaatcaaca gtgcgctgtc 18900tatctacacg catgtgacat ctcagatcaa gatcaggtca ccaaggtgct ccggttgtgc 18960gaagaagcac atgcaccgcc aattcgaggt atcatacaag gtgccatggt tctcaaggac 19020gcgcttctat cgcgaatgac attggatgaa tttaatgcag caacacgccc aaaagtacag 19080ggtagttggt atcttcacaa gatcgcacag gatgttgact tcttcgtgat gctctcatcc 19140cttgttgggg tcatgggtgg ggcaggccag gccaattacg cagctgctgg tgcattccag 19200gacgcacttg cgcaccaccg gagagcccat ggcatgccgg ctgtcaccat tgacttgggc 19260atggtcaagt ctgttggata cgtggctgaa actggccgtg gtgtggccga ccggctcgct 19320agaataggtt acaagcctat gcatgaaaag gacgtcatgg atgtgttgga gaaggcaatc 19380ctgtgttctt cccctcaatt tccatcacct cccgcagctg tggttacagg aatcaacaca 19440tccccgggtg ctcactggac cgaggcaaac tggatacagg aacagcggtt tgtgggactt 19500aaataccgcc aagtccttca tgcagaccaa tcctttgtct cttcgcataa aaaaggacca 19560gatggcgtgc gggcccaact aagcagggtc acctctcacg acgaggccat ttctatcgtc 19620ctcaaagcaa tgacggaaaa gctgatgcga atgtttggtc tggcagaaga cgacatgtcc 19680tcgtccaaaa acctggcagg tgtcggcgta gactcactcg tcgccattga acttcgaaac 19740tggatcacat ctgaaatcca tgttgatgtg tcgatctttg agctcatgaa tggtaacacc 19800atcgccggcc tcgtcgagtt agttgtggcg aaatgcagtt aagttgaagg gttcagtgaa 19860gccttttgtc tggccaagcg ggtatagctc gacggaggta tagtacgaag gagcatagcg 19920gccatggtct gaagcctgaa tccaatctga atcgagcctg ggctgagcct gactatttaa 19980tgcctgactt ctggatagca gtaaatagag atacctgaaa taccattaca gtggccctga 20040gaagcaacaa agtacacatg tgcactcgtt ctcgaagtcg gaagagtgaa tgctttttat 20100actaccaggg aagctgtctt agcacctcgg aggcttgact gtcaaaagtt ctctcttttt 20160ctctccatta tgattcccgc aagccttgta aatgcgcgtt gaacggtcga aaggcgttgg 20220cacgggcagt gggtacagat tgtggatatg tagtcggaag gcgggaggga gtacttgtgt 20280ccacgtcgtt gcgccgtcct ctctttcgcc tagtcgggga tgttgagtag gaacatcaag 20340acttaacaga gcctaagccc tcgtcatcgt aagcgccagt caacgcctga gagaatgggg 20400agatcggtga ttgtaccggg agaaaagctt cattactgcc gacttcccta cgtggcggtg 20460tagctggcgg tatagaagca gatggccgct ctgcgtagca ggaatacaca ctctctccct 20520tctctctctc tgtgtttctg tctctcgcac atagccaaag tctacaccac gttcgattac 20580aaagaaggca tcacaatcga ataaaatgcg ttttatttta ctaacctact cgactaatac 20640agcacctagt ttctctggga cggaaactat tggaataagc ctggggacgg atgcatattt 20700gttttagttt gcgtgttata tcttagcacc ggtcatgagg gagcgggatg tcctcgttgc 20760gccggcgtac catgagcttt gtggttggat gcatacgaac gctaaaagcg tgacggtagt 20820atttgtcatc gtctcctggt acaggcttca catcatactg aatcagtata tgagcgagga 20880gaatcttgat ttccttcgag gcgaagaacc gcccgggaca agcgcgtggg ttccagccga 20940agccgatgtg atcaccgttg gtattctcca attgagcggt gaaggccttg tctggatcct 21000cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180gctgcgtctc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660gccactcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag 22020agacgtcatt gagttacaac aatggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200tccagctcgg accatacgta tcgaagtcct gcctagccct catggtcgtc aactcccacc 22260attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320gactaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700cgggcgagag taccatggcg gttgcagccg gtgcgaatct gatattgggc cccatgacct 23760ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180gttgcagaaa gtctctctct ccctaacacg aagatcccag gaactggtac accagccggt 24240gacccacagg aagctgaggc tattgcaaca gccttcttcg gacacaagga tggaacaatc 24300gacagcgacg gcgagaaaga tgagcttttt gtcggcagca tcaagacagt tctcggtcac 24360acggaaggca ctgctggtat tgcgggctta atgaaggcat cgtttgctgt acgaaatggc 24420gtgatcccgc caaacctgct gtttgagaag atcagtcccc gtgtcgctcc gttctatacg 24480cacttgaaaa ttgcaacgga ggccacagaa tggccgattg ttgcgcccgg gcagcctcgc 24540agagtcagcg ttaattcatt tggtaaggat tcaactgcac ttcttgagaa cgaaagtgaa 24600gttagctaaa catataaaca catcaggatt tggtggtaca aatgcccatg ctattatcga 24660agagtatatg gctcctccac acaagccgac agcagtggta acagaggtga cctcagatgc 24720agatgcatgc agcttgcccc ttgtgctttc atcgaagtcg cagcgctcca tgaaggcaac 24780gctagaaaat atgctccaat ttctggaaac gcatgatgac gtggacatgc atgatatcgc 24840atatacctta cttgagaaac ggtctatctt gcccttccgt cgtgcgattg cagcacacaa 24900caaggaagta gcccgcgcgg cactggaggc tgccatcgcg gacggtgagg tcgtcaccga 24960cttccgcacc gacgcgaatg acaaccctcg cgtactaggt gtctttactg gccaaggtgc 25020acagtggccg ggcatgctga agaagctcat ggtgggtatg ccatttgtga gaggcattct 25080cgaagagctg gataattcac tgcaaacact gcctgaaaag tatcggccta cgtggacact 25140gtatgaccag ctcatgcttg aaggggatgc ctcaaacgtc agactcgcca gcttctccca 25200gcctctatgc tgcgccgtac aaatcgttct ggtccgactt ctcgctgcag ctggtatcga 25260gttcagtgca attgtcggcc acagttcagg tgagattgcc tgtgcctttg cggcaggatt 25320catcagtgcc actcaagcta tccgtattgc gcatctgcgt ggagttgtgt ccgcggagca 25380tgcctcttct ccaagcggcc agacaggcgc tatgctagcg gcaggtatgt cgtacgatga 25440cgcaaaggaa ctatgcgagc tcgaagcctt tgagggtcgg gtctgcgtcg ccgctagcaa 25500ttcaccggat agtgtgacct tctccggcga catggatgct atccagcacg ttgaaggtgt 25560cttggaggat gaatccactt ttgccagaat cttgagagtt gacaaggcct accattcgca 25620tcacatgcac ccatgcgcag ctccatatgt caaggcattg ctggagtgcg actgtgctgt 25680tgccgatggc caaggtaacg atagtgttgc ttggttctct gccgtccacg agaccagcaa 25740gcaaatgact gtacaggatg tgatgcccgc ttattggaaa gacaatctcg tctctccggt 25800cttgttctcg caggctgtgc agaaagcagt catcactcat cgtctaatcg acgtcgccat 25860cgaaattggc gcccaccctg ctctcaaggg tccgtgtcta gccaccatca aggatgctct 25920tgccggtgtg gagctgccgt ataccgggtg cttggcacga aacgttgacg atgtggacgc 25980ttttgctgga ggtctgggat acatttggga gcgtttcgga gttcggagta tcgacgccga 26040gggcttcgta caacaagtcc ggcccgatcg tgccgttcaa aacctgtcaa agtcattgcc 26100cacatactct tgggatcata ctcgtcaata ctgggcagaa tctcgctcca cccgccagca 26160tcttcgtgga ggtgcgcccc atcttctgct tggaaagctt tcttcttaca gcacagcatc 26220gaccttccag tggacaaact tcatcaggcc ccgggatctg gaatggctcg acggtcatgc 26280gctacaaggc cagactgtgt tccccgctgc tgggtacata attatggcca tggaagctgc 26340catgaaggtg gctggtgagc gtgccgccca agttcagctc ctggaaatct tggacatgag 26400catcaacaaa gccatcgtgt ttgaagatga aaacacctcc gtggagctga acttgacagc 26460cgaagtcacc agtgacaatg atgcggatgg ccaagtcacg gtcaaatttg ttattgattc 26520ctgtctggca aaggagagtg agctttcgac atccgccaaa ggccaaatcg tcataaccct 26580tggcgaggca tcaccgtcat cgcagctttt gccgccacct gaggaagagt acccccagat 26640gaacaatgtc aacatcgatt tcttctatcg ggaacttgac ctccttgggt atgactacag 26700caaagacttc cgtcgtttgc agaccatgag aagggccgac tccaaagcta gcggcacctt 26760ggctttcctt ccacttaagg atgaattgcg caatgagccc ctcttgctcc acccagcgcc 26820cctggacatc gcgttccaga ctgtcattgg agcgtattcc tctccaggag atcgtcgcct 26880acgctcattg tacgtgccta ctcacgttga cagagtgact ctgattccat cgctctgtat 26940atcggcgggt aattctggtg aaaccgagct tgcgtttgac acaatcaaca cacacgacaa 27000gggtgatttc ctgagcggcg acatcacggt gtacgattcg accaagacaa cgcttttcca 27060agttgataac attgtcttta agcctttctc tcccccgact gcttcgaccg accaccgaat 27120cttcgcaaag tgggtctggg gacccctcac gcccgaaaaa ctgctggagg accctgcgac 27180gttgatcata gctcgggaca aggaggacat tctgaccatc gagcgaatcg tttacttcta 27240catcaaatcc ttcctagccc agataacccc cgacgaccgt caaaatgccg acctccattc 27300ccagaagtac attgaatggt gtgaccaggt tcaggccgat gctcgggctg gccaccatca 27360gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27480actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30360tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540tacggtgtag ggtttgtcac gagggccgag atggaggagg actttgatgc tatccgtttc 30600atgtttgact cagttgaaga gcatgagctg cacacgcttt tcgccgaagc ggtcgtgtct 30660gaccagcgtg cccggcagca accacagcgc aagacggtca ttgacatggc ggaccttgag 30720cttaccacgg gtatcccaga tcttgaccct gcgcttcaag atcgaattat ttacttcaac 30780gaccctcgtt tcggaaactt caaaattccc ggtcaacgcg gagacggtgg cgacaatgga 30840tcagggtcta aaggctccat tgccgaccag ctcaaacaag caacaacttt agaccaagtt 30900cggcaaatcg tgattggtaa gttatctctc atgcgtttcc tgatatcgag ttcaaactaa 30960caaagttgca gatggtctat ctgagaaact ccgtgttacc ctccaagttt cggacgggga 31020gagcgtggac ccaaccattc ctctcattga tcaaggtgtc gactccttgg gtgcagtgac 31080tgtcggctca tggttctcaa agcaactcta ccttgacctc ccactcttga gggtacttgg 31140cggtgcttct gtcgctgatc ttgccgacga cgcggccacc cgactcccag ctacatccat 31200tccgctgctg ttgcaaattg gtgattccac gggaacctcg gacagcgggg cttctccgac 31260accaacagac agccatgatg aagcaagctc tgctaccagc acagatgcgt cgtcagccga 31320agaggatgaa gagcaagagg acgataatga gcagggaggc cgtaagattc ttcgtcgcga 31380gaggttgtcc cttggccagg agtattcctg gaggcagcaa caaatggtaa aagatcatac 31440catcttcaac aacactattg gcatgttcat gaagggtacc attgacctcg accggttgag 31500gcgggctctg aaagcctcat tgcgccgtca cgagatcttc cgtacgtgct ttgttactgg 31560cgatgactat agcagcgatt taaatggtcc cgtccaagtg gttctcaaga acccggagaa 31620cagagtgcac tttgttcagg tgaacaacgc tgcggaggca gaggaagagt accggaaact 31680cgagaagaca aactatagca tctccacagg tgacactctc agactcgttg atttctactg 31740gggcacagat gaccacctgt tggtaatcgg ctaccacaga ttagttggtg atggctcaac 31800aacagaaaac ctgttcaatg agatcgggca gatttacagc ggggtgaaaa tgcagcgacc 31860atcgacccaa ttctctgatc tagccgtcca acagcgggaa aacctggaaa atgggcgaat 31920gggggacgat atcgcgttct ggaagtccat gcatagcaaa gtctcgtcat ctgcgccaac 31980cgtgcttccc atcatgaatc tgatcaatga ccctgctgcc aattcagagc agcagcaaat 32040acagccattc acgtggcagc agtatgaagc aattgctcgt ttagatccca tggtcgcctt 32100ccgaatcaaa gagcggagcc gcaagcacaa ggcaaccccc atgcagttct acctggccgc 32160ctaccacgtt ttgttggcgc gtcttaccgg cagcaaagac ataaccatcg gcctcgccga 32220aaccaaccga tccaccatgg aagaaatttc ggcgatgggc tttttcgcta acgtgcttcc 32280cctgcgcttt gatgagttcg tcggcagcaa gacattcggc gagcaccttg tagccaccaa 32340ggacagtgtg cgtgaggcca tgcaacacgc gcgggtgccg tatggcgtca tcctcgactg 32400tctaggcctg aatctcccta cctcaggcga ggaacccaag actcagacac acgccccctt 32460gttccaggct gtctttgatt acaagcaggg tcaagcggag agtggctcaa ttggcaatgc 32520caaaatgacg agtgttctcg cttcccgtga gcgcactcct tatgacatcg ttctcgagat 32580gtgggatgac cctaccaagg acccactcat tcatgtcaaa cttcagagct cgctgtatgg 32640ccctgagcac gctcaggcct ttgtagacca cttttcttca atcctcacta tgttctcgat 32700gaacccggct ctgaagttgg cctagatcgt tcagcgccgt gaattcagat gtgtggtttg 32760agtgttgttc atgataaaga tggattagaa attggcaata gagcagatgg caaatctatc 32820ctgaattcgg cgtcaattga cacacgcata ttcatctaca aatagcgaat tcgtcttgta 32880tctttgtcaa aattacttct accttcgttg ctcttcttta ttgcagcaat cgtaacatca 32940agttagatag cgcggttcag agtaccgtaa cggtgataaa tatacctcgg tagcgcgttt 33000cgaaagactc tgtgaggaag gtgaaacctc caaggcttgg aattgatttc aatccatcct 33060gtatataaat tcgacgccat tgcaaatagt tccatagtta ctggtttagt gccttgttgt 33120ggtgatcgag tggttttaga tgtctgtcat gcctgttcag aacgagcctt ccatgatcta 33180tccaaaatat gttcacgaaa tatttatgag atggtcgcga ccactataac taaatcaccc 33240ttggaaggtg agcattcaaa ccgtgtaaga ttagaactat tcaaatttgt tcagtaaaaa 33300tgtggtatgg actaggcatg agagccagag ccttgctata taccctgttg tctcacctag 33360acaaatgaac ctgacatctt gaccttttga tatagctgtt ggaagcgctt gaccgtctcc 33420tggacatcac tcggtctgtt gggaaaatta tgctttccct gaaactcgag tacatctgca 33480ttctgaggca ggtaatgtgt ttcaaccatc tgtctcgacc cttggagagc aaaatcttga 33540cgaccgtgaa gatgcagtgt cggcacgttg attattagct tgtcgtcgtc gtcttgcgcc 33600tcggctctca tgtaatctct ggcttcatcg ctatagaaac agcaaatcaa aacagcaatg 33660ctcattttcg gaaaccatgg cagttttccc atttgctgtt gatggagcag caaagtggcg 33720accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200atc 34203<210>3<211>17<212>DNA<213>人工序列<220><221>misc feature<223>人工序列的说明:具有由黄曲霉PKS的氨基酸序列推断的
DNA序列的混合引物<220><221>修饰碱基<222>(6)..(6)<223>i<220><221>修饰碱基<222>(9)..(9)<223>i<400>3gayacngcnt gyasttc 17<210>4<211>17<212>DNA<213>人工序列<220><221>misc feature<223>人工序列的说明:具有由黄曲霉PKS的氨基酸序列推断的
DNA序列的混合引物<220><221>修饰碱基<222>(3)..(3)<223>i<220><221>修饰碱基<222>(6)..(6)<223>i<220><221>修饰碱基<222>(8)..(8)<223>i<220><221>修饰碱基<222>(15)..(15)<223>i<400>4tcnccnknrc wgtgncc 17<210>5<211>19<212>DNA<213>柑桔青霉<400>5gcatgttcaa tttgctctc 19<210>6<211>19<212>DNA<213>柑桔青霉<400>6ctggatcaga cttttctgc 19<210>7<211>18<212>DNA<213>柑桔青霉<400>7gtcgcagtag catgggcc 18<210>8<211>20<212>DNA<213>柑桔青霉<400>8gtcagagtga tgctcttctc 20<210>9<211>20<212>DNA<213>柑桔青霉<400>9gttgagagga ttgtgagggc 20<210>10<211>19<212>DNA<213>柑桔青霉<400>10ttgcttgtgt tggattgtc 19<210>11<211>20<212>DNA<213>柑桔青霉<400>11catggtactc tcgcccgttc 20<210>12<211>19<212>DNA<213>柑桔青霉<400>12ctccccagta cgtaagctc 19<210>13<211>21<212>DNA<213>柑桔青霉<400>13ccataatgag tgtgactgtt c 21<210>14<211>19<212>DNA<213>柑桔青霉<400>14gaacatctgc atccccgtc 19<210>15<211>20<212>DNA<213>柑桔青霉<400>15ggaaggcaaa gaaagtgtac 20<210>16<211>21<212>DNA<213>柑桔青霉<400>16agattcattg ctgttggcat c 21<210>17<211>722<212>DNA<213>柑桔青霉<400>17ggccacgcgt cgactagtac gggggggggg gggggggggg gcttgttcgc tcagagattc 60aactctgcga ttctgtttaa tcccaatcct atcgcccaaa aacaggatca gcagttatgg 120atcaagccaa ctatccaaac gagccaattg tggtagtggg aagcggttgt cggtttccag 180gtggtgtcaa cacaccatca aaactttggg agctgctcaa agagccccgg gatgtacaga 240ccaagatccc taaggagaga tttgacgtcg atacatttta cagccccgat ggcactcacc 300ccgggcgcac gaacgcaccc tttgcatact tgctgcagga ggatctacgc ggttttgatg 360cctctttctt caacatccaa gctggagagg ccgaaacgat tgacccacag caaaggctgc 420tgctggagac ggtctatgaa gctgtatcca acgcaggcct acggatccaa ggccttcaag 480gatcctctac tgctgtgtac gtcggtatga tgacgcatga ctatgagact atcgtgacgc 540gtgaattgga tagtattcct acatactctg ccacgggggt agctgtcagt gtggcctcca 600accgtgtatc atacttcttc gactggcatg ggccgagtat gacgatcgac acagcctgta 660gttcatcctt agctgccgtg catctggccg tccaacagct tagaacgggc gagagtacca 720tg 722<210>18<211>760<212>DNA<213>柑桔青霉<400>18ggccacgcgt cgactagtac gggggggggg gggggggggg gactatcaac ggttttatca 60ccagggcgac tgatatatca gtcaatgaaa caacgttgga atgaacaata cccccgccgt 120aaccgcaacc gcaaccgcaa ccgcaaccgc aaccgcaatg gcaggctcgg cttgctctaa 180cacatccacg cccattgcca tagttggaat gggatgtcga tttgctggag atgcaacgag 240tccacagaag ctttgggaaa tggttgaaag aggaggcagt gcctggtcta aggtcccctc 300ctcgcgattc aatgtgagag gagtatacca cccgaatggc gaaagggtcg ggtccaccca 360cgtaaagggt ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa 420catgaccaca gaggtcgcca gctgcatgga tccgcagtat cggcttatgc ttgaggtggt 480ctacgaatcg ctggagagtg ccggtatcac catcgatggt atggcaggct ctaatacgtc 540ggtgtttggg ggtgtcatgt accacgacta tcaggattcg ctcaatcgtg accccgagac 600agttccgcgt tatttcataa ctggcaactc aggaacaatg ctttcgaacc ggatatcaca 660cttctacgac ttacgtggtc ccagcgtgac ggttgacacg gcctgttcga cgacattgac 720cgcactgcac ttggcgtgcc agagcttacg tactggggag 760<210>19<211>773<212>DNA<213>柑桔青霉<400>19ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag 60agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg 120cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc 180tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc 240tcaagccctt gtggcggtcg cagtgcttct tagtctcatc gcctaccgtt tgcgggggcg 300ccagtccgaa ctgcaagtct ataatcccaa aaaatggtgg gagttgacga ccatgagggc 360taggcaggac ttcgatacgt atggtccgag ctggatcgaa gcttggttct cgaaaaacga 420caagcccctg cgcttcattg ttgattccgg ctattgcacc atcctcccat cgtccatggc 480cgacgagttt cggaaaatca aagatatgtg catgtacaag tttttggcgg atgactttca 540ctctcatctc cctggattcg acgggttcaa ggaaatctgc caggatgcac atcttgtcaa 600caaagttgtt ttgaaccagt tacaaaccca agcccccaag tacacaaagc cattggctac 660cttggccgac gctactattg ccaagttgtt cggtaaaagc gaggagtggc aaaccgcacc 720tgtctattcc aatggattgg accttgtcac acgaacagtc acactcatta tgg 773<210>20<211>527<212>DNA<213>柑桔青霉<400>20ggccacgcgt cgactagtac gggggggggg gtacctagga actgttcagt tgtccctccc 60aaccccttgg gccgaacaac cttcctccaa tctacgacgg cagattatac ctaggcgcct 120aaccgattag gttgctcatt cgattttgga gagactacct agctataggt accactccaa 180gctgtagcac agacctttca gcatggtcgc ttcgttgcta ccctctcgct ttcgcggtag 240ggaatcaatg aatcagcagc accctctacg ctcgggaaat cgggcattga cctccacact 300ccaatttcta tccaaaacgg cgtgtctaca cccgatccat accgtttgca ccatagctat 360tctagctagt accacatacg ttggactact caaagacagc ttcttccatg gccccgcaaa 420cgttgataaa gcagaatggg gctctttggt cgaaggaagt cgaagcttga tcaccggccc 480acagaatggc tggaagtggc agagcttcga cggggatgca gatgttc 527<210>21<211>522<212>DNA<213>柑桔青霉<400>21ggccacgcgt cgactagtac gggggggggg gggggggggg ggatccatca atctgacttc 60aggctagcgg accttaacga aacaacgaga gcgagatcat tcatacacca aaacacaggt 120actatagaag cgccgcgcag tagagattca caccgcccct tgaagcaaaa gtcggaagga 180attgcgcgat gtcagaacct ctacccccta aagaagggga accaaggcca cagaaggaag 240aaagtcaaaa tgacacgctc gaagcgactg agtccaagtc ccagcacatc acaggcctca 300agctcgggct ggtggttgct tcagttactt tcgtagcatt tttgatgctc cttgatatgt 360ccattatcgt cacggcaatc ccacatatca caagcgagtt ccactctctg aacgatgtag 420ggtggtacgg cagtgcttat cttctggcta actgtgctct ccagcccctg gccggtaaat 480tgtatacact cttgggcttg aagtacactt tctttgcctt cc 522<210>22<211>541<212>DNA<213>柑桔青霉<400>22ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc 60aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc 360accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga 420accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc 480gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc 540t 541<210>23<211>20<212>DNA<213>柑桔青霉<400>23atcataccat cttcaacaac 20<210>24<211>20<212>DNA<213>柑桔青霉<400>24gctagaatag gttacaagcc 20<210>25<211>20<212>DNA<213>柑桔青霉<400>25acattgccag gcacccagac 20<210>26<211>20<212>DNA<213>柑桔青霉<400>26caacgcccaa gctgccaatc 20<210>27<211>20<212>DNA<213>柑桔青霉<400>27gtcttttcct actatctacc 20<210>28<211>20<212>DNA<213>柑桔青霉<400>28ctttcccagc tgctactatc 20<210>29<211>1524<212>DNA<213>柑桔青霉<400>29aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttcaa cgaaggtaga 60agtaattttg acaaagatac aagacgaatt cgctatttgt agatgaatat gcgtgtgtca 120attgaagccg aattcaggat agatttgcca tctgctctat tgccaatttc taatccatct 180ttatcatgaa caacactcaa accacacatc tgaattcacg gcgctgaacg atctaggcca 240acttcagagc cgggttcatc gagaacatag tgaggattga agaaaagtgg tctacaaagg 300cctgagcgtg ctcagggcca tacagcgagc tctgaagttt gacatgaatg agtgggtcct 360tggtagggtc atcccacatc tcgagaacga tgtcataagg agtgcgctca cgggaagcga 420gaacactcgt cattttggca ttgccaattg agccactctc cgcttgaccc tgcttgtaat 480caaagacagc ctggaacaag ggggcgtgtg tctgagtctt gggttcctcg cctgaggtag 540ggagattcag gcctagacag tcgaggatga cgccatacgg cacccgcgcg tgttgcatgg 600cctcacgcac actgtccttg gtggctacaa ggtgctcgcc gaatgtcttg ctgccgacga 660actcatcaaa gcgcagggga agcacgttag cgaaaaagcc catcgccgaa atttcttcca 720tggtggatcg gttggtttcg gcgaggccga tggttatgtc tttgctgccg gtaagacgcg 780ccaacaaaac gtggtaggcg gccaggtaga actgcatggg ggttgccttg tgcttgcggc 840tccgctcttt gattcggaag gcgaccatgg gatctaaacg agcaattgct tcatactgct 900gccacgtgaa tggctgtatt tgctgctgct ctgaattggc agcagggtca ttgatcagat 960tcatgatggg aagcacggtt ggcgcagatg acgagacttt gctatgcatg gacttccaga 1020acgcgatatc gtcccccatt cgcccatttt ccaggttttc ccgctgttgg acggctagat 1080cagagaattg ggtcgatggt cgctgcattt tcaccccgct gtaaatctgc ccgatctcat 1140tgaacaggtt ttctgttgtt gagccatcac caactaatct gtggtagccg attaccaaca 1200ggtggtcatc tgtgccccag tagaaatcaa cgagtctgag agtgtcacct gtggagatgc 1260tatagtttgt cttctcgagt ttccggtact cttcctctgc ctccgcagcg ttgttcacct 1320gaacaaagtg cactctgttc tccgggttct tgagaaccac ttggacggga ccatttaaat 1380cgctgctata gtcatcgcca gtaacaaagc acgtacggaa gatctcgtga cggcgcaatg 1440aggctttcag agcccgcctc aaccggtcga ggtcaatggt acccttcatg aacatgccaa 1500tagtgttgtt gaagatggta tgat 1524<210>30<211>784<212>DNA<213>柑桔青霉<400>30aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc tttgttgctt 60ctcagggcca ctgtaatggt atttcaggta tctctattta ctgctatcca gaagtcaggc 120attaaatagt caggctcagc ccaggctcga ttcagattgg attcaggctt cagaccatgg 180ccgctatgct ccttcgtact atacctccgt cgagctatac ccgcttggcc agacaaaagg 240cttcactgaa cccttcaact taactgcatt tcgccacaac taactcgacg aggccggcga 300tggtgttacc attcatgagc tcaaagatcg acacatcaac atggatttca gatgtgatcc 360agtttcgaag ttcaatggcg acgagtgagt ctacgccgac acctgccagg tttttggacg 420aggacatgtc gtcttctgcc agaccaaaca ttcgcatcag cttttccgtc attgctttga 480ggacgataga aatggcctcg tcgtgagagg tgaccctgct tagttgggcc cgcacgccat 540ctggtccttt tttatgcgaa gagacaaagg attggtctgc atgaaggact tggcggtatt 600taagtcccac aaaccgctgt tcctgtatcc agtttgcctc ggtccagtga gcacccgggg 660atgtgttgat tcctgtaacc acagctgcgg gaggtgatgg aaattgaggg gaagaacaca 720ggattgcctt ctccaacaca tccatgacgt ccttttcatg cataggcttg taacctattc 780tagc 784<210>31<211>764<212>DNA<213>柑桔青霉<400>31aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc gaataaaatg 60cgttttattt tactaaccta ctcgactaat acagcaccta gtttctctgg gacggaaacc 120attggaataa gcctggggac ggatgcatat ttgttttagt ttgcgtgtta tatcttagca 180ccggtcatga gggagcggga tgtcctcgtt gcgccggcgt accatgagct ttgtggttgg 240atgcatacga acgctaaaag cgtgacggta gtatttgtca tcgtctcctg gtacaggctt 300cacatcatac tgaatcagta tatgagcgag gagaatcttg atttccttcg aggcgaagaa 360ccgcccggga caagcgcgtg ggttccagcc gaagccgatg tgatcaccgt tggtattctc 420caattgagcg gtgaaggcct tgtctggatc ctcgcgcatg cgcataaatc ggtagggatc 480ataattttcg gggttttccc acacatcagg gttgttcatg cggtctgcag ccacagcggc 540caactcgccc ttgggaatga agaggccatt ggatagagtg atgtctctga gagcggtact 600gcgcatagtg gcgcactcga ccggcttgat tcgctgcgtc tctttcatgc agctgtcgag 660gagcttcagc ttgaacagag aggcaggcgt ccagccccct tctccgatta cagtgcggat 720ctcttggcgg agaggctgaa taaggtctgg gtgcctggca atgt 764<210>32<211>765<212>DNA<213>柑桔青霉<400>32aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttctgg aaaaggacca 60tctctttata tattcttctt ccctactact tgcatcgtaa atttcaacaa catataaaca 120tgagataccc tttctggccg ttcactctac cacctgcctg tctcattgca ttgtgctttt 180gaaaattatg acaataacaa ccaatgagaa aaaatatgat cctcctgcaa tgaatccact 240ggagggggta cggagcttgg aatgctccta agattccgac ctaatcagcg tcgagcccga 300tcagtagctg cagcactcgg cctcagtgca ttgttaggaa cagggactgt cctggttccg 360cctgacgggg agacacttcg agaaggggct gaagatgccg gggcagaacg gttgtgcgcc 420atgtgcgcct tgaccaggtg accggcggct agggcagcac atagcgagag ctccccagcc 480aaaacagcgc ttccgatgat gcgcgcaagt tgacgtgcat tctcaccggg agtggtcggg 540tgtgatccgc ggacaccaag catgtcaagc attgcgccct ggggctccag aatcgtacca 600ccgcccaacg ttccaacctc aatagacggc atggagacag agatttgaag cgatccgcga 660agattgttca tgagagtgat gcagttagcg ctctccacaa cttgcgccgg atcctgacct 720gtggcaatga aaatggctgc cgcaagattg gcagcttggg cgttg 765<210>33<211>802<212>DNA<213>柑桔青霉<400>33aactggaaga attcgcggcc gcaggaattt tttttttttt tttttataga atctttgaaa 60tcgacattaa ttaagtatgt ggagattctt tgtggaggca cggtaatgtg tctatctagc 120aacgcggtca agcatcagtc tcaggcacag cccgggtgtc gtttttggtt gcaatcttcc 180gccatcccat tccaaaggca aacacaaacg tgcacgccgt agctcccact gctaagtaaa 240aagtatgatc aacggcgaga ctgtaagctt ttacaacccc tggaaggtta ttcttgctga 300ccacatctct gaagccagtc gcccctgctg ccgtcacggc ctgcgtgtcg acagtgggcg 360catacttgct caggccagtt ctcaaaccgg acccaaagac aaggttagca aagtccagga 420agagcgatcc tccaaacgtc tgtccaaaca cggcgagaga aattccgagg gcaccttgtt 480cgggcgaaag cgtgctttgg atggcgatga taggcgtttg catgccacaa ccacgaccga 540agcccgcgat aaattggtac atgacccatt tcacagttga tgtatggggc tggaaggtgg 600ataccagacc tgcgcctatg gcgacgagaa cagcgctgcc tagggcccaa ggcaaatagt 660atcctgtctt tccaattgcg aagccagaaa ccatagccat aatgacttgt ccaagaattc 720caggcaacat gtacacacca ctcagtgtgg gagaaacatc cttcacagcc tggaagtaga 780tcggtagata gtaggaaaag ac 802<210>34<211>562<212>DNA<213>柑桔青霉<400>34aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttttac taagcaatat 60tgtgtttctt cgctaatgcg aatatttcct tatagcaacg tcgcaacaca tttatcgtct 120tccctgaggc ctttgttgac ttgggctctt cgtctccggc ttcgtcactc caaagcacag 180ataggagacg agaggccggc gttatggttt tattttcagc gccaaggatt tgccacgatg 240tgcttggcat atctgatagg actagacgaa tagatgccgc agccccgtgc tcctgtgcta 300tccccaaagc agtctcaatc ccactcaata gtcgaaggct tacacgcaat gtcgtgcatg 360cagaagataa ggcgtgcatg aatgggtcga gatgtgaaat gagctcgccg atatgaagat 420tagagtgaaa cgagggaagt gcttcggctc ttccattgtc atttctagtg gttgagccag 480accagtacca atccattcgt gtgctttgct tttgtccaca aggttgggct ttcatcacct 540cggatagtag cagctgggaa ag 562<210>35<211>26<212>DNA<213>柑桔青霉<400>35gttaacatgt cagaacctct accccc 26<210>36<211>27<212>DNA<213>柑桔青霉<400>36aatatttcaa gcatcagtct caggcac 27<210>37<211>1662<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1662)<400>37atg tca gaa cct cta ccc cct aaa gaa ggg gaa cca agg cca cag aag 48Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys1 5 10 15gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag 96Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc 144His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc 192Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60cca cat atc aca agc gag ttc cac tct ctg aac gat gta ggg tgg tac 240Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr65 70 75 80ggc agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt 288Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc ctc 336Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110tgt att ttt gaa cta ggc tcg gtg cta tgc ggt gcc gca aga tct tcc 384Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125acc atg ttg att gtt ggg cgg gcc gtt gct gga atg gga ggc tca ggt 432Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140ctt gtc aac gga gcc ctc aca atc ctc tca aca gct gct cct aag cac 480Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His145 150 155 160aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc 528Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175att gtc tgt gga cca ctg ctc gga ggt gct ttc act caa cac gcc act 576Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190tgg cga tgg tgc ttt tat atc aat ctc ccc atc ggc gct gtc gct gca 624Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205ttc ctc ctt ctc gtc atc acc ata ccc gac cga att tca tcc acg gac 672Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220agc gaa ctc tcg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt 720Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu225 230 235 240cgc aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc 768Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255atg att tcc ctc gca cta gaa tgg gga ggg tcg acc tac acc tgg cga 816Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt gct ctg att 864Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285gcg ttc gtg cta tgg gag cgt cat gtt ggc gat gct gtt gcc atg att 912Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300cct ggc tca gtg gct ggt aaa cga caa gtg tgg tgc tct tgt tta ttt 960Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe305 310 315 320atg ggc ttt ttc tct ggc tcc ttg ctt gtc ttt tcc tac tat cta ccg 1008Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335atc tac ttc cag gct gtg aag gat gtt tct ccc aca ctg agt ggt gtg 1056Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350tac atg ttg cct gga att ctt gga caa gtc att atg gct atg gtt tct 1104Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc cta ggc 1152Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380agc gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag 1200Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln385 390 395 400ccc cat aca tca act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc 1248Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415ttc ggt cgt ggt tgt ggc atg caa acg cct atc atc gcc atc caa agc 1296Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430acg ctt tcg ccc gaa caa ggt gcc ctc gga att tct ctc gcc gtg ttt 1344Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445gga cag acg ttt gga gga tcg ctc ttc ctg gac ttt gct aac ctt gtc 1392Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg ccc act gtc 1440Phe Gly Set Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val465 470 475 480gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg 1488Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc 1536Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt 1584Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac 1632Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540acc cgg gct gtg cct gag act gat gct tga 1662Thr Arg Ala Val Pro Glu Thr Asp Ala545 550<210>38<211>553<212>PRT<213>柑桔青霉<400>38Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys1 5 10 15Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr65 70 75 80Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His145 150 155 160Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu225 230 235 240Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe305 310 315 320Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln385 390 395 400Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val465 470 475 480Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540Thr Arg Ala Val Pro Glu Thr Asp Ala545 550<210>39<211>31<212>DNA<213>柑桔青霉<400>39ggatccatgt ccctgccgca tgcaacgatt c 31<210>40<211>30<212>DNA<213>柑桔青霉<400>40ggatccctaa gcaatattgt gtttcttcgc 30<210>41<211>1380<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1380)<400>41atg tcc ctg ccg cat gca acg att ccg acg aac cta cgc cgt cgc gcg 48Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala1 5 10 15ttt cga cgc tca tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc 96Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30ggt agc aat gcc aat tta gtc cgt gct cag tgt caa cgt tgt caa caa 144Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45gcc gga tta agg tgt gtg tac agc gaa agg cta ccc aag cgc aat tta 192Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60cat aaa gaa gcc gca gct gga act aca aga gcc aca gaa acc tca caa 240His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln65 70 75 80ccg atg acc gcg aca tct tct acg gtc ttc tca tca ttg gca gag act 288Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95cct cca cct tac tgc tca cca cct acg cat att ggc acc tcg gca ctc 336Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110aag gaa aca tta tca gaa cca tca gcg gca acc ctg caa ttc tat gat 384Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125aca tca atc aac ttt gat gat ccc gag tcg ttt ccc ggc ggc tgg cct 432Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140cag cca aat aca ttt cgc gac gat gcc aac agc aat gaa tct tcg ggg 480Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly145 150 155 160ata cca gat cta ggc tac gac ttt gaa ggc cct ttg gat gca acg gcg 528Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tca 576Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190tcc gga caa tcc aac aca agc aac acg caa cga gac ctt ttc gaa agt 624Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205ctg tcg gat gtg tca cag gac cta gag gta ata ctc cac ggg gtg act 672Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220gtg gaa tgg ccc aag caa aaa att tta agc tac ccg ata ggg gac ttt 720Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe225 230 235 240ttg aat gcc ttt ggt aga ttg cta cta cat ctt caa gaa cgt gtg atc 768Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255acg agc agc aat agc agc atg tta gat ggg tgt ctg caa acc aag aac 816Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270ttg ttc atg gcg gtg cat tgc tac atg ttg tct gtc aaa atc atg aca 864Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285tca ctt tcc cag ctg cta cta tcc gag gtg atg aaa gcc caa cct tgt 912Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300gga caa aag caa agc aca cga atg gat tgg tac tgg tct ggc tca acc 960Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr305 310 315 320act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tct 1008Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac 1056Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350gcc tta tct tct gca tgc acg aca ttg cgt gta agc ctt cga cta ttg 1104Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365agt gag att gag act gct ttg ggg ata gca cag gag cac ggg gct gcg 1152Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380gca tct att cgt cta gtc cta tca gat atg cca agc aca tcg tgg caa 1200Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln385 390 395 400atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tct cgt ctc cta 1248Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415tct gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca 1296Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430aag gcc tca ggg aag acg ata aat gtg ttg cga cgt tgc tat aag gaa 1344Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445ata ttc gca tta gcg aag aaa cac aat att gct tag 1380Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455<210>42<211>459<212>PRT<213>柑桔青霉<400>42Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala1 5 10 15Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln65 70 75 80Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly145 150 155 160Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe225 230 235 240Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr305 310 315 320Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln385 390 395 400Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455<210>43<211>9099<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(9099)<400>43atg gat caa gcc aac tat cca aac gag cca att gtg gta gtg gga agc 48Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser1 5 10 15ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tca aaa ctt tgg gag 96Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga 144Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45ttt gac gtc gat aca ttt tac agc ccc gat ggc act cac ccc ggg cgc 192Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60acg aac gca ccc ttt gca tac ttg ctg cag gag gat cta cgc ggt ttt 240Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe65 70 75 80gat gcc tct ttc ttc aac atc caa gct gga gag gcc gaa acg att gac 288Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95cca cag caa agg ctg ctg ctg gag acg gtc tat gaa gct gta tcc aac 336Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110gca ggc cta cgg atc caa ggc ctt caa gga tcc tct act gct gtg tac 384Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125gtc ggt atg atg acg cat gac tat gag act atc gtg acg cgt gaa ttg 432Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140gat agt att cct aca tac tct gcc acg ggg gta gct gtc agt gtg gcc 480Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala145 150 155 160tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg 528Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175atc gac aca gcc tgt agt tca tcc tta gct gcc gtg cat ctg gcc gtc 576Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg 624Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac 672Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220atg ctg tcc ccc aat ggt aga tct cga atg tgg gat gct gct gcc gat 720Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp225 230 235 240gga tat gcc aga gga gaa ggt gtt tgc tct att gtc ctg aaa acg ctg 768Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc cga gag 816Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270acc ggt atc aac caa gat ggc cga acg aca ggt atc aca atg cca aac 864Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag gct ggt 912His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gaa gcc cat 960Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His305 310 315 320gga act ggt aca cca gcc ggt gac cca cag gaa gct gag gct att gca 1008Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335aca gcc ttc ttc gga cac aag gatgga aca atc gac agc gac ggc gag 1056Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg 1104Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365gaa ggc act gct ggt att gcg ggc tta atg aag gca tcg ttt gct gta 1152Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380cga aat ggc gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc 1200Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro385 390 395 400cgt gtc gct ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca 1248Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415gaa tgg ccg att gtt gcg ccc ggg cag cct cgc aga gtc agc gtt aat 1296Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430tca ttt gga ttt ggt ggt aca aat gcc cat gct att atc gaa gag tat 1344Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445atg gct cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tca 1392Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460gat gca gat gca tgc agc ttg ccc ctt gtg ctt tca tcg aag tcg cag 1440Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln465 470 475 480cgc tcc atg aag gca acg cta gaa aat atg ctc caa ttt ctg gaa acg 1488Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa 1536His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510cgg tct atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa 1584Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525gta gcc cgc gcg gca ctg gag gct gcc atc gcg gac ggt gag gtc gtc 1632Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540acc gac ttc cgc acc gac gcg aat gac aac cct cgc gta cta ggt gtc 1680Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val545 550 555 560ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg 1728Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tca 1776Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac 1824Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605cag ctc atg ctt gaa ggg gat gcc tca aac gtc aga ctc gcc agc ttc 1872Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc cga ctt ctc 1920Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu625 630 635 640gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tca ggt 1968Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct 2016Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tct 2064Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685tct cca agc ggc cag aca ggc gct atg cta gcg gca ggt atg tcg tac 2112Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc 2160Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val705 710 715 720tgc gtc gcc gct agc aat tca ccg gat agt gtg acc ttc tcc ggc gac 2208Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act 2256Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750ttt gcc aga atc ttg aga gtt gac aag gcc tac cat tcg cat cac atg 2304Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt 2352His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tct gcc 2400Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala785 790 795 800gtc cac gag acc agc aag caa atg act gta cag gat gtg atg ccc gct 2448Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815tat tgg aaa gac aat ctc gtc tct ccg gtc ttg ttc tcg cag gct gtg 2496Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830cag aaa gca gtc atc act cat cgt cta atc gac gtc gcc atc gaa att 2544Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845ggc gcc cac cct gct ctc aag ggt ccg tgt cta gcc acc atc aag gat 2592Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca cga aac 2640Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Ash865 870 875 880gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag 2688Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc 2736Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910cgg ccc gat cgt gcc gtt caa aac ctg tca aag tca ttg ccc aca tac 2784Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925tct tgg gat cat act cgt caa tac tgg gca gaa tct cgc tcc acc cgc 2832Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tct 2880Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser945 950 955 960tct tac agc aca gca tcg acc ttc cag tgg aca aac ttc atc agg ccc 2928Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975cgg gat ctg gaa tgg ctc gac ggt cat gcg cta caa ggc cag act gtg 2976Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990ttc ccc gct gct ggg tac ata att atg gcc atg gaa gct gcc atg aag 3024Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005gtg gct ggt gag cgt gcc gcc caa gtt cag ctc ctg gaa atc ttg 3069Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu
1010 1015 1020gac atg agc atc aac aaa gcc atc gtg ttt gaa gat gaa aac acc 3114Asp Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr
1025 1030 1035tcc gtg gag ctg aac ttg aca gcc gaa gtc acc agt gac aat gat 3159Ser Val Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp
1040 1045 1050gcg gat ggc caa gtc acg gtc aaa ttt gtt att gat tcc tgt ctg 3204Ala Asp Gly Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu
1055 1060 1065gca aag gag agt gag ctt tcg aca tcc gcc aaa ggc caa atc gtc 3249Ala Lys Glu Ser Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val
1070 1075 1080ata acc ctt ggc gag gca tca ccg tca tcg cag ctt ttg ccg cca 3294Ile Thr Leu Gly Glu Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro
1085 1090 1095cct gag gaa gag tac ccc cag atg aac aat gtc aac atc gat ttc 3339Pro Glu Glu Glu Tyr Pro Gln Met Asn Asn Val Asn Ile Asp Phe
1100 1105 1110ttc tat cgg gaa ctt gac ctc ctt ggg tat gac tac agc aaa gac 3384Phe Tyr Arg Glu Leu Asp Leu Leu Gly Tyr Asp Tyr Ser Lys Asp
1115 1120 1125tt cgt cgt ttg cag acc atg aga agg gcc gac tcc aaa gct agc 3429Phe Arg Arg Leu Gln Thr Met Arg Arg Ala Asp Ser Lys Ala Ser
1130 1135 1140ggc acc ttg gct ttc ctt cca ctt aag gat gaa ttg cgc aat gag 3474Gly Thr Leu Ala Phe Leu Pro Leu Lys Asp Glu Leu Arg Asn Glu
1145 1150 1155ccc ctc ttg ctc cac cca gcg ccc ctg gac atc gcg ttc cag act 3519Pro Leu Leu Leu His Pro Ala Pro Leu Asp Ile Ala Phe Gln Thr
1160 1165 1170gtc att gga gcg tat tcc tct cca gga gat cgt cgc cta cgc tca 3564Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg Arg Leu Arg Ser
1175 1180 1185ttg tac gtg cct act cac gtt gac aga gtg act ctg att cca tcg 3609Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu Ile Pro Ser
1190 1195 1200ctc tgt ata tcg gcg ggt aat tct ggt gaa acc gag ctt gcg ttt 3654Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu Ala Phe
1205 1210 1215gac aca atc aac aca cac gac aag ggt gat ttc ctg agc ggc gac 3699Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly Asp
1220 1225 1230atc acg gtg tac gat tcg acc aag aca acg ctt ttc caa gtt gat 3744Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245aac att gtc ttt aag cct ttc tct ccc ccg act gct tcg acc gac 3789Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp
1250 1255 1260cac cga atc ttc gca aag tgg gtc tgg gga ccc ctc acg ccc gaa 3834His Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu
1265 1270 1275aaa ctg ctg gag gac cct gcg acg ttg atc ata gct cgg gac aag 3879Lys Leu Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys
1280 1285 1290gag gac att ctg acc atc gag cga atc gtt tac ttc tac atc aaa 3924Glu Asp Ile Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys
1295 1300 1305tcc ttc cta gcc cag ata acc ccc gac gac cgt caa aat gcc gac 3969Ser Phe Leu Ala Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp
1310 1315 1320ctc cat tcc cag aag tac att gaa tgg tgt gac cag gtt cag gcc 4014Leu His Ser Gln Lys Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala
1325 1330 1335gat gct cgg gct ggc cac cat cag tgg tac cag gag tct tgg gag 4059Asp Ala Arg Ala Gly His His Gln Trp Tyr Gln Glu Ser Trp Glu
1340 1345 1350gag gac act tct gtt cac att gag caa atg tgt gaa agc aac tcg 4104Glu Asp Thr Ser Val His Ile Glu Gln Met Cys Glu Ser Asn Ser
1355 1360 1365tcc cac cca cat gtg cgc ctg atc caa agg gta ggc aaa gaa tta 4149Ser His Pro His Val Arg Leu Ile Gln Arg Val Gly Lys Glu Leu
1370 1375 1380att tca att gtt cgc ggg aac ggg gat cct ttg gat atc atg aac 4194Ile Ser Ile Val Arg Gly Asn Gly Asp Pro Leu Asp Ile Met Asn
1385 1390 1395cgc gat ggg ttg ttc acc gag tac tat acc aac aag ctc gcc ttt 4239Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr Asn Lys Leu Ala Phe
1400 1405 1410ggc tca gca ata cac gtc gtt cag gat ctg gtt agc caa att gct 4284Gly Ser Ala Ile His Val Val Gln Asp Leu Val Ser Gln Ile Ala
1415 1420 1425cat cgc tac caa tcc att gat atc ctt gag atc ggc ttg ggt aca 4329His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly Leu Gly Thr
1430 1435 1440ggc atc gcc acg aag cgc gtt ctt gca tca cct caa ctt ggt ttc 4374Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu Gly Phe
1445 1450 1455aac agt tac act tgc act gac atc tcg gcg gat gtt att ggc aag 4419Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly Lys
1460 1465 1470gcc cgt gaa caa ctt tcc gaa ttc gac ggt ctc atg cag ttt gag 4464Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485gca cta gac atc aac aga agc cca gca gag caa gga ttc aag cct 4509Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro
1490 1495 1500cac tcc tac gat ctg att att gca tcc gat gtc ctc cat gcc agc 4554His Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser
1505 1510 1515tcc aac ttc gag gaa aaa ttg gct cac ata agg tcc ttg ctc aag 4599Ser Asn Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys
1520 1525 1530ccg ggt ggt cac ttg gtt act ttc ggg gtc acc cat cgc gag cct 4644Pro Gly Gly His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro
1535 1540 1545gct cgc ctc gcc ttc atc tct ggg ctt ttc gct gat cga tgg act 4689Ala Arg Leu Ala Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr
1550 1555 1560gga gaa gac gaa act cgt gct ttg agt gcc tcg ggg tcc gtt gac 4734Gly Glu Asp Glu Thr Arg Ala Leu Ser Ala Ser Gly Ser Val Asp
1565 1570 1575caa tgg gag cat acc ctc aag aga gtt ggg ttc tct ggc gtc gat 4779Gln Trp Glu His Thr Leu Lys Arg Val Gly Phe Ser Gly Val Asp
1580 1585 1590agt cgg aca ctt gat cga gag gat gat ttg atc ccg tct gtc ttc 4824Ser Arg Thr Leu Asp Arg Glu Asp Asp Leu Ile Pro Ser Val Phe
1595 1600 1605agt aca cat gct gtg gat gcc acc gtt gag cgt ttg tat gat cca 4869Ser Thr His Ala Val Asp Ala Thr Val Glu Arg Leu Tyr Asp Pro
1610 1615 1620ctt tct gct cca ttg aag gac tca tac ccg cca tta gtg gtt atc 4914Leu Ser Ala Pro Leu Lys Asp Ser Tyr Pro Pro Leu Val Val Ile
1625 1630 1635ggt ggc gaa tcg aca aaa acc gaa cgc att ttg aac gac atg aaa 4959Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile Leu Asn Asp Met Lys
1640 1645 1650gct gcc cta ccg cat aga cac atc cac tcc gtc aag cgg ctg gaa 5004Ala Ala Leu Pro His Arg His Ile His Ser Val Lys Arg Leu Glu
1655 1660 1665agt gtt ctc gac gac ccg gcc ttg cag cct aag tcg act ttt gtc 5049Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser Thr Phe Val
1670 1675 1680atc ctc tcg gaa ctt gat gat gaa gtg ttt tgc aac ctt gaa gag 5094Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu Glu Glu
1685 1690 1695gac aag ttt gag gca gtc aag tct ctt ctc ttc tac gcc gga cgc 5139Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly Arg
1700 1705 1710atg atg tgg ctg aca gag aat gcc tgg att gat cat ccc cac cag 5184Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725gcc agc acc atc gga atg ttg agg aca atc aag ctc gag aac cct 5229Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro
1730 1735 1740gac ttg gga acg cac gtc ttc gat gtc gat act gtg gag aac cta 5274Asp Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu
1745 1750 1755gac acc aaa ttc ttc gtt gag caa ctt ttg cgc ttc gag gag agc 5319Asp Thr Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser
1760 1765 1770gat gat cag ctt ttg gaa tca ata aca tgg act cat gag ccc gaa 5364Asp Asp Gln Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu
1775 1780 1785gtg tac tgg tgc aag ggt cgt gcc tgg gtc cct cgt ttg aag cag 5409Val Tyr Trp Cys Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln
1790 1795 1800gat att gct agg aac gac cgt atg aac tcg tct cgt cgt cca att 5454Asp Ile Ala Arg Asn Asp Arg Met Asn Ser Ser Arg Arg Pro Ile
1805 1810 1815ttc ggt aac ttt aat tcg tcc aag acg gcc att gca ctg aaa gag 5499Phe Gly Asn Phe Asn Ser Ser Lys Thr Ala Ile Ala Leu Lys Glu
1820 1825 1830gcg agg gga gca tcc tca tcg atg tac tat ctt gag tca acc gag 5544Ala Arg Gly Ala Ser Ser Ser Met Tyr Tyr Leu Glu Ser Thr Glu
1835 1840 1845acg tgt gat tcg tta gaa gac gct cgt cat gct gga aaa gca act 5589Thr Cys Asp Ser Leu Glu Asp Ala Arg His Ala Gly Lys Ala Thr
1850 1855 1860gtt cgt gtt cgc tac gct ctt ccc cag gca att cgc gtg ggc cat 5634Val Arg Val Arg Tyr Ala Leu Pro Gln Ala Ile Arg Val Gly His
1865 1870 1875ctc gga tac ttc cat gtc gtg cag ggc agt att ctg gag aat aca 5679Leu Gly Tyr Phe His Val Val Gln Gly Ser Ile Leu Glu Asn Thr
1880 1885 1890tgt gag gtg cct gta gtc gcc ctg gct gag aag aat gga tct ata 5724Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys Asn Gly Ser Ile
1895 1900 1905ctg cat gta ccg aga aac tac atg cat agt ctg ccc gat aac atg 5769Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro Asp Asn Met
1910 1915 1920gcg gaa ggc gag gat agt tcc ttc ttg ttg tcc aca gct gca gcc 5814Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala Ala Ala
1925 1930 1935ctc ctt gcc gaa aca att ctc tct agc gct cag tcc ttt ggc tct 5859Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly Ser
1940 1945 1950gat gca tca att ctg att atg gag ccc cca atc ttc tgc gtc aaa 5904Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965gca att ctg gag tcg gcc aaa acc tac ggt gtt cag gtt catttg 5949Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu
1970 1975 1980gca aca act ctg tcc gac gtc aaa act att ccg gct cct tgg atc 5994Ala Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile
1985 1990 1995cga tta cat gcc aag gaa acc gac gct cgg ctg aaa cac agc ctg 6039Arg Leu His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu
2000 2005 2010ccg aca aac atg atg gca ttc ttt gac ttg tct acc gac cgg act 6084Pro Thr Asn Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr
2015 2020 2025gct gcc ggg ata acc aac cgt ttg gcc aag ttg cta cca ccc agt 6129Ala Ala Gly Ile Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser
2030 2035 2040tgc ttc atg tac agt ggt gac tat ctt atc cga agt aca gct tcc 6174Cys Phe Met Tyr Ser Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser
2045 2050 2055aca tac aaa gtt agt cat gtt gag gat att cca atc ctc gag cac 6219Thr Tyr Lys Val Ser His Val Glu Asp Ile Pro Ile Leu Glu His
2060 2065 2070tct gtg gca atg gca aaa aat acc gtc tct gcg tcg act gtc gac 6264Ser Val Ala Met Ala Lys Asn Thr Val Ser Ala Ser Thr Val Asp
2075 2080 2085gac act gag aaa gtt att aca gcc aca caa att ctc ttg cct ggt 6309Asp Thr Glu Lys Val Ile Thr Ala Thr Gln Ile Leu Leu Pro Gly
2090 2095 2100cag ctc tct gtc aac cac aat gac caa cgc ttc aat ctg gcc acc 6354Gln Leu Ser Val Asn His Asn Asp Gln Arg Phe Asn Leu Ala Thr
2105 2110 2115gtc atc gac tgg aag gaa aat gag gtg tcc gct agg att tgc ccc 6399Val Ile Asp Trp Lys Glu Asn Glu Val Ser Ala Arg Ile Cys Pro
2120 2125 2130atc gac tct ggt aac tta ttt tcc aac aag aag acg tat ttg ctt 6444Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys Thr Tyr Leu Leu
2135 2140 2145gtt ggt ctt acc ggg gac ctt ggt cgc tct ctc tgt cgc tgg atg 6489Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys Arg Trp Met
2150 2155 2160atc ttg cat ggc gcc cgc cat gtt gtg ctc act agc cgg aac cct 6534Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg Asn Pro
2165 2170 2175cga ctt gat ccc aaa tgg atc gcc aac atg gag gca ctt ggt ggt 6579Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly Gly
2180 2185 2190gac atc acc gtt ctg tca atg gat gtt gcc aat gag gat tca gtc 6624Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205gat gct ggc ctt ggc aag ctt gtc gat atg aag ttg cca cct gtt 6669Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val
2210 2215 2220gcc ggc atc gcg ttc ggg cct ttg gtg ctg cag gat gtc atg ctg 6714Ala Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu
2225 2230 2235aag aac atg gac cac cag atg atg gac atg gtg ttg aag ccc aag 6759Lys Asn Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys
2240 2245 2250gta caa gga gca cgc att ctt cat gaa cgg ttc tcc gaa cag acg 6804Val Gln Gly Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr
2255 2260 2265ggc agc aag gcg ctc gac ttc ttc atc atg ttt tcg tcc att gtt 6849Gly Ser Lys Ala Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val
2270 2275 2280gca gtt att ggc aat cct ggc cag tcc aac tat ggc gct gcg aat 6894Ala Val Ile Gly Asn Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn
2285 2290 2295gcc tac cta cag gct ctg gcc cag caa cgg tgc gcc aga gga ttg 6939Ala Tyr Leu Gln Ala Leu Ala Gln Gln Arg Cys Ala Arg Gly Leu
2300 2305 2310gcg gga tca acc atc gat att ggt gcc gtt tac ggt gta ggg ttt 6984Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe
2315 2320 2325gtc acg agg gcc gag atg gag gag gac ttt gat gct atc cgt ttc 7029Val Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe
2330 2335 2340atg ttt gac tca gtt gaa gag cat gag ctg cac acg ctt ttc gcc 7074Met Phe Asp Ser Val Glu Glu His Glu Leu His Thr Leu Phe Ala
2345 2350 2355gaa gcg gtc gtg tct gac cag cgt gcc cgg cag caa cca cag cgc 7119Glu Ala Val Val Ser Asp Gln Arg Ala Arg Gln Gln Pro Gln Arg
2360 2365 2370aag acg gtc att gac atg gcg gac ctt gag ctt acc acg ggt atc 7164Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile
2375 2380 2385cca gat ctt gac cct gcg ctt caa gat cga att att tac ttc aac 7209Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile Tyr Phe Asn
2390 2395 2400gac cct cgt ttc gga aac ttc aaa att ccc ggt caa cgc gga gac 7254Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg Gly Asp
2405 2410 2415ggt ggc gac aat gga tca ggg tct aaa ggc tcc att gcc gac cag 7299Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gln
2420 2425 2430ctc aaa caa gca aca act tta gac caa gtt cgg caa atc gtg att 7344Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445gat ggt cta tct gag aaa ctc cgt gtt acc ctc caa gtt tcg gac 7389Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp
2450 2455 2460ggg gag agc gtg gac cca acc att cct ctc att gat caa ggt gtc 7434Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val
2465 2470 2475gac tcc ttg ggt gca gtg act gtc ggc tca tgg ttc tca aag caa 7479Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln
2480 2485 2490ctc tac ctt gac ctc cca ctc ttg agg gta ctt ggc ggt gct tct 7524Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser
2495 2500 2505gtc gct gat ctt gcc gac gac gcg gcc acc cga ctc cca gct aca 7569Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr
2510 2515 2520tcc att ccg ctg ctg ttg caa att ggt gat tcc acg gga acc tcg 7614Ser Ile Pro Leu Leu Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser
2525 2530 2535gac agc ggg gct tct ccg aca cca aca gac agc cat gat gaa gca 7659Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala
2540 2545 2550agc tct gct acc agc aca gat gcg tcg tca gcc gaa gag gat gaa 7704Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu
2555 2560 2565gag caa gag gac gat aat gag cag gga ggc cgt aag att ctt cgt 7749Glu Gln Glu Asp Asp Asn Glu Gln Gly Gly Arg Lys Ile Leu Arg
2570 2575 2580cgc gag agg ttg tcc ctt ggc cag gag tat tcc tgg agg cag caa 7794Arg Glu Arg Leu Ser Leu Gly Gln Glu Tyr Ser Trp Arg Gln Gln
2585 2590 2595caa atg gta aaa gat cat acc atc ttc aac aac act att ggc atg 7839Gln Met Val Lys Asp His Thr Ile Phe Asn Asn Thr Ile Gly Met
2600 2605 2610ttc atg aag ggt acc att gac ctc gac cgg ttg agg cgg gct ctg 7884Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu Arg Arg Ala Leu
2615 2620 2625aaa gcc tca ttg cgc cgt cac gag atc ttc cgt acg tgc ttt gtt 7929Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr Cys Phe Val
2630 2635 2640act ggc gat gac tat agc agc gat tta aat ggt ccc gtc caa gtg 7974Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val Gln Val
2645 2650 2655gtt ctc aag aac ccg gag aac aga gtg cac ttt gtt cag gtg aac 8019Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val Asn
2660 2665 2670aac gct gcg gag gca gag gaa gag tac cgg aaa ctc gag aag aca 8064Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685aac tat agc atc tcc aca ggt gac act ctc aga ctc gtt gat ttc 8109Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe
2690 2695 2700tac tgg ggc aca gat gac cac ctg ttg gta atc ggc tac cac aga 8154Tyr Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg
2705 2710 2715tta gtt ggt gat ggc tca aca aca gaa aac ctg ttc aat gag atc 8199Leu Val Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile
2720 2725 2730ggg cag att tac agc ggg gtg aaa atg cag cga cca tcg acc caa 8244Gly Gln Ile Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln
2735 2740 2745ttc tct gat cta gcc gtc caa cag cgg gaa aac ctg gaa aat ggg 8289Phe Ser Asp Leu Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly
2750 2755 2760cga atg ggg gac gat atc gcg ttc tgg aag tcc atg cat agc aaa 8334Arg Met Gly Asp Asp Ile Ala Phe Trp Lys Ser Met His Ser Lys
2765 2770 2775gtc tcg tca tct gcg cca acc gtg ctt ccc atc atg aat ctg atc 8379Val Ser Ser Ser Ala Pro Thr Val Leu Pro Ile Met Asn Leu Ile
2780 2785 2790aat gac cct gct gcc aat tca gag cag cag caa ata cag cca ttc 8424Asn Asp Pro Ala Ala Asn Ser Glu Gln Gln Gln Ile Gln Pro Phe
2795 2800 2805acg tgg cag cag tat gaa gca att gct cgt tta gat ccc atg gtc 8469Thr Trp Gln Gln Tyr Glu Ala Ile Ala Arg Leu Asp Pro Met Val
2810 2815 2820gcc ttc cga atc aaa gag cgg agc cgc aag cac aag gca acc ccc 8514Ala Phe Arg Ile Lys Glu Arg Ser Arg Lys His Lys Ala Thr Pro
2825 2830 2835atg cag ttc tac ctg gcc gcc tac cac gtt ttg ttg gcg cgt ctt 8559Met Gln Phe Tyr Leu Ala Ala Tyr His Val Leu Leu Ala Arg Leu
2840 2845 2850acc ggc agc aaa gac ata acc atc ggc ctc gcc gaa acc aac cga 8604Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala Glu Thr Asn Arg
2855 2860 2865tcc acc atg gaa gaa att tcg gcg atg ggc ttt ttc gct aac gtg 8649Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe Ala Asn Val
2870 2875 2880ctt ccc ctg cgc ttt gat gag ttc gtc ggc agc aag aca ttc ggc 8694Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr Phe Gly
2885 2890 2895gag cac ctt gta gcc acc aag gac agt gtg cgt gag gcc atg caa 8739Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met Gln
2900 2905 2910cac gcg cgg gtg ccg tat ggc gtc atc ctc gac tgt cta ggc ctg 8784His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925aat ctc cct acc tca ggc gag gaa ccc aag act cag aca cac gcc 8829Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala
2930 2935 2940ccc ttg ttc cag gct gtc ttt gat tac aag cag ggt caa gcg gag 8874Pro Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu
2945 2950 2955agt ggc tca att ggc aat gcc aaa atg acg agt gtt ctc gct tcc 8919Ser Gly Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser
2960 2965 2970cgt gag cgc act cct tat gac atc gtt ctc gag atg tgg gat gac 8964Arg Glu Arg Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp
2975 2980 2985cct acc aag gac cca ctc att cat gtc aaa ctt cag agc tcg ctg 9009Pro Thr Lys Asp Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu
2990 2995 3000tat ggc cct gag cac gct cag gcc ttt gta gac cac ttt tct tca 9054Tyr Gly Pro Glu His Ala Gln Ala Phe Val Asp His Phe Ser Ser
3005 3010 3015atc ctc act atg ttc tcg atg aac ccg gct ctg aag ttg gcc tag 9099Ile Leu Thr Met Phe Ser Met Asn Pro Ala Leu Lys Leu Ala
3020 3025 3030<210>44<211>3032<212>PRT<213>柑桔青霉<400>44Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser1 5 10 15Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe65 70 75 80Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala145 150 155 160Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp225 230 235 240Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His305 310 315 320Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro385 390 395 400Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln465 470 475 480Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val545 550 555 560Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu625 630 635 640Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val705 710 715 720Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala785 790 795 800Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn865 870 875 880Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser945 950 955 960Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu
1010 1015 1020Asp Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr
1025 1030 1035Ser Val Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp
1040 1045 1050Ala Asp Gly Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu
1055 1060 1065Ala Lys Glu Ser Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val
1070 1075 1080Ile Thr Leu Gly Glu Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro
1085 1090 1095Pro Glu Glu Glu Tyr Pro Gln Met Asn Asn Val Asn Ile Asp Phe
1100 1105 1110Phe Tyr Arg Glu Leu Asp Leu Leu Gly Tyr Asp Tyr Ser Lys Asp
1115 1120 1125Phe Arg Arg Leu Gln Thr Met Arg Arg Ala Asp Ser Lys Ala Ser
1130 1135 1140Gly Thr Leu Ala Phe Leu Pro Leu Lys Asp Glu Leu Arg Asn Glu
1145 1150 1155Pro Leu Leu Leu His Pro Ala Pro Leu Asp Ile Ala Phe Gln Thr
1160 1165 1170Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg Arg Leu Arg Ser
1175 1180 1185Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu Ile Pro Ser
1190 1195 1200Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu Ala Phe
1205 1210 1215Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly Asp
1220 1225 1230Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp
1250 1255 1260His Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu
1265 1270 1275Lys Leu Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys
1280 1285 1290Glu Asp Ile Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys
1295 1300 1305Ser Phe Leu Ala Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp
1310 1315 1320Leu His Ser Gln Lys Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala
1325 1330 1335Asp Ala Arg Ala Gly His His Gln Trp Tyr Gln Glu Ser Trp Glu
1340 1345 1350Glu Asp Thr Ser Val His Ile Glu Gln Met Cys Glu Ser Asn Ser
1355 1360 1365Ser His Pro His Val Arg Leu Ile Gln Arg Val Gly Lys Glu Leu
1370 1375 1380Ile Ser Ile Val Arg Gly Asn Gly Asp Pro Leu Asp Ile Met Asn
1385 1390 1395Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr Asn Lys Leu Ala Phe
1400 1405 1410Gly Ser Ala Ile His Val Val Gln Asp Leu Val Ser Gln Ile Ala
1415 1420 1425His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly Leu Gly Thr
1430 1435 1440Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu Gly Phe
1445 1450 1455Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly Lys
1460 1465 1470Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro
1490 1495 1500His Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser
1505 1510 1515Ser Asn Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys
1520 1525 1530Pro Gly Gly His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro
1535 1540 1545Ala Arg Leu Ala Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr
1550 1555 1560Gly Glu Asp Glu Thr Arg Ala Leu Ser Ala Ser Gly Ser Val Asp
1565 1570 1575Gln Trp Glu His Thr Leu Lys Arg Val Gly Phe Ser Gly Val Asp
1580 1585 1590Ser Arg Thr Leu Asp Arg Glu Asp Asp Leu Ile Pro Ser Val Phe
1595 1600 1605Ser Thr His Ala Val Asp Ala Thr Val Glu Arg Leu Tyr Asp Pro
1610 1615 1620Leu Ser Ala Pro Leu Lys Asp Ser Tyr Pro Pro Leu Val Val Ile
1625 1630 1635Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile Leu Asn Asp Met Lys
1640 1645 1650Ala Ala Leu Pro His Arg His Ile His Ser Val Lys Arg Leu Glu
1655 1660 1665Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser Thr Phe Val
1670 1675 1680Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu Glu Glu
1685 1690 1695Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly Arg
1700 1705 1710Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro
1730 1735 1740Asp Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu
1745 1750 1755Asp Thr Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser
1760 1765 1770Asp Asp Gln Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu
1775 1780 1785Val Tyr Trp Cys Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln
1790 1795 1800Asp Ile Ala Arg Asn Asp Arg Met Asn Ser Ser Arg Arg Pro Ile
1805 1810 1815Phe Gly Asn Phe Asn Ser Ser Lys Thr Ala Ile Ala Leu Lys Glu
1820 1825 1830Ala Arg Gly Ala Ser Ser Ser Met Tyr Tyr Leu Glu Ser Thr Glu
1835 1840 1845Thr Cys Asp Ser Leu Glu Asp Ala Arg His Ala Gly Lys Ala Thr
1850 1855 1860Val Arg Val Arg Tyr Ala Leu Pro Gln Ala Ile Arg Val Gly His
1865 1870 1875Leu Gly Tyr Phe His Val Val Gln Gly Ser Ile Leu Glu Asn Thr
1880 1885 1890Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys Asn Gly Ser Ile
1895 1900 1905Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro Asp Asn Met
1910 1915 1920Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala Ala Ala
1925 1930 1935Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly Ser
1940 1945 1950Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu
1970 1975 1980Ala Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile
1985 1990 1995Arg Leu His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu
2000 2005 2010Pro Thr Asn Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr
2015 2020 2025Ala Ala Gly Ile Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser
2030 2035 2040Cys Phe Met Tyr Ser Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser
2045 2050 2055Thr Tyr Lys Val Ser His Val Glu Asp Ile Pro Ile Leu Glu His
2060 2065 2070Ser Val Ala Met Ala Lys Asn Thr Val Ser Ala Ser Thr Val Asp
2075 2080 2085Asp Thr Glu Lys Val Ile Thr Ala Thr Gln Ile Leu Leu Pro Gly
2090 2095 2100Gln Leu Ser Val Asn His Asn Asp Gln Arg Phe Asn Leu Ala Thr
2105 211 2115Val Ile Asp Trp Lys Glu Asn Glu Val Ser Ala Arg Ile Cys Pro
2120 2125 2130Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys Thr Tyr Leu Leu
2135 2140 2145Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys Arg Trp Met
2150 2155 2160Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg Asn Pro
2165 2170 2175Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly Gly
2180 2185 2190Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val
2210 2215 2220Ala Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu
2225 2230 2235Lys Asn Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys
2240 2245 2250Val Gln Gly Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr
2255 2260 2265Gly Ser Lys Ala Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val
2270 2275 2280Ala Val Ile Gly Asn Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn
2285 2290 2295Ala Tyr Leu Gln Ala Leu Ala Gln Gln Arg Cys Ala Arg Gly Leu
2300 2305 2310Ala Gly Ser Thr Ile Asp Ile Gly Ala Val Tyr Gly Val Gly Phe
2315 2320 2325Val Thr Arg Ala Glu Met Glu Glu Asp Phe Asp Ala Ile Arg Phe
2330 2335 2340Met Phe Asp Ser Val Glu Glu His Glu Leu His Thr Leu Phe Ala
2345 2350 2355Glu Ala Val Val Ser Asp Gln Arg Ala Arg Gln Gln Pro Gln Arg
2360 2365 2370Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu Thr Thr Gly Ile
2375 2380 2385Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile Tyr Phe Asn
2390 2395 2400Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg Gly Asp
2405 2410 2415Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp Gln
2420 2425 2430Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp
2450 2455 2460Gly Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val
2465 2470 2475Asp Ser Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln
2480 2485 2490Leu Tyr Leu Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser
2495 2500 2505Val Ala Asp Leu Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr
2510 2515 2520Ser Ile Pro Leu Leu Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser
2525 2530 2535Asp Ser Gly Ala Ser Pro Thr Pro Thr Asp Ser His Asp Glu Ala
2540 2545 2550Ser Ser Ala Thr Ser Thr Asp Ala Ser Ser Ala Glu Glu Asp Glu
2555 2560 2565Glu Gln Glu Asp Asp Asn Glu Gln Gly Gly Arg Lys Ile Leu Arg
2570 2575 2580Arg Glu Arg Leu Ser Leu Gly Gln Glu Tyr Ser Trp Arg Gln Gln
2585 2590 2595Gln Met Val Lys Asp His Thr Ile Phe Asn Asn Thr Ile Gly Met
2600 2605 2610Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu Arg Arg Ala Leu
2615 2620 2625Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr Cys Phe Val
2630 2635 2640Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val Gln Val
2645 2650 2655Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val Asn
2660 2665 2670Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe
2690 2695 2700Tyr Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg
2705 2710 2715Leu Val Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile
2720 2725 2730Gly Gln Ile Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln
2735 2740 2745Phe Ser Asp Leu Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly
2750 2755 2760Arg Met Gly Asp Asp Ile Ala Phe Trp Lys Ser Met His Ser Lys
2765 2770 2775Val Ser Ser Ser Ala Pro Thr Val Leu Pro Ile Met Asn Leu Ile
2780 2785 2790Asn Asp Pro Ala Ala Asn Ser Glu Gln Gln Gln Ile Gln Pro Phe
2795 2800 2805Thr Trp Gln Gln Tyr Glu Ala Ile Ala Arg Leu Asp Pro Met Val
2810 2815 2820Ala Phe Arg Ile Lys Glu Arg Ser Arg Lys His Lys Ala Thr Pro
2825 2830 2835Met Gln Phe Tyr Leu Ala Ala Tyr His Val Leu Leu Ala Arg Leu
2840 2845 2850Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala Glu Thr Asn Arg
2855 2860 2865Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe Ala Asn Val
2870 2875 2880Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr Phe Gly
2885 2890 2895Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met Gln
2900 2905 2910His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala
2930 2935 2940Pro Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu
2945 2950 2955Ser Gly Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser
2960 2965 2970Arg Glu Arg Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp
2975 2980 2985Pro Thr Lys Asp Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu
2990 2995 3000Tyr Gly Pro Glu His Ala Gln Ala Phe Val Asp His Phe Ser Ser
3005 3010 3015Ile Leu Thr Met Phe Ser Met Asn Pro Ala Leu Lys Leu Ala
3020 3025 3030<210>45<211>7692<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(7692)<400>45atg aac aat acc ccc gcc gta acc gca acc gca acc gca acc gca acc 48Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thrl 5 10 15gca acc gca atg gca ggc tcg gct tgc tct aac aca tcc acg ccc att 96Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30gcc ata gtt gga atg gga tgt cga ttt gct gga gat gca acg agt cca 144Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tct aag 192Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60gtc ccc tcc tcg cga ttc aat gtg aga gga gta tac cac ccg aat ggc 240Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly65 70 75 80gaa agg gtc ggg tcc acc cac gta aag ggt gga cac ttc atc gac gag 288Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95gat cct gct tta ttt gac gcc gcg ttc ttc aac atg acc aca gag gtc 336Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110gcc agc tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac 384Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125gaa tcg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tct 432Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140aat acg tcg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat tcg 480Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser145 150 155 160ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac 528Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175tca gga aca atg ctt tcg aac cgg ata tca cac ttc tac gac tta cgt 576Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190ggt ccc agc gtg acg gtt gac acg gcc tgt tcg acg aca ttg acc gca 624Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205ctg cac ttg gcg tgc cag agc tta cgt act ggg gag tca gat aca gcc 672Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220atc gtt atc ggt gca aat ctt ctg ctc aat ccc gat gtt ttt gtt acg 720Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr225 230 235 240atg tca aac ctg gga ttt ttg tcc ccg gat ggt atc tcg tac tct ttt 768Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255gat cct cga gcg aat gga tat ggt cgc ggg gaa gga att gcc gct ctg 816Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270gta ata aag gcc ctc cct aac gcg ttg cga gac caa gac cct atc cga 864Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285gcc gtc att cga gag aca gcg ctg aac cag gat ggc aaa aca ccc gca 912Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt 960Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys305 310 315 320tac gat aag gct ggg cta gat atg tcg ttg acc tcg tac gtg gag gcc 1008Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335cac gga act gga aca cca act ggt gac ccc ctt gaa atc tca gca att 1056His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350tca gca gct ttt aaa gga cat cct ctg cac ctt ggc tct gtg aaa gca 1104Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag 1152Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc 1200Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe385 390 395 400ctg caa aag aac agc aag ctg atg ctt gac caa aag aac atc aag atc 1248Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415ccc atg tct gct caa gac tgg cct gtg aaa gat ggg act cgt cgc gca 1296Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430tct gtc aat aac ttc ggc ttt ggt ggt tcg aat gct cac gtc att ttg 1344Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445gaa tca tat gat cgc gca tca ttg gcc ctg cca gag gat caa gtg cat 1392Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460gtc aat ggt aac tct gag cat ggt agg gtt gag gat ggt tcc aaa cag 1440Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln465 470 475 480agc cgc ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg cga 1488Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495acg ata gca agc ctg cga gac tac att aaa tcc gtc gct gac att gac 1536Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510ggg gaa ccc ttc ctc gcc agc ctc gcc tat aca cta ggc tct cgc cgt 1584Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525tcc att ctg cca tgg acg tca gtg tat gta gca gac agc ctt ggc ggc 1632Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540ctt gtt tct gcc ctc agc gat gag tcc aat caa cca aaa cga gcg aat 1680Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn545 550 555 560gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg 1728Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag 1776His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg 1824Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat 1872Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620gat gcc gaa tac agt cta cca ctg tca acc gct atc caa att gca ctt 1920Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu625 630 635 640gtg cgt ctc ctt tgg tca tgg gga att cgg cca acg ggg ata acc agt 1968Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655cac tca agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc 2016His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670gcg cgg tcg gcc att ggg atc act tat ata cgc ggt gta ttg acc act 2064Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt 2112Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700ctt ggt cgc agt gag acc aat gtt tac att tcg cgt ctc aac cag gag 2160Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu705 710 715 720gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg 2208Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735gtg tcg gga gat ttg ggt gca atc gag aaa ctt gaa aag ttg tta cac 2256Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat 2304Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765tca agc cac atg cga cca atg gca gat gcc ttt ggg gcg tca ctg aga 2352Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780gat ctg ttc aac tcg gat aac aac aac gac aat ccc aat gct gac acc 2400Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr785 790 795 800tca aag ggt gta tta tat tca tca cct aag act ggt agt cgc atg acc 2448Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta 2496Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830cag ccg gta gag ttc gag tcc tca ctc cgc gag atg tgc ttt gat ccc 2544Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845aac acc aaa gag aaa gcc gtc gat gtg att att gaa ata ggg cct cac 2592Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg 2640Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu865 870 875 880aaa gga aca gat ata aac tat ctc agt tgc ctt tct cgc ggc aga agc 2688Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895tcg ttg gag aca atg tat cgt gct gct acg gag ttg ata agc aag ggt 2736Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910tat ggg ctc aaa atg gac gct ata aac ttt cct cat gga aga aaa gag 2784Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925ccc aga gtg aag gta ctg agc gat ttg ccg gcg tac ccg tgg aat cac 2832Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940caa acc cgt tat tgg aga gag cct cgc ggc agt cgt gag tcc aaa cag 2880Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln945 950 955 960aga acc cat ccg cct cac act ttg ata ggc tca cgg gaa tct ctc tct 2928Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tca gat att 2976Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990cca tgg ata cga gat cac gtc gtt ggt tcg agc atc atc ttt ccg gga 3024Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005gct ggc ttc atc agc atg gcc atc gag ggg ttt tca caa gtc tgc 3069Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys
1010 1015 1020cca cca gtt gcg ggg gct agc atc aac tac aac ttg cgt gac gtt 3114Pro Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val
1025 1030 1035gaa ctc gcg cag gct ctc ata ata ccc gct gat gca gaa gca gag 3159Glu Leu Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu
1040 1045 1050gtt gac ctg cgc cta acg atc cgt tca tgt gag gaa agg tcc ctc 3204Val Asp Leu Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu
1055 1060 1065ggc aca aag aac tgg cat caa ttt tct gtg cac tca att tcg ggc 3249Gly Thr Lys Asn Trp His Gln Phe Ser Val His Ser Ile Ser Gly
1070 1075 1080gaa aat aat acc tgg aca gaa cac tgc acc gga tta ata cgt tcg 3294Glu Asn Asn Thr Trp Thr Glu His Cys Thr Gly Leu Ile Arg Ser
1085 1090 1095gag agc gaa aga agc cac ctt gac tgt tca act gtg gaa gcc tca 3339Glu Ser Glu Arg Ser His Leu Asp Cys Ser Thr Val Glu Ala Ser
1100 1105 1110cgc agg ttg aat cta ggc tca gat aac cgg agc att gat ccc aac 3384Arg Arg Leu Asn Leu Gly Ser Asp Asn Arg Ser Ile Asp Pro Asn
1115 1120 1125gat ctc tgg gag tcc tta cac gcg aat ggg ata tgc cac gga ccc 3429Asp Leu Trp Glu Ser Leu His Ala Asn Gly Ile Cys His Gly Pro
1130 1135 1140att ttt cag aac att cag cga att caa aac aat gga cag ggc tcg 3474Ile Phe Gln Asn Ile Gln Arg Ile Gln Asn Asn Gly Gln Gly Ser
1145 1150 1155ttt tgc aga ttt tcc att gct gac act gcc tcg gct atg cct cac 3519Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala Ser Ala Met Pro His
1160 1165 1170tcg tac gag aat cga cac atc gtc cat cct act act ctg gac tcg 3564Ser Tyr Glu Asn Arg His Ile Val His Pro Thr Thr Leu Asp Ser
1175 1180 1185gtg atc cag gcg gca tac acg gtg tta ccc tac gcg gga aca cgt 3609Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala Gly Thr Arg
1190 1195 1200atg aaa acg gcc atg gta cca agg agg cta aga aat gtc aaa ata 3654Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val Lys Ile
1205 1210 1215tcc tct agc ctg gct gac ttg gag gct ggt gat gct ctg gac gca 3699Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp Ala
1220 1225 1230cag gcc agc atc aag gat cgc aac tct caa tcc ttc tct acc gac 3744Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245ttg gca gtg ttt gat gac tat gat agc ggt tct tct ccc tcg gac 3789Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp
1250 1255 1260gga atc cca gtc ata gag att gaa ggc ctt gtt ttc cag tcg gtt 3834Gly Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val
1265 1270 1275gga agc agc ttc tct gac caa aag tca gac tcc aac gac aca gaa 3879Gly Ser Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu
1280 1285 1290aat gcc tgc agc tcc tgg gtt tgg gcc cct gac atc agc ttg ggt 3924Asn Ala Cys Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly
1295 1300 1305gac tcc act tgg ctc aaa gaa aag ttg agc act gag gct gag acg 3969Asp Ser Thr Trp Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr
1310 1315 1320aaa gaa acg gaa ctc atg atg gac ctc cga aga tgc acg atc aac 4014Lys Glu Thr Glu Leu Met Met Asp Leu Arg Arg Cys Thr Ile Asn
1325 1330 1335ttt ata cag gag gct gtc act gat ttg aca aat tct gat atc caa 4059Phe Ile Gln Glu Ala Val Thr Asp Leu Thr Asn Ser Asp Ile Gln
1340 1345 1350cat ctg gat ggc cac ctt cag aag tat ttc gat tgg atg aat gtc 4104His Leu Asp Gly His Leu Gln Lys Tyr Phe Asp Trp Met Asn Val
1355 1360 1365caa ttg gac ctt gcg aga caa aac aag ctc agc cca gcc agt tgc 4149Gln Leu Asp Leu Ala Arg Gln Asn Lys Leu 8er Pro Ala Ser Cys
1370 1375 1380gac tgg cta agt gac gat gct gag cag aag aaa tgc cta cag gcc 4194Asp Trp Leu Ser Asp Asp Ala Glu Gln Lys Lys Cys Leu Gln Ala
1385 1390 1395aga gtc gct gga gaa agc gtc aat ggc gag atg att tct cgt cta 4239Arg Val Ala Gly Glu Ser Val Asn Gly Glu Met Ile Ser Arg Leu
1400 1405 1410gga cct cag tta ata gca atg cta cgc cgc gaa aca gag cca ctt 4284Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu Thr Glu Pro Leu
1415 1420 1425gag ttg atg atg caa gat cag ctg cta agc aga tac tac gtc aac 4329Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr Tyr Val Asn
1430 1435 1440gca atc aaa tgg agc cga tca aac gca caa gcc agc gag ctg atc 4374Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu Leu Ile
1445 1450 1455cga ctt tgc gcc cac aag aac ccg cgt tct cgc att ttg gag att 4419Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu Ile
1460 1465 1470ggc gga ggc acg ggc ggc tgc aca aag ctt att gtc aat gca ttg 4464Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485gga aac acc aag ccg atc gat cgt tat gac ttc acc gat gtg tct 4509Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser
1490 1495 1500gcc ggg ttt ttc gag tcg gcg cgt gag caa ttt gcg gat tgg caa 4554Ala Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln
1505 1510 1515gac gtg atg act ttc aaa aaa ttg gat att gaa agc gat ccc gag 4599Asp Val Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu
1520 1525 1530caa caa ggg ttt gaa tgt gcc acc tac gat gtg gtc gtg gct tgc 4644Gln Gln Gly Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys
1535 1540 1545cag gtc ctg cat gca act cga tgc atg aaa cga aca ctg agt aac 4689Gln Val Leu His Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn
1550 1555 1560gtt cga aaa ttg ctc aag cct ggg ggc aac ttg att ttg gtt gag 4734Val Arg Lys Leu Leu Lys Pro Gly Gly Asn Leu Ile Leu Val Glu
1565 1570 1575act acc agg gat cag ctc gat ttg ttc ttt acc ttc gga ctg ttg 4779Thr Thr Arg Asp Gln Leu Asp Leu Phe Phe Thr Phe Gly Leu Leu
1580 1585 1590cca ggt tgg tgg ctc agt gag gag cct gag cgg aag tcg acg cca 4824Pro Gly Trp Trp Leu Ser Glu Glu Pro Glu Arg Lys Ser Thr Pro
1595 1600 1605tcg ctc act acc gat ctt tgg aac acc atg ttg gac acg agc ggt 4869Ser Leu Thr Thr Asp Leu Trp Asn Thr Met Leu Asp Thr Ser Gly
1610 1615 1620ttc aac ggt gtg gaa ttg gag gtt cgt gat tgt gaa gac gat gag 4914Phe Asn Gly Val Glu Leu Glu Val Arg Asp Cys Glu Asp Asp Glu
1625 1630 1635ttt tac atg atc agc aca atg cta tcg acg gct aga aaa gag aat 4959Phe Tyr Met Ile Ser Thr Met Leu Ser Thr Ala Arg Lys Glu Asn
1640 1645 1650aca acc ccg gat aca gtg gca gaa tcg gag gtg ctt ttg ctg cac 5004Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val Leu Leu Leu His
1655 1660 1665gga gcg ctc cga cct cct tca tct tgg ctg gaa agt ctc cag gca 5049Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser Leu Gln Ala
1670 1675 1680gca att tgt gaa aag acc agt tct agc cca tcg atc aac gct ctg 5094Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn Ala Leu
1685 1690 1695ggc gag gta gat acc act gga agg aca tgc att ttt ctt ggg gaa 5139Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly Glu
1700 1705 1710atg gag tcc tcg ctc ctt gga gag gtg gga agc gag acc ttc aaa 5184Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725tcc atc acc gcg atg ctg aat aac tgc aac gca ctt ctc tgg gtg 5229Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val
1730 1735 1740tct aga gga gca gcc atg agc tcc gag gat cca tgg aaa gct cta 5274Ser Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu
1745 1750 1755cat att ggt ctg ctg cgt acc atc cgc aac gaa aat aac ggg aag 5319His Ile Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys
1760 1765 1770gaa tat gta tcg ttg gat ctc gat cct tct cga aac gca tac acc 5364Glu Tyr Val Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr
1775 1780 1785cac gag tcc ctg tat gct atc tgc aat atc ttc aat ggc cgc ctc 5409His Glu Ser Leu Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu
1790 1795 1800ggc gac ctt tcc gaa gac aag gag ttt gaa ttt gca gag aga aac 5454Gly Asp Leu Ser Glu Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn
1805 1810 1815ggc gtc atc cac gta ccg cga ctt ttc aat gac ccg cac tgg aag 5499Gly Val Ile His Val Pro Arg Leu Phe Asn Asp Pro His Trp Lys
1820 1825 1830gac caa gaa gcg gtt gag gtc aca ctg cag ccg ttc gag caa ccc 5544Asp Gln Glu Ala Val Glu Val Thr Leu Gln Pro Phe Glu Gln Pro
1835 1840 1845ggg cgt cgt ctg cgg atg gag gtt gag acg cca ggg ctc tta gac 5589Gly Arg Arg Leu Arg Met Glu Val Glu Thr Pro Gly Leu Leu Asp
1850 1855 1860tcc ctg caa ttt cga gac gac gaa gga cgt gaa ggc aag gat ctt 5634Ser Leu Gln Phe Arg Asp Asp Glu Gly Arg Glu Gly Lys Asp Leu
1865 1870 1875ccg gat gat tgg gta gaa atc gaa ccc aaa gct ttc ggt ctc aat 5679Pro Asp Asp Trp Val Glu Ile Glu Pro Lys Ala Phe Gly Leu Asn
1880 1885 1890ttt cgg gat gtc atg gtt gcc atg ggt caa ttg gag gcc aac cgt 5724Phe Arg Asp Val Met Val Ala Met Gly Gln Leu Glu Ala Asn Arg
1895 1900 1905gtg atg ggc ttc gaa tgc gcc gga gtg atc aca aag ctc ggt gga 5769Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys Leu Gly Gly
1910 1915 1920gct gct gcc gct agc caa ggc ctc aga tta ggg gac cgc gta tgt 5814Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg Val Cys
1925 1930 1935gca cta ctg aaa ggc cat tgg gcg acc aga aca cag acg ccg tac 5859Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro Tyr
1940 1945 1950act aat gtc gtc cgt att ccg gac gaa atg ggc ttc cca gaa gcc 5904Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965gct tcg gtc ccc ctg gct ttc act acc gca tat att gcg ctt tat 5949Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr
1970 1975 1980acc acg gca aag cta cga cga ggc gaa aga gtc ttg atc cac agt 5994Thr Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser
1985 1990 1995gga gct gga ggc gtc ggt caa gca gcg atc att ttg tcc cag ctt 6039Gly Ala Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu
2000 2005 2010gcg ggt gcc gag gtc ttc gtc aca gcg gga act caa gcc aag cgt 6084Ala Gly Ala Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg
2015 2020 2025gac ttt gtc ggc gat aaa ttc ggc atc aat ccg gat cat atc ttc 6129Asp Phe Val Gly Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe
2030 2035 2040tcg agc agg aat gac tta ttc gtc gac ggc atc aaa gcc tac acg 6174Ser Ser Arg Asn Asp Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr
2045 2050 2055ggc gga ctt ggc gtt cat gtc gtt cta aac tca ttg gca ggt caa 6219Gly Gly Leu Gly Val His Val Val Leu Asn Ser Leu Ala Gly Gln
2060 2065 2070ctc ctc caa gca agc ttt gac tgc atg gcc gaa ttc ggc aga ttt 6264Leu Leu Gln Ala Ser Phe Asp Cys Met Ala Glu Phe Gly Arg Phe
2075 2080 2085gtt gag att gga aaa aag gac ctg gag caa aac agc aga ctt gac 6309Val Glu Ile Gly Lys Lys Asp Leu Glu Gln Asn Ser Arg Leu Asp
2090 2095 2100atg ctg cca ttc acc cgg gac gtc tct ttc aca tca att gat ctt 6354Met Leu Pro Phe Thr Arg Asp Val Ser Phe Thr Ser Ile Asp Leu
2105 2110 2115ctc tcg tgg caa aga gcc aaa agt gaa gaa gta tcc gaa gcg ttg 6399Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu Val Ser Glu Ala Leu
2120 2125 2130aac cat gtc aca aaa ctc ctc gag aca aaa gcg att ggc ttg att 6444Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala Ile Gly Leu Ile
2135 2140 2145ggt cca atc cag cag cac tcc ttg tca aac atc gag aag gcc ttc 6489Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu Lys Ala Phe
2150 2155 2160cgt acg atg cag agt ggt cag cat gtt ggc aaa gtt gtg gtc aat 6534Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val Val Asn
2165 2170 2175gta tct ggg gac gaa ctg gtc cca gtc ggc gat gga ggg ttc tcg 6579Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe Ser
2180 2185 2190ctg aag ctg aag cct gac agt tct tac cta gtt gct ggt ggg ctg 6624Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205ggg gga att gga aag cag atc tgt cag tgg ctt gtt gat cat ggc 6669Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly
2210 2215 2220gcg aag cac ttg att atc cta tcg aga agt gca aag gcc agt cca 6714Ala Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro
2225 2230 2235ttc ata acc agc ttg caa aat caa cag tgc gct gtc tat cta cac 6759Phe Ile Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His
2240 2245 2250gca tgt gac atc tca gat caa gat cag gtc acc aag gtg ctc cgg 6804Ala Cys Asp Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg
2255 2260 2265ttg tgc gaa gaa gca cat gca ccg cca att cga ggt atc ata caa 6849Leu Cys Glu Glu Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln
2270 2275 2280ggt gcc atg gtt ctc aag gac gcg ctt cta tcg cga atg aca ttg 6894Gly Ala Met Val Leu Lys Asp Ala Leu Leu Ser Arg Met Thr Leu
2285 2290 2295gat gaa ttt aat gca gca aca cgc cca aaa gta cag ggt agt tgg 6939Asp Glu Phe Asn Ala Ala Thr Arg Pro Lys Val Gln Gly Ser Trp
2300 2305 2310tat ctt cac aag atc gca cag gat gtt gac ttc ttc gtg atg ctc 6984Tyr Leu His Lys Ile Ala Gln Asp Val Asp Phe Phe Val Met Leu
2315 2320 2325tca tcc ctt gtt ggg gtc atg ggt ggg gca ggc cag gcc aat tac 7029Ser Ser Leu Val Gly Val Met Gly Gly Ala Gly Gln Ala Asn Tyr
2330 2335 2340gca gct gct ggt gca ttc cag gac gca ctt gcg cac cac cgg aga 7074Ala Ala Ala Gly Ala Phe Gln Asp Ala Leu Ala His His Arg Arg
2345 2350 2355gcc cat ggc atg ccg gct gtc acc att gac ttg ggc atg gtc aag 7119Ala His Gly Met Pro Ala Val Thr Ile Asp Leu Gly Met Val Lys
2360 2365 2370tct gtt gga tac gtg gct gaa act ggc cgt ggt gtg gcc gac cgg 7164Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly Val Ala Asp Arg
2375 2380 2385ctc gct aga ata ggt tac aag cct atg cat gaa aag gac gtc atg 7209Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys Asp Val Met
2390 2395 2400gat gtg ttg gag aag gca atc ctg tgt tct tcc cct caa ttt cca 7254Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln Phe Pro
2405 2410 2415tca cct ccc gca gct gtg gtt aca gga atc aac aca tcc ccg ggt 7299Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430gct cac tgg acc gag gca aac tgg ata cag gaa cag cgg ttt gtg 7344Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445gga ctt aaa tac cgc caa gtc ctt cat gca gac caa tcc ttt gtc 7389Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val
2450 2455 2460tct tcg cat aaa aaa gga cca gat ggc gtg cgg gcc caa cta agc 7434Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser
2465 2470 2475agg gtc acc tct cac gac gag gcc att tct atc gtc ctc aaa gca 7479Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
2480 2485 2490atg acg gaa aag ctg atg cga atg ttt ggt ctg gca gaa gac gac 7524Met Thr Glu Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp
2495 2500 2505atg tcc tcg tcc aaa aac ctg gca ggt gtc ggc gta gac tca ctc 7569Met Ser Ser Ser Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu
2510 2515 2520gtc gcc att gaa ctt cga aac tgg atc aca tct gaa atc cat gtt 7614Val Ala Ile Glu Leu Arg Asn Trp Ile Thr Ser Glu Ile His Val
2525 2530 2535gat gtg tcg atc ttt gag ctc atg aat ggt aac acc atc gcc ggc 7659Asp Val Ser Ile Phe Glu Leu Met Asn Gly Asn Thr Ile Ala Gly
2540 2545 2550ctc gtc gag tta gtt gtg gcg aaa tgc agt taa 7692Leu Val Glu Leu Val Val Ala Lys Cys Ser
2555 2560<210>46<211>2563<212>PRT<213>柑桔青霉<400> 46Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr1 5 10 15Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly65 70 75 80Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser145 150 155 160Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr225 230 235 240Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys305 310 315 320Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe385 390 395 400Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln465 470 475 480Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn545 550 555 560Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu625 630 635 640Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu705 710 715 720Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr785 790 795 800Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu865 870 875 880Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln945 950 955 960Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys
1010 1015 1020Pro Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val
1025 1030 1035Glu Leu Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu
1040 1045 1050Val Asp Leu Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu
1055 1060 1065Gly Thr Lys Asn Trp His Gln Phe Ser Val His Ser Ile Ser Gly
1070 1075 1080Glu Asn Asn Thr Trp Thr Glu His Cys Thr Gly Leu Ile Arg Ser
1085 1090 1095Glu Ser Glu Arg Ser His Leu Asp Cys Ser Thr Val Glu Ala Ser
1100 1105 1110Arg Arg Leu Asn Leu Gly Ser Asp Asn Arg Ser Ile Asp Pro Asn
1115 1120 1125Asp Leu Trp Glu Ser Leu His Ala Asn Gly Ile Cys His Gly Pro
1130 1135 1140Ile Phe Gln Asn Ile Gln Arg Ile Gln Asn Asn Gly Gln Gly Ser
1145 1150 1155Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala Ser Ala Met Pro His
1160 1165 1170Ser Tyr Glu Asn Arg His Ile Val His Pro Thr Thr Leu Asp Ser
1175 1180 1185Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala Gly Thr Arg
1190 1195 1200Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val Lys Ile
1205 1210 1215Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp Ala
1220 1225 1230Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp
1250 1255 1260Gly Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val
1265 1270 1275Gly Ser Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu
1280 1285 1290Asn Ala Cys Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly
1295 1300 1305Asp Ser Thr Trp Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr
1310 1315 1320Lys Glu Thr Glu Leu Met Met Asp Leu Arg Arg Cys Thr Ile Asn
1325 1330 1335Phe Ile Gln Glu Ala Val Thr Asp Leu Thr Asn Ser Asp Ile Gln
1340 1345 1350His Leu Asp Gly His Leu Gln Lys Tyr Phe Asp Trp Met Asn Val
1355 1360 1365Gln Leu Asp Leu Ala Arg Gln Asn Lys Leu Ser Pro Ala Ser Cys
1370 1375 1380Asp Trp Leu Ser Asp Asp Ala Glu Gln Lys Lys Cys Leu Gln Ala
1385 1390 1395Arg Val Ala Gly Glu Ser Val Asn Gly Glu Met Ile Ser Arg Leu
1400 1405 1410Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu Thr Glu Pro Leu
1415 1420 1425Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr Tyr Val Asn
1430 1435 1440Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu Leu Ile
1445 1450 1455Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu Ile
1460 1465 1470Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser
1490 1495 1500Ala Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln
1505 1510 1515Asp Val Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu
1520 1525 1530Gln Gln Gly Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys
1535 1540 1545Gln Val Leu His Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn
1550 1555 1560Val Arg Lys Leu Leu Lys Pro Gly Gly Asn Leu Ile Leu Val Glu
1565 1570 1575Thr Thr Arg Asp Gln Leu Asp Leu Phe Phe Thr Phe Gly Leu Leu
1580 1585 1590Pro Gly Trp Trp Leu Ser Glu Glu Pro Glu Arg Lys Ser Thr Pro
1595 1600 1605Ser Leu Thr Thr Asp Leu Trp Asn Thr Met Leu Asp Thr Ser Gly
1610 1615 1620Phe Asn Gly Val Glu Leu Glu Val Arg Asp Cys Glu Asp Asp Glu
1625 1630 1635Phe Tyr Met Ile Ser Thr Met Leu Ser Thr Ala Arg Lys Glu Asn
1640 1645 1650Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val Leu Leu Leu His
1655 1660 1665Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser Leu Gln Ala
1670 1675 1680Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn Ala Leu
1685 1690 1695Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly Glu
1700 1705 1710Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val
1730 1735 1740Ser Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu
1745 1750 1755His Ile Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys
1760 1765 1770Glu Tyr Val Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr
1775 1780 1785His Glu Ser Leu Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu
1790 1795 1800Gly Asp Leu Ser Glu Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn
1805 1810 1815Gly Val Ile His Val Pro Arg Leu Phe Asn Asp Pro His Trp Lys
1820 1825 1830Asp Gln Glu Ala Val Glu Val Thr Leu Gln Pro Phe Glu Gln Pro
1835 1840 1845Gly Arg Arg Leu Arg Met Glu Val Glu Thr Pro Gly Leu Leu Asp
1850 1855 1860Ser Leu Gln Phe Arg Asp Asp Glu Gly Arg Glu Gly Lys Asp Leu
1865 1870 1875Pro Asp Asp Trp Val Glu Ile Glu Pro Lys Ala Phe Gly Leu Asn
1880 1885 1890Phe Arg Asp Val Met Val Ala Met Gly Gln Leu Glu Ala Asn Arg
1895 1900 1905Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys Leu Gly Gly
1910 1915 1920Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg Val Cys
1925 1930 1935Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro Tyr
1940 1945 1950Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr
1970 1975 1980Thr Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser
1985 1990 1995Gly Ala Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu
2000 2005 2010Ala Gly Ala Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg
2015 2020 2025Asp Phe Val Gly Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe
2030 2035 2040Ser Ser Arg Asn Asp Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr
2045 2050 2055Gly Gly Leu Gly Val His Val Val Leu Asn Ser Leu Ala Gly Gln
2060 2065 2070Leu Leu Gln Ala Ser Phe Asp Cys Met Ala Glu Phe Gly Arg Phe
2075 2080 2085Val Glu Ile Gly Lys Lys Asp Leu Glu Gln Asn Ser Arg Leu Asp
2090 2095 2100Met Leu Pro Phe Thr Arg Asp Val Ser Phe Thr Ser Ile Asp Leu
2105 2110 2115Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu Val Ser Glu Ala Leu
2120 2125 2130Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala Ile Gly Leu Ile
2135 2140 2145Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu Lys Ala Phe
2150 2155 2160Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val Val Asn
2165 2170 2175Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe Ser
2180 2185 2190Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly
2210 2215 2220Ala Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro
2225 2230 2235Phe Ile Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His
2240 2245 2250Ala Cys Asp Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg
2255 2260 2265Leu Cys Glu Glu Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln
2270 2275 2280Gly Ala Met Val Leu Lys Asp Ala Leu Leu Ser Arg Met Thr Leu
2285 2290 2295Asp Glu Phe Asn Ala Ala Thr Arg Pro Lys Val Gln Gly Ser Trp
2300 2305 2310Tyr Leu His Lys Ile Ala Gln Asp Val Asp Phe Phe Val Met Leu
2315 2320 2325Ser Ser Leu Val Gly Val Met Gly Gly Ala Gly Gln Ala Asn Tyr
2330 2335 2340Ala Ala Ala Gly Ala Phe Gln Asp Ala Leu Ala His His Arg Arg
2345 2350 2355Ala His Gly Met Pro Ala Val Thr lle Asp Leu Gly Met Val Lys
2360 2365 2370Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly Val Ala Asp Arg
2375 2380 2385Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys Asp Val Met
2390 2395 2400Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln Phe Pro
2405 2410 2415Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro Gly
2420 2425 2430Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val
2450 2455 2460Ser Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser
2465 2470 2475Arg Val Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala
2480 2485 2490Met Thr Glu Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp
2495 2500 2505Met Ser Ser Ser Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu
2510 2515 2520Val Ala Ile Glu Leu Arg Asn Trp Ile Thr Ser Glu Ile His Val
2525 2530 2535Asp Val Ser Ile Phe Glu Leu Met Asn Gly Asn Thr Ile Ala Gly
2540 2545 2550Leu Val Glu Leu Val Val Ala Lys Cys Ser
2555 2560<210>47<211>1557<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(1557)<400>47atg ctc ggc cag gtt ctt ctg acc gtc gaa tcg tac caa tgg gta tcg 48Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser1 5 10 15acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc 96Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa 144Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45aaa tgg tgg gag ttg acg acc atg agg gct agg cag gac ttc gat acg 192Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60tat ggt ccg agc tgg atc gaa gct tgg ttc tcg aaa aac gac aag ccc 240Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro65 70 75 80ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca tcg tcc 288Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt 336Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110ttg gcg gat gac ttt cac tct cat ctc cct gga ttc gac ggg ttc aag 384Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125gaa atc tgc cag gat gca cat ctt gtc aac aaa gtt gtt ttg aac cag 432Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140tta caa acc caa gcc ccc aag tac aca aag cca ttg gct acc ttg gcc 480Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala145 150 155 160gac gct act att gcc aag ttg ttc ggt aaa agc gag gag tgg caa acc 528Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175gca cct gtc tat tcc aat gga ttg gac ctt gtc aca cga aca gtc aca 576Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat 624Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt 672Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220cgc gta tgg ccc atg cta ctg cga ccg ctc gct cac tgg ttt caa ccg 720Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro225 230 235 240caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca cga aag atc att 768Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255gat cct gag att cag cga cga cgt gct gaa aag gcc gca tgt gta gcg 816Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa 864Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct 912Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300atg gat ttc gcc ggc atc tac gcc tcg acg gat ctt ttc gtc ggt gcc 960Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala305 310 315 320ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa 1008Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335gag atc cgc act gta atc gga gaa ggg ggc tgg acg cct gcc tct ctg 1055Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350ttc aag ctg aag ctc ctc gac agc tgc atg aaa gag acg cag cga atc 1104Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365aag ccg gtc gag tgc gcc act atg cgc agt acc gct ctc aga gac atc 1152Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380act cta tcc aat ggc ctc ttc att ccc aag ggc gag ttg gcc gct gtg 1200Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val385 390 395 400gct gca gac cgc atg aac aac cct gat gtg tgg gaa aac ccc gaa aat 1248Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415tat gat ccc tac cga ttt atg cgc atg cgc gag gat cca gac aag gcc 1296Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430ttc acc gct caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc 1344Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445tgg aac cca cgc gct tgt ccc ggg cgg ttc ttc gcc tcg aag gaa atc 1392Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460aag att ctc ctc gct cat ata ctg att cag tat gat gtg aag cct gta 1440Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val465 470 475 480cca gga gac gat gac aaa tac tac cgt cac gct ttt agc gtt cgt atg 1488Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495cat cca acc aca aag ctc atg gta cgc cgg cgc aac gag gac atc ccg 1536His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510ctc cct cat gac cgg tgc taa 1557Leu Pro His Asp Arg Cys
515<210>48<211>518<212>PRT<213>柑桔青霉<400> 48Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser1 5 10 15Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro65 70 75 80Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala145 150 155 160Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro225 230 235 240Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala305 310 315 320Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val385 390 395 400Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val465 470 475 480Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510Leu Pro His Asp Arg Cys
515<210>49<211>3522<212>DNA<213>柑桔青霉<220><221>CDS<222>(1)..(3522)<400>49atg gtc gct tcg ttg eta ccc tct cgc ttt cgc ggt agg gaa tca atg 48Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met1 5 10 15aat cag cag cac cct cta cgc tcg gga aat cgg gca ttg acc tcc aca 96Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30ctc caa ttt cta tcc aaa acg gcg tgt cta cac ccg atc cat acc gtt 144Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45tgc acc ata gct att cta gct agt acc aca tac gtt gga cta ctc aaa 192Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60gac agc ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc 240Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly65 70 75 80tct ttg gtc gaa gga agt cga agc ttg atc acc ggc cca cag aat ggc 288Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95tgg aag tgg cag agc ttc gac ggg gat gca gat gtt ctc gga gat ttc 336Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110aac cat caa gca cta atg acc ttg gta ttc ccg ggg tca tat ggg gtt 384Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125gca tct caa gca gcc tca cca ttc ctt gct ccc ctc cct gtg aac cta 432Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140tct gtg att gac ctt ccc tca acg tcg agc cct tta acc gcc tat tcg 480Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser145 150 155 160aaa gat aaa gtt ttc gcc ttc tct gtg gaa tac agc agc gcg ccg gaa 528Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175ctc gtg gct gct gtt caa gaa atc ccc aac aac agt gcc gac ctg aaa 576Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190ttg cag gag acg caa ttg atc gag atg gaa cgc cag atg tgg atc atg 624Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac 672Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220gat acc tgg aca gag tct ctt gat ctt atc aag agc gct caa acg ctc 720Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu225 230 235 240gac gtg gtt gtc atg gtg cta ggt tat ata tca atg cac ttg act ttc 768Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255gtc tca ctc ttc ctc agc atg aaa aaa ttg gga tcg aag gtt tgg ctg 816Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270gct aca agc gtc ctt ttg tcg tca aca ttt gcc ttt ctc ctc ggt ctc 864Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285gac gtg gcc ata aga cta ggg gtt ccg atg agc atg agg ttg cta tcc 912Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc 960Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile305 310 315 320act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac cga aag ccc 1008Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335cag aag ata cag tct gac cag ggt agc gtg aca gcc att gct gaa agt 1056Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350acc atc aat tac gcc gta cga agc gcc att cgg gag aag ggt tac aat 1104Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365atc gtg tgc cac tac gtg gtc gag atc ctg ctc cta gtt atc ggt gct 1152Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380gtc tta ggc atc caa ggt ggg cta cag cac ttc tgt gtt cta gct gca 1200Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala385 390 395 400ttg atc ctg ttc ttt gac tgt ctg ctg ctg ttt aca ttc tac act gcg 1248Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415att ctg tct atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac 1296Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag 1344Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445agt gtc gcg acc agc aat gat gcc caa gac agt gca cgt aca tat ctg 1392Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460ttt ggc aat gat atg aaa ggc agc agt gtt ccg aag ttc aaa ttc tgg 1440Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp465 470 475 480atg gtc gtt ggt ttc ctt ate gtc aac ctc gtc aac atc ggc tcc acc 1488Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495ctt ttc caa gcc tct tct agt gga tcg ttg tcc agt ata tca tct tgg 1536Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510acc gaa agt ctg agc gga tcg gcc att aaa ccc ccg ctt gag ccc ttc 1584Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525aag gta gct gga agt gga cta gat gaa cta ctt ttc cag gca aga ggg 1632Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa 1680Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu545 550 555 560cta gag tat cct tcc att cac cgt ggt acc tcg cag cta cac gag tat 1728Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575gga gtt ggt gga aaa atg gtc ggt agc ctg ctc acc agc ctg gaa gat 1776Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc cta agt gtc gct 1824Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605ctg aac agc tat ctg ttc aag gcc gcc aga ctg gga atc aaa gat cct 1872Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620aat ctc ccg agt cac cca gtt gat cca gtt gag ctt gac cag gcc gaa 1920Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu625 630 635 640agc ttc aac gct gcc cag aac cag acc cct cag att caa tca agt ctc 1968Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655caa gct cct cag acc aga gtg ttc act cct acc acc acc gac agt gac 2016Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670agt gat gcc tca tta gtc tta att aaa gca tct cta aag gtc act aag 2064Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685cga gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tct cgc aca 2112Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc agc gag ttg 2160Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu705 710 715 720aac gat gag gat gtc gtt gcc ttg tct ttg cgg gga aag gtt ccc ggg 2208Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt 2256Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750cgc cgc tct atc att tcg agg aca ccg gct acc gca gag ctt aca agt 2304Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765atg ctg gag cac tcg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc 2352Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct 2400Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro785 790 795 800gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att 2448Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815cct atg gca acc acc gag ggc gtc ctc gtc gct agt gct agc cgt ggc 2496Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc 2544Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845gac ggt atg aca cga ggc ccg tgt gtg aag ttt gat gtc crt gaa cga 2592Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta 2640Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val865 870 875 880atg aaa gaa gcc ttc aat tca acc agc aga ttt gcg cgc tta caa agt 2688Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895atg cgg aca act atc gcc ggt act cac tta tat att cga ttt aag act 2736Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910act act ggc gac gct atg gga atg aat atg att tct aag ggc gtg gag 2784Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925cat gca ctg aat gtt atg gcg aca gag gca ggt ttc agc gat atg aat 2832His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940att att acc cta tca gga aat tac tgt acg gat aag aaa cct tca gct 2880Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala945 950 955 960ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc 2928Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975ata ccg gcg aac gtt gtc agg gat gtc tta aag agc gat gtg gat agc 2976Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca 3069Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala
1010 1015 1020gcc att ttc att gcc aca ggt cag gat ccg gcg caa gtt gtg gag 3114Ala Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu
1025 1030 1035agc gct aac tgc atc act ctc atg aac aat ctt cgc gga tcg ctt 3159Ser Ala Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu
1040 1045 1050caa atc tct gtc tcc atg ccg tct att gag gtt gga acg ttg ggc 3204Gln Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly
1055 1060 1065ggt ggt acg att ctg gag ccc cag ggc gca atg ctt gac atg ctt 3249Gly Gly Thr Ile Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu
1070 1075 1080ggt gtc cgc gga tca cac ccg acc act ccc ggt gag aat gca cgt 3294Gly Val Arg Gly Ser His Pro Thr Thr Pro Gly Glu Asn Ala Arg
1085 1090 1095caa ctt gcg cgc atc atc gga agc gct gtt ttg gct ggg gag ctc 3339Gln Leu Ala Arg Ile Ile Gly Ser Ala Val Leu Ala Gly Glu Leu
1100 1105 1110tcg cta tgt gct gcc cta gcc gcc ggt cac ctg gtc aag gcg cac 3384Ser Leu Cys Ala Ala Leu Ala Ala Gly His Leu Val Lys Ala His
1115 1120 1125atg gcg cac aac cgt tct gcc ccg gca tct tca gcc cct tct cga 3429Met Ala His Asn Arg Ser Ala Pro Ala Ser Ser Ala Pro Ser Arg
1130 1135 1140agt gtc tcc ccg tca ggc gga acc agg aca gtc cct gtt cct aac 3474Ser Val Ser Pro Ser Gly Gly Thr Arg Thr Val Pro Val Pro Asn
1145 1150 1155aat gca ctg agg ccg agt gct gca gct act gat cgg gct cga cgc 3519Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg
1160 1165 1170tga 3522<210>50<211>1173<212>PRT<213>柑桔青霉<400>50Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met1 5 10 15Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly65 70 75 80Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser145 150 155 160Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu225 230 235 240Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile305 310 315 320Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala385 390 395 400Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp465 470 475 480Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu545 550 555 560Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu625 630 635 640Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu705 710 715 720Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro785 790 795 800Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val865 870 875 880Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala945 950 955 960Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala
1010 1015 1020Ala Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu
1025 1030 1035Ser Ala Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu
1040 1045 1050Gln Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly
1055 1060 1065Gly Gly Thr Ile Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu
1070 1075 1080Gly Val Arg Gly Ser His Pro Thr Thr Pro Gly Glu Asn Ala Arg
1085 1090 1095Gln Leu Ala Arg Ile Ile Gly Ser Ala Val Leu Ala Gly Glu Leu
1100 1105 1110Ser Leu Cys Ala Ala Leu Ala Ala Gly His Leu Val Lys Ala His
1115 1120 1125Met Ala His Asn Arg Ser Ala Pro Ala Ser Ser Ala Pro Ser Arg
1130 1135 1140Ser Val Ser Pro Ser Gly Gly Thr Arg Thr Val Pro Val Pro Asn
1145 1150 1155Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr Asp Arg Ala Arg Arg
1160 1165 1170<210>51<211>20<212>DNA<213>柑桔青霉<400>51gcaagctctg ctaccagcac 20<210>52<211>20<212>DNA<213>柑桔青霉<400>52ctaggccaac ttcagagccg 20<210>53<211>20<212>DNA<213>柑桔青霉<400>53agtcatgcag gatctgggtc 20<210>54<211>20<212>DNA<213>柑桔青霉<400>54gcagacacat cggtgaagtc 20<210>55<211>20<212>DNA<213>柑桔青霉<400>55aaaccgcacc tgtctattcc 20<210>56<211>20<212>DNA<213>柑桔青霉<400>56ctttgtggtt ggatgcatac 20<210>57<211>20<212>DNA<213>柑桔青霉<400>57cgctctatca tttcgaggac 20<210>58<211>20<212>DNA<213>柑桔青霉<400>58tcaatagacg gcatggagac 20<210>59<211>20<212>DNA<213>柑桔青霉<400>59atgtcagaac ctctaccccc 20<210>60<211>20<212>DNA<213>柑桔青霉<400>60tcaagcatca gtctcaggca 20<210>61<211>20<212>DNA<213>柑桔青霉<400>61atgtccctgc cgcatgcaac 20<210>62<211>20<212>DNA<213>柑桔青霉<400>62ctaagcaata ttgtgtttct 20
Claims (41)
1.一种多核苷酸,选自以下:
(a)编码具有氨基酸序列SEQ ID NO38的蛋白质的多核苷酸,或者编码具有至少一个缺失、添加、取代或改变的修饰氨基酸序列的其多核苷酸变体,所述变体多核苷酸适合用于加速ML-236B的生物合成;和
(b)编码具有氨基酸序列SEQ ID NO42的蛋白质的多核苷酸,或者编码具有至少一个缺失、取代或改变的修饰氨基酸的其多核苷酸变体,所述变体多核苷酸适合用于加速ML-236B的生物合成。
2.如权利要求1的多核苷酸,含有SEQ ID NO37或者含有其突变体或变体,它适合用于加速ML-236B的生物合成。
3.如权利要求1或2的多核苷酸,含有SEQ ID NO37。
4.如权利要求1-3任一项的多核苷酸,含有由转化的大肠杆菌pSAKexpESANK72499(FERMBP-7005)获得的DNA。
5.如权利要求1的多核苷酸,含有SEQ ID NO41,或者含有其变体,它适合用于加速ML-236B的生物合成。
6.如权利要求1或5的多核苷酸,含有SEQ ID NO41。
7.如权利要求1、5或6的多核苷酸,含有由转化的大肠杆菌pSAKexpRSANK 72599(FERM BP-7006)获得的DNA。
8.如前面任意权利要求的多核苷酸,与一种或多种多核苷酸可操作地组合,所述组合适合用于提高产ML-236B的微生物的ML-236B的产量。
9.如权利要求8的多核苷酸,含有SEQ ID NO37的多核苷酸、或者其具有相似功能的变体,它与选自SEQ ID NO37、41、43、45、47或49、或者其具有相似功能的变体的一个或多个序列组合。
10.如权利要求8的多核苷酸,含有SEQ ID NO41的多核苷酸、或者其具有相似功能的变体,它与选自SEQ ID NO37、41、43、45、47或49、或者其具有相似功能的变体的一个或多个序列组合。
11.能够在严格条件下与前面任意权利要求的多核苷酸杂交的多核苷酸。
12.如权利要求11的多核苷酸,当其导入产ML-236B的微生物中时适合加速该产ML-236B的微生物中的ML-236B的生物合成。
13.如权利要求11或12的多核苷酸,它是RNA。
14.含有如前面任意权利要求的多核苷酸的载体。
15.如权利要求14的载体,能由大肠杆菌pSAKexpE SANK72499(FERMBP-7005)或大肠杆菌pSAKexpR SANK72599(FERM BP-7006)获得。
16.如权利要求14或15的载体,它是表达载体。
17.由权利要求14-16任一项的载体转化的宿主细胞。
18.如权利要求17的宿主细胞,其特征在于其为产ML-236B的微生物。
19.如权利要求18的宿主细胞,其特征在于其为柑桔青霉。
20.如权利要求17的宿主细胞,其特征在于其为大肠杆菌。
21.如权利要求20的宿主细胞,其特征在于其为大肠杆菌pSAKexpE SANK72499(FERM BP-7005)。
22.如权利要求20的宿主细胞,特征在于其为大肠杆菌pSAKexpR SANK72599(FERM BP-7006)。
23.由权利要求1-13任一项的多核苷酸编码的多肽。
24.一种多肽,含有序列SEQ ID NO38,或者与SE ID NO38具有至少80%同一性的其变体,它能加速产ML236B的生物体中的ML236B生产。
25.如权利要求24的多肽,具有序列SEQ ID NO38。
26.一种多肽,含有序列SEQ ID NO42,或者与SE ID NO42具有至少80%同一性的其变体,它能加速产ML236B的生物体中的ML236B生产。
27.如权利要求26的多肽,具有序列SEQ ID NO42。
28.一种生产ML-236B的方法,包括将权利要求17-19任一项的宿主细胞培养,然后从该培养物中回收ML-236B。
29.如权利要求28的方法,其中所述宿主细胞用含有SEQ ID NO37或SEQID NO41的载体转化。
30.如权利要求29的方法,其中所述载体不包括其它基因。
31.如权利要求28-30任一项的方法,其中在没有相应于SEQ ID NO44、46、48或50的重组mlcA、B、C或D的情况下进行生产。
32.通过权利要求28-31任一项的方法生产的ML-236B。
33.一种生产帕伐他丁的方法,包括进行权利要求28-31任一项的方法,并将ML-236B转变成帕伐他丁。
34.与SEQ ID NO38或SEQ ID NO42的蛋白质反应的抗体。
35.一种编码具有选自SEQ ID NO44、46、48或50的氨基酸序列的蛋白质的多核苷酸,或者编码具有缺失、取代、添加或改变的所述氨基酸序列修饰的变体多核苷酸,所述变体适合用于加速ML-236B的生物合成。
36.如权利要求35的多核苷酸,选自由SEQ ID NO43、45、47或49组成的组。
37.如权利要求35或36的多核苷酸,所述多核苷酸能单独或者与SEQ ID NO37或SEQ ID NO41的多核苷酸相连加速ML-236B的生物合成。
38.含有如权利要求35-37任一项的多核苷酸的载体。
39.含有如权利要求38的载体的宿主细胞。
40.由权利要求35-37任一项的多核苷酸编码的多肽。
41.一种生产ML236B的方法,包括培养权利要求39的宿主细胞,然后从该培养物中回收ML-236B。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000116591 | 2000-04-18 | ||
JP116591/2000 | 2000-04-18 | ||
JP116591/00 | 2000-04-18 | ||
JP117458/2000 | 2000-04-19 | ||
JP2000117458 | 2000-04-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1325959A true CN1325959A (zh) | 2001-12-12 |
CN1325959B CN1325959B (zh) | 2010-05-05 |
Family
ID=26590305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN011196556A Expired - Fee Related CN1325959B (zh) | 2000-04-18 | 2001-04-18 | 来自基因簇的基因 |
Country Status (24)
Country | Link |
---|---|
US (3) | US7056710B2 (zh) |
EP (1) | EP1149919B1 (zh) |
KR (1) | KR100632174B1 (zh) |
CN (1) | CN1325959B (zh) |
AR (1) | AR034550A1 (zh) |
AT (1) | ATE373101T1 (zh) |
AU (1) | AU783319B2 (zh) |
BR (1) | BR0101518A (zh) |
CA (1) | CA2342397C (zh) |
CY (1) | CY1106985T1 (zh) |
CZ (1) | CZ20011367A3 (zh) |
DE (1) | DE60130394T2 (zh) |
DK (1) | DK1149919T3 (zh) |
ES (1) | ES2293966T3 (zh) |
HK (1) | HK1037683A1 (zh) |
HU (1) | HUP0101569A3 (zh) |
IL (1) | IL142619A (zh) |
MX (1) | MXPA01003913A (zh) |
NO (1) | NO328653B1 (zh) |
NZ (1) | NZ511166A (zh) |
PL (1) | PL202457B1 (zh) |
PT (1) | PT1149919E (zh) |
RU (1) | RU2236463C2 (zh) |
TW (1) | TWI312807B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009540811A (ja) * | 2006-06-22 | 2009-11-26 | ディーエスエム アイピー アセッツ ビー.ブイ. | プラバスタチンの産生 |
WO2010034686A1 (en) * | 2008-09-24 | 2010-04-01 | Dsm Ip Assets B.V. | Improved statin production |
WO2010069914A1 (en) * | 2008-12-19 | 2010-06-24 | Dsm Ip Assets B.V. | Statin transcription regulators |
WO2015161856A1 (en) * | 2014-04-23 | 2015-10-29 | Danmarks Tekniske Universitet | Statin resistance and export |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS572240A (en) | 1980-06-06 | 1982-01-07 | Sankyo Co Ltd | Ml-236b derivative |
US5179013A (en) * | 1987-02-02 | 1993-01-12 | Sankyo Company, Limited | Cytochrome P-450 enzymes |
WO1995012661A1 (en) | 1993-11-02 | 1995-05-11 | Merck & Co., Inc. | Dna encoding triol polyketide synthase |
KR100186758B1 (ko) * | 1996-08-09 | 1999-04-01 | 영진약품공업 주식회사 | 프라바스타틴(pravastatin)전구체의제조방법 |
US6391583B1 (en) | 1998-12-18 | 2002-05-21 | Wisconsin Alumni Research Foundation | Method of producing antihypercholesterolemic agents |
AU6475800A (en) | 1999-08-11 | 2001-03-13 | Sankyo Company Limited | Ml-236b biosynthesis-associated dna |
FR2801648B1 (fr) * | 1999-11-30 | 2002-06-21 | Commissariat Energie Atomique | Injecteur a vapeur haute pression comportant un drain axial |
-
2001
- 2001-04-16 IL IL142619A patent/IL142619A/en not_active IP Right Cessation
- 2001-04-17 CA CA2342397A patent/CA2342397C/en not_active Expired - Fee Related
- 2001-04-17 RU RU2001110575/13A patent/RU2236463C2/ru not_active IP Right Cessation
- 2001-04-17 NO NO20011890A patent/NO328653B1/no not_active IP Right Cessation
- 2001-04-17 US US09/836,705 patent/US7056710B2/en not_active Expired - Fee Related
- 2001-04-17 CZ CZ20011367A patent/CZ20011367A3/cs unknown
- 2001-04-18 DK DK01303527T patent/DK1149919T3/da active
- 2001-04-18 AT AT01303527T patent/ATE373101T1/de not_active IP Right Cessation
- 2001-04-18 AR ARP010101821A patent/AR034550A1/es active IP Right Grant
- 2001-04-18 ES ES01303527T patent/ES2293966T3/es not_active Expired - Lifetime
- 2001-04-18 KR KR1020010020867A patent/KR100632174B1/ko not_active IP Right Cessation
- 2001-04-18 PT PT01303527T patent/PT1149919E/pt unknown
- 2001-04-18 CN CN011196556A patent/CN1325959B/zh not_active Expired - Fee Related
- 2001-04-18 BR BR0101518-4A patent/BR0101518A/pt not_active IP Right Cessation
- 2001-04-18 MX MXPA01003913A patent/MXPA01003913A/es active IP Right Grant
- 2001-04-18 AU AU37092/01A patent/AU783319B2/en not_active Ceased
- 2001-04-18 TW TW090109340A patent/TWI312807B/zh not_active IP Right Cessation
- 2001-04-18 PL PL347118A patent/PL202457B1/pl not_active IP Right Cessation
- 2001-04-18 NZ NZ511166A patent/NZ511166A/xx unknown
- 2001-04-18 EP EP01303527A patent/EP1149919B1/en not_active Expired - Lifetime
- 2001-04-18 DE DE60130394T patent/DE60130394T2/de not_active Expired - Lifetime
- 2001-04-18 HU HU0101569A patent/HUP0101569A3/hu unknown
- 2001-11-30 HK HK01108428A patent/HK1037683A1/xx not_active IP Right Cessation
-
2005
- 2005-05-11 US US11/127,939 patent/US20050214909A1/en not_active Abandoned
-
2006
- 2006-12-14 US US11/639,130 patent/US20070111293A1/en not_active Abandoned
-
2007
- 2007-11-08 CY CY20071101434T patent/CY1106985T1/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1298447A (zh) | 生产刺糖噻杀虫剂所用的生物合成基因 | |
CN1152941A (zh) | 合成抗病原体物质的基因 | |
CN1314950A (zh) | 微生物和植物中的维生素c生产 | |
CN1305529A (zh) | 利用微生物生产类异戊二烯化合物的方法和检测具有抗菌或除草活性的化合物的方法 | |
CN1065277C (zh) | 阿凡曼菌素的制备方法 | |
CN1333820A (zh) | 产生环氧噻酮及其衍生物的重组方法和材料 | |
CN1094707A (zh) | 六氢化萘酯衍生物、它们的制备和它们在治疗方面的应用 | |
CN1257541A (zh) | 植物脂肪酸环氧化酶及其用途 | |
CN1845925A (zh) | 取代的杂环化合物 | |
CN1705662A (zh) | 埃坡霉素b的制备、分离和纯化的方法,及埃坡霉素b的x-射线晶体结构 | |
CN1717493A (zh) | 大环内酯化合物的产生方法 | |
CN1221453A (zh) | 提高丝状真菌中血红素蛋白产量的方法 | |
CN1263855C (zh) | 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用 | |
CN1849391A (zh) | 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法 | |
CN1886505A (zh) | 参与大环内酯类化合物的羟化作用的dna | |
CN1110554C (zh) | 米曲霉5-氨基乙酰丙酸合成酶及编码此酶的核酸 | |
CN1325959A (zh) | 来自基因簇的基因 | |
CN1514880A (zh) | 生产依马菌素的方法和组合物 | |
CN1307137A (zh) | 携带新黄素裂解酶基因的转基因植物 | |
CN1092811A (zh) | 新的thiomarinol衍生物及其制备方法 | |
CN1434867A (zh) | 具有各种特性的稻子过氧化物酶 | |
CN1387566A (zh) | 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统 | |
CN101063140A (zh) | 万古霉素生物合成基因簇 | |
CN1034498C (zh) | 用于抑制胆固醇生物合成的八氢萘肟衍生物,其制备方法和用途 | |
CN1521180A (zh) | 介导除虫菌素b2:b1比例的除虫链霉菌基因 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100505 Termination date: 20130418 |