KR100632174B1 - 유전자 클러스터의 유전자 - Google Patents
유전자 클러스터의 유전자 Download PDFInfo
- Publication number
- KR100632174B1 KR100632174B1 KR1020010020867A KR20010020867A KR100632174B1 KR 100632174 B1 KR100632174 B1 KR 100632174B1 KR 1020010020867 A KR1020010020867 A KR 1020010020867A KR 20010020867 A KR20010020867 A KR 20010020867A KR 100632174 B1 KR100632174 B1 KR 100632174B1
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- leu
- ala
- seq
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/385—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/06—Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/181—Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
Abstract
ML-236B는 HMG-CoA 리덕타제의 억제제이고 상기의 다른 억제제인 프라바스타틴을 제조하는데 유용하다. ML-236B 생산 미생물을 사용한 ML-236B의 제조는 상기 미생물에 존재하는 폴리케티드 신타제 클러스터에 관련된 유전자를 코딩하는 폴리뉴클레오티드를 사용하여 증강된다.
Description
도 1 은 DNA 벡터 pSAKcos1의 작제를 나타내는 도식이고;
도 2 는 pML48의 삽입 서열의 구조 유전자 분석의 결과이고;
도 3 은 pML48 의 삽입 서열의 노던(Northern) 블롯 혼성화를 나타내고;
도 4 는 cDNA 발현 벡터 pSAK700 의 작제를 나타내는 도식이고;
도 5 는 pSAKexpR 형질전환체에서의 mlcA 내지 E 및 R 의 전사에 대한 RT-PCR 분석을 나타낸다.
도 6 은 pSAKexpE 형질전환체에서의 mlcE의 전사에 대한 RT-PCR 분석을 나타낸다.
본 발명은 유전자 클러스터, 및 더 특히 유전자 클러스터의 유전자에 관한 것이다.
더 특히 본 발명은 ML-236B 생산 미생물에 도입되었을 때 ML-236B 생산 미생물에서 HMG-CoA 리덕타제 억제제인 ML-236B의 생합성을 촉진하는, DNA와 같은 폴리뉴클레오티드에 관한 것이다. 추가로 본 발명은 상기 폴리뉴클레오티드가 삽입된 벡터, 상기 벡터에 의해 형질전환되는 숙주 세포, 상기 벡터에 의해 발현되는 단백질, 상기 폴리뉴클레오티드 및/또는 단백질을 사용하여 ML-236B를 생성하는 방법(상기 숙주 세포의 배양물로부터 ML-236B를 회수하는 것을 포함함)에 관한 것이고, 또한 본 발명은 다른 연관된 측면에 관한 것이다.
프라바스타틴(pravastatin)은 HMG-CoA 리덕타제 억제제이다. 프라바스타틴 소듐은 고지방혈증(Hyperlipemia) 또는 지질과잉혈증(Hyperlipidaemia)의 치료에 사용됐고 혈청 콜레스테롤을 감소시킬 수 있는 약리학적으로 유용한 효과를 갖는다. 스트렙토미세스 카르보필러스 (Streptomyces carbophilus)를 사용하여 페니실륨 시트리눔(Penicillium citrinum)에 의해 생성되는 ML-236B의 미생물학적 전환에 의해 프라바스타틴을 수득할 수 있다[Endo, A., et al., J. Antibiot., 29 1346 (1976); Matsuoka, T., et al., Eur. J. Biochem., 184, 707 (1989) 및 일본 특허 출원 공보 제 57-2240 호에 기술되어 있음].
프라바스타틴의 전구체인 ML-236B와 HMG-CoA 억제제인 로바스타틴은 모두 동일한 부분 구조를 공유한다고 보여졌다. 이들은 폴리케티드를 통해 생물학적으로 합성된다[Moore, R.N., et al., J. Am. Chem. Soc., 107, 3694 (1985); Shiao, M. and Don, H. S., Proc. Natl. Sci. Counc. Repub. China B, 11, 223 (1987)에 기술되어 있음].
폴리케티드는 아세트산, 프로피온산, 부티르산 등과 같은 저분자량의 카르복실산의 연속 축합 반응으로부터 생성되는 β-케토 탄소 사슬로부터 유도되는 화합 물이다. 각각의 β-케토 카르보닐기의 축합 또는 환원의 경로에 따라 다양한 구조를 유도할 수 있다[Hopwood, D.A. and Sherman, D.H., Annu. Rev. Genet., 24, 37-66 (1990); Hutchinson, C.R. and Fujii, I., Annu. Rev. Microbiol., 49, 201-238 (1995)에 기술되어 있음].
폴리케티드의 합성에 기여하는 폴리케티드 신타제(이하 PKS 로 지칭함)는 사상균 및 세균에 존재하는 것으로 공지된 효소이다. 사상균의 효소는 분자생물학적 기술을 사용하여 연구되었다[Feng, G.H. and Leonard, T.J., J. Bacteriol., 177, 6246 (1995); Takano, Y., et al., Mol. Gen. Genet. 249. 162 (1995)에 기술되어 있음]. 로바스타틴 생성 미생물인 아스페르길루스 테레우스(Aspergillus terreus)에서, 로바스타틴의 생합성에 관련된 PKS 유전자를 분석했다[일본에서의 국제 출원 공개 (KOHYO) 제 9-504436 호에 기술되어 있고, 트리올 폴리케티드 신타제를 코딩하는 DNA 를 청구한, 상응하는 WO 9512661 을 보라].
사상균의 2 차 대사물질의 생합성에 관련된 유전자는 종종 게놈 상에서 클러스터를 형성한다. 폴리케티드의 생합성 경로에서, 상기 경로에 관여하는 유전자 클러스터가 존재하는 것으로 공지되어 있다. 아스페르길루스 플라부스(Aspergillus flavus) 및 아스페르길루스 파라시티쿠스(Aspergillus parasiticus)에 의해 생성되는 폴리케티드인 아플라톡신(Aflatoxin)의 생합성에서, 상기 생합성에 관여하는 효소 단백질(예를 들어 PKS)을 코딩하는 유전자가 클러스터 구조를 형성하는 것으로 공지되었다. 아플라톡신의 생합성에 관여하는 유전자의 게놈 분석 및 비교를 수행했다[Yu, J., et al., Appl. Environ. Microbiol., 61, 2365 (1995)를 보라]. 아스페르길루스 니둘란스(Aspergillus nidulans)에 의해 생성되는 스테리그마토시스틴(Sterigmatocystin)의 생합성에 관여하는 유전자가 그의 게놈 상에 약 60 kb 의 연속된 영역에 클러스터 구조를 형성한다고 보고되었다[Brown, D.W. et al., Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)에 기술되어 있음].
로바스타틴 합성 동안 부단백질에 의한 폴리케티드 신타제 활성의 조절을 조사했다[Kennedy, J. et al., Science Vol 284, 1368 (1999)를 보라].
그러나, 현재까지는, ML-236B 의 생합성 및 상기를 조절하는 인자를 분자생물학적으로 분석하는 것이 불충분했다. 본 발명은 상기 문제에 착수하는 것을 시도한다.
본 발명에 따라, ML-236B 의 생합성을 촉진하는데 사용하기 적합한 폴리뉴클레오티드가 제공된다.
폴리뉴클레오티드는 서열 번호 38, 42, 44, 46, 48 또는 50 의 아미노산 서열을 포함하거나 상기 서열로 구성되는 단백질을 코딩하는 전형적인 폴리뉴클레오티드이다. 하나 이상의 결실, 부가, 치환 또는 변경을 갖는 변형 아미노산 서열을 코딩하는 그의 폴리뉴클레오티드 변이체도 또한 제공된다.
서열 목록에 대한 작성표
서열 목록은 본 특허 명세서의 일부를 형성한다. 이해를 돕기 위해, 서열 목록의 하기 작성표를 제공한다.
서열 번호 동정
1 pML48 인서트
2 서열 번호 1 에 상보적임
3 실시예 4 의 PCR 프라이머
4 실시예 4 의 PCR 프라이머
5 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
6 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
7 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
8 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
9 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
10 5'-RACE 용 올리고뉴클레오티드 DNA(1), 실시예 8
11 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
12 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
13 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
14 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
15 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
16 5'-RACE 용 올리고뉴클레오티드 DNA(2), 실시예 8
17 5'-말단 cDNA 프래그먼트, 실시예 8
18 5'-말단 cDNA 프래그먼트, 실시예 8
19 5'-말단 cDNA 프래그먼트, 실시예 8
20 5'-말단 cDNA 프래그먼트, 실시예 8
21 5'-말단 cDNA 프래그먼트, 실시예 8
22 5'-말단 cDNA 프래그먼트, 실시예 8
23 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
24 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
25 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
26 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
27 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
28 3'-RACE 용 올리고뉴클레오티드 DNA(3), 실시예 8
29 3'-말단 cDNA 프래그먼트, 실시예 8
30 3'-말단 cDNA 프래그먼트, 실시예 8
31 3'-말단 cDNA 프래그먼트, 실시예 8
32 3'-말단 cDNA 프래그먼트, 실시예 8
33 3'-말단 cDNA 프래그먼트, 실시예 8
34 3'-말단 cDNA 프래그먼트, 실시예 8
35 RT-PCR 프라이머, 실시예 9
36 RT-PCR 프라이머, 실시예 9
37 mlcE; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
38 추정된 mlcE 폴리펩티드
39 RT-PCR 프라이머, 실시예 12
40 RT-PCR 프라이머, 실시예 12
41 mlcR; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
42 추정된 mlcR 폴리펩티드
43 mlcA; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
44 추정된 mlcA 폴리펩티드
45 mlcB; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
46 추정된 mlcB 폴리펩티드
47 mlcC; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
48 추정된 mlcC 폴리펩티드
49 mlcD; cDNA 뉴클레오티드 서열 및 추정된 아미노산 서열
50 추정된 mlcD 폴리펩티드
51 RT-PCR 프라이머, 실시예 17
52 RT-PCR 프라이머, 실시예 17
53 RT-PCR 프라이머, 실시예 17
54 RT-PCR 프라이머, 실시예 17
55 RT-PCR 프라이머, 실시예 17
56 RT-PCR 프라이머, 실시예 17
57 RT-PCR 프라이머, 실시예 17
58 RT-PCR 프라이머, 실시예 17
59 RT-PCR 프라이머, 실시예 17
60 RT-PCR 프라이머, 실시예 17
61 RT-PCR 프라이머, 실시예 17
62 RT-PCR 프라이머, 실시예 17
바람직한 구현
서열 번호 38, 42, 44, 46, 48 또는 50의 아미노산 서열을 코딩하는 폴리뉴클레오티드는 cDNA, 게놈 DNA 또는 mRNA 일 수 있다. 상기 6 개의 서열 각각을 코딩하는 게놈 DNA를 구조 유전자 mlcE, mlcR, mlcA, mlcB, mlcC 및 mlcD 로 각각 지칭한다. 상기 지정에 얽매이지 않고, 본 발명자들은 상기 구조 유전자가 하기 기능을 갖는 단백질을 코딩하는 것으로 믿는다.
mlcA 폴리케티드 신타제
mlcB 폴리케티드 신타제
mlcC P450 모노옥시게나제
mlcD HMG-CoA 리덕타제
mlcE 유출 펌프
mlcR 전사 인자
본 발명자들은 mlcE 또는 mlcE에 상응하는 cDNA 의 삽입이 ML-236B의 생합성을 촉진할 수 있고 mlcR 또는 mlcR에 상응하는 cDNA 의 삽입이 ML-236B의 생합성을 촉진할 수 있다는 것을 발견했다. 또한, mlcR이 mlcA 내지 D의 전사 발현을 자극한다. 유전자 붕괴 연구에서 나타난 것처럼, mlcA, B, C 및 D 는 독립적으로 또는 조합으로 ML-236B의 생성에 관여한다.
천연 또는 인공적인 변화에 의해 수득가능한 mlcA, B 및/또는 C의 변이체가 프라바스타틴 또는 로바스타틴과 같은 스타틴을 포함한 ML-236B의 유도체를 생성하는데 유용할 것이다. 상기 관점에서, 현재는 스트렙토미세스 카르보필루스로 수행되는 ML-236B의 프라바스타틴으로의 미생물학적 전환을 필요로 하지 않으면서 오직 하나의 발효 단계로 상기 변이체를 이용하여 직접 프라바스타틴을 생성하는 것이 가능할 수 있다.
바람직한 폴리뉴클레오티드는 서열 번호 37을 포함하거나, ML-236B의 생합성을 촉진할 수 있는 그의 돌연변이체 또는 변이체를 포함하는 서열을 포함한다. 상기 DNA 폴리뉴클레오티드는 형질전환된 에스케리키아 콜라이(Escherichia coli) pSAKexpE SANK 72499 (FERM BP-7005)로부터 수득가능하다.
다른 바람직한 폴리뉴클레오티드는 서열 번호 41을 포함하거나, ML-236B의 생합성을 촉진할 수 있는 그의 돌연변이체 또는 변이체를 포함하는 서열을 포함한다. 상기 DNA 폴리뉴클레오티드는 형질전환된 에스케리키아 콜라이 pSAKexpR SANK 72599 (FERM BP-7006)로부터 수득가능하다.
본 발명의 폴리뉴클레오티드를 하나 이상의 폴리뉴클레오티드와 작동성 조합물 형태로 사용할 수 있다. 바람직한 조합물은 ML-236B 생산 미생물에서 ML236B 의 생성을 증강시키는데 사용하기 적합하다.
상기 조합물의 예는 서열 번호 37 그 자체, 41, 43, 45, 47 또는 49로부터 선택된 하나 이상의 서열과 조합된 서열 번호 37의 폴리뉴클레오티드 또는 유사한 기능을 갖는 그의 변이체; 및 서열 번호 37, 41 그 자체, 43, 45, 47 또는 49 로부터 선택된 하나 이상의 서열과 조합된 서열 번호 41의 폴리뉴클레오티드 또는 유사한 기능을 갖는 그의 변이체를 포함한다.
어떤 관점에서는, 폴리뉴클레오티드는 바람직하게는 서열 번호 38, 42, 44, 46, 48 또는 50의 아미노산 서열을 포함하거나 상기로 구성되는 단백질을 코딩하는 폴리뉴클레오티드이고, 단독으로 또는 서열 번호 37, 서열 번호 41 또는 유사한 기능을 갖는 그의 변이체의 폴리뉴클레오티드와 함께 ML-236B의 생합성을 촉진시킬 수 있다.
본 발명은 또한 본 발명의 폴리뉴클레오티드와 엄격한(stringent) 조건하에 혼성화할 수 있는 폴리뉴클레오티드로 확장된다. 상기 폴리뉴클레오티드는 ML-236B 생산 미생물에 도입되었을 때 ML-236B 생산 미생물에서 ML-236B의 생합성을 촉진하기 적합한 폴리뉴클레오티드로 확장된다.
폴리뉴클레오티드는 전형적으로 DNA, cDNA 또는 게놈 DNA, 또는 RNA이고, 센스 또는 안티센스일 수 있다. 폴리뉴클레오티드는 전형적으로 다른 세포 성분이 없는 폴리뉴클레오티드와 같은 정제된 폴리뉴클레오티드이다.
본 발명은 하나 이상의 뉴클레오티드가 변한, 표시된 서열 번호 38, 42, 44, 46, 48 또는 50 의 아미노산 서열을 코딩하는 폴리뉴클레오티드 변형체로 확장된다. 상기 변화는 자연적으로 발생할 수 있고, 트리플렛(triplet) 유전자 코드의 중복 또는 축퇴 내에서 이루어질 수 있다. 따라서 상기의 축퇴적으로 변한 폴리뉴클레오티드는 동일한 아미노산 서열을 코딩한다. 상기 폴리뉴클레오티드 변이체 내에서, 단순히 cDNA 서열보다 엑손 및 인트론을 갖는 게놈 DNA 를 포함한다.
또한 본 발명은 하나 이상의 결실, 부가, 치환 또는 변경을 갖는 변형된 아 미노산 서열을 코딩하는, 표시된 서열 번호 38, 42, 44, 46, 48 또는 50 의 아미노산 서열을 코딩하는 폴리뉴클레오티드 변이체로 확장된다. 따라서, 본 발명은 표시된 서열에 의해 코딩되는 것과 동일하거나 더 짧거나 더 긴 길이의 아미노산 서열을 코딩하는 표시된 서열의 폴리뉴클레오티드 변형체로 확장된다. 바람직하게는 변형체 폴리펩티드는 ML-236B의 합성을 촉진하는 능력을 갖고 있고, 바람직하게는 변이체 서열을 제공하는 모체(parent) 서열과 실직절으로 유사하거나 더 나은 활성을 갖는다.
폴리뉴클레오티드 변이체는 모체 서열과의 동일도를 갖는다. 적합하게는 동일도는 적어도 60%, 적어도 80%, 적어도 90% 또는 적어도 95% 또는 100% 이다. 변이체의 동일도는 바람직하게는 상동성 조사를 수행하는 알고리듬을 사용하는 BLAST 프로그램과 같은 컴퓨터 소프트웨어로 평가한다.
어떤 측면에서는, 본 발명의 바람직한 폴리뉴클레오티드는 하기:
(a) 서열 목록의 서열 번호 37의 뉴클레오티드 제 1 번 내지 제 1662 번에 나타낸 뉴클레오티드 서열을 하나 이상 포함하고, ML-236B 생산 미생물에 도입되었을 때 상기 ML-236B 생산 미생물에서 ML-236B의 생합성을 촉진하는 것을 특징으로 하는 DNA;
(b) 엄격한 조건하에 (a)에 기술된 DNA 와 혼성화하고, ML-236B 생산 미생물에 도입되었을 때 상기 ML-236B 생산 미생물에서 ML-236B의 생합성을 촉진하는 것을 특징으로 하는 DNA;
(c) 서열 목록의 서열 번호 41 의 뉴클레오티드 제 1 번 내지 제 1380 번에 나타낸 뉴클레오티드 서열 하나 이상 포함하고, ML-236B 생산 미생물에 도입되었을 때 상기 ML-236B 생산 미생물에서 ML-236B의 생합성을 촉진하는 것을 특징으로 하는 DNA;
(d) 엄격한 조건하에 (c)에 기술된 DNA 와 혼성화하고, ML-236B 생산 미생물에 도입되었을 때 상기 ML-236B 생산 미생물에서 ML-236B 의 생합성을 촉진하는 것을 특징으로 하는 DNA
로 구성되는 군으로부터 선택되는 DNA이다.
본 발명의 폴리뉴클레오티드는 ML-236B를 생산하는 미생물에서 ML-236B 의 생합성을 촉진한다. ML-236B 생산 미생물의 예는 페니실륨(Penicillium) 종, 예를 들어 페니실륨 시트리눔, 페니실륨 브레비콤팍툼(Penicillium brevicompactum) [Brown, A.G., et al., J. Chem. Soc. Perkin-1., 1165 (1976)에 기술되어 있음], 페니실륨 시클로피움(Penicillim cyclopium)[Doss, S.L., et al., J. Natl. Prod., 49, 357 (1986)에 기술되어 있음] 등을 포함한다. 다른 예는 유페니실륨 (Eupenicillium) 종 M6603[Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609 (1986)에 기술되어 있음], 파에실로미세스 비리디스(Paecilomyces viridis) FERM P-6236[일본 특허 출원 공보 제 58-98092 호에 기술되어 있음], 파에실로미세스 종 M2016[Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609 (1986)에 기술되어 있음], 트리코데르마 롱기브라키아툼(Trichoderma longibrachiatum) M6735[Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609 (1986)에 기술되어 있음], 히포미세스 크리소스페르무스(Hypomyces chrysospermus) IFO 7798[Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609 (1986)에 기술되어 있음], 글리오클라디움 (Gliocladium) 종 YJ-9515[WO 제 9806867 호에 기술되어 있음], 트리코르데르마 비리데(Trichorderma viride) IFO 5836[일본 특허 공보 제 62-19159 호에 기술되어 있음], 유페니실륨 레티쿨리스포룸(Eupenicillium reticulisporum) IFO 9022[일본 특허 공보 제 62-19159 호에 기술되어 있음], 또는 임의의 다른 적합한 생물을 포함한다.
상기 ML-236B 생산 미생물 중, 페니실륨 시트리눔이 바람직하고, 페니실륨 시트리눔 균주 SANK 13380 이 더 바람직하다. 페니실륨 시트리눔 SANK 13380 균주는 미생물 수탁에 관한 부다페스트 조약에 따라 1992년 12월 22일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 제 FERM BP-4129 호로 수탁됐다. ML-236B 생산 미생물의 예는 또한 천연원으로부터 분리된 것 및 자연적으로 또는 인공적으로 돌연변이된 것을 포함한다.
본 발명은 또한 본 발명의 폴리뉴클레오티드를 포함하는 벡터, 예를 들어 에스케리키아 콜라이 pSAKexpE SANK 72499 (FERM BP-7005) 또는 에스케리키아 콜라이 pSAKexpR SANK 72599 (FERM BP-7006)으로부터 수득가능한 벡터를 제공한다. 본 발명의 상기 벡터는 발현 벡터를 포함한다.
ML-236B 생산 미생물을 포함하여, 본 발명의 벡터에 의해 형질전환된 숙주 세포가 또한 제공된다. 본 발명의 숙주 세포는 페니실륨 시트리눔 및 에스케리키아 콜라이, 예를 들어 에스케리키아 콜라이 pSAKexpE SANK 72499 (FERM BP-7005) 또는 에스케리키아 콜라이 pSAKexpR SANK 72599 (FERM BP-7006)를 포함한다.
또한, 본 발명은 본 발명의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드로 확장된다. 본 발명의 폴리펩티드의 예는 서열 번호 38 또는 42의 서열, 또는 서열 번호 38 또는 42에 대해 특정한 동일도를 갖고 ML236B 생산 생물에서 ML236B 생성을 촉진할 수 있는 그의 변이체를 포함한다. 다른 폴리펩티드는 본 발명의 다른 폴리뉴클레오티드 서열에 의해 코딩된 것, 및 동일도를 갖는 변이체이다.
적합하게는 서열 번호 38 또는 42에 대한 폴리펩티드 변이체의 동일도는 적어도 80%, 적어도 90% 또는 적어도 95% 또는 100% 이다. 변이체의 동일도는 바람직하게는 상동성 조사 수행용 알고리듬을 사용하는 BLAST 프로그램과 같은 컴퓨터 소프트웨어에 의해 평가된다.
본 발명의 폴리펩티드는 서열 번호 38 또는 42 또는 변이체의 더 짧거나 더 긴 서열을 포함한다. 더 짧은 폴리펩티드는 서열 번호 38, 42 또는 그의 변이체의 부분 아미노산 서열을 포함하고, 바람직하게는 ML236B의 생합성을 촉진하는 능력을 유지한다. 더 긴 폴리펩티드는 서열 번호 38, 42 또는 그의 변이체의 전체 또는 부분 아미노산 서열을 포함하고, 바람직하게는 ML236B의 생합성을 촉진하는 능력을 유지한다. 더 긴 폴리펩티드는 Fc-융합 단백질과 같은 융합 단백질을 포함한다.
본 발명의 폴리펩티드는 서열 번호 38, 서열 번호 42, 서열 번호 44, 서열 번호 46, 서열 번호 48, 또는 유사한 기능을 갖는 그의 변이체의 서열을 갖는 것을 포함한다. 본 발명의 폴리펩티드에 대한 항체도 또한 제공된다. 폴리클로날 항체 및 모노클로날 항체 모두가 본 발명에 의해 제공된다. 상기 항체는 ML-236B 생성을 조절하고, 프라바스타틴 및 로바스타틴을 포함한 스타틴과 같은 ML-236B의 유도체를 생산하는데 유용하다. 또한, 상기 항체는 바람직하게는 ML-236B 생합성 및 그의 조절 메카니즘의 분석에 사용될 수 있다. 상기 분석은 ML-236B 생성을 조절하하고, ML-236B의 유도체를 생성하는데 유용하다.
본 발명의 벡터를 갖는 본 발명의 숙주 세포는 상기 숙주 세포를 배양하고 이어서 배양물로부터 ML-236B를 회수하는 것을 포함하는 ML-236B 생산 방법에 사용될 수 있다. 어떤 방법에서는, 벡터가 mlcE 또는 mlcR을 포함하고, mlcA, mlcB, mlcC 또는 mlcD 와 같은 추가의 유전자는 포함하지 않는다.
본 발명의 방법에 의한 생산은, 서열 번호 44, 서열 번호 46, 서열 번호 48 또는 서열 번호 50 에 상응하는 재조합체 mlcA, mlcB, mlcC 및/또는 mlcD (폴리펩티드)의 부재하에 이루어질 수 있다.
본 발명은 이후 더 상세하게 기술될 것이다.
본 발명의 발명자들은 페니실륨 시트리눔에 ML-236B 의 생합성에 관여하는 유전자를 포함하는 게놈 DNA를 클로닝했다. 게놈 DNA는 이후 ML-236B 생합성에 관련된 게놈 DNA로 지칭되고, ML-236B 생산 미생물의 게놈 DNA 라이브러리로부터 클로닝됐다. 게놈 DNA를 분석하여 상기 게놈 DNA 상에서 구조 유전자를 발견하고 이어서 상기 구조 유전자에 상응하는 cDNA를 페니실륨 시트리눔의 mRNA를 포함하는 전체 RNA를 주형으로 사용하여 역전사-폴리머라제 사슬 반응(이후 "RT-PCR"로 지칭함)에 의해 수득했다. ML-236B 생산 미생물이 상기 cDNA를 포함하는 재조합된 DNA벡터에 의해 형질전환될 경우 ML-236B 생산 미생물에서의 ML-236B의 생합성이 촉진되었다는 것을 발견했다.
본 발명은 특히 ML-236B 생산 미생물에 도입되었을 때 상기 ML-236B 생산 미 생물에서 ML-236B의 생합성을 촉진하는 cDNA(이후 ML-236B 생합성 촉진 cDNA로 지칭함)에 관한 것이다.
본 발명의 ML-236B 생합성 촉진 폴리뉴클레오티드, 예를 들어 ML-236B 생합성 촉진 cDNA는 그 예로 하기:
(I) ML-236B 의 생합성에 관여하고 ML-236B 생산 미생물의 게놈 DNA 에 존재하는 구조 유전자의 전사 생성물(메신저 RNA, 이하 mRNA 로 지칭함)을 주형으로 사용하는 합성에 의해 수득가능한 DNA;
(II) DNA (I) 및 제 1 가닥으로서 DNA (I)을 사용하여 합성된 제 2 가닥 DNA 의 회합의 결과로 형성된 이중 가닥 DNA;
(III) 이중 가닥 DNA (II)를 복제 또는 증폭시킴으로써(예를 들어, 클로닝 등의 방법에 의함) 형성된 이중 가닥 DNA;
(IV) 엄격한 조건하에 상기 DNA 또는 mRNA 중 하나와 혼성화할 수 있는 DNA
를 포함한다.
DNA (IV)는 본원에서 임의의 구조 유전자 서열에 나타난 것, 예를 들어 서열 목록의 서열 번호 37 의 뉴클레오티드 번호 제 1 번 내지 제 1662 번 또는 서열 번호 41 의 뉴클레오티드 번호 제 1 번 내지 제 1380 번일 수 있고, 여기서 하나 이상의 뉴클레오티드는 임의로 치환, 결실 및/또는 부가되고, 상기는 ML-236B 생산 미생물에 도입되었을 때 ML-236B 생산 미생물에서 ML-236B의 생합성을 촉진시킬 수 있다.
2 개의 단일 가닥 핵산이 혼성화될 때, 상기는 서로 상보적이거나 매우 상보적인 영역에서 이중 가닥 분자를 형성하고, "엄격한 조건"은 적합하게는 혼성화 용액이 6 x SSC [1 x SSC는 150 mM NaCl, 시트르산 나트륨 15 mM의 조성을 갖음]인 경우를 가리키고, 혼성화 온도는 55℃ 이다.
ML-236B 생합성 촉진 cDNA는 예를 들어 ML-236B 생산 미생물의 cDNA 라이브러리로부터 cDNA를 포함하는 클론을 분리함으로써 수득될 수 있다. 대안으로, ML-236B 생합성에 관련된 게놈 DNA의 뉴클레오티드 서열을 기초로 고안된 프라이머 쌍을 ML-236B 생산 미생물의 mRNA 또는 전체 RNA와 함께 사용하는 RT-PCR을 사용할 수 있다.
ML-236B 생산 미생물은 ML-236B를 생성하는 능력을 유전적으로 갖는 미생물이다. 상기에 표시된 것처럼 ML-236B 생산 미생물의 예는 페니실륨 종, 예를 들어 페니실륨 시트리눔, 페니실륨 브레비콤팍툼, 페니실륨 시클로피움 등을 포함하고 다른 예는 유페니실륨 종 M6603, 파에실로미세스 비리디스 FERM P-6236, 파에실로미세스 종 M2016, 트리코데르마 롱기브라키아툼 M6735, 히포미세스 크리소스페르무스 IFO 7798, 글리오클라디움 종 YJ-9515, 트리코르데르마 비리데 IFO 5836, 유페니실륨 레티쿨리스포룸 IFO 9022, 및 임의의 다른 적합한 생물을 포함한다.
상기 ML-236B 생산 미생물 중, 페니실륨 시트리눔이 바람직하고, 페니실륨 시트리눔 균주 SANK 13380 이 더 바람직하다. 페니실륨 시트리눔 SANK 13380 균주는 미생물 수탁에 대한 부다페스트 조약에 따라 1992년 12월 22일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 제 FERM BP-4129 호로 수탁됐다. ML-236B 생산 미생물의 예는 또한 천연원으로부터 분리된 것 및 자연적으로 또는 인공적으로 돌연변이된 것을 포함한다.
ML-236B 생합성에 관련된 게놈 DNA는 적합한 프로브로 ML-236B 생산 미생물의 게놈 DNA 라이브러리를 스크리닝함으로써 수득될 수 있다. 적합하게는 프로브는 ML-236B 생합성에서 역활을 담당할 것으로 예상되는 DNA 서열을 기초로 고안되고, 적합하게는 사상균으로부터 기원한다.
게놈 DNA 라이브러리를 만드는 방법을 선택하는 것은 제한되지 않고, 임의의 적합한 방법이 사용될 수 있고, 바람직하게는 진핵 생물의 게놈 DNA 라이브러리를 작제하는 통상적인 방법이다. 그의 예는 마니아티스(Maniatis) 등의 방법을 포함한다[Maniatis, T., et al., Molecular cloning, a laboratory manual, 2nd ed., Cold Spring Harbor Laboratory, 미국 뉴욕주의 콜드 스프링 하버 소재 (1989)]. 다른 적합한 방법이 당 업계에 공지되어 있다.
개요로, ML-236B 생산 미생물로부터의 게놈 DNA를, 상기 ML-236B 생산 미생물의 배양물로부터 세포를 회수하고, 물리적으로 세포를 파쇄하고, 그의 핵에 존재하는 DNA 를 추출하고 상기 DNA를 정제함으로써 수득할 수 있다.
ML-236B 생산 미생물의 배양은 특정한 ML-236B 생산 미생물에 적합한 조건하에서 수행할 수 있다. 예를 들어, 바람직한 ML-236B 생산 미생물인 페니실륨 시트리눔의 배양을 MBG3-8 배지[조성: 7%(w/v) 글리세린, 3%(w/v) 글루코스, 1%(w/v) 콩 분말, 1%(w/v) 펩톤(Kyokuto Seiyaku Kogyo corporation제), 1%(w/v) 콘 스팁 리쿠에르(Corn steep liqueur, Honen corporation제), 0.5%(w/v) 질산나트륨, 0.1%(w/v) 마그네슘 술페이트 헵타히드레이트(pH 6.5)]에 세포를 접종하고, 22 내지 28℃에서 3 내지 7일 동안 진탕시키면서 인큐베이션함으로써 수행할 수 있다. 용융된 PGA 아가 배지[조성: 200 g/L 감자 추출물, 15%(w/v) 글리세린, 2%(w/v) 아가]를 시험관에 붓고, 아가를 비스듬히 고체화시킴으로써 세균 저장용 슬랜트를 제조할 수 있다. 이어서 페니실륨 시트리눔을 백금침을 사용하여 슬랜트에 접종시키고 22 내지 28℃에서 7 내지 15 일 동안 인큐베이션할 수 있다. 슬랜트를 0 내지 4℃ 로 저장함으로써 상기 방법으로 생장한 미생물 또는 세균이 슬랜트에 계속 유지될 수 있다.
액체 배지에서 배양된 ML-236B 생산 미생물의 세포는 원심분리에 의해 회수할 수 있고, 고체 배지에서 배양된 것은 고체 배지로부터 세포 스크레이퍼 (scraper) 등으로 긁어서 회수할 수 있다.
액체 질소 등으로 세포를 동결시킨 후 유봉 및 유발을 사용하여 세포를 갈아서 세포의 물리적인 파쇄를 수행할 수 있다. 소듐 도데실술페이트(이후 SDS 로 지칭함)와 같은 계면활성제 또는 적합한 다른 계면활성제를 사용하여 파쇄된 세포의 핵에 있는 DNA를 추출할 수 있다. 추출된 게놈 DNA를 페놀-클로로포름으로 적합하게 처리하여 단백질을 제거하고, 에탄올 침전을 수행함으로써 침전물로서 회수한다.
생성되는 게놈 DNA를 적합한 제한 효소로 절단함으로써 프래그먼트화한다. 제한 절단용으로 사용될 수 있는 제한 효소에 대한 한계는 없고, 통상 시판되는 제한 효소가 바람직하다. 그의 예는 Sau3AI를 포함한다. 적합한 다른 효소는 당 업계에 공지되어 있다. 이어서 절단된 DNA를 겔 전기영동하고, 적합한 크기를 갖는 게놈 DNA를 겔로부터 회수한다. DNA 프래그먼트의 크기는 특별히 제한되지 않지만, 바람직하게는 20 kb 이상이다.
마찬가지로 벡터에 의해 형질전환될 숙주 세포에서 복제에 필요한 DNA 서열을 벡터가 갖는한, 게놈 DNA 라이브러리의 작제에 사용되는 DNA 벡터의 선택에 대한 제한은 없다. 적합한 벡터의 예는 플라스미드 벡터, 파지 벡터, 코스미드 벡터, BAC 벡터 등을 포함하고, 코스미드 벡터가 바람직하다. DNA 벡터는 바람직하게는 발현 벡터이다. 더 바람직하게는, DNA 벡터가 벡터에 의해 형질전환된 숙주 세포 상에 선택적인 표현형을 부여하는 뉴클레오티드 서열 또는 DNA 를 포함한다.
DNA 벡터는 적합하게는 클로닝 및 발현 모두에 사용될 수 있는 벡터이다. 바람직하게는 벡터는 하나 이상의 미생물 숙주의 형질전환에 사용될 수 있는 셔틀 벡터이다. 셔틀 벡터는 적합하게는 숙주 세포에서 복제를 허용하는 DNA 서열, 및 바람직하게는 세균 및 균류와 같은 상이한 미생물군으로부터의 다수의 상이한 숙주 세포에서 복제를 허용하는 서열(들)을 갖는다. 또한, 셔틀 벡터는 바람직하게는 상이한 미생물군으로부터의 세포와 같은 상이한 숙주 세포의 범위에 대해 선택가능한 표현형을 제공할 수 있는 DNA 서열을 포함한다.
만약 미생물군 중 하나가 클로닝에 사용될 수 있고 다른 하나가 ML-236B 생산 능력을 갖는다면, 셔틀 벡터에 의해 형질전환되는 숙주 세포 및 미생물군의 조합을 선택하는 것을 특별히 제한 받지 않는다. 상기 조합은 예를 들어 세균 및 사상균의 조합, 효모 및 사상균의 조합일 수 있고, 세균 및 사상균의 조합이 바람직하다. 통상 생물공학에서 사용될 수 있는 것, 예를 들어 에스케리키아 콜라이, 바실루스 서브틸리스(Bacillus subtilis) 등이라면, 세균의 선택은 특별히 제한 받지 않는다. 에스케리키아 콜라이가 바람직하고, 에스케리키아 콜라이 XL1-Blue MR 이 더 바람직하다. 유사하게, 통상 생물공학에서 사용될 수 있는 것, 예를 들어 사카로미세스 세레비지애(Saccharomyces cerevisiae) 등이라면, 효모 종에 대한 제한은 없다. 사상균의 예는 상기의 ML-236B 생산 미생물을 포함한다. 미생물의 적합한 다른 예는 당 업계에 공지되어 있다.
본 발명에서, 미생물군은 세균, 사상균 및 효모로부터 선택될 수 있다.
상기에서 언급된 셔틀 벡터의 예는 표현형을 선택하기 위한 적합한 마커(marker) 유전자 및 코스(cos) 부위를 갖는 코스미드 벡터를 포함한다. 다른 적합한 벡터는 당 업계에 공지되어 있다. 바람직한 벡터는 코스미드 벡터 pWE15(STRATAGENE제)로부터의 코스 부위를 플라스미드 pSAK333에 삽입함으로써 작제된 pSAKcos1 이고, 상기는 에스케리키아 콜라이 하이그로마이신 B 포스포트랜스퍼라제 유전자의 서열을 포함한다[일본 특허 츨원 공보 제 3-262486 호에 기술되어 있음]. pSAKcos1을 작제하는 방법을 도 1 에 나타낸다. 본 발명은 상기 벡터에 의해 한정되지 않는다.
ML-236B 생산 미생물로부터의 게놈 DNA 프래그먼트를 포함하는 셔틀 벡터를 숙주 세포에 도입함으로써 게놈 DNA 라이브러리를 제조할 수 있다. 사용되는 숙주 세포는 바람직하게는 에스케리키아 콜라이, 더 바람직하게는 에스케리키아 콜라이 XL1-Blue MR이다. 숙주 세포가 에스케리키아 콜라이인 경우, 시험관내 패키징에 의해 도입이 수행될 수 있다. 본 발명에서, 형질전환은 또한 시험관내 패키징에 의한 외래 DNA의 도입을 포함하고, 형질전환된 세포는 또한 외래 DNA 가 시험관내 패키징에 의해 도입된 세포를 포함한다.
목적 클론을 동정하기 위해 항체 또는 핵산 프로브를 사용하여 게놈 라이브러리를 스크리닝할 수 있고, 핵산 프로브가 바람직하다. 바람직하게는 핵산 프로브는 폴리케티드 생합성에 관련된 유전자 또는 DNA의 뉴클레오티드 서열을 기초로 제조되고, 바람직하게는 사상균으로부터 유래되는 서열이다. 폴리케티드의 생합성에 관련되고 그의 뉴클레오티드 서열이 공지되어 있다면 특정 유전자의 선택은 제한 받지 않는다. 상기 유전자의 예는 아스페르길루스 플라부스 및 아스페르길루스 파라시티쿠스의 아플라톡신 PKS 유전자, 아스페르길루스 니둘란스의 스테리그마토시스틴 PKS 유전자 등을 포함한다.
예를 들어, 상기의 공지된 게놈 DNA 서열의 일부를 포함하는 올리고뉴클레오티드 프로브를 합성하거나, 올리고뉴클레오티드 프라이머를 제조하고 게놈 DNA를 주형으로 폴리머라제 사슬 반응[이후 "PCR"로 지칭함, Saiki, R.K., et al., Science, 239, 487 (1988)에 기술되어 있음]을 사용하여 표적 DNA를 증폭시키거나, mRNA를 주형으로 사용하여 RT-PCR에 의해 적합한 핵산 프로브를 수득할 수 있다. 상기 프로브를 수득하는 적합한 다른 방법은 당 업계에 잘 공지되어 있다.
ML-236B 생산 미생물로부터 예를 들어 PCR 또는 RT-PCR을 사용하여 핵산 프로브를 수득할 수 있다. PCR 또는 RT-PCR에 사용되는 프라이머(이하 "PCR용 프라이머"로 지칭함)의 고안은 바람직하게는 뉴클레오티드 서열이 공지된 폴리케티드 생합성에 관련된 유전자의 뉴클레오티드 서열을 기초로 수행된다. 바람직하게는 유전자는 아스페르길루스 플라부스, 아스페르길루스 파라시티쿠스의 아플라톡신 PKS 유전자, 또는 아스페르길루스 니둘란스의 스테리그마토시스틴 PKS 유전자이다.
PCR용 프라이머는 적합하게는 PKS 유전자 내에 많이 보존된 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하도록 고안된다. 주어진 아미노산 서열에 상응하는 뉴클레오티드 서열을 동정하는 방법은 숙주 세포의 코돈 사용(codon usage)을 기초로 한 추정, 및 다중 코돈을 사용하여 혼합된 올리고뉴클레오티드 서열(이하 '축퇴 올리고뉴클레오티드'로 지칭함)을 만드는 방법을 포함한다. 후자의 경우에, 올리고뉴클레오티드의 다중성은 그의 뉴클레오티드 서열에 하이포크산틴을 도입함으로써 감소될 수 있다.
PCR용 프라이머는 주형 사슬에 어닐링하도록 고안된 뉴클레오티드 서열을 포함할 수 있고, 프라이머는 부가 5'서열에 연결된다. 상기 부가 5'뉴클레오티드 서열의 선택은 프라이머가 PCR 또는 RT-PCR에 사용될 수 있는 것이라면 특별히 제한 받지 않는다. 상기 부가 5'서열은 예를 들어 PCR 생성물의 클로닝 작업에 편리한 뉴클레오티드 서열일 수 있다. 상기 뉴클레오티드 서열은 예를 들어 제한 효소 절단 부위 또는 제한 효소 절단 부위를 포함하는 뉴클레오티드 서열일 수 있다.
또한, PCR용 프라이머를 고안할 때, 구아닌(G)의 수 및 시토신(C) 염기의 수의 총 합이 총 염기수의 40 내지 60% 인 것이 바람직하다. 또한, 바람직하게는 주어진 프라이머에 대한 자가-어닐링이 거의 없거나 전혀 없고, 프라이머 쌍의 경우 바람직하게는 프라이머 사이의 어닐링이 거의 없거나 전혀 없다.
PCR용 프라이머를 구성하는 뉴클레오티드의 수는 PCR 용으로 사용될 수 있는 것이라면 특별히 제한 받지 않는다. 상기 수의 하한선은 통상 10 내지 14 개의 뉴 클레오티드이고, 상한선은 40 내지 60 개의 뉴클레오티드이다. 바람직하게는 프라이머는 14 내지 40 개의 길이의 올리고뉴클레오티드이다.
PCR용 프라이머는 바람직하게는 DNA이다. 프라이머의 뉴클레오티드는 데옥시 아데노신, 데옥시 시티딘, 데옥시 티미딘, 및 데옥시 구아노신, 및 추가로 데옥시 이노신일 수 있다. PCR용 프라이머의 5'-말단에 있는 뉴클레사이드의 5'-위치는 적합하게는 하나의 인산이 에스테르 연결에 의해 결합된 히드록시기 또는 히드록실기이다.
PCR용 프라이머의 합성은 핵산의 합성에 통상 사용되는 방법, 예를 들어 포스포아미디트(phosphoamidite) 방법에 의해 수행될 수 있다. 바람직하게는 자동화 DNA 합성기가 상기 방법에서 사용될 수 있다.
ML-236B 생산 미생물로부터의 게놈 DNA 및 mRNA를 PCR 또는 RT-PCR용 주형으로 각각 사용할 수 있다. 전체 RNA를 mRNA 대신에 RT-PCR용 주형으로 사용할 수 있다.
PCR 생성물 또는 RT-PCR 생성물을 적합한 DNA 벡터로의 삽입에 의해 클로닝할 수 있다. 클로닝 단계에 사용되는 DNA 벡터의 선택은 통상 제한 받지 않는다. PCR 또는 RT-PCR 생성물의 용이한 클로닝용 키트는 시판되고 있다. 그 예로, Original TA Cloning Kit(Invitrogen제: DNA 벡터로 pCR2.1 을 사용함)가 상기 클로닝에 적합하다.
클로닝된 PCR 생성물을 수득하기 위해, 목적 PCR 생성물을 포함하는 플라스미드를 함유하는 형질전환된 숙주 세포를 배양하고, 이어서 상기 세포로부터 플라 스미드를 추출하고 정제한다. 이이서 삽입된 DNA 프래그먼트를 생성된 플라스미드로부터 회수한다.
형질전환된 숙주 세포의 배양은 적합하게는 숙주 세포에 적절한 조건하에 수행한다. 바람직한 숙주 세포, 에스케리키아 콜라이를 LB 배지[1%(w/v) 트립톤, 0.5%(w/v) 효모 추출물, 0.5%(w/v) 염화나트륨]에서 18 시간 내지 2 일 동안 30 내지 37℃에서 진탕시키면서 배양할 수 있다.
형질전환된 숙주 세포의 배양물로부터의 플라스미드의 제조는 숙주 세포를 회수하고 게놈 DNA 또는 숙주의 단백질과 같은 다른 세포 성분이 없는 플라스미드를 분리함으로써 수행할 수 있다. 에스케리키아 콜라이의 배양물로부터의 플라스미드 DNA의 제조는 마니아티스의 알칼라인법에 따라 수행할 수 있다[Maniatis, T., et al., Molecular cloning, a laboratory manual, 2nd ed., Cold Spring Harbor Laboratory, 미국 뉴욕주의 콜드 스프링 하버 소재 (1989)에 기술되어 있음]. 더 높은 순도를 갖는 플라스미드를 수득하기 위한 키트가 시판된다. 플라스미드 미니 키트(Plasmid Mini Kit)[QIAGEN AG제]가 바람직하다. 또한, 플라스미드의 대량 생산용 키트가 시판되고 있다. 플라스미드 막시 키트(Plasmid Maxi Kit, QIAGEN AG 제)가 바람직하다.
상기 DNA 시료의 알맞은 희석 후에 260 nm 의 파장에서 흡광도를 측정하고 흡광도 OD260 1 의 용액은 DNA 50 ㎍/ml 를 포함한다는 것을 기초로 계산함으로써 생성되는 플라스미드 DNA의 농도를 결정할 수 있다(Maniatis, T., et al., supra 에 기술되어 있음).
DNA의 순도는 280 및 260 nm 의 파장에서 흡광도의 비로부터 계산될 수 있다 (Maniatis, T., et al., supra 에 기술되어 있음).
핵산 프로브의 표지 방법은 통상 방사능 표지 및 비방사능 표지로 분류될 수 있다. 방사능 표지용 방사성뉴클레오티드의 선택은 통상 제한 받지 않고 예를 들어 32P, 35S, 14C 등일 수 있다. 표지에 32P 를 사용하는 것이 바람직하다. 비빙사능 표지용 제제의 선택은 핵산의 표지에 일반적으로 사용될 수 있는 것이라면 통상 제한 받지 않고, 예를 들어 디곡스게닌, 비오틴 등일 수 있고, 디곡스게닌이 바람직하다.
또한, 핵산 프로브의 표지 방법은 통상 제한 받지 않는다. 일반적으로 사용되는 방법, 예를 들어 표지된 뉴클레오티드 기질을 사용하여 PCR 또는 RT-PCR 에 의한 생성물에 표지를 섞는 방법, 틈(nick) 번역, 랜덤 프라이머의 사용, 종결 표지화, 및 올리고뉴클레오티드 DNA를 합성하는 방법이 바람직하다. 핵산 프로브의 종류에 따라 상기 방법으로부터 적합한 방법을 선택할 수 있다.
특정 핵산 프로브의 뉴클레오티드 서열과 동일한 뉴클레오티드 서열의 ML-236B 생산 미생물의 게놈에서의 존재를 상기 ML-236B 생산 미생물의 게놈 DNA 와의 서던 블롯(Southern blot) 혼성화로 확인할 수 있다.
서던 블롯 혼성화는 마니아티스의 방법에 따라 수행할 수 있다[Maniatis, T., et al., supra 에 기술되어 있음].
상기와 같이 제조된 표지된 핵산 프로브는 게놈 DNA 라이브러리를 스크리닝하는데 사용할 수 있다. 스크리닝 방법의 선택은 일반적으로 유전자 클로닝에 적절하다면 특별히 제한 받지 않지만, 콜로니 혼성화 방법이 바람직하다[Maniatis, T., et al., supra 에 기술되어 있음].
콜로니 혼성화에 사용되는 콜로니의 배양을 적합하게는 숙주 세포에 적절한 조건하에서 수행한다. 바람직한 숙주인 에스케리키아 콜라이의 배양을 LB 아가 배지 [1%(w/v) 트립톤, 0.5%(w/v) 효모 추출물, 0.5%(w/v) 염화나트륨, 1.5%(w/v) 아가로스]에서 18 시간 내지 2 일 동안 30 내지 37℃에서 인큐베이션에 의해 수행할 수 있다.
콜로니 혼성화에 의해 수득된 양성 클론으로부터의 재조합 DNA 벡터의 제조는 통상 양성 클론의 배양물로부터 플라스미드를 추출하고 정제함으로써 수행될 수 있다.
본 발명에 따라 수득되는 양성 클론을 나타내는 형질전환된 에스케리키아 콜라이 균주, 에스케리키아 콜라이 pML48 SANK71199 는 미생물 수탁에 관한 부다페스트 조약에 따라 1999년 7월 7일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁되었고 수탁 번호 FERM BP-6780를 부여 받았다.
에스케리키아 콜라이 pML48 SANK71199가 보유하는 전형적인 DNA 벡터는 pML48 로 명명됐다.
양성 클론에 존재하는 재조합 DNA 벡터가 ML-236B 생합성에 관련된 게놈 DNA 를 포함한다는 것은 재조합 DNA 벡터 인서트의 뉴클레오티드 서열의 결정, 서던 블롯 혼성화 또는 기능을 결정하는 인서트의 발현에 의해 적합하게 확인할 수 있다.
막삼(Maxam) 및 길버트(Gilbert)의 화학적 변형 기술[Maxam, A.M.M. and Gilbert, W., Methods in Enzymology, 65, 499 (1980)에 기술되어 있음] 또는 디데옥시 사슬 종결 방법[Messing, J. and Vieira, J., Gene, 19, 269 (1982)에 기술되어 있음]에 따라 DNA의 뉴클레오티드 서열을 결정할 수 있다. 적합한 다른 방법이 당 업계에 잘 공지되어 있다. 뉴클레오티드 서열의 결정에 사용되는 플라스미드 DNA는 바람직하게는 상기에 기술된 것처럼 높은 순도의 시료이다.
pML48 인서트의 뉴클레오티드 서열이 서열 목록의 서열 번호 1 에 나타나 있다. 서열 목록의 서열 번호 2 에 나타낸 뉴클레오티드 서열은 서열 번호 1 에 나타낸 뉴클레오티드 서열에 완전히 상보적이다. 통상, 게놈 DNA 의 뉴클레오티드 서열은 종 내에서 유전적 다형성, 즉 동종간 차이를 갖는다. 또한, DNA 클로닝 및 서열화의 과정에서, 뉴클레오티드 치환, 또는 다른 변경이 특정 빈도로 발생한다고 공지되어 있다. 따라서, 본 발명의 ML-236B 생합성에 관련된 게놈 DNA 는 또한 서열 목록의 서열 번호 1 또는 2의 뉴클레오티드 제 1 번 내지 제 34203 번의 DNA 에 혼성화될 수 있는 게놈 및 다른 DNA를 포함한다. 엄격한 조건하에 서열 목록의 서열 번호 1 또는 2의 뉴클레오티드 제 1 번 내지 제 34203 번의 DNA 에 혼성화될 수 있는 게놈 또는 다른 DNA가 바람직하다. 상기 DNA 는 서열 목록의 서열 번호 1 또는 2의 뉴클레오티드 제 1 번 내지 제 34203 번의 DNA를 포함하고, 여기서 하나 이상의 뉴클레오티드가 치환, 결실 및/또는 부가된다. 또한, 상기의 혼성 게놈 또는 다른 DNA는 페니실륨 시트리눔 SANK13380 외의 ML-236B 생산 미생물로부터 나오는 DNA를 포함할 수 있고, 바람직하게는 ML-236B 생산 미생물에 도입되었을 때 ML-236B 의 생성을 향상시킬 수 있는 것이다.
ML-236B 생합성에 관련된 게놈 DNA 는 적절하게는 하기 방법 1) 내지 3) 에 따라 분석된다.
1) 유전자 분석 소프트웨어로의 분석
게놈 DNA 내의 유전자는 유전자를 찾는 프로그램(이하 "GRAIL"로 지칭함) 및 상동성 서열 조사 프로그램(BLASTN 및 BLASTX)를 사용하여 위치화될 수 있다.
GRAIL 는 게놈 서열을 7 개의 파라미터로 나누어 유전자 서열의 출현을 평가하고, 뉴럴 넷(neural net) 방법을 사용하여 결과를 통합함으로써 게놈 DNA 의 구조 유전자를 조사하는 프로그램이다[Uberbracher, E.C. & Mural, R.J., Proc. Natl. Acad. Sci. USA., 88, 11261 (1991)에 기술되어 있음]. 그 예로, ApoCom GRAIL Toolkit[Apocom corporation제]을 사용할 수 있다.
BLAST 는 뉴클레오티드 서열 및 아미노산 서열의 상동성 조사를 수행하는 알고리듬을 사용하는 프로그램이다〔Altschul, S.F., Madden, T. L., et al., Nucl. Acids Res., 25, 3389 (1997)에 기술되어 있음〕
시료 게놈 DNA 서열 상의 구조 유전자의 위치 및 방향은 DNA 서열을 적합한 길이로 나누고 BLASTN을 사용하여 유전자 데이타 베이스의 상동성 조사를 수행함으로써 예측될 수 있다. 시험되는 DNA 서열 상의 구조 유전자의 위치 및 방향은 또한 나누어진 게놈 DMA 서열을 6 개의 번역 프레임(센스 가닥 상의 3 개 및 안티센스 가닥 상의 다른 3 개)으로 번역하고 BLASTX를 사용하여 유도된 아미노산 서열의 상동성 조사를 펩티드 데이터 베이스에서 수행함으로써 예측될 수 있다.
게놈 DNA의 구조 유전자에 대한 코딩 영역은 때때로 진핵 생물에서 인트론으로 분할된다. 상기 갭을 갖는 구조 유전자의 분석을 위해 갭을 포함하는 서열을 분석하는 BLAST 프로그램이 더 효과적이고, Gapped-BLAST 프로그램(BLAST2: WISCONSIN GCG 패키지 버전 10.0 에 설치되어 있음)이 바람직하다.
2) 노던(Northern) 블롯 혼성화 방법에 따른 분석
단락 1)에 기술된 분석법에 의해 예측된 구조 유전자의 발현을 노던 블롯 혼성화법을 사용하여 연구할 수 있다.
적합하게는 ML-236B 생산 미생물로부터의 전체 RNA는 미생물의 배양으로부터 수득된다. 바람직한 ML-236B 생산 미생물 페니실륨 시트리눔의 배양물은 상기 미생물을 슬랜트로부터 MGB3-8 배지에 접종하고 이어서 진탕시키면서 22 내지 28℃에서 1 일 내지 4 일 동안 인큐베이션함으로써 수득될 수 잇다.
ML-236B 생산 미생물로부터 RNA를 추출하는 방법의 선택은 제한 받지 않고, 구아니딘 티오시아네이트-고온 페놀 방법, 구아니딘 티오시아네이트-구아니딘 염산 방법 등이 바람직하다. 더 높은 순도의 전체 RNA 제조용으로 시판되는 키트의 예는 RNeasy Plant Mini Kit(Qiagen AG제)을 포함한다. 또한, mRNA는 전체 RNA를 올리고(dT)칼럼에 적용하고, 칼럼에 흡수된 분획을 회수함으로써 수득할 수 있다.
RNA의 막으로의 전달, 프로브의 제조, 혼성화 및 신호의 검출은 상기에 언급된 서던 블롯 혼성화 방법과 유사한 방법으로 수행할 수 있다.
3) 전사체의 5'-말단 및 3'-말단의 분석
각각의 전사체의 5'-말단 및 3'-말단의 분석은 'RACE'(Rapid Amplification of cDNA Ends, cDNA 말단의 빠른 증폭) 방법에 따라 수행할 수 있다. RACE 는 mRNA를 주형으로 RT-PCR을 사용하여 유전자의 5'-말단 또는 3'-말단에 있는 공지된 뉴클레오티드 및 공지되지 않은 영역을 포함하는 cDNA를 수득하는 방법이다[Frohman, M. A., Methods Enzymol. 218, 340 (1998)에 기술되어 있음].
5'-RACE 는 하기 방법에 따라 수행할 수 있다. cDNA 의 제 1 가닥을 mRNA 를 주형으로 사용하는 역전사효소 반응에 따라 합성한다. 프라이머로, 뉴클레오티드 서열의 공지된 부분으로 고안된 안티센스 올리고뉴클레오티드(1)을 사용한다. 동종중합체성 뉴클레오티드 사슬(한 가지 종류의 염기로 구성됨)을 말단 데옥시뉴클레오티딜 트랜스퍼라제를 사용하여 cDNA의 제 1 가닥의 3'-말단에 첨가한다. 이어서, cDNA 의 제 1 가닥을 주형으로 사용하여 PCR 로 5'-말단 영역의 이중 가닥 cDNA를 증폭한다. 증폭을 위해, 2 개의 프라이머를 사용한다; 동종중합체성 서열에 상보적인 서열을 포함하는 센스 가닥으로부터의 DNA 올리고뉴클레오티드 및 안티센스 가닥 및 올리고뉴클레오티드 DNA (1)의 3'-말단 쪽 상의 올리고뉴클레오티드 (2)[Frohman, M.A., Methods in Enzymol., 218, 340 (1993)에 기술되어 있음]. 5' RACE 용 키트는 시판되고 있고, 5' RACE System for Rapid Amplication of cDNA ends, 버전 2.0(GIBCO제)이 적합하다.
3' RACE 는 mRNA 의 3'-말단에 존재하는 폴리A 영역을 사용하는 방법이다. 구체적으로, cDNA 의 제 1 가닥을, mRNA를 주형으로 하고 올리고 d(T) 아답터를 프 라이머로 사용하는 역전사효소 반응으로 합성한다. 이어서, 3'-말단 영역의 이중 가닥 cDNA를 cDNA의 제 1 가닥을 주형으로 사용하여 PCR로 증폭한다. 프라이머로, 센스 가닥의 뉴클레오티드 서열의 공지된 부분으로 고안된 센스 가닥 상의 DNA 올리고뉴클레오티드 (3), 및 안티센스 가닥 상의 올리고 d(T) 아답터를 사용한다. 3' RACE 용 키트는 시판되고 있고, Ready-To-Go T-primed First-Strand Kit (Phramacia corporation제)가 적합하다.
상기 분석 1) 및 2) 의 결과는 바람직하게는 RACE 방법에서 원하는 뉴클레오티드 서열의 공지된 부분을 기초로 프라이머를 고안할 때 사용된다.
상기 1) 내지 3)에 기술된 분석법을 사용하여, 게놈 DNA 서열 상의 구조 유전자의 방향, 구조 유전자의 전사 개시 부위의 위치, 번역 개시 코돈의 위치, 및 번역 종결 코돈 및 그의 위치를 추정할 수 있다. 상기 정보를 기초로, 각각의 구조 유전자, 및 그의 cDNA, 즉 ML-236B 생합성 촉진 cDNA를 수득할 수 있다.
6 개의 구조 유전자가 본 발명에 따라 수득된 재조합 DNA 벡터 pML48 에 삽입된 서열상에 존재하는 것으로 여겨진다. 상기를 각각 mlcA, mlcB, mlcC, mlcD, mlcE, 및 mlcR로 명명한다. 상기 중, mlcA, mlcB, mlcE 및 mlcR이 서열 목록의 서열 번호 2에 나타낸 뉴클레오티드 서열 상에 코딩 영역을 갖는 것으로 여겨진다. mlcC 및 mlcD 는 서열 목록의 서열 번호 1 에 나타낸 뉴클레오티드 서열 상에 코딩 영역을 갖는 것으로 여겨진다.
상기에 언급된 구조 유전자에 상응하는 특정 ML-236B 생합성 촉진 cDNA을 수득하는 방법의 예는 각각의 구조 유전자 및 그의 양쪽에 있는 DNA의 서열로 고안된 프라이머를 사용한 RT-PCR 로의 클로닝, 및 공지된 뉴클레오티드 서열로 고안된 적절한 DNA 프로브를 사용한 cDNA 라이브러리로부터의 클로닝을 포함한다. 다른 적합한 방법은 당 업계에 잘 공지되어 있다. 상기 방법에 따라 수득되는 cDNA를 기능적으로 발현시키기 위해, 완전한 길이의 cDNA를 수득하는 것이 바람직하다.
RT-PCR를 사용하여 ML-236B 생합성 촉진 cDNA를 수득하는 방법을 하기에 설명한다.
RT-PCR용 및 ML-236B 생합성 촉진 cDNA를 수득하기 위한 프라이머 쌍을 각각의 주형 사슬과 선택적으로 어닐링하여 cDNA를 수득하게 하도록 고안할 필요가 있다. 그러나, 만약 RT-PCR용 프라이머가 상기 조건을 만족한다면 각각의 주형 사슬의 일부에 완전히 상보적인 것이 필수적이지는 않다. 안티센스 사슬과 어닐링할 수 있는 적합한 RT-PCR용 프라이머(이하 "센스 프라이머"로 지칭함)는 안티센스 사슬의 일부에 완전히 상보적인 센스 프라이머(이하 "비치환 센스 프라이머"로 지칭함) 또는 안티센스 사슬의 일부에 완전히 상보적이지 않은 센스 프라이머(이하 "부분적으로 치환된 센스 프라이머"로 지칭함)이다. 센스 사슬과 어닐링 할 수 있는 다른 적합한 RT-PCR용 프라이머(이하 "안티센스 프라이머"로 지칭함)는 센스 사슬의 일부에 완전히 상보적인 안티센스 프라이머(이하 "비치환 안티센스 프라이머"로 지칭함) 또는 센스 사슬의 일부에 완전히 상보적이지 않은 안티센스 프라이머(이하 "부분적으로 치환된 안티센스 프라이머"로 지칭함)이다.
상기를 사용하여 수득한 RT-PCR 생성물이 원래의 번역 개시 위치에 코돈 ATG를 포함하도록 센스 프라이머를 적합하게 고안한다. 적합하게는 RT-PCR 생성물은 또한 원래의 ATG 시작 부위를 갖는 판독 프레임 내에 올바른 번역 종결 코돈만을 포함하고, 추가(의사(擬似)) 번역 정지 부위는 포함하지 않는다. 본 발명에서 예측된 상기 구조 유전자의 번역 개시 코돈의 위치는 서열 목록의 서열 번호 1 및 서열 번호 2에 위치한 유전자에 대해 표 5에 나타낸다.
비치환 센스 프라이머의 5'-말단은 적합하게는 번역 개시 코돈 ATG 의 뉴클레오티드 'A', 또는 그의 5'-말단 쪽에 존재하는 염기이다.
부분적으로 치환된 센스 프라이머는 서열 목록의 서열 번호 1 또는 서열 번호 2의 특정 영역과 선택적으로 어닐링하고, 서열 목록의 서열 번호 2의 뉴클레오티드 서열은 서열 목록의 서열 번호 1에 완전히 상보적이다.
부분적으로 치환된 센스 프라이머가 번역 개시 코돈 ATG 의 3'-측에 존재하는 뉴클레오티드 서열을 포함할 경우, 이는 적합하게는 상기 ATG와 동일한 판독 프레임에 있는 종결 코돈(TAA, TAG 또는 TGA)인 뉴클레오티드 서열을 상기 영역내에 포함하지 않는다.
부분적으로 치환된 센스 프라이머는 뉴클레오티드 "A", 뉴클레오티드 "A"에 상응하는 뉴클레오티드 서열 "AT" 또는 "ATG"(이하 "뉴클레오티드 또는 뉴클레오티드 서열 m'"로 지칭함), 번역 개시 코돈의 뉴클레오티드 서열 "AT" 또는 "ATG"(이하 "뉴클레오티드 또는 뉴클레오티드 서열 m"로 지칭함)을 포함할 수 있다. 뉴클레오티드 m' 가 서열 "m" 의 "A" 에 상응하는 "A" 인 경우, 본 발명자들은 m'"A" 가 부분적으로 치환된 센스 프라이머의 3'-말단에 위치하는 것을 선호한다. 유사하게 m' 가 "AT" 인 경우, 본 발명자들은 m'"AT" 서열이 부분적으로 치환된 센스 프라이머의 3'-말단에 위치하는 것을 선호한다. 뉴클레오티드 또는 뉴클레오티드 서열 m 이 m'"ATG" 에 상응하는 "ATG" 인 경우, 본 발명자들은 프라이머의 ATG 에 대해 3' 인 상기 트리뉴클레오티드가 정지 코돈이 아닌 것을 선호한다. 즉, 5'-말단 뉴클레오티드가 3'-말단의 방향으로 m'"ATG"의 A 로부터 세어서 (3 x n + 1)번째 뉴클레오티드(n 은 1 이상의 정수를 나타냄)인 트리뉴클레오티드에 대해, 트리뉴클레오티드의 뉴클레오티드 서열은 바람직하게는 TAA, TAG, TGA 가 모두 아니다. RT-PCR 주형으로 사용되는 mRNA 의 번역 개시 코돈에 상응하는 위치에 메티오닌 코돈을 갖는 cDNA를 수득하기 위해 상기 프라이머를 사용할 수 있다.
부분적으로 치환된 센스 프라이머의 3'-말단이 뉴클레오티드 위치(3 x n + 1)인 경우, 바람직하게는 상기 위치에서 시작되는 트리뉴클레오티드는, 프라이머의 하나로 부분적으로 치환된 센스 프라이머를 사용하고, ML-236B 생산 미생물의 RNA 또는 mRNA를 주형으로 사용하여 수득되는 RT-PCR 생성물, 또는 게놈 DNA 또는 cDNA를 주형으로 사용하여 수득되는 PCR 생성물에서 TAA, TAG 또는 TGA 가 아니다. 뉴클레오티드 위치는 3'-말단의 방향으로 번역 개시 코돈 "ATG"의 'A'로부터 세고, 'n'은 1 이상의 정수를 나타낸다.
부분적으로 치환된 센스 프라이머의 3'-말단이 뉴클레오티드 위치(3 x n + 2)인 경우, 위치 3 x n + 2 가 중심 뉴클레오티드인 트리플렛은 바람직하게는 상기처럼 수득된 PCR 또는 RT-PCR 생성물에 있어서 서열 TAA, TAG 또는 TGA 중 어느 것도 아니다.
부분적으로 치환된 센스 프라이머의 3'-말단이 뉴클레오티드 위치(3 x n + 3)인 경우, 위치(3 x n + 3)이 3' 뉴클레오티드인 트리플렛은 바람직하게는 서열 TAA, TAG 또는 TGA 중 어느 것도 아니다.
센스 프라이머에 대한 요구조건은 상기에서 논의된 것과 동일하다.
센스 프라이머와 함께 쌍을 이룰 때, 상응하는 펩티드의 N-말단에서 C-말단으로의 방향과 동일한 방향으로 RT-PCR를 사용하여 각각의 구조 유전자(mlcA, mlcB, mlcC, mlcD, mlcE, 및 mlcR)를 코딩하는 cDNA를 증폭시킬 수 있도록 안티센스 프라이머를 고안한다.
비치환 안티센스 프라이머가 cDNA 의 번역 종결 부위의 영역에 위치한 뉴클레오티드 서열에 상보적인 뉴클레오티드 서열을 갖는 안티센스 프라이머라면 비치환 안티센스 프라이머의 선택은 제한 받지 않는다. 그러나, 번역 종결 코돈의 3'-말단에 있는 염기에 상보적인 5'-말단 염기를 갖는 프라이머, 또는 상기 프라이머 염기의 5'-말단 쪽의 염기를 갖는 프라이머가 바람직하다. 번역 종결 코돈에 상보적인 3 개의 염기를 포함하는 프라이머가 더 바람직하다. 표 8 내지 10 은 각각의 구조 유전자의 번역 종결 코돈, 번역 종결 코돈에 상보적인 서열, 각각의 구조 유전자에 의해 코딩되는 펩티드의 C-말단의 아미노산 잔기, 아미노산 잔기를 코딩하는 뉴클레오티드 서열, 및 서열 번호 1 또는 서열 번호 2 에서의 그의 위치를 나타낸다.
부분적으로 치환된 안티센스 프라이머는 서열 목록의 서열 번호 1 또는 서열 번호 2의 뉴클레오티드 서열의 특정 영역과 선택적으로 어닐링한다.
상기는 안티센스 프라이머에 대한 요구조건이다.
상기 언급된 요구 조건이 충족된다면 부분적으로 치환된 센스 프라이머 및 부분적으로 치환된 안티센스 프라이머의 5'-말단에 적합한 뉴클레오티드 서열을 부가하는 것이 가능하다. 프라이머가 PCR 에 사용될 수 있는 것이라면 상기 뉴클레오티드 서열의 선택은 특별히 제한 받지 않는다. 적합한 서열의 예는 PCR 생성물의 클로닝에 편리한 뉴클레오티드 서열, 예를 들어 제한 효소 절단 부위 및 적합한 제한 효소 절단 부위를 포함하는 뉴클레오티드 서열을 포함한다.
또한, 센스 프라이머 및 안티센스 프라이머를 상기 설명 및 PCR용 프라이머의 통상적인 고안에 따라 적합하게 고안한다.
상기와 같이, ML-236B 생산 미생물로부터의 mRNA 또는 전체 RNA를 RT-PCR 용 주형으로 사용할 수 있다. 본 발명에서, pML48 인서트 서열 내의 구조 유전자 mlcE 의 코딩 영역 모두를 증폭시키는데 적합한 프라이머 쌍[서열 목록의 서열 번호 35 및 36 의 뉴클레오티드 서열로 각각 나타낸 프라이머]을 고안하고 합성하고 이어서 SANK13380 의 전체 RNA를 주형으로 사용하여 RT-PCR를 수행함으로써 구조 유전자 mlcE 에 상응하는 ML-236B 생합성 촉진 cDNA를 수득했다.
서열 목록의 서열 번호 39 및 40 의 뉴클레오티드 서열로 각각 나타낸 프라이머를 사용하여 유사한 방식으로 구조 유전자 mlcR 에 상응하는 ML-236B 생합성 촉진 cDNA를 수득했다.
상기에 기술된 것처럼, 적합한 DNA 벡터에 삽입함으로써 RT-PCR 생성물을 클로닝할 수 있다. 상기 클로닝에 사용되는 DNA 벡터의 선택은 제한 받지 않고, 적합하게는 DNA 프래그먼트의 클로닝에 통상 사용되는 DNA 벡터이다. RT-PCR 생성물의 클로닝을 용이하게 수행하기 위한 키트는 시판되고 있고, Original TA Cloning Kit[Invitrogen제: pCR2.1을 DNA 벡터로 사용함]이 바람직하다.
상기 방법을 사용하여 ML-236B 생산 미생물에서 수득된 ML-236B 생합성 촉진 cDNA의 기능적 발현은 ML-236B 생산 미생물에서의 기능적 발현에 적합한 DNA 벡터에 cDNA를 클로닝함으로써 확인할 수 있다. 이어서 적합한 세포를 재조합 DNA 벡터로 형질전환하고, 형질전환된 세포 및 형질전환되지 않은 숙주 세포의 ML-236B 생합성 능력을 비교한다. 만약 ML-236B 생합성 촉진 cDNA 가 형질전환된 세포에서 기능적으로 발현된다면, 숙주 세포의 ML-236B 생합성 능력에 비해 형질전환된 세포의 ML-236B 생합성 능력이 향상된다.
ML-236B 생산 미생물에서 발현에 적합한 DNA 벡터[이하 기능적인 발현 벡터로 지칭함]의 선택은 상기가 ML-236B 생산 미생물을 형질전환시키는데 사용될 수 있고 상기 생물 내에서 ML-236B 생합성 촉진 cDNA 에 의해 코딩되는 폴리펩티드를 기능적으로 발현시킬 수 있는 것이라면 제한 받지 않는다. 바람직하게는 벡터는 숙주 세포에서 안정적이고, 숙주 세포에서 복제를 허용하는 뉴클레오티드 서열을 갖는다.
기능적 발현을 위한 벡터는 하나 이상의 ML-236B 생합성 촉진 cDNA, 예를 들어 구조 유전자 mlcE 및/또는 mlcR 에 상응하는 cDNA를 포함할 수 있다.
기능적인 발현을 위한 벡터는 ML-236B 생산 미생물에 도입되었을 때 ML-236B 의 생합성을 촉진하는 구조 유전자 mlcE 및/또는 mlcR 에 상응하는 cDNA 이외에 한 가지 이상의 DNA를 포함할 수 있다. 상기 DNA의 예는 구조 유전자 mlcA, mlcB, mlcC, 또는 mlcD 에 상응하는 cDNA, ML-236B 생합성에 관련된 게놈 DNA, 본 발명의 ML-236B 생합성 촉진 cDNA 의 발현 조절 인자를 코딩하는 DNA 등을 포함한다.
기능적인 발현을 위한 벡터는 바람직하게는 숙주 세포 내의 플라스미드에 대해 선택적 표현형을 제공하는 뉴클레오티드 서열을 포함하고, 바람직하게는 셔틀 벡터이다.
또한, 선택적 표현형은 약물 내성 표현형 등일 수 있고, 바람직하게는 항생물질 내성이고, 더 바람직하게는 암피실린에 대한 내성 또는 하이그로마이신 B 에 대한 내성이다.
발현 벡터가 셔틀 벡터인 경우, 벡터는 적합하게는 벡터가 미생물 군 중 하나의 숙주 세포에서 복제하게 하는 뉴클레오티드 서열, 및 다른 숙주 세포 유형에서 벡터 인서트에 의해 코딩된 폴리펩티드의 발현에 필요한 뉴클레오티드 서열을 포함한다. 벡터가, 형질전환된 상이한 미생물군의 각각의 숙주 세포에 대한 상이한 선택적 표현형을 제공하는 것이 바람직하다. 미생물군의 조합에 대한 요구 조건은 본 명세서에 기술된 ML-236B 생합성에 관련된 게놈 DNA의 클로닝 및 발현에 사용되는 셔틀 벡터에 대한 요구조건과 유사하다.
본 발명에서, 적합한 셔틀 벡터 DNA 벡터는 DNA 벡터 pSAK333 에 존재하는 아스페르길루스 니둘란스로부터 나온 3-포스포글리세레이트 키나제(이하 "pgk"로 지칭함) 프로모터(일본 특허 출원 공보 제 3-262486 호에 기술되어 있음), 외래 유전자 삽입용 아답터, 및 DNA 에 존재하는 pgk 터미네이터를 상기 순서로 조합하여 작제된 pSAK700 이다(도 4를 보라).
상기 구조 유전자 mlcE 에 상응하는 cDNA를 상기 발현 벡터에 삽입함으로써 ML-236B 생산 미생물에서 폴리펩티드가 발현될 수 있다. 본 발명에서, 재조합 cDNA 발현 벡터 pSAKexpE를 pSAK700의 아답터 부위에 구조 유전자 mlcE에 상응하는 cDNA를 삽입함으로써 수득했다. pSAKexpE에 삽입된 서열, 즉 구조 유전자 mlcE 에 상응하는 cDNA의 뉴클레오티드 서열을 서열 목록의 서열 번호 37에 나타낸다. 유사하게 재조합 cDNA 발현 벡터 pSAKexpR을 pSAK700의 아답터 부위에 구조 유전자 mlcR에 상응하는 cDNA를 삽입함으로써 수득했다. pSAKexpR에 삽입된 서열, 즉 구조 유전자 mlcR에 상응하는 cDNA의 뉴클레오티드 서열을 서열 목록의 서열 번호 41 에 나타낸다.
pSAKexpE에 의해 형질전환된 에스케리키아 콜라이 균주인 에스케리키아 콜라이 pSAKexpE SANK 72499는 미생물 수탁에 관한 부다페스트 조약에 따라, 2000년 1월 25일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 FERM BP-7005로 수탁됐다. pSAKexpR 에 의해 형질전환된 에스케리키아 콜라이 균주인 에스케리키아 콜라이 pSAKexpR SANK 72599 는 미생물 수탁에 관한 부다페스트 조약에 따라, 2000년 1월 25일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 FERM BP-7006으로 수탁됐다.
적합한 형질전환 방법을 숙주 세포에 따라 적절하게 선택하여 ML-236B 생합성 촉진 cDNA, ML-236B 생합성에 관련된 게놈 DNA 또는 그의 프래그먼트의 발현을 얻을 수 있다. 페니실륨 시트리눔의 포자로부터 원형질체를 제조하고, 이어서 재조합 DNA 벡터를 원형질체에 도입함으로써 바람직한 ML-236B 생산 미생물인 페니실륨 시트리눔의 형질전환을 수행할 수 있다[Nara, F., et al., Curr. Genet. 23, 28 (1993)에 기술되어 있음].
적합하게는 페니실륨 시트리눔 배양물의 슬랜트로부터의 포자를 PGA 아가 배지의 플레이트에 접종하고 22 내지 28℃에서 10 내지 14 일 동안 인큐베이션한다. 이이서 포자를 플레이트로부터 수거하고 1 x 107 내지 1 x 109 개의 포자를 YPL-20 배양 배지[조성: 0.1%(w/v) 효모 추출물(Difco corporation제), 0.5%(w/v) 폴리펩톤(Nihon Seiyaku corporation제), 락토스 20%(w/v), pH 5.0] 50 내지 100 ml 에 접종하고, 이어서 22 내지 28℃에서 18 시간 내지 2 일 동안 인큐베이션한다. 발아 포자를 배양물로부터 회수하고, 세포벽 분해 효소로 처리하여 원형질체를 수득한다. 세포벽 분해 효소의 선택은 페니실륨 시트리눔의 세포벽을 분해할 수 있는 것이고 미생물에 해로운 효과를 주지 않는다면 특별히 제한 받지 않는다. 그의 예는 자이몰리아제(zymolyase), 키틴아제 (chitinase) 등을 포함한다.
적절한 조건하에서 ML-236B 생합성 촉진 cDNA을 포함하는 재조합 DNA 벡터 및 ML-236B 생산 미생물, 또는 그의 원형질체의 혼합으로 재조합 DNA 벡터가 상기 원형질체에 도입하게 하여 형질전환체를 제공한다.
ML-236B 생산 미생물의 형질전환체의 배양을 적합하게는 각각의 숙주 세포에 적합한 조건하에서 수행한다. 세포벽을 재생성하는데 적절한 조건하에서 앞서 형질전환된 원형질체를 배양한 후 배양함으로써 바람직한 ML-236B 생산 미생물인 페니실륨 시트리눔의 형질전환체의 배양을 수행할 수 있다. 즉, 페니실륨 시트리눔의 형질전환된 원형질체를 VGS 중간층 아가 배지[조성: 보겔(Vogel) 최소 배지, 2%(w/v) 글루코스, 1 M 글리시톨, 2%(w/v) 아가]에 도입하고, 이어서 VGS 중간층 아가를 VGS 하층 아가 배지[조성: 보겔 최소 배지, 2%(w/v) 글루코스, 1 M 글리시톨, 2.7%(w/v) 아가]와 VGS 상층 아가 배지[조성: 보겔 최소 배지, 2%(w/v) 글루코스, 1 M 글리시톨, 1.5%(w/v) 아가](하이그로마이신 B 800 ㎍/ml 를 포함함) 사이에 끼우고, 이어서 22 내지 28℃에서 7 내지 15 일 동안 인큐베이션할 수 있다. 생성된 균주를 PGA 배지 상에서 22 내지 28℃에서의 인큐베이션으로 계대배양한다. 균주를 백금침으로 PGA 배지로 제조된 슬랜트에 접종하고 22 내지 28℃에서 10 내지 14 일 동안 인큐베이션하고, 이어서 0 내지 4℃에서 저장한다.
상기에서 기술된 것처럼, 상기의 슬랜트로부터 수득되고, 재생성된 세포벽을 갖는 페니실륨 시트리눔 형질전환체를 MBG 3-8 배지에 접종하고, 이이서 22 내지 28℃에서 7 내지 12 일 동안 진탕시키면서 인큐베이션함으로써 ML-236B 가 효율적으로 생산될 수 있다. 숙주 세포로 페니실륨 시트리눔을 액체 배지에서 배양하여 마찬가지로 ML-236B를 생성할 수 있다.
천연 생성물의 정제에 통상 사용되는 각종 방법을 조합하여 ML-236B 생산 미생물의 형질전환체의 배양물로부터 ML-236B를 정제할 수 있다. 상기 방법의 선택은 특별히 제한 받지 않고, 예를 들어 원심분리, 여과에 의한 고체와 액체의 분리, 알칼리 또는 산으로의 처리, 유기 용매로의 추출, 용해, 흡수 크로마토그래피, 분배 크로마토그래피 등과 같은 크로마토그래피 방법, 및 결정화법 등일 수 있다. ML-236B는 상호 전환될 수 있는 히드록시산 또는 락톤 형태로 존재할 수 있다. 히드록시산은 더 안정적인 그의 염으로 전환된다. 상기 물리적 특성을 사용하여, ML-236B 히드록시산 형태(이하 유리 히드록시산으로 지칭함), ML-236B 히드록시산의 염(이하 히드록시산의 염으로 지칭함), 또는 ML236B 락톤 형태(이하 락톤으로 지칭함)를 수득할 수 있다.
개환 (ring opening) 및 히드록시산의 염으로의 전환을 위해 고온 또는 실온에서 배양물을 알칼리성 가수분해하고, 이어서 반응액을 산성화하고 여과한다. 여과액을 물로부터 분리시키는 유기 용매로 추출하여 유리 히드록산으로 의도되는 생성물을 제공한다. 유기 용매의 선택은 특별히 제한 받지 않는다. 그의 예는 지방족 탄화수소(예를 들어 헥산, 헵탄 등); 방향족 탄화수소(예를 들어 벤젠, 톨루엔 등); 할로겐화 탄화수소(예를 들어 메틸렌 클로라이드, 클로로포름 등); 에테르(예를 들어 디에틸 에테르 등); 에스테르(예를 들어 에틸 포르메이트, 에틸 아세테이트 등); 또는 2 개 이상의 용매로 구성된 혼합물을 포함한다.
수산화나트륨과 같은 알칼리금속염의 수용액에 유리 히드록시산을 용해시킴으로써 의도된 화합물을 히드록시산염으로 수득할 수 있다.
또한, 유기 용매에서 유리 히드록시산을 가열하여 탈수시키거나, 다른 적합한 방법에 의해 고리를 폐쇄하여 의도된 화합물을 락톤으로 수득할 수 있다.
칼럼 크로마토그래피 등을 사용하여 수득된 유리 히드록시산, 히드록시산 또는 락톤을 정제 분리하는 것이 가능하다. 크로마토그래피에 사용되는 칼럼의 지지체는 특별히 제한 받지 않는다. 그의 예는 Sephadex LH-20(Pharmacia corporation제), Diaion HP-20(Mitsubishi Kagaku corporation제), 실리카 겔, 역상 지지체 등을 포함하고, C18 시리즈의 지지체가 바람직하다.
ML-236B 정량화 방법의 선택은 특별히 제한 받지 않고, 유기 화합물의 정량화에 통상 사용되는 방법이 바람직하다. 그의 예는 역상 고성능 액체 크로마토그래피(이하 "역상 HPLC"로 지칭함) 등을 포함한다. 역상 HPLC 에 따른 정량화는, ML-236B 생산 미생물의 배양물을 알칼리성 가수분해하고, 용해성 분획을 C18 칼럼을 사용하여 역상 HPLC하고, UV 흡광도를 측정하고, 흡광도 값을 ML-236B 의 양으로 전환함으로써 수행될 수 있다. C18 칼럼의 선택은 특별히 제한 받지 않고, 통상적인 역상 HPLC에 사용되는 C18 칼럼이 바람직하다. 그의 예는 SSC-ODS-262(직경 6 mm, 길이 100 mm, Senshu Kagaku corporation제) 등을 포함한다. 이동상용 용매의 선택은 역상 HPLC에 통상 사용되는 용매라면 특별히 제한 받지 않는다. 예를 들어 75%(v/v) 메탄올-0.1%(v/v) 트리에틸 아민-0.1%(v/v) 아세트산 등이다. ML-236B를 SSC-ODS-262 칼럼에 실온에서 첨가할 때, 75%(v/v) 메탄올-0.1%(v/v) 트리에틸 아민-0.1%(v/v) 아세트산이 2 ml/분의 속도로 이동상으로 사용될 경우, ML-236B 가 4.0 분 후에 용출된다. HPLC 용 UV 검출기를 사용하여 ML-236B를 검출할 수 있다. UV 검출용 흡수 파장은 220 내지 280 nm, 바람직하게는 220 내지 260 nm, 더 바람직하게는 236 nm 이다.
본 발명을 사용하여 수득된 ML-236B를 포함하는 제약학적 조성물이 제약학적 담체와 함께 제공된다.
또한 본 발명을 사용하여 수득된 ML-236B로부터 제조되는 프라바스타틴을 함유하는 제약학적 조성물이 제약학적 담체와 함께 제공된다.
본 발명의 제약학적 조성물은 종래의 것일 수 있고 ML-236B 또는 프라바스타 틴의 현존하는 제제로 사용되는 것과 동일한 것일 수 있다.
치료 방법은 본 발명의 일부일 수 있고 지방과잉혈증 및 다른 질환을 치료하기 위한 화합물 또는 조성물을 사용한다.
본 발명은 이제 하기 도면 및 실시예를 참고하여 더 자세히 설명된다. 실시예는 본 발명을 설명하지만 여기에 제한되지는 않는다.
실시예
실시예 1: pSAKcos1 벡터의 작제
에스케리키아 콜라이로부터 유래하는 하이그로마이신 B 포스포트랜스퍼라제 유전자 (이하, "HPT"라 칭함)을 포함하는 플라스미드 pSAK333 (일본 특허 출원 공개 공보 제3-262486호)를 제한 효소 BamHI (일본의 Takara Shuzo Co., Ltd제)으로 절단하고 T4 DNA 폴리머라제 (일본의 Takara Shuzo Co., Ltd제)로 처리하여 블런트 말단을 형성하였다.
상기와 같이 얻은 DNA 프래그먼트를 DNA 라이게이션 키트 버전 2 (일본의 Takara Shuzo Co., Ltd제)를 사용하여 원형으로 자가 라이게이션시키고, 이어서 이를 사용하여 콤피턴트 세포인 에스케리키아 콜라이 JM 109 (일본의 Takara Shuzo Co., Ltd제)를 형질전환시켰다. BamHI 부위가 결실된 플라스미드를 보유하는 균주를 형질전환 에스케리키아 콜라이로부터 선발하여 pSAK360으로 명명하였다.
pSAK360을 제한 효소 PvuII로 절단하고, 이어서 알칼라인 포스파타제로 처리하여 5'-말단이 탈인산화된 프래그먼트를 생성하였다. cos 부위를 포함하는 SalI-ScaI 프래그먼트 (약 3 kb)를 코스미드 벡터 pWE15 (STRATAGENE 제)로부터 얻고, 이를 T4 DNA 폴리머라제로 처리하여 블런트 말단을 형성하였다. 그 후, 이를 pSAK360의 PvuII 부위로 라이게이션하였다. 상기 DNA로 JM109를 형질전환시켰다. PvuII 부위에 SalI-ScaI 프래그먼트 (약 3 kb)가 삽입된 플라스미드를 보유하는 균주를 형질전환 에스케리키아 콜라이로부터 선발하고, 상기 균주에 의해 보유되는 플라스미드를 pSAKcos1으로 명명하였다. pSAKcos1은 제한 효소 BamHI, EcoR1 및 NotI의 절단 부위를 포함하는데, 각각의 부위는 pWE15로부터 유래하였다. pSAKcos1은 선발 마커로서 암피실린 내성 유전자 및 하이그로마이신 내성 유전자를 보유한다.
에스케리키아 콜라이를 숙주로 사용하는 하기 실시예에 있어서, pSAKcos1 형질전환체, 또는 외래 유전자 인서트를 포함하는 pSAKcos1의 형질전환체의 선발은 적합한 배지에 40 ㎍/ml의 암피실린을 첨가함으로써 수행하였다 (암피실린: Sigma Corporation제). 페니실륨 시트리눔 (Penicillium citrinum) SANK13380을 숙주로 사용하는 경우, pSAKcos1 형질전환체, 또는 외래 유전자 인서트를 포함하는 pSAKcos1의 형질전환체의 선발은 적합한 배지에 200 ㎍/ml의 하이그로마이신을 첨가함으로써 수행하였다 (하이그로마이신: Sigma Corporation제).
pSAKcos1의 작제 방법을 도 1에 나타내었다.
실시예 2: 페니실륨 시트리눔 SANK 13380의 게놈 DNA의 제조
1) 페니실륨 시트리눔 SANK 13380의 배양
페니실륨 시트리눔 SANK 13380의 종배양 (seed culture)을 PGA 아가 배지의 슬랜트 상에서 수행하였다. 즉, 백금침을 사용하여 페니실륨 시트리눔 SANK 13380을 아가에 접종하여, 이를 26℃에서 14일 동안 유지하였다. 슬랜트를 4℃에서 유지하였다.
주 배양은 액체 통기 배양법으로 수행하였다. 5 mm2의 상기 슬랜트로부터의 세포를 500 ml의 코니칼 플라스크 중 MBG3-8 배지 50 ml에 접종하고, 210 rpm에서 진탕시키면서 26℃에서 5일 동안 배양하였다.
2) 페니실륨 시트리눔 SANK 13380으로부터의 게놈 DNA의 제조
단계 1)에서 얻은 배양물을 10000 x G, 실온에서 10분 동안 원심분리하여 세포를 수집하였다. 드라이 아이스로 냉각시킨 유발에서 3 g (습윤 중량)의 세포를 파쇄하여 분말의 형태가 되도록 하였다. 20 ml의 62.5 mM EDTA·2Na (Wako Pure Chemical Industries, LTD.제) - 5% (w/v) SDS - 50 mM 트리스 염산 (Wako Pure Chemical Industries, Ltd.제) 완충제 (pH 8.0)가 충진된 원심분리 튜브에 상기 파쇄 세포를 넣고, 온화하게 혼합시키고, 이어서 0℃에서 1시간 동안 정치시켰다. 10 mM의 트리스 염산 및 0.1 mM EDTA·2Na (pH 8.0, 이하, "TE"로 칭함)로 포화된 페놀 10 ml을 여기에 첨가하고, 혼합물을 50℃에서 1시간 동안 온화하게 교반시켰다.
실온, 10000 x G에서 10 분 동안 원심분리한 후, 15 ml의 상층 (수상)을 다른 원심분리 튜브에 넣었다. 상기 용액에 0.5배 부피의 TE 포화 페놀 및 0.5배 부피의 클로로포름 용액을 첨가하였다. 혼합물을 2분 동안 교반시키고, 실온, 10000 x G 에서 10 분 동안 원심분리하였다 (이하, "페놀 클로로포름 추출"이라 칭함). 상층 (수상) 10 ml에 10 ml의 8M 아세트산암모늄 (pH 7.5) 및 25 ml의 2-프로판올 (Wako Pure Chemical Industries, Ltd. 제)을 첨가하고, 이어서 -80℃에서 15분 동안 냉각시키고, 4℃, 10000 x G 에서 10 분 동안 원심분리하였다.
침전 후, 침전물을 5 ml의 TE에 용해시킨 후, 20 ㎕의 10 mg/ml 리보뉴클레아제 A (Sigma corporation 제) 및 250 단위의 리보뉴클레아제 T1 (GIBCO corporation 제)을 여기에 첨가하고, 이어서 37℃에서 20분 동안 인큐베이션시켰다. 여기에 20 ml의 2-프로판올을 첨가하고, 온화하게 혼합하였다. 그 후, 게놈 DNA의 쓰레드 (thread)를 파스퇴르 피펫 팁에 스풀링하고, 1 ml의 TE에 용해시켰다.
다음, 0.1 배 부피의 3 M 아세트산나트륨 (pH 6.5) 및 2.5 배 부피의 에탄올을 상기 DNA 용액에 첨가하였다. 이 용액을 -80℃에서 15분 동안 냉각시키고, 이어서 4℃, 10000 x G 에서 5분 동안 원심분리하였다 (이하, 본원에서 "에탄올 침전"이라 칭함). 생성된 침전물을 200 ㎕의 TE에 용해시켰는데, 이는 게놈 DNA 분획이었다.
실시예 3: 페니실륨 시트리눔 SANK13380의 게놈 DNA 라이브러리의 제조
1) 게놈 DNA 프래그먼트의 제조
0.25 단위의 Sau3AI (일본의 Takara Shuzo Co., Ltd.제) 를 실시예 2에서 얻은 페니실륨 시트리눔 SANK13380의 게놈 DNA (50 ㎍)의 수용액 100 ㎕에 첨가하였다. 10, 30, 60, 90 및 120 초의 간격 후에, 20 ㎕의 혼합물 시료를 취하고, 각각의 시료에 0.5 M EDTA (pH 8.0) 를 첨가하여 제한 효소 반응을 중지시켰다. 생성된 부분 절단 DNA 프래그먼트를 아가로스 겔 전기영동으로 분리하고, 30 kb 이상의 DNA 프래그먼트를 포함하는 아가로스 겔을 회수하였다.
회수 겔을 미분화하고, 울트라 프리 C3 원심분리 여과 단위 (Ultra Free C3 Centrifuged Filtration Unit, Japan Milipore corporation제)에 넣었다. 겔을 -80℃에서 15분 동안 냉각시켜 동결시키고, 이어서 겔을 37℃에서 10분 동안 인큐베이션함으로써 용융시켰다. 이를 5000 x G 에서 5 분 동안 원심분리시켜 DNA를 추출하였다. DNA를 페놀-클로로포름 추출하여 에탄올 침전시켰다. 생성된 침전물을 적당한 소량의 TE에 용해시켰다.
2) DNA 벡터 pSAKcos1의 예비처리
pSAKcos1를 제한효소 BamHI (일본의 Takara Shuzo Co., Ltd.제)으로 절단하고, 이어서 65℃에서 30분 동안 처리한 알칼라인 포스파타제 (일본의 Takara Shuzo Co., Ltd.제) 로 처리하였다. 생성된 반응 용액을 페놀-클로로포름 추출하고, 에탄올 침전시켰다. 생성된 침전물을 적당한 소량의 TE에 용해시켰다.
3) 라이게이션 및 시험관내 패키징
상기 단계 1)에 기술된 게놈 DNA 프래그먼트 (2 ㎍) 및 상기와 같이 예비처리한 pSAKcos1 (1 ㎍)을 혼합시키고, 이어서 DNA 라이게이션 키트 버전 2 (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 16℃에서 16시간 동안 라이게이션시켰다. 생성된 반응 용액을 페놀 - 클로로포름 추출하고 에탄올 침전시켰다. 생성된 침전물을 5 ㎕의 TE에 용해시켰다. 라이게이션 생성물 용액을, GIGAPAK II Gold kit (STRATAGENE corporation제)를 사용하여 시험관내 패키징에 적용하여 재조합 DNA 벡터를 포함하는 에스케리키아 콜라이 형질전환체를 얻었다. 3 ml 의 LB 배지를 에스케리키아 콜라이 형질전환체의 콜로니가 형성된 플레이트 상에 붓고, 이어서 플레이트 상의 콜로니를 세포 스크레이퍼를 사용하여 회수하였다 ("회수 용액 1"로 칭함). 플레이트를 3 ml 의 LB 배지로 추가로 세척하고, 세포를 회수하였다 ("회수 용액 2"로 칭함). 글리세롤을 회수 용액 1 및 2의 혼합물에 첨가하여 18%의 최종 농도를 얻었으며 (에스케리키아 콜라이 세포 용액으로 칭함), 이를 페니실륨 시트리눔 SANK13380의 게놈 DNA 라이브러리로서 -80℃에서 유지하였다.
실시예 4: 페니실륨 시트리눔 SANK13380의 게놈 DNA를 주형으로 사용한 PCR에 의한 PKS 유전자 프래그먼트의 증폭
1) PCR을 위한 프라이머의 고안 및 합성
아스페르길루스 플라부스 (Aspergillus flavus)의 PKS 유전자의 아미노산 서열 (Brown, D.W. 등의 문헌 [Proc. Natl. Acad. Sci. USA, 93, 1418 (1996)])을 기초로 하여 , 서열 목록의 서열 번호 3 및 4에 나타낸 축퇴 (degenerate) 프라이머를 고안 합성하였다. 합성은 포스포아미디트 방법에 따라 수행하였다.
서열 목록의 서열 번호 3:
gayacngcntgyasttc
서열 목록의 서열 번호 4:
tcnccnknrcwgtgncc
서열 번호 3 및 4의 뉴클레오티드 서열에 있어서, n은 이노신 (하이포크산틴)을 나타내고, y 는 t 또는 c를 나타내고, s는 g 또는 c를 나타내고, k는 g 또는 t를 나타내고, r은 g 또는 a를 나타내고, w 는 a 또는 t를 나타낸다.
2) PCR에 의한 DNA 단편의 증폭
상기 단계 1)의 PCR용 프라이머 (각각 100 pmol), 실시예 2에서 얻은 페니실륨 시트리눔 SANK13380의 게놈 DNA (500 ng), 0.2 mM 의 dATP, 0.2 mM 의 dCTP, 0.2 mM 의 dGTP, 0.2 mM 의 dTTP, 50 mM 의 염화칼륨, 2 mM 의 염화마그네슘 및 1.25 단위의 Ex. Tac DNA 폴리머라제 (일본의 Takara Shuzo Co., Ltd. 제)를 포함하는 50 ㎕의 반응 용액을 제조하였다. 이 용액을 하기의 연속 3단계로 구성된 반응 사이클에 적용하였다: 94℃에서 1분, 58℃에서 2분 및 70℃에서 3분. 이 사이클을 30회 반복하여 DNA 프래그먼트를 증폭시켰다. TaKaRa PCR Thermal Cycler MP TP 3000 (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 PCR을 수행하였다.
증폭 DNA 프래그먼트를 아가로스 겔 전기영동에 적용하고, 이어서 크기가 약 1.0 내지 2.0 kb인 DNA 프래그먼트를 포함하는 아가로스를 회수하였다. DNA를 겔로부터 회수하고, 이를 페놀-클로로포름 추출하고 에탄올 침전시켰다. 생성된 침전물을 소량의 TE에 용해시켰다.
3) 라이게이션 및 형질전환
단계 2)에서 얻은 DNA 프래그먼트를 TA 클로닝 시스템 pCR 2.1(Invitrogen corporation제)을 사용하여 플라스미드 pCR2.1에 라이게이션시켰는데, 이 플라스미드는 상기 키트의 일부로 제공된다. 이 플라스미드로 에스케리키아 콜라이 JM109를 형질전환시켜 형질전환체를 생성하였다.
생성된 형질전환체로부터 여러 콜로니를 선발하여 Maniatis 등의 방법 (문헌 [Maniatis, T. 등, Molecular cloning, a laboratory manual, 제2판, Cold Spring Harbor Laboratory, 미국 뉴욕주의 콜드 스프링 하버 소재(1989)]에 기술되어 있음)에 따라 배양하였다. 즉, 각각의 콜로니를 2 ml 의 LB 배지를 포함하는 24 ml의 시험관에 접종하고, 37℃에서 18시간 동안 진탕 배양하였다.
재조합 DNA 벡터를 알칼라인 방법(Maniatis, T. 등의 상기 문헌에 기술되어 있음)에 따라 배양물로부터 제조하였다. 즉, 1.5 ml 의 배양액을 실온, 10000 x G 에서 2분 동안 원심분리하였다. 이어서 침전물로부터 세포를 회수하였다. 100 ㎕ 의 50 mM 글루코스, 25 mM 트리스 염산, 10 mM EDTA의 용액 (pH 8.0)을 세포에 첨가하여 현탁물을 형성하였다. 여기에 200 ㎕ 의 0.2 N 수산화나트륨- 1%(w/v) SDS를 첨가하였다. 이 현탁물을 온화하게 교반하여 미생물을 용균시켰다. 이어서 150 ㎕ 의 3 M 아세트산칼륨 - 11.5%(w/v) 아세트산을 첨가하여 모든 단백질을 변성시키고, 이어서 실온, 10000 x G에서 10 분 동안 원심분리시켰다. 상층액을 회수하였다. 이 상층액을 페놀-클로로포름 추출하고 에탄올 침전시켰다. 생성된 침전물을 40 ㎍/ml 의 리보뉴클레아제 A (Sigma corporation제)를 포함하는 50 ㎕ 의 TE에 용해시켰다.
각각의 재조합 DNA 벡터를 제한 효소로 절단하고, 전기영동에 적용하였다. 전기영동 상에서 상이한 절단 패턴을 가지는 모든 인서트에 대해, 재조합 DNA 벡터 중 DNA 인서트의 뉴클레오티드 서열을 DNA 서열결정기(모델 377: 일본의 Perkin Elmer제)를 사용하여 결정하였다.
이러한 방식으로 페니실륨 시트리눔으로부터 유래된 PKS 프래그먼트를 포함 하는 재조합 DNA 벡터를 보유하는 균주를 동정하였다.
실시예 5: 페니실륨 시트리눔 SANK13380의 게놈의 서던 (Southern) 블로팅 혼성화
1) 전기영동 및 막으로의 이동
실시예 2에서 얻은 페니실륨 시트리눔 SANK13380의 게놈 DNA (10 ㎍)을 제한 효소 EcoRI, SalI, HindIII 또는 Sac1 (이들 모두는 일본의 Takara Shuzo Co., Ltd.제임)으로 절단하고, 이어서 아가로스 겔 전기영동에 적용하였다. 겔은 아가로스 L03 "TAKARA" (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 제조하였다. 전기영동 후에 겔을 0.25 N 염산 (Wako Pure Chemical Industries, Ltd.제)에 침지시키고, 실온에서 10분 동안 온화하게 진탕시키면서 인큐베이션하였다. 겔을 0.4 N 수산화나트륨 (Wako Pure Chemical Industries, Ltd.제)으로 옮기고, 실온에서 30분 동안 온화하게 인큐베이션하였다. Maniatis 등 (상기 문헌 참조)의 알칼라인 이동법을 사용하여, 겔의 DNA를 나일론 막 Hybond-N+ (Amersham corporation제) 상에 이동시키고, 상기에 고정화하였다. 이 막을 2 x SSC (1 x SSC는 150 mM NaCl, 15 mM 시트르산나트륨을 포함함)로 세척하고, 이어서 공기 건조시켰다.
2) 혼성화 및 신호의 검출
실시예 4에서 얻은 PKS 유전자 프래그먼트를 프로브로 사용하여 단계 1)에서 얻은 막을 혼성화하였다.
프로브에 있어서, 실시예 4에서 얻은 PKS 유전자 인서트 프래그먼트 DNA 1 ㎍을 DIG DNA 표지 키트 (Boeringer-Mannheim제)로 표지화하고, 10분 동안 비등시키고 이어서 사용 직전에 신속하게 냉각시켰다.
단계 1)에 기술된 막을 혼성화 액체 (DIG Easy Hyb: Boeringer-Mannheim제)에 침지시키고, 이어서 20 rpm, 42℃에서 2시간 동안 진탕시키면서 예비혼성화하였다. 이어서, 상기 표지 프로브를 혼성화 액체에 첨가하고, 다중진탕기 오븐 (Multishaker Oven) HB (TAITEC corporation제)을 사용하여 20 rpm , 42℃에서 18시간 동안 진탕시키면서 혼성화를 수행하였다. 이어서 혼성화를 실시한 막을 2 x SSC를 사용하여 실온에서 20분 동안 3회, 0.1 x SSC를 사용하여 55℃에서 30분 동안 2회 세척하였다.
세척 막을 핵산용 DIG 발광성 검출 키트 (DIG Luminescent Detection Kit for Nucleic Acids, Boeringer-Mannheim제)로 처리하고, X선 필름 (Lumifilm, Boeringer-Mannheim제)에 노출시켰다. 후지 의학 필름 프로세서 FPM 800A (Fuji Film Corporation제)을 사용하여 노출을 수행하였다.
그 결과, 실시예 4에서 얻은 PKS 유전자 프래그먼트가 페니실륨 시트리눔의 게놈 상에 존재함이 확인되었다.
실시예 6: PKS 유전자 프래그먼트를 프로브로 사용한 페니실륨 시트리눔 SANK13380의 게놈 DNA 라이브러리의 스크리닝
콜로니 혼성화 방법을 사용하여 PKS 유전자를 포함하는 게놈 DNA 프래그먼트의 클로닝을 수행하였다.
1) 막의 제조
페니실륨 시트리눔 SANK13380의 게놈 DNA 라이브러리로 유지된 에스케리키아 콜라이 세포 용액 (실시예 3에 기술됨)을 희석시키고, 플레이트 당 5000 내지 10000개의 콜로니가 생장할 수 있도록 LB 아가 배지 플레이트 상에 도말하였다. 플레이트를 26℃에서 18시간 동안 유지하고, 4℃에서 1시간 동안 냉각시켰다. Hybond-N+ (Amasham corporation제)를 플레이트 상에 놓고, 플레이트와 1분 동안 접촉시켰다. 콜로니가 점착된 막을 조심스럽게 플레이트로부터 옮겼다. 콜로니와 접촉한 표면을 위로 하여, 200 ml의 1.5 M 염화나트륨, 0.5 N 수산화나트륨 용액에 7분 동안 침지시키고, 이어서 200 ml의 1.5 M 염화나트륨, 0.5 M 트리스 염산, 1 mM EDTA의 용액 (pH 7.5)에 3분 동안 2회 침지시키고, 이어서 400 ml의 2 x SSC로 세척하였다. 세척 막을 30분 동안 공기 건조시켰다.
2) 혼성화
실시예 4에서 얻은 PKS 유전자 인서트 DNA (1 ㎍)을 프로브로 사용하였다. DNA를 DIG DNA 표지 키트 (Boeringer-Mannheim제)를 사용하여 표지화하고 10분 동안 비등시키고 사용 직전에 신속하게 냉각시켰다.
단계 1)에 기술한 막을 혼성화 액체 (DIG Easy Hyb: Boeringer-Mannheim제)에 침지시키고, 이어서 20 rpm, 42℃에서 2시간 동안 예비혼성화 세척하였다. 이어서 상기 표지 프로브를 혼성화 액체에 첨가하고, 20 rpm, 42℃에서 18 시간 동안 다중진탕기 오븐 HB (TAITEC corporation제)를 사용하여 혼성화를 수행하였다. 혼성화를 실시한 막을 2 x SSC를 사용하여 실온에서 20 분 동안 3회, 그리고 0.1 x SSC를 사용하여 68℃에서 30분 동안 2회 세척하였다.
세척 막을 핵산의 DIG 발광성 검출 키트 (Boeringer-Mannheim제)로 처리하고, X선 필름 (Lumifilm, Boeringer-Mannheim제)에 노출시켰다. 후지 의학 필름 프로세서 FPM 800A (Fuji Film Corporation제)을 사용하여 노출을 수행하였다.
상기 단계 1) 및 2)를 스크리닝으로 칭한다.
제1 스크리닝에서 양성 신호가 검출된 플레이트 상의 콜로니를 긁어내어 회수 세포를 LB 배지에 현탁시켰다. 이어서 세포를 적당하게 희석시키고, 적합한 플레이트 상에 도말하였다. 그 후, 제2 스크리닝을 수행하여 양성 클론을 정제하였다.
본 실시예에서 얻은 양성 클론, 즉, 형질전환 에스케리키아 콜라이인 에스케리키아 콜라이 pML48 SANK71199 균주는 미생물 기탁에 관한 부다페스트 조약에 따라 수탁 번호 FERM BP-6780 하에 1999년 7월 7일에 일본 통상산업성 공업기술원 생명공학 공업기술 연구원에 기탁되었다.
실시예 7: 재조합 DNA 벡터 pML48의 삽입 서열의 분석 (1)
실시예 6에서 얻은 에스케리키아 콜라이 pML48 SANK71199 균주의 배양 및 상기 배양물로부터의 재조합 DNA 벡터의 제조는 실시예 4에 기술된 것과 유사한 방식으로 수행하였다.
얻어진 DNA 벡터를 pML48로 명명하였다. ML-236B 생합성 관련 게놈 DNA인 pML48의 인서트를 여러 제한 효소로 절단하고, 생성된 프래그먼트를 pUC119 (일본의 Takara Shuzo Co., Ltd제) 내로 서브클로닝하였다. 생성된 서브클론을 프로브로 사용하여, 실시예 5에 기술된 것과 유사한 방법으로 서던 블롯 혼성화를 수행하였다. 즉, 여러 제한 효소로 pML48을 절단함으로써 얻어진 생성물을 전기영동하고, DNA를 막으로 이동시켜 혼성화를 수행하였다. 그 결과, pML48의 삽입 서열의 제한 효소 절단 지도를 당 업계의 표준 기술을 사용하여 만들었다.
각각의 서브클론의 삽입 서열의 뉴클레오티드 서열을 DNA 서열결정기 모델 377 (Perkin Elmer Japan Co.Ltd 제)를 사용하여 결정하고, 이어서 pML48의 전체 뉴클레오티드 서열을 결정하였다.
pML48의 삽입 서열은 총 34203개의 염기로 구성되었다.
pML48의 삽입 서열의 뉴클레오티드의 서열은 서열 목록의 서열 번호 1 및 2에 기술되어 있다. 서열 목록의 서열 번호 1 및 2에 기술된 서열은 서로 완전히 상보적이다.
pML48 인서트 서열 상의 구조 유전자의 존재는, 유전자 탐색 프로그램 GRAIL (ApoCom GRAIL Toolkit: Apocom Corporation제) 및 상동성 탐색 프로그램 BLAST (Gapped-BLAST (BLAST2): 위스콘신 GCG 패키지 버전 10.0에 설치됨)을 사용하여 분석하였다.
그 결과, pML48의 삽입 서열에는 6개의 상이한 구조 유전자가 존재하는 것으로 예측되었으며, 이들은 각각 mlcA, mlcB, mlcC, mlcD, mlcE 및 mlcR로 명명되었다. 또한, mlcA, mlcB, mlcE 및 mlcR은 서열 목록의 서열 번호 2의 뉴클레오티드 서열 내에 코딩 영역을 가지며, mlcC 및 mlcD은 서열 목록의 서열 번호 1의 뉴클레 오티드 서열 내에 코딩 영역을 가지는 것으로 예측되었다. 삽입 서열의 추정 구조 유전자 각각의 상대적인 위치 및 길이도 또한 예측되었다.
본 실시예의 결과를 도 2에 나타내었다. 각각의 화살표는 pML48 인서트 상의 각각의 구조 유전자의 위치화, 방향 및 상대적인 크기를 나타낸다. 좌측으로 향하는 화살표는 구조 유전자(mlcA, B, E 또는 R)의 코딩 영역이 서열 번호 2 상에 존재한다는 것을 나타낸다. 우측으로 향하는 화살표는 구조 유전자(mlcC 또는 D)의 코딩 영역이 서열 번호 1에 존재한다는 것을 나타낸다.
실시예 8: 재조합 DNA 벡터 pML48의 삽입 서열의 분석 (2)
실시예 7에서 그의 존재가 예측된 구조 유전자의 발현 분석을 노던 (Northern) 블롯 혼성화 및 RACE에 의해 실시하였다. 5'- 및 3'-말단 영역의 분석을 수행하였다.
1) 페니실륨 시트리눔 SANK13380의 전체 RNA의 제조
페니실륨 시트리눔 SANK13380 슬랜트 배양물 중 5 mm2으로부터의 세포 (실시예 2에 기술됨)을 100 ml의 코니칼 플라스크 중 10 ml의 MBG3-8 배지에 접종하고, 26℃에서 3일 동안 진탕 배양하였다.
배양물로부터의 전체 RNA의 제조는 구아니딘-이소티오시아네이트 방법을 사용하는 RNeasy Plant Mini Kit (Qiagen AG제)을 사용하여 수행하였다 즉, 배양물을 실온, 5000 x G에서 10분 동안 원심분리시켜 세포를 회수하였다. 그 후, 액체 질소로 2g (습윤 중량)의 세포를 동결시키고 이어서 유발에서 파쇄하여 분말을 생성하였다. 파쇄 세포를 4 ml의 용균 완충제 (키트 중에 포함됨)에 현탁시켰다. 450 ㎕의 현탁물을 키트에 포함된 10개의 QIAshredder 스핀 컬럼 각각에 붓고, 이어서 실온, 1000 x G 에서 10 분 동안 원심분리시켰다. 생성된 용출액 각각을 회수하고, 여기에 225 ㎕의 에탄올을 첨가하고, 이어서 키트에 포함된 RNA 미니 스핀 컬럼에 첨가하였다. 컬럼을 키트에 포함된 세척 완충제로 세척하고, 이어서 리보뉴클레아제가 없는 50 ㎕의 증류수로 각각의 컬럼 중 흡착물을 용출시켰다. 용출액을 전체 RNA 분획으로 사용하였다.
2) 노던 블롯 혼성화
페니실륨 시트리눔 SANK13380의 전체 RNA 20 ㎍을 포함하는 수용액 2.25 ㎕를 1 ㎕의 10 x MOPS (조성: 200 mM의 3-모르폴리노 프로판 술폰산, 50 mM의 아세트산나트륨, 10 mM EDTA·2Na; pH 7.0; 오토클레이브에서 121℃에서 20분 동안 살균한 후 사용; Dojinkagaku Laboratory Co.Ltd. 제), 1.75 ㎕의 포름알데히드 및 5 ㎕의 포름아미드에 첨가하고, 이어서 혼합함으로써 RNA 시료를 제조하였다. RNA 시료를 65℃에서 10분 동안 유지하고, 이어서 빙수에서 신속하게 냉각시키고, 아가로스 겔 전기영동에 적용하였다. 전기영동용 겔은 10 ml의 10 x MOPS 및 1 그램의 아가로스 L03 "TAKARA" (일본의 Takara Shuzo Co., Ltd.제)를 72 ml의 피로카르본산 디에틸 에스테르 처리 물 (Sigma Corporation제)과 혼합하고 가열하여 아가로스를 용해시키고, 이어서 냉각시키고, 이어서 18 ml의 포름알데히드를 첨가함으로써 제조하였다. 시료 완충제로는 1 x MOPS (10 x MOPS를 10배의 물로 희석시켜 제조)를 사용하였다. 겔 중 RNA를 10 X SSC 에서 Hybond-N+ (Amasham corporation제)로 이동시켰다.
pML48의 삽입 서열을 하기 표 1에 나타낸 제한 효소 1 및 2로 절단함으로써 얻은 DNA 프래그먼트 a, b, c, d 및 e를 프로브로 사용하였다. pML48 인서트 상의 각각의 프로브의 위치는 도 3의 상부 패널에 나타내었다.
프로브 | 제한효소 1 | 제한효소 부위의 뉴클레오티드 번호* | 제한효소 2 | 세한효소 부위의 뉴클레오티드 번호* |
a | EcoRI | 6319 내지 6324 | EcoRI | 15799 내지 15804 |
b | BamHI | 16793 내지 16798 | PstI | 18164 내지 18169 |
c | KpnI | 26025 내지 26030 | BamHI | 27413 내지 27418 |
d | SalI | 28691 내지 28696 | SalI | 29551 내지 29556 |
e | HindIII | 33050 내지 33055 | SacI | 34039 내지 34044 |
* 각각의 뉴클레오티드 번호는 서열 목록의 서열 번호 1에 존재한다.
프로브의 표지, 혼성화 및 신호의 검출은 실시예 5에 기술되어 있는 서던 블롯 혼성화에 따라 수행하였다.
실시예의 결과를 도 3의 하부 패널에 나타내었다.
각각의 신호는 각각의 프로브의 뉴클레오티드 서열에 상동성인 전사 생성물의 존재를 나타낸다.
상기 결과는, 본 실시예의 pML48의 삽입 서열에 존재하는 것으로 예측된 구조 유전자, 즉, mlcA mlcB, mlcC mlcD, mlcE 및 mlcR이 페니실륨 시트리눔 SANK13380에서 전사되었음을 시사한다.
각각의 신호의 위치는 전사 생성물의 상대적인 크기를 나타내지는 않는다.
3) 5'RACE 에 따른 5'-말단 서열의 결정
cDNA 말단의 빠른 증폭을 위한 5'RACE System, 버전 2.0 (GIBCO corporation제)을 사용하여 각각의 구조 유전자의 5'-말단 영역을 포함하는 cDNA 를 수득했다.
2 종류의 안티센스 올리고뉴클레오티드 DNA 를 생성했다. 실시예 7 의 결과 및 본 실시예의 항목 2)에 의해 예측되는 것처럼, pML48 의 삽입 서열에 있는 각각의 구조 유전자의 5'-말단 주위 및 코딩 영역에 존재할 것으로 추정되는 뉴클레오티드 서열을 기초로 고안했다.
각각의 구조 유전자의 3'-말단 쪽의 뉴클레오티드 서열을 기초로 고안된 안티센스 올리고뉴클레오티드 DNA (1)의 뉴클레오티드 서열을 표 2 에 나타낸다. 각각의 구조 유전자의 5'-말단 쪽의 뉴클레오티드 서열을 기초로 고안된 안티센스 올리고뉴클레오티드 DNA (2)의 뉴클레오티드 서열을 표 3 에 나타낸다.
올리고뉴클레오티드 DNA (1)을 프라이머로, 페니실륨 시트리눔 SANK13380 의 전체 RNA 를 주형으로 사용하여 역전사 반응에 따라 cDNA 의 제 1 가닥을 합성했다. 즉, 전체 RNA 1 ㎍, 올리고뉴클레오티드 DNA (1) 2.5 pmol 및 SUPER SCRIPTTM II 역전사효소(키트에 포함되어 있음) 1 ㎕를 포함하는 반응 혼합물 24 ㎕ 를 16℃ 에서 1 시간 동안 인큐베이션하고, 반응 생성물을 키트에 포함된 GLASSMAX 스핀 카트리지에 첨가하여 cDNA의 제 1 가닥을 정제했다.
키트에 포함된 말단 데옥시리보뉴클레오티딜 트랜스퍼라제를 사용하여 cDNA 제 1 가닥의 3'-말단에 폴리 C 사슬을 부가했다.
3'-말단 폴리 C 사슬을 부가한 cDNA의 제 1 가닥을 포함하는 반응 혼합물 50 ㎕ 를 올리고뉴클레오티드 DNA (2) 40 pmol 및 Abriged Anchor Primer(키트에 포함되어 있음) 40 pmol 과 혼합하고 94℃에서 2 분 동안 인큐베이션했다. 이어서, 94℃에서 30 초, 55℃에서 30 초 및 72℃에서 2 분인 인큐베이션 주기를 35회 반복하고, 72℃ 에서 5 분 및 4℃ 에서 18 시간 동안 인큐베이션했다. 생성물을 아가로스 겔 전기영동하고 DNA를 겔로부터 회수했다. 생성물을 페놀-클로로포름 추출 및 에탄올 침전으로 정제하고, pCR 2.1 을 사용하여 실시예 4에 기술된 방법과 유사한 방식으로 클로닝했다.
상기 조작은 5'-RACE이다.
5'-말단을 포함하는 cDNA 프래그먼트의 뉴클레오티드 서열을 결정하고, 전사 개시점 및 번역 개시 코돈의 위치를 예측했다.
표 4 는 5'RACE에 의해 수득된 각각의 구조 유전자에 상응하는 5'-말단 cDNA 프래그먼트의 뉴클레오티드 서열이 기술된 서열 번호를 나타낸다. 표 5 는 각각의 구조 유전자의 전사 개시점 및 번역 개시점이 존재하는 서열 번호, 및 전사 개시점 및 번역 개시점의 위치를 나타낸다.
* 서열 목록의 서열 번호 1 및 2에 나타낸 뉴클레오티드 서열은 서로 완전히 상보적이다.
4) 3'RACE에 상응하는 3'-말단 서열의 결정
Ready To Go:T-Primed First-Strand 키트(Pharmacia corporation제)을 사용하여 각각의 구조 유전자의 3'-말단 영역을 포함하는 cDNA 를 수득했다.
pML48의 삽입된 서열에 있는 각각의 구조 유전자의 3'-말단 주위 및 코딩 영역에 존재할 것으로 예측되는 한 종류의 센스 올리고뉴클레오티드 DNA (3)을 생성하고, 실시예 7 및 본 실시예의 항목 2)의 결과로부터 예측했다.
각각의 구조 유전자에 대해 생성된 올리고뉴클레오티드 DNA (3)의 뉴클레오 티드 서열을 표 6 에 나타낸다.
NotI-d(T)18 프라이머(키트에 포함되어 있음), 및 주형으로 페니실륨 시트리눔 SANK13380의 전체 RNA (1 ㎍)를 사용하여 역전사효소 반응으로 cDNA 의 제 1 가닥을 합성했다.
cDNA 의 제 1 가닥, 올리고뉴클레오티드 DNA (3) 40 pmol 및 NotI-d(T)18 프라이머(키트에 포함되어 있음)을 포함하는 반응 혼합물 100 ㎕ 를 94℃에서 2 분 동안 유지시켰다. 94℃에서 30 초, 55℃에서 30 초 및 72℃에서 2 분인 인큐베이션 주기를 35회 반복하고, 72℃에서 5 분 및 4℃에서 18 시간 동안 인큐베이션했다. 생성물을 아가로세 겔 전기영동하고, DNA 를 겔로부터 회수했다. 생성물을 페놀-클로로포름 추출 및 에탄올 침전으로 정제하고, pCR 2.1을 사용하여 실시예 4 에 기술된 방법과 유사한 방식으로 클로닝했다.
상기 조작이 3'-RACE 이다.
3'-말단의 cDNA의 뉴클레오티드 서열을 결정하고, 번역 종결 코돈의 위치를 예측했다.
표 7은 3'RACE 에 의해 수득된 각각의 구조 유전자에 상응하는 3'-말단 cDNA 프래그먼트의 뉴클레오티드 서열이 기술된 서열 목록의 서열 번호를 나타낸다. 표 8은 번역 종결 코돈 및 서열 목록의 서열 번호 1 및 2 를 기초로 한 코돈의 위치를 나타낸다.
* 서열 목록의 서열 번호 1 및 2에 나타낸 뉴클레오티드 서열은 서로 완전히 상보적이다.
표 9 는 각각의 구조 유전자에 의해 코딩되는 것으로 예측되는 폴리펩티드의 C-말단 아미노산 잔기, 아미노산 잔기를 코딩하는 트리뉴클레오티드의 뉴클레오티드 서열 및 트리뉴클레오티드의 위치를 나타낸다.
* 서열 목록의 서열 번호 1 및 2 에 나타낸 뉴클레오티드 서열은 서로 완전히 상보적이다.
표 10 은 표 8 에 나타낸 번역 종결 코돈에 상보적인 서열, 상보적인 서열이 존재하는 서열 번호 및 상보적인 서열의 위치를 요약한다.
* 서열 목록의 서열 번호 1 및 2에 나타낸 뉴클레오티드 서열은 서로 완전히 상보적이다.
상기에서처럼, 각각의 구조 유전자의 위치, 그의 방향 및 그의 위치를 확정했다. 상기 정보를 기초로, 각각의 구조 유전자의 전사 생성물 및 번역 생성물을 수득할 수 있다.
실시예 9: 구조 유전자 mlcE 에 상응하는 cDNA 의 수득
1) 전체 RNA 의 제조
페니실륨 시트리눔의 전체 RNA 를 실시예 8 의 방법에 따라 제조했다.
2) 프라이머의 고안
실시예 8 에서 결정된 구조 유전자 mlcE 에 상응하는 완전한 길이의 cDNA 를 수득하기 위해 하기 프라이머를 고안하고 합성했다:
센스 프라이머 5'-gttaacatgtcagaacctctaccccc-3' (서열 목록의 서열 번호 35를 보라); 및
안티센스 프라이머 5'-aatatttcaagcatcagtctcaggcac-3' (서열 목록의 서열 번호 36을 보라).
프라이머는 구조 유전자 mlcE의 5'-말단 상류 영역의 서열, 및 3'-말단 하류 영역의 서열로부터 각각 유도된다. 포스포아미디트 방법에 따라 합성을 수행했다.
3) RT-PCR
mlcE의 유전자 생성물을 코딩하는 완전한 길이의 cDNA를 수득하기 위해 Takara RNA LA PCR 키트(AMV) 버전 1.1을 사용했다.
구체적으로, 전체 RNA 1 ㎍, 랜덤 9머 프라이머 2.5 pmol(키트에 포함되어 있음), 및 역전사효소 1 ㎕(키트에 포함되어 있음)을 포함하는 반응 혼합물 20 ㎕ 를 42℃에서 30 분 동안 인큐베이션하여 cDNA의 제 1 가닥을 생성했다. 이이서 역전사 효소를 99℃에서 5분 동안 가열하여 비활성화시켰다.
상기 cDNA의 제 1 가닥의 반응 혼합물의 총량, 센스 프라이머 40 pmol 및 안티센스 프라이머 40 pmol을 포함하는 제 2 반응 혼합물 100 ㎕를 94℃에서 2분 동안 인큐베이션했다. 94℃에서 30 초, 60℃에서 30 초 및 72℃에서 2 분인 인큐베이션 주기를 30회 반복하고, 72℃에서 5 분 및 4℃에서 18 시간 동안 인큐베이션하였다. 생성물을 아가로스 겔 전기영동하고 DNA를 겔로부터 회수했다. 생성물을 페놀-클로로포름 추출 및 에탄올 침전으로 정제하고, pCR 2.1을 사용하여 실시예 4에 기술된 방법과 유사한 방식으로 에스케리키아 콜라이 콤피턴트 세포 JM109 균주 (일본의 Takara Shuzo Co., Ltd.제)을 형질전환하는 데 사용했다. DNA 프래그먼트를 갖는 플라스미드를 보유하는 균주를 형질전환된 에스케리키아 콜라이로부터 선택하고, 균주에 보유된 플라스미드를 pCRexpE 로 명명했다.
생성된 재조합 DNA 벡터 pCRexpE의 삽입 DNA의 뉴클레오티드 서열을 결정했다. 삽입 DNA는 구조 유전자 mlcE에 상응하는 완전한 길이의 cDNA 를 포함했다. 그의 뉴클레오티드 서열 및 뉴클레오티드 서열로부터 추정된 펩티드의 아미노산 서열을 서열 목록의 서열 번호 37 및/또는 서열 번호 38 에 나타낸다.
mlcE (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 ORF10 였고 동일도는 70%였다.
실시예 10: 발현 벡터 pSAK700 의 작제
cDNA 발현 벡터 pSAK700은 실시예 1에 기술한 벡터 pSAK333 및 pSAK360 을 사용하여 작제했다.
pSAK333을 제한 효소 BamHI 및 HindIII (일본의 Takara Shuzo Co., Ltd.제) 모두로 절단하고, 이어서 아가로스 겔 전기영동을 하였다. 4.1 kb 프래그먼트를 겔로부터 회수하고, DNA 프래그먼트의 말단을 T4-DNA 폴리머라제(일본의 Takara Shuzo Co., Ltd.제)로 블런트말단화하였다.
EcoRI-NotI-BamHI 아답터(일본의 Takara Shuzo Co., Ltd.제)을 DNA 라이게이션 키트 버전 2(일본의 Takara Shuzo Co., Ltd.제)를 사용하여 상기에 언급된 DNA 프래그먼트에 연결하였다. 에스케리키아 콜라이 콤피턴트 세포 JM109 균주 (일본의 Takara Shuzo Co., Ltd.제)를 라이게이션된 DNA 로 형질전환했다. 아답터를 갖 는 플라스미드를 보유하는 균주를 형질전환된 에스케리키아 콜라이로부터 선택하고, 균주에 보유된 플라스미드를 pSAK410 으로 명명했다.
pSAK360 을 제한 효소 Pvu II 및 Ssp I 모두로 절단하고 전기영동하였다. 3-포스포글리세레이트 키나제(이하 "pgk"로 지칭함) 유전자의 프로모터 및 터미네이터 및 에스케리키아 콜라이로부터 나온 HPT 를 포함하는 DNA 프래그먼트(약 2.9 kb)을 겔로부터 회수했다.
상기에 언급한 회수된 DNA 프래그먼트를 DNA 라이게이션 키트 버전 2 (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 pSAK410 의 Pvu II 부위에 연결했다. 에스케리키아 콜라이 콤피턴트 세포 JM109 균주를 라이게이션된 DNA 로 형질전환했다. DNA 프래그먼트를 갖는 플라스미드를 보유하는 균주를 형질전환된 에스케리키아 콜라이로부터 선택하고, 균주에 보유된 플라스미드를 pSAK700 로 명명했다.
pSAK700의 작제는 도 4 에 나타낸다.
pSAK700은 효소 BamHI 및 NotI 각각에 대해 하나의 제한 효소 부위를 갖는다. pSAK700은 또한 암피실린 내성 유전자(이하 "Ampr"로 지칭함) 및 하이그로마이신 내성 유전자 HTP 를 선발 마커로 갖는다. 하기 실시예에서, 에스케리키아 콜라이를 숙주 세포로 사용할 경우, pSAK700 또는 외래 DNA 인서트를 포함하는 pSAK700 에 의해 형질전환된 세포의 선택을 적합한 배지에 암피실린 40 ㎍/ml 을 첨가함으로써 수행했다. 페니실륨 시트리눔 SANK13380을 숙주로 사용할 경우, pSAK700 또는 외래 DNA 인서트를 포함하는 pSAK700에 의해 형질전환된 세포의 선택을 적합한 배지에 하이그로마이신 200 ㎍/ml 을 첨가함으로써 수행했다.
실시예 11: cDNA 발현 벡터 pSAKexpE 의 작제
실시예 9에서 수득한 재조합 DNA 벡터 pCRexpE 를 제한 효소 HpaI 및 SspI (일본의 Takara Shuzo Co., Ltd.제)의 존재하에 37℃에서 2 시간 동안 반응시키고, 반응 생성물을 아가로스 겔 전기영동하였다. 1.7 kb 주위의 mlcE의 완전한 길이의 cDNA를 포함하는 밴드를 겔로부터 회수했다.
pSAK700 를 제한 효소 NotI(일본의 Takara Shuzo Co., Ltd.제)와 37℃ 에서 1 시간 동안 반응시킨 후, 벡터의 말단을 T4 DNA 폴리머라제(Takara Shuzo Co., Ltd., 일본)로 37℃ 에서 5 분 동안 블런트말단화하였다. 이어서, 벡터를 페놀 클로로포름으로 추출하고 에탄올로 침전시켰다. 침전된 DNA를 소량의 TE 에 용해시켰다. 알칼라인 포스파타제를 상기에 첨가하고 65℃에서 30 분 동안 인큐베이션했다. 상기에서처럼 제조된 pSAK700를 DNA 라이게이션 키트 버전 2 (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 단계 1)에서 수득된 DNA 프래그먼트 1.7 kb에 라이게이션했다. 에스케리키아 콜라이 콤피턴트 세포 JM109 균주를 라이게이션된 DNA를 사용하여 형질전환했다. cDNA 발현 벡터에 의해 형질전환된 에스케리키아 콜라이 균주를 수득했다.
본 실시예에서 수득된, 에스케리키아 콜라이 pSAKexpE SANK 72499 로 명명된 형질전환된 에스케리키아 콜라이는 미생물 수탁에 관한 부다페스트 조약에 따라 2000년 1월 25일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 FERM BP-7005로 수탁됐다.
실시예 12: 구조 유전자 mlcR 에 상응하는 cDNA 의 수득
1) 전체 RNA 의 제조
페니실리움 시트리눔의 전체 RNA 를 실시예 8의 방법에 따라 제조했다.
2) 프라이머의 고안
실시예 8에서 결정된 구조 유전자 mlcR에 상응하는 완전한 길이의 cDNA 를 수득하기 위해 하기 프라이머를 고안하고 합성했다:
센스 프라이머 5'-ggatccatgtccctgccgcatgcaacgattc-3' (서열 목록의 서열 번호 39를 보라)
안티센스 프라이머 5'-ggatccctaagcaatattgtgtttcttcgc-3' (서열 목록의 서열 번호 40을 보라).
프라이머를 구조 유전자 mlcR 의 5'-말단 상류 영역의 서열, 및 3'-말단 하류 영역의 서열로부터 각각 고안했다. 포스포아미디트 방법에 따라 합성을 수행했다.
3) RT-PCR
mlcR의 유전자 생성물을 코딩하는 완전한 길이의 cDNA 를 수득하기 위해 Takara RNA LA PCR 키트(AMV) 버전 1.1 을 사용했다.
구체적으로, 전체 RNA 1 ㎍, 랜덤 9머 프라이머 2.5 pmol(키트에 포함되어 있음), 및 역전사효소 1 ㎕(키트에 포함되어 있음)을 포함하는 반응 혼합물 20 ㎕ 를 42℃에서 30 분 동안 인큐베이션하여 cDNA의 제 1 가닥을 생성했다. 이이서 역전사 효소를 99℃에서 5분 동안 가열하여 불활성화시켰다.
상기 cDNA의 제 1 가닥의 반응 혼합물의 총량, 센스 프라이머 40 pmol 및 안티센스 프라이머 40 pmol을 포함하는 제 2 반응 혼합물 100 ㎕를 94℃에서 2 분 동안 인큐베이션했다. 94℃에서 30 초, 60℃에서 30 초 및 72℃에서 2 분인 인큐베이션 주기를 30회 반복하고, 72℃에서 5 분 및 4℃에서 18 시간 동안 인큐베이션하였다. 생성물을 아가로스 겔 전기영동하고 DNA 를 겔로부터 회수했다. 생성물을 페놀-클로로포름 추출 및 에탄올 침전으로 정제하고, pCR 2.1을 사용하여 실시예 4 에 기술된 방법과 유사한 방식으로 에스케리키아 콜라이 콤피턴트 세포 JM109 균주 (일본의 Takara Shuzo Co., Ltd.제)를 형질전환하는 데 사용했다. DNA 프래그먼트를 갖는 플라스미드를 보유하는 균주를 형질전환된 에스케리키아 콜라이로부터 선택하고, 균주에 보유된 플라스미드를 pCRexpR로 명명했다.
생성된 재조합 DNA 벡터 pCRexpR 의 삽입된 DNA 의 뉴클레오티드 서열을 결정했다. 삽입된 DNA는 구조 유전자 mlcR 에 상응하는 완전한 길이의 cDNA를 포함했다. 그의 뉴클레오티드 서열 및 뉴클레오티드 서열로부터 추정된 펩티드의 아미노산 서열을 서열 목록의 서열 번호 41 및/또는 서열 번호 42 에 나타낸다.
mlcR (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 lovE 였고 동일도는 34%이다.
실시예 13: cDNA 발현 벡터 pSAKexpR 의 작제
실시예 12에서 수득한 재조합 DNA 벡터 pCRexpR을 제한 효소 BamHI (일본의 Takara Shuzo Co., Ltd.제)의 존재하에 37℃ 에서 2 시간 동안 반응시키고, 반응 생성물을 아가로스 겔 전기영동하였다. 1.4 kb 주위의 완전한 길이의 mlcR cDNA 를 포함하는 밴드를 겔로부터 회수했다.
pSAK700 를 제한 효소 BamHI(일본의 Takara Shuzo Co., Ltd.제)와 37℃ 에서 1 시간 동안 반응시킨 후, 알칼라인 포스파타제(일본의 Takara Shuzo Co., Ltd.제)를 첨가하고 65℃에서 30 분 동안 인큐베이션했다. 상기에 기술된 것처럼 BamHI 로 절단된 pSAK700을 DNA 라이게이션 키트 버전 2 (일본의 Takara Shuzo Co., Ltd.제)를 사용하여 단계 1)에서 수득된 DNA 1.4 kb 프래그먼트에 라이게이션했다. 에스케리키아 콜라이 콤피턴트 세포 JM109 균주를 라이게이션된 DNA로 형질전환했다. cDNA 발현 벡터에 의해 형질전환된 에스케리키아 콜라이 균주를 수득했다.
본 실시예에서 수득된, 에스케리키아 콜라이 pSAKexpR SANK 72599로 명명된 형질전환된 에스케리키아 콜라이는 미생물 수탁에 관한 부다페스트 조약에 따라 2000년 1월 25일자로 통상산업성 공업기술원 생명공학 공업기술연구원에 수탁 번호 FERM BP-7006으로 수탁됐다.
실시예 14: ML-236B 생산 미생물의 형질전환
1) 원형질체의 제조
페니실륨 시트리눔 SANK 13380 균주의 배양물의 슬랜트로부터의 포자를 PGA 아가 배지에 접종하고, 이어서 26℃에서 14 일 동안 배양했다. 이어서, 페니실륨 시트리눔 SANK 13380 균주의 포자를 배양물로부터 회수하고, 포자 1 x 108 개를 YPL-20 배양 배지 80 ml 에 접종하고, 26℃에서 1 일 동안 인큐베이션했다. 현미경으로 관찰하여 포자의 발아를 확인한 후, 발아 포자를 실온, 5000 x G에서 10 분 동안 원심분리하고, 침전물로 회수했다.
포자를 멸균수로 3회 세척하여 원형질체를 수득했다. 즉, 자이몰리아제 20T (Seikagaku Kogyo corporation제) 200 mg 및 키틴아제(Sigma 사제) 100 mg 을 0.55 M 염화마그네슘 용액 10 ml 에 용해하고, 실온, 5000 x G에서 10 분 동안 원심분리했다. 생성된 상층액을 효소액으로 사용했다. 효소 용액 20 ml 및 발아 포자 0.5 g(습윤 중량)를 100 ml 코니칼 플라스크에 넣고 온화하게 진탕시키면서 30℃ 에서 60 분 동안 인큐베이션했다. 발아 포자가 원형질체가 되는 것을 현미경을 사용하여 확인한 후, 반응액을 3G-2 유리 필터(HARIO corporation제)을 통해 여과했다. 여과액을 실온, 1000 x G에서 10 분 동안 원심분리하고, 이어서 침전물로 원형질체를 회수했다.
2) 형질전환
단계 1)에서 수득한 원형질체를 0.55 M 염화마그네슘 30 ml로 2회, 0.55 M 염화마그네슘, 50 mM 염화칼슘 및 10 mM 3-모르폴리노 프로판 술포네이트로 구성된 용액(pH 6.3 이하, 이후 MCM 용액으로 지칭함) 30 ml로 1회 세척했다. 이어서 원형질체를 4%(w/v) 폴리에틸렌 글리콜 8000, 10 mM 3-모르폴리노 프로판 술포네이트, 0.0025%(w/v) 헤파린(Sigma corporation제), 50 mM 염화마그네슘의 용액(pH 6.3 이하, 이후 "형질전환액"으로 지칭함) 100 ㎕ 에 현탁시켰다.
약 5 x 107 개의 원형질체를 함유하는 형질전환액 96 ㎕ 및 pSAKexpE 또는 pSAKexpR 120 ㎍을 포함하는 TE 10 ㎕를 혼합하고, 얼음 상에 30 분 동안 두었다. 여기에 20%(w/v) 폴리에틸렌 글리콜, 염화마그네슘 50 mM, 3-모르폴리노 프로판 술폰산 10 mM의 용액 (pH 6.3) 1.2 ml을 첨가했다. 이어서 액체를 온화하게 피펫팅하고 실온에서 20 분 동안 두었다. 여기에 MCM 용액 10 ml 를 첨가하고, 온화하게 혼합하고, 실온, 1000 x G에서 10 분 동안 원심분리했다. 형질전환된 원형질체를 침전물로부터 회수했다.
3) 형질전환된 원형질체의 세포벽의 재생성
단계 2)에서 수득한 형질전환된 원형질체를 액체 VGS 중간층 아가 배지 5 ml 에 현탁시키고, 고체화된 VGS 하층 아가 배지 플레이트 10 ml 상에 놓았다. 플레이트를 26℃에서 1 일 동안 인큐베이션한 후, 플레이트 당 하이그로마이신 B 5 mg 을 포함하는 액체 VGS 상층 아가 배지(하이그로마이신의 최종 농도 200 ㎍/ml) 10 ml 을 상부에 놓았다. 26℃에서 14 일 동안 인큐베이션한 후, 두개의 균주(즉, pSAKexpE, 또는 pSAKexpR 로 형질전환된 원형질체로부터 유래한 상기 균주)를 하이그로마이신 B 200 ㎍/ml 을 함유하는 PGA 아가 배지에 계대배양하고, PGA 아가 배지로 제조된 슬랜트상에서 계대배양하고, 26℃ 에서 14 일 동안 인큐베이션했다.
슬랜트를 4℃에서 보관했다.
시험예 1: 형질전환된 균주와 원래 균주의 ML-236B 생합성 능력의 비교
실시예 14 에서 수득한 형질전환된 균주 및 페니실륨 시트리눔 SANK 13380 을 배양하고 각각의 배양물의 ML-236B 량을 측정했다.
포자의 5 mm 정방형 접종물을 실시예 14에 기술된 것처럼 형질전환된 균주가 배양된 슬랜트로부터 배양하고, 페니실륨 시트리눔 SANK 13380 과 관해서는 실시예 2에 기술된 슬랜트로부터 배양했다. 세포를 100 ml 코니칼 플라스크 내의 MBG3-8 배지 10 ml에 접종하고, 이어서 24℃에서 2 일 동안 진탕시키면서 배양하고, 50%(w/v) 글리세린 용액 3.5 ml 를 첨가했다. 이어서 24℃에서 10 일 동안 진탕시키면서 배양을 지속시켰다.
0.2 N 수산화나트륨 50 ml을 배양물 10 ml에 첨가하고, 26℃에서 1 시간 동안 진탕시키면서 인큐베이션했다. 배양물을 실온, 3000 x G에서 2 분 동안 원심분리했다. 상층액 1 ml을 회수하고, 75% 메탄올 9 ml와 혼합하고 HPLC에 가했다.
SSC-ODS-262(직경 6 mm, 길이 100 mm, Senshu Kagaku Co.Ltd. 제)을 HPLC 칼럼으로 사용하고, 75%(v/v) 메탄올-0.1%(v/v) 트리에틸아민-0.1%(v/v)아세트산을 이동상으로 사용했다. 실온에서 유속 2 ml/분으로 용출을 수행했다. 상기 조건하에, 칼럼에 첨가한 후 4 분에 ML-236B가 용출됐다. UV 검출기로 236 nm 의 흡수 파장에서 검출을 수행했다.
ML-236B 생합성 능력은 8 개의 pSAKexpE 형질전환 균주 중 3 개의 균주에서 증가했다. 상기 균주의 ML-236B 생합성 능력은 원래 균주와 비교했을 때 평균적으로 10% 높았다. 상기 3 개의 균주의 ML-236B 생합성 능력은 또한 단포자처리 등과 같은 계대배양 후 안정적으로 유지되었다. 상기 결과는 pSAKexpE 의 인서트가 ML-236B 생합성 촉진 cDNA인 것을 나타낸다.
ML-236B 생합성 능력은 pSAKexpR 형질전환 균주 중 5 개 균주에서 증가했다. 상기 균주의 ML-236B 생합성 능력은 원래 균주에 비해 평균 15% 높았다. 상기 5 개의 균주의 ML-236B 생합성 능력은 또한 단포자 처리 등과 같은 계대배양 후 안정 적으로 유지됐다. 상기 결과는 pSAKexpR의 인서트가 ML-236B 생합성 촉진 cDNA인 것을 나타낸다.
따라서, 본 발명에 따른 ML-236B 생산 미생물로부터 수득된 ML-236B 생합성 촉진 cDNA 는 ML-236B 생산 미생물에 도입되었을 때 ML-236B 생산 미생물에서 ML-236B 생합성을 촉진한다.
실시예 15: 구조 유전자
mlc
A 내지 D에 상응하는 cDNA의 서열의 결정
구조 유전자 mlcA 에 상응하는 cDNA의 서열을 결정했다.
TAKARA LA PCR 키트 버전 1.1(Takara Shuzo Co., Ltd.제)로 제 1 가닥 cDNA 를 합성했다. 제 1 가닥 cDNA 를 주형으로 하고 수개의 다른 쌍의 올리고뉴클레오티드를 프라이머로 사용하여 cDNA의 전체 또는 부분 영역의 증폭을 위해 수차례의 PCR을 수행했다.
94℃에서 30 초, 60℃에서 30 초 및 72℃에서 5 분인 주기를 The Big Dye Primer/Terminator Cycle Sequencing Kit 및 The ABI Prism 377 서열(PE Applied Biosystems)를 사용하여 30회 반복했다.
각각의 반응의 생성물을 플라스미드 pCR 2.1 에 개별적으로 삽입했다.
각각의 재조합 플라스미드의 에스케리키아 콜라이 형질전환체를 수득했다.
상기 형질전환체로부터 수득된 재조합 플라스미드의 각각의 인서트의 뉴클레오티드 서열을 결정했다.
엑손 및 인트론의 서열을 상기 언급된 몇몇 RT-PCR 생성물의 뉴클레오티드 서열과 구조 유전자 mlcA 의 뉴클레오티드 서열을 비교한 것을 기초로 결정했다.
이어서, 구조 유전자 mlcA 에 상응하는 cDNA의 서열을 결정했다(서열 번호 43). 상기 cDNA 에 의해 코딩되는 폴리펩티드의 상응하는 아미노산 서열을 예측하고(서열 번호 44) 폴리펩티드의 기능을 아미노산 서열을 사용한 상동성 조사를 기초로 추측했다.
mlcA (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 LNKS(lovB)였고, 동일도는 60%이다.
유사한 방식으로, 구조 유전자 mlcB 에 상응하는 cDNA의 서열을 결정했다(서열 번호 45). 상기 cDNA에 의해 코딩되는 폴리펩티드의 상응하는 아미노산 서열을 예측하고(서열 번호 46) 폴리펩티드의 기능을 아미노산 서열을 사용한 상동성 조사를 기초로 추측했다.
mlcB (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 LDKS(lovF)였고, 동일도는 61%이다.
유사하게, 구조 유전자 mlcC 에 상응하는 cDNA 의 서열을 측정했다(서열 번호 47). 상기 cDNA에 의해 코딩되는 폴리펩티드의 상응하는 아미노산 서열을 예측하고(서열 번호 48) 폴리펩티드의 기능을 아미노산 서열을 사용한 상동성 조사를 기초로 추측했다.
mlcC (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 lovA 였고, 동일도는72%이다.
또한, 구조 유전자 mlcD 에 상응하는 cDNA의 서열을 결정했다(서열 번호 49). 상기 cDNA 에 의해 코딩되는 폴리펩티드의 상응하는 아미노산 서열을 예측하고(서열 번호 50) 폴리펩티드의 기능을 아미노산 서열을 사용한 상동성 조사를 기초로 추측했다.
mlcD (폴리펩티드)에 대해 가장 최근에 공지된 서열은 로바스타틴의 생합성에 관련된 유전자 클러스터 상의 ORF8 였고, 동일도는 63%이다.
서열 번호 1 또는 서열 번호 2 상의 각각의 구조 유전자의 엑손의 위치가 결정되었고, 하기와 같다:
서열 번호 1 또는 서열 번호 2 상의 각각의 구조 유전자의 전사 종결 부위의 위치가 하기와 같이 결정되었다:
실시예 16: 유전자 붕괴 연구
피. 시트리눔(P. citrinum)의 구조 유전자 mlcA, B 또는 D 를 상동성 재조합을 사용하여 부위 지정(directed) 돌연변이를 통해 붕괴시켰다.
피. 시트리눔의 구조 유전자 mlcA-붕괴 돌연변이체를 수득하기 위한 재조합 플라스미드를 플라스미드 pSAK333을 사용하여 작제했다.
pML48 인서트 상의 mlcA 유전자좌의 4.1-kb 내부 KpnI 프래그먼트를 회수, 정제하고 DNA Blunting Kit (Takara Shuzo Co., Ltd.)로 블런트 말단화하고 PuuII로 절단된 pSAK333에 라이게이션했다. 생성된 플라스미드를 pdismlcA로 명명했다.
피. 시트리눔 SANK13380을 pdismlcA로 형질전환했다.
pdismlcA 형질전환체의 게놈 DNA 의 서던 혼성화를 수행하여 구조 유전자 mlcA의 붕괴를 확인했다.
생성된 mlcA-붕괴 돌연변이체는 ML-236B 또는 그의 전구체를 전혀 생성하지 않는다.
피. 시트리눔의 구조 유전자 mlcB-붕괴 돌연변이체를 수득하기 위한 재조합 플라스미드를 플라스미드 pSAK333을 사용하여 작제했다.
pML48 인서트 상의 mlcB 유전자좌의 1.4-kb PsI-BamHI 프래그먼트를 회수, 정제하고 DNA Blunting Kit (Takara Shuzo Co., Ltd.)로 블런트 말단화하고 PuuII로 절단된 pSAK333에 라이게이션했다. 생성된 플라스미드를 pdismlcB로 명명했다.
피. 시트리눔 SANK13380을 pdismlcB로 형질전환했다.
pdismlcB 형질전환체의 게놈 DNA의 서던 혼성화를 수행하여 구조 유전자 mlcB 의 붕괴를 확인했다.
생성된 mlcB-붕괴 돌연변이체는 ML-236B를 생성하지 않고 ML-236B 의 전구체인 ML-236A를 생성했다.
피. 시트리눔의 구조 유전자 mlcD-붕괴 돌연변이체를 수득하기 위한 재조합 플라스미드를 플라스미드 pSAK333을 사용하여 작제했다.
pML48 인서트 상의 mlcD 유전자좌의 1.4-kb KpnI-BamHI 프래그먼트를 회수, 정제하고 DNA Blunting Kit (Takara Shuzo Co., Ltd.)로 블런트 말단화하고 PuuII로 절단된 pSAK333에 라이게이션했다. 생성된 플라스미드를 pdismlcD로 명명했다.
피. 시트리눔 SANK13380 을 pdismlcD 로 형질전환했다.
pdismlcD 형질전환체의 게놈 DNA 의 서던 혼성화를 수행하여 구조 유전자 mlcD 의 붕괴를 확인했다.
생성된 mlcD-붕괴 돌연변이체에 의해 생성된 ML-236B의 양은 형질전환되지 않은 대조 숙주의 양의 약 30% 였다.
실시예 17: pSAKexpR 형질전환체의 mlcR 의 기능 분석
실시예 12 에서 수득했고 각각 TR1 또는 TR2로 명명한 pSAKexpR 형질전환체 2 개, 및 형질전환되지 않은 숙주 세포, 페니실륨 시트리눔 SANK13380을 MBG3-8 배지에 접종하고 실시예 8 에 기술된 것처럼 개별적으로 인큐베이션했다.
전체 RNA 를 실시예 8 에 기술된 배양물 각각으로부터 추출했다.
상기 전체 RNA 를 주형으로 하고 구조 유전자 mlcA, B, C, D, E 또는 R 의 뉴클레오티드 서열을 기초로 고안된 올리고뉴클레오티드 쌍을 프라이머로 사용하여 RT-PCR 을 수행했다.
형질전환되지 않은 페니실륨 시트리눔 13380, 및 TR1, TR2로 명명한 2 개의 형질전환체에 대한 RT-PCR 분석의 결과를 도 5에 나타낸다.
구조 유전자 mlcA, B, C, D 및 R이 pSAKexpR 형질전환체에서 배양의 첫째, 둘째 및 셋째 날에 발현했다.
대조적으로, 상기 구조 유전자 모두가 형질전환되지 않은 숙주 세포에서 배양의 셋째 날에만 발현했다.
pSAKexpR 형질전환체와 형질전환되지 않은 숙주 세포 사이의 구조 유전자 mlcE 의 발현에서의 차이는 없었다.
상기 결과는 구조 유전자 mlcR에 상응하는 cDNA 에 의해 코딩되는 단백질이 ML-236B 생합성에 관련된 유전자 클러스터에 위치한 일부의 다른 구조 유전자(예를 들어 mlcA, B, C, D)의 전사를 유도한다는 것을 암시한다.
실시예 18: pSAKexpE 형질전환체의 mlcE 의 기능 분석
실시예 12 에서 수득되고 TE1으로 명명된 pSAKexpE 형질전환체, 및 형질전환되지 않은 그의 숙주 세포, 페니실륨 시트리눔 SANK13380을 MBG3-8 배지에 접종하고 실시예 8 에 기술된 것처럼 개별적으로 인큐베이션했다.
전체 RNA를 실시예 8 에 기술된 배양물 각각으로부터 추출했다.
상기 전체 RNA를 주형으로 하고 구조 유전자 mlcA, B, C, D, E 또는 R 의 뉴클레오티드 서열을 기초로 고안된 올리고뉴클레오티드 쌍을 프라이머로 사용하여 RT-PCR을 수행했다. 본 실시예에 사용된 프라이머는 이전 실시예의 표의 것과 동일했다.
형질전환되지 않은 페니실륨 시트리눔 13380, 및 TE1으로 명명한 형질전환체에 대한 RT-PCR 분석의 결과를 도 6에 나타낸다.
구조 유전자 mlcE가 pSAKexpE 형질전환체에서 배양의 첫째, 둘째 및 셋째 날 에 발현했다.
대조적으로, 구조 유전자 mlcE가 형질전환되지 않은 숙주 세포에서 배양의 셋째 날에만 발현했다.
반대로, pSAKexpE 형질전환체와 형질전환되지 않은 숙주 세포 사이의 구조 유전자 mlcA, B, C, D 및 R의 발현에서의 차이는 없었다(데이타는 나타내지 않음).
상기 결과는 구조 유전자 mlcE에 상응하는 cDNA에 의해 코딩되는 단백질이 구조 유전자 mlcA, B, C, D 및 R과 독립적으로 ML-236B 생합성을 촉진한다는 것을 암시한다.
ML-236B는 HMG-CoA 리덕타제의 억제제이고 상기의 다른 억제제, 프라바스타틴을 제조하는데 유용하다. ML-236B 생산 미생물을 사용한 ML-236B의 제조는 상기 미생물에 존재하는 폴리케티드 신타제 클러스터에 관련된 유전자를 코딩하는 폴리뉴클레오티드를 사용하여 증강된다.
<110> Sankyo Company. Limited
<120> Genes from a Gene Cluster
<150> JP 2000-116591
<151> 2000-04-18
<150> JP 2000-117458
<151> 2000-04-19
<160> 62
<170> KopatentIn 1.71
<210> 1
<211> 34203
<212> DNA
<213> Penicillium citrinum
<400> 1
gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca 60
gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc 120
gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat 180
attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata 240
tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat 300
gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc 360
cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg 420
gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt 480
ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat 540
gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc 600
cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg 660
tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca 720
gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt 780
ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt 840
tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc 900
acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc 960
caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt 1020
ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc 1080
accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata 1140
tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt 1200
tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta 1260
acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa 1320
agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg acgccgaatt 1380
caggatagat ttgccatctg ctctattgcc aatttctaat ccatctttat catgaacaac 1440
actcaaacca cacatctgaa ttcacggcgc tgaacgatct aggccaactt cagagccggg 1500
ttcatcgaga acatagtgag gattgaagaa aagtggtcta caaaggcctg agcgtgctca 1560
gggccataca gcgagctctg aagtttgaca tgaatgagtg ggtccttggt agggtcatcc 1620
cacatctcga gaacgatgtc ataaggagtg cgctcacggg aagcgagaac actcgtcatt 1680
ttggcattgc caattgagcc actctccgct tgaccctgct tgtaatcaaa gacagcctgg 1740
aacaaggggg cgtgtgtctg agtcttgggt tcctcgcctg aggtagggag attcaggcct 1800
agacagtcga ggatgacgcc atacggcacc cgcgcgtgtt gcatggcctc acgcacactg 1860
tccttggtgg ctacaaggtg ctcgccgaat gtcttgctgc cgacgaactc atcaaagcgc 1920
aggggaagca cgttagcgaa aaagcccatc gccgaaattt cttccatggt ggatcggttg 1980
gtttcggcga ggccgatggt tatgtctttg ctgccggtaa gacgcgccaa caaaacgtgg 2040
taggcggcca ggtagaactg catgggggtt gccttgtgct tgcggctccg ctctttgatt 2100
cggaaggcga ccatgggatc taaacgagca attgcttcat actgctgcca cgtgaatggc 2160
tgtatttgct gctgctctga attggcagca gggtcattga tcagattcat gatgggaagc 2220
acggttggcg cagatgacga gactttgcta tgcatggact tccagaacgc gatatcgtcc 2280
cccattcgcc cattttccag gttttcccgc tgttggacgg ctagatcaga gaattgggtc 2340
gatggtcgct gcattttcac cccgctgtaa atctgcccga tctcattgaa caggttttct 2400
gttgttgagc catcaccaac taatctgtgg tagccgatta ccaacaggtg gtcatctgtg 2460
ccccagtaga aatcaacgag tctgagagtg tcacctgtgg agatgctata gtttgtcttc 2520
tcgagtttcc ggtactcttc ctctgcctcc gcagcgttgt tcacctgaac aaagtgcact 2580
ctgttctccg ggttcttgag aaccacttgg acgggaccat ttaaatcgct gctatagtca 2640
tcgccagtaa caaagcacgt acggaagatc tcgtgacggc gcaatgaggc tttcagagcc 2700
cgcctcaacc ggtcgaggtc aatggtaccc ttcatgaaca tgccaatagt gttgttgaag 2760
atggtatgat cttttaccat ttgttgctgc ctccaggaat actcctggcc aagggacaac 2820
ctctcgcgac gaagaatctt acggcctccc tgctcattat cgtcctcttg ctcttcatcc 2880
tcttcggctg acgacgcatc tgtgctggta gcagagcttg cttcatcatg gctgtctgtt 2940
ggtgtcggag aagccccgct gtccgaggtt cccgtggaat caccaatttg caacagcagc 3000
ggaatggatg tagctgggag tcgggtggcc gcgtcgtcgg caagatcagc gacagaagca 3060
ccgccaagta ccctcaagag tgggaggtca aggtagagtt gctttgagaa ccatgagccg 3120
acagtcactg cacccaagga gtcgacacct tgatcaatga gaggaatggt tgggtccacg 3180
ctctccccgt ccgaaacttg gagggtaaca cggagtttct cagatagacc atctgcaact 3240
ttgttagttt gaactcgata tcaggaaacg catgagagat aacttaccaa tcacgatttg 3300
ccgaacttgg tctaaagttg ttgcttgttt gagctggtcg gcaatggagc ctttagaccc 3360
tgatccattg tcgccaccgt ctccgcgttg accgggaatt ttgaagtttc cgaaacgagg 3420
gtcgttgaag taaataattc gatcttgaag cgcagggtca agatctggga tacccgtggt 3480
aagctcaagg tccgccatgt caatgaccgt cttgcgctgt ggttgctgcc gggcacgctg 3540
gtcagacacg accgcttcgg cgaaaagcgt gtgcagctca tgctcttcaa ctgagtcaaa 3600
catgaaacgg atagcatcaa agtcctcctc catctcggcc ctcgtgacaa accctacacc 3660
gtaaacggca ccaatatcga tggttgatcc ctgtggttgt gcgttagtaa cttgacgtcg 3720
atgcatgata attcaggggt agaaaatacc gccaatcctc tggcgcaccg ttgctgggcc 3780
agagcctgta ggtaggcatt cgcagcgcca tagttggact ggccaggatt gccaataact 3840
gcaacaatgg acgaaaacat gatgaagaag tcgagcgcct tgctgcccgt ctgttcggag 3900
aaccgttcat gaagaatgcg tgctccttgt accttgggct tcaacaccat gtccatcatc 3960
tggtggtcca tgttcttcag catgacatcc tgcagcacca aaggcccgaa cgcgatgccg 4020
gcaacaggtg gcaacttcat atcgacaagc ttgccaaggc cagcatcgac tgaatcctca 4080
ttggcaacat ccctaaagaa agtaattgga taagtaaacg aggatgtggt agcaaggtgt 4140
gatgtgatat caatcaactt acattgacag aacggtgatg tcaccaccaa gtgcctccat 4200
gttggcgatc catttgggat caagtcgagg gttccggcta gtgagcacaa catggcgggc 4260
gccatgcaag atcatccagc gacagagaga gcgaccaagg tccccggtaa gaccaacaag 4320
caaatacgtc ttcttgttgg aaaataagtt accagagtcg atggggcaaa tcctagcgga 4380
cacctcattt tccttccagt cgatgacggt ggccagattg aagcgttggt cattgtggtt 4440
gacagagagc tgaccaggca agagaatttg tgtggctgta ataactttct cagtgtcgtc 4500
gacagtcgac gcagagacgg tattttttgc cattgccaca gagtgctcga ggattggaat 4560
atcctcaaca tgactaactt tgtatgtgga agctgtactt cggataagat agtcaccact 4620
gtacatgaag caactgggtg gtagcaactt ggccaaacgg ttggttatcc cggcagcagt 4680
ccggtcggta gacaagtcaa agaatgccat catgtttgtc ggcaggctgt gtttcagccg 4740
agcgtcggtt tccttggcat gtaatcggat ccaaggagcc ggaatagttt tgacgtcgga 4800
cagagttgtt gccaaatgaa cctgaacacc gtaggttttg gccgactcca gaattgcttt 4860
gacgcagaag attgggggct ccataatcag aattgatgca tcagagccaa aggactgagc 4920
gctagagaga attgtttcgg caaggagggc tgcagctgtg gacaacaaga aggaactatc 4980
ctcgccttcc gccatgttat cgggcagact atgcatgtag tttctcggta catgcagtat 5040
agatccattc ttctcagcca gggcgactac aggcacctca catgtattct ccagaatact 5100
gccctgcacg acatggaagt atccgagatg gcccacgcga attgcctggg gaagagcgta 5160
gcgaacacga acagttgctt ttccagcatg acgagcgtct tctaacgaat cacacgtctc 5220
ggttgactca agatagtaca tcgatgagga tgctcccctc gcctctttca gtgcaatggc 5280
cgtcttggac gaattaaagt taccgaaaat tggacgacga gacgagttca tacggtcgtt 5340
cctagcaata tcctgcttca aacgagggac ccaggcacga cccttgcacc agtacacttc 5400
gggctcatga gtccatgtta ttgattccaa aagctgatca tcgctctcct cgaagcgcaa 5460
aagttgctca acgaagaatt tggtgtctag gttctccaca gtatcgacat cgaagacgtg 5520
cgttcccaag tcagggttct cgagcttgat tgtcctcaac attccgatgg tgctggcctg 5580
gtggggatga tcaatccagg cattctctgt cagccacatc atgcgtccgg cgtagaagag 5640
aagagacttg actgcctcaa acttgtcctc ttcaaggttg caaaacactt catcatcaag 5700
ttccgagagg atgacaaaag tcgacttagg ctgcaaggcc gggtcgtcga gaacactttc 5760
cagccgcttg acggagtgga tgtgtctatg cggtagggca gctttcatgt cgttcaaaat 5820
gcgttcggtt tttgtcgatt cgccaccgat aaccactaat ggcgggtatg agtccttcaa 5880
tggagcagaa agtggatcat acaaacgctc aacggtggca tccacagcat gtgtactgaa 5940
gacagacggg atcaaatcat cctctcgatc aagtgtccga ctatcgacgc cagagaaccc 6000
aactctcttg agggtatgct cccattggtc aacggacccc gaggcactca aagcacgagt 6060
ttcgtcttct ccagtccatc gatcagcgaa aagcccagag atgaaggcga ggcgagcagg 6120
ctcgcgatgg gtgaccccga aagtaaccaa gtgaccaccc ggcttgagca aggaccttat 6180
gtgagccaat ttttcctcga agttggagct ggcatggagg acatcggatg caataatcag 6240
atcgtaggag tgaggcttga atccttgctc tgctgggctt ctgttgatgt ctagtgcctc 6300
aaactgcatg agaccgtcga attcggaaag ttgttcacgg gccttgccaa taacatccgc 6360
cgagatgtca gtgcaagtgt aactgttgaa accaagttga ggtgatgcaa gaacgcgctt 6420
cgtggcgatg cctgtaccca agcctaaaaa gcgaacgaca gattagcaaa ctgcctagtt 6480
acttacattt cagattcgac ttaccgatct caaggatatc aatggattgg tagcgatgag 6540
caatttggct aaccagatcc tgaacgacgt gtattgctga gccaaaggcg agcttgttgg 6600
tatagtactc ggtgaacaac ccatcgcggt tcatgatatc caaaggatcc ccgttcccgc 6660
gaacaattga aattaattct ttgcctaccc tttggatcag gcgcacatgt gggtgggacg 6720
agttgcttca agtaaaaggt taatataaaa gaatgaaaaa acacggaaca gctttgggtg 6780
tacctttcac acatttgctc aatgtgaaca gaagtgtcct cctcccaaga ctcctggtac 6840
cactgatggt ggccagcccg agcatcggcc tgaacctggt cacaccattc aatgtacttc 6900
tgggaatgga ggtcggcatt ttgacggtcg tcgggggtta tctgggctag gaaggatttg 6960
atgtagaagt aaacgattcg ctcgatggtc agaatgtcct ccttgtcccg agctatgatc 7020
aacgtcgcag ggtcctccag cagtttttcg ggcgtgaggg gtccccagac ccactttgcg 7080
aagattcggt ggtcggtcga agcagtcggg ggagagaaag gcttaaagac aatgttatca 7140
acttggaaaa gcgttgtctt ggtcgaatcg tacaccgtga tgtcgccgct caggaaatca 7200
cccttgtcgt gtgtgttgat tgtgtcaaac gcaagctcgg tttcaccaga attacccgcc 7260
gatatacaga gcgatggaat cagagtcact ctgtcaacgt gagtaggcac gtacaatgag 7320
cgtaggcgac gatctcctgg agaggaatac gctccaatga cagtctggaa cgcgatgtcc 7380
aggggcgctg ggtggagcaa gaggggctca ttgcgcaatt catccttaag tggaaggaaa 7440
gccaaggtgc cgctagcttt ggagtcggcc cttctcatgg tctgcaaacg acggaagtct 7500
ttgctgtagt catacccaag gaggtcaagt tcccgataga agaaatcgat gttgacattg 7560
ttcatctggg ggtactcttc ctcaggtggc ggcaaaagct gcgatgacgg tgatgcctcg 7620
ccaagggtta tgacgatttg gcctttggcg gatgtcgaaa gctcactctc ctttgccaga 7680
caggaatcaa taacaaattt gaccgtgact tggccatccg catcattgtc actggtgact 7740
tcggctgtca agttcagctc cacggaggtg ttttcatctt caaacacgat ggctttgttg 7800
atgctcatgt ccaagatttc caggagctga acttgggcgg cacgctcacc agccaccttc 7860
atggcagctt ccatggccat aattatgtac ccagcagcgg ggaacacagt ctggccttgt 7920
agcgcatgac cgtcgagcca ttccagatcc cggggcctga tgaagtttgt ccactggaag 7980
gtcgatgctg tgctgtaaga agaaagcttt ccaagcagaa gatggggcgc acctccacga 8040
agatgctggc gggtggagcg agattctgcc cagtattgac gagtatgatc ccaagagtat 8100
gtgggcaatg actttgacag gttttgaacg gcacgatcgg gccggacttg ttgtacgaag 8160
ccctcggcgt cgatactccg aactccgaaa cgctcccaaa tgtatcccag acctccagca 8220
aaagcgtcca catcgtcaac gtttcgtgcc aagcacccgg tatacggcag ctccacaccg 8280
gcaagagcat ccttgatggt ggctagacac ggacccttga gagcagggtg ggcgccaatt 8340
tcgatggcga cgtcgattag acgatgagtg atgactgctt tctgcacagc ctgcgagaac 8400
aagaccggag agacgagatt gtctttccaa taagcgggca tcacatcctg tacagtcatt 8460
tgcttgctgg tctcgtggac ggcagagaac caagcaacac tatcgttacc ttggccatcg 8520
gcaacagcac agtcgcactc cagcaatgcc ttgacatatg gagctgcgca tgggtgcatg 8580
tgatgcgaat ggtaggcctt gtcaactctc aagattctgg caaaagtgga ttcatcctcc 8640
aagacacctt caacgtgctg gatagcatcc atgtcgccgg agaaggtcac actatccggt 8700
gaattgctag cggcgacgca gacccgaccc tcaaaggctt cgagctcgca tagttccttt 8760
gcgtcatcgt acgacatacc tgccgctagc atagcgcctg tctggccgct tggagaagag 8820
gcatgctccg cggacacaac tccacgcaga tgcgcaatac ggatagcttg agtggcactg 8880
atgaatcctg ccgcaaaggc acaggcaatc tcacctgaac tgtggccgac aattgcactg 8940
aactcgatac cagctgcagc gagaagtcgg accagaacga tttgtacggc gcagcataga 9000
ggctgggaga agctggcgag tctgacgttt gaggcatccc cttcaagcat gagctggtca 9060
tacagtgtcc acgtaggccg atacttttca ggcagtgttt gcagtgaatt atccagctct 9120
tcgagaatgc ctctcacaaa tggcataccc accatgagct tcttcagcat gcccggccac 9180
tgtgcacctt ggccagtaaa gacacctagt acgcgagggt tgtcattcgc gtcggtgcgg 9240
aagtcggtga cgacctcacc gtccgcgatg gcagcctcca gtgccgcgcg ggctacttcc 9300
ttgttgtgtg ctgcaatcgc acgacggaag ggcaagatag accgtttctc aagtaaggta 9360
tatgcgatat catgcatgtc cacgtcatca tgcgtttcca gaaattggag catattttct 9420
agcgttgcct tcatggagcg ctgcgacttc gatgaaagca caaggggcaa gctgcatgca 9480
tctgcatctg aggtcacctc tgttaccact gctgtcggct tgtgtggagg agccatatac 9540
tcttcgataa tagcatgggc atttgtacca ccaaatcctg atgtgtttat atgtttagct 9600
aacttcactt tcgttctcaa gaagtgcagt tgaatcctta ccaaatgaat taacgctgac 9660
tctgcgaggc tgcccgggcg caacaatcgg ccattctgtg gcctccgttg caattttcaa 9720
gtgcgtatag aacggagcga cacggggact gatcttctca aacagcaggt ttggcgggat 9780
cacgccattt cgtacagcaa acgatgcctt cattaagccc gcaataccag cagtgccttc 9840
cgtgtgaccg agaactgtct tgatgctgcc gacaaaaagc tcatctttct cgccgtcgct 9900
gtcgattgtt ccatccttgt gtccgaagaa ggctgttgca atagcctcag cttcctgtgg 9960
gtcaccggct ggtgtaccag ttcctgggat cttcgtgtta gggagagaga gactttctgc 10020
aacttccata aggctgatac ttccagggaa taccacttac catgggcttc aaagaactgg 10080
cagcgttcct gggggttggt aatatcaaga ccagccttgg catatgtggc ccgaatgagg 10140
gcttcttgtg cgctatggtt tggcattgtg atacctgtcg ttcggccatc ttggttgata 10200
ccggtctctc ggataacaca ctcgatactg tccccgtcgc gcagtgcctg gctcagcgtt 10260
ttcaggacaa tagagcaaac accttcctaa aaagcagtta caggaggtca gtgccatctt 10320
gctttttttg aaaggaattg atgcattgtc aacttactcc tctggcatat ccatcggcag 10380
cagcatccca cattcgagat ctaccattgg gggacagcat gttcaatttg ctctccatta 10440
caaaggtcat ggggcccaat atcagattcg caccggctgc aaccgccatg gtactctcgc 10500
ccgttctaag ctgttggacg gccagatgca cggcagctaa ggatgaacta caggctgtgt 10560
cgatcgtcat ctgcagaatc agtcaggaat ctgtcagcac ttgacgaagt cgggctcgct 10620
caatgagtgg cactcacact cggcccatgc cagtcgaaga agtatgatac acggttggag 10680
gccacactga cagctacccc cgtggcagag tatgtaggaa tactatccaa ttcacgcgtc 10740
acgatagtct catagtcatg cgtcatcata ccgacgtaca cagcagtaga ggatccttga 10800
aggccttgga tccgtaggcc tgcgttggat acagcttcat agaccgtctc cagcagcagc 10860
ctttgctgtg ggtcaatcgt ttcggcctct ccagcttgga tgttgaagaa agaggcatca 10920
aaaccgcgta gatcctcctg cagcaagtat gcaaagggtg cgttcgtgcg cccggggtga 10980
gtgccatcgg ggctgtaaaa tgtatcgacg tcaaatctct ccttagggat cttggtctgt 11040
acatcccggg gctctttgag cagctcccaa agttttgatg gtgtgttgac accacctgga 11100
aaccgacaac cgcttcccac taccacaatt ggctcgtttg gatagttggc ttgatccata 11160
actgctgatc ctgtttttgg gcgataggat tgggattaaa ccttgtcttg cgtcagtaga 11220
tcttctcact gcatgccggg cacaacattt gttcttacag aatcgcagag ttgaatctct 11280
gagcgaacaa gccggccttg caaccgatac cgtcgttata tttacttgca cgtatcagta 11340
ctcatctaga ttcggacaat ttcaagatcc attctagtac tcaaatgccc ccacttccca 11400
gcaatgcaag ctcggcacct agcaaaccct cccggcgtca ttcggtgcac gaatagccat 11460
tcctccatac ggcgttattc ggtcacacga ggctgaatga atcaaacgtg aatatcaatt 11520
ggctgtatca aggtgaaacc gagtttttca ctcggattgt tcttgtgctg ctcggtgaag 11580
ctgctcctaa aggaaacaac cgaactgccc catccaggta aacttcgatt gggggggggg 11640
tttttttttt ttcaaggttg actggaagag tgctctcggc cacaaaatcc cagaagcatt 11700
agtgctgtta ttcgattata aaccgtcgca gcgctctcat tcttcgctct ttcttctttt 11760
ccactggtgt gcataggtcc tatctgtctc acgcaatgct cggccaggtt cttctgaccg 11820
tcgaatcgta ccaatgggta tcgacccctc aagcccttgt ggcggtcgca gtgcttctta 11880
gtctcatcgc ctaccgtttg cgggggcgcc agtccgaact gcaagtctat aatcccaaaa 11940
aatggtggga gttgacgacc atgagggcta ggcaggactt cgatacgtat ggtccgagct 12000
ggatcgaagc ttggttctcg aaaaacgaca agcccctgcg cttcattgtt gattccggct 12060
attgcaccat cctcccatcg tccatggccg acgagtttcg gaaaatcaaa gatatgtgca 12120
tgtacaagtt tttggcggat gtatgacctc tgaattttcc attgttgtaa ctcaatgacg 12180
tctctaagat tctgatgaat gtataggact ttcactctca tctccctgga ttcgacgggt 12240
tcaaggaaat ctgccaggat gcacatcttg tcaacaaagt tgttttgaac cagttacaaa 12300
cccaagcccc caagtacaca aagccattgg ctaccttggc cgacgctact attgccaagt 12360
tgttcggtaa aagcgagggt aagtgtcaat ttttctgtct tgagcattga gcctctggct 12420
gacataccgc gaatatacta gagtggcaaa ccgcacctgt ctattccaat ggattggacc 12480
ttgtcacacg aacagtcaca ctcattatgg tcggcgacaa aatctgccac aatgaggagt 12540
ggctggatat tgcaaagaac catgccgtga gtgtggcggt acaagctcgc caacttcgcg 12600
tatggcccat gctactgcga ccgctcgctc actggtttca accgcaagga cgcaaattgc 12660
gtgaccaagt gcgccgcgca cgaaagatca ttgatcctga gattcagcga cgacgtgctg 12720
aaaaggccgc atgtgtagcg aagggcgtgc agccgcccca gtacgtcgat accatgcaat 12780
ggtttgaaga caccgccgac ggccgctggt acgatgtggc gggtgctcag ctcgctatgg 12840
atttcgccgg catctacgcc tcgacggatc ttttcgtcgg tgcccttgtg gacattgcca 12900
ggcacccaga ccttattcag cctctccgcc aagagatccg cactgtaatc ggagaagggg 12960
gctggacgcc tgcctctctg ttcaagctga agctcctcga cagctgcatg aaagagacgc 13020
agcgaatcaa gccggtcgag tgcgccacta tgcgcagtac cgctctcaga gacatcactc 13080
tatccaatgg cctcttcatt cccaagggcg agttggccgc tgtggctgca gaccgcatga 13140
acaaccctga tgtgtgggaa aaccccgaaa attatgatcc ctaccgattt atgcgcatgc 13200
gcgaggatcc agacaaggcc ttcaccgctc aattggagaa taccaacggt gatcacatcg 13260
gcttcggctg gaacccacgc gcttgtcccg ggcggttctt cgcctcgaag gaaatcaaga 13320
ttctcctcgc tcatatactg attcagtatg atgtgaagcc tgtaccagga gacgatgaca 13380
aatactaccg tcacgctttt agcgttcgta tgcatccaac cacaaagctc atggtacgcc 13440
ggcgcaacga ggacatcccg ctccctcatg accggtgcta agatataaca cgcaaactaa 13500
aacaaatatg catccgtccc caggcttatt ccaatagttt ccgtcccaga gaaactaggt 13560
gctgtattag tcgagtaggt tagtaaaata aaacgcattt tattcgattg tgatgccttc 13620
tttgtaatcg aacgtggtgt agactttggc tatgtgcgag agacagaaac acagagagag 13680
agaagggaga gagtgtgtat tcctgctacg cagagcggcc atctgcttct ataccgccag 13740
ctacaccgcc acgtagggaa gtcggcagta atgaagcttt tctcccggta caatcaccga 13800
tctccccatt ctctcaggcg ttgactggcg cttacgatga cgagggctta ggctctgtta 13860
agtcttgatg ttcctactca acatccccga ctaggcgaaa gagaggacgg cgcaacgacg 13920
tggacacaag tactccctcc cgccttccga ctacatatcc acaatctgta cccactgccc 13980
gtgccaacgc ctttcgaccg ttcaacgcgc atttacaagg cttgcgggaa tcataatgga 14040
gagaaaaaga gagaactttt gacagtcaag cctccgaggt gctaagacag cttccctggt 14100
agtataaaaa gcattcactc ttccgacttc gagaacgagt gcacatgtgt actttgttgc 14160
ttctcagggc cactgtaatg gtatttcagg tatctctatt tactgctatc cagaagtcag 14220
gcattaaata gtcaggctca gcccaggctc gattcagatt ggattcaggc ttcagaccat 14280
ggccgctatg ctccttcgta ctatacctcc gtcgagctat acccgcttgg ccagacaaaa 14340
ggcttcactg aacccttcaa cttaactgca tttcgccaca actaactcga cgaggccggc 14400
gatggtgtta ccattcatga gctcaaagat cgacacatca acatggattt cagatgtgat 14460
ccagtttcga agttcaatgg cgacgagtga gtctacgccg acacctgcca ggtttttgga 14520
cgaggacatg tcgtcttctg ccagaccaaa cattcgcatc agcttttccg tcattgcttt 14580
gaggacgata gaaatggcct cgtcgtgaga ggtgaccctg cttagttggg cccgcacgcc 14640
atctggtcct tttttatgcg aagagacaaa ggattggtct gcatgaagga cttggcggta 14700
tttaagtccc acaaaccgct gttcctgtat ccagtttgcc tcggtccagt gagcacccgg 14760
ggatgtgttg attcctgtaa ccacagctgc gggaggtgat ggaaattgag gggaagaaca 14820
caggattgcc ttctccaaca catccatgac gtccttttca tgcataggct tgtaacctat 14880
tctagcgagc cggtcggcca caccacggcc agtttcagcc acgtatccaa cagacttgac 14940
catgcccaag tcaatggtga cagccggcat gccatgggct ctccggtggt gcgcaagtgc 15000
gtcctggaat gcaccagcag ctgcgtaatt ggcctggcct gccccaccca tgaccccaac 15060
aagggatgag agcatcacga agaagtcaac atcctgtgcg atcttgtgaa gataccaact 15120
accctgtact tttgggcgtg ttgctgcatt aaattcatcc aatgtcattc gcgatagaag 15180
cgcgtccttg agaaccatgg caccttgtat gatacctcga attggcggtg catgtgcttc 15240
ttcgcacaac cggagcacct tggtgacctg atcttgatct gagatgtcac atgcgtgtag 15300
atagacagcg cactgttgat tttgcaagct ggttatgaat ggactggcct ttgcacttct 15360
cgataggata atcaagtgct tcgcgccatg atcaacaagc cactgacaga tctgctttcc 15420
aattcccccc agcccaccag caactaggta agaactgtca ggcttcagct tcagcgagaa 15480
ccctccatcg ccgactggga ccagttcgtc cccagataca ttgaccacaa ctttgccaac 15540
atgctgacca ctctgcatcg tacggaaggc cttctcgatg tttgacaagg agtgctgctg 15600
gattggacca atcaagccaa tcgcttttgt ctcgaggagt tttgtgacat ggttcaacgc 15660
ttcggatact tcttcacttt tggctctttg ccacgagaga agatcaattg atgtgaaaga 15720
gacgtcccgg gtgaatggca gcatgtcaag tctgctgttt tgctccaggt ccttttttcc 15780
aatctcaaca aatctgccga attcggccat gcagtcaaag cttgcttgga ggagttgacc 15840
tgccaatgag tttagaacga catgaacgcc aagtccgccc gtgtaggctt tgatgccgtc 15900
gacgaataag tcattcctgc tcgagaagat atgatccgga ttgatgccga atttatcgcc 15960
gacaaagtca cgcttggctt gagttcccgc tgtgacgaag acctcggcac ccgcaagctg 16020
ggacaaaatg atcgctgctt gaccgacgcc tccagctcca ctgtggatca agactctttc 16080
gcctcgtcgt agctttgccg tggtataaag cgcaatatat gcggtagtga aagccagggg 16140
gaccgaagcg gcttctggga agcccatttc gtccggaata cggacgacat tagtgtacgg 16200
cgtctgtgtt ctggtcgccc aatggccttt cagtagtgca catacgcggt cccctaatct 16260
gaggccttgg ctagcggcag cagctccacc gagctttgtg atcactccgg cgcattcgaa 16320
gcccatcaca cggttggcct ccaattgacc catggcaacc atgacatccc gaaaattgag 16380
accgaaagct ttgggttcga tttctaccca atcatccgga agatccttgc cttcacgtcc 16440
ttcgtcgtct cgaaattgca gggagtctaa gagccctggc gtctcaacct ccatccgcag 16500
acgacgcccg ggttgctcga acggctgcag tgtgacctca accgcttctt ggtccttcca 16560
gtgcgggtca ttgaaaagtc gcggtacgtg gatgacgccg tttctctctg caaattcaaa 16620
ctccttgtct tcggaaaggt cgccgaggcg gccattgaag atattgcaga tagcatacag 16680
ggactcgtgg gtgtatgcgt ttcgagaagg atcgagatcc aacgatacat attccttccc 16740
gttattttcg ttgcggatgg tacgcagcag accaatatgt agagctttcc atggatcctc 16800
ggagctcatg gctgctcctc tagacaccca gagaagtgcg ttgcagttat tcagcatcgc 16860
ggtgatggat ttgaaggtct cgcttcccac ctctccaagg agcgaggact ccatttcccc 16920
aagaaaaatg catgtccttc cagtggtatc tacctcgccc agagcgttga tcgatgggct 16980
agaactggtc ttttcacaaa ttgctgcctg gagactttcc agccaagatg aaggaggtcg 17040
gagcgctccg tgcagcaaaa gcacctccga ttctgccact gtatccgggg ttgtattctc 17100
ttttctagcc gtcgatagca ttgtgctgat catgtaaaac tcatcgtctt cacaatcacg 17160
aacctccaat tccacaccgt tgaaaccgct cgtgtccaac atggtgttcc aaagatcggt 17220
agtgagcgat ggcgtcgact tccgctcagg ctcctcactg agccaccaac ctggcaacag 17280
tccgaaggta aagaacaaat cgagctgatc cctggtagtc tcaaccaaaa tcaagttgcc 17340
cccaggcttg agcaattttc gaacgttact cagtgttcgt ttcatgcatc gagttgcatg 17400
caggacctgg caagccacga ccacatcgta ggtggcacat tcaaaccctt gttgctcggg 17460
atcgctttca atatccaatt ttttgaaagt catcacgtct tgccaatccg caaattgctc 17520
acgcgccgac tcgaaaaacc cggcagacac atcggtgaag tcataacgat cgatcggctt 17580
ggtgtttccc aatgcattga caataagctt tgtgcagccg cccgtgcctc cgccaatctc 17640
caaaatgcga gaacgcgggt tcttgtgggc gcaaagtcgg atcagctcgc tggcttgtgc 17700
gtttgatcgg ctccatttga ttgcgttgac gtagtatctg cttagcagct gatcttgcat 17760
catcaactca agtggctctg tttcgcggcg tagcattgct attaactgag gtcctagacg 17820
agaaatcatc tcgccattga cgctttctcc agcgactctg gcctgtaggc atttcttctg 17880
ctcagcatcg tcacttagcc agtcgcaact ggctgggctg agcttgtttt gtctcgcaag 17940
gtccaattgg acattcatcc aatcgaaata cttctgaagg tggccatcca gatgttggat 18000
atcagaattt gtcaaatcag tgacagcctc ctgtataaag ttgatcgtgc atcttcggag 18060
gtccatcatg agttccgttt ctttcgtctc agcctcagtg ctcaactttt ctttgagcca 18120
agtggagtca cccaagctga tgtcaggggc ccaaacccag gagctgcagg cattttctgt 18180
gtcgttggag tctgactttt ggtcagagaa gctgcttcca accgactgga aaacaaggcc 18240
ttcaatctct atgactggga ttccgtccga gggagaagaa ccgctatcat agtcatcaaa 18300
cactgccaag tcggtagaga aggattgaga gttgcgatcc ttgatgctgg cctgtgcgtc 18360
cagagcatca ccagcctcca agtcagccag gctagaggat attttgacat ttcttagcct 18420
ccttggtacc atggccgttt tcatacgtgt tcccgcgtag ggtaacaccg tgtatgccgc 18480
ctggatcacc gagtccagag tagtaggatg gacgatgtgt cgattctcgt acgagtgagg 18540
catagccgag gcagtgtcag caatggaaaa tctgcaaaac gagccctgtc cattgttttg 18600
aattcgctga atgttctgaa aaatgggtcc gtggcatatc ccattcgcgt gtaaggactc 18660
ccagagatcg ttgggatcaa tgctccggtt atctgagcct agattcaacc tgcgtgaggc 18720
ttccacagtt gaacagtcaa ggtggcttct ttcgctctcc gaacgtatta atccggtgca 18780
gtgttctgtc caggtattat tttcgcccga aattgagtgc acagaaaatt gatgccagtt 18840
ctttgtgccg agggaccttt cctcacatga acggatcgtt aggcgcaggt caacctctgc 18900
ttctgcatca gcgggtatta tgagagcctg cgcgagttca acgtcacgca agttgtagtt 18960
gatgctagcc cccgcaactg gtgggcagac ttgtgaaaac ccctcgatgg ccatgctgat 19020
gaagccagct cccggaaaga tgatgctcga accaacgacg tgatctcgta tccatggaat 19080
atctgacaga cggagaacat gtttccattt aggcgcgaaa tgaggagaga gagattcccg 19140
tgagcctatc aaagtgtgag gcggatgggt tctctgtttg gactcacgac tgccgcgagg 19200
ctctctccaa taacgggttt ggtgattcca cgggtacgcc ggcaaatcgc tcagtacctt 19260
cactctgggc tcttttcttc catgaggaaa gtttatagcg tccattttga gcccataacc 19320
cttgcttatc aactccgtag cagcacgata cattgtctcc aacgagcttc tgccgcgaga 19380
aaggcaactg agatagttta tatctgttcc tttcagaccc agatcctgca tgacttggtt 19440
gattggacca ccaagcgctc cgtgaggccc tatttcaata atcacatcga cggctttctc 19500
tttggtgttg ggatcaaagc acatctcgcg gagtgaggac tcgaactcta ccggctgtag 19560
catactatcc atccagtgtg tgggatccaa tagcaattta agatcggtca tgcgactacc 19620
agtcttaggt gatgaatata atacaccctt tgaggtgtca gcattgggat tgtcgttgtt 19680
gttatccgag ttgaacagat ctctcagtga cgccccaaag gcatctgcca ttggtcgcat 19740
gtggcttgaa tggaaggctt cagtgacttt cagtttcctg gtaaagatgc catcggcgtg 19800
taacaacttt tcaagtttct cgattgcacc caaatctccc gacaccgtca cactacattg 19860
actgttgata catccaacca ccacacagcc gtcctcctgg ttgagacgcg aaatgtaaac 19920
attggtctca ctgcgaccaa gacccaccgc catcattcct cctttggctg ccaatgcggg 19980
cttgggctta gtggtcaata caccgcgtat ataagtgatc ccaatggccg accgcgcgga 20040
taaagcccca gctgcgtagg cagcagcagc ctctccactt gagtgactgg ttatccccgt 20100
tggccgaatt ccccatgacc aaaggagacg cacaagtgca atttggatag cggttgacag 20160
tggtagactg tattcggcat catttacccg agtcgtcagc tcatcacggt ggagctcctc 20220
tgtgcaattg aatgttagta cctcaagctt gatacagtat tacttttccc gggctcgcaa 20280
cttacccata aaattccaac tcgcgcccag ttgcttgatg tagccatcac attcaagaat 20340
cgcctgtttg aatactggga atgtattgac cagctctctg cccattgcat gccactgcgc 20400
cccctgaccg gtgaatacaa atccgagccg tactttctca ttcgctcgtt ttggttgatt 20460
ggactcatcg ctgagggcag aaacaaggcc gccaaggctg tctgctacat acactgacgt 20520
ccatggcaga atggaacggc gagagcctag tgtataggcg aggctggcga ggaagggttc 20580
cccgtcaatg tcagcgacgg atttaatgta gtctcgcagg cttgctatcg ttcgccgaca 20640
agcttgctcg tccttggcac gcacaacgta tatgcggctc tgtttggaac catcctcaac 20700
cctaccatgc tcagagttac cattgacatg cacttgatcc tctggcaggg ccaatgatgc 20760
gcgatcatat gattccaaaa tgacgtgagc attcgaacca ccaaagccga agttattgac 20820
agatgcgcga cgagtcccat ctttcacagg ccagtcttga gcagacatgg ggatctttga 20880
aacattaacc tttgaaacat ataactgaat ctgcgaatgc gcaaagcctt accttgatgt 20940
tcttttggtc aagcatcagc ttgctgttct tttgcaggaa ccgcgcatta gggggaatca 21000
agcccttctc caaggccaag gccaccttga ttatactggc caggccactg gcggcttctg 21060
tatggccaat atttgctttc acagagccaa ggtgcagagg atgtccttta aaagctgctg 21120
aaattgctga gatttcaagg gggtcaccag ttggtgttcc agttccgtgg gcctccacgt 21180
acgaggtcaa cgacatatct agcccagcct tatcgtaaca ctcctggatc agacttttct 21240
gcgccacatc actcggcgca gtaattgcgg gtgttttgcc atcctggttc agcgctgtct 21300
ctcgaatgac ggctcggata gggtcttggt ctcgcaacgc gttagggagg gcctttatta 21360
ccagagcggc aattccttcc ccgcgaccat atccattcgc tcgaggatca aaagagtacg 21420
agataccatc cggggacaaa aatctgtcat tgagcaacaa ggattgctta gttcaagact 21480
ctcgatctgg aatcttcttc ggaaaactca ccccaggttt gacatcgtaa caaaaacatc 21540
gggattgagc agaagatttg caccgataac gatggctgta tctgactccc cagtacgtaa 21600
gctctggcac gccaagtgca gtgcggtcaa tgtcgtcgaa caggccgtgt caaccgtcac 21660
gctgggacca cgtaagtcgt agaagtgtga tatccggttc gaaagcattg ttcctgagtt 21720
gccagttatg aaataacgcg gaactgtctc ggggtcacga ttgagcgaat cctgatagtc 21780
gtggtacatg acacccccaa acaccgacgt attagagcct gccataccat cgatggtgat 21840
accggctgga tgatggtcag tgacgtttgc ttacagtgag gatgacccac actacatacc 21900
actctccagc gattcgtaga ccacctcaag cataagccga tactgcggat ccatgcactg 21960
tccaatatta gatctctgcg tcccgggtta gatcaattga aataatcata cgctggcgac 22020
ctctgtggtc atgttgaaga acgcggcgtc aaataaagca ggatcctcgt cgatgaagtg 22080
tccacccttt acgtgggtct atccagtcat ccttggagtc agtaaccaag cttcagtgat 22140
gctcaaatct tgtgtcaaat attcaaaaca agatataaat gcatgcatgt tagatactca 22200
cggacccgac cctttcgcca ttcgggtggt atactcctct cacattgaat cgcgaggagg 22260
ggaccttaga ccaggcactg cctcctcttt caaccatttc ccaaagcttc tgtggactcg 22320
ttgcatctcc agcaaatcga catcccattc caactatggc aatgggcgtg gatgtgttag 22380
agcaagccga gcctgccatt gcggttgcgg ttgcggttgc ggttgcggtt gcggttacgg 22440
cgggggtatt gttcattcca acgttgtttc attgactgat atatcagtcg ccctggtgat 22500
aaaaccgttg atagtcttcc aacagtctac aggtccctgg catagctata gatgcataag 22560
ctgcccccga cacgtgattc atagttcggg gtttgttttc atcttggacg tgacacgata 22620
ttcgctctgt gcccatggga aaccccggac caccatgcta tgctcggggc aataccttag 22680
aggtaccggt tcgggaggca ttgtctgtcg tcacgataat cccgagtcaa aacgccgatg 22740
ggaaaccgtc gaacaagacg aaacaggtca ggccggccag gtagttttcg ggtataatgg 22800
aggctgtcag aatccgatac tccgtacaca gatgcgaaat acgcatacga gctatcaaac 22860
caaacgaatc caaaagcctt ggaaaagctt ggaaaggctt agtgggtaat cctgtcccaa 22920
ggtttgttga gggcctgagc gcagggtggg tcctgtaagc agttggtaat tcaatttcca 22980
acaatacaca atccccaaaa tttgcattat cggttgacta agacaagcaa acaaaatata 23040
tgcaggaagc gcaattcatc gcgagcaaac gatcatcatg agcatgtgac cctttcctct 23100
tttttctact tcggaaggcg gcatgatcat ctgtcagaac tcccaatcgg gagcaatacc 23160
ataccttacg gcaccccact cagacccatg cacaaagaaa atccatgcgc cgaatattga 23220
agccttggca acaaagcccc gtgtaactcc gaaggtatcc aaagaccgag agacgccgat 23280
ttgagagaca cgtacggagg tccacacaaa atgttcccga gtctatacac tatactccaa 23340
actgacttct tgtctacctg ggtatcttgt tcaggttgct gtttactgag ataaatgata 23400
ccgggggggg gggggggggg gggggttgac actggctttt cgtggacaga ataataccca 23460
tacatccctg cgtaagtagt cgtttcgaga agaatgtgtt tcgtggtgca ttactccgta 23520
ggcacaatat atttccattc ctcacgaagt ggcctcgtcc gggcgtgatc gatgcagctt 23580
gccgccccac caaaaaagga ccacaatacg agtcagatta gaaacgtcta acaggacgtc 23640
tatgtaagag gacgctcctt tgtatgtcgg atctaggcat gacaaaataa ctatacctag 23700
gtagtgttct gtcttattgg tcatttggcc tactttcgga acaatcttgg aagttcacat 23760
tcctaggtat cagggcaatt gattggtgtc cccagaattc ttttttctcg aataaaggat 23820
aaatttatgc ataaaaacct tggaaactga gcatagttat gagcacaaat actagttttc 23880
agtgcaattg gtcctactat cctttgcttg gtacccctta ccaattatac cctaggcagc 23940
agttgacacc ggtcatgaat ccattcataa aggtggacca gatgcaggga taaggaagcg 24000
aatctttccg ctgcctcagc ctcaggggcg cgcgccattt gttattttct tctactcatt 24060
tcccgtacct aggaactgtt cagttgtccc tcccaacccc ttgggccgaa caaccttcct 24120
ccaatctacg acggcagatt atacctaggc gcctaaccga ttaggttgct cattcgattt 24180
tggaggtatg cactttatct caagccctaa ttcccaattg aagtgctttt ccgtccccat 24240
ttgcagagct gactagattc ttttctcaga gactacctag ctataggtac cactccaagc 24300
tgtagcacag acctttcagc atggtcgctt cgttgctacc ctctcgcttt cgcggtaggg 24360
aatcaatgaa tcagcagcac cctctacgct cgggaaatcg ggcattgacc tccacactcc 24420
aatttctatc caaaacggcg tgtctacacc cgatccatac cgtttgcacc atagctattc 24480
tagctagtac cacatacgtt ggactactca aagacagctt cttccatggc cccgcaaacg 24540
ttgataaagc agaatggggc tctttggtcg aaggaagtcg aagcttgatc accggcccac 24600
agaatggctg gaagtggcag agcttcgacg gggatgcaga tgttctcgga gatttcaacc 24660
atcaagcact aatgaccttg gtattcccgg ggtcatatgg ggttgcatct caagcagcct 24720
caccattcct tgctcccctc cctgtgaacc tatctgtgat tgaccttccc tcaacgtcga 24780
gccctttaac cgcctattcg aaagataaag ttttcgcctt ctctgtggaa tacagcagcg 24840
cgccggaact cgtggctgct gttcaagaaa tccccaacaa cagtgccgac ctgaaattgc 24900
aggagacgca attgatcgag atggaacgcc agatgtggat catgaaggct gccagggctc 24960
acacaaaacg cagccttgct caatgggtgc acgatacctg gacagagtct cttgatctta 25020
tcaagagcgc tcaaacgctc gacgtggttg tcatggtgct aggttatata tcaatgcact 25080
tgactttcgt ctcactcttc ctcagcatga aaaaattggg atcgaaggtt tggctggcta 25140
caagcgtcct tttgtcgtca acatttgcct ttctcctcgg tctcgacgtg gccataagac 25200
taggggttcc gatgagcatg aggttgctat ccgaaggcct ccccttcttg gtggtgatcg 25260
ttggctttga gaagagcatc actctgacca gggctgtttt gtcctatgct gtgcagcacc 25320
gaaagcccca gaagatacag tctgaccagg gtagcgtgac agccattgct gaaagtacca 25380
tcaattacgc cgtacgaagc gccattcggg agaagggtta caatatcgtg tgccactacg 25440
tggtcgagat cctgctccta gttatcggtg ctgtcttagg catccaaggt gggctacagc 25500
acttctgtgt tctagctgca ttgatcctgt tctttgactg tctgctgctg tttacattct 25560
acactgcgat tctgtctatc aagctcgagg taaaccgcct caaacgtcat atcaacatgc 25620
ggtacgcgtt ggaagatgag ggtctcagtc agcggacggc ggagagtgtc gcgaccagca 25680
atgatgccca agacagtgca cgtacatatc tgtttggcaa tgatatgaaa ggcagcagtg 25740
ttccgaagtt caaattctgg atggtcgttg gtttccttat cgtcaacctc gtcaacatcg 25800
gctccaccct tttccaagcc tcttctagtg gatcgttgtc cagtatatca tcttggaccg 25860
aaagtctgag cggatcggcc attaaacccc cgcttgagcc cttcaaggta gctggaagtg 25920
gactagatga actacttttc caggcaagag ggcgcggtca atcgactatg gtcactgtcc 25980
tcgcccccat caagtacgaa ctagagtatc cttccattca ccgtggtacc tcgcagctac 26040
acgagtatgg agttggtgga aaaatggtcg gtagcctgct caccagcctg gaagatcccg 26100
tcctctccaa atgggtgttt gtggcacttg ccctaagtgt cgctctgaac agctatctgt 26160
tcaaggccgc cagactggga atcaaagatc ctaatctccc gagtcaccca gttgatccag 26220
ttgagcttga ccaggccgaa agcttcaacg ctgcccagaa ccagacccct cagattcaat 26280
caagtctcca agctcctcag accagagtgt tcactcctac caccaccgac agtgacagtg 26340
atgcctcatt agtcttaatt aaagcatctc taaaggtcac taagcgagca gaaggaaaga 26400
cagccactag tgaacttccc gtgtctcgca cacaaatcga actggacaat ttgctgaagc 26460
agaacacaat cagcgagttg aacgatgagg atgtcgttgc cttgtctttg cggggaaagg 26520
ttcccgggta tgccctagag aagagtctca aagactgcac tcgtgccgtc aaggttcgcc 26580
gctctatcat ttcgaggaca ccggctaccg cagagcttac aagtatgctg gagcactcga 26640
agctgccgta cgaaaactac gcctgggaac gcgtgctcgg tgcatgttgc gagaacgtta 26700
ttggctatat gccagtccct gttggcgtcg ccggtcctat tgttatcgac ggcaagagtt 26760
atttcattcc tatggcaacc accgagggcg tcctcgtcgc tagtgctagc cgtggcagta 26820
aggcaatcaa cctcggtggc ggtgccgtga cagtcctgac tggcgacggt atgacacgag 26880
gcccgtgtgt gaagtttgat gtccttgaac gagctggtgc tgctaagatc tggctcgatt 26940
cggacgtcgg ccagaccgta atgaaagaag ccttcaattc aaccagcaga tttgcgcgct 27000
tacaaagtat gcggacaact atcgccggta ctcacttata tattcgattt aagactacta 27060
ctggcgacgc tatgggaatg aatatgattt ctaagggcgt ggagcatgca ctgaatgtta 27120
tggcgacaga ggcaggtttc agcgatatga atattattac cctatcagga aattactgta 27180
cggataagaa accttcagct ttgaattgga tcgatggacg gggcaagggc attgtggccg 27240
aagccatcat accggcgaac gttgtcaggg atgtcttaaa gagcgatgtg gatagcatgg 27300
ttcagctcaa catatcgaaa aatctgattg ggtccgctat ggctggctca gttggcggct 27360
tcaacgccca agctgccaat cttgcggcag ccattttcat tgccacaggt caggatccgg 27420
cgcaagttgt ggagagcgct aactgcatca ctctcatgaa caagtaagtt gaaagcggcc 27480
gcttacttgg aaacattcac taatcctgtt tagtcttcgc ggatcgcttc aaatctctgt 27540
ctccatgccg tctattgagg ttggaacgtt gggcggtggt acgattctgg agccccaggg 27600
cgcaatgctt gacatgcttg gtgtccgcgg atcacacccg accactcccg gtgagaatgc 27660
acgtcaactt gcgcgcatca tcggaagcgc tgttttggct ggggagctct cgctatgtgc 27720
tgccctagcc gccggtcacc tggtcaaggc gcacatggcg cacaaccgtt ctgccccggc 27780
atcttcagcc ccttctcgaa gtgtctcccc gtcaggcgga accaggacag tccctgttcc 27840
taacaatgca ctgaggccga gtgctgcagc tactgatcgg gctcgacgct gattaggtcg 27900
gaatcttagg agcattccaa gctccgtacc ccctccagtg gattcattgc aggaggatca 27960
tattttttct cattggttgt tattgtcata attttcaaaa gcacaatgca atgagacagg 28020
caggtggtag agtgaacggc cagaaagggt atctcatgtt tatatgttgt tgaaatttac 28080
gatgcaagta gtagggaaga agaatatata aagagatggt ccttttccag agagtgttta 28140
ggtctgatcc ctcataatta tttaatgagt gaaagctttg ttcaagctat aacttactga 28200
gtaggttgaa tgttgatctg attcattcct gaggtatcag gattgatgcc tgaaacatca 28260
atcatccatt gtcagatgcc gtaactaact aactatgaat ctcaacatag ttatatgttg 28320
ccaatctagc cacggtgact agaaccttga gatggactta gactagacat gggtcgcggg 28380
caatgacata tagaatcttt gaaatcgaca ttaattaagt atgtggagat tctttgtgga 28440
ggcacggtaa tgtgtctatc tagcaacgcg gtcaagcatc agtctcaggc acagcccggg 28500
tgtcgttttt ggttgcaatc ttccgccatc ccattccaaa ggcaaacaca aacgtgcacg 28560
ccgtagctcc cactgctaag taaaaagtat gatcaacggc gagactgtaa gcttttacaa 28620
cccctggaag gttattcttg ctgaccacat ctctgaagcc agtcgcccct gctgccgtca 28680
cggcctgcgt gtcgacagtg ggcgcatact tgctcaggcc agttctcaaa ccggacccaa 28740
agacaaggtt agcaaagtcc aggaagagcg atcctccaaa cgtctgtcca aacacggcga 28800
gagaaattcc gagggcacct tgttcgggcg aaagcgtgct ttggatggcg atgataggct 28860
ggccattgag tattgatgtc agcgtctagc ggttgcatgc tcttcttgct ttgatacaaa 28920
gccgaaagcg tgagagatga tcaaaggttt catagcttac cgtttgcatg ccacaaccac 28980
gaccgaagcc cgcgataaat tggtacatga cccatttcac agttgatgta tggggctgga 29040
aggtggatac cagacctgcg cctatggcga cgagaacagc gctgcctagg gcccaaggca 29100
aatagtatcc tgtctttcca actggtgcgt catatgtcag tatacacgat atccaagccc 29160
gatgtcagac ggttgtggca agaaaggagc catagaaatg gacggggtgg agaaaaatgt 29220
gtacgcgagt ttcacttact tgcgaagcca gaaaccatag ccataatgac ttgtccaaga 29280
attccaggca acatgtacac accactcagt gtgggagaaa catccttcac agcctggaag 29340
tagatcggta gatagtagga aaagacaagc aaggagccag agaaaaagcc cataaataaa 29400
caagagcacc acacttgtcg tttaccagcc actgagccag gaatcatggc aacagcatcg 29460
ccaacatgac gctcccatag cacgaacgca atcagagcaa accctccgcc acagaacagg 29520
ccgatgatga cggaacttcg ccaggtgtag gtcgaccctc cccattctag tgcgagggaa 29580
atcatggttg cgaaggctgc aaagaccaca aagcctacaa ggtccagttt gcgaagtgtg 29640
gattttatgt tggccattgg tttgtcggtc gagagttcgc tgtccgtgga tgaaattcgg 29700
tcgggtatgg tgatgacgag aaggaggaat gcagcgacag cgccgatggg gagattgata 29760
taaaagcctg aattccaagt gagaacatgg acaacaatca taaaaaggcc aaaggtcaac 29820
atacaccatc gccaagtggc gtgttgagtg aaagcacctc cgagcagtgg tccacagaca 29880
atggcaatct gactaactga aaacatattg tcagacgacg aaccgttcgt ttggggtaca 29940
tcagatcttg agatgacata cgacccatca tcactccaat caaaacttca tatgcgaggt 30000
cagcgtgtac acggcaccca gcagacttcc aaaaatcggt tcccttacct ggttgcttgt 30060
gcttaggagc agctgttgag aggattgtga gggctccgtt gacaagacct gagcctccca 30120
ttccagcaac ggcccgccca acaatcaaca tggtggaaga tcttgcggca ccgcatagca 30180
ccgagcctag ttcaaaaata cagaggaagg caaagaaagt gtacttcaag cccaagagtg 30240
tatacaattt accggccagg ggctggagag cacagctaaa tatgatgtta gctaatctgt 30300
tcgtacaatg aacaaggtca aggagaacag agccatactt agccagaaga taagcactgc 30360
cgtaccaccc tacatcgttc agagagtgga actcgcttgt gatatgtggg attgcctgtg 30420
gctggagtca attgactgtg ctgcgctctg ttctgaggta gccaccatct taccgtgacg 30480
ataatggaca tatcaaggag catcaaaaat gctacgaaag taactgaagc aaccaccagc 30540
ccgagcttga ggcctgtgat gtgctgggac ttggactcag tcgcttcgag cgtgtcattt 30600
tgactttctt ccttctgtgg ccttggttcc ccttctttag ggggtagagg ttctgacatc 30660
gcgcaattcc ttccgacttt tgcttcaagg ggcggtgtga atctctactg cgcggcgctt 30720
ctatagtacc tgtgttttgg tgtatgaatg atctcgctct cgttgtttcg ttaaggtccg 30780
ctagcctgaa gtcagattga tggatgggga tcaggggaaa ttggcgacgt ctttaatttt 30840
gcttttcttt gttaccggaa gtgttgcggt attagcgtgt ctgggcttat ttacgacgca 30900
caagatgcat tgaactggcc ccactgctag atctcactag tattgtggtt gtaatttacc 30960
tatactccat attgactggg caggttttga acacaaccca caccccccca tactacacat 31020
tagttttgca tattttcctg ggggccaaaa aaaccccaaa aggcttcaat attttgcggc 31080
caatggagag tgtaactaat ttggcccaca ctccggtggt atcaatcgga tctcactgca 31140
tatatgatga aagcaagagg gggcaggaga tacgctcttt attggctgtc tgcgcgaagc 31200
tgggcaaatg caaataaaaa gacaaacaac cagctggaag accgggcgac aaacatggtt 31260
tacctaacac cctcgatccc aacaatgtgc atgttaatca atgtgctccg tggggagtat 31320
gaactataac atacgaagca gccattcatg tcaaaaaaaa aaccaggcga atgggcgtcg 31380
tcaacggttt cacataagta ctatattgta ctaactaccc gtgagactgg agagaacagt 31440
ctcgcgcgaa gaaacgataa gagcatcggt catatcggtc catctcggtc taagtgtatg 31500
agaatattcc gacgtgaatc catccgtcag tgatcaatgt ctccaagtaa ttcatcattt 31560
caattaccct cgctttactc cgtagaatac aagaccttac tagcgcaaac aagtgggggc 31620
taacggtgtg atctccttcc gttgcggccg ccacctcggt tccagccgta atacgacgac 31680
ccgtctatcg cgacccccta gccttggcca tttttggcgt tacagtaaag ctttggagag 31740
aaacgccaag ggaaaatgct agccaccaat tctataaatt actcttcaca tgcagctagt 31800
atcactggta agtctacggg gcacatgtaa aatttttatt actttctaat aatctttcca 31860
agttcttttc cacggggccc caatgcttaa aatactcaaa agacgtgaaa aacctgcaag 31920
ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 31980
tgatgatctc aaattgagat ggcgagcgct ggatctggga aattggtagt gggattggta 32040
tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 32100
atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 32160
gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 32220
ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 32280
acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 32340
caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 32400
gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 32460
aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 32520
gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 32580
acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 32640
caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 32700
gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 32760
ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 32820
ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 32880
tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 32940
cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 33000
tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 33060
acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 33120
gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 33180
actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 33240
ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 33300
aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 33360
tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 33420
atcatagaat tgcagggttg ccgctgatgg ttctgataat gtttccttga gtgccgaggt 33480
gccaatatgc gtaggtggtg agcagtaagg tggaggagtc tctgccaatg atgagaagac 33540
cgtagaagat gtcgcggtca tcggttgtga ggtttctgtg gctcttgtag ttccagctgc 33600
ggcttcttta tgtaaattgc gcttgggtag cctttcgctg tacacacacc ttaatccggc 33660
ttgttgacaa cgttgacact gagcacggac taaattggca ttgctaccgg tacatttgag 33720
cttttgtgca tgacaccggt cacatgagcg tcgaaacgcg cgacggcgta ggttcgtcgg 33780
aatcgttgca tgcggcaggg acataattat tggattaaga tcaaataatg tgaggtgaga 33840
ctttgcatgt tcctggatct ttatgtattg gaattggaga gtaagctcgt gcaggagata 33900
agttcaggtc gtcttgctgg aagacttact aagttatatg caaacaagtg ttttcgagcg 33960
gacaccaaaa gccaatagtc ttactatgaa tgtcttttca gtcacccgga gaaatactct 34020
tagcctctgc tcttatgcga gctcatcaaa gctgggcata cataccccat ccagcgccac 34080
gtattacact agaaagagtt ctaaaagaaa tagattcggc cccccatctg gctatcatat 34140
atgccagatg aaatacctgt aacgtggggc ataaaaaggc aggctctagt ctaccagcag 34200
atc 34203
<210> 2
<211> 34203
<212> DNA
<213> Penicillium citrinum
<400> 2
gatctgctgg tagactagag cctgcctttt tatgccccac gttacaggta tttcatctgg 60
catatatgat agccagatgg ggggccgaat ctatttcttt tagaactctt tctagtgtaa 120
tacgtggcgc tggatggggt atgtatgccc agctttgatg agctcgcata agagcagagg 180
ctaagagtat ttctccgggt gactgaaaag acattcatag taagactatt ggcttttggt 240
gtccgctcga aaacacttgt ttgcatataa cttagtaagt cttccagcaa gacgacctga 300
acttatctcc tgcacgagct tactctccaa ttccaataca taaagatcca ggaacatgca 360
aagtctcacc tcacattatt tgatcttaat ccaataatta tgtccctgcc gcatgcaacg 420
attccgacga acctacgccg tcgcgcgttt cgacgctcat gtgaccggtg tcatgcacaa 480
aagctcaaat gtaccggtag caatgccaat ttagtccgtg ctcagtgtca acgttgtcaa 540
caagccggat taaggtgtgt gtacagcgaa aggctaccca agcgcaattt acataaagaa 600
gccgcagctg gaactacaag agccacagaa acctcacaac cgatgaccgc gacatcttct 660
acggtcttct catcattggc agagactcct ccaccttact gctcaccacc tacgcatatt 720
ggcacctcgg cactcaagga aacattatca gaaccatcag cggcaaccct gcaattctat 780
gatacatcaa tcaactttga tgatcccgag tcgtttcccg gcggctggcc tcagccaaat 840
acatttcgcg acgatgccaa cagcaatgaa tcttcgggga taccagatct aggctacgac 900
tttgaaggcc ctttggatgc aacggcgcct gtctcgccat cgctgtttga cctcgaagta 960
gaggggaact cgtcatccgg acaatccaac acaagcaaca cgcaacgaga ccttttcgaa 1020
agtctgtcgg atgtgtcaca ggacctagag gtaatactcc acggggtgac tgtggaatgg 1080
cccaagcaaa aaattttaag ctgtgagatt ttcaattctg cctgtttact gcctcttgat 1140
tgtcgctaaa gcttcttcct agacccgata ggggactttt tgaatgcctt tggtagattg 1200
ctactacatc ttcaagaacg tgtgatcacg agcagcaata gcagcatgtt agatgggtgt 1260
ctgcaaacca agaacttgtt catggcggtg cattgctaca tgttgtctgt caaaatcatg 1320
acatcacttt cccagctgct actatccgag gtgatgaaag cccaaccttg tggacaaaag 1380
caaagcacac gaatggattg gtactggtct ggctcaacca ctagaaatga caatggaaga 1440
gccgaagcac ttccctcgtt tcactctaat cttcatatcg gcgagctcat ttcacatctc 1500
gacccattca tgcacgcctt atcttctgca tgcacgacat tgcgtgtaag ccttcgacta 1560
ttgagtgaga ttgagactgc tttggggata gcacaggagc acggggctgc ggcatctatt 1620
cgtctagtaa gtgggaccga taaccaccag tcttttcttc ccttgcatac atcagcaatg 1680
cgctgaccgg gagaggggga ataggtccta tcagatatgc caagcacatc gtggcaaatc 1740
cttggcgctg aaaataaaac cataacgccg gcctctcgtc tcctatctgt gctttggagt 1800
gacgaagccg gagacgaaga gcccaagtca acaaaggcct cagggaagac gataaatgtg 1860
ttgcgacgtt gctataagga aatattcgca ttagcgaaga aacacaatat tgcttagtac 1920
cgtacctgtt tgagtaacta tagattgtcg gagatggtgc atcccccctc tatggaaatt 1980
gaaggtagca tagccccgct cgcctttccc tgtcagtgga cgccactcgt tgtagactgc 2040
gacattaccc tgagaaagcc cctgcttttt tttataccca gcgctatatt gaagaaacta 2100
gatcgggcca tcacatagcc tccatatgta cttattacat ggtcttctgc acttacgttt 2160
ctataccaat cccactacca atttcccaga tccagcgctc gccatctcaa tttgagatca 2220
tcaaacagca tataatggct cggaatcagg ctgttgaggc attacgtgtg atatcactgg 2280
cggcttgcag gtttttcacg tcttttgagt attttaagca ttggggcccc gtggaaaaga 2340
acttggaaag attattagaa agtaataaaa attttacatg tgccccgtag acttaccagt 2400
gatactagct gcatgtgaag agtaatttat agaattggtg gctagcattt tcccttggcg 2460
tttctctcca aagctttact gtaacgccaa aaatggccaa ggctaggggg tcgcgataga 2520
cgggtcgtcg tattacggct ggaaccgagg tggcggccgc aacggaagga gatcacaccg 2580
ttagccccca cttgtttgcg ctagtaaggt cttgtattct acggagtaaa gcgagggtaa 2640
ttgaaatgat gaattacttg gagacattga tcactgacgg atggattcac gtcggaatat 2700
tctcatacac ttagaccgag atggaccgat atgaccgatg ctcttatcgt ttcttcgcgc 2760
gagactgttc tctccagtct cacgggtagt tagtacaata tagtacttat gtgaaaccgt 2820
tgacgacgcc cattcgcctg gttttttttt tgacatgaat ggctgcttcg tatgttatag 2880
ttcatactcc ccacggagca cattgattaa catgcacatt gttgggatcg agggtgttag 2940
gtaaaccatg tttgtcgccc ggtcttccag ctggttgttt gtctttttat ttgcatttgc 3000
ccagcttcgc gcagacagcc aataaagagc gtatctcctg ccccctcttg ctttcatcat 3060
atatgcagtg agatccgatt gataccaccg gagtgtgggc caaattagtt acactctcca 3120
ttggccgcaa aatattgaag ccttttgggg tttttttggc ccccaggaaa atatgcaaaa 3180
ctaatgtgta gtatgggggg gtgtgggttg tgttcaaaac ctgcccagtc aatatggagt 3240
ataggtaaat tacaaccaca atactagtga gatctagcag tggggccagt tcaatgcatc 3300
ttgtgcgtcg taaataagcc cagacacgct aataccgcaa cacttccggt aacaaagaaa 3360
agcaaaatta aagacgtcgc caatttcccc tgatccccat ccatcaatct gacttcaggc 3420
tagcggacct taacgaaaca acgagagcga gatcattcat acaccaaaac acaggtacta 3480
tagaagcgcc gcgcagtaga gattcacacc gccccttgaa gcaaaagtcg gaaggaattg 3540
cgcgatgtca gaacctctac cccctaaaga aggggaacca aggccacaga aggaagaaag 3600
tcaaaatgac acgctcgaag cgactgagtc caagtcccag cacatcacag gcctcaagct 3660
cgggctggtg gttgcttcag ttactttcgt agcatttttg atgctccttg atatgtccat 3720
tatcgtcacg gtaagatggt ggctacctca gaacagagcg cagcacagtc aattgactcc 3780
agccacaggc aatcccacat atcacaagcg agttccactc tctgaacgat gtagggtggt 3840
acggcagtgc ttatcttctg gctaagtatg gctctgttct ccttgacctt gttcattgta 3900
cgaacagatt agctaacatc atatttagct gtgctctcca gcccctggcc ggtaaattgt 3960
atacactctt gggcttgaag tacactttct ttgccttcct ctgtattttt gaactaggct 4020
cggtgctatg cggtgccgca agatcttcca ccatgttgat tgttgggcgg gccgttgctg 4080
gaatgggagg ctcaggtctt gtcaacggag ccctcacaat cctctcaaca gctgctccta 4140
agcacaagca accaggtaag ggaaccgatt tttggaagtc tgctgggtgc cgtgtacacg 4200
ctgacctcgc atatgaagtt ttgattggag tgatgatggg tcgtatgtca tctcaagatc 4260
tgatgtaccc caaacgaacg gttcgtcgtc tgacaatatg ttttcagtta gtcagattgc 4320
cattgtctgt ggaccactgc tcggaggtgc tttcactcaa cacgccactt ggcgatggtg 4380
tatgttgacc tttggccttt ttatgattgt tgtccatgtt ctcacttgga attcaggctt 4440
ttatatcaat ctccccatcg gcgctgtcgc tgcattcctc cttctcgtca tcaccatacc 4500
cgaccgaatt tcatccacgg acagcgaact ctcgaccgac aaaccaatgg ccaacataaa 4560
atccacactt cgcaaactgg accttgtagg ctttgtggtc tttgcagcct tcgcaaccat 4620
gatttccctc gcactagaat ggggagggtc gacctacacc tggcgaagtt ccgtcatcat 4680
cggcctgttc tgtggcggag ggtttgctct gattgcgttc gtgctatggg agcgtcatgt 4740
tggcgatgct gttgccatga ttcctggctc agtggctggt aaacgacaag tgtggtgctc 4800
ttgtttattt atgggctttt tctctggctc cttgcttgtc ttttcctact atctaccgat 4860
ctacttccag gctgtgaagg atgtttctcc cacactgagt ggtgtgtaca tgttgcctgg 4920
aattcttgga caagtcatta tggctatggt ttctggcttc gcaagtaagt gaaactcgcg 4980
tacacatttt tctccacccc gtccatttct atggctcctt tcttgccaca accgtctgac 5040
atcgggcttg gatatcgtgt atactgacat atgacgcacc agttggaaag acaggatact 5100
atttgccttg ggccctaggc agcgctgttc tcgtcgccat aggcgcaggt ctggtatcca 5160
ccttccagcc ccatacatca actgtgaaat gggtcatgta ccaatttatc gcgggcttcg 5220
gtcgtggttg tggcatgcaa acggtaagct atgaaacctt tgatcatctc tcacgctttc 5280
ggctttgtat caaagcaaga agagcatgca accgctagac gctgacatca atactcaatg 5340
gccagcctat catcgccatc caaagcacgc tttcgcccga acaaggtgcc ctcggaattt 5400
ctctcgccgt gtttggacag acgtttggag gatcgctctt cctggacttt gctaaccttg 5460
tctttgggtc cggtttgaga actggcctga gcaagtatgc gcccactgtc gacacgcagg 5520
ccgtgacggc agcaggggcg actggcttca gagatgtggt cagcaagaat aaccttccag 5580
gggttgtaaa agcttacagt ctcgccgttg atcatacttt ttacttagca gtgggagcta 5640
cggcgtgcac gtttgtgttt gcctttggaa tgggatggcg gaagattgca accaaaaacg 5700
acacccgggc tgtgcctgag actgatgctt gaccgcgttg ctagatagac acattaccgt 5760
gcctccacaa agaatctcca catacttaat taatgtcgat ttcaaagatt ctatatgtca 5820
ttgcccgcga cccatgtcta gtctaagtcc atctcaaggt tctagtcacc gtggctagat 5880
tggcaacata taactatgtt gagattcata gttagttagt tacggcatct gacaatggat 5940
gattgatgtt tcaggcatca atcctgatac ctcaggaatg aatcagatca acattcaacc 6000
tactcagtaa gttatagctt gaacaaagct ttcactcatt aaataattat gagggatcag 6060
acctaaacac tctctggaaa aggaccatct ctttatatat tcttcttccc tactacttgc 6120
atcgtaaatt tcaacaacat ataaacatga gatacccttt ctggccgttc actctaccac 6180
ctgcctgtct cattgcattg tgcttttgaa aattatgaca ataacaacca atgagaaaaa 6240
atatgatcct cctgcaatga atccactgga gggggtacgg agcttggaat gctcctaaga 6300
ttccgaccta atcagcgtcg agcccgatca gtagctgcag cactcggcct cagtgcattg 6360
ttaggaacag ggactgtcct ggttccgcct gacggggaga cacttcgaga aggggctgaa 6420
gatgccgggg cagaacggtt gtgcgccatg tgcgccttga ccaggtgacc ggcggctagg 6480
gcagcacata gcgagagctc cccagccaaa acagcgcttc cgatgatgcg cgcaagttga 6540
cgtgcattct caccgggagt ggtcgggtgt gatccgcgga caccaagcat gtcaagcatt 6600
gcgccctggg gctccagaat cgtaccaccg cccaacgttc caacctcaat agacggcatg 6660
gagacagaga tttgaagcga tccgcgaaga ctaaacagga ttagtgaatg tttccaagta 6720
agcggccgct ttcaacttac ttgttcatga gagtgatgca gttagcgctc tccacaactt 6780
gcgccggatc ctgacctgtg gcaatgaaaa tggctgccgc aagattggca gcttgggcgt 6840
tgaagccgcc aactgagcca gccatagcgg acccaatcag atttttcgat atgttgagct 6900
gaaccatgct atccacatcg ctctttaaga catccctgac aacgttcgcc ggtatgatgg 6960
cttcggccac aatgcccttg ccccgtccat cgatccaatt caaagctgaa ggtttcttat 7020
ccgtacagta atttcctgat agggtaataa tattcatatc gctgaaacct gcctctgtcg 7080
ccataacatt cagtgcatgc tccacgccct tagaaatcat attcattccc atagcgtcgc 7140
cagtagtagt cttaaatcga atatataagt gagtaccggc gatagttgtc cgcatacttt 7200
gtaagcgcgc aaatctgctg gttgaattga aggcttcttt cattacggtc tggccgacgt 7260
ccgaatcgag ccagatctta gcagcaccag ctcgttcaag gacatcaaac ttcacacacg 7320
ggcctcgtgt cataccgtcg ccagtcagga ctgtcacggc accgccaccg aggttgattg 7380
ccttactgcc acggctagca ctagcgacga ggacgccctc ggtggttgcc ataggaatga 7440
aataactctt gccgtcgata acaataggac cggcgacgcc aacagggact ggcatatagc 7500
caataacgtt ctcgcaacat gcaccgagca cgcgttccca ggcgtagttt tcgtacggca 7560
gcttcgagtg ctccagcata cttgtaagct ctgcggtagc cggtgtcctc gaaatgatag 7620
agcggcgaac cttgacggca cgagtgcagt ctttgagact cttctctagg gcatacccgg 7680
gaacctttcc ccgcaaagac aaggcaacga catcctcatc gttcaactcg ctgattgtgt 7740
tctgcttcag caaattgtcc agttcgattt gtgtgcgaga cacgggaagt tcactagtgg 7800
ctgtctttcc ttctgctcgc ttagtgacct ttagagatgc tttaattaag actaatgagg 7860
catcactgtc actgtcggtg gtggtaggag tgaacactct ggtctgagga gcttggagac 7920
ttgattgaat ctgaggggtc tggttctggg cagcgttgaa gctttcggcc tggtcaagct 7980
caactggatc aactgggtga ctcgggagat taggatcttt gattcccagt ctggcggcct 8040
tgaacagata gctgttcaga gcgacactta gggcaagtgc cacaaacacc catttggaga 8100
ggacgggatc ttccaggctg gtgagcaggc taccgaccat ttttccacca actccatact 8160
cgtgtagctg cgaggtacca cggtgaatgg aaggatactc tagttcgtac ttgatggggg 8220
cgaggacagt gaccatagtc gattgaccgc gccctcttgc ctggaaaagt agttcatcta 8280
gtccacttcc agctaccttg aagggctcaa gcgggggttt aatggccgat ccgctcagac 8340
tttcggtcca agatgatata ctggacaacg atccactaga agaggcttgg aaaagggtgg 8400
agccgatgtt gacgaggttg acgataagga aaccaacgac catccagaat ttgaacttcg 8460
gaacactgct gcctttcata tcattgccaa acagatatgt acgtgcactg tcttgggcat 8520
cattgctggt cgcgacactc tccgccgtcc gctgactgag accctcatct tccaacgcgt 8580
accgcatgtt gatatgacgt ttgaggcggt ttacctcgag cttgatagac agaatcgcag 8640
tgtagaatgt aaacagcagc agacagtcaa agaacaggat caatgcagct agaacacaga 8700
agtgctgtag cccaccttgg atgcctaaga cagcaccgat aactaggagc aggatctcga 8760
ccacgtagtg gcacacgata ttgtaaccct tctcccgaat ggcgcttcgt acggcgtaat 8820
tgatggtact ttcagcaatg gctgtcacgc taccctggtc agactgtatc ttctggggct 8880
ttcggtgctg cacagcatag gacaaaacag ccctggtcag agtgatgctc ttctcaaagc 8940
caacgatcac caccaagaag gggaggcctt cggatagcaa cctcatgctc atcggaaccc 9000
ctagtcttat ggccacgtcg agaccgagga gaaaggcaaa tgttgacgac aaaaggacgc 9060
ttgtagccag ccaaaccttc gatcccaatt ttttcatgct gaggaagagt gagacgaaag 9120
tcaagtgcat tgatatataa cctagcacca tgacaaccac gtcgagcgtt tgagcgctct 9180
tgataagatc aagagactct gtccaggtat cgtgcaccca ttgagcaagg ctgcgttttg 9240
tgtgagccct ggcagccttc atgatccaca tctggcgttc catctcgatc aattgcgtct 9300
cctgcaattt caggtcggca ctgttgttgg ggatttcttg aacagcagcc acgagttccg 9360
gcgcgctgct gtattccaca gagaaggcga aaactttatc tttcgaatag gcggttaaag 9420
ggctcgacgt tgagggaagg tcaatcacag ataggttcac agggagggga gcaaggaatg 9480
gtgaggctgc ttgagatgca accccatatg accccgggaa taccaaggtc attagtgctt 9540
gatggttgaa atctccgaga acatctgcat ccccgtcgaa gctctgccac ttccagccat 9600
tctgtgggcc ggtgatcaag cttcgacttc cttcgaccaa agagccccat tctgctttat 9660
caacgtttgc ggggccatgg aagaagctgt ctttgagtag tccaacgtat gtggtactag 9720
ctagaatagc tatggtgcaa acggtatgga tcgggtgtag acacgccgtt ttggatagaa 9780
attggagtgt ggaggtcaat gcccgatttc ccgagcgtag agggtgctgc tgattcattg 9840
attccctacc gcgaaagcga gagggtagca acgaagcgac catgctgaaa ggtctgtgct 9900
acagcttgga gtggtaccta tagctaggta gtctctgaga aaagaatcta gtcagctctg 9960
caaatgggga cggaaaagca cttcaattgg gaattagggc ttgagataaa gtgcatacct 10020
ccaaaatcga atgagcaacc taatcggtta ggcgcctagg tataatctgc cgtcgtagat 10080
tggaggaagg ttgttcggcc caaggggttg ggagggacaa ctgaacagtt cctaggtacg 10140
ggaaatgagt agaagaaaat aacaaatggc gcgcgcccct gaggctgagg cagcggaaag 10200
attcgcttcc ttatccctgc atctggtcca cctttatgaa tggattcatg accggtgtca 10260
actgctgcct agggtataat tggtaagggg taccaagcaa aggatagtag gaccaattgc 10320
actgaaaact agtatttgtg ctcataacta tgctcagttt ccaaggtttt tatgcataaa 10380
tttatccttt attcgagaaa aaagaattct ggggacacca atcaattgcc ctgataccta 10440
ggaatgtgaa cttccaagat tgttccgaaa gtaggccaaa tgaccaataa gacagaacac 10500
tacctaggta tagttatttt gtcatgccta gatccgacat acaaaggagc gtcctcttac 10560
atagacgtcc tgttagacgt ttctaatctg actcgtattg tggtcctttt ttggtggggc 10620
ggcaagctgc atcgatcacg cccggacgag gccacttcgt gaggaatgga aatatattgt 10680
gcctacggag taatgcacca cgaaacacat tcttctcgaa acgactactt acgcagggat 10740
gtatgggtat tattctgtcc acgaaaagcc agtgtcaacc cccccccccc cccccccccc 10800
cggtatcatt tatctcagta aacagcaacc tgaacaagat acccaggtag acaagaagtc 10860
agtttggagt atagtgtata gactcgggaa cattttgtgt ggacctccgt acgtgtctct 10920
caaatcggcg tctctcggtc tttggatacc ttcggagtta cacggggctt tgttgccaag 10980
gcttcaatat tcggcgcatg gattttcttt gtgcatgggt ctgagtgggg tgccgtaagg 11040
tatggtattg ctcccgattg ggagttctga cagatgatca tgccgccttc cgaagtagaa 11100
aaaagaggaa agggtcacat gctcatgatg atcgtttgct cgcgatgaat tgcgcttcct 11160
gcatatattt tgtttgcttg tcttagtcaa ccgataatgc aaattttggg gattgtgtat 11220
tgttggaaat tgaattacca actgcttaca ggacccaccc tgcgctcagg ccctcaacaa 11280
accttgggac aggattaccc actaagcctt tccaagcttt tccaaggctt ttggattcgt 11340
ttggtttgat agctcgtatg cgtatttcgc atctgtgtac ggagtatcgg attctgacag 11400
cctccattat acccgaaaac tacctggccg gcctgacctg tttcgtcttg ttcgacggtt 11460
tcccatcggc gttttgactc gggattatcg tgacgacaga caatgcctcc cgaaccggta 11520
cctctaaggt attgccccga gcatagcatg gtggtccggg gtttcccatg ggcacagagc 11580
gaatatcgtg tcacgtccaa gatgaaaaca aaccccgaac tatgaatcac gtgtcggggg 11640
cagcttatgc atctatagct atgccaggga cctgtagact gttggaagac tatcaacggt 11700
tttatcacca gggcgactga tatatcagtc aatgaaacaa cgttggaatg aacaataccc 11760
ccgccgtaac cgcaaccgca accgcaaccg caaccgcaac cgcaatggca ggctcggctt 11820
gctctaacac atccacgccc attgccatag ttggaatggg atgtcgattt gctggagatg 11880
caacgagtcc acagaagctt tgggaaatgg ttgaaagagg aggcagtgcc tggtctaagg 11940
tcccctcctc gcgattcaat gtgagaggag tataccaccc gaatggcgaa agggtcgggt 12000
ccgtgagtat ctaacatgca tgcatttata tcttgttttg aatatttgac acaagatttg 12060
agcatcactg aagcttggtt actgactcca aggatgactg gatagaccca cgtaaagggt 12120
ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa catgaccaca 12180
gaggtcgcca gcgtatgatt atttcaattg atctaacccg ggacgcagag atctaatatt 12240
ggacagtgca tggatccgca gtatcggctt atgcttgagg tggtctacga atcgctggag 12300
agtggtatgt agtgtgggtc atcctcactg taagcaaacg tcactgacca tcatccagcc 12360
ggtatcacca tcgatggtat ggcaggctct aatacgtcgg tgtttggggg tgtcatgtac 12420
cacgactatc aggattcgct caatcgtgac cccgagacag ttccgcgtta tttcataact 12480
ggcaactcag gaacaatgct ttcgaaccgg atatcacact tctacgactt acgtggtccc 12540
agcgtgacgg ttgacacggc ctgttcgacg acattgaccg cactgcactt ggcgtgccag 12600
agcttacgta ctggggagtc agatacagcc atcgttatcg gtgcaaatct tctgctcaat 12660
cccgatgttt ttgttacgat gtcaaacctg gggtgagttt tccgaagaag attccagatc 12720
gagagtcttg aactaagcaa tccttgttgc tcaatgacag atttttgtcc ccggatggta 12780
tctcgtactc ttttgatcct cgagcgaatg gatatggtcg cggggaagga attgccgctc 12840
tggtaataaa ggccctccct aacgcgttgc gagaccaaga ccctatccga gccgtcattc 12900
gagagacagc gctgaaccag gatggcaaaa cacccgcaat tactgcgccg agtgatgtgg 12960
cgcagaaaag tctgatccag gagtgttacg ataaggctgg gctagatatg tcgttgacct 13020
cgtacgtgga ggcccacgga actggaacac caactggtga cccccttgaa atctcagcaa 13080
tttcagcagc ttttaaagga catcctctgc accttggctc tgtgaaagca aatattggcc 13140
atacagaagc cgccagtggc ctggccagta taatcaaggt ggccttggcc ttggagaagg 13200
gcttgattcc ccctaatgcg cggttcctgc aaaagaacag caagctgatg cttgaccaaa 13260
agaacatcaa ggtaaggctt tgcgcattcg cagattcagt tatatgtttc aaaggttaat 13320
gtttcaaaga tccccatgtc tgctcaagac tggcctgtga aagatgggac tcgtcgcgca 13380
tctgtcaata acttcggctt tggtggttcg aatgctcacg tcattttgga atcatatgat 13440
cgcgcatcat tggccctgcc agaggatcaa gtgcatgtca atggtaactc tgagcatggt 13500
agggttgagg atggttccaa acagagccgc atatacgttg tgcgtgccaa ggacgagcaa 13560
gcttgtcggc gaacgatagc aagcctgcga gactacatta aatccgtcgc tgacattgac 13620
ggggaaccct tcctcgccag cctcgcctat acactaggct ctcgccgttc cattctgcca 13680
tggacgtcag tgtatgtagc agacagcctt ggcggccttg tttctgccct cagcgatgag 13740
tccaatcaac caaaacgagc gaatgagaaa gtacggctcg gatttgtatt caccggtcag 13800
ggggcgcagt ggcatgcaat gggcagagag ctggtcaata cattcccagt attcaaacag 13860
gcgattcttg aatgtgatgg ctacatcaag caactgggcg cgagttggaa ttttatgggt 13920
aagttgcgag cccgggaaaa gtaatactgt atcaagcttg aggtactaac attcaattgc 13980
acagaggagc tccaccgtga tgagctgacg actcgggtaa atgatgccga atacagtcta 14040
ccactgtcaa ccgctatcca aattgcactt gtgcgtctcc tttggtcatg gggaattcgg 14100
ccaacgggga taaccagtca ctcaagtgga gaggctgctg ctgcctacgc agctggggct 14160
ttatccgcgc ggtcggccat tgggatcact tatatacgcg gtgtattgac cactaagccc 14220
aagcccgcat tggcagccaa aggaggaatg atggcggtgg gtcttggtcg cagtgagacc 14280
aatgtttaca tttcgcgtct caaccaggag gacggctgtg tggtggttgg atgtatcaac 14340
agtcaatgta gtgtgacggt gtcgggagat ttgggtgcaa tcgagaaact tgaaaagttg 14400
ttacacgccg atggcatctt taccaggaaa ctgaaagtca ctgaagcctt ccattcaagc 14460
cacatgcgac caatggcaga tgcctttggg gcgtcactga gagatctgtt caactcggat 14520
aacaacaacg acaatcccaa tgctgacacc tcaaagggtg tattatattc atcacctaag 14580
actggtagtc gcatgaccga tcttaaattg ctattggatc ccacacactg gatggatagt 14640
atgctacagc cggtagagtt cgagtcctca ctccgcgaga tgtgctttga tcccaacacc 14700
aaagagaaag ccgtcgatgt gattattgaa atagggcctc acggagcgct tggtggtcca 14760
atcaaccaag tcatgcagga tctgggtctg aaaggaacag atataaacta tctcagttgc 14820
ctttctcgcg gcagaagctc gttggagaca atgtatcgtg ctgctacgga gttgataagc 14880
aagggttatg ggctcaaaat ggacgctata aactttcctc atggaagaaa agagcccaga 14940
gtgaaggtac tgagcgattt gccggcgtac ccgtggaatc accaaacccg ttattggaga 15000
gagcctcgcg gcagtcgtga gtccaaacag agaacccatc cgcctcacac tttgataggc 15060
tcacgggaat ctctctctcc tcatttcgcg cctaaatgga aacatgttct ccgtctgtca 15120
gatattccat ggatacgaga tcacgtcgtt ggttcgagca tcatctttcc gggagctggc 15180
ttcatcagca tggccatcga ggggttttca caagtctgcc caccagttgc gggggctagc 15240
atcaactaca acttgcgtga cgttgaactc gcgcaggctc tcataatacc cgctgatgca 15300
gaagcagagg ttgacctgcg cctaacgatc cgttcatgtg aggaaaggtc cctcggcaca 15360
aagaactggc atcaattttc tgtgcactca atttcgggcg aaaataatac ctggacagaa 15420
cactgcaccg gattaatacg ttcggagagc gaaagaagcc accttgactg ttcaactgtg 15480
gaagcctcac gcaggttgaa tctaggctca gataaccgga gcattgatcc caacgatctc 15540
tgggagtcct tacacgcgaa tgggatatgc cacggaccca tttttcagaa cattcagcga 15600
attcaaaaca atggacaggg ctcgttttgc agattttcca ttgctgacac tgcctcggct 15660
atgcctcact cgtacgagaa tcgacacatc gtccatccta ctactctgga ctcggtgatc 15720
caggcggcat acacggtgtt accctacgcg ggaacacgta tgaaaacggc catggtacca 15780
aggaggctaa gaaatgtcaa aatatcctct agcctggctg acttggaggc tggtgatgct 15840
ctggacgcac aggccagcat caaggatcgc aactctcaat ccttctctac cgacttggca 15900
gtgtttgatg actatgatag cggttcttct ccctcggacg gaatcccagt catagagatt 15960
gaaggccttg ttttccagtc ggttggaagc agcttctctg accaaaagtc agactccaac 16020
gacacagaaa atgcctgcag ctcctgggtt tgggcccctg acatcagctt gggtgactcc 16080
acttggctca aagaaaagtt gagcactgag gctgagacga aagaaacgga actcatgatg 16140
gacctccgaa gatgcacgat caactttata caggaggctg tcactgattt gacaaattct 16200
gatatccaac atctggatgg ccaccttcag aagtatttcg attggatgaa tgtccaattg 16260
gaccttgcga gacaaaacaa gctcagccca gccagttgcg actggctaag tgacgatgct 16320
gagcagaaga aatgcctaca ggccagagtc gctggagaaa gcgtcaatgg cgagatgatt 16380
tctcgtctag gacctcagtt aatagcaatg ctacgccgcg aaacagagcc acttgagttg 16440
atgatgcaag atcagctgct aagcagatac tacgtcaacg caatcaaatg gagccgatca 16500
aacgcacaag ccagcgagct gatccgactt tgcgcccaca agaacccgcg ttctcgcatt 16560
ttggagattg gcggaggcac gggcggctgc acaaagctta ttgtcaatgc attgggaaac 16620
accaagccga tcgatcgtta tgacttcacc gatgtgtctg ccgggttttt cgagtcggcg 16680
cgtgagcaat ttgcggattg gcaagacgtg atgactttca aaaaattgga tattgaaagc 16740
gatcccgagc aacaagggtt tgaatgtgcc acctacgatg tggtcgtggc ttgccaggtc 16800
ctgcatgcaa ctcgatgcat gaaacgaaca ctgagtaacg ttcgaaaatt gctcaagcct 16860
gggggcaact tgattttggt tgagactacc agggatcagc tcgatttgtt ctttaccttc 16920
ggactgttgc caggttggtg gctcagtgag gagcctgagc ggaagtcgac gccatcgctc 16980
actaccgatc tttggaacac catgttggac acgagcggtt tcaacggtgt ggaattggag 17040
gttcgtgatt gtgaagacga tgagttttac atgatcagca caatgctatc gacggctaga 17100
aaagagaata caaccccgga tacagtggca gaatcggagg tgcttttgct gcacggagcg 17160
ctccgacctc cttcatcttg gctggaaagt ctccaggcag caatttgtga aaagaccagt 17220
tctagcccat cgatcaacgc tctgggcgag gtagatacca ctggaaggac atgcattttt 17280
cttggggaaa tggagtcctc gctccttgga gaggtgggaa gcgagacctt caaatccatc 17340
accgcgatgc tgaataactg caacgcactt ctctgggtgt ctagaggagc agccatgagc 17400
tccgaggatc catggaaagc tctacatatt ggtctgctgc gtaccatccg caacgaaaat 17460
aacgggaagg aatatgtatc gttggatctc gatccttctc gaaacgcata cacccacgag 17520
tccctgtatg ctatctgcaa tatcttcaat ggccgcctcg gcgacctttc cgaagacaag 17580
gagtttgaat ttgcagagag aaacggcgtc atccacgtac cgcgactttt caatgacccg 17640
cactggaagg accaagaagc ggttgaggtc acactgcagc cgttcgagca acccgggcgt 17700
cgtctgcgga tggaggttga gacgccaggg ctcttagact ccctgcaatt tcgagacgac 17760
gaaggacgtg aaggcaagga tcttccggat gattgggtag aaatcgaacc caaagctttc 17820
ggtctcaatt ttcgggatgt catggttgcc atgggtcaat tggaggccaa ccgtgtgatg 17880
ggcttcgaat gcgccggagt gatcacaaag ctcggtggag ctgctgccgc tagccaaggc 17940
ctcagattag gggaccgcgt atgtgcacta ctgaaaggcc attgggcgac cagaacacag 18000
acgccgtaca ctaatgtcgt ccgtattccg gacgaaatgg gcttcccaga agccgcttcg 18060
gtccccctgg ctttcactac cgcatatatt gcgctttata ccacggcaaa gctacgacga 18120
ggcgaaagag tcttgatcca cagtggagct ggaggcgtcg gtcaagcagc gatcattttg 18180
tcccagcttg cgggtgccga ggtcttcgtc acagcgggaa ctcaagccaa gcgtgacttt 18240
gtcggcgata aattcggcat caatccggat catatcttct cgagcaggaa tgacttattc 18300
gtcgacggca tcaaagccta cacgggcgga cttggcgttc atgtcgttct aaactcattg 18360
gcaggtcaac tcctccaagc aagctttgac tgcatggccg aattcggcag atttgttgag 18420
attggaaaaa aggacctgga gcaaaacagc agacttgaca tgctgccatt cacccgggac 18480
gtctctttca catcaattga tcttctctcg tggcaaagag ccaaaagtga agaagtatcc 18540
gaagcgttga accatgtcac aaaactcctc gagacaaaag cgattggctt gattggtcca 18600
atccagcagc actccttgtc aaacatcgag aaggccttcc gtacgatgca gagtggtcag 18660
catgttggca aagttgtggt caatgtatct ggggacgaac tggtcccagt cggcgatgga 18720
gggttctcgc tgaagctgaa gcctgacagt tcttacctag ttgctggtgg gctgggggga 18780
attggaaagc agatctgtca gtggcttgtt gatcatggcg cgaagcactt gattatccta 18840
tcgagaagtg caaaggccag tccattcata accagcttgc aaaatcaaca gtgcgctgtc 18900
tatctacacg catgtgacat ctcagatcaa gatcaggtca ccaaggtgct ccggttgtgc 18960
gaagaagcac atgcaccgcc aattcgaggt atcatacaag gtgccatggt tctcaaggac 19020
gcgcttctat cgcgaatgac attggatgaa tttaatgcag caacacgccc aaaagtacag 19080
ggtagttggt atcttcacaa gatcgcacag gatgttgact tcttcgtgat gctctcatcc 19140
cttgttgggg tcatgggtgg ggcaggccag gccaattacg cagctgctgg tgcattccag 19200
gacgcacttg cgcaccaccg gagagcccat ggcatgccgg ctgtcaccat tgacttgggc 19260
atggtcaagt ctgttggata cgtggctgaa actggccgtg gtgtggccga ccggctcgct 19320
agaataggtt acaagcctat gcatgaaaag gacgtcatgg atgtgttgga gaaggcaatc 19380
ctgtgttctt cccctcaatt tccatcacct cccgcagctg tggttacagg aatcaacaca 19440
tccccgggtg ctcactggac cgaggcaaac tggatacagg aacagcggtt tgtgggactt 19500
aaataccgcc aagtccttca tgcagaccaa tcctttgtct cttcgcataa aaaaggacca 19560
gatggcgtgc gggcccaact aagcagggtc acctctcacg acgaggccat ttctatcgtc 19620
ctcaaagcaa tgacggaaaa gctgatgcga atgtttggtc tggcagaaga cgacatgtcc 19680
tcgtccaaaa acctggcagg tgtcggcgta gactcactcg tcgccattga acttcgaaac 19740
tggatcacat ctgaaatcca tgttgatgtg tcgatctttg agctcatgaa tggtaacacc 19800
atcgccggcc tcgtcgagtt agttgtggcg aaatgcagtt aagttgaagg gttcagtgaa 19860
gccttttgtc tggccaagcg ggtatagctc gacggaggta tagtacgaag gagcatagcg 19920
gccatggtct gaagcctgaa tccaatctga atcgagcctg ggctgagcct gactatttaa 19980
tgcctgactt ctggatagca gtaaatagag atacctgaaa taccattaca gtggccctga 20040
gaagcaacaa agtacacatg tgcactcgtt ctcgaagtcg gaagagtgaa tgctttttat 20100
actaccaggg aagctgtctt agcacctcgg aggcttgact gtcaaaagtt ctctcttttt 20160
ctctccatta tgattcccgc aagccttgta aatgcgcgtt gaacggtcga aaggcgttgg 20220
cacgggcagt gggtacagat tgtggatatg tagtcggaag gcgggaggga gtacttgtgt 20280
ccacgtcgtt gcgccgtcct ctctttcgcc tagtcgggga tgttgagtag gaacatcaag 20340
acttaacaga gcctaagccc tcgtcatcgt aagcgccagt caacgcctga gagaatgggg 20400
agatcggtga ttgtaccggg agaaaagctt cattactgcc gacttcccta cgtggcggtg 20460
tagctggcgg tatagaagca gatggccgct ctgcgtagca ggaatacaca ctctctccct 20520
tctctctctc tgtgtttctg tctctcgcac atagccaaag tctacaccac gttcgattac 20580
aaagaaggca tcacaatcga ataaaatgcg ttttatttta ctaacctact cgactaatac 20640
agcacctagt ttctctggga cggaaactat tggaataagc ctggggacgg atgcatattt 20700
gttttagttt gcgtgttata tcttagcacc ggtcatgagg gagcgggatg tcctcgttgc 20760
gccggcgtac catgagcttt gtggttggat gcatacgaac gctaaaagcg tgacggtagt 20820
atttgtcatc gtctcctggt acaggcttca catcatactg aatcagtata tgagcgagga 20880
gaatcttgat ttccttcgag gcgaagaacc gcccgggaca agcgcgtggg ttccagccga 20940
agccgatgtg atcaccgttg gtattctcca attgagcggt gaaggccttg tctggatcct 21000
cgcgcatgcg cataaatcgg tagggatcat aattttcggg gttttcccac acatcagggt 21060
tgttcatgcg gtctgcagcc acagcggcca actcgccctt gggaatgaag aggccattgg 21120
atagagtgat gtctctgaga gcggtactgc gcatagtggc gcactcgacc ggcttgattc 21180
gctgcgtctc tttcatgcag ctgtcgagga gcttcagctt gaacagagag gcaggcgtcc 21240
agcccccttc tccgattaca gtgcggatct cttggcggag aggctgaata aggtctgggt 21300
gcctggcaat gtccacaagg gcaccgacga aaagatccgt cgaggcgtag atgccggcga 21360
aatccatagc gagctgagca cccgccacat cgtaccagcg gccgtcggcg gtgtcttcaa 21420
accattgcat ggtatcgacg tactggggcg gctgcacgcc cttcgctaca catgcggcct 21480
tttcagcacg tcgtcgctga atctcaggat caatgatctt tcgtgcgcgg cgcacttggt 21540
cacgcaattt gcgtccttgc ggttgaaacc agtgagcgag cggtcgcagt agcatgggcc 21600
atacgcgaag ttggcgagct tgtaccgcca cactcacggc atggttcttt gcaatatcca 21660
gccactcctc attgtggcag attttgtcgc cgaccataat gagtgtgact gttcgtgtga 21720
caaggtccaa tccattggaa tagacaggtg cggtttgcca ctctagtata ttcgcggtat 21780
gtcagccaga ggctcaatgc tcaagacaga aaaattgaca cttaccctcg cttttaccga 21840
acaacttggc aatagtagcg tcggccaagg tagccaatgg ctttgtgtac ttgggggctt 21900
gggtttgtaa ctggttcaaa acaactttgt tgacaagatg tgcatcctgg cagatttcct 21960
tgaacccgtc gaatccaggg agatgagagt gaaagtccta tacattcatc agaatcttag 22020
agacgtcatt gagttacaac aatggaaaat tcagaggtca tacatccgcc aaaaacttgt 22080
acatgcacat atctttgatt ttccgaaact cgtcggccat ggacgatggg aggatggtgc 22140
aatagccgga atcaacaatg aagcgcaggg gcttgtcgtt tttcgagaac caagcttcga 22200
tccagctcgg accatacgta tcgaagtcct gcctagccct catggtcgtc aactcccacc 22260
attttttggg attatagact tgcagttcgg actggcgccc ccgcaaacgg taggcgatga 22320
gactaagaag cactgcgacc gccacaaggg cttgaggggt cgatacccat tggtacgatt 22380
cgacggtcag aagaacctgg ccgagcattg cgtgagacag ataggaccta tgcacaccag 22440
tggaaaagaa gaaagagcga agaatgagag cgctgcgacg gtttataatc gaataacagc 22500
actaatgctt ctgggatttt gtggccgaga gcactcttcc agtcaacctt gaaaaaaaaa 22560
aaaccccccc cccaatcgaa gtttacctgg atggggcagt tcggttgttt cctttaggag 22620
cagcttcacc gagcagcaca agaacaatcc gagtgaaaaa ctcggtttca ccttgataca 22680
gccaattgat attcacgttt gattcattca gcctcgtgtg accgaataac gccgtatgga 22740
ggaatggcta ttcgtgcacc gaatgacgcc gggagggttt gctaggtgcc gagcttgcat 22800
tgctgggaag tgggggcatt tgagtactag aatggatctt gaaattgtcc gaatctagat 22860
gagtactgat acgtgcaagt aaatataacg acggtatcgg ttgcaaggcc ggcttgttcg 22920
ctcagagatt caactctgcg attctgtaag aacaaatgtt gtgcccggca tgcagtgaga 22980
agatctactg acgcaagaca aggtttaatc ccaatcctat cgcccaaaaa caggatcagc 23040
agttatggat caagccaact atccaaacga gccaattgtg gtagtgggaa gcggttgtcg 23100
gtttccaggt ggtgtcaaca caccatcaaa actttgggag ctgctcaaag agccccggga 23160
tgtacagacc aagatcccta aggagagatt tgacgtcgat acattttaca gccccgatgg 23220
cactcacccc gggcgcacga acgcaccctt tgcatacttg ctgcaggagg atctacgcgg 23280
ttttgatgcc tctttcttca acatccaagc tggagaggcc gaaacgattg acccacagca 23340
aaggctgctg ctggagacgg tctatgaagc tgtatccaac gcaggcctac ggatccaagg 23400
ccttcaagga tcctctactg ctgtgtacgt cggtatgatg acgcatgact atgagactat 23460
cgtgacgcgt gaattggata gtattcctac atactctgcc acgggggtag ctgtcagtgt 23520
ggcctccaac cgtgtatcat acttcttcga ctggcatggg ccgagtgtga gtgccactca 23580
ttgagcgagc ccgacttcgt caagtgctga cagattcctg actgattctg cagatgacga 23640
tcgacacagc ctgtagttca tccttagctg ccgtgcatct ggccgtccaa cagcttagaa 23700
cgggcgagag taccatggcg gttgcagccg gtgcgaatct gatattgggc cccatgacct 23760
ttgtaatgga gagcaaattg aacatgctgt cccccaatgg tagatctcga atgtgggatg 23820
ctgctgccga tggatatgcc agaggagtaa gttgacaatg catcaattcc tttcaaaaaa 23880
agcaagatgg cactgacctc ctgtaactgc tttttaggaa ggtgtttgct ctattgtcct 23940
gaaaacgctg agccaggcac tgcgcgacgg ggacagtatc gagtgtgtta tccgagagac 24000
cggtatcaac caagatggcc gaacgacagg tatcacaatg ccaaaccata gcgcacaaga 24060
agccctcatt cgggccacat atgccaaggc tggtcttgat attaccaacc cccaggaacg 24120
ctgccagttc tttgaagccc atggtaagtg gtattccctg gaagtatcag ccttatggaa 24180
gttgcagaaa gtctctctct ccctaacacg aagatcccag gaactggtac accagccggt 24240
gacccacagg aagctgaggc tattgcaaca gccttcttcg gacacaagga tggaacaatc 24300
gacagcgacg gcgagaaaga tgagcttttt gtcggcagca tcaagacagt tctcggtcac 24360
acggaaggca ctgctggtat tgcgggctta atgaaggcat cgtttgctgt acgaaatggc 24420
gtgatcccgc caaacctgct gtttgagaag atcagtcccc gtgtcgctcc gttctatacg 24480
cacttgaaaa ttgcaacgga ggccacagaa tggccgattg ttgcgcccgg gcagcctcgc 24540
agagtcagcg ttaattcatt tggtaaggat tcaactgcac ttcttgagaa cgaaagtgaa 24600
gttagctaaa catataaaca catcaggatt tggtggtaca aatgcccatg ctattatcga 24660
agagtatatg gctcctccac acaagccgac agcagtggta acagaggtga cctcagatgc 24720
agatgcatgc agcttgcccc ttgtgctttc atcgaagtcg cagcgctcca tgaaggcaac 24780
gctagaaaat atgctccaat ttctggaaac gcatgatgac gtggacatgc atgatatcgc 24840
atatacctta cttgagaaac ggtctatctt gcccttccgt cgtgcgattg cagcacacaa 24900
caaggaagta gcccgcgcgg cactggaggc tgccatcgcg gacggtgagg tcgtcaccga 24960
cttccgcacc gacgcgaatg acaaccctcg cgtactaggt gtctttactg gccaaggtgc 25020
acagtggccg ggcatgctga agaagctcat ggtgggtatg ccatttgtga gaggcattct 25080
cgaagagctg gataattcac tgcaaacact gcctgaaaag tatcggccta cgtggacact 25140
gtatgaccag ctcatgcttg aaggggatgc ctcaaacgtc agactcgcca gcttctccca 25200
gcctctatgc tgcgccgtac aaatcgttct ggtccgactt ctcgctgcag ctggtatcga 25260
gttcagtgca attgtcggcc acagttcagg tgagattgcc tgtgcctttg cggcaggatt 25320
catcagtgcc actcaagcta tccgtattgc gcatctgcgt ggagttgtgt ccgcggagca 25380
tgcctcttct ccaagcggcc agacaggcgc tatgctagcg gcaggtatgt cgtacgatga 25440
cgcaaaggaa ctatgcgagc tcgaagcctt tgagggtcgg gtctgcgtcg ccgctagcaa 25500
ttcaccggat agtgtgacct tctccggcga catggatgct atccagcacg ttgaaggtgt 25560
cttggaggat gaatccactt ttgccagaat cttgagagtt gacaaggcct accattcgca 25620
tcacatgcac ccatgcgcag ctccatatgt caaggcattg ctggagtgcg actgtgctgt 25680
tgccgatggc caaggtaacg atagtgttgc ttggttctct gccgtccacg agaccagcaa 25740
gcaaatgact gtacaggatg tgatgcccgc ttattggaaa gacaatctcg tctctccggt 25800
cttgttctcg caggctgtgc agaaagcagt catcactcat cgtctaatcg acgtcgccat 25860
cgaaattggc gcccaccctg ctctcaaggg tccgtgtcta gccaccatca aggatgctct 25920
tgccggtgtg gagctgccgt ataccgggtg cttggcacga aacgttgacg atgtggacgc 25980
ttttgctgga ggtctgggat acatttggga gcgtttcgga gttcggagta tcgacgccga 26040
gggcttcgta caacaagtcc ggcccgatcg tgccgttcaa aacctgtcaa agtcattgcc 26100
cacatactct tgggatcata ctcgtcaata ctgggcagaa tctcgctcca cccgccagca 26160
tcttcgtgga ggtgcgcccc atcttctgct tggaaagctt tcttcttaca gcacagcatc 26220
gaccttccag tggacaaact tcatcaggcc ccgggatctg gaatggctcg acggtcatgc 26280
gctacaaggc cagactgtgt tccccgctgc tgggtacata attatggcca tggaagctgc 26340
catgaaggtg gctggtgagc gtgccgccca agttcagctc ctggaaatct tggacatgag 26400
catcaacaaa gccatcgtgt ttgaagatga aaacacctcc gtggagctga acttgacagc 26460
cgaagtcacc agtgacaatg atgcggatgg ccaagtcacg gtcaaatttg ttattgattc 26520
ctgtctggca aaggagagtg agctttcgac atccgccaaa ggccaaatcg tcataaccct 26580
tggcgaggca tcaccgtcat cgcagctttt gccgccacct gaggaagagt acccccagat 26640
gaacaatgtc aacatcgatt tcttctatcg ggaacttgac ctccttgggt atgactacag 26700
caaagacttc cgtcgtttgc agaccatgag aagggccgac tccaaagcta gcggcacctt 26760
ggctttcctt ccacttaagg atgaattgcg caatgagccc ctcttgctcc acccagcgcc 26820
cctggacatc gcgttccaga ctgtcattgg agcgtattcc tctccaggag atcgtcgcct 26880
acgctcattg tacgtgccta ctcacgttga cagagtgact ctgattccat cgctctgtat 26940
atcggcgggt aattctggtg aaaccgagct tgcgtttgac acaatcaaca cacacgacaa 27000
gggtgatttc ctgagcggcg acatcacggt gtacgattcg accaagacaa cgcttttcca 27060
agttgataac attgtcttta agcctttctc tcccccgact gcttcgaccg accaccgaat 27120
cttcgcaaag tgggtctggg gacccctcac gcccgaaaaa ctgctggagg accctgcgac 27180
gttgatcata gctcgggaca aggaggacat tctgaccatc gagcgaatcg tttacttcta 27240
catcaaatcc ttcctagccc agataacccc cgacgaccgt caaaatgccg acctccattc 27300
ccagaagtac attgaatggt gtgaccaggt tcaggccgat gctcgggctg gccaccatca 27360
gtggtaccag gagtcttggg aggaggacac ttctgttcac attgagcaaa tgtgtgaaag 27420
gtacacccaa agctgttccg tgttttttca ttcttttata ttaacctttt acttgaagca 27480
actcgtccca cccacatgtg cgcctgatcc aaagggtagg caaagaatta atttcaattg 27540
ttcgcgggaa cggggatcct ttggatatca tgaaccgcga tgggttgttc accgagtact 27600
ataccaacaa gctcgccttt ggctcagcaa tacacgtcgt tcaggatctg gttagccaaa 27660
ttgctcatcg ctaccaatcc attgatatcc ttgagatcgg taagtcgaat ctgaaatgta 27720
agtaactagg cagtttgcta atctgtcgtt cgctttttag gcttgggtac aggcatcgcc 27780
acgaagcgcg ttcttgcatc acctcaactt ggtttcaaca gttacacttg cactgacatc 27840
tcggcggatg ttattggcaa ggcccgtgaa caactttccg aattcgacgg tctcatgcag 27900
tttgaggcac tagacatcaa cagaagccca gcagagcaag gattcaagcc tcactcctac 27960
gatctgatta ttgcatccga tgtcctccat gccagctcca acttcgagga aaaattggct 28020
cacataaggt ccttgctcaa gccgggtggt cacttggtta ctttcggggt cacccatcgc 28080
gagcctgctc gcctcgcctt catctctggg cttttcgctg atcgatggac tggagaagac 28140
gaaactcgtg ctttgagtgc ctcggggtcc gttgaccaat gggagcatac cctcaagaga 28200
gttgggttct ctggcgtcga tagtcggaca cttgatcgag aggatgattt gatcccgtct 28260
gtcttcagta cacatgctgt ggatgccacc gttgagcgtt tgtatgatcc actttctgct 28320
ccattgaagg actcataccc gccattagtg gttatcggtg gcgaatcgac aaaaaccgaa 28380
cgcattttga acgacatgaa agctgcccta ccgcatagac acatccactc cgtcaagcgg 28440
ctggaaagtg ttctcgacga cccggccttg cagcctaagt cgacttttgt catcctctcg 28500
gaacttgatg atgaagtgtt ttgcaacctt gaagaggaca agtttgaggc agtcaagtct 28560
cttctcttct acgccggacg catgatgtgg ctgacagaga atgcctggat tgatcatccc 28620
caccaggcca gcaccatcgg aatgttgagg acaatcaagc tcgagaaccc tgacttggga 28680
acgcacgtct tcgatgtcga tactgtggag aacctagaca ccaaattctt cgttgagcaa 28740
cttttgcgct tcgaggagag cgatgatcag cttttggaat caataacatg gactcatgag 28800
cccgaagtgt actggtgcaa gggtcgtgcc tgggtccctc gtttgaagca ggatattgct 28860
aggaacgacc gtatgaactc gtctcgtcgt ccaattttcg gtaactttaa ttcgtccaag 28920
acggccattg cactgaaaga ggcgagggga gcatcctcat cgatgtacta tcttgagtca 28980
accgagacgt gtgattcgtt agaagacgct cgtcatgctg gaaaagcaac tgttcgtgtt 29040
cgctacgctc ttccccaggc aattcgcgtg ggccatctcg gatacttcca tgtcgtgcag 29100
ggcagtattc tggagaatac atgtgaggtg cctgtagtcg ccctggctga gaagaatgga 29160
tctatactgc atgtaccgag aaactacatg catagtctgc ccgataacat ggcggaaggc 29220
gaggatagtt ccttcttgtt gtccacagct gcagccctcc ttgccgaaac aattctctct 29280
agcgctcagt cctttggctc tgatgcatca attctgatta tggagccccc aatcttctgc 29340
gtcaaagcaa ttctggagtc ggccaaaacc tacggtgttc aggttcattt ggcaacaact 29400
ctgtccgacg tcaaaactat tccggctcct tggatccgat tacatgccaa ggaaaccgac 29460
gctcggctga aacacagcct gccgacaaac atgatggcat tctttgactt gtctaccgac 29520
cggactgctg ccgggataac caaccgtttg gccaagttgc taccacccag ttgcttcatg 29580
tacagtggtg actatcttat ccgaagtaca gcttccacat acaaagttag tcatgttgag 29640
gatattccaa tcctcgagca ctctgtggca atggcaaaaa ataccgtctc tgcgtcgact 29700
gtcgacgaca ctgagaaagt tattacagcc acacaaattc tcttgcctgg tcagctctct 29760
gtcaaccaca atgaccaacg cttcaatctg gccaccgtca tcgactggaa ggaaaatgag 29820
gtgtccgcta ggatttgccc catcgactct ggtaacttat tttccaacaa gaagacgtat 29880
ttgcttgttg gtcttaccgg ggaccttggt cgctctctct gtcgctggat gatcttgcat 29940
ggcgcccgcc atgttgtgct cactagccgg aaccctcgac ttgatcccaa atggatcgcc 30000
aacatggagg cacttggtgg tgacatcacc gttctgtcaa tgtaagttga ttgatatcac 30060
atcacacctt gctaccacat cctcgtttac ttatccaatt actttcttta gggatgttgc 30120
caatgaggat tcagtcgatg ctggccttgg caagcttgtc gatatgaagt tgccacctgt 30180
tgccggcatc gcgttcgggc ctttggtgct gcaggatgtc atgctgaaga acatggacca 30240
ccagatgatg gacatggtgt tgaagcccaa ggtacaagga gcacgcattc ttcatgaacg 30300
gttctccgaa cagacgggca gcaaggcgct cgacttcttc atcatgtttt cgtccattgt 30360
tgcagttatt ggcaatcctg gccagtccaa ctatggcgct gcgaatgcct acctacaggc 30420
tctggcccag caacggtgcg ccagaggatt ggcggtattt tctacccctg aattatcatg 30480
catcgacgtc aagttactaa cgcacaacca cagggatcaa ccatcgatat tggtgccgtt 30540
tacggtgtag ggtttgtcac gagggccgag atggaggagg actttgatgc tatccgtttc 30600
atgtttgact cagttgaaga gcatgagctg cacacgcttt tcgccgaagc ggtcgtgtct 30660
gaccagcgtg cccggcagca accacagcgc aagacggtca ttgacatggc ggaccttgag 30720
cttaccacgg gtatcccaga tcttgaccct gcgcttcaag atcgaattat ttacttcaac 30780
gaccctcgtt tcggaaactt caaaattccc ggtcaacgcg gagacggtgg cgacaatgga 30840
tcagggtcta aaggctccat tgccgaccag ctcaaacaag caacaacttt agaccaagtt 30900
cggcaaatcg tgattggtaa gttatctctc atgcgtttcc tgatatcgag ttcaaactaa 30960
caaagttgca gatggtctat ctgagaaact ccgtgttacc ctccaagttt cggacgggga 31020
gagcgtggac ccaaccattc ctctcattga tcaaggtgtc gactccttgg gtgcagtgac 31080
tgtcggctca tggttctcaa agcaactcta ccttgacctc ccactcttga gggtacttgg 31140
cggtgcttct gtcgctgatc ttgccgacga cgcggccacc cgactcccag ctacatccat 31200
tccgctgctg ttgcaaattg gtgattccac gggaacctcg gacagcgggg cttctccgac 31260
accaacagac agccatgatg aagcaagctc tgctaccagc acagatgcgt cgtcagccga 31320
agaggatgaa gagcaagagg acgataatga gcagggaggc cgtaagattc ttcgtcgcga 31380
gaggttgtcc cttggccagg agtattcctg gaggcagcaa caaatggtaa aagatcatac 31440
catcttcaac aacactattg gcatgttcat gaagggtacc attgacctcg accggttgag 31500
gcgggctctg aaagcctcat tgcgccgtca cgagatcttc cgtacgtgct ttgttactgg 31560
cgatgactat agcagcgatt taaatggtcc cgtccaagtg gttctcaaga acccggagaa 31620
cagagtgcac tttgttcagg tgaacaacgc tgcggaggca gaggaagagt accggaaact 31680
cgagaagaca aactatagca tctccacagg tgacactctc agactcgttg atttctactg 31740
gggcacagat gaccacctgt tggtaatcgg ctaccacaga ttagttggtg atggctcaac 31800
aacagaaaac ctgttcaatg agatcgggca gatttacagc ggggtgaaaa tgcagcgacc 31860
atcgacccaa ttctctgatc tagccgtcca acagcgggaa aacctggaaa atgggcgaat 31920
gggggacgat atcgcgttct ggaagtccat gcatagcaaa gtctcgtcat ctgcgccaac 31980
cgtgcttccc atcatgaatc tgatcaatga ccctgctgcc aattcagagc agcagcaaat 32040
acagccattc acgtggcagc agtatgaagc aattgctcgt ttagatccca tggtcgcctt 32100
ccgaatcaaa gagcggagcc gcaagcacaa ggcaaccccc atgcagttct acctggccgc 32160
ctaccacgtt ttgttggcgc gtcttaccgg cagcaaagac ataaccatcg gcctcgccga 32220
aaccaaccga tccaccatgg aagaaatttc ggcgatgggc tttttcgcta acgtgcttcc 32280
cctgcgcttt gatgagttcg tcggcagcaa gacattcggc gagcaccttg tagccaccaa 32340
ggacagtgtg cgtgaggcca tgcaacacgc gcgggtgccg tatggcgtca tcctcgactg 32400
tctaggcctg aatctcccta cctcaggcga ggaacccaag actcagacac acgccccctt 32460
gttccaggct gtctttgatt acaagcaggg tcaagcggag agtggctcaa ttggcaatgc 32520
caaaatgacg agtgttctcg cttcccgtga gcgcactcct tatgacatcg ttctcgagat 32580
gtgggatgac cctaccaagg acccactcat tcatgtcaaa cttcagagct cgctgtatgg 32640
ccctgagcac gctcaggcct ttgtagacca cttttcttca atcctcacta tgttctcgat 32700
gaacccggct ctgaagttgg cctagatcgt tcagcgccgt gaattcagat gtgtggtttg 32760
agtgttgttc atgataaaga tggattagaa attggcaata gagcagatgg caaatctatc 32820
ctgaattcgg cgtcaattga cacacgcata ttcatctaca aatagcgaat tcgtcttgta 32880
tctttgtcaa aattacttct accttcgttg ctcttcttta ttgcagcaat cgtaacatca 32940
agttagatag cgcggttcag agtaccgtaa cggtgataaa tatacctcgg tagcgcgttt 33000
cgaaagactc tgtgaggaag gtgaaacctc caaggcttgg aattgatttc aatccatcct 33060
gtatataaat tcgacgccat tgcaaatagt tccatagtta ctggtttagt gccttgttgt 33120
ggtgatcgag tggttttaga tgtctgtcat gcctgttcag aacgagcctt ccatgatcta 33180
tccaaaatat gttcacgaaa tatttatgag atggtcgcga ccactataac taaatcaccc 33240
ttggaaggtg agcattcaaa ccgtgtaaga ttagaactat tcaaatttgt tcagtaaaaa 33300
tgtggtatgg actaggcatg agagccagag ccttgctata taccctgttg tctcacctag 33360
acaaatgaac ctgacatctt gaccttttga tatagctgtt ggaagcgctt gaccgtctcc 33420
tggacatcac tcggtctgtt gggaaaatta tgctttccct gaaactcgag tacatctgca 33480
ttctgaggca ggtaatgtgt ttcaaccatc tgtctcgacc cttggagagc aaaatcttga 33540
cgaccgtgaa gatgcagtgt cggcacgttg attattagct tgtcgtcgtc gtcttgcgcc 33600
tcggctctca tgtaatctct ggcttcatcg ctatagaaac agcaaatcaa aacagcaatg 33660
ctcattttcg gaaaccatgg cagttttccc atttgctgtt gatggagcag caaagtggcg 33720
accaatgcgc cctcagagaa ggccactatg ccgacaatgg gtgcctgtgg gttagttata 33780
gaccaatctt ggacggtctt ttgcacaggc ccgatcacag ccgctactct atcgcccacc 33840
gtgggggttg tcgtgtttgt aacggcgtca tgatgctttt ggaaccaggt gtagtatgga 33900
cccatgcctt ggaagacagg aagcacgccg ggtccggggc tggagctaaa cggcgcggtc 33960
gcatatacga attcaaactc gtttttcaac gccacgcgca gtttagagat ctggacgcgg 34020
aatatggctg ctgagcaccc ggcaccgtgg atgcataaga gagcttttct cggtttgcct 34080
ggcgagaaat ctgtaatcct cgctggactc attttctctt gtggtgtgag ctgtgacttc 34140
gtctgttctg gggaatttgt tagtcattac tgacaaggaa ataacaacga cgtagtattg 34200
atc 34203
<210> 3
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> A mixed primer which has a DNA sequence decuced from the amino
acid sequence of PKS of Aspergillus flavus.
<220>
<221> modified_base
<222> (6)
<223> i
<220>
<221> modified_base
<222> (9)
<223> i
<400> 3
gayacngcnt gyasttc 17
<210> 4
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> A mixed primer which has a DNA sequence deduced from the amino
acid sequence of PKS of Aspergillus flavus.
<220>
<221> modified_base
<222> (3)
<223> i
<220>
<221> modified_base
<222> (6)
<223> i
<220>
<221> modified_base
<222> (8)
<223> i
<220>
<221> modified_base
<222> (15)
<223> i
<400> 4
tcnccnknrc wgtgncc 17
<210> 5
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 5
gcatgttcaa tttgctctc 19
<210> 6
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 6
ctggatcaga cttttctgc 19
<210> 7
<211> 18
<212> DNA
<213> Penicillium citrinum
<400> 7
gtcgcagtag catgggcc 18
<210> 8
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 8
gtcagagtga tgctcttctc 20
<210> 9
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 9
gttgagagga ttgtgagggc 20
<210> 10
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 10
ttgcttgtgt tggattgtc 19
<210> 11
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 11
catggtactc tcgcccgttc 20
<210> 12
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 12
ctccccagta cgtaagctc 19
<210> 13
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 13
ccataatgag tgtgactgtt c 21
<210> 14
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 14
gaacatctgc atccccgtc 19
<210> 15
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 15
ggaaggcaaa gaaagtgtac 20
<210> 16
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 16
agattcattg ctgttggcat c 21
<210> 17
<211> 722
<212> DNA
<213> Penicillium citrinum
<400> 17
ggccacgcgt cgactagtac gggggggggg gggggggggg gcttgttcgc tcagagattc 60
aactctgcga ttctgtttaa tcccaatcct atcgcccaaa aacaggatca gcagttatgg 120
atcaagccaa ctatccaaac gagccaattg tggtagtggg aagcggttgt cggtttccag 180
gtggtgtcaa cacaccatca aaactttggg agctgctcaa agagccccgg gatgtacaga 240
ccaagatccc taaggagaga tttgacgtcg atacatttta cagccccgat ggcactcacc 300
ccgggcgcac gaacgcaccc tttgcatact tgctgcagga ggatctacgc ggttttgatg 360
cctctttctt caacatccaa gctggagagg ccgaaacgat tgacccacag caaaggctgc 420
tgctggagac ggtctatgaa gctgtatcca acgcaggcct acggatccaa ggccttcaag 480
gatcctctac tgctgtgtac gtcggtatga tgacgcatga ctatgagact atcgtgacgc 540
gtgaattgga tagtattcct acatactctg ccacgggggt agctgtcagt gtggcctcca 600
accgtgtatc atacttcttc gactggcatg ggccgagtat gacgatcgac acagcctgta 660
gttcatcctt agctgccgtg catctggccg tccaacagct tagaacgggc gagagtacca 720
tg 722
<210> 18
<211> 760
<212> DNA
<213> Penicillium citrinum
<400> 18
ggccacgcgt cgactagtac gggggggggg gggggggggg gactatcaac ggttttatca 60
ccagggcgac tgatatatca gtcaatgaaa caacgttgga atgaacaata cccccgccgt 120
aaccgcaacc gcaaccgcaa ccgcaaccgc aaccgcaatg gcaggctcgg cttgctctaa 180
cacatccacg cccattgcca tagttggaat gggatgtcga tttgctggag atgcaacgag 240
tccacagaag ctttgggaaa tggttgaaag aggaggcagt gcctggtcta aggtcccctc 300
ctcgcgattc aatgtgagag gagtatacca cccgaatggc gaaagggtcg ggtccaccca 360
cgtaaagggt ggacacttca tcgacgagga tcctgcttta tttgacgccg cgttcttcaa 420
catgaccaca gaggtcgcca gctgcatgga tccgcagtat cggcttatgc ttgaggtggt 480
ctacgaatcg ctggagagtg ccggtatcac catcgatggt atggcaggct ctaatacgtc 540
ggtgtttggg ggtgtcatgt accacgacta tcaggattcg ctcaatcgtg accccgagac 600
agttccgcgt tatttcataa ctggcaactc aggaacaatg ctttcgaacc ggatatcaca 660
cttctacgac ttacgtggtc ccagcgtgac ggttgacacg gcctgttcga cgacattgac 720
cgcactgcac ttggcgtgcc agagcttacg tactggggag 760
<210> 19
<211> 773
<212> DNA
<213> Penicillium citrinum
<400> 19
ggccacgcgt cgactagtac gggggggggg ggtttttttt ttttcaaggt tgactggaag 60
agtgctctcg gccacaaaat cccagaagca ttagtgctgt tattcgatta taaaccgtcg 120
cagcgctctc attcttcgct ctttcttctt ttccactggt gtgcataggt cctatctgtc 180
tcacgcaatg ctcggccagg ttcttctgac cgtcgaatcg taccaatggg tatcgacccc 240
tcaagccctt gtggcggtcg cagtgcttct tagtctcatc gcctaccgtt tgcgggggcg 300
ccagtccgaa ctgcaagtct ataatcccaa aaaatggtgg gagttgacga ccatgagggc 360
taggcaggac ttcgatacgt atggtccgag ctggatcgaa gcttggttct cgaaaaacga 420
caagcccctg cgcttcattg ttgattccgg ctattgcacc atcctcccat cgtccatggc 480
cgacgagttt cggaaaatca aagatatgtg catgtacaag tttttggcgg atgactttca 540
ctctcatctc cctggattcg acgggttcaa ggaaatctgc caggatgcac atcttgtcaa 600
caaagttgtt ttgaaccagt tacaaaccca agcccccaag tacacaaagc cattggctac 660
cttggccgac gctactattg ccaagttgtt cggtaaaagc gaggagtggc aaaccgcacc 720
tgtctattcc aatggattgg accttgtcac acgaacagtc acactcatta tgg 773
<210> 20
<211> 527
<212> DNA
<213> Penicillium citrinum
<400> 20
ggccacgcgt cgactagtac gggggggggg gtacctagga actgttcagt tgtccctccc 60
aaccccttgg gccgaacaac cttcctccaa tctacgacgg cagattatac ctaggcgcct 120
aaccgattag gttgctcatt cgattttgga gagactacct agctataggt accactccaa 180
gctgtagcac agacctttca gcatggtcgc ttcgttgcta ccctctcgct ttcgcggtag 240
ggaatcaatg aatcagcagc accctctacg ctcgggaaat cgggcattga cctccacact 300
ccaatttcta tccaaaacgg cgtgtctaca cccgatccat accgtttgca ccatagctat 360
tctagctagt accacatacg ttggactact caaagacagc ttcttccatg gccccgcaaa 420
cgttgataaa gcagaatggg gctctttggt cgaaggaagt cgaagcttga tcaccggccc 480
acagaatggc tggaagtggc agagcttcga cggggatgca gatgttc 527
<210> 21
<211> 522
<212> DNA
<213> Penicillium citrinum
<400> 21
ggccacgcgt cgactagtac gggggggggg gggggggggg ggatccatca atctgacttc 60
aggctagcgg accttaacga aacaacgaga gcgagatcat tcatacacca aaacacaggt 120
actatagaag cgccgcgcag tagagattca caccgcccct tgaagcaaaa gtcggaagga 180
attgcgcgat gtcagaacct ctacccccta aagaagggga accaaggcca cagaaggaag 240
aaagtcaaaa tgacacgctc gaagcgactg agtccaagtc ccagcacatc acaggcctca 300
agctcgggct ggtggttgct tcagttactt tcgtagcatt tttgatgctc cttgatatgt 360
ccattatcgt cacggcaatc ccacatatca caagcgagtt ccactctctg aacgatgtag 420
ggtggtacgg cagtgcttat cttctggcta actgtgctct ccagcccctg gccggtaaat 480
tgtatacact cttgggcttg aagtacactt tctttgcctt cc 522
<210> 22
<211> 541
<212> DNA
<213> Penicillium citrinum
<400> 22
ggccacgcgt cgactagtac gggggggggg ggctcacctc acattatttg atcttaatcc 60
aataattatg tccctgccgc atgcaacgat tccgacgaac ctacgccgtc gcgcgtttcg 120
acgctcatgt gaccggtgtc atgcacaaaa gctcaaatgt accggtagca atgccaattt 180
agtccgtgct cagtgtcaac gttgtcagca agccggatta aggtgtgtgt acagcgaaag 240
gctacccaag cgcaatttac ataaagaagc cgcagctgga actacaagag ccacagaaac 300
ctcacaaccg atgaccgcga catcttctac ggtcttctca tcattggcag agactcctcc 360
accttactgc tcaccaccta cgcatattgg cacctcggca ctcaaggaaa cattatcaga 420
accatcagcg gcaaccctgc aattctatga tacatcaatc aactttgatg atcccgagtc 480
gtttcccggc ggctggcctc agccaaatac atttcgcgac gatgccaaca gcaatgaatc 540
t 541
<210> 23
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 23
atcataccat cttcaacaac 20
<210> 24
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 24
gctagaatag gttacaagcc 20
<210> 25
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 25
acattgccag gcacccagac 20
<210> 26
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 26
caacgcccaa gctgccaatc 20
<210> 27
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 27
gtcttttcct actatctacc 20
<210> 28
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 28
ctttcccagc tgctactatc 20
<210> 29
<211> 1524
<212> DNA
<213> Penicillium citrinum
<400> 29
aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttcaa cgaaggtaga 60
agtaattttg acaaagatac aagacgaatt cgctatttgt agatgaatat gcgtgtgtca 120
attgaagccg aattcaggat agatttgcca tctgctctat tgccaatttc taatccatct 180
ttatcatgaa caacactcaa accacacatc tgaattcacg gcgctgaacg atctaggcca 240
acttcagagc cgggttcatc gagaacatag tgaggattga agaaaagtgg tctacaaagg 300
cctgagcgtg ctcagggcca tacagcgagc tctgaagttt gacatgaatg agtgggtcct 360
tggtagggtc atcccacatc tcgagaacga tgtcataagg agtgcgctca cgggaagcga 420
gaacactcgt cattttggca ttgccaattg agccactctc cgcttgaccc tgcttgtaat 480
caaagacagc ctggaacaag ggggcgtgtg tctgagtctt gggttcctcg cctgaggtag 540
ggagattcag gcctagacag tcgaggatga cgccatacgg cacccgcgcg tgttgcatgg 600
cctcacgcac actgtccttg gtggctacaa ggtgctcgcc gaatgtcttg ctgccgacga 660
actcatcaaa gcgcagggga agcacgttag cgaaaaagcc catcgccgaa atttcttcca 720
tggtggatcg gttggtttcg gcgaggccga tggttatgtc tttgctgccg gtaagacgcg 780
ccaacaaaac gtggtaggcg gccaggtaga actgcatggg ggttgccttg tgcttgcggc 840
tccgctcttt gattcggaag gcgaccatgg gatctaaacg agcaattgct tcatactgct 900
gccacgtgaa tggctgtatt tgctgctgct ctgaattggc agcagggtca ttgatcagat 960
tcatgatggg aagcacggtt ggcgcagatg acgagacttt gctatgcatg gacttccaga 1020
acgcgatatc gtcccccatt cgcccatttt ccaggttttc ccgctgttgg acggctagat 1080
cagagaattg ggtcgatggt cgctgcattt tcaccccgct gtaaatctgc ccgatctcat 1140
tgaacaggtt ttctgttgtt gagccatcac caactaatct gtggtagccg attaccaaca 1200
ggtggtcatc tgtgccccag tagaaatcaa cgagtctgag agtgtcacct gtggagatgc 1260
tatagtttgt cttctcgagt ttccggtact cttcctctgc ctccgcagcg ttgttcacct 1320
gaacaaagtg cactctgttc tccgggttct tgagaaccac ttggacggga ccatttaaat 1380
cgctgctata gtcatcgcca gtaacaaagc acgtacggaa gatctcgtga cggcgcaatg 1440
aggctttcag agcccgcctc aaccggtcga ggtcaatggt acccttcatg aacatgccaa 1500
tagtgttgtt gaagatggta tgat 1524
<210> 30
<211> 784
<212> DNA
<213> Penicillium citrinum
<400> 30
aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc tttgttgctt 60
ctcagggcca ctgtaatggt atttcaggta tctctattta ctgctatcca gaagtcaggc 120
attaaatagt caggctcagc ccaggctcga ttcagattgg attcaggctt cagaccatgg 180
ccgctatgct ccttcgtact atacctccgt cgagctatac ccgcttggcc agacaaaagg 240
cttcactgaa cccttcaact taactgcatt tcgccacaac taactcgacg aggccggcga 300
tggtgttacc attcatgagc tcaaagatcg acacatcaac atggatttca gatgtgatcc 360
agtttcgaag ttcaatggcg acgagtgagt ctacgccgac acctgccagg tttttggacg 420
aggacatgtc gtcttctgcc agaccaaaca ttcgcatcag cttttccgtc attgctttga 480
ggacgataga aatggcctcg tcgtgagagg tgaccctgct tagttgggcc cgcacgccat 540
ctggtccttt tttatgcgaa gagacaaagg attggtctgc atgaaggact tggcggtatt 600
taagtcccac aaaccgctgt tcctgtatcc agtttgcctc ggtccagtga gcacccgggg 660
atgtgttgat tcctgtaacc acagctgcgg gaggtgatgg aaattgaggg gaagaacaca 720
ggattgcctt ctccaacaca tccatgacgt ccttttcatg cataggcttg taacctattc 780
tagc 784
<210> 31
<211> 764
<212> DNA
<213> Penicillium citrinum
<400> 31
aactggaaga attcgcggcc gcaggaattt tttttttttt tttttttttc gaataaaatg 60
cgttttattt tactaaccta ctcgactaat acagcaccta gtttctctgg gacggaaacc 120
attggaataa gcctggggac ggatgcatat ttgttttagt ttgcgtgtta tatcttagca 180
ccggtcatga gggagcggga tgtcctcgtt gcgccggcgt accatgagct ttgtggttgg 240
atgcatacga acgctaaaag cgtgacggta gtatttgtca tcgtctcctg gtacaggctt 300
cacatcatac tgaatcagta tatgagcgag gagaatcttg atttccttcg aggcgaagaa 360
ccgcccggga caagcgcgtg ggttccagcc gaagccgatg tgatcaccgt tggtattctc 420
caattgagcg gtgaaggcct tgtctggatc ctcgcgcatg cgcataaatc ggtagggatc 480
ataattttcg gggttttccc acacatcagg gttgttcatg cggtctgcag ccacagcggc 540
caactcgccc ttgggaatga agaggccatt ggatagagtg atgtctctga gagcggtact 600
gcgcatagtg gcgcactcga ccggcttgat tcgctgcgtc tctttcatgc agctgtcgag 660
gagcttcagc ttgaacagag aggcaggcgt ccagccccct tctccgatta cagtgcggat 720
ctcttggcgg agaggctgaa taaggtctgg gtgcctggca atgt 764
<210> 32
<211> 765
<212> DNA
<213> Penicillium citrinum
<400> 32
aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttctgg aaaaggacca 60
tctctttata tattcttctt ccctactact tgcatcgtaa atttcaacaa catataaaca 120
tgagataccc tttctggccg ttcactctac cacctgcctg tctcattgca ttgtgctttt 180
gaaaattatg acaataacaa ccaatgagaa aaaatatgat cctcctgcaa tgaatccact 240
ggagggggta cggagcttgg aatgctccta agattccgac ctaatcagcg tcgagcccga 300
tcagtagctg cagcactcgg cctcagtgca ttgttaggaa cagggactgt cctggttccg 360
cctgacgggg agacacttcg agaaggggct gaagatgccg gggcagaacg gttgtgcgcc 420
atgtgcgcct tgaccaggtg accggcggct agggcagcac atagcgagag ctccccagcc 480
aaaacagcgc ttccgatgat gcgcgcaagt tgacgtgcat tctcaccggg agtggtcggg 540
tgtgatccgc ggacaccaag catgtcaagc attgcgccct ggggctccag aatcgtacca 600
ccgcccaacg ttccaacctc aatagacggc atggagacag agatttgaag cgatccgcga 660
agattgttca tgagagtgat gcagttagcg ctctccacaa cttgcgccgg atcctgacct 720
gtggcaatga aaatggctgc cgcaagattg gcagcttggg cgttg 765
<210> 33
<211> 802
<212> DNA
<213> Penicillium citrinum
<400> 33
aactggaaga attcgcggcc gcaggaattt tttttttttt tttttataga atctttgaaa 60
tcgacattaa ttaagtatgt ggagattctt tgtggaggca cggtaatgtg tctatctagc 120
aacgcggtca agcatcagtc tcaggcacag cccgggtgtc gtttttggtt gcaatcttcc 180
gccatcccat tccaaaggca aacacaaacg tgcacgccgt agctcccact gctaagtaaa 240
aagtatgatc aacggcgaga ctgtaagctt ttacaacccc tggaaggtta ttcttgctga 300
ccacatctct gaagccagtc gcccctgctg ccgtcacggc ctgcgtgtcg acagtgggcg 360
catacttgct caggccagtt ctcaaaccgg acccaaagac aaggttagca aagtccagga 420
agagcgatcc tccaaacgtc tgtccaaaca cggcgagaga aattccgagg gcaccttgtt 480
cgggcgaaag cgtgctttgg atggcgatga taggcgtttg catgccacaa ccacgaccga 540
agcccgcgat aaattggtac atgacccatt tcacagttga tgtatggggc tggaaggtgg 600
ataccagacc tgcgcctatg gcgacgagaa cagcgctgcc tagggcccaa ggcaaatagt 660
atcctgtctt tccaattgcg aagccagaaa ccatagccat aatgacttgt ccaagaattc 720
caggcaacat gtacacacca ctcagtgtgg gagaaacatc cttcacagcc tggaagtaga 780
tcggtagata gtaggaaaag ac 802
<210> 34
<211> 562
<212> DNA
<213> Penicillium citrinum
<400> 34
aactggaaga attcgcggcc gcaggaattt tttttttttt ttttttttac taagcaatat 60
tgtgtttctt cgctaatgcg aatatttcct tatagcaacg tcgcaacaca tttatcgtct 120
tccctgaggc ctttgttgac ttgggctctt cgtctccggc ttcgtcactc caaagcacag 180
ataggagacg agaggccggc gttatggttt tattttcagc gccaaggatt tgccacgatg 240
tgcttggcat atctgatagg actagacgaa tagatgccgc agccccgtgc tcctgtgcta 300
tccccaaagc agtctcaatc ccactcaata gtcgaaggct tacacgcaat gtcgtgcatg 360
cagaagataa ggcgtgcatg aatgggtcga gatgtgaaat gagctcgccg atatgaagat 420
tagagtgaaa cgagggaagt gcttcggctc ttccattgtc atttctagtg gttgagccag 480
accagtacca atccattcgt gtgctttgct tttgtccaca aggttgggct ttcatcacct 540
cggatagtag cagctgggaa ag 562
<210> 35
<211> 26
<212> DNA
<213> Penicillium citrinum
<400> 35
gttaacatgt cagaacctct accccc 26
<210> 36
<211> 27
<212> DNA
<213> Penicillium citrinum
<400> 36
aatatttcaa gcatcagtct caggcac 27
<210> 37
<211> 1662
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1659)
<400> 37
atg tca gaa cct cta ccc cct aaa gaa ggg gaa cca agg cca cag aag 48
Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys
1 5 10 15
gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag 96
Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30
cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc 144
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc 192
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
cca cat atc aca agc gag ttc cac tct ctg aac gat gta ggg tgg tac 240
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
ggc agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt 288
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95
aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc ctc 336
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
tgt att ttt gaa cta ggc tcg gtg cta tgc ggt gcc gca aga tct tcc 384
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
acc atg ttg att gtt ggg cgg gcc gtt gct gga atg gga ggc tca ggt 432
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
ctt gtc aac gga gcc ctc aca atc ctc tca aca gct gct cct aag cac 480
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc 528
Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175
att gtc tgt gga cca ctg ctc gga ggt gct ttc act caa cac gcc act 576
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190
tgg cga tgg tgc ttt tat atc aat ctc ccc atc ggc gct gtc gct gca 624
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
ttc ctc ctt ctc gtc atc acc ata ccc gac cga att tca tcc acg gac 672
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
agc gaa ctc tcg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt 720
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
cgc aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc 768
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
atg att tcc ctc gca cta gaa tgg gga ggg tcg acc tac acc tgg cga 816
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt gct ctg att 864
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
gcg ttc gtg cta tgg gag cgt cat gtt ggc gat gct gtt gcc atg att 912
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
cct ggc tca gtg gct ggt aaa cga caa gtg tgg tgc tct tgt tta ttt 960
Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe
305 310 315 320
atg ggc ttt ttc tct ggc tcc ttg ctt gtc ttt tcc tac tat cta ccg 1008
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
atc tac ttc cag gct gtg aag gat gtt tct ccc aca ctg agt ggt gtg 1056
Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
tac atg ttg cct gga att ctt gga caa gtc att atg gct atg gtt tct 1104
Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365
ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc cta ggc 1152
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
agc gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag 1200
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln
385 390 395 400
ccc cat aca tca act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc 1248
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415
ttc ggt cgt ggt tgt ggc atg caa acg cct atc atc gcc atc caa agc 1296
Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430
acg ctt tcg ccc gaa caa ggt gcc ctc gga att tct ctc gcc gtg ttt 1344
Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
gga cag acg ttt gga gga tcg ctc ttc ctg gac ttt gct aac ctt gtc 1392
Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg ccc act gtc 1440
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg 1488
Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc 1536
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt 1584
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac 1632
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
acc cgg gct gtg cct gag act gat gct t ga 1662
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 38
<211> 553
<212> PRT
<213> Penicillium citrinum
<400> 38
Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys
1 5 10 15
Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe
305 310 315 320
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln
385 390 395 400
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415
Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430
Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 39
<211> 31
<212> DNA
<213> Penicillium citrinum
<400> 39
ggatccatgt ccctgccgca tgcaacgatt c 31
<210> 40
<211> 30
<212> DNA
<213> Penicillium citrinum
<400> 40
ggatccctaa gcaatattgt gtttcttcgc 30
<210> 41
<211> 1380
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1377)
<400> 41
atg tcc ctg ccg cat gca acg att ccg acg aac cta cgc cgt cgc gcg 48
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
1 5 10 15
ttt cga cgc tca tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc 96
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30
ggt agc aat gcc aat tta gtc cgt gct cag tgt caa cgt tgt caa caa 144
Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45
gcc gga tta agg tgt gtg tac agc gaa agg cta ccc aag cgc aat tta 192
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
cat aaa gaa gcc gca gct gga act aca aga gcc aca gaa acc tca caa 240
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln
65 70 75 80
ccg atg acc gcg aca tct tct acg gtc ttc tca tca ttg gca gag act 288
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
cct cca cct tac tgc tca cca cct acg cat att ggc acc tcg gca ctc 336
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
aag gaa aca tta tca gaa cca tca gcg gca acc ctg caa ttc tat gat 384
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125
aca tca atc aac ttt gat gat ccc gag tcg ttt ccc ggc ggc tgg cct 432
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
cag cca aat aca ttt cgc gac gat gcc aac agc aat gaa tct tcg ggg 480
Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
ata cca gat cta ggc tac gac ttt gaa ggc cct ttg gat gca acg gcg 528
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tca 576
Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
tcc gga caa tcc aac aca agc aac acg caa cga gac ctt ttc gaa agt 624
Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205
ctg tcg gat gtg tca cag gac cta gag gta ata ctc cac ggg gtg act 672
Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
gtg gaa tgg ccc aag caa aaa att tta agc tac ccg ata ggg gac ttt 720
Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
ttg aat gcc ttt ggt aga ttg cta cta cat ctt caa gaa cgt gtg atc 768
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255
acg agc agc aat agc agc atg tta gat ggg tgt ctg caa acc aag aac 816
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270
ttg ttc atg gcg gtg cat tgc tac atg ttg tct gtc aaa atc atg aca 864
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
tca ctt tcc cag ctg cta cta tcc gag gtg atg aaa gcc caa cct tgt 912
Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300
gga caa aag caa agc aca cga atg gat tgg tac tgg tct ggc tca acc 960
Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tct 1008
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac 1056
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
gcc tta tct tct gca tgc acg aca ttg cgt gta agc ctt cga cta ttg 1104
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
agt gag att gag act gct ttg ggg ata gca cag gag cac ggg gct gcg 1152
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380
gca tct att cgt cta gtc cta tca gat atg cca agc aca tcg tgg caa 1200
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln
385 390 395 400
atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tct cgt ctc cta 1248
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
tct gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca 1296
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
aag gcc tca ggg aag acg ata aat gtg ttg cga cgt tgc tat aag gaa 1344
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
ata ttc gca tta gcg aag aaa cac aat att gct tag 1380
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> 42
<211> 459
<212> PRT
<213> Penicillium citrinum
<400> 42
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
1 5 10 15
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30
Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln
65 70 75 80
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205
Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300
Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln
385 390 395 400
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> 43
<211> 9099
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(9096)
<400> 43
atg gat caa gcc aac tat cca aac gag cca att gtg gta gtg gga agc 48
Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser
1 5 10 15
ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tca aaa ctt tgg gag 96
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga 144
Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45
ttt gac gtc gat aca ttt tac agc ccc gat ggc act cac ccc ggg cgc 192
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
acg aac gca ccc ttt gca tac ttg ctg cag gag gat cta cgc ggt ttt 240
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe
65 70 75 80
gat gcc tct ttc ttc aac atc caa gct gga gag gcc gaa acg att gac 288
Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
cca cag caa agg ctg ctg ctg gag acg gtc tat gaa gct gta tcc aac 336
Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
gca ggc cta cgg atc caa ggc ctt caa gga tcc tct act gct gtg tac 384
Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125
gtc ggt atg atg acg cat gac tat gag act atc gtg acg cgt gaa ttg 432
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140
gat agt att cct aca tac tct gcc acg ggg gta gct gtc agt gtg gcc 480
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg 528
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
atc gac aca gcc tgt agt tca tcc tta gct gcc gtg cat ctg gcc gtc 576
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg 624
Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac 672
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
atg ctg tcc ccc aat ggt aga tct cga atg tgg gat gct gct gcc gat 720
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
gga tat gcc aga gga gaa ggt gtt tgc tct att gtc ctg aaa acg ctg 768
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc cga gag 816
Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
acc ggt atc aac caa gat ggc cga acg aca ggt atc aca atg cca aac 864
Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag gct ggt 912
His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gaa gcc cat 960
Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His
305 310 315 320
gga act ggt aca cca gcc ggt gac cca cag gaa gct gag gct att gca 1008
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335
aca gcc ttc ttc gga cac aag gat gga aca atc gac agc gac ggc gag 1056
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg 1104
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
gaa ggc act gct ggt att gcg ggc tta atg aag gca tcg ttt gct gta 1152
Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380
cga aat ggc gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc 1200
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
cgt gtc gct ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca 1248
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
gaa tgg ccg att gtt gcg ccc ggg cag cct cgc aga gtc agc gtt aat 1296
Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430
tca ttt gga ttt ggt ggt aca aat gcc cat gct att atc gaa gag tat 1344
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
atg gct cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tca 1392
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
gat gca gat gca tgc agc ttg ccc ctt gtg ctt tca tcg aag tcg cag 1440
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln
465 470 475 480
cgc tcc atg aag gca acg cta gaa aat atg ctc caa ttt ctg gaa acg 1488
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495
cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa 1536
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
cgg tct atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa 1584
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
gta gcc cgc gcg gca ctg gag gct gcc atc gcg gac ggt gag gtc gtc 1632
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
acc gac ttc cgc acc gac gcg aat gac aac cct cgc gta cta ggt gtc 1680
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg 1728
Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tca 1776
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac 1824
Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
cag ctc atg ctt gaa ggg gat gcc tca aac gtc aga ctc gcc agc ttc 1872
Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620
tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc cga ctt ctc 1920
Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu
625 630 635 640
gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tca ggt 1968
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct 2016
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670
atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tct 2064
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
tct cca agc ggc cag aca ggc gct atg cta gcg gca ggt atg tcg tac 2112
Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc 2160
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
tgc gtc gcc gct agc aat tca ccg gat agt gtg acc ttc tcc ggc gac 2208
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act 2256
Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
ttt gcc aga atc ttg aga gtt gac aag gcc tac cat tcg cat cac atg 2304
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt 2352
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tct gcc 2400
Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
gtc cac gag acc agc aag caa atg act gta cag gat gtg atg ccc gct 2448
Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815
tat tgg aaa gac aat ctc gtc tct ccg gtc ttg ttc tcg cag gct gtg 2496
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830
cag aaa gca gtc atc act cat cgt cta atc gac gtc gcc atc gaa att 2544
Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
ggc gcc cac cct gct ctc aag ggt ccg tgt cta gcc acc atc aag gat 2592
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca cga aac 2640
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag 2688
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc 2736
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910
cgg ccc gat cgt gcc gtt caa aac ctg tca aag tca ttg ccc aca tac 2784
Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
tct tgg gat cat act cgt caa tac tgg gca gaa tct cgc tcc acc cgc 2832
Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tct 2880
Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
tct tac agc aca gca tcg acc ttc cag tgg aca aac ttc atc agg ccc 2928
Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975
cgg gat ctg gaa tgg ctc gac ggt cat gcg cta caa ggc cag act gtg 2976
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990
ttc ccc gct gct ggg tac ata att atg gcc atg gaa gct gcc atg aag 3024
Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005
gtg gct ggt gag cgt gcc gcc caa gtt cag ctc ctg gaa atc ttg gac 3072
Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu Asp
1010 1015 1020
atg agc atc aac aaa gcc atc gtg ttt gaa gat gaa aac acc tcc gtg 3120
Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr Ser Val
1025 1030 1035 1040
gag ctg aac ttg aca gcc gaa gtc acc agt gac aat gat gcg gat ggc 3168
Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp Ala Asp Gly
1045 1050 1055
caa gtc acg gtc aaa ttt gtt att gat tcc tgt ctg gca aag gag agt 3216
Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu Ala Lys Glu Ser
1060 1065 1070
gag ctt tcg aca tcc gcc aaa ggc caa atc gtc ata acc ctt ggc gag 3264
Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val Ile Thr Leu Gly Glu
1075 1080 1085
gca tca ccg tca tcg cag ctt ttg ccg cca cct gag gaa gag tac ccc 3312
Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro Pro Glu Glu Glu Tyr Pro
1090 1095 1100
cag atg aac aat gtc aac atc gat ttc ttc tat cgg gaa ctt gac ctc 3360
Gln Met Asn Asn Val Asn Ile Asp Phe Phe Tyr Arg Glu Leu Asp Leu
1105 1110 1115 1120
ctt ggg tat gac tac agc aaa gac ttc cgt cgt ttg cag acc atg aga 3408
Leu Gly Tyr Asp Tyr Ser Lys Asp Phe Arg Arg Leu Gln Thr Met Arg
1125 1130 1135
agg gcc gac tcc aaa gct agc ggc acc ttg gct ttc ctt cca ctt aag 3456
Arg Ala Asp Ser Lys Ala Ser Gly Thr Leu Ala Phe Leu Pro Leu Lys
1140 1145 1150
gat gaa ttg cgc aat gag ccc ctc ttg ctc cac cca gcg ccc ctg gac 3504
Asp Glu Leu Arg Asn Glu Pro Leu Leu Leu His Pro Ala Pro Leu Asp
1155 1160 1165
atc gcg ttc cag act gtc att gga gcg tat tcc tct cca gga gat cgt 3552
Ile Ala Phe Gln Thr Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg
1170 1175 1180
cgc cta cgc tca ttg tac gtg cct act cac gtt gac aga gtg act ctg 3600
Arg Leu Arg Ser Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu
1185 1190 1195 1200
att cca tcg ctc tgt ata tcg gcg ggt aat tct ggt gaa acc gag ctt 3648
Ile Pro Ser Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu
1205 1210 1215
gcg ttt gac aca atc aac aca cac gac aag ggt gat ttc ctg agc ggc 3696
Ala Phe Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly
1220 1225 1230
gac atc acg gtg tac gat tcg acc aag aca acg ctt ttc caa gtt gat 3744
Asp Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245
aac att gtc ttt aag cct ttc tct ccc ccg act gct tcg acc gac cac 3792
Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp His
1250 1255 1260
cga atc ttc gca aag tgg gtc tgg gga ccc ctc acg ccc gaa aaa ctg 3840
Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu Lys Leu
1265 1270 1275 1280
ctg gag gac cct gcg acg ttg atc ata gct cgg gac aag gag gac att 3888
Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys Glu Asp Ile
1285 1290 1295
ctg acc atc gag cga atc gtt tac ttc tac atc aaa tcc ttc cta gcc 3936
Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys Ser Phe Leu Ala
1300 1305 1310
cag ata acc ccc gac gac cgt caa aat gcc gac ctc cat tcc cag aag 3984
Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp Leu His Ser Gln Lys
1315 1320 1325
tac att gaa tgg tgt gac cag gtt cag gcc gat gct cgg gct ggc cac 4032
Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala Asp Ala Arg Ala Gly His
1330 1335 1340
cat cag tgg tac cag gag tct tgg gag gag gac act tct gtt cac att 4080
His Gln Trp Tyr Gln Glu Ser Trp Glu Glu Asp Thr Ser Val His Ile
1345 1350 1355 1360
gag caa atg tgt gaa agc aac tcg tcc cac cca cat gtg cgc ctg atc 4128
Glu Gln Met Cys Glu Ser Asn Ser Ser His Pro His Val Arg Leu Ile
1365 1370 1375
caa agg gta ggc aaa gaa tta att tca att gtt cgc ggg aac ggg gat 4176
Gln Arg Val Gly Lys Glu Leu Ile Ser Ile Val Arg Gly Asn Gly Asp
1380 1385 1390
cct ttg gat atc atg aac cgc gat ggg ttg ttc acc gag tac tat acc 4224
Pro Leu Asp Ile Met Asn Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr
1395 1400 1405
aac aag ctc gcc ttt ggc tca gca ata cac gtc gtt cag gat ctg gtt 4272
Asn Lys Leu Ala Phe Gly Ser Ala Ile His Val Val Gln Asp Leu Val
1410 1415 1420
agc caa att gct cat cgc tac caa tcc att gat atc ctt gag atc ggc 4320
Ser Gln Ile Ala His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly
1425 1430 1435 1440
ttg ggt aca ggc atc gcc acg aag cgc gtt ctt gca tca cct caa ctt 4368
Leu Gly Thr Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu
1445 1450 1455
ggt ttc aac agt tac act tgc act gac atc tcg gcg gat gtt att ggc 4416
Gly Phe Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly
1460 1465 1470
aag gcc cgt gaa caa ctt tcc gaa ttc gac ggt ctc atg cag ttt gag 4464
Lys Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485
gca cta gac atc aac aga agc cca gca gag caa gga ttc aag cct cac 4512
Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro His
1490 1495 1500
tcc tac gat ctg att att gca tcc gat gtc ctc cat gcc agc tcc aac 4560
Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser Ser Asn
1505 1510 1515 1520
ttc gag gaa aaa ttg gct cac ata agg tcc ttg ctc aag ccg ggt ggt 4608
Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys Pro Gly Gly
1525 1530 1535
cac ttg gtt act ttc ggg gtc acc cat cgc gag cct gct cgc ctc gcc 4656
His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro Ala Arg Leu Ala
1540 1545 1550
ttc atc tct ggg ctt ttc gct gat cga tgg act gga gaa gac gaa act 4704
Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr Gly Glu Asp Glu Thr
1555 1560 1565
cgt gct ttg agt gcc tcg ggg tcc gtt gac caa tgg gag cat acc ctc 4752
Arg Ala Leu Ser Ala Ser Gly Ser Val Asp Gln Trp Glu His Thr Leu
1570 1575 1580
aag aga gtt ggg ttc tct ggc gtc gat agt cgg aca ctt gat cga gag 4800
Lys Arg Val Gly Phe Ser Gly Val Asp Ser Arg Thr Leu Asp Arg Glu
1585 1590 1595 1600
gat gat ttg atc ccg tct gtc ttc agt aca cat gct gtg gat gcc acc 4848
Asp Asp Leu Ile Pro Ser Val Phe Ser Thr His Ala Val Asp Ala Thr
1605 1610 1615
gtt gag cgt ttg tat gat cca ctt tct gct cca ttg aag gac tca tac 4896
Val Glu Arg Leu Tyr Asp Pro Leu Ser Ala Pro Leu Lys Asp Ser Tyr
1620 1625 1630
ccg cca tta gtg gtt atc ggt ggc gaa tcg aca aaa acc gaa cgc att 4944
Pro Pro Leu Val Val Ile Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile
1635 1640 1645
ttg aac gac atg aaa gct gcc cta ccg cat aga cac atc cac tcc gtc 4992
Leu Asn Asp Met Lys Ala Ala Leu Pro His Arg His Ile His Ser Val
1650 1655 1660
aag cgg ctg gaa agt gtt ctc gac gac ccg gcc ttg cag cct aag tcg 5040
Lys Arg Leu Glu Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser
1665 1670 1675 1680
act ttt gtc atc ctc tcg gaa ctt gat gat gaa gtg ttt tgc aac ctt 5088
Thr Phe Val Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu
1685 1690 1695
gaa gag gac aag ttt gag gca gtc aag tct ctt ctc ttc tac gcc gga 5136
Glu Glu Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly
1700 1705 1710
cgc atg atg tgg ctg aca gag aat gcc tgg att gat cat ccc cac cag 5184
Arg Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725
gcc agc acc atc gga atg ttg agg aca atc aag ctc gag aac cct gac 5232
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro Asp
1730 1735 1740
ttg gga acg cac gtc ttc gat gtc gat act gtg gag aac cta gac acc 5280
Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu Asp Thr
1745 1750 1755 1760
aaa ttc ttc gtt gag caa ctt ttg cgc ttc gag gag agc gat gat cag 5328
Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser Asp Asp Gln
1765 1770 1775
ctt ttg gaa tca ata aca tgg act cat gag ccc gaa gtg tac tgg tgc 5376
Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu Val Tyr Trp Cys
1780 1785 1790
aag ggt cgt gcc tgg gtc cct cgt ttg aag cag gat att gct agg aac 5424
Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln Asp Ile Ala Arg Asn
1795 1800 1805
gac cgt atg aac tcg tct cgt cgt cca att ttc ggt aac ttt aat tcg 5472
Asp Arg Met Asn Ser Ser Arg Arg Pro Ile Phe Gly Asn Phe Asn Ser
1810 1815 1820
tcc aag acg gcc att gca ctg aaa gag gcg agg gga gca tcc tca tcg 5520
Ser Lys Thr Ala Ile Ala Leu Lys Glu Ala Arg Gly Ala Ser Ser Ser
1825 1830 1835 1840
atg tac tat ctt gag tca acc gag acg tgt gat tcg tta gaa gac gct 5568
Met Tyr Tyr Leu Glu Ser Thr Glu Thr Cys Asp Ser Leu Glu Asp Ala
1845 1850 1855
cgt cat gct gga aaa gca act gtt cgt gtt cgc tac gct ctt ccc cag 5616
Arg His Ala Gly Lys Ala Thr Val Arg Val Arg Tyr Ala Leu Pro Gln
1860 1865 1870
gca att cgc gtg ggc cat ctc gga tac ttc cat gtc gtg cag ggc agt 5664
Ala Ile Arg Val Gly His Leu Gly Tyr Phe His Val Val Gln Gly Ser
1875 1880 1885
att ctg gag aat aca tgt gag gtg cct gta gtc gcc ctg gct gag aag 5712
Ile Leu Glu Asn Thr Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys
1890 1895 1900
aat gga tct ata ctg cat gta ccg aga aac tac atg cat agt ctg ccc 5760
Asn Gly Ser Ile Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro
1905 1910 1915 1920
gat aac atg gcg gaa ggc gag gat agt tcc ttc ttg ttg tcc aca gct 5808
Asp Asn Met Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala
1925 1930 1935
gca gcc ctc ctt gcc gaa aca att ctc tct agc gct cag tcc ttt ggc 5856
Ala Ala Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly
1940 1945 1950
tct gat gca tca att ctg att atg gag ccc cca atc ttc tgc gtc aaa 5904
Ser Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965
gca att ctg gag tcg gcc aaa acc tac ggt gtt cag gtt cat ttg gca 5952
Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu Ala
1970 1975 1980
aca act ctg tcc gac gtc aaa act att ccg gct cct tgg atc cga tta 6000
Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile Arg Leu
1985 1990 1995 2000
cat gcc aag gaa acc gac gct cgg ctg aaa cac agc ctg ccg aca aac 6048
His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu Pro Thr Asn
2005 2010 2015
atg atg gca ttc ttt gac ttg tct acc gac cgg act gct gcc ggg ata 6096
Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr Ala Ala Gly Ile
2020 2025 2030
acc aac cgt ttg gcc aag ttg cta cca ccc agt tgc ttc atg tac agt 6144
Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser Cys Phe Met Tyr Ser
2035 2040 2045
ggt gac tat ctt atc cga agt aca gct tcc aca tac aaa gtt agt cat 6192
Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser Thr Tyr Lys Val Ser His
2050 2055 2060
gtt gag gat att cca atc ctc gag cac tct gtg gca atg gca aaa aat 6240
Val Glu Asp Ile Pro Ile Leu Glu His Ser Val Ala Met Ala Lys Asn
2065 2070 2075 2080
acc gtc tct gcg tcg act gtc gac gac act gag aaa gtt att aca gcc 6288
Thr Val Ser Ala Ser Thr Val Asp Asp Thr Glu Lys Val Ile Thr Ala
2085 2090 2095
aca caa att ctc ttg cct ggt cag ctc tct gtc aac cac aat gac caa 6336
Thr Gln Ile Leu Leu Pro Gly Gln Leu Ser Val Asn His Asn Asp Gln
2100 2105 2110
cgc ttc aat ctg gcc acc gtc atc gac tgg aag gaa aat gag gtg tcc 6384
Arg Phe Asn Leu Ala Thr Val Ile Asp Trp Lys Glu Asn Glu Val Ser
2115 2120 2125
gct agg att tgc ccc atc gac tct ggt aac tta ttt tcc aac aag aag 6432
Ala Arg Ile Cys Pro Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys
2130 2135 2140
acg tat ttg ctt gtt ggt ctt acc ggg gac ctt ggt cgc tct ctc tgt 6480
Thr Tyr Leu Leu Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys
2145 2150 2155 2160
cgc tgg atg atc ttg cat ggc gcc cgc cat gtt gtg ctc act agc cgg 6528
Arg Trp Met Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg
2165 2170 2175
aac cct cga ctt gat ccc aaa tgg atc gcc aac atg gag gca ctt ggt 6576
Asn Pro Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly
2180 2185 2190
ggt gac atc acc gtt ctg tca atg gat gtt gcc aat gag gat tca gtc 6624
Gly Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205
gat gct ggc ctt ggc aag ctt gtc gat atg aag ttg cca cct gtt gcc 6672
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val Ala
2210 2215 2220
ggc atc gcg ttc ggg cct ttg gtg ctg cag gat gtc atg ctg aag aac 6720
Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu Lys Asn
2225 2230 2235 2240
atg gac cac cag atg atg gac atg gtg ttg aag ccc aag gta caa gga 6768
Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys Val Gln Gly
2245 2250 2255
gca cgc att ctt cat gaa cgg ttc tcc gaa cag acg ggc agc aag gcg 6816
Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr Gly Ser Lys Ala
2260 2265 2270
ctc gac ttc ttc atc atg ttt tcg tcc att gtt gca gtt att ggc aat 6864
Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val Ala Val Ile Gly Asn
2275 2280 2285
cct ggc cag tcc aac tat ggc gct gcg aat gcc tac cta cag gct ctg 6912
Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn Ala Tyr Leu Gln Ala Leu
2290 2295 2300
gcc cag caa cgg tgc gcc aga gga ttg gcg gga tca acc atc gat att 6960
Ala Gln Gln Arg Cys Ala Arg Gly Leu Ala Gly Ser Thr Ile Asp Ile
2305 2310 2315 2320
ggt gcc gtt tac ggt gta ggg ttt gtc acg agg gcc gag atg gag gag 7008
Gly Ala Val Tyr Gly Val Gly Phe Val Thr Arg Ala Glu Met Glu Glu
2325 2330 2335
gac ttt gat gct atc cgt ttc atg ttt gac tca gtt gaa gag cat gag 7056
Asp Phe Asp Ala Ile Arg Phe Met Phe Asp Ser Val Glu Glu His Glu
2340 2345 2350
ctg cac acg ctt ttc gcc gaa gcg gtc gtg tct gac cag cgt gcc cgg 7104
Leu His Thr Leu Phe Ala Glu Ala Val Val Ser Asp Gln Arg Ala Arg
2355 2360 2365
cag caa cca cag cgc aag acg gtc att gac atg gcg gac ctt gag ctt 7152
Gln Gln Pro Gln Arg Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu
2370 2375 2380
acc acg ggt atc cca gat ctt gac cct gcg ctt caa gat cga att att 7200
Thr Thr Gly Ile Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile
2385 2390 2395 2400
tac ttc aac gac cct cgt ttc gga aac ttc aaa att ccc ggt caa cgc 7248
Tyr Phe Asn Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg
2405 2410 2415
gga gac ggt ggc gac aat gga tca ggg tct aaa ggc tcc att gcc gac 7296
Gly Asp Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp
2420 2425 2430
cag ctc aaa caa gca aca act tta gac caa gtt cgg caa atc gtg att 7344
Gln Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445
gat ggt cta tct gag aaa ctc cgt gtt acc ctc caa gtt tcg gac ggg 7392
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp Gly
2450 2455 2460
gag agc gtg gac cca acc att cct ctc att gat caa ggt gtc gac tcc 7440
Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val Asp Ser
2465 2470 2475 2480
ttg ggt gca gtg act gtc ggc tca tgg ttc tca aag caa ctc tac ctt 7488
Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln Leu Tyr Leu
2485 2490 2495
gac ctc cca ctc ttg agg gta ctt ggc ggt gct tct gtc gct gat ctt 7536
Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser Val Ala Asp Leu
2500 2505 2510
gcc gac gac gcg gcc acc cga ctc cca gct aca tcc att ccg ctg ctg 7584
Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr Ser Ile Pro Leu Leu
2515 2520 2525
ttg caa att ggt gat tcc acg gga acc tcg gac agc ggg gct tct ccg 7632
Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser Asp Ser Gly Ala Ser Pro
2530 2535 2540
aca cca aca gac agc cat gat gaa gca agc tct gct acc agc aca gat 7680
Thr Pro Thr Asp Ser His Asp Glu Ala Ser Ser Ala Thr Ser Thr Asp
2545 2550 2555 2560
gcg tcg tca gcc gaa gag gat gaa gag caa gag gac gat aat gag cag 7728
Ala Ser Ser Ala Glu Glu Asp Glu Glu Gln Glu Asp Asp Asn Glu Gln
2565 2570 2575
gga ggc cgt aag att ctt cgt cgc gag agg ttg tcc ctt ggc cag gag 7776
Gly Gly Arg Lys Ile Leu Arg Arg Glu Arg Leu Ser Leu Gly Gln Glu
2580 2585 2590
tat tcc tgg agg cag caa caa atg gta aaa gat cat acc atc ttc aac 7824
Tyr Ser Trp Arg Gln Gln Gln Met Val Lys Asp His Thr Ile Phe Asn
2595 2600 2605
aac act att ggc atg ttc atg aag ggt acc att gac ctc gac cgg ttg 7872
Asn Thr Ile Gly Met Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu
2610 2615 2620
agg cgg gct ctg aaa gcc tca ttg cgc cgt cac gag atc ttc cgt acg 7920
Arg Arg Ala Leu Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr
2625 2630 2635 2640
tgc ttt gtt act ggc gat gac tat agc agc gat tta aat ggt ccc gtc 7968
Cys Phe Val Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val
2645 2650 2655
caa gtg gtt ctc aag aac ccg gag aac aga gtg cac ttt gtt cag gtg 8016
Gln Val Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val
2660 2665 2670
aac aac gct gcg gag gca gag gaa gag tac cgg aaa ctc gag aag aca 8064
Asn Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
aac tat agc atc tcc aca ggt gac act ctc aga ctc gtt gat ttc tac 8112
Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe Tyr
2690 2695 2700
tgg ggc aca gat gac cac ctg ttg gta atc ggc tac cac aga tta gtt 8160
Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg Leu Val
2705 2710 2715 2720
ggt gat ggc tca aca aca gaa aac ctg ttc aat gag atc ggg cag att 8208
Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile Gly Gln Ile
2725 2730 2735
tac agc ggg gtg aaa atg cag cga cca tcg acc caa ttc tct gat cta 8256
Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln Phe Ser Asp Leu
2740 2745 2750
gcc gtc caa cag cgg gaa aac ctg gaa aat ggg cga atg ggg gac gat 8304
Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly Arg Met Gly Asp Asp
2755 2760 2765
atc gcg ttc tgg aag tcc atg cat agc aaa gtc tcg tca tct gcg cca 8352
Ile Ala Phe Trp Lys Ser Met His Ser Lys Val Ser Ser Ser Ala Pro
2770 2775 2780
acc gtg ctt ccc atc atg aat ctg atc aat gac cct gct gcc aat tca 8400
Thr Val Leu Pro Ile Met Asn Leu Ile Asn Asp Pro Ala Ala Asn Ser
2785 2790 2795 2800
gag cag cag caa ata cag cca ttc acg tgg cag cag tat gaa gca att 8448
Glu Gln Gln Gln Ile Gln Pro Phe Thr Trp Gln Gln Tyr Glu Ala Ile
2805 2810 2815
gct cgt tta gat ccc atg gtc gcc ttc cga atc aaa gag cgg agc cgc 8496
Ala Arg Leu Asp Pro Met Val Ala Phe Arg Ile Lys Glu Arg Ser Arg
2820 2825 2830
aag cac aag gca acc ccc atg cag ttc tac ctg gcc gcc tac cac gtt 8544
Lys His Lys Ala Thr Pro Met Gln Phe Tyr Leu Ala Ala Tyr His Val
2835 2840 2845
ttg ttg gcg cgt ctt acc ggc agc aaa gac ata acc atc ggc ctc gcc 8592
Leu Leu Ala Arg Leu Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala
2850 2855 2860
gaa acc aac cga tcc acc atg gaa gaa att tcg gcg atg ggc ttt ttc 8640
Glu Thr Asn Arg Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe
2865 2870 2875 2880
gct aac gtg ctt ccc ctg cgc ttt gat gag ttc gtc ggc agc aag aca 8688
Ala Asn Val Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr
2885 2890 2895
ttc ggc gag cac ctt gta gcc acc aag gac agt gtg cgt gag gcc atg 8736
Phe Gly Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met
2900 2905 2910
caa cac gcg cgg gtg ccg tat ggc gtc atc ctc gac tgt cta ggc ctg 8784
Gln His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
aat ctc cct acc tca ggc gag gaa ccc aag act cag aca cac gcc ccc 8832
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala Pro
2930 2935 2940
ttg ttc cag gct gtc ttt gat tac aag cag ggt caa gcg gag agt ggc 8880
Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu Ser Gly
2945 2950 2955 2960
tca att ggc aat gcc aaa atg acg agt gtt ctc gct tcc cgt gag cgc 8928
Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser Arg Glu Arg
2965 2970 2975
act cct tat gac atc gtt ctc gag atg tgg gat gac cct acc aag gac 8976
Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp Pro Thr Lys Asp
2980 2985 2990
cca ctc att cat gtc aaa ctt cag agc tcg ctg tat ggc cct gag cac 9024
Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu Tyr Gly Pro Glu His
2995 3000 3005
gct cag gcc ttt gta gac cac ttt tct tca atc ctc act atg ttc tcg 9072
Ala Gln Ala Phe Val Asp His Phe Ser Ser Ile Leu Thr Met Phe Ser
3010 3015 3020
atg aac ccg gct ctg aag ttg gcc tag 9099
Met Asn Pro Ala Leu Lys Leu Ala
3025 3030
<210> 44
<211> 3032
<212> PRT
<213> Penicillium citrinum
<400> 44
Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser
1 5 10 15
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe
65 70 75 80
Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His
305 310 315 320
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln
465 470 475 480
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620
Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu
625 630 635 640
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830
Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910
Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990
Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005
Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu Asp
1010 1015 1020
Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr Ser Val
1025 1030 1035 1040
Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp Ala Asp Gly
1045 1050 1055
Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu Ala Lys Glu Ser
1060 1065 1070
Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val Ile Thr Leu Gly Glu
1075 1080 1085
Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro Pro Glu Glu Glu Tyr Pro
1090 1095 1100
Gln Met Asn Asn Val Asn Ile Asp Phe Phe Tyr Arg Glu Leu Asp Leu
1105 1110 1115 1120
Leu Gly Tyr Asp Tyr Ser Lys Asp Phe Arg Arg Leu Gln Thr Met Arg
1125 1130 1135
Arg Ala Asp Ser Lys Ala Ser Gly Thr Leu Ala Phe Leu Pro Leu Lys
1140 1145 1150
Asp Glu Leu Arg Asn Glu Pro Leu Leu Leu His Pro Ala Pro Leu Asp
1155 1160 1165
Ile Ala Phe Gln Thr Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg
1170 1175 1180
Arg Leu Arg Ser Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu
1185 1190 1195 1200
Ile Pro Ser Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu
1205 1210 1215
Ala Phe Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly
1220 1225 1230
Asp Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245
Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp His
1250 1255 1260
Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu Lys Leu
1265 1270 1275 1280
Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys Glu Asp Ile
1285 1290 1295
Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys Ser Phe Leu Ala
1300 1305 1310
Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp Leu His Ser Gln Lys
1315 1320 1325
Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala Asp Ala Arg Ala Gly His
1330 1335 1340
His Gln Trp Tyr Gln Glu Ser Trp Glu Glu Asp Thr Ser Val His Ile
1345 1350 1355 1360
Glu Gln Met Cys Glu Ser Asn Ser Ser His Pro His Val Arg Leu Ile
1365 1370 1375
Gln Arg Val Gly Lys Glu Leu Ile Ser Ile Val Arg Gly Asn Gly Asp
1380 1385 1390
Pro Leu Asp Ile Met Asn Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr
1395 1400 1405
Asn Lys Leu Ala Phe Gly Ser Ala Ile His Val Val Gln Asp Leu Val
1410 1415 1420
Ser Gln Ile Ala His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly
1425 1430 1435 1440
Leu Gly Thr Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu
1445 1450 1455
Gly Phe Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly
1460 1465 1470
Lys Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485
Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro His
1490 1495 1500
Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser Ser Asn
1505 1510 1515 1520
Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys Pro Gly Gly
1525 1530 1535
His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro Ala Arg Leu Ala
1540 1545 1550
Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr Gly Glu Asp Glu Thr
1555 1560 1565
Arg Ala Leu Ser Ala Ser Gly Ser Val Asp Gln Trp Glu His Thr Leu
1570 1575 1580
Lys Arg Val Gly Phe Ser Gly Val Asp Ser Arg Thr Leu Asp Arg Glu
1585 1590 1595 1600
Asp Asp Leu Ile Pro Ser Val Phe Ser Thr His Ala Val Asp Ala Thr
1605 1610 1615
Val Glu Arg Leu Tyr Asp Pro Leu Ser Ala Pro Leu Lys Asp Ser Tyr
1620 1625 1630
Pro Pro Leu Val Val Ile Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile
1635 1640 1645
Leu Asn Asp Met Lys Ala Ala Leu Pro His Arg His Ile His Ser Val
1650 1655 1660
Lys Arg Leu Glu Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser
1665 1670 1675 1680
Thr Phe Val Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu
1685 1690 1695
Glu Glu Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly
1700 1705 1710
Arg Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro Asp
1730 1735 1740
Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu Asp Thr
1745 1750 1755 1760
Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser Asp Asp Gln
1765 1770 1775
Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu Val Tyr Trp Cys
1780 1785 1790
Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln Asp Ile Ala Arg Asn
1795 1800 1805
Asp Arg Met Asn Ser Ser Arg Arg Pro Ile Phe Gly Asn Phe Asn Ser
1810 1815 1820
Ser Lys Thr Ala Ile Ala Leu Lys Glu Ala Arg Gly Ala Ser Ser Ser
1825 1830 1835 1840
Met Tyr Tyr Leu Glu Ser Thr Glu Thr Cys Asp Ser Leu Glu Asp Ala
1845 1850 1855
Arg His Ala Gly Lys Ala Thr Val Arg Val Arg Tyr Ala Leu Pro Gln
1860 1865 1870
Ala Ile Arg Val Gly His Leu Gly Tyr Phe His Val Val Gln Gly Ser
1875 1880 1885
Ile Leu Glu Asn Thr Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys
1890 1895 1900
Asn Gly Ser Ile Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro
1905 1910 1915 1920
Asp Asn Met Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala
1925 1930 1935
Ala Ala Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly
1940 1945 1950
Ser Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965
Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu Ala
1970 1975 1980
Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile Arg Leu
1985 1990 1995 2000
His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu Pro Thr Asn
2005 2010 2015
Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr Ala Ala Gly Ile
2020 2025 2030
Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser Cys Phe Met Tyr Ser
2035 2040 2045
Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser Thr Tyr Lys Val Ser His
2050 2055 2060
Val Glu Asp Ile Pro Ile Leu Glu His Ser Val Ala Met Ala Lys Asn
2065 2070 2075 2080
Thr Val Ser Ala Ser Thr Val Asp Asp Thr Glu Lys Val Ile Thr Ala
2085 2090 2095
Thr Gln Ile Leu Leu Pro Gly Gln Leu Ser Val Asn His Asn Asp Gln
2100 2105 2110
Arg Phe Asn Leu Ala Thr Val Ile Asp Trp Lys Glu Asn Glu Val Ser
2115 2120 2125
Ala Arg Ile Cys Pro Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys
2130 2135 2140
Thr Tyr Leu Leu Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys
2145 2150 2155 2160
Arg Trp Met Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg
2165 2170 2175
Asn Pro Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly
2180 2185 2190
Gly Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val Ala
2210 2215 2220
Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu Lys Asn
2225 2230 2235 2240
Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys Val Gln Gly
2245 2250 2255
Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr Gly Ser Lys Ala
2260 2265 2270
Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val Ala Val Ile Gly Asn
2275 2280 2285
Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn Ala Tyr Leu Gln Ala Leu
2290 2295 2300
Ala Gln Gln Arg Cys Ala Arg Gly Leu Ala Gly Ser Thr Ile Asp Ile
2305 2310 2315 2320
Gly Ala Val Tyr Gly Val Gly Phe Val Thr Arg Ala Glu Met Glu Glu
2325 2330 2335
Asp Phe Asp Ala Ile Arg Phe Met Phe Asp Ser Val Glu Glu His Glu
2340 2345 2350
Leu His Thr Leu Phe Ala Glu Ala Val Val Ser Asp Gln Arg Ala Arg
2355 2360 2365
Gln Gln Pro Gln Arg Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu
2370 2375 2380
Thr Thr Gly Ile Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile
2385 2390 2395 2400
Tyr Phe Asn Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg
2405 2410 2415
Gly Asp Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp
2420 2425 2430
Gln Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp Gly
2450 2455 2460
Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val Asp Ser
2465 2470 2475 2480
Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln Leu Tyr Leu
2485 2490 2495
Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser Val Ala Asp Leu
2500 2505 2510
Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr Ser Ile Pro Leu Leu
2515 2520 2525
Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser Asp Ser Gly Ala Ser Pro
2530 2535 2540
Thr Pro Thr Asp Ser His Asp Glu Ala Ser Ser Ala Thr Ser Thr Asp
2545 2550 2555 2560
Ala Ser Ser Ala Glu Glu Asp Glu Glu Gln Glu Asp Asp Asn Glu Gln
2565 2570 2575
Gly Gly Arg Lys Ile Leu Arg Arg Glu Arg Leu Ser Leu Gly Gln Glu
2580 2585 2590
Tyr Ser Trp Arg Gln Gln Gln Met Val Lys Asp His Thr Ile Phe Asn
2595 2600 2605
Asn Thr Ile Gly Met Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu
2610 2615 2620
Arg Arg Ala Leu Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr
2625 2630 2635 2640
Cys Phe Val Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val
2645 2650 2655
Gln Val Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val
2660 2665 2670
Asn Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe Tyr
2690 2695 2700
Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg Leu Val
2705 2710 2715 2720
Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile Gly Gln Ile
2725 2730 2735
Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln Phe Ser Asp Leu
2740 2745 2750
Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly Arg Met Gly Asp Asp
2755 2760 2765
Ile Ala Phe Trp Lys Ser Met His Ser Lys Val Ser Ser Ser Ala Pro
2770 2775 2780
Thr Val Leu Pro Ile Met Asn Leu Ile Asn Asp Pro Ala Ala Asn Ser
2785 2790 2795 2800
Glu Gln Gln Gln Ile Gln Pro Phe Thr Trp Gln Gln Tyr Glu Ala Ile
2805 2810 2815
Ala Arg Leu Asp Pro Met Val Ala Phe Arg Ile Lys Glu Arg Ser Arg
2820 2825 2830
Lys His Lys Ala Thr Pro Met Gln Phe Tyr Leu Ala Ala Tyr His Val
2835 2840 2845
Leu Leu Ala Arg Leu Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala
2850 2855 2860
Glu Thr Asn Arg Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe
2865 2870 2875 2880
Ala Asn Val Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr
2885 2890 2895
Phe Gly Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met
2900 2905 2910
Gln His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala Pro
2930 2935 2940
Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu Ser Gly
2945 2950 2955 2960
Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser Arg Glu Arg
2965 2970 2975
Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp Pro Thr Lys Asp
2980 2985 2990
Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu Tyr Gly Pro Glu His
2995 3000 3005
Ala Gln Ala Phe Val Asp His Phe Ser Ser Ile Leu Thr Met Phe Ser
3010 3015 3020
Met Asn Pro Ala Leu Lys Leu Ala
3025 3030
<210> 45
<211> 7692
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(7689)
<400> 45
atg aac aat acc ccc gcc gta acc gca acc gca acc gca acc gca acc 48
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
1 5 10 15
gca acc gca atg gca ggc tcg gct tgc tct aac aca tcc acg ccc att 96
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
gcc ata gtt gga atg gga tgt cga ttt gct gga gat gca acg agt cca 144
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tct aag 192
Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
gtc ccc tcc tcg cga ttc aat gtg aga gga gta tac cac ccg aat ggc 240
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
gaa agg gtc ggg tcc acc cac gta aag ggt gga cac ttc atc gac gag 288
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
gat cct gct tta ttt gac gcc gcg ttc ttc aac atg acc aca gag gtc 336
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
gcc agc tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac 384
Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
gaa tcg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tct 432
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
aat acg tcg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat tcg 480
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser
145 150 155 160
ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac 528
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
tca gga aca atg ctt tcg aac cgg ata tca cac ttc tac gac tta cgt 576
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
ggt ccc agc gtg acg gtt gac acg gcc tgt tcg acg aca ttg acc gca 624
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
ctg cac ttg gcg tgc cag agc tta cgt act ggg gag tca gat aca gcc 672
Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220
atc gtt atc ggt gca aat ctt ctg ctc aat ccc gat gtt ttt gtt acg 720
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
atg tca aac ctg gga ttt ttg tcc ccg gat ggt atc tcg tac tct ttt 768
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
gat cct cga gcg aat gga tat ggt cgc ggg gaa gga att gcc gct ctg 816
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
gta ata aag gcc ctc cct aac gcg ttg cga gac caa gac cct atc cga 864
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285
gcc gtc att cga gag aca gcg ctg aac cag gat ggc aaa aca ccc gca 912
Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300
att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt 960
Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys
305 310 315 320
tac gat aag gct ggg cta gat atg tcg ttg acc tcg tac gtg gag gcc 1008
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
cac gga act gga aca cca act ggt gac ccc ctt gaa atc tca gca att 1056
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
tca gca gct ttt aaa gga cat cct ctg cac ctt ggc tct gtg aaa gca 1104
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag 1152
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc 1200
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
ctg caa aag aac agc aag ctg atg ctt gac caa aag aac atc aag atc 1248
Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415
ccc atg tct gct caa gac tgg cct gtg aaa gat ggg act cgt cgc gca 1296
Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
tct gtc aat aac ttc ggc ttt ggt ggt tcg aat gct cac gtc att ttg 1344
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
gaa tca tat gat cgc gca tca ttg gcc ctg cca gag gat caa gtg cat 1392
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460
gtc aat ggt aac tct gag cat ggt agg gtt gag gat ggt tcc aaa cag 1440
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln
465 470 475 480
agc cgc ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg cga 1488
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495
acg ata gca agc ctg cga gac tac att aaa tcc gtc gct gac att gac 1536
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
ggg gaa ccc ttc ctc gcc agc ctc gcc tat aca cta ggc tct cgc cgt 1584
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
tcc att ctg cca tgg acg tca gtg tat gta gca gac agc ctt ggc ggc 1632
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
ctt gtt tct gcc ctc agc gat gag tcc aat caa cca aaa cga gcg aat 1680
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn
545 550 555 560
gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg 1728
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575
cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag 1776
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590
gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg 1824
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605
aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat 1872
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
gat gcc gaa tac agt cta cca ctg tca acc gct atc caa att gca ctt 1920
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu
625 630 635 640
gtg cgt ctc ctt tgg tca tgg gga att cgg cca acg ggg ata acc agt 1968
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
cac tca agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc 2016
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
gcg cgg tcg gcc att ggg atc act tat ata cgc ggt gta ttg acc act 2064
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt 2112
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
ctt ggt cgc agt gag acc aat gtt tac att tcg cgt ctc aac cag gag 2160
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu
705 710 715 720
gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg 2208
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735
gtg tcg gga gat ttg ggt gca atc gag aaa ctt gaa aag ttg tta cac 2256
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat 2304
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
tca agc cac atg cga cca atg gca gat gcc ttt ggg gcg tca ctg aga 2352
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
gat ctg ttc aac tcg gat aac aac aac gac aat ccc aat gct gac acc 2400
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
tca aag ggt gta tta tat tca tca cct aag act ggt agt cgc atg acc 2448
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta 2496
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
cag ccg gta gag ttc gag tcc tca ctc cgc gag atg tgc ttt gat ccc 2544
Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
aac acc aaa gag aaa gcc gtc gat gtg att att gaa ata ggg cct cac 2592
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg 2640
Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu
865 870 875 880
aaa gga aca gat ata aac tat ctc agt tgc ctt tct cgc ggc aga agc 2688
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
tcg ttg gag aca atg tat cgt gct gct acg gag ttg ata agc aag ggt 2736
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
tat ggg ctc aaa atg gac gct ata aac ttt cct cat gga aga aaa gag 2784
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
ccc aga gtg aag gta ctg agc gat ttg ccg gcg tac ccg tgg aat cac 2832
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
caa acc cgt tat tgg aga gag cct cgc ggc agt cgt gag tcc aaa cag 2880
Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln
945 950 955 960
aga acc cat ccg cct cac act ttg ata ggc tca cgg gaa tct ctc tct 2928
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tca gat att 2976
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
cca tgg ata cga gat cac gtc gtt ggt tcg agc atc atc ttt ccg gga 3024
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
gct ggc ttc atc agc atg gcc atc gag ggg ttt tca caa gtc tgc cca 3072
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys Pro
1010 1015 1020
cca gtt gcg ggg gct agc atc aac tac aac ttg cgt gac gtt gaa ctc 3120
Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val Glu Leu
1025 1030 1035 1040
gcg cag gct ctc ata ata ccc gct gat gca gaa gca gag gtt gac ctg 3168
Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu Val Asp Leu
1045 1050 1055
cgc cta acg atc cgt tca tgt gag gaa agg tcc ctc ggc aca aag aac 3216
Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu Gly Thr Lys Asn
1060 1065 1070
tgg cat caa ttt tct gtg cac tca att tcg ggc gaa aat aat acc tgg 3264
Trp His Gln Phe Ser Val His Ser Ile Ser Gly Glu Asn Asn Thr Trp
1075 1080 1085
aca gaa cac tgc acc gga tta ata cgt tcg gag agc gaa aga agc cac 3312
Thr Glu His Cys Thr Gly Leu Ile Arg Ser Glu Ser Glu Arg Ser His
1090 1095 1100
ctt gac tgt tca act gtg gaa gcc tca cgc agg ttg aat cta ggc tca 3360
Leu Asp Cys Ser Thr Val Glu Ala Ser Arg Arg Leu Asn Leu Gly Ser
1105 1110 1115 1120
gat aac cgg agc att gat ccc aac gat ctc tgg gag tcc tta cac gcg 3408
Asp Asn Arg Ser Ile Asp Pro Asn Asp Leu Trp Glu Ser Leu His Ala
1125 1130 1135
aat ggg ata tgc cac gga ccc att ttt cag aac att cag cga att caa 3456
Asn Gly Ile Cys His Gly Pro Ile Phe Gln Asn Ile Gln Arg Ile Gln
1140 1145 1150
aac aat gga cag ggc tcg ttt tgc aga ttt tcc att gct gac act gcc 3504
Asn Asn Gly Gln Gly Ser Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala
1155 1160 1165
tcg gct atg cct cac tcg tac gag aat cga cac atc gtc cat cct act 3552
Ser Ala Met Pro His Ser Tyr Glu Asn Arg His Ile Val His Pro Thr
1170 1175 1180
act ctg gac tcg gtg atc cag gcg gca tac acg gtg tta ccc tac gcg 3600
Thr Leu Asp Ser Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala
1185 1190 1195 1200
gga aca cgt atg aaa acg gcc atg gta cca agg agg cta aga aat gtc 3648
Gly Thr Arg Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val
1205 1210 1215
aaa ata tcc tct agc ctg gct gac ttg gag gct ggt gat gct ctg gac 3696
Lys Ile Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp
1220 1225 1230
gca cag gcc agc atc aag gat cgc aac tct caa tcc ttc tct acc gac 3744
Ala Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245
ttg gca gtg ttt gat gac tat gat agc ggt tct tct ccc tcg gac gga 3792
Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp Gly
1250 1255 1260
atc cca gtc ata gag att gaa ggc ctt gtt ttc cag tcg gtt gga agc 3840
Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val Gly Ser
1265 1270 1275 1280
agc ttc tct gac caa aag tca gac tcc aac gac aca gaa aat gcc tgc 3888
Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu Asn Ala Cys
1285 1290 1295
agc tcc tgg gtt tgg gcc cct gac atc agc ttg ggt gac tcc act tgg 3936
Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly Asp Ser Thr Trp
1300 1305 1310
ctc aaa gaa aag ttg agc act gag gct gag acg aaa gaa acg gaa ctc 3984
Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr Lys Glu Thr Glu Leu
1315 1320 1325
atg atg gac ctc cga aga tgc acg atc aac ttt ata cag gag gct gtc 4032
Met Met Asp Leu Arg Arg Cys Thr Ile Asn Phe Ile Gln Glu Ala Val
1330 1335 1340
act gat ttg aca aat tct gat atc caa cat ctg gat ggc cac ctt cag 4080
Thr Asp Leu Thr Asn Ser Asp Ile Gln His Leu Asp Gly His Leu Gln
1345 1350 1355 1360
aag tat ttc gat tgg atg aat gtc caa ttg gac ctt gcg aga caa aac 4128
Lys Tyr Phe Asp Trp Met Asn Val Gln Leu Asp Leu Ala Arg Gln Asn
1365 1370 1375
aag ctc agc cca gcc agt tgc gac tgg cta agt gac gat gct gag cag 4176
Lys Leu Ser Pro Ala Ser Cys Asp Trp Leu Ser Asp Asp Ala Glu Gln
1380 1385 1390
aag aaa tgc cta cag gcc aga gtc gct gga gaa agc gtc aat ggc gag 4224
Lys Lys Cys Leu Gln Ala Arg Val Ala Gly Glu Ser Val Asn Gly Glu
1395 1400 1405
atg att tct cgt cta gga cct cag tta ata gca atg cta cgc cgc gaa 4272
Met Ile Ser Arg Leu Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu
1410 1415 1420
aca gag cca ctt gag ttg atg atg caa gat cag ctg cta agc aga tac 4320
Thr Glu Pro Leu Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr
1425 1430 1435 1440
tac gtc aac gca atc aaa tgg agc cga tca aac gca caa gcc agc gag 4368
Tyr Val Asn Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu
1445 1450 1455
ctg atc cga ctt tgc gcc cac aag aac ccg cgt tct cgc att ttg gag 4416
Leu Ile Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu
1460 1465 1470
att ggc gga ggc acg ggc ggc tgc aca aag ctt att gtc aat gca ttg 4464
Ile Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485
gga aac acc aag ccg atc gat cgt tat gac ttc acc gat gtg tct gcc 4512
Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser Ala
1490 1495 1500
ggg ttt ttc gag tcg gcg cgt gag caa ttt gcg gat tgg caa gac gtg 4560
Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln Asp Val
1505 1510 1515 1520
atg act ttc aaa aaa ttg gat att gaa agc gat ccc gag caa caa ggg 4608
Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu Gln Gln Gly
1525 1530 1535
ttt gaa tgt gcc acc tac gat gtg gtc gtg gct tgc cag gtc ctg cat 4656
Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys Gln Val Leu His
1540 1545 1550
gca act cga tgc atg aaa cga aca ctg agt aac gtt cga aaa ttg ctc 4704
Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn Val Arg Lys Leu Leu
1555 1560 1565
aag cct ggg ggc aac ttg att ttg gtt gag act acc agg gat cag ctc 4752
Lys Pro Gly Gly Asn Leu Ile Leu Val Glu Thr Thr Arg Asp Gln Leu
1570 1575 1580
gat ttg ttc ttt acc ttc gga ctg ttg cca ggt tgg tgg ctc agt gag 4800
Asp Leu Phe Phe Thr Phe Gly Leu Leu Pro Gly Trp Trp Leu Ser Glu
1585 1590 1595 1600
gag cct gag cgg aag tcg acg cca tcg ctc act acc gat ctt tgg aac 4848
Glu Pro Glu Arg Lys Ser Thr Pro Ser Leu Thr Thr Asp Leu Trp Asn
1605 1610 1615
acc atg ttg gac acg agc ggt ttc aac ggt gtg gaa ttg gag gtt cgt 4896
Thr Met Leu Asp Thr Ser Gly Phe Asn Gly Val Glu Leu Glu Val Arg
1620 1625 1630
gat tgt gaa gac gat gag ttt tac atg atc agc aca atg cta tcg acg 4944
Asp Cys Glu Asp Asp Glu Phe Tyr Met Ile Ser Thr Met Leu Ser Thr
1635 1640 1645
gct aga aaa gag aat aca acc ccg gat aca gtg gca gaa tcg gag gtg 4992
Ala Arg Lys Glu Asn Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val
1650 1655 1660
ctt ttg ctg cac gga gcg ctc cga cct cct tca tct tgg ctg gaa agt 5040
Leu Leu Leu His Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser
1665 1670 1675 1680
ctc cag gca gca att tgt gaa aag acc agt tct agc cca tcg atc aac 5088
Leu Gln Ala Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn
1685 1690 1695
gct ctg ggc gag gta gat acc act gga agg aca tgc att ttt ctt ggg 5136
Ala Leu Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly
1700 1705 1710
gaa atg gag tcc tcg ctc ctt gga gag gtg gga agc gag acc ttc aaa 5184
Glu Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725
tcc atc acc gcg atg ctg aat aac tgc aac gca ctt ctc tgg gtg tct 5232
Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val Ser
1730 1735 1740
aga gga gca gcc atg agc tcc gag gat cca tgg aaa gct cta cat att 5280
Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu His Ile
1745 1750 1755 1760
ggt ctg ctg cgt acc atc cgc aac gaa aat aac ggg aag gaa tat gta 5328
Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys Glu Tyr Val
1765 1770 1775
tcg ttg gat ctc gat cct tct cga aac gca tac acc cac gag tcc ctg 5376
Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr His Glu Ser Leu
1780 1785 1790
tat gct atc tgc aat atc ttc aat ggc cgc ctc ggc gac ctt tcc gaa 5424
Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu Gly Asp Leu Ser Glu
1795 1800 1805
gac aag gag ttt gaa ttt gca gag aga aac ggc gtc atc cac gta ccg 5472
Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn Gly Val Ile His Val Pro
1810 1815 1820
cga ctt ttc aat gac ccg cac tgg aag gac caa gaa gcg gtt gag gtc 5520
Arg Leu Phe Asn Asp Pro His Trp Lys Asp Gln Glu Ala Val Glu Val
1825 1830 1835 1840
aca ctg cag ccg ttc gag caa ccc ggg cgt cgt ctg cgg atg gag gtt 5568
Thr Leu Gln Pro Phe Glu Gln Pro Gly Arg Arg Leu Arg Met Glu Val
1845 1850 1855
gag acg cca ggg ctc tta gac tcc ctg caa ttt cga gac gac gaa gga 5616
Glu Thr Pro Gly Leu Leu Asp Ser Leu Gln Phe Arg Asp Asp Glu Gly
1860 1865 1870
cgt gaa ggc aag gat ctt ccg gat gat tgg gta gaa atc gaa ccc aaa 5664
Arg Glu Gly Lys Asp Leu Pro Asp Asp Trp Val Glu Ile Glu Pro Lys
1875 1880 1885
gct ttc ggt ctc aat ttt cgg gat gtc atg gtt gcc atg ggt caa ttg 5712
Ala Phe Gly Leu Asn Phe Arg Asp Val Met Val Ala Met Gly Gln Leu
1890 1895 1900
gag gcc aac cgt gtg atg ggc ttc gaa tgc gcc gga gtg atc aca aag 5760
Glu Ala Asn Arg Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys
1905 1910 1915 1920
ctc ggt gga gct gct gcc gct agc caa ggc ctc aga tta ggg gac cgc 5808
Leu Gly Gly Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg
1925 1930 1935
gta tgt gca cta ctg aaa ggc cat tgg gcg acc aga aca cag acg ccg 5856
Val Cys Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro
1940 1945 1950
tac act aat gtc gtc cgt att ccg gac gaa atg ggc ttc cca gaa gcc 5904
Tyr Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
gct tcg gtc ccc ctg gct ttc act acc gca tat att gcg ctt tat acc 5952
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr Thr
1970 1975 1980
acg gca aag cta cga cga ggc gaa aga gtc ttg atc cac agt gga gct 6000
Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser Gly Ala
1985 1990 1995 2000
gga ggc gtc ggt caa gca gcg atc att ttg tcc cag ctt gcg ggt gcc 6048
Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu Ala Gly Ala
2005 2010 2015
gag gtc ttc gtc aca gcg gga act caa gcc aag cgt gac ttt gtc ggc 6096
Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg Asp Phe Val Gly
2020 2025 2030
gat aaa ttc ggc atc aat ccg gat cat atc ttc tcg agc agg aat gac 6144
Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe Ser Ser Arg Asn Asp
2035 2040 2045
tta ttc gtc gac ggc atc aaa gcc tac acg ggc gga ctt ggc gtt cat 6192
Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr Gly Gly Leu Gly Val His
2050 2055 2060
gtc gtt cta aac tca ttg gca ggt caa ctc ctc caa gca agc ttt gac 6240
Val Val Leu Asn Ser Leu Ala Gly Gln Leu Leu Gln Ala Ser Phe Asp
2065 2070 2075 2080
tgc atg gcc gaa ttc ggc aga ttt gtt gag att gga aaa aag gac ctg 6288
Cys Met Ala Glu Phe Gly Arg Phe Val Glu Ile Gly Lys Lys Asp Leu
2085 2090 2095
gag caa aac agc aga ctt gac atg ctg cca ttc acc cgg gac gtc tct 6336
Glu Gln Asn Ser Arg Leu Asp Met Leu Pro Phe Thr Arg Asp Val Ser
2100 2105 2110
ttc aca tca att gat ctt ctc tcg tgg caa aga gcc aaa agt gaa gaa 6384
Phe Thr Ser Ile Asp Leu Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu
2115 2120 2125
gta tcc gaa gcg ttg aac cat gtc aca aaa ctc ctc gag aca aaa gcg 6432
Val Ser Glu Ala Leu Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala
2130 2135 2140
att ggc ttg att ggt cca atc cag cag cac tcc ttg tca aac atc gag 6480
Ile Gly Leu Ile Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu
2145 2150 2155 2160
aag gcc ttc cgt acg atg cag agt ggt cag cat gtt ggc aaa gtt gtg 6528
Lys Ala Phe Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val
2165 2170 2175
gtc aat gta tct ggg gac gaa ctg gtc cca gtc ggc gat gga ggg ttc 6576
Val Asn Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe
2180 2185 2190
tcg ctg aag ctg aag cct gac agt tct tac cta gtt gct ggt ggg ctg 6624
Ser Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
ggg gga att gga aag cag atc tgt cag tgg ctt gtt gat cat ggc gcg 6672
Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly Ala
2210 2215 2220
aag cac ttg att atc cta tcg aga agt gca aag gcc agt cca ttc ata 6720
Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro Phe Ile
2225 2230 2235 2240
acc agc ttg caa aat caa cag tgc gct gtc tat cta cac gca tgt gac 6768
Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His Ala Cys Asp
2245 2250 2255
atc tca gat caa gat cag gtc acc aag gtg ctc cgg ttg tgc gaa gaa 6816
Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg Leu Cys Glu Glu
2260 2265 2270
gca cat gca ccg cca att cga ggt atc ata caa ggt gcc atg gtt ctc 6864
Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln Gly Ala Met Val Leu
2275 2280 2285
aag gac gcg ctt cta tcg cga atg aca ttg gat gaa ttt aat gca gca 6912
Lys Asp Ala Leu Leu Ser Arg Met Thr Leu Asp Glu Phe Asn Ala Ala
2290 2295 2300
aca cgc cca aaa gta cag ggt agt tgg tat ctt cac aag atc gca cag 6960
Thr Arg Pro Lys Val Gln Gly Ser Trp Tyr Leu His Lys Ile Ala Gln
2305 2310 2315 2320
gat gtt gac ttc ttc gtg atg ctc tca tcc ctt gtt ggg gtc atg ggt 7008
Asp Val Asp Phe Phe Val Met Leu Ser Ser Leu Val Gly Val Met Gly
2325 2330 2335
ggg gca ggc cag gcc aat tac gca gct gct ggt gca ttc cag gac gca 7056
Gly Ala Gly Gln Ala Asn Tyr Ala Ala Ala Gly Ala Phe Gln Asp Ala
2340 2345 2350
ctt gcg cac cac cgg aga gcc cat ggc atg ccg gct gtc acc att gac 7104
Leu Ala His His Arg Arg Ala His Gly Met Pro Ala Val Thr Ile Asp
2355 2360 2365
ttg ggc atg gtc aag tct gtt gga tac gtg gct gaa act ggc cgt ggt 7152
Leu Gly Met Val Lys Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly
2370 2375 2380
gtg gcc gac cgg ctc gct aga ata ggt tac aag cct atg cat gaa aag 7200
Val Ala Asp Arg Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys
2385 2390 2395 2400
gac gtc atg gat gtg ttg gag aag gca atc ctg tgt tct tcc cct caa 7248
Asp Val Met Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln
2405 2410 2415
ttt cca tca cct ccc gca gct gtg gtt aca gga atc aac aca tcc ccg 7296
Phe Pro Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro
2420 2425 2430
ggt gct cac tgg acc gag gca aac tgg ata cag gaa cag cgg ttt gtg 7344
Gly Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445
gga ctt aaa tac cgc caa gtc ctt cat gca gac caa tcc ttt gtc tct 7392
Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val Ser
2450 2455 2460
tcg cat aaa aaa gga cca gat ggc gtg cgg gcc caa cta agc agg gtc 7440
Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser Arg Val
2465 2470 2475 2480
acc tct cac gac gag gcc att tct atc gtc ctc aaa gca atg acg gaa 7488
Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala Met Thr Glu
2485 2490 2495
aag ctg atg cga atg ttt ggt ctg gca gaa gac gac atg tcc tcg tcc 7536
Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp Met Ser Ser Ser
2500 2505 2510
aaa aac ctg gca ggt gtc ggc gta gac tca ctc gtc gcc att gaa ctt 7584
Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu Val Ala Ile Glu Leu
2515 2520 2525
cga aac tgg atc aca tct gaa atc cat gtt gat gtg tcg atc ttt gag 7632
Arg Asn Trp Ile Thr Ser Glu Ile His Val Asp Val Ser Ile Phe Glu
2530 2535 2540
ctc atg aat ggt aac acc atc gcc ggc ctc gtc gag tta gtt gtg gcg 7680
Leu Met Asn Gly Asn Thr Ile Ala Gly Leu Val Glu Leu Val Val Ala
2545 2550 2555 2560
aaa tgc agt t aa 7692
Lys Cys Ser
<210> 46
<211> 2563
<212> PRT
<213> Penicillium citrinum
<400> 46
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
1 5 10 15
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser
145 150 155 160
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285
Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300
Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys
305 310 315 320
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415
Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln
465 470 475 480
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn
545 550 555 560
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu
625 630 635 640
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu
705 710 715 720
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu
865 870 875 880
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln
945 950 955 960
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys Pro
1010 1015 1020
Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val Glu Leu
1025 1030 1035 1040
Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu Val Asp Leu
1045 1050 1055
Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu Gly Thr Lys Asn
1060 1065 1070
Trp His Gln Phe Ser Val His Ser Ile Ser Gly Glu Asn Asn Thr Trp
1075 1080 1085
Thr Glu His Cys Thr Gly Leu Ile Arg Ser Glu Ser Glu Arg Ser His
1090 1095 1100
Leu Asp Cys Ser Thr Val Glu Ala Ser Arg Arg Leu Asn Leu Gly Ser
1105 1110 1115 1120
Asp Asn Arg Ser Ile Asp Pro Asn Asp Leu Trp Glu Ser Leu His Ala
1125 1130 1135
Asn Gly Ile Cys His Gly Pro Ile Phe Gln Asn Ile Gln Arg Ile Gln
1140 1145 1150
Asn Asn Gly Gln Gly Ser Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala
1155 1160 1165
Ser Ala Met Pro His Ser Tyr Glu Asn Arg His Ile Val His Pro Thr
1170 1175 1180
Thr Leu Asp Ser Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala
1185 1190 1195 1200
Gly Thr Arg Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val
1205 1210 1215
Lys Ile Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp
1220 1225 1230
Ala Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245
Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp Gly
1250 1255 1260
Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val Gly Ser
1265 1270 1275 1280
Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu Asn Ala Cys
1285 1290 1295
Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly Asp Ser Thr Trp
1300 1305 1310
Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr Lys Glu Thr Glu Leu
1315 1320 1325
Met Met Asp Leu Arg Arg Cys Thr Ile Asn Phe Ile Gln Glu Ala Val
1330 1335 1340
Thr Asp Leu Thr Asn Ser Asp Ile Gln His Leu Asp Gly His Leu Gln
1345 1350 1355 1360
Lys Tyr Phe Asp Trp Met Asn Val Gln Leu Asp Leu Ala Arg Gln Asn
1365 1370 1375
Lys Leu Ser Pro Ala Ser Cys Asp Trp Leu Ser Asp Asp Ala Glu Gln
1380 1385 1390
Lys Lys Cys Leu Gln Ala Arg Val Ala Gly Glu Ser Val Asn Gly Glu
1395 1400 1405
Met Ile Ser Arg Leu Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu
1410 1415 1420
Thr Glu Pro Leu Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr
1425 1430 1435 1440
Tyr Val Asn Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu
1445 1450 1455
Leu Ile Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu
1460 1465 1470
Ile Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485
Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser Ala
1490 1495 1500
Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln Asp Val
1505 1510 1515 1520
Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu Gln Gln Gly
1525 1530 1535
Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys Gln Val Leu His
1540 1545 1550
Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn Val Arg Lys Leu Leu
1555 1560 1565
Lys Pro Gly Gly Asn Leu Ile Leu Val Glu Thr Thr Arg Asp Gln Leu
1570 1575 1580
Asp Leu Phe Phe Thr Phe Gly Leu Leu Pro Gly Trp Trp Leu Ser Glu
1585 1590 1595 1600
Glu Pro Glu Arg Lys Ser Thr Pro Ser Leu Thr Thr Asp Leu Trp Asn
1605 1610 1615
Thr Met Leu Asp Thr Ser Gly Phe Asn Gly Val Glu Leu Glu Val Arg
1620 1625 1630
Asp Cys Glu Asp Asp Glu Phe Tyr Met Ile Ser Thr Met Leu Ser Thr
1635 1640 1645
Ala Arg Lys Glu Asn Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val
1650 1655 1660
Leu Leu Leu His Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser
1665 1670 1675 1680
Leu Gln Ala Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn
1685 1690 1695
Ala Leu Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly
1700 1705 1710
Glu Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725
Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val Ser
1730 1735 1740
Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu His Ile
1745 1750 1755 1760
Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys Glu Tyr Val
1765 1770 1775
Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr His Glu Ser Leu
1780 1785 1790
Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu Gly Asp Leu Ser Glu
1795 1800 1805
Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn Gly Val Ile His Val Pro
1810 1815 1820
Arg Leu Phe Asn Asp Pro His Trp Lys Asp Gln Glu Ala Val Glu Val
1825 1830 1835 1840
Thr Leu Gln Pro Phe Glu Gln Pro Gly Arg Arg Leu Arg Met Glu Val
1845 1850 1855
Glu Thr Pro Gly Leu Leu Asp Ser Leu Gln Phe Arg Asp Asp Glu Gly
1860 1865 1870
Arg Glu Gly Lys Asp Leu Pro Asp Asp Trp Val Glu Ile Glu Pro Lys
1875 1880 1885
Ala Phe Gly Leu Asn Phe Arg Asp Val Met Val Ala Met Gly Gln Leu
1890 1895 1900
Glu Ala Asn Arg Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys
1905 1910 1915 1920
Leu Gly Gly Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg
1925 1930 1935
Val Cys Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro
1940 1945 1950
Tyr Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr Thr
1970 1975 1980
Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser Gly Ala
1985 1990 1995 2000
Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu Ala Gly Ala
2005 2010 2015
Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg Asp Phe Val Gly
2020 2025 2030
Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe Ser Ser Arg Asn Asp
2035 2040 2045
Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr Gly Gly Leu Gly Val His
2050 2055 2060
Val Val Leu Asn Ser Leu Ala Gly Gln Leu Leu Gln Ala Ser Phe Asp
2065 2070 2075 2080
Cys Met Ala Glu Phe Gly Arg Phe Val Glu Ile Gly Lys Lys Asp Leu
2085 2090 2095
Glu Gln Asn Ser Arg Leu Asp Met Leu Pro Phe Thr Arg Asp Val Ser
2100 2105 2110
Phe Thr Ser Ile Asp Leu Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu
2115 2120 2125
Val Ser Glu Ala Leu Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala
2130 2135 2140
Ile Gly Leu Ile Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu
2145 2150 2155 2160
Lys Ala Phe Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val
2165 2170 2175
Val Asn Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe
2180 2185 2190
Ser Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly Ala
2210 2215 2220
Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro Phe Ile
2225 2230 2235 2240
Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His Ala Cys Asp
2245 2250 2255
Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg Leu Cys Glu Glu
2260 2265 2270
Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln Gly Ala Met Val Leu
2275 2280 2285
Lys Asp Ala Leu Leu Ser Arg Met Thr Leu Asp Glu Phe Asn Ala Ala
2290 2295 2300
Thr Arg Pro Lys Val Gln Gly Ser Trp Tyr Leu His Lys Ile Ala Gln
2305 2310 2315 2320
Asp Val Asp Phe Phe Val Met Leu Ser Ser Leu Val Gly Val Met Gly
2325 2330 2335
Gly Ala Gly Gln Ala Asn Tyr Ala Ala Ala Gly Ala Phe Gln Asp Ala
2340 2345 2350
Leu Ala His His Arg Arg Ala His Gly Met Pro Ala Val Thr Ile Asp
2355 2360 2365
Leu Gly Met Val Lys Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly
2370 2375 2380
Val Ala Asp Arg Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys
2385 2390 2395 2400
Asp Val Met Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln
2405 2410 2415
Phe Pro Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro
2420 2425 2430
Gly Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445
Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val Ser
2450 2455 2460
Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser Arg Val
2465 2470 2475 2480
Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala Met Thr Glu
2485 2490 2495
Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp Met Ser Ser Ser
2500 2505 2510
Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu Val Ala Ile Glu Leu
2515 2520 2525
Arg Asn Trp Ile Thr Ser Glu Ile His Val Asp Val Ser Ile Phe Glu
2530 2535 2540
Leu Met Asn Gly Asn Thr Ile Ala Gly Leu Val Glu Leu Val Val Ala
2545 2550 2555 2560
Lys Cys Ser
<210> 47
<211> 1557
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1554)
<400> 47
atg ctc ggc cag gtt ctt ctg acc gtc gaa tcg tac caa tgg gta tcg 48
Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser
1 5 10 15
acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc 96
Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa 144
Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45
aaa tgg tgg gag ttg acg acc atg agg gct agg cag gac ttc gat acg 192
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60
tat ggt ccg agc tgg atc gaa gct tgg ttc tcg aaa aac gac aag ccc 240
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca tcg tcc 288
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt 336
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
ttg gcg gat gac ttt cac tct cat ctc cct gga ttc gac ggg ttc aag 384
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
gaa atc tgc cag gat gca cat ctt gtc aac aaa gtt gtt ttg aac cag 432
Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140
tta caa acc caa gcc ccc aag tac aca aag cca ttg gct acc ttg gcc 480
Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
gac gct act att gcc aag ttg ttc ggt aaa agc gag gag tgg caa acc 528
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175
gca cct gtc tat tcc aat gga ttg gac ctt gtc aca cga aca gtc aca 576
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat 624
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt 672
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220
cgc gta tgg ccc atg cta ctg cga ccg ctc gct cac tgg ttt caa ccg 720
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro
225 230 235 240
caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca cga aag atc att 768
Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
gat cct gag att cag cga cga cgt gct gaa aag gcc gca tgt gta gcg 816
Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa 864
Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285
gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct 912
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300
atg gat ttc gcc ggc atc tac gcc tcg acg gat ctt ttc gtc ggt gcc 960
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa 1008
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335
gag atc cgc act gta atc gga gaa ggg ggc tgg acg cct gcc tct ctg 1056
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
ttc aag ctg aag ctc ctc gac agc tgc atg aaa gag acg cag cga atc 1104
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365
aag ccg gtc gag tgc gcc act atg cgc agt acc gct ctc aga gac atc 1152
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
act cta tcc aat ggc ctc ttc att ccc aag ggc gag ttg gcc gct gtg 1200
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
gct gca gac cgc atg aac aac cct gat gtg tgg gaa aac ccc gaa aat 1248
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
tat gat ccc tac cga ttt atg cgc atg cgc gag gat cca gac aag gcc 1296
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
ttc acc gct caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc 1344
Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
tgg aac cca cgc gct tgt ccc ggg cgg ttc ttc gcc tcg aag gaa atc 1392
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
aag att ctc ctc gct cat ata ctg att cag tat gat gtg aag cct gta 1440
Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val
465 470 475 480
cca gga gac gat gac aaa tac tac cgt cac gct ttt agc gtt cgt atg 1488
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
cat cca acc aca aag ctc atg gta cgc cgg cgc aac gag gac atc ccg 1536
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
ctc cct cat gac cgg tgc taa 1557
Leu Pro His Asp Arg Cys
515
<210> 48
<211> 518
<212> PRT
<213> Penicillium citrinum
<400> 48
Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser
1 5 10 15
Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140
Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro
225 230 235 240
Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val
465 470 475 480
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
Leu Pro His Asp Arg Cys
515
<210> 49
<211> 3522
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(3519)
<400> 49
atg gtc gct tcg ttg cta ccc tct cgc ttt cgc ggt agg gaa tca atg 48
Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
1 5 10 15
aat cag cag cac cct cta cgc tcg gga aat cgg gca ttg acc tcc aca 96
Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
ctc caa ttt cta tcc aaa acg gcg tgt cta cac ccg atc cat acc gtt 144
Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
tgc acc ata gct att cta gct agt acc aca tac gtt gga cta ctc aaa 192
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
gac agc ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc 240
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
tct ttg gtc gaa gga agt cga agc ttg atc acc ggc cca cag aat ggc 288
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95
tgg aag tgg cag agc ttc gac ggg gat gca gat gtt ctc gga gat ttc 336
Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
aac cat caa gca cta atg acc ttg gta ttc ccg ggg tca tat ggg gtt 384
Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
gca tct caa gca gcc tca cca ttc ctt gct ccc ctc cct gtg aac cta 432
Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
tct gtg att gac ctt ccc tca acg tcg agc cct tta acc gcc tat tcg 480
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
aaa gat aaa gtt ttc gcc ttc tct gtg gaa tac agc agc gcg ccg gaa 528
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
ctc gtg gct gct gtt caa gaa atc ccc aac aac agt gcc gac ctg aaa 576
Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
ttg cag gag acg caa ttg atc gag atg gaa cgc cag atg tgg atc atg 624
Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205
aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac 672
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220
gat acc tgg aca gag tct ctt gat ctt atc aag agc gct caa acg ctc 720
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu
225 230 235 240
gac gtg gtt gtc atg gtg cta ggt tat ata tca atg cac ttg act ttc 768
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
gtc tca ctc ttc ctc agc atg aaa aaa ttg gga tcg aag gtt tgg ctg 816
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270
gct aca agc gtc ctt ttg tcg tca aca ttt gcc ttt ctc ctc ggt ctc 864
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
gac gtg gcc ata aga cta ggg gtt ccg atg agc atg agg ttg cta tcc 912
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc 960
Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac cga aag ccc 1008
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335
cag aag ata cag tct gac cag ggt agc gtg aca gcc att gct gaa agt 1056
Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
acc atc aat tac gcc gta cga agc gcc att cgg gag aag ggt tac aat 1104
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
atc gtg tgc cac tac gtg gtc gag atc ctg ctc cta gtt atc ggt gct 1152
Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
gtc tta ggc atc caa ggt ggg cta cag cac ttc tgt gtt cta gct gca 1200
Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala
385 390 395 400
ttg atc ctg ttc ttt gac tgt ctg ctg ctg ttt aca ttc tac act gcg 1248
Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415
att ctg tct atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac 1296
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag 1344
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445
agt gtc gcg acc agc aat gat gcc caa gac agt gca cgt aca tat ctg 1392
Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460
ttt ggc aat gat atg aaa ggc agc agt gtt ccg aag ttc aaa ttc tgg 1440
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
atg gtc gtt ggt ttc ctt atc gtc aac ctc gtc aac atc ggc tcc acc 1488
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
ctt ttc caa gcc tct tct agt gga tcg ttg tcc agt ata tca tct tgg 1536
Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
acc gaa agt ctg agc gga tcg gcc att aaa ccc ccg ctt gag ccc ttc 1584
Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
aag gta gct gga agt gga cta gat gaa cta ctt ttc cag gca aga ggg 1632
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540
cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa 1680
Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
cta gag tat cct tcc att cac cgt ggt acc tcg cag cta cac gag tat 1728
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575
gga gtt ggt gga aaa atg gtc ggt agc ctg ctc acc agc ctg gaa gat 1776
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc cta agt gtc gct 1824
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
ctg aac agc tat ctg ttc aag gcc gcc aga ctg gga atc aaa gat cct 1872
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
aat ctc ccg agt cac cca gtt gat cca gtt gag ctt gac cag gcc gaa 1920
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu
625 630 635 640
agc ttc aac gct gcc cag aac cag acc cct cag att caa tca agt ctc 1968
Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655
caa gct cct cag acc aga gtg ttc act cct acc acc acc gac agt gac 2016
Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670
agt gat gcc tca tta gtc tta att aaa gca tct cta aag gtc act aag 2064
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685
cga gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tct cgc aca 2112
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc agc gag ttg 2160
Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu
705 710 715 720
aac gat gag gat gtc gtt gcc ttg tct ttg cgg gga aag gtt ccc ggg 2208
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt 2256
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
cgc cgc tct atc att tcg agg aca ccg gct acc gca gag ctt aca agt 2304
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
atg ctg gag cac tcg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc 2352
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct 2400
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att 2448
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
cct atg gca acc acc gag ggc gtc ctc gtc gct agt gct agc cgt ggc 2496
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc 2544
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
gac ggt atg aca cga ggc ccg tgt gtg aag ttt gat gtc ctt gaa cga 2592
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta 2640
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val
865 870 875 880
atg aaa gaa gcc ttc aat tca acc agc aga ttt gcg cgc tta caa agt 2688
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895
atg cgg aca act atc gcc ggt act cac tta tat att cga ttt aag act 2736
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
act act ggc gac gct atg gga atg aat atg att tct aag ggc gtg gag 2784
Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925
cat gca ctg aat gtt atg gcg aca gag gca ggt ttc agc gat atg aat 2832
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
att att acc cta tca gga aat tac tgt acg gat aag aaa cct tca gct 2880
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc 2928
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
ata ccg gcg aac gtt gtc agg gat gtc tta aag agc gat gtg gat agc 2976
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024
Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005
ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca gcc 3072
Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala Ala
1010 1015 1020
att ttc att gcc aca ggt cag gat ccg gcg caa gtt gtg gag agc gct 3120
Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu Ser Ala
1025 1030 1035 1040
aac tgc atc act ctc atg aac aat ctt cgc gga tcg ctt caa atc tct 3168
Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu Gln Ile Ser
1045 1050 1055
gtc tcc atg ccg tct att gag gtt gga acg ttg ggc ggt ggt acg att 3216
Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly Gly Gly Thr Ile
1060 1065 1070
ctg gag ccc cag ggc gca atg ctt gac atg ctt ggt gtc cgc gga tca 3264
Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu Gly Val Arg Gly Ser
1075 1080 1085
cac ccg acc act ccc ggt gag aat gca cgt caa ctt gcg cgc atc atc 3312
His Pro Thr Thr Pro Gly Glu Asn Ala Arg Gln Leu Ala Arg Ile Ile
1090 1095 1100
gga agc gct gtt ttg gct ggg gag ctc tcg cta tgt gct gcc cta gcc 3360
Gly Ser Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala Leu Ala
1105 1110 1115 1120
gcc ggt cac ctg gtc aag gcg cac atg gcg cac aac cgt tct gcc ccg 3408
Ala Gly His Leu Val Lys Ala His Met Ala His Asn Arg Ser Ala Pro
1125 1130 1135
gca tct tca gcc cct tct cga agt gtc tcc ccg tca ggc gga acc agg 3456
Ala Ser Ser Ala Pro Ser Arg Ser Val Ser Pro Ser Gly Gly Thr Arg
1140 1145 1150
aca gtc cct gtt cct aac aat gca ctg agg ccg agt gct gca gct act 3504
Thr Val Pro Val Pro Asn Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr
1155 1160 1165
gat cgg gct cga cgc t ga 3522
Asp Arg Ala Arg Arg
1170
<210> 50
<211> 1173
<212> PRT
<213> Penicillium citrinum
<400> 50
Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
1 5 10 15
Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95
Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu
225 230 235 240
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335
Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala
385 390 395 400
Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445
Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540
Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu
625 630 635 640
Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655
Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu
705 710 715 720
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val
865 870 875 880
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005
Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala Ala
1010 1015 1020
Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu Ser Ala
1025 1030 1035 1040
Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu Gln Ile Ser
1045 1050 1055
Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly Gly Gly Thr Ile
1060 1065 1070
Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu Gly Val Arg Gly Ser
1075 1080 1085
His Pro Thr Thr Pro Gly Glu Asn Ala Arg Gln Leu Ala Arg Ile Ile
1090 1095 1100
Gly Ser Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala Leu Ala
1105 1110 1115 1120
Ala Gly His Leu Val Lys Ala His Met Ala His Asn Arg Ser Ala Pro
1125 1130 1135
Ala Ser Ser Ala Pro Ser Arg Ser Val Ser Pro Ser Gly Gly Thr Arg
1140 1145 1150
Thr Val Pro Val Pro Asn Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr
1155 1160 1165
Asp Arg Ala Arg Arg
1170
<210> 51
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 51
gcaagctctg ctaccagcac 20
<210> 52
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 52
ctaggccaac ttcagagccg 20
<210> 53
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 53
agtcatgcag gatctgggtc 20
<210> 54
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 54
gcagacacat cggtgaagtc 20
<210> 55
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 55
aaaccgcacc tgtctattcc 20
<210> 56
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 56
ctttgtggtt ggatgcatac 20
<210> 57
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 57
cgctctatca tttcgaggac 20
<210> 58
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 58
tcaatagacg gcatggagac 20
<210> 59
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 59
atgtcagaac ctctaccccc 20
<210> 60
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 60
tcaagcatca gtctcaggca 20
<210> 61
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 61
atgtccctgc cgcatgcaac 20
<210> 62
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 62
ctaagcaata ttgtgtttct 20
Claims (41)
- 하기로 이루어진 군으로부터 선택되는 폴리뉴클레오티드:(a) 서열 번호 42의 아미노산 서열을 갖는 단백질을 코딩하는 폴리뉴클레오티드; 및(b) 서열 번호 41 의 뉴클레오티드로 이루어진 폴리뉴클레오티드.
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서, 서열 번호 37, 41, 43, 45, 47 또는 49로부터 선택된 하나 이상의 서열과 조합된 형태의 서열 번호 41의 폴리뉴클레오티드로 이루어진 폴리뉴클레오티드.
- 삭제
- 삭제
- 삭제
- 제1항 또는 제6항에 따른 폴리뉴클레오티드를 포함하는 벡터.
- 제10항에 있어서, 에스케리키아 콜라이 pSAKexpR SANK 72599 (FERM BP-7006)으로부터 얻을 수 있는 벡터.
- 제10항에 있어서, 발현성 벡터인 벡터.
- 제10항에 따른 벡터로 형질전환된 숙주 세포.
- 제13항에 있어서, ML-236B 생산 미생물인 것을 특징으로 하는 숙주 세포.
- 제14항에 있어서, 페니실륨 시트리눔 (Penicillium citrinum)인 것을 특징으로 하는 숙주 세포.
- 제13항에 있어서, 에스케리키아 콜라이인 것을 특징으로 하는 숙주 세포.
- 제16항에 있어서, 에스케리키아 콜라이 pSAKexpR SANK 72599 (FERM BP-7006)인 것을 특징으로 하는 숙주 세포.
- 제1항 또는 제6항에 따른 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드.
- ML-236B 생산 유기체에서 ML-236B 생산을 촉진할 수 있는, 서열 번호 42의 서열로 이루어진 폴리펩티드.
- 서열 번호 42의 서열로 이루어진 폴리펩티드.
- 제13항에 따른 숙주 세포를 배양하고, 이어서 배양물로부터 ML-236B를 회수하는 것을 포함하는, ML-236B의 생산 방법.
- 제21항에 있어서, 숙주 세포를 서열 번호 41 의 뉴클레오티드를 포함하는 벡터로 형질전환시키는 방법.
- 제22항에 있어서, 벡터가 서열 번호 37 의 폴리뉴클레오티드 서열을 포함하지 않는 방법.
- 제21항에 있어서, 생산이 서열 번호 38, 44, 46, 48 및/또는 50에 상응하는 아미노산 서열을 갖는 하나 이상의 재조합 폴리펩티드의 부재하에서 일어나는 방법.
- 제21항에 따른 방법을 실시하고, ML-236B를 프라바스타틴으로 전환시키는 것을 포함하는 프라바스타틴의 제조 방법.
- 제1항에 있어서, 서열 번호 38, 42, 44, 46, 48, 또는 50 의 아미노산 서열로 이루어진 단백질을 코딩하는 폴리뉴클레오티드와 결합하는 형태의 폴리뉴클레오티드.
- 제1항에 있어서, DNA 인 폴리뉴클레오티드.
- 제1항에 있어서, 게놈 DNA 인 폴리뉴클레오티드.
- 제1항에 있어서, cDNA 인 폴리뉴클레오티드.
- 제10항에 있어서, 서열 번호 37 의 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 추가로 포함하는 벡터.
- 제10항에 있어서, 서열 번호 43, 45, 47, 또는 49 서열로부터 선택되는 하나 이상의 폴리뉴클레오티드를 추가로 포함하는 벡터.
- 제10항에 있어서, 서열 번호 37, 43, 45, 47, 또는 49 의 폴리뉴클레오티드 서열을 포함하지 않는 벡터.
- 제10항에 있어서, 서열 번호 43, 45, 47, 또는 49 의 폴리뉴클레오티드 서열을 포함하지 않는 벡터.
- 제14항에 있어서, 숙주세포가 페니실륨 (Penicillium) 종인 것을 특징으로 하는 숙주세포.
- 제22항에 있어서, 벡터가 서열 번호 44, 46, 48 및/또는 50 의 아미노산 서열을 코딩하는 하나 이상의 폴리뉴클레오티드를 포함하지 않는 방법.
- 제21항에 있어서, 생산이 서열 번호 37, 43, 45, 47, 및/또는 49 에 상응하는 하나 이상의 cDNA 의 부재하에서 일어나는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-116591 | 2000-04-18 | ||
JP2000116591 | 2000-04-18 | ||
JP2000-117458 | 2000-04-19 | ||
JP2000117458 | 2000-04-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010098713A KR20010098713A (ko) | 2001-11-08 |
KR100632174B1 true KR100632174B1 (ko) | 2006-10-11 |
Family
ID=26590305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010020867A KR100632174B1 (ko) | 2000-04-18 | 2001-04-18 | 유전자 클러스터의 유전자 |
Country Status (24)
Country | Link |
---|---|
US (3) | US7056710B2 (ko) |
EP (1) | EP1149919B1 (ko) |
KR (1) | KR100632174B1 (ko) |
CN (1) | CN1325959B (ko) |
AR (1) | AR034550A1 (ko) |
AT (1) | ATE373101T1 (ko) |
AU (1) | AU783319B2 (ko) |
BR (1) | BR0101518A (ko) |
CA (1) | CA2342397C (ko) |
CY (1) | CY1106985T1 (ko) |
CZ (1) | CZ20011367A3 (ko) |
DE (1) | DE60130394T2 (ko) |
DK (1) | DK1149919T3 (ko) |
ES (1) | ES2293966T3 (ko) |
HK (1) | HK1037683A1 (ko) |
HU (1) | HUP0101569A3 (ko) |
IL (1) | IL142619A (ko) |
MX (1) | MXPA01003913A (ko) |
NO (1) | NO328653B1 (ko) |
NZ (1) | NZ511166A (ko) |
PL (1) | PL202457B1 (ko) |
PT (1) | PT1149919E (ko) |
RU (1) | RU2236463C2 (ko) |
TW (1) | TWI312807B (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2029750T3 (da) * | 2006-06-22 | 2011-10-17 | Dsm Ip Assets Bv | Fremstilling af pravastatin |
CN102171328A (zh) * | 2008-09-24 | 2011-08-31 | 帝斯曼知识产权资产管理有限公司 | 经改进的斯达汀生产 |
WO2010069914A1 (en) * | 2008-12-19 | 2010-06-24 | Dsm Ip Assets B.V. | Statin transcription regulators |
US20170088589A1 (en) * | 2014-04-23 | 2017-03-30 | Danmarks Tekniske Universitet | Statin resistance and export |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995012661A1 (en) * | 1993-11-02 | 1995-05-11 | Merck & Co., Inc. | Dna encoding triol polyketide synthase |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS572240A (en) | 1980-06-06 | 1982-01-07 | Sankyo Co Ltd | Ml-236b derivative |
US5179013A (en) | 1987-02-02 | 1993-01-12 | Sankyo Company, Limited | Cytochrome P-450 enzymes |
KR100186758B1 (ko) * | 1996-08-09 | 1999-04-01 | 영진약품공업 주식회사 | 프라바스타틴(pravastatin)전구체의제조방법 |
US6391583B1 (en) | 1998-12-18 | 2002-05-21 | Wisconsin Alumni Research Foundation | Method of producing antihypercholesterolemic agents |
AU6475800A (en) | 1999-08-11 | 2001-03-13 | Sankyo Company Limited | Ml-236b biosynthesis-associated dna |
FR2801648B1 (fr) * | 1999-11-30 | 2002-06-21 | Commissariat Energie Atomique | Injecteur a vapeur haute pression comportant un drain axial |
-
2001
- 2001-04-16 IL IL142619A patent/IL142619A/en not_active IP Right Cessation
- 2001-04-17 CA CA2342397A patent/CA2342397C/en not_active Expired - Fee Related
- 2001-04-17 CZ CZ20011367A patent/CZ20011367A3/cs unknown
- 2001-04-17 NO NO20011890A patent/NO328653B1/no not_active IP Right Cessation
- 2001-04-17 US US09/836,705 patent/US7056710B2/en not_active Expired - Fee Related
- 2001-04-17 RU RU2001110575/13A patent/RU2236463C2/ru not_active IP Right Cessation
- 2001-04-18 EP EP01303527A patent/EP1149919B1/en not_active Expired - Lifetime
- 2001-04-18 NZ NZ511166A patent/NZ511166A/xx unknown
- 2001-04-18 PT PT01303527T patent/PT1149919E/pt unknown
- 2001-04-18 DK DK01303527T patent/DK1149919T3/da active
- 2001-04-18 MX MXPA01003913A patent/MXPA01003913A/es active IP Right Grant
- 2001-04-18 BR BR0101518-4A patent/BR0101518A/pt not_active IP Right Cessation
- 2001-04-18 AU AU37092/01A patent/AU783319B2/en not_active Ceased
- 2001-04-18 PL PL347118A patent/PL202457B1/pl not_active IP Right Cessation
- 2001-04-18 AT AT01303527T patent/ATE373101T1/de not_active IP Right Cessation
- 2001-04-18 CN CN011196556A patent/CN1325959B/zh not_active Expired - Fee Related
- 2001-04-18 TW TW090109340A patent/TWI312807B/zh not_active IP Right Cessation
- 2001-04-18 DE DE60130394T patent/DE60130394T2/de not_active Expired - Lifetime
- 2001-04-18 AR ARP010101821A patent/AR034550A1/es active IP Right Grant
- 2001-04-18 ES ES01303527T patent/ES2293966T3/es not_active Expired - Lifetime
- 2001-04-18 KR KR1020010020867A patent/KR100632174B1/ko not_active IP Right Cessation
- 2001-04-18 HU HU0101569A patent/HUP0101569A3/hu unknown
- 2001-11-30 HK HK01108428A patent/HK1037683A1/xx not_active IP Right Cessation
-
2005
- 2005-05-11 US US11/127,939 patent/US20050214909A1/en not_active Abandoned
-
2006
- 2006-12-14 US US11/639,130 patent/US20070111293A1/en not_active Abandoned
-
2007
- 2007-11-08 CY CY20071101434T patent/CY1106985T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995012661A1 (en) * | 1993-11-02 | 1995-05-11 | Merck & Co., Inc. | Dna encoding triol polyketide synthase |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2574092C (en) | Dna coding for polypeptide participating in biosynthesis of pladienolide | |
JP2000515390A (ja) | 新規ポリケチド誘導体およびそれを製造するための組換え方法 | |
JPH09504436A (ja) | トリオールポリケチドシンターゼをコードするdna | |
JP2002505881A (ja) | スピノシン殺虫剤生産のための生合成遺伝子 | |
JP2006061166A (ja) | エポチロン生合成用遺伝子 | |
KR100632174B1 (ko) | 유전자 클러스터의 유전자 | |
US20090011476A1 (en) | Gene cluster and method for the biosynthesis of terrequinone a | |
US6632650B1 (en) | Genes involved in cyclododecanone degradation pathway | |
JP2001169780A (ja) | ドコサヘキサエン酸生産細菌の遺伝子 | |
US20030215930A1 (en) | Genes involved in cyclododecanone degradation pathway | |
JP2002315579A (ja) | 遺伝子クラスター上の構造遺伝子 | |
KR20130097538A (ko) | 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터 | |
JP5524053B2 (ja) | ハーボキシジエンの生合成に関与するポリペプチドをコードするdna | |
JP2001112487A (ja) | Ml−236b生合成関連dna | |
JP2003116567A (ja) | 遺伝子クラスター | |
WO2000055304A2 (en) | A chc biosynthetic gene cluster | |
JPH0646864A (ja) | イコサペンタエン酸合成酵素群をコードする遺伝子及びイコサペンタエン酸の製造方法 | |
WO2001012814A1 (fr) | Adn lie a la biosynthese ml-236b |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110811 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20120907 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |