KR101577839B1 - 이종 단백질의 제조 방법 - Google Patents
이종 단백질의 제조 방법 Download PDFInfo
- Publication number
- KR101577839B1 KR101577839B1 KR1020107002620A KR20107002620A KR101577839B1 KR 101577839 B1 KR101577839 B1 KR 101577839B1 KR 1020107002620 A KR1020107002620 A KR 1020107002620A KR 20107002620 A KR20107002620 A KR 20107002620A KR 101577839 B1 KR101577839 B1 KR 101577839B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- gly
- val
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01002—Alanine transaminase (2.6.1.2), i.e. alanine-aminotransferase
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Abstract
천연형 단백질 또는 재조합 단백질을 고생산량으로 제조할 수 있는 방법을 제공한다.
알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양하여, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.
알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양하여, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.
Description
본 발명은 이종(異種) 단백질의 제조 방법에 관한 것으로서, 보다 상세하게는, 알라닌아미노트랜스페라아제를 강(强)발현하는 세포를 사용하여 폴리펩티드를 제조하는 방법에 관한 것이다.
유전자 재조합 기술을 이용하여, 의약으로서 유용한 단백질을 생산할 때 동물 세포를 사용하면, 원핵 세포가 수행할 수 없는 복잡한 번역 후 수식이나 폴딩이 가능해지므로, 동물 세포는 재조합 단백질 생산을 위한 숙주 세포로서 다용되어 왔다.
최근, 항체나 생리 활성 단백질 등의 다양한 바이오 의약품이 배출되고 있는데, 재조합 단백질을 효율적으로 동물 세포에게 생산케 하는 기술은 바이오 의약품의 저비용화로 연결되어 환자에게 안정적인 공급을 약속하는 것이다.
따라서, 보다 생산 효율이 높은 단백질의 제조 방법이 요망되고 있다.
알라닌은 단백질 구성 아미노산 중 하나로, 비필수 아미노산이다. 생체 내에서는, 피루브산에 글루탐산의 아미노기가 전이됨으로써 생합성된다. 또, 역반응으로 분해된다.
알라닌의 분해 효소로서는, 알라닌아미노트랜스페라아제 (EC 2.6.1.2.)(비특허문헌 1) 가 알려져 있는데, 이 효소는 알라닌의 아미노기를 2-옥소글루타르산으로 전이시켜 글루탐산을 생성시킨다. 알라닌아미노트랜스페라아제는 글루타민-피루브산트랜스아미나아제라고도 불리고, GPT 로 약칭된다 (비특허문헌 2). GPT 는 GOP (아스파르트산아미노트랜스페라아제) 와 함께, 간장 중에 함유되는 효소로서, 간장의 세포가 파괴되면 혈액 중에 방출되기 때문에, GPT 와 GOT 가 이상(異常) 고가를 나타내는 경우에는 간장에 어떠한 장해가 있다고 진단된다.
이와 같이, 알라닌아미노트랜스페라아제는 간기능의 마커로서 이용되고 있는데, 알라닌아미노트랜스페라아제를 강발현한 CHO 세포 등의 숙주 세포가 어떤 거동을 나타내는지에 대해서는 알려지지 않았다.
Sanjay B. J., et. al., Hepatology (2004) 39(5), 1297-1302
Melanie M. S., et. al., Genomics (1997) 40, 247-252
본 발명은 천연형 단백질 또는 재조합 단백질을 높은 생산량으로 제조할 수 있는 방법을 제공하는 것을 목적으로 한다.
본 발명자들은 상기 과제를 해결하기 위해 예의 노력한 결과, 알라닌아미노트랜스페라아제 (이하, 「ALT」라고 기재하는 경우도 있다) 를 강발현하는 세포를 사용함으로써 원하는 폴리펩티드의 생산량을 증가시킬 수 있는 것을 알아내어, 본 발명을 완성시키기에 이르렀다. 또한, ALT 와 타우린 트랜스포터를 공(共)발현시키는 세포를 사용함으로써, 원하는 폴리펩티드의 생산량을 더욱 증가시킬 수 있었다. 세포 배양에서, 알라닌은 시간 경과적으로 다량 생성되므로, 세포 내에 축적된 알라닌은 배지 중에 분비된다. ALT 강발현에 의해, 알라닌으로부터 피루브산이나 글루탐산을 생합성시키는 반응을 촉진할 수 있으면, TCA 회로에서의 대사나, 당신생(糖新生)에 의한 글루코오스 생성에 이용되어, 세포의 배양 거동이 개선되고, 원하는 폴리펩티드의 고생산이 기대된다.
본 발명의 요지는 이하와 같다.
(1) 알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.
(2) 알라닌아미노트랜스페라아제를 강발현하는 세포가 알라닌아미노트랜스페라아제를 코드하는 DNA 를 도입한 세포인 (1) 기재된 제조 방법.
(3) 알라닌아미노트랜스페라아제를 강발현하는 세포가 추가로 타우린 트랜스포터를 강발현하는 (1) 또는 (2) 기재된 제조 방법.
(4) 타우린 트랜스포터를 강발현하는 세포가 타우린 트랜스포터를 코드하는 DNA 를 도입한 세포인 (3) 기재된 제조 방법.
(5) 세포가 차이니즈 햄스터 난소 세포인 (2) 또는 (4) 기재된 제조 방법.
(6) 원하는 폴리펩티드가 항체인 (1) ∼ (5) 중 어느 하나에 기재된 제조 방법.
(7) 알라닌아미노트랜스페라아제를 코드하는 DNA 가 이하의 (a) ∼ (e) 중 어느 하나인 (2) ∼ (6) 중 어느 하나에 기재된 제조 방법.
(a) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA
(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(d) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA
(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(8) (1) ∼ (7) 중 어느 하나에 기재된 방법으로 제조된 폴리펩티드를 함유하는 의약품을 제조하는 방법.
(9) 알라닌아미노트랜스페라아제를 코드하는 DNA 와 원하는 폴리펩티드를 코드하는 DNA 가 도입되어 있는 세포.
(10) 추가로 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 (9) 기재된 세포.
(11) 알라닌아미노트랜스페라아제를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 세포.
본 발명에 의해, 원하는 폴리펩티드의 생산량을 증가시킬 수 있게 되었다.
본 명세서는 본원 우선권의 기초인 일본 특허출원, 일본 특허출원 2007-205158 의 명세서 및/또는 도면에 기재되는 내용을 포함한다.
도 1 은 인간 ALT1 (496 아미노산) 을 발현시킨 Puromycin 선발용 플라스미드이다.
도 2 는 인간 ALT1 (496 아미노산) 을 발현시킨 Hygromycin 선발용 플라스미드이다.
도 3 은 50 ㎖ 쉐이커 플라스크 유가(流加) 배양 17 일째의 항(抗)글리피칸-3 항체 생성량 플롯이다. pPur-ALT1 도입 세포 (n = 4) 의 항글리피칸-3 항체 생성량은 pPur 도입 세포 (n = 3) 에 대해 우위였다 (P < 0.01).
도 4 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 1 ℓ Jar 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 19 일째의 A72 의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 이고 P41 보다 높았다.
도 5 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 생존률을 나타내는 그래프이다. 배양 후기에서의 A72 의 생존률은 P41 보다 높았다.
도 6 은 50 ㎖ 쉐이커 플라스크 유가 배양 4 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg-TauT/pPur-ALT1 공도입 세포 (n = 6) 의 항글리피칸-3 항체 생성량은 pHyg-TauT/pPur 공(共)도입 세포 (n = 8) 에 대해 우위였다 (P < 0.01).
도 7 은 TauT/ALT1 공발현주인 TA41 의 1 ℓ Jar 유가 배양의 항체 생성량을 나타내는 그래프이다. 배양 21 일째의 항글리피칸-3 항체 생성량은 5.3 g/ℓ 였다.
도 8 은 클로닝된 CHO 세포 유래 햄스터 타우린 트랜스포터 유전자의 염기 배열 및 아미노산 배열을 나타낸다.
도 9 는 신규로 클로닝한 CHO 세포 유래 타우린 트랜스포터막 토폴로지이다.
도 10 은 Hamster TauT (622 아미노산) 를 발현시킨 플라스미드이다.
도 11 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 생세포 밀도 플롯이다. pHyg/TauT 도입 세포의 생세포 밀도는 pHyg 도입 세포에 대해 우위였다.
도 12 는 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 락트산 생성량 플롯이다. pHyg/TauT 도입 세포는 저락트산 생성이고, pHyg 도입 세포에 대해 우위였다.
도 13 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 7 주 중 4 주는 pHyg 도입 세포의 최고값 이상의 항체 생성량을 갖고 있었다.
도 14 는 50 ㎖ 쉐이커 플라스크 유가 배양 7 일째의 항글리피칸 3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 항글리피칸-3 항체는 pHyg 도입 세포에 대해 우위였다.
도 15 는 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자(jar)에 의한 유가 배양에서의 생존률을 나타내는 그래프이다. T10 의 생존률은 배양 32 일째에도 80 % 이상이었다.
도 16 은 정치(靜置) 배양에서의 확대 과정에서 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자에 의한 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 35 일째의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 였다.
도 17 은 TauT 도입 T10 세포가 세포막 상에 TauT 분자를 발현시키고 있는 것을 나타내는 플로우 사이트 메트리의 분석 결과이다.
도 18 은 1 ℓ 자 유가 배양 중의 세포 내 암모니아 함량 (농도비) 을 나타내는 그래프이다. 친주에 대해, pHyg/TauT 도입주의 암모니아 억제는 현저하였다.
도 19 는 배지 중의 타우린 농도에 의존하여 타우린이 세포 내에 주입되어 있는 것을 나타내는 그래프이다. 타우린의 주입량은 pHyg/TauT 도입주와 친주에서 차는 확인되지 않았다.
도 20 은 배지 중의 글루타민 소비를 나타내는 그래프이다. pHyg/TauT 도입주는 친주에 대해, 배지 중의 타우린 농도에 의존하지 않아 세포당 글루타민 소비량이 현저하게 높았다.
도 21 은 pHyg/TauT 도입주의 항글리피칸-3 항체 생성량이 배양 개시시의 배지 중의 타우린 농도에 의존하지 않고, 동일한 정도인 것을 나타내는 그래프이다.
도 22 는 TauT/ALT 공발현주 TA41 의 쉐이커 fed-batch 배양 14 일째의 항글리피칸-3 항체 생성량을 나타낸다. -케토글루탈산 첨가에 의해 항체 생성량이 증가되었다.
도 2 는 인간 ALT1 (496 아미노산) 을 발현시킨 Hygromycin 선발용 플라스미드이다.
도 3 은 50 ㎖ 쉐이커 플라스크 유가(流加) 배양 17 일째의 항(抗)글리피칸-3 항체 생성량 플롯이다. pPur-ALT1 도입 세포 (n = 4) 의 항글리피칸-3 항체 생성량은 pPur 도입 세포 (n = 3) 에 대해 우위였다 (P < 0.01).
도 4 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 1 ℓ Jar 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 19 일째의 A72 의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 이고 P41 보다 높았다.
도 5 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 생존률을 나타내는 그래프이다. 배양 후기에서의 A72 의 생존률은 P41 보다 높았다.
도 6 은 50 ㎖ 쉐이커 플라스크 유가 배양 4 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg-TauT/pPur-ALT1 공도입 세포 (n = 6) 의 항글리피칸-3 항체 생성량은 pHyg-TauT/pPur 공(共)도입 세포 (n = 8) 에 대해 우위였다 (P < 0.01).
도 7 은 TauT/ALT1 공발현주인 TA41 의 1 ℓ Jar 유가 배양의 항체 생성량을 나타내는 그래프이다. 배양 21 일째의 항글리피칸-3 항체 생성량은 5.3 g/ℓ 였다.
도 8 은 클로닝된 CHO 세포 유래 햄스터 타우린 트랜스포터 유전자의 염기 배열 및 아미노산 배열을 나타낸다.
도 9 는 신규로 클로닝한 CHO 세포 유래 타우린 트랜스포터막 토폴로지이다.
도 10 은 Hamster TauT (622 아미노산) 를 발현시킨 플라스미드이다.
도 11 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 생세포 밀도 플롯이다. pHyg/TauT 도입 세포의 생세포 밀도는 pHyg 도입 세포에 대해 우위였다.
도 12 는 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 락트산 생성량 플롯이다. pHyg/TauT 도입 세포는 저락트산 생성이고, pHyg 도입 세포에 대해 우위였다.
도 13 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 7 주 중 4 주는 pHyg 도입 세포의 최고값 이상의 항체 생성량을 갖고 있었다.
도 14 는 50 ㎖ 쉐이커 플라스크 유가 배양 7 일째의 항글리피칸 3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 항글리피칸-3 항체는 pHyg 도입 세포에 대해 우위였다.
도 15 는 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자(jar)에 의한 유가 배양에서의 생존률을 나타내는 그래프이다. T10 의 생존률은 배양 32 일째에도 80 % 이상이었다.
도 16 은 정치(靜置) 배양에서의 확대 과정에서 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자에 의한 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 35 일째의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 였다.
도 17 은 TauT 도입 T10 세포가 세포막 상에 TauT 분자를 발현시키고 있는 것을 나타내는 플로우 사이트 메트리의 분석 결과이다.
도 18 은 1 ℓ 자 유가 배양 중의 세포 내 암모니아 함량 (농도비) 을 나타내는 그래프이다. 친주에 대해, pHyg/TauT 도입주의 암모니아 억제는 현저하였다.
도 19 는 배지 중의 타우린 농도에 의존하여 타우린이 세포 내에 주입되어 있는 것을 나타내는 그래프이다. 타우린의 주입량은 pHyg/TauT 도입주와 친주에서 차는 확인되지 않았다.
도 20 은 배지 중의 글루타민 소비를 나타내는 그래프이다. pHyg/TauT 도입주는 친주에 대해, 배지 중의 타우린 농도에 의존하지 않아 세포당 글루타민 소비량이 현저하게 높았다.
도 21 은 pHyg/TauT 도입주의 항글리피칸-3 항체 생성량이 배양 개시시의 배지 중의 타우린 농도에 의존하지 않고, 동일한 정도인 것을 나타내는 그래프이다.
도 22 는 TauT/ALT 공발현주 TA41 의 쉐이커 fed-batch 배양 14 일째의 항글리피칸-3 항체 생성량을 나타낸다. -케토글루탈산 첨가에 의해 항체 생성량이 증가되었다.
이하, 본 발명의 실시형태에 대해 보다 상세하게 설명한다.
본 발명은 ALT 를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법을 제공한다.
본 발명의 방법에서, 세포는 원하는 폴리펩티드를 생성할 수 있는 천연 세포이어도 되고, 원하는 폴리펩티드를 코드하는 DNA 를 도입한 형질 전환 세포이어도 되는데, 원하는 폴리펩티드를 코드하는 DNA 를 도입한 형질 전환 세포가 바람직하다.
본 발명의 방법에서, 원하는 폴리펩티드는 특별히 한정되지 않고, 항체 (예를 들어, 항 IL-6 리셉터 항체, 항 IL-6 항체, 항글리피칸-3 항체, 항 CD3 항체, 항 CD20 항체, 항 GPIIb/IIIa 항체, 항 TNF 항체, 항 CD25 항체, 항 EGFR 항체, 항 Her2/neu 항체, 항 RSV 항체, 항 CD33 항체, 항 CD52 항체, 항 IgE 항체, 항 CD11a 항체, 항 VEGF 항체, 항 VLA4 항체 등) 나 생리 활성 단백질 (과립구 콜로니 자극 인자 (G-CSF), 과립구 매크로파지 콜로니 자극 인자 (GM-CSF), 에리트로포이에틴, 인터페론, IL-1 이나 IL-6 등의 인터류킨, t-PA, 우로키나제, 혈청 알부민, 혈액 응고 인자, PTH 등) 등 어떠한 폴리펩티드이어도 되는데, 특히 항체가 바람직하다. 항체는, 천연 항체, Fab, scFv, sc(Fv)2 등의 저분자화 항체, 키메라 항체, 인간화 항체 등의 어떠한 항체이어도 된다.
ALT 를 강발현하는 세포를 사용함으로써 세포에 의한 폴리펩티드의 생성량을 증가시킬 수 있다.
ALT 는 본래, 알라닌의 아미노기를 2-옥소글루타르산으로 전이시키고, 글루탐산을 생성시키는 효소로서 알려져 있다. 본 발명자들은 CHO 세포 등의 숙주 세포 내에서 강발현함으로써 알라닌으로부터 피루브산이나 글루탐산을 생합성시키는 반응을 촉진할 수 있으면, TCA 회로에서의 대사나, 당신생에 의한 글루코오스 생성에 이용되어, 세포의 배양 거동이 개선되고, 원하는 폴리펩티드의 타카오산이 기대된다고 생각하였다.
ALT 를 강발현하는 세포는 천연 세포와 비교하여 ALT 의 발현량이 증가되어 있는 세포이면 특별히 한정되지 않는다. 천연 세포는 특별히 한정되지 않는데, 예를 들어 CHO 세포 등 재조합 단백질을 제조할 때 숙주로서 사용되고 있는 세포를 들 수 있다.
ALT 를 강발현하는 세포로서는, 예를 들어, ALT 유전자가 인위적으로 도입된 세포를 들 수 있다. ALT 유전자가 인위적으로 도입된 세포는 당업자에게 공지된 방법에 의해 제조할 수 있고, 예를 들어, ALT 유전자를 벡터에 삽입하고, 그 벡터를 세포에 형질 전환시킴으로써 제조할 수 있다. 또한, 본 명세서에서는 유전자 활성화 기술 (예를 들어, 국제 공개 제WO94/12650호 팜플렛 참조) 에 의해 내인성(內因性) ALT 유전자가 활성화되고, 그 결과, ALT 가 강발현된 세포도 ALT 유전자가 인위적으로 도입된 세포에 포함된다.
세포에 강발현하는 ALT 유전자로서는 어떠한 생물에서 유래하는 ALT 이어도 되며 특별히 한정되지 않는다. 구체적으로는, 인간, 마우스, 래트, 개, 아프리카 발톱 개구리, 초파리, 선충, 일본쌀, 원자 홍조, 빵 효모, 사상균 Ashbya gossypii, 진균 Candida albicans, 분열 효모, 진균 Aspergillus nidulans, 진균 Aspergillus fumigatus, 청주 누룩곰팡이 Aspergillus oryzae, 진균 Cryptococcus neoformans, 세포성 점균 Dictyostelium discoideum, Trypanosoma brucei, 세포 내 기생성 원충 Leishmania major, 적리 아메바 Entamoeba histolytica 또는 세포 내 기생성 원충 Trypanosoma cruzi 등의 ALT 가 공지되어 있었고, 이것들을 이용할 수 있는데, 인간, 설치류 혹은 숙주 세포와 동일한 종 유래의 ALT 인 것이 바람직하고, 예를 들어, ALT 를 강발현하는 세포가 차이니즈 햄스터 난소 세포 (CHO 세포) 인 경우에는, 인간 혹은 햄스터 유래의 ALT 인 것이 바람직하다. 인간, 마우스, 효모 등의 ALT 는 Variant (ALT1 과 ALT2) 가 존재한다. ALT2 는 ALT1 에 대해 아미노산 레벨로 80 % 이상의 상동성이 있다. 후술하는 실시예에서는 ALT1 을 강제 발현시켰다.
ALT 유전자로서는, 이하의 (a) ∼ (e) 중 어느 것의 DNA 를 들 수 있다.
(a) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA
(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 몇 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA
(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA
(d) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA
(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA
ALT 를 강발현하는 세포는 동물 세포, 식물 세포, 효모 등의 진핵 세포 ; 대장균, 고초균 등의 원핵 세포 등 어떤 세포이어도 되고, CHO 세포, COS 세포 등의 동물 세포가 바람직하고, 특히 CHO 세포가 바람직하다. 또, 원하는 폴리펩티드를 제조하기 위해서는, CHO dhfr-세포 등 원하는 유전자를 도입하는 데 적합한 세포인 것이 바람직하다.
ALT 를 강발현하는 세포는 원하는 폴리펩티드를 제조하기 위해, 추가로 타우린 트랜스포터를 강발현하고 있는 것이 바람직하다. 당해 세포에 원하는 폴리펩티드를 코드하는 유전자를 도입하고, 그 세포를 배지 내에서 배양시킴으로써, 보다 대량으로 원하는 폴리펩티드를 제조할 수 있다.
ALT 유전자가 인위적으로 도입된 세포를 사용하여 원하는 폴리펩티드를 제조하는 경우, ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자의 도입 순서는 특별히 제한되지 않아, ALT 유전자를 도입한 후에 원하는 폴리펩티드를 코드하는 유전자를 도입해도 되고, 원하는 폴리펩티드를 코드하는 유전자를 도입한 후에 ALT 유전자를 도입해도 된다. 또, ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자를 동시에 도입해도 된다.
ALT 유전자 및 원하는 폴리펩티드를 코드하는 유전자의 도입은 단일한 벡터에 의해 동시에 도입해도 되고, 복수의 벡터를 사용하여 각각 도입해도 된다.
ALT 외에 타우린 트랜스포터를 강발현하는 세포를 사용함으로써, 세포 내 암모니아 농도를 억제시킬 수 있다.
타우린 트랜스포터는 타우린, β-알라닌이나 각종 아미노산을 세포 내에 주입할 수 있는, 침투압 조절 기능을 갖는 막단백질이다.
타우린 트랜스포터를 강발현하는 세포는 천연 세포와 비교하여 타우린 트랜스포터의 발현량이 증가되어 있는 세포이면 특별히 한정되지 않는다. 천연 세포는 특별히 한정되지 않는데, 예를 들어 CHO 세포 등 재조합 단백질을 제조할 때 숙주로서 사용되고 있는 세포를 들 수 있다.
타우린 트랜스포터를 강발현하는 세포로서는, 예를 들어, 타우린 트랜스포터 유전자가 인위적으로 도입된 세포를 들 수 있다. 타우린 트랜스포터 유전자가 인위적으로 도입된 세포는 당업자에게 공지된 방법에 의해 제조할 수 있고, 예를 들어, 타우린 트랜스포터 유전자를 벡터에 삽입하고, 그 벡터를 세포에 형질 전환시킴으로써 제조할 수 있다.
세포에 강발현하는 타우린 트랜스포터 유전자로서는, 어떤 생물 유래의 타우린 트랜스포터이어도 되며 특별히 한정되지 않는다. 구체적으로는, 인간, 마우스, 래트, 햄스터 등 설치류 등의 생물 유래의 타우린 트랜스포터를 들 수 있고, 인간, 설치류 혹은 숙주 세포와 동일한 종 유래의 타우린 트랜스포터인 것이 바람직하고, 예를 들어, 타우린 트랜스포터를 강발현하는 세포가 차이니즈 햄스터 난소 세포 (CHO 세포) 인 경우에는, 인간 혹은 햄스터 유래의 타우린 트랜스포터인 것이 바람직하다.
타우린 트랜스포터 유전자로서는, 타우린 트랜스포터를 코드하는 이하의 (a1) ∼ (e1) 중 어느 하나의 DNA 를 들 수도 있다.
(a1) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA
(b1) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA
(c1) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA
(d1) 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA
(e1) 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA
원하는 폴리펩티드를 제조하려면, 타우린 트랜스포터와 ALT 유전자를 강발현하는 세포에 원하는 폴리펩티드를 코드하는 유전자를 도입하여, 그 세포를 배지 중에서 배양시킴으로써 제조할 수 있다. 또한, 본 명세서에서는 유전자 활성화 기술 (예를 들어, 국제공개 제WO94/12650호 팜플렛 참조) 에 의해, 그 세포의 내인성의 원하는 폴리펩티드를 코드하는 유전자가 활성화됨으로써, 원하는 폴리펩티드를 생성하는 세포를 사용하여, 원하는 폴리펩티드를 제조할 수도 있다.
타우린 트랜스포터 유전자와 ALT 유전자가 인위적으로 도입된 세포를 사용하여 원하는 폴리펩티드를 제조하는 경우, 타우린 트랜스포터 유전자와 ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자의 도입 순서는 특별히 제한되지 않아, 타우린 트랜스포터 유전자와 ALT 유전자를 도입한 후에 원하는 폴리펩티드를 코드하는 유전자를 도입해도 되고, 원하는 폴리펩티드를 코드하는 유전자를 도입한 후에 타우린 트랜스포터 유전자와 ALT 유전자를 도입해도 된다. 또, 타우린 트랜스포터 유전자와 ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자를 동시에 도입해도 된다.
타우린 트랜스포터 유전자, ALT 유전자 및 원하는 폴리펩티드를 코드하는 유전자의 도입은 단일한 벡터에 의해 동시에 도입해도 되고, 복수의 벡터를 사용하여 각각 도입해도 된다.
ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 의 배양에는, 통상적인 세포 (바람직하게는, 동물 세포) 배양에서 사용되고 있는 배지를 사용할 수 있다. 이들에는 통상적으로, 아미노산, 비타민류, 지질 인자, 에너지원, 침투압 조절제, 철원, pH 완충제를 함유한다. 이들 성분의 함량은 통상적으로 아미노산은 0.05 - 1500 ㎎/ℓ, 비타민류는 0.001 - 10 ㎎/ℓ, 지질 인자는 0 - 200 ㎎/ℓ, 에너지원은 1 - 20 g/ℓ, 침투압 조절제는 0.1 - 10000 ㎎/ℓ, 철원은 0.1 - 500 ㎎/ℓ, pH 완충제는 1 - 10000 ㎎/ℓ, 미량 금속 원소는 0.00001 - 200 ㎎/ℓ, 계면 활성제는 0 - 5000 ㎎/ℓ, 증식 보조 인자는 0.05 - 10000 ㎍/ℓ 및 뉴클레오시드는 0.001 - 50 ㎎/ℓ 의 범위가 적당한데, 이들에 한정되지 않고, 배양하는 세포의 종류, 원하는 폴리펩티드의 종류 등에 의해 적절히 결정할 수 있다.
상기 성분 외에, 예를 들어, 미량 금속 원소, 계면 활성제, 증식 보조 인자, 뉴클레오시드 등을 첨가해도 된다.
구체적으로는, 예를 들어, L-알라닌, L-알기닌, L-아스파라긴, L-아스파르트산, L-시스테인, L-시스틴, L-글루타민, L-글루탐산, 글리신, L-히스티딘, L-이로류신, L-류신, L-리신, L-메티오닌, L-오르니틴, L-페닐알라닌, L-프롤린, L-세린, L-트레오닌, L-트립토판, L-티로신, L-발린 등, 바람직하게는 L-알라닌, L-알기닌, L-아스파라긴, L-아스파르트산, L-시스틴, L-글루타민, L-글루탐산, 글리신, L-히스티딘, L-이로류신, L-류신, L-리신, L-메티오닌, L-페닐알라닌, L-프롤린, L-세린, L-트레오닌, L-트립토판, L-티로신, L-발린 등의 아미노산류 ; i-이노시톨, 비오틴, 엽산, 리포산, 니코틴아미드, 니코틴산, p-아미노벤조산, 판토텐산칼슘, 염산피리독살, 염산피리독신, 리보플라빈, 염산티아민, 비타민 B12, 아스코르브산 등, 바람직하게는 비오틴, 엽산, 리포산, 니코틴산아미드, 판토텐산칼슘, 염산피리독살, 리보플라빈, 염산티아민, 비타민 B12, 아스코르브산 등의 비타민류 ; 염화콜린, 타르타르산콜린, 리놀산, 올레산, 콜레스테롤 등, 바람직하게는 염화콜린 등의 지질 인자 ; 글루코오스, 갈락토오스, 만노오스, 푸룩토오스 등, 바람직하게는 글루코오스 등의 에너지원 ; 염화나트륨, 염화칼륨, 질산칼륨 등, 바람직하게는 염화나트륨 등의 침투압 조절제 ; EDTA 철, 시트르산 철, 염화 제 1 철, 염화 제 2 철, 황산 제 1 철, 황산 제 2 철, 질산 제 2 철 등, 바람직하게는 염화 제 2 철, EDTA 철, 시트르산 철 등의 철원류 ; 탄산수소나트륨, 염화칼슘, 인산 2 수소나트륨, HEPES, MOPS 등, 바람직하게는 탄산수소나트륨 등의 pH 완충제를 함유하는 배지를 예시할 수 있다.
상기 성분 외에, 예를 들어, 황산구리, 황산망간, 황산아연, 황산마그네슘, 염화니켈, 염화주석, 염화마그네슘, 아(亞)규산나트륨 등, 바람직하게는 황산구리, 황산아연, 황산마그네슘 등의 미량 금속 원소 ; Tween80, 플루로닉 F68 등의 계면 활성제 ; 및 재조합형 인슐린, 재조합형 IGF-1, 재조합형 EGF, 재조합형 FGF, 재조합형 PDGF, 재조합형 TGF-, 염산에탄올아민, 아(亞)셀렌산나트륨, 레티노인산, 염산프토렉신 등, 바람직하게는 아셀렌산나트륨, 염산에탄올아민, 재조합형 IGF-1, 염산프토렉신 등의 증식 보조 인자 ; 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 아데노신, 시티딘, 구아노신, 우리딘 등의 뉴클레오시드 등을 첨가해도 된다. 또한 상기 배지의 적합예에서는, 스트렙토마이신, 페니실린 G 칼륨 및 겐타마이신 등의 항생 물질이나, 페놀레드 등의 pH 지시약을 포함하고 있어도 된다.
또, 배지에는, ALT 의 기질이 되는 -케토글루탈산을 첨가해도 된다. -케토글루탈산의 첨가에 의해, 원하는 폴리펩티드 (예를 들어, 항체) 의 생성량이 증가될 수 있다. 이 때의 -케토글루탈산의 첨가량은 통상적으로 0.01 ∼ 1000 mM 의 범위이면 되고, 0.1 ∼ 100 m 가 바람직하고, 또한 1 ∼ 10 mM 가 바람직하다.
배지의 pH 는 배양하는 세포에 따라 상이한데, 일반적으로는 pH 6.8 ∼ 7.6, 대부분의 경우 pH 7.0 ∼ 7.4 가 적당하다.
배지는 시판되는 동물 세포 배양용 배지, 예를 들어, D-MEM (Dulbecco's Modified Eagle Medium), D-MEM/F-12 1 : 1 Mixture (Dulbecco's Modified Eagle Medium : Nutrient Mixture F-12), RPMI1640, CHO-S-SFM II (Invitrogen 사), CHO-SF (Sigma-Aldrich 사), EX-CELL 301 (JRH biosciences 사), IS CHO-V (Irvine Scientific 사), PF-ACF-CHO (Sigma-Aldrich 사) 등의 배지를 사용할 수도 있다.
또한, 배지는 무혈청 배지, 예를 들어, CD-CHO (Invitrogen 사) 이어도 된다.
ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 가 CHO 세포인 경우, CHO 세포의 배양은 당업자에게 공지된 방법을 사용하여 실시할 수 있다. 예를 들어, 통상적으로 기상의 CO2 농도가 0 - 40 %, 바람직하게는 2 - 10 % 의 분위기 하, 30 - 39 ℃, 바람직하게는 37 ℃ 정도로 배양할 수 있다.
또한 배양 세포에서 항체 등의 원하는 폴리펩티드를 생성하는 경우, 배양 후기에는 세포가 상당히 고밀도 상태 (대략 1 x 107 cells/㎖) 가 되고, 락트산 등 노폐물의 영향이 매우 높아진다. ALT 를 강발현하는 세포에 의해 원하는 폴리펩티드를 제조하면, 배양 후기에도 높은 생존률을 유지하여, 원하는 폴리펩티드의 생성량 향상에 대해서도 기대할 수 있다.
ALT 를 강발현하는 세포를 사용하여 원하는 폴리펩티드를 생성시키기 위해 적당한 배양 기간은 통상적으로 1 일 ∼ 3 개월이고, 바람직하게는 1 일 ∼ 2 개월, 더욱 바람직하게는 1 일 ∼ 1 개월이다.
또, 동물 세포 배양용 각종 배양 장치로서는, 예를 들어 발효조형 탱크 배양 장치, 에어리프트형 배양 장치, 컬쳐 플라스크형 배양 장치, 스피너 플라스크형 배양 장치, 마이크로 캐리어형 배양 장치, 유동층형 배양 장치, 호로파이버형 배양 장치, 롤러 보틀형 배양 장치, 충전조형 배양 장치 등을 사용하여 배양할 수 있다.
배양은 배치 배양 (batch culture), 유가 배양 (fed-batch culture), 연속 배양 (continuous culture) 등 중 어느 방법을 이용해도 되는데, 유가 배양 또는 연속 배양이 바람직하고, 유가 배양이 보다 바람직하다.
또한, ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 를 강발현하는 세포를 배양할 때에, 세포에 대한 타우린의 주입을 촉진시키기 위해 배지 중에 타우린을 첨가해도 된다. 배지에 첨가하는 타우린의 농도는 특별히 한정되지 않는데, 통상적으로 0 g/ℓ ∼ 100 g/ℓ, 바람직하게는 0 g/ℓ ∼ 20 g/ℓ, 더욱 바람직하게는 0 g/ℓ ∼ 10 g/ℓ 이다.
본 발명의 방법에 의해 제조된 폴리펩티드가 의약으로서 이용할 수 있는 생물학적 활성을 갖는 경우에는, 이 폴리펩티드를 의약적으로 허용되는 담체 또는 첨가제와 혼합하여 제제화시킴으로써 의약품을 제조할 수 있다.
의약적으로 허용되는 담체 및 첨가제의 예로서, 물, 의약적으로 허용되는 유기 용제, 콜라겐, 폴리비닐알코올, 폴리비닐피롤리돈, 카르복시비닐폴리머, 카르복시메틸셀룰로오스나트륨, 폴리아크릴산나트륨, 알긴산나트륨, 수용성 덱스트란, 카르복시메틸스타치나트륨, 펙틴, 메틸셀룰로오스, 에틸셀룰로오스, 잔탄검, 아라비아고무, 카세인, 한천, 폴리에틸렌글리콜, 디글리세린, 글리세린, 프로필렌글리콜, 바셀린, 파라핀, 스테아릴알코올, 스테아르산, 인간 혈청 알부민 (HSA), 만니톨, 소르비톨, 락토오스, 의약 첨가물로서 허용되는 계면 활성제 등을 들 수 있다.
실제 첨가물은 본 발명 치료제의 제형에 따라 상기 중에서 단독으로 또는 적절하게 조합하여 선택되는데, 물론 이들에 한정되는 것은 아니다. 예를 들어, 주사용 제제로서 사용하는 경우, 정제된 폴리펩티드를 용제, 예를 들어 생리 식염수, 완충액, 포도당 용액 등에 용해시키고, 이것에 흡착 방지제, 예를 들어 Tween80, Tween20, 젤라틴, 인간 혈청 알부민 등을 첨가한 것을 사용할 수 있다. 혹은, 사용 전에 용해 재구성하는 제형으로 하기 위해 동결 건조시킨 것이어도 되고, 동결 건조를 위한 부형제로서는, 예를 들어, 만니톨, 포도당 등의 당 알코올이나 당류를 사용할 수 있다.
폴리펩티드의 유효 투여량은 폴리펩티드의 종류, 치료나 예방의 대상으로 하는 질환의 종류, 환자의 연령, 질환의 중독도(重篤度) 등에 의해 적절히 선택된다. 예를 들어, 폴리펩티드가 항글리피칸 항체인 경우, 항글리피칸 항체의 유효 투여량은 1 회에 체중 1 kg 당 0.001 mg 내지 1000 mg 의 범위에서 선택된다. 혹은, 환자당 0.01 ∼ 100000 mg/body 의 투여량을 선택할 수 있다. 그러나, 이들의 투여량에 제한되는 것은 아니다.
폴리펩티드의 투여 방법은 경구, 비경구 투여 중 어느 것도 가능한데, 바람직하게는 비경구 투여이고, 구체적으로는 주사 (예를 들어, 정맥 내 주사, 근육 내 주사, 복강 내 주사, 피하 주사 등에 의한 전신 또는 국소 투여), 경비 투여, 경폐 투여, 경피 투여 등을 들 수 있다.
본 발명에서, ALT 를 코드하는 유전자로서 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA 를 사용하면 된다. 그 밖에도, 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.
배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드는 인간, 마우스, 래트, 개, 아프리카 발톱 개구리, 초파리, 선충, 일본쌀, 원자 홍조, 빵 효모, 사상균 Ashbya gossypii, 진균 Candida albicans, 분열 효모, 진균 Aspergillus nidulans, 진균 Aspergillus fumigatus, 청주 누룩곰팡이 Aspergillus oryzae, 진균 Cryptococcus neoformans, 세포성 점균 Dictyostelium discoideum, Trypanosoma brucei, 세포 내 기생성 원충 Leishmania major, 적리 아메바 Entamoeba histolytica 또는 세포 내 기생성 원충 Trypanosoma cruzi ALT (이하,「인간 등의 ALT」라고 기재하는 경우도 있다) 와 기능적으로 동등한 폴리펩티드이다. 이와 같은 폴리펩티드에는, 예를 들어, 인간 등의 ALT 의 변이체 등이 함유된다. 후술하는 실시예에서는, 공개되어 있는 인간 ALT1 유전자가 코드하고 있는 아미노산 496 개 중, 4 아미노산 (R53S, Q72R, F286S, M332K) 이 치환되어 있는 변이체가 사용되었다.
어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하기 위한, 당업자에게 잘 알려진 방법으로서는, 폴리펩티드에 변이를 도입하는 방법이 알려져 있다. 예를 들어, 당업자이면, 부위 특이적 변이 유발법 (Hashimoto-Gotoh, T. et al. (1995) Gene 152, 271-275, Zoller, MJ, and Smith, M.(1983) Methods Enzymol. 100, 468-500, Kramer, W. et al.(1984) Nucleic Acids Res. 12, 9441-9456, Kramer W, and Fritz HJ (1987) Methods. Enzymol. 154, 350-367, Kunkel, TA (1985) Proc Natl Acad Sci USA. 82, 488-492, Kunkel (1988) Methods Enzymol. 85, 2763-2766) 등을 이용하여, 인간 등의 ALT 아미노산에 적절히 변이를 도입함으로써 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 조제할 수 있다. 또, 아미노산의 변이는 자연계에서도 생길 수 있다.
인간 등의 ALT 와 기능적으로 동등한 폴리펩티드로서는, 구체적으로는 인간 등의 ALT 의 아미노산 배열 (예를 들어, 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60) 중의 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 결실된 것, 인간 등의 ALT 아미노산 배열에 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 부가된 것, 인간 등의 ALT 의 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 다른 아미노산으로 치환된 것 등을 들 수 있다.
변이되는 아미노산 잔기는 특별히 한정되지 않는데, 아미노산 측사슬의 성질이 보존되어 있는 다른 아미노산으로 변이되는 것이 바람직하다. 예를 들어 아미노산 측사슬의 성질로서는, 소수성 아미노산 (A, I, L, M, F, P, W, Y, V), 친수성 아미노산 (R, D, N, C, E, Q, G, H, K, S, T), 지방족 측사슬을 갖는 아미노산 (G, A, V, L, I, P), 수산기 함유 측사슬을 갖는 아미노산 (S, T, Y), 황원자 함유 측사슬을 갖는 아미노산 (C, M), 카르복실산 및 아미드 함유 측사슬을 갖는 아미노산 (D, N, E, Q), 염기 함유 측사슬을 갖는 아미노산 (R, K, H), 방향족 함유 측사슬을 갖는 아미노산 (H, F, Y, W) 을 들 수 있다 (괄호 내는 모두 아미노산의 1 문자 표기를 나타낸다).
또한, 어느 아미노산 배열에 대한 1 또는 복수개의 아미노산 잔기의 결실, 부가 및/또는 다른 아미노산에 의한 치환에 의해 수식된 아미노산 배열을 갖는 폴리펩티드가 그 생물학적 활성을 유지하는 것은 이미 알려져 있다 (Mark, D.F. et al., Proc. Natl. Acad. Sci. USA (1984)81, 5662-5666, Zoller, M.J. & Smith, M.Nucleic Acids Research (1982)10, 6487-6500, Wang, A. et al., Science 224, 1431-1433, Dalbadie-McFarland, G. et al., Proc. Natl. Acad. Sci. USA (1982)79, 6409-6413).
인간 등의 ALT 에 1 또는 복수개의 아미노산 잔기가 부가된 폴리펩티드로서는, 예를 들어, 인간 등의 ALT 를 함유하는 융합 폴리펩티드를 들 수 있다. 융합 폴리펩티드는 인간 등의 ALT 와 다른 폴리펩티드가 융합된 것이다. 융합 폴리펩티드를 제조하는 방법은 인간 등의 ALT 를 코드하는 유전자와 다른 폴리펩티드를 코드하는 유전자를 프레임이 일치하도록 연결하여 이것을 발현 벡터에 도입시켜 숙주로 발현시키면 되고, 당업자에게 공지된 수법을 사용할 수 있다. 인간 등의 ALT 와의 융합에 사용되는 다른 폴리펩티드로서는, 특별히 한정되지 않는다.
인간 등의 ALT 와의 융합에 사용되는 다른 펩티드로서는, 예를 들어, FLAG (Hopp, T.P. et al., BioTechnology (1988)6, 1204-1210), 6 개의 His (히스티딘) 잔기로 이루어지는 6×His, 10×His, 인플루엔자 응집소 (HA), 인간 c-myc 의 단편(斷片), VSV-GP 의 단편, p18HIV 의 단편, T7-tag, HSV-tag , E-tag , SV40T 항원의 단편, lck tag, -tubulin 의 단편, B-tag , Protein C 의 단편, GST (글루타티온-S-트랜스페라아제), HA (인플루엔자 응집소), 면역 글로불린 정상 영역, β-갈락토시다아제, MBP (말토오스 결합 폴리펩티드) 등을 들 수 있다.
시판되어 있는 이들 폴리펩티드를 코드하는 유전자를 인간 등의 ALT 를 코드하는 유전자와 융합시키고, 이로써 조제된 융합 유전자를 발현시킴으로써 융합 폴리펩티드를 조제할 수 있다.
또, 어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하는 당업자에게 잘 알려진 다른 방법으로서는, 하이브리다이제이션 기술 (Sambrook, J et al., Molecular Cloning 2nd ed., 9.47-9.58, Cold Spring Harbor Lab. press, 1989) 을 이용하는 방법을 들 수 있다. 즉, 당업자이면, 인간 등의 ALT 를 코드하는 DNA 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 DNA 배열) 혹은 그 일부를 기본으로, 이것과 상동성이 높은 DNA 를 단리시키고, 그 DNA 로부터 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 단리시키는 것도 통상적으로 실시할 수 있는 것이다.
인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 단리시키 위한 하이브리다이제이션의 조건으로서는, 당업자이면 적절히 선택할 수 있다. 하이브리다이제이션의 조건은 예를 들어 저(低)스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고(高)스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 낮출수록 높은 상동성을 갖는 DNA 뿐만 아니라, 낮은 상동성만 가지고 있는 DNA 까지도 포괄적으로 얻을 수 있다. 반대로, 온도를 높일수록, 높은 상동성을 갖는 DNA 만이 얻어지는 것을 기대할 수 있다. 단, 하이브리다이제이션의 스트린젠시에 영향을 미치는 요소로서는 온도 이외에도 염 농도 등 복수의 요소를 생각할 수 있고, 당업자이면 이들 요소를 적절히 선택하는 것으로 동일한 스트린젠시를 실현할 수 있다.
이들 하이브리다이제이션 기술에 의해 단리되는 DNA 가 코드하는 폴리펩티드는 인간 등의 ALT 와 아미노산 배열에서 70 % 이상의 동일성을 갖는 것이면 되는데, 통상적으로 인간 등의 ALT 와 아미노산 배열에서 높은 상동성을 갖는다. 높은 상동성이란, 통상적으로 97 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 폴리펩티드의 동일성을 결정하려면, 문헌 (Wilbur, W.J. and Lipman, D.J. Proc. Natl. Acad. Sci. USA (1983)80, 726-730) 에 기재된 알고리즘에 따르면 된다.
폴리펩티드는 후술하는 그것을 생성하는 세포나 숙주 혹은 정제 방법에 의해, 아미노산 배열, 분자량, 등전점 또는 당사슬의 유무나 형태 등이 상이할 수도 있다. 그러나, 얻어진 폴리펩티드가 인간 등의 ALT 와 동등한 기능을 갖고 있는 한, 그것을 코드하는 DNA 를 본 발명에서 이용할 수 있다. 예를 들어, 폴리펩티드를 원핵 세포, 예를 들어 대장균으로 발현시켰을 경우, 본래의 폴리펩티드의 아미노산 배열의 N 말단에 메티오닌 잔기가 부가된다. 또, 진핵 세포, 예를 들어 포유 동물 세포로 발현시켰을 경우, N 말단의 시그널 배열은 제거된다. 이와 같은 폴리펩티드를 코드하는 DNA 도 본 발명에서 이용할 수 있다.
폴리펩티드는 당업자에게 공지된 방법에 의해, 재조합 폴리펩티드로서 또 천연 폴리펩티드로서 조제할 수 있다. 재조합 폴리펩티드이면, 폴리펩티드를 코드하는 DNA 를, 적당한 발현 벡터에 삽입하고, 이것을 적당한 숙주 세포에 도입하여 얻은 형질 전환체를 회수하고, 추출물을 얻은 후, 이온 교환, 역상, 겔 여과 등의 크로마토그래피, 혹은 본 발명의 폴리펩티드에 대한 항체를 칼럼에 고정시킨 어피니티 크로마토그래피에 넣음으로써, 또는, 추가로 이들 칼럼을 복수 조합함으로써 정제시켜 조제할 수 있다.
또, 폴리펩티드를 글루타티온 S 트랜스페라아제 폴리펩티드와의 융합 폴리펩티드로서, 혹은 히스티딘을 복수 부가시킨 재조합 폴리펩티드로서 숙주 세포 (예를 들어, 동물 세포나 대장균 등) 내에서 발현시킨 경우에는, 발현시킨 재조합 폴리펩티드는 글루타티온 칼럼 혹은 니켈 칼럼을 사용하여 정제시킬 수 있다.
융합 폴리펩티드의 정제 후, 필요에 따라 융합 폴리펩티드 중 목적으로 하는 폴리펩티드 이외의 영역을, 트롬빈 또는 팩터 Xa 등에 의해 절단하여 제거할 수도 있다.
천연 폴리펩티드이면, 당업자에게 주지된 방법, 예를 들어, 인간 ALT 와 동등한 기능을 갖고 있는 폴리펩티드를 발현시키고 있는 조직이나 세포의 추출물에 대해, 인간 ALT 에 결합하는 항체가 결합된 어피니티 칼럼을 작용시켜 정제시킴으로써 단리할 수 있다. 항체는 폴리크로날 항체이어도 되고 모노크로날 항체이어도 된다.
본 발명에서, ALT 를 코드하는 DNA 로서 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 를 사용해도 된다. 그 밖에도, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.
ALT 를 코드하는 DNA 는 상기 서술한 원하는 폴리펩티드의 in vivo 나 in vitro 에서의 생산에 이용되는 것 외에, ALT 를 강발현하는 세포의 제조에 사용할 수 있다. ALT 를 코드하는 DNA 는 ALT 를 코드할 수 있는 것이면, 어떠한 형태이어도 된다. 즉, mRNA 로부터 합성된 cDNA 인지, 게놈 DNA 인지, 화학 합성 DNA 인지 등에 상관없다. 또, ALT 를 코드하는 DNA 를 코드할 수 있는 한, 유전 암호의 축중(縮重)에 기초하는 임의의 염기 배열을 갖는 DNA 가 함유된다.
ALT 를 코드하는 DNA 는 당업자에게 공지된 방법에 의해 조제할 수 있다. 예를 들어, ALT 를 발현시키고 있는 세포로부터 cDNA 라이브러리를 제조하고, ALT 의 DNA 의 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59) 의 일부를 프로브로 하고 하이브리다이제이션을 실시함으로써 조제할 수 있다. cDNA 라이브러리는 예를 들어 Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989) 에 기재된 방법에 의해 조제해도 되고, 시판되는 유전자 라이브러리를 사용해도 된다. 또, ALT 를 발현시키고 있는 세포로부터 RNA 를 조제하고, ALT 의 DNA 의 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59) 에 기초하여 올리고 DNA 를 합성하고, 이것을 프라이머로서 사용하여 PCR 반응을 실시하고, ALT 를 코드하는 cDNA 를 증폭시킴으로써 조제할 수도 있다.
또, 얻어진 cDNA 의 염기 배열을 결정함으로써, 그것이 코드하는 번역 영역을 결정할 수 있어, ALT 의 아미노산 배열을 얻을 수 있다. 또, 얻어진 cDNA 를 프로브로서 게놈 DNA 라이브러리를 스크리닝함으로써 게놈 DNA 를 단리할 수 있다.
구체적으로는, 다음과 같이 하면 된다. 먼저, ALT 를 발현시키는 세포, 조직 등에서 mRNA 를 단리시킨다. mRNA 의 단리는, 공지된 방법, 예를 들어, 구아니딘 초원심법 (Chirgwin, J.M. et al., Biochemistry (1979)18, 5294-5299), AGPC 법 (Chomczynski, P. and Sacchi, N., Anal. Biochem. (1987)162, 156-159) 등에 의해 전체 RNA 를 조제하고, mRNA Purification Kit (Pharmacia) 등을 사용하여 전체 RNA 로부터 mRNA 를 정제시킨다. 또, QuickPrep mRNA Purification Kit (Pharmacia) 를 사용함으로써 mRNA 를 직접 조제할 수도 있다.
얻어진 mRNA 로부터 역전사 효소를 사용하여 cDNA 를 합성한다. cDNA 의 합성은, AMV Reverse Transcriptase First-strand cDNA Synthesis Kit (생화학 공업) 등을 사용하여 실시할 수도 있다. 또, 프라이머 등을 사용하여 5'-Ampli FINDER RACE Kit (Clontech 제) 및 폴리머라아제 연쇄 반응 (polymerase chain reaction ; PCR) 을 사용한 5'-RACE 법 (Frohman, M.A. et al., Proc. Natl. Acad. Sci. U.S.A. (1988)85, 8998-9002 ; Belyavsky, A. et al., Nucleic Acids Res. (1989)17, 2919-2932) 에 따라, cDNA 의 합성 및 증폭을 실시할 수 있다.
얻어진 PCR 산물로부터 목적으로 하는 DNA 단편을 조제하여 벡터 DNA 와 연결한다. 또한, 이것으로 재조합 벡터를 제조하고, 대장균 등에 도입하여 콜로니를 선택하고 원하는 재조합 벡터를 조제한다. 목적으로 하는 DNA 의 염기 배열은 공지된 방법, 예를 들어, 디데옥시뉴클레오티드체인터미네이션법에 의해 확인할 수 있다.
또, ALT 를 코드하는 DNA 에서는, 발현에 사용하는 숙주의 코돈 사용 빈도를 고려하고, 보다 발현 효율이 높은 염기 배열을 설계할 수 있다 (Grantham, R. et al., Nucelic Acids Research (1981)9, r43-74). 또, ALT 를 코드하는 DNA 는 시판되는 키트나 공지된 방법에 의해 개변시킬 수 있다. 개변으로서는, 예를 들어, 제한 효소에 의한 소화, 합성 올리고 뉴클레오티드나 적당한 DNA 프래그먼트의 삽입, 링커의 부가, 개시 코돈 (ATG) 및/또는 종지 코돈 (TAA, TGA, 또는 TAG) 의 삽입 등을 들 수 있다.
ALT 를 코드하는 DNA 는 또한, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하는 DNA 이고, 또한 ALT 와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 함유한다.
스트린젠트한 조건으로서는, 당업자이면 적절히 선택할 수 있는데, 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 높일수록 높은 상동성을 갖는 DNA 를 얻을 수 있다. 상기의 하이브리다이즈하는 DNA 는 바람직하게는 천연 유래의 DNA, 예를 들어 cDNA 또는 염색체 DNA 이어도 된다.
이들 하이브리다이제이션 기술에 의해 단리되는 DNA 는 통상적으로 인간 등의 ALT 를 코드하는 DNA 와 염기 배열에서 높은 동일성을 갖는다. ALT 를 코드하는 DNA 에는, 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 코드하고, 인간 등의 ALT 를 코드하는 DNA 와 높은 동일성을 갖는 DNA 도 포함된다. 높은 동일성이란, 통상적으로 96 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 염기 배열의 동일성은 Karlin and Altschul 에 의한 알고리즘 BLAST (Proc. Natl. Acad. Sci. USA 90 : 5873-5877, 1993) 에 의해 결정할 수 있다. 이 알고리즘에 기초하여, BLASTN 나 BLASTX 로 불리는 프로그램이 개발되어 있다 (Altschul et al. J. Mol. Biol. 215 : 403-410, 1990). BLAST 에 기초하여 BLASTN 에 의해 염기 배열을 해석하는 경우에는, 파라미터는 예를 들어 score = 100, wordlength = 12 로 한다. 이들 해석 방법의 구체적인 수법은 공지된 것이다 (http://www.ncbi.nlm.nih. gov.). ALT 를 코드하는 DNA 는 벡터에 삽입되면 된다.
벡터로서는, 예를 들어, 대장균을 숙주로 하는 경우에는, 벡터를 대장균 (예를 들어, JM109, DH5, HB101, XL1Blue) 등으로 대량으로 증폭시켜 대량 조제하기 위해, 대장균으로 증폭되기 위한 「ori」를 갖고, 추가로 형질 전환된 대장균의 선발 유전자 (예를 들어, 어떠한 약제 (암피실린이나 테트라시클린, 카나마이신, 클로람페니콜) 에 의해 판별할 수 있는 약제 내성 유전자) 를 갖는 것이 바람직하다. 벡터의 예로서는, M13 계 벡터, pUC 계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또, cDNA 의 서브 클로닝, 절단을 목적으로 했을 경우, 상기 벡터 외에, 예를 들어, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 원하는 폴리펩티드를 생산하는 목적으로 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로서는, 예를 들어, 대장균에서의 발현을 목적으로 한 경우에는, 벡터가 대장균으로 증폭되는 상기 특징을 갖는 것 외에, 숙주를 JM109, DH5, HB101, XL1-Blue 등의 대장균으로 했을 경우에는, 대장균으로 효율적으로 발현시킬 수 있는 프로모터, 예를 들어, lacZ 프로모터 (Ward 등, Nature (1989)341, 544-546 ; FASEB J.(1992)6, 2422-2427), araB 프로모터 (Better 등, Science (1988)240, 1041-1043), 또는 T7 프로모터 등을 갖고 있는 것이 바람직하다. 이와 같은 벡터로서는, 상기 벡터 외에 pGEX-5X-1 (Pharmacia 사 제조), 「QIAexpress system」(Qiagen 사 제조), pEGFP, 또는 pET (이 경우, 숙주는 T7 RNA 폴리메라제를 발현시키고 있는 BL21 이 바람직하다) 등을 들 수 있다.
또, 벡터에는, 폴리펩티드 분비를 위한 시그널 배열이 포함되어 있어도 된다. 폴리펩티드 분비를 위한 시그널 배열로서는, 대장균의 페리프라즘에 생성시키는 경우, pelB 시그널 배열 (Lei, S.P. et al J. Bacteriol. (1987)169, 4379) 을 사용하면 된다. 숙주 세포로의 벡터의 도입은 예를 들어 염화칼슘법, 일렉트로포레이션법을 이용하여 실시할 수 있다.
대장균을 숙주로 하는 경우 이외에도, 예를 들어, 원하는 폴리펩티드를 제조하기 위해 사용되는 벡터로서는, 포유 동물 유래의 발현 벡터 (예를 들어, pcDNA3 (Invitrogen 사 제조) 나, pEGF-BOS (Nucleic Acids. Res. 1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터 (예를 들어 「Bac-to-BAC baculovairus expression system」(GIBCO BRL 사 제조), pBacPAK8), 식물 유래의 발현 벡터 (예를 들어 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터 (예를 들어, pHSV, pMV, pAdexLcw), 레토로 바이러스 유래의 발현 벡터 (예를 들어, pZIpneo), 효모 유래의 발현 벡터 (예를 들어, 「Pichia Expression Kit」(Invitrogen 사 제조), pNV11, SP-Q01), 고초균 유래의 발현 벡터 (예를 들어, pPL608, pKTH50) 등을 들 수 있다.
CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포 내에서 발현시키기 위해 필요한 프로모터, 예를 들어 SV40 프로모터 (Mulligan 등, Nature (1979)277, 108), MMLV-LTR 프로모터, EF1 프로모터 (Mizushima 등, Nucleic Acids Res.(1990)18, 5322), CMV 프로모터 등을 갖고 있는 것이 바람직하고, 세포에 대한 형질 전환을 선발하기 위한 유전자 (예를 들어, 약제 (네오마이신, G418 등) 에 의해 판별할 수 있는 약제 내성 유전자) 를 가지면 더욱 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들어, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.
또한, 유전자를 안정적으로 발현시키고, 또한, 세포 내에서의 유전자의 카피수의 증폭을 목적으로 하는 경우에는, 핵산 합성 경로를 결손한 CHO 세포에 그것을 상보하는 DHFR 유전자를 갖는 벡터 (예를 들어, pCHOI 등) 를 도입하고, 메토트렉사이트 (MTX) 에 의해 증폭시키는 방법을 들 수 있고, 또, 유전자의 일과성 발현을 목적으로 하는 경우에는, SV40 T 항원을 발현시키는 유전자를 염색체 상에 갖는 COS 세포를 사용하여 SV40 의 복제 기점을 갖는 벡터 (pcD 등) 로 형질 전환시키는 방법을 들 수 있다. 복제 개시점으로서는, 또한, 폴리오마 바이러스, 아데노 바이러스, 소 파피로마 바이러스 (BPV) 등 유래의 것을 사용할 수 있다. 또한, 숙주 세포계에서 유전자 카피 수 증폭을 위해, 발현 벡터는 선택 마커로서 아미노글리코시드트랜스페라아제 (APH) 유전자, 티미딘키나제 (TK) 유전자, 대장균 크산틴구아닌포스포리보실트랜스페라아제 (Ecogpt) 유전자, 디히드로엽산 환원 효소 (dhfr) 유전자 등을 함유할 수 있다.
ALT 를 코드하는 DNA (벡터에 삽입되어 있어도 된다) 가 도입되는 숙주 세포로서는 특별히 제한은 없고, 예를 들어, 대장균이나 여러 가지 동물 세포 등을 사용할 수 있다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에 원하는 폴리펩티드를 코드하는 DNA 를 도입하면, 이 숙주 세포는 ALT 를 강발현할 수 있고, 원하는 폴리펩티드의 생산을 증가시킬 수 있다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에는, 타우린 트랜스포터를 코드하는 DNA (벡터에 삽입되어 있어도 된다) 가 추가로 도입되어도 된다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에 원하는 폴리펩티드를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 를 도입함으로써, 원하는 폴리펩티드의 생성량을 향상시킬 수 있다. 폴리펩티드 제조를 위한 생성계는 in vitro 및 in vivo 의 생성계가 있다. in vitro 의 생성계로서는, 진핵 세포를 사용하는 생성계나 원핵 세포를 사용하는 생성계를 들 수 있다.
본 발명에서, 타우린 트랜스포터를 코드하는 DNA 로서, 배열 번호 62, 64, 66 또는 68 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA 를 사용하면 된다. 그 밖에도, 배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.
배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드는, 햄스터, 래트, 마우스 및 인간 타우린 트랜스포터 (이하, 「햄스터 등의 타우린 트랜스포터」라고 기재하는 경우도 있다) 와 기능적으로 동등한 폴리펩티드이다. 이와 같은 폴리펩티드에는, 예를 들어, 햄스터 등의 타우린 트랜스포터의 변이체 등이 포함된다.
어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하기 위한, 당업자에게 잘 알려진 방법으로는, 폴리펩티드에 변이를 도입하는 방법이 알려져 있다. 예를 들어, 당업자이면, 부위 특이적 변이 유발법 (Hashimoto-Gotoh, T. et al. (1995) Gene 152, 271-275, Zoller, MJ, and Smith, M. (1983) Methods Enzymol. 100, 468-500, Kramer, W. et al. (1984) Nucleic Acids Res. 12, 9441-9456, Kramer W, and Fritz HJ (1987) Methods. Enzymol. 154, 350-367, Kunkel, TA (1985) Proc Natl Acad Sci USA. 82, 488-492, Kunkel (1988) Methods Enzymol. 85, 2763-2766) 등을 사용하고, 햄스터 등의 타우린 트랜스포터의 아미노산에 적절히 변이를 도입함으로써 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 조제할 수 있다. 또, 아미노산의 변이는 자연계에서도 발생될 수 있다.
햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드로서는, 구체적으로는 햄스터 등의 타우린 트랜스포터의 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 결실된 것, 햄스터 등의 타우린 트랜스포터 아미노산 배열에 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 부가된 것, 햄스터 등의 타우린 트랜스포터 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 다른 아미노산으로 치환된 것 등을 들 수 있다.
변이되는 아미노산 잔기는 특별히 한정되지 않는데, 아미노산 측사슬의 성질이 보존되어 있는 다른 아미노산에 변이되는 것이 바람직하다. 예를 들어 아미노산 측사슬의 성질로는, 소수성 아미노산 (A, I, L, M, F, P, W, Y, V), 친수성 아미노산 (R, D, N, C, E, Q, G, H, K, S, T), 지방족 측사슬을 갖는 아미노산 (G, A, V, L, I, P), 수산기 함유 측사슬을 갖는 아미노산 (S, T, Y), 황원자 함유 측사슬을 갖는 아미노산 (C, M), 카르복실산 및 아미드 함유 측사슬을 갖는 아미노산 (D, N, E, Q), 염기 함유 측사슬을 갖는 아미노산 (R, K, H), 방향족 함유 측사슬을 갖는 아미노산 (H, F, Y, W) 을 들 수 있다 (괄호 내에는 모두 아미노산의 1 문자 표기를 나타낸다).
햄스터 등의 타우린 트랜스포터에 1 또는 복수개의 아미노산 잔기가 부가된 폴리펩티드로는, 예를 들어, 햄스터 등의 타우린 트랜스포터를 함유하는 융합 폴리펩티드를 들 수 있다. 융합 폴리펩티드는 햄스터 등의 타우린 트랜스포터와 다른 폴리펩티드가 융합된 것으로, 본 발명에 포함된다. 융합 폴리펩티드를 제조하는 방법은 햄스터 등의 타우린 트랜스포터를 코드하는 유전자와 다른 폴리펩티드를 코드하는 유전자를 프레임이 일치하도록 연결하고 이것을 발현 벡터에 도입하여 숙주로 발현시키면 되고, 당업자에게 공지된 수법을 사용할 수 있다. 햄스터 등의 타우린 트랜스포터와의 융합에 사용되는 다른 폴리펩티드로서는, 특별히 한정되지 않는다.
햄스터 등의 타우린 트랜스포터와의 융합에 사용되는 다른 펩티드로는, 예를 들어, FLAG (Hopp, T.P. et al., BioTechnology (1988)6, 1204-1210), 6 개의 His (히스티딘) 잔기로 이루어지는 6×His, 10×His, 인플루엔자 응집소 (HA), 인간 c-myc 의 단편, VSV-GP 의 단편, p18HIV 의 단편, T7-tag, HSV-tag, E-tag, SV40T 항원의 단편, lck tag, -tubulin 의 단편, B-tag, Protein C 의 단편, GST (글루타티온-S-트랜스페라아제), HA (인플루엔자 응집소), 면역 글로불린 정상 영역, β-갈락토시다아제, MBP (말토오스 결합 폴리펩티드) 등을 들 수 있다.
시판되는 이들 폴리펩티드를 코드하는 유전자를 햄스터 등의 타우린 트랜스포터를 코드하는 유전자와 융합시키고, 이로써 조제된 융합 유전자를 발현시킴으로써 융합 폴리펩티드를 조제할 수 있다.
또, 어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하는 당업자에게 잘 알려진 다른 방법으로는, 하이브리다이제이션 기술 (Sambrook, J et al., Molecular Cloning 2nd ed., 9.47-9.58, Cold Spring Harbor Lab. press, 1989) 을 이용하는 방법을 들 수 있다. 즉, 당업자이면, 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 배열 혹은 그 일부를 기본으로, 이것과 상동성이 높은 DNA 를 단리시키고, 그 DNA 로부터 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 단리시키는 것도 통상적으로 실시할 수 있는 것이다.
햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 단리시키기 위한 하이브리다이제이션의 조건으로는, 당업자이면 적절히 선택할 수 있다. 하이브리다이제이션의 조건은 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는, 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 낮출수록 높은 상동성을 갖는 DNA 뿐만 아니라, 낮은 상동성만 갖는 DNA 까지도 포괄적으로 얻을 수 있다. 반대로, 온도를 높일수록 높은 상동성을 갖는 DNA 만이 얻어지는 것을 기대할 수 있다. 단, 하이브리다이제이션의 스트린젠시에 영향을 미치는 요소로서는 온도 이외에도 염 농도 등 복수의 요소를 생각할 수 있고, 당업자이면 이들 요소를 적절히 선택함으로써 동일한 스트린젠시를 실현할 수 있다.
이들 하이브리다이제이션 기술에 의해 단리되는 DNA 가 코드하는 폴리펩티드는 햄스터 등의 타우린 트랜스포터와 아미노산 배열에서 70 % 이상의 동일성을 갖는 것이면 되고, 통상적으로 햄스터 등의 타우린 트랜스포터와 아미노산 배열에서 높은 상동성을 갖는다. 상기 폴리펩티드에는, 본 발명의 햄스터 타우린 트랜스포터와 기능적으로 동등하고, 햄스터 등의 타우린 트랜스포터 아미노산 배열과 높은 상동성을 갖는 폴리펩티드도 포함된다. 높은 상동성이란, 통상적으로 97 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 폴리펩티드의 동일성을 결정하려면, 문헌 (Wilbur, W.J. and Lipman, D.J. Proc. Natl. Acad. Sci. USA (1983)80, 726-730) 에 기재된 알고리즘에 따르면 된다.
폴리펩티드는 후술하는 그것을 생성하는 세포나 숙주 혹은 정제 방법에 의해, 아미노산 배열, 분자량, 등전점 또는 당사슬의 유무나 형태 등이 상이할 수도 있다. 그러나, 얻어진 폴리펩티드가 햄스터 등의 타우린 트랜스포터와 동등한 기능을 갖고 있는 한, 그것을 코드하는 DNA 를 본 발명에서 사용할 수 있다. 예를 들어, 폴리펩티드를 원핵 세포, 예를 들어 대장균으로 발현시켰을 경우, 본래의 폴리펩티드의 아미노산 배열의 N 말단에 메티오닌 잔기가 부가된다. 또, 진핵 세포, 예를 들어 포유 동물 세포로 발현시켰을 경우, N 말단의 시그널 배열은 제거된다. 이와 같은 폴리펩티드를 코드하는 DNA 도 본 발명에서 사용할 수 있다.
폴리펩티드는 당업자에게 공지된 방법에 의해, 재조합 폴리펩티드로서 또 천연의 폴리펩티드로서 조제할 수 있다. 재조합 폴리펩티드이면, 폴리펩티드를 코드하는 DNA 를 적당한 발현 벡터에 삽입하고, 이것을 적당한 숙주 세포에 도입하여 얻은 형질 전환체를 회수하여 추출물을 얻은 후, 이온 교환, 역상, 겔 여과 등의 크로마토그래피, 혹은 상기 폴리펩티드에 대한 항체를 칼럼에 고정시킨 어피니티 크로마토그래피에 넣음으로써, 또는, 추가로 이들 칼럼을 복수 조합함으로써 정제시켜 조제할 수 있다.
또, 폴리펩티드를 글루타티온 S 트랜스페라아제 폴리펩티드와의 융합 폴리펩티드로서 혹은 히스티딘을 복수 부가시킨 재조합 폴리펩티드로서 숙주 세포 (예를 들어, 동물 세포나 대장균 등) 내에서 발현시킨 경우에는, 발현시킨 재조합 폴리펩티드는 글루타티온 칼럼 혹은 니켈 칼럼을 사용하여 정제시킬 수 있다.
융합 폴리펩티드의 정제 후, 필요에 따라 융합 폴리펩티드 중 목적으로 하는 폴리펩티드 이외의 영역을 트롬빈 또는 팩터 Xa 등에 의해 절단하여 제거할 수도 있다.
천연 폴리펩티드이면, 당업자에게 주지된 방법, 예를 들어, 폴리펩티드를 발현시키고 있는 조직이나 세포의 추출물에 대해, 햄스터 등의 타우린 트랜스포터에 결합하는 항체가 결합된 어피니티 칼럼을 작용시켜 정제시킴으로써 단리시킬 수 있다. 항체는 폴리크로날 항체이어도 되고 모노클로날 항체이어도 된다.
본 발명에서, 타우린 트랜스포터를 코드하는 DNA 로서, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 를 사용해도 된다. 그 밖에도, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.
타우린 트랜스포터를 코드하는 DNA 는 상기 서술한 원하는 폴리펩티드의 in vivo 나 in vitro 에서의 생산에 이용되는 것 외에, 타우린 트랜스포터를 강발현하는 세포의 제조에 사용할 수 있다. 타우린 트랜스포터를 코드하는 DNA 는 타우린 트랜스포터를 코드할 수 있는 것이면 어떠한 형태이어도 된다. 즉, mRNA 로부터 합성된 cDNA 인지, 게놈 DNA 인지, 화학 합성 DNA 인지 등에 상관없다. 또, 타우린 트랜스포터를 코드할 수 있는 한, 유전 암호의 축중에 기초하는 임의의 염기 배열을 갖는 DNA 가 함유된다.
타우린 트랜스포터를 코드하는 DNA 는 당업자에게 공지된 방법에 의해 조제할 수 있다. 예를 들어, 타우린 트랜스포터를 발현시키고 있는 세포로부터 cDNA 라이브러리를 제조하고, 타우린 트랜스포터를 코드하는 DNA 의 배열 (예를 들어, 배열 번호 61, 63, 65 또는 67) 의 일부를 프로브로 하고 하이브리다이제이션을 실시함으로써 조제할 수 있다. cDNA 라이브러리는 예를 들어 Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989) 에 기재된 방법에 의해 조제해도 되고, 시판되는 유전자 라이브러리를 사용해도 된다. 또, 타우린 트랜스포터를 발현시키고 있는 세포로부터 RNA 를 조제하고, 타우린 트랜스포터의 DNA 의 배열 (예를 들어, 배열 번호 61, 63, 65 또는 67) 에 기초하여 올리고 DNA 를 합성하고, 이것을 프라이머로서 사용하여 PCR 반응을 실시하고, 타우린 트랜스포터를 코드하는 cDNA 를 증폭시킴으로써 조제할 수도 있다.
또, 얻어진 cDNA 의 염기 배열을 결정함으로써, 그것이 코드하는 번역 영역을 결정할 수 있고, 타우린 트랜스포터의 아미노산 배열을 얻을 수 있다. 또, 얻어진 cDNA 를 프로브로서 게놈 DNA 라이브러리를 스크리닝함으로써, 게놈 DNA 를 단리시킬 수 있다.
구체적으로는, 다음과 같이 하면 된다. 먼저, 타우린 트랜스포터를 발현시키는 세포, 조직 등에서 mRNA 를 단리시킨다. mRNA 의 단리는 공지된 방법, 예를 들어, 구아니딘 초원심법 (Chirgwin, J.M. et al., Biochemistry (1979)18, 5294-5299), AGPC 법 (Chomczynski, P. and Sacchi, N., Anal.Biochem.(1987)162, 156-159) 등에 의해 전체 RNA 를 조제하고, mRNA Purification Kit (Pharmacia) 등을 사용하여 전체 RNA 로부터 mRNA 를 정제시킨다. 또, QuickPrep mRNA Purification Kit (Pharmacia) 를 사용함으로써 mRNA 를 직접 조제할 수도 있다.
얻어진 mRNA 로부터 역전사 효소를 사용하여 cDNA 를 합성한다. cDNA 의 합성은 AMV Reverse Transcriptase First-strand cDNA Synthesis Kit (생화학 공업) 등을 사용하여 실시할 수도 있다. 또, 프라이머 등을 사용하여, 5'-Ampli FINDER RACE Kit (Clontech 제) 및 폴리머라아제 연쇄 반응 (polymerase chain reaction ; PCR) 을 사용한 5'-RACE 법 (Frohman, M.A. et al., Proc. Natl. Acad. Sci. U.S.A. (1988)85, 8998-9002 ; Belyavsky, A. et al., Nucleic Acids Res. (1989)17, 2919-2932) 에 따라, cDNA 의 합성 및 증폭을 실시할 수 있다.
얻어진 PCR 산물로부터 목적으로 하는 DNA 단편을 조제하고, 벡터 DNA 와 연결한다. 또한, 이것으로부터 재조합 벡터를 제조하고, 대장균 등에 도입하여 콜로니를 선택해 원하는 재조합 벡터를 조제한다. 목적으로 하는 DNA 의 염기 배열은 공지된 방법, 예를 들어, 디데옥시뉴클레오티드체인터미네이션법에 의해 확인할 수 있다.
또, 타우린 트랜스포터를 코드하는 DNA 에서는, 발현에 사용하는 숙주의 코돈 사용 빈도를 고려하고, 보다 발현 효율이 높은 염기 배열을 설계할 수 있다 (Grantham, R. et al., Nucelic Acids Research (1981)9, r43-74). 또, 타우린 트랜스포터를 코드하는 DNA 는 시판되는 키트나 공지된 방법에 의해 개변할 수 있다. 개변으로는, 예를 들어, 제한 효소에 의한 소화, 합성 올리고 뉴클레오티드나 적당한 DNA 프래그먼트의 삽입, 링커의 부가, 개시 코돈 (ATG) 및/또는 종지 코돈 (TAA, TGA, 또는 TAG) 의 삽입 등을 들 수 있다.
타우린 트랜스포터를 코드하는 DNA 는 또한, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하는 DNA 이고, 또한 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 함유한다.
스트린젠트한 조건으로는, 당업자이면 적절히 선택할 수 있는데, 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 높일수록 높은 상동성을 갖는 DNA 를 얻을 수 있다. 상기의 하이브리다이즈하는 DNA 는 바람직하게는 천연 유래의 DNA, 예를 들어 cDNA 또는 염색체 DNA 이어도 된다.
이들 하이브리다이제이션 기술에 의해 단리되는 DNA 는 통상적으로 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 와 염기 배열에서 높은 동일성을 갖는다. 이들의 DNA 에는, 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하고, 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 와 높은 동일성을 갖는 DNA 도 함유된다. 높은 동일성이란, 통상적으로 96 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 염기 배열의 동일성은 Karlin and Altschul 에 의한 알고리즘 BLAST (Proc. Natl. Acad. Sci. USA 90 : 5873-5877, 1993) 에 의해 결정할 수 있다. 이 알고리즘에 기초하여, BLASTN 이나 BLASTX 로 불리는 프로그램이 개발되어 있다 (Altschul et al. J. Mol. Biol. 215 : 403-410, 1990). BLAST 에 기초하여 BLASTN 에 의해 염기 배열을 해석하는 경우에는, 파라미터는 예를 들어 score = 100, wordlength = 12 로 한다. 이들 해석 방법의 구체적인 수법은 공지이다 (http : //www.ncbi.nlm.nih.gov.).
타우린 트랜스포터를 코드하는 DNA 는 벡터에 삽입되면 된다.
벡터로서는, 예를 들어, 대장균을 숙주로 하는 경우에는, 벡터를 대장균 (예를 들어, JM109, DH5, HB101, XL1Blue) 등으로 대량으로 증폭시켜 대량 조제하기 위해, 대장균으로 증폭되기 위한 「ori」를 갖고, 추가로 형질 전환된 대장균의 선발 유전자 (예를 들어, 어떠한 약제 (암피실린이나 테트라시클린, 카나마이신, 클로람페니콜) 에 의해 판별할 수 있는 약제 내성 유전자) 를 갖는 것이 바람직하다. 벡터의 예로는, M13 계 벡터, pUC 계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또, cDNA 의 서브 클로닝, 절단을 목적으로 했을 경우, 상기 벡터 외에, 예를 들어, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 원하는 폴리펩티드를 생산하는 목적에서 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로는, 예를 들어, 대장균에서의 발현을 목적으로 한 경우에는, 벡터가 대장균으로 증폭되는 상기 특징을 갖는 것 외에, 숙주를 JM109, DH5, HB101, XL1-Blue 등의 대장균으로 했을 경우에는, 대장균으로 효율적으로 발현시킬 수 있는 프로모터, 예를 들어, lacZ 프로모터 (Ward 등, Nature (1989)341, 544-546 ; FASEB J.(1992)6, 2422-2427), araB 프로모터 (Better 등, Science (1988)240, 1041-1043), 또는 T7 프로모터 등을 갖고 있는 것이 바람직하다. 이와 같은 벡터로는, 상기 벡터 외에 pGEX-5X-1 (Pharmacia 사 제조), 「QIAexpress system」(Qiagen 사 제조), pEGFP, 또는 pET (이 경우, 숙주는 T7 RNA 폴리머라아제를 발현시키고 있는 BL21 이 바람직하다) 등을 들 수 있다.
또, 벡터에는, 폴리펩티드 분비를 위한 시그널 배열이 포함되어 있어도 된다. 폴리펩티드 분비를 위한 시그널 배열로는, 대장균의 페리프라즘에 생성시키는 경우, pelB 시그널 배열 (Lei, S.P. et al J. Bacteriol. (1987)169, 4379) 을 사용하면 된다. 숙주 세포로의 벡터의 도입은 예를 들어 염화칼슘법, 일렉트로포레이션법을 이용하여 실시할 수 있다.
대장균을 숙주로 하는 경우 이외에도, 예를 들어, 원하는 폴리펩티드를 제조하기 위해 사용되는 벡터로는, 포유 동물 유래의 발현 벡터 (예를 들어, pcDNA3 (Invitrogen 사 제조) 나, pEGF-BOS (Nucleic Acids.Res.1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터 (예를 들어 「Bac-to-BAC baculovairus expression system」(GIBCO BRL 사 제조), pBacPAK8), 식물 유래의 발현 벡터 (예를 들어 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터 (예를 들어, pHSV, pMV, pAdexLcw), 레토로 바이러스 유래의 발현 벡터 (예를 들어, pZIpneo), 효모 유래의 발현 벡터 (예를 들어, 「Pichia Expression Kit」(Invitrogen 사 제조), pNV11, SP-Q01), 고초균 유래의 발현 벡터 (예를 들어, pPL608, pKTH50) 등을 들 수 있다.
CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포 내에서 발현시키기 위해 필요한 프로모터, 예를 들어 SV40 프로모터 (Mulligan 등, Nature (1979) 277, 108), MMLV-LTR 프로모터, EF1 프로모터 (Mizushima 등, Nucleic Acids Res.(1990)18, 5322), CMV 프로모터 등을 갖고 있는 것이 바람직하고, 세포로의 형질 전환을 선발하기 위한 유전자 (예를 들어, 약제 (네오마이신, G418 등) 에 의해 판별할 수 있는 약제 내성 유전자) 를 가지면 더욱 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들어, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.
또한, 유전자를 안정적으로 발현시키고, 또한, 세포 내에서의 유전자의 카피수의 증폭을 목적으로 하는 경우에는, 핵산 합성 경로를 결손시킨 CHO 세포에 그것을 상보하는 DHFR 유전자를 갖는 벡터 (예를 들어, pCHOI 등) 를 도입하고, 메토트렉사이트 (MTX) 에 의해 증폭시키는 방법을 들 수 있고, 또, 유전자의 일과성 발현을 목적으로 하는 경우에는, SV40 T 항원을 발현시키는 유전자를 염색체 상에 갖는 COS 세포를 사용하여 SV40 의 복제 기점을 갖는 벡터 (pcD 등) 로 형질 전환시키는 방법을 들 수 있다. 복제 개시점으로는, 또한, 폴리오마 바이러스, 아데노바이러스, 소 파피로마 바이러스 (BPV) 등 유래의 것을 사용할 수도 있다. 또한, 숙주 세포계에서 유전자 카피 수 증폭을 위해, 발현 벡터는 선택 마커로서 아미노글리코시드트랜스페라아제 (APH) 유전자, 티미딘키나아제 (TK) 유전자, 대장균 크산틴구아닌포스포리보실트랜스페라아제 (Ecogpt) 유전자, 디히드로 엽산 환원 효소 (dhfr) 유전자 등을 함유할 수 있다.
본 발명은 ALT 를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 세포 (어느 DNA 도 벡터에 삽입되어 있어도 된다) 도 제공한다.
진핵 세포를 사용하는 경우, 예를 들어, 동물 세포, 식물 세포, 진균 세포를 숙주에 사용할 수 있다. 동물 세포로는, 포유류 세포, 예를 들어, CHO (J.Exp.Med.(1995)108, 945), COS, 3T3, 골수종, BHK (baby hamster kidney), HeLa, Vero, 양서류 세포, 예를 들어 아프리카 발톱 개구리 난모 세포 (Valle, et al., Nature (1981)291, 358-340), 혹은 곤충 세포, 예를 들어, Sf9 , Sf21, Tn5 가 알려져 있다. CHO 세포로는, 특히, DHFR 유전자를 결손시킨 CHO 세포인 dhfr-CHO (Proc.Natl.Acad.Sci.USA (1980)77, 4216-4220) 나 CHO K-1 (Proc.Natl.Acad.Sci.USA (1968)60, 1275) 를 바람직하게 사용할 수 있다. 동물 세포에서, 대량 발현을 목적으로 하는 경우에는 특히 CHO 세포가 바람직하다. 숙주 세포에 DNA (벡터에 삽입되어 있어도 된다) 를 도입하는 것은 예를 들어 인산칼슘법, DEAE 덱스트란법, 카티오닉 리보솜 DOTAP (베이린가만하임사 제조) 를 사용한 방법, 일렉트로포레이션법, 리포펙션 등의 방법으로 실시할 수 있다.
식물 세포로는, 예를 들어, 니코티아나 타바쿰 (Nicotiana tabacum) 유래의 세포가 폴리펩티드 생산계로서 알려져 있고, 이것을 캘러스 배양하면 된다. 진균 세포로는, 효모, 예를 들어, 사카로미세스 (Saccharomyces) 속, 예를 들어, 사카로미세스 세레비시아 (Saccharomyces cerevisiae), 사상균, 예를 들어, 아스페르질루스 (Aspergillus) 속, 예를 들어, 아스페르질루스 니거 (Aspergillus niger) 가 알려져 있다.
원핵 세포를 사용하는 경우, 세균 세포를 사용하는 생성계가 있다. 세균 세포로는, 대장균 (E. coli), 예를 들어, JM109, DH5, HB101 등을 들 수 있고, 그 밖에 고초균이 알려져 있다.
이들 세포를 목적으로 하는 유전자에 의해 형질 전환시키고, 형질 전환된 세포를 in vitro 에서 배양시킴으로써 목적으로 하는 유전자가 코드하는 폴리펩티드 가 얻어진다. 배양은 공지된 방법에 따라 실시할 수 있다. 예를 들어, 동물 세포의 배양액으로서 예를 들어, DMEM, MEM, RPMI1640, IMDM 을 사용할 수 있다. 그 때, 소 태아 혈청 (FCS) 등의 혈청 보액을 병용할 수도 있고, 무혈청 배양시켜도 된다. 배양시의 pH 는 약 6 ∼ 8 인 것이 바람직하다. 배양은 통상적으로 약 30 ∼ 40 ℃ 에서 약 15 ∼ 200 시간 실시하고, 필요에 따라 배지의 교환, 통기, 교반을 추가한다.
한편, in vivo 에서 폴리펩티드를 생성시키는 계로는, 예를 들어, 동물을 사용하는 생성계나 식물을 사용하는 생성계를 들 수 있다. 이들 동물 또는 식물에 목적으로 하는 유전자를 도입하고, 동물 또는 식물의 체내에서 폴리펩티드를 생성시켜 회수한다. 본 발명에서의 「숙주」란, 이들의 동물, 식물을 포함한다.
동물을 사용하는 경우, 포유류 동물, 곤충을 사용하는 생성계가 있다. 포유류 동물로는, 염소, 돼지, 양, 마우스, 소를 사용할 수 있다 (Vicki Glaser, SPECTRUM Biotechnology Applications, 1993). 또, 포유류 동물을 사용하는 경우, 트랜스제닉 동물을 사용할 수 있다.
예를 들어, 목적으로 하는 유전자를, 염소 β 카세인과 같은 유즙 중에서 고유하게 생성되는 폴리펩티드를 코드하는 유전자와의 융합 유전자로서 조제한다. 이어서, 이 융합 유전자를 함유하는 유전자 단편을 염소의 배(胚)에 주입하고, 이 배를 암컷의 염소에게 이식한다. 배를 수용한 염소로부터 태어나는 트랜스제닉 염소 또는 그 자손이 생성하는 유즙으로부터, 목적으로 하는 폴리펩티드를 얻을 수 있다. 트랜스제닉 염소로부터 생성되는 폴리펩티드를 함유하는 유즙량을 증가시키기 위해, 적절히 호르몬을 트랜스제닉 염소에 사용해도 된다 (Ebert, K.M. et al., Bio/Technology (1994)12, 699-702).
또, 곤충으로는, 예를 들어 누에를 사용할 수 있다. 누에를 사용하는 경우, 목적으로 하는 폴리펩티드를 코드하는 유전자를 삽입한 바큘로 바이러스를 누에에게 감염시킴으로써, 이 누에의 체액으로부터 목적으로 하는 폴리펩티드를 얻을 수 있다 (Susumu, M. et al., Nature (1985)315, 592-594).
또한, 식물을 사용하는 경우, 예를 들어 담배를 사용할 수 있다. 담배를 사용하는 경우, 목적으로 하는 폴리펩티드를 코드하는 유전자를 식물 발현용 벡터, 예를 들어 pMON 530 에 삽입하고, 이 벡터를 아그로 박테리움 투메파키엔스 (Agrobacterium tumefaciens) 와 같은 박테리아에 도입한다. 이 박테리아를 담배, 예를 들어, 니코티아나 타바쿰 (Nicotiana tabacum) 에 감염시켜 본 담배의 잎으로부터 원하는 폴리펩티드를 얻을 수 있다 (Julian K.-C.Ma et. al., Eur. J. Immunol. (1994)24, 131-138).
이로써 얻어진 폴리펩티드는 숙주 세포 내 또는 세포 외 (배지 등) 로부터 단리되어, 실질적으로 순수하고 균일한 폴리펩티드로서 정제시킬 수 있다. 폴리펩티드의 분리, 정제는 통상적인 폴리펩티드의 정제에서 사용되고 있는 분리, 정제 방법을 사용하면 되고, 전혀 한정되지 않는다. 예를 들어, 크로마토그래피 칼럼, 필터, 한외 여과, 염석, 용매 침전, 용매 추출, 증류, 면역 침강, SDS-폴리아크릴아미드겔 전기 영동, 등전점 전기 영동법, 투석, 재결정 등을 적절히 선택, 조합하면 폴리펩티드를 분리, 정제시킬 수 있다.
크로마토그래피로는, 예를 들어 어피니티 크로마토그래피, 이온 교환 크로마토그래피, 소수성 크로마토그래피, 겔 여과, 역상 크로마토그래피, 흡착 크로마토그래피 등을 들 수 있다 (Strategies for Protein Purification and Characterization : A Laboratory Course Manual.Ed Daniel R.Marshak et al., Cold Spring Harbor Laboratory Press, 1996). 이들 크로마토그래피는, 액상 크로마토그래피, 예를 들어 HPLC, FPLC 등의 액상 크로마토그래피를 사용하여 실시할 수 있다. 본 발명은 이들의 정제 방법을 이용하여 고도로 정제된 폴리펩티드도 포함한다.
또한, 폴리펩티드를 정제 전 또는 정제 후에 적당한 폴리펩티드 수식 효소를 작용시킴으로써, 임의로 수식을 첨가하고 부분적으로 펩티드를 제거할 수도 있다. 폴리펩티드 수식 효소로서는, 예를 들어, 트립신, 키모트립신, 리실엔드펩티다아제, 프로테인키나제, 글루코시다아제 등이 사용된다.
또한, 본 발명에서, 「DNA 를 도입한 세포」란, 유전자 재조합 기술에 의해 외래성 DNA 가 삽입된 세포 외에 유전자 활성화 기술 (예를 들어, 국제 공개 제WO94/12650호 팜플렛 참조) 에 의해 내인성 DNA 가 활성화되고, 그 결과, 당해 DNA 에 대응하는 단백질의 발현 혹은 당해 DNA 의 전사가 개시 혹은 증가된 세포도 포함하는 개념이다.
실시예
이하, 본 발명을 실시예에 의해 구체적으로 설명한다. 또한, 이들 실시예는, 본 발명을 설명하기 위한 것으로서, 본 발명의 범위를 한정하는 것은 아니다.
[실시예 1] 인간 간세포 알라닌아미노트랜스페라아제 (Alanine aminotransferase) 유전자 클로닝
시판되는 Human Liver QUICK-Clone cDNA (Clontech 사) 를 주형으로 하여, 인간 간 유래 Alanine aminotransferase (ALT1) 유전자를 PCR 법에 의해 얻었다. 클로닝된 유전자는 염기 배열을 결정하고, 공개되어 있는 인간 ALT1 과의 상동성으로부터 ALT1 을 코드하고 있는 것을 확인하였다. 얻어진 ALT1 유전자는 1488 염기 중, 5 지점 (c157a, a215g, c765t, t857c, t995a) 에서 변이가 확인되고, 코드하는 아미노산은 496 개 중, 4 아미노산 (R53S, Q72R, F286S, M332K) 이 상이했는데, 인간 간 유래 ALT1 PCR 클론으로서 세포 개변에 사용하였다.
[실시예 2] 인간 알라닌아미노트랜스페라아제 도입에 의한 항체 생성량 증가
실시예 1 의 클로닝에 의해 취득한 인간 ALT1 (이하 ALT1) 유전자에 Kozak 배열을 첨가하고, CMV 프로모터 발현 플라스미드 pPur-ALT1 (도 1), pHyg-ALT1 (도 2) 을 구축하였다. pPur-ALT1 혹은 ALT1 유전자를 함유하지 않는 pPur 발현 플라스미드를, 친주인 항글리피칸-3 항체 생성 CHO 세포 (국제 공개 제WO 2006/006693호 팜플렛을 참조) 에 일렉트로포레이션법으로 도입하고, Puromycin (6 ㎍/㎖) 존재하에서 정치 배양에서 고증식인 세포주 (pPur-ALT1 : 7 주, pPur : 3 주) 를 선발하였다. 확대 후, pPur-ALT1 세포주로부터 Total RNA 를 조제하고, TaqMan 법에 의해 인간 ALT1 을 고발현시키고 있는 6 주를 선발하고, 추가로 진탕 배양하에서 컨트롤인 pPur 도입 세포 (3 주) 와 동일한 정도로 증식하는 4 주를 인간 ALT1 도입 세포로 하여 항체 생성량을 비교하였다. 초발 밀도 2 x 105 cells/㎖ 의 50 ㎖ 쉐이커 플라스크에 의한 유가 배양에서, 쉐이커 배양 후기 17 일째의 pPur-ALT1 도입 세포 (4 주) 의 항글리피칸-3 항체 생성량은 pPur 도입 세포 (3 주) 에 대해 우위였다 (t 검정 P<0.01, 도 3). 쉐이커 유가 배양 검토에서, 각각 가장 항체 고생성이었던 pPur-ALT1 발현주 A72 및 Pur 발현주 P41 을 초발 10 x 105 cells/㎖ 로 1 ℓ 자 유가 배양을 실시하면, A72 의 항체 생성량은 배양 19 일째에 2.9 g/ℓ 이고, P41 의 항체 생성량 (2.2 g/ℓ) 이상으로 고생성이었다 (도 4). 배양 14 일째 이후에 P41 의 생성량 증가가 확인되지 않으므로, A72 의 항체 고생성은 생존률 유지 효과에 의한 것으로 생각할 수 있었다 (도 5). 또, Hygromycin (200 ㎍/㎖) 존재하에서 상기와 동일한 수법으로 약제 선발된 pHyg/ALT 도입 세포 (3 주) 를 친주와 함께, 초발 밀도 1 x 105 cells/㎖ 로 15 ㎖ 튜브에 의한 유가 배양을 실시하면, 튜브 배양 후기 10 일째의 pHyg-ALT 도입 세포의 항글리피칸-3 항체 생성량은 471 ㎎/ℓ, 544 ㎎/ℓ, 588 ㎎/ℓ 로, 모두 친주 (400 ㎎/ℓ) 이상이었다 (data not shown).
다음으로, pHyg-TauT 도입 세포 T10 (후술하는 참고예 2 를 참조) 을 친주로 하고, pPur-ALT1 혹은 pPur 을 공도입하여, 고증식이고 또한 인간 ALT1 을 고발현시키고 있는 TauT/ALT1 공발현 세포 (6 주), 및 고증식인 TauT/pPur 공발현 세포 (8 주) 를 선발하고, 초발 밀도 10 x 105 cells/㎖ 로 50 ㎖ 쉐이커 플라스크에 의한 유가 배양을 실시하였다. ALT 발현 세포인 TauT/ALT1 공발현주의 쉐이커 배양 4 일째의 항글리피칸-3 항체 생성량은 TauT/pPur 세포에 대해 우위였다 (t 검정 P<0.01, 도 6).
쉐이커 유가 배양 검토에서 가장 항체 고생성이고, 또한, ALT1 mRNA 를 가장 발현시키고 있었던 TauT/ALT1 공발현주 TA41 (881 ㎎/ℓ/4 days) 을 초발 10 x 105 cells/㎖ 로 1 ℓ 자 유가 배양을 실시하면, 그 항체 생성량은 배양 7 일째에 1.3 g/ℓ, 배양 10 일째에 3.0 g/ℓ, 배양 12 일째에 3.5 g/ℓ, 배양 17 일째에 4.6 g/ℓ, 배양 21 일째에 5.3 g/ℓ 로 높고 (도 7), TauT/pPur 공발현주 중에서 가장 생성량이 많았던 컨트롤주 TP08 (656 ㎎/ℓ/4 days) 에 대해서도 명백하게 높았다 (배양 10 일째에 2.4 g/ℓ).
TauT/ALT1 공발현주인 TA41 의 50 ㎖ 쉐이커 플라스크 유가 배양 14 일째의 항글리피칸-3 항체 생성량은 알라닌과 함께 ALT 의 기질이 되는 -케토글루탈산을 첨가하면 증가되었다 (도 22). 배양 14 일째의 항글리피칸-3 항체 생성량은 2.5 mM -케토글루탈산 존재하에서 1452 ㎎/ℓ, -케토글루탈산 비존재하에서 1239 ㎎/ℓ 였다.
이상의 결과는 ALT1 을 인위적으로 발현시킴으로써 배양 후기에 항체를 고생성하는 세포가 얻어지는 것을 시사하고 있다.
본 발명은 모든 항체 생성 세포에 응용할 수 있다.
[참고예 1] CHO 세포 유래 햄스터 타우린 트랜스포터 유전자 클로닝
CHO DXB11 세포에 항 IL-6 리셉터 항체 유전자를 도입한 항 IL-6 리셉터 항체 생성 세포 (일본 공개특허공보 평8-99902호) 로부터 total RNA 추출을 실시한 후, 폴리 A 에 의존하는 cDNA 를 합성하였다. SalI, XhoI, EcoRI 의 3 종류의 제한 효소로 단편화시킨 cDNA 를 주형시킴으로써, Hamster 타우린 트랜스포터 (TauT) 유전자를 PCR 에 의해 얻었다. PCR 프라이머는 이미 알려진 Rat/Mouse TauT 사이에서 유전자 배열이 보존되어 있는 5', 3' 를 함유하는 것을 설계하여 사용하였다. 클로닝된 유전자는 염기 배열을 결정하고, 이미 알려진 생물종의 TauT 와의 상동성으로부터 Hamster TauT 를 코드하고 있는 것을 확인하였다 (도 8). Hamster TauT 아미노산 배열은 Mouse (96 % Identity), Rat (96 % Identity), Human (93 % Identity) TauT 에 대해 높은 상동성을 갖고 있고, 12 의 막관통 영역을 갖는 트랜스포터인 것이 예상되었다 (도 9).
[참고예 2] 햄스터 타우린 트랜스포터 도입에 의한 생세포 밀도 증가, 유산 생성량 억제, 및 항체 생성량 증가
참고예 1 의 클로닝에 의해 취득한 Hamster TauT (이하 TauT) 유전자에 Kozak 배열을 첨가하여 CMV 프로모터 발현 플라스미드 pHyg/TauT (도 10) 를 구축하였다. pHyg/TauT 혹은 TauT 유전자를 제거한 컨트롤 플라스미드 pHyg 를, 친주인 항글리피칸-3 항체 생성 CHO 세포 (국제 공개 제WO 2006/006693호 팜플렛을 참조) 에 일렉트로포레이션법으로 도입하였다. 발현 플라스미드 도입 세포를 Hygromycin (400 ㎍/㎖) 존재하에서 선발한 후, 안정적으로 증식하는 세포주 전부를 확대하였다 (pHyg/TauT : 8 주, pHyg : 7 주). TauT mRNA 를 조제 후 TaqMan 법에 의해, 친주에 대해 우위 발현을 확인할 수 있는 7 주를 pHyg/TauT 도입 세포로 하였다. 도입 세포 (7 주) 의 mRNA 평균 발현량은 컨트롤 (7 주) 의 약 40 배였다. 합계 14 주의 세포는 2 x 105 cells/㎖ 의 초발 밀도로 50 ㎖ 쉐이커 플라스크에 의한 배치 (batch) 배양 및 유가 (fed-batch) 배양을 실시하고, 배양 후기 7 일째의 생세포 밀도, 락트산 생성량, 항글리피칸-3 항체 생성량을 비교하였다. 배치 배양에서는 세포 증식에 수반되어 배양액 중에 락트산 등의 성장 저해 물질이 축적되어 증식이 억제되는데, pHyg/TauT 도입 세포의 생세포 밀도 (도 11) 및 락트산 생성량 (도 12) 은 pHyg 도입 세포에 대해 우위였다 (t 검정 P<0.05). 항글리피칸-3 항체 생성량에 관해서는, pHyg/TauT 도입 세포의 7 주 중 4 주가 pHyg 도입 세포의 최고값 이상이었다 (도 13). 또한 pHyg/TauT 도입 세포의 항글리피칸-3 항체 생성량의 우위성 (t 검정 P<0.01, 도 14) 이 유가 배양에 의해 명백해졌기 때문에, 상기 4 주 중에서 가장 증식력이 높았던 pHyg/TauT 도입 세포 (T10) 와 친주의 1 ℓ 자에 의한 유가 배양을 실시한 결과, T10 는 배양 32 일째에도 생존률이 80 % 이상으로 유지되어 있고 (도 15), 유산 생성이 억제되어 있었다. 그 결과, 항글리피칸-3 항체 생성량은 배양 35 일째에 2.9 g/ℓ (도 16) 를 달성하였다. TauT 도입 T10 세포가 세포막 상에 TauT 분자를 발현시키고 있는 것은 플로우 사이트 메트리 분석 (도 17) 으로 확인하였다. 이상의 결과는 Hamster TauT 를 인위적으로 발현시킴으로써 항체 생성 세포의 포텐셜이 상승되어, 항체 고생성주가 얻어지는 것을 시사하고 있다.
[참고예 3] 햄스터 타우린 트랜스포터 도입주의 암모니아 생성량 억제, 타우린의 주입, 글루타민 소비량 증가, 및 타우린 부(否)의존적인 항체 생성량
친주 및 pHyg/TauT 도입주를, 초발 2 x 105 cells/㎖ 로 1 ℓ 자에 유가 배양시키고, 적시에 배양조로부터 450 x 105 세포를 함유하는 배양액을 채취하였다. 원심에 의해, 배양 상청을 분리 채취한 후, 세포 펠릿에 프로테아제 저해제 (Complete Mini, Roche Diagnostics 사, Protease inhibitor cocktail tablets) 를 함유한 1 ㎖ 의 냉각 멸균수를 첨가하고, 빙상에서 초음파 세포 파쇄기 (MISONIX ASTRASON MODEL XL2020) 를 사용하여 5 초 펄스 조작 후, 5 초 휴지(休止)를 1 세트로 하고, 합계 12 세트 처리를 반복하여 세포를 완전히 파쇄시켰다. 처리 후의 용액은 전체량을 원심식 여과 유닛에 어플라이함으로써, 분자량 5000 이하의 여과액을 조제하여 세포 내 아미노산 측정용 시료로 하였다. 각 시료는 또한, 닌히드린 시액-L8500 세트 (와코 순약 공업) 및, 히타치 제조 전자동 아미노산 분석 장치 (L-8500) 의 개량형을 사용하여 570 nm 의 흡광도를 검출, 비교하고, 시료 중의 각종 아미노산 농도를 구하였다. 배양액 중의 각종 아미노산 및 암모니아 등의 농도는 직접 측정한 값이므로, μM 오더의 농도를 비교하고, 한편, 세포 내 농도는 세포 펠릿에 냉각 멸균수 1 ㎖ 를 첨가한 후 초음파 세포를 파쇄함으로써, 각종 아미노산 및 암모니아 등의 측정값을 세포당 값으로 환산하고, 그 환산값을 비교하였다. 도 18 의 암모니아 농도비는 1 ℓ 자에 유가 배양 개시시의 450 x 105 개당 친주의 암모니아 검출값을 1 로 규정하고, 배양 개시시에 6 일째, 12 일째, 18 일째의 검출값과 비교하여 비를 구하였다. 또, 도 19, 도 20 의 타우린과 글루탐산도 상기 아미노산 분석에 의해 측정하였다.
그 결과, pHyg/TauT 도입주는 배양 후기에서 세포 내 암모니아가 저농도로 유지되어 있고, 항체 고생성에 기여하고 있는 것으로 생각할 수 있었다 (도 18).
세포 내의 타우린 농도비는 상기, 암모니아와 거의 동일한 방법으로 구하였다 (도 19). 차이점은 50 ㎖ 쉐이커 배치 배양 4 일째의 200 x 105 개당 친주의 암모니아 검출값을 1 로 규정하고 있는 것이다.
그 결과, pHyg/TauT 도입주는 타우린 첨가량에 의존하여 타우린을 주입하고, 그 주입량은 친주와 동등하였다. 그러나, 도 20 에 나타내는 바와 같이, pHyg/TauT 도입주의 글루타민 소비량은 친주에 대해 현저하고, 초발 타우린 농도에 의존하지 않았다. 글루타민이 하이브리도머의 세포 증식이나 생존률, 및 항체 생성능을 개선시키고, 항체 생성량을 상승시키는 기능을 하는 것은 보고되어 있다 (Enzyme and Microbial Technology 17 : 47-55, 1995). 따라서, pHyg/TauT 도입주의 항체 생성 증강 효과는, 타우린 트랜스포터를 개입시킨 타우린 이외의 다른 아미노산 (글루타민 등) 의 주입에 의한 가능성도 생각할 수 있다. 또한, 글루타민 농도는 도 19 에서의 배양 4 일째의 배양액을 아미노산 분석한 측정값을 1 x 105 세포당으로 환산한 값이다.
실제, 항글리피칸-3 항체 생성량은 50 ㎖ 쉐이커 유가 배양 개시시의 초발 타우린 농도 (0 ∼ 500 mM (62.575 g/ℓ)) 에 의존하지 않았다 (도 21). 또, 친주에 대해서도 초발 타우린 농도에 의한 항체 생성량의 영향에 우위한 차는 확인되지 않았다.
이상의 결과는 배양 개시시의 배지 중에 타우린을 함유하지 않아도 TauT 강발현주가 높은 항체 생성능을 갖는 것을 시사하고, 타우린 이외의 아미노산 등의 주입에 대해서도 촉진될 가능성도 생각할 수 있다.
본 명세서에서 인용한 모든 간행물, 특허 및 특허출원을 그대로 참고로서 본 명세서에 도입하는 것으로 한다.
산업상 이용 가능성
본 발명은 폴리펩티드의 생산에 사용할 수 있다.
배열표 프리 텍스트
<배열 번호 1>
배열 번호 1 은 인간 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 2875) 을 나타낸다.
<배열 번호 2>
배열 번호 2 는 인간 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 2875) 을 나타낸다.
<배열 번호 3>
배열 번호 3 은 인간 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 84706) 의 염기 배열을 나타낸다.
<배열 번호 4>
배열 번호 4 는 인간 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 84706) 을 나타낸다.
<배열 번호 5>
배열 번호 5 는 마우스 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 76282) 의 염기 배열을 나타낸다.
<배열 번호 6>
배열 번호 6 은 마우스 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 76282) 을 나타낸다.
<배열 번호 7>
배열 번호 7 은 마우스 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 108682) 을 나타낸다.
<배열 번호 8>
배열 번호 8 은 마우스 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 108682) 을 나타낸다.
<배열 번호 9>
배열 번호 9 는 래트 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Rattus norvegicus (rat) : 81670) 을 나타낸다.
<배열 번호 10>
배열 번호 10 은 래트 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Rattus norvegicus (rat) : 81670) 을 나타낸다.
<배열 번호 11>
배열 번호 11 은 개 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Canis familiaris (dog) : 609510) 을 나타낸다.
<배열 번호 12>
배열 번호 12 는 개 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Canis familiaris (dog) : 609510) 을 나타낸다.
<배열 번호 13>
배열 번호 13 은 아프리카 발톱 개구리 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Xenopus laevis (African clawed frog) : 444533) 을 나타낸다.
<배열 번호 14>
배열 번호 14 는 아프리카 발톱 개구리 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Xenopus laevis (African clawed frog) : 444533) 을 나타낸다.
<배열 번호 15>
배열 번호 15 는 초파리 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Drosophila melanogaster (fruit fly) : Dmel_CG1640) 을 나타낸다.
<배열 번호 16>
배열 번호 16 은 초파리 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Drosophila melanogaster (fruit fly) : Dmel_CG1640) 을 나타낸다.
<배열 번호 17>
배열 번호 17 은 선충 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Caenorhabditis elegans (nematode) : C32F10.8) 을 나타낸다.
<배열 번호 18>
배열 번호 18 은 선충 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Caenorhabditis elegans (nematode) : C32F10.8) 을 나타낸다.
<배열 번호 19>
배열 번호 19 는 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4342210) 을 나타낸다.
<배열 번호 20>
배열 번호 20 은 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4342210) 을 나타낸다.
<배열 번호 21>
배열 번호 21 은 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4348524) 을 나타낸다.
<배열 번호 22>
배열 번호 22 는 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4348524) 을 나타낸다.
<배열 번호 23>
배열 번호 23 은 원시 홍조 시아니디오시존 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Cyanidioschyzon merolae : CMM066C) 을 나타낸다.
<배열 번호 24>
배열 번호 24 는 원시 홍조 시아니디오시존 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Cyanidioschyzon merolae : CMM066C) 을 나타낸다.
<배열 번호 25>
배열 번호 25 는 빵 효모 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YLR089C) 을 나타낸다.
<배열 번호 26>
배열 번호 26 은 빵 효모 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YLR089C) 을 나타낸다.
<배열 번호 27>
배열 번호 27 은 빵 효모 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomycescerevisiae : YDR111C) 을 나타낸다.
<배열 번호 28>
배열 번호 28 은 빵 효모 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YDR111C) 을 나타낸다.
<배열 번호 29>
배열 번호 29 는 사상균 Ashbya gossypii 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Ashbya gossypii (Eremothecium gossypii) : AGOS_AGR085W) 을 나타낸다.
<배열 번호 30>
배열 번호 30 은 사상균 Ashbya gossypii 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Ashbya gossypii (Eremothecium gossypii) : AGOS_AGR085W) 을 나타낸다.
<배열 번호 31>
배열 번호 31 은 진균 Candida albicans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Candida albicans : CaO19_346) 을 나타낸다.
<배열 번호 32>
배열 번호 32 는 진균 Candida albicans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Candida albicans : CaO19_346) 을 나타낸다.
<배열 번호 33>
배열 번호 33 은 분열 효모 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Schizosaccharomyces pombe : SPBC582.08) 을 나타낸다.
<배열 번호 34>
배열 번호 34 는 분열 효모 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Schizosaccharomyces pombe : SPBC582.08) 을 나타낸다.
<배열 번호 35>
배열 번호 35 는 진균 Aspergillus nidulans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus nidulans : AN1923.2) 을 나타낸다.
<배열 번호 36>
배열 번호 36 은 진균 Aspergillus nidulans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus nidulans : AN1923.2) 을 나타낸다.
<배열 번호 37>
배열 번호 37 은 진균 Aspergillus fumigatus 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus fumigatus : AFUA_6 G07770) 을 나타낸다.
<배열 번호 38>
배열 번호 38 은 진균 Aspergillus fumigatus 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus fumigatus : AFUA_6 G07770) 을 나타낸다.
<배열 번호 39>
배열 번호 39 는 청주 누룩곰팡이 Aspergillus oryzae 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus oryzae : AO090003000164) 을 나타낸다.
<배열 번호 40>
배열 번호 40 은 청주 누룩곰팡이 Aspergillus oryzae 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus oryzae : AO090003000164) 을 나타낸다.
<배열 번호 41>
배열 번호 41 은 진균 Cryptococcus neoformans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Cryptococcus neoformans JEC21 : CNG01490) 을 나타낸다.
<배열 번호 42>
배열 번호 42 는 진균 Cryptococcus neoformans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Cryptococcus neoformans JEC21 : CNG01490) 을 나타낸다.
<배열 번호 43>
배열 번호 43 은 세포성 점균 Dictyostelium discoideum 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Dictyostelium discoideum : DDB_0232139) 을 나타낸다.
<배열 번호 44>
배열 번호 44 는 세포성 점균 Dictyostelium discoideum 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Dictyostelium discoideum : DDB_0232139) 을 나타낸다.
<배열 번호 45>
배열 번호 45 는 Trypanosoma brucei 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma brucei : Tb927.1.3950) 을 나타낸다.
<배열 번호 46>
배열 번호 46 은 Trypanosoma brucei 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma brucei : Tb927.1.3950) 을 나타낸다.
<배열 번호 47>
배열 번호 47 은 세포 내 기생성 원충 Leishmania major 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Leishmania major : LmjF12.0630) 을 나타낸다.
<배열 번호 48>
배열 번호 48 은 세포 내 기생성 원충 Leishmania major 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Leishmania major : LmjF12.0630) 을 나타낸다.
<배열 번호 49>
배열 번호 49 는 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 233.t00009) 을 나타낸다.
<배열 번호 50>
배열 번호 50 은 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 233.t00009) 을 나타낸다.
<배열 번호 51>
배열 번호 51 은 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 24.t00016) 을 나타낸다.
<배열 번호 52>
배열 번호 52 는 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 24.t00016) 을 나타낸다.
<배열 번호 53>
배열 번호 53 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.420) 을 나타낸다.
<배열 번호 54>
배열 번호 54 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.420) 을 나타낸다.
<배열 번호 55>
배열 번호 55 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.430) 을 나타낸다.
<배열 번호 56>
배열 번호 56 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.430) 을 나타낸다.
<배열 번호 57>
배열 번호 57 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.120) 을 나타낸다.
<배열 번호 58>
배열 번호 58 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.120) 을 나타낸다.
<배열 번호 59>
배열 번호 59 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140) 을 나타낸다.
<배열 번호 60>
배열 번호 60 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140)(KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140) 을 나타낸다.
<배열 번호 61>
배열 번호 61 은 햄스터 타우린 트랜스포터를 코드하는 유전자의 염기 배열을 나타낸다.
<배열 번호 62>
배열 번호 62 는 햄스터 타우린 트랜스포터의 아미노산 배열을 나타낸다.
<배열 번호 63>
배열 번호 63 은 래트 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_017206) 을 나타낸다.
<배열 번호 64>
배열 번호 64 는 래트 타우린 트랜스포터의 아미노산 배열 (GenBank NM_017206) 을 나타낸다.
<배열 번호 65>
배열 번호 65 는 마우스 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_009320) 을 나타낸다.
<배열 번호 66>
배열 번호 66 은 마우스 타우린 트랜스포터의 아미노산 배열 (GenBank NM_009320) 을 나타낸다.
<배열 번호 67>
배열 번호 67 은 인간 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_003043) 을 나타낸다.
<배열 번호 68>
배열 번호 68 은 인간 타우린 트랜스포터의 아미노산 배열 (GenBank NM_003043) 을 나타낸다.
<110> CHUGAI PHARMACEUTICAL CO.,LTD.
<120> A method of preparing a heteroprotein
<130> FP-111PCT
<150> JP P2007-205158
<151> 2007-08-07
<160> 68
<170> PatentIn version 3.1
<210> 1
<211> 1491
<212> DNA
<213> Homo sapiens
<400> 1
atggcctcga gcacaggtga ccggagccag gcggtgaggc atggactgag ggcgaaggtg 60
ctgacgctgg acggcatgaa cccgcgtgtg cggagagtgg agtacgcagt gcgtggcccc 120
atagtgcagc gagccttgga gctggagcag gagctgcgcc agggtgtgaa gaagcctttc 180
accgaggtca tccgtgccaa catcggggac gcacaggcta tggggcagag gcccatcacc 240
ttcctgcgcc aggtcttggc cctctgtgtt aaccctgatc ttctgagcag ccccaacttc 300
cctgacgatg ccaagaaaag ggcggagcgc atcttgcagg cgtgtggggg ccacagtctg 360
ggggcctaca gcgtcagctc cggcatccag ctgatccggg aggacgtggc gcggtacatt 420
gagaggcgtg acggaggcat ccctgcggac cccaacaacg tcttcctgtc cacaggggcc 480
agcgatgcca tcgtgacggt gctgaagctg ctggtggccg gcgagggcca cacacgcacg 540
ggtgtgctca tccccatccc ccagtaccca ctctactcgg ccacgctggc agagctgggc 600
gcagtgcagg tggattacta cctggacgag gagcgtgcct gggcgctgga cgtggccgag 660
cttcaccgtg cactgggcca ggcgcgtgac cactgccgcc ctcgtgcgct ctgtgtcatc 720
aaccctggca accccaccgg gcaggtgcag acccgcgagt gcatcgaggc cgtgatccgc 780
ttcgccttcg aagagcggct ctttctgctg gcggacgagg tgtaccagga caacgtgtac 840
gccgcgggtt cgcagttcca ctcattcaag aaggtgctca tggagatggg gccgccctac 900
gccgggcagc aggagcttgc ctccttccac tccacctcca agggctacat gggcgagtgc 960
gggttccgcg gcggctatgt ggaggtggtg aacatggacg ctgcagtgca gcagcagatg 1020
ctgaagctga tgagtgtgcg gctgtgcccg ccggtgccag gacaggccct gctggacctg 1080
gtggtcagcc cgcccgcgcc caccgacccc tcctttgcgc agttccaggc tgagaagcag 1140
gcagtgctgg cagagctggc ggccaaggcc aagctcaccg agcaggtctt caatgaggct 1200
cctggcatca gctgcaaccc agtgcagggc gccatgtact ccttcccgcg cgtgcagctg 1260
cccccgcggg cggtggagcg cgctcaggag ctgggcctgg cccccgatat gttcttctgc 1320
ctgcgcctcc tggaggagac cggcatctgc gtggtgccag ggagcggctt tgggcagcgg 1380
gaaggcacct accacttccg gatgaccatt ctgcccccct tggagaaact gcggctgctg 1440
ctggagaagc tgagcaggtt ccatgccaag ttcaccctcg agtactcctg a 1491
<210> 2
<211> 496
<212> PRT
<213> Homo sapiens
<400> 2
Met Ala Ser Ser Thr Gly Asp Arg Ser Gln Ala Val Arg His Gly Leu
1 5 10 15
Arg Ala Lys Val Leu Thr Leu Asp Gly Met Asn Pro Arg Val Arg Arg
20 25 30
Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu
35 40 45
Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile
50 55 60
Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr
65 70 75 80
Phe Leu Arg Gln Val Leu Ala Leu Cys Val Asn Pro Asp Leu Leu Ser
85 90 95
Ser Pro Asn Phe Pro Asp Asp Ala Lys Lys Arg Ala Glu Arg Ile Leu
100 105 110
Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Val Ser Ser Gly
115 120 125
Ile Gln Leu Ile Arg Glu Asp Val Ala Arg Tyr Ile Glu Arg Arg Asp
130 135 140
Gly Gly Ile Pro Ala Asp Pro Asn Asn Val Phe Leu Ser Thr Gly Ala
145 150 155 160
Ser Asp Ala Ile Val Thr Val Leu Lys Leu Leu Val Ala Gly Glu Gly
165 170 175
His Thr Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr
180 185 190
Ser Ala Thr Leu Ala Glu Leu Gly Ala Val Gln Val Asp Tyr Tyr Leu
195 200 205
Asp Glu Glu Arg Ala Trp Ala Leu Asp Val Ala Glu Leu His Arg Ala
210 215 220
Leu Gly Gln Ala Arg Asp His Cys Arg Pro Arg Ala Leu Cys Val Ile
225 230 235 240
Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu
245 250 255
Ala Val Ile Arg Phe Ala Phe Glu Glu Arg Leu Phe Leu Leu Ala Asp
260 265 270
Glu Val Tyr Gln Asp Asn Val Tyr Ala Ala Gly Ser Gln Phe His Ser
275 280 285
Phe Lys Lys Val Leu Met Glu Met Gly Pro Pro Tyr Ala Gly Gln Gln
290 295 300
Glu Leu Ala Ser Phe His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys
305 310 315 320
Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Ala Val
325 330 335
Gln Gln Gln Met Leu Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val
340 345 350
Pro Gly Gln Ala Leu Leu Asp Leu Val Val Ser Pro Pro Ala Pro Thr
355 360 365
Asp Pro Ser Phe Ala Gln Phe Gln Ala Glu Lys Gln Ala Val Leu Ala
370 375 380
Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala
385 390 395 400
Pro Gly Ile Ser Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro
405 410 415
Arg Val Gln Leu Pro Pro Arg Ala Val Glu Arg Ala Gln Glu Leu Gly
420 425 430
Leu Ala Pro Asp Met Phe Phe Cys Leu Arg Leu Leu Glu Glu Thr Gly
435 440 445
Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr
450 455 460
His Phe Arg Met Thr Ile Leu Pro Pro Leu Glu Lys Leu Arg Leu Leu
465 470 475 480
Leu Glu Lys Leu Ser Arg Phe His Ala Lys Phe Thr Leu Glu Tyr Ser
485 490 495
<210> 3
<211> 1572
<212> DNA
<213> Homo sapiens
<400> 3
atgcagcggg cggcggcgct ggtccggcgg ggctgtggtc cccggacccc cagctcctgg 60
ggccgcagcc agagcagcgc ggccgccgag gcctcggcgg tgctcaaggt gcggcccgag 120
cgcagccggc gcgagcgcat cctcacgctg gagtccatga acccgcaggt gaaggcggtg 180
gagtacgccg tgcggggacc catcgtgctc aaggccggcg agatcgagct cgagctgcag 240
cggggtatca aaaagccatt cacagaggtc atccgagcca acatcgggga cgcccaggct 300
atggggcagc agccaatcac cttcctccgg caggtgatgg cactatgcac ctacccaaac 360
ctgctggaca gccccagctt cccagaagat gctaagaaac gtgcccggcg gatcctgcag 420
gcttgtggcg ggaacagcct ggggtcctac agtgctagcc agggtgtcaa ctgcatccgt 480
gaagatgtgg ctgcctacat caccaggagg gatggcggtg tgcctgcgga ccccgacaac 540
atctacctga ccacgggagc tagtgacggc atttctacga tcctgaagat cctcgtctcc 600
gggggcggca agtcacggac aggtgtgatg atccccatcc cacaatatcc cctctattca 660
gctgtcatct ctgagctcga cgccatccag gtgaattact acctggacga ggagaactgc 720
tgggcgctga atgtgaatga gctccggcgg gcggtgcagg aggccaaaga ccactgtgat 780
cctaaggtgc tctgcataat caaccctggg aaccccacag gccaggtaca aagcagaaag 840
tgcatagaag atgtgatcca ctttgcctgg gaagagaagc tctttctcct ggctgatgag 900
gtgtaccagg acaacgtgta ctctccagat tgcagattcc actccttcaa gaaggtgctg 960
tacgagatgg ggcccgagta ctccagcaac gtggagctcg cctccttcca ctccacctcc 1020
aagggctaca tgggcgagtg tggttacaga ggaggctaca tggaggtgat caacctgcac 1080
cctgagatca agggccagct ggtgaagctg ctgtcggtgc gcctgtgccc cccagtgtct 1140
gggcaggccg ccatggacat tgtcgtgaac cccccggtgg caggagagga gtcctttgag 1200
caattcagcc gagagaagga gtcggtcctg ggtaatctgg ccaaaaaagc aaagctgacg 1260
gaagacctgt ttaaccaagt cccaggaatt cactgcaacc ccttgcaggg ggccatgtac 1320
gccttccctc ggatcttcat tcctgccaaa gctgtggagg ctgctcaggc ccatcaaatg 1380
gctccagaca tgttctactg catgaagctc ctggaggaga ctggcatctg tgtcgtgccc 1440
ggcagtggct ttgggcagag ggaaggcact taccacttca ggatgactat cctccctcca 1500
gtggagaagc tgaaaacggt gctgcagaag gtgaaagact tccacatcaa cttcctggag 1560
aagtacgcgt ga 1572
<210> 4
<211> 523
<212> PRT
<213> Homo sapiens
<400> 4
Met Gln Arg Ala Ala Ala Leu Val Arg Arg Gly Cys Gly Pro Arg Thr
1 5 10 15
Pro Ser Ser Trp Gly Arg Ser Gln Ser Ser Ala Ala Ala Glu Ala Ser
20 25 30
Ala Val Leu Lys Val Arg Pro Glu Arg Ser Arg Arg Glu Arg Ile Leu
35 40 45
Thr Leu Glu Ser Met Asn Pro Gln Val Lys Ala Val Glu Tyr Ala Val
50 55 60
Arg Gly Pro Ile Val Leu Lys Ala Gly Glu Ile Glu Leu Glu Leu Gln
65 70 75 80
Arg Gly Ile Lys Lys Pro Phe Thr Glu Val Ile Arg Ala Asn Ile Gly
85 90 95
Asp Ala Gln Ala Met Gly Gln Gln Pro Ile Thr Phe Leu Arg Gln Val
100 105 110
Met Ala Leu Cys Thr Tyr Pro Asn Leu Leu Asp Ser Pro Ser Phe Pro
115 120 125
Glu Asp Ala Lys Lys Arg Ala Arg Arg Ile Leu Gln Ala Cys Gly Gly
130 135 140
Asn Ser Leu Gly Ser Tyr Ser Ala Ser Gln Gly Val Asn Cys Ile Arg
145 150 155 160
Glu Asp Val Ala Ala Tyr Ile Thr Arg Arg Asp Gly Gly Val Pro Ala
165 170 175
Asp Pro Asp Asn Ile Tyr Leu Thr Thr Gly Ala Ser Asp Gly Ile Ser
180 185 190
Thr Ile Leu Lys Ile Leu Val Ser Gly Gly Gly Lys Ser Arg Thr Gly
195 200 205
Val Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Val Ile Ser
210 215 220
Glu Leu Asp Ala Ile Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn Cys
225 230 235 240
Trp Ala Leu Asn Val Asn Glu Leu Arg Arg Ala Val Gln Glu Ala Lys
245 250 255
Asp His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn Pro
260 265 270
Thr Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile His Phe
275 280 285
Ala Trp Glu Glu Lys Leu Phe Leu Leu Ala Asp Glu Val Tyr Gln Asp
290 295 300
Asn Val Tyr Ser Pro Asp Cys Arg Phe His Ser Phe Lys Lys Val Leu
305 310 315 320
Tyr Glu Met Gly Pro Glu Tyr Ser Ser Asn Val Glu Leu Ala Ser Phe
325 330 335
His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Tyr Arg Gly Gly
340 345 350
Tyr Met Glu Val Ile Asn Leu His Pro Glu Ile Lys Gly Gln Leu Val
355 360 365
Lys Leu Leu Ser Val Arg Leu Cys Pro Pro Val Ser Gly Gln Ala Ala
370 375 380
Met Asp Ile Val Val Asn Pro Pro Val Ala Gly Glu Glu Ser Phe Glu
385 390 395 400
Gln Phe Ser Arg Glu Lys Glu Ser Val Leu Gly Asn Leu Ala Lys Lys
405 410 415
Ala Lys Leu Thr Glu Asp Leu Phe Asn Gln Val Pro Gly Ile His Cys
420 425 430
Asn Pro Leu Gln Gly Ala Met Tyr Ala Phe Pro Arg Ile Phe Ile Pro
435 440 445
Ala Lys Ala Val Glu Ala Ala Gln Ala His Gln Met Ala Pro Asp Met
450 455 460
Phe Tyr Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val Pro
465 470 475 480
Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr His Phe Arg Met Thr
485 490 495
Ile Leu Pro Pro Val Glu Lys Leu Lys Thr Val Leu Gln Lys Val Lys
500 505 510
Asp Phe His Ile Asn Phe Leu Glu Lys Tyr Ala
515 520
<210> 5
<211> 1491
<212> DNA
<213> Mus musculus
<400> 5
atggcctcac aaaggaatga ccggatccag gcttcaagga atggactgaa ggggaaggtg 60
ctaactctgg ataccatgaa cccatgtgtg cggagggtgg agtatgcagt ccgaggcccc 120
atcgtgcaac gtgccttgga gctggagcag gagctgcgcc agggtgtgaa gaagcctttt 180
actgaggtta tccgtgccaa tattggggat gcacaagcca tggggcagag acccatcacc 240
ttcttccgcc aggtcctggc cctctgtgtc taccccaatc ttctgagcag tccggacttc 300
ccagaggatg ccaagagaag ggcagaacgc atcttgcagg catgcggggg ccacagcctg 360
ggtgcctata gcattagctc tggaatccag ccgattcggg aggatgtggc gcaatatatt 420
gagaggagag acggaggcat ccctgcagac ccgaacaaca tatttctgtc cacaggggcc 480
agcgatgcca tcgtgaccat gctcaagctg ctggtagccg gcgagggccg tgcgcgaacc 540
ggtgtactca ttcccattcc tcagtaccca ctgtactcag ctgcgctggc tgagctggac 600
gccgtgcaag tggactacta cctggacgaa gagcgcgcct gggctcttga catcgctgag 660
ctgcggcgcg ctctgtgcca ggcacgtgac cgctgctgcc ctcgagtact atgcgtcatc 720
aaccccggca accccacggg gcaggtgcag acccgtgaat gcatcgaggc cgtaatccgc 780
tttgctttcg aagagggact cttcctgatg gctgatgagg tataccaaga caatgtatat 840
gccgagggct ctcagttcca ttcattcaag aaggtgctca cggagatggg gccaccatat 900
gccacgcagc aggagctcgc gtctttccac tcagtctcta agggctacat gggcgagtgc 960
gggtttcgtg gtggctatgt ggaagtggta aacatggatg ccgaggtgca gaaacagatg 1020
gcgaaactga tgagcgtgcg gttgtgtcca ccagtgccgg gccaggcttt gatgggcatg 1080
gtggtcagtc cgccaacccc ctcggagccg tccttcaagc agtttcaagc agagaggcag 1140
gaggtgctgg ctgaactggc agccaaggct aaactcacgg agcaggtctt caacgaggcc 1200
cccgggatcc gctgcaaccc ggtgcagggc gctatgtatt ccttccctca aattcagctg 1260
cctttgaaag cagtgcagcg tgcgcaggac ctgggcctgg cccctgacat gttcttctgt 1320
ctgtgcctcc tggaagagac tggcatctgc gttgtgcctg ggagtggctt tgggcagcag 1380
gagggcacct atcatttccg gatgaccatt ctgcccccca tggagaaact gcgggtgctg 1440
ctggagaaac tgaggcactt ccatgctaaa ttcactcatg agtactcctg a 1491
<210> 6
<211> 496
<212> PRT
<213> Mus musculus
<400> 6
Met Ala Ser Gln Arg Asn Asp Arg Ile Gln Ala Ser Arg Asn Gly Leu
1 5 10 15
Lys Gly Lys Val Leu Thr Leu Asp Thr Met Asn Pro Cys Val Arg Arg
20 25 30
Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu
35 40 45
Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile
50 55 60
Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr
65 70 75 80
Phe Phe Arg Gln Val Leu Ala Leu Cys Val Tyr Pro Asn Leu Leu Ser
85 90 95
Ser Pro Asp Phe Pro Glu Asp Ala Lys Arg Arg Ala Glu Arg Ile Leu
100 105 110
Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Ile Ser Ser Gly
115 120 125
Ile Gln Pro Ile Arg Glu Asp Val Ala Gln Tyr Ile Glu Arg Arg Asp
130 135 140
Gly Gly Ile Pro Ala Asp Pro Asn Asn Ile Phe Leu Ser Thr Gly Ala
145 150 155 160
Ser Asp Ala Ile Val Thr Met Leu Lys Leu Leu Val Ala Gly Glu Gly
165 170 175
Arg Ala Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr
180 185 190
Ser Ala Ala Leu Ala Glu Leu Asp Ala Val Gln Val Asp Tyr Tyr Leu
195 200 205
Asp Glu Glu Arg Ala Trp Ala Leu Asp Ile Ala Glu Leu Arg Arg Ala
210 215 220
Leu Cys Gln Ala Arg Asp Arg Cys Cys Pro Arg Val Leu Cys Val Ile
225 230 235 240
Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu
245 250 255
Ala Val Ile Arg Phe Ala Phe Glu Glu Gly Leu Phe Leu Met Ala Asp
260 265 270
Glu Val Tyr Gln Asp Asn Val Tyr Ala Glu Gly Ser Gln Phe His Ser
275 280 285
Phe Lys Lys Val Leu Thr Glu Met Gly Pro Pro Tyr Ala Thr Gln Gln
290 295 300
Glu Leu Ala Ser Phe His Ser Val Ser Lys Gly Tyr Met Gly Glu Cys
305 310 315 320
Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Glu Val
325 330 335
Gln Lys Gln Met Ala Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val
340 345 350
Pro Gly Gln Ala Leu Met Gly Met Val Val Ser Pro Pro Thr Pro Ser
355 360 365
Glu Pro Ser Phe Lys Gln Phe Gln Ala Glu Arg Gln Glu Val Leu Ala
370 375 380
Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala
385 390 395 400
Pro Gly Ile Arg Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro
405 410 415
Gln Ile Gln Leu Pro Leu Lys Ala Val Gln Arg Ala Gln Asp Leu Gly
420 425 430
Leu Ala Pro Asp Met Phe Phe Cys Leu Cys Leu Leu Glu Glu Thr Gly
435 440 445
Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Gln Glu Gly Thr Tyr
450 455 460
His Phe Arg Met Thr Ile Leu Pro Pro Met Glu Lys Leu Arg Val Leu
465 470 475 480
Leu Glu Lys Leu Arg His Phe His Ala Lys Phe Thr His Glu Tyr Ser
485 490 495
<210> 7
<211> 1569
<212> DNA
<213> Mus musculus
<400> 7
atgcagcggg cagcggtgct ggtgcggcgg ggctcctgcc cccgcgcctc gggcccctgg 60
ggccgtagtc acagcagcgc tgcagccgaa gcctcggcgg cgctcaaggt gcgaccggag 120
cgcagccctc gagaccgcat cctcaccctg gagtccatga acccgcaggt gaaggcggtg 180
gagtacgctg tgcggggacc catcgtgctc aaagccggcg agatcgagat ggagctgcag 240
cggggtatca aaaaaccatt cactgaggta atccgagcca acattgggga tgcccatgct 300
atgggccagc agccaatcac cttcctccgt caggtgatgg cactctgcac ctacccaaac 360
ctactaaaca gccccagctt cccagaagac gctaagaaac gagcgcggcg gatcctgcag 420
gcttgtggtg gaaacagctt gggatcttac agtgctagcc aaggcgttaa ctgtatccgt 480
gaagatgtgg cagcctttat caccaggaga gatggtgtgc ctgcagaccc agacaacatt 540
tacctgacta ctggagctag cgacggtatt tctacaatcc tgaagctcct ggtctccggt 600
ggtggcaagt cacggaccgg cgtgatgatt cccatccccc agtatccctt gtactccgcg 660
gtcatctctg agctcgacgc ggtgcaggtc aactactatc tggatgaaga gaactgctgg 720
gctttgaatg tggacgagct ccggcgggca ttgcggcaag ccaaagacca ctgtgaccct 780
aaagttctct gcattatcaa ccccggaaac cccacaggcc aggtacaaag cagaaagtgc 840
atagaagatg tgattcactt tgcctgggaa gagaagcttt ttctcctggc tgatgaggtg 900
taccaggaca acgtgtactc tccagactgc agattccact cgtttaagaa agtgctttac 960
cagatggggc acgagtactc cagcaacgtg gagctcgcct ccttccactc cacctccaag 1020
ggctacatgg gcgagtgtgg ctacagaggg ggctacatgg aggtgatcaa tttgcacccc 1080
gagatcaaag gccagctggt gaagctactc tcggttcgcc tctgtccgcc agtgtcagga 1140
caggccgcca tggacattgt tgtgaatcca ccggaaccag gagaggagtc ctttgagcaa 1200
ttcagcaggg aaaaagaatt cgtccttggt aatctggcca aaaaagcaaa gctgacagaa 1260
gatctgttta accaagtccc agggatccag tgcaacccct tgcaaggagc tatgtatgcg 1320
ttccctcgga ttctcatccc tgccaaggcc gtggaggcag ctcagtccca taaaatggct 1380
ccagacatgt tctactgcat gaagctcctg gaggagactg gcatctgtgt cgtgcctggc 1440
agtggctttg ggcagcgaga aggcacttac cacttcagaa tgaccattct ccctccggtg 1500
gataaactga agaccgtgct ccacaaggtg aaagactttc acctgaagtt cctggagcag 1560
tactcatga 1569
<210> 8
<211> 522
<212> PRT
<213> Mus musculus
<400> 8
Met Gln Arg Ala Ala Val Leu Val Arg Arg Gly Ser Cys Pro Arg Ala
1 5 10 15
Ser Gly Pro Trp Gly Arg Ser His Ser Ser Ala Ala Ala Glu Ala Ser
20 25 30
Ala Ala Leu Lys Val Arg Pro Glu Arg Ser Pro Arg Asp Arg Ile Leu
35 40 45
Thr Leu Glu Ser Met Asn Pro Gln Val Lys Ala Val Glu Tyr Ala Val
50 55 60
Arg Gly Pro Ile Val Leu Lys Ala Gly Glu Ile Glu Met Glu Leu Gln
65 70 75 80
Arg Gly Ile Lys Lys Pro Phe Thr Glu Val Ile Arg Ala Asn Ile Gly
85 90 95
Asp Ala His Ala Met Gly Gln Gln Pro Ile Thr Phe Leu Arg Gln Val
100 105 110
Met Ala Leu Cys Thr Tyr Pro Asn Leu Leu Asn Ser Pro Ser Phe Pro
115 120 125
Glu Asp Ala Lys Lys Arg Ala Arg Arg Ile Leu Gln Ala Cys Gly Gly
130 135 140
Asn Ser Leu Gly Ser Tyr Ser Ala Ser Gln Gly Val Asn Cys Ile Arg
145 150 155 160
Glu Asp Val Ala Ala Phe Ile Thr Arg Arg Asp Gly Val Pro Ala Asp
165 170 175
Pro Asp Asn Ile Tyr Leu Thr Thr Gly Ala Ser Asp Gly Ile Ser Thr
180 185 190
Ile Leu Lys Leu Leu Val Ser Gly Gly Gly Lys Ser Arg Thr Gly Val
195 200 205
Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Val Ile Ser Glu
210 215 220
Leu Asp Ala Val Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn Cys Trp
225 230 235 240
Ala Leu Asn Val Asp Glu Leu Arg Arg Ala Leu Arg Gln Ala Lys Asp
245 250 255
His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn Pro Thr
260 265 270
Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile His Phe Ala
275 280 285
Trp Glu Glu Lys Leu Phe Leu Leu Ala Asp Glu Val Tyr Gln Asp Asn
290 295 300
Val Tyr Ser Pro Asp Cys Arg Phe His Ser Phe Lys Lys Val Leu Tyr
305 310 315 320
Gln Met Gly His Glu Tyr Ser Ser Asn Val Glu Leu Ala Ser Phe His
325 330 335
Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Tyr Arg Gly Gly Tyr
340 345 350
Met Glu Val Ile Asn Leu His Pro Glu Ile Lys Gly Gln Leu Val Lys
355 360 365
Leu Leu Ser Val Arg Leu Cys Pro Pro Val Ser Gly Gln Ala Ala Met
370 375 380
Asp Ile Val Val Asn Pro Pro Glu Pro Gly Glu Glu Ser Phe Glu Gln
385 390 395 400
Phe Ser Arg Glu Lys Glu Phe Val Leu Gly Asn Leu Ala Lys Lys Ala
405 410 415
Lys Leu Thr Glu Asp Leu Phe Asn Gln Val Pro Gly Ile Gln Cys Asn
420 425 430
Pro Leu Gln Gly Ala Met Tyr Ala Phe Pro Arg Ile Leu Ile Pro Ala
435 440 445
Lys Ala Val Glu Ala Ala Gln Ser His Lys Met Ala Pro Asp Met Phe
450 455 460
Tyr Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val Pro Gly
465 470 475 480
Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr His Phe Arg Met Thr Ile
485 490 495
Leu Pro Pro Val Asp Lys Leu Lys Thr Val Leu His Lys Val Lys Asp
500 505 510
Phe His Leu Lys Phe Leu Glu Gln Tyr Ser
515 520
<210> 9
<211> 1491
<212> DNA
<213> Rattus norvegicus
<400> 9
atggcctcac gggtgaatga tcaaagccag gcttcaagga atgggctgaa gggaaaggtg 60
ctaactctgg acactatgaa cccatgtgtg cggagggtgg agtatgcagt tcgaggaccc 120
attgtgcagc gtgccttgga gctggagcag gagctgcgtc agggtgtgaa gaagccgttt 180
actgaggtca tccgtgccaa cattggggat gcacaagcca tggggcagag acccatcacc 240
ttcttccgcc aggtcctggc cctctgtgtc taccccaatc ttctgagcag tcctgacttc 300
ccagaggatg ccaagagaag ggcagaacgc atcttgcagg cctgcggggg ccacagcctg 360
ggtgcctata gcattagctc tggaatccag ccgatccggg aggatgtggc gcaatacatt 420
gagagaagag acggaggcat ccccgcagac ccgaacaaca tatttctatc cacaggggcc 480
agcgatgcca tcgtgacaat gctcaagctg ctggtatctg gcgagggccg tgcacgaaca 540
ggtgtactca ttcccattcc tcagtaccca ctgtactcag ccgcgctggc tgaactggac 600
gccgtgcaag tggactacta cctggacgaa gagcgcgcct gggctctgga catcgcagag 660
ctgcggcgcg ctctgtgcca ggcacgtgac cgttgctgcc ctcgagtact gtgcgtcatc 720
aaccccggca accccactgg gcaggtgcag acccgtgagt gcatcgaggc cgtaatccgc 780
tttgctttca aagaaggact cttcttgatg gctgatgagg tataccagga caacgtgtat 840
gccgagggct ctcagttcca ttcattcaag aaggtgctca tggagatggg gccaccgtat 900
tccacgcagc aggagcttgc ttctttccac tcagtctcta agggctacat gggcgagtgc 960
gggtttcgtg gtggctatgt ggaggtggta aacatggatg ctgaggtgca gaaacagatg 1020
gggaagctga tgagtgtgcg gctgtgtcca ccagtgccag gccaggcctt gatggacatg 1080
gtggtcagtc cgccaacacc ctccgagccg tccttcaagc agtttcaagc agagagacag 1140
gaggtgctgg ctgaactggc agccaaggct aagctcacgg agcaggtctt caatgaggct 1200
cccgggatcc gctgcaaccc agtgcagggc gccatgtatt ccttccctca agtgcagctg 1260
cccttgaaag cggtgcagcg tgctcaggaa ctgggcctgg cccctgacat gttcttctgc 1320
ctgtgcctcc tggaagagac tggcatctgc gttgtgcccg ggagtggctt tgggcagcag 1380
gagggcacct atcatttccg gatgaccatt ctgcccccca tggagaaact gcggctgctg 1440
ctggaaaaac tcagtcactt ccatgccaag ttcacccatg agtactcctg a 1491
<210> 10
<211> 496
<212> PRT
<213> Rattus norvegicus
<400> 10
Met Ala Ser Arg Val Asn Asp Gln Ser Gln Ala Ser Arg Asn Gly Leu
1 5 10 15
Lys Gly Lys Val Leu Thr Leu Asp Thr Met Asn Pro Cys Val Arg Arg
20 25 30
Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu
35 40 45
Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile
50 55 60
Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr
65 70 75 80
Phe Phe Arg Gln Val Leu Ala Leu Cys Val Tyr Pro Asn Leu Leu Ser
85 90 95
Ser Pro Asp Phe Pro Glu Asp Ala Lys Arg Arg Ala Glu Arg Ile Leu
100 105 110
Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Ile Ser Ser Gly
115 120 125
Ile Gln Pro Ile Arg Glu Asp Val Ala Gln Tyr Ile Glu Arg Arg Asp
130 135 140
Gly Gly Ile Pro Ala Asp Pro Asn Asn Ile Phe Leu Ser Thr Gly Ala
145 150 155 160
Ser Asp Ala Ile Val Thr Met Leu Lys Leu Leu Val Ser Gly Glu Gly
165 170 175
Arg Ala Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr
180 185 190
Ser Ala Ala Leu Ala Glu Leu Asp Ala Val Gln Val Asp Tyr Tyr Leu
195 200 205
Asp Glu Glu Arg Ala Trp Ala Leu Asp Ile Ala Glu Leu Arg Arg Ala
210 215 220
Leu Cys Gln Ala Arg Asp Arg Cys Cys Pro Arg Val Leu Cys Val Ile
225 230 235 240
Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu
245 250 255
Ala Val Ile Arg Phe Ala Phe Lys Glu Gly Leu Phe Leu Met Ala Asp
260 265 270
Glu Val Tyr Gln Asp Asn Val Tyr Ala Glu Gly Ser Gln Phe His Ser
275 280 285
Phe Lys Lys Val Leu Met Glu Met Gly Pro Pro Tyr Ser Thr Gln Gln
290 295 300
Glu Leu Ala Ser Phe His Ser Val Ser Lys Gly Tyr Met Gly Glu Cys
305 310 315 320
Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Glu Val
325 330 335
Gln Lys Gln Met Gly Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val
340 345 350
Pro Gly Gln Ala Leu Met Asp Met Val Val Ser Pro Pro Thr Pro Ser
355 360 365
Glu Pro Ser Phe Lys Gln Phe Gln Ala Glu Arg Gln Glu Val Leu Ala
370 375 380
Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala
385 390 395 400
Pro Gly Ile Arg Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro
405 410 415
Gln Val Gln Leu Pro Leu Lys Ala Val Gln Arg Ala Gln Glu Leu Gly
420 425 430
Leu Ala Pro Asp Met Phe Phe Cys Leu Cys Leu Leu Glu Glu Thr Gly
435 440 445
Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Gln Glu Gly Thr Tyr
450 455 460
His Phe Arg Met Thr Ile Leu Pro Pro Met Glu Lys Leu Arg Leu Leu
465 470 475 480
Leu Glu Lys Leu Ser His Phe His Ala Lys Phe Thr His Glu Tyr Ser
485 490 495
<210> 11
<211> 1125
<212> DNA
<213> Canis familiaris
<400> 11
atgctggctc ttcacggggc cgtggttaag gtgaaacggg gccggctgcg tccagggctt 60
ggcgctacgc ctgatgccgg gatcgagggc ctgaccacct gttgcctcct ctttgctcag 120
ggtatcaaga aaccgttcac cgaggtcatc cgcgccaaca tcggggacgc ccaggccatg 180
ggccagcagc ctataacctt cctccgacag gtgatggcac tgtgcaccta ccccaacctg 240
ctggacagcc ccagcttccc agaagatgct aagaaacgag cccggaggat cctacaggct 300
tgtggcggga acagcctggg gtcctacagt gccagccagg gcgtcaactg catccgcgag 360
gacgtggccg cctacgtcac caggagggac ggcggggtgc ccgcggaccc cttcaacatt 420
tacctgacca ctggagccag cgacggcatt tctacgatcc tgaagatcct ggtgtccggg 480
ggtggcaagt cgcggacggg cgtgctgatc cccatcccac agtaccccct ctactcggcc 540
gtcatctccg agctcgacgc catccaggtg aactactact tggacgagga gaactgctgg 600
gccctcgacg tgaacgagct ccggcgggcc gtgcaggagg ctaaggacca ctgtaacccc 660
aaggtgctgt gcatcatcaa ccccgggaac cccacaggtc aggtgcaaag caggaagtgc 720
atagaggacg tcatccactt tgcctgggaa gagaagctct ttctcctggc agatgaggtg 780
taccaggaca acgtgtactc tccggactgc agattccact ccttcaagaa ggtgctctac 840
gagatggggc ccgagtactc gagcaacgtg gagcttgcgt ccttccactc tacctccaag 900
ggctacatgg gcgagtacgt tggccttggc ttcctcccgc ggccccacca ctcggccctg 960
cccgctggcg gcctgctgcg cggggaacac ggggcccatc tcagggggcc tgtgcatgag 1020
ctcagccctg gtgcagggac gcccgtgcgg cgaggtcctg ctggggcccc gggctccccg 1080
cgcttcctgc cgggcccacg ctgctgccct gggactgaac cctga 1125
<210> 12
<211> 374
<212> PRT
<213> Canis familiaris
<400> 12
Met Leu Ala Leu His Gly Ala Val Val Lys Val Lys Arg Gly Arg Leu
1 5 10 15
Arg Pro Gly Leu Gly Ala Thr Pro Asp Ala Gly Ile Glu Gly Leu Thr
20 25 30
Thr Cys Cys Leu Leu Phe Ala Gln Gly Ile Lys Lys Pro Phe Thr Glu
35 40 45
Val Ile Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Gln Pro
50 55 60
Ile Thr Phe Leu Arg Gln Val Met Ala Leu Cys Thr Tyr Pro Asn Leu
65 70 75 80
Leu Asp Ser Pro Ser Phe Pro Glu Asp Ala Lys Lys Arg Ala Arg Arg
85 90 95
Ile Leu Gln Ala Cys Gly Gly Asn Ser Leu Gly Ser Tyr Ser Ala Ser
100 105 110
Gln Gly Val Asn Cys Ile Arg Glu Asp Val Ala Ala Tyr Val Thr Arg
115 120 125
Arg Asp Gly Gly Val Pro Ala Asp Pro Phe Asn Ile Tyr Leu Thr Thr
130 135 140
Gly Ala Ser Asp Gly Ile Ser Thr Ile Leu Lys Ile Leu Val Ser Gly
145 150 155 160
Gly Gly Lys Ser Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro
165 170 175
Leu Tyr Ser Ala Val Ile Ser Glu Leu Asp Ala Ile Gln Val Asn Tyr
180 185 190
Tyr Leu Asp Glu Glu Asn Cys Trp Ala Leu Asp Val Asn Glu Leu Arg
195 200 205
Arg Ala Val Gln Glu Ala Lys Asp His Cys Asn Pro Lys Val Leu Cys
210 215 220
Ile Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Ser Arg Lys Cys
225 230 235 240
Ile Glu Asp Val Ile His Phe Ala Trp Glu Glu Lys Leu Phe Leu Leu
245 250 255
Ala Asp Glu Val Tyr Gln Asp Asn Val Tyr Ser Pro Asp Cys Arg Phe
260 265 270
His Ser Phe Lys Lys Val Leu Tyr Glu Met Gly Pro Glu Tyr Ser Ser
275 280 285
Asn Val Glu Leu Ala Ser Phe His Ser Thr Ser Lys Gly Tyr Met Gly
290 295 300
Glu Tyr Val Gly Leu Gly Phe Leu Pro Arg Pro His His Ser Ala Leu
305 310 315 320
Pro Ala Gly Gly Leu Leu Arg Gly Glu His Gly Ala His Leu Arg Gly
325 330 335
Pro Val His Glu Leu Ser Pro Gly Ala Gly Thr Pro Val Arg Arg Gly
340 345 350
Pro Ala Gly Ala Pro Gly Ser Pro Arg Phe Leu Pro Gly Pro Arg Cys
355 360 365
Cys Pro Gly Thr Glu Pro
370
<210> 13
<211> 1623
<212> DNA
<213> Xenopus laevis
<400> 13
atgagtattc tcagggggtc tctgaggggg gtgctggccc ccaatgcttc tgttgtgttt 60
aggagcagat tgccccccca gctcacttct gccctcctgt gccccctcag gtcgctgtcg 120
ggaacgccgc tggctgaacc ggacgggaaa gttactcgca agatgtctga gaacgggaca 180
tgcaaccgga tcctgactct ggactccatg aatccctgta tccagaaagt ggaatacgca 240
gtgaggggcc ccatcgtcat cagggctgtg gagctggaga aagaactgca gcagggggta 300
aagaagccat tcacagaagt gatcaaagcc aatattggag atgcccatgc aatgggtcag 360
aaacccgtta ctttcctgcg ccaggtgagt gccatctgtc tgtaccccga gctcatgaat 420
gacaacaagt tcccggagga cgtgaagcag aaggcagcga ggatcctgca ggcgtgtggc 480
gggcacagca ttggggccta cagcgccagc caagggattg aagtgatccg acaagatgtg 540
gccaagtaca ttgagagaag ggatgggggt atcctgtccg accccaacaa catctacctc 600
tccacggggg ccagtgactc tattgtgaca atgctgaagt tgctggtgtc tgggcaaggg 660
aaatcccgaa ctggggtgat gatcccgatc cctcaatacc cgctgtattc tgcggccctg 720
gcagagttgg atgccgtgca ggttaattat tatctggatg aggagaactg ctgggccctg 780
gacatcaacg agctgcggag agcactagcg gaggcccgaa aacattgtga ccccaaagta 840
ctgtgcatta ttaacccagg aaaccctaca gggcaggtgc agagccgcaa gtgcattgag 900
gacgtgatcc gttttgctgc tgaagagaat cttttcctga tggcggatga ggtctaccaa 960
gataatgtct atgccaaggg ctgtgccttt cactccttca aaaaggttct ctttgagatg 1020
ggacccaagt attcagaaac gctggaactg gcttctttcc actccacatc caagggatac 1080
atgggagagt gcgggttcag agggggttac atggaagtga tcaatatgga tcctgctgtc 1140
aagcaacaac taaccaagtt ggtgtctgtg cgtctgtgcc ccccagtgcc ggggcaagta 1200
ttacttgatg tgattgtgaa cccaccaaag cctggggagc cctcctacaa acagttcatt 1260
tctgagaaac aggctgtgct caataacctg gctgagaaag ctcgtctcac tgaggaaatc 1320
ctaaaccaag cgcctgggat ccgctgtaac ccagtccagg gagccatgta ctcgtttcca 1380
aggatccaca tcccagagaa ggccattaaa cttgcacagg ctgagggaca ggccccagac 1440
atgttcttct gtatgaagct gctggaagag actggcattt gtgtggtacc tggaagtgga 1500
tttggacaac gtgagggcac tcaccatttc aggatgacca tcctccctcc caccgataag 1560
ctgaagagcc tgttagagcg gctgaaggat ttccaccaga aatttatgga tgagtattcc 1620
tag 1623
<210> 14
<211> 540
<212> PRT
<213> Xenopus laevis
<400> 14
Met Ser Ile Leu Arg Gly Ser Leu Arg Gly Val Leu Ala Pro Asn Ala
1 5 10 15
Ser Val Val Phe Arg Ser Arg Leu Pro Pro Gln Leu Thr Ser Ala Leu
20 25 30
Leu Cys Pro Leu Arg Ser Leu Ser Gly Thr Pro Leu Ala Glu Pro Asp
35 40 45
Gly Lys Val Thr Arg Lys Met Ser Glu Asn Gly Thr Cys Asn Arg Ile
50 55 60
Leu Thr Leu Asp Ser Met Asn Pro Cys Ile Gln Lys Val Glu Tyr Ala
65 70 75 80
Val Arg Gly Pro Ile Val Ile Arg Ala Val Glu Leu Glu Lys Glu Leu
85 90 95
Gln Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile Lys Ala Asn Ile
100 105 110
Gly Asp Ala His Ala Met Gly Gln Lys Pro Val Thr Phe Leu Arg Gln
115 120 125
Val Ser Ala Ile Cys Leu Tyr Pro Glu Leu Met Asn Asp Asn Lys Phe
130 135 140
Pro Glu Asp Val Lys Gln Lys Ala Ala Arg Ile Leu Gln Ala Cys Gly
145 150 155 160
Gly His Ser Ile Gly Ala Tyr Ser Ala Ser Gln Gly Ile Glu Val Ile
165 170 175
Arg Gln Asp Val Ala Lys Tyr Ile Glu Arg Arg Asp Gly Gly Ile Leu
180 185 190
Ser Asp Pro Asn Asn Ile Tyr Leu Ser Thr Gly Ala Ser Asp Ser Ile
195 200 205
Val Thr Met Leu Lys Leu Leu Val Ser Gly Gln Gly Lys Ser Arg Thr
210 215 220
Gly Val Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Ala Leu
225 230 235 240
Ala Glu Leu Asp Ala Val Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn
245 250 255
Cys Trp Ala Leu Asp Ile Asn Glu Leu Arg Arg Ala Leu Ala Glu Ala
260 265 270
Arg Lys His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn
275 280 285
Pro Thr Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile Arg
290 295 300
Phe Ala Ala Glu Glu Asn Leu Phe Leu Met Ala Asp Glu Val Tyr Gln
305 310 315 320
Asp Asn Val Tyr Ala Lys Gly Cys Ala Phe His Ser Phe Lys Lys Val
325 330 335
Leu Phe Glu Met Gly Pro Lys Tyr Ser Glu Thr Leu Glu Leu Ala Ser
340 345 350
Phe His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Phe Arg Gly
355 360 365
Gly Tyr Met Glu Val Ile Asn Met Asp Pro Ala Val Lys Gln Gln Leu
370 375 380
Thr Lys Leu Val Ser Val Arg Leu Cys Pro Pro Val Pro Gly Gln Val
385 390 395 400
Leu Leu Asp Val Ile Val Asn Pro Pro Lys Pro Gly Glu Pro Ser Tyr
405 410 415
Lys Gln Phe Ile Ser Glu Lys Gln Ala Val Leu Asn Asn Leu Ala Glu
420 425 430
Lys Ala Arg Leu Thr Glu Glu Ile Leu Asn Gln Ala Pro Gly Ile Arg
435 440 445
Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro Arg Ile His Ile
450 455 460
Pro Glu Lys Ala Ile Lys Leu Ala Gln Ala Glu Gly Gln Ala Pro Asp
465 470 475 480
Met Phe Phe Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val
485 490 495
Pro Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr His His Phe Arg Met
500 505 510
Thr Ile Leu Pro Pro Thr Asp Lys Leu Lys Ser Leu Leu Glu Arg Leu
515 520 525
Lys Asp Phe His Gln Lys Phe Met Asp Glu Tyr Ser
530 535 540
<210> 15
<211> 1707
<212> DNA
<213> Drosophila melanogaster
<400> 15
atgagtcgaa tgctaattaa acctgctgcc gccacagttt cggccgcatt gcagcagcac 60
cagcgccagc agcaacagta cgttattcgc cgctggaaat cgttcctgca caacaacagc 120
aacaatgcca atcgacgtgc ggcgaaatca acggcaacag caacggtgac ggcagcagcg 180
acgtcgcagc gccatggaac aagcggcgat ttcattcaac cgttagacgt ccgccgttcc 240
ttttcaacca gccacaaaat gccgtcgtcg tcgaaagcgc tcacactgga taacataaat 300
cccaacttta ttgccatgga atatgccgtt cgcggtcctc tggtgattcg tgctggggaa 360
atcgagaagg aactggaaaa gggtgtcaag aagccattcg accaggtgat ccgtgccaac 420
atcggtgatt gccatgcgat gggccagcag cccttgacct tcctgcgaca gctgttggcg 480
ctgaccttcg agacacgtct gctggattca cccgattatc ccgaggacgt caagaagcgc 540
gcctgtgcca ttttgaacgg ctgccagggt caatcggtgg gctcgtacac cgactccgcc 600
ggtctggagg tggtgcgtcg ccaggttgct cagtacatcg agaaaaggga tggcggcatc 660
gcctccaatt ggcaggacat ctatctaacc ggcggtgcct ctcccggcat caagagcatt 720
ctctccatga tcaacgccga ggtgggatgc aaggcgcctg gtgtcatggt gcccattccg 780
cagtacccac tgtactcggc caccatctcc gaatacggca tgaccaaggt ggattactat 840
ctggaggagg agaccggttg gagcctggac aggaaggagc tgcaacggtc ctacgatgag 900
gcgaagaagg tctgcaatcc gcgtgccctg gtcgtgatca atccgggcaa tcccaccgga 960
caggtactga cccgcgagaa catcgaggag atcattaagt tcgcacacga taacaaggtg 1020
ctggtgctgg ccgatgaggt gtaccaggac aatgtctacg acaagaactc caagttctgg 1080
tcgttcaaga aggtggccta cgaaatgggc gacccctatc gtaatctgga aatggtcagt 1140
ttcctgtcca cctcgaaggg ctatctgggc gagtgcggca ttcgcggcgg ttacatggag 1200
gttctcaatc ttgatcccaa ggtcaaggcc atgctgacca agtcgataac ggcggcgctt 1260
tgcagcacca ccgctggcca ggtggccgtg agtgccctgg tcaatccacc gcagcccgga 1320
gagccatcat acgatctgta caagaaggag cgcgatggca ttctggccgc tctaaaagaa 1380
cgggccgagc tcgtccacaa ggcactgaac agcttcgaag gctacaaggt taaccccgta 1440
cagggcgcca tgtacgtctt tccacagatc gagatcccgc ccaaggcgat cgaggcggcc 1500
aaggccaagg gcatggcccc cgatgttttc tacgcatttg agctgctcga gacgagcggc 1560
atttgcattg ttcctggcag tggatttggt cagaagcccg gcacgtggca tttccgaagc 1620
acgatcctcc cgcaaacgga caagctgaag ctgatgatgg agaagttccg tgtgttccac 1680
gccgagttca tgaagaagta caagtag 1707
<210> 16
<211> 568
<212> PRT
<213> Drosophila melanogaster
<400> 16
Met Ser Arg Met Leu Ile Lys Pro Ala Ala Ala Thr Val Ser Ala Ala
1 5 10 15
Leu Gln Gln His Gln Arg Gln Gln Gln Gln Tyr Val Ile Arg Arg Trp
20 25 30
Lys Ser Phe Leu His Asn Asn Ser Asn Asn Ala Asn Arg Arg Ala Ala
35 40 45
Lys Ser Thr Ala Thr Ala Thr Val Thr Ala Ala Ala Thr Ser Gln Arg
50 55 60
His Gly Thr Ser Gly Asp Phe Ile Gln Pro Leu Asp Val Arg Arg Ser
65 70 75 80
Phe Ser Thr Ser His Lys Met Pro Ser Ser Ser Lys Ala Leu Thr Leu
85 90 95
Asp Asn Ile Asn Pro Asn Phe Ile Ala Met Glu Tyr Ala Val Arg Gly
100 105 110
Pro Leu Val Ile Arg Ala Gly Glu Ile Glu Lys Glu Leu Glu Lys Gly
115 120 125
Val Lys Lys Pro Phe Asp Gln Val Ile Arg Ala Asn Ile Gly Asp Cys
130 135 140
His Ala Met Gly Gln Gln Pro Leu Thr Phe Leu Arg Gln Leu Leu Ala
145 150 155 160
Leu Thr Phe Glu Thr Arg Leu Leu Asp Ser Pro Asp Tyr Pro Glu Asp
165 170 175
Val Lys Lys Arg Ala Cys Ala Ile Leu Asn Gly Cys Gln Gly Gln Ser
180 185 190
Val Gly Ser Tyr Thr Asp Ser Ala Gly Leu Glu Val Val Arg Arg Gln
195 200 205
Val Ala Gln Tyr Ile Glu Lys Arg Asp Gly Gly Ile Ala Ser Asn Trp
210 215 220
Gln Asp Ile Tyr Leu Thr Gly Gly Ala Ser Pro Gly Ile Lys Ser Ile
225 230 235 240
Leu Ser Met Ile Asn Ala Glu Val Gly Cys Lys Ala Pro Gly Val Met
245 250 255
Val Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Ser Glu Tyr
260 265 270
Gly Met Thr Lys Val Asp Tyr Tyr Leu Glu Glu Glu Thr Gly Trp Ser
275 280 285
Leu Asp Arg Lys Glu Leu Gln Arg Ser Tyr Asp Glu Ala Lys Lys Val
290 295 300
Cys Asn Pro Arg Ala Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly
305 310 315 320
Gln Val Leu Thr Arg Glu Asn Ile Glu Glu Ile Ile Lys Phe Ala His
325 330 335
Asp Asn Lys Val Leu Val Leu Ala Asp Glu Val Tyr Gln Asp Asn Val
340 345 350
Tyr Asp Lys Asn Ser Lys Phe Trp Ser Phe Lys Lys Val Ala Tyr Glu
355 360 365
Met Gly Asp Pro Tyr Arg Asn Leu Glu Met Val Ser Phe Leu Ser Thr
370 375 380
Ser Lys Gly Tyr Leu Gly Glu Cys Gly Ile Arg Gly Gly Tyr Met Glu
385 390 395 400
Val Leu Asn Leu Asp Pro Lys Val Lys Ala Met Leu Thr Lys Ser Ile
405 410 415
Thr Ala Ala Leu Cys Ser Thr Thr Ala Gly Gln Val Ala Val Ser Ala
420 425 430
Leu Val Asn Pro Pro Gln Pro Gly Glu Pro Ser Tyr Asp Leu Tyr Lys
435 440 445
Lys Glu Arg Asp Gly Ile Leu Ala Ala Leu Lys Glu Arg Ala Glu Leu
450 455 460
Val His Lys Ala Leu Asn Ser Phe Glu Gly Tyr Lys Val Asn Pro Val
465 470 475 480
Gln Gly Ala Met Tyr Val Phe Pro Gln Ile Glu Ile Pro Pro Lys Ala
485 490 495
Ile Glu Ala Ala Lys Ala Lys Gly Met Ala Pro Asp Val Phe Tyr Ala
500 505 510
Phe Glu Leu Leu Glu Thr Ser Gly Ile Cys Ile Val Pro Gly Ser Gly
515 520 525
Phe Gly Gln Lys Pro Gly Thr Trp His Phe Arg Ser Thr Ile Leu Pro
530 535 540
Gln Thr Asp Lys Leu Lys Leu Met Met Glu Lys Phe Arg Val Phe His
545 550 555 560
Ala Glu Phe Met Lys Lys Tyr Lys
565
<210> 17
<211> 1515
<212> DNA
<213> Caenorhabditis elegans
<400> 17
atgcgaaccg tacaagcaat ttccggactc gtcacaagtc gctttttcgg cacatccact 60
agaatcatgg ctagcggaaa gactttgaac acctccaaca tcaatccaaa tgttatcaag 120
atggagtatg ctgttcgtgg accaatcgtg atccgtgccg tggagcttga aaaagagctt 180
gcgaccggtg ctcagaagcc attcccaaat gtcatcaagg ctaatattgg agatgctcat 240
gctatgggtc aaaagccgat tactttcatt cgccagctcc tcgcgtgtat tgtcaaccca 300
gagatcatga aaacggacaa atcaattcca tctgatgtta tcgaacatgc aaatgcattc 360
cttggaagtt gtggaggaaa atccgctgga gcatacagtc agagtacggg agtggaaatt 420
gtacgaaaac acgtggcaga gtatattaag agacgtgatg gaggaattcc atgcaattca 480
gaagatgtct gcttgtctgg aggagcttct gaatcaatcc gaaatgttct caaacttttt 540
atcaatcata acaacgcaaa gaaagtcgga gtcatgattc caattccaca atatccactc 600
tattctgcca ctatcgaaga attcggactt ggacaagttg gatactattt gagtgaatcg 660
tctaattggt ccatggatga agctgaactt gaaagatctt tcaatgatca ctgcaaagaa 720
tacgatattc gagttttgtg tatcatcaat ccaggaaatc ctaccggaca agcactttct 780
cgtgaaaata ttgagactat catcaagttt gcacaaaaga agaacctgtt ccttatggct 840
gatgaggttt atcaagacaa cgtctacgct caaggatcgc aattccattc attcaagaag 900
gttcttgtgg agatgggaga gccatacaat aaaatggaat tggcttcttt ccattcggta 960
tccaaaggat acatgggaga atgcggaatg cgtggaggat atgttgaatt cttgaatctc 1020
gacccagaag tgtatgtcct tttcaaaaaa atgatctctg ccaaattgtg ctccacagta 1080
ctcggacaag ccgtcattga tgccgttgtg aatccaccaa aggaaggaga tgcatcgtat 1140
gctctgtgga aacaagaaaa ggatgcagta cttgcttctc ttaaggaacg tgctacactc 1200
gtcgagaagg catacagtag cattgatgga atcagctgta atccagttca aggagccatg 1260
tacgctttcc cgcaaatcac gattccacag agagctgttg aaaaagctca gtctttgaac 1320
caacaacctg atttcttcta tgctatgcaa cttcttgaga ccaccggaat ctgtatcgtg 1380
ccaggaagtg gatttggaca aaaagacgga acttatcatt tcagaacgac aattcttcca 1440
cagccagaac tcttcaaaga catgctctcc cggttcactg atttccacca aaaattcctt 1500
gccgaataca agtag 1515
<210> 18
<211> 504
<212> PRT
<213> Caenorhabditis elegans
<400> 18
Met Arg Thr Val Gln Ala Ile Ser Gly Leu Val Thr Ser Arg Phe Phe
1 5 10 15
Gly Thr Ser Thr Arg Ile Met Ala Ser Gly Lys Thr Leu Asn Thr Ser
20 25 30
Asn Ile Asn Pro Asn Val Ile Lys Met Glu Tyr Ala Val Arg Gly Pro
35 40 45
Ile Val Ile Arg Ala Val Glu Leu Glu Lys Glu Leu Ala Thr Gly Ala
50 55 60
Gln Lys Pro Phe Pro Asn Val Ile Lys Ala Asn Ile Gly Asp Ala His
65 70 75 80
Ala Met Gly Gln Lys Pro Ile Thr Phe Ile Arg Gln Leu Leu Ala Cys
85 90 95
Ile Val Asn Pro Glu Ile Met Lys Thr Asp Lys Ser Ile Pro Ser Asp
100 105 110
Val Ile Glu His Ala Asn Ala Phe Leu Gly Ser Cys Gly Gly Lys Ser
115 120 125
Ala Gly Ala Tyr Ser Gln Ser Thr Gly Val Glu Ile Val Arg Lys His
130 135 140
Val Ala Glu Tyr Ile Lys Arg Arg Asp Gly Gly Ile Pro Cys Asn Ser
145 150 155 160
Glu Asp Val Cys Leu Ser Gly Gly Ala Ser Glu Ser Ile Arg Asn Val
165 170 175
Leu Lys Leu Phe Ile Asn His Asn Asn Ala Lys Lys Val Gly Val Met
180 185 190
Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Glu Glu Phe
195 200 205
Gly Leu Gly Gln Val Gly Tyr Tyr Leu Ser Glu Ser Ser Asn Trp Ser
210 215 220
Met Asp Glu Ala Glu Leu Glu Arg Ser Phe Asn Asp His Cys Lys Glu
225 230 235 240
Tyr Asp Ile Arg Val Leu Cys Ile Ile Asn Pro Gly Asn Pro Thr Gly
245 250 255
Gln Ala Leu Ser Arg Glu Asn Ile Glu Thr Ile Ile Lys Phe Ala Gln
260 265 270
Lys Lys Asn Leu Phe Leu Met Ala Asp Glu Val Tyr Gln Asp Asn Val
275 280 285
Tyr Ala Gln Gly Ser Gln Phe His Ser Phe Lys Lys Val Leu Val Glu
290 295 300
Met Gly Glu Pro Tyr Asn Lys Met Glu Leu Ala Ser Phe His Ser Val
305 310 315 320
Ser Lys Gly Tyr Met Gly Glu Cys Gly Met Arg Gly Gly Tyr Val Glu
325 330 335
Phe Leu Asn Leu Asp Pro Glu Val Tyr Val Leu Phe Lys Lys Met Ile
340 345 350
Ser Ala Lys Leu Cys Ser Thr Val Leu Gly Gln Ala Val Ile Asp Ala
355 360 365
Val Val Asn Pro Pro Lys Glu Gly Asp Ala Ser Tyr Ala Leu Trp Lys
370 375 380
Gln Glu Lys Asp Ala Val Leu Ala Ser Leu Lys Glu Arg Ala Thr Leu
385 390 395 400
Val Glu Lys Ala Tyr Ser Ser Ile Asp Gly Ile Ser Cys Asn Pro Val
405 410 415
Gln Gly Ala Met Tyr Ala Phe Pro Gln Ile Thr Ile Pro Gln Arg Ala
420 425 430
Val Glu Lys Ala Gln Ser Leu Asn Gln Gln Pro Asp Phe Phe Tyr Ala
435 440 445
Met Gln Leu Leu Glu Thr Thr Gly Ile Cys Ile Val Pro Gly Ser Gly
450 455 460
Phe Gly Gln Lys Asp Gly Thr Tyr His Phe Arg Thr Thr Ile Leu Pro
465 470 475 480
Gln Pro Glu Leu Phe Lys Asp Met Leu Ser Arg Phe Thr Asp Phe His
485 490 495
Gln Lys Phe Leu Ala Glu Tyr Lys
500
<210> 19
<211> 1458
<212> DNA
<213> Oryza sativa japonica
<400> 19
atgttcggcg gcggcggcgg cggcgggagg aagccgctgg actacgagga gctgaacgag 60
aacgtgaaga aggtgcagta cgcggtgcgg ggggagctgt acctgcgcgc ctccgagctc 120
cagaaggagg gcaagaagat catcttcacc aacgtcggca acccacacgc gctcggccag 180
aagccgctca ccttcccccg ccaggttgtg gcgctgtgcc aggccccctt cctgctcgat 240
gatcccaacg tcggccttat cttccccgcc gacgccatcg cgcgggccaa gcactacctc 300
gccatggcac ccggtggact aggtgcttac agtgattccc gaggtatccc tggtattagg 360
aaggaagtcg ccgagttcat cgagaggcgt gatggttatc caagtgatcc agaacttatt 420
tacctcacag atggtgccag caaaggtgtg atgcaaatgc tgaataccat tatcagaaat 480
gagagagatg ggattctggt tcctgttcca caatacccgc tttattctgc tgccatttcc 540
ctctttggtg gttctctcgt gccatactac ttagaagaag aggctaactg gggacttgac 600
ttcgtcaatc tccgacagac tgtggcgtca gcgcggtcaa agggaatcac tgttcgagca 660
atggtgatta tcaacccagg aaaccctact ggccaatgcc ttagtgaagg aaacataaag 720
gaacttctca aattctgctt ccatgagaac ttagttctgc ttgcagatga agtctatcaa 780
cagaacattt atcaagatga gcgcccattt ataagtgcta gaaaggttct gtttgacatg 840
ggtcctccta tgagcaggga agttcagctg gtttctttcc atactgtgtc aaaaggatat 900
tggggggagt gtggacaacg tggagggtat tttgaaatga caaatcttcc tcccaagaca 960
gtagacgaga tctacaaggt tgcatcaatc gcactcagtc caaatgttcc tgggcagatc 1020
tttatgggtt taatggttaa ccctcctaag cctggagata tctcttatct gaagttttct 1080
gctgaaagca agtctatcct cgagtctttg aggaggagag cacgcctgat gacagatggt 1140
ttcaatagtt gccgaaatgt tgtctgcaat ttcacagaag gagctatgta ctctttcccc 1200
caaatacgct taccaccaaa agctatagat gcagccaaaa gggctggcaa agcggccgat 1260
gttttctact gcctcaagct tcttgaagca actggaatat ccactgttcc agggtcaggt 1320
ttcggacaaa aagaaggggt gttccacctg aggacgacca tcctgccagc tgaggaggac 1380
atgcctgcca tcatgaccag cttcaagaag ttcaacgaca ctttcatgga tcagtacgat 1440
ggctactcca ggatgtga 1458
<210> 20
<211> 485
<212> PRT
<213> Oryza sativa japonica
<400> 20
Met Phe Gly Gly Gly Gly Gly Gly Gly Arg Lys Pro Leu Asp Tyr Glu
1 5 10 15
Glu Leu Asn Glu Asn Val Lys Lys Val Gln Tyr Ala Val Arg Gly Glu
20 25 30
Leu Tyr Leu Arg Ala Ser Glu Leu Gln Lys Glu Gly Lys Lys Ile Ile
35 40 45
Phe Thr Asn Val Gly Asn Pro His Ala Leu Gly Gln Lys Pro Leu Thr
50 55 60
Phe Pro Arg Gln Val Val Ala Leu Cys Gln Ala Pro Phe Leu Leu Asp
65 70 75 80
Asp Pro Asn Val Gly Leu Ile Phe Pro Ala Asp Ala Ile Ala Arg Ala
85 90 95
Lys His Tyr Leu Ala Met Ala Pro Gly Gly Leu Gly Ala Tyr Ser Asp
100 105 110
Ser Arg Gly Ile Pro Gly Ile Arg Lys Glu Val Ala Glu Phe Ile Glu
115 120 125
Arg Arg Asp Gly Tyr Pro Ser Asp Pro Glu Leu Ile Tyr Leu Thr Asp
130 135 140
Gly Ala Ser Lys Gly Val Met Gln Met Leu Asn Thr Ile Ile Arg Asn
145 150 155 160
Glu Arg Asp Gly Ile Leu Val Pro Val Pro Gln Tyr Pro Leu Tyr Ser
165 170 175
Ala Ala Ile Ser Leu Phe Gly Gly Ser Leu Val Pro Tyr Tyr Leu Glu
180 185 190
Glu Glu Ala Asn Trp Gly Leu Asp Phe Val Asn Leu Arg Gln Thr Val
195 200 205
Ala Ser Ala Arg Ser Lys Gly Ile Thr Val Arg Ala Met Val Ile Ile
210 215 220
Asn Pro Gly Asn Pro Thr Gly Gln Cys Leu Ser Glu Gly Asn Ile Lys
225 230 235 240
Glu Leu Leu Lys Phe Cys Phe His Glu Asn Leu Val Leu Leu Ala Asp
245 250 255
Glu Val Tyr Gln Gln Asn Ile Tyr Gln Asp Glu Arg Pro Phe Ile Ser
260 265 270
Ala Arg Lys Val Leu Phe Asp Met Gly Pro Pro Met Ser Arg Glu Val
275 280 285
Gln Leu Val Ser Phe His Thr Val Ser Lys Gly Tyr Trp Gly Glu Cys
290 295 300
Gly Gln Arg Gly Gly Tyr Phe Glu Met Thr Asn Leu Pro Pro Lys Thr
305 310 315 320
Val Asp Glu Ile Tyr Lys Val Ala Ser Ile Ala Leu Ser Pro Asn Val
325 330 335
Pro Gly Gln Ile Phe Met Gly Leu Met Val Asn Pro Pro Lys Pro Gly
340 345 350
Asp Ile Ser Tyr Leu Lys Phe Ser Ala Glu Ser Lys Ser Ile Leu Glu
355 360 365
Ser Leu Arg Arg Arg Ala Arg Leu Met Thr Asp Gly Phe Asn Ser Cys
370 375 380
Arg Asn Val Val Cys Asn Phe Thr Glu Gly Ala Met Tyr Ser Phe Pro
385 390 395 400
Gln Ile Arg Leu Pro Pro Lys Ala Ile Asp Ala Ala Lys Arg Ala Gly
405 410 415
Lys Ala Ala Asp Val Phe Tyr Cys Leu Lys Leu Leu Glu Ala Thr Gly
420 425 430
Ile Ser Thr Val Pro Gly Ser Gly Phe Gly Gln Lys Glu Gly Val Phe
435 440 445
His Leu Arg Thr Thr Ile Leu Pro Ala Glu Glu Asp Met Pro Ala Ile
450 455 460
Met Thr Ser Phe Lys Lys Phe Asn Asp Thr Phe Met Asp Gln Tyr Asp
465 470 475 480
Gly Tyr Ser Arg Met
485
<210> 21
<211> 1452
<212> DNA
<213> Oryza sativa japonica
<400> 21
atggctgctc ccagcgtcgc cgtcgacaac ctcaacccca aggttttgaa ttgtgagtat 60
gcagtgcgtg gagagattgt gatccatgct cagcgcctgc agcaacagct acagactcaa 120
ccagggtctc ttccttttga tgagatccta tactgcaaca ttgggaatcc ccagtctctt 180
ggtcagaagc cagttacatt cttcagggag gttattgctc tttgtgatca tccatgcttg 240
ttggaaaagg aggaaaccaa atcattgttc agtgctgatg ccatttctcg agcaacaaca 300
attcttgcct cgattcctgg aagagcaact ggagcataca gccacagcca gggcatcaaa 360
gggctgcgtg atgcaattgc tgctggaatt gcatcacgtg acggataccc tgcaaatgca 420
gacgacattt tccttactga cggagcaagc cctggagttc acatgatgat gcagttactg 480
ataaggaacg agaaagatgg cattctctgc ccaattcctc aatatccttt gtactcagcc 540
tccattgctc ttcatggtgg agctcttgtc ccgtattatc ttaatgaatc aacaggctgg 600
ggtttggaga tctctgacct taagaagcaa ctcgaagatt ctcggttgaa aggcattgat 660
gttagggctt tggtagttat caatccagga aatccaactg ggcaggttct tgctgaggaa 720
aaccaacggg acatagtgaa gttctgcaaa aatgagggac ttgttcttct ggctgatgag 780
gtgtaccaag agaacatcta tgttgacaac aagaaattta actctttcaa gaagatagcg 840
agatccatgg gatacaacga ggatgatctc cctttagtat catttcaatc tgtttctaag 900
ggatattatg gtgaatgtgg caaaagagga ggctacatgg agattactgg cttcagtgct 960
ccagttagag agcagatcta caaagtggcg tcagtgaact tatgttccaa tatcactggc 1020
cagatccttg ccagcctcgt catgaatcca ccaaaggctg gagatgcatc atatgcttca 1080
tacaaggcag agaaagatgg aatcctccaa tcattagctc gccgtgcaaa ggcattggag 1140
aatgctttca acagtcttga gggaattaca tgcaacaaaa ctgaaggagc aatgtacctc 1200
ttccctcagc ttagtctgcc acaaaaggca attgacgctg ctaaagctgc taacaaagca 1260
cctgatgctt tctatgccct tcgtctcctc gaggcaaccg gaattgttgt tgtccctgga 1320
tctggatttg gccaagttcc tggcacatgg cacatcagat gcacaatcct gccacaggag 1380
gagaagatcc ccgcgatcat ctcccgcttc aaggcattcc atgagggctt catggcagcg 1440
taccgcgact ga 1452
<210> 22
<211> 483
<212> PRT
<213> Oryza sativa japonica
<400> 22
Met Ala Ala Pro Ser Val Ala Val Asp Asn Leu Asn Pro Lys Val Leu
1 5 10 15
Asn Cys Glu Tyr Ala Val Arg Gly Glu Ile Val Ile His Ala Gln Arg
20 25 30
Leu Gln Gln Gln Leu Gln Thr Gln Pro Gly Ser Leu Pro Phe Asp Glu
35 40 45
Ile Leu Tyr Cys Asn Ile Gly Asn Pro Gln Ser Leu Gly Gln Lys Pro
50 55 60
Val Thr Phe Phe Arg Glu Val Ile Ala Leu Cys Asp His Pro Cys Leu
65 70 75 80
Leu Glu Lys Glu Glu Thr Lys Ser Leu Phe Ser Ala Asp Ala Ile Ser
85 90 95
Arg Ala Thr Thr Ile Leu Ala Ser Ile Pro Gly Arg Ala Thr Gly Ala
100 105 110
Tyr Ser His Ser Gln Gly Ile Lys Gly Leu Arg Asp Ala Ile Ala Ala
115 120 125
Gly Ile Ala Ser Arg Asp Gly Tyr Pro Ala Asn Ala Asp Asp Ile Phe
130 135 140
Leu Thr Asp Gly Ala Ser Pro Gly Val His Met Met Met Gln Leu Leu
145 150 155 160
Ile Arg Asn Glu Lys Asp Gly Ile Leu Cys Pro Ile Pro Gln Tyr Pro
165 170 175
Leu Tyr Ser Ala Ser Ile Ala Leu His Gly Gly Ala Leu Val Pro Tyr
180 185 190
Tyr Leu Asn Glu Ser Thr Gly Trp Gly Leu Glu Ile Ser Asp Leu Lys
195 200 205
Lys Gln Leu Glu Asp Ser Arg Leu Lys Gly Ile Asp Val Arg Ala Leu
210 215 220
Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Ala Glu Glu
225 230 235 240
Asn Gln Arg Asp Ile Val Lys Phe Cys Lys Asn Glu Gly Leu Val Leu
245 250 255
Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Val Asp Asn Lys Lys
260 265 270
Phe Asn Ser Phe Lys Lys Ile Ala Arg Ser Met Gly Tyr Asn Glu Asp
275 280 285
Asp Leu Pro Leu Val Ser Phe Gln Ser Val Ser Lys Gly Tyr Tyr Gly
290 295 300
Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Ile Thr Gly Phe Ser Ala
305 310 315 320
Pro Val Arg Glu Gln Ile Tyr Lys Val Ala Ser Val Asn Leu Cys Ser
325 330 335
Asn Ile Thr Gly Gln Ile Leu Ala Ser Leu Val Met Asn Pro Pro Lys
340 345 350
Ala Gly Asp Ala Ser Tyr Ala Ser Tyr Lys Ala Glu Lys Asp Gly Ile
355 360 365
Leu Gln Ser Leu Ala Arg Arg Ala Lys Ala Leu Glu Asn Ala Phe Asn
370 375 380
Ser Leu Glu Gly Ile Thr Cys Asn Lys Thr Glu Gly Ala Met Tyr Leu
385 390 395 400
Phe Pro Gln Leu Ser Leu Pro Gln Lys Ala Ile Asp Ala Ala Lys Ala
405 410 415
Ala Asn Lys Ala Pro Asp Ala Phe Tyr Ala Leu Arg Leu Leu Glu Ala
420 425 430
Thr Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Val Pro Gly
435 440 445
Thr Trp His Ile Arg Cys Thr Ile Leu Pro Gln Glu Glu Lys Ile Pro
450 455 460
Ala Ile Ile Ser Arg Phe Lys Ala Phe His Glu Gly Phe Met Ala Ala
465 470 475 480
Tyr Arg Asp
<210> 23
<211> 1722
<212> DNA
<213> Cyanidioschyzon merolae
<400> 23
atgcaacacg tgttggcggg tcgggtaggg cgtagaacgt ttgggctgct caatttcagt 60
tatctccgta tagggcgaag gaataggagc cacggtgtaa gcgcagggat gccgcacgaa 120
gccgacggga cgcgccggcg aaaagcgctc gacttgcgaa ccataaacca gcgcgtggta 180
gcggcgcagt acgctgtgcg tggtgaattg cccactcgcg ctgcgcgact gcaacagact 240
ctagaaaaag gaggaccaga agctgccgca ctgccgttta aggaaataat ttactgcaac 300
atcggaaatc cacaggcact tgggaacccg ccattcactt accaccggcg ggtcatggca 360
ctgtgcgact gtccggactt ggcagcggca ctcccggaga aggagcgtga aaaactgttc 420
cccgccgacg tgcgcgaagc gacggaacga atcctacgct ccgctggact cggcggtacg 480
ggagcgtact cggactccca gggagtgccg atcattcgac aagatgtggc agagttcatg 540
aacaagcggg acggcattca cgaggactcc gaatttgcag ctcgagtgaa ggatgtgttt 600
ttgacaaatg gttcatcgag cgcgatcctc atgctcatgg cgctgttgag cggttccgac 660
gcagcgctca gcgcggacgg taccaacggc gtatcgcatg gacgcgaaac acgttccatg 720
cgaccgggtg tgctgattcc agtgccacag tatccgattt actcggcgct ttgcacagtc 780
ctagggatcg aagcgctaca ctaccatctc gttcaggagc agaattggtc tattcaagtc 840
acggagctaa cggaacaggt tcgacaggca cgctcccgtg gcatcgaagc gcgcgccctg 900
gtcgtcatct caccggggaa tcctaccgga caattgcttc atccggcgaa catgcgagaa 960
ctgatggatt ttgcgtatcg agagggactc ctactcctgg ctgatgaggt ctatgcagac 1020
aacgtgtact tggatggtcg gaaattcgag tcgtttcgaa gagtgctgca ttcgagtatg 1080
ccggaggagg tccaggagtc gctggaactc gtgtcgctct actccgccag caaagggctt 1140
gtcggagagt gtggtcgccg cggcggctac atgctgttat caccgggcgt tacaaacgag 1200
gcacgtgaac aactcctgaa actcgctagt atcatgctct gcccaaacct cggcggacag 1260
gtcatgatcg actgtgtggt gcgcccgccg gagccgggcc aaccatcata tgagctctac 1320
cagaaagaga aacttgagcg ttatgaaagt ttgcggcgac gtgcgcatcg cgttgtagag 1380
gcatttaaga gtatgcgcgg tgtgcaatgc aaccctagtg agggcgccat gtacgccttt 1440
ccgagcatca ctgtgggcac gaaagcactc caggcagcgc aaaagtccaa tatgccgctg 1500
gatacgtttt actgtgtcag ccttttggaa cgaactggta tctgtgtggt gccgggcgca 1560
gggttcggca tgcattccaa tgaaccaaca tccagtgtcc cgaacggttc gtgtcggttt 1620
tacctgcgga cgactatttt gcctccggag gaaaagctcg aacccgtcat cgcgctgctt 1680
cgggctcatc acgaggagtt tcttcaaaag tatcccccgg ac 1722
<210> 24
<211> 574
<212> PRT
<213> Cyanidioschyzon merolae
<400> 24
Met Gln His Val Leu Ala Gly Arg Val Gly Arg Arg Thr Phe Gly Leu
1 5 10 15
Leu Asn Phe Ser Tyr Leu Arg Ile Gly Arg Arg Asn Arg Ser His Gly
20 25 30
Val Ser Ala Gly Met Pro His Glu Ala Asp Gly Thr Arg Arg Arg Lys
35 40 45
Ala Leu Asp Leu Arg Thr Ile Asn Gln Arg Val Val Ala Ala Gln Tyr
50 55 60
Ala Val Arg Gly Glu Leu Pro Thr Arg Ala Ala Arg Leu Gln Gln Thr
65 70 75 80
Leu Glu Lys Gly Gly Pro Glu Ala Ala Ala Leu Pro Phe Lys Glu Ile
85 90 95
Ile Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Gly Asn Pro Pro Phe
100 105 110
Thr Tyr His Arg Arg Val Met Ala Leu Cys Asp Cys Pro Asp Leu Ala
115 120 125
Ala Ala Leu Pro Glu Lys Glu Arg Glu Lys Leu Phe Pro Ala Asp Val
130 135 140
Arg Glu Ala Thr Glu Arg Ile Leu Arg Ser Ala Gly Leu Gly Gly Thr
145 150 155 160
Gly Ala Tyr Ser Asp Ser Gln Gly Val Pro Ile Ile Arg Gln Asp Val
165 170 175
Ala Glu Phe Met Asn Lys Arg Asp Gly Ile His Glu Asp Ser Glu Phe
180 185 190
Ala Ala Arg Val Lys Asp Val Phe Leu Thr Asn Gly Ser Ser Ser Ala
195 200 205
Ile Leu Met Leu Met Ala Leu Leu Ser Gly Ser Asp Ala Ala Leu Ser
210 215 220
Ala Asp Gly Thr Asn Gly Val Ser His Gly Arg Glu Thr Arg Ser Met
225 230 235 240
Arg Pro Gly Val Leu Ile Pro Val Pro Gln Tyr Pro Ile Tyr Ser Ala
245 250 255
Leu Cys Thr Val Leu Gly Ile Glu Ala Leu His Tyr His Leu Val Gln
260 265 270
Glu Gln Asn Trp Ser Ile Gln Val Thr Glu Leu Thr Glu Gln Val Arg
275 280 285
Gln Ala Arg Ser Arg Gly Ile Glu Ala Arg Ala Leu Val Val Ile Ser
290 295 300
Pro Gly Asn Pro Thr Gly Gln Leu Leu His Pro Ala Asn Met Arg Glu
305 310 315 320
Leu Met Asp Phe Ala Tyr Arg Glu Gly Leu Leu Leu Leu Ala Asp Glu
325 330 335
Val Tyr Ala Asp Asn Val Tyr Leu Asp Gly Arg Lys Phe Glu Ser Phe
340 345 350
Arg Arg Val Leu His Ser Ser Met Pro Glu Glu Val Gln Glu Ser Leu
355 360 365
Glu Leu Val Ser Leu Tyr Ser Ala Ser Lys Gly Leu Val Gly Glu Cys
370 375 380
Gly Arg Arg Gly Gly Tyr Met Leu Leu Ser Pro Gly Val Thr Asn Glu
385 390 395 400
Ala Arg Glu Gln Leu Leu Lys Leu Ala Ser Ile Met Leu Cys Pro Asn
405 410 415
Leu Gly Gly Gln Val Met Ile Asp Cys Val Val Arg Pro Pro Glu Pro
420 425 430
Gly Gln Pro Ser Tyr Glu Leu Tyr Gln Lys Glu Lys Leu Glu Arg Tyr
435 440 445
Glu Ser Leu Arg Arg Arg Ala His Arg Val Val Glu Ala Phe Lys Ser
450 455 460
Met Arg Gly Val Gln Cys Asn Pro Ser Glu Gly Ala Met Tyr Ala Phe
465 470 475 480
Pro Ser Ile Thr Val Gly Thr Lys Ala Leu Gln Ala Ala Gln Lys Ser
485 490 495
Asn Met Pro Leu Asp Thr Phe Tyr Cys Val Ser Leu Leu Glu Arg Thr
500 505 510
Gly Ile Cys Val Val Pro Gly Ala Gly Phe Gly Met His Ser Asn Glu
515 520 525
Pro Thr Ser Ser Val Pro Asn Gly Ser Cys Arg Phe Tyr Leu Arg Thr
530 535 540
Thr Ile Leu Pro Pro Glu Glu Lys Leu Glu Pro Val Ile Ala Leu Leu
545 550 555 560
Arg Ala His His Glu Glu Phe Leu Gln Lys Tyr Pro Pro Asp
565 570
<210> 25
<211> 1779
<212> DNA
<213> Saccharomyces cerevisiae
<400> 25
atgttatcac tgtctgccaa aaatcacttc acagtgagta attctataac tcacgttatt 60
aagtcatatc atataaggac tctcacttca agcgcagaaa aaatgccaca tatcactact 120
cctttttcta cctcagccag tagtacaaag ttaaaagctt tcaggaaagt tagacccgtc 180
ctacagagac atagctcttc ctggattgtt gctcaaaatc atagacgttc attatctggt 240
caatcttcgc taaacgacct gcgtcatttg aatcgctttc cacaccacac gttgaaaact 300
tcgaataacg agttttatcc cgccgaacaa ttgactttgg aagacgtaaa tgaaaatgtc 360
ttgaaggcta agtacgccgt tagaggtgcc atcccaatga gagctgaaga attgaaagct 420
caactggaga aggatcctca atctctgcca tttgacagga ttatcaacgc caatattggt 480
aatcctcagc aactacaaca gaaacctctg acttactaca gacaggtctt gtctctctta 540
caatacccag aactattaaa ccaaaacgaa cagcagctag ttgattcgaa attgtttaaa 600
ctagatgcca ttaaacgtgc aaagagttta atggaagata tcggtggttc tgttggtgct 660
tactcttctt ctcaaggtgt agaaggtata aggaaaagtg tcgctgaatt tataacgaag 720
agggacgaag gcgagatatc atacccagag gatattttcc taactgctgg tgcatccgca 780
gctgtcaatt acttgttatc aattttctgt agagggccag aaacgggtgt cttgattcca 840
attcctcaat atccattata taccgctact ctagctttga acaattctca agctttacca 900
tactatttag atgagaattc aggttggtca actaatccag aagaaattga aactgtcgtc 960
aaagaggcta tacagaacga aatcaaacct acagttctag tggttatcaa tccaggtaat 1020
cctacaggag ctgtcctatc acctgagtct atagctcaga tttttgaagt cgcagccaag 1080
tacggtacag tagtgatagc tgacgaagtt tatcaagaaa atatcttccc gggcaccaag 1140
ttccattcta tgaagaaaat tttgagacat ttacagaggg aacatccagg taaattcgat 1200
aatgttcagc tagcttcttt gcattcgact tctaagggtg tttctggtga atgtggtcaa 1260
aggggtggct acatggaact cactggattc agccatgaga tgagacaagt tatcttgaaa 1320
ctagcctcga tttcattgtg tcccgttgtc acaggtcaag ctttggttga tttgatggtt 1380
cgtccaccag tggaagggga ggaatcattc gagtcggacc aagcagaacg taactccatc 1440
catgaaaagt taattacaag agcaatgaca ctgtatgaga catttaactc tttagaaggc 1500
attgaatgtc aaaagcctca aggtgccatg tatttattcc ctaagataga cttacctttc 1560
aaggcagttc aagaagctcg ccacttagag ttaactccgg atgaatttta ttgtaagaag 1620
ttgttagaat ctactggcat ttgcactgtt cccggttctg ggtttggtca agaacctggt 1680
acttaccatt taagaacaac atttttggca cctggtctgg aatggattaa gaaatgggaa 1740
agtttccata aagaattttt tgaccaatac cgtgactga 1779
<210> 26
<211> 592
<212> PRT
<213> Saccharomyces cerevisiae
<400> 26
Met Leu Ser Leu Ser Ala Lys Asn His Phe Thr Val Ser Asn Ser Ile
1 5 10 15
Thr His Val Ile Lys Ser Tyr His Ile Arg Thr Leu Thr Ser Ser Ala
20 25 30
Glu Lys Met Pro His Ile Thr Thr Pro Phe Ser Thr Ser Ala Ser Ser
35 40 45
Thr Lys Leu Lys Ala Phe Arg Lys Val Arg Pro Val Leu Gln Arg His
50 55 60
Ser Ser Ser Trp Ile Val Ala Gln Asn His Arg Arg Ser Leu Ser Gly
65 70 75 80
Gln Ser Ser Leu Asn Asp Leu Arg His Leu Asn Arg Phe Pro His His
85 90 95
Thr Leu Lys Thr Ser Asn Asn Glu Phe Tyr Pro Ala Glu Gln Leu Thr
100 105 110
Leu Glu Asp Val Asn Glu Asn Val Leu Lys Ala Lys Tyr Ala Val Arg
115 120 125
Gly Ala Ile Pro Met Arg Ala Glu Glu Leu Lys Ala Gln Leu Glu Lys
130 135 140
Asp Pro Gln Ser Leu Pro Phe Asp Arg Ile Ile Asn Ala Asn Ile Gly
145 150 155 160
Asn Pro Gln Gln Leu Gln Gln Lys Pro Leu Thr Tyr Tyr Arg Gln Val
165 170 175
Leu Ser Leu Leu Gln Tyr Pro Glu Leu Leu Asn Gln Asn Glu Gln Gln
180 185 190
Leu Val Asp Ser Lys Leu Phe Lys Leu Asp Ala Ile Lys Arg Ala Lys
195 200 205
Ser Leu Met Glu Asp Ile Gly Gly Ser Val Gly Ala Tyr Ser Ser Ser
210 215 220
Gln Gly Val Glu Gly Ile Arg Lys Ser Val Ala Glu Phe Ile Thr Lys
225 230 235 240
Arg Asp Glu Gly Glu Ile Ser Tyr Pro Glu Asp Ile Phe Leu Thr Ala
245 250 255
Gly Ala Ser Ala Ala Val Asn Tyr Leu Leu Ser Ile Phe Cys Arg Gly
260 265 270
Pro Glu Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Thr
275 280 285
Ala Thr Leu Ala Leu Asn Asn Ser Gln Ala Leu Pro Tyr Tyr Leu Asp
290 295 300
Glu Asn Ser Gly Trp Ser Thr Asn Pro Glu Glu Ile Glu Thr Val Val
305 310 315 320
Lys Glu Ala Ile Gln Asn Glu Ile Lys Pro Thr Val Leu Val Val Ile
325 330 335
Asn Pro Gly Asn Pro Thr Gly Ala Val Leu Ser Pro Glu Ser Ile Ala
340 345 350
Gln Ile Phe Glu Val Ala Ala Lys Tyr Gly Thr Val Val Ile Ala Asp
355 360 365
Glu Val Tyr Gln Glu Asn Ile Phe Pro Gly Thr Lys Phe His Ser Met
370 375 380
Lys Lys Ile Leu Arg His Leu Gln Arg Glu His Pro Gly Lys Phe Asp
385 390 395 400
Asn Val Gln Leu Ala Ser Leu His Ser Thr Ser Lys Gly Val Ser Gly
405 410 415
Glu Cys Gly Gln Arg Gly Gly Tyr Met Glu Leu Thr Gly Phe Ser His
420 425 430
Glu Met Arg Gln Val Ile Leu Lys Leu Ala Ser Ile Ser Leu Cys Pro
435 440 445
Val Val Thr Gly Gln Ala Leu Val Asp Leu Met Val Arg Pro Pro Val
450 455 460
Glu Gly Glu Glu Ser Phe Glu Ser Asp Gln Ala Glu Arg Asn Ser Ile
465 470 475 480
His Glu Lys Leu Ile Thr Arg Ala Met Thr Leu Tyr Glu Thr Phe Asn
485 490 495
Ser Leu Glu Gly Ile Glu Cys Gln Lys Pro Gln Gly Ala Met Tyr Leu
500 505 510
Phe Pro Lys Ile Asp Leu Pro Phe Lys Ala Val Gln Glu Ala Arg His
515 520 525
Leu Glu Leu Thr Pro Asp Glu Phe Tyr Cys Lys Lys Leu Leu Glu Ser
530 535 540
Thr Gly Ile Cys Thr Val Pro Gly Ser Gly Phe Gly Gln Glu Pro Gly
545 550 555 560
Thr Tyr His Leu Arg Thr Thr Phe Leu Ala Pro Gly Leu Glu Trp Ile
565 570 575
Lys Lys Trp Glu Ser Phe His Lys Glu Phe Phe Asp Gln Tyr Arg Asp
580 585 590
<210> 27
<211> 1524
<212> DNA
<213> Saccharomyces cerevisiae
<400> 27
atgacaatga cacaccaaca ggatttgaaa ggtgtgttca ccgcaaagga tttggatttt 60
aagcccgctg gcaagattac taaaaaagat ttgaatacag gtgtcactaa ggcagaatat 120
gctgtaagag gagctattcc aaccagagct gacgagctaa aagaggaatt gaaaaaaaac 180
ccagaagttt tgcctttcga tgatattatc aatgcgaaca ttggtaatcc gcagcaactg 240
gatcagaagc ctttgacctt taccaggcaa gtactggcca tcctggagta cccggaaatt 300
ttacgagtag gccataatga actggcttct ttgaacttgt tttccaggga cgccttggaa 360
agagctgagc gcctcttgaa tgatattggc ggttctatag gggcatattc gcattctcaa 420
ggtgtgccag gaataaggca aacagttgct gacttcatta ctagaagaga cggcggtgag 480
cccgctacac cggaagatat ttatttaacc actggcgctt cgtccgcggc aacttctttg 540
ttatctttat tgtgtaaaga ttctcaaaca ggcctgctga ttccaattcc gcagtatccg 600
ctttatactg catccgcatc tcttttcaat gcacaagtgc tgccatacta cttagatgag 660
gagtcaaatt ggtctacaaa cagcgacgaa attgaaaaag tagtgcaaga tgctttgaaa 720
aaacagatca gaccatctgt gctgatagtt attaatccag gtaacccaac cggtgcagtt 780
ctttctgaag aaaccattgc caggatctgt ttgatcgctg cgaaatacgg cattacaatc 840
atttctgatg aggtctatca agaaaacatt ttcaacgatg ttaaatttca ttcgatgaag 900
aaagtcctaa gaaaattgca gcatctttat ccaggaaaat tcgataacgt tcagctcgcc 960
tctttacact ccatttctaa aggattcatg gatgagtgcg gccaaagagg cggttacatg 1020
gaaattattg ggttttctca agaaataaga gatgctcttt tcaaactcat gtctatatcc 1080
atatgttctg ttgtcacagg acaagctgtg gttgatttaa tggtcaaacc accccagcct 1140
ggagacgagt cctatgaaca agatcatgac gaaaggctga aaatttttca tgaaatgcgt 1200
acgagagcaa acttattgta cgagacgttt aaggaactag agggtatcga atgccaaaaa 1260
cctcagggtg caatgtatct tttccctagg cttgttttac ctaagaaagc tctttgtgaa 1320
agcgaacgcc ttggcatcga acctgatgag ttctattgca catctttgct agaatctaca 1380
ggtatttgta ctgtcccagg gtctgggttc ggacaaagac ccgggactta tcatgtgcga 1440
acaacgtttt tggctccagg gactaaatgg attcaagact ggaaagaatt tcatcaagat 1500
ttcttcagca agtatcgtaa ttga 1524
<210> 28
<211> 507
<212> PRT
<213> Saccharomyces cerevisiae
<400> 28
Met Thr Met Thr His Gln Gln Asp Leu Lys Gly Val Phe Thr Ala Lys
1 5 10 15
Asp Leu Asp Phe Lys Pro Ala Gly Lys Ile Thr Lys Lys Asp Leu Asn
20 25 30
Thr Gly Val Thr Lys Ala Glu Tyr Ala Val Arg Gly Ala Ile Pro Thr
35 40 45
Arg Ala Asp Glu Leu Lys Glu Glu Leu Lys Lys Asn Pro Glu Val Leu
50 55 60
Pro Phe Asp Asp Ile Ile Asn Ala Asn Ile Gly Asn Pro Gln Gln Leu
65 70 75 80
Asp Gln Lys Pro Leu Thr Phe Thr Arg Gln Val Leu Ala Ile Leu Glu
85 90 95
Tyr Pro Glu Ile Leu Arg Val Gly His Asn Glu Leu Ala Ser Leu Asn
100 105 110
Leu Phe Ser Arg Asp Ala Leu Glu Arg Ala Glu Arg Leu Leu Asn Asp
115 120 125
Ile Gly Gly Ser Ile Gly Ala Tyr Ser His Ser Gln Gly Val Pro Gly
130 135 140
Ile Arg Gln Thr Val Ala Asp Phe Ile Thr Arg Arg Asp Gly Gly Glu
145 150 155 160
Pro Ala Thr Pro Glu Asp Ile Tyr Leu Thr Thr Gly Ala Ser Ser Ala
165 170 175
Ala Thr Ser Leu Leu Ser Leu Leu Cys Lys Asp Ser Gln Thr Gly Leu
180 185 190
Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Ser Ala Ser Leu
195 200 205
Phe Asn Ala Gln Val Leu Pro Tyr Tyr Leu Asp Glu Glu Ser Asn Trp
210 215 220
Ser Thr Asn Ser Asp Glu Ile Glu Lys Val Val Gln Asp Ala Leu Lys
225 230 235 240
Lys Gln Ile Arg Pro Ser Val Leu Ile Val Ile Asn Pro Gly Asn Pro
245 250 255
Thr Gly Ala Val Leu Ser Glu Glu Thr Ile Ala Arg Ile Cys Leu Ile
260 265 270
Ala Ala Lys Tyr Gly Ile Thr Ile Ile Ser Asp Glu Val Tyr Gln Glu
275 280 285
Asn Ile Phe Asn Asp Val Lys Phe His Ser Met Lys Lys Val Leu Arg
290 295 300
Lys Leu Gln His Leu Tyr Pro Gly Lys Phe Asp Asn Val Gln Leu Ala
305 310 315 320
Ser Leu His Ser Ile Ser Lys Gly Phe Met Asp Glu Cys Gly Gln Arg
325 330 335
Gly Gly Tyr Met Glu Ile Ile Gly Phe Ser Gln Glu Ile Arg Asp Ala
340 345 350
Leu Phe Lys Leu Met Ser Ile Ser Ile Cys Ser Val Val Thr Gly Gln
355 360 365
Ala Val Val Asp Leu Met Val Lys Pro Pro Gln Pro Gly Asp Glu Ser
370 375 380
Tyr Glu Gln Asp His Asp Glu Arg Leu Lys Ile Phe His Glu Met Arg
385 390 395 400
Thr Arg Ala Asn Leu Leu Tyr Glu Thr Phe Lys Glu Leu Glu Gly Ile
405 410 415
Glu Cys Gln Lys Pro Gln Gly Ala Met Tyr Leu Phe Pro Arg Leu Val
420 425 430
Leu Pro Lys Lys Ala Leu Cys Glu Ser Glu Arg Leu Gly Ile Glu Pro
435 440 445
Asp Glu Phe Tyr Cys Thr Ser Leu Leu Glu Ser Thr Gly Ile Cys Thr
450 455 460
Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Gly Thr Tyr His Val Arg
465 470 475 480
Thr Thr Phe Leu Ala Pro Gly Thr Lys Trp Ile Gln Asp Trp Lys Glu
485 490 495
Phe His Gln Asp Phe Phe Ser Lys Tyr Arg Asn
500 505
<210> 29
<211> 1566
<212> DNA
<213> Ashbya gossypii
<400> 29
atggcaatag ggatgctgag aagaaatagc agcggcaccg ccgtgagcgt tctacagggg 60
cgtgtgcttc gcactcgtag attgagctca gtaaaggacg ggtcgcggtt tgtgcctgcg 120
gaaccgatga cactagcgga cgtgaacgaa aacgtggtca aggcgaagta cgcggtgcgg 180
gggaagattc caacgcgtgc agaggagctg gagcggcggc tggaggagca cccgggctcg 240
ctgccgttca gcaaaatcat ccaagcgaac atcggcaatc cgcagcagct gggccagaag 300
ccgctgacat tctaccggca agtgatctcg ctgatgcaga atccacagtt gctggagatg 360
cccgcagaat ggctgcagca ggcgttcaag gcggatgtgg tggtgcgtgc gcggaggatg 420
ctgcaggacg ccggaggctc cgtgggagcg tactcggcgt cgcagggtgt gaaaggctac 480
cggcgcacgg ttgcgcagtt tattgagcgg cgcgatggga tcccagcgaa tccagacaac 540
gtgtacctga ccgcgggtgc gtcctctgct gtgtcttgtc tgctgtcgac attctgcaag 600
ggaccggaga caggcgtgtt gatcccaatc cctcagtacc cgctgtacac tgctacgatc 660
acacagaata acgcggttgc gctgccgtac tacctaaatg aggctgatgg gtggtctacg 720
aatccagatg agatggaacg tgtcatcctc gattctaaga agaggaacat cgcgcccaaa 780
tgtctggttg tgattaaccc tgggaatccc actggttccg tactgtctgt aaaggatatg 840
gaggctattc taacacttgc tgcgaagtat gggattgtcg ttattgcgga cgaggtatac 900
caggataatg tgtttggcga tgccaagttc cactctatgc gtaaggtgct gaaaaacctt 960
caactcagag agccaacgct ctacaagaat gtccagttag cctctcttca ctcgatctcg 1020
aaggggctct ccggcgaatg tggccagcgt ggtggctaca tggaattgat cggtttccgt 1080
gaggagctca ggaaggtttt cgttaagttg gcttctatat ctctttgtcc agtggttacc 1140
ggacaagctc tagtcgacct tatggttggg cctcccagcc aaggggatcc atcctatgag 1200
caatataccc aggaaacaag gagtatctat cacgaattgg aggaacggtc gcaactgctg 1260
tggaaaacgt tctgttcctt ggagggtata gaatgcaata tgccacaagg tgctctatat 1320
ctattcccta agttgcatct tccacagaaa gctattgaag cggcgcaaaa gctgggtata 1380
ccagcggatg agctctactg tagcgaatta cttgatgaaa caggcatctg cactgtccct 1440
ggaactggtt tcggccaaat cccgggcaca tatcacgtta gaactacgtt tttgccacct 1500
ggtactaagt ggatcgaaag ttggaaggac ttccacaaga aattttatga caagtatagg 1560
gactaa 1566
<210> 30
<211> 521
<212> PRT
<213> Ashbya gossypii
<400> 30
Met Ala Ile Gly Met Leu Arg Arg Asn Ser Ser Gly Thr Ala Val Ser
1 5 10 15
Val Leu Gln Gly Arg Val Leu Arg Thr Arg Arg Leu Ser Ser Val Lys
20 25 30
Asp Gly Ser Arg Phe Val Pro Ala Glu Pro Met Thr Leu Ala Asp Val
35 40 45
Asn Glu Asn Val Val Lys Ala Lys Tyr Ala Val Arg Gly Lys Ile Pro
50 55 60
Thr Arg Ala Glu Glu Leu Glu Arg Arg Leu Glu Glu His Pro Gly Ser
65 70 75 80
Leu Pro Phe Ser Lys Ile Ile Gln Ala Asn Ile Gly Asn Pro Gln Gln
85 90 95
Leu Gly Gln Lys Pro Leu Thr Phe Tyr Arg Gln Val Ile Ser Leu Met
100 105 110
Gln Asn Pro Gln Leu Leu Glu Met Pro Ala Glu Trp Leu Gln Gln Ala
115 120 125
Phe Lys Ala Asp Val Val Val Arg Ala Arg Arg Met Leu Gln Asp Ala
130 135 140
Gly Gly Ser Val Gly Ala Tyr Ser Ala Ser Gln Gly Val Lys Gly Tyr
145 150 155 160
Arg Arg Thr Val Ala Gln Phe Ile Glu Arg Arg Asp Gly Ile Pro Ala
165 170 175
Asn Pro Asp Asn Val Tyr Leu Thr Ala Gly Ala Ser Ser Ala Val Ser
180 185 190
Cys Leu Leu Ser Thr Phe Cys Lys Gly Pro Glu Thr Gly Val Leu Ile
195 200 205
Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Thr Ile Thr Gln Asn Asn
210 215 220
Ala Val Ala Leu Pro Tyr Tyr Leu Asn Glu Ala Asp Gly Trp Ser Thr
225 230 235 240
Asn Pro Asp Glu Met Glu Arg Val Ile Leu Asp Ser Lys Lys Arg Asn
245 250 255
Ile Ala Pro Lys Cys Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly
260 265 270
Ser Val Leu Ser Val Lys Asp Met Glu Ala Ile Leu Thr Leu Ala Ala
275 280 285
Lys Tyr Gly Ile Val Val Ile Ala Asp Glu Val Tyr Gln Asp Asn Val
290 295 300
Phe Gly Asp Ala Lys Phe His Ser Met Arg Lys Val Leu Lys Asn Leu
305 310 315 320
Gln Leu Arg Glu Pro Thr Leu Tyr Lys Asn Val Gln Leu Ala Ser Leu
325 330 335
His Ser Ile Ser Lys Gly Leu Ser Gly Glu Cys Gly Gln Arg Gly Gly
340 345 350
Tyr Met Glu Leu Ile Gly Phe Arg Glu Glu Leu Arg Lys Val Phe Val
355 360 365
Lys Leu Ala Ser Ile Ser Leu Cys Pro Val Val Thr Gly Gln Ala Leu
370 375 380
Val Asp Leu Met Val Gly Pro Pro Ser Gln Gly Asp Pro Ser Tyr Glu
385 390 395 400
Gln Tyr Thr Gln Glu Thr Arg Ser Ile Tyr His Glu Leu Glu Glu Arg
405 410 415
Ser Gln Leu Leu Trp Lys Thr Phe Cys Ser Leu Glu Gly Ile Glu Cys
420 425 430
Asn Met Pro Gln Gly Ala Leu Tyr Leu Phe Pro Lys Leu His Leu Pro
435 440 445
Gln Lys Ala Ile Glu Ala Ala Gln Lys Leu Gly Ile Pro Ala Asp Glu
450 455 460
Leu Tyr Cys Ser Glu Leu Leu Asp Glu Thr Gly Ile Cys Thr Val Pro
465 470 475 480
Gly Thr Gly Phe Gly Gln Ile Pro Gly Thr Tyr His Val Arg Thr Thr
485 490 495
Phe Leu Pro Pro Gly Thr Lys Trp Ile Glu Ser Trp Lys Asp Phe His
500 505 510
Lys Lys Phe Tyr Asp Lys Tyr Arg Asp
515 520
<210> 31
<211> 1563
<212> DNA
<213> Candida albicans
<400> 31
atgcttagag taaattcacg attattaact actcgaaaat ctcaatttat gttcacttct 60
aattccttaa ggtttttagc aacctttaaa cctgcggatc cattgactac tcatgatatc 120
aacccacaaa cggtcgaggc aaaatacgct gtacgtggga aaatcccaat tattgccgat 180
gaattgaatg aattgattca aaagcaacca cagctgcatg gattaccatt tagcaaaatc 240
attaatgcca acattggtaa cccacagcaa ttggaacaac gtccattgac atggtatcgt 300
caagtattgt ctcttttaca atacccggat ttattgaaaa atggagaccc tgaaaccgtt 360
aaatcacttt atcctgaaga tgtgattgag cgagcacaat caattttgaa acacattgga 420
tcaatagggg catactctca ttctcagggt gccagttatt tccgacaatc tattgctgaa 480
tttataacta accgtgatgg tggttatgta tcccacgcca acaacatttt tttaacttcc 540
ggggcatcaa ctgcagtgtc gtatttatta caaattttgt ctgtcaatga aaactccggg 600
ttcttaattc cgatcccaca gtatcctttg tatactgcca ctattgcctt gaataatgcc 660
aagccaattg gttattatct cgatgagtcg aaccattggt caaccaatcc tcaagagatt 720
agagaattga tcgaaaccaa tcaactgcaa ggtattaaca tcaaggcatt ggtggtgatt 780
aacccgggga acccaacggg ggcaatttta tcatcacaag atataattga attgatagat 840
attgctgctg aatatggaat tgtattaatt gccgatgagg tttatcaaga aaatattttc 900
aaagggaaat ttgtttcatt caagaagatt ttgtcggaat taattgagca agaccctcaa 960
acttataaac atgttcaatt agcatcatta cactcgacat cgaaaggtgt tagtggagaa 1020
tgtggacaac gtggtggata tatggaatta gttgggttca aaccggaagt taaagatgtg 1080
gttttcaaat tggcatcgat taatttatgt tctgttgtct ctggtcaagc attaatggag 1140
ttaatgatta atcctcctca agaaggtgat cctagttacc ccttgtacaa aagcgaaacc 1200
gaatcaatcc ataacgattt ggaatcaaga gcagaatcac tctatcaagc ttttttacaa 1260
atggaagata tcaaatgtaa taaaccaatg ggggccatgt atattttccc cactttagat 1320
tttgatccag cccgatacca taagttatat tcgagagcta agaattccaa tttacaaatt 1380
gatgatattt attgtatcga gttattagaa ggtacaggta tttgttgtgt tcctggtaat 1440
ggatttggtc agaaaccaga tacttatcat ttaagaacaa catttttacc accaggtaaa 1500
gaatggattg ataaatggat aaatttccat aaatcattta ttaaaaaata taaagatgaa 1560
tag 1563
<210> 32
<211> 520
<212> PRT
<213> Candida albicans
<400> 32
Met Leu Arg Val Asn Ser Arg Leu Leu Thr Thr Arg Lys Ser Gln Phe
1 5 10 15
Met Phe Thr Ser Asn Ser Leu Arg Phe Leu Ala Thr Phe Lys Pro Ala
20 25 30
Asp Pro Leu Thr Thr His Asp Ile Asn Pro Gln Thr Val Glu Ala Lys
35 40 45
Tyr Ala Val Arg Gly Lys Ile Pro Ile Ile Ala Asp Glu Leu Asn Glu
50 55 60
Leu Ile Gln Lys Gln Pro Gln Ser His Gly Leu Pro Phe Ser Lys Ile
65 70 75 80
Ile Asn Ala Asn Ile Gly Asn Pro Gln Gln Leu Glu Gln Arg Pro Leu
85 90 95
Thr Trp Tyr Arg Gln Val Leu Ser Leu Leu Gln Tyr Pro Asp Leu Leu
100 105 110
Lys Asn Gly Asp Pro Glu Thr Val Lys Ser Leu Tyr Pro Glu Asp Val
115 120 125
Ile Glu Arg Ala Gln Ser Ile Leu Lys His Ile Gly Ser Ile Gly Ala
130 135 140
Tyr Ser His Ser Gln Gly Ala Ser Tyr Phe Arg Gln Ser Ile Ala Glu
145 150 155 160
Phe Ile Thr Asn Arg Asp Gly Gly Tyr Val Ser His Ala Asn Asn Ile
165 170 175
Phe Leu Thr Ser Gly Ala Ser Thr Ala Val Ser Tyr Leu Leu Gln Ile
180 185 190
Leu Ser Val Asn Glu Asn Ser Gly Phe Leu Ile Pro Ile Pro Gln Tyr
195 200 205
Pro Leu Tyr Thr Ala Thr Ile Ala Leu Asn Asn Ala Lys Pro Ile Gly
210 215 220
Tyr Tyr Leu Asp Glu Ser Asn His Trp Ser Thr Asn Pro Gln Glu Ile
225 230 235 240
Arg Glu Leu Ile Glu Thr Asn Gln Ser Gln Gly Ile Asn Ile Lys Ala
245 250 255
Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ile Leu Ser Ser
260 265 270
Gln Asp Ile Ile Glu Leu Ile Asp Ile Ala Ala Glu Tyr Gly Ile Val
275 280 285
Leu Ile Ala Asp Glu Val Tyr Gln Glu Asn Ile Phe Lys Gly Lys Phe
290 295 300
Val Ser Phe Lys Lys Ile Leu Ser Glu Leu Ile Glu Gln Asp Pro Gln
305 310 315 320
Thr Tyr Lys His Val Gln Leu Ala Ser Leu His Ser Thr Ser Lys Gly
325 330 335
Val Ser Gly Glu Cys Gly Gln Arg Gly Gly Tyr Met Glu Leu Val Gly
340 345 350
Phe Lys Pro Glu Val Lys Asp Val Val Phe Lys Leu Ala Ser Ile Asn
355 360 365
Leu Cys Ser Val Val Ser Gly Gln Ala Leu Met Glu Leu Met Ile Asn
370 375 380
Pro Pro Gln Glu Gly Asp Pro Ser Tyr Pro Leu Tyr Lys Ser Glu Thr
385 390 395 400
Glu Ser Ile His Asn Asp Leu Glu Ser Arg Ala Glu Ser Leu Tyr Gln
405 410 415
Ala Phe Leu Gln Met Glu Asp Ile Lys Cys Asn Lys Pro Met Gly Ala
420 425 430
Met Tyr Ile Phe Pro Thr Leu Asp Phe Asp Pro Ala Arg Tyr His Lys
435 440 445
Leu Tyr Ser Arg Ala Lys Asn Ser Asn Leu Gln Ile Asp Asp Ile Tyr
450 455 460
Cys Ile Glu Leu Leu Glu Gly Thr Gly Ile Cys Cys Val Pro Gly Asn
465 470 475 480
Gly Phe Gly Gln Lys Pro Asp Thr Tyr His Leu Arg Thr Thr Phe Leu
485 490 495
Pro Pro Gly Lys Glu Trp Ile Asp Lys Trp Ile Asn Phe His Lys Ser
500 505 510
Phe Ile Lys Lys Tyr Lys Asp Glu
515 520
<210> 33
<211> 1518
<212> DNA
<213> Schizosaccharomyces pombe
<400> 33
atgtttacag attatccaaa tgatattaac tgtgagtctc caagaatgtc ggaccttgat 60
ggattttgtc aaaatgcgtt ctcagacctt aattctttga atcaacaagt atttaaggca 120
aattacgccg tccgtggagc tttagccatt cttgcggacg agatccaaga tgatttactt 180
gaaaatcctt cttcatatcc tttcagtgag atcgtctatg caaacatcgg taatcctcag 240
cagatgggac agtctcctat tacattcgtt cgacaggttt tatctctttg ccagtaccct 300
accttgttag accatgctga ggaaaagtgg tttcaaaatt tgttccctac ggatgtcgta 360
caacgatcca aaatgctctt aaaggaatct ggaagtttgg gtgcctatag tgcttctcaa 420
ggtattccgc ttgtaaggcg acatgttgcg gatttcatta gagcgagaga tggatttgat 480
tgcgagccat ctgacatata tttgactagt ggtgcctcac acgctgcccg gcttataatg 540
actttgataa tcgctaggcc aacagatggt gtaatggttc ccgctcctca atatcctttg 600
tacggtgccc aaattgatct catgagtgga tctatggtat cttacagcct ctccgaggaa 660
aataattggg acattgattt tgaccaattt aaaaaatcat ttgatgaagc atctaaaaaa 720
ggtatcaacg ttcgtttatg cgtggttatt aatcccggta atcctactgg agcttgcatt 780
tctgaaaata gcatggaaaa agttttgcgc tttgctaagg caaagggcat agtattgctt 840
gccgacgaag tctatcaaaa caatatttac caaaacaagt ttcattcttt taggagaaaa 900
cttggtgaat taagagaaaa ggaacccgac aatcattggg accaagtttc gcttatttcc 960
gtaaattctg ttagcaaagg tcaatttggt gaatgtggtc aaagaggtgg atatttggac 1020
gttgttaata ttccagagcc cgctaaggat caaatcctca aactagctac cattgacatt 1080
tgtccaccag ttgctggtca attattagta gacatgctag taaatcctcc taaacctggt 1140
gatcccagtt atgatttgtt catcaaagaa gttgatgaga ttcatgaagc actgcgttta 1200
caatgccgtc agctctacga gggaacaaag cgcatgaaga gagtttcatg tttagaaccc 1260
cacggggcca tgtatttgca tcccagcgtc tcacttcccg aaaagttaat cactacagcc 1320
aaagctcaga aaattcaacc tgacgaattc tatgcgatag aattgcttaa gcgttcaggt 1380
atatgtgttg ttcctggaag tggatttggg caaccagaag gtgattatca tattcgaatc 1440
acgtttttgg ctaaaggaac tgaatacatt gaacgatttg tcaaagctca taatgaaata 1500
atggacctct atgaataa 1518
<210> 34
<211> 505
<212> PRT
<213> Schizosaccharomyces pombe
<400> 34
Met Phe Thr Asp Tyr Pro Asn Asp Ile Asn Cys Glu Ser Pro Arg Met
1 5 10 15
Ser Asp Leu Asp Gly Phe Cys Gln Asn Ala Phe Ser Asp Leu Asn Ser
20 25 30
Leu Asn Gln Gln Val Phe Lys Ala Asn Tyr Ala Val Arg Gly Ala Leu
35 40 45
Ala Ile Leu Ala Asp Glu Ile Gln Asp Asp Leu Leu Glu Asn Pro Ser
50 55 60
Ser Tyr Pro Phe Ser Glu Ile Val Tyr Ala Asn Ile Gly Asn Pro Gln
65 70 75 80
Gln Met Gly Gln Ser Pro Ile Thr Phe Val Arg Gln Val Leu Ser Leu
85 90 95
Cys Gln Tyr Pro Thr Leu Leu Asp His Ala Glu Glu Lys Trp Phe Gln
100 105 110
Asn Leu Phe Pro Thr Asp Val Val Gln Arg Ser Lys Met Leu Leu Lys
115 120 125
Glu Ser Gly Ser Leu Gly Ala Tyr Ser Ala Ser Gln Gly Ile Pro Leu
130 135 140
Val Arg Arg His Val Ala Asp Phe Ile Arg Ala Arg Asp Gly Phe Asp
145 150 155 160
Cys Glu Pro Ser Asp Ile Tyr Leu Thr Ser Gly Ala Ser His Ala Ala
165 170 175
Arg Leu Ile Met Thr Leu Ile Ile Ala Arg Pro Thr Asp Gly Val Met
180 185 190
Val Pro Ala Pro Gln Tyr Pro Leu Tyr Gly Ala Gln Ile Asp Leu Met
195 200 205
Ser Gly Ser Met Val Ser Tyr Ser Leu Ser Glu Glu Asn Asn Trp Asp
210 215 220
Ile Asp Phe Asp Gln Phe Lys Lys Ser Phe Asp Glu Ala Ser Lys Lys
225 230 235 240
Gly Ile Asn Val Arg Leu Cys Val Val Ile Asn Pro Gly Asn Pro Thr
245 250 255
Gly Ala Cys Ile Ser Glu Asn Ser Met Glu Lys Val Leu Arg Phe Ala
260 265 270
Lys Ala Lys Gly Ile Val Leu Leu Ala Asp Glu Val Tyr Gln Asn Asn
275 280 285
Ile Tyr Gln Asn Lys Phe His Ser Phe Arg Arg Lys Leu Gly Glu Leu
290 295 300
Arg Glu Lys Glu Pro Asp Asn His Trp Asp Gln Val Ser Leu Ile Ser
305 310 315 320
Val Asn Ser Val Ser Lys Gly Gln Phe Gly Glu Cys Gly Gln Arg Gly
325 330 335
Gly Tyr Leu Asp Val Val Asn Ile Pro Glu Pro Ala Lys Asp Gln Ile
340 345 350
Leu Lys Leu Ala Thr Ile Asp Ile Cys Pro Pro Val Ala Gly Gln Leu
355 360 365
Leu Val Asp Met Leu Val Asn Pro Pro Lys Pro Gly Asp Pro Ser Tyr
370 375 380
Asp Leu Phe Ile Lys Glu Val Asp Glu Ile His Glu Ala Leu Arg Leu
385 390 395 400
Gln Cys Arg Gln Leu Tyr Glu Gly Thr Lys Arg Met Lys Arg Val Ser
405 410 415
Cys Leu Glu Pro His Gly Ala Met Tyr Leu His Pro Ser Val Ser Leu
420 425 430
Pro Glu Lys Leu Ile Thr Thr Ala Lys Ala Gln Lys Ile Gln Pro Asp
435 440 445
Glu Phe Tyr Ala Ile Glu Leu Leu Lys Arg Ser Gly Ile Cys Val Val
450 455 460
Pro Gly Ser Gly Phe Gly Gln Pro Glu Gly Asp Tyr His Ile Arg Ile
465 470 475 480
Thr Phe Leu Ala Lys Gly Thr Glu Tyr Ile Glu Arg Phe Val Lys Ala
485 490 495
His Asn Glu Ile Met Asp Leu Tyr Glu
500 505
<210> 35
<211> 1500
<212> DNA
<213> Aspergillus nidulans
<400> 35
atgacgaccc gaacgacagt tcctaatgcc tcgcaacgcg ctctatccac tgcggctgtt 60
cgttgcctga ccctagacaa catcaattcg aacgtcaagg ctgccaagta tgctgttcgt 120
ggagaactcg ccgttaaggc ggaggaatac cgtgtgaggc tggctcaggg agacaagaca 180
ctgccgtttg acagcgttat tttcgccaac atcggcaatc ctcagcagct cgaccaaaag 240
cccatcactt tcttccgtca agtcctcagt cttatggaaa accctctact gttaagcaac 300
aaagatgccc ttcgtacgtc tttcggctat caggatgatg ttatcgagcg ggccgagaag 360
cttctggccg aagtccagag tgttggtgca tacagtcaca gccaaggtgc tcccctgatt 420
cgcgagagtg tggccaagtt cattgaagaa cgtgatggct tccccgccga ccctcagtcg 480
ctttacctta ctggtggtgc ctcttccggt gtaaacacca ttctgaacgt catttgtaat 540
gggccaaatg ctggtgtcct agttccgatt ccccagtatc ctctgtacac agccacttta 600
tccctcttga atgctcagtg tgttccttac cacttagaag agcagaaggc ttggggtacc 660
gacatcggta caatcaagaa gtcattggaa caggccaagg ctgcaggcac tgacgttcgc 720
gccattgttg ttatcaaccc tggcaacccg acgggcgctt ctttgagtcc agctgatatc 780
aagagcgtcc ttgacatcgc cgcggaagag aagctcgtcg taattgcgga cgaggtatac 840
cagacaaatg tgtttatcgg agaattcaca tcgttcaaaa agaggctccg ggagctgcag 900
caagaagtac ctggtaaata cgacaatgtc gagcttgttt cccttcacag tacttccaag 960
ggtatggttg gtgaatgtgg ccatcgcgga ggttacttcg aactggttgg atttgatccc 1020
ttggttgctg cccaggtcta caagttcatc agcatcatgc tctgccctcc tgtcatcggg 1080
caatgtttgg ttgaactgat ggtgaaccct ccaaaggagg gcgagcccag ccatgagttg 1140
tatcagaagg agtacaacgg catccgggaa ggactgcgcc agcgcgcctt tgccctctat 1200
gaagcttttc aacggatgga gggtgtcgag tgccaagagc ctcagggtgc catgtacctt 1260
ttccctacta tctcactgcc tcccaaggct attgaagccg ctgccgctga gaaccgcgcc 1320
gcagacgaat tctactgcct ccgtctcctt gacgccactg gtgtttgcgt cgtccctggc 1380
tccggcttcg gtcagaagga gaacacgctc cacttccgca ctactttcct cgcaccaggc 1440
acggactggg tggagcgtat cgtgaagttc cattccgagt tcatggccaa atacaaatag 1500
1500
<210> 36
<211> 499
<212> PRT
<213> Aspergillus nidulans
<400> 36
Met Thr Thr Arg Thr Thr Val Pro Asn Ala Ser Gln Arg Ala Leu Ser
1 5 10 15
Thr Ala Ala Val Arg Cys Leu Thr Leu Asp Asn Ile Asn Ser Asn Val
20 25 30
Lys Ala Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys Ala Glu
35 40 45
Glu Tyr Arg Val Arg Leu Ala Gln Gly Asp Lys Thr Leu Pro Phe Asp
50 55 60
Ser Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp Gln Lys
65 70 75 80
Pro Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Met Glu Asn Pro Leu
85 90 95
Leu Leu Ser Asn Lys Asp Ala Leu Arg Thr Ser Phe Gly Tyr Gln Asp
100 105 110
Asp Val Ile Glu Arg Ala Glu Lys Leu Leu Ala Glu Val Gln Ser Val
115 120 125
Gly Ala Tyr Ser His Ser Gln Gly Ala Pro Leu Ile Arg Glu Ser Val
130 135 140
Ala Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asp Pro Gln Ser
145 150 155 160
Leu Tyr Leu Thr Gly Gly Ala Ser Ser Gly Val Asn Thr Ile Leu Asn
165 170 175
Val Ile Cys Asn Gly Pro Asn Ala Gly Val Leu Val Pro Ile Pro Gln
180 185 190
Tyr Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln Cys Val
195 200 205
Pro Tyr His Leu Glu Glu Gln Lys Ala Trp Gly Thr Asp Ile Gly Thr
210 215 220
Ile Lys Lys Ser Leu Glu Gln Ala Lys Ala Ala Gly Thr Asp Val Arg
225 230 235 240
Ala Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser Leu Ser
245 250 255
Pro Ala Asp Ile Lys Ser Val Leu Asp Ile Ala Ala Glu Glu Lys Leu
260 265 270
Val Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Ile Gly Glu
275 280 285
Phe Thr Ser Phe Lys Lys Arg Leu Arg Glu Leu Gln Gln Glu Val Pro
290 295 300
Gly Lys Tyr Asp Asn Val Glu Leu Val Ser Leu His Ser Thr Ser Lys
305 310 315 320
Gly Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu Leu Val
325 330 335
Gly Phe Asp Pro Leu Val Ala Ala Gln Val Tyr Lys Phe Ile Ser Ile
340 345 350
Met Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Val Glu Leu Met Val
355 360 365
Asn Pro Pro Lys Glu Gly Glu Pro Ser His Glu Leu Tyr Gln Lys Glu
370 375 380
Tyr Asn Gly Ile Arg Glu Gly Leu Arg Gln Arg Ala Phe Ala Leu Tyr
385 390 395 400
Glu Ala Phe Gln Arg Met Glu Gly Val Glu Cys Gln Glu Pro Gln Gly
405 410 415
Ala Met Tyr Leu Phe Pro Thr Ile Ser Leu Pro Pro Lys Ala Ile Glu
420 425 430
Ala Ala Ala Ala Glu Asn Arg Ala Ala Asp Glu Phe Tyr Cys Leu Arg
435 440 445
Leu Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly
450 455 460
Gln Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala Pro Gly
465 470 475 480
Thr Asp Trp Val Glu Arg Ile Val Lys Phe His Ser Glu Phe Met Ala
485 490 495
Lys Tyr Lys
<210> 37
<211> 1506
<212> DNA
<213> Aspergillus fumigatus
<400> 37
atgatcacag aacccaccat gaccgtgcca tataccacca agcggaccgc ttctgatctc 60
ggccctcgtc gtctccgtgc cgataatatc aatcccaacg tcaaggcggc caagtatgct 120
gtccgtggtg agcttgccgt caaggcggag gaataccgtg tgagattggc caagggagac 180
aagtctttgc cctttgacag tgtcattttc gccaatattg gcaaccccca gcagctggat 240
caaaaaccca tcaccttctt ccgtcaagta ctcagtcttc tcgagaacac cgcattgctt 300
gaaaaaccgg aggtcctgcg gtcgtctttc ggctacaacc aggacgtcat tgaccgggct 360
aagaagcttc ttgcggacat tcagagcgtc ggtgcctaca gtcacagcca gggagcacca 420
gtaattcggg agagcgtggc caaattcatc gaggagcgtg atggcttccc cgccaacccg 480
caagacctgt acctctgcgc tggtgcgtcg tccggtgtta gcacgctgct gaatgtcatc 540
tgcaacggtc ccaccgccgg tgtccttgtg ccgattcccc aatatcctct gtacaccgcc 600
accctgtccc ttctcaatgc acagtgcgtc ccataccatt tagaggagga caaggcctgg 660
ggtaccgacg tggaggccat ccggcaatct ctggtgcgcg ccaaggccga gggcactgag 720
gttcgtgcta tcgtcgtcat caaccccggt aacccgacgg gtgcctcgct cagccccgag 780
gacatcaaga gcgtgcttga catcgccgcc gaggagaagc tggtcgtcat cgccgacgag 840
gtgtaccaga ccaacgtctt cgtgggcgag ttcacatcct tcaagaagag actgcgccaa 900
ctccagcagg aggtgcctgg caagtacgac aatgtcgaac ttgcttctct gcacagtgtg 960
tccaagggta tggtgggcga atgcggtcac cgaggcggtt actttgaact cgtcggattc 1020
gaccccttgg tcgcggccga gatttacaag tttgttagca ttatgctgtg cccgccggtg 1080
atcggtcagt gcctggtcga acttatggtg aacccaccca agaagggcga gcccagttac 1140
gagttgtatc agaaggagta caacagcatt agcgatggcc tacacaagcg tgccctcgcc 1200
ctgtacgaag ccttcaagca gatggagggc gttgaatgcc aggagcctca gggcgccatg 1260
tacctcttcc ccagcatcac cctgcccccc aaggccgtcg aagccgccgc tgccgaaggt 1320
cggaacgccg acgaattcta ctgtctgcgc ctcctcgacg caacgggtgt ttgcgtggtc 1380
cccggttccg gctttggaca gaaggagaac acgctccact tccgcacaac cttccttgcc 1440
cccggcactg actgggtcga gcggatcgtc aagttccacg ccgagttcat ggccaagtat 1500
aaatag 1506
<210> 38
<211> 501
<212> PRT
<213> Aspergillus fumigatus
<400> 38
Met Ile Thr Glu Pro Thr Met Thr Val Pro Tyr Thr Thr Lys Arg Thr
1 5 10 15
Ala Ser Asp Leu Gly Pro Arg Arg Leu Arg Ala Asp Asn Ile Asn Pro
20 25 30
Asn Val Lys Ala Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys
35 40 45
Ala Glu Glu Tyr Arg Val Arg Leu Ala Lys Gly Asp Lys Ser Leu Pro
50 55 60
Phe Asp Ser Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp
65 70 75 80
Gln Lys Pro Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Leu Glu Asn
85 90 95
Thr Ala Leu Leu Glu Lys Pro Glu Val Leu Arg Ser Ser Phe Gly Tyr
100 105 110
Asn Gln Asp Val Ile Asp Arg Ala Lys Lys Leu Leu Ala Asp Ile Gln
115 120 125
Ser Val Gly Ala Tyr Ser His Ser Gln Gly Ala Pro Val Ile Arg Glu
130 135 140
Ser Val Ala Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asn Pro
145 150 155 160
Gln Asp Leu Tyr Leu Cys Ala Gly Ala Ser Ser Gly Val Ser Thr Leu
165 170 175
Leu Asn Val Ile Cys Asn Gly Pro Thr Ala Gly Val Leu Val Pro Ile
180 185 190
Pro Gln Tyr Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln
195 200 205
Cys Val Pro Tyr His Leu Glu Glu Asp Lys Ala Trp Gly Thr Asp Val
210 215 220
Glu Ala Ile Arg Gln Ser Leu Val Arg Ala Lys Ala Glu Gly Thr Glu
225 230 235 240
Val Arg Ala Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser
245 250 255
Leu Ser Pro Glu Asp Ile Lys Ser Val Leu Asp Ile Ala Ala Glu Glu
260 265 270
Lys Leu Val Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Val
275 280 285
Gly Glu Phe Thr Ser Phe Lys Lys Arg Leu Arg Gln Leu Gln Gln Glu
290 295 300
Val Pro Gly Lys Tyr Asp Asn Val Glu Leu Ala Ser Leu His Ser Val
305 310 315 320
Ser Lys Gly Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu
325 330 335
Leu Val Gly Phe Asp Pro Leu Val Ala Ala Glu Ile Tyr Lys Phe Val
340 345 350
Ser Ile Met Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Val Glu Leu
355 360 365
Met Val Asn Pro Pro Lys Lys Gly Glu Pro Ser Tyr Glu Leu Tyr Gln
370 375 380
Lys Glu Tyr Asn Ser Ile Ser Asp Gly Leu His Lys Arg Ala Leu Ala
385 390 395 400
Leu Tyr Glu Ala Phe Lys Gln Met Glu Gly Val Glu Cys Gln Glu Pro
405 410 415
Gln Gly Ala Met Tyr Leu Phe Pro Ser Ile Thr Leu Pro Pro Lys Ala
420 425 430
Val Glu Ala Ala Ala Ala Glu Gly Arg Asn Ala Asp Glu Phe Tyr Cys
435 440 445
Leu Arg Leu Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly
450 455 460
Phe Gly Gln Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala
465 470 475 480
Pro Gly Thr Asp Trp Val Glu Arg Ile Val Lys Phe His Ala Glu Phe
485 490 495
Met Ala Lys Tyr Lys
500
<210> 39
<211> 1497
<212> DNA
<213> Aspergillus oryzae
<400> 39
atggcgactc agactacagt gtcctacact actacacgca ccttgtccac cccggctcgt 60
tgcctgaacc ctgataacat caacccccac gtcacggagg ccaagtatgc cgtccgtggt 120
gagcttgctg tcaaggccga ggagtaccgc gtgaaactgg ccaatggaga caaatcgtta 180
cctttcgaca gtgtcatctt tgccaacatc ggcaatcccc aacagctcga ccagaaaccc 240
atcaccttct tccgccaagt actcagtctc ctcgagaacc ctcaactgtt gaacaacacg 300
gaagcacttc gtacatcctt tttttatgaa caagatgtcg ttgaccgggc caagaagctc 360
ctcgcggatg tccagagcgt tggtgcttac agtcacagcc agggagcgcc tgtgatccgc 420
caaagtatcg ccaaattcat tgaggagcgt gatggattcc cggccaaccc tcaggatttg 480
ttctgctgcg ctggtgcctc gtctggcgtc agcaccattc tcaatatcat ctgcaacggc 540
ccccaggccg gtgtcctcgt ccctattccg caataccctc tttacactgc caccctttct 600
ctcctgaatg cgcaatgtgt accctacctc ctcgaagagc aaaaggcttg gggtaccgat 660
gtgactgcca tccgtaactc gttggcgcag gcccggtcta ccggcactga cgttcgttcg 720
attgtggtca tcaaccccgg taaccctact ggtgcctctt tgagcgccga ggatatcaag 780
aatgttcttg accttgctgc ggaggagaag cttgttgtta ttgcggacga ggtttaccag 840
acgaacgttt tcgagggcga gttcatttcg ttcaagaaga ggcttcgtca gctgcaacag 900
gagacaccag gcaagtatga ttatgtggag ttggtctctc ttcacagtgt gtctaaaggt 960
atggtgggcg agtgtggcca ccgtggtggc tactttgagc tggttggatt cgaccctgag 1020
gttcaggccc agatctacaa gcttgtgagc atcggacttt gcccaccagt cattggacag 1080
tgtttgcttg agcttatggt gaacccaccc aaggagggcg aaggcagcta tgagctgtac 1140
cagaaggagt acaatggaat cagcgaggga ctgcacaagc gcgcctttgc cttatacgag 1200
gccttccaac agatggaggg cgttgagtgt cagaaacctc agggtgccat gtatctcttc 1260
cccaccatca ctctcccacc caaggccatt gaggctgcca aggctgagaa ccgtgccgcc 1320
gatgagttct actgcttgcg tctcctcgac gctaccggtg tctgtgttgt ccctggctcc 1380
ggcttcggcc agaaggagaa cactctgcac ttccgcacaa ctttcctggc ccctggcact 1440
gattgggttg aacggatcgt caagttccac tccgaattta tggccaagta caaataa 1497
<210> 40
<211> 498
<212> PRT
<213> Aspergillus oryzae
<400> 40
Met Ala Thr Gln Thr Thr Val Ser Tyr Thr Thr Thr Arg Thr Leu Ser
1 5 10 15
Thr Pro Ala Arg Cys Leu Asn Pro Asp Asn Ile Asn Pro His Val Thr
20 25 30
Glu Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys Ala Glu Glu
35 40 45
Tyr Arg Val Lys Leu Ala Asn Gly Asp Lys Ser Leu Pro Phe Asp Ser
50 55 60
Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp Gln Lys Pro
65 70 75 80
Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Leu Glu Asn Pro Gln Leu
85 90 95
Leu Asn Asn Thr Glu Ala Leu Arg Thr Ser Phe Phe Tyr Glu Gln Asp
100 105 110
Val Val Asp Arg Ala Lys Lys Leu Leu Ala Asp Val Gln Ser Val Gly
115 120 125
Ala Tyr Ser His Ser Gln Gly Ala Pro Val Ile Arg Gln Ser Ile Ala
130 135 140
Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asn Pro Gln Asp Leu
145 150 155 160
Phe Cys Cys Ala Gly Ala Ser Ser Gly Val Ser Thr Ile Leu Asn Ile
165 170 175
Ile Cys Asn Gly Pro Gln Ala Gly Val Leu Val Pro Ile Pro Gln Tyr
180 185 190
Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln Cys Val Pro
195 200 205
Tyr Leu Leu Glu Glu Gln Lys Ala Trp Gly Thr Asp Val Thr Ala Ile
210 215 220
Arg Asn Ser Leu Ala Gln Ala Arg Ser Thr Gly Thr Asp Val Arg Ser
225 230 235 240
Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser Leu Ser Ala
245 250 255
Glu Asp Ile Lys Asn Val Leu Asp Leu Ala Ala Glu Glu Lys Leu Val
260 265 270
Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Glu Gly Glu Phe
275 280 285
Ile Ser Phe Lys Lys Arg Leu Arg Gln Leu Gln Gln Glu Thr Pro Gly
290 295 300
Lys Tyr Asp Tyr Val Glu Leu Val Ser Leu His Ser Val Ser Lys Gly
305 310 315 320
Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu Leu Val Gly
325 330 335
Phe Asp Pro Glu Val Gln Ala Gln Ile Tyr Lys Leu Val Ser Ile Gly
340 345 350
Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Leu Glu Leu Met Val Asn
355 360 365
Pro Pro Lys Glu Gly Glu Gly Ser Tyr Glu Leu Tyr Gln Lys Glu Tyr
370 375 380
Asn Gly Ile Ser Glu Gly Leu His Lys Arg Ala Phe Ala Leu Tyr Glu
385 390 395 400
Ala Phe Gln Gln Met Glu Gly Val Glu Cys Gln Lys Pro Gln Gly Ala
405 410 415
Met Tyr Leu Phe Pro Thr Ile Thr Leu Pro Pro Lys Ala Ile Glu Ala
420 425 430
Ala Lys Ala Glu Asn Arg Ala Ala Asp Glu Phe Tyr Cys Leu Arg Leu
435 440 445
Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly Gln
450 455 460
Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala Pro Gly Thr
465 470 475 480
Asp Trp Val Glu Arg Ile Val Lys Phe His Ser Glu Phe Met Ala Lys
485 490 495
Tyr Lys
<210> 41
<211> 1542
<212> DNA
<213> Cryptococcus neoformans
<400> 41
atgcccagac ttagcaacgt ctattgtccc aaatcactct tacaacgtca gaccatccaa 60
atcaggtcat tcagtcagac tatgtcacct ttcaaacccg cgcttactct tgataccatc 120
aaccccgcgg ttcaggctgt tcactatgct gtccgaggcg agctcgcgat caaggcggac 180
aaatatgtcc aagtccttgc cgatataact cacaagcctt tgccgtttga aaagatcgtc 240
actgccaaca tcggtaatcc ccaacaacaa ggtcttgatc aagttcctct cacttattgg 300
cgacaaatta tttccttatt ggagtatccc gatctgatgc agaaacatga gcagttggcc 360
aagcagattt accctggaga tgtgattgag cgagccaggg cgttacataa cgaaattgga 420
agtacgggtg cgtacactca ttccaagggt gtgttgggta tcagaaagag agtcgccaag 480
tttattgaag aacgcgacgg ttacccggcg gaccctcaaa atatcttcct caccgccggt 540
gcttctgccg gtgttgcttc gatccttggt gtcgccctcc gcagaggtga tggctgcatg 600
atccccatcc cccaatatcc cctctatacc gccaccctcg cttacctcga gtctgagcct 660
ctgccatact acctttctga agcggacgac tggtcgatga accacgattc tttgctcaag 720
agcgtggagg aaggcaagaa gaagggtatc cccatcaagg cgcttgtaat cattaacccc 780
ggaaacccta ccggcgcatg tttgagccaa gaggcgatgg aggcggttgt gcatctctgt 840
tatgaggaag gtatcgtcct cctcgcagac gaggtttacc agatgaacgt ctttgacccc 900
gaacagcgac cgttcatttc tttcaaaaag gttttgatgg atatgcccaa ggagatcagg 960
gaaagtgtgg aactggtatc tttccattcg atctcaaaag gtgttagtgg agaatgtgga 1020
aggagaggtg gatactttga atgtgtcaac attgataagg atgtgatgga ccaggtttac 1080
aagatggcga gtgtcacttt atgtcctccc gtctcaggcc agatcggtgt cgacctcatg 1140
gtctcccctc cgaaacccgg agacgaatct taccccttat ggaaagaaga aaccgatctg 1200
atccaaaaca atctcaagtc ccgatcatat ctcatggctg agcatttcaa caaaatggaa 1260
ggtgtttctt gcaacaatgc ggaaggagcc atgtacttgt tcccgaggat taatatccct 1320
cccaaagctg tagaggcggc gaagaagttg ggtaaggaac cggatgtgat gtatgctttg 1380
gatcttcttg atgcgaccgg tatctgtgcg gtggcaggca gcggttttgg ccaagaaccg 1440
gggacgttcc atttgcgagt gactgccctg tgtcccgata ctgctgaatt tatcggtcga 1500
ttccaaaagt tcaacaagga atttatggaa aagtatgcct aa 1542
<210> 42
<211> 480
<212> PRT
<213> Cryptococcus neoformans
<400> 42
Met Pro Arg Leu Ser Asn Val Tyr Cys Pro Lys Ser Leu Leu Gln Arg
1 5 10 15
Gln Thr Ile Gln Ile Arg Ser Phe Ser Gln Thr Met Ser Pro Phe Lys
20 25 30
Pro Ala Leu Thr Leu Asp Thr Ile Asn Pro Ala Val Gln Ala Val His
35 40 45
Tyr Ala Val Arg Gly Glu Leu Ala Ile Lys Ala Asp Lys Tyr Val Gln
50 55 60
Val Leu Ala Asp Ile Thr His Lys Pro Leu Pro Phe Glu Lys Ile Val
65 70 75 80
Thr Ala Asn Ile Gly Asn Pro Gln Gln Gln Gly Leu Asp Gln Val Pro
85 90 95
Leu Thr Tyr Trp Arg Gln Ile Ile Ser Leu Leu Glu Tyr Pro Asp Leu
100 105 110
Met Gln Lys His Glu Gln Leu Ala Lys Gln Ile Tyr Pro Gly Asp Val
115 120 125
Ile Glu Arg Ala Arg Ala Leu His Asn Glu Ile Gly Ser Thr Gly Ala
130 135 140
Tyr Thr His Ser Lys Gly Val Leu Gly Ile Arg Lys Arg Val Ala Lys
145 150 155 160
Phe Ile Glu Glu Arg Asp Gly Tyr Pro Ala Asp Pro Gln Asn Ile Phe
165 170 175
Leu Thr Ala Gly Ala Ser Ala Gly Val Ala Ser Ile Leu Gly Val Ala
180 185 190
Leu Arg Arg Gly Asp Gly Cys Met Ile Pro Ile Pro Gln Tyr Pro Leu
195 200 205
Tyr Thr Ala Thr Leu Ala Tyr Leu Glu Ser Glu Pro Leu Pro Tyr Tyr
210 215 220
Leu Ser Glu Ala Asp Asp Trp Ser Met Asn His Asp Ser Leu Leu Lys
225 230 235 240
Ser Val Glu Glu Gly Lys Lys Lys Gly Ile Pro Ile Lys Ala Leu Val
245 250 255
Ile Ile Asn Pro Gly Asn Pro Thr Gly Ala Cys Leu Ser Gln Glu Ala
260 265 270
Met Glu Ala Val Val His Leu Cys Tyr Glu Glu Gly Ile Val Leu Leu
275 280 285
Ala Asp Glu Val Tyr Gln Met Asn Val Phe Asp Pro Glu Gln Arg Pro
290 295 300
Phe Ile Ser Phe Lys Lys Val Leu Met Asp Met Pro Lys Glu Ile Arg
305 310 315 320
Glu Ser Val Glu Leu Val Ser Phe His Ser Ile Ser Lys Gly Val Ser
325 330 335
Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Glu Cys Val Asn Ile Asp
340 345 350
Lys Asp Val Met Asp Gln Val Tyr Lys Met Ala Ser Val Thr Leu Cys
355 360 365
Pro Pro Val Ser Gly Gln Ile Gly Val Asp Leu Met Val Ser Pro Pro
370 375 380
Lys Pro Gly Asp Glu Ser Tyr Pro Leu Trp Lys Glu Glu Thr Asp Leu
385 390 395 400
Ile Gln Asn Asn Leu Lys Ser Arg Ser Tyr Leu Met Ala Glu His Phe
405 410 415
Asn Lys Met Glu Gly Val Ser Cys Asn Asn Ala Glu Gly Ala Met Tyr
420 425 430
Leu Phe Pro Arg Ile Asn Ile Pro Pro Lys Ala Val Glu Ala Ala Lys
435 440 445
Lys Leu Gly Lys Glu Pro Asp Val Met Tyr Ala Leu Asp Leu Leu Asp
450 455 460
Ala Thr Gly Ile Cys Ala Val Ala Gly Ser Gly Phe Gly Gln Glu Pro
465 470 475 480
<210> 43
<211> 1605
<212> DNA
<213> Dictyostelium discoideum
<400> 43
atgttcaaaa gaagtttaaa agttttatta tcaaatccac ccatcaacag agtaaagccc 60
tcttcaacaa ttattcaacc actttcaaat actactacaa caacaataat taataataat 120
aatataacta attttgaaaa aatgacacat aaaaaatcta tgacaattga taatatttgc 180
caaaatgtaa gaaatgcaca atatgcagta cgtggtgaat tagttattcg tgcagaagca 240
atttcacatc aattacaaaa acaaaaaaca gaaggcacaa aaacattacc atttgaagag 300
attgtctatt gtaatattgg taatccacaa caattgaaac aaaaaccatt aacttatttc 360
cgtcaagttg tatcattagt tgaatgtcca gatttattag ataatccata cgttgaaaag 420
atatatccag ccgatgttat ctcacgtgct aaagagatat taggatcaat taataataca 480
acaggtgcct attccaatag tcaaggtatt ggtttagttt taagatcagt tgcagatttc 540
atagagagac gtgatggaca taaatctgat ccatccgaaa ttttccttac agatggtgca 600
tcagttggtg tacaacgtat tttgaaactt ttaattaaag atcgttcaga cggtatctta 660
attccaattc cacaatatcc actctacagt gccaccattg aattatataa tggcagtcaa 720
ttagggtacc tattaaatga agagaaaggt tggtcactcg agatctccca attggagcat 780
tcctacaatg atgcagtttc aaagggtatt aatccacgtg cactcgttat catcaatcca 840
ggtaatccaa ctggtcaatg tttagataga gcaaatatgg aagagattgt caagttttgt 900
ttagaaaaga atgtagtatt attggctgat gaagtctatc aagagaatgt ttatgtcaaa 960
gagagtaaac cattcatctc attcaaaaag gttgtcaaag atatgggtgg tgattatgca 1020
gatttagaga tggtttcatt ccattcagtt agtaaaggtt tcgttggtga atgtggtaaa 1080
cgtggtggtt atatggaatt aaatggtgtc actcaagatg ttaaagctga aatttataaa 1140
ctcgcatcaa ttggtttatg tccaaatgtt attggtcaat tggttgttga tttaatggtt 1200
cgtccaccag ttgctggtga acaatcacat gatctctacc ttaaagaaag agataatatc 1260
tatgaatctt taaaaaaacg tgcaaatctc ttaacaaatg ctttaaataa tcttgaaggt 1320
gtaacttgta atccatcaga aggtgcaatg tatgctttcc cacaaattcg tcttccagct 1380
aaagctgtag aatatgcaaa ttcaattggt aaagcaccag atgcttacta ttgtattcaa 1440
ttactcgaag ccactggtat ctgtgttgta ccaggtagtg gtttcggtca aaaagatggt 1500
acttggcatt ttagaactac cttcttacct tctgaagaag caattgaagg tgtttgtaag 1560
agaatcgctg atttccatca atcatttatg aataaatata aataa 1605
<210> 44
<211> 534
<212> PRT
<213> Dictyostelium discoideum
<400> 44
Met Phe Lys Arg Ser Leu Lys Val Leu Leu Ser Asn Pro Pro Ile Asn
1 5 10 15
Arg Val Lys Pro Ser Ser Thr Ile Ile Gln Pro Leu Ser Asn Thr Thr
20 25 30
Thr Thr Thr Ile Ile Asn Asn Asn Asn Ile Thr Asn Phe Glu Lys Met
35 40 45
Thr His Lys Lys Ser Met Thr Ile Asp Asn Ile Cys Gln Asn Val Arg
50 55 60
Asn Ala Gln Tyr Ala Val Arg Gly Glu Leu Val Ile Arg Ala Glu Ala
65 70 75 80
Ile Ser His Gln Leu Gln Lys Gln Lys Thr Glu Gly Thr Lys Thr Leu
85 90 95
Pro Phe Glu Glu Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Gln Leu
100 105 110
Lys Gln Lys Pro Leu Thr Tyr Phe Arg Gln Val Val Ser Leu Val Glu
115 120 125
Cys Pro Asp Leu Leu Asp Asn Pro Tyr Val Glu Lys Ile Tyr Pro Ala
130 135 140
Asp Val Ile Ser Arg Ala Lys Glu Ile Leu Gly Ser Ile Asn Asn Thr
145 150 155 160
Thr Gly Ala Tyr Ser Asn Ser Gln Gly Ile Gly Leu Val Leu Arg Ser
165 170 175
Val Ala Asp Phe Ile Glu Arg Arg Asp Gly His Lys Ser Asp Pro Ser
180 185 190
Glu Ile Phe Leu Thr Asp Gly Ala Ser Val Gly Val Gln Arg Ile Leu
195 200 205
Lys Leu Leu Ile Lys Asp Arg Ser Asp Gly Ile Leu Ile Pro Ile Pro
210 215 220
Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Glu Leu Tyr Asn Gly Ser Gln
225 230 235 240
Leu Gly Tyr Leu Leu Asn Glu Glu Lys Gly Trp Ser Leu Glu Ile Ser
245 250 255
Gln Leu Glu His Ser Tyr Asn Asp Ala Val Ser Lys Gly Ile Asn Pro
260 265 270
Arg Ala Leu Val Ile Ile Asn Pro Gly Asn Pro Thr Gly Gln Cys Leu
275 280 285
Asp Arg Ala Asn Met Glu Glu Ile Val Lys Phe Cys Leu Glu Lys Asn
290 295 300
Val Val Leu Leu Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Val Lys
305 310 315 320
Glu Ser Lys Pro Phe Ile Ser Phe Lys Lys Val Val Lys Asp Met Gly
325 330 335
Gly Asp Tyr Ala Asp Leu Glu Met Val Ser Phe His Ser Val Ser Lys
340 345 350
Gly Phe Val Gly Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Leu Asn
355 360 365
Gly Val Thr Gln Asp Val Lys Ala Glu Ile Tyr Lys Leu Ala Ser Ile
370 375 380
Gly Leu Cys Pro Asn Val Ile Gly Gln Leu Val Val Asp Leu Met Val
385 390 395 400
Arg Pro Pro Val Ala Gly Glu Gln Ser His Asp Leu Tyr Leu Lys Glu
405 410 415
Arg Asp Asn Ile Tyr Glu Ser Leu Lys Lys Arg Ala Asn Leu Leu Thr
420 425 430
Asn Ala Leu Asn Asn Leu Glu Gly Val Thr Cys Asn Pro Ser Glu Gly
435 440 445
Ala Met Tyr Ala Phe Pro Gln Ile Arg Leu Pro Ala Lys Ala Val Glu
450 455 460
Tyr Ala Asn Ser Ile Gly Lys Ala Pro Asp Ala Tyr Tyr Cys Ile Gln
465 470 475 480
Leu Leu Glu Ala Thr Gly Ile Cys Val Val Pro Gly Ser Gly Phe Gly
485 490 495
Gln Lys Asp Gly Thr Trp His Phe Arg Thr Thr Phe Leu Pro Ser Glu
500 505 510
Glu Ala Ile Glu Gly Val Cys Lys Arg Ile Ala Asp Phe His Gln Ser
515 520 525
Phe Met Asn Lys Tyr Lys
530
<210> 45
<211> 1710
<212> DNA
<213> Trypanosoma brucei
<400> 45
atggatatat atttattttc cgtttggttt atacagaacg aggaaaagtg tttggatttt 60
ctaaacatta gtaagaagaa caaagccaag tcgagcgtac aacacattgg cgggttagcg 120
cgaaaacaga atcctgaacc cacaaaatca atttttgtgt cgagatacgg agcacgatca 180
ctgaagacct cgacaatgaa aggtaaccag gaattttttc agaagggtgg ggcccacgtt 240
tccaagggcg ttcacatcaa cccacgcgta aagaaggctc agtatgccgt gcgcgggctt 300
gtgccgatgc gagccgacga aatcagggag gaaatccgtt caggcacggg gaagtcgaag 360
ttctccttca acgaactggt ttactgcaac attggcaacc cccaagccct ggagcagaag 420
ccgcttacct ttcaccgcca agtgatgtcg cttatcgatg ctccatttct gcttgaggat 480
aacgccgtcg tctctcgata tccctctgat gctgtttccc gtgcgcgtct ctacttgggc 540
cacatcggcc aacgtactgg cgcctacacg gactccgcag gctatgcctt tgtacgtgac 600
atcgtcgcgc agtatgtgaa tgagcgtgac gcctatgtaa aaccgcttca ggaggcatcg 660
tcgattgtgc ttacagacgg cgcaagcact ggtgtgcgca taatcttaca gacgcttgtg 720
ggcgatgaga aggacgctgt gatgattccc atcccgcagt atccgctgta cacggcacag 780
attgcattgt tgggaggtac ccccgcgatg tattaccttc gtgagagcga aggctgggcg 840
ctgaacgttg gagagctcga ggcagtatac aaagactgtg tggcgaacgg aaacgcgacg 900
ccccgcgtgc tcgtcgtgat taaccctggt aaccctacag gtggcgtgtt ggagcgcact 960
gtgatggagg aggttgccaa gttctgttgc gatcacggtg ttgtgctcat ggccgatgag 1020
gtttaccagg aaaatatcta caccgcgacc aagcggtttg agagttttcg gaagattgtg 1080
ctcgaacttc caccaccata caacaccgac accgtgcttg tttccttgca ctccgtgtcg 1140
aagggtatta tcggtgagtg tggtcgccgt ggtgggtact tcacactcac aaacgctccg 1200
cctgagttag tggagcaggt gatgaaattg tgctctatta acctctgcag caacgtcaac 1260
ggtcagctta tgacggcact gatgtgctcc ccgccgaaac ctggcgatgc gagcttcgac 1320
cactacacgg cagagtacag tggcattttt gaaagcctta agcgccgtgc tgacctgctt 1380
gcaaaggaac tgaacaacat ccgtggtttc aagtcccaat ctgttgaggg cgccatgtac 1440
gctttcccca ctattgagct ccctcccaag tacgtgaagc acaacgatga gatgaactca 1500
aaggagggcc gacagcttgc gccggacgcg cgttgggcac tggagcttct cgagagcacc 1560
ggtattgttg tggtgccggg ttctggcttt gggcagcagc ctgggacact gcacttccgc 1620
acgacgatcc tcccacccga agcgcatatg gagcgtgtgg tgaaggctct gcgccagttc 1680
caggagggca tttgggccaa gtatgcataa 1710
<210> 46
<211> 569
<212> PRT
<213> Trypanosoma brucei
<400> 46
Met Asp Ile Tyr Leu Phe Ser Val Trp Phe Ile Gln Asn Glu Glu Lys
1 5 10 15
Cys Leu Asp Phe Leu Asn Ile Ser Lys Lys Asn Lys Ala Lys Ser Ser
20 25 30
Val Gln His Ile Gly Gly Leu Ala Arg Lys Gln Asn Pro Glu Pro Thr
35 40 45
Lys Ser Ile Phe Val Ser Arg Tyr Gly Ala Arg Ser Leu Lys Thr Ser
50 55 60
Thr Met Lys Gly Asn Gln Glu Phe Phe Gln Lys Gly Gly Ala His Val
65 70 75 80
Ser Lys Gly Val His Ile Asn Pro Arg Val Lys Lys Ala Gln Tyr Ala
85 90 95
Val Arg Gly Leu Val Pro Met Arg Ala Asp Glu Ile Arg Glu Glu Ile
100 105 110
Arg Ser Gly Thr Gly Lys Ser Lys Phe Ser Phe Asn Glu Leu Val Tyr
115 120 125
Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys Pro Leu Thr Phe
130 135 140
His Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe Leu Leu Glu Asp
145 150 155 160
Asn Ala Val Val Ser Arg Tyr Pro Ser Asp Ala Val Ser Arg Ala Arg
165 170 175
Leu Tyr Leu Gly His Ile Gly Gln Arg Thr Gly Ala Tyr Thr Asp Ser
180 185 190
Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Gln Tyr Val Asn Glu
195 200 205
Arg Asp Ala Tyr Val Lys Pro Leu Gln Glu Ala Ser Ser Ile Val Leu
210 215 220
Thr Asp Gly Ala Ser Thr Gly Val Arg Ile Ile Leu Gln Thr Leu Val
225 230 235 240
Gly Asp Glu Lys Asp Ala Val Met Ile Pro Ile Pro Gln Tyr Pro Leu
245 250 255
Tyr Thr Ala Gln Ile Ala Leu Leu Gly Gly Thr Pro Ala Met Tyr Tyr
260 265 270
Leu Arg Glu Ser Glu Gly Trp Ala Leu Asn Val Gly Glu Leu Glu Ala
275 280 285
Val Tyr Lys Asp Cys Val Ala Asn Gly Asn Ala Thr Pro Arg Val Leu
290 295 300
Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val Leu Glu Arg Thr
305 310 315 320
Val Met Glu Glu Val Ala Lys Phe Cys Cys Asp His Gly Val Val Leu
325 330 335
Met Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Thr Ala Thr Lys Arg
340 345 350
Phe Glu Ser Phe Arg Lys Ile Val Leu Glu Leu Pro Pro Pro Tyr Asn
355 360 365
Thr Asp Thr Val Leu Val Ser Leu His Ser Val Ser Lys Gly Ile Ile
370 375 380
Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Thr Leu Thr Asn Ala Pro
385 390 395 400
Pro Glu Leu Val Glu Gln Val Met Lys Leu Cys Ser Ile Asn Leu Cys
405 410 415
Ser Asn Val Asn Gly Gln Leu Met Thr Ala Leu Met Cys Ser Pro Pro
420 425 430
Lys Pro Gly Asp Ala Ser Phe Asp His Tyr Thr Ala Glu Tyr Ser Gly
435 440 445
Ile Phe Glu Ser Leu Lys Arg Arg Ala Asp Leu Leu Ala Lys Glu Leu
450 455 460
Asn Asn Ile Arg Gly Phe Lys Ser Gln Ser Val Glu Gly Ala Met Tyr
465 470 475 480
Ala Phe Pro Thr Ile Glu Leu Pro Pro Lys Tyr Val Lys His Asn Asp
485 490 495
Glu Met Asn Ser Lys Glu Gly Arg Gln Leu Ala Pro Asp Ala Arg Trp
500 505 510
Ala Leu Glu Leu Leu Glu Ser Thr Gly Ile Val Val Val Pro Gly Ser
515 520 525
Gly Phe Gly Gln Gln Pro Gly Thr Leu His Phe Arg Thr Thr Ile Leu
530 535 540
Pro Pro Glu Ala His Met Glu Arg Val Val Lys Ala Leu Arg Gln Phe
545 550 555 560
Gln Glu Gly Ile Trp Ala Lys Tyr Ala
565
<210> 47
<211> 1494
<212> DNA
<213> Leishmania major
<400> 47
atgctgcgcc acgctgctcg ttgcttttca ccaaggcaat gctacgtaag ccctcgcgtc 60
atggaggcgg aatacgccgt gcgggggctg atcccggcgc gcgcggatga gatcaaggcg 120
gacttggcta caggccacgg cacctactcg ttcgaaagcc tcgtgtactg caacatcggc 180
aacccgcagt cagtggggca gatgccgcta acgttctacc gacaagtgat ggtgctcgtc 240
gatgcgccgt tcctgctgga ggatgcggaa atcgttgcgc ggctgccaga ggacgccgtt 300
gcacgcgcgc gcaggtacct ttcggagatc gggacgggca ccggcgcgta cacagagtct 360
ttcggcttcc ggtttgcccg cgctgccgtt gcggcgcaca tcaacgagct cgaccatggc 420
gtgagcccgg ctgcgacggt gaacgatatc tgtctgacag acggcgcgag catgggtgcg 480
aagctgttcc tgcagctcct tgtgggcggc gcgagcgatg ctgtgatgat cccggttccg 540
cagtatccgc tatactctgc gcagattgct ttacttggcg gggtgaaggt gccctacggc 600
ctgcacgagt ctgaggggtg ggtaatgaag ttgtcggacc ttgttgccgc gtacgagcgg 660
tgcgtgaccg agagcggcgc gacgccgcgc ttgtttgtgt gcatcaaccc cgggaacccg 720
acggggaacg tactggagcg ctgcgtgatg gaggacgtcg tgcggttctg ccacgagcgc 780
ggcatgctgc tgcttgcaga cgaggtgtac caggagaacg tgtacgacac gcgacgccgg 840
tttttgagct tccgcgaggt tgtgcttggg atgcctgagc cgtactgctc ggagacgatg 900
cttgtgtcac tgcactcgac atcgaaaggg gtgattggtg aatgcgggcg gcgcggcggg 960
tatttctgca tgacgaacct gcctgctgcg ctgcgccagc aggttgtgaa gctgtgctcg 1020
atcaacctgt gtgcaaacgt gaacgggcag ttgatgactg cgctgatgtg ctcgccgccg 1080
cgcgagggcg aagcgagcta cgcgctgcac cggcgcgagt acgacgagat ctttacgggc 1140
atgaaggagc gcgctgagct gctggcgcgc gagcttgggg ctgtgcgcgg gctctcgtgc 1200
caaccggtgg agggcgcaat gtacgcgttc ccgagaattg tgttgcctga gcggtacgcc 1260
cagcggaacg aggagctgaa cgcgaaggag ggtcggcagc ttgcgctgga cgcgcggtgg 1320
gcgctggagc tgctggagtc gagcgggatc gttgttgtgc ccgggtctgg gttcgggcag 1380
gaacccggga cgctgcactt tcggatcacg attctcccgc ctcttgaaca gattgatcgg 1440
atggtgcgtg cgatccgcga gttccaggac cggatctacg agcagtacgc ttaa 1494
<210> 48
<211> 497
<212> PRT
<213> Leishmania major
<400> 48
Met Leu Arg His Ala Ala Arg Cys Phe Ser Pro Arg Gln Cys Tyr Val
1 5 10 15
Ser Pro Arg Val Met Glu Ala Glu Tyr Ala Val Arg Gly Leu Ile Pro
20 25 30
Ala Arg Ala Asp Glu Ile Lys Ala Asp Leu Ala Thr Gly His Gly Thr
35 40 45
Tyr Ser Phe Glu Ser Leu Val Tyr Cys Asn Ile Gly Asn Pro Gln Ser
50 55 60
Val Gly Gln Met Pro Leu Thr Phe Tyr Arg Gln Val Met Val Leu Val
65 70 75 80
Asp Ala Pro Phe Leu Leu Glu Asp Ala Glu Ile Val Ala Arg Leu Pro
85 90 95
Glu Asp Ala Val Ala Arg Ala Arg Arg Tyr Leu Ser Glu Ile Gly Thr
100 105 110
Gly Thr Gly Ala Tyr Thr Glu Ser Phe Gly Phe Arg Phe Ala Arg Ala
115 120 125
Ala Val Ala Ala His Ile Asn Glu Leu Asp His Gly Val Ser Pro Ala
130 135 140
Ala Thr Val Asn Asp Ile Cys Leu Thr Asp Gly Ala Ser Met Gly Ala
145 150 155 160
Lys Leu Phe Leu Gln Leu Leu Val Gly Gly Ala Ser Asp Ala Val Met
165 170 175
Ile Pro Val Pro Gln Tyr Pro Leu Tyr Ser Ala Gln Ile Ala Leu Leu
180 185 190
Gly Gly Val Lys Val Pro Tyr Gly Leu His Glu Ser Glu Gly Trp Val
195 200 205
Met Lys Leu Ser Asp Leu Val Ala Ala Tyr Glu Arg Cys Val Thr Glu
210 215 220
Ser Gly Ala Thr Pro Arg Leu Phe Val Cys Ile Asn Pro Gly Asn Pro
225 230 235 240
Thr Gly Asn Val Leu Glu Arg Cys Val Met Glu Asp Val Val Arg Phe
245 250 255
Cys His Glu Arg Gly Met Leu Leu Leu Ala Asp Glu Val Tyr Gln Glu
260 265 270
Asn Val Tyr Asp Thr Arg Arg Arg Phe Leu Ser Phe Arg Glu Val Val
275 280 285
Leu Gly Met Pro Glu Pro Tyr Cys Ser Glu Thr Met Leu Val Ser Leu
290 295 300
His Ser Thr Ser Lys Gly Val Ile Gly Glu Cys Gly Arg Arg Gly Gly
305 310 315 320
Tyr Phe Cys Met Thr Asn Leu Pro Ala Ala Leu Arg Gln Gln Val Val
325 330 335
Lys Leu Cys Ser Ile Asn Leu Cys Ala Asn Val Asn Gly Gln Leu Met
340 345 350
Thr Ala Leu Met Cys Ser Pro Pro Arg Glu Gly Glu Ala Ser Tyr Ala
355 360 365
Leu His Arg Arg Glu Tyr Asp Glu Ile Phe Thr Gly Met Lys Glu Arg
370 375 380
Ala Glu Leu Leu Ala Arg Glu Leu Gly Ala Val Arg Gly Leu Ser Cys
385 390 395 400
Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Arg Ile Val Leu Pro
405 410 415
Glu Arg Tyr Ala Gln Arg Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg
420 425 430
Gln Leu Ala Leu Asp Ala Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser
435 440 445
Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Glu Pro Gly Thr
450 455 460
Leu His Phe Arg Ile Thr Ile Leu Pro Pro Leu Glu Gln Ile Asp Arg
465 470 475 480
Met Val Arg Ala Ile Arg Glu Phe Gln Asp Arg Ile Tyr Glu Gln Tyr
485 490 495
Ala
<210> 49
<211> 1455
<212> DNA
<213> Entamoeba histolytica
<400> 49
atgaaagcat tttcaagaca aagtattaat ccttgtatca ttgcaactca atatgctgtt 60
agaggaaaat tagtattaga ggcaaatgag attcaaaaag aaattgaaga agcaagaaaa 120
aaaggaaaaa ataatcctta tccatttgag aaagtagttt attgtaatat tggtaatcca 180
cagatatgta accaacagcc attaacatat ccaaggcaga ttatctcaat agttgaatat 240
cctgagcttt taaatcatac aacccttttt ccgaaagatg ttatcaccca tgctaaaaaa 300
attattaata gtcttggttg tactggaaca agtggtgcat atactaattc tatgggagtt 360
attcaattca gaaaatcaat ttgtaaattt ataaaacata gagatggaac tgctccatcc 420
cctgatgacg tatttataac cgatggagca tctactggaa taaaaatgat tttaaatatg 480
ttgatttcac atcctcttca tggaattatg attcctattc cacaataccc attatacagt 540
gcttcaatat ctcaattcgg aggttttcaa attaattact ttctagatga atcaaaaaaa 600
tggtcaacag atatgacatc cgtaagaaaa gtttatgaac aagcggttga aaaaggtatt 660
caagtgaaag gatttgtttg tattaaccca ggtaatccaa ctggacaagt tcttacagtc 720
caaaatatga aagaaattat agaattttgc tatgaaaaaa aaatttgttt attagctgat 780
gaagtatatc aagagaatat ctacggtgaa ataccattta catcattcag aaaggtattg 840
aagtcaatga gggatgaggt gaaaaatagt gttgagctaa tctcattttt tagtgtttca 900
aaaggatttt atggtgaatg tggaaagcga ggtggatatt tccagataga aaatattaat 960
tcatttgctc gttctcagat gtataaaata gcatctacca atttatgttc aaatgtagtt 1020
ggtcaagaga tggttgaaat aatttgcaac ccaccaaaag aaggtgatga atcttatcca 1080
aaatacatga atgaaaaaat gtctatttta aactctttga aaagaaaagc caagttactc 1140
tattctgttc taaatgagtg tgaaggaatt tcttgtaatg aagctatggg tgctctttat 1200
cttttcccaa agattacatt cccaaacaaa tatattgatg agtgtaaaag aaaggatcaa 1260
aaaccagatg aattgtattg tttaaggatg ttaaaaagta taggggtgtg tgttgttcca 1320
ggatctggtt ttggtcaaaa agataatacg tatcatttta gaattgccat tctaccacca 1380
gaaaatgaaa tacagaatat tgccgtcaaa ataaaaactt ttcatacatc ttttatgaag 1440
gactattgtc actaa 1455
<210> 50
<211> 484
<212> PRT
<213> Entamoeba histolytica
<400> 50
Met Lys Ala Phe Ser Arg Gln Ser Ile Asn Pro Cys Ile Ile Ala Thr
1 5 10 15
Gln Tyr Ala Val Arg Gly Lys Leu Val Leu Glu Ala Asn Glu Ile Gln
20 25 30
Lys Glu Ile Glu Glu Ala Arg Lys Lys Gly Lys Asn Asn Pro Tyr Pro
35 40 45
Phe Glu Lys Val Val Tyr Cys Asn Ile Gly Asn Pro Gln Ile Cys Asn
50 55 60
Gln Gln Pro Leu Thr Tyr Pro Arg Gln Ile Ile Ser Ile Val Glu Tyr
65 70 75 80
Pro Glu Leu Leu Asn His Thr Thr Leu Phe Pro Lys Asp Val Ile Thr
85 90 95
His Ala Lys Lys Ile Ile Asn Ser Leu Gly Cys Thr Gly Thr Ser Gly
100 105 110
Ala Tyr Thr Asn Ser Met Gly Val Ile Gln Phe Arg Lys Ser Ile Cys
115 120 125
Lys Phe Ile Lys His Arg Asp Gly Thr Ala Pro Ser Pro Asp Asp Val
130 135 140
Phe Ile Thr Asp Gly Ala Ser Thr Gly Ile Lys Met Ile Leu Asn Met
145 150 155 160
Leu Ile Ser His Pro Leu His Gly Ile Met Ile Pro Ile Pro Gln Tyr
165 170 175
Pro Leu Tyr Ser Ala Ser Ile Ser Gln Phe Gly Gly Phe Gln Ile Asn
180 185 190
Tyr Phe Leu Asp Glu Ser Lys Lys Trp Ser Thr Asp Met Thr Ser Val
195 200 205
Arg Lys Val Tyr Glu Gln Ala Val Glu Lys Gly Ile Gln Val Lys Gly
210 215 220
Phe Val Cys Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Thr Val
225 230 235 240
Gln Asn Met Lys Glu Ile Ile Glu Phe Cys Tyr Glu Lys Lys Ile Cys
245 250 255
Leu Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Gly Glu Ile Pro
260 265 270
Phe Thr Ser Phe Arg Lys Val Leu Lys Ser Met Arg Asp Glu Val Lys
275 280 285
Asn Ser Val Glu Leu Ile Ser Phe Phe Ser Val Ser Lys Gly Phe Tyr
290 295 300
Gly Glu Cys Gly Lys Arg Gly Gly Tyr Phe Gln Ile Glu Asn Ile Asn
305 310 315 320
Ser Phe Ala Arg Ser Gln Met Tyr Lys Ile Ala Ser Thr Asn Leu Cys
325 330 335
Ser Asn Val Val Gly Gln Glu Met Val Glu Ile Ile Cys Asn Pro Pro
340 345 350
Lys Glu Gly Asp Glu Ser Tyr Pro Lys Tyr Met Asn Glu Lys Met Ser
355 360 365
Ile Leu Asn Ser Leu Lys Arg Lys Ala Lys Leu Leu Tyr Ser Val Leu
370 375 380
Asn Glu Cys Glu Gly Ile Ser Cys Asn Glu Ala Met Gly Ala Leu Tyr
385 390 395 400
Leu Phe Pro Lys Ile Thr Phe Pro Asn Lys Tyr Ile Asp Glu Cys Lys
405 410 415
Arg Lys Asp Gln Lys Pro Asp Glu Leu Tyr Cys Leu Arg Met Leu Lys
420 425 430
Ser Ile Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly Gln Lys Asp
435 440 445
Asn Thr Tyr His Phe Arg Ile Ala Ile Leu Pro Pro Glu Asn Glu Ile
450 455 460
Gln Asn Ile Ala Val Lys Ile Lys Thr Phe His Thr Ser Phe Met Lys
465 470 475 480
Asp Tyr Cys His
<210> 51
<211> 1452
<212> DNA
<213> Entamoeba histolytica
<400> 51
atgagatcat tcgctagtga aaatattagt ccagatgtag ttgcattcca atttgctgta 60
cgtggtaaaa ttgctattgt ttcagaagaa attgataatg ctattaaaaa agcaaaagca 120
gaaggtaaac caaatcctta tccatttgaa aaagttgtta aatgtaatag tggtaatcct 180
caattattaa atcaaaaacc attaactttt gttagagaaa ttacttctat ggtagaatat 240
cctcctctta cagaacatcc agaacttttc catgctgatg ctgttgctcg tgctaaagaa 300
attattaaag ctactggttg taatggaaca actggtgctt actcaccatc taaaggtctt 360
gcttatgtta gacaaacaat tgcacgtttc ttagaagaaa gagataatgt tccaatgtcc 420
ccagaagata tttatttaac tgatggtgct tctattgcta ttaagattgt tatgcaatta 480
atgctttcac atccacttca tggtattatg attccaaatc cacaatatcc attatatggt 540
gcttgtattc aacaattagg aggaaaaaca tgtcattata atttaaacga agataattat 600
tggttaccag acattaatga tattaaggaa caatatgaaa aatatcagaa tgaaggaatt 660
aaaattaagg cattagttgt tattaatcca ggaaatccat gtggagaagt tttaccagtt 720
gacactataa aagaaattat tagattctgt aacgaaaaga agatttgttt aatggctgat 780
gaagtatatc aagaaaatat ttggactgat gttccattca actcatttag aaaaattctt 840
gctacaatgg aaccagaaat tgcacatgga cttgaattaa tttctttcca ttctatttca 900
aaaggattct atggagaatg tggtaagaga ggaggaatgt ttgcatgtac caatattcca 960
gaatttgctc gtttaatgat gtataaaatt atttctacta ctttatgttc taatgttgta 1020
ggacaagttg taatgtctat aatttgtaat cttccaaaag aaggagaccc atcctatcca 1080
ttatttaaac aagaaagaga tgaaatcctt ggctctttaa aacgtaaagc agaatattta 1140
tgtgatattt tcaataagtg tgaaggtatg tcttgtaata gagctgctgg agctatgtat 1200
cttttcccaa gaattacatt accagaaaaa ttcataaaag aatgtcatga aagacatgaa 1260
gatccaaatg aaacatattg tattgaaatg ttaaaaaaga ctggaattgc tgttgtaaaa 1320
gggtctggat ttggtcagaa aaagggtaca tatcatttta gaattgcttt gttaccacca 1380
gaaaatgaaa ttgaagaagt tggaaaaaga attcaagtat tccataattc ttttattcaa 1440
caatacaagt aa 1452
<210> 52
<211> 483
<212> PRT
<213> Entamoeba histolytica
<400> 52
Met Arg Ser Phe Ala Ser Glu Asn Ile Ser Pro Asp Val Val Ala Phe
1 5 10 15
Gln Phe Ala Val Arg Gly Lys Ile Ala Ile Val Ser Glu Glu Ile Asp
20 25 30
Asn Ala Ile Lys Lys Ala Lys Ala Glu Gly Lys Pro Asn Pro Tyr Pro
35 40 45
Phe Glu Lys Val Val Lys Cys Asn Ser Gly Asn Pro Gln Leu Leu Asn
50 55 60
Gln Lys Pro Leu Thr Phe Val Arg Glu Ile Thr Ser Met Val Glu Tyr
65 70 75 80
Pro Pro Leu Thr Glu His Pro Glu Leu Phe His Ala Asp Ala Val Ala
85 90 95
Arg Ala Lys Glu Ile Ile Lys Ala Thr Gly Cys Asn Gly Thr Thr Gly
100 105 110
Ala Tyr Ser Pro Ser Lys Gly Leu Ala Tyr Val Arg Gln Thr Ile Ala
115 120 125
Arg Phe Leu Glu Glu Arg Asp Asn Val Pro Met Ser Pro Glu Asp Ile
130 135 140
Tyr Leu Thr Asp Gly Ala Ser Ile Ala Ile Lys Ile Val Met Gln Leu
145 150 155 160
Met Leu Ser His Pro Leu His Gly Ile Met Ile Pro Asn Pro Gln Tyr
165 170 175
Pro Leu Tyr Gly Ala Cys Ile Gln Gln Leu Gly Gly Lys Thr Cys His
180 185 190
Tyr Asn Leu Asn Glu Asp Asn Tyr Trp Leu Pro Asp Ile Asn Asp Ile
195 200 205
Lys Glu Gln Tyr Glu Lys Tyr Gln Asn Glu Gly Ile Lys Ile Lys Ala
210 215 220
Leu Val Val Ile Asn Pro Gly Asn Pro Cys Gly Glu Val Leu Pro Val
225 230 235 240
Asp Thr Ile Lys Glu Ile Ile Arg Phe Cys Asn Glu Lys Lys Ile Cys
245 250 255
Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Ile Trp Thr Asp Val Pro
260 265 270
Phe Asn Ser Phe Arg Lys Ile Leu Ala Thr Met Glu Pro Glu Ile Ala
275 280 285
His Gly Leu Glu Leu Ile Ser Phe His Ser Ile Ser Lys Gly Phe Tyr
290 295 300
Gly Glu Cys Gly Lys Arg Gly Gly Met Phe Ala Cys Thr Asn Ile Pro
305 310 315 320
Glu Phe Ala Arg Leu Met Met Tyr Lys Ile Ile Ser Thr Thr Leu Cys
325 330 335
Ser Asn Val Val Gly Gln Val Val Met Ser Ile Ile Cys Asn Leu Pro
340 345 350
Lys Glu Gly Asp Pro Ser Tyr Pro Leu Phe Lys Gln Glu Arg Asp Glu
355 360 365
Ile Leu Gly Ser Leu Lys Arg Lys Ala Glu Tyr Leu Cys Asp Ile Phe
370 375 380
Asn Lys Cys Glu Gly Met Ser Cys Asn Arg Ala Ala Gly Ala Met Tyr
385 390 395 400
Leu Phe Pro Arg Ile Thr Leu Pro Glu Lys Phe Ile Lys Glu Cys His
405 410 415
Glu Arg His Glu Asp Pro Asn Glu Thr Tyr Cys Ile Glu Met Leu Lys
420 425 430
Lys Thr Gly Ile Ala Val Val Lys Gly Ser Gly Phe Gly Gln Lys Lys
435 440 445
Gly Thr Tyr His Phe Arg Ile Ala Leu Leu Pro Pro Glu Asn Glu Ile
450 455 460
Glu Glu Val Gly Lys Arg Ile Gln Val Phe His Asn Ser Phe Ile Gln
465 470 475 480
Gln Tyr Lys
<210> 53
<211> 1482
<212> DNA
<213> Trypanosoma cruzi
<400> 53
atgtctgggt cacgaaagga aattcgcatc aacccccgtg tggtggcggc agagtatgcg 60
gtgcgtggga tgctccccat gcgtgcggac gagatcaggg cggccctggc gacaccggag 120
gggaaggcca agtacccctt ctccagcatt gtgtactgca acattgggaa cccgcaggca 180
ctggaacaga agccgctgac gttcttccgg caggtgatgt cgctgattga cgcgccgttc 240
ctgctggaga acgagaaggt tacgtcgcag ttcccggcgg atgcggtggc gcgtgcgagg 300
gagtatcttc gccacatcgg cgatcgcacg ggcgcctaca cggactctgc gggctacgcc 360
tttgtccgtg acatcgtggc gcggcaaatc aatgaacgcg accacgagat aaagccgctg 420
gtggacgcat cctctatttt tctgacggac ggcgcgagct cgggcgtgcg tcttttgctg 480
caggttctcg tgggtgacgc gagtgatgcg gtgatggttc ccattccgca gtacccgctg 540
tacacggcgc agcttacgct tcttggcggc acgcccgcga tgtactacct gtgtgagaag 600
gataactggg cactgaacgt ggaggagctg gcgtcggtgt acgacgagtg cgtggcgaag 660
aataatgcga ccccgcgcgt gctcgttgtg atcaaccctg ggaacccgac tggcggcgtg 720
ctggatcgcg acgtgatgga ggccgtggcg aaattctgct gcgaccgcgg cattgtgctg 780
atggcggacg aggtgtacca ggagaacgtg tacgcggcgg gaaagcgttt cttgagcttc 840
cgggaagtgg tgcttgggct gccggcgccg tacaacacgg acacggtgct ggcctcgctg 900
cactcgacgt cgaagggcat cattggtgag tgcgggcgcc gcggcgggta cttctgcctc 960
acaaacttcc ccgcgccggt tcgggagcag gtgttaaaga tgtgctccat ggttccgtgc 1020
agcagcgtga atgggcagtt gatgacggca ctgatgtgct cgccaccgcg gcccggtgac 1080
gcgagctatg agtcatactg ggcggagtac aatgggatct ttgcgagtct aaagaagcgc 1140
gccctgctgc ttgcgaagga gctgagcacg attcgcggtt tttcttgcca gccggtggaa 1200
ggggcgatgt acgcgtttcc gacgattgag ctgccggaga agtactttca gcacaatgag 1260
gagctgaacg cgaaggaggg gcgaaagctt gggcccgaca cgcgatgggc gttggagctt 1320
ctggagagca gcggggttgt tgttgtggcc ggctctgggt ttggtcagca gcccaacacg 1380
ctgcacttcc gcacgacgat cctgccgccg gagcagcaga tggaacggat ggtgaaggcg 1440
atgcgcacat tccaggaggg catttgggca aagtacgggt aa 1482
<210> 54
<211> 493
<212> PRT
<213> Trypanosoma cruzi
<400> 54
Met Ser Gly Ser Arg Lys Glu Ile Arg Ile Asn Pro Arg Val Val Ala
1 5 10 15
Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg Ala Asp Glu Ile
20 25 30
Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys Tyr Pro Phe Ser
35 40 45
Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys
50 55 60
Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe
65 70 75 80
Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro Ala Asp Ala Val
85 90 95
Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp Arg Thr Gly Ala
100 105 110
Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Arg
115 120 125
Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu Val Asp Ala Ser
130 135 140
Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val Arg Leu Leu Leu
145 150 155 160
Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met Val Pro Ile Pro
165 170 175
Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu Gly Gly Thr Pro
180 185 190
Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala Leu Asn Val Glu
195 200 205
Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys Asn Asn Ala Thr
210 215 220
Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val
225 230 235 240
Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe Cys Cys Asp Arg
245 250 255
Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Ala
260 265 270
Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val Leu Gly Leu Pro
275 280 285
Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu His Ser Thr Ser
290 295 300
Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Cys Leu
305 310 315 320
Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Leu Lys Met Cys Ser
325 330 335
Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met Thr Ala Leu Met
340 345 350
Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu Ser Tyr Trp Ala
355 360 365
Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg Ala Leu Leu Leu
370 375 380
Ala Lys Glu Leu Ser Thr Ile Arg Gly Phe Ser Cys Gln Pro Val Glu
385 390 395 400
Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro Glu Lys Tyr Phe
405 410 415
Gln His Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg Lys Leu Gly Pro
420 425 430
Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser Gly Val Val Val
435 440 445
Val Ala Gly Ser Gly Phe Gly Gln Gln Pro Asn Thr Leu His Phe Arg
450 455 460
Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg Met Val Lys Ala
465 470 475 480
Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr Gly
485 490
<210> 55
<211> 1494
<212> DNA
<213> Trypanosoma cruzi
<400> 55
atgctgcgca aaactctttt tggattcagg gccattcgca tcaacccccg tgtggtggcg 60
gcagagtatg cggtgcgtgg gatgctccca atgcgtgcgg acgagatcag ggcggccctg 120
gcgacaccgg aggggaaggc caagtatccc ttccccagca ttgtgtactg caacattggg 180
aacccgcagg cactggaaca gaagccgctg acgttcttcc ggcaggtgat gtcgctgatt 240
gacgcgccgt tcctgctgga aaacgagaag gttacgtcgc agtacccggc ggatgcggtg 300
gcgcgtgcga gggagtatct tcgccacatc ggcgatcgca cgggcgccta cacggactct 360
gcgggctacg cctttgtccg tgacatcgtg gcgcggcaaa tcaatgaacg cgaccacgag 420
ataaagccgc tggtggacgc atcctctatt tttctgacgg acggcgcgag ctcgggcgtg 480
cgtcttttgc tgcaggttct cgtgggtgac gcgagtgatg cggtgatggt tcccattccg 540
cagtacccgc tgtacacggc gcagcttacg cttcttggcg gcacgcccgc gatgtactac 600
ctgtgtgaga aggataactg ggcactgaac gtggaggagc tggcgtcggt gtacgacgag 660
tgcgtggcga agaataatgc gactccgcgc gtgctcgttg tgatcaaccc tgggaacccg 720
actggcggcg tgctggatcg cgacgtgatg gaggctgtgg cgaaattctg ctgcgaccgc 780
ggcattgtgc tgatggcgga cgaggtgtac caggagaacg tgtacgcggc gggaaagcgt 840
ttcttgagct tccgggaagt ggtgcttggg ctgccggcgc cgtacaacac ggacacggtg 900
ctggcctcgc tgcactcgac gtcgaagggc atcattggtg agtgcgggcg ccgcggcggg 960
tacttctgcc tcacaaactt ccccgcgccg gttcgggagc aggtgttaaa gatgtgctcc 1020
atggttccgt gcagcagcgt gaatgggcag ttgatgacgg cactgatgtg ctcgccaccg 1080
cggcccggtg acgcgagcta tgagtcatac tgggcggagt acaatgggat ctttgcgagt 1140
ctaaagaagc gcgccctgct gcttgcgaag gagctgagca cgattcgcgg tttttcttgc 1200
cagccggtgg aaggggcgat gtacgcgttt ccgacgattg agctgccgga gaagtacttt 1260
cagcacaatg aggagctgaa cgcgaaggag gggcgaaagc ttgggcccga cacgcgatgg 1320
gcgttggagc ttctggagag cagcggggtt gttgttgtgg ccggctctgg gtttggtcag 1380
cagcccaaca cgctgcactt ccgcacgacg atcctgccgc cggagcagca gatggaacgg 1440
atggtgaagg cgatgcgcac attccaggag ggcatttggg caaagtacgg gtaa 1494
<210> 56
<211> 497
<212> PRT
<213> Trypanosoma cruzi
<400> 56
Met Leu Arg Lys Thr Leu Phe Gly Phe Arg Ala Ile Arg Ile Asn Pro
1 5 10 15
Arg Val Val Ala Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg
20 25 30
Ala Asp Glu Ile Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys
35 40 45
Tyr Pro Phe Pro Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala
50 55 60
Leu Glu Gln Lys Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile
65 70 75 80
Asp Ala Pro Phe Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Tyr Pro
85 90 95
Ala Asp Ala Val Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp
100 105 110
Arg Thr Gly Ala Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp
115 120 125
Ile Val Ala Arg Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu
130 135 140
Val Asp Ala Ser Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val
145 150 155 160
Arg Leu Leu Leu Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met
165 170 175
Val Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu
180 185 190
Gly Gly Thr Pro Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala
195 200 205
Leu Asn Val Glu Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys
210 215 220
Asn Asn Ala Thr Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro
225 230 235 240
Thr Gly Gly Val Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe
245 250 255
Cys Cys Asp Arg Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu
260 265 270
Asn Val Tyr Ala Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val
275 280 285
Leu Gly Leu Pro Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu
290 295 300
His Ser Thr Ser Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly
305 310 315 320
Tyr Phe Cys Leu Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Leu
325 330 335
Lys Met Cys Ser Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met
340 345 350
Thr Ala Leu Met Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu
355 360 365
Ser Tyr Trp Ala Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg
370 375 380
Ala Leu Leu Leu Ala Lys Glu Leu Ser Thr Ile Arg Gly Phe Ser Cys
385 390 395 400
Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro
405 410 415
Glu Lys Tyr Phe Gln His Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg
420 425 430
Lys Leu Gly Pro Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser
435 440 445
Gly Val Val Val Val Ala Gly Ser Gly Phe Gly Gln Gln Pro Asn Thr
450 455 460
Leu His Phe Arg Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg
465 470 475 480
Met Val Lys Ala Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr
485 490 495
Gly
<210> 57
<211> 1482
<212> DNA
<213> Trypanosoma cruzi
<400> 57
atgtctgggt cacgaaagga aattcgcatc aacccccgtg tggtggcggc agagtatgcg 60
gtgcgtggga tgctccccat gcgtgcggac gagatcaggg cggccctggc gacaccggag 120
gggaaggcca agtacccctt ctccagcatt gtgtactgca acattgggaa cccgcaggca 180
ctggaacaga agccgctgac gttcttccgg caggtgatgt cgctgattga cgcgccgttc 240
ctgctggaga acgagaaggt tacgtcgcag ttcccggcgg atgcggtggc gcgtgcgagg 300
gagtatcttc gccacatcgg cgatcgcacg ggcgcctaca cggactctgc gggctacgcc 360
tttgtccgtg acatcgtggc gcggcaaatc aatgaacgcg accacgagat aaagccgctg 420
gtggacgcat cctctatttt tctgacggac ggcgcgagct cgggcgtgcg tcttttgctg 480
caggttctcg tgggtgacgc gagtgatgcg gtgatggttc ccattccgca gtacccgctg 540
tacacggcgc agcttacgct tcttggcggc acgcccgcga tgtactacct gtgtgagaag 600
gataactggg cactgaatgt ggaggagctg gcgtcggtgt acgacgagtg cgtggcgaag 660
aataatgcga ccccgcgcgt gctcgttgtg atcaaccctg ggaacccgac tggcggcgtg 720
ctggatcgcg acgtgatgga ggctgtggcg aaattctgct gcgaccgcgg cattgtgctg 780
atggcggacg aggtgtacca ggagaacgtg tacgcggcgg gaaagcgttt cttgagcttc 840
cgggaagtgg tgcttgggct gccggcgccg tacaacacgg acacggtgct ggcctcgctg 900
cactcgacgt cgaagggcat cattggtgag tgcgggcgcc gcggcgggta cttctgcctc 960
acaaacttcc ccgcgccggt gcgggagcag gtggtaaaga tgtgctccat ggttccgtgc 1020
agcagcgtga atgggcagtt gatgacggca ctgatgtgct cgccaccgcg gcccggtgac 1080
gcgagctatg agtcatactg ggcggagtac aatgggatct ttgcgagtct aaagaagcgc 1140
gccctgctgc ttgcgaagga gctgggcacg attcgcggtt tttcttgcca gccggtggaa 1200
ggggcgatgt acgcgtttcc gacgattgag ctgccggaga agtactttca gcacaatgcg 1260
gagctgaacg cgaaggaggg gcgaaagctt gggcccgaca cgcgatgggc gttggagctt 1320
ctggagagca gcggggttgt tgttgtgccc ggctctgggt ttggtcagcg gcccaacacg 1380
ctgcacttcc gcacgacgat cctgccgccg gagcagcaga tggaacggat ggtgaaggcg 1440
atgcgcacat tccaggaggg catttgggca aagtacgggt aa 1482
<210> 58
<211> 493
<212> PRT
<213> Trypanosoma cruzi
<400> 58
Met Ser Gly Ser Arg Lys Glu Ile Arg Ile Asn Pro Arg Val Val Ala
1 5 10 15
Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg Ala Asp Glu Ile
20 25 30
Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys Tyr Pro Phe Ser
35 40 45
Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys
50 55 60
Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe
65 70 75 80
Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro Ala Asp Ala Val
85 90 95
Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp Arg Thr Gly Ala
100 105 110
Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Arg
115 120 125
Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu Val Asp Ala Ser
130 135 140
Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val Arg Leu Leu Leu
145 150 155 160
Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met Val Pro Ile Pro
165 170 175
Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu Gly Gly Thr Pro
180 185 190
Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala Leu Asn Val Glu
195 200 205
Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys Asn Asn Ala Thr
210 215 220
Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val
225 230 235 240
Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe Cys Cys Asp Arg
245 250 255
Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Ala
260 265 270
Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val Leu Gly Leu Pro
275 280 285
Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu His Ser Thr Ser
290 295 300
Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Cys Leu
305 310 315 320
Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Val Lys Met Cys Ser
325 330 335
Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met Thr Ala Leu Met
340 345 350
Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu Ser Tyr Trp Ala
355 360 365
Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg Ala Leu Leu Leu
370 375 380
Ala Lys Glu Leu Gly Thr Ile Arg Gly Phe Ser Cys Gln Pro Val Glu
385 390 395 400
Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro Glu Lys Tyr Phe
405 410 415
Gln His Asn Ala Glu Leu Asn Ala Lys Glu Gly Arg Lys Leu Gly Pro
420 425 430
Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser Gly Val Val Val
435 440 445
Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Asn Thr Leu His Phe Arg
450 455 460
Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg Met Val Lys Ala
465 470 475 480
Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr Gly
485 490
<210> 59
<211> 1494
<212> DNA
<213> Trypanosoma cruzi
<400> 59
atgctacgca aaaccctttt tggattcagg gccattcgca tcaacccccg tgtggtggcg 60
gcagagtatg cggtgcgtgg gatgctcccc atgcgtgcgg acgagatcag ggcggccctg 120
gcgacaccgg aggggaaggc caagtacccc ttctccagca ttgtgtactg caacattggg 180
aacccgcagg cactggaaca gaagccgctg acgttcttcc ggcaggtgat gtcgctgatt 240
gacgcgccgt tcctgctgga gaacgagaag gttacgtcgc agttcccggc ggatgcggtg 300
gcgcgtgcga gggagtatct tcgccacatc ggcgatcgca cgggcgccta cacggactct 360
gcgggctacg cctttgcccg tgacatcgtg gcgcggcaaa tcaatgaacg cgaccacgag 420
ataaagccgc tggtggacgc atcctctatt tttctgacgg acggcgcgag ctcgggcgtg 480
cgtcttttgc tgcaggttct cgtgggtgac gcgagtgatg cggtgatggt tcccattccg 540
cagtacccgc tgtacacggc gcagcttact cttcttggcg gcacgcccgc gatgtactac 600
ctgtgtgaga aggataactg ggcactgaac gtggaggagc tggcgtcggt gtacgacgag 660
tgcgtggcga agaataatgc gaccccgcgc gtgctcgttg tgatcaaccc cgggaacccg 720
actggcggcg tgctggatcg cgaagtgatg gaggccgtgg cgaaattctg ctgcgaccgc 780
ggcattgtgc tgatggcgga cgaggtgtac caggagaacg tgtacgcggc gggaaagcgt 840
ttcttgagct tccgggaagt ggtgcttggg ctgccggcgc cgtacaacac ggacacggtg 900
ctggcctcgc tgcactcgac gtcgaagggc atcattggtg agtgcgggcg ccgcggcggg 960
tacttctgcc tcacaaactt ccccgcgccg gtgcgggagc aggtggtaaa gatgtgctcc 1020
atggttccgt gcagcagcgt gaatgggcag ttgatgacgg cactgatgtg ctcgccaccg 1080
cggcccggtg acgcgagcta tgagtcatac tgggcggagt acaatgggat ctttgcgagt 1140
ctaaagaagc gcgccctgct gcttgcgaag gagctgggca cgattcgcgg tttttcttgc 1200
cagccggtgg aaggggcgat gtacgcgttt ccgacgattg agctgccgga gaagtacttt 1260
cagcacaatg cggagctgaa cgcgaaggag gggcgaaagc ttgggcccga cacgcgatgg 1320
gcgttggagc ttctggagag cagcggggtt gttgttgtgc ccggctctgg gtttggtcag 1380
cggcccaaca cgctgcactt ccgcacgacg atcctgccgc cggagcagca gatggaacgg 1440
atggtgaagg cgatgcgcac attccaggag ggcatttggg caaagtacgg gtaa 1494
<210> 60
<211> 497
<212> PRT
<213> Trypanosoma cruzi
<400> 60
Met Leu Arg Lys Thr Leu Phe Gly Phe Arg Ala Ile Arg Ile Asn Pro
1 5 10 15
Arg Val Val Ala Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg
20 25 30
Ala Asp Glu Ile Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys
35 40 45
Tyr Pro Phe Ser Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala
50 55 60
Leu Glu Gln Lys Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile
65 70 75 80
Asp Ala Pro Phe Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro
85 90 95
Ala Asp Ala Val Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp
100 105 110
Arg Thr Gly Ala Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Ala Arg Asp
115 120 125
Ile Val Ala Arg Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu
130 135 140
Val Asp Ala Ser Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val
145 150 155 160
Arg Leu Leu Leu Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met
165 170 175
Val Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu
180 185 190
Gly Gly Thr Pro Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala
195 200 205
Leu Asn Val Glu Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys
210 215 220
Asn Asn Ala Thr Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro
225 230 235 240
Thr Gly Gly Val Leu Asp Arg Glu Val Met Glu Ala Val Ala Lys Phe
245 250 255
Cys Cys Asp Arg Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu
260 265 270
Asn Val Tyr Ala Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val
275 280 285
Leu Gly Leu Pro Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu
290 295 300
His Ser Thr Ser Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly
305 310 315 320
Tyr Phe Cys Leu Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Val
325 330 335
Lys Met Cys Ser Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met
340 345 350
Thr Ala Leu Met Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu
355 360 365
Ser Tyr Trp Ala Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg
370 375 380
Ala Leu Leu Leu Ala Lys Glu Leu Gly Thr Ile Arg Gly Phe Ser Cys
385 390 395 400
Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro
405 410 415
Glu Lys Tyr Phe Gln His Asn Ala Glu Leu Asn Ala Lys Glu Gly Arg
420 425 430
Lys Leu Gly Pro Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser
435 440 445
Gly Val Val Val Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Asn Thr
450 455 460
Leu His Phe Arg Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg
465 470 475 480
Met Val Lys Ala Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr
485 490 495
Gly
<210> 61
<211> 1869
<212> DNA
<213> Cricetulus griseus
<400> 61
atggccacca aggagaagct gcagtgtctg aaagacttcc acaaagacat cctgaagcct 60
tctccaggga agagcccagg cacacggcct gaggatgagg ctgaggggaa gccccctcag 120
agggagaagt ggtccagcaa gattgacttt gtgctgtctg tggccggagg cttcgtgggt 180
ttgggcaacg tttggcgttt cccgtacctc tgctacaaaa atggtggagg tgctttcctc 240
ataccgtatt ttattttcct gtttgggagt ggcctgcctg tgtttttcct ggaggtcata 300
ataggccagt acacctcaga agggggaatc acctgctggg agaagatctg ccccttgttc 360
tctggcattg gctacgcatc catcgtcatc gtgtccctcc tgaatgtgta ctacattgtc 420
atcctggcct gggccacata ctacctattt cactccttcc agacagagct tccctgggcc 480
cactgcaacc acagctggaa cacaccacat tgcatggagg acaccctgcg taggaatgag 540
agtctctggg tctcccttag cgcctccaac ttcacctcgc ctgtcatcga gttctgggag 600
cgcaatgtac tcagcctgtc ttccggaatc gacgaaccag gcgctctgaa atgggacctt 660
gcgctctgcc tcctcttagt ctggcttgtc tgttttttct gcatatggaa gggtgttcga 720
tccacaggca aggttgtcta cttcaccgcc actttcccgt ttgccatgct tctggtgctg 780
ctggtccgtg gactgaccct gccgggtgct ggcgaaggca tcaaattcta cctgtaccct 840
gacatcagcc gccttgagga cccacaggtg tggatcgacg ccggaaccca gatattcttt 900
tcctatgcca tctgcctggg ggccatgacc tcactgggaa gctacaacaa gtacaagtat 960
aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020
ggcttcgcag ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080
gatgtggctg agtcaggtcc tggcttggcc ttcattgcct atccaaaagc tgtgactatg 1140
atgccgctgc ccaccttttg gtccattctg ttttttatta tgctcctctt gcttggactg 1200
gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260
ttcctaagga agggttatcg tcgggaagtc ttcatcgcca tcctgtgtag catcagctac 1320
ctgctggggc tgtcgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380
tatgcagcta gtggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440
tggatatatg gtggtgataa cttatatgac ggtattgagg acatgattgg ctatcggcct 1500
gggccctgga tgaagtacag ctgggctgtc atcactccag ttctctgtgc tggatgtttc 1560
atcttctctc ttgtcaagta tgtacccctg acctacaaca aagtctacgt gtatcctgat 1620
tgggcaattg ggctgggctg gggcctggcc ctatcctcca tggtgtgtat ccccttggtc 1680
attgccatcc tcctctgccg gacggaggga ccgttccgcg tgagaatcca atacctgata 1740
acccccaggg agcccaaccg ctgggctgtg gagcgtgagg gggccacacc cttccactcc 1800
cgcacaagcc tcgtcatgaa cggcgcactc atgaaaccca gtcacgtcat tgtggagacc 1860
atgatgtga 1869
<210> 62
<211> 622
<212> PRT
<213> Cricetulus griseus
<400> 62
Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp
1 5 10 15
Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp
20 25 30
Glu Ala Glu Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile
35 40 45
Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val
50 55 60
Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu
65 70 75 80
Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe
85 90 95
Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys
100 105 110
Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile
115 120 125
Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp
130 135 140
Ala Thr Tyr Tyr Leu Phe His Ser Phe Gln Thr Glu Leu Pro Trp Ala
145 150 155 160
His Cys Asn His Ser Trp Asn Thr Pro His Cys Met Glu Asp Thr Leu
165 170 175
Arg Arg Asn Glu Ser Leu Trp Val Ser Leu Ser Ala Ser Asn Phe Thr
180 185 190
Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser
195 200 205
Gly Ile Asp Glu Pro Gly Ala Leu Lys Trp Asp Leu Ala Leu Cys Leu
210 215 220
Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg
225 230 235 240
Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met
245 250 255
Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu
260 265 270
Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Ser Arg Leu Glu Asp Pro
275 280 285
Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile
290 295 300
Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr
305 310 315 320
Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr
325 330 335
Ser Phe Val Ser Gly Phe Ala Val Phe Ser Ile Leu Gly Phe Met Ala
340 345 350
Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly
355 360 365
Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro
370 375 380
Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu
385 390 395 400
Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp
405 410 415
Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Val Phe Ile
420 425 430
Ala Ile Leu Cys Ser Ile Ser Tyr Leu Leu Gly Leu Ser Met Val Thr
435 440 445
Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser
450 455 460
Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala
465 470 475 480
Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile
485 490 495
Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr
500 505 510
Pro Val Leu Cys Ala Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val
515 520 525
Pro Leu Thr Tyr Asn Lys Val Tyr Val Tyr Pro Asp Trp Ala Ile Gly
530 535 540
Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Val Cys Ile Pro Leu Val
545 550 555 560
Ile Ala Ile Leu Leu Cys Arg Thr Glu Gly Pro Phe Arg Val Arg Ile
565 570 575
Gln Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg
580 585 590
Glu Gly Ala Thr Pro Phe His Ser Arg Thr Ser Leu Val Met Asn Gly
595 600 605
Ala Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met
610 615 620
<210> 63
<211> 1866
<212> DNA
<213> Rattus norvegicus
<400> 63
atggccacca aggagaagct tcaatgtctg aaagacttcc acaaagacat cctgaagcct 60
tctccaggga agagcccagg cacgcggcct gaggatgagg ctgatgggaa gccccctcag 120
agggagaagt ggtccagcaa gatcgacttt gtgctgtctg tggccggagg cttcgtgggt 180
ttgggcaatg tctggcgttt cccgtacctc tgctacaaaa atggtggagg tgcattcctc 240
ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttcct ggaggtcatc 300
ataggccagt acacctcaga agggggcatc acctgctggg agaagatctg ccccttgttc 360
tctggcattg gctacgcgtc catcgtcatc gtgtccctcc tgaatgtgta ctacatcgtc 420
atcctggcct gggccacata ctacctattc cagtctttcc agaaggatct tccctgggcc 480
cactgcaacc atagctggaa cacgccacag tgcatggagg acaccctgcg taggaacgag 540
agtcactggg tctcccttag cgccgccaac ttcacttcgc ctgtgatcga gttctgggag 600
cgcaacgtgc tcagcctgtc ctccggaatc gaccacccag gcagtctgaa atgggacctc 660
gcgctctgcc tcctcttagt ctggctcgtc tgttttttct gcatctggaa gggtgttcgg 720
tccacaggca aggttgtcta cttcactgct actttcccgt ttgccatgct tctggtgctg 780
ctggtccgtg gactgaccct gccaggtgct ggtgaaggca tcaaattcta cctgtaccct 840
aacatcagcc gccttgagga cccacaggtg tggatcgacg ctggaactca gatattcttt 900
tcctacgcta tctgcctggg ggccatgacc tcactgggaa gctataacaa gtacaagtat 960
aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020
ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080
gatgtggctg agtcaggtcc tggcttggcc ttcattgcct acccaaaagc tgtgaccatg 1140
atgccgctgc ccaccttttg gtccattctg ttttttatta tgctcctctt gcttggactg 1200
gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260
ttcctaagga agggttatcg tcgggaaatc ttcattgcca tcgtgtgcag catcagctac 1320
ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380
tatgcagcta gtggtgtatg ccttttgtgg gtcgcattct ttgaatgttt tgttattgcc 1440
tggatatatg gcggtgataa cttatatgac ggtattgagg acatgatcgg ctatcggcct 1500
ggaccctgga tgaagtacag ctgggctgtc atcactccag ctctctgtgt tggatgtttc 1560
atcttctctc tcgtcaagta tgtacccctg acctacaaca aagtctaccg gtaccctgat 1620
tgggcaatcg ggctgggctg gggcctggcc ctttcctcca tggtgtgtat ccccttggtc 1680
attgtcatcc tcctctgccg gacggaggga ccgctccgcg tgagaatcaa atacctgata 1740
acccccaggg agcccaaccg ctgggctgtg gagcgtgaag gggctacgcc ctttcactcc 1800
agagcaaccc tcatgaacgg tgcactcatg aaacccagtc acgtcattgt ggagaccatg 1860
atgtga 1866
<210> 64
<211> 621
<212> PRT
<213> Rattus norvegicus
<400> 64
Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp
1 5 10 15
Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp
20 25 30
Glu Ala Asp Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile
35 40 45
Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val
50 55 60
Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu
65 70 75 80
Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe
85 90 95
Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys
100 105 110
Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile
115 120 125
Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp
130 135 140
Ala Thr Tyr Tyr Leu Phe Gln Ser Phe Gln Lys Asp Leu Pro Trp Ala
145 150 155 160
His Cys Asn His Ser Trp Asn Thr Pro Gln Cys Met Glu Asp Thr Leu
165 170 175
Arg Arg Asn Glu Ser His Trp Val Ser Leu Ser Ala Ala Asn Phe Thr
180 185 190
Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser
195 200 205
Gly Ile Asp His Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu
210 215 220
Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg
225 230 235 240
Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met
245 250 255
Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu
260 265 270
Gly Ile Lys Phe Tyr Leu Tyr Pro Asn Ile Ser Arg Leu Glu Asp Pro
275 280 285
Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile
290 295 300
Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr
305 310 315 320
Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr
325 330 335
Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala
340 345 350
Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly
355 360 365
Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro
370 375 380
Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu
385 390 395 400
Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp
405 410 415
Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile
420 425 430
Ala Ile Val Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr
435 440 445
Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser
450 455 460
Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala
465 470 475 480
Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile
485 490 495
Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr
500 505 510
Pro Ala Leu Cys Val Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val
515 520 525
Pro Leu Thr Tyr Asn Lys Val Tyr Arg Tyr Pro Asp Trp Ala Ile Gly
530 535 540
Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Val Cys Ile Pro Leu Val
545 550 555 560
Ile Val Ile Leu Leu Cys Arg Thr Glu Gly Pro Leu Arg Val Arg Ile
565 570 575
Lys Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg
580 585 590
Glu Gly Ala Thr Pro Phe His Ser Arg Ala Thr Leu Met Asn Gly Ala
595 600 605
Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met
610 615 620
<210> 65
<211> 1866
<212> DNA
<213> Mus musculus
<400> 65
atggccacga aggagaagct gcaatgtctg aaagacttcc acaaagacat cctgaagcct 60
tctccaggga agagcccagg cacacggcct gaagatgagg cggacgggaa gccccctcag 120
agggagaagt ggtccagcaa gatcgacttt gtgctgtctg tggccggagg cttcgtgggt 180
ttgggcaacg tctggcgttt cccgtacctc tgctacaaaa atggtggagg tgcgttcctc 240
ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttctt ggaggtcatc 300
ataggccagt acacatcaga agggggcatc acctgctggg agaagatctg tcctttgttc 360
tctggcattg gctacgcatc catcgtcatt gtgtccctcc tgaacgtgta ctacatcgtc 420
atcctggcct gggccacata ctacctattc cactctttcc agaaggatct tccctgggcc 480
cactgcaacc atagctggaa cacaccacag tgcatggagg acaccctgcg taggaacgag 540
agtcactggg tctcccttag cactgccaac ttcacctcac ccgtcatcga gttctgggag 600
cgcaatgtgc tcagcctgtc ctccggaatc gacaacccag gcagtctgaa atgggacctc 660
gcgctctgcc tcctcttagt ctggctcgtc tgttttttct gcatctggaa gggtgttcga 720
tccacaggca aggttgtcta cttcaccgct actttcccgt ttgccatgct tctggtgctg 780
ctggtccgtg gactgaccct gccaggtgct ggtgaaggca tcaaattcta cctgtaccct 840
gacatcagcc gccttgggga cccacaggtg tggatcgacg ctggaactca gatattcttt 900
tcctacgcaa tctgcctggg ggccatgacc tcactgggaa gctataacaa gtacaagtat 960
aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020
ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080
gatgtggctg agtcaggtcc tggcttggcc ttcattgcct acccaaaagc tgtaaccatg 1140
atgccgctgc ccaccttttg gtctattctg tttttcatta tgctcctctt gcttggactg 1200
gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260
ttcctaagga agggttatcg tcgggaaatc ttcatagcca tcttgtgtag catcagctac 1320
ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380
tatgcagcta gtggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440
tggatatatg gcggtgataa cttatatgac ggtattgagg acatgattgg ctatcggcct 1500
gggccctgga tgaagtacag ctgggctgtc atcactccag ctctttgtgt tggatgtttc 1560
gtcttctcgc ttgtcaagta tgtacccctg acctacaaca aagtgtaccg gtacccggat 1620
tgggcaattg ggctgggctg gggcctggcc ctttcctcca tgctgtgtat ccccttggtc 1680
attgtcatcc tcctctgccg gacggaggga ccgctccgcg tgagaatcaa atacctgata 1740
acccccaggg agcccaaccg ctgggctgtg gagcgtgaag gggccacacc ctttcactcc 1800
cgagtaaccc tcatgaacgg cgcactcatg aaacccagtc acgtcattgt ggagaccatg 1860
atgtga 1866
<210> 66
<211> 621
<212> PRT
<213> Mus musculus
<400> 66
Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp
1 5 10 15
Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp
20 25 30
Glu Ala Asp Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile
35 40 45
Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val
50 55 60
Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu
65 70 75 80
Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe
85 90 95
Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys
100 105 110
Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile
115 120 125
Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp
130 135 140
Ala Thr Tyr Tyr Leu Phe His Ser Phe Gln Lys Asp Leu Pro Trp Ala
145 150 155 160
His Cys Asn His Ser Trp Asn Thr Pro Gln Cys Met Glu Asp Thr Leu
165 170 175
Arg Arg Asn Glu Ser His Trp Val Ser Leu Ser Thr Ala Asn Phe Thr
180 185 190
Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser
195 200 205
Gly Ile Asp Asn Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu
210 215 220
Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg
225 230 235 240
Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met
245 250 255
Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu
260 265 270
Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Ser Arg Leu Gly Asp Pro
275 280 285
Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile
290 295 300
Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr
305 310 315 320
Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr
325 330 335
Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala
340 345 350
Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly
355 360 365
Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro
370 375 380
Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu
385 390 395 400
Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp
405 410 415
Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile
420 425 430
Ala Ile Leu Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr
435 440 445
Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser
450 455 460
Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala
465 470 475 480
Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile
485 490 495
Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr
500 505 510
Pro Ala Leu Cys Val Gly Cys Phe Val Phe Ser Leu Val Lys Tyr Val
515 520 525
Pro Leu Thr Tyr Asn Lys Val Tyr Arg Tyr Pro Asp Trp Ala Ile Gly
530 535 540
Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Leu Cys Ile Pro Leu Val
545 550 555 560
Ile Val Ile Leu Leu Cys Arg Thr Glu Gly Pro Leu Arg Val Arg Ile
565 570 575
Lys Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg
580 585 590
Glu Gly Ala Thr Pro Phe His Ser Arg Val Thr Leu Met Asn Gly Ala
595 600 605
Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met
610 615 620
<210> 67
<211> 1863
<212> DNA
<213> Homo sapiens
<400> 67
atggccacca aggagaagct gcagtgtctg aaagatttcc acaaggacat cctgaagccc 60
tcaccaggga agagcccagg cacgcggcct gaggacgagg ctgagggaaa acctccgcag 120
agggagaagt ggtctagcaa gatcgacttt gtgctctctg tggctggcgg cttcgtgggc 180
ttgggcaacg tctggcgctt cccgtacctc tgctacaaga atggtggagg tgcgtttctc 240
ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttctt ggagatcatc 300
ataggccagt acacctctga agggggcatc acctgctggg aaaagatctg ccccttgttc 360
tctggtatcg gctatgcctc cgttgtaatt gtgtccctcc tgaatgtcta ctacatcgtc 420
atcctggcct gggccacata ctacctgttc cagtccttcc agaaggagct gccctgggca 480
cactgcaacc acagctggaa cacacctcac tgcatggagg acaccatgcg caagaacaag 540
agtgtctgga tcaccatcag ctccaccaac ttcacctccc ctgtcatcga gttctgggag 600
cgcaacgtgc tgagcttgtc ccctggaatc gaccacccag gctctctgaa atgggacctc 660
gctctctgcc ttcttttagt ctggctagtg tgtttcttct gcatctggaa gggcgtcagg 720
tccactggga aggtcgtcta cttcacagcc acttttccat tcgccatgct cctggtgctg 780
ctggtccgag ggctgacgct gccgggcgcg ggcgcaggca tcaagttcta tctgtatcct 840
gacatcaccc gccttgagga cccacaggtg tggattgacg ctgggactca gatattcttc 900
tcttatgcca tctgcctggg ggctatgacc tcgctgggga gctacaacaa gtacaagtat 960
aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020
ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080
gatgtggctg agtcaggtcc tggcctggcc ttcattgcct acccaaaagc tgtgacaatg 1140
atgccgctgc ccacattttg gtccattctt ttttttatta tgcttctctt gcttggactg 1200
gatagccagt ttgttgaagt tgaaggacag atcacatcct tggttgatct ttacccatcc 1260
ttcctaagga agggttatcg tcgggaaatc ttcatcgcct tcgtgtgtag catcagctac 1320
ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcagct ctttgactac 1380
tatgcagcta gcggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440
tggatatatg gaggtgataa cctttatgat ggtattgagg acatgattgg ctatcggccc 1500
gggccctgga tgaagtacag ctgggctgtg atcactccag ttctctgtgt tggatgtttc 1560
atcttctcgc tcgtcaagta cgtacccctg acctacaaca aaacatacgt gtaccccaac 1620
tgggccattg ggctgggctg gagcctggcc ctttcctcca tgctctgcgt tcccttggtc 1680
atcgtcatcc gcctctgcca gactgagggg ccgttccttg tgagagtcaa gtacctgctg 1740
accccaaggg aacccaaccg ctgggctgtg gagcgcgagg gagccacacc ttacaactct 1800
cgcaccgtca tgaacggcgc tctcgtgaaa ccgacccaca tcattgtgga gaccatgatg 1860
tga 1863
<210> 68
<211> 620
<212> PRT
<213> Homo sapiens
<400> 68
Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp
1 5 10 15
Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp
20 25 30
Glu Ala Glu Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile
35 40 45
Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val
50 55 60
Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu
65 70 75 80
Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe
85 90 95
Leu Glu Ile Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys
100 105 110
Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Val
115 120 125
Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp
130 135 140
Ala Thr Tyr Tyr Leu Phe Gln Ser Phe Gln Lys Glu Leu Pro Trp Ala
145 150 155 160
His Cys Asn His Ser Trp Asn Thr Pro His Cys Met Glu Asp Thr Met
165 170 175
Arg Lys Asn Lys Ser Val Trp Ile Thr Ile Ser Ser Thr Asn Phe Thr
180 185 190
Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Pro
195 200 205
Gly Ile Asp His Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu
210 215 220
Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg
225 230 235 240
Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met
245 250 255
Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Ala
260 265 270
Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Thr Arg Leu Glu Asp Pro
275 280 285
Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile
290 295 300
Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr
305 310 315 320
Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr
325 330 335
Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala
340 345 350
Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly
355 360 365
Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro
370 375 380
Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu
385 390 395 400
Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp
405 410 415
Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile
420 425 430
Ala Phe Val Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr
435 440 445
Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser
450 455 460
Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala
465 470 475 480
Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile
485 490 495
Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr
500 505 510
Pro Val Leu Cys Val Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val
515 520 525
Pro Leu Thr Tyr Asn Lys Thr Tyr Val Tyr Pro Asn Trp Ala Ile Gly
530 535 540
Leu Gly Trp Ser Leu Ala Leu Ser Ser Met Leu Cys Val Pro Leu Val
545 550 555 560
Ile Val Ile Arg Leu Cys Gln Thr Glu Gly Pro Phe Leu Val Arg Val
565 570 575
Lys Tyr Leu Leu Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg
580 585 590
Glu Gly Ala Thr Pro Tyr Asn Ser Arg Thr Val Met Asn Gly Ala Leu
595 600 605
Val Lys Pro Thr His Ile Ile Val Glu Thr Met Met
610 615 620
Claims (12)
- 알라닌아미노트랜스페라아제를 코드하는 DNA 및 원하는 폴리펩티드를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.
- 삭제
- 제 1 항에 있어서,
상기 세포가 추가로 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포인 제조 방법. - 삭제
- 제 1 항 또는 제 3 항에 있어서,
세포가 차이니즈 햄스터 난소 세포인 제조 방법. - 제 1 항 또는 제 3 항에 있어서,
원하는 폴리펩티드가 항체인 제조 방법. - 제 1 항 또는 제 3 항에 있어서,
알라닌아미노트랜스페라아제를 코드하는 DNA 가 이하의 (a) ∼ (e) 중 어느 하나인 제조 방법.
(a) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA
(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 및 삽입으로 이루어진 군에서 선택된 하나 이상으로 변이된 아미노산 배열을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 97 % 이상의 동일성을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(d) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA
(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA - 삭제
- 알라닌아미노트랜스페라아제를 코드하는 DNA 와 원하는 폴리펩티드를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포.
- 제 9 항에 있어서,
추가로 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포. - 알라닌아미노트랜스페라아제를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007205158 | 2007-08-07 | ||
JPJP-P-2007-205158 | 2007-08-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100057598A KR20100057598A (ko) | 2010-05-31 |
KR101577839B1 true KR101577839B1 (ko) | 2015-12-15 |
Family
ID=40341376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107002620A KR101577839B1 (ko) | 2007-08-07 | 2008-08-06 | 이종 단백질의 제조 방법 |
Country Status (15)
Country | Link |
---|---|
US (3) | US8697397B2 (ko) |
EP (1) | EP2186905B1 (ko) |
JP (1) | JP5337033B2 (ko) |
KR (1) | KR101577839B1 (ko) |
CN (1) | CN101809161B (ko) |
AU (1) | AU2008284753B2 (ko) |
BR (1) | BRPI0815036B1 (ko) |
CA (1) | CA2695849C (ko) |
DK (1) | DK2186905T3 (ko) |
ES (1) | ES2591284T3 (ko) |
HK (1) | HK1143608A1 (ko) |
MX (1) | MX2010001319A (ko) |
RU (1) | RU2487168C2 (ko) |
TW (1) | TWI463013B (ko) |
WO (1) | WO2009020144A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220083949A (ko) * | 2020-12-11 | 2022-06-21 | 대한민국(농촌진흥청장) | 내염성 증진 신품종 식물 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007119774A1 (ja) * | 2006-04-13 | 2007-10-25 | Chugai Seiyaku Kabushiki Kaisha | タウリントランスポーター遺伝子 |
US20100233759A1 (en) | 2007-03-15 | 2010-09-16 | Chugai Seiyaku Kabushiki Kaisha | Method for production of polypeptide |
AU2008284753B2 (en) | 2007-08-07 | 2014-01-16 | Chugai Seiyaku Kabushiki Kaisha | Method of producing heterogeneous protein |
JP5337043B2 (ja) | 2007-10-15 | 2013-11-06 | 中外製薬株式会社 | 異種タンパク質を高生産する細胞の作製方法 |
BRPI0818764B1 (pt) | 2007-10-24 | 2017-11-21 | Chugai Seiyaku Kabushiki Kaisha | Process of production of a polipeptídeo |
US8741601B2 (en) | 2009-04-22 | 2014-06-03 | Chugai Seiyaku Kabushiki Kaisha | Method for producing a cell capable of high-yield production of heteroproteins |
CN102985437B (zh) | 2010-05-28 | 2016-05-25 | 弗·哈夫曼-拉罗切有限公司 | 通过下调ldh和pdhk表达降低乳酸水平和增加多肽生产 |
JP6182066B2 (ja) | 2011-04-01 | 2017-08-16 | 中外製薬株式会社 | 組換えポリペプチドの製造方法 |
JP6463634B2 (ja) * | 2012-10-10 | 2019-02-06 | 中外製薬株式会社 | 改変宿主細胞の樹立方法 |
BR112015021993A8 (pt) | 2013-03-15 | 2019-12-03 | Genentech Inc | polipeptídeo, métodos para sua produção, métodos para cultivo de uma célula, composição farmacêutica, kit, e meio de cultura celular |
BR112016013443B1 (pt) | 2013-12-20 | 2022-11-29 | Novartis Ag | Métodos para produzir de forma recombinante um produto de interesse, para produção de uma célula hospedeira eucariótica para produzir de forma recombinante um produto de interesse, e para analisar as células eucarióticas quanto à sua adequabilidade como células hospedeiras para expressão recombinante de um produto de interesse |
RU2712507C2 (ru) | 2013-12-20 | 2020-01-29 | Новартис Аг | Новые эукариотические клетки и способы их получения для рекомбинантной экспрессии представляющего интерес продукта |
CN103923872B (zh) * | 2014-04-17 | 2015-11-18 | 湖北工业大学 | 一种米曲霉活力强化剂及其培养方法 |
JP6657500B2 (ja) * | 2015-03-31 | 2020-03-04 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd | モバイルプラットフォームの制御方法およびシステム |
TW202330904A (zh) | 2015-08-04 | 2023-08-01 | 美商再生元醫藥公司 | 補充牛磺酸之細胞培養基及用法 |
EP3896168A4 (en) | 2018-12-11 | 2022-03-02 | FUJIFILM Corporation | ANIMAL CELLS, METHODS OF PRODUCTION OF ANIMAL CELLS AND METHODS OF PRODUCTION OF TARGET PROTEIN |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9019812D0 (en) | 1990-09-11 | 1990-10-24 | Scotgen Ltd | Novel antibodies for treatment and prevention of infection in animals and man |
GB9028123D0 (en) * | 1990-12-28 | 1991-02-13 | Erba Carlo Spa | Monoclonal antibodies against human tumor necrosis factor alpha |
US6225115B1 (en) | 1992-03-04 | 2001-05-01 | Synaptic Pharmaceutical Corporation | DNA encoding taurine and GABA transporters and uses thereof |
EP0631623A4 (en) | 1992-03-04 | 1996-09-25 | Synaptic Pharma Corp | DNA CODING FOR TAURINE AND GABA TRANSPORTERS AND THEIR USE. |
TW402639B (en) | 1992-12-03 | 2000-08-21 | Transkaryotic Therapies Inc | Protein production and protein delivery |
JP3630453B2 (ja) | 1994-09-30 | 2005-03-16 | 中外製薬株式会社 | Il−6レセプター抗体を有効成分とする未熟型骨髄腫細胞治療剤 |
AU695117B2 (en) | 1994-10-06 | 1998-08-06 | Hoechst Aktiengesellschaft | Regulated genes by stimulation of chondrocytes with IL-1beta |
JPH09203734A (ja) | 1996-01-26 | 1997-08-05 | Sumitomo Electric Ind Ltd | 抗血清、抗体、リガンド及びそれらの検出方法 |
JPH1075787A (ja) * | 1996-09-02 | 1998-03-24 | Asahi Chem Ind Co Ltd | 変異型アラニンアミノトランスフェラーゼおよびその製造法 |
JPH10191984A (ja) * | 1997-01-09 | 1998-07-28 | Oriental Yeast Co Ltd | 活性型ヒトaltの製造法 |
DE19855313A1 (de) | 1998-12-01 | 2000-06-08 | Degussa | Verfahren zur fermentativen Herstellung von D-Pantothensäure durch Verstärkung des panD-Gens in Mikroorganismen |
JP2000236877A (ja) * | 1999-02-23 | 2000-09-05 | Internatl Reagents Corp | 精度管理用物質 |
DE60034954D1 (de) | 1999-09-14 | 2007-07-05 | Xenoport Inc | Substrate und screeningverfahren für transportproteine |
US6812339B1 (en) | 2000-09-08 | 2004-11-02 | Applera Corporation | Polymorphisms in known genes associated with human disease, methods of detection and uses thereof |
US20040234977A1 (en) | 2001-05-14 | 2004-11-25 | Da-Wei Gong | Novel alanine transaminase enzyme and methods of use |
CN1292655C (zh) | 2001-11-08 | 2007-01-03 | 蛋白质设计实验室股份有限公司 | IgG抗体稳定的液态药物制剂 |
ES2329778T3 (es) | 2002-01-18 | 2009-12-01 | Novozymes A/S | 2,3-aminomutasa de alanina. |
IL152905A0 (en) | 2002-11-17 | 2003-06-24 | Univ Ramot | Dopaminergic markers induction in neuronal-like cells isolated from adult human bone marrow stromal cells: implications for novel gene therapy strategy for parkinsons disease |
US20050265983A1 (en) | 2002-11-17 | 2005-12-01 | Eldad Melamed | Methods, nucleic acid constructs and cells for treating neurodegenerative disorders |
US20030165495A1 (en) | 2003-04-01 | 2003-09-04 | Carulli John P. | Nucleic acids and polypeptides |
US7147713B2 (en) | 2003-04-30 | 2006-12-12 | Cree, Inc. | Phase controlled sublimation |
CN1838968A (zh) * | 2003-08-08 | 2006-09-27 | 艾伯吉尼斯公司 | 针对甲状旁腺激素(pth)之抗体和其用途 |
US20050170391A1 (en) | 2004-01-30 | 2005-08-04 | Xenoport, Inc. | TAUT1 transporters expressed in blood brain barrier cells |
KR100789645B1 (ko) | 2004-04-14 | 2007-12-27 | 주식회사유한양행 | B형 간염바이러스의 s-표면항원을 인식하는 인간화 항체및 이의 제조방법 |
EP2314317A3 (en) | 2004-07-09 | 2011-06-29 | Chugai Seiyaku Kabushiki Kaisha | Anti-glypican 3 antibody |
JPWO2006038315A1 (ja) | 2004-10-07 | 2008-07-31 | 株式会社サンギ | 経皮・経粘膜吸収製剤 |
PA8672101A1 (es) | 2005-04-29 | 2006-12-07 | Centocor Inc | Anticuerpos anti-il-6, composiciones, métodos y usos |
EP1957535A1 (en) * | 2005-11-09 | 2008-08-20 | Abbott Laboratories | Human bnp immunospecific antibodies |
CA2634925C (en) * | 2005-12-23 | 2015-06-23 | Arcadia Biosciences, Inc. | Nitrogen-efficient monocot plants |
CH697825B1 (de) | 2006-02-01 | 2009-02-27 | Isofer Ag | Auffangzaun für Lawinen Stein- oder Holzschlag. |
WO2007119774A1 (ja) | 2006-04-13 | 2007-10-25 | Chugai Seiyaku Kabushiki Kaisha | タウリントランスポーター遺伝子 |
US20100233759A1 (en) | 2007-03-15 | 2010-09-16 | Chugai Seiyaku Kabushiki Kaisha | Method for production of polypeptide |
AU2008284753B2 (en) * | 2007-08-07 | 2014-01-16 | Chugai Seiyaku Kabushiki Kaisha | Method of producing heterogeneous protein |
JP5337043B2 (ja) | 2007-10-15 | 2013-11-06 | 中外製薬株式会社 | 異種タンパク質を高生産する細胞の作製方法 |
BRPI0818764B1 (pt) | 2007-10-24 | 2017-11-21 | Chugai Seiyaku Kabushiki Kaisha | Process of production of a polipeptídeo |
US8741601B2 (en) | 2009-04-22 | 2014-06-03 | Chugai Seiyaku Kabushiki Kaisha | Method for producing a cell capable of high-yield production of heteroproteins |
-
2008
- 2008-08-06 AU AU2008284753A patent/AU2008284753B2/en active Active
- 2008-08-06 KR KR1020107002620A patent/KR101577839B1/ko active IP Right Grant
- 2008-08-06 JP JP2009526472A patent/JP5337033B2/ja active Active
- 2008-08-06 BR BRPI0815036-2A patent/BRPI0815036B1/pt active IP Right Grant
- 2008-08-06 ES ES08792251.4T patent/ES2591284T3/es active Active
- 2008-08-06 RU RU2010108308/10A patent/RU2487168C2/ru active
- 2008-08-06 MX MX2010001319A patent/MX2010001319A/es active IP Right Grant
- 2008-08-06 WO PCT/JP2008/064095 patent/WO2009020144A1/ja active Application Filing
- 2008-08-06 CA CA2695849A patent/CA2695849C/en active Active
- 2008-08-06 EP EP08792251.4A patent/EP2186905B1/en active Active
- 2008-08-06 DK DK08792251.4T patent/DK2186905T3/en active
- 2008-08-06 CN CN200880101621.1A patent/CN101809161B/zh active Active
- 2008-08-06 US US12/733,052 patent/US8697397B2/en active Active
- 2008-08-07 TW TW97130081A patent/TWI463013B/zh active
-
2010
- 2010-10-25 HK HK10110028.3A patent/HK1143608A1/xx unknown
-
2014
- 2014-03-26 US US14/225,833 patent/US9284374B2/en active Active
-
2015
- 2015-07-16 US US14/800,924 patent/US9499618B2/en active Active
Non-Patent Citations (1)
Title |
---|
Fang Zhang 등. Cytotechnology. Vol. 51, No. 1, 페이지 21-28 (2006)* |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220083949A (ko) * | 2020-12-11 | 2022-06-21 | 대한민국(농촌진흥청장) | 내염성 증진 신품종 식물 |
KR102479900B1 (ko) | 2020-12-11 | 2022-12-26 | 대한민국 | 내염성 증진 신품종 식물 |
Also Published As
Publication number | Publication date |
---|---|
US9284374B2 (en) | 2016-03-15 |
JP5337033B2 (ja) | 2013-11-06 |
US20150315624A1 (en) | 2015-11-05 |
RU2010108308A (ru) | 2011-09-20 |
TW200920845A (en) | 2009-05-16 |
RU2487168C2 (ru) | 2013-07-10 |
BRPI0815036B1 (pt) | 2022-09-20 |
ES2591284T3 (es) | 2016-11-25 |
US8697397B2 (en) | 2014-04-15 |
MX2010001319A (es) | 2010-06-01 |
AU2008284753B2 (en) | 2014-01-16 |
EP2186905A4 (en) | 2010-09-01 |
CA2695849A1 (en) | 2009-02-12 |
CA2695849C (en) | 2018-10-16 |
US20140309405A1 (en) | 2014-10-16 |
DK2186905T3 (en) | 2016-09-19 |
BRPI0815036A2 (pt) | 2014-10-14 |
TWI463013B (zh) | 2014-12-01 |
KR20100057598A (ko) | 2010-05-31 |
WO2009020144A1 (ja) | 2009-02-12 |
CN101809161A (zh) | 2010-08-18 |
AU2008284753A1 (en) | 2009-02-12 |
EP2186905B1 (en) | 2016-07-13 |
US20100167346A1 (en) | 2010-07-01 |
US9499618B2 (en) | 2016-11-22 |
HK1143608A1 (en) | 2011-01-07 |
EP2186905A1 (en) | 2010-05-19 |
CN101809161B (zh) | 2014-03-12 |
JPWO2009020144A1 (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101577839B1 (ko) | 이종 단백질의 제조 방법 | |
KR101636086B1 (ko) | 이종 단백질 제조를 위한 세포 및 그것을 사용한 제조 방법 | |
KR101342172B1 (ko) | 타우린 트랜스포터 유전자 | |
EP2135946B1 (en) | Method for production of polypeptide | |
WO2006088198A1 (ja) | ハムスターigf-1を用いたタンパク質の製造方法 | |
WO2010084947A1 (ja) | 異種ポリペプチドの製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180813 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190821 Year of fee payment: 5 |