KR101577839B1

KR101577839B1 - 이종 단백질의 제조 방법

Info

Publication number: KR101577839B1
Application number: KR1020107002620A
Authority: KR
Inventors: 히사히로 다부치; 도모야 스기야마
Original assignee: 추가이 세이야쿠 가부시키가이샤
Priority date: 2007-08-07
Filing date: 2008-08-06
Publication date: 2015-12-15
Also published as: US9284374B2; JP5337033B2; US20150315624A1; RU2010108308A; TW200920845A; RU2487168C2; BRPI0815036B1; ES2591284T3; US8697397B2; MX2010001319A; AU2008284753B2; EP2186905A4; CA2695849A1; CA2695849C; US20140309405A1; DK2186905T3; BRPI0815036A2; TWI463013B; KR20100057598A; WO2009020144A1

Abstract

천연형 단백질 또는 재조합 단백질을 고생산량으로 제조할 수 있는 방법을 제공한다.
알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양하여, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.

Description

이종 단백질의 제조 방법 {METHOD OF PRODUCING HETEROGENEOUS PROTEIN}

본 발명은 이종(異種) 단백질의 제조 방법에 관한 것으로서, 보다 상세하게는, 알라닌아미노트랜스페라아제를 강(强)발현하는 세포를 사용하여 폴리펩티드를 제조하는 방법에 관한 것이다.

유전자 재조합 기술을 이용하여, 의약으로서 유용한 단백질을 생산할 때 동물 세포를 사용하면, 원핵 세포가 수행할 수 없는 복잡한 번역 후 수식이나 폴딩이 가능해지므로, 동물 세포는 재조합 단백질 생산을 위한 숙주 세포로서 다용되어 왔다.

최근, 항체나 생리 활성 단백질 등의 다양한 바이오 의약품이 배출되고 있는데, 재조합 단백질을 효율적으로 동물 세포에게 생산케 하는 기술은 바이오 의약품의 저비용화로 연결되어 환자에게 안정적인 공급을 약속하는 것이다.

따라서, 보다 생산 효율이 높은 단백질의 제조 방법이 요망되고 있다.

알라닌은 단백질 구성 아미노산 중 하나로, 비필수 아미노산이다. 생체 내에서는, 피루브산에 글루탐산의 아미노기가 전이됨으로써 생합성된다. 또, 역반응으로 분해된다.

알라닌의 분해 효소로서는, 알라닌아미노트랜스페라아제 (EC 2.6.1.2.)(비특허문헌 1) 가 알려져 있는데, 이 효소는 알라닌의 아미노기를 2-옥소글루타르산으로 전이시켜 글루탐산을 생성시킨다. 알라닌아미노트랜스페라아제는 글루타민-피루브산트랜스아미나아제라고도 불리고, GPT 로 약칭된다 (비특허문헌 2). GPT 는 GOP (아스파르트산아미노트랜스페라아제) 와 함께, 간장 중에 함유되는 효소로서, 간장의 세포가 파괴되면 혈액 중에 방출되기 때문에, GPT 와 GOT 가 이상(異常) 고가를 나타내는 경우에는 간장에 어떠한 장해가 있다고 진단된다.

이와 같이, 알라닌아미노트랜스페라아제는 간기능의 마커로서 이용되고 있는데, 알라닌아미노트랜스페라아제를 강발현한 CHO 세포 등의 숙주 세포가 어떤 거동을 나타내는지에 대해서는 알려지지 않았다.

Sanjay B. J., et. al., Hepatology (2004) 39(5), 1297-1302 Melanie M. S., et. al., Genomics (1997) 40, 247-252

본 발명은 천연형 단백질 또는 재조합 단백질을 높은 생산량으로 제조할 수 있는 방법을 제공하는 것을 목적으로 한다.

본 발명자들은 상기 과제를 해결하기 위해 예의 노력한 결과, 알라닌아미노트랜스페라아제 (이하, 「ALT」라고 기재하는 경우도 있다) 를 강발현하는 세포를 사용함으로써 원하는 폴리펩티드의 생산량을 증가시킬 수 있는 것을 알아내어, 본 발명을 완성시키기에 이르렀다. 또한, ALT 와 타우린 트랜스포터를 공(共)발현시키는 세포를 사용함으로써, 원하는 폴리펩티드의 생산량을 더욱 증가시킬 수 있었다. 세포 배양에서, 알라닌은 시간 경과적으로 다량 생성되므로, 세포 내에 축적된 알라닌은 배지 중에 분비된다. ALT 강발현에 의해, 알라닌으로부터 피루브산이나 글루탐산을 생합성시키는 반응을 촉진할 수 있으면, TCA 회로에서의 대사나, 당신생(糖新生)에 의한 글루코오스 생성에 이용되어, 세포의 배양 거동이 개선되고, 원하는 폴리펩티드의 고생산이 기대된다.

본 발명의 요지는 이하와 같다.

(1) 알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.

(2) 알라닌아미노트랜스페라아제를 강발현하는 세포가 알라닌아미노트랜스페라아제를 코드하는 DNA 를 도입한 세포인 (1) 기재된 제조 방법.

(3) 알라닌아미노트랜스페라아제를 강발현하는 세포가 추가로 타우린 트랜스포터를 강발현하는 (1) 또는 (2) 기재된 제조 방법.

(4) 타우린 트랜스포터를 강발현하는 세포가 타우린 트랜스포터를 코드하는 DNA 를 도입한 세포인 (3) 기재된 제조 방법.

(5) 세포가 차이니즈 햄스터 난소 세포인 (2) 또는 (4) 기재된 제조 방법.

(6) 원하는 폴리펩티드가 항체인 (1) ∼ (5) 중 어느 하나에 기재된 제조 방법.

(7) 알라닌아미노트랜스페라아제를 코드하는 DNA 가 이하의 (a) ∼ (e) 중 어느 하나인 (2) ∼ (6) 중 어느 하나에 기재된 제조 방법.

(a) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA

(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA

(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA

(d) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA

(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA

(8) (1) ∼ (7) 중 어느 하나에 기재된 방법으로 제조된 폴리펩티드를 함유하는 의약품을 제조하는 방법.

(9) 알라닌아미노트랜스페라아제를 코드하는 DNA 와 원하는 폴리펩티드를 코드하는 DNA 가 도입되어 있는 세포.

(10) 추가로 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 (9) 기재된 세포.

(11) 알라닌아미노트랜스페라아제를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 세포.

(12) 알라닌아미노트랜스페라아제를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를

-케토글루탈산을 함유하는 배지에서 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.

본 발명에 의해, 원하는 폴리펩티드의 생산량을 증가시킬 수 있게 되었다.

본 명세서는 본원 우선권의 기초인 일본 특허출원, 일본 특허출원 2007-205158 의 명세서 및/또는 도면에 기재되는 내용을 포함한다.

도 1 은 인간 ALT1 (496 아미노산) 을 발현시킨 Puromycin 선발용 플라스미드이다.
도 2 는 인간 ALT1 (496 아미노산) 을 발현시킨 Hygromycin 선발용 플라스미드이다.
도 3 은 50 ㎖ 쉐이커 플라스크 유가(流加) 배양 17 일째의 항(抗)글리피칸-3 항체 생성량 플롯이다. pPur-ALT1 도입 세포 (n = 4) 의 항글리피칸-3 항체 생성량은 pPur 도입 세포 (n = 3) 에 대해 우위였다 (P < 0.01).
도 4 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 1 ℓ Jar 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 19 일째의 A72 의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 이고 P41 보다 높았다.
도 5 는 ALT1 발현주인 A72 및 컨트롤주 P41 의 생존률을 나타내는 그래프이다. 배양 후기에서의 A72 의 생존률은 P41 보다 높았다.
도 6 은 50 ㎖ 쉐이커 플라스크 유가 배양 4 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg-TauT/pPur-ALT1 공도입 세포 (n = 6) 의 항글리피칸-3 항체 생성량은 pHyg-TauT/pPur 공(共)도입 세포 (n = 8) 에 대해 우위였다 (P < 0.01).
도 7 은 TauT/ALT1 공발현주인 TA41 의 1 ℓ Jar 유가 배양의 항체 생성량을 나타내는 그래프이다. 배양 21 일째의 항글리피칸-3 항체 생성량은 5.3 g/ℓ 였다.
도 8 은 클로닝된 CHO 세포 유래 햄스터 타우린 트랜스포터 유전자의 염기 배열 및 아미노산 배열을 나타낸다.
도 9 는 신규로 클로닝한 CHO 세포 유래 타우린 트랜스포터막 토폴로지이다.
도 10 은 Hamster TauT (622 아미노산) 를 발현시킨 플라스미드이다.
도 11 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 생세포 밀도 플롯이다. pHyg/TauT 도입 세포의 생세포 밀도는 pHyg 도입 세포에 대해 우위였다.
도 12 는 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 락트산 생성량 플롯이다. pHyg/TauT 도입 세포는 저락트산 생성이고, pHyg 도입 세포에 대해 우위였다.
도 13 은 50 ㎖ 쉐이커 플라스크 배치 배양 7 일째의 항글리피칸-3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 7 주 중 4 주는 pHyg 도입 세포의 최고값 이상의 항체 생성량을 갖고 있었다.
도 14 는 50 ㎖ 쉐이커 플라스크 유가 배양 7 일째의 항글리피칸 3 항체 생성량 플롯이다. pHyg/TauT 도입 세포의 항글리피칸-3 항체는 pHyg 도입 세포에 대해 우위였다.
도 15 는 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자(jar)에 의한 유가 배양에서의 생존률을 나타내는 그래프이다. T10 의 생존률은 배양 32 일째에도 80 % 이상이었다.
도 16 은 정치(靜置) 배양에서의 확대 과정에서 증식력이 높은 pHyg/TauT 도입 세포인 T10 의 1 ℓ 자에 의한 유가 배양에서의 항체 생성량을 나타내는 그래프이다. 배양 35 일째의 항글리피칸-3 항체 생성량은 2.9 g/ℓ 였다.
도 17 은 TauT 도입 T10 세포가 세포막 상에 TauT 분자를 발현시키고 있는 것을 나타내는 플로우 사이트 메트리의 분석 결과이다.
도 18 은 1 ℓ 자 유가 배양 중의 세포 내 암모니아 함량 (농도비) 을 나타내는 그래프이다. 친주에 대해, pHyg/TauT 도입주의 암모니아 억제는 현저하였다.
도 19 는 배지 중의 타우린 농도에 의존하여 타우린이 세포 내에 주입되어 있는 것을 나타내는 그래프이다. 타우린의 주입량은 pHyg/TauT 도입주와 친주에서 차는 확인되지 않았다.
도 20 은 배지 중의 글루타민 소비를 나타내는 그래프이다. pHyg/TauT 도입주는 친주에 대해, 배지 중의 타우린 농도에 의존하지 않아 세포당 글루타민 소비량이 현저하게 높았다.
도 21 은 pHyg/TauT 도입주의 항글리피칸-3 항체 생성량이 배양 개시시의 배지 중의 타우린 농도에 의존하지 않고, 동일한 정도인 것을 나타내는 그래프이다.
도 22 는 TauT/ALT 공발현주 TA41 의 쉐이커 fed-batch 배양 14 일째의 항글리피칸-3 항체 생성량을 나타낸다.

-케토글루탈산 첨가에 의해 항체 생성량이 증가되었다.

이하, 본 발명의 실시형태에 대해 보다 상세하게 설명한다.

본 발명은 ALT 를 강발현하고, 또한 원하는 폴리펩티드를 코드하는 DNA 를 도입한 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법을 제공한다.

본 발명의 방법에서, 세포는 원하는 폴리펩티드를 생성할 수 있는 천연 세포이어도 되고, 원하는 폴리펩티드를 코드하는 DNA 를 도입한 형질 전환 세포이어도 되는데, 원하는 폴리펩티드를 코드하는 DNA 를 도입한 형질 전환 세포가 바람직하다.

본 발명의 방법에서, 원하는 폴리펩티드는 특별히 한정되지 않고, 항체 (예를 들어, 항 IL-6 리셉터 항체, 항 IL-6 항체, 항글리피칸-3 항체, 항 CD3 항체, 항 CD20 항체, 항 GPIIb/IIIa 항체, 항 TNF 항체, 항 CD25 항체, 항 EGFR 항체, 항 Her2/neu 항체, 항 RSV 항체, 항 CD33 항체, 항 CD52 항체, 항 IgE 항체, 항 CD11a 항체, 항 VEGF 항체, 항 VLA4 항체 등) 나 생리 활성 단백질 (과립구 콜로니 자극 인자 (G-CSF), 과립구 매크로파지 콜로니 자극 인자 (GM-CSF), 에리트로포이에틴, 인터페론, IL-1 이나 IL-6 등의 인터류킨, t-PA, 우로키나제, 혈청 알부민, 혈액 응고 인자, PTH 등) 등 어떠한 폴리펩티드이어도 되는데, 특히 항체가 바람직하다. 항체는, 천연 항체, Fab, scFv, sc(Fv)2 등의 저분자화 항체, 키메라 항체, 인간화 항체 등의 어떠한 항체이어도 된다.

ALT 를 강발현하는 세포를 사용함으로써 세포에 의한 폴리펩티드의 생성량을 증가시킬 수 있다.

ALT 는 본래, 알라닌의 아미노기를 2-옥소글루타르산으로 전이시키고, 글루탐산을 생성시키는 효소로서 알려져 있다. 본 발명자들은 CHO 세포 등의 숙주 세포 내에서 강발현함으로써 알라닌으로부터 피루브산이나 글루탐산을 생합성시키는 반응을 촉진할 수 있으면, TCA 회로에서의 대사나, 당신생에 의한 글루코오스 생성에 이용되어, 세포의 배양 거동이 개선되고, 원하는 폴리펩티드의 타카오산이 기대된다고 생각하였다.

ALT 를 강발현하는 세포는 천연 세포와 비교하여 ALT 의 발현량이 증가되어 있는 세포이면 특별히 한정되지 않는다. 천연 세포는 특별히 한정되지 않는데, 예를 들어 CHO 세포 등 재조합 단백질을 제조할 때 숙주로서 사용되고 있는 세포를 들 수 있다.

ALT 를 강발현하는 세포로서는, 예를 들어, ALT 유전자가 인위적으로 도입된 세포를 들 수 있다. ALT 유전자가 인위적으로 도입된 세포는 당업자에게 공지된 방법에 의해 제조할 수 있고, 예를 들어, ALT 유전자를 벡터에 삽입하고, 그 벡터를 세포에 형질 전환시킴으로써 제조할 수 있다. 또한, 본 명세서에서는 유전자 활성화 기술 (예를 들어, 국제 공개 제WO94/12650호 팜플렛 참조) 에 의해 내인성(內因性) ALT 유전자가 활성화되고, 그 결과, ALT 가 강발현된 세포도 ALT 유전자가 인위적으로 도입된 세포에 포함된다.

세포에 강발현하는 ALT 유전자로서는 어떠한 생물에서 유래하는 ALT 이어도 되며 특별히 한정되지 않는다. 구체적으로는, 인간, 마우스, 래트, 개, 아프리카 발톱 개구리, 초파리, 선충, 일본쌀, 원자 홍조, 빵 효모, 사상균 Ashbya gossypii, 진균 Candida albicans, 분열 효모, 진균 Aspergillus nidulans, 진균 Aspergillus fumigatus, 청주 누룩곰팡이 Aspergillus oryzae, 진균 Cryptococcus neoformans, 세포성 점균 Dictyostelium discoideum, Trypanosoma brucei, 세포 내 기생성 원충 Leishmania major, 적리 아메바 Entamoeba histolytica 또는 세포 내 기생성 원충 Trypanosoma cruzi 등의 ALT 가 공지되어 있었고, 이것들을 이용할 수 있는데, 인간, 설치류 혹은 숙주 세포와 동일한 종 유래의 ALT 인 것이 바람직하고, 예를 들어, ALT 를 강발현하는 세포가 차이니즈 햄스터 난소 세포 (CHO 세포) 인 경우에는, 인간 혹은 햄스터 유래의 ALT 인 것이 바람직하다. 인간, 마우스, 효모 등의 ALT 는 Variant (ALT1 과 ALT2) 가 존재한다. ALT2 는 ALT1 에 대해 아미노산 레벨로 80 % 이상의 상동성이 있다. 후술하는 실시예에서는 ALT1 을 강제 발현시켰다.

ALT 유전자로서는, 이하의 (a) ∼ (e) 중 어느 것의 DNA 를 들 수 있다.

(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 몇 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA

(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA

(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA

ALT 를 강발현하는 세포는 동물 세포, 식물 세포, 효모 등의 진핵 세포 ; 대장균, 고초균 등의 원핵 세포 등 어떤 세포이어도 되고, CHO 세포, COS 세포 등의 동물 세포가 바람직하고, 특히 CHO 세포가 바람직하다. 또, 원하는 폴리펩티드를 제조하기 위해서는, CHO dhfr-세포 등 원하는 유전자를 도입하는 데 적합한 세포인 것이 바람직하다.

ALT 를 강발현하는 세포는 원하는 폴리펩티드를 제조하기 위해, 추가로 타우린 트랜스포터를 강발현하고 있는 것이 바람직하다. 당해 세포에 원하는 폴리펩티드를 코드하는 유전자를 도입하고, 그 세포를 배지 내에서 배양시킴으로써, 보다 대량으로 원하는 폴리펩티드를 제조할 수 있다.

ALT 유전자가 인위적으로 도입된 세포를 사용하여 원하는 폴리펩티드를 제조하는 경우, ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자의 도입 순서는 특별히 제한되지 않아, ALT 유전자를 도입한 후에 원하는 폴리펩티드를 코드하는 유전자를 도입해도 되고, 원하는 폴리펩티드를 코드하는 유전자를 도입한 후에 ALT 유전자를 도입해도 된다. 또, ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자를 동시에 도입해도 된다.

ALT 유전자 및 원하는 폴리펩티드를 코드하는 유전자의 도입은 단일한 벡터에 의해 동시에 도입해도 되고, 복수의 벡터를 사용하여 각각 도입해도 된다.

ALT 외에 타우린 트랜스포터를 강발현하는 세포를 사용함으로써, 세포 내 암모니아 농도를 억제시킬 수 있다.

타우린 트랜스포터는 타우린, β-알라닌이나 각종 아미노산을 세포 내에 주입할 수 있는, 침투압 조절 기능을 갖는 막단백질이다.

타우린 트랜스포터를 강발현하는 세포는 천연 세포와 비교하여 타우린 트랜스포터의 발현량이 증가되어 있는 세포이면 특별히 한정되지 않는다. 천연 세포는 특별히 한정되지 않는데, 예를 들어 CHO 세포 등 재조합 단백질을 제조할 때 숙주로서 사용되고 있는 세포를 들 수 있다.

타우린 트랜스포터를 강발현하는 세포로서는, 예를 들어, 타우린 트랜스포터 유전자가 인위적으로 도입된 세포를 들 수 있다. 타우린 트랜스포터 유전자가 인위적으로 도입된 세포는 당업자에게 공지된 방법에 의해 제조할 수 있고, 예를 들어, 타우린 트랜스포터 유전자를 벡터에 삽입하고, 그 벡터를 세포에 형질 전환시킴으로써 제조할 수 있다.

세포에 강발현하는 타우린 트랜스포터 유전자로서는, 어떤 생물 유래의 타우린 트랜스포터이어도 되며 특별히 한정되지 않는다. 구체적으로는, 인간, 마우스, 래트, 햄스터 등 설치류 등의 생물 유래의 타우린 트랜스포터를 들 수 있고, 인간, 설치류 혹은 숙주 세포와 동일한 종 유래의 타우린 트랜스포터인 것이 바람직하고, 예를 들어, 타우린 트랜스포터를 강발현하는 세포가 차이니즈 햄스터 난소 세포 (CHO 세포) 인 경우에는, 인간 혹은 햄스터 유래의 타우린 트랜스포터인 것이 바람직하다.

타우린 트랜스포터 유전자로서는, 타우린 트랜스포터를 코드하는 이하의 (a₁) ∼ (e₁) 중 어느 하나의 DNA 를 들 수도 있다.

(a₁) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA

(b₁) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA

(c₁) 배열 번호 62, 64, 66 또는 68 의 아미노산 배열과 70 % 이상의 동일성을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA

(d₁) 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA

(e₁) 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA

원하는 폴리펩티드를 제조하려면, 타우린 트랜스포터와 ALT 유전자를 강발현하는 세포에 원하는 폴리펩티드를 코드하는 유전자를 도입하여, 그 세포를 배지 중에서 배양시킴으로써 제조할 수 있다. 또한, 본 명세서에서는 유전자 활성화 기술 (예를 들어, 국제공개 제WO94/12650호 팜플렛 참조) 에 의해, 그 세포의 내인성의 원하는 폴리펩티드를 코드하는 유전자가 활성화됨으로써, 원하는 폴리펩티드를 생성하는 세포를 사용하여, 원하는 폴리펩티드를 제조할 수도 있다.

타우린 트랜스포터 유전자와 ALT 유전자가 인위적으로 도입된 세포를 사용하여 원하는 폴리펩티드를 제조하는 경우, 타우린 트랜스포터 유전자와 ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자의 도입 순서는 특별히 제한되지 않아, 타우린 트랜스포터 유전자와 ALT 유전자를 도입한 후에 원하는 폴리펩티드를 코드하는 유전자를 도입해도 되고, 원하는 폴리펩티드를 코드하는 유전자를 도입한 후에 타우린 트랜스포터 유전자와 ALT 유전자를 도입해도 된다. 또, 타우린 트랜스포터 유전자와 ALT 유전자와 원하는 폴리펩티드를 코드하는 유전자를 동시에 도입해도 된다.

타우린 트랜스포터 유전자, ALT 유전자 및 원하는 폴리펩티드를 코드하는 유전자의 도입은 단일한 벡터에 의해 동시에 도입해도 되고, 복수의 벡터를 사용하여 각각 도입해도 된다.

ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 의 배양에는, 통상적인 세포 (바람직하게는, 동물 세포) 배양에서 사용되고 있는 배지를 사용할 수 있다. 이들에는 통상적으로, 아미노산, 비타민류, 지질 인자, 에너지원, 침투압 조절제, 철원, pH 완충제를 함유한다. 이들 성분의 함량은 통상적으로 아미노산은 0.05 - 1500 ㎎/ℓ, 비타민류는 0.001 - 10 ㎎/ℓ, 지질 인자는 0 - 200 ㎎/ℓ, 에너지원은 1 - 20 g/ℓ, 침투압 조절제는 0.1 - 10000 ㎎/ℓ, 철원은 0.1 - 500 ㎎/ℓ, pH 완충제는 1 - 10000 ㎎/ℓ, 미량 금속 원소는 0.00001 - 200 ㎎/ℓ, 계면 활성제는 0 - 5000 ㎎/ℓ, 증식 보조 인자는 0.05 - 10000 ㎍/ℓ 및 뉴클레오시드는 0.001 - 50 ㎎/ℓ 의 범위가 적당한데, 이들에 한정되지 않고, 배양하는 세포의 종류, 원하는 폴리펩티드의 종류 등에 의해 적절히 결정할 수 있다.

상기 성분 외에, 예를 들어, 미량 금속 원소, 계면 활성제, 증식 보조 인자, 뉴클레오시드 등을 첨가해도 된다.

구체적으로는, 예를 들어, L-알라닌, L-알기닌, L-아스파라긴, L-아스파르트산, L-시스테인, L-시스틴, L-글루타민, L-글루탐산, 글리신, L-히스티딘, L-이로류신, L-류신, L-리신, L-메티오닌, L-오르니틴, L-페닐알라닌, L-프롤린, L-세린, L-트레오닌, L-트립토판, L-티로신, L-발린 등, 바람직하게는 L-알라닌, L-알기닌, L-아스파라긴, L-아스파르트산, L-시스틴, L-글루타민, L-글루탐산, 글리신, L-히스티딘, L-이로류신, L-류신, L-리신, L-메티오닌, L-페닐알라닌, L-프롤린, L-세린, L-트레오닌, L-트립토판, L-티로신, L-발린 등의 아미노산류 ; i-이노시톨, 비오틴, 엽산, 리포산, 니코틴아미드, 니코틴산, p-아미노벤조산, 판토텐산칼슘, 염산피리독살, 염산피리독신, 리보플라빈, 염산티아민, 비타민 B12, 아스코르브산 등, 바람직하게는 비오틴, 엽산, 리포산, 니코틴산아미드, 판토텐산칼슘, 염산피리독살, 리보플라빈, 염산티아민, 비타민 B12, 아스코르브산 등의 비타민류 ; 염화콜린, 타르타르산콜린, 리놀산, 올레산, 콜레스테롤 등, 바람직하게는 염화콜린 등의 지질 인자 ; 글루코오스, 갈락토오스, 만노오스, 푸룩토오스 등, 바람직하게는 글루코오스 등의 에너지원 ; 염화나트륨, 염화칼륨, 질산칼륨 등, 바람직하게는 염화나트륨 등의 침투압 조절제 ; EDTA 철, 시트르산 철, 염화 제 1 철, 염화 제 2 철, 황산 제 1 철, 황산 제 2 철, 질산 제 2 철 등, 바람직하게는 염화 제 2 철, EDTA 철, 시트르산 철 등의 철원류 ; 탄산수소나트륨, 염화칼슘, 인산 2 수소나트륨, HEPES, MOPS 등, 바람직하게는 탄산수소나트륨 등의 pH 완충제를 함유하는 배지를 예시할 수 있다.

상기 성분 외에, 예를 들어, 황산구리, 황산망간, 황산아연, 황산마그네슘, 염화니켈, 염화주석, 염화마그네슘, 아(亞)규산나트륨 등, 바람직하게는 황산구리, 황산아연, 황산마그네슘 등의 미량 금속 원소 ; Tween80, 플루로닉 F68 등의 계면 활성제 ; 및 재조합형 인슐린, 재조합형 IGF-1, 재조합형 EGF, 재조합형 FGF, 재조합형 PDGF, 재조합형 TGF-

, 염산에탄올아민, 아(亞)셀렌산나트륨, 레티노인산, 염산프토렉신 등, 바람직하게는 아셀렌산나트륨, 염산에탄올아민, 재조합형 IGF-1, 염산프토렉신 등의 증식 보조 인자 ; 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 아데노신, 시티딘, 구아노신, 우리딘 등의 뉴클레오시드 등을 첨가해도 된다. 또한 상기 배지의 적합예에서는, 스트렙토마이신, 페니실린 G 칼륨 및 겐타마이신 등의 항생 물질이나, 페놀레드 등의 pH 지시약을 포함하고 있어도 된다.

또, 배지에는, ALT 의 기질이 되는

-케토글루탈산을 첨가해도 된다.

-케토글루탈산의 첨가에 의해, 원하는 폴리펩티드 (예를 들어, 항체) 의 생성량이 증가될 수 있다. 이 때의

-케토글루탈산의 첨가량은 통상적으로 0.01 ∼ 1000 mM 의 범위이면 되고, 0.1 ∼ 100 m 가 바람직하고, 또한 1 ∼ 10 mM 가 바람직하다.

배지의 pH 는 배양하는 세포에 따라 상이한데, 일반적으로는 pH 6.8 ∼ 7.6, 대부분의 경우 pH 7.0 ∼ 7.4 가 적당하다.

배지는 시판되는 동물 세포 배양용 배지, 예를 들어, D-MEM (Dulbecco's Modified Eagle Medium), D-MEM/F-12 1 : 1 Mixture (Dulbecco's Modified Eagle Medium : Nutrient Mixture F-12), RPMI1640, CHO-S-SFM II (Invitrogen 사), CHO-SF (Sigma-Aldrich 사), EX-CELL 301 (JRH biosciences 사), IS CHO-V (Irvine Scientific 사), PF-ACF-CHO (Sigma-Aldrich 사) 등의 배지를 사용할 수도 있다.

또한, 배지는 무혈청 배지, 예를 들어, CD-CHO (Invitrogen 사) 이어도 된다.

ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 가 CHO 세포인 경우, CHO 세포의 배양은 당업자에게 공지된 방법을 사용하여 실시할 수 있다. 예를 들어, 통상적으로 기상의 CO₂ 농도가 0 - 40 %, 바람직하게는 2 - 10 % 의 분위기 하, 30 - 39 ℃, 바람직하게는 37 ℃ 정도로 배양할 수 있다.

또한 배양 세포에서 항체 등의 원하는 폴리펩티드를 생성하는 경우, 배양 후기에는 세포가 상당히 고밀도 상태 (대략 1 x 10⁷ cells/㎖) 가 되고, 락트산 등 노폐물의 영향이 매우 높아진다. ALT 를 강발현하는 세포에 의해 원하는 폴리펩티드를 제조하면, 배양 후기에도 높은 생존률을 유지하여, 원하는 폴리펩티드의 생성량 향상에 대해서도 기대할 수 있다.

ALT 를 강발현하는 세포를 사용하여 원하는 폴리펩티드를 생성시키기 위해 적당한 배양 기간은 통상적으로 1 일 ∼ 3 개월이고, 바람직하게는 1 일 ∼ 2 개월, 더욱 바람직하게는 1 일 ∼ 1 개월이다.

또, 동물 세포 배양용 각종 배양 장치로서는, 예를 들어 발효조형 탱크 배양 장치, 에어리프트형 배양 장치, 컬쳐 플라스크형 배양 장치, 스피너 플라스크형 배양 장치, 마이크로 캐리어형 배양 장치, 유동층형 배양 장치, 호로파이버형 배양 장치, 롤러 보틀형 배양 장치, 충전조형 배양 장치 등을 사용하여 배양할 수 있다.

배양은 배치 배양 (batch culture), 유가 배양 (fed-batch culture), 연속 배양 (continuous culture) 등 중 어느 방법을 이용해도 되는데, 유가 배양 또는 연속 배양이 바람직하고, 유가 배양이 보다 바람직하다.

또한, ALT 를 강발현하는 세포 (타우린 트랜스포터를 강발현해도 된다) 를 강발현하는 세포를 배양할 때에, 세포에 대한 타우린의 주입을 촉진시키기 위해 배지 중에 타우린을 첨가해도 된다. 배지에 첨가하는 타우린의 농도는 특별히 한정되지 않는데, 통상적으로 0 g/ℓ ∼ 100 g/ℓ, 바람직하게는 0 g/ℓ ∼ 20 g/ℓ, 더욱 바람직하게는 0 g/ℓ ∼ 10 g/ℓ 이다.

본 발명의 방법에 의해 제조된 폴리펩티드가 의약으로서 이용할 수 있는 생물학적 활성을 갖는 경우에는, 이 폴리펩티드를 의약적으로 허용되는 담체 또는 첨가제와 혼합하여 제제화시킴으로써 의약품을 제조할 수 있다.

의약적으로 허용되는 담체 및 첨가제의 예로서, 물, 의약적으로 허용되는 유기 용제, 콜라겐, 폴리비닐알코올, 폴리비닐피롤리돈, 카르복시비닐폴리머, 카르복시메틸셀룰로오스나트륨, 폴리아크릴산나트륨, 알긴산나트륨, 수용성 덱스트란, 카르복시메틸스타치나트륨, 펙틴, 메틸셀룰로오스, 에틸셀룰로오스, 잔탄검, 아라비아고무, 카세인, 한천, 폴리에틸렌글리콜, 디글리세린, 글리세린, 프로필렌글리콜, 바셀린, 파라핀, 스테아릴알코올, 스테아르산, 인간 혈청 알부민 (HSA), 만니톨, 소르비톨, 락토오스, 의약 첨가물로서 허용되는 계면 활성제 등을 들 수 있다.

실제 첨가물은 본 발명 치료제의 제형에 따라 상기 중에서 단독으로 또는 적절하게 조합하여 선택되는데, 물론 이들에 한정되는 것은 아니다. 예를 들어, 주사용 제제로서 사용하는 경우, 정제된 폴리펩티드를 용제, 예를 들어 생리 식염수, 완충액, 포도당 용액 등에 용해시키고, 이것에 흡착 방지제, 예를 들어 Tween80, Tween20, 젤라틴, 인간 혈청 알부민 등을 첨가한 것을 사용할 수 있다. 혹은, 사용 전에 용해 재구성하는 제형으로 하기 위해 동결 건조시킨 것이어도 되고, 동결 건조를 위한 부형제로서는, 예를 들어, 만니톨, 포도당 등의 당 알코올이나 당류를 사용할 수 있다.

폴리펩티드의 유효 투여량은 폴리펩티드의 종류, 치료나 예방의 대상으로 하는 질환의 종류, 환자의 연령, 질환의 중독도(重篤度) 등에 의해 적절히 선택된다. 예를 들어, 폴리펩티드가 항글리피칸 항체인 경우, 항글리피칸 항체의 유효 투여량은 1 회에 체중 1 kg 당 0.001 mg 내지 1000 mg 의 범위에서 선택된다. 혹은, 환자당 0.01 ∼ 100000 mg/body 의 투여량을 선택할 수 있다. 그러나, 이들의 투여량에 제한되는 것은 아니다.

폴리펩티드의 투여 방법은 경구, 비경구 투여 중 어느 것도 가능한데, 바람직하게는 비경구 투여이고, 구체적으로는 주사 (예를 들어, 정맥 내 주사, 근육 내 주사, 복강 내 주사, 피하 주사 등에 의한 전신 또는 국소 투여), 경비 투여, 경폐 투여, 경피 투여 등을 들 수 있다.

본 발명에서, ALT 를 코드하는 유전자로서 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA 를 사용하면 된다. 그 밖에도, 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.

배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 ALT 활성을 갖는 폴리펩티드는 인간, 마우스, 래트, 개, 아프리카 발톱 개구리, 초파리, 선충, 일본쌀, 원자 홍조, 빵 효모, 사상균 Ashbya gossypii, 진균 Candida albicans, 분열 효모, 진균 Aspergillus nidulans, 진균 Aspergillus fumigatus, 청주 누룩곰팡이 Aspergillus oryzae, 진균 Cryptococcus neoformans, 세포성 점균 Dictyostelium discoideum, Trypanosoma brucei, 세포 내 기생성 원충 Leishmania major, 적리 아메바 Entamoeba histolytica 또는 세포 내 기생성 원충 Trypanosoma cruzi ALT (이하,「인간 등의 ALT」라고 기재하는 경우도 있다) 와 기능적으로 동등한 폴리펩티드이다. 이와 같은 폴리펩티드에는, 예를 들어, 인간 등의 ALT 의 변이체 등이 함유된다. 후술하는 실시예에서는, 공개되어 있는 인간 ALT1 유전자가 코드하고 있는 아미노산 496 개 중, 4 아미노산 (R53S, Q72R, F286S, M332K) 이 치환되어 있는 변이체가 사용되었다.

어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하기 위한, 당업자에게 잘 알려진 방법으로서는, 폴리펩티드에 변이를 도입하는 방법이 알려져 있다. 예를 들어, 당업자이면, 부위 특이적 변이 유발법 (Hashimoto-Gotoh, T. et al. (1995) Gene 152, 271-275, Zoller, MJ, and Smith, M.(1983) Methods Enzymol. 100, 468-500, Kramer, W. et al.(1984) Nucleic Acids Res. 12, 9441-9456, Kramer W, and Fritz HJ (1987) Methods. Enzymol. 154, 350-367, Kunkel, TA (1985) Proc Natl Acad Sci USA. 82, 488-492, Kunkel (1988) Methods Enzymol. 85, 2763-2766) 등을 이용하여, 인간 등의 ALT 아미노산에 적절히 변이를 도입함으로써 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 조제할 수 있다. 또, 아미노산의 변이는 자연계에서도 생길 수 있다.

인간 등의 ALT 와 기능적으로 동등한 폴리펩티드로서는, 구체적으로는 인간 등의 ALT 의 아미노산 배열 (예를 들어, 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60) 중의 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 결실된 것, 인간 등의 ALT 아미노산 배열에 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 부가된 것, 인간 등의 ALT 의 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 1 개 이상 30 개 이하, 보다 바람직하게는 1 개 이상 10 개 이하의 아미노산이 다른 아미노산으로 치환된 것 등을 들 수 있다.

변이되는 아미노산 잔기는 특별히 한정되지 않는데, 아미노산 측사슬의 성질이 보존되어 있는 다른 아미노산으로 변이되는 것이 바람직하다. 예를 들어 아미노산 측사슬의 성질로서는, 소수성 아미노산 (A, I, L, M, F, P, W, Y, V), 친수성 아미노산 (R, D, N, C, E, Q, G, H, K, S, T), 지방족 측사슬을 갖는 아미노산 (G, A, V, L, I, P), 수산기 함유 측사슬을 갖는 아미노산 (S, T, Y), 황원자 함유 측사슬을 갖는 아미노산 (C, M), 카르복실산 및 아미드 함유 측사슬을 갖는 아미노산 (D, N, E, Q), 염기 함유 측사슬을 갖는 아미노산 (R, K, H), 방향족 함유 측사슬을 갖는 아미노산 (H, F, Y, W) 을 들 수 있다 (괄호 내는 모두 아미노산의 1 문자 표기를 나타낸다).

또한, 어느 아미노산 배열에 대한 1 또는 복수개의 아미노산 잔기의 결실, 부가 및/또는 다른 아미노산에 의한 치환에 의해 수식된 아미노산 배열을 갖는 폴리펩티드가 그 생물학적 활성을 유지하는 것은 이미 알려져 있다 (Mark, D.F. et al., Proc. Natl. Acad. Sci. USA (1984)81, 5662-5666, Zoller, M.J. & Smith, M.Nucleic Acids Research (1982)10, 6487-6500, Wang, A. et al., Science 224, 1431-1433, Dalbadie-McFarland, G. et al., Proc. Natl. Acad. Sci. USA (1982)79, 6409-6413).

인간 등의 ALT 에 1 또는 복수개의 아미노산 잔기가 부가된 폴리펩티드로서는, 예를 들어, 인간 등의 ALT 를 함유하는 융합 폴리펩티드를 들 수 있다. 융합 폴리펩티드는 인간 등의 ALT 와 다른 폴리펩티드가 융합된 것이다. 융합 폴리펩티드를 제조하는 방법은 인간 등의 ALT 를 코드하는 유전자와 다른 폴리펩티드를 코드하는 유전자를 프레임이 일치하도록 연결하여 이것을 발현 벡터에 도입시켜 숙주로 발현시키면 되고, 당업자에게 공지된 수법을 사용할 수 있다. 인간 등의 ALT 와의 융합에 사용되는 다른 폴리펩티드로서는, 특별히 한정되지 않는다.

인간 등의 ALT 와의 융합에 사용되는 다른 펩티드로서는, 예를 들어, FLAG (Hopp, T.P. et al., BioTechnology (1988)6, 1204-1210), 6 개의 His (히스티딘) 잔기로 이루어지는 6×His, 10×His, 인플루엔자 응집소 (HA), 인간 c-myc 의 단편(斷片), VSV-GP 의 단편, p18HIV 의 단편, T7-tag, HSV-tag , E-tag , SV40T 항원의 단편, lck tag,

-tubulin 의 단편, B-tag , Protein C 의 단편, GST (글루타티온-S-트랜스페라아제), HA (인플루엔자 응집소), 면역 글로불린 정상 영역, β-갈락토시다아제, MBP (말토오스 결합 폴리펩티드) 등을 들 수 있다.

시판되어 있는 이들 폴리펩티드를 코드하는 유전자를 인간 등의 ALT 를 코드하는 유전자와 융합시키고, 이로써 조제된 융합 유전자를 발현시킴으로써 융합 폴리펩티드를 조제할 수 있다.

또, 어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하는 당업자에게 잘 알려진 다른 방법으로서는, 하이브리다이제이션 기술 (Sambrook, J et al., Molecular Cloning 2nd ed., 9.47-9.58, Cold Spring Harbor Lab. press, 1989) 을 이용하는 방법을 들 수 있다. 즉, 당업자이면, 인간 등의 ALT 를 코드하는 DNA 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 DNA 배열) 혹은 그 일부를 기본으로, 이것과 상동성이 높은 DNA 를 단리시키고, 그 DNA 로부터 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 단리시키는 것도 통상적으로 실시할 수 있는 것이다.

인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 단리시키 위한 하이브리다이제이션의 조건으로서는, 당업자이면 적절히 선택할 수 있다. 하이브리다이제이션의 조건은 예를 들어 저(低)스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고(高)스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 낮출수록 높은 상동성을 갖는 DNA 뿐만 아니라, 낮은 상동성만 가지고 있는 DNA 까지도 포괄적으로 얻을 수 있다. 반대로, 온도를 높일수록, 높은 상동성을 갖는 DNA 만이 얻어지는 것을 기대할 수 있다. 단, 하이브리다이제이션의 스트린젠시에 영향을 미치는 요소로서는 온도 이외에도 염 농도 등 복수의 요소를 생각할 수 있고, 당업자이면 이들 요소를 적절히 선택하는 것으로 동일한 스트린젠시를 실현할 수 있다.

이들 하이브리다이제이션 기술에 의해 단리되는 DNA 가 코드하는 폴리펩티드는 인간 등의 ALT 와 아미노산 배열에서 70 % 이상의 동일성을 갖는 것이면 되는데, 통상적으로 인간 등의 ALT 와 아미노산 배열에서 높은 상동성을 갖는다. 높은 상동성이란, 통상적으로 97 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 폴리펩티드의 동일성을 결정하려면, 문헌 (Wilbur, W.J. and Lipman, D.J. Proc. Natl. Acad. Sci. USA (1983)80, 726-730) 에 기재된 알고리즘에 따르면 된다.

폴리펩티드는 후술하는 그것을 생성하는 세포나 숙주 혹은 정제 방법에 의해, 아미노산 배열, 분자량, 등전점 또는 당사슬의 유무나 형태 등이 상이할 수도 있다. 그러나, 얻어진 폴리펩티드가 인간 등의 ALT 와 동등한 기능을 갖고 있는 한, 그것을 코드하는 DNA 를 본 발명에서 이용할 수 있다. 예를 들어, 폴리펩티드를 원핵 세포, 예를 들어 대장균으로 발현시켰을 경우, 본래의 폴리펩티드의 아미노산 배열의 N 말단에 메티오닌 잔기가 부가된다. 또, 진핵 세포, 예를 들어 포유 동물 세포로 발현시켰을 경우, N 말단의 시그널 배열은 제거된다. 이와 같은 폴리펩티드를 코드하는 DNA 도 본 발명에서 이용할 수 있다.

폴리펩티드는 당업자에게 공지된 방법에 의해, 재조합 폴리펩티드로서 또 천연 폴리펩티드로서 조제할 수 있다. 재조합 폴리펩티드이면, 폴리펩티드를 코드하는 DNA 를, 적당한 발현 벡터에 삽입하고, 이것을 적당한 숙주 세포에 도입하여 얻은 형질 전환체를 회수하고, 추출물을 얻은 후, 이온 교환, 역상, 겔 여과 등의 크로마토그래피, 혹은 본 발명의 폴리펩티드에 대한 항체를 칼럼에 고정시킨 어피니티 크로마토그래피에 넣음으로써, 또는, 추가로 이들 칼럼을 복수 조합함으로써 정제시켜 조제할 수 있다.

또, 폴리펩티드를 글루타티온 S 트랜스페라아제 폴리펩티드와의 융합 폴리펩티드로서, 혹은 히스티딘을 복수 부가시킨 재조합 폴리펩티드로서 숙주 세포 (예를 들어, 동물 세포나 대장균 등) 내에서 발현시킨 경우에는, 발현시킨 재조합 폴리펩티드는 글루타티온 칼럼 혹은 니켈 칼럼을 사용하여 정제시킬 수 있다.

융합 폴리펩티드의 정제 후, 필요에 따라 융합 폴리펩티드 중 목적으로 하는 폴리펩티드 이외의 영역을, 트롬빈 또는 팩터 Xa 등에 의해 절단하여 제거할 수도 있다.

천연 폴리펩티드이면, 당업자에게 주지된 방법, 예를 들어, 인간 ALT 와 동등한 기능을 갖고 있는 폴리펩티드를 발현시키고 있는 조직이나 세포의 추출물에 대해, 인간 ALT 에 결합하는 항체가 결합된 어피니티 칼럼을 작용시켜 정제시킴으로써 단리할 수 있다. 항체는 폴리크로날 항체이어도 되고 모노크로날 항체이어도 된다.

본 발명에서, ALT 를 코드하는 DNA 로서 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 를 사용해도 된다. 그 밖에도, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 ALT 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.

ALT 를 코드하는 DNA 는 상기 서술한 원하는 폴리펩티드의 in vivo 나 in vitro 에서의 생산에 이용되는 것 외에, ALT 를 강발현하는 세포의 제조에 사용할 수 있다. ALT 를 코드하는 DNA 는 ALT 를 코드할 수 있는 것이면, 어떠한 형태이어도 된다. 즉, mRNA 로부터 합성된 cDNA 인지, 게놈 DNA 인지, 화학 합성 DNA 인지 등에 상관없다. 또, ALT 를 코드하는 DNA 를 코드할 수 있는 한, 유전 암호의 축중(縮重)에 기초하는 임의의 염기 배열을 갖는 DNA 가 함유된다.

ALT 를 코드하는 DNA 는 당업자에게 공지된 방법에 의해 조제할 수 있다. 예를 들어, ALT 를 발현시키고 있는 세포로부터 cDNA 라이브러리를 제조하고, ALT 의 DNA 의 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59) 의 일부를 프로브로 하고 하이브리다이제이션을 실시함으로써 조제할 수 있다. cDNA 라이브러리는 예를 들어 Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989) 에 기재된 방법에 의해 조제해도 되고, 시판되는 유전자 라이브러리를 사용해도 된다. 또, ALT 를 발현시키고 있는 세포로부터 RNA 를 조제하고, ALT 의 DNA 의 배열 (예를 들어, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59) 에 기초하여 올리고 DNA 를 합성하고, 이것을 프라이머로서 사용하여 PCR 반응을 실시하고, ALT 를 코드하는 cDNA 를 증폭시킴으로써 조제할 수도 있다.

또, 얻어진 cDNA 의 염기 배열을 결정함으로써, 그것이 코드하는 번역 영역을 결정할 수 있어, ALT 의 아미노산 배열을 얻을 수 있다. 또, 얻어진 cDNA 를 프로브로서 게놈 DNA 라이브러리를 스크리닝함으로써 게놈 DNA 를 단리할 수 있다.

구체적으로는, 다음과 같이 하면 된다. 먼저, ALT 를 발현시키는 세포, 조직 등에서 mRNA 를 단리시킨다. mRNA 의 단리는, 공지된 방법, 예를 들어, 구아니딘 초원심법 (Chirgwin, J.M. et al., Biochemistry (1979)18, 5294-5299), AGPC 법 (Chomczynski, P. and Sacchi, N., Anal. Biochem. (1987)162, 156-159) 등에 의해 전체 RNA 를 조제하고, mRNA Purification Kit (Pharmacia) 등을 사용하여 전체 RNA 로부터 mRNA 를 정제시킨다. 또, QuickPrep mRNA Purification Kit (Pharmacia) 를 사용함으로써 mRNA 를 직접 조제할 수도 있다.

얻어진 mRNA 로부터 역전사 효소를 사용하여 cDNA 를 합성한다. cDNA 의 합성은, AMV Reverse Transcriptase First-strand cDNA Synthesis Kit (생화학 공업) 등을 사용하여 실시할 수도 있다. 또, 프라이머 등을 사용하여 5'-Ampli FINDER RACE Kit (Clontech 제) 및 폴리머라아제 연쇄 반응 (polymerase chain reaction ; PCR) 을 사용한 5'-RACE 법 (Frohman, M.A. et al., Proc. Natl. Acad. Sci. U.S.A. (1988)85, 8998-9002 ; Belyavsky, A. et al., Nucleic Acids Res. (1989)17, 2919-2932) 에 따라, cDNA 의 합성 및 증폭을 실시할 수 있다.

얻어진 PCR 산물로부터 목적으로 하는 DNA 단편을 조제하여 벡터 DNA 와 연결한다. 또한, 이것으로 재조합 벡터를 제조하고, 대장균 등에 도입하여 콜로니를 선택하고 원하는 재조합 벡터를 조제한다. 목적으로 하는 DNA 의 염기 배열은 공지된 방법, 예를 들어, 디데옥시뉴클레오티드체인터미네이션법에 의해 확인할 수 있다.

또, ALT 를 코드하는 DNA 에서는, 발현에 사용하는 숙주의 코돈 사용 빈도를 고려하고, 보다 발현 효율이 높은 염기 배열을 설계할 수 있다 (Grantham, R. et al., Nucelic Acids Research (1981)9, r43-74). 또, ALT 를 코드하는 DNA 는 시판되는 키트나 공지된 방법에 의해 개변시킬 수 있다. 개변으로서는, 예를 들어, 제한 효소에 의한 소화, 합성 올리고 뉴클레오티드나 적당한 DNA 프래그먼트의 삽입, 링커의 부가, 개시 코돈 (ATG) 및/또는 종지 코돈 (TAA, TGA, 또는 TAG) 의 삽입 등을 들 수 있다.

ALT 를 코드하는 DNA 는 또한, 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하는 DNA 이고, 또한 ALT 와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 함유한다.

스트린젠트한 조건으로서는, 당업자이면 적절히 선택할 수 있는데, 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 높일수록 높은 상동성을 갖는 DNA 를 얻을 수 있다. 상기의 하이브리다이즈하는 DNA 는 바람직하게는 천연 유래의 DNA, 예를 들어 cDNA 또는 염색체 DNA 이어도 된다.

이들 하이브리다이제이션 기술에 의해 단리되는 DNA 는 통상적으로 인간 등의 ALT 를 코드하는 DNA 와 염기 배열에서 높은 동일성을 갖는다. ALT 를 코드하는 DNA 에는, 인간 등의 ALT 와 기능적으로 동등한 폴리펩티드를 코드하고, 인간 등의 ALT 를 코드하는 DNA 와 높은 동일성을 갖는 DNA 도 포함된다. 높은 동일성이란, 통상적으로 96 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 염기 배열의 동일성은 Karlin and Altschul 에 의한 알고리즘 BLAST (Proc. Natl. Acad. Sci. USA 90 : 5873-5877, 1993) 에 의해 결정할 수 있다. 이 알고리즘에 기초하여, BLASTN 나 BLASTX 로 불리는 프로그램이 개발되어 있다 (Altschul et al. J. Mol. Biol. 215 : 403-410, 1990). BLAST 에 기초하여 BLASTN 에 의해 염기 배열을 해석하는 경우에는, 파라미터는 예를 들어 score = 100, wordlength = 12 로 한다. 이들 해석 방법의 구체적인 수법은 공지된 것이다 (http://www.ncbi.nlm.nih. gov.). ALT 를 코드하는 DNA 는 벡터에 삽입되면 된다.

벡터로서는, 예를 들어, 대장균을 숙주로 하는 경우에는, 벡터를 대장균 (예를 들어, JM109, DH5

, HB101, XL1Blue) 등으로 대량으로 증폭시켜 대량 조제하기 위해, 대장균으로 증폭되기 위한 「ori」를 갖고, 추가로 형질 전환된 대장균의 선발 유전자 (예를 들어, 어떠한 약제 (암피실린이나 테트라시클린, 카나마이신, 클로람페니콜) 에 의해 판별할 수 있는 약제 내성 유전자) 를 갖는 것이 바람직하다. 벡터의 예로서는, M13 계 벡터, pUC 계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또, cDNA 의 서브 클로닝, 절단을 목적으로 했을 경우, 상기 벡터 외에, 예를 들어, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 원하는 폴리펩티드를 생산하는 목적으로 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로서는, 예를 들어, 대장균에서의 발현을 목적으로 한 경우에는, 벡터가 대장균으로 증폭되는 상기 특징을 갖는 것 외에, 숙주를 JM109, DH5

, HB101, XL1-Blue 등의 대장균으로 했을 경우에는, 대장균으로 효율적으로 발현시킬 수 있는 프로모터, 예를 들어, lacZ 프로모터 (Ward 등, Nature (1989)341, 544-546 ; FASEB J.(1992)6, 2422-2427), araB 프로모터 (Better 등, Science (1988)240, 1041-1043), 또는 T7 프로모터 등을 갖고 있는 것이 바람직하다. 이와 같은 벡터로서는, 상기 벡터 외에 pGEX-5X-1 (Pharmacia 사 제조), 「QIAexpress system」(Qiagen 사 제조), pEGFP, 또는 pET (이 경우, 숙주는 T7 RNA 폴리메라제를 발현시키고 있는 BL21 이 바람직하다) 등을 들 수 있다.

또, 벡터에는, 폴리펩티드 분비를 위한 시그널 배열이 포함되어 있어도 된다. 폴리펩티드 분비를 위한 시그널 배열로서는, 대장균의 페리프라즘에 생성시키는 경우, pelB 시그널 배열 (Lei, S.P. et al J. Bacteriol. (1987)169, 4379) 을 사용하면 된다. 숙주 세포로의 벡터의 도입은 예를 들어 염화칼슘법, 일렉트로포레이션법을 이용하여 실시할 수 있다.

대장균을 숙주로 하는 경우 이외에도, 예를 들어, 원하는 폴리펩티드를 제조하기 위해 사용되는 벡터로서는, 포유 동물 유래의 발현 벡터 (예를 들어, pcDNA3 (Invitrogen 사 제조) 나, pEGF-BOS (Nucleic Acids. Res. 1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터 (예를 들어 「Bac-to-BAC baculovairus expression system」(GIBCO BRL 사 제조), pBacPAK8), 식물 유래의 발현 벡터 (예를 들어 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터 (예를 들어, pHSV, pMV, pAdexLcw), 레토로 바이러스 유래의 발현 벡터 (예를 들어, pZIpneo), 효모 유래의 발현 벡터 (예를 들어, 「Pichia Expression Kit」(Invitrogen 사 제조), pNV11, SP-Q01), 고초균 유래의 발현 벡터 (예를 들어, pPL608, pKTH50) 등을 들 수 있다.

CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포 내에서 발현시키기 위해 필요한 프로모터, 예를 들어 SV40 프로모터 (Mulligan 등, Nature (1979)277, 108), MMLV-LTR 프로모터, EF1

프로모터 (Mizushima 등, Nucleic Acids Res.(1990)18, 5322), CMV 프로모터 등을 갖고 있는 것이 바람직하고, 세포에 대한 형질 전환을 선발하기 위한 유전자 (예를 들어, 약제 (네오마이신, G418 등) 에 의해 판별할 수 있는 약제 내성 유전자) 를 가지면 더욱 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들어, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.

또한, 유전자를 안정적으로 발현시키고, 또한, 세포 내에서의 유전자의 카피수의 증폭을 목적으로 하는 경우에는, 핵산 합성 경로를 결손한 CHO 세포에 그것을 상보하는 DHFR 유전자를 갖는 벡터 (예를 들어, pCHOI 등) 를 도입하고, 메토트렉사이트 (MTX) 에 의해 증폭시키는 방법을 들 수 있고, 또, 유전자의 일과성 발현을 목적으로 하는 경우에는, SV40 T 항원을 발현시키는 유전자를 염색체 상에 갖는 COS 세포를 사용하여 SV40 의 복제 기점을 갖는 벡터 (pcD 등) 로 형질 전환시키는 방법을 들 수 있다. 복제 개시점으로서는, 또한, 폴리오마 바이러스, 아데노 바이러스, 소 파피로마 바이러스 (BPV) 등 유래의 것을 사용할 수 있다. 또한, 숙주 세포계에서 유전자 카피 수 증폭을 위해, 발현 벡터는 선택 마커로서 아미노글리코시드트랜스페라아제 (APH) 유전자, 티미딘키나제 (TK) 유전자, 대장균 크산틴구아닌포스포리보실트랜스페라아제 (Ecogpt) 유전자, 디히드로엽산 환원 효소 (dhfr) 유전자 등을 함유할 수 있다.

ALT 를 코드하는 DNA (벡터에 삽입되어 있어도 된다) 가 도입되는 숙주 세포로서는 특별히 제한은 없고, 예를 들어, 대장균이나 여러 가지 동물 세포 등을 사용할 수 있다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에 원하는 폴리펩티드를 코드하는 DNA 를 도입하면, 이 숙주 세포는 ALT 를 강발현할 수 있고, 원하는 폴리펩티드의 생산을 증가시킬 수 있다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에는, 타우린 트랜스포터를 코드하는 DNA (벡터에 삽입되어 있어도 된다) 가 추가로 도입되어도 된다. ALT 를 코드하는 DNA 가 도입된 숙주 세포에 원하는 폴리펩티드를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 를 도입함으로써, 원하는 폴리펩티드의 생성량을 향상시킬 수 있다. 폴리펩티드 제조를 위한 생성계는 in vitro 및 in vivo 의 생성계가 있다. in vitro 의 생성계로서는, 진핵 세포를 사용하는 생성계나 원핵 세포를 사용하는 생성계를 들 수 있다.

본 발명에서, 타우린 트랜스포터를 코드하는 DNA 로서, 배열 번호 62, 64, 66 또는 68 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA 를 사용하면 된다. 그 밖에도, 배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.

배열 번호 62, 64, 66 또는 68 의 아미노산 배열에서, 1 또는 복수 (예를 들어, 수 개) 의 아미노산이 치환, 결실, 부가 또는/및 삽입된 아미노산 배열을 갖고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드는, 햄스터, 래트, 마우스 및 인간 타우린 트랜스포터 (이하, 「햄스터 등의 타우린 트랜스포터」라고 기재하는 경우도 있다) 와 기능적으로 동등한 폴리펩티드이다. 이와 같은 폴리펩티드에는, 예를 들어, 햄스터 등의 타우린 트랜스포터의 변이체 등이 포함된다.

어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하기 위한, 당업자에게 잘 알려진 방법으로는, 폴리펩티드에 변이를 도입하는 방법이 알려져 있다. 예를 들어, 당업자이면, 부위 특이적 변이 유발법 (Hashimoto-Gotoh, T. et al. (1995) Gene 152, 271-275, Zoller, MJ, and Smith, M. (1983) Methods Enzymol. 100, 468-500, Kramer, W. et al. (1984) Nucleic Acids Res. 12, 9441-9456, Kramer W, and Fritz HJ (1987) Methods. Enzymol. 154, 350-367, Kunkel, TA (1985) Proc Natl Acad Sci USA. 82, 488-492, Kunkel (1988) Methods Enzymol. 85, 2763-2766) 등을 사용하고, 햄스터 등의 타우린 트랜스포터의 아미노산에 적절히 변이를 도입함으로써 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 조제할 수 있다. 또, 아미노산의 변이는 자연계에서도 발생될 수 있다.

햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드로서는, 구체적으로는 햄스터 등의 타우린 트랜스포터의 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 결실된 것, 햄스터 등의 타우린 트랜스포터 아미노산 배열에 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 부가된 것, 햄스터 등의 타우린 트랜스포터 아미노산 배열 중의 1 또는 2 개 이상, 바람직하게는 2 개 이상 30 개 이하, 보다 바람직하게는 2 개 이상 10 개 이하의 아미노산이 다른 아미노산으로 치환된 것 등을 들 수 있다.

변이되는 아미노산 잔기는 특별히 한정되지 않는데, 아미노산 측사슬의 성질이 보존되어 있는 다른 아미노산에 변이되는 것이 바람직하다. 예를 들어 아미노산 측사슬의 성질로는, 소수성 아미노산 (A, I, L, M, F, P, W, Y, V), 친수성 아미노산 (R, D, N, C, E, Q, G, H, K, S, T), 지방족 측사슬을 갖는 아미노산 (G, A, V, L, I, P), 수산기 함유 측사슬을 갖는 아미노산 (S, T, Y), 황원자 함유 측사슬을 갖는 아미노산 (C, M), 카르복실산 및 아미드 함유 측사슬을 갖는 아미노산 (D, N, E, Q), 염기 함유 측사슬을 갖는 아미노산 (R, K, H), 방향족 함유 측사슬을 갖는 아미노산 (H, F, Y, W) 을 들 수 있다 (괄호 내에는 모두 아미노산의 1 문자 표기를 나타낸다).

햄스터 등의 타우린 트랜스포터에 1 또는 복수개의 아미노산 잔기가 부가된 폴리펩티드로는, 예를 들어, 햄스터 등의 타우린 트랜스포터를 함유하는 융합 폴리펩티드를 들 수 있다. 융합 폴리펩티드는 햄스터 등의 타우린 트랜스포터와 다른 폴리펩티드가 융합된 것으로, 본 발명에 포함된다. 융합 폴리펩티드를 제조하는 방법은 햄스터 등의 타우린 트랜스포터를 코드하는 유전자와 다른 폴리펩티드를 코드하는 유전자를 프레임이 일치하도록 연결하고 이것을 발현 벡터에 도입하여 숙주로 발현시키면 되고, 당업자에게 공지된 수법을 사용할 수 있다. 햄스터 등의 타우린 트랜스포터와의 융합에 사용되는 다른 폴리펩티드로서는, 특별히 한정되지 않는다.

햄스터 등의 타우린 트랜스포터와의 융합에 사용되는 다른 펩티드로는, 예를 들어, FLAG (Hopp, T.P. et al., BioTechnology (1988)6, 1204-1210), 6 개의 His (히스티딘) 잔기로 이루어지는 6×His, 10×His, 인플루엔자 응집소 (HA), 인간 c-myc 의 단편, VSV-GP 의 단편, p18HIV 의 단편, T7-tag, HSV-tag, E-tag, SV40T 항원의 단편, lck tag,

-tubulin 의 단편, B-tag, Protein C 의 단편, GST (글루타티온-S-트랜스페라아제), HA (인플루엔자 응집소), 면역 글로불린 정상 영역, β-갈락토시다아제, MBP (말토오스 결합 폴리펩티드) 등을 들 수 있다.

시판되는 이들 폴리펩티드를 코드하는 유전자를 햄스터 등의 타우린 트랜스포터를 코드하는 유전자와 융합시키고, 이로써 조제된 융합 유전자를 발현시킴으로써 융합 폴리펩티드를 조제할 수 있다.

또, 어느 폴리펩티드와 기능적으로 동등한 폴리펩티드를 조제하는 당업자에게 잘 알려진 다른 방법으로는, 하이브리다이제이션 기술 (Sambrook, J et al., Molecular Cloning 2nd ed., 9.47-9.58, Cold Spring Harbor Lab. press, 1989) 을 이용하는 방법을 들 수 있다. 즉, 당업자이면, 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 배열 혹은 그 일부를 기본으로, 이것과 상동성이 높은 DNA 를 단리시키고, 그 DNA 로부터 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 단리시키는 것도 통상적으로 실시할 수 있는 것이다.

햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 단리시키기 위한 하이브리다이제이션의 조건으로는, 당업자이면 적절히 선택할 수 있다. 하이브리다이제이션의 조건은 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는, 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 낮출수록 높은 상동성을 갖는 DNA 뿐만 아니라, 낮은 상동성만 갖는 DNA 까지도 포괄적으로 얻을 수 있다. 반대로, 온도를 높일수록 높은 상동성을 갖는 DNA 만이 얻어지는 것을 기대할 수 있다. 단, 하이브리다이제이션의 스트린젠시에 영향을 미치는 요소로서는 온도 이외에도 염 농도 등 복수의 요소를 생각할 수 있고, 당업자이면 이들 요소를 적절히 선택함으로써 동일한 스트린젠시를 실현할 수 있다.

이들 하이브리다이제이션 기술에 의해 단리되는 DNA 가 코드하는 폴리펩티드는 햄스터 등의 타우린 트랜스포터와 아미노산 배열에서 70 % 이상의 동일성을 갖는 것이면 되고, 통상적으로 햄스터 등의 타우린 트랜스포터와 아미노산 배열에서 높은 상동성을 갖는다. 상기 폴리펩티드에는, 본 발명의 햄스터 타우린 트랜스포터와 기능적으로 동등하고, 햄스터 등의 타우린 트랜스포터 아미노산 배열과 높은 상동성을 갖는 폴리펩티드도 포함된다. 높은 상동성이란, 통상적으로 97 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 폴리펩티드의 동일성을 결정하려면, 문헌 (Wilbur, W.J. and Lipman, D.J. Proc. Natl. Acad. Sci. USA (1983)80, 726-730) 에 기재된 알고리즘에 따르면 된다.

폴리펩티드는 후술하는 그것을 생성하는 세포나 숙주 혹은 정제 방법에 의해, 아미노산 배열, 분자량, 등전점 또는 당사슬의 유무나 형태 등이 상이할 수도 있다. 그러나, 얻어진 폴리펩티드가 햄스터 등의 타우린 트랜스포터와 동등한 기능을 갖고 있는 한, 그것을 코드하는 DNA 를 본 발명에서 사용할 수 있다. 예를 들어, 폴리펩티드를 원핵 세포, 예를 들어 대장균으로 발현시켰을 경우, 본래의 폴리펩티드의 아미노산 배열의 N 말단에 메티오닌 잔기가 부가된다. 또, 진핵 세포, 예를 들어 포유 동물 세포로 발현시켰을 경우, N 말단의 시그널 배열은 제거된다. 이와 같은 폴리펩티드를 코드하는 DNA 도 본 발명에서 사용할 수 있다.

폴리펩티드는 당업자에게 공지된 방법에 의해, 재조합 폴리펩티드로서 또 천연의 폴리펩티드로서 조제할 수 있다. 재조합 폴리펩티드이면, 폴리펩티드를 코드하는 DNA 를 적당한 발현 벡터에 삽입하고, 이것을 적당한 숙주 세포에 도입하여 얻은 형질 전환체를 회수하여 추출물을 얻은 후, 이온 교환, 역상, 겔 여과 등의 크로마토그래피, 혹은 상기 폴리펩티드에 대한 항체를 칼럼에 고정시킨 어피니티 크로마토그래피에 넣음으로써, 또는, 추가로 이들 칼럼을 복수 조합함으로써 정제시켜 조제할 수 있다.

또, 폴리펩티드를 글루타티온 S 트랜스페라아제 폴리펩티드와의 융합 폴리펩티드로서 혹은 히스티딘을 복수 부가시킨 재조합 폴리펩티드로서 숙주 세포 (예를 들어, 동물 세포나 대장균 등) 내에서 발현시킨 경우에는, 발현시킨 재조합 폴리펩티드는 글루타티온 칼럼 혹은 니켈 칼럼을 사용하여 정제시킬 수 있다.

융합 폴리펩티드의 정제 후, 필요에 따라 융합 폴리펩티드 중 목적으로 하는 폴리펩티드 이외의 영역을 트롬빈 또는 팩터 Xa 등에 의해 절단하여 제거할 수도 있다.

천연 폴리펩티드이면, 당업자에게 주지된 방법, 예를 들어, 폴리펩티드를 발현시키고 있는 조직이나 세포의 추출물에 대해, 햄스터 등의 타우린 트랜스포터에 결합하는 항체가 결합된 어피니티 칼럼을 작용시켜 정제시킴으로써 단리시킬 수 있다. 항체는 폴리크로날 항체이어도 되고 모노클로날 항체이어도 된다.

본 발명에서, 타우린 트랜스포터를 코드하는 DNA 로서, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 를 사용해도 된다. 그 밖에도, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 타우린 트랜스포터 활성을 갖는 폴리펩티드를 코드하는 DNA 를 사용해도 된다.

타우린 트랜스포터를 코드하는 DNA 는 상기 서술한 원하는 폴리펩티드의 in vivo 나 in vitro 에서의 생산에 이용되는 것 외에, 타우린 트랜스포터를 강발현하는 세포의 제조에 사용할 수 있다. 타우린 트랜스포터를 코드하는 DNA 는 타우린 트랜스포터를 코드할 수 있는 것이면 어떠한 형태이어도 된다. 즉, mRNA 로부터 합성된 cDNA 인지, 게놈 DNA 인지, 화학 합성 DNA 인지 등에 상관없다. 또, 타우린 트랜스포터를 코드할 수 있는 한, 유전 암호의 축중에 기초하는 임의의 염기 배열을 갖는 DNA 가 함유된다.

타우린 트랜스포터를 코드하는 DNA 는 당업자에게 공지된 방법에 의해 조제할 수 있다. 예를 들어, 타우린 트랜스포터를 발현시키고 있는 세포로부터 cDNA 라이브러리를 제조하고, 타우린 트랜스포터를 코드하는 DNA 의 배열 (예를 들어, 배열 번호 61, 63, 65 또는 67) 의 일부를 프로브로 하고 하이브리다이제이션을 실시함으로써 조제할 수 있다. cDNA 라이브러리는 예를 들어 Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989) 에 기재된 방법에 의해 조제해도 되고, 시판되는 유전자 라이브러리를 사용해도 된다. 또, 타우린 트랜스포터를 발현시키고 있는 세포로부터 RNA 를 조제하고, 타우린 트랜스포터의 DNA 의 배열 (예를 들어, 배열 번호 61, 63, 65 또는 67) 에 기초하여 올리고 DNA 를 합성하고, 이것을 프라이머로서 사용하여 PCR 반응을 실시하고, 타우린 트랜스포터를 코드하는 cDNA 를 증폭시킴으로써 조제할 수도 있다.

또, 얻어진 cDNA 의 염기 배열을 결정함으로써, 그것이 코드하는 번역 영역을 결정할 수 있고, 타우린 트랜스포터의 아미노산 배열을 얻을 수 있다. 또, 얻어진 cDNA 를 프로브로서 게놈 DNA 라이브러리를 스크리닝함으로써, 게놈 DNA 를 단리시킬 수 있다.

구체적으로는, 다음과 같이 하면 된다. 먼저, 타우린 트랜스포터를 발현시키는 세포, 조직 등에서 mRNA 를 단리시킨다. mRNA 의 단리는 공지된 방법, 예를 들어, 구아니딘 초원심법 (Chirgwin, J.M. et al., Biochemistry (1979)18, 5294-5299), AGPC 법 (Chomczynski, P. and Sacchi, N., Anal.Biochem.(1987)162, 156-159) 등에 의해 전체 RNA 를 조제하고, mRNA Purification Kit (Pharmacia) 등을 사용하여 전체 RNA 로부터 mRNA 를 정제시킨다. 또, QuickPrep mRNA Purification Kit (Pharmacia) 를 사용함으로써 mRNA 를 직접 조제할 수도 있다.

얻어진 mRNA 로부터 역전사 효소를 사용하여 cDNA 를 합성한다. cDNA 의 합성은 AMV Reverse Transcriptase First-strand cDNA Synthesis Kit (생화학 공업) 등을 사용하여 실시할 수도 있다. 또, 프라이머 등을 사용하여, 5'-Ampli FINDER RACE Kit (Clontech 제) 및 폴리머라아제 연쇄 반응 (polymerase chain reaction ; PCR) 을 사용한 5'-RACE 법 (Frohman, M.A. et al., Proc. Natl. Acad. Sci. U.S.A. (1988)85, 8998-9002 ; Belyavsky, A. et al., Nucleic Acids Res. (1989)17, 2919-2932) 에 따라, cDNA 의 합성 및 증폭을 실시할 수 있다.

얻어진 PCR 산물로부터 목적으로 하는 DNA 단편을 조제하고, 벡터 DNA 와 연결한다. 또한, 이것으로부터 재조합 벡터를 제조하고, 대장균 등에 도입하여 콜로니를 선택해 원하는 재조합 벡터를 조제한다. 목적으로 하는 DNA 의 염기 배열은 공지된 방법, 예를 들어, 디데옥시뉴클레오티드체인터미네이션법에 의해 확인할 수 있다.

또, 타우린 트랜스포터를 코드하는 DNA 에서는, 발현에 사용하는 숙주의 코돈 사용 빈도를 고려하고, 보다 발현 효율이 높은 염기 배열을 설계할 수 있다 (Grantham, R. et al., Nucelic Acids Research (1981)9, r43-74). 또, 타우린 트랜스포터를 코드하는 DNA 는 시판되는 키트나 공지된 방법에 의해 개변할 수 있다. 개변으로는, 예를 들어, 제한 효소에 의한 소화, 합성 올리고 뉴클레오티드나 적당한 DNA 프래그먼트의 삽입, 링커의 부가, 개시 코돈 (ATG) 및/또는 종지 코돈 (TAA, TGA, 또는 TAG) 의 삽입 등을 들 수 있다.

타우린 트랜스포터를 코드하는 DNA 는 또한, 배열 번호 61, 63, 65 또는 67 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하는 DNA 이고, 또한 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하는 DNA 를 함유한다.

스트린젠트한 조건으로는, 당업자이면 적절히 선택할 수 있는데, 예를 들어 저스트린젠트한 조건을 들 수 있다. 저스트린젠트한 조건이란, 예를 들어 42 ℃, 2×SSC, 0.1 % SDS 를 들 수 있고, 바람직하게는 50 ℃, 2×SSC, 0.1 % SDS 이다. 또한 보다 바람직하게는 고스트린젠트한 조건을 들 수 있다. 고스트린젠트한 조건이란, 예를 들어 65 ℃, 2×SSC 및 0.1 % SDS 를 들 수 있다. 이들 조건에서, 온도를 높일수록 높은 상동성을 갖는 DNA 를 얻을 수 있다. 상기의 하이브리다이즈하는 DNA 는 바람직하게는 천연 유래의 DNA, 예를 들어 cDNA 또는 염색체 DNA 이어도 된다.

이들 하이브리다이제이션 기술에 의해 단리되는 DNA 는 통상적으로 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 와 염기 배열에서 높은 동일성을 갖는다. 이들의 DNA 에는, 햄스터 등의 타우린 트랜스포터와 기능적으로 동등한 폴리펩티드를 코드하고, 햄스터 등의 타우린 트랜스포터를 코드하는 DNA 와 높은 동일성을 갖는 DNA 도 함유된다. 높은 동일성이란, 통상적으로 96 % 이상의 동일성, 바람직하게는 98 % 이상의 동일성, 더욱 바람직하게는 99 % 이상의 동일성을 나타낸다. 염기 배열의 동일성은 Karlin and Altschul 에 의한 알고리즘 BLAST (Proc. Natl. Acad. Sci. USA 90 : 5873-5877, 1993) 에 의해 결정할 수 있다. 이 알고리즘에 기초하여, BLASTN 이나 BLASTX 로 불리는 프로그램이 개발되어 있다 (Altschul et al. J. Mol. Biol. 215 : 403-410, 1990). BLAST 에 기초하여 BLASTN 에 의해 염기 배열을 해석하는 경우에는, 파라미터는 예를 들어 score = 100, wordlength = 12 로 한다. 이들 해석 방법의 구체적인 수법은 공지이다 (http : //www.ncbi.nlm.nih.gov.).

타우린 트랜스포터를 코드하는 DNA 는 벡터에 삽입되면 된다.

, HB101, XL1Blue) 등으로 대량으로 증폭시켜 대량 조제하기 위해, 대장균으로 증폭되기 위한 「ori」를 갖고, 추가로 형질 전환된 대장균의 선발 유전자 (예를 들어, 어떠한 약제 (암피실린이나 테트라시클린, 카나마이신, 클로람페니콜) 에 의해 판별할 수 있는 약제 내성 유전자) 를 갖는 것이 바람직하다. 벡터의 예로는, M13 계 벡터, pUC 계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또, cDNA 의 서브 클로닝, 절단을 목적으로 했을 경우, 상기 벡터 외에, 예를 들어, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 원하는 폴리펩티드를 생산하는 목적에서 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로는, 예를 들어, 대장균에서의 발현을 목적으로 한 경우에는, 벡터가 대장균으로 증폭되는 상기 특징을 갖는 것 외에, 숙주를 JM109, DH5

, HB101, XL1-Blue 등의 대장균으로 했을 경우에는, 대장균으로 효율적으로 발현시킬 수 있는 프로모터, 예를 들어, lacZ 프로모터 (Ward 등, Nature (1989)341, 544-546 ; FASEB J.(1992)6, 2422-2427), araB 프로모터 (Better 등, Science (1988)240, 1041-1043), 또는 T7 프로모터 등을 갖고 있는 것이 바람직하다. 이와 같은 벡터로는, 상기 벡터 외에 pGEX-5X-1 (Pharmacia 사 제조), 「QIAexpress system」(Qiagen 사 제조), pEGFP, 또는 pET (이 경우, 숙주는 T7 RNA 폴리머라아제를 발현시키고 있는 BL21 이 바람직하다) 등을 들 수 있다.

또, 벡터에는, 폴리펩티드 분비를 위한 시그널 배열이 포함되어 있어도 된다. 폴리펩티드 분비를 위한 시그널 배열로는, 대장균의 페리프라즘에 생성시키는 경우, pelB 시그널 배열 (Lei, S.P. et al J. Bacteriol. (1987)169, 4379) 을 사용하면 된다. 숙주 세포로의 벡터의 도입은 예를 들어 염화칼슘법, 일렉트로포레이션법을 이용하여 실시할 수 있다.

대장균을 숙주로 하는 경우 이외에도, 예를 들어, 원하는 폴리펩티드를 제조하기 위해 사용되는 벡터로는, 포유 동물 유래의 발현 벡터 (예를 들어, pcDNA3 (Invitrogen 사 제조) 나, pEGF-BOS (Nucleic Acids.Res.1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터 (예를 들어 「Bac-to-BAC baculovairus expression system」(GIBCO BRL 사 제조), pBacPAK8), 식물 유래의 발현 벡터 (예를 들어 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터 (예를 들어, pHSV, pMV, pAdexLcw), 레토로 바이러스 유래의 발현 벡터 (예를 들어, pZIpneo), 효모 유래의 발현 벡터 (예를 들어, 「Pichia Expression Kit」(Invitrogen 사 제조), pNV11, SP-Q01), 고초균 유래의 발현 벡터 (예를 들어, pPL608, pKTH50) 등을 들 수 있다.

CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포 내에서 발현시키기 위해 필요한 프로모터, 예를 들어 SV40 프로모터 (Mulligan 등, Nature (1979) 277, 108), MMLV-LTR 프로모터, EF1

프로모터 (Mizushima 등, Nucleic Acids Res.(1990)18, 5322), CMV 프로모터 등을 갖고 있는 것이 바람직하고, 세포로의 형질 전환을 선발하기 위한 유전자 (예를 들어, 약제 (네오마이신, G418 등) 에 의해 판별할 수 있는 약제 내성 유전자) 를 가지면 더욱 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들어, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.

또한, 유전자를 안정적으로 발현시키고, 또한, 세포 내에서의 유전자의 카피수의 증폭을 목적으로 하는 경우에는, 핵산 합성 경로를 결손시킨 CHO 세포에 그것을 상보하는 DHFR 유전자를 갖는 벡터 (예를 들어, pCHOI 등) 를 도입하고, 메토트렉사이트 (MTX) 에 의해 증폭시키는 방법을 들 수 있고, 또, 유전자의 일과성 발현을 목적으로 하는 경우에는, SV40 T 항원을 발현시키는 유전자를 염색체 상에 갖는 COS 세포를 사용하여 SV40 의 복제 기점을 갖는 벡터 (pcD 등) 로 형질 전환시키는 방법을 들 수 있다. 복제 개시점으로는, 또한, 폴리오마 바이러스, 아데노바이러스, 소 파피로마 바이러스 (BPV) 등 유래의 것을 사용할 수도 있다. 또한, 숙주 세포계에서 유전자 카피 수 증폭을 위해, 발현 벡터는 선택 마커로서 아미노글리코시드트랜스페라아제 (APH) 유전자, 티미딘키나아제 (TK) 유전자, 대장균 크산틴구아닌포스포리보실트랜스페라아제 (Ecogpt) 유전자, 디히드로 엽산 환원 효소 (dhfr) 유전자 등을 함유할 수 있다.

본 발명은 ALT 를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 가 도입되어 있는 세포 (어느 DNA 도 벡터에 삽입되어 있어도 된다) 도 제공한다.

진핵 세포를 사용하는 경우, 예를 들어, 동물 세포, 식물 세포, 진균 세포를 숙주에 사용할 수 있다. 동물 세포로는, 포유류 세포, 예를 들어, CHO (J.Exp.Med.(1995)108, 945), COS, 3T3, 골수종, BHK (baby hamster kidney), HeLa, Vero, 양서류 세포, 예를 들어 아프리카 발톱 개구리 난모 세포 (Valle, et al., Nature (1981)291, 358-340), 혹은 곤충 세포, 예를 들어, Sf9 , Sf21, Tn5 가 알려져 있다. CHO 세포로는, 특히, DHFR 유전자를 결손시킨 CHO 세포인 dhfr-CHO (Proc.Natl.Acad.Sci.USA (1980)77, 4216-4220) 나 CHO K-1 (Proc.Natl.Acad.Sci.USA (1968)60, 1275) 를 바람직하게 사용할 수 있다. 동물 세포에서, 대량 발현을 목적으로 하는 경우에는 특히 CHO 세포가 바람직하다. 숙주 세포에 DNA (벡터에 삽입되어 있어도 된다) 를 도입하는 것은 예를 들어 인산칼슘법, DEAE 덱스트란법, 카티오닉 리보솜 DOTAP (베이린가만하임사 제조) 를 사용한 방법, 일렉트로포레이션법, 리포펙션 등의 방법으로 실시할 수 있다.

식물 세포로는, 예를 들어, 니코티아나 타바쿰 (Nicotiana tabacum) 유래의 세포가 폴리펩티드 생산계로서 알려져 있고, 이것을 캘러스 배양하면 된다. 진균 세포로는, 효모, 예를 들어, 사카로미세스 (Saccharomyces) 속, 예를 들어, 사카로미세스 세레비시아 (Saccharomyces cerevisiae), 사상균, 예를 들어, 아스페르질루스 (Aspergillus) 속, 예를 들어, 아스페르질루스 니거 (Aspergillus niger) 가 알려져 있다.

원핵 세포를 사용하는 경우, 세균 세포를 사용하는 생성계가 있다. 세균 세포로는, 대장균 (E. coli), 예를 들어, JM109, DH5

, HB101 등을 들 수 있고, 그 밖에 고초균이 알려져 있다.

이들 세포를 목적으로 하는 유전자에 의해 형질 전환시키고, 형질 전환된 세포를 in vitro 에서 배양시킴으로써 목적으로 하는 유전자가 코드하는 폴리펩티드 가 얻어진다. 배양은 공지된 방법에 따라 실시할 수 있다. 예를 들어, 동물 세포의 배양액으로서 예를 들어, DMEM, MEM, RPMI1640, IMDM 을 사용할 수 있다. 그 때, 소 태아 혈청 (FCS) 등의 혈청 보액을 병용할 수도 있고, 무혈청 배양시켜도 된다. 배양시의 pH 는 약 6 ∼ 8 인 것이 바람직하다. 배양은 통상적으로 약 30 ∼ 40 ℃ 에서 약 15 ∼ 200 시간 실시하고, 필요에 따라 배지의 교환, 통기, 교반을 추가한다.

한편, in vivo 에서 폴리펩티드를 생성시키는 계로는, 예를 들어, 동물을 사용하는 생성계나 식물을 사용하는 생성계를 들 수 있다. 이들 동물 또는 식물에 목적으로 하는 유전자를 도입하고, 동물 또는 식물의 체내에서 폴리펩티드를 생성시켜 회수한다. 본 발명에서의 「숙주」란, 이들의 동물, 식물을 포함한다.

동물을 사용하는 경우, 포유류 동물, 곤충을 사용하는 생성계가 있다. 포유류 동물로는, 염소, 돼지, 양, 마우스, 소를 사용할 수 있다 (Vicki Glaser, SPECTRUM Biotechnology Applications, 1993). 또, 포유류 동물을 사용하는 경우, 트랜스제닉 동물을 사용할 수 있다.

예를 들어, 목적으로 하는 유전자를, 염소 β 카세인과 같은 유즙 중에서 고유하게 생성되는 폴리펩티드를 코드하는 유전자와의 융합 유전자로서 조제한다. 이어서, 이 융합 유전자를 함유하는 유전자 단편을 염소의 배(胚)에 주입하고, 이 배를 암컷의 염소에게 이식한다. 배를 수용한 염소로부터 태어나는 트랜스제닉 염소 또는 그 자손이 생성하는 유즙으로부터, 목적으로 하는 폴리펩티드를 얻을 수 있다. 트랜스제닉 염소로부터 생성되는 폴리펩티드를 함유하는 유즙량을 증가시키기 위해, 적절히 호르몬을 트랜스제닉 염소에 사용해도 된다 (Ebert, K.M. et al., Bio/Technology (1994)12, 699-702).

또, 곤충으로는, 예를 들어 누에를 사용할 수 있다. 누에를 사용하는 경우, 목적으로 하는 폴리펩티드를 코드하는 유전자를 삽입한 바큘로 바이러스를 누에에게 감염시킴으로써, 이 누에의 체액으로부터 목적으로 하는 폴리펩티드를 얻을 수 있다 (Susumu, M. et al., Nature (1985)315, 592-594).

또한, 식물을 사용하는 경우, 예를 들어 담배를 사용할 수 있다. 담배를 사용하는 경우, 목적으로 하는 폴리펩티드를 코드하는 유전자를 식물 발현용 벡터, 예를 들어 pMON 530 에 삽입하고, 이 벡터를 아그로 박테리움 투메파키엔스 (Agrobacterium tumefaciens) 와 같은 박테리아에 도입한다. 이 박테리아를 담배, 예를 들어, 니코티아나 타바쿰 (Nicotiana tabacum) 에 감염시켜 본 담배의 잎으로부터 원하는 폴리펩티드를 얻을 수 있다 (Julian K.-C.Ma et. al., Eur. J. Immunol. (1994)24, 131-138).

이로써 얻어진 폴리펩티드는 숙주 세포 내 또는 세포 외 (배지 등) 로부터 단리되어, 실질적으로 순수하고 균일한 폴리펩티드로서 정제시킬 수 있다. 폴리펩티드의 분리, 정제는 통상적인 폴리펩티드의 정제에서 사용되고 있는 분리, 정제 방법을 사용하면 되고, 전혀 한정되지 않는다. 예를 들어, 크로마토그래피 칼럼, 필터, 한외 여과, 염석, 용매 침전, 용매 추출, 증류, 면역 침강, SDS-폴리아크릴아미드겔 전기 영동, 등전점 전기 영동법, 투석, 재결정 등을 적절히 선택, 조합하면 폴리펩티드를 분리, 정제시킬 수 있다.

크로마토그래피로는, 예를 들어 어피니티 크로마토그래피, 이온 교환 크로마토그래피, 소수성 크로마토그래피, 겔 여과, 역상 크로마토그래피, 흡착 크로마토그래피 등을 들 수 있다 (Strategies for Protein Purification and Characterization : A Laboratory Course Manual.Ed Daniel R.Marshak et al., Cold Spring Harbor Laboratory Press, 1996). 이들 크로마토그래피는, 액상 크로마토그래피, 예를 들어 HPLC, FPLC 등의 액상 크로마토그래피를 사용하여 실시할 수 있다. 본 발명은 이들의 정제 방법을 이용하여 고도로 정제된 폴리펩티드도 포함한다.

또한, 폴리펩티드를 정제 전 또는 정제 후에 적당한 폴리펩티드 수식 효소를 작용시킴으로써, 임의로 수식을 첨가하고 부분적으로 펩티드를 제거할 수도 있다. 폴리펩티드 수식 효소로서는, 예를 들어, 트립신, 키모트립신, 리실엔드펩티다아제, 프로테인키나제, 글루코시다아제 등이 사용된다.

또한, 본 발명에서, 「DNA 를 도입한 세포」란, 유전자 재조합 기술에 의해 외래성 DNA 가 삽입된 세포 외에 유전자 활성화 기술 (예를 들어, 국제 공개 제WO94/12650호 팜플렛 참조) 에 의해 내인성 DNA 가 활성화되고, 그 결과, 당해 DNA 에 대응하는 단백질의 발현 혹은 당해 DNA 의 전사가 개시 혹은 증가된 세포도 포함하는 개념이다.

실시예

이하, 본 발명을 실시예에 의해 구체적으로 설명한다. 또한, 이들 실시예는, 본 발명을 설명하기 위한 것으로서, 본 발명의 범위를 한정하는 것은 아니다.

[실시예 1] 인간 간세포 알라닌아미노트랜스페라아제 (Alanine aminotransferase) 유전자 클로닝

시판되는 Human Liver QUICK-Clone cDNA (Clontech 사) 를 주형으로 하여, 인간 간 유래 Alanine aminotransferase (ALT1) 유전자를 PCR 법에 의해 얻었다. 클로닝된 유전자는 염기 배열을 결정하고, 공개되어 있는 인간 ALT1 과의 상동성으로부터 ALT1 을 코드하고 있는 것을 확인하였다. 얻어진 ALT1 유전자는 1488 염기 중, 5 지점 (c157a, a215g, c765t, t857c, t995a) 에서 변이가 확인되고, 코드하는 아미노산은 496 개 중, 4 아미노산 (R53S, Q72R, F286S, M332K) 이 상이했는데, 인간 간 유래 ALT1 PCR 클론으로서 세포 개변에 사용하였다.

[실시예 2] 인간 알라닌아미노트랜스페라아제 도입에 의한 항체 생성량 증가

실시예 1 의 클로닝에 의해 취득한 인간 ALT1 (이하 ALT1) 유전자에 Kozak 배열을 첨가하고, CMV 프로모터 발현 플라스미드 pPur-ALT1 (도 1), pHyg-ALT1 (도 2) 을 구축하였다. pPur-ALT1 혹은 ALT1 유전자를 함유하지 않는 pPur 발현 플라스미드를, 친주인 항글리피칸-3 항체 생성 CHO 세포 (국제 공개 제WO 2006/006693호 팜플렛을 참조) 에 일렉트로포레이션법으로 도입하고, Puromycin (6 ㎍/㎖) 존재하에서 정치 배양에서 고증식인 세포주 (pPur-ALT1 : 7 주, pPur : 3 주) 를 선발하였다. 확대 후, pPur-ALT1 세포주로부터 Total RNA 를 조제하고, TaqMan 법에 의해 인간 ALT1 을 고발현시키고 있는 6 주를 선발하고, 추가로 진탕 배양하에서 컨트롤인 pPur 도입 세포 (3 주) 와 동일한 정도로 증식하는 4 주를 인간 ALT1 도입 세포로 하여 항체 생성량을 비교하였다. 초발 밀도 2 x 10⁵ cells/㎖ 의 50 ㎖ 쉐이커 플라스크에 의한 유가 배양에서, 쉐이커 배양 후기 17 일째의 pPur-ALT1 도입 세포 (4 주) 의 항글리피칸-3 항체 생성량은 pPur 도입 세포 (3 주) 에 대해 우위였다 (t 검정 P<0.01, 도 3). 쉐이커 유가 배양 검토에서, 각각 가장 항체 고생성이었던 pPur-ALT1 발현주 A72 및 Pur 발현주 P41 을 초발 10 x 10⁵ cells/㎖ 로 1 ℓ 자 유가 배양을 실시하면, A72 의 항체 생성량은 배양 19 일째에 2.9 g/ℓ 이고, P41 의 항체 생성량 (2.2 g/ℓ) 이상으로 고생성이었다 (도 4). 배양 14 일째 이후에 P41 의 생성량 증가가 확인되지 않으므로, A72 의 항체 고생성은 생존률 유지 효과에 의한 것으로 생각할 수 있었다 (도 5). 또, Hygromycin (200 ㎍/㎖) 존재하에서 상기와 동일한 수법으로 약제 선발된 pHyg/ALT 도입 세포 (3 주) 를 친주와 함께, 초발 밀도 1 x 10⁵ cells/㎖ 로 15 ㎖ 튜브에 의한 유가 배양을 실시하면, 튜브 배양 후기 10 일째의 pHyg-ALT 도입 세포의 항글리피칸-3 항체 생성량은 471 ㎎/ℓ, 544 ㎎/ℓ, 588 ㎎/ℓ 로, 모두 친주 (400 ㎎/ℓ) 이상이었다 (data not shown).

다음으로, pHyg-TauT 도입 세포 T10 (후술하는 참고예 2 를 참조) 을 친주로 하고, pPur-ALT1 혹은 pPur 을 공도입하여, 고증식이고 또한 인간 ALT1 을 고발현시키고 있는 TauT/ALT1 공발현 세포 (6 주), 및 고증식인 TauT/pPur 공발현 세포 (8 주) 를 선발하고, 초발 밀도 10 x 10⁵ cells/㎖ 로 50 ㎖ 쉐이커 플라스크에 의한 유가 배양을 실시하였다. ALT 발현 세포인 TauT/ALT1 공발현주의 쉐이커 배양 4 일째의 항글리피칸-3 항체 생성량은 TauT/pPur 세포에 대해 우위였다 (t 검정 P<0.01, 도 6).

쉐이커 유가 배양 검토에서 가장 항체 고생성이고, 또한, ALT1 mRNA 를 가장 발현시키고 있었던 TauT/ALT1 공발현주 TA41 (881 ㎎/ℓ/4 days) 을 초발 10 x 10⁵ cells/㎖ 로 1 ℓ 자 유가 배양을 실시하면, 그 항체 생성량은 배양 7 일째에 1.3 g/ℓ, 배양 10 일째에 3.0 g/ℓ, 배양 12 일째에 3.5 g/ℓ, 배양 17 일째에 4.6 g/ℓ, 배양 21 일째에 5.3 g/ℓ 로 높고 (도 7), TauT/pPur 공발현주 중에서 가장 생성량이 많았던 컨트롤주 TP08 (656 ㎎/ℓ/4 days) 에 대해서도 명백하게 높았다 (배양 10 일째에 2.4 g/ℓ).

TauT/ALT1 공발현주인 TA41 의 50 ㎖ 쉐이커 플라스크 유가 배양 14 일째의 항글리피칸-3 항체 생성량은 알라닌과 함께 ALT 의 기질이 되는

-케토글루탈산을 첨가하면 증가되었다 (도 22). 배양 14 일째의 항글리피칸-3 항체 생성량은 2.5 mM

-케토글루탈산 존재하에서 1452 ㎎/ℓ,

-케토글루탈산 비존재하에서 1239 ㎎/ℓ 였다.

이상의 결과는 ALT1 을 인위적으로 발현시킴으로써 배양 후기에 항체를 고생성하는 세포가 얻어지는 것을 시사하고 있다.

본 발명은 모든 항체 생성 세포에 응용할 수 있다.

[참고예 1] CHO 세포 유래 햄스터 타우린 트랜스포터 유전자 클로닝

CHO DXB11 세포에 항 IL-6 리셉터 항체 유전자를 도입한 항 IL-6 리셉터 항체 생성 세포 (일본 공개특허공보 평8-99902호) 로부터 total RNA 추출을 실시한 후, 폴리 A 에 의존하는 cDNA 를 합성하였다. SalI, XhoI, EcoRI 의 3 종류의 제한 효소로 단편화시킨 cDNA 를 주형시킴으로써, Hamster 타우린 트랜스포터 (TauT) 유전자를 PCR 에 의해 얻었다. PCR 프라이머는 이미 알려진 Rat/Mouse TauT 사이에서 유전자 배열이 보존되어 있는 5', 3' 를 함유하는 것을 설계하여 사용하였다. 클로닝된 유전자는 염기 배열을 결정하고, 이미 알려진 생물종의 TauT 와의 상동성으로부터 Hamster TauT 를 코드하고 있는 것을 확인하였다 (도 8). Hamster TauT 아미노산 배열은 Mouse (96 % Identity), Rat (96 % Identity), Human (93 % Identity) TauT 에 대해 높은 상동성을 갖고 있고, 12 의 막관통 영역을 갖는 트랜스포터인 것이 예상되었다 (도 9).

[참고예 2] 햄스터 타우린 트랜스포터 도입에 의한 생세포 밀도 증가, 유산 생성량 억제, 및 항체 생성량 증가

참고예 1 의 클로닝에 의해 취득한 Hamster TauT (이하 TauT) 유전자에 Kozak 배열을 첨가하여 CMV 프로모터 발현 플라스미드 pHyg/TauT (도 10) 를 구축하였다. pHyg/TauT 혹은 TauT 유전자를 제거한 컨트롤 플라스미드 pHyg 를, 친주인 항글리피칸-3 항체 생성 CHO 세포 (국제 공개 제WO 2006/006693호 팜플렛을 참조) 에 일렉트로포레이션법으로 도입하였다. 발현 플라스미드 도입 세포를 Hygromycin (400 ㎍/㎖) 존재하에서 선발한 후, 안정적으로 증식하는 세포주 전부를 확대하였다 (pHyg/TauT : 8 주, pHyg : 7 주). TauT mRNA 를 조제 후 TaqMan 법에 의해, 친주에 대해 우위 발현을 확인할 수 있는 7 주를 pHyg/TauT 도입 세포로 하였다. 도입 세포 (7 주) 의 mRNA 평균 발현량은 컨트롤 (7 주) 의 약 40 배였다. 합계 14 주의 세포는 2 x 10⁵ cells/㎖ 의 초발 밀도로 50 ㎖ 쉐이커 플라스크에 의한 배치 (batch) 배양 및 유가 (fed-batch) 배양을 실시하고, 배양 후기 7 일째의 생세포 밀도, 락트산 생성량, 항글리피칸-3 항체 생성량을 비교하였다. 배치 배양에서는 세포 증식에 수반되어 배양액 중에 락트산 등의 성장 저해 물질이 축적되어 증식이 억제되는데, pHyg/TauT 도입 세포의 생세포 밀도 (도 11) 및 락트산 생성량 (도 12) 은 pHyg 도입 세포에 대해 우위였다 (t 검정 P<0.05). 항글리피칸-3 항체 생성량에 관해서는, pHyg/TauT 도입 세포의 7 주 중 4 주가 pHyg 도입 세포의 최고값 이상이었다 (도 13). 또한 pHyg/TauT 도입 세포의 항글리피칸-3 항체 생성량의 우위성 (t 검정 P<0.01, 도 14) 이 유가 배양에 의해 명백해졌기 때문에, 상기 4 주 중에서 가장 증식력이 높았던 pHyg/TauT 도입 세포 (T10) 와 친주의 1 ℓ 자에 의한 유가 배양을 실시한 결과, T10 는 배양 32 일째에도 생존률이 80 % 이상으로 유지되어 있고 (도 15), 유산 생성이 억제되어 있었다. 그 결과, 항글리피칸-3 항체 생성량은 배양 35 일째에 2.9 g/ℓ (도 16) 를 달성하였다. TauT 도입 T10 세포가 세포막 상에 TauT 분자를 발현시키고 있는 것은 플로우 사이트 메트리 분석 (도 17) 으로 확인하였다. 이상의 결과는 Hamster TauT 를 인위적으로 발현시킴으로써 항체 생성 세포의 포텐셜이 상승되어, 항체 고생성주가 얻어지는 것을 시사하고 있다.

[참고예 3] 햄스터 타우린 트랜스포터 도입주의 암모니아 생성량 억제, 타우린의 주입, 글루타민 소비량 증가, 및 타우린 부(否)의존적인 항체 생성량

친주 및 pHyg/TauT 도입주를, 초발 2 x 10⁵ cells/㎖ 로 1 ℓ 자에 유가 배양시키고, 적시에 배양조로부터 450 x 10⁵ 세포를 함유하는 배양액을 채취하였다. 원심에 의해, 배양 상청을 분리 채취한 후, 세포 펠릿에 프로테아제 저해제 (Complete Mini, Roche Diagnostics 사, Protease inhibitor cocktail tablets) 를 함유한 1 ㎖ 의 냉각 멸균수를 첨가하고, 빙상에서 초음파 세포 파쇄기 (MISONIX ASTRASON MODEL XL2020) 를 사용하여 5 초 펄스 조작 후, 5 초 휴지(休止)를 1 세트로 하고, 합계 12 세트 처리를 반복하여 세포를 완전히 파쇄시켰다. 처리 후의 용액은 전체량을 원심식 여과 유닛에 어플라이함으로써, 분자량 5000 이하의 여과액을 조제하여 세포 내 아미노산 측정용 시료로 하였다. 각 시료는 또한, 닌히드린 시액-L8500 세트 (와코 순약 공업) 및, 히타치 제조 전자동 아미노산 분석 장치 (L-8500) 의 개량형을 사용하여 570 nm 의 흡광도를 검출, 비교하고, 시료 중의 각종 아미노산 농도를 구하였다. 배양액 중의 각종 아미노산 및 암모니아 등의 농도는 직접 측정한 값이므로, μM 오더의 농도를 비교하고, 한편, 세포 내 농도는 세포 펠릿에 냉각 멸균수 1 ㎖ 를 첨가한 후 초음파 세포를 파쇄함으로써, 각종 아미노산 및 암모니아 등의 측정값을 세포당 값으로 환산하고, 그 환산값을 비교하였다. 도 18 의 암모니아 농도비는 1 ℓ 자에 유가 배양 개시시의 450 x 10⁵ 개당 친주의 암모니아 검출값을 1 로 규정하고, 배양 개시시에 6 일째, 12 일째, 18 일째의 검출값과 비교하여 비를 구하였다. 또, 도 19, 도 20 의 타우린과 글루탐산도 상기 아미노산 분석에 의해 측정하였다.

그 결과, pHyg/TauT 도입주는 배양 후기에서 세포 내 암모니아가 저농도로 유지되어 있고, 항체 고생성에 기여하고 있는 것으로 생각할 수 있었다 (도 18).

세포 내의 타우린 농도비는 상기, 암모니아와 거의 동일한 방법으로 구하였다 (도 19). 차이점은 50 ㎖ 쉐이커 배치 배양 4 일째의 200 x 10⁵ 개당 친주의 암모니아 검출값을 1 로 규정하고 있는 것이다.

그 결과, pHyg/TauT 도입주는 타우린 첨가량에 의존하여 타우린을 주입하고, 그 주입량은 친주와 동등하였다. 그러나, 도 20 에 나타내는 바와 같이, pHyg/TauT 도입주의 글루타민 소비량은 친주에 대해 현저하고, 초발 타우린 농도에 의존하지 않았다. 글루타민이 하이브리도머의 세포 증식이나 생존률, 및 항체 생성능을 개선시키고, 항체 생성량을 상승시키는 기능을 하는 것은 보고되어 있다 (Enzyme and Microbial Technology 17 : 47-55, 1995). 따라서, pHyg/TauT 도입주의 항체 생성 증강 효과는, 타우린 트랜스포터를 개입시킨 타우린 이외의 다른 아미노산 (글루타민 등) 의 주입에 의한 가능성도 생각할 수 있다. 또한, 글루타민 농도는 도 19 에서의 배양 4 일째의 배양액을 아미노산 분석한 측정값을 1 x 10⁵ 세포당으로 환산한 값이다.

실제, 항글리피칸-3 항체 생성량은 50 ㎖ 쉐이커 유가 배양 개시시의 초발 타우린 농도 (0 ∼ 500 mM (62.575 g/ℓ)) 에 의존하지 않았다 (도 21). 또, 친주에 대해서도 초발 타우린 농도에 의한 항체 생성량의 영향에 우위한 차는 확인되지 않았다.

이상의 결과는 배양 개시시의 배지 중에 타우린을 함유하지 않아도 TauT 강발현주가 높은 항체 생성능을 갖는 것을 시사하고, 타우린 이외의 아미노산 등의 주입에 대해서도 촉진될 가능성도 생각할 수 있다.

본 명세서에서 인용한 모든 간행물, 특허 및 특허출원을 그대로 참고로서 본 명세서에 도입하는 것으로 한다.

산업상 이용 가능성

본 발명은 폴리펩티드의 생산에 사용할 수 있다.

배열표 프리 텍스트

<배열 번호 1>

배열 번호 1 은 인간 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 2875) 을 나타낸다.

<배열 번호 2>

배열 번호 2 는 인간 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 2875) 을 나타낸다.

<배열 번호 3>

배열 번호 3 은 인간 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 84706) 의 염기 배열을 나타낸다.

<배열 번호 4>

배열 번호 4 는 인간 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Homo sapiens (human) : 84706) 을 나타낸다.

<배열 번호 5>

배열 번호 5 는 마우스 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 76282) 의 염기 배열을 나타낸다.

<배열 번호 6>

배열 번호 6 은 마우스 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 76282) 을 나타낸다.

<배열 번호 7>

배열 번호 7 은 마우스 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 108682) 을 나타낸다.

<배열 번호 8>

배열 번호 8 은 마우스 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Mus musculus (mouse) : 108682) 을 나타낸다.

<배열 번호 9>

배열 번호 9 는 래트 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Rattus norvegicus (rat) : 81670) 을 나타낸다.

<배열 번호 10>

배열 번호 10 은 래트 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Rattus norvegicus (rat) : 81670) 을 나타낸다.

<배열 번호 11>

배열 번호 11 은 개 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Canis familiaris (dog) : 609510) 을 나타낸다.

<배열 번호 12>

배열 번호 12 는 개 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Canis familiaris (dog) : 609510) 을 나타낸다.

<배열 번호 13>

배열 번호 13 은 아프리카 발톱 개구리 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Xenopus laevis (African clawed frog) : 444533) 을 나타낸다.

<배열 번호 14>

배열 번호 14 는 아프리카 발톱 개구리 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Xenopus laevis (African clawed frog) : 444533) 을 나타낸다.

<배열 번호 15>

배열 번호 15 는 초파리 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Drosophila melanogaster (fruit fly) : Dmel_CG1640) 을 나타낸다.

<배열 번호 16>

배열 번호 16 은 초파리 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Drosophila melanogaster (fruit fly) : Dmel_CG1640) 을 나타낸다.

<배열 번호 17>

배열 번호 17 은 선충 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Caenorhabditis elegans (nematode) : C32F10.8) 을 나타낸다.

<배열 번호 18>

배열 번호 18 은 선충 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Caenorhabditis elegans (nematode) : C32F10.8) 을 나타낸다.

<배열 번호 19>

배열 번호 19 는 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4342210) 을 나타낸다.

<배열 번호 20>

배열 번호 20 은 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4342210) 을 나타낸다.

<배열 번호 21>

배열 번호 21 은 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4348524) 을 나타낸다.

<배열 번호 22>

배열 번호 22 는 일본쌀 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Oryza sativa japonica (Japanese rice) : 4348524) 을 나타낸다.

<배열 번호 23>

배열 번호 23 은 원시 홍조 시아니디오시존 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Cyanidioschyzon merolae : CMM066C) 을 나타낸다.

<배열 번호 24>

배열 번호 24 는 원시 홍조 시아니디오시존 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Cyanidioschyzon merolae : CMM066C) 을 나타낸다.

<배열 번호 25>

배열 번호 25 는 빵 효모 알라닌아미노트랜스페라아제 (ALT1) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YLR089C) 을 나타낸다.

<배열 번호 26>

배열 번호 26 은 빵 효모 알라닌아미노트랜스페라아제 (ALT1) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YLR089C) 을 나타낸다.

<배열 번호 27>

배열 번호 27 은 빵 효모 알라닌아미노트랜스페라아제 변이체 (ALT2) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomycescerevisiae : YDR111C) 을 나타낸다.

<배열 번호 28>

배열 번호 28 은 빵 효모 알라닌아미노트랜스페라아제 변이체 (ALT2) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Saccharomyces cerevisiae : YDR111C) 을 나타낸다.

<배열 번호 29>

배열 번호 29 는 사상균 Ashbya gossypii 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Ashbya gossypii (Eremothecium gossypii) : AGOS_AGR085W) 을 나타낸다.

<배열 번호 30>

배열 번호 30 은 사상균 Ashbya gossypii 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Ashbya gossypii (Eremothecium gossypii) : AGOS_AGR085W) 을 나타낸다.

<배열 번호 31>

배열 번호 31 은 진균 Candida albicans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Candida albicans : CaO19_346) 을 나타낸다.

<배열 번호 32>

배열 번호 32 는 진균 Candida albicans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Candida albicans : CaO19_346) 을 나타낸다.

<배열 번호 33>

배열 번호 33 은 분열 효모 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Schizosaccharomyces pombe : SPBC582.08) 을 나타낸다.

<배열 번호 34>

배열 번호 34 는 분열 효모 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Schizosaccharomyces pombe : SPBC582.08) 을 나타낸다.

<배열 번호 35>

배열 번호 35 는 진균 Aspergillus nidulans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus nidulans : AN1923.2) 을 나타낸다.

<배열 번호 36>

배열 번호 36 은 진균 Aspergillus nidulans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus nidulans : AN1923.2) 을 나타낸다.

<배열 번호 37>

배열 번호 37 은 진균 Aspergillus fumigatus 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus fumigatus : AFUA_6 G07770) 을 나타낸다.

<배열 번호 38>

배열 번호 38 은 진균 Aspergillus fumigatus 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus fumigatus : AFUA_6 G07770) 을 나타낸다.

<배열 번호 39>

배열 번호 39 는 청주 누룩곰팡이 Aspergillus oryzae 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus oryzae : AO090003000164) 을 나타낸다.

<배열 번호 40>

배열 번호 40 은 청주 누룩곰팡이 Aspergillus oryzae 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Aspergillus oryzae : AO090003000164) 을 나타낸다.

<배열 번호 41>

배열 번호 41 은 진균 Cryptococcus neoformans 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Cryptococcus neoformans JEC21 : CNG01490) 을 나타낸다.

<배열 번호 42>

배열 번호 42 는 진균 Cryptococcus neoformans 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Cryptococcus neoformans JEC21 : CNG01490) 을 나타낸다.

<배열 번호 43>

배열 번호 43 은 세포성 점균 Dictyostelium discoideum 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Dictyostelium discoideum : DDB_0232139) 을 나타낸다.

<배열 번호 44>

배열 번호 44 는 세포성 점균 Dictyostelium discoideum 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Dictyostelium discoideum : DDB_0232139) 을 나타낸다.

<배열 번호 45>

배열 번호 45 는 Trypanosoma brucei 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma brucei : Tb927.1.3950) 을 나타낸다.

<배열 번호 46>

배열 번호 46 은 Trypanosoma brucei 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma brucei : Tb927.1.3950) 을 나타낸다.

<배열 번호 47>

배열 번호 47 은 세포 내 기생성 원충 Leishmania major 알라닌아미노트랜스페라아제를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Leishmania major : LmjF12.0630) 을 나타낸다.

<배열 번호 48>

배열 번호 48 은 세포 내 기생성 원충 Leishmania major 알라닌아미노트랜스페라아제의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Leishmania major : LmjF12.0630) 을 나타낸다.

<배열 번호 49>

배열 번호 49 는 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 233.t00009) 을 나타낸다.

<배열 번호 50>

배열 번호 50 은 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 233.t00009) 을 나타낸다.

<배열 번호 51>

배열 번호 51 은 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 24.t00016) 을 나타낸다.

<배열 번호 52>

배열 번호 52 는 적리 아메바 Entamoeba histolytica 알라닌아미노트랜스페라아제 (2 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 /Entamoeba histolytica : 24.t00016) 을 나타낸다.

<배열 번호 53>

배열 번호 53 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.420) 을 나타낸다.

<배열 번호 54>

배열 번호 54 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.420) 을 나타낸다.

<배열 번호 55>

배열 번호 55 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.430) 을 나타낸다.

<배열 번호 56>

배열 번호 56 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 506529.430) 을 나타낸다.

<배열 번호 57>

배열 번호 57 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.120) 을 나타낸다.

<배열 번호 58>

배열 번호 58 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.120) 을 나타낸다.

<배열 번호 59>

배열 번호 59 는 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 를 코드하는 유전자의 염기 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140) 을 나타낸다.

<배열 번호 60>

배열 번호 60 은 세포 내 기생성 원충 Trypanosoma cruzi 알라닌아미노트랜스페라아제 (4 종 중 1 개) 의 아미노산 배열 (KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140)(KEGG / ENZYME : 2.6.1.2 / Trypanosoma cruzi : 510889.140) 을 나타낸다.

<배열 번호 61>

배열 번호 61 은 햄스터 타우린 트랜스포터를 코드하는 유전자의 염기 배열을 나타낸다.

<배열 번호 62>

배열 번호 62 는 햄스터 타우린 트랜스포터의 아미노산 배열을 나타낸다.

<배열 번호 63>

배열 번호 63 은 래트 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_017206) 을 나타낸다.

<배열 번호 64>

배열 번호 64 는 래트 타우린 트랜스포터의 아미노산 배열 (GenBank NM_017206) 을 나타낸다.

<배열 번호 65>

배열 번호 65 는 마우스 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_009320) 을 나타낸다.

<배열 번호 66>

배열 번호 66 은 마우스 타우린 트랜스포터의 아미노산 배열 (GenBank NM_009320) 을 나타낸다.

<배열 번호 67>

배열 번호 67 은 인간 타우린 트랜스포터를 코드하는 유전자의 염기 배열 (GenBank NM_003043) 을 나타낸다.

<배열 번호 68>

배열 번호 68 은 인간 타우린 트랜스포터의 아미노산 배열 (GenBank NM_003043) 을 나타낸다.

<110> CHUGAI PHARMACEUTICAL CO.,LTD. <120> A method of preparing a heteroprotein <130> FP-111PCT <150> JP P2007-205158 <151> 2007-08-07 <160> 68 <170> PatentIn version 3.1 <210> 1 <211> 1491 <212> DNA <213> Homo sapiens <400> 1 atggcctcga gcacaggtga ccggagccag gcggtgaggc atggactgag ggcgaaggtg 60 ctgacgctgg acggcatgaa cccgcgtgtg cggagagtgg agtacgcagt gcgtggcccc 120 atagtgcagc gagccttgga gctggagcag gagctgcgcc agggtgtgaa gaagcctttc 180 accgaggtca tccgtgccaa catcggggac gcacaggcta tggggcagag gcccatcacc 240 ttcctgcgcc aggtcttggc cctctgtgtt aaccctgatc ttctgagcag ccccaacttc 300 cctgacgatg ccaagaaaag ggcggagcgc atcttgcagg cgtgtggggg ccacagtctg 360 ggggcctaca gcgtcagctc cggcatccag ctgatccggg aggacgtggc gcggtacatt 420 gagaggcgtg acggaggcat ccctgcggac cccaacaacg tcttcctgtc cacaggggcc 480 agcgatgcca tcgtgacggt gctgaagctg ctggtggccg gcgagggcca cacacgcacg 540 ggtgtgctca tccccatccc ccagtaccca ctctactcgg ccacgctggc agagctgggc 600 gcagtgcagg tggattacta cctggacgag gagcgtgcct gggcgctgga cgtggccgag 660 cttcaccgtg cactgggcca ggcgcgtgac cactgccgcc ctcgtgcgct ctgtgtcatc 720 aaccctggca accccaccgg gcaggtgcag acccgcgagt gcatcgaggc cgtgatccgc 780 ttcgccttcg aagagcggct ctttctgctg gcggacgagg tgtaccagga caacgtgtac 840 gccgcgggtt cgcagttcca ctcattcaag aaggtgctca tggagatggg gccgccctac 900 gccgggcagc aggagcttgc ctccttccac tccacctcca agggctacat gggcgagtgc 960 gggttccgcg gcggctatgt ggaggtggtg aacatggacg ctgcagtgca gcagcagatg 1020 ctgaagctga tgagtgtgcg gctgtgcccg ccggtgccag gacaggccct gctggacctg 1080 gtggtcagcc cgcccgcgcc caccgacccc tcctttgcgc agttccaggc tgagaagcag 1140 gcagtgctgg cagagctggc ggccaaggcc aagctcaccg agcaggtctt caatgaggct 1200 cctggcatca gctgcaaccc agtgcagggc gccatgtact ccttcccgcg cgtgcagctg 1260 cccccgcggg cggtggagcg cgctcaggag ctgggcctgg cccccgatat gttcttctgc 1320 ctgcgcctcc tggaggagac cggcatctgc gtggtgccag ggagcggctt tgggcagcgg 1380 gaaggcacct accacttccg gatgaccatt ctgcccccct tggagaaact gcggctgctg 1440 ctggagaagc tgagcaggtt ccatgccaag ttcaccctcg agtactcctg a 1491 <210> 2 <211> 496 <212> PRT <213> Homo sapiens <400> 2 Met Ala Ser Ser Thr Gly Asp Arg Ser Gln Ala Val Arg His Gly Leu 1 5 10 15 Arg Ala Lys Val Leu Thr Leu Asp Gly Met Asn Pro Arg Val Arg Arg 20 25 30 Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu 35 40 45 Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile 50 55 60 Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr 65 70 75 80 Phe Leu Arg Gln Val Leu Ala Leu Cys Val Asn Pro Asp Leu Leu Ser 85 90 95 Ser Pro Asn Phe Pro Asp Asp Ala Lys Lys Arg Ala Glu Arg Ile Leu 100 105 110 Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Val Ser Ser Gly 115 120 125 Ile Gln Leu Ile Arg Glu Asp Val Ala Arg Tyr Ile Glu Arg Arg Asp 130 135 140 Gly Gly Ile Pro Ala Asp Pro Asn Asn Val Phe Leu Ser Thr Gly Ala 145 150 155 160 Ser Asp Ala Ile Val Thr Val Leu Lys Leu Leu Val Ala Gly Glu Gly 165 170 175 His Thr Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr 180 185 190 Ser Ala Thr Leu Ala Glu Leu Gly Ala Val Gln Val Asp Tyr Tyr Leu 195 200 205 Asp Glu Glu Arg Ala Trp Ala Leu Asp Val Ala Glu Leu His Arg Ala 210 215 220 Leu Gly Gln Ala Arg Asp His Cys Arg Pro Arg Ala Leu Cys Val Ile 225 230 235 240 Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu 245 250 255 Ala Val Ile Arg Phe Ala Phe Glu Glu Arg Leu Phe Leu Leu Ala Asp 260 265 270 Glu Val Tyr Gln Asp Asn Val Tyr Ala Ala Gly Ser Gln Phe His Ser 275 280 285 Phe Lys Lys Val Leu Met Glu Met Gly Pro Pro Tyr Ala Gly Gln Gln 290 295 300 Glu Leu Ala Ser Phe His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys 305 310 315 320 Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Ala Val 325 330 335 Gln Gln Gln Met Leu Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val 340 345 350 Pro Gly Gln Ala Leu Leu Asp Leu Val Val Ser Pro Pro Ala Pro Thr 355 360 365 Asp Pro Ser Phe Ala Gln Phe Gln Ala Glu Lys Gln Ala Val Leu Ala 370 375 380 Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala 385 390 395 400 Pro Gly Ile Ser Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro 405 410 415 Arg Val Gln Leu Pro Pro Arg Ala Val Glu Arg Ala Gln Glu Leu Gly 420 425 430 Leu Ala Pro Asp Met Phe Phe Cys Leu Arg Leu Leu Glu Glu Thr Gly 435 440 445 Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr 450 455 460 His Phe Arg Met Thr Ile Leu Pro Pro Leu Glu Lys Leu Arg Leu Leu 465 470 475 480 Leu Glu Lys Leu Ser Arg Phe His Ala Lys Phe Thr Leu Glu Tyr Ser 485 490 495 <210> 3 <211> 1572 <212> DNA <213> Homo sapiens <400> 3 atgcagcggg cggcggcgct ggtccggcgg ggctgtggtc cccggacccc cagctcctgg 60 ggccgcagcc agagcagcgc ggccgccgag gcctcggcgg tgctcaaggt gcggcccgag 120 cgcagccggc gcgagcgcat cctcacgctg gagtccatga acccgcaggt gaaggcggtg 180 gagtacgccg tgcggggacc catcgtgctc aaggccggcg agatcgagct cgagctgcag 240 cggggtatca aaaagccatt cacagaggtc atccgagcca acatcgggga cgcccaggct 300 atggggcagc agccaatcac cttcctccgg caggtgatgg cactatgcac ctacccaaac 360 ctgctggaca gccccagctt cccagaagat gctaagaaac gtgcccggcg gatcctgcag 420 gcttgtggcg ggaacagcct ggggtcctac agtgctagcc agggtgtcaa ctgcatccgt 480 gaagatgtgg ctgcctacat caccaggagg gatggcggtg tgcctgcgga ccccgacaac 540 atctacctga ccacgggagc tagtgacggc atttctacga tcctgaagat cctcgtctcc 600 gggggcggca agtcacggac aggtgtgatg atccccatcc cacaatatcc cctctattca 660 gctgtcatct ctgagctcga cgccatccag gtgaattact acctggacga ggagaactgc 720 tgggcgctga atgtgaatga gctccggcgg gcggtgcagg aggccaaaga ccactgtgat 780 cctaaggtgc tctgcataat caaccctggg aaccccacag gccaggtaca aagcagaaag 840 tgcatagaag atgtgatcca ctttgcctgg gaagagaagc tctttctcct ggctgatgag 900 gtgtaccagg acaacgtgta ctctccagat tgcagattcc actccttcaa gaaggtgctg 960 tacgagatgg ggcccgagta ctccagcaac gtggagctcg cctccttcca ctccacctcc 1020 aagggctaca tgggcgagtg tggttacaga ggaggctaca tggaggtgat caacctgcac 1080 cctgagatca agggccagct ggtgaagctg ctgtcggtgc gcctgtgccc cccagtgtct 1140 gggcaggccg ccatggacat tgtcgtgaac cccccggtgg caggagagga gtcctttgag 1200 caattcagcc gagagaagga gtcggtcctg ggtaatctgg ccaaaaaagc aaagctgacg 1260 gaagacctgt ttaaccaagt cccaggaatt cactgcaacc ccttgcaggg ggccatgtac 1320 gccttccctc ggatcttcat tcctgccaaa gctgtggagg ctgctcaggc ccatcaaatg 1380 gctccagaca tgttctactg catgaagctc ctggaggaga ctggcatctg tgtcgtgccc 1440 ggcagtggct ttgggcagag ggaaggcact taccacttca ggatgactat cctccctcca 1500 gtggagaagc tgaaaacggt gctgcagaag gtgaaagact tccacatcaa cttcctggag 1560 aagtacgcgt ga 1572 <210> 4 <211> 523 <212> PRT <213> Homo sapiens <400> 4 Met Gln Arg Ala Ala Ala Leu Val Arg Arg Gly Cys Gly Pro Arg Thr 1 5 10 15 Pro Ser Ser Trp Gly Arg Ser Gln Ser Ser Ala Ala Ala Glu Ala Ser 20 25 30 Ala Val Leu Lys Val Arg Pro Glu Arg Ser Arg Arg Glu Arg Ile Leu 35 40 45 Thr Leu Glu Ser Met Asn Pro Gln Val Lys Ala Val Glu Tyr Ala Val 50 55 60 Arg Gly Pro Ile Val Leu Lys Ala Gly Glu Ile Glu Leu Glu Leu Gln 65 70 75 80 Arg Gly Ile Lys Lys Pro Phe Thr Glu Val Ile Arg Ala Asn Ile Gly 85 90 95 Asp Ala Gln Ala Met Gly Gln Gln Pro Ile Thr Phe Leu Arg Gln Val 100 105 110 Met Ala Leu Cys Thr Tyr Pro Asn Leu Leu Asp Ser Pro Ser Phe Pro 115 120 125 Glu Asp Ala Lys Lys Arg Ala Arg Arg Ile Leu Gln Ala Cys Gly Gly 130 135 140 Asn Ser Leu Gly Ser Tyr Ser Ala Ser Gln Gly Val Asn Cys Ile Arg 145 150 155 160 Glu Asp Val Ala Ala Tyr Ile Thr Arg Arg Asp Gly Gly Val Pro Ala 165 170 175 Asp Pro Asp Asn Ile Tyr Leu Thr Thr Gly Ala Ser Asp Gly Ile Ser 180 185 190 Thr Ile Leu Lys Ile Leu Val Ser Gly Gly Gly Lys Ser Arg Thr Gly 195 200 205 Val Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Val Ile Ser 210 215 220 Glu Leu Asp Ala Ile Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn Cys 225 230 235 240 Trp Ala Leu Asn Val Asn Glu Leu Arg Arg Ala Val Gln Glu Ala Lys 245 250 255 Asp His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn Pro 260 265 270 Thr Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile His Phe 275 280 285 Ala Trp Glu Glu Lys Leu Phe Leu Leu Ala Asp Glu Val Tyr Gln Asp 290 295 300 Asn Val Tyr Ser Pro Asp Cys Arg Phe His Ser Phe Lys Lys Val Leu 305 310 315 320 Tyr Glu Met Gly Pro Glu Tyr Ser Ser Asn Val Glu Leu Ala Ser Phe 325 330 335 His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Tyr Arg Gly Gly 340 345 350 Tyr Met Glu Val Ile Asn Leu His Pro Glu Ile Lys Gly Gln Leu Val 355 360 365 Lys Leu Leu Ser Val Arg Leu Cys Pro Pro Val Ser Gly Gln Ala Ala 370 375 380 Met Asp Ile Val Val Asn Pro Pro Val Ala Gly Glu Glu Ser Phe Glu 385 390 395 400 Gln Phe Ser Arg Glu Lys Glu Ser Val Leu Gly Asn Leu Ala Lys Lys 405 410 415 Ala Lys Leu Thr Glu Asp Leu Phe Asn Gln Val Pro Gly Ile His Cys 420 425 430 Asn Pro Leu Gln Gly Ala Met Tyr Ala Phe Pro Arg Ile Phe Ile Pro 435 440 445 Ala Lys Ala Val Glu Ala Ala Gln Ala His Gln Met Ala Pro Asp Met 450 455 460 Phe Tyr Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val Pro 465 470 475 480 Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr His Phe Arg Met Thr 485 490 495 Ile Leu Pro Pro Val Glu Lys Leu Lys Thr Val Leu Gln Lys Val Lys 500 505 510 Asp Phe His Ile Asn Phe Leu Glu Lys Tyr Ala 515 520 <210> 5 <211> 1491 <212> DNA <213> Mus musculus <400> 5 atggcctcac aaaggaatga ccggatccag gcttcaagga atggactgaa ggggaaggtg 60 ctaactctgg ataccatgaa cccatgtgtg cggagggtgg agtatgcagt ccgaggcccc 120 atcgtgcaac gtgccttgga gctggagcag gagctgcgcc agggtgtgaa gaagcctttt 180 actgaggtta tccgtgccaa tattggggat gcacaagcca tggggcagag acccatcacc 240 ttcttccgcc aggtcctggc cctctgtgtc taccccaatc ttctgagcag tccggacttc 300 ccagaggatg ccaagagaag ggcagaacgc atcttgcagg catgcggggg ccacagcctg 360 ggtgcctata gcattagctc tggaatccag ccgattcggg aggatgtggc gcaatatatt 420 gagaggagag acggaggcat ccctgcagac ccgaacaaca tatttctgtc cacaggggcc 480 agcgatgcca tcgtgaccat gctcaagctg ctggtagccg gcgagggccg tgcgcgaacc 540 ggtgtactca ttcccattcc tcagtaccca ctgtactcag ctgcgctggc tgagctggac 600 gccgtgcaag tggactacta cctggacgaa gagcgcgcct gggctcttga catcgctgag 660 ctgcggcgcg ctctgtgcca ggcacgtgac cgctgctgcc ctcgagtact atgcgtcatc 720 aaccccggca accccacggg gcaggtgcag acccgtgaat gcatcgaggc cgtaatccgc 780 tttgctttcg aagagggact cttcctgatg gctgatgagg tataccaaga caatgtatat 840 gccgagggct ctcagttcca ttcattcaag aaggtgctca cggagatggg gccaccatat 900 gccacgcagc aggagctcgc gtctttccac tcagtctcta agggctacat gggcgagtgc 960 gggtttcgtg gtggctatgt ggaagtggta aacatggatg ccgaggtgca gaaacagatg 1020 gcgaaactga tgagcgtgcg gttgtgtcca ccagtgccgg gccaggcttt gatgggcatg 1080 gtggtcagtc cgccaacccc ctcggagccg tccttcaagc agtttcaagc agagaggcag 1140 gaggtgctgg ctgaactggc agccaaggct aaactcacgg agcaggtctt caacgaggcc 1200 cccgggatcc gctgcaaccc ggtgcagggc gctatgtatt ccttccctca aattcagctg 1260 cctttgaaag cagtgcagcg tgcgcaggac ctgggcctgg cccctgacat gttcttctgt 1320 ctgtgcctcc tggaagagac tggcatctgc gttgtgcctg ggagtggctt tgggcagcag 1380 gagggcacct atcatttccg gatgaccatt ctgcccccca tggagaaact gcgggtgctg 1440 ctggagaaac tgaggcactt ccatgctaaa ttcactcatg agtactcctg a 1491 <210> 6 <211> 496 <212> PRT <213> Mus musculus <400> 6 Met Ala Ser Gln Arg Asn Asp Arg Ile Gln Ala Ser Arg Asn Gly Leu 1 5 10 15 Lys Gly Lys Val Leu Thr Leu Asp Thr Met Asn Pro Cys Val Arg Arg 20 25 30 Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu 35 40 45 Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile 50 55 60 Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr 65 70 75 80 Phe Phe Arg Gln Val Leu Ala Leu Cys Val Tyr Pro Asn Leu Leu Ser 85 90 95 Ser Pro Asp Phe Pro Glu Asp Ala Lys Arg Arg Ala Glu Arg Ile Leu 100 105 110 Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Ile Ser Ser Gly 115 120 125 Ile Gln Pro Ile Arg Glu Asp Val Ala Gln Tyr Ile Glu Arg Arg Asp 130 135 140 Gly Gly Ile Pro Ala Asp Pro Asn Asn Ile Phe Leu Ser Thr Gly Ala 145 150 155 160 Ser Asp Ala Ile Val Thr Met Leu Lys Leu Leu Val Ala Gly Glu Gly 165 170 175 Arg Ala Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr 180 185 190 Ser Ala Ala Leu Ala Glu Leu Asp Ala Val Gln Val Asp Tyr Tyr Leu 195 200 205 Asp Glu Glu Arg Ala Trp Ala Leu Asp Ile Ala Glu Leu Arg Arg Ala 210 215 220 Leu Cys Gln Ala Arg Asp Arg Cys Cys Pro Arg Val Leu Cys Val Ile 225 230 235 240 Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu 245 250 255 Ala Val Ile Arg Phe Ala Phe Glu Glu Gly Leu Phe Leu Met Ala Asp 260 265 270 Glu Val Tyr Gln Asp Asn Val Tyr Ala Glu Gly Ser Gln Phe His Ser 275 280 285 Phe Lys Lys Val Leu Thr Glu Met Gly Pro Pro Tyr Ala Thr Gln Gln 290 295 300 Glu Leu Ala Ser Phe His Ser Val Ser Lys Gly Tyr Met Gly Glu Cys 305 310 315 320 Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Glu Val 325 330 335 Gln Lys Gln Met Ala Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val 340 345 350 Pro Gly Gln Ala Leu Met Gly Met Val Val Ser Pro Pro Thr Pro Ser 355 360 365 Glu Pro Ser Phe Lys Gln Phe Gln Ala Glu Arg Gln Glu Val Leu Ala 370 375 380 Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala 385 390 395 400 Pro Gly Ile Arg Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro 405 410 415 Gln Ile Gln Leu Pro Leu Lys Ala Val Gln Arg Ala Gln Asp Leu Gly 420 425 430 Leu Ala Pro Asp Met Phe Phe Cys Leu Cys Leu Leu Glu Glu Thr Gly 435 440 445 Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Gln Glu Gly Thr Tyr 450 455 460 His Phe Arg Met Thr Ile Leu Pro Pro Met Glu Lys Leu Arg Val Leu 465 470 475 480 Leu Glu Lys Leu Arg His Phe His Ala Lys Phe Thr His Glu Tyr Ser 485 490 495 <210> 7 <211> 1569 <212> DNA <213> Mus musculus <400> 7 atgcagcggg cagcggtgct ggtgcggcgg ggctcctgcc cccgcgcctc gggcccctgg 60 ggccgtagtc acagcagcgc tgcagccgaa gcctcggcgg cgctcaaggt gcgaccggag 120 cgcagccctc gagaccgcat cctcaccctg gagtccatga acccgcaggt gaaggcggtg 180 gagtacgctg tgcggggacc catcgtgctc aaagccggcg agatcgagat ggagctgcag 240 cggggtatca aaaaaccatt cactgaggta atccgagcca acattgggga tgcccatgct 300 atgggccagc agccaatcac cttcctccgt caggtgatgg cactctgcac ctacccaaac 360 ctactaaaca gccccagctt cccagaagac gctaagaaac gagcgcggcg gatcctgcag 420 gcttgtggtg gaaacagctt gggatcttac agtgctagcc aaggcgttaa ctgtatccgt 480 gaagatgtgg cagcctttat caccaggaga gatggtgtgc ctgcagaccc agacaacatt 540 tacctgacta ctggagctag cgacggtatt tctacaatcc tgaagctcct ggtctccggt 600 ggtggcaagt cacggaccgg cgtgatgatt cccatccccc agtatccctt gtactccgcg 660 gtcatctctg agctcgacgc ggtgcaggtc aactactatc tggatgaaga gaactgctgg 720 gctttgaatg tggacgagct ccggcgggca ttgcggcaag ccaaagacca ctgtgaccct 780 aaagttctct gcattatcaa ccccggaaac cccacaggcc aggtacaaag cagaaagtgc 840 atagaagatg tgattcactt tgcctgggaa gagaagcttt ttctcctggc tgatgaggtg 900 taccaggaca acgtgtactc tccagactgc agattccact cgtttaagaa agtgctttac 960 cagatggggc acgagtactc cagcaacgtg gagctcgcct ccttccactc cacctccaag 1020 ggctacatgg gcgagtgtgg ctacagaggg ggctacatgg aggtgatcaa tttgcacccc 1080 gagatcaaag gccagctggt gaagctactc tcggttcgcc tctgtccgcc agtgtcagga 1140 caggccgcca tggacattgt tgtgaatcca ccggaaccag gagaggagtc ctttgagcaa 1200 ttcagcaggg aaaaagaatt cgtccttggt aatctggcca aaaaagcaaa gctgacagaa 1260 gatctgttta accaagtccc agggatccag tgcaacccct tgcaaggagc tatgtatgcg 1320 ttccctcgga ttctcatccc tgccaaggcc gtggaggcag ctcagtccca taaaatggct 1380 ccagacatgt tctactgcat gaagctcctg gaggagactg gcatctgtgt cgtgcctggc 1440 agtggctttg ggcagcgaga aggcacttac cacttcagaa tgaccattct ccctccggtg 1500 gataaactga agaccgtgct ccacaaggtg aaagactttc acctgaagtt cctggagcag 1560 tactcatga 1569 <210> 8 <211> 522 <212> PRT <213> Mus musculus <400> 8 Met Gln Arg Ala Ala Val Leu Val Arg Arg Gly Ser Cys Pro Arg Ala 1 5 10 15 Ser Gly Pro Trp Gly Arg Ser His Ser Ser Ala Ala Ala Glu Ala Ser 20 25 30 Ala Ala Leu Lys Val Arg Pro Glu Arg Ser Pro Arg Asp Arg Ile Leu 35 40 45 Thr Leu Glu Ser Met Asn Pro Gln Val Lys Ala Val Glu Tyr Ala Val 50 55 60 Arg Gly Pro Ile Val Leu Lys Ala Gly Glu Ile Glu Met Glu Leu Gln 65 70 75 80 Arg Gly Ile Lys Lys Pro Phe Thr Glu Val Ile Arg Ala Asn Ile Gly 85 90 95 Asp Ala His Ala Met Gly Gln Gln Pro Ile Thr Phe Leu Arg Gln Val 100 105 110 Met Ala Leu Cys Thr Tyr Pro Asn Leu Leu Asn Ser Pro Ser Phe Pro 115 120 125 Glu Asp Ala Lys Lys Arg Ala Arg Arg Ile Leu Gln Ala Cys Gly Gly 130 135 140 Asn Ser Leu Gly Ser Tyr Ser Ala Ser Gln Gly Val Asn Cys Ile Arg 145 150 155 160 Glu Asp Val Ala Ala Phe Ile Thr Arg Arg Asp Gly Val Pro Ala Asp 165 170 175 Pro Asp Asn Ile Tyr Leu Thr Thr Gly Ala Ser Asp Gly Ile Ser Thr 180 185 190 Ile Leu Lys Leu Leu Val Ser Gly Gly Gly Lys Ser Arg Thr Gly Val 195 200 205 Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Val Ile Ser Glu 210 215 220 Leu Asp Ala Val Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn Cys Trp 225 230 235 240 Ala Leu Asn Val Asp Glu Leu Arg Arg Ala Leu Arg Gln Ala Lys Asp 245 250 255 His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn Pro Thr 260 265 270 Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile His Phe Ala 275 280 285 Trp Glu Glu Lys Leu Phe Leu Leu Ala Asp Glu Val Tyr Gln Asp Asn 290 295 300 Val Tyr Ser Pro Asp Cys Arg Phe His Ser Phe Lys Lys Val Leu Tyr 305 310 315 320 Gln Met Gly His Glu Tyr Ser Ser Asn Val Glu Leu Ala Ser Phe His 325 330 335 Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Tyr Arg Gly Gly Tyr 340 345 350 Met Glu Val Ile Asn Leu His Pro Glu Ile Lys Gly Gln Leu Val Lys 355 360 365 Leu Leu Ser Val Arg Leu Cys Pro Pro Val Ser Gly Gln Ala Ala Met 370 375 380 Asp Ile Val Val Asn Pro Pro Glu Pro Gly Glu Glu Ser Phe Glu Gln 385 390 395 400 Phe Ser Arg Glu Lys Glu Phe Val Leu Gly Asn Leu Ala Lys Lys Ala 405 410 415 Lys Leu Thr Glu Asp Leu Phe Asn Gln Val Pro Gly Ile Gln Cys Asn 420 425 430 Pro Leu Gln Gly Ala Met Tyr Ala Phe Pro Arg Ile Leu Ile Pro Ala 435 440 445 Lys Ala Val Glu Ala Ala Gln Ser His Lys Met Ala Pro Asp Met Phe 450 455 460 Tyr Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val Pro Gly 465 470 475 480 Ser Gly Phe Gly Gln Arg Glu Gly Thr Tyr His Phe Arg Met Thr Ile 485 490 495 Leu Pro Pro Val Asp Lys Leu Lys Thr Val Leu His Lys Val Lys Asp 500 505 510 Phe His Leu Lys Phe Leu Glu Gln Tyr Ser 515 520 <210> 9 <211> 1491 <212> DNA <213> Rattus norvegicus <400> 9 atggcctcac gggtgaatga tcaaagccag gcttcaagga atgggctgaa gggaaaggtg 60 ctaactctgg acactatgaa cccatgtgtg cggagggtgg agtatgcagt tcgaggaccc 120 attgtgcagc gtgccttgga gctggagcag gagctgcgtc agggtgtgaa gaagccgttt 180 actgaggtca tccgtgccaa cattggggat gcacaagcca tggggcagag acccatcacc 240 ttcttccgcc aggtcctggc cctctgtgtc taccccaatc ttctgagcag tcctgacttc 300 ccagaggatg ccaagagaag ggcagaacgc atcttgcagg cctgcggggg ccacagcctg 360 ggtgcctata gcattagctc tggaatccag ccgatccggg aggatgtggc gcaatacatt 420 gagagaagag acggaggcat ccccgcagac ccgaacaaca tatttctatc cacaggggcc 480 agcgatgcca tcgtgacaat gctcaagctg ctggtatctg gcgagggccg tgcacgaaca 540 ggtgtactca ttcccattcc tcagtaccca ctgtactcag ccgcgctggc tgaactggac 600 gccgtgcaag tggactacta cctggacgaa gagcgcgcct gggctctgga catcgcagag 660 ctgcggcgcg ctctgtgcca ggcacgtgac cgttgctgcc ctcgagtact gtgcgtcatc 720 aaccccggca accccactgg gcaggtgcag acccgtgagt gcatcgaggc cgtaatccgc 780 tttgctttca aagaaggact cttcttgatg gctgatgagg tataccagga caacgtgtat 840 gccgagggct ctcagttcca ttcattcaag aaggtgctca tggagatggg gccaccgtat 900 tccacgcagc aggagcttgc ttctttccac tcagtctcta agggctacat gggcgagtgc 960 gggtttcgtg gtggctatgt ggaggtggta aacatggatg ctgaggtgca gaaacagatg 1020 gggaagctga tgagtgtgcg gctgtgtcca ccagtgccag gccaggcctt gatggacatg 1080 gtggtcagtc cgccaacacc ctccgagccg tccttcaagc agtttcaagc agagagacag 1140 gaggtgctgg ctgaactggc agccaaggct aagctcacgg agcaggtctt caatgaggct 1200 cccgggatcc gctgcaaccc agtgcagggc gccatgtatt ccttccctca agtgcagctg 1260 cccttgaaag cggtgcagcg tgctcaggaa ctgggcctgg cccctgacat gttcttctgc 1320 ctgtgcctcc tggaagagac tggcatctgc gttgtgcccg ggagtggctt tgggcagcag 1380 gagggcacct atcatttccg gatgaccatt ctgcccccca tggagaaact gcggctgctg 1440 ctggaaaaac tcagtcactt ccatgccaag ttcacccatg agtactcctg a 1491 <210> 10 <211> 496 <212> PRT <213> Rattus norvegicus <400> 10 Met Ala Ser Arg Val Asn Asp Gln Ser Gln Ala Ser Arg Asn Gly Leu 1 5 10 15 Lys Gly Lys Val Leu Thr Leu Asp Thr Met Asn Pro Cys Val Arg Arg 20 25 30 Val Glu Tyr Ala Val Arg Gly Pro Ile Val Gln Arg Ala Leu Glu Leu 35 40 45 Glu Gln Glu Leu Arg Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile 50 55 60 Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Arg Pro Ile Thr 65 70 75 80 Phe Phe Arg Gln Val Leu Ala Leu Cys Val Tyr Pro Asn Leu Leu Ser 85 90 95 Ser Pro Asp Phe Pro Glu Asp Ala Lys Arg Arg Ala Glu Arg Ile Leu 100 105 110 Gln Ala Cys Gly Gly His Ser Leu Gly Ala Tyr Ser Ile Ser Ser Gly 115 120 125 Ile Gln Pro Ile Arg Glu Asp Val Ala Gln Tyr Ile Glu Arg Arg Asp 130 135 140 Gly Gly Ile Pro Ala Asp Pro Asn Asn Ile Phe Leu Ser Thr Gly Ala 145 150 155 160 Ser Asp Ala Ile Val Thr Met Leu Lys Leu Leu Val Ser Gly Glu Gly 165 170 175 Arg Ala Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr 180 185 190 Ser Ala Ala Leu Ala Glu Leu Asp Ala Val Gln Val Asp Tyr Tyr Leu 195 200 205 Asp Glu Glu Arg Ala Trp Ala Leu Asp Ile Ala Glu Leu Arg Arg Ala 210 215 220 Leu Cys Gln Ala Arg Asp Arg Cys Cys Pro Arg Val Leu Cys Val Ile 225 230 235 240 Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Thr Arg Glu Cys Ile Glu 245 250 255 Ala Val Ile Arg Phe Ala Phe Lys Glu Gly Leu Phe Leu Met Ala Asp 260 265 270 Glu Val Tyr Gln Asp Asn Val Tyr Ala Glu Gly Ser Gln Phe His Ser 275 280 285 Phe Lys Lys Val Leu Met Glu Met Gly Pro Pro Tyr Ser Thr Gln Gln 290 295 300 Glu Leu Ala Ser Phe His Ser Val Ser Lys Gly Tyr Met Gly Glu Cys 305 310 315 320 Gly Phe Arg Gly Gly Tyr Val Glu Val Val Asn Met Asp Ala Glu Val 325 330 335 Gln Lys Gln Met Gly Lys Leu Met Ser Val Arg Leu Cys Pro Pro Val 340 345 350 Pro Gly Gln Ala Leu Met Asp Met Val Val Ser Pro Pro Thr Pro Ser 355 360 365 Glu Pro Ser Phe Lys Gln Phe Gln Ala Glu Arg Gln Glu Val Leu Ala 370 375 380 Glu Leu Ala Ala Lys Ala Lys Leu Thr Glu Gln Val Phe Asn Glu Ala 385 390 395 400 Pro Gly Ile Arg Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro 405 410 415 Gln Val Gln Leu Pro Leu Lys Ala Val Gln Arg Ala Gln Glu Leu Gly 420 425 430 Leu Ala Pro Asp Met Phe Phe Cys Leu Cys Leu Leu Glu Glu Thr Gly 435 440 445 Ile Cys Val Val Pro Gly Ser Gly Phe Gly Gln Gln Glu Gly Thr Tyr 450 455 460 His Phe Arg Met Thr Ile Leu Pro Pro Met Glu Lys Leu Arg Leu Leu 465 470 475 480 Leu Glu Lys Leu Ser His Phe His Ala Lys Phe Thr His Glu Tyr Ser 485 490 495 <210> 11 <211> 1125 <212> DNA <213> Canis familiaris <400> 11 atgctggctc ttcacggggc cgtggttaag gtgaaacggg gccggctgcg tccagggctt 60 ggcgctacgc ctgatgccgg gatcgagggc ctgaccacct gttgcctcct ctttgctcag 120 ggtatcaaga aaccgttcac cgaggtcatc cgcgccaaca tcggggacgc ccaggccatg 180 ggccagcagc ctataacctt cctccgacag gtgatggcac tgtgcaccta ccccaacctg 240 ctggacagcc ccagcttccc agaagatgct aagaaacgag cccggaggat cctacaggct 300 tgtggcggga acagcctggg gtcctacagt gccagccagg gcgtcaactg catccgcgag 360 gacgtggccg cctacgtcac caggagggac ggcggggtgc ccgcggaccc cttcaacatt 420 tacctgacca ctggagccag cgacggcatt tctacgatcc tgaagatcct ggtgtccggg 480 ggtggcaagt cgcggacggg cgtgctgatc cccatcccac agtaccccct ctactcggcc 540 gtcatctccg agctcgacgc catccaggtg aactactact tggacgagga gaactgctgg 600 gccctcgacg tgaacgagct ccggcgggcc gtgcaggagg ctaaggacca ctgtaacccc 660 aaggtgctgt gcatcatcaa ccccgggaac cccacaggtc aggtgcaaag caggaagtgc 720 atagaggacg tcatccactt tgcctgggaa gagaagctct ttctcctggc agatgaggtg 780 taccaggaca acgtgtactc tccggactgc agattccact ccttcaagaa ggtgctctac 840 gagatggggc ccgagtactc gagcaacgtg gagcttgcgt ccttccactc tacctccaag 900 ggctacatgg gcgagtacgt tggccttggc ttcctcccgc ggccccacca ctcggccctg 960 cccgctggcg gcctgctgcg cggggaacac ggggcccatc tcagggggcc tgtgcatgag 1020 ctcagccctg gtgcagggac gcccgtgcgg cgaggtcctg ctggggcccc gggctccccg 1080 cgcttcctgc cgggcccacg ctgctgccct gggactgaac cctga 1125 <210> 12 <211> 374 <212> PRT <213> Canis familiaris <400> 12 Met Leu Ala Leu His Gly Ala Val Val Lys Val Lys Arg Gly Arg Leu 1 5 10 15 Arg Pro Gly Leu Gly Ala Thr Pro Asp Ala Gly Ile Glu Gly Leu Thr 20 25 30 Thr Cys Cys Leu Leu Phe Ala Gln Gly Ile Lys Lys Pro Phe Thr Glu 35 40 45 Val Ile Arg Ala Asn Ile Gly Asp Ala Gln Ala Met Gly Gln Gln Pro 50 55 60 Ile Thr Phe Leu Arg Gln Val Met Ala Leu Cys Thr Tyr Pro Asn Leu 65 70 75 80 Leu Asp Ser Pro Ser Phe Pro Glu Asp Ala Lys Lys Arg Ala Arg Arg 85 90 95 Ile Leu Gln Ala Cys Gly Gly Asn Ser Leu Gly Ser Tyr Ser Ala Ser 100 105 110 Gln Gly Val Asn Cys Ile Arg Glu Asp Val Ala Ala Tyr Val Thr Arg 115 120 125 Arg Asp Gly Gly Val Pro Ala Asp Pro Phe Asn Ile Tyr Leu Thr Thr 130 135 140 Gly Ala Ser Asp Gly Ile Ser Thr Ile Leu Lys Ile Leu Val Ser Gly 145 150 155 160 Gly Gly Lys Ser Arg Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro 165 170 175 Leu Tyr Ser Ala Val Ile Ser Glu Leu Asp Ala Ile Gln Val Asn Tyr 180 185 190 Tyr Leu Asp Glu Glu Asn Cys Trp Ala Leu Asp Val Asn Glu Leu Arg 195 200 205 Arg Ala Val Gln Glu Ala Lys Asp His Cys Asn Pro Lys Val Leu Cys 210 215 220 Ile Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Gln Ser Arg Lys Cys 225 230 235 240 Ile Glu Asp Val Ile His Phe Ala Trp Glu Glu Lys Leu Phe Leu Leu 245 250 255 Ala Asp Glu Val Tyr Gln Asp Asn Val Tyr Ser Pro Asp Cys Arg Phe 260 265 270 His Ser Phe Lys Lys Val Leu Tyr Glu Met Gly Pro Glu Tyr Ser Ser 275 280 285 Asn Val Glu Leu Ala Ser Phe His Ser Thr Ser Lys Gly Tyr Met Gly 290 295 300 Glu Tyr Val Gly Leu Gly Phe Leu Pro Arg Pro His His Ser Ala Leu 305 310 315 320 Pro Ala Gly Gly Leu Leu Arg Gly Glu His Gly Ala His Leu Arg Gly 325 330 335 Pro Val His Glu Leu Ser Pro Gly Ala Gly Thr Pro Val Arg Arg Gly 340 345 350 Pro Ala Gly Ala Pro Gly Ser Pro Arg Phe Leu Pro Gly Pro Arg Cys 355 360 365 Cys Pro Gly Thr Glu Pro 370 <210> 13 <211> 1623 <212> DNA <213> Xenopus laevis <400> 13 atgagtattc tcagggggtc tctgaggggg gtgctggccc ccaatgcttc tgttgtgttt 60 aggagcagat tgccccccca gctcacttct gccctcctgt gccccctcag gtcgctgtcg 120 ggaacgccgc tggctgaacc ggacgggaaa gttactcgca agatgtctga gaacgggaca 180 tgcaaccgga tcctgactct ggactccatg aatccctgta tccagaaagt ggaatacgca 240 gtgaggggcc ccatcgtcat cagggctgtg gagctggaga aagaactgca gcagggggta 300 aagaagccat tcacagaagt gatcaaagcc aatattggag atgcccatgc aatgggtcag 360 aaacccgtta ctttcctgcg ccaggtgagt gccatctgtc tgtaccccga gctcatgaat 420 gacaacaagt tcccggagga cgtgaagcag aaggcagcga ggatcctgca ggcgtgtggc 480 gggcacagca ttggggccta cagcgccagc caagggattg aagtgatccg acaagatgtg 540 gccaagtaca ttgagagaag ggatgggggt atcctgtccg accccaacaa catctacctc 600 tccacggggg ccagtgactc tattgtgaca atgctgaagt tgctggtgtc tgggcaaggg 660 aaatcccgaa ctggggtgat gatcccgatc cctcaatacc cgctgtattc tgcggccctg 720 gcagagttgg atgccgtgca ggttaattat tatctggatg aggagaactg ctgggccctg 780 gacatcaacg agctgcggag agcactagcg gaggcccgaa aacattgtga ccccaaagta 840 ctgtgcatta ttaacccagg aaaccctaca gggcaggtgc agagccgcaa gtgcattgag 900 gacgtgatcc gttttgctgc tgaagagaat cttttcctga tggcggatga ggtctaccaa 960 gataatgtct atgccaaggg ctgtgccttt cactccttca aaaaggttct ctttgagatg 1020 ggacccaagt attcagaaac gctggaactg gcttctttcc actccacatc caagggatac 1080 atgggagagt gcgggttcag agggggttac atggaagtga tcaatatgga tcctgctgtc 1140 aagcaacaac taaccaagtt ggtgtctgtg cgtctgtgcc ccccagtgcc ggggcaagta 1200 ttacttgatg tgattgtgaa cccaccaaag cctggggagc cctcctacaa acagttcatt 1260 tctgagaaac aggctgtgct caataacctg gctgagaaag ctcgtctcac tgaggaaatc 1320 ctaaaccaag cgcctgggat ccgctgtaac ccagtccagg gagccatgta ctcgtttcca 1380 aggatccaca tcccagagaa ggccattaaa cttgcacagg ctgagggaca ggccccagac 1440 atgttcttct gtatgaagct gctggaagag actggcattt gtgtggtacc tggaagtgga 1500 tttggacaac gtgagggcac tcaccatttc aggatgacca tcctccctcc caccgataag 1560 ctgaagagcc tgttagagcg gctgaaggat ttccaccaga aatttatgga tgagtattcc 1620 tag 1623 <210> 14 <211> 540 <212> PRT <213> Xenopus laevis <400> 14 Met Ser Ile Leu Arg Gly Ser Leu Arg Gly Val Leu Ala Pro Asn Ala 1 5 10 15 Ser Val Val Phe Arg Ser Arg Leu Pro Pro Gln Leu Thr Ser Ala Leu 20 25 30 Leu Cys Pro Leu Arg Ser Leu Ser Gly Thr Pro Leu Ala Glu Pro Asp 35 40 45 Gly Lys Val Thr Arg Lys Met Ser Glu Asn Gly Thr Cys Asn Arg Ile 50 55 60 Leu Thr Leu Asp Ser Met Asn Pro Cys Ile Gln Lys Val Glu Tyr Ala 65 70 75 80 Val Arg Gly Pro Ile Val Ile Arg Ala Val Glu Leu Glu Lys Glu Leu 85 90 95 Gln Gln Gly Val Lys Lys Pro Phe Thr Glu Val Ile Lys Ala Asn Ile 100 105 110 Gly Asp Ala His Ala Met Gly Gln Lys Pro Val Thr Phe Leu Arg Gln 115 120 125 Val Ser Ala Ile Cys Leu Tyr Pro Glu Leu Met Asn Asp Asn Lys Phe 130 135 140 Pro Glu Asp Val Lys Gln Lys Ala Ala Arg Ile Leu Gln Ala Cys Gly 145 150 155 160 Gly His Ser Ile Gly Ala Tyr Ser Ala Ser Gln Gly Ile Glu Val Ile 165 170 175 Arg Gln Asp Val Ala Lys Tyr Ile Glu Arg Arg Asp Gly Gly Ile Leu 180 185 190 Ser Asp Pro Asn Asn Ile Tyr Leu Ser Thr Gly Ala Ser Asp Ser Ile 195 200 205 Val Thr Met Leu Lys Leu Leu Val Ser Gly Gln Gly Lys Ser Arg Thr 210 215 220 Gly Val Met Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Ala Leu 225 230 235 240 Ala Glu Leu Asp Ala Val Gln Val Asn Tyr Tyr Leu Asp Glu Glu Asn 245 250 255 Cys Trp Ala Leu Asp Ile Asn Glu Leu Arg Arg Ala Leu Ala Glu Ala 260 265 270 Arg Lys His Cys Asp Pro Lys Val Leu Cys Ile Ile Asn Pro Gly Asn 275 280 285 Pro Thr Gly Gln Val Gln Ser Arg Lys Cys Ile Glu Asp Val Ile Arg 290 295 300 Phe Ala Ala Glu Glu Asn Leu Phe Leu Met Ala Asp Glu Val Tyr Gln 305 310 315 320 Asp Asn Val Tyr Ala Lys Gly Cys Ala Phe His Ser Phe Lys Lys Val 325 330 335 Leu Phe Glu Met Gly Pro Lys Tyr Ser Glu Thr Leu Glu Leu Ala Ser 340 345 350 Phe His Ser Thr Ser Lys Gly Tyr Met Gly Glu Cys Gly Phe Arg Gly 355 360 365 Gly Tyr Met Glu Val Ile Asn Met Asp Pro Ala Val Lys Gln Gln Leu 370 375 380 Thr Lys Leu Val Ser Val Arg Leu Cys Pro Pro Val Pro Gly Gln Val 385 390 395 400 Leu Leu Asp Val Ile Val Asn Pro Pro Lys Pro Gly Glu Pro Ser Tyr 405 410 415 Lys Gln Phe Ile Ser Glu Lys Gln Ala Val Leu Asn Asn Leu Ala Glu 420 425 430 Lys Ala Arg Leu Thr Glu Glu Ile Leu Asn Gln Ala Pro Gly Ile Arg 435 440 445 Cys Asn Pro Val Gln Gly Ala Met Tyr Ser Phe Pro Arg Ile His Ile 450 455 460 Pro Glu Lys Ala Ile Lys Leu Ala Gln Ala Glu Gly Gln Ala Pro Asp 465 470 475 480 Met Phe Phe Cys Met Lys Leu Leu Glu Glu Thr Gly Ile Cys Val Val 485 490 495 Pro Gly Ser Gly Phe Gly Gln Arg Glu Gly Thr His His Phe Arg Met 500 505 510 Thr Ile Leu Pro Pro Thr Asp Lys Leu Lys Ser Leu Leu Glu Arg Leu 515 520 525 Lys Asp Phe His Gln Lys Phe Met Asp Glu Tyr Ser 530 535 540 <210> 15 <211> 1707 <212> DNA <213> Drosophila melanogaster <400> 15 atgagtcgaa tgctaattaa acctgctgcc gccacagttt cggccgcatt gcagcagcac 60 cagcgccagc agcaacagta cgttattcgc cgctggaaat cgttcctgca caacaacagc 120 aacaatgcca atcgacgtgc ggcgaaatca acggcaacag caacggtgac ggcagcagcg 180 acgtcgcagc gccatggaac aagcggcgat ttcattcaac cgttagacgt ccgccgttcc 240 ttttcaacca gccacaaaat gccgtcgtcg tcgaaagcgc tcacactgga taacataaat 300 cccaacttta ttgccatgga atatgccgtt cgcggtcctc tggtgattcg tgctggggaa 360 atcgagaagg aactggaaaa gggtgtcaag aagccattcg accaggtgat ccgtgccaac 420 atcggtgatt gccatgcgat gggccagcag cccttgacct tcctgcgaca gctgttggcg 480 ctgaccttcg agacacgtct gctggattca cccgattatc ccgaggacgt caagaagcgc 540 gcctgtgcca ttttgaacgg ctgccagggt caatcggtgg gctcgtacac cgactccgcc 600 ggtctggagg tggtgcgtcg ccaggttgct cagtacatcg agaaaaggga tggcggcatc 660 gcctccaatt ggcaggacat ctatctaacc ggcggtgcct ctcccggcat caagagcatt 720 ctctccatga tcaacgccga ggtgggatgc aaggcgcctg gtgtcatggt gcccattccg 780 cagtacccac tgtactcggc caccatctcc gaatacggca tgaccaaggt ggattactat 840 ctggaggagg agaccggttg gagcctggac aggaaggagc tgcaacggtc ctacgatgag 900 gcgaagaagg tctgcaatcc gcgtgccctg gtcgtgatca atccgggcaa tcccaccgga 960 caggtactga cccgcgagaa catcgaggag atcattaagt tcgcacacga taacaaggtg 1020 ctggtgctgg ccgatgaggt gtaccaggac aatgtctacg acaagaactc caagttctgg 1080 tcgttcaaga aggtggccta cgaaatgggc gacccctatc gtaatctgga aatggtcagt 1140 ttcctgtcca cctcgaaggg ctatctgggc gagtgcggca ttcgcggcgg ttacatggag 1200 gttctcaatc ttgatcccaa ggtcaaggcc atgctgacca agtcgataac ggcggcgctt 1260 tgcagcacca ccgctggcca ggtggccgtg agtgccctgg tcaatccacc gcagcccgga 1320 gagccatcat acgatctgta caagaaggag cgcgatggca ttctggccgc tctaaaagaa 1380 cgggccgagc tcgtccacaa ggcactgaac agcttcgaag gctacaaggt taaccccgta 1440 cagggcgcca tgtacgtctt tccacagatc gagatcccgc ccaaggcgat cgaggcggcc 1500 aaggccaagg gcatggcccc cgatgttttc tacgcatttg agctgctcga gacgagcggc 1560 atttgcattg ttcctggcag tggatttggt cagaagcccg gcacgtggca tttccgaagc 1620 acgatcctcc cgcaaacgga caagctgaag ctgatgatgg agaagttccg tgtgttccac 1680 gccgagttca tgaagaagta caagtag 1707 <210> 16 <211> 568 <212> PRT <213> Drosophila melanogaster <400> 16 Met Ser Arg Met Leu Ile Lys Pro Ala Ala Ala Thr Val Ser Ala Ala 1 5 10 15 Leu Gln Gln His Gln Arg Gln Gln Gln Gln Tyr Val Ile Arg Arg Trp 20 25 30 Lys Ser Phe Leu His Asn Asn Ser Asn Asn Ala Asn Arg Arg Ala Ala 35 40 45 Lys Ser Thr Ala Thr Ala Thr Val Thr Ala Ala Ala Thr Ser Gln Arg 50 55 60 His Gly Thr Ser Gly Asp Phe Ile Gln Pro Leu Asp Val Arg Arg Ser 65 70 75 80 Phe Ser Thr Ser His Lys Met Pro Ser Ser Ser Lys Ala Leu Thr Leu 85 90 95 Asp Asn Ile Asn Pro Asn Phe Ile Ala Met Glu Tyr Ala Val Arg Gly 100 105 110 Pro Leu Val Ile Arg Ala Gly Glu Ile Glu Lys Glu Leu Glu Lys Gly 115 120 125 Val Lys Lys Pro Phe Asp Gln Val Ile Arg Ala Asn Ile Gly Asp Cys 130 135 140 His Ala Met Gly Gln Gln Pro Leu Thr Phe Leu Arg Gln Leu Leu Ala 145 150 155 160 Leu Thr Phe Glu Thr Arg Leu Leu Asp Ser Pro Asp Tyr Pro Glu Asp 165 170 175 Val Lys Lys Arg Ala Cys Ala Ile Leu Asn Gly Cys Gln Gly Gln Ser 180 185 190 Val Gly Ser Tyr Thr Asp Ser Ala Gly Leu Glu Val Val Arg Arg Gln 195 200 205 Val Ala Gln Tyr Ile Glu Lys Arg Asp Gly Gly Ile Ala Ser Asn Trp 210 215 220 Gln Asp Ile Tyr Leu Thr Gly Gly Ala Ser Pro Gly Ile Lys Ser Ile 225 230 235 240 Leu Ser Met Ile Asn Ala Glu Val Gly Cys Lys Ala Pro Gly Val Met 245 250 255 Val Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Ser Glu Tyr 260 265 270 Gly Met Thr Lys Val Asp Tyr Tyr Leu Glu Glu Glu Thr Gly Trp Ser 275 280 285 Leu Asp Arg Lys Glu Leu Gln Arg Ser Tyr Asp Glu Ala Lys Lys Val 290 295 300 Cys Asn Pro Arg Ala Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly 305 310 315 320 Gln Val Leu Thr Arg Glu Asn Ile Glu Glu Ile Ile Lys Phe Ala His 325 330 335 Asp Asn Lys Val Leu Val Leu Ala Asp Glu Val Tyr Gln Asp Asn Val 340 345 350 Tyr Asp Lys Asn Ser Lys Phe Trp Ser Phe Lys Lys Val Ala Tyr Glu 355 360 365 Met Gly Asp Pro Tyr Arg Asn Leu Glu Met Val Ser Phe Leu Ser Thr 370 375 380 Ser Lys Gly Tyr Leu Gly Glu Cys Gly Ile Arg Gly Gly Tyr Met Glu 385 390 395 400 Val Leu Asn Leu Asp Pro Lys Val Lys Ala Met Leu Thr Lys Ser Ile 405 410 415 Thr Ala Ala Leu Cys Ser Thr Thr Ala Gly Gln Val Ala Val Ser Ala 420 425 430 Leu Val Asn Pro Pro Gln Pro Gly Glu Pro Ser Tyr Asp Leu Tyr Lys 435 440 445 Lys Glu Arg Asp Gly Ile Leu Ala Ala Leu Lys Glu Arg Ala Glu Leu 450 455 460 Val His Lys Ala Leu Asn Ser Phe Glu Gly Tyr Lys Val Asn Pro Val 465 470 475 480 Gln Gly Ala Met Tyr Val Phe Pro Gln Ile Glu Ile Pro Pro Lys Ala 485 490 495 Ile Glu Ala Ala Lys Ala Lys Gly Met Ala Pro Asp Val Phe Tyr Ala 500 505 510 Phe Glu Leu Leu Glu Thr Ser Gly Ile Cys Ile Val Pro Gly Ser Gly 515 520 525 Phe Gly Gln Lys Pro Gly Thr Trp His Phe Arg Ser Thr Ile Leu Pro 530 535 540 Gln Thr Asp Lys Leu Lys Leu Met Met Glu Lys Phe Arg Val Phe His 545 550 555 560 Ala Glu Phe Met Lys Lys Tyr Lys 565 <210> 17 <211> 1515 <212> DNA <213> Caenorhabditis elegans <400> 17 atgcgaaccg tacaagcaat ttccggactc gtcacaagtc gctttttcgg cacatccact 60 agaatcatgg ctagcggaaa gactttgaac acctccaaca tcaatccaaa tgttatcaag 120 atggagtatg ctgttcgtgg accaatcgtg atccgtgccg tggagcttga aaaagagctt 180 gcgaccggtg ctcagaagcc attcccaaat gtcatcaagg ctaatattgg agatgctcat 240 gctatgggtc aaaagccgat tactttcatt cgccagctcc tcgcgtgtat tgtcaaccca 300 gagatcatga aaacggacaa atcaattcca tctgatgtta tcgaacatgc aaatgcattc 360 cttggaagtt gtggaggaaa atccgctgga gcatacagtc agagtacggg agtggaaatt 420 gtacgaaaac acgtggcaga gtatattaag agacgtgatg gaggaattcc atgcaattca 480 gaagatgtct gcttgtctgg aggagcttct gaatcaatcc gaaatgttct caaacttttt 540 atcaatcata acaacgcaaa gaaagtcgga gtcatgattc caattccaca atatccactc 600 tattctgcca ctatcgaaga attcggactt ggacaagttg gatactattt gagtgaatcg 660 tctaattggt ccatggatga agctgaactt gaaagatctt tcaatgatca ctgcaaagaa 720 tacgatattc gagttttgtg tatcatcaat ccaggaaatc ctaccggaca agcactttct 780 cgtgaaaata ttgagactat catcaagttt gcacaaaaga agaacctgtt ccttatggct 840 gatgaggttt atcaagacaa cgtctacgct caaggatcgc aattccattc attcaagaag 900 gttcttgtgg agatgggaga gccatacaat aaaatggaat tggcttcttt ccattcggta 960 tccaaaggat acatgggaga atgcggaatg cgtggaggat atgttgaatt cttgaatctc 1020 gacccagaag tgtatgtcct tttcaaaaaa atgatctctg ccaaattgtg ctccacagta 1080 ctcggacaag ccgtcattga tgccgttgtg aatccaccaa aggaaggaga tgcatcgtat 1140 gctctgtgga aacaagaaaa ggatgcagta cttgcttctc ttaaggaacg tgctacactc 1200 gtcgagaagg catacagtag cattgatgga atcagctgta atccagttca aggagccatg 1260 tacgctttcc cgcaaatcac gattccacag agagctgttg aaaaagctca gtctttgaac 1320 caacaacctg atttcttcta tgctatgcaa cttcttgaga ccaccggaat ctgtatcgtg 1380 ccaggaagtg gatttggaca aaaagacgga acttatcatt tcagaacgac aattcttcca 1440 cagccagaac tcttcaaaga catgctctcc cggttcactg atttccacca aaaattcctt 1500 gccgaataca agtag 1515 <210> 18 <211> 504 <212> PRT <213> Caenorhabditis elegans <400> 18 Met Arg Thr Val Gln Ala Ile Ser Gly Leu Val Thr Ser Arg Phe Phe 1 5 10 15 Gly Thr Ser Thr Arg Ile Met Ala Ser Gly Lys Thr Leu Asn Thr Ser 20 25 30 Asn Ile Asn Pro Asn Val Ile Lys Met Glu Tyr Ala Val Arg Gly Pro 35 40 45 Ile Val Ile Arg Ala Val Glu Leu Glu Lys Glu Leu Ala Thr Gly Ala 50 55 60 Gln Lys Pro Phe Pro Asn Val Ile Lys Ala Asn Ile Gly Asp Ala His 65 70 75 80 Ala Met Gly Gln Lys Pro Ile Thr Phe Ile Arg Gln Leu Leu Ala Cys 85 90 95 Ile Val Asn Pro Glu Ile Met Lys Thr Asp Lys Ser Ile Pro Ser Asp 100 105 110 Val Ile Glu His Ala Asn Ala Phe Leu Gly Ser Cys Gly Gly Lys Ser 115 120 125 Ala Gly Ala Tyr Ser Gln Ser Thr Gly Val Glu Ile Val Arg Lys His 130 135 140 Val Ala Glu Tyr Ile Lys Arg Arg Asp Gly Gly Ile Pro Cys Asn Ser 145 150 155 160 Glu Asp Val Cys Leu Ser Gly Gly Ala Ser Glu Ser Ile Arg Asn Val 165 170 175 Leu Lys Leu Phe Ile Asn His Asn Asn Ala Lys Lys Val Gly Val Met 180 185 190 Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Glu Glu Phe 195 200 205 Gly Leu Gly Gln Val Gly Tyr Tyr Leu Ser Glu Ser Ser Asn Trp Ser 210 215 220 Met Asp Glu Ala Glu Leu Glu Arg Ser Phe Asn Asp His Cys Lys Glu 225 230 235 240 Tyr Asp Ile Arg Val Leu Cys Ile Ile Asn Pro Gly Asn Pro Thr Gly 245 250 255 Gln Ala Leu Ser Arg Glu Asn Ile Glu Thr Ile Ile Lys Phe Ala Gln 260 265 270 Lys Lys Asn Leu Phe Leu Met Ala Asp Glu Val Tyr Gln Asp Asn Val 275 280 285 Tyr Ala Gln Gly Ser Gln Phe His Ser Phe Lys Lys Val Leu Val Glu 290 295 300 Met Gly Glu Pro Tyr Asn Lys Met Glu Leu Ala Ser Phe His Ser Val 305 310 315 320 Ser Lys Gly Tyr Met Gly Glu Cys Gly Met Arg Gly Gly Tyr Val Glu 325 330 335 Phe Leu Asn Leu Asp Pro Glu Val Tyr Val Leu Phe Lys Lys Met Ile 340 345 350 Ser Ala Lys Leu Cys Ser Thr Val Leu Gly Gln Ala Val Ile Asp Ala 355 360 365 Val Val Asn Pro Pro Lys Glu Gly Asp Ala Ser Tyr Ala Leu Trp Lys 370 375 380 Gln Glu Lys Asp Ala Val Leu Ala Ser Leu Lys Glu Arg Ala Thr Leu 385 390 395 400 Val Glu Lys Ala Tyr Ser Ser Ile Asp Gly Ile Ser Cys Asn Pro Val 405 410 415 Gln Gly Ala Met Tyr Ala Phe Pro Gln Ile Thr Ile Pro Gln Arg Ala 420 425 430 Val Glu Lys Ala Gln Ser Leu Asn Gln Gln Pro Asp Phe Phe Tyr Ala 435 440 445 Met Gln Leu Leu Glu Thr Thr Gly Ile Cys Ile Val Pro Gly Ser Gly 450 455 460 Phe Gly Gln Lys Asp Gly Thr Tyr His Phe Arg Thr Thr Ile Leu Pro 465 470 475 480 Gln Pro Glu Leu Phe Lys Asp Met Leu Ser Arg Phe Thr Asp Phe His 485 490 495 Gln Lys Phe Leu Ala Glu Tyr Lys 500 <210> 19 <211> 1458 <212> DNA <213> Oryza sativa japonica <400> 19 atgttcggcg gcggcggcgg cggcgggagg aagccgctgg actacgagga gctgaacgag 60 aacgtgaaga aggtgcagta cgcggtgcgg ggggagctgt acctgcgcgc ctccgagctc 120 cagaaggagg gcaagaagat catcttcacc aacgtcggca acccacacgc gctcggccag 180 aagccgctca ccttcccccg ccaggttgtg gcgctgtgcc aggccccctt cctgctcgat 240 gatcccaacg tcggccttat cttccccgcc gacgccatcg cgcgggccaa gcactacctc 300 gccatggcac ccggtggact aggtgcttac agtgattccc gaggtatccc tggtattagg 360 aaggaagtcg ccgagttcat cgagaggcgt gatggttatc caagtgatcc agaacttatt 420 tacctcacag atggtgccag caaaggtgtg atgcaaatgc tgaataccat tatcagaaat 480 gagagagatg ggattctggt tcctgttcca caatacccgc tttattctgc tgccatttcc 540 ctctttggtg gttctctcgt gccatactac ttagaagaag aggctaactg gggacttgac 600 ttcgtcaatc tccgacagac tgtggcgtca gcgcggtcaa agggaatcac tgttcgagca 660 atggtgatta tcaacccagg aaaccctact ggccaatgcc ttagtgaagg aaacataaag 720 gaacttctca aattctgctt ccatgagaac ttagttctgc ttgcagatga agtctatcaa 780 cagaacattt atcaagatga gcgcccattt ataagtgcta gaaaggttct gtttgacatg 840 ggtcctccta tgagcaggga agttcagctg gtttctttcc atactgtgtc aaaaggatat 900 tggggggagt gtggacaacg tggagggtat tttgaaatga caaatcttcc tcccaagaca 960 gtagacgaga tctacaaggt tgcatcaatc gcactcagtc caaatgttcc tgggcagatc 1020 tttatgggtt taatggttaa ccctcctaag cctggagata tctcttatct gaagttttct 1080 gctgaaagca agtctatcct cgagtctttg aggaggagag cacgcctgat gacagatggt 1140 ttcaatagtt gccgaaatgt tgtctgcaat ttcacagaag gagctatgta ctctttcccc 1200 caaatacgct taccaccaaa agctatagat gcagccaaaa gggctggcaa agcggccgat 1260 gttttctact gcctcaagct tcttgaagca actggaatat ccactgttcc agggtcaggt 1320 ttcggacaaa aagaaggggt gttccacctg aggacgacca tcctgccagc tgaggaggac 1380 atgcctgcca tcatgaccag cttcaagaag ttcaacgaca ctttcatgga tcagtacgat 1440 ggctactcca ggatgtga 1458 <210> 20 <211> 485 <212> PRT <213> Oryza sativa japonica <400> 20 Met Phe Gly Gly Gly Gly Gly Gly Gly Arg Lys Pro Leu Asp Tyr Glu 1 5 10 15 Glu Leu Asn Glu Asn Val Lys Lys Val Gln Tyr Ala Val Arg Gly Glu 20 25 30 Leu Tyr Leu Arg Ala Ser Glu Leu Gln Lys Glu Gly Lys Lys Ile Ile 35 40 45 Phe Thr Asn Val Gly Asn Pro His Ala Leu Gly Gln Lys Pro Leu Thr 50 55 60 Phe Pro Arg Gln Val Val Ala Leu Cys Gln Ala Pro Phe Leu Leu Asp 65 70 75 80 Asp Pro Asn Val Gly Leu Ile Phe Pro Ala Asp Ala Ile Ala Arg Ala 85 90 95 Lys His Tyr Leu Ala Met Ala Pro Gly Gly Leu Gly Ala Tyr Ser Asp 100 105 110 Ser Arg Gly Ile Pro Gly Ile Arg Lys Glu Val Ala Glu Phe Ile Glu 115 120 125 Arg Arg Asp Gly Tyr Pro Ser Asp Pro Glu Leu Ile Tyr Leu Thr Asp 130 135 140 Gly Ala Ser Lys Gly Val Met Gln Met Leu Asn Thr Ile Ile Arg Asn 145 150 155 160 Glu Arg Asp Gly Ile Leu Val Pro Val Pro Gln Tyr Pro Leu Tyr Ser 165 170 175 Ala Ala Ile Ser Leu Phe Gly Gly Ser Leu Val Pro Tyr Tyr Leu Glu 180 185 190 Glu Glu Ala Asn Trp Gly Leu Asp Phe Val Asn Leu Arg Gln Thr Val 195 200 205 Ala Ser Ala Arg Ser Lys Gly Ile Thr Val Arg Ala Met Val Ile Ile 210 215 220 Asn Pro Gly Asn Pro Thr Gly Gln Cys Leu Ser Glu Gly Asn Ile Lys 225 230 235 240 Glu Leu Leu Lys Phe Cys Phe His Glu Asn Leu Val Leu Leu Ala Asp 245 250 255 Glu Val Tyr Gln Gln Asn Ile Tyr Gln Asp Glu Arg Pro Phe Ile Ser 260 265 270 Ala Arg Lys Val Leu Phe Asp Met Gly Pro Pro Met Ser Arg Glu Val 275 280 285 Gln Leu Val Ser Phe His Thr Val Ser Lys Gly Tyr Trp Gly Glu Cys 290 295 300 Gly Gln Arg Gly Gly Tyr Phe Glu Met Thr Asn Leu Pro Pro Lys Thr 305 310 315 320 Val Asp Glu Ile Tyr Lys Val Ala Ser Ile Ala Leu Ser Pro Asn Val 325 330 335 Pro Gly Gln Ile Phe Met Gly Leu Met Val Asn Pro Pro Lys Pro Gly 340 345 350 Asp Ile Ser Tyr Leu Lys Phe Ser Ala Glu Ser Lys Ser Ile Leu Glu 355 360 365 Ser Leu Arg Arg Arg Ala Arg Leu Met Thr Asp Gly Phe Asn Ser Cys 370 375 380 Arg Asn Val Val Cys Asn Phe Thr Glu Gly Ala Met Tyr Ser Phe Pro 385 390 395 400 Gln Ile Arg Leu Pro Pro Lys Ala Ile Asp Ala Ala Lys Arg Ala Gly 405 410 415 Lys Ala Ala Asp Val Phe Tyr Cys Leu Lys Leu Leu Glu Ala Thr Gly 420 425 430 Ile Ser Thr Val Pro Gly Ser Gly Phe Gly Gln Lys Glu Gly Val Phe 435 440 445 His Leu Arg Thr Thr Ile Leu Pro Ala Glu Glu Asp Met Pro Ala Ile 450 455 460 Met Thr Ser Phe Lys Lys Phe Asn Asp Thr Phe Met Asp Gln Tyr Asp 465 470 475 480 Gly Tyr Ser Arg Met 485 <210> 21 <211> 1452 <212> DNA <213> Oryza sativa japonica <400> 21 atggctgctc ccagcgtcgc cgtcgacaac ctcaacccca aggttttgaa ttgtgagtat 60 gcagtgcgtg gagagattgt gatccatgct cagcgcctgc agcaacagct acagactcaa 120 ccagggtctc ttccttttga tgagatccta tactgcaaca ttgggaatcc ccagtctctt 180 ggtcagaagc cagttacatt cttcagggag gttattgctc tttgtgatca tccatgcttg 240 ttggaaaagg aggaaaccaa atcattgttc agtgctgatg ccatttctcg agcaacaaca 300 attcttgcct cgattcctgg aagagcaact ggagcataca gccacagcca gggcatcaaa 360 gggctgcgtg atgcaattgc tgctggaatt gcatcacgtg acggataccc tgcaaatgca 420 gacgacattt tccttactga cggagcaagc cctggagttc acatgatgat gcagttactg 480 ataaggaacg agaaagatgg cattctctgc ccaattcctc aatatccttt gtactcagcc 540 tccattgctc ttcatggtgg agctcttgtc ccgtattatc ttaatgaatc aacaggctgg 600 ggtttggaga tctctgacct taagaagcaa ctcgaagatt ctcggttgaa aggcattgat 660 gttagggctt tggtagttat caatccagga aatccaactg ggcaggttct tgctgaggaa 720 aaccaacggg acatagtgaa gttctgcaaa aatgagggac ttgttcttct ggctgatgag 780 gtgtaccaag agaacatcta tgttgacaac aagaaattta actctttcaa gaagatagcg 840 agatccatgg gatacaacga ggatgatctc cctttagtat catttcaatc tgtttctaag 900 ggatattatg gtgaatgtgg caaaagagga ggctacatgg agattactgg cttcagtgct 960 ccagttagag agcagatcta caaagtggcg tcagtgaact tatgttccaa tatcactggc 1020 cagatccttg ccagcctcgt catgaatcca ccaaaggctg gagatgcatc atatgcttca 1080 tacaaggcag agaaagatgg aatcctccaa tcattagctc gccgtgcaaa ggcattggag 1140 aatgctttca acagtcttga gggaattaca tgcaacaaaa ctgaaggagc aatgtacctc 1200 ttccctcagc ttagtctgcc acaaaaggca attgacgctg ctaaagctgc taacaaagca 1260 cctgatgctt tctatgccct tcgtctcctc gaggcaaccg gaattgttgt tgtccctgga 1320 tctggatttg gccaagttcc tggcacatgg cacatcagat gcacaatcct gccacaggag 1380 gagaagatcc ccgcgatcat ctcccgcttc aaggcattcc atgagggctt catggcagcg 1440 taccgcgact ga 1452 <210> 22 <211> 483 <212> PRT <213> Oryza sativa japonica <400> 22 Met Ala Ala Pro Ser Val Ala Val Asp Asn Leu Asn Pro Lys Val Leu 1 5 10 15 Asn Cys Glu Tyr Ala Val Arg Gly Glu Ile Val Ile His Ala Gln Arg 20 25 30 Leu Gln Gln Gln Leu Gln Thr Gln Pro Gly Ser Leu Pro Phe Asp Glu 35 40 45 Ile Leu Tyr Cys Asn Ile Gly Asn Pro Gln Ser Leu Gly Gln Lys Pro 50 55 60 Val Thr Phe Phe Arg Glu Val Ile Ala Leu Cys Asp His Pro Cys Leu 65 70 75 80 Leu Glu Lys Glu Glu Thr Lys Ser Leu Phe Ser Ala Asp Ala Ile Ser 85 90 95 Arg Ala Thr Thr Ile Leu Ala Ser Ile Pro Gly Arg Ala Thr Gly Ala 100 105 110 Tyr Ser His Ser Gln Gly Ile Lys Gly Leu Arg Asp Ala Ile Ala Ala 115 120 125 Gly Ile Ala Ser Arg Asp Gly Tyr Pro Ala Asn Ala Asp Asp Ile Phe 130 135 140 Leu Thr Asp Gly Ala Ser Pro Gly Val His Met Met Met Gln Leu Leu 145 150 155 160 Ile Arg Asn Glu Lys Asp Gly Ile Leu Cys Pro Ile Pro Gln Tyr Pro 165 170 175 Leu Tyr Ser Ala Ser Ile Ala Leu His Gly Gly Ala Leu Val Pro Tyr 180 185 190 Tyr Leu Asn Glu Ser Thr Gly Trp Gly Leu Glu Ile Ser Asp Leu Lys 195 200 205 Lys Gln Leu Glu Asp Ser Arg Leu Lys Gly Ile Asp Val Arg Ala Leu 210 215 220 Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Ala Glu Glu 225 230 235 240 Asn Gln Arg Asp Ile Val Lys Phe Cys Lys Asn Glu Gly Leu Val Leu 245 250 255 Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Val Asp Asn Lys Lys 260 265 270 Phe Asn Ser Phe Lys Lys Ile Ala Arg Ser Met Gly Tyr Asn Glu Asp 275 280 285 Asp Leu Pro Leu Val Ser Phe Gln Ser Val Ser Lys Gly Tyr Tyr Gly 290 295 300 Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Ile Thr Gly Phe Ser Ala 305 310 315 320 Pro Val Arg Glu Gln Ile Tyr Lys Val Ala Ser Val Asn Leu Cys Ser 325 330 335 Asn Ile Thr Gly Gln Ile Leu Ala Ser Leu Val Met Asn Pro Pro Lys 340 345 350 Ala Gly Asp Ala Ser Tyr Ala Ser Tyr Lys Ala Glu Lys Asp Gly Ile 355 360 365 Leu Gln Ser Leu Ala Arg Arg Ala Lys Ala Leu Glu Asn Ala Phe Asn 370 375 380 Ser Leu Glu Gly Ile Thr Cys Asn Lys Thr Glu Gly Ala Met Tyr Leu 385 390 395 400 Phe Pro Gln Leu Ser Leu Pro Gln Lys Ala Ile Asp Ala Ala Lys Ala 405 410 415 Ala Asn Lys Ala Pro Asp Ala Phe Tyr Ala Leu Arg Leu Leu Glu Ala 420 425 430 Thr Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Val Pro Gly 435 440 445 Thr Trp His Ile Arg Cys Thr Ile Leu Pro Gln Glu Glu Lys Ile Pro 450 455 460 Ala Ile Ile Ser Arg Phe Lys Ala Phe His Glu Gly Phe Met Ala Ala 465 470 475 480 Tyr Arg Asp <210> 23 <211> 1722 <212> DNA <213> Cyanidioschyzon merolae <400> 23 atgcaacacg tgttggcggg tcgggtaggg cgtagaacgt ttgggctgct caatttcagt 60 tatctccgta tagggcgaag gaataggagc cacggtgtaa gcgcagggat gccgcacgaa 120 gccgacggga cgcgccggcg aaaagcgctc gacttgcgaa ccataaacca gcgcgtggta 180 gcggcgcagt acgctgtgcg tggtgaattg cccactcgcg ctgcgcgact gcaacagact 240 ctagaaaaag gaggaccaga agctgccgca ctgccgttta aggaaataat ttactgcaac 300 atcggaaatc cacaggcact tgggaacccg ccattcactt accaccggcg ggtcatggca 360 ctgtgcgact gtccggactt ggcagcggca ctcccggaga aggagcgtga aaaactgttc 420 cccgccgacg tgcgcgaagc gacggaacga atcctacgct ccgctggact cggcggtacg 480 ggagcgtact cggactccca gggagtgccg atcattcgac aagatgtggc agagttcatg 540 aacaagcggg acggcattca cgaggactcc gaatttgcag ctcgagtgaa ggatgtgttt 600 ttgacaaatg gttcatcgag cgcgatcctc atgctcatgg cgctgttgag cggttccgac 660 gcagcgctca gcgcggacgg taccaacggc gtatcgcatg gacgcgaaac acgttccatg 720 cgaccgggtg tgctgattcc agtgccacag tatccgattt actcggcgct ttgcacagtc 780 ctagggatcg aagcgctaca ctaccatctc gttcaggagc agaattggtc tattcaagtc 840 acggagctaa cggaacaggt tcgacaggca cgctcccgtg gcatcgaagc gcgcgccctg 900 gtcgtcatct caccggggaa tcctaccgga caattgcttc atccggcgaa catgcgagaa 960 ctgatggatt ttgcgtatcg agagggactc ctactcctgg ctgatgaggt ctatgcagac 1020 aacgtgtact tggatggtcg gaaattcgag tcgtttcgaa gagtgctgca ttcgagtatg 1080 ccggaggagg tccaggagtc gctggaactc gtgtcgctct actccgccag caaagggctt 1140 gtcggagagt gtggtcgccg cggcggctac atgctgttat caccgggcgt tacaaacgag 1200 gcacgtgaac aactcctgaa actcgctagt atcatgctct gcccaaacct cggcggacag 1260 gtcatgatcg actgtgtggt gcgcccgccg gagccgggcc aaccatcata tgagctctac 1320 cagaaagaga aacttgagcg ttatgaaagt ttgcggcgac gtgcgcatcg cgttgtagag 1380 gcatttaaga gtatgcgcgg tgtgcaatgc aaccctagtg agggcgccat gtacgccttt 1440 ccgagcatca ctgtgggcac gaaagcactc caggcagcgc aaaagtccaa tatgccgctg 1500 gatacgtttt actgtgtcag ccttttggaa cgaactggta tctgtgtggt gccgggcgca 1560 gggttcggca tgcattccaa tgaaccaaca tccagtgtcc cgaacggttc gtgtcggttt 1620 tacctgcgga cgactatttt gcctccggag gaaaagctcg aacccgtcat cgcgctgctt 1680 cgggctcatc acgaggagtt tcttcaaaag tatcccccgg ac 1722 <210> 24 <211> 574 <212> PRT <213> Cyanidioschyzon merolae <400> 24 Met Gln His Val Leu Ala Gly Arg Val Gly Arg Arg Thr Phe Gly Leu 1 5 10 15 Leu Asn Phe Ser Tyr Leu Arg Ile Gly Arg Arg Asn Arg Ser His Gly 20 25 30 Val Ser Ala Gly Met Pro His Glu Ala Asp Gly Thr Arg Arg Arg Lys 35 40 45 Ala Leu Asp Leu Arg Thr Ile Asn Gln Arg Val Val Ala Ala Gln Tyr 50 55 60 Ala Val Arg Gly Glu Leu Pro Thr Arg Ala Ala Arg Leu Gln Gln Thr 65 70 75 80 Leu Glu Lys Gly Gly Pro Glu Ala Ala Ala Leu Pro Phe Lys Glu Ile 85 90 95 Ile Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Gly Asn Pro Pro Phe 100 105 110 Thr Tyr His Arg Arg Val Met Ala Leu Cys Asp Cys Pro Asp Leu Ala 115 120 125 Ala Ala Leu Pro Glu Lys Glu Arg Glu Lys Leu Phe Pro Ala Asp Val 130 135 140 Arg Glu Ala Thr Glu Arg Ile Leu Arg Ser Ala Gly Leu Gly Gly Thr 145 150 155 160 Gly Ala Tyr Ser Asp Ser Gln Gly Val Pro Ile Ile Arg Gln Asp Val 165 170 175 Ala Glu Phe Met Asn Lys Arg Asp Gly Ile His Glu Asp Ser Glu Phe 180 185 190 Ala Ala Arg Val Lys Asp Val Phe Leu Thr Asn Gly Ser Ser Ser Ala 195 200 205 Ile Leu Met Leu Met Ala Leu Leu Ser Gly Ser Asp Ala Ala Leu Ser 210 215 220 Ala Asp Gly Thr Asn Gly Val Ser His Gly Arg Glu Thr Arg Ser Met 225 230 235 240 Arg Pro Gly Val Leu Ile Pro Val Pro Gln Tyr Pro Ile Tyr Ser Ala 245 250 255 Leu Cys Thr Val Leu Gly Ile Glu Ala Leu His Tyr His Leu Val Gln 260 265 270 Glu Gln Asn Trp Ser Ile Gln Val Thr Glu Leu Thr Glu Gln Val Arg 275 280 285 Gln Ala Arg Ser Arg Gly Ile Glu Ala Arg Ala Leu Val Val Ile Ser 290 295 300 Pro Gly Asn Pro Thr Gly Gln Leu Leu His Pro Ala Asn Met Arg Glu 305 310 315 320 Leu Met Asp Phe Ala Tyr Arg Glu Gly Leu Leu Leu Leu Ala Asp Glu 325 330 335 Val Tyr Ala Asp Asn Val Tyr Leu Asp Gly Arg Lys Phe Glu Ser Phe 340 345 350 Arg Arg Val Leu His Ser Ser Met Pro Glu Glu Val Gln Glu Ser Leu 355 360 365 Glu Leu Val Ser Leu Tyr Ser Ala Ser Lys Gly Leu Val Gly Glu Cys 370 375 380 Gly Arg Arg Gly Gly Tyr Met Leu Leu Ser Pro Gly Val Thr Asn Glu 385 390 395 400 Ala Arg Glu Gln Leu Leu Lys Leu Ala Ser Ile Met Leu Cys Pro Asn 405 410 415 Leu Gly Gly Gln Val Met Ile Asp Cys Val Val Arg Pro Pro Glu Pro 420 425 430 Gly Gln Pro Ser Tyr Glu Leu Tyr Gln Lys Glu Lys Leu Glu Arg Tyr 435 440 445 Glu Ser Leu Arg Arg Arg Ala His Arg Val Val Glu Ala Phe Lys Ser 450 455 460 Met Arg Gly Val Gln Cys Asn Pro Ser Glu Gly Ala Met Tyr Ala Phe 465 470 475 480 Pro Ser Ile Thr Val Gly Thr Lys Ala Leu Gln Ala Ala Gln Lys Ser 485 490 495 Asn Met Pro Leu Asp Thr Phe Tyr Cys Val Ser Leu Leu Glu Arg Thr 500 505 510 Gly Ile Cys Val Val Pro Gly Ala Gly Phe Gly Met His Ser Asn Glu 515 520 525 Pro Thr Ser Ser Val Pro Asn Gly Ser Cys Arg Phe Tyr Leu Arg Thr 530 535 540 Thr Ile Leu Pro Pro Glu Glu Lys Leu Glu Pro Val Ile Ala Leu Leu 545 550 555 560 Arg Ala His His Glu Glu Phe Leu Gln Lys Tyr Pro Pro Asp 565 570 <210> 25 <211> 1779 <212> DNA <213> Saccharomyces cerevisiae <400> 25 atgttatcac tgtctgccaa aaatcacttc acagtgagta attctataac tcacgttatt 60 aagtcatatc atataaggac tctcacttca agcgcagaaa aaatgccaca tatcactact 120 cctttttcta cctcagccag tagtacaaag ttaaaagctt tcaggaaagt tagacccgtc 180 ctacagagac atagctcttc ctggattgtt gctcaaaatc atagacgttc attatctggt 240 caatcttcgc taaacgacct gcgtcatttg aatcgctttc cacaccacac gttgaaaact 300 tcgaataacg agttttatcc cgccgaacaa ttgactttgg aagacgtaaa tgaaaatgtc 360 ttgaaggcta agtacgccgt tagaggtgcc atcccaatga gagctgaaga attgaaagct 420 caactggaga aggatcctca atctctgcca tttgacagga ttatcaacgc caatattggt 480 aatcctcagc aactacaaca gaaacctctg acttactaca gacaggtctt gtctctctta 540 caatacccag aactattaaa ccaaaacgaa cagcagctag ttgattcgaa attgtttaaa 600 ctagatgcca ttaaacgtgc aaagagttta atggaagata tcggtggttc tgttggtgct 660 tactcttctt ctcaaggtgt agaaggtata aggaaaagtg tcgctgaatt tataacgaag 720 agggacgaag gcgagatatc atacccagag gatattttcc taactgctgg tgcatccgca 780 gctgtcaatt acttgttatc aattttctgt agagggccag aaacgggtgt cttgattcca 840 attcctcaat atccattata taccgctact ctagctttga acaattctca agctttacca 900 tactatttag atgagaattc aggttggtca actaatccag aagaaattga aactgtcgtc 960 aaagaggcta tacagaacga aatcaaacct acagttctag tggttatcaa tccaggtaat 1020 cctacaggag ctgtcctatc acctgagtct atagctcaga tttttgaagt cgcagccaag 1080 tacggtacag tagtgatagc tgacgaagtt tatcaagaaa atatcttccc gggcaccaag 1140 ttccattcta tgaagaaaat tttgagacat ttacagaggg aacatccagg taaattcgat 1200 aatgttcagc tagcttcttt gcattcgact tctaagggtg tttctggtga atgtggtcaa 1260 aggggtggct acatggaact cactggattc agccatgaga tgagacaagt tatcttgaaa 1320 ctagcctcga tttcattgtg tcccgttgtc acaggtcaag ctttggttga tttgatggtt 1380 cgtccaccag tggaagggga ggaatcattc gagtcggacc aagcagaacg taactccatc 1440 catgaaaagt taattacaag agcaatgaca ctgtatgaga catttaactc tttagaaggc 1500 attgaatgtc aaaagcctca aggtgccatg tatttattcc ctaagataga cttacctttc 1560 aaggcagttc aagaagctcg ccacttagag ttaactccgg atgaatttta ttgtaagaag 1620 ttgttagaat ctactggcat ttgcactgtt cccggttctg ggtttggtca agaacctggt 1680 acttaccatt taagaacaac atttttggca cctggtctgg aatggattaa gaaatgggaa 1740 agtttccata aagaattttt tgaccaatac cgtgactga 1779 <210> 26 <211> 592 <212> PRT <213> Saccharomyces cerevisiae <400> 26 Met Leu Ser Leu Ser Ala Lys Asn His Phe Thr Val Ser Asn Ser Ile 1 5 10 15 Thr His Val Ile Lys Ser Tyr His Ile Arg Thr Leu Thr Ser Ser Ala 20 25 30 Glu Lys Met Pro His Ile Thr Thr Pro Phe Ser Thr Ser Ala Ser Ser 35 40 45 Thr Lys Leu Lys Ala Phe Arg Lys Val Arg Pro Val Leu Gln Arg His 50 55 60 Ser Ser Ser Trp Ile Val Ala Gln Asn His Arg Arg Ser Leu Ser Gly 65 70 75 80 Gln Ser Ser Leu Asn Asp Leu Arg His Leu Asn Arg Phe Pro His His 85 90 95 Thr Leu Lys Thr Ser Asn Asn Glu Phe Tyr Pro Ala Glu Gln Leu Thr 100 105 110 Leu Glu Asp Val Asn Glu Asn Val Leu Lys Ala Lys Tyr Ala Val Arg 115 120 125 Gly Ala Ile Pro Met Arg Ala Glu Glu Leu Lys Ala Gln Leu Glu Lys 130 135 140 Asp Pro Gln Ser Leu Pro Phe Asp Arg Ile Ile Asn Ala Asn Ile Gly 145 150 155 160 Asn Pro Gln Gln Leu Gln Gln Lys Pro Leu Thr Tyr Tyr Arg Gln Val 165 170 175 Leu Ser Leu Leu Gln Tyr Pro Glu Leu Leu Asn Gln Asn Glu Gln Gln 180 185 190 Leu Val Asp Ser Lys Leu Phe Lys Leu Asp Ala Ile Lys Arg Ala Lys 195 200 205 Ser Leu Met Glu Asp Ile Gly Gly Ser Val Gly Ala Tyr Ser Ser Ser 210 215 220 Gln Gly Val Glu Gly Ile Arg Lys Ser Val Ala Glu Phe Ile Thr Lys 225 230 235 240 Arg Asp Glu Gly Glu Ile Ser Tyr Pro Glu Asp Ile Phe Leu Thr Ala 245 250 255 Gly Ala Ser Ala Ala Val Asn Tyr Leu Leu Ser Ile Phe Cys Arg Gly 260 265 270 Pro Glu Thr Gly Val Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Thr 275 280 285 Ala Thr Leu Ala Leu Asn Asn Ser Gln Ala Leu Pro Tyr Tyr Leu Asp 290 295 300 Glu Asn Ser Gly Trp Ser Thr Asn Pro Glu Glu Ile Glu Thr Val Val 305 310 315 320 Lys Glu Ala Ile Gln Asn Glu Ile Lys Pro Thr Val Leu Val Val Ile 325 330 335 Asn Pro Gly Asn Pro Thr Gly Ala Val Leu Ser Pro Glu Ser Ile Ala 340 345 350 Gln Ile Phe Glu Val Ala Ala Lys Tyr Gly Thr Val Val Ile Ala Asp 355 360 365 Glu Val Tyr Gln Glu Asn Ile Phe Pro Gly Thr Lys Phe His Ser Met 370 375 380 Lys Lys Ile Leu Arg His Leu Gln Arg Glu His Pro Gly Lys Phe Asp 385 390 395 400 Asn Val Gln Leu Ala Ser Leu His Ser Thr Ser Lys Gly Val Ser Gly 405 410 415 Glu Cys Gly Gln Arg Gly Gly Tyr Met Glu Leu Thr Gly Phe Ser His 420 425 430 Glu Met Arg Gln Val Ile Leu Lys Leu Ala Ser Ile Ser Leu Cys Pro 435 440 445 Val Val Thr Gly Gln Ala Leu Val Asp Leu Met Val Arg Pro Pro Val 450 455 460 Glu Gly Glu Glu Ser Phe Glu Ser Asp Gln Ala Glu Arg Asn Ser Ile 465 470 475 480 His Glu Lys Leu Ile Thr Arg Ala Met Thr Leu Tyr Glu Thr Phe Asn 485 490 495 Ser Leu Glu Gly Ile Glu Cys Gln Lys Pro Gln Gly Ala Met Tyr Leu 500 505 510 Phe Pro Lys Ile Asp Leu Pro Phe Lys Ala Val Gln Glu Ala Arg His 515 520 525 Leu Glu Leu Thr Pro Asp Glu Phe Tyr Cys Lys Lys Leu Leu Glu Ser 530 535 540 Thr Gly Ile Cys Thr Val Pro Gly Ser Gly Phe Gly Gln Glu Pro Gly 545 550 555 560 Thr Tyr His Leu Arg Thr Thr Phe Leu Ala Pro Gly Leu Glu Trp Ile 565 570 575 Lys Lys Trp Glu Ser Phe His Lys Glu Phe Phe Asp Gln Tyr Arg Asp 580 585 590 <210> 27 <211> 1524 <212> DNA <213> Saccharomyces cerevisiae <400> 27 atgacaatga cacaccaaca ggatttgaaa ggtgtgttca ccgcaaagga tttggatttt 60 aagcccgctg gcaagattac taaaaaagat ttgaatacag gtgtcactaa ggcagaatat 120 gctgtaagag gagctattcc aaccagagct gacgagctaa aagaggaatt gaaaaaaaac 180 ccagaagttt tgcctttcga tgatattatc aatgcgaaca ttggtaatcc gcagcaactg 240 gatcagaagc ctttgacctt taccaggcaa gtactggcca tcctggagta cccggaaatt 300 ttacgagtag gccataatga actggcttct ttgaacttgt tttccaggga cgccttggaa 360 agagctgagc gcctcttgaa tgatattggc ggttctatag gggcatattc gcattctcaa 420 ggtgtgccag gaataaggca aacagttgct gacttcatta ctagaagaga cggcggtgag 480 cccgctacac cggaagatat ttatttaacc actggcgctt cgtccgcggc aacttctttg 540 ttatctttat tgtgtaaaga ttctcaaaca ggcctgctga ttccaattcc gcagtatccg 600 ctttatactg catccgcatc tcttttcaat gcacaagtgc tgccatacta cttagatgag 660 gagtcaaatt ggtctacaaa cagcgacgaa attgaaaaag tagtgcaaga tgctttgaaa 720 aaacagatca gaccatctgt gctgatagtt attaatccag gtaacccaac cggtgcagtt 780 ctttctgaag aaaccattgc caggatctgt ttgatcgctg cgaaatacgg cattacaatc 840 atttctgatg aggtctatca agaaaacatt ttcaacgatg ttaaatttca ttcgatgaag 900 aaagtcctaa gaaaattgca gcatctttat ccaggaaaat tcgataacgt tcagctcgcc 960 tctttacact ccatttctaa aggattcatg gatgagtgcg gccaaagagg cggttacatg 1020 gaaattattg ggttttctca agaaataaga gatgctcttt tcaaactcat gtctatatcc 1080 atatgttctg ttgtcacagg acaagctgtg gttgatttaa tggtcaaacc accccagcct 1140 ggagacgagt cctatgaaca agatcatgac gaaaggctga aaatttttca tgaaatgcgt 1200 acgagagcaa acttattgta cgagacgttt aaggaactag agggtatcga atgccaaaaa 1260 cctcagggtg caatgtatct tttccctagg cttgttttac ctaagaaagc tctttgtgaa 1320 agcgaacgcc ttggcatcga acctgatgag ttctattgca catctttgct agaatctaca 1380 ggtatttgta ctgtcccagg gtctgggttc ggacaaagac ccgggactta tcatgtgcga 1440 acaacgtttt tggctccagg gactaaatgg attcaagact ggaaagaatt tcatcaagat 1500 ttcttcagca agtatcgtaa ttga 1524 <210> 28 <211> 507 <212> PRT <213> Saccharomyces cerevisiae <400> 28 Met Thr Met Thr His Gln Gln Asp Leu Lys Gly Val Phe Thr Ala Lys 1 5 10 15 Asp Leu Asp Phe Lys Pro Ala Gly Lys Ile Thr Lys Lys Asp Leu Asn 20 25 30 Thr Gly Val Thr Lys Ala Glu Tyr Ala Val Arg Gly Ala Ile Pro Thr 35 40 45 Arg Ala Asp Glu Leu Lys Glu Glu Leu Lys Lys Asn Pro Glu Val Leu 50 55 60 Pro Phe Asp Asp Ile Ile Asn Ala Asn Ile Gly Asn Pro Gln Gln Leu 65 70 75 80 Asp Gln Lys Pro Leu Thr Phe Thr Arg Gln Val Leu Ala Ile Leu Glu 85 90 95 Tyr Pro Glu Ile Leu Arg Val Gly His Asn Glu Leu Ala Ser Leu Asn 100 105 110 Leu Phe Ser Arg Asp Ala Leu Glu Arg Ala Glu Arg Leu Leu Asn Asp 115 120 125 Ile Gly Gly Ser Ile Gly Ala Tyr Ser His Ser Gln Gly Val Pro Gly 130 135 140 Ile Arg Gln Thr Val Ala Asp Phe Ile Thr Arg Arg Asp Gly Gly Glu 145 150 155 160 Pro Ala Thr Pro Glu Asp Ile Tyr Leu Thr Thr Gly Ala Ser Ser Ala 165 170 175 Ala Thr Ser Leu Leu Ser Leu Leu Cys Lys Asp Ser Gln Thr Gly Leu 180 185 190 Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Ser Ala Ser Leu 195 200 205 Phe Asn Ala Gln Val Leu Pro Tyr Tyr Leu Asp Glu Glu Ser Asn Trp 210 215 220 Ser Thr Asn Ser Asp Glu Ile Glu Lys Val Val Gln Asp Ala Leu Lys 225 230 235 240 Lys Gln Ile Arg Pro Ser Val Leu Ile Val Ile Asn Pro Gly Asn Pro 245 250 255 Thr Gly Ala Val Leu Ser Glu Glu Thr Ile Ala Arg Ile Cys Leu Ile 260 265 270 Ala Ala Lys Tyr Gly Ile Thr Ile Ile Ser Asp Glu Val Tyr Gln Glu 275 280 285 Asn Ile Phe Asn Asp Val Lys Phe His Ser Met Lys Lys Val Leu Arg 290 295 300 Lys Leu Gln His Leu Tyr Pro Gly Lys Phe Asp Asn Val Gln Leu Ala 305 310 315 320 Ser Leu His Ser Ile Ser Lys Gly Phe Met Asp Glu Cys Gly Gln Arg 325 330 335 Gly Gly Tyr Met Glu Ile Ile Gly Phe Ser Gln Glu Ile Arg Asp Ala 340 345 350 Leu Phe Lys Leu Met Ser Ile Ser Ile Cys Ser Val Val Thr Gly Gln 355 360 365 Ala Val Val Asp Leu Met Val Lys Pro Pro Gln Pro Gly Asp Glu Ser 370 375 380 Tyr Glu Gln Asp His Asp Glu Arg Leu Lys Ile Phe His Glu Met Arg 385 390 395 400 Thr Arg Ala Asn Leu Leu Tyr Glu Thr Phe Lys Glu Leu Glu Gly Ile 405 410 415 Glu Cys Gln Lys Pro Gln Gly Ala Met Tyr Leu Phe Pro Arg Leu Val 420 425 430 Leu Pro Lys Lys Ala Leu Cys Glu Ser Glu Arg Leu Gly Ile Glu Pro 435 440 445 Asp Glu Phe Tyr Cys Thr Ser Leu Leu Glu Ser Thr Gly Ile Cys Thr 450 455 460 Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Gly Thr Tyr His Val Arg 465 470 475 480 Thr Thr Phe Leu Ala Pro Gly Thr Lys Trp Ile Gln Asp Trp Lys Glu 485 490 495 Phe His Gln Asp Phe Phe Ser Lys Tyr Arg Asn 500 505 <210> 29 <211> 1566 <212> DNA <213> Ashbya gossypii <400> 29 atggcaatag ggatgctgag aagaaatagc agcggcaccg ccgtgagcgt tctacagggg 60 cgtgtgcttc gcactcgtag attgagctca gtaaaggacg ggtcgcggtt tgtgcctgcg 120 gaaccgatga cactagcgga cgtgaacgaa aacgtggtca aggcgaagta cgcggtgcgg 180 gggaagattc caacgcgtgc agaggagctg gagcggcggc tggaggagca cccgggctcg 240 ctgccgttca gcaaaatcat ccaagcgaac atcggcaatc cgcagcagct gggccagaag 300 ccgctgacat tctaccggca agtgatctcg ctgatgcaga atccacagtt gctggagatg 360 cccgcagaat ggctgcagca ggcgttcaag gcggatgtgg tggtgcgtgc gcggaggatg 420 ctgcaggacg ccggaggctc cgtgggagcg tactcggcgt cgcagggtgt gaaaggctac 480 cggcgcacgg ttgcgcagtt tattgagcgg cgcgatggga tcccagcgaa tccagacaac 540 gtgtacctga ccgcgggtgc gtcctctgct gtgtcttgtc tgctgtcgac attctgcaag 600 ggaccggaga caggcgtgtt gatcccaatc cctcagtacc cgctgtacac tgctacgatc 660 acacagaata acgcggttgc gctgccgtac tacctaaatg aggctgatgg gtggtctacg 720 aatccagatg agatggaacg tgtcatcctc gattctaaga agaggaacat cgcgcccaaa 780 tgtctggttg tgattaaccc tgggaatccc actggttccg tactgtctgt aaaggatatg 840 gaggctattc taacacttgc tgcgaagtat gggattgtcg ttattgcgga cgaggtatac 900 caggataatg tgtttggcga tgccaagttc cactctatgc gtaaggtgct gaaaaacctt 960 caactcagag agccaacgct ctacaagaat gtccagttag cctctcttca ctcgatctcg 1020 aaggggctct ccggcgaatg tggccagcgt ggtggctaca tggaattgat cggtttccgt 1080 gaggagctca ggaaggtttt cgttaagttg gcttctatat ctctttgtcc agtggttacc 1140 ggacaagctc tagtcgacct tatggttggg cctcccagcc aaggggatcc atcctatgag 1200 caatataccc aggaaacaag gagtatctat cacgaattgg aggaacggtc gcaactgctg 1260 tggaaaacgt tctgttcctt ggagggtata gaatgcaata tgccacaagg tgctctatat 1320 ctattcccta agttgcatct tccacagaaa gctattgaag cggcgcaaaa gctgggtata 1380 ccagcggatg agctctactg tagcgaatta cttgatgaaa caggcatctg cactgtccct 1440 ggaactggtt tcggccaaat cccgggcaca tatcacgtta gaactacgtt tttgccacct 1500 ggtactaagt ggatcgaaag ttggaaggac ttccacaaga aattttatga caagtatagg 1560 gactaa 1566 <210> 30 <211> 521 <212> PRT <213> Ashbya gossypii <400> 30 Met Ala Ile Gly Met Leu Arg Arg Asn Ser Ser Gly Thr Ala Val Ser 1 5 10 15 Val Leu Gln Gly Arg Val Leu Arg Thr Arg Arg Leu Ser Ser Val Lys 20 25 30 Asp Gly Ser Arg Phe Val Pro Ala Glu Pro Met Thr Leu Ala Asp Val 35 40 45 Asn Glu Asn Val Val Lys Ala Lys Tyr Ala Val Arg Gly Lys Ile Pro 50 55 60 Thr Arg Ala Glu Glu Leu Glu Arg Arg Leu Glu Glu His Pro Gly Ser 65 70 75 80 Leu Pro Phe Ser Lys Ile Ile Gln Ala Asn Ile Gly Asn Pro Gln Gln 85 90 95 Leu Gly Gln Lys Pro Leu Thr Phe Tyr Arg Gln Val Ile Ser Leu Met 100 105 110 Gln Asn Pro Gln Leu Leu Glu Met Pro Ala Glu Trp Leu Gln Gln Ala 115 120 125 Phe Lys Ala Asp Val Val Val Arg Ala Arg Arg Met Leu Gln Asp Ala 130 135 140 Gly Gly Ser Val Gly Ala Tyr Ser Ala Ser Gln Gly Val Lys Gly Tyr 145 150 155 160 Arg Arg Thr Val Ala Gln Phe Ile Glu Arg Arg Asp Gly Ile Pro Ala 165 170 175 Asn Pro Asp Asn Val Tyr Leu Thr Ala Gly Ala Ser Ser Ala Val Ser 180 185 190 Cys Leu Leu Ser Thr Phe Cys Lys Gly Pro Glu Thr Gly Val Leu Ile 195 200 205 Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Thr Ile Thr Gln Asn Asn 210 215 220 Ala Val Ala Leu Pro Tyr Tyr Leu Asn Glu Ala Asp Gly Trp Ser Thr 225 230 235 240 Asn Pro Asp Glu Met Glu Arg Val Ile Leu Asp Ser Lys Lys Arg Asn 245 250 255 Ile Ala Pro Lys Cys Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly 260 265 270 Ser Val Leu Ser Val Lys Asp Met Glu Ala Ile Leu Thr Leu Ala Ala 275 280 285 Lys Tyr Gly Ile Val Val Ile Ala Asp Glu Val Tyr Gln Asp Asn Val 290 295 300 Phe Gly Asp Ala Lys Phe His Ser Met Arg Lys Val Leu Lys Asn Leu 305 310 315 320 Gln Leu Arg Glu Pro Thr Leu Tyr Lys Asn Val Gln Leu Ala Ser Leu 325 330 335 His Ser Ile Ser Lys Gly Leu Ser Gly Glu Cys Gly Gln Arg Gly Gly 340 345 350 Tyr Met Glu Leu Ile Gly Phe Arg Glu Glu Leu Arg Lys Val Phe Val 355 360 365 Lys Leu Ala Ser Ile Ser Leu Cys Pro Val Val Thr Gly Gln Ala Leu 370 375 380 Val Asp Leu Met Val Gly Pro Pro Ser Gln Gly Asp Pro Ser Tyr Glu 385 390 395 400 Gln Tyr Thr Gln Glu Thr Arg Ser Ile Tyr His Glu Leu Glu Glu Arg 405 410 415 Ser Gln Leu Leu Trp Lys Thr Phe Cys Ser Leu Glu Gly Ile Glu Cys 420 425 430 Asn Met Pro Gln Gly Ala Leu Tyr Leu Phe Pro Lys Leu His Leu Pro 435 440 445 Gln Lys Ala Ile Glu Ala Ala Gln Lys Leu Gly Ile Pro Ala Asp Glu 450 455 460 Leu Tyr Cys Ser Glu Leu Leu Asp Glu Thr Gly Ile Cys Thr Val Pro 465 470 475 480 Gly Thr Gly Phe Gly Gln Ile Pro Gly Thr Tyr His Val Arg Thr Thr 485 490 495 Phe Leu Pro Pro Gly Thr Lys Trp Ile Glu Ser Trp Lys Asp Phe His 500 505 510 Lys Lys Phe Tyr Asp Lys Tyr Arg Asp 515 520 <210> 31 <211> 1563 <212> DNA <213> Candida albicans <400> 31 atgcttagag taaattcacg attattaact actcgaaaat ctcaatttat gttcacttct 60 aattccttaa ggtttttagc aacctttaaa cctgcggatc cattgactac tcatgatatc 120 aacccacaaa cggtcgaggc aaaatacgct gtacgtggga aaatcccaat tattgccgat 180 gaattgaatg aattgattca aaagcaacca cagctgcatg gattaccatt tagcaaaatc 240 attaatgcca acattggtaa cccacagcaa ttggaacaac gtccattgac atggtatcgt 300 caagtattgt ctcttttaca atacccggat ttattgaaaa atggagaccc tgaaaccgtt 360 aaatcacttt atcctgaaga tgtgattgag cgagcacaat caattttgaa acacattgga 420 tcaatagggg catactctca ttctcagggt gccagttatt tccgacaatc tattgctgaa 480 tttataacta accgtgatgg tggttatgta tcccacgcca acaacatttt tttaacttcc 540 ggggcatcaa ctgcagtgtc gtatttatta caaattttgt ctgtcaatga aaactccggg 600 ttcttaattc cgatcccaca gtatcctttg tatactgcca ctattgcctt gaataatgcc 660 aagccaattg gttattatct cgatgagtcg aaccattggt caaccaatcc tcaagagatt 720 agagaattga tcgaaaccaa tcaactgcaa ggtattaaca tcaaggcatt ggtggtgatt 780 aacccgggga acccaacggg ggcaatttta tcatcacaag atataattga attgatagat 840 attgctgctg aatatggaat tgtattaatt gccgatgagg tttatcaaga aaatattttc 900 aaagggaaat ttgtttcatt caagaagatt ttgtcggaat taattgagca agaccctcaa 960 acttataaac atgttcaatt agcatcatta cactcgacat cgaaaggtgt tagtggagaa 1020 tgtggacaac gtggtggata tatggaatta gttgggttca aaccggaagt taaagatgtg 1080 gttttcaaat tggcatcgat taatttatgt tctgttgtct ctggtcaagc attaatggag 1140 ttaatgatta atcctcctca agaaggtgat cctagttacc ccttgtacaa aagcgaaacc 1200 gaatcaatcc ataacgattt ggaatcaaga gcagaatcac tctatcaagc ttttttacaa 1260 atggaagata tcaaatgtaa taaaccaatg ggggccatgt atattttccc cactttagat 1320 tttgatccag cccgatacca taagttatat tcgagagcta agaattccaa tttacaaatt 1380 gatgatattt attgtatcga gttattagaa ggtacaggta tttgttgtgt tcctggtaat 1440 ggatttggtc agaaaccaga tacttatcat ttaagaacaa catttttacc accaggtaaa 1500 gaatggattg ataaatggat aaatttccat aaatcattta ttaaaaaata taaagatgaa 1560 tag 1563 <210> 32 <211> 520 <212> PRT <213> Candida albicans <400> 32 Met Leu Arg Val Asn Ser Arg Leu Leu Thr Thr Arg Lys Ser Gln Phe 1 5 10 15 Met Phe Thr Ser Asn Ser Leu Arg Phe Leu Ala Thr Phe Lys Pro Ala 20 25 30 Asp Pro Leu Thr Thr His Asp Ile Asn Pro Gln Thr Val Glu Ala Lys 35 40 45 Tyr Ala Val Arg Gly Lys Ile Pro Ile Ile Ala Asp Glu Leu Asn Glu 50 55 60 Leu Ile Gln Lys Gln Pro Gln Ser His Gly Leu Pro Phe Ser Lys Ile 65 70 75 80 Ile Asn Ala Asn Ile Gly Asn Pro Gln Gln Leu Glu Gln Arg Pro Leu 85 90 95 Thr Trp Tyr Arg Gln Val Leu Ser Leu Leu Gln Tyr Pro Asp Leu Leu 100 105 110 Lys Asn Gly Asp Pro Glu Thr Val Lys Ser Leu Tyr Pro Glu Asp Val 115 120 125 Ile Glu Arg Ala Gln Ser Ile Leu Lys His Ile Gly Ser Ile Gly Ala 130 135 140 Tyr Ser His Ser Gln Gly Ala Ser Tyr Phe Arg Gln Ser Ile Ala Glu 145 150 155 160 Phe Ile Thr Asn Arg Asp Gly Gly Tyr Val Ser His Ala Asn Asn Ile 165 170 175 Phe Leu Thr Ser Gly Ala Ser Thr Ala Val Ser Tyr Leu Leu Gln Ile 180 185 190 Leu Ser Val Asn Glu Asn Ser Gly Phe Leu Ile Pro Ile Pro Gln Tyr 195 200 205 Pro Leu Tyr Thr Ala Thr Ile Ala Leu Asn Asn Ala Lys Pro Ile Gly 210 215 220 Tyr Tyr Leu Asp Glu Ser Asn His Trp Ser Thr Asn Pro Gln Glu Ile 225 230 235 240 Arg Glu Leu Ile Glu Thr Asn Gln Ser Gln Gly Ile Asn Ile Lys Ala 245 250 255 Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ile Leu Ser Ser 260 265 270 Gln Asp Ile Ile Glu Leu Ile Asp Ile Ala Ala Glu Tyr Gly Ile Val 275 280 285 Leu Ile Ala Asp Glu Val Tyr Gln Glu Asn Ile Phe Lys Gly Lys Phe 290 295 300 Val Ser Phe Lys Lys Ile Leu Ser Glu Leu Ile Glu Gln Asp Pro Gln 305 310 315 320 Thr Tyr Lys His Val Gln Leu Ala Ser Leu His Ser Thr Ser Lys Gly 325 330 335 Val Ser Gly Glu Cys Gly Gln Arg Gly Gly Tyr Met Glu Leu Val Gly 340 345 350 Phe Lys Pro Glu Val Lys Asp Val Val Phe Lys Leu Ala Ser Ile Asn 355 360 365 Leu Cys Ser Val Val Ser Gly Gln Ala Leu Met Glu Leu Met Ile Asn 370 375 380 Pro Pro Gln Glu Gly Asp Pro Ser Tyr Pro Leu Tyr Lys Ser Glu Thr 385 390 395 400 Glu Ser Ile His Asn Asp Leu Glu Ser Arg Ala Glu Ser Leu Tyr Gln 405 410 415 Ala Phe Leu Gln Met Glu Asp Ile Lys Cys Asn Lys Pro Met Gly Ala 420 425 430 Met Tyr Ile Phe Pro Thr Leu Asp Phe Asp Pro Ala Arg Tyr His Lys 435 440 445 Leu Tyr Ser Arg Ala Lys Asn Ser Asn Leu Gln Ile Asp Asp Ile Tyr 450 455 460 Cys Ile Glu Leu Leu Glu Gly Thr Gly Ile Cys Cys Val Pro Gly Asn 465 470 475 480 Gly Phe Gly Gln Lys Pro Asp Thr Tyr His Leu Arg Thr Thr Phe Leu 485 490 495 Pro Pro Gly Lys Glu Trp Ile Asp Lys Trp Ile Asn Phe His Lys Ser 500 505 510 Phe Ile Lys Lys Tyr Lys Asp Glu 515 520 <210> 33 <211> 1518 <212> DNA <213> Schizosaccharomyces pombe <400> 33 atgtttacag attatccaaa tgatattaac tgtgagtctc caagaatgtc ggaccttgat 60 ggattttgtc aaaatgcgtt ctcagacctt aattctttga atcaacaagt atttaaggca 120 aattacgccg tccgtggagc tttagccatt cttgcggacg agatccaaga tgatttactt 180 gaaaatcctt cttcatatcc tttcagtgag atcgtctatg caaacatcgg taatcctcag 240 cagatgggac agtctcctat tacattcgtt cgacaggttt tatctctttg ccagtaccct 300 accttgttag accatgctga ggaaaagtgg tttcaaaatt tgttccctac ggatgtcgta 360 caacgatcca aaatgctctt aaaggaatct ggaagtttgg gtgcctatag tgcttctcaa 420 ggtattccgc ttgtaaggcg acatgttgcg gatttcatta gagcgagaga tggatttgat 480 tgcgagccat ctgacatata tttgactagt ggtgcctcac acgctgcccg gcttataatg 540 actttgataa tcgctaggcc aacagatggt gtaatggttc ccgctcctca atatcctttg 600 tacggtgccc aaattgatct catgagtgga tctatggtat cttacagcct ctccgaggaa 660 aataattggg acattgattt tgaccaattt aaaaaatcat ttgatgaagc atctaaaaaa 720 ggtatcaacg ttcgtttatg cgtggttatt aatcccggta atcctactgg agcttgcatt 780 tctgaaaata gcatggaaaa agttttgcgc tttgctaagg caaagggcat agtattgctt 840 gccgacgaag tctatcaaaa caatatttac caaaacaagt ttcattcttt taggagaaaa 900 cttggtgaat taagagaaaa ggaacccgac aatcattggg accaagtttc gcttatttcc 960 gtaaattctg ttagcaaagg tcaatttggt gaatgtggtc aaagaggtgg atatttggac 1020 gttgttaata ttccagagcc cgctaaggat caaatcctca aactagctac cattgacatt 1080 tgtccaccag ttgctggtca attattagta gacatgctag taaatcctcc taaacctggt 1140 gatcccagtt atgatttgtt catcaaagaa gttgatgaga ttcatgaagc actgcgttta 1200 caatgccgtc agctctacga gggaacaaag cgcatgaaga gagtttcatg tttagaaccc 1260 cacggggcca tgtatttgca tcccagcgtc tcacttcccg aaaagttaat cactacagcc 1320 aaagctcaga aaattcaacc tgacgaattc tatgcgatag aattgcttaa gcgttcaggt 1380 atatgtgttg ttcctggaag tggatttggg caaccagaag gtgattatca tattcgaatc 1440 acgtttttgg ctaaaggaac tgaatacatt gaacgatttg tcaaagctca taatgaaata 1500 atggacctct atgaataa 1518 <210> 34 <211> 505 <212> PRT <213> Schizosaccharomyces pombe <400> 34 Met Phe Thr Asp Tyr Pro Asn Asp Ile Asn Cys Glu Ser Pro Arg Met 1 5 10 15 Ser Asp Leu Asp Gly Phe Cys Gln Asn Ala Phe Ser Asp Leu Asn Ser 20 25 30 Leu Asn Gln Gln Val Phe Lys Ala Asn Tyr Ala Val Arg Gly Ala Leu 35 40 45 Ala Ile Leu Ala Asp Glu Ile Gln Asp Asp Leu Leu Glu Asn Pro Ser 50 55 60 Ser Tyr Pro Phe Ser Glu Ile Val Tyr Ala Asn Ile Gly Asn Pro Gln 65 70 75 80 Gln Met Gly Gln Ser Pro Ile Thr Phe Val Arg Gln Val Leu Ser Leu 85 90 95 Cys Gln Tyr Pro Thr Leu Leu Asp His Ala Glu Glu Lys Trp Phe Gln 100 105 110 Asn Leu Phe Pro Thr Asp Val Val Gln Arg Ser Lys Met Leu Leu Lys 115 120 125 Glu Ser Gly Ser Leu Gly Ala Tyr Ser Ala Ser Gln Gly Ile Pro Leu 130 135 140 Val Arg Arg His Val Ala Asp Phe Ile Arg Ala Arg Asp Gly Phe Asp 145 150 155 160 Cys Glu Pro Ser Asp Ile Tyr Leu Thr Ser Gly Ala Ser His Ala Ala 165 170 175 Arg Leu Ile Met Thr Leu Ile Ile Ala Arg Pro Thr Asp Gly Val Met 180 185 190 Val Pro Ala Pro Gln Tyr Pro Leu Tyr Gly Ala Gln Ile Asp Leu Met 195 200 205 Ser Gly Ser Met Val Ser Tyr Ser Leu Ser Glu Glu Asn Asn Trp Asp 210 215 220 Ile Asp Phe Asp Gln Phe Lys Lys Ser Phe Asp Glu Ala Ser Lys Lys 225 230 235 240 Gly Ile Asn Val Arg Leu Cys Val Val Ile Asn Pro Gly Asn Pro Thr 245 250 255 Gly Ala Cys Ile Ser Glu Asn Ser Met Glu Lys Val Leu Arg Phe Ala 260 265 270 Lys Ala Lys Gly Ile Val Leu Leu Ala Asp Glu Val Tyr Gln Asn Asn 275 280 285 Ile Tyr Gln Asn Lys Phe His Ser Phe Arg Arg Lys Leu Gly Glu Leu 290 295 300 Arg Glu Lys Glu Pro Asp Asn His Trp Asp Gln Val Ser Leu Ile Ser 305 310 315 320 Val Asn Ser Val Ser Lys Gly Gln Phe Gly Glu Cys Gly Gln Arg Gly 325 330 335 Gly Tyr Leu Asp Val Val Asn Ile Pro Glu Pro Ala Lys Asp Gln Ile 340 345 350 Leu Lys Leu Ala Thr Ile Asp Ile Cys Pro Pro Val Ala Gly Gln Leu 355 360 365 Leu Val Asp Met Leu Val Asn Pro Pro Lys Pro Gly Asp Pro Ser Tyr 370 375 380 Asp Leu Phe Ile Lys Glu Val Asp Glu Ile His Glu Ala Leu Arg Leu 385 390 395 400 Gln Cys Arg Gln Leu Tyr Glu Gly Thr Lys Arg Met Lys Arg Val Ser 405 410 415 Cys Leu Glu Pro His Gly Ala Met Tyr Leu His Pro Ser Val Ser Leu 420 425 430 Pro Glu Lys Leu Ile Thr Thr Ala Lys Ala Gln Lys Ile Gln Pro Asp 435 440 445 Glu Phe Tyr Ala Ile Glu Leu Leu Lys Arg Ser Gly Ile Cys Val Val 450 455 460 Pro Gly Ser Gly Phe Gly Gln Pro Glu Gly Asp Tyr His Ile Arg Ile 465 470 475 480 Thr Phe Leu Ala Lys Gly Thr Glu Tyr Ile Glu Arg Phe Val Lys Ala 485 490 495 His Asn Glu Ile Met Asp Leu Tyr Glu 500 505 <210> 35 <211> 1500 <212> DNA <213> Aspergillus nidulans <400> 35 atgacgaccc gaacgacagt tcctaatgcc tcgcaacgcg ctctatccac tgcggctgtt 60 cgttgcctga ccctagacaa catcaattcg aacgtcaagg ctgccaagta tgctgttcgt 120 ggagaactcg ccgttaaggc ggaggaatac cgtgtgaggc tggctcaggg agacaagaca 180 ctgccgtttg acagcgttat tttcgccaac atcggcaatc ctcagcagct cgaccaaaag 240 cccatcactt tcttccgtca agtcctcagt cttatggaaa accctctact gttaagcaac 300 aaagatgccc ttcgtacgtc tttcggctat caggatgatg ttatcgagcg ggccgagaag 360 cttctggccg aagtccagag tgttggtgca tacagtcaca gccaaggtgc tcccctgatt 420 cgcgagagtg tggccaagtt cattgaagaa cgtgatggct tccccgccga ccctcagtcg 480 ctttacctta ctggtggtgc ctcttccggt gtaaacacca ttctgaacgt catttgtaat 540 gggccaaatg ctggtgtcct agttccgatt ccccagtatc ctctgtacac agccacttta 600 tccctcttga atgctcagtg tgttccttac cacttagaag agcagaaggc ttggggtacc 660 gacatcggta caatcaagaa gtcattggaa caggccaagg ctgcaggcac tgacgttcgc 720 gccattgttg ttatcaaccc tggcaacccg acgggcgctt ctttgagtcc agctgatatc 780 aagagcgtcc ttgacatcgc cgcggaagag aagctcgtcg taattgcgga cgaggtatac 840 cagacaaatg tgtttatcgg agaattcaca tcgttcaaaa agaggctccg ggagctgcag 900 caagaagtac ctggtaaata cgacaatgtc gagcttgttt cccttcacag tacttccaag 960 ggtatggttg gtgaatgtgg ccatcgcgga ggttacttcg aactggttgg atttgatccc 1020 ttggttgctg cccaggtcta caagttcatc agcatcatgc tctgccctcc tgtcatcggg 1080 caatgtttgg ttgaactgat ggtgaaccct ccaaaggagg gcgagcccag ccatgagttg 1140 tatcagaagg agtacaacgg catccgggaa ggactgcgcc agcgcgcctt tgccctctat 1200 gaagcttttc aacggatgga gggtgtcgag tgccaagagc ctcagggtgc catgtacctt 1260 ttccctacta tctcactgcc tcccaaggct attgaagccg ctgccgctga gaaccgcgcc 1320 gcagacgaat tctactgcct ccgtctcctt gacgccactg gtgtttgcgt cgtccctggc 1380 tccggcttcg gtcagaagga gaacacgctc cacttccgca ctactttcct cgcaccaggc 1440 acggactggg tggagcgtat cgtgaagttc cattccgagt tcatggccaa atacaaatag 1500 1500 <210> 36 <211> 499 <212> PRT <213> Aspergillus nidulans <400> 36 Met Thr Thr Arg Thr Thr Val Pro Asn Ala Ser Gln Arg Ala Leu Ser 1 5 10 15 Thr Ala Ala Val Arg Cys Leu Thr Leu Asp Asn Ile Asn Ser Asn Val 20 25 30 Lys Ala Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys Ala Glu 35 40 45 Glu Tyr Arg Val Arg Leu Ala Gln Gly Asp Lys Thr Leu Pro Phe Asp 50 55 60 Ser Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp Gln Lys 65 70 75 80 Pro Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Met Glu Asn Pro Leu 85 90 95 Leu Leu Ser Asn Lys Asp Ala Leu Arg Thr Ser Phe Gly Tyr Gln Asp 100 105 110 Asp Val Ile Glu Arg Ala Glu Lys Leu Leu Ala Glu Val Gln Ser Val 115 120 125 Gly Ala Tyr Ser His Ser Gln Gly Ala Pro Leu Ile Arg Glu Ser Val 130 135 140 Ala Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asp Pro Gln Ser 145 150 155 160 Leu Tyr Leu Thr Gly Gly Ala Ser Ser Gly Val Asn Thr Ile Leu Asn 165 170 175 Val Ile Cys Asn Gly Pro Asn Ala Gly Val Leu Val Pro Ile Pro Gln 180 185 190 Tyr Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln Cys Val 195 200 205 Pro Tyr His Leu Glu Glu Gln Lys Ala Trp Gly Thr Asp Ile Gly Thr 210 215 220 Ile Lys Lys Ser Leu Glu Gln Ala Lys Ala Ala Gly Thr Asp Val Arg 225 230 235 240 Ala Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser Leu Ser 245 250 255 Pro Ala Asp Ile Lys Ser Val Leu Asp Ile Ala Ala Glu Glu Lys Leu 260 265 270 Val Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Ile Gly Glu 275 280 285 Phe Thr Ser Phe Lys Lys Arg Leu Arg Glu Leu Gln Gln Glu Val Pro 290 295 300 Gly Lys Tyr Asp Asn Val Glu Leu Val Ser Leu His Ser Thr Ser Lys 305 310 315 320 Gly Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu Leu Val 325 330 335 Gly Phe Asp Pro Leu Val Ala Ala Gln Val Tyr Lys Phe Ile Ser Ile 340 345 350 Met Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Val Glu Leu Met Val 355 360 365 Asn Pro Pro Lys Glu Gly Glu Pro Ser His Glu Leu Tyr Gln Lys Glu 370 375 380 Tyr Asn Gly Ile Arg Glu Gly Leu Arg Gln Arg Ala Phe Ala Leu Tyr 385 390 395 400 Glu Ala Phe Gln Arg Met Glu Gly Val Glu Cys Gln Glu Pro Gln Gly 405 410 415 Ala Met Tyr Leu Phe Pro Thr Ile Ser Leu Pro Pro Lys Ala Ile Glu 420 425 430 Ala Ala Ala Ala Glu Asn Arg Ala Ala Asp Glu Phe Tyr Cys Leu Arg 435 440 445 Leu Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly 450 455 460 Gln Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala Pro Gly 465 470 475 480 Thr Asp Trp Val Glu Arg Ile Val Lys Phe His Ser Glu Phe Met Ala 485 490 495 Lys Tyr Lys <210> 37 <211> 1506 <212> DNA <213> Aspergillus fumigatus <400> 37 atgatcacag aacccaccat gaccgtgcca tataccacca agcggaccgc ttctgatctc 60 ggccctcgtc gtctccgtgc cgataatatc aatcccaacg tcaaggcggc caagtatgct 120 gtccgtggtg agcttgccgt caaggcggag gaataccgtg tgagattggc caagggagac 180 aagtctttgc cctttgacag tgtcattttc gccaatattg gcaaccccca gcagctggat 240 caaaaaccca tcaccttctt ccgtcaagta ctcagtcttc tcgagaacac cgcattgctt 300 gaaaaaccgg aggtcctgcg gtcgtctttc ggctacaacc aggacgtcat tgaccgggct 360 aagaagcttc ttgcggacat tcagagcgtc ggtgcctaca gtcacagcca gggagcacca 420 gtaattcggg agagcgtggc caaattcatc gaggagcgtg atggcttccc cgccaacccg 480 caagacctgt acctctgcgc tggtgcgtcg tccggtgtta gcacgctgct gaatgtcatc 540 tgcaacggtc ccaccgccgg tgtccttgtg ccgattcccc aatatcctct gtacaccgcc 600 accctgtccc ttctcaatgc acagtgcgtc ccataccatt tagaggagga caaggcctgg 660 ggtaccgacg tggaggccat ccggcaatct ctggtgcgcg ccaaggccga gggcactgag 720 gttcgtgcta tcgtcgtcat caaccccggt aacccgacgg gtgcctcgct cagccccgag 780 gacatcaaga gcgtgcttga catcgccgcc gaggagaagc tggtcgtcat cgccgacgag 840 gtgtaccaga ccaacgtctt cgtgggcgag ttcacatcct tcaagaagag actgcgccaa 900 ctccagcagg aggtgcctgg caagtacgac aatgtcgaac ttgcttctct gcacagtgtg 960 tccaagggta tggtgggcga atgcggtcac cgaggcggtt actttgaact cgtcggattc 1020 gaccccttgg tcgcggccga gatttacaag tttgttagca ttatgctgtg cccgccggtg 1080 atcggtcagt gcctggtcga acttatggtg aacccaccca agaagggcga gcccagttac 1140 gagttgtatc agaaggagta caacagcatt agcgatggcc tacacaagcg tgccctcgcc 1200 ctgtacgaag ccttcaagca gatggagggc gttgaatgcc aggagcctca gggcgccatg 1260 tacctcttcc ccagcatcac cctgcccccc aaggccgtcg aagccgccgc tgccgaaggt 1320 cggaacgccg acgaattcta ctgtctgcgc ctcctcgacg caacgggtgt ttgcgtggtc 1380 cccggttccg gctttggaca gaaggagaac acgctccact tccgcacaac cttccttgcc 1440 cccggcactg actgggtcga gcggatcgtc aagttccacg ccgagttcat ggccaagtat 1500 aaatag 1506 <210> 38 <211> 501 <212> PRT <213> Aspergillus fumigatus <400> 38 Met Ile Thr Glu Pro Thr Met Thr Val Pro Tyr Thr Thr Lys Arg Thr 1 5 10 15 Ala Ser Asp Leu Gly Pro Arg Arg Leu Arg Ala Asp Asn Ile Asn Pro 20 25 30 Asn Val Lys Ala Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys 35 40 45 Ala Glu Glu Tyr Arg Val Arg Leu Ala Lys Gly Asp Lys Ser Leu Pro 50 55 60 Phe Asp Ser Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp 65 70 75 80 Gln Lys Pro Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Leu Glu Asn 85 90 95 Thr Ala Leu Leu Glu Lys Pro Glu Val Leu Arg Ser Ser Phe Gly Tyr 100 105 110 Asn Gln Asp Val Ile Asp Arg Ala Lys Lys Leu Leu Ala Asp Ile Gln 115 120 125 Ser Val Gly Ala Tyr Ser His Ser Gln Gly Ala Pro Val Ile Arg Glu 130 135 140 Ser Val Ala Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asn Pro 145 150 155 160 Gln Asp Leu Tyr Leu Cys Ala Gly Ala Ser Ser Gly Val Ser Thr Leu 165 170 175 Leu Asn Val Ile Cys Asn Gly Pro Thr Ala Gly Val Leu Val Pro Ile 180 185 190 Pro Gln Tyr Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln 195 200 205 Cys Val Pro Tyr His Leu Glu Glu Asp Lys Ala Trp Gly Thr Asp Val 210 215 220 Glu Ala Ile Arg Gln Ser Leu Val Arg Ala Lys Ala Glu Gly Thr Glu 225 230 235 240 Val Arg Ala Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser 245 250 255 Leu Ser Pro Glu Asp Ile Lys Ser Val Leu Asp Ile Ala Ala Glu Glu 260 265 270 Lys Leu Val Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Val 275 280 285 Gly Glu Phe Thr Ser Phe Lys Lys Arg Leu Arg Gln Leu Gln Gln Glu 290 295 300 Val Pro Gly Lys Tyr Asp Asn Val Glu Leu Ala Ser Leu His Ser Val 305 310 315 320 Ser Lys Gly Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu 325 330 335 Leu Val Gly Phe Asp Pro Leu Val Ala Ala Glu Ile Tyr Lys Phe Val 340 345 350 Ser Ile Met Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Val Glu Leu 355 360 365 Met Val Asn Pro Pro Lys Lys Gly Glu Pro Ser Tyr Glu Leu Tyr Gln 370 375 380 Lys Glu Tyr Asn Ser Ile Ser Asp Gly Leu His Lys Arg Ala Leu Ala 385 390 395 400 Leu Tyr Glu Ala Phe Lys Gln Met Glu Gly Val Glu Cys Gln Glu Pro 405 410 415 Gln Gly Ala Met Tyr Leu Phe Pro Ser Ile Thr Leu Pro Pro Lys Ala 420 425 430 Val Glu Ala Ala Ala Ala Glu Gly Arg Asn Ala Asp Glu Phe Tyr Cys 435 440 445 Leu Arg Leu Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly 450 455 460 Phe Gly Gln Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala 465 470 475 480 Pro Gly Thr Asp Trp Val Glu Arg Ile Val Lys Phe His Ala Glu Phe 485 490 495 Met Ala Lys Tyr Lys 500 <210> 39 <211> 1497 <212> DNA <213> Aspergillus oryzae <400> 39 atggcgactc agactacagt gtcctacact actacacgca ccttgtccac cccggctcgt 60 tgcctgaacc ctgataacat caacccccac gtcacggagg ccaagtatgc cgtccgtggt 120 gagcttgctg tcaaggccga ggagtaccgc gtgaaactgg ccaatggaga caaatcgtta 180 cctttcgaca gtgtcatctt tgccaacatc ggcaatcccc aacagctcga ccagaaaccc 240 atcaccttct tccgccaagt actcagtctc ctcgagaacc ctcaactgtt gaacaacacg 300 gaagcacttc gtacatcctt tttttatgaa caagatgtcg ttgaccgggc caagaagctc 360 ctcgcggatg tccagagcgt tggtgcttac agtcacagcc agggagcgcc tgtgatccgc 420 caaagtatcg ccaaattcat tgaggagcgt gatggattcc cggccaaccc tcaggatttg 480 ttctgctgcg ctggtgcctc gtctggcgtc agcaccattc tcaatatcat ctgcaacggc 540 ccccaggccg gtgtcctcgt ccctattccg caataccctc tttacactgc caccctttct 600 ctcctgaatg cgcaatgtgt accctacctc ctcgaagagc aaaaggcttg gggtaccgat 660 gtgactgcca tccgtaactc gttggcgcag gcccggtcta ccggcactga cgttcgttcg 720 attgtggtca tcaaccccgg taaccctact ggtgcctctt tgagcgccga ggatatcaag 780 aatgttcttg accttgctgc ggaggagaag cttgttgtta ttgcggacga ggtttaccag 840 acgaacgttt tcgagggcga gttcatttcg ttcaagaaga ggcttcgtca gctgcaacag 900 gagacaccag gcaagtatga ttatgtggag ttggtctctc ttcacagtgt gtctaaaggt 960 atggtgggcg agtgtggcca ccgtggtggc tactttgagc tggttggatt cgaccctgag 1020 gttcaggccc agatctacaa gcttgtgagc atcggacttt gcccaccagt cattggacag 1080 tgtttgcttg agcttatggt gaacccaccc aaggagggcg aaggcagcta tgagctgtac 1140 cagaaggagt acaatggaat cagcgaggga ctgcacaagc gcgcctttgc cttatacgag 1200 gccttccaac agatggaggg cgttgagtgt cagaaacctc agggtgccat gtatctcttc 1260 cccaccatca ctctcccacc caaggccatt gaggctgcca aggctgagaa ccgtgccgcc 1320 gatgagttct actgcttgcg tctcctcgac gctaccggtg tctgtgttgt ccctggctcc 1380 ggcttcggcc agaaggagaa cactctgcac ttccgcacaa ctttcctggc ccctggcact 1440 gattgggttg aacggatcgt caagttccac tccgaattta tggccaagta caaataa 1497 <210> 40 <211> 498 <212> PRT <213> Aspergillus oryzae <400> 40 Met Ala Thr Gln Thr Thr Val Ser Tyr Thr Thr Thr Arg Thr Leu Ser 1 5 10 15 Thr Pro Ala Arg Cys Leu Asn Pro Asp Asn Ile Asn Pro His Val Thr 20 25 30 Glu Ala Lys Tyr Ala Val Arg Gly Glu Leu Ala Val Lys Ala Glu Glu 35 40 45 Tyr Arg Val Lys Leu Ala Asn Gly Asp Lys Ser Leu Pro Phe Asp Ser 50 55 60 Val Ile Phe Ala Asn Ile Gly Asn Pro Gln Gln Leu Asp Gln Lys Pro 65 70 75 80 Ile Thr Phe Phe Arg Gln Val Leu Ser Leu Leu Glu Asn Pro Gln Leu 85 90 95 Leu Asn Asn Thr Glu Ala Leu Arg Thr Ser Phe Phe Tyr Glu Gln Asp 100 105 110 Val Val Asp Arg Ala Lys Lys Leu Leu Ala Asp Val Gln Ser Val Gly 115 120 125 Ala Tyr Ser His Ser Gln Gly Ala Pro Val Ile Arg Gln Ser Ile Ala 130 135 140 Lys Phe Ile Glu Glu Arg Asp Gly Phe Pro Ala Asn Pro Gln Asp Leu 145 150 155 160 Phe Cys Cys Ala Gly Ala Ser Ser Gly Val Ser Thr Ile Leu Asn Ile 165 170 175 Ile Cys Asn Gly Pro Gln Ala Gly Val Leu Val Pro Ile Pro Gln Tyr 180 185 190 Pro Leu Tyr Thr Ala Thr Leu Ser Leu Leu Asn Ala Gln Cys Val Pro 195 200 205 Tyr Leu Leu Glu Glu Gln Lys Ala Trp Gly Thr Asp Val Thr Ala Ile 210 215 220 Arg Asn Ser Leu Ala Gln Ala Arg Ser Thr Gly Thr Asp Val Arg Ser 225 230 235 240 Ile Val Val Ile Asn Pro Gly Asn Pro Thr Gly Ala Ser Leu Ser Ala 245 250 255 Glu Asp Ile Lys Asn Val Leu Asp Leu Ala Ala Glu Glu Lys Leu Val 260 265 270 Val Ile Ala Asp Glu Val Tyr Gln Thr Asn Val Phe Glu Gly Glu Phe 275 280 285 Ile Ser Phe Lys Lys Arg Leu Arg Gln Leu Gln Gln Glu Thr Pro Gly 290 295 300 Lys Tyr Asp Tyr Val Glu Leu Val Ser Leu His Ser Val Ser Lys Gly 305 310 315 320 Met Val Gly Glu Cys Gly His Arg Gly Gly Tyr Phe Glu Leu Val Gly 325 330 335 Phe Asp Pro Glu Val Gln Ala Gln Ile Tyr Lys Leu Val Ser Ile Gly 340 345 350 Leu Cys Pro Pro Val Ile Gly Gln Cys Leu Leu Glu Leu Met Val Asn 355 360 365 Pro Pro Lys Glu Gly Glu Gly Ser Tyr Glu Leu Tyr Gln Lys Glu Tyr 370 375 380 Asn Gly Ile Ser Glu Gly Leu His Lys Arg Ala Phe Ala Leu Tyr Glu 385 390 395 400 Ala Phe Gln Gln Met Glu Gly Val Glu Cys Gln Lys Pro Gln Gly Ala 405 410 415 Met Tyr Leu Phe Pro Thr Ile Thr Leu Pro Pro Lys Ala Ile Glu Ala 420 425 430 Ala Lys Ala Glu Asn Arg Ala Ala Asp Glu Phe Tyr Cys Leu Arg Leu 435 440 445 Leu Asp Ala Thr Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly Gln 450 455 460 Lys Glu Asn Thr Leu His Phe Arg Thr Thr Phe Leu Ala Pro Gly Thr 465 470 475 480 Asp Trp Val Glu Arg Ile Val Lys Phe His Ser Glu Phe Met Ala Lys 485 490 495 Tyr Lys <210> 41 <211> 1542 <212> DNA <213> Cryptococcus neoformans <400> 41 atgcccagac ttagcaacgt ctattgtccc aaatcactct tacaacgtca gaccatccaa 60 atcaggtcat tcagtcagac tatgtcacct ttcaaacccg cgcttactct tgataccatc 120 aaccccgcgg ttcaggctgt tcactatgct gtccgaggcg agctcgcgat caaggcggac 180 aaatatgtcc aagtccttgc cgatataact cacaagcctt tgccgtttga aaagatcgtc 240 actgccaaca tcggtaatcc ccaacaacaa ggtcttgatc aagttcctct cacttattgg 300 cgacaaatta tttccttatt ggagtatccc gatctgatgc agaaacatga gcagttggcc 360 aagcagattt accctggaga tgtgattgag cgagccaggg cgttacataa cgaaattgga 420 agtacgggtg cgtacactca ttccaagggt gtgttgggta tcagaaagag agtcgccaag 480 tttattgaag aacgcgacgg ttacccggcg gaccctcaaa atatcttcct caccgccggt 540 gcttctgccg gtgttgcttc gatccttggt gtcgccctcc gcagaggtga tggctgcatg 600 atccccatcc cccaatatcc cctctatacc gccaccctcg cttacctcga gtctgagcct 660 ctgccatact acctttctga agcggacgac tggtcgatga accacgattc tttgctcaag 720 agcgtggagg aaggcaagaa gaagggtatc cccatcaagg cgcttgtaat cattaacccc 780 ggaaacccta ccggcgcatg tttgagccaa gaggcgatgg aggcggttgt gcatctctgt 840 tatgaggaag gtatcgtcct cctcgcagac gaggtttacc agatgaacgt ctttgacccc 900 gaacagcgac cgttcatttc tttcaaaaag gttttgatgg atatgcccaa ggagatcagg 960 gaaagtgtgg aactggtatc tttccattcg atctcaaaag gtgttagtgg agaatgtgga 1020 aggagaggtg gatactttga atgtgtcaac attgataagg atgtgatgga ccaggtttac 1080 aagatggcga gtgtcacttt atgtcctccc gtctcaggcc agatcggtgt cgacctcatg 1140 gtctcccctc cgaaacccgg agacgaatct taccccttat ggaaagaaga aaccgatctg 1200 atccaaaaca atctcaagtc ccgatcatat ctcatggctg agcatttcaa caaaatggaa 1260 ggtgtttctt gcaacaatgc ggaaggagcc atgtacttgt tcccgaggat taatatccct 1320 cccaaagctg tagaggcggc gaagaagttg ggtaaggaac cggatgtgat gtatgctttg 1380 gatcttcttg atgcgaccgg tatctgtgcg gtggcaggca gcggttttgg ccaagaaccg 1440 gggacgttcc atttgcgagt gactgccctg tgtcccgata ctgctgaatt tatcggtcga 1500 ttccaaaagt tcaacaagga atttatggaa aagtatgcct aa 1542 <210> 42 <211> 480 <212> PRT <213> Cryptococcus neoformans <400> 42 Met Pro Arg Leu Ser Asn Val Tyr Cys Pro Lys Ser Leu Leu Gln Arg 1 5 10 15 Gln Thr Ile Gln Ile Arg Ser Phe Ser Gln Thr Met Ser Pro Phe Lys 20 25 30 Pro Ala Leu Thr Leu Asp Thr Ile Asn Pro Ala Val Gln Ala Val His 35 40 45 Tyr Ala Val Arg Gly Glu Leu Ala Ile Lys Ala Asp Lys Tyr Val Gln 50 55 60 Val Leu Ala Asp Ile Thr His Lys Pro Leu Pro Phe Glu Lys Ile Val 65 70 75 80 Thr Ala Asn Ile Gly Asn Pro Gln Gln Gln Gly Leu Asp Gln Val Pro 85 90 95 Leu Thr Tyr Trp Arg Gln Ile Ile Ser Leu Leu Glu Tyr Pro Asp Leu 100 105 110 Met Gln Lys His Glu Gln Leu Ala Lys Gln Ile Tyr Pro Gly Asp Val 115 120 125 Ile Glu Arg Ala Arg Ala Leu His Asn Glu Ile Gly Ser Thr Gly Ala 130 135 140 Tyr Thr His Ser Lys Gly Val Leu Gly Ile Arg Lys Arg Val Ala Lys 145 150 155 160 Phe Ile Glu Glu Arg Asp Gly Tyr Pro Ala Asp Pro Gln Asn Ile Phe 165 170 175 Leu Thr Ala Gly Ala Ser Ala Gly Val Ala Ser Ile Leu Gly Val Ala 180 185 190 Leu Arg Arg Gly Asp Gly Cys Met Ile Pro Ile Pro Gln Tyr Pro Leu 195 200 205 Tyr Thr Ala Thr Leu Ala Tyr Leu Glu Ser Glu Pro Leu Pro Tyr Tyr 210 215 220 Leu Ser Glu Ala Asp Asp Trp Ser Met Asn His Asp Ser Leu Leu Lys 225 230 235 240 Ser Val Glu Glu Gly Lys Lys Lys Gly Ile Pro Ile Lys Ala Leu Val 245 250 255 Ile Ile Asn Pro Gly Asn Pro Thr Gly Ala Cys Leu Ser Gln Glu Ala 260 265 270 Met Glu Ala Val Val His Leu Cys Tyr Glu Glu Gly Ile Val Leu Leu 275 280 285 Ala Asp Glu Val Tyr Gln Met Asn Val Phe Asp Pro Glu Gln Arg Pro 290 295 300 Phe Ile Ser Phe Lys Lys Val Leu Met Asp Met Pro Lys Glu Ile Arg 305 310 315 320 Glu Ser Val Glu Leu Val Ser Phe His Ser Ile Ser Lys Gly Val Ser 325 330 335 Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Glu Cys Val Asn Ile Asp 340 345 350 Lys Asp Val Met Asp Gln Val Tyr Lys Met Ala Ser Val Thr Leu Cys 355 360 365 Pro Pro Val Ser Gly Gln Ile Gly Val Asp Leu Met Val Ser Pro Pro 370 375 380 Lys Pro Gly Asp Glu Ser Tyr Pro Leu Trp Lys Glu Glu Thr Asp Leu 385 390 395 400 Ile Gln Asn Asn Leu Lys Ser Arg Ser Tyr Leu Met Ala Glu His Phe 405 410 415 Asn Lys Met Glu Gly Val Ser Cys Asn Asn Ala Glu Gly Ala Met Tyr 420 425 430 Leu Phe Pro Arg Ile Asn Ile Pro Pro Lys Ala Val Glu Ala Ala Lys 435 440 445 Lys Leu Gly Lys Glu Pro Asp Val Met Tyr Ala Leu Asp Leu Leu Asp 450 455 460 Ala Thr Gly Ile Cys Ala Val Ala Gly Ser Gly Phe Gly Gln Glu Pro 465 470 475 480 <210> 43 <211> 1605 <212> DNA <213> Dictyostelium discoideum <400> 43 atgttcaaaa gaagtttaaa agttttatta tcaaatccac ccatcaacag agtaaagccc 60 tcttcaacaa ttattcaacc actttcaaat actactacaa caacaataat taataataat 120 aatataacta attttgaaaa aatgacacat aaaaaatcta tgacaattga taatatttgc 180 caaaatgtaa gaaatgcaca atatgcagta cgtggtgaat tagttattcg tgcagaagca 240 atttcacatc aattacaaaa acaaaaaaca gaaggcacaa aaacattacc atttgaagag 300 attgtctatt gtaatattgg taatccacaa caattgaaac aaaaaccatt aacttatttc 360 cgtcaagttg tatcattagt tgaatgtcca gatttattag ataatccata cgttgaaaag 420 atatatccag ccgatgttat ctcacgtgct aaagagatat taggatcaat taataataca 480 acaggtgcct attccaatag tcaaggtatt ggtttagttt taagatcagt tgcagatttc 540 atagagagac gtgatggaca taaatctgat ccatccgaaa ttttccttac agatggtgca 600 tcagttggtg tacaacgtat tttgaaactt ttaattaaag atcgttcaga cggtatctta 660 attccaattc cacaatatcc actctacagt gccaccattg aattatataa tggcagtcaa 720 ttagggtacc tattaaatga agagaaaggt tggtcactcg agatctccca attggagcat 780 tcctacaatg atgcagtttc aaagggtatt aatccacgtg cactcgttat catcaatcca 840 ggtaatccaa ctggtcaatg tttagataga gcaaatatgg aagagattgt caagttttgt 900 ttagaaaaga atgtagtatt attggctgat gaagtctatc aagagaatgt ttatgtcaaa 960 gagagtaaac cattcatctc attcaaaaag gttgtcaaag atatgggtgg tgattatgca 1020 gatttagaga tggtttcatt ccattcagtt agtaaaggtt tcgttggtga atgtggtaaa 1080 cgtggtggtt atatggaatt aaatggtgtc actcaagatg ttaaagctga aatttataaa 1140 ctcgcatcaa ttggtttatg tccaaatgtt attggtcaat tggttgttga tttaatggtt 1200 cgtccaccag ttgctggtga acaatcacat gatctctacc ttaaagaaag agataatatc 1260 tatgaatctt taaaaaaacg tgcaaatctc ttaacaaatg ctttaaataa tcttgaaggt 1320 gtaacttgta atccatcaga aggtgcaatg tatgctttcc cacaaattcg tcttccagct 1380 aaagctgtag aatatgcaaa ttcaattggt aaagcaccag atgcttacta ttgtattcaa 1440 ttactcgaag ccactggtat ctgtgttgta ccaggtagtg gtttcggtca aaaagatggt 1500 acttggcatt ttagaactac cttcttacct tctgaagaag caattgaagg tgtttgtaag 1560 agaatcgctg atttccatca atcatttatg aataaatata aataa 1605 <210> 44 <211> 534 <212> PRT <213> Dictyostelium discoideum <400> 44 Met Phe Lys Arg Ser Leu Lys Val Leu Leu Ser Asn Pro Pro Ile Asn 1 5 10 15 Arg Val Lys Pro Ser Ser Thr Ile Ile Gln Pro Leu Ser Asn Thr Thr 20 25 30 Thr Thr Thr Ile Ile Asn Asn Asn Asn Ile Thr Asn Phe Glu Lys Met 35 40 45 Thr His Lys Lys Ser Met Thr Ile Asp Asn Ile Cys Gln Asn Val Arg 50 55 60 Asn Ala Gln Tyr Ala Val Arg Gly Glu Leu Val Ile Arg Ala Glu Ala 65 70 75 80 Ile Ser His Gln Leu Gln Lys Gln Lys Thr Glu Gly Thr Lys Thr Leu 85 90 95 Pro Phe Glu Glu Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Gln Leu 100 105 110 Lys Gln Lys Pro Leu Thr Tyr Phe Arg Gln Val Val Ser Leu Val Glu 115 120 125 Cys Pro Asp Leu Leu Asp Asn Pro Tyr Val Glu Lys Ile Tyr Pro Ala 130 135 140 Asp Val Ile Ser Arg Ala Lys Glu Ile Leu Gly Ser Ile Asn Asn Thr 145 150 155 160 Thr Gly Ala Tyr Ser Asn Ser Gln Gly Ile Gly Leu Val Leu Arg Ser 165 170 175 Val Ala Asp Phe Ile Glu Arg Arg Asp Gly His Lys Ser Asp Pro Ser 180 185 190 Glu Ile Phe Leu Thr Asp Gly Ala Ser Val Gly Val Gln Arg Ile Leu 195 200 205 Lys Leu Leu Ile Lys Asp Arg Ser Asp Gly Ile Leu Ile Pro Ile Pro 210 215 220 Gln Tyr Pro Leu Tyr Ser Ala Thr Ile Glu Leu Tyr Asn Gly Ser Gln 225 230 235 240 Leu Gly Tyr Leu Leu Asn Glu Glu Lys Gly Trp Ser Leu Glu Ile Ser 245 250 255 Gln Leu Glu His Ser Tyr Asn Asp Ala Val Ser Lys Gly Ile Asn Pro 260 265 270 Arg Ala Leu Val Ile Ile Asn Pro Gly Asn Pro Thr Gly Gln Cys Leu 275 280 285 Asp Arg Ala Asn Met Glu Glu Ile Val Lys Phe Cys Leu Glu Lys Asn 290 295 300 Val Val Leu Leu Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Val Lys 305 310 315 320 Glu Ser Lys Pro Phe Ile Ser Phe Lys Lys Val Val Lys Asp Met Gly 325 330 335 Gly Asp Tyr Ala Asp Leu Glu Met Val Ser Phe His Ser Val Ser Lys 340 345 350 Gly Phe Val Gly Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Leu Asn 355 360 365 Gly Val Thr Gln Asp Val Lys Ala Glu Ile Tyr Lys Leu Ala Ser Ile 370 375 380 Gly Leu Cys Pro Asn Val Ile Gly Gln Leu Val Val Asp Leu Met Val 385 390 395 400 Arg Pro Pro Val Ala Gly Glu Gln Ser His Asp Leu Tyr Leu Lys Glu 405 410 415 Arg Asp Asn Ile Tyr Glu Ser Leu Lys Lys Arg Ala Asn Leu Leu Thr 420 425 430 Asn Ala Leu Asn Asn Leu Glu Gly Val Thr Cys Asn Pro Ser Glu Gly 435 440 445 Ala Met Tyr Ala Phe Pro Gln Ile Arg Leu Pro Ala Lys Ala Val Glu 450 455 460 Tyr Ala Asn Ser Ile Gly Lys Ala Pro Asp Ala Tyr Tyr Cys Ile Gln 465 470 475 480 Leu Leu Glu Ala Thr Gly Ile Cys Val Val Pro Gly Ser Gly Phe Gly 485 490 495 Gln Lys Asp Gly Thr Trp His Phe Arg Thr Thr Phe Leu Pro Ser Glu 500 505 510 Glu Ala Ile Glu Gly Val Cys Lys Arg Ile Ala Asp Phe His Gln Ser 515 520 525 Phe Met Asn Lys Tyr Lys 530 <210> 45 <211> 1710 <212> DNA <213> Trypanosoma brucei <400> 45 atggatatat atttattttc cgtttggttt atacagaacg aggaaaagtg tttggatttt 60 ctaaacatta gtaagaagaa caaagccaag tcgagcgtac aacacattgg cgggttagcg 120 cgaaaacaga atcctgaacc cacaaaatca atttttgtgt cgagatacgg agcacgatca 180 ctgaagacct cgacaatgaa aggtaaccag gaattttttc agaagggtgg ggcccacgtt 240 tccaagggcg ttcacatcaa cccacgcgta aagaaggctc agtatgccgt gcgcgggctt 300 gtgccgatgc gagccgacga aatcagggag gaaatccgtt caggcacggg gaagtcgaag 360 ttctccttca acgaactggt ttactgcaac attggcaacc cccaagccct ggagcagaag 420 ccgcttacct ttcaccgcca agtgatgtcg cttatcgatg ctccatttct gcttgaggat 480 aacgccgtcg tctctcgata tccctctgat gctgtttccc gtgcgcgtct ctacttgggc 540 cacatcggcc aacgtactgg cgcctacacg gactccgcag gctatgcctt tgtacgtgac 600 atcgtcgcgc agtatgtgaa tgagcgtgac gcctatgtaa aaccgcttca ggaggcatcg 660 tcgattgtgc ttacagacgg cgcaagcact ggtgtgcgca taatcttaca gacgcttgtg 720 ggcgatgaga aggacgctgt gatgattccc atcccgcagt atccgctgta cacggcacag 780 attgcattgt tgggaggtac ccccgcgatg tattaccttc gtgagagcga aggctgggcg 840 ctgaacgttg gagagctcga ggcagtatac aaagactgtg tggcgaacgg aaacgcgacg 900 ccccgcgtgc tcgtcgtgat taaccctggt aaccctacag gtggcgtgtt ggagcgcact 960 gtgatggagg aggttgccaa gttctgttgc gatcacggtg ttgtgctcat ggccgatgag 1020 gtttaccagg aaaatatcta caccgcgacc aagcggtttg agagttttcg gaagattgtg 1080 ctcgaacttc caccaccata caacaccgac accgtgcttg tttccttgca ctccgtgtcg 1140 aagggtatta tcggtgagtg tggtcgccgt ggtgggtact tcacactcac aaacgctccg 1200 cctgagttag tggagcaggt gatgaaattg tgctctatta acctctgcag caacgtcaac 1260 ggtcagctta tgacggcact gatgtgctcc ccgccgaaac ctggcgatgc gagcttcgac 1320 cactacacgg cagagtacag tggcattttt gaaagcctta agcgccgtgc tgacctgctt 1380 gcaaaggaac tgaacaacat ccgtggtttc aagtcccaat ctgttgaggg cgccatgtac 1440 gctttcccca ctattgagct ccctcccaag tacgtgaagc acaacgatga gatgaactca 1500 aaggagggcc gacagcttgc gccggacgcg cgttgggcac tggagcttct cgagagcacc 1560 ggtattgttg tggtgccggg ttctggcttt gggcagcagc ctgggacact gcacttccgc 1620 acgacgatcc tcccacccga agcgcatatg gagcgtgtgg tgaaggctct gcgccagttc 1680 caggagggca tttgggccaa gtatgcataa 1710 <210> 46 <211> 569 <212> PRT <213> Trypanosoma brucei <400> 46 Met Asp Ile Tyr Leu Phe Ser Val Trp Phe Ile Gln Asn Glu Glu Lys 1 5 10 15 Cys Leu Asp Phe Leu Asn Ile Ser Lys Lys Asn Lys Ala Lys Ser Ser 20 25 30 Val Gln His Ile Gly Gly Leu Ala Arg Lys Gln Asn Pro Glu Pro Thr 35 40 45 Lys Ser Ile Phe Val Ser Arg Tyr Gly Ala Arg Ser Leu Lys Thr Ser 50 55 60 Thr Met Lys Gly Asn Gln Glu Phe Phe Gln Lys Gly Gly Ala His Val 65 70 75 80 Ser Lys Gly Val His Ile Asn Pro Arg Val Lys Lys Ala Gln Tyr Ala 85 90 95 Val Arg Gly Leu Val Pro Met Arg Ala Asp Glu Ile Arg Glu Glu Ile 100 105 110 Arg Ser Gly Thr Gly Lys Ser Lys Phe Ser Phe Asn Glu Leu Val Tyr 115 120 125 Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys Pro Leu Thr Phe 130 135 140 His Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe Leu Leu Glu Asp 145 150 155 160 Asn Ala Val Val Ser Arg Tyr Pro Ser Asp Ala Val Ser Arg Ala Arg 165 170 175 Leu Tyr Leu Gly His Ile Gly Gln Arg Thr Gly Ala Tyr Thr Asp Ser 180 185 190 Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Gln Tyr Val Asn Glu 195 200 205 Arg Asp Ala Tyr Val Lys Pro Leu Gln Glu Ala Ser Ser Ile Val Leu 210 215 220 Thr Asp Gly Ala Ser Thr Gly Val Arg Ile Ile Leu Gln Thr Leu Val 225 230 235 240 Gly Asp Glu Lys Asp Ala Val Met Ile Pro Ile Pro Gln Tyr Pro Leu 245 250 255 Tyr Thr Ala Gln Ile Ala Leu Leu Gly Gly Thr Pro Ala Met Tyr Tyr 260 265 270 Leu Arg Glu Ser Glu Gly Trp Ala Leu Asn Val Gly Glu Leu Glu Ala 275 280 285 Val Tyr Lys Asp Cys Val Ala Asn Gly Asn Ala Thr Pro Arg Val Leu 290 295 300 Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val Leu Glu Arg Thr 305 310 315 320 Val Met Glu Glu Val Ala Lys Phe Cys Cys Asp His Gly Val Val Leu 325 330 335 Met Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Thr Ala Thr Lys Arg 340 345 350 Phe Glu Ser Phe Arg Lys Ile Val Leu Glu Leu Pro Pro Pro Tyr Asn 355 360 365 Thr Asp Thr Val Leu Val Ser Leu His Ser Val Ser Lys Gly Ile Ile 370 375 380 Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Thr Leu Thr Asn Ala Pro 385 390 395 400 Pro Glu Leu Val Glu Gln Val Met Lys Leu Cys Ser Ile Asn Leu Cys 405 410 415 Ser Asn Val Asn Gly Gln Leu Met Thr Ala Leu Met Cys Ser Pro Pro 420 425 430 Lys Pro Gly Asp Ala Ser Phe Asp His Tyr Thr Ala Glu Tyr Ser Gly 435 440 445 Ile Phe Glu Ser Leu Lys Arg Arg Ala Asp Leu Leu Ala Lys Glu Leu 450 455 460 Asn Asn Ile Arg Gly Phe Lys Ser Gln Ser Val Glu Gly Ala Met Tyr 465 470 475 480 Ala Phe Pro Thr Ile Glu Leu Pro Pro Lys Tyr Val Lys His Asn Asp 485 490 495 Glu Met Asn Ser Lys Glu Gly Arg Gln Leu Ala Pro Asp Ala Arg Trp 500 505 510 Ala Leu Glu Leu Leu Glu Ser Thr Gly Ile Val Val Val Pro Gly Ser 515 520 525 Gly Phe Gly Gln Gln Pro Gly Thr Leu His Phe Arg Thr Thr Ile Leu 530 535 540 Pro Pro Glu Ala His Met Glu Arg Val Val Lys Ala Leu Arg Gln Phe 545 550 555 560 Gln Glu Gly Ile Trp Ala Lys Tyr Ala 565 <210> 47 <211> 1494 <212> DNA <213> Leishmania major <400> 47 atgctgcgcc acgctgctcg ttgcttttca ccaaggcaat gctacgtaag ccctcgcgtc 60 atggaggcgg aatacgccgt gcgggggctg atcccggcgc gcgcggatga gatcaaggcg 120 gacttggcta caggccacgg cacctactcg ttcgaaagcc tcgtgtactg caacatcggc 180 aacccgcagt cagtggggca gatgccgcta acgttctacc gacaagtgat ggtgctcgtc 240 gatgcgccgt tcctgctgga ggatgcggaa atcgttgcgc ggctgccaga ggacgccgtt 300 gcacgcgcgc gcaggtacct ttcggagatc gggacgggca ccggcgcgta cacagagtct 360 ttcggcttcc ggtttgcccg cgctgccgtt gcggcgcaca tcaacgagct cgaccatggc 420 gtgagcccgg ctgcgacggt gaacgatatc tgtctgacag acggcgcgag catgggtgcg 480 aagctgttcc tgcagctcct tgtgggcggc gcgagcgatg ctgtgatgat cccggttccg 540 cagtatccgc tatactctgc gcagattgct ttacttggcg gggtgaaggt gccctacggc 600 ctgcacgagt ctgaggggtg ggtaatgaag ttgtcggacc ttgttgccgc gtacgagcgg 660 tgcgtgaccg agagcggcgc gacgccgcgc ttgtttgtgt gcatcaaccc cgggaacccg 720 acggggaacg tactggagcg ctgcgtgatg gaggacgtcg tgcggttctg ccacgagcgc 780 ggcatgctgc tgcttgcaga cgaggtgtac caggagaacg tgtacgacac gcgacgccgg 840 tttttgagct tccgcgaggt tgtgcttggg atgcctgagc cgtactgctc ggagacgatg 900 cttgtgtcac tgcactcgac atcgaaaggg gtgattggtg aatgcgggcg gcgcggcggg 960 tatttctgca tgacgaacct gcctgctgcg ctgcgccagc aggttgtgaa gctgtgctcg 1020 atcaacctgt gtgcaaacgt gaacgggcag ttgatgactg cgctgatgtg ctcgccgccg 1080 cgcgagggcg aagcgagcta cgcgctgcac cggcgcgagt acgacgagat ctttacgggc 1140 atgaaggagc gcgctgagct gctggcgcgc gagcttgggg ctgtgcgcgg gctctcgtgc 1200 caaccggtgg agggcgcaat gtacgcgttc ccgagaattg tgttgcctga gcggtacgcc 1260 cagcggaacg aggagctgaa cgcgaaggag ggtcggcagc ttgcgctgga cgcgcggtgg 1320 gcgctggagc tgctggagtc gagcgggatc gttgttgtgc ccgggtctgg gttcgggcag 1380 gaacccggga cgctgcactt tcggatcacg attctcccgc ctcttgaaca gattgatcgg 1440 atggtgcgtg cgatccgcga gttccaggac cggatctacg agcagtacgc ttaa 1494 <210> 48 <211> 497 <212> PRT <213> Leishmania major <400> 48 Met Leu Arg His Ala Ala Arg Cys Phe Ser Pro Arg Gln Cys Tyr Val 1 5 10 15 Ser Pro Arg Val Met Glu Ala Glu Tyr Ala Val Arg Gly Leu Ile Pro 20 25 30 Ala Arg Ala Asp Glu Ile Lys Ala Asp Leu Ala Thr Gly His Gly Thr 35 40 45 Tyr Ser Phe Glu Ser Leu Val Tyr Cys Asn Ile Gly Asn Pro Gln Ser 50 55 60 Val Gly Gln Met Pro Leu Thr Phe Tyr Arg Gln Val Met Val Leu Val 65 70 75 80 Asp Ala Pro Phe Leu Leu Glu Asp Ala Glu Ile Val Ala Arg Leu Pro 85 90 95 Glu Asp Ala Val Ala Arg Ala Arg Arg Tyr Leu Ser Glu Ile Gly Thr 100 105 110 Gly Thr Gly Ala Tyr Thr Glu Ser Phe Gly Phe Arg Phe Ala Arg Ala 115 120 125 Ala Val Ala Ala His Ile Asn Glu Leu Asp His Gly Val Ser Pro Ala 130 135 140 Ala Thr Val Asn Asp Ile Cys Leu Thr Asp Gly Ala Ser Met Gly Ala 145 150 155 160 Lys Leu Phe Leu Gln Leu Leu Val Gly Gly Ala Ser Asp Ala Val Met 165 170 175 Ile Pro Val Pro Gln Tyr Pro Leu Tyr Ser Ala Gln Ile Ala Leu Leu 180 185 190 Gly Gly Val Lys Val Pro Tyr Gly Leu His Glu Ser Glu Gly Trp Val 195 200 205 Met Lys Leu Ser Asp Leu Val Ala Ala Tyr Glu Arg Cys Val Thr Glu 210 215 220 Ser Gly Ala Thr Pro Arg Leu Phe Val Cys Ile Asn Pro Gly Asn Pro 225 230 235 240 Thr Gly Asn Val Leu Glu Arg Cys Val Met Glu Asp Val Val Arg Phe 245 250 255 Cys His Glu Arg Gly Met Leu Leu Leu Ala Asp Glu Val Tyr Gln Glu 260 265 270 Asn Val Tyr Asp Thr Arg Arg Arg Phe Leu Ser Phe Arg Glu Val Val 275 280 285 Leu Gly Met Pro Glu Pro Tyr Cys Ser Glu Thr Met Leu Val Ser Leu 290 295 300 His Ser Thr Ser Lys Gly Val Ile Gly Glu Cys Gly Arg Arg Gly Gly 305 310 315 320 Tyr Phe Cys Met Thr Asn Leu Pro Ala Ala Leu Arg Gln Gln Val Val 325 330 335 Lys Leu Cys Ser Ile Asn Leu Cys Ala Asn Val Asn Gly Gln Leu Met 340 345 350 Thr Ala Leu Met Cys Ser Pro Pro Arg Glu Gly Glu Ala Ser Tyr Ala 355 360 365 Leu His Arg Arg Glu Tyr Asp Glu Ile Phe Thr Gly Met Lys Glu Arg 370 375 380 Ala Glu Leu Leu Ala Arg Glu Leu Gly Ala Val Arg Gly Leu Ser Cys 385 390 395 400 Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Arg Ile Val Leu Pro 405 410 415 Glu Arg Tyr Ala Gln Arg Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg 420 425 430 Gln Leu Ala Leu Asp Ala Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser 435 440 445 Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Glu Pro Gly Thr 450 455 460 Leu His Phe Arg Ile Thr Ile Leu Pro Pro Leu Glu Gln Ile Asp Arg 465 470 475 480 Met Val Arg Ala Ile Arg Glu Phe Gln Asp Arg Ile Tyr Glu Gln Tyr 485 490 495 Ala <210> 49 <211> 1455 <212> DNA <213> Entamoeba histolytica <400> 49 atgaaagcat tttcaagaca aagtattaat ccttgtatca ttgcaactca atatgctgtt 60 agaggaaaat tagtattaga ggcaaatgag attcaaaaag aaattgaaga agcaagaaaa 120 aaaggaaaaa ataatcctta tccatttgag aaagtagttt attgtaatat tggtaatcca 180 cagatatgta accaacagcc attaacatat ccaaggcaga ttatctcaat agttgaatat 240 cctgagcttt taaatcatac aacccttttt ccgaaagatg ttatcaccca tgctaaaaaa 300 attattaata gtcttggttg tactggaaca agtggtgcat atactaattc tatgggagtt 360 attcaattca gaaaatcaat ttgtaaattt ataaaacata gagatggaac tgctccatcc 420 cctgatgacg tatttataac cgatggagca tctactggaa taaaaatgat tttaaatatg 480 ttgatttcac atcctcttca tggaattatg attcctattc cacaataccc attatacagt 540 gcttcaatat ctcaattcgg aggttttcaa attaattact ttctagatga atcaaaaaaa 600 tggtcaacag atatgacatc cgtaagaaaa gtttatgaac aagcggttga aaaaggtatt 660 caagtgaaag gatttgtttg tattaaccca ggtaatccaa ctggacaagt tcttacagtc 720 caaaatatga aagaaattat agaattttgc tatgaaaaaa aaatttgttt attagctgat 780 gaagtatatc aagagaatat ctacggtgaa ataccattta catcattcag aaaggtattg 840 aagtcaatga gggatgaggt gaaaaatagt gttgagctaa tctcattttt tagtgtttca 900 aaaggatttt atggtgaatg tggaaagcga ggtggatatt tccagataga aaatattaat 960 tcatttgctc gttctcagat gtataaaata gcatctacca atttatgttc aaatgtagtt 1020 ggtcaagaga tggttgaaat aatttgcaac ccaccaaaag aaggtgatga atcttatcca 1080 aaatacatga atgaaaaaat gtctatttta aactctttga aaagaaaagc caagttactc 1140 tattctgttc taaatgagtg tgaaggaatt tcttgtaatg aagctatggg tgctctttat 1200 cttttcccaa agattacatt cccaaacaaa tatattgatg agtgtaaaag aaaggatcaa 1260 aaaccagatg aattgtattg tttaaggatg ttaaaaagta taggggtgtg tgttgttcca 1320 ggatctggtt ttggtcaaaa agataatacg tatcatttta gaattgccat tctaccacca 1380 gaaaatgaaa tacagaatat tgccgtcaaa ataaaaactt ttcatacatc ttttatgaag 1440 gactattgtc actaa 1455 <210> 50 <211> 484 <212> PRT <213> Entamoeba histolytica <400> 50 Met Lys Ala Phe Ser Arg Gln Ser Ile Asn Pro Cys Ile Ile Ala Thr 1 5 10 15 Gln Tyr Ala Val Arg Gly Lys Leu Val Leu Glu Ala Asn Glu Ile Gln 20 25 30 Lys Glu Ile Glu Glu Ala Arg Lys Lys Gly Lys Asn Asn Pro Tyr Pro 35 40 45 Phe Glu Lys Val Val Tyr Cys Asn Ile Gly Asn Pro Gln Ile Cys Asn 50 55 60 Gln Gln Pro Leu Thr Tyr Pro Arg Gln Ile Ile Ser Ile Val Glu Tyr 65 70 75 80 Pro Glu Leu Leu Asn His Thr Thr Leu Phe Pro Lys Asp Val Ile Thr 85 90 95 His Ala Lys Lys Ile Ile Asn Ser Leu Gly Cys Thr Gly Thr Ser Gly 100 105 110 Ala Tyr Thr Asn Ser Met Gly Val Ile Gln Phe Arg Lys Ser Ile Cys 115 120 125 Lys Phe Ile Lys His Arg Asp Gly Thr Ala Pro Ser Pro Asp Asp Val 130 135 140 Phe Ile Thr Asp Gly Ala Ser Thr Gly Ile Lys Met Ile Leu Asn Met 145 150 155 160 Leu Ile Ser His Pro Leu His Gly Ile Met Ile Pro Ile Pro Gln Tyr 165 170 175 Pro Leu Tyr Ser Ala Ser Ile Ser Gln Phe Gly Gly Phe Gln Ile Asn 180 185 190 Tyr Phe Leu Asp Glu Ser Lys Lys Trp Ser Thr Asp Met Thr Ser Val 195 200 205 Arg Lys Val Tyr Glu Gln Ala Val Glu Lys Gly Ile Gln Val Lys Gly 210 215 220 Phe Val Cys Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Thr Val 225 230 235 240 Gln Asn Met Lys Glu Ile Ile Glu Phe Cys Tyr Glu Lys Lys Ile Cys 245 250 255 Leu Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Gly Glu Ile Pro 260 265 270 Phe Thr Ser Phe Arg Lys Val Leu Lys Ser Met Arg Asp Glu Val Lys 275 280 285 Asn Ser Val Glu Leu Ile Ser Phe Phe Ser Val Ser Lys Gly Phe Tyr 290 295 300 Gly Glu Cys Gly Lys Arg Gly Gly Tyr Phe Gln Ile Glu Asn Ile Asn 305 310 315 320 Ser Phe Ala Arg Ser Gln Met Tyr Lys Ile Ala Ser Thr Asn Leu Cys 325 330 335 Ser Asn Val Val Gly Gln Glu Met Val Glu Ile Ile Cys Asn Pro Pro 340 345 350 Lys Glu Gly Asp Glu Ser Tyr Pro Lys Tyr Met Asn Glu Lys Met Ser 355 360 365 Ile Leu Asn Ser Leu Lys Arg Lys Ala Lys Leu Leu Tyr Ser Val Leu 370 375 380 Asn Glu Cys Glu Gly Ile Ser Cys Asn Glu Ala Met Gly Ala Leu Tyr 385 390 395 400 Leu Phe Pro Lys Ile Thr Phe Pro Asn Lys Tyr Ile Asp Glu Cys Lys 405 410 415 Arg Lys Asp Gln Lys Pro Asp Glu Leu Tyr Cys Leu Arg Met Leu Lys 420 425 430 Ser Ile Gly Val Cys Val Val Pro Gly Ser Gly Phe Gly Gln Lys Asp 435 440 445 Asn Thr Tyr His Phe Arg Ile Ala Ile Leu Pro Pro Glu Asn Glu Ile 450 455 460 Gln Asn Ile Ala Val Lys Ile Lys Thr Phe His Thr Ser Phe Met Lys 465 470 475 480 Asp Tyr Cys His <210> 51 <211> 1452 <212> DNA <213> Entamoeba histolytica <400> 51 atgagatcat tcgctagtga aaatattagt ccagatgtag ttgcattcca atttgctgta 60 cgtggtaaaa ttgctattgt ttcagaagaa attgataatg ctattaaaaa agcaaaagca 120 gaaggtaaac caaatcctta tccatttgaa aaagttgtta aatgtaatag tggtaatcct 180 caattattaa atcaaaaacc attaactttt gttagagaaa ttacttctat ggtagaatat 240 cctcctctta cagaacatcc agaacttttc catgctgatg ctgttgctcg tgctaaagaa 300 attattaaag ctactggttg taatggaaca actggtgctt actcaccatc taaaggtctt 360 gcttatgtta gacaaacaat tgcacgtttc ttagaagaaa gagataatgt tccaatgtcc 420 ccagaagata tttatttaac tgatggtgct tctattgcta ttaagattgt tatgcaatta 480 atgctttcac atccacttca tggtattatg attccaaatc cacaatatcc attatatggt 540 gcttgtattc aacaattagg aggaaaaaca tgtcattata atttaaacga agataattat 600 tggttaccag acattaatga tattaaggaa caatatgaaa aatatcagaa tgaaggaatt 660 aaaattaagg cattagttgt tattaatcca ggaaatccat gtggagaagt tttaccagtt 720 gacactataa aagaaattat tagattctgt aacgaaaaga agatttgttt aatggctgat 780 gaagtatatc aagaaaatat ttggactgat gttccattca actcatttag aaaaattctt 840 gctacaatgg aaccagaaat tgcacatgga cttgaattaa tttctttcca ttctatttca 900 aaaggattct atggagaatg tggtaagaga ggaggaatgt ttgcatgtac caatattcca 960 gaatttgctc gtttaatgat gtataaaatt atttctacta ctttatgttc taatgttgta 1020 ggacaagttg taatgtctat aatttgtaat cttccaaaag aaggagaccc atcctatcca 1080 ttatttaaac aagaaagaga tgaaatcctt ggctctttaa aacgtaaagc agaatattta 1140 tgtgatattt tcaataagtg tgaaggtatg tcttgtaata gagctgctgg agctatgtat 1200 cttttcccaa gaattacatt accagaaaaa ttcataaaag aatgtcatga aagacatgaa 1260 gatccaaatg aaacatattg tattgaaatg ttaaaaaaga ctggaattgc tgttgtaaaa 1320 gggtctggat ttggtcagaa aaagggtaca tatcatttta gaattgcttt gttaccacca 1380 gaaaatgaaa ttgaagaagt tggaaaaaga attcaagtat tccataattc ttttattcaa 1440 caatacaagt aa 1452 <210> 52 <211> 483 <212> PRT <213> Entamoeba histolytica <400> 52 Met Arg Ser Phe Ala Ser Glu Asn Ile Ser Pro Asp Val Val Ala Phe 1 5 10 15 Gln Phe Ala Val Arg Gly Lys Ile Ala Ile Val Ser Glu Glu Ile Asp 20 25 30 Asn Ala Ile Lys Lys Ala Lys Ala Glu Gly Lys Pro Asn Pro Tyr Pro 35 40 45 Phe Glu Lys Val Val Lys Cys Asn Ser Gly Asn Pro Gln Leu Leu Asn 50 55 60 Gln Lys Pro Leu Thr Phe Val Arg Glu Ile Thr Ser Met Val Glu Tyr 65 70 75 80 Pro Pro Leu Thr Glu His Pro Glu Leu Phe His Ala Asp Ala Val Ala 85 90 95 Arg Ala Lys Glu Ile Ile Lys Ala Thr Gly Cys Asn Gly Thr Thr Gly 100 105 110 Ala Tyr Ser Pro Ser Lys Gly Leu Ala Tyr Val Arg Gln Thr Ile Ala 115 120 125 Arg Phe Leu Glu Glu Arg Asp Asn Val Pro Met Ser Pro Glu Asp Ile 130 135 140 Tyr Leu Thr Asp Gly Ala Ser Ile Ala Ile Lys Ile Val Met Gln Leu 145 150 155 160 Met Leu Ser His Pro Leu His Gly Ile Met Ile Pro Asn Pro Gln Tyr 165 170 175 Pro Leu Tyr Gly Ala Cys Ile Gln Gln Leu Gly Gly Lys Thr Cys His 180 185 190 Tyr Asn Leu Asn Glu Asp Asn Tyr Trp Leu Pro Asp Ile Asn Asp Ile 195 200 205 Lys Glu Gln Tyr Glu Lys Tyr Gln Asn Glu Gly Ile Lys Ile Lys Ala 210 215 220 Leu Val Val Ile Asn Pro Gly Asn Pro Cys Gly Glu Val Leu Pro Val 225 230 235 240 Asp Thr Ile Lys Glu Ile Ile Arg Phe Cys Asn Glu Lys Lys Ile Cys 245 250 255 Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Ile Trp Thr Asp Val Pro 260 265 270 Phe Asn Ser Phe Arg Lys Ile Leu Ala Thr Met Glu Pro Glu Ile Ala 275 280 285 His Gly Leu Glu Leu Ile Ser Phe His Ser Ile Ser Lys Gly Phe Tyr 290 295 300 Gly Glu Cys Gly Lys Arg Gly Gly Met Phe Ala Cys Thr Asn Ile Pro 305 310 315 320 Glu Phe Ala Arg Leu Met Met Tyr Lys Ile Ile Ser Thr Thr Leu Cys 325 330 335 Ser Asn Val Val Gly Gln Val Val Met Ser Ile Ile Cys Asn Leu Pro 340 345 350 Lys Glu Gly Asp Pro Ser Tyr Pro Leu Phe Lys Gln Glu Arg Asp Glu 355 360 365 Ile Leu Gly Ser Leu Lys Arg Lys Ala Glu Tyr Leu Cys Asp Ile Phe 370 375 380 Asn Lys Cys Glu Gly Met Ser Cys Asn Arg Ala Ala Gly Ala Met Tyr 385 390 395 400 Leu Phe Pro Arg Ile Thr Leu Pro Glu Lys Phe Ile Lys Glu Cys His 405 410 415 Glu Arg His Glu Asp Pro Asn Glu Thr Tyr Cys Ile Glu Met Leu Lys 420 425 430 Lys Thr Gly Ile Ala Val Val Lys Gly Ser Gly Phe Gly Gln Lys Lys 435 440 445 Gly Thr Tyr His Phe Arg Ile Ala Leu Leu Pro Pro Glu Asn Glu Ile 450 455 460 Glu Glu Val Gly Lys Arg Ile Gln Val Phe His Asn Ser Phe Ile Gln 465 470 475 480 Gln Tyr Lys <210> 53 <211> 1482 <212> DNA <213> Trypanosoma cruzi <400> 53 atgtctgggt cacgaaagga aattcgcatc aacccccgtg tggtggcggc agagtatgcg 60 gtgcgtggga tgctccccat gcgtgcggac gagatcaggg cggccctggc gacaccggag 120 gggaaggcca agtacccctt ctccagcatt gtgtactgca acattgggaa cccgcaggca 180 ctggaacaga agccgctgac gttcttccgg caggtgatgt cgctgattga cgcgccgttc 240 ctgctggaga acgagaaggt tacgtcgcag ttcccggcgg atgcggtggc gcgtgcgagg 300 gagtatcttc gccacatcgg cgatcgcacg ggcgcctaca cggactctgc gggctacgcc 360 tttgtccgtg acatcgtggc gcggcaaatc aatgaacgcg accacgagat aaagccgctg 420 gtggacgcat cctctatttt tctgacggac ggcgcgagct cgggcgtgcg tcttttgctg 480 caggttctcg tgggtgacgc gagtgatgcg gtgatggttc ccattccgca gtacccgctg 540 tacacggcgc agcttacgct tcttggcggc acgcccgcga tgtactacct gtgtgagaag 600 gataactggg cactgaacgt ggaggagctg gcgtcggtgt acgacgagtg cgtggcgaag 660 aataatgcga ccccgcgcgt gctcgttgtg atcaaccctg ggaacccgac tggcggcgtg 720 ctggatcgcg acgtgatgga ggccgtggcg aaattctgct gcgaccgcgg cattgtgctg 780 atggcggacg aggtgtacca ggagaacgtg tacgcggcgg gaaagcgttt cttgagcttc 840 cgggaagtgg tgcttgggct gccggcgccg tacaacacgg acacggtgct ggcctcgctg 900 cactcgacgt cgaagggcat cattggtgag tgcgggcgcc gcggcgggta cttctgcctc 960 acaaacttcc ccgcgccggt tcgggagcag gtgttaaaga tgtgctccat ggttccgtgc 1020 agcagcgtga atgggcagtt gatgacggca ctgatgtgct cgccaccgcg gcccggtgac 1080 gcgagctatg agtcatactg ggcggagtac aatgggatct ttgcgagtct aaagaagcgc 1140 gccctgctgc ttgcgaagga gctgagcacg attcgcggtt tttcttgcca gccggtggaa 1200 ggggcgatgt acgcgtttcc gacgattgag ctgccggaga agtactttca gcacaatgag 1260 gagctgaacg cgaaggaggg gcgaaagctt gggcccgaca cgcgatgggc gttggagctt 1320 ctggagagca gcggggttgt tgttgtggcc ggctctgggt ttggtcagca gcccaacacg 1380 ctgcacttcc gcacgacgat cctgccgccg gagcagcaga tggaacggat ggtgaaggcg 1440 atgcgcacat tccaggaggg catttgggca aagtacgggt aa 1482 <210> 54 <211> 493 <212> PRT <213> Trypanosoma cruzi <400> 54 Met Ser Gly Ser Arg Lys Glu Ile Arg Ile Asn Pro Arg Val Val Ala 1 5 10 15 Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg Ala Asp Glu Ile 20 25 30 Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys Tyr Pro Phe Ser 35 40 45 Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys 50 55 60 Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe 65 70 75 80 Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro Ala Asp Ala Val 85 90 95 Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp Arg Thr Gly Ala 100 105 110 Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Arg 115 120 125 Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu Val Asp Ala Ser 130 135 140 Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val Arg Leu Leu Leu 145 150 155 160 Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met Val Pro Ile Pro 165 170 175 Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu Gly Gly Thr Pro 180 185 190 Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala Leu Asn Val Glu 195 200 205 Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys Asn Asn Ala Thr 210 215 220 Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val 225 230 235 240 Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe Cys Cys Asp Arg 245 250 255 Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Ala 260 265 270 Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val Leu Gly Leu Pro 275 280 285 Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu His Ser Thr Ser 290 295 300 Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Cys Leu 305 310 315 320 Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Leu Lys Met Cys Ser 325 330 335 Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met Thr Ala Leu Met 340 345 350 Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu Ser Tyr Trp Ala 355 360 365 Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg Ala Leu Leu Leu 370 375 380 Ala Lys Glu Leu Ser Thr Ile Arg Gly Phe Ser Cys Gln Pro Val Glu 385 390 395 400 Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro Glu Lys Tyr Phe 405 410 415 Gln His Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg Lys Leu Gly Pro 420 425 430 Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser Gly Val Val Val 435 440 445 Val Ala Gly Ser Gly Phe Gly Gln Gln Pro Asn Thr Leu His Phe Arg 450 455 460 Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg Met Val Lys Ala 465 470 475 480 Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr Gly 485 490 <210> 55 <211> 1494 <212> DNA <213> Trypanosoma cruzi <400> 55 atgctgcgca aaactctttt tggattcagg gccattcgca tcaacccccg tgtggtggcg 60 gcagagtatg cggtgcgtgg gatgctccca atgcgtgcgg acgagatcag ggcggccctg 120 gcgacaccgg aggggaaggc caagtatccc ttccccagca ttgtgtactg caacattggg 180 aacccgcagg cactggaaca gaagccgctg acgttcttcc ggcaggtgat gtcgctgatt 240 gacgcgccgt tcctgctgga aaacgagaag gttacgtcgc agtacccggc ggatgcggtg 300 gcgcgtgcga gggagtatct tcgccacatc ggcgatcgca cgggcgccta cacggactct 360 gcgggctacg cctttgtccg tgacatcgtg gcgcggcaaa tcaatgaacg cgaccacgag 420 ataaagccgc tggtggacgc atcctctatt tttctgacgg acggcgcgag ctcgggcgtg 480 cgtcttttgc tgcaggttct cgtgggtgac gcgagtgatg cggtgatggt tcccattccg 540 cagtacccgc tgtacacggc gcagcttacg cttcttggcg gcacgcccgc gatgtactac 600 ctgtgtgaga aggataactg ggcactgaac gtggaggagc tggcgtcggt gtacgacgag 660 tgcgtggcga agaataatgc gactccgcgc gtgctcgttg tgatcaaccc tgggaacccg 720 actggcggcg tgctggatcg cgacgtgatg gaggctgtgg cgaaattctg ctgcgaccgc 780 ggcattgtgc tgatggcgga cgaggtgtac caggagaacg tgtacgcggc gggaaagcgt 840 ttcttgagct tccgggaagt ggtgcttggg ctgccggcgc cgtacaacac ggacacggtg 900 ctggcctcgc tgcactcgac gtcgaagggc atcattggtg agtgcgggcg ccgcggcggg 960 tacttctgcc tcacaaactt ccccgcgccg gttcgggagc aggtgttaaa gatgtgctcc 1020 atggttccgt gcagcagcgt gaatgggcag ttgatgacgg cactgatgtg ctcgccaccg 1080 cggcccggtg acgcgagcta tgagtcatac tgggcggagt acaatgggat ctttgcgagt 1140 ctaaagaagc gcgccctgct gcttgcgaag gagctgagca cgattcgcgg tttttcttgc 1200 cagccggtgg aaggggcgat gtacgcgttt ccgacgattg agctgccgga gaagtacttt 1260 cagcacaatg aggagctgaa cgcgaaggag gggcgaaagc ttgggcccga cacgcgatgg 1320 gcgttggagc ttctggagag cagcggggtt gttgttgtgg ccggctctgg gtttggtcag 1380 cagcccaaca cgctgcactt ccgcacgacg atcctgccgc cggagcagca gatggaacgg 1440 atggtgaagg cgatgcgcac attccaggag ggcatttggg caaagtacgg gtaa 1494 <210> 56 <211> 497 <212> PRT <213> Trypanosoma cruzi <400> 56 Met Leu Arg Lys Thr Leu Phe Gly Phe Arg Ala Ile Arg Ile Asn Pro 1 5 10 15 Arg Val Val Ala Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg 20 25 30 Ala Asp Glu Ile Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys 35 40 45 Tyr Pro Phe Pro Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala 50 55 60 Leu Glu Gln Lys Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile 65 70 75 80 Asp Ala Pro Phe Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Tyr Pro 85 90 95 Ala Asp Ala Val Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp 100 105 110 Arg Thr Gly Ala Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp 115 120 125 Ile Val Ala Arg Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu 130 135 140 Val Asp Ala Ser Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val 145 150 155 160 Arg Leu Leu Leu Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met 165 170 175 Val Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu 180 185 190 Gly Gly Thr Pro Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala 195 200 205 Leu Asn Val Glu Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys 210 215 220 Asn Asn Ala Thr Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro 225 230 235 240 Thr Gly Gly Val Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe 245 250 255 Cys Cys Asp Arg Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu 260 265 270 Asn Val Tyr Ala Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val 275 280 285 Leu Gly Leu Pro Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu 290 295 300 His Ser Thr Ser Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly 305 310 315 320 Tyr Phe Cys Leu Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Leu 325 330 335 Lys Met Cys Ser Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met 340 345 350 Thr Ala Leu Met Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu 355 360 365 Ser Tyr Trp Ala Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg 370 375 380 Ala Leu Leu Leu Ala Lys Glu Leu Ser Thr Ile Arg Gly Phe Ser Cys 385 390 395 400 Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro 405 410 415 Glu Lys Tyr Phe Gln His Asn Glu Glu Leu Asn Ala Lys Glu Gly Arg 420 425 430 Lys Leu Gly Pro Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser 435 440 445 Gly Val Val Val Val Ala Gly Ser Gly Phe Gly Gln Gln Pro Asn Thr 450 455 460 Leu His Phe Arg Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg 465 470 475 480 Met Val Lys Ala Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr 485 490 495 Gly <210> 57 <211> 1482 <212> DNA <213> Trypanosoma cruzi <400> 57 atgtctgggt cacgaaagga aattcgcatc aacccccgtg tggtggcggc agagtatgcg 60 gtgcgtggga tgctccccat gcgtgcggac gagatcaggg cggccctggc gacaccggag 120 gggaaggcca agtacccctt ctccagcatt gtgtactgca acattgggaa cccgcaggca 180 ctggaacaga agccgctgac gttcttccgg caggtgatgt cgctgattga cgcgccgttc 240 ctgctggaga acgagaaggt tacgtcgcag ttcccggcgg atgcggtggc gcgtgcgagg 300 gagtatcttc gccacatcgg cgatcgcacg ggcgcctaca cggactctgc gggctacgcc 360 tttgtccgtg acatcgtggc gcggcaaatc aatgaacgcg accacgagat aaagccgctg 420 gtggacgcat cctctatttt tctgacggac ggcgcgagct cgggcgtgcg tcttttgctg 480 caggttctcg tgggtgacgc gagtgatgcg gtgatggttc ccattccgca gtacccgctg 540 tacacggcgc agcttacgct tcttggcggc acgcccgcga tgtactacct gtgtgagaag 600 gataactggg cactgaatgt ggaggagctg gcgtcggtgt acgacgagtg cgtggcgaag 660 aataatgcga ccccgcgcgt gctcgttgtg atcaaccctg ggaacccgac tggcggcgtg 720 ctggatcgcg acgtgatgga ggctgtggcg aaattctgct gcgaccgcgg cattgtgctg 780 atggcggacg aggtgtacca ggagaacgtg tacgcggcgg gaaagcgttt cttgagcttc 840 cgggaagtgg tgcttgggct gccggcgccg tacaacacgg acacggtgct ggcctcgctg 900 cactcgacgt cgaagggcat cattggtgag tgcgggcgcc gcggcgggta cttctgcctc 960 acaaacttcc ccgcgccggt gcgggagcag gtggtaaaga tgtgctccat ggttccgtgc 1020 agcagcgtga atgggcagtt gatgacggca ctgatgtgct cgccaccgcg gcccggtgac 1080 gcgagctatg agtcatactg ggcggagtac aatgggatct ttgcgagtct aaagaagcgc 1140 gccctgctgc ttgcgaagga gctgggcacg attcgcggtt tttcttgcca gccggtggaa 1200 ggggcgatgt acgcgtttcc gacgattgag ctgccggaga agtactttca gcacaatgcg 1260 gagctgaacg cgaaggaggg gcgaaagctt gggcccgaca cgcgatgggc gttggagctt 1320 ctggagagca gcggggttgt tgttgtgccc ggctctgggt ttggtcagcg gcccaacacg 1380 ctgcacttcc gcacgacgat cctgccgccg gagcagcaga tggaacggat ggtgaaggcg 1440 atgcgcacat tccaggaggg catttgggca aagtacgggt aa 1482 <210> 58 <211> 493 <212> PRT <213> Trypanosoma cruzi <400> 58 Met Ser Gly Ser Arg Lys Glu Ile Arg Ile Asn Pro Arg Val Val Ala 1 5 10 15 Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg Ala Asp Glu Ile 20 25 30 Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys Tyr Pro Phe Ser 35 40 45 Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala Leu Glu Gln Lys 50 55 60 Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile Asp Ala Pro Phe 65 70 75 80 Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro Ala Asp Ala Val 85 90 95 Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp Arg Thr Gly Ala 100 105 110 Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Val Arg Asp Ile Val Ala Arg 115 120 125 Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu Val Asp Ala Ser 130 135 140 Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val Arg Leu Leu Leu 145 150 155 160 Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met Val Pro Ile Pro 165 170 175 Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu Gly Gly Thr Pro 180 185 190 Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala Leu Asn Val Glu 195 200 205 Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys Asn Asn Ala Thr 210 215 220 Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gly Val 225 230 235 240 Leu Asp Arg Asp Val Met Glu Ala Val Ala Lys Phe Cys Cys Asp Arg 245 250 255 Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val Tyr Ala 260 265 270 Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val Leu Gly Leu Pro 275 280 285 Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu His Ser Thr Ser 290 295 300 Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly Tyr Phe Cys Leu 305 310 315 320 Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Val Lys Met Cys Ser 325 330 335 Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met Thr Ala Leu Met 340 345 350 Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu Ser Tyr Trp Ala 355 360 365 Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg Ala Leu Leu Leu 370 375 380 Ala Lys Glu Leu Gly Thr Ile Arg Gly Phe Ser Cys Gln Pro Val Glu 385 390 395 400 Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro Glu Lys Tyr Phe 405 410 415 Gln His Asn Ala Glu Leu Asn Ala Lys Glu Gly Arg Lys Leu Gly Pro 420 425 430 Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser Gly Val Val Val 435 440 445 Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Asn Thr Leu His Phe Arg 450 455 460 Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg Met Val Lys Ala 465 470 475 480 Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr Gly 485 490 <210> 59 <211> 1494 <212> DNA <213> Trypanosoma cruzi <400> 59 atgctacgca aaaccctttt tggattcagg gccattcgca tcaacccccg tgtggtggcg 60 gcagagtatg cggtgcgtgg gatgctcccc atgcgtgcgg acgagatcag ggcggccctg 120 gcgacaccgg aggggaaggc caagtacccc ttctccagca ttgtgtactg caacattggg 180 aacccgcagg cactggaaca gaagccgctg acgttcttcc ggcaggtgat gtcgctgatt 240 gacgcgccgt tcctgctgga gaacgagaag gttacgtcgc agttcccggc ggatgcggtg 300 gcgcgtgcga gggagtatct tcgccacatc ggcgatcgca cgggcgccta cacggactct 360 gcgggctacg cctttgcccg tgacatcgtg gcgcggcaaa tcaatgaacg cgaccacgag 420 ataaagccgc tggtggacgc atcctctatt tttctgacgg acggcgcgag ctcgggcgtg 480 cgtcttttgc tgcaggttct cgtgggtgac gcgagtgatg cggtgatggt tcccattccg 540 cagtacccgc tgtacacggc gcagcttact cttcttggcg gcacgcccgc gatgtactac 600 ctgtgtgaga aggataactg ggcactgaac gtggaggagc tggcgtcggt gtacgacgag 660 tgcgtggcga agaataatgc gaccccgcgc gtgctcgttg tgatcaaccc cgggaacccg 720 actggcggcg tgctggatcg cgaagtgatg gaggccgtgg cgaaattctg ctgcgaccgc 780 ggcattgtgc tgatggcgga cgaggtgtac caggagaacg tgtacgcggc gggaaagcgt 840 ttcttgagct tccgggaagt ggtgcttggg ctgccggcgc cgtacaacac ggacacggtg 900 ctggcctcgc tgcactcgac gtcgaagggc atcattggtg agtgcgggcg ccgcggcggg 960 tacttctgcc tcacaaactt ccccgcgccg gtgcgggagc aggtggtaaa gatgtgctcc 1020 atggttccgt gcagcagcgt gaatgggcag ttgatgacgg cactgatgtg ctcgccaccg 1080 cggcccggtg acgcgagcta tgagtcatac tgggcggagt acaatgggat ctttgcgagt 1140 ctaaagaagc gcgccctgct gcttgcgaag gagctgggca cgattcgcgg tttttcttgc 1200 cagccggtgg aaggggcgat gtacgcgttt ccgacgattg agctgccgga gaagtacttt 1260 cagcacaatg cggagctgaa cgcgaaggag gggcgaaagc ttgggcccga cacgcgatgg 1320 gcgttggagc ttctggagag cagcggggtt gttgttgtgc ccggctctgg gtttggtcag 1380 cggcccaaca cgctgcactt ccgcacgacg atcctgccgc cggagcagca gatggaacgg 1440 atggtgaagg cgatgcgcac attccaggag ggcatttggg caaagtacgg gtaa 1494 <210> 60 <211> 497 <212> PRT <213> Trypanosoma cruzi <400> 60 Met Leu Arg Lys Thr Leu Phe Gly Phe Arg Ala Ile Arg Ile Asn Pro 1 5 10 15 Arg Val Val Ala Ala Glu Tyr Ala Val Arg Gly Met Leu Pro Met Arg 20 25 30 Ala Asp Glu Ile Arg Ala Ala Leu Ala Thr Pro Glu Gly Lys Ala Lys 35 40 45 Tyr Pro Phe Ser Ser Ile Val Tyr Cys Asn Ile Gly Asn Pro Gln Ala 50 55 60 Leu Glu Gln Lys Pro Leu Thr Phe Phe Arg Gln Val Met Ser Leu Ile 65 70 75 80 Asp Ala Pro Phe Leu Leu Glu Asn Glu Lys Val Thr Ser Gln Phe Pro 85 90 95 Ala Asp Ala Val Ala Arg Ala Arg Glu Tyr Leu Arg His Ile Gly Asp 100 105 110 Arg Thr Gly Ala Tyr Thr Asp Ser Ala Gly Tyr Ala Phe Ala Arg Asp 115 120 125 Ile Val Ala Arg Gln Ile Asn Glu Arg Asp His Glu Ile Lys Pro Leu 130 135 140 Val Asp Ala Ser Ser Ile Phe Leu Thr Asp Gly Ala Ser Ser Gly Val 145 150 155 160 Arg Leu Leu Leu Gln Val Leu Val Gly Asp Ala Ser Asp Ala Val Met 165 170 175 Val Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Gln Leu Thr Leu Leu 180 185 190 Gly Gly Thr Pro Ala Met Tyr Tyr Leu Cys Glu Lys Asp Asn Trp Ala 195 200 205 Leu Asn Val Glu Glu Leu Ala Ser Val Tyr Asp Glu Cys Val Ala Lys 210 215 220 Asn Asn Ala Thr Pro Arg Val Leu Val Val Ile Asn Pro Gly Asn Pro 225 230 235 240 Thr Gly Gly Val Leu Asp Arg Glu Val Met Glu Ala Val Ala Lys Phe 245 250 255 Cys Cys Asp Arg Gly Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu 260 265 270 Asn Val Tyr Ala Ala Gly Lys Arg Phe Leu Ser Phe Arg Glu Val Val 275 280 285 Leu Gly Leu Pro Ala Pro Tyr Asn Thr Asp Thr Val Leu Ala Ser Leu 290 295 300 His Ser Thr Ser Lys Gly Ile Ile Gly Glu Cys Gly Arg Arg Gly Gly 305 310 315 320 Tyr Phe Cys Leu Thr Asn Phe Pro Ala Pro Val Arg Glu Gln Val Val 325 330 335 Lys Met Cys Ser Met Val Pro Cys Ser Ser Val Asn Gly Gln Leu Met 340 345 350 Thr Ala Leu Met Cys Ser Pro Pro Arg Pro Gly Asp Ala Ser Tyr Glu 355 360 365 Ser Tyr Trp Ala Glu Tyr Asn Gly Ile Phe Ala Ser Leu Lys Lys Arg 370 375 380 Ala Leu Leu Leu Ala Lys Glu Leu Gly Thr Ile Arg Gly Phe Ser Cys 385 390 395 400 Gln Pro Val Glu Gly Ala Met Tyr Ala Phe Pro Thr Ile Glu Leu Pro 405 410 415 Glu Lys Tyr Phe Gln His Asn Ala Glu Leu Asn Ala Lys Glu Gly Arg 420 425 430 Lys Leu Gly Pro Asp Thr Arg Trp Ala Leu Glu Leu Leu Glu Ser Ser 435 440 445 Gly Val Val Val Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Asn Thr 450 455 460 Leu His Phe Arg Thr Thr Ile Leu Pro Pro Glu Gln Gln Met Glu Arg 465 470 475 480 Met Val Lys Ala Met Arg Thr Phe Gln Glu Gly Ile Trp Ala Lys Tyr 485 490 495 Gly <210> 61 <211> 1869 <212> DNA <213> Cricetulus griseus <400> 61 atggccacca aggagaagct gcagtgtctg aaagacttcc acaaagacat cctgaagcct 60 tctccaggga agagcccagg cacacggcct gaggatgagg ctgaggggaa gccccctcag 120 agggagaagt ggtccagcaa gattgacttt gtgctgtctg tggccggagg cttcgtgggt 180 ttgggcaacg tttggcgttt cccgtacctc tgctacaaaa atggtggagg tgctttcctc 240 ataccgtatt ttattttcct gtttgggagt ggcctgcctg tgtttttcct ggaggtcata 300 ataggccagt acacctcaga agggggaatc acctgctggg agaagatctg ccccttgttc 360 tctggcattg gctacgcatc catcgtcatc gtgtccctcc tgaatgtgta ctacattgtc 420 atcctggcct gggccacata ctacctattt cactccttcc agacagagct tccctgggcc 480 cactgcaacc acagctggaa cacaccacat tgcatggagg acaccctgcg taggaatgag 540 agtctctggg tctcccttag cgcctccaac ttcacctcgc ctgtcatcga gttctgggag 600 cgcaatgtac tcagcctgtc ttccggaatc gacgaaccag gcgctctgaa atgggacctt 660 gcgctctgcc tcctcttagt ctggcttgtc tgttttttct gcatatggaa gggtgttcga 720 tccacaggca aggttgtcta cttcaccgcc actttcccgt ttgccatgct tctggtgctg 780 ctggtccgtg gactgaccct gccgggtgct ggcgaaggca tcaaattcta cctgtaccct 840 gacatcagcc gccttgagga cccacaggtg tggatcgacg ccggaaccca gatattcttt 900 tcctatgcca tctgcctggg ggccatgacc tcactgggaa gctacaacaa gtacaagtat 960 aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020 ggcttcgcag ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080 gatgtggctg agtcaggtcc tggcttggcc ttcattgcct atccaaaagc tgtgactatg 1140 atgccgctgc ccaccttttg gtccattctg ttttttatta tgctcctctt gcttggactg 1200 gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260 ttcctaagga agggttatcg tcgggaagtc ttcatcgcca tcctgtgtag catcagctac 1320 ctgctggggc tgtcgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380 tatgcagcta gtggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440 tggatatatg gtggtgataa cttatatgac ggtattgagg acatgattgg ctatcggcct 1500 gggccctgga tgaagtacag ctgggctgtc atcactccag ttctctgtgc tggatgtttc 1560 atcttctctc ttgtcaagta tgtacccctg acctacaaca aagtctacgt gtatcctgat 1620 tgggcaattg ggctgggctg gggcctggcc ctatcctcca tggtgtgtat ccccttggtc 1680 attgccatcc tcctctgccg gacggaggga ccgttccgcg tgagaatcca atacctgata 1740 acccccaggg agcccaaccg ctgggctgtg gagcgtgagg gggccacacc cttccactcc 1800 cgcacaagcc tcgtcatgaa cggcgcactc atgaaaccca gtcacgtcat tgtggagacc 1860 atgatgtga 1869 <210> 62 <211> 622 <212> PRT <213> Cricetulus griseus <400> 62 Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp 1 5 10 15 Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp 20 25 30 Glu Ala Glu Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile 35 40 45 Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val 50 55 60 Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu 65 70 75 80 Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe 85 90 95 Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys 100 105 110 Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile 115 120 125 Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp 130 135 140 Ala Thr Tyr Tyr Leu Phe His Ser Phe Gln Thr Glu Leu Pro Trp Ala 145 150 155 160 His Cys Asn His Ser Trp Asn Thr Pro His Cys Met Glu Asp Thr Leu 165 170 175 Arg Arg Asn Glu Ser Leu Trp Val Ser Leu Ser Ala Ser Asn Phe Thr 180 185 190 Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser 195 200 205 Gly Ile Asp Glu Pro Gly Ala Leu Lys Trp Asp Leu Ala Leu Cys Leu 210 215 220 Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg 225 230 235 240 Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met 245 250 255 Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu 260 265 270 Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Ser Arg Leu Glu Asp Pro 275 280 285 Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile 290 295 300 Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr 305 310 315 320 Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr 325 330 335 Ser Phe Val Ser Gly Phe Ala Val Phe Ser Ile Leu Gly Phe Met Ala 340 345 350 Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly 355 360 365 Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro 370 375 380 Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu 385 390 395 400 Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp 405 410 415 Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Val Phe Ile 420 425 430 Ala Ile Leu Cys Ser Ile Ser Tyr Leu Leu Gly Leu Ser Met Val Thr 435 440 445 Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser 450 455 460 Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala 465 470 475 480 Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile 485 490 495 Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr 500 505 510 Pro Val Leu Cys Ala Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val 515 520 525 Pro Leu Thr Tyr Asn Lys Val Tyr Val Tyr Pro Asp Trp Ala Ile Gly 530 535 540 Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Val Cys Ile Pro Leu Val 545 550 555 560 Ile Ala Ile Leu Leu Cys Arg Thr Glu Gly Pro Phe Arg Val Arg Ile 565 570 575 Gln Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg 580 585 590 Glu Gly Ala Thr Pro Phe His Ser Arg Thr Ser Leu Val Met Asn Gly 595 600 605 Ala Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met 610 615 620 <210> 63 <211> 1866 <212> DNA <213> Rattus norvegicus <400> 63 atggccacca aggagaagct tcaatgtctg aaagacttcc acaaagacat cctgaagcct 60 tctccaggga agagcccagg cacgcggcct gaggatgagg ctgatgggaa gccccctcag 120 agggagaagt ggtccagcaa gatcgacttt gtgctgtctg tggccggagg cttcgtgggt 180 ttgggcaatg tctggcgttt cccgtacctc tgctacaaaa atggtggagg tgcattcctc 240 ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttcct ggaggtcatc 300 ataggccagt acacctcaga agggggcatc acctgctggg agaagatctg ccccttgttc 360 tctggcattg gctacgcgtc catcgtcatc gtgtccctcc tgaatgtgta ctacatcgtc 420 atcctggcct gggccacata ctacctattc cagtctttcc agaaggatct tccctgggcc 480 cactgcaacc atagctggaa cacgccacag tgcatggagg acaccctgcg taggaacgag 540 agtcactggg tctcccttag cgccgccaac ttcacttcgc ctgtgatcga gttctgggag 600 cgcaacgtgc tcagcctgtc ctccggaatc gaccacccag gcagtctgaa atgggacctc 660 gcgctctgcc tcctcttagt ctggctcgtc tgttttttct gcatctggaa gggtgttcgg 720 tccacaggca aggttgtcta cttcactgct actttcccgt ttgccatgct tctggtgctg 780 ctggtccgtg gactgaccct gccaggtgct ggtgaaggca tcaaattcta cctgtaccct 840 aacatcagcc gccttgagga cccacaggtg tggatcgacg ctggaactca gatattcttt 900 tcctacgcta tctgcctggg ggccatgacc tcactgggaa gctataacaa gtacaagtat 960 aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020 ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080 gatgtggctg agtcaggtcc tggcttggcc ttcattgcct acccaaaagc tgtgaccatg 1140 atgccgctgc ccaccttttg gtccattctg ttttttatta tgctcctctt gcttggactg 1200 gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260 ttcctaagga agggttatcg tcgggaaatc ttcattgcca tcgtgtgcag catcagctac 1320 ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380 tatgcagcta gtggtgtatg ccttttgtgg gtcgcattct ttgaatgttt tgttattgcc 1440 tggatatatg gcggtgataa cttatatgac ggtattgagg acatgatcgg ctatcggcct 1500 ggaccctgga tgaagtacag ctgggctgtc atcactccag ctctctgtgt tggatgtttc 1560 atcttctctc tcgtcaagta tgtacccctg acctacaaca aagtctaccg gtaccctgat 1620 tgggcaatcg ggctgggctg gggcctggcc ctttcctcca tggtgtgtat ccccttggtc 1680 attgtcatcc tcctctgccg gacggaggga ccgctccgcg tgagaatcaa atacctgata 1740 acccccaggg agcccaaccg ctgggctgtg gagcgtgaag gggctacgcc ctttcactcc 1800 agagcaaccc tcatgaacgg tgcactcatg aaacccagtc acgtcattgt ggagaccatg 1860 atgtga 1866 <210> 64 <211> 621 <212> PRT <213> Rattus norvegicus <400> 64 Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp 1 5 10 15 Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp 20 25 30 Glu Ala Asp Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile 35 40 45 Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val 50 55 60 Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu 65 70 75 80 Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe 85 90 95 Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys 100 105 110 Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile 115 120 125 Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp 130 135 140 Ala Thr Tyr Tyr Leu Phe Gln Ser Phe Gln Lys Asp Leu Pro Trp Ala 145 150 155 160 His Cys Asn His Ser Trp Asn Thr Pro Gln Cys Met Glu Asp Thr Leu 165 170 175 Arg Arg Asn Glu Ser His Trp Val Ser Leu Ser Ala Ala Asn Phe Thr 180 185 190 Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser 195 200 205 Gly Ile Asp His Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu 210 215 220 Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg 225 230 235 240 Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met 245 250 255 Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu 260 265 270 Gly Ile Lys Phe Tyr Leu Tyr Pro Asn Ile Ser Arg Leu Glu Asp Pro 275 280 285 Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile 290 295 300 Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr 305 310 315 320 Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr 325 330 335 Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala 340 345 350 Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly 355 360 365 Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro 370 375 380 Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu 385 390 395 400 Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp 405 410 415 Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile 420 425 430 Ala Ile Val Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr 435 440 445 Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser 450 455 460 Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala 465 470 475 480 Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile 485 490 495 Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr 500 505 510 Pro Ala Leu Cys Val Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val 515 520 525 Pro Leu Thr Tyr Asn Lys Val Tyr Arg Tyr Pro Asp Trp Ala Ile Gly 530 535 540 Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Val Cys Ile Pro Leu Val 545 550 555 560 Ile Val Ile Leu Leu Cys Arg Thr Glu Gly Pro Leu Arg Val Arg Ile 565 570 575 Lys Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg 580 585 590 Glu Gly Ala Thr Pro Phe His Ser Arg Ala Thr Leu Met Asn Gly Ala 595 600 605 Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met 610 615 620 <210> 65 <211> 1866 <212> DNA <213> Mus musculus <400> 65 atggccacga aggagaagct gcaatgtctg aaagacttcc acaaagacat cctgaagcct 60 tctccaggga agagcccagg cacacggcct gaagatgagg cggacgggaa gccccctcag 120 agggagaagt ggtccagcaa gatcgacttt gtgctgtctg tggccggagg cttcgtgggt 180 ttgggcaacg tctggcgttt cccgtacctc tgctacaaaa atggtggagg tgcgttcctc 240 ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttctt ggaggtcatc 300 ataggccagt acacatcaga agggggcatc acctgctggg agaagatctg tcctttgttc 360 tctggcattg gctacgcatc catcgtcatt gtgtccctcc tgaacgtgta ctacatcgtc 420 atcctggcct gggccacata ctacctattc cactctttcc agaaggatct tccctgggcc 480 cactgcaacc atagctggaa cacaccacag tgcatggagg acaccctgcg taggaacgag 540 agtcactggg tctcccttag cactgccaac ttcacctcac ccgtcatcga gttctgggag 600 cgcaatgtgc tcagcctgtc ctccggaatc gacaacccag gcagtctgaa atgggacctc 660 gcgctctgcc tcctcttagt ctggctcgtc tgttttttct gcatctggaa gggtgttcga 720 tccacaggca aggttgtcta cttcaccgct actttcccgt ttgccatgct tctggtgctg 780 ctggtccgtg gactgaccct gccaggtgct ggtgaaggca tcaaattcta cctgtaccct 840 gacatcagcc gccttgggga cccacaggtg tggatcgacg ctggaactca gatattcttt 900 tcctacgcaa tctgcctggg ggccatgacc tcactgggaa gctataacaa gtacaagtat 960 aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020 ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080 gatgtggctg agtcaggtcc tggcttggcc ttcattgcct acccaaaagc tgtaaccatg 1140 atgccgctgc ccaccttttg gtctattctg tttttcatta tgctcctctt gcttggactg 1200 gacagccagt ttgttgaagt cgaaggacag atcacatcct tggttgatct ttacccgtcc 1260 ttcctaagga agggttatcg tcgggaaatc ttcatagcca tcttgtgtag catcagctac 1320 ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcaact ctttgactac 1380 tatgcagcta gtggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440 tggatatatg gcggtgataa cttatatgac ggtattgagg acatgattgg ctatcggcct 1500 gggccctgga tgaagtacag ctgggctgtc atcactccag ctctttgtgt tggatgtttc 1560 gtcttctcgc ttgtcaagta tgtacccctg acctacaaca aagtgtaccg gtacccggat 1620 tgggcaattg ggctgggctg gggcctggcc ctttcctcca tgctgtgtat ccccttggtc 1680 attgtcatcc tcctctgccg gacggaggga ccgctccgcg tgagaatcaa atacctgata 1740 acccccaggg agcccaaccg ctgggctgtg gagcgtgaag gggccacacc ctttcactcc 1800 cgagtaaccc tcatgaacgg cgcactcatg aaacccagtc acgtcattgt ggagaccatg 1860 atgtga 1866 <210> 66 <211> 621 <212> PRT <213> Mus musculus <400> 66 Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp 1 5 10 15 Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp 20 25 30 Glu Ala Asp Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile 35 40 45 Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val 50 55 60 Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu 65 70 75 80 Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe 85 90 95 Leu Glu Val Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys 100 105 110 Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Ile 115 120 125 Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp 130 135 140 Ala Thr Tyr Tyr Leu Phe His Ser Phe Gln Lys Asp Leu Pro Trp Ala 145 150 155 160 His Cys Asn His Ser Trp Asn Thr Pro Gln Cys Met Glu Asp Thr Leu 165 170 175 Arg Arg Asn Glu Ser His Trp Val Ser Leu Ser Thr Ala Asn Phe Thr 180 185 190 Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Ser 195 200 205 Gly Ile Asp Asn Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu 210 215 220 Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg 225 230 235 240 Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met 245 250 255 Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Glu 260 265 270 Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Ser Arg Leu Gly Asp Pro 275 280 285 Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile 290 295 300 Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr 305 310 315 320 Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr 325 330 335 Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala 340 345 350 Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly 355 360 365 Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro 370 375 380 Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu 385 390 395 400 Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp 405 410 415 Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile 420 425 430 Ala Ile Leu Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr 435 440 445 Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser 450 455 460 Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala 465 470 475 480 Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile 485 490 495 Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr 500 505 510 Pro Ala Leu Cys Val Gly Cys Phe Val Phe Ser Leu Val Lys Tyr Val 515 520 525 Pro Leu Thr Tyr Asn Lys Val Tyr Arg Tyr Pro Asp Trp Ala Ile Gly 530 535 540 Leu Gly Trp Gly Leu Ala Leu Ser Ser Met Leu Cys Ile Pro Leu Val 545 550 555 560 Ile Val Ile Leu Leu Cys Arg Thr Glu Gly Pro Leu Arg Val Arg Ile 565 570 575 Lys Tyr Leu Ile Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg 580 585 590 Glu Gly Ala Thr Pro Phe His Ser Arg Val Thr Leu Met Asn Gly Ala 595 600 605 Leu Met Lys Pro Ser His Val Ile Val Glu Thr Met Met 610 615 620 <210> 67 <211> 1863 <212> DNA <213> Homo sapiens <400> 67 atggccacca aggagaagct gcagtgtctg aaagatttcc acaaggacat cctgaagccc 60 tcaccaggga agagcccagg cacgcggcct gaggacgagg ctgagggaaa acctccgcag 120 agggagaagt ggtctagcaa gatcgacttt gtgctctctg tggctggcgg cttcgtgggc 180 ttgggcaacg tctggcgctt cccgtacctc tgctacaaga atggtggagg tgcgtttctc 240 ataccgtatt ttattttcct gtttgggagc ggcctgcctg tgtttttctt ggagatcatc 300 ataggccagt acacctctga agggggcatc acctgctggg aaaagatctg ccccttgttc 360 tctggtatcg gctatgcctc cgttgtaatt gtgtccctcc tgaatgtcta ctacatcgtc 420 atcctggcct gggccacata ctacctgttc cagtccttcc agaaggagct gccctgggca 480 cactgcaacc acagctggaa cacacctcac tgcatggagg acaccatgcg caagaacaag 540 agtgtctgga tcaccatcag ctccaccaac ttcacctccc ctgtcatcga gttctgggag 600 cgcaacgtgc tgagcttgtc ccctggaatc gaccacccag gctctctgaa atgggacctc 660 gctctctgcc ttcttttagt ctggctagtg tgtttcttct gcatctggaa gggcgtcagg 720 tccactggga aggtcgtcta cttcacagcc acttttccat tcgccatgct cctggtgctg 780 ctggtccgag ggctgacgct gccgggcgcg ggcgcaggca tcaagttcta tctgtatcct 840 gacatcaccc gccttgagga cccacaggtg tggattgacg ctgggactca gatattcttc 900 tcttatgcca tctgcctggg ggctatgacc tcgctgggga gctacaacaa gtacaagtat 960 aactcgtaca gggactgtat gctgctggga tgcctgaaca gtggtaccag ttttgtgtct 1020 ggcttcgcaa ttttttccat cctgggcttc atggcacaag agcaaggggt ggacattgct 1080 gatgtggctg agtcaggtcc tggcctggcc ttcattgcct acccaaaagc tgtgacaatg 1140 atgccgctgc ccacattttg gtccattctt ttttttatta tgcttctctt gcttggactg 1200 gatagccagt ttgttgaagt tgaaggacag atcacatcct tggttgatct ttacccatcc 1260 ttcctaagga agggttatcg tcgggaaatc ttcatcgcct tcgtgtgtag catcagctac 1320 ctgctggggc tgacgatggt gacggagggt ggcatgtatg tgtttcagct ctttgactac 1380 tatgcagcta gcggtgtatg ccttttgtgg gttgcattct ttgaatgttt tgttattgcc 1440 tggatatatg gaggtgataa cctttatgat ggtattgagg acatgattgg ctatcggccc 1500 gggccctgga tgaagtacag ctgggctgtg atcactccag ttctctgtgt tggatgtttc 1560 atcttctcgc tcgtcaagta cgtacccctg acctacaaca aaacatacgt gtaccccaac 1620 tgggccattg ggctgggctg gagcctggcc ctttcctcca tgctctgcgt tcccttggtc 1680 atcgtcatcc gcctctgcca gactgagggg ccgttccttg tgagagtcaa gtacctgctg 1740 accccaaggg aacccaaccg ctgggctgtg gagcgcgagg gagccacacc ttacaactct 1800 cgcaccgtca tgaacggcgc tctcgtgaaa ccgacccaca tcattgtgga gaccatgatg 1860 tga 1863 <210> 68 <211> 620 <212> PRT <213> Homo sapiens <400> 68 Met Ala Thr Lys Glu Lys Leu Gln Cys Leu Lys Asp Phe His Lys Asp 1 5 10 15 Ile Leu Lys Pro Ser Pro Gly Lys Ser Pro Gly Thr Arg Pro Glu Asp 20 25 30 Glu Ala Glu Gly Lys Pro Pro Gln Arg Glu Lys Trp Ser Ser Lys Ile 35 40 45 Asp Phe Val Leu Ser Val Ala Gly Gly Phe Val Gly Leu Gly Asn Val 50 55 60 Trp Arg Phe Pro Tyr Leu Cys Tyr Lys Asn Gly Gly Gly Ala Phe Leu 65 70 75 80 Ile Pro Tyr Phe Ile Phe Leu Phe Gly Ser Gly Leu Pro Val Phe Phe 85 90 95 Leu Glu Ile Ile Ile Gly Gln Tyr Thr Ser Glu Gly Gly Ile Thr Cys 100 105 110 Trp Glu Lys Ile Cys Pro Leu Phe Ser Gly Ile Gly Tyr Ala Ser Val 115 120 125 Val Ile Val Ser Leu Leu Asn Val Tyr Tyr Ile Val Ile Leu Ala Trp 130 135 140 Ala Thr Tyr Tyr Leu Phe Gln Ser Phe Gln Lys Glu Leu Pro Trp Ala 145 150 155 160 His Cys Asn His Ser Trp Asn Thr Pro His Cys Met Glu Asp Thr Met 165 170 175 Arg Lys Asn Lys Ser Val Trp Ile Thr Ile Ser Ser Thr Asn Phe Thr 180 185 190 Ser Pro Val Ile Glu Phe Trp Glu Arg Asn Val Leu Ser Leu Ser Pro 195 200 205 Gly Ile Asp His Pro Gly Ser Leu Lys Trp Asp Leu Ala Leu Cys Leu 210 215 220 Leu Leu Val Trp Leu Val Cys Phe Phe Cys Ile Trp Lys Gly Val Arg 225 230 235 240 Ser Thr Gly Lys Val Val Tyr Phe Thr Ala Thr Phe Pro Phe Ala Met 245 250 255 Leu Leu Val Leu Leu Val Arg Gly Leu Thr Leu Pro Gly Ala Gly Ala 260 265 270 Gly Ile Lys Phe Tyr Leu Tyr Pro Asp Ile Thr Arg Leu Glu Asp Pro 275 280 285 Gln Val Trp Ile Asp Ala Gly Thr Gln Ile Phe Phe Ser Tyr Ala Ile 290 295 300 Cys Leu Gly Ala Met Thr Ser Leu Gly Ser Tyr Asn Lys Tyr Lys Tyr 305 310 315 320 Asn Ser Tyr Arg Asp Cys Met Leu Leu Gly Cys Leu Asn Ser Gly Thr 325 330 335 Ser Phe Val Ser Gly Phe Ala Ile Phe Ser Ile Leu Gly Phe Met Ala 340 345 350 Gln Glu Gln Gly Val Asp Ile Ala Asp Val Ala Glu Ser Gly Pro Gly 355 360 365 Leu Ala Phe Ile Ala Tyr Pro Lys Ala Val Thr Met Met Pro Leu Pro 370 375 380 Thr Phe Trp Ser Ile Leu Phe Phe Ile Met Leu Leu Leu Leu Gly Leu 385 390 395 400 Asp Ser Gln Phe Val Glu Val Glu Gly Gln Ile Thr Ser Leu Val Asp 405 410 415 Leu Tyr Pro Ser Phe Leu Arg Lys Gly Tyr Arg Arg Glu Ile Phe Ile 420 425 430 Ala Phe Val Cys Ser Ile Ser Tyr Leu Leu Gly Leu Thr Met Val Thr 435 440 445 Glu Gly Gly Met Tyr Val Phe Gln Leu Phe Asp Tyr Tyr Ala Ala Ser 450 455 460 Gly Val Cys Leu Leu Trp Val Ala Phe Phe Glu Cys Phe Val Ile Ala 465 470 475 480 Trp Ile Tyr Gly Gly Asp Asn Leu Tyr Asp Gly Ile Glu Asp Met Ile 485 490 495 Gly Tyr Arg Pro Gly Pro Trp Met Lys Tyr Ser Trp Ala Val Ile Thr 500 505 510 Pro Val Leu Cys Val Gly Cys Phe Ile Phe Ser Leu Val Lys Tyr Val 515 520 525 Pro Leu Thr Tyr Asn Lys Thr Tyr Val Tyr Pro Asn Trp Ala Ile Gly 530 535 540 Leu Gly Trp Ser Leu Ala Leu Ser Ser Met Leu Cys Val Pro Leu Val 545 550 555 560 Ile Val Ile Arg Leu Cys Gln Thr Glu Gly Pro Phe Leu Val Arg Val 565 570 575 Lys Tyr Leu Leu Thr Pro Arg Glu Pro Asn Arg Trp Ala Val Glu Arg 580 585 590 Glu Gly Ala Thr Pro Tyr Asn Ser Arg Thr Val Met Asn Gly Ala Leu 595 600 605 Val Lys Pro Thr His Ile Ile Val Glu Thr Met Met 610 615 620

Claims

알라닌아미노트랜스페라아제를 코드하는 DNA 및 원하는 폴리펩티드를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포를 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.
삭제
제 1 항에 있어서,
상기 세포가 추가로 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포인 제조 방법.
삭제
제 1 항 또는 제 3 항에 있어서,
세포가 차이니즈 햄스터 난소 세포인 제조 방법.
제 1 항 또는 제 3 항에 있어서,
원하는 폴리펩티드가 항체인 제조 방법.
제 1 항 또는 제 3 항에 있어서,
알라닌아미노트랜스페라아제를 코드하는 DNA 가 이하의 (a) ∼ (e) 중 어느 하나인 제조 방법.
(a) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열을 갖는 폴리펩티드를 코드하는 DNA
(b) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열에서, 1 또는 복수의 아미노산이 치환, 결실, 부가 및 삽입으로 이루어진 군에서 선택된 하나 이상으로 변이된 아미노산 배열을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(c) 배열 번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58 또는 60 의 아미노산 배열과 97 % 이상의 동일성을 갖고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
(d) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA
(e) 배열 번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57 또는 59 의 염기 배열을 갖는 DNA 에 상보적인 DNA 와 스트린젠트한 조건하에서 하이브리다이즈하고, 또한 알라닌아미노트랜스페라아제 활성을 갖는 폴리펩티드를 코드하는 DNA
삭제
알라닌아미노트랜스페라아제를 코드하는 DNA 와 원하는 폴리펩티드를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포.
제 9 항에 있어서,
추가로 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포.
알라닌아미노트랜스페라아제를 코드하는 DNA 와 타우린 트랜스포터를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포.
알라닌아미노트랜스페라아제를 코드하는 DNA 및 원하는 폴리펩티드를 코드하는 DNA 를 삽입한 벡터에 의해 형질 전환된 세포를,
-케토글루탈산을 함유하는 배지에서 배양시켜, 원하는 폴리펩티드를 생성시키는 것을 포함하는 폴리펩티드의 제조 방법.