KR20060002010A

KR20060002010A - 생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및시스템

Info

Publication number: KR20060002010A
Application number: KR1020057018129A
Authority: KR
Inventors: 미츠루 후루사와
Original assignee: 미츠루 후루사와; 네오-모건 래보러터리 인코퍼레이티드
Priority date: 2003-03-28
Filing date: 2004-03-26
Publication date: 2006-01-06
Also published as: JP2006521113A; AU2004225648B2; WO2004087960A2; WO2004087960A3; EP1608750A2; AU2004225648A1; CA2520479A1; BRPI0409528A; US20050054597A1

Abstract

세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한 세포의 유전 형질의 전환율을 조절하기 위한 방법이 제공된다. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및 (b) 수득된 세포를 재생산시키는 단계를 포함한 조절된 유전 형질을 지닌 세포를 생성하기 위한 방법이 제공된다. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및 (b) 수득된 생물체를 재생산시키는 단계를 포함한 조절된 유전 형질을 지닌 생물체를 생성하기 위한 방법이 제공된다.

세포, 유전자 복제, 오류-빈발 빈도, 조절, 유전 형질, 전환율, 생물체

Description

생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및 시스템{Method and system for rapidly conferring a desired trait to an organism}

본 발명은 생물체의 유전 형질을 빠르게 변형시키기 위한 방법 및 본 방법에 의해 수득된 생물체 및 생성물에 관한 것이다.

기록된 역사 이래로 인간은 생물체의 유전 형질을 변형시키고자 노력했다. 소위 유전공학의 도래 이전에 이종-교배 등이 원하는 형질을 지닌 생물체를 수득하기 위해 시도되었고 또는 대안으로 돌연변이가 방사선에 의해 무작위로 유발되어 변형된 유전 형질을 지닌 돌연변이화된 생물체가 분리되었다.

최근 진보된 유전공학은 변형된 유전 형질을 지닌 생물체를 수득하는 것을 크게 촉진시킨다. 외생적 유전자가 생물체 내로 도입되는 유전공학이 유전적으로 변형된 생물체의 생성에 널리 이용되었다. 그러나 외생적 유전자가 도입되기만 생물체는 원하는 유전 형질을 항상 수득하는 것은 아니다. 자연 진화 과정과 다른 조작은 기대하지 않은 결과를 야기한다. 따라서 정부 당국은 유전적으로 변형된 생물체(GMOs)로부터 유래된 식품을 통상의 식품보다 더욱 엄격하게 규제한다.

따라서 자연 진화와 순응하여 생물체에 원하는 유전 형질을 부여하는 방법 및 이러한 생물체를 생성하는 방법에 대한 본 분야의 증가된 요구가 있다.

현재 하기의 알려진 돌연변이유발 방법이 있다.

(1) 자연 돌연변이 : 생물체가 일반적 환경 하에서 생장할 때 발행된 돌연변이가 자연 돌연변이로 불린다. 자연 돌연변이에 대한 주요 원인은 DNA 복제 및 내생적 돌연변이원(뉴클레오타이드 아날로그) 내의 오류로 여겨진다 (Maki, "Shizenheni To Shufukukiko [Natural Mutation And Repair Mechanism]", Saibo Kogaku [Cell Engineering], Vol. 13, No.8, pp. 663-672, 1994).

(2) 방사선, 돌연변이원 등으로의 처리 : DNA는 자외선, X-선 등과 같은 방사선으로의 처리 또는 알킬화제 등과 같은 인공 돌연변이원으로의 처리에 의해 손상된다. 이러한 손상은 DNA 복제 과정에서 돌연변이로서 고정된다.

(3) PCR(중합효소 연쇄 반응)의 이용 : PCR시 DNA가 시험관 내에서 증폭되기 때문에 PCR 시스템은 세포내 돌연변이 억제 메카니즘이 부재한다. 따라서 돌연변이는 매우 자주 유도된다. DNA 셔플링(shuffling)(Stemmer, Nature, Vol. 370, pp. 389-391, Aug. 1994)이 PCR과 결합되면 유독한 돌연변이의 축적이 방지될 수 있고 다수의 유익한 돌연변이가 유전자 내에 축적될 수 있다.

(4) 돌연변이 인자 (또는 돌연변이유발 유전자(mutator))의 이용 : 거의 모든 생물체에서 자연 돌연변이의 빈도는 돌연변이 억제 메카니즘에 의해 매우 낮은 비율로 유지된다. 돌연변이 억제 메카니즘은 10 이상의 유전자와 관련된 다수의 단계를 포함한다. 돌연변이는 하나 이상의 유전자가 파괴된 생물체 내에서 높은 빈도로 발생한다. 이들 유전자가 돌연변이유발 유전자로 불린다(Maki 상동 및 Horst et al., Trends in Microbiology, Vol. 7, No. 1, pp. 29-36, Jan. 1999).

돌연변이유발 유전자를 이용한 방법은 불일치(disparity) 방법이다(Furusawa M. and Doi H. J. Theor. Biol. 157, pp. 127-133, 1992; 및 Furusawa M. and Doi H. Genetica 103, pp. 333-347, 1998; 일본 공개공보 8-163986; 일본 공개공보 8-163987; 일본 공개공보 9-23882; WO00/28015). 불일치 방법에서 실질적으로 생성된 생물체(특히 고등생물(즉, 진핵성 생물))가 정상적인 생장 곡선을 나타내는지 여부는 뚜렷하지 않았다. 더욱이 불일치 방법은 자연 진화를 촉진시키는지 증명되지 않았다.

다수의 복제 사이트를 보유한 염색체의 이배체 이상을 지닌 진핵세포 생물과 같은 "고등생물"(즉, 진핵생물)에 대한 불균형 돌연변이 모델의 시뮬레이션에서 치명적 돌연변이가 발생할 가능성이 있다. 불일치 방법이 실제 상황에 적용될 수 있는지 여부는 명백하지 않다.

불균형 돌연변이 모델의 시뮬레이션에서 돌연변이는 예를 들어 낮은 복제 정확성을 지닌 비-인접 체인 내로 무작위로 도입된다. 이러한 돌연변이가 진화에 기여하는지 여부는 명백하지 않다.

도입된 돌연변이유발 유전자를 지닌 E. coli의 돌연변이 균주를 이용하여 시도된 약물 저항성 실험에서 약물-저항성 균주가 수득되었다. 그러나 진화의 속도를 임의로 변화시키거나 제어시킬 수 있는 어떠한 시스템도 제안되지 않았다.

돌연변이가 실질적으로 불균형 방식으로 삽입되는지 여부에 관계없이 진화 속도의 측정을 제공하는 게놈-수준 분석에 의해 측정된 어떠한 실험도 없었다. 시퀀싱 기술 자체가 용이하게 수행될 수 있음을 고려할 때 돌연변이 사이트가 확인되었다고 보고된 어떠한 예도 없다고 할 수 있다.

발명의 개시

상기-기술된 문제점은 생물체의 진화 속도가 시간의 함수가 아니고 생물체의 오류-빈발 빈도를 조절함으로서 조절될 수 있음을 발견하고, 변형된 진화 속도를 지닌 실제 생물체가 자연-진화 생물체와 실질적으로 동일한 속도로 증식함을 증명한 본 발명자에 의해 해결되었다. 본 발명에 따라 오류 역치(threshold)는 생물체의 진화에 실질적으로 영향을 미치지 않음이 증명될 수 있었다.

본 발명의 또다른 관점에서 본 발명자는 이질성 복제 정확성을 지닌 유전적 다양성(quasispecies)의 오류 역치를 연구하였다. 본 발명자는 무-오류 및 오류-빈발 중합효소의 공존이 유전 정보의 분열적 손실없이 오류 역치를 증가시킬 수 있음을 증명하였다. 또한 본 발명자는 레플리코어(replicore)(복제 작용제)가 오류 역치에 영향을 미침을 나타내었다. 그 결과로서 본 발명자는 이질성 복제 정확성을 지닌 유전적 다양성이 다양한 돌연변이체를 생성하기 위해 선택적 진화에 관련된 유전적 비용을 감소시킴을 발견하였다.

적당한 진화는 이로운 돌연변이체의 유전적 다양성과 안정적 재생산을 요구한다. 게놈의 정확한 복제는 안정한 재생산을 보증하는 반면, 복제 동안의 오류는 유전적 다양성을 생성한다. 따라서 진화의 하나의 열쇠는 복제 정확성에 고유하다. 복제 정확성은 뉴클레오타이드 중합효소에 따라 달라진다. 세포내 중합효소는 상동성 복제 정확성을 지니는 것으로 여겨진다. 또한 진화 모델의 대부분의 연구는 상동성 복제 정확성에 기반하였다. 그러나 무-오류 및 오류-빈발 중합효 소는 자연-발생 생물체 내에 공존됨이 증명되었다. 따라서 본 발명은 자연에 적합하다.

본 발명은 하기를 제공한다.

1. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한:

세포의 유전 형질의 전환율을 조절하는 방법

2. 제 1항목에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법

3. 제 2항목에 있어서, 적어도 약 30% 이상의 오류-빈발 빈도 작용제는 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법

4. 제 1항목에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법

5. 제 1항목에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법

6. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 10¹이상까지 서로 다름을 특징으로 하는 방법

7. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 10²이상까지 서로 다름을 특징으로 하는 방법

8. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 10³이상까지 서로 다름을 특징으로 하는 방법

9. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법

10. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법

11. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법

12. 제 11항목에 있어서, 상기 DNA 중합효소는 프루프리딩(proofreading) 기능을 지님을 특징으로 하는 방법

13. 제 11항목에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법

14. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법

15. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법

16. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법

17. 제 16항목에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법

18. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법

19. 제 18항목에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법

20. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법

21. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법

22. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법

23. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

24. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

25. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

26. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

27. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

28. 제 1항목에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법

29. 제 1항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법

30. 제 1항목에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법

31. 제 1항목에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법

32. 제 1항목에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법

33. 제 1항목에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법

34. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법

35. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법

36. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법

37. 제 1항목에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법

38. 제 37항목에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법

39. 제 1항목에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법

40. 제 1항목에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법

41. 제 1항목에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법

42. 제 1항목에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법

43. 제 1항목에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법

44. 제 43항목에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법

45. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및

(b) 수득된 세포를 재생산시키는 단계를 포함한:

조절된 유전 형질을 지닌 세포를 생성하는 방법

46. 제 45항목에 있어서, 원하는 형질을 지닌 재생산된 세포를 선별하는 단계를 더욱 포함함을 특징으로 하는 방법

47. 제 45항목에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법

48. 제 45항목에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법

49. 제 45항목에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법

50. 제 45항목에 있어서, 상기 더 적은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법

51. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 10¹ 이상까지 서로 다름을 특징으로 하는 방법

52. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 10² 이상까지 서로 다름을 특징으로 하는 방법

53. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 10³ 이상까지 서로 다름을 특징으로 하는 방법

54. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법

55. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법

56. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법

57. 제 56항목에 있어서, 상기 DNA 중합효소는 프루프리딩 기능을 지님을 특징으로 하는 방법

58. 제 56항목에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법

59. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법

60. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법

61. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법

62. 제 61항목에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법

63. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법

64. 제 63항목에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법

65. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법

66. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법

67. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법

68. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

69. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

70. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

71. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

72. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법

73. 제 45항목에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법

74. 제 45항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법

75. 제 45항목에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법

76. 제 45항목에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법

77. 제 45항목에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법

78. 제 45항목에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법

79. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법

80. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법

81. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법

82. 제 45항목에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법

83. 제 82항목에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법

84. 제 45항목에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법

85. 제 45항목에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법

86. 제 45항목에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법

87. 제 45항목에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법

88. 제 45항목에 있어서, 상기 오류-빈발 빈도는 미리결정된 조건 하에서 조절됨을 특징으로 하는 방법

89. 제 88항목에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법

90. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및

(b) 수득된 생물체를 재생산시키는 단계를 포함한:

조절된 유전 형질을 지닌 생물체를 생성하는 방법

91. 제 90항목에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 세포

92. 제 91항목에 있어서, 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 세포

93. 제 90항목에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 생물체

94. 제 93항목에 있어서, 상기 생물체는 야생형 생물체와 실질적으로 동일한 생장을 지님을 특징으로 하는 생물체

95. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 유전자를 인코드하는 핵산 분자를 생성하는 단 계를 포함한:

조절된 유전 형질을 지닌 유전자를 인코드하는 핵산 분자를 생성하는 방법

96. 제 95항목에 따른 방법에 의해 생성된 핵산 분자

97. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 단계를 포함한:

조절된 유전 형질을 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 방법

98. 제 97항목에 따른 방법에 의해 생성된 폴리펩타이드

99. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 대사산물을 생성하는 단계를 포함한:

조절된 유전 형질을 지닌 생물체의 대사산물을 생성하는 방법

100. 제 99항목에 따른 방법에 의해 생성된 대사산물

101. 조절된 오류-빈발 빈도를 지닌 DNA 중합효소를 인코드하는 핵산 서열을 포함한, 생물체의 유전 형질을 조절하기 위한 핵산 분자

102. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소임을 특징으로 하는 핵산 분자

103. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자

104. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자

105. 제 101항목에 따른 핵산 분자를 포함한 벡터

106. 제 101항목에 따른 핵산 분자를 포함한 세포

107. 제 106항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 세포

108. 제 107항목에 있어서, 상기 진핵성 세포는 식물, 동물 및 효모로 구성된 군으로부터 선택됨을 특징으로 하는 세포

109. 제 106항목에 있어서, 상기 세포는 그람-양성 박테리아 세포임을 특징으로 하는 세포

110. 제 106항목에 있어서, 상기 세포는 유전 형질의 전환율을 조절하기 위해 이용됨을 특징으로 하는 방법

111. 제 101항목에 따른 핵산 분자를 포함한 생물체

112. 제 106항목에 따른 세포 또는 그의 일부에 의해 생성된 생성물 물질

113. 제 106항목에 따른 세포 또는 그의 일부에 포함된 핵산 분자

114. 조절된 유전 형질에 관련된 유전자를 인코드하는 제 113항목에 따른 핵산 분자

115. 질병 모델로서 제 106항목에 따른 세포를 이용하여 약물의 효과를 시험하는 단계;

대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및

질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법

116. 질병 모델로서 제 111항목에 따른 생물체를 이용하여 약물의 효과를 시험하는 단계;

117. 생물체의 유전 형질의 전환율을 조절하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트

118. 제 117항목에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트

119. 제 117항목에 있어서, 상기 중합효소 세트는 동일한 종으로부터 유래됨을 특징으로 하는 세트

120. 조절된 유전 형질을 지닌 생물체를 생성하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트

121. 제 120항목에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트

122. 제 121항목에 있어서, 상기 중합효소 세트는 동일한 생물체 종으로부터 유래됨을 특징으로 하는 세트

123. 생물체의 유전 형질의 전환율을 조절하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용

124. 조절된 유전 형질을 지닌 생물체를 생성하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용

따라서 여기에 기술된 본 발명은 자연 진화에 순응하여 생물체에 원하는 유전 형질을 부여하기 위한 방법을 제공하는 장점을 가능하게 한다.

본 발명의 이들 장점은 수반된 도면을 참조하여 하기 상세한 설명을 해석하고 이해함으로서 당업자에게 명백해질 것이다.

이하, 본 발명은 도면을 참조로 실시예를 통해 설명될 것이다.

본 명세서 전체를 통해 단수 형태 "a", "an" 및 "the"는 특별히 규정하지 않는 한 다수의 대상물을 포함함이 이해되어야 한다. 또한 여기에 사용된 용어는 언급되지 않는 한 일반적으로 사용되는 정의를 지님이 이해되어야 한다.

(용어)

하기 명세서 및 청구범위 내에서 하기 의미를 지니도록 정의된 많은 용어를 참조로 한다.

"생물체"라는 용어는 당분야에서 공표된 의미로 여기에 사용되고, 대표적으로 세포 구조, 증식(자가 재생산), 생장, 조절, 신진대사, 복구 능력 등과 같은 다양한 성질을 지닌 생명 과정을 수행하는 본체를 나타낸다. 일반적으로, 생물체는 핵산에 의해 제어되는 유전 및 단백질에 의해 제어되는 신진대사가 관련된 증식과 같은 기본 속성을 보유한다. 생물체는 바이러스, 원핵성 생물체, 진핵성 생물체(즉, 단세포 생물(즉, 효모 등) 및 다세포 생물(즉, 식물, 동물 등)) 등을 포함한다. 본 발명의 방법은 그람-양성 박테리아, 진핵성 생물체 등과 같은 고등생물을 포함한 어떠한 생물체에도 적용됨이 이해될 것이다.

"진핵성 생물체"라는 용어는 일반적으로 여기에 사용되고 핵 엔벨로프(envolope)를 지닌 뚜렷한 핵 구조를 지닌 생물체를 나타낸다. 진핵성 생물체의 예는 단세포 생물(즉, 효모 등), 식물(즉, 쌀, 밀, 옥수수, 대두 등), 동물(즉, 마우스, 래트, 소, 말, 돼지, 원숭이 등), 곤충(즉, 파리, 누에 등) 등을 포함하나 이에 한정적인 것은 아니다. 효모, 선충류, 과일 파리, 누에, 쌀, 밀, 대두, 옥수수, 아라비돕시스 탈리아나(Arabidopsis thaliana), 인간, 마우스, 래트, 소, 말, 돼지, 개구리, 물고기(즉, 제브라피쉬 등)가 여기서 모델로 사용되었으나 이에 한정적이지 않다.

여기에 사용된 바와 같이 "원핵성 생물체"라는 용어는 일반적 의미로 사용되고 뚜렷한 핵 구조를 지니지 않는 세포(들)로 구성된 생물체를 나타낸다. 원핵성 생물체의 예는 그람-음성 박테리아(즉, E. coli, 살모넬라 등), 그람-양성 박테리아(즉, 바실러스 섭틸리스, 방선균류, 스타필로코커스 등), 시아노박테리아, 수소 박테리아 등을 포함한다. 대표적으로 E. coli 이외에 그람-양성 박테리아가 여기에 사용되나 이에 한정적인 것은 아니다.

"단세포 생물"이라는 용어는 일반적 의미로 사용되고 하나의 세포로 구성된 생물체를 나타낸다. 단세포 생물은 진핵성 생물체와 원핵성 생물체 모두를 포함한다. 단세포 생물의 예는 박테리아(즉, E. coli, 바실러스 섭티리스 등), 효모, 사이노박테리아 등을 포함하나 이에 한정적인 것은 아니다.

여기에 사용된 바와 같이 "다세포 생물"이라는 용어는 다수의 세포로 구성된 개체 생물체를 나타낸다(일반적으로 다른 형태의 다수의 세포). 다세포 생물이 다른 형태의 세포로 구성되기 때문에 생물체의 생명 유지는 단세포 생물체와는 다른 항상성을 위한 높은 수준의 메카니즘을 요구한다. 대부분의 진핵성 생물체는 다세포 생물이다. 다세포 생물은 동물, 식물, 곤충 등을 포함한다. 놀랍게도 본 발명은 다세포 생물에 적용될 수 있음이 주지되어야 한다.

"동물"이라는 용어는 공표된 의미로 여기서 사용되고 척추동물 및 무척추동물(즉, 절지동물)을 나타낸다. 동물의 예는 포유강, 조강, 파충강, 양서강, 어강, 곤충강, 연충강(Vermes)을 포함하나 이에 한정적인 것은 아니다. 바람직하게는 동물은 척추동물(즉, 먹장어류, 페트로니조니포메스(Petronyzoniformes), 연골어류, 경골어류, 양서류, 파충류, 조류, 포유류 등)이나 이에 한정적인 것은 아니다. 특정한 실시태양에서 동물은 포유류(즉, 단공류, 유대류, 빈치류, 피익류, 익수류, 육식동물, 식충동물, 장비류, 기제류, 우제류, 투불리덴타타(tubulidentata), 유린류, 해우류, 고래류, 영장류, 설치류, 토끼류 등)이나 이에 한정적인 것은 아니다. 더욱 바람직하게는, 동물은 영장류(즉, 침팬지, 일본 원숭이, 인간) 또는 동물 모델(즉, 기제류, 우제류, 설치류(마우스 등), 토끼류 등)로 사용되는 어떠한 정이다. 본 발명은 본 발명의 방법이 어떠한 생물체에도 적용될 수 있음을 처음으로 증명하는 것이다.

여기에 사용된 바와 같이 "식물"이라는 용어는 엽록소, 단단한 세포벽, 풍부한 영구 배아 조직의 존재 및 운동력의 부재가 특징인 식물계에 속하는 어떠한 생물체도 나타낸다. 대표적으로 "식물"이라는 용어는 세포벽의 형성 및 엽록소에 의한 동화작용이 가능한 개화 식물을 나타낸다. "식물"이라는 용어는 어떠한 단자엽식물 및 쌍자엽식물도 나타낸다. 바람직한 식물은 쌀과(즉, 밀, 옥수수, 쌀, 보리, 사탕수수 등)의 단자엽식물과 같은 유용한 식물을 포함하나 이에 한정적인 것은 아니다. 바람직한 식물의 예는 담배, 피망, 가지, 메론, 토마토, 고구마, 양배추, 부추, 브로콜리, 당근, 오이, 감귤, 중국 양배추, 상추, 복숭아, 감자 및 사과를 포함한다. 바람직한 식물은 농작물에 한정적이지 않고 개화 식물, 나무, 잔디, 잡초 등을 포함한다. 규정하지 않는 한 "식물"이라는 용어는 식물체, 식물 기관, 식물 조직, 식물 세포 및 종자의 어떠한 것도 나타낸다. 식물 기관의 예는 뿌리, 잎, 줄기, 꽃 등을 포함한다. 식물 세포의 예는 캘러스, 부유 배양 세포 등을 포함한다. 본 발명은 본 발명의 방법이 어떠한 생물체에도 적용될 수 있음을 가장 먼저 증명한 것이다. 어떠한 생물체도 본 발명에 이용됨이 이해되어야 한다.

특정한 실시태양에서 본 발명에서 이용될 수 있는 식물 형태의 예는 가지과(Solanaceae), 화본과(Poaceae), 십자화과(Brassicaceae), 장미과(Rosaceae), 콩과(Leguminosae), 박과(Cucurbitaceae), 꿀풀과(Lamiaceae), 백합과(Liliaceae), 명아주과(Chenopodiaceae) 및 산형과(Umbelliferae)의 식물을 포함하나 이에 한정적인 것은 아니다.

여기에 사용된 "유전 형질"이라는 용어는 유전형이라고도 불리고, 유전자에 의해 제어되는 생물체의 형태학적 요소를 나타낸다. 유전 형질의 예는 예를 들어 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광파장, 전자파, 방사선, 중력, 장력, 음파, 다른 생물체, 화학제, 항생제, 천연물질, 정신적 스트레스, 물리적 스트레스 등과 같은 환경 파라미터에 대한 저항성을 포함하나 이에 한정적인 것은 아니다.

여기에 사용된 "유전자"라는 용어는 미리 결정된 길이의 서열을 지닌 세포 내에 존재하는 핵산을 나타낸다. 유전자는 유전 형질을 한정하거나 그렇지 않다. 여기에 사용된 "유전자"라는 용어는 일반적으로 게놈 내에 존재하는 서열을 나타내고 염색체 외부의 서열, 미토콘드리아 내 서열 등을 나타낸다. 유전자는 일반적으로 염색체 상의 제공된 서열 내에 배열된다. 단백질의 1차 구조를 한정하는 유전자는 구조 유전자로 불린다. 구조 유전자의 발현을 조절하는 유전자는 조절 유전자로 불린다(즉 프로모터). 여기서 유전자는 명시하지 않는 한 구조 유전자 및 조절 유전자를 포함한다. 따라서 예를 들어 "DNA 중합효소 유전자"라는 용어는 일반적으로 DNA 중합효소의 구조 유전자 및 그의 전사 및/또는 번역 조절 서열(즉, 프로모터)를 나타낸다. 본 발명에서 구조 유전자뿐만 아니라 전사 및/또는 번역의 조절 서열이 본 발명에 의해 타겟된 유전자로서 유용함이 이해될 것이다. 여기에 사용된 "유전자"는 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "핵산" 및 "핵산 분자" 및/또는 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드"를 나타낸다. 여기에 사용된 "유전자 생성물"은 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "핵산" 및 "핵산 분자" 및/또는 유전자에 의해 발현되는 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드" 포함한다. 본 설명에 따라 당업자는 유전자 생성물이 무엇인지 이해한다.

여기에 사용된 유전자에 관련한 "복제"라는 용어는 유전자 물질, DNA 또는 RNA가 그 자체의 사본을 재생산시키고, 모체 핵산 스트랜드(DNA 또는 RNA)이 모체 핵산과 동일한 구조 및 기능을 지닌 새로운 핵산 분자(각각 DNA 또는 RNA)를 형성하는 주형으로서 사용됨을 의미한다. 진핵세포에서 복제 효소(DNA 중합효소 α)를 포함한 복제 개시 복합체는 이중-스트랜드 DNA 분자 상의 많은 복제 기점(origin)에서 복제를 시작하도록 형성되고, 복제 반응은 복제의 기점으로부터 반대 방향으로 진행된다. 복제 개시는 세포 주기에 따라 제어된다. 효모에서 자발적 복제 서열은 복제의 기점으로 여겨진다. E. coli와 같은 원핵세포에서 복제 기점(ori)은 게놈 이중-스트랜드 원형 DNA 분자 상에 존재한다. 복제 개시 복합체는 ori에서 형성되고, 반응은 ori로부터 반대 방향으로 진행된다. 복제 개시 복합체는 복제 효소(DNA 중합효소 Ⅲ)을 포함한 10 이상의 단백질 요소를 포함한 복합 구조를 지닌다. 복제 반응시 이중-스트랜드 DNA의 나선형 구조는 부분적으로 다시 감기고; 짧은 DNA 프라이머가 합성되고; 새로운 DNA 스트랜드가 프라이머의 3'-OH 그룹으로부터 신장되고; Okazaki 단편이 상보성 스트랜드 주형상에서 합성되고; Okazaki 단편이 라이게이트되고; 프루프리딩이 수행되어 새롭게 복제된 스트랜드와 주형 스트랜드를 비교한다. 따라서 복제 반응은 많은 반응 단계를 통해 수행된다.

생물체의 유전 정보를 저장하는 게놈 DNA의 복제 메카니즘은 예를 들어 Kornberg A. and Baker T., "DNA Replication", New York, Freeman, 1992에 상세히 설명되어 있다. 일반적으로 상보성 스트랜드를 합성하여 이중-스트랜드 DNA를 형성하기 위해 주형으로서 DNA의 하나의 스트랜드를 이용하는 효소는 DNA 중합효소(DNA 복제 효소)라고 불린다. DNA 복제는 적어도 2종류 이상의 DNA 중합효소를 필요로한다. 일반적으로 이는 리딩 스트랜드 및 래깅 스트랜드가 동시에 합성되기 때문이다. DNA 복제는 복제 기점(ori)라고 불리는 DNA 상의 미리 결정된 위치로부터 시작된다. 예를 들어 박테리아는 그의 원형 게놈 DNA 상에 적어도 하나 이상의 양-방향 복제 기점을 지닌다. 따라서 그의 복제 동안 하나의 게놈 DNA 상에 동시에 작용하기 위해 일반적으로 4개의 DNA 중합효소가 필요하다. 본 발명에서 바람직하게는 복제 오류가 리딩 스트랜드 및 래깅 스트랜드 중 하나에서만 유리하게 조절되고, 또는 대안으로 2개의 스트랜드 사이의 복제 오류의 빈도 상의 차이가 유리하게 존재한다.

여기에 사용된 "복제 오류"라는 용어는 유전자(DNA 등)의 복제 동안 부정확한 뉴클레오타이드의 도입을 나타낸다. 일반적으로 복제 오류의 빈도는 10⁸∼10¹² 중 하나로 낮다. 복제 오류 빈도가 낮은 이유는 뉴클레오타이드 첨가가 복제 동안 주형 DNA와 도입된 뉴클레오타이드 사이의 상보적 염기쌍에 의해 결정되기 때문이다; DNA 중합효소 δ, ε 등의 효소의 3'→5' 엑소뉴클레아제 활성(프루프리딩 기능)이 주형에 상보적이지 않은 쌍을 이루지 않은 뉴클레오타이드를 확인하고 제거한다. 따라서 본 발명에서 복제시 오류-빈발 빈도의 조절은 특정한 염기쌍 형성, 프루프리딩 기능 등을 방해함으로서 수행될 수 있다.

여기에 사용된 유전 형질과 관련한 "전환율"이라는 용어는 본래 생물체의 재생산 또는 분열 후 본래 생물체와 그의 선구체 사이의 유전 형질에서 발생하는 차이의 비율을 나타낸다. 이러한 전환율은 예를 들어 분열 또는 재생산 당 유전 형질 내의 변화를 지닌 생물체 수에 의해 표현될 수 있다. 이러한 유전 형질의 전환율은 여기서 대안으로 "진화"로 표기된다.

여기에 사용된 유전 형질의 전환율과 관련한 "조절하다"라는 용어는 유전 형질의 전환율이 자연-발생적 인자가 아닌 인공적 조작에 의해 변화됨을 의미한다. 따라서 유전 형질의 전환율의 조절은 유전 형질의 전환율을 감소시키거나 촉진시키는 것을 포함한다. 생물체의 유전 형질의 전환율을 감소시킴으로서 생물체는 실질적으로 유전 형질을 변화시키지 않는다. 즉, 생물체의 유전 형질의 전환율을 감소시킴으로서 생물의 진화 속도가 저하된다. 반대로, 생물체의 유전 형질의 전환율을 촉진시킴으로서 생물체는 정상 수준보다 더 자주 유전 형질을 변화시킨다. 즉, 생물체의 유전 형질의 전환율을 촉진시킴으로서 생물체의 진화 속도가 증가된다.

여기에 사용된 "무-오류"라는 용어는 유전자의 복제시 오류가 거의 없거나 실질적으로 전혀 없는 성질을 나타낸다. 무-오류 수준은 프루프리딩 효소(즉, DNA 중합효소 δ 및 ε 등)의 프루프리딩 기능의 정확성에 의해 영향 받는다.

여기에 사용된 "오류-빈발"이라는 용어는 유전자(DNA 등)의 복제시 오류가 발생하기 쉬운(즉, 복제 오류가 발생하기 쉬운) 성질을 나타낸다. 오류-빈발 수준은 프루프리딩 효소(즉, DNA 중합효소 δ 및 ε 등)의 프루프리딩 기능의 정확성에 의해 영향 받는다.

오류-빈발 상태 및 무-오류 상태는 절대적으로 구별될 수 있고(즉, 오류-빈발 빈도의 수준 등으로 측정될 수 있다), 또는 대안으로 상대적으로 구별될 수 있다(즉, 유전자 복제시 중요한 역할을 하는 2 이상의 작용제가 구분될 때 더 높은 오류-빈발 빈도를 지닌 작용제는 오류-빈발 유전자로 분류되는 반면 더 낮은 오류-빈발 빈도를 지닌 작용제는 무-오류 작용제로 분류된다).

여기에 사용된 "오류-빈발 빈도"라는 용어는 오류-빈발 성질의 수준을 나타낸다. 오류-빈발 빈도는 예를 들어 유전자 서열 내 돌연변이의 절대적 수(돌연변이 자체 수) 또는 유전자 서열 내 돌연변이의 상대적 수(전체 길이에 대한 돌연변이 수의 비율)에 의해 표현될 수 있다. 대안으로, 특정한 생물체 또는 효소를 언급시 오류-빈발 빈도는 그의 하나의 재생산 또는 분열 당 유전자 서열 내 돌연변이의 절대 수 또는 상대 수에 의해 표현된다. 언급하지 않는 한 오류-빈발 빈도는 하나의 복제 과정시 유전자 서열 내 오류 수에 의해 표현된다. 여기서 오류-빈발 빈도는 역 치수로서 "정확성"으로 표기된다. 균일한 오류-빈발 빈도는 다수의 유전자의 복제시 중요한 역할을 하는 작용제(중합효소 등)가 논의될 때 그의 오류-빈발 빈도는 서로 실질적으로 동일함을 의미한다. 반대로, 이질성 오류-빈발 빈도는 오류-빈발 빈도 상의 유의적인 차이가 다수의 유전자의 복제시 중요한 역할을 하는 다수의 작용제(중합효소 등) 중에 존재함을 의미한다.

여기에 사용된 오류-빈발 빈도와 관련한 "조절하다"라는 용어는 오류-빈발 빈도가 변화됨을 의미한다. 이러한 오류-빈발 빈도의 조절은 오류-빈발 빈도의 증가 및 감소를 포함한다. 오류-빈발 빈도를 조절하는 방법의 예는 프루프리딩 기능을 지닌 DNA 중합효소의 변형, 복제 동안 중합반응 또는 연장반응을 저해하거나 억제할 수 있는 작용제의 삽입, 이들 반응을 증진시키는 인자의 저해 또는 억제, 하나 이상의 염기의 삭제, 이중 DNA 복구 효소의 부재, 비정상 염기를 제거할 수 있는 복구 작용제의 변형, 미스매치된 염기쌍을 복구할 수 있는 복구 작용제의 변형, 복제 자체의 정확성의 감소를 포함하나 이에 한정적인 것은 아니다. 오류-빈발 빈도의 조절은 이중-스트랜드 DNA의 양쪽 스트랜드 또는 하나의 스트랜드 상에서 수행된다. 바람직하게는 오류-빈발 빈도의 조절은 하나의 스트랜드 상에서 유리하게 수행된다. 이는 불리한 돌연변이유발이 감소되기 때문이다.

여기에 사용된 "DNA 중합효소" 또는 "Pol"이라는 용어는 DNA를 중합시키기 위해 4개의 디옥시리보뉴클레오타이드 5'-트리포스페이트로부터 피로인산을 유리시키는 효소를 나타낸다. DNA 중합효소 반응은 주형 DNA, 프라이머 분자, Mg²⁺ 등을 요구한다. 상보적 뉴클레오타이드는 실질적으로 프라이머의 3'-OH 말단에 첨가되어 분자 체인을 연장시킨다.

E. coli가 적어도 3개 이상의 DNA 중합효소 Ⅰ, Ⅱ 및 Ⅲ를 보유한 것으로 알려져 있다. DNA 중합효소 Ⅰ은 손상된 DNA의 복구, 유전자 재조합 및 DNA 복제에 관련된다. DNA 중합효소 Ⅱ 및 Ⅲ은 보조적 기능을 지닌 것으로 여겨진다. 이들 효소 각각은 여러 단백질을 포함한 서브유니트 구조를 지니고 구조에 따라 핵심 효소(core enzyme) 또는 홀로효소(holoenzyme)으로 나뉜다. 핵심 효소는 α, ε 및 θ 서브유니트로 구성된다. 홀로효소는 α, ε 및 θ 서브유니트 이외에 τ, γ, δ 및 β 구성성분을 포함한다. 진핵세포는 다수의 DNA 중합효소를 지니는 것으로 알려져 있다. 고등생물에서는 다수의 DNA 중합효소 α, β, γ, δ, ε 등이 있다. 동물에서는 알려진 중합효소가 있다: 핵 DNA의 복제에 관련되고 세포 생장기에서 DNA 복제시 중요한 역할을 하는 DNA 중합효소 α; 핵 내의 DNA 복구에 관련되고 생장기 또는 휴지기에서 손상된 DNA의 복구에 중요한 역할을 하는 DNA 중합효소 β; 미토콘드리아 DNA의 복제 및 복구에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 γ; DNA 연장에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 δ; 래깅 스트랜드 사이의 갭의 복제에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 ε.

그람-양성 박테리아, 그람-음성 박테리아, 진핵성 생물체 등의 프루프리딩 기능을 지닌 DNA 중합효소에서 ExoI 모티프를 지닌 아미노산 서열이 3'→5' 엑소뉴클레아제 활성 센터에 중요한 역할을 하고 프루프리딩 기능의 정확성에 영향을 미치는 것으로 여겨진다.

서열번호 5 : DnaQ: 8-QIVLDTETTGMN-19 (Escherichia coli);

서열번호 6 : DnaQ: 7-QIVLDTETTGMN-18 (Haemophilus influenzae);

서열번호 7 : DnaQ: 8-QIVLDTETTGMN-19 (Salmonella typhimurium);

서열번호 8 : DnaQ: 12-IVVLDTETTGMN-23 (Vibrio cholerae);

서열번호 9 : DnaQ: 3-SVVLDTETTGMP-14 (Pseudomonas aeruginosa);

서열번호 10 : DnaQ: 5-QIILDTETTGLY-16 (Neisseria meningitidis);

서열번호 11 : DnaQ: 9-FVCLDCETTGLD-20 (Chlamydia trachomatis);

서열번호 12 : DnaQ: 9-LAAFDTETTGVD-20 (Streptomyces coelicolor);

서열번호 13 : DnaQ: 11-QIVLDTETTGMN-22 (Shigella flexneri 2a str. 301);

서열번호 14 : PolC: 420-YVVFDVETTGLS-431 (Staphylococcus aureus);

서열번호 15 : PolC: 421-YVVFDVETTGLS-432 (Bacillus subtilis);

서열번호 16 : PolC: 404-YVVYDIETTGLS-415 (Mycoplasma pulmonis);

서열번호 17 : PolC: 416-FVIFDIETTGLH-427 (Mycoplasma genitalium);

서열번호 18 : PolC: 408-FVIFDIETTGLH-419 (Mycoplasma pneumoniae);

서열번호 19 : Pol Ⅲ: 317-IMSFDIECAGRI-328 (Saccharomyces cerevisiae);

서열번호 20 : Pol Ⅲ: 286-VMAFDIETTKPP-297 (Saccharomyces cerevisiae);

서열번호 21 : Pol δ: 310-VLSFDIECAGRK-321 (마우스);

서열번호 22 : Pol ε: 271-VLAFDIETTKLP-282 (마우스);

서열번호 23 : Pol δ: 312-VLSFDIECAGRK-323 (인간);

서열번호 24 : Pol ε: 271-VLAFDIETTKLP-282 (인간);

서열번호 25 : Pol δ: 316-ILSFDIECAGRK-327 (쌀);

서열번호 26 : Pol δ: 306-VLSFDIECAGRK-317 (Arabidopsis thaliana);

서열번호 27 : Pol ε: 235-VCAFDIETVKLP-246 (Arabidopsis thaliana);

서열번호 28 : Pol δ: 308-VLSFDIECAGRK-319 (래트);

서열번호 29 : Pol δ: 311-VLSFDIECAGRK-322 (소);

서열번호 30 : Pol δ: 273-ILSFDIECAGRK-284 (대두);

서열번호 31 : Pol δ: 296-ILSFDIECAGRK-307 (과일 파리); 및

서열번호 32 : Pol ε: 269-VLAFDIETTKLP-280 (과일 파리);

명백하게는, 프루프리딩 기능을 지닌 DNA 중합효소는 잘 보존된 아스파르트산(즉, 인간 DNA 중합효소 δ 내 316 위치) 및 글루탐산(즉, 인간 DNA 중합효소 δ 내 318 위치)을 지닌다. 이러한 아스파르트산 및 글루탐산을 포함한 구역은 여기서 프루프리딩 기능 활성 사이트로 여겨진다.

E. coli와 같은 그람-음성 박테리아에는 2개의 DNA 중합효소 단백질 즉, 엑소뉴클레아제 활서을 지닌 분자 및 DNA 중합효소 합성 활성을 지닌 분자가 있다. 따라서 엑소뉴클레아제 활성을 조절함으로서 프루프리딩 기능이 조절될 수 있다.

그러나 진핵성 생물체(즉, 효모, 동물, 식물 등) 뿐만 아니라 그람-양성 박테리아(즉, B. subtilis 등)에는 하나의 DNA 중합효소가 DNA 합성 활성과 엑소뉴클레아제 활성 둘 모두를 지닌다. 따라서 프루프리딩 기능을 조절하기 위해 정상 DNA 합성 활성을 유지하는 동안 엑소뉴클레아제 활성을 조절하는 분자가 요구된다. 본 발명은 정상 DNA 합성 활성을 유지하는 동안 엑소뉴클레아제 활성을 조절할 수 있고 생물체의 진화에 이용될 수 있는 진핵성 생물체 및 그람-양성 박테리아의 DNA 중합효소 변이체를 제공한다. 이로 인해 E. coli와 다르고 예측되지 않았던 효과가 달성되었다. 따라서 본 발명은 상기-기술된 프루프리딩 기능 활성 사이트가 진핵성 생물체 및 그람-양성 박테리아, 특히 진핵성 생물체에서 예상외로 명기되었음을 발견함으로서 일부 달성된 것으로 여겨질 수 있다. 더욱이 본 발명의 유의적인 효과는 하기 실시예에서 예상외로 나타난 유전 형질의 획득이다.

많은 오류-빈발 DNA 중합효소가 인간뿐만 아니라 박테리아에서 발견되었다. 많은 복제성 DNA 중합효소는 일반적으로 프루프리딩 기능을 지닌다 즉, 3'→5' 엑소뉴클레아제 활성에 의해 오류를 제거하여 무-오류 복제를 수행한다. 그러나 오류-빈발 DNA 중합효소는 프루프리딩 기능을 지니지 않고 DNA 손상을 우회할 수 없고, 따라서 돌연변이를 유발한다. 오류-빈발 DNA 중합효소의 존재는 암의 발병, 진화, 항체 진화 등에 관련된다. 많은 DNA 중합효소는 오류-빈발이 되는 가능성을 지닌다. 그의 프루프리딩 기능을 분열시킴으로서 이들 DNA 중합효소는 오류-빈발이 될 수 있다. 따라서 복제의 정확성은 상기-기술된 프루프리딩 기능 활성 사이트를 변형시킴으로서 조절될 수 있다. 이러한 모델을 이용함으로서 한번 획득된 새로운 특성은 비정상없이 유리하게 진화될 수 있다. 이러한 점에서 본래 불일치 모델과 비교시 예상되지 않은 장점 및 효과는 획득될 수 있다.

유전적 다양성(quasispecies) 이론에서 Eigen은 오류-빈발 복제만이 고려된 진화 모델을 주장한다(M. Eigen, Naturwissenschaften 58, 465(1971)). 유전적 다양성 이론은 다양한 변형을 이용한다. 유전적 다양성은 가장 잘 맞는 서열의 안정한 앙상블로서 정의될 수 있고, 그의 돌연변이체는 선택적으로 서열 공간 내 가장 잘 맞는 서열 주변에 분포된다. 자연적 선택은 단일 서열이 아닌 전체 유전적 다양성 분포에서 발생하는 것으로 보인다. 유전적 다양성의 진화는 하기와 같이 발생한다: 주요 서열보다 더 높은 적합성을 지닌 돌연변이체가 유전적 다양성에 나타나고, 이러한 돌연변이체는 선택적으로 오래된 주요 서열을 복제하고, 이후 새로운 유전적 다양성 분포가 돌연변이체 주변을 조직한다.

유전적 다양성 이론은 유전 정보를 유지하기 위한 오류 역치가 존재함을 예측하고 결정하였다. 따라서 통상적으로 유전적 다양성은 이러한 역치하에서만 진화한다고 여겨진다(M. Eigen et al., Adv. Chem. Phys. 75, 149 (1989)). 이는 진화율의 상한선이 오류 역치의 상한선에 의해 한정됨을 의미한다. 유전적 다양성 이론은 오류 역치 가까이의 높은 비율로 진화하는 RNA 바이러스의 연구로 증명된 것을 보인다. 그러나 돌연변이화된 작용제의 표현형 내의 오류율의 증가를 지닌 작용제는 이러한 과정에서 중요한 역할을 하는 것으로 여겨진다.

박테리아 게놈이 단일 복제 기점을 지니는 반면 진핵성 생물체의 게놈은 다수의 복제 기점을 지닌다. 이는 게놈의 서열이 다수의 복제 유니트(복제 작용제, 레플리코어)를 포함함을 의미한다. 따라서 다수의 중합효소는 게놈 복제에 동시에 참여한다. 본 발명에서 오류 역치 상의 다수의 복제 작용제의 영향이 고려된다.

하나의 바람직한 실시태양에서 DNA 중합효소를 인코드하는 유전자 내로 3'→5' 엑소뉴클레아제 활성을 분열시킬 수 있는 돌연변이를 도입시킴으로서 감소된 프루프리딩 기능(즉, 높은 오류-빈발 빈도)을 지닌 DNA 중합효소를 인코드하는 핵산 분자 및 폴리펩타이드가 제공될 수 있다. 단일 DNA 중합효소 유전자(PolC, POL2, CDC2 등)에서 3'→5' 엑소뉴클레아제 활성(프루프리딩 기능)이 DNA 중합반응 활성을 지닌 분자 내에 포함되거나(즉, 진핵성 생물체, 그람-양성 박테리아 등) DNA 중합반응 활성을 인코드하는 유전자(즉, dnaE)와 다른 유전자(dnaQ)에 의해 인코드됨이(즉, 그람-음성 박테리아 등) 주지해야 한다(Kornberg A. and Baker T., "DNA Replication", New York, Freeman, 1992). 상기-기술된 특성의 이해에 기반하여 당업자는 본 발명에 따른 오류-빈발 빈도를 조절할 수 있다. 예를 들어 진핵성 생물체에서 DNA 중합효소 내로 DNA 중합반응 활성이 아닌 프루프리딩 기능을 실질적으로 변화시키는 돌연변이를 도입시키는 것이 바람직하다. 이러한 경우 상기-기술된 프루프리딩 기능과 관련된 2개의 산성 아미노산이 변형된다(바람직하게는 비-보존적 치환(즉, 알라닌, 발린 등의 치환))(Derbyshire et al., EMBO J. 10, pp. 17-24, Jan. 1991; Fijalkowska and Schaaper, "Mutants in the Exo I motif of Escherichia coli danQ: Defective proofreading and inviability due to error catastrophe", Proc. Natl. Acad. Sci. USA, Vol. 93, pp. 2856-2861, Apr. 1996). 본 발명은 이에 한정적이지 않다.

여기에 사용된 "프루프리딩 기능"이라는 용어는 세포의 DNA 내의 손상 및/또는 오류를 감지하고 복구하는 기능을 나타낸다. 이러한 기능은 아퓨린 사이트(apurinic site) 또는 아피리미딘 사이트(apyrimidinic site)에서 염기를 삽입시킴으로서 또는 대안으로 아퓨린-아피리미딘(A-P) 엔도뉴클레아제로 하나의 스트랜드를 분열시킨 후 5'→3' 엑소뉴클레아제로 사이트를 제거시킴으로서 달성된다. 제고된 부분에서 DNA는 합성되고 DNA 중합효소가 보충되고 합성된 DNA는 DNA 리가제에 의해 정상 DNA와 라이게이트된다. 이러한 반응은 절제 복구(excision repair)로 불린다. 알킬화제, 비정상 염기, 방사선, 자외선에 의한 손상된 DNA의 경우 손상된 부분은 복구가 상기-기술된 반응에 의해 수행되기 전에 DNA 글리코시다제로 제거된다(예정되지 않은 DNA 합성). 이러한 프루프리딩 기능을 지닌 DNA 중합효소의 예는 진핵성 생물체의 DNA 중합효소 δ, DNA 중합효소 ε 등을 포함하나 이에 한정적인 것은 아니다. 여기에 사용된 "정확도"라는 용어는 프루프리딩 기능 수준을 나타내는데 사용된다. "정확도"라는 용어는 DNA 복제 정확성을 나타낸다. 정상 DNA 중합효소는 일반적으로 높은 수준의 정확도를 지닌다. 변형에 의해 감소된 프루프리딩 기능을 지닌 DNA 중합효소는 낮은 수준의 정확도를 지닌다.

DNA 중합효소의 상기-기술된 프루프리딩 기능은 예를 들어 Kukel, T.A.: J. Biol. Chem., 260, 12866-12874(1985); Kunkel, T.A., Sabotino, R.D. & Bambara, R.A.: Proc, Natl., Acad. Sci. USA, 84, 4865-4869(1987); Wu. C.I. & Maeda, N.: Nature, 327, 167-170(1987); Roberts, J.D. & Kunkel. T.A.: Proc. Natl. Acad. Sci. USA, 85, 7064-7068(1988); Thomas, D.C., Fitzgerald, M.P. & Kunkel. T.A.: Basic Life Science, 52, 287-297(1990); Trinh, T.Q. & Siden, R.R., Nature, 352, 544-547(1991); Weston-Hafer, K. & Berg, D.E., Genetics, 127, 649-655(1991); Veaute, X. & Fuchs, R.P.P.: Science, 261, 598-600(1993); Roberts, J.D., Izuta, S., Thomas, D.C. & Kunkel, T.A.: J. Biol. Chem., 269-1711-1717(1994); Roch, W.A., Trinh, T.Q. & Siden, R.R., J. Bacteriol., 177, 4385-4391(1995); Kang S., Jaworski, A., Ohshirna, K. & Wells, Nat. Genet., 10, 213-218(1995); Fijalkowska. I.J., Jonczyk, P., Maliszewska-Tkaczyk, M., Bialoskorska, M. & Schaaper, R.M., Proc. Natl. Acad. Sci. USA., 95, 10020-10025(1998); Maliszewska-Tkaczyk, M., Bialoskorska, M. & Schaaper, R.M., Proc. Natl. Acad. Sci. USA., 97, 12678-12683(2000); Gwel, D., Jonezyk, P., Bialoskorska, M., Schaaper, R.M. & Fijalkowska, I.J.: Mutation Research, 501, 129-136(2002); Roberts, J.D., Thomas, D.C. & Kunkel. T.A.: Proc. Natl. Acad. Sci. USA, 88, 3465-3469(1991); Roberts, J.D., Nguyen, D. & Kunkel, T.A.: Biochemistry, 32, 4083-4089(1993); Francino, M.P., Chac, L., Riley, M.A. & Ochman, H.: Science, 272, 107-109(1996); A. Boulet, M. Simon, G. Faye, G.A. Bauer & P.M. Burgers, EMBO J., 8, 1849-1854(1989); Morrison A., Araki H., Clark A.B., Hamtake R.K., & Sugino A., Cell, 62(6), 1143-1151(1990) 등에 기술되어 있다.

여기에 사용된 진핵성 생물체의 "DNA 중합효소 δ"라는 용어는 프루프리딩 기능을 유도하는 엑소뉴클레아제 활성을 지니는 것으로 여겨지는 DNA 연장에 관련된 효소를 나타낸다. 대표적 DNA 중합효소 δ는 서열번호 1 및 2(핵산 서열 및 아미노산 서열 각각; polδ: X61920gi/171411/gb/M61710.1/YSCDPB2[171411])에 나타난 서열을 지닌다. 이러한 DNA 중합효소 δ의 프루프리딩 기능은 서열번호 2에 나타난 아미노산 서열의 322 위치에서 아미노산을 변형시킴으로서 조절될 수 있다. DNA 중합효소 δ는 참고문헌에 포함된 Simon, M. et al., EMBO J., 10, 2163-2170, 1991에 기술되어 있다. DNA 중합효소 δ의 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)(서열번호: 45), 쌀(서열번호: 47 및 48), 대두(서열번호: 49 및 50), 인간(서열번호: 51 및 52), 마우스(서열번호: 55 및 56), 래트(서열번호: 59 및 60), 소(서열번호: 61 및 62), 과일 파리(서열번호: 63 및 64)의 것을 포함하나 이에 한정적인 것은 아니다.

여기에 사용된 진핵성 생물체의 "DNA 중합효소 ε"는 프루프리딩 기능을 유도하는 엑소뉴클레아제 활성을 지닌, 래깅 스트랜드 사이의 갭의 복제에 관련된 효소를 나타낸다. 대표적인 DNA 중합효소 ε는 서열번호 3 및 4(핵산 서열 및 아미노산 서열, 각각; polε: M60416gi/171408/gb/M60416.1/YSCDNA[171408])에 나타난 서열을 지닌다. DNA 중합효소 ε의 프루프리딩 기능은 서열번호 4에 나타난 아미노산 서열의 391 위치에서 아미노산을 변형시킴으로서 조절될 수 있다. DNA 중합효소 ε는 예를 들어 참고문헌에 포함된 Morrison, A. et al., MGG. 242, 289-296, 1994; Araki H., et al., Nucleic Acids Res. 19, 4857-4872, 1991; 및 Ohya T., et al., Nucleic Acids Res. 28, 3846-3852, 2000에 기술되어 있다. DNA 중합효소 ε의 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)(서열번호: 46), 쌀(서열번호: 47 및 48), 인간(서열번호: 53 및 54), 마우스(서열번호: 57 및 58), 래트(서열번호: 59 및 60), 과일 파리(서열번호: 65 및 66)의 것을 포함하나 이에 한정적인 것은 아니다.

DNA 중합효소 δ 및 ε는 HUGO 카테고리에 따라 각각 POLD1/POL3 및 POLE/POL2로 표기된다. 두 용어 모두 여기에 사용된다.

다른 DNA 중합효소는 예를 들어 참고문헌에 포함된 Lawrence C.W. et al., J. Mol. Biol., 122, 1-21, 1978; Lawrence C.W. et al., Genetics 92, 397-408; Lawrence C.W. et al., MGG, 195, 487-490, 1984; Lawrence C.W. et al., MGG. 200, 86-91, 1985(DNA 중합효소 β 및 DNA 중합효소 ξ); Maher V.M. et al., Nature 261, 593-595, 1976; McGregor, W.G. et al., Mol. Cell. Biol. 19, 147-154, 1999 (DNA 중합효소 η); Strand M. et al., Nature 365, 275-276, 1993; Prolla T.A., et al., Mol. Cell. Biol. 15, 407-415, 1994; Kat A., et al., Proc. Natl. Acad. Sci. USA 90, 6424-6428; Bhattacharyya N.P., et al., Proc. Natl. Acad. Sci. USA 91, 6319-6323, 1994; Faber F.A., et al., Hum. Mol. Genet. 3, 253-256, 1994; Eshleman, J.R. et al., Oncogene 10, 33-37, 1995; Morrison A. et al, Proc. Natl. Acad. Sci. USA 88, 9473-9477, 1991; Morrison A., et al., EMBO J. 12, 1467-1473, 1993; Foury F., et al., EMBO J. 11, 2717-27256, 1992 (DNA 중합효소 λ, DNA 중합효소 μ 등)에 기술되어 있다.

여기에 사용된 DNA 중합효소를 인코드하는 유전자 및 생물체(즉, 효모 등)와 관련한 "야생형"이라는 용어는 공표된 의미로 DNA 중합효소를 인코드하는 자연-발생적 유전자 및 생물체(즉, 효모 등)가 유래된 종의 대부분의 멤버의 특성인 형태를 나타낸다. 따라서 일반적으로 특정한 종에서 처음으로 확인된 DNA 중합효소를 인코드하는 유전자 및 생물체(즉, 효모 등)의 형태가 야생형이라고 할 수 있다. 또한 야생형은 "자연 표준형"으로도 표기된다. 야생형 DNA 중합효소 δ는 서열번호 1 및 2에 나타난 서열을 지닌다. 야생형 DNA 중합효소 ε는 서열번호 3 및 44에 나타난 서열을 지닌다. 서열번호 41 내지 66에 나타난 서열을 지닌 DNA 중합효소도 야생형이다. 야생형 생물체는 일반적 효소 활성, 일반적 형질, 일반적 흡성, 일반적 생리기능, 일반적 재생산 및 일반적 게놈을 지닌다.

여기에 사용된 효소의 프루프리딩 기능과 관련한 "야생형보다 더 낮은"이라는 용어는 효소의 프루프리딩 기능이 야생형 효소보다 더 낮음(즉, 효소의 프루프리딩 과정 후 유지되는 돌연변이의 수가 야생형 효소보다 더 큼)을 의미한다. 야생형과의 비교는 상대적 또는 절대적 표현에 의해 수행될 수 있다. 이러한 비교는 오류-빈발 빈도를 이용하여 수행될 수 있다.

여기에 사용된 유전자와 관련한 "돌연변이"라는 용어는 유전자의 서열이 변화된 것을 의미하거나 유전자의 변화된 핵산 서열 또는 아미노산 서열의 상태를 나타낸다. 예를 들어 여기서 "돌연변이"라는 용어는 프루프리딩 기능의 변화를 유도하는 유전자 서열 내의 변화를 나타낸다. 한정하지 않는 한 "돌연변이" 및 "변이"라는 용어는 명세서에서 동일한 의미를 지닌다.

유용한 돌연변이체를 생성하기 위해 돌연변이유발이 생물체에 가장 일반적으로 수행된다. "돌연변이"라는 용어는 DNA 서열의 변화를 포함하여 유전자를 인코드하는 염기 서열 내 변화를 나타낸다. 돌연변이는 돌연변이를 지닌 개체 상의 그의 영향에 따라 하기 3가지 그룹으로 크게 분류된다: A) 중립 돌연변이(대부분의 돌연변이가 본 그룹으로 분류되고, 생물체의 생장 및 신진대사에 실질적으로 어떠한 영향도 존재하지 않는다); B) 유해성 돌연변이(그의 빈도는 중립 돌연변이보다 더 낮다). 이러한 형태의 돌연변이는 생물체의 생장 및 신진대사를 저해한다. 유해성 돌연변이는 생장에 필수적인 유전자를 분열시키는 치사성 돌연변이를 포함한다. 미생물의 경우 유해성 돌연변이의 비율은 종에 따라 다르나 일반적으로 총 돌연변이의 약 1/10 내지 1/100이다; C) 유익성 돌연변이(본 돌연변이는 생물체 번식에 유익하다). 발생 빈도는 중립 돌연변이에 비교하여 매우 낮다. 따라서 유익성 돌연변이를 지닌 개체 생물체를 수득하기 위해서는 생물체의 큰 집단 및 장기간이 요구된다. 생물체의 번식에 충분한 효과는 단일 돌연변이에 의헤서는 거의 획득되지 않고 종종 다수의 유익성 돌연변이의 축적을 필요로 한다.

여기에 사용된 특정한 생물체와 관련한 "생장"이라는 용어는 개체 생물체 내의 양적 증가를 나타낸다. 생물체의 생장은 신체 크기(신체 높이), 체중 등과 같은 측정된 수치의 양적 증가에 의해 인식될 수 있다. 개체 내 양적 증가는 각 세포의 증가 및 세포수의 증가에 따라 달라진다.

여기에 사용된 생물체와 관련한 "실질적으로 동일한 생장"은 생물체의 생장률이 참조 생물체(즉, 형질전환전 생물체)와 비교시 실질적으로 변화되지 않았음을 의미한다. 생장률이 실질적으로 변화되지 않은 범위의 예는 일반적 생장의 통계적 분포 내 1 편차의 범위를 포함하나 이에 한정적인 것은 아니다. 본 발명의 생물체에서 "실질적으로 동일한 생장"이라는 용어는 예를 들어 (1) 선구체의 수가 실질적으로 변화되지 않고; (2) 형태가 변화되더라도 일반적인 인공 돌연변이와 다른 어떠한 장애도 실질적으로 생성되지 않음을 의미한다. 매우 높은 돌연변이율에도 불구하고 외형이 "아름다운" 것으로 인식되고(이러한 특징이 생장에 직접적으로 관련되지 않더라도 본 특징은 본 발명의 방법에 의해 생성된 돌연변이체의 특성임); (3) 한번 획득된 형질, 유전형 또는 표현형은 퇴화하지 않는다.

여기에 사용된 "약물 저항성"이라는 용어는 박테리오파지, 박테리오신과 같은 생리적 활성 물질을 포함한 약물에 대한 내성 또는 저항성을 나타낸다. 약물 저항성은 약물에 대한 그의 수용체가 변화되거나 약물 작용에 관련된 하나 이상의 다양한 과정이 변화될 때 민감한 숙주에 의해 획득된다. 대안으로, 민감한 숙주가 항생제 자체를 불활성화시키는 능력을 획득하면 약물 저항성이 수득된다. 약물 저항성 생물체에 있어서 염색체 DNA 내의 돌연변이는 약물이 작용하는 효소 및/또는 리보솜 단백질을 변화시켜서 일반적 농도를 지닌 약물은 더 이상 효과적이지 않게 된다. 대안으로, 생물체는 다른 생물체로부터의 약물 저항성 플라스미드(즉, R 플라스미드)를 획득하여 약물을 불활성화시키는 능력을 지닌 효소가 수득된다. 대안으로 약물의 멤브레인 투과성이 감소되어 약물에 대한 저항성이 획득된다. 본 발명은 이에 한정적인 것은 아니다.

여기에 사용된 "암세포"라는 용어는 육종을 포함한 "악성 종양 세포"라는 용어와 동일한 의미를 지니고 영구적인 증식 능력을 지니고 불멸인 세포를 나타낸다. 암세포는 하기 방식으로 영구적 증식 능력을 획득하고 불멸이 된다. 특정한 비가역적 변화가 유전자 수준에서 정상 세포에 생성된다. 그 결과로서 정상 세포는 비정상 세포 즉, 암세포로 형질전환된다.

여기에 사용된 생물체와 관련한 "생성"이라는 용어는 개체 생물체가 생성됨을 의미한다.

여기에 사용된 생물체와 관련한 "재생산"이라는 용어는 다음 세대의 새로운 개체가 부모 개체로부터 생성됨을 의미한다. 재생산은 자연적 증가, 증식 등; 클로닝 기술(핵이식 등)과 같은 인공적 기술에 의한 인공적 증가, 증식 등을 포함하나 이에 한정적인 것은 아니다. 재생산 기술의 예는 식물의 경우 단일 세포의 배양; 절단체의 이식; 절단체의 정착 등을 포함하나 이에 한정적인 것은 아니다. 재생산된 생물체는 일반적으로 그의 부모로부터 유래된 유전 형질을 지닌다. 유성적으로 재생산된 생물체는 일반적으로 2개의 성으로부터 유래된 유전 형질을 지닌다. 일반적으로 이들 유전 형질은 실질적으로 동일한 비율로 2개의 성으로부터 유래된다. 무성적으로 재생산된 생물체는 그의 부모로부터 유래된 유전 형질을 지닌다.

"세포"라는 용어는 여기서 공표된 의미로 사용되고 자가 복제할 수 있고 이를 발현하기 위한 유전 정보 및 메카니즘을 지니고 외부로부터 생명체를 구분시키는 멤브레인 구조에 의해 둘러싸인 다세포 생물체 조직의 구조적 단위를 나타낸다. 여기에 사용된 세포는 자연-발생적 세포 또는 인공적으로 변형된 세포(즉, 융합세포, 유전적으로 변형된 세포 등)이다. 세포 급원의 예는 단일세포 배양, 배아, 정상적으로 생장된 형질전환 동물의 혈액 또는 신체 조직, 정상적으로 생장된 세포주로부터의 세포와 같은 세포 혼합물 등을 포함하나 이에 한정적인 것은 아니다.

본 발명에 이용되는 세포는 어떠한 생물체(즉, 어떠한 단세포 생물(즉, 박테리아, 효모 등) 또는 어떠한 다세포 생물(즉, 동물(척추동물, 무척추동물), 식물(즉, 단자엽식물, 쌍자엽식물 등))로부터도 유래된다. 예를 들어 척추동물(즉, 먹장어류, 페트로니조니포메스, 연골어류, 경골어류, 양서류, 파충류, 조류, 포유류 등)로부터 유래된 세포가 이용된다. 특히, 포유류(즉, 단공류, 유대류, 빈치류, 피익류, 익수류, 육식동물, 식충동물, 장비류, 기제류, 우제류, 투불리덴타타(tubulidentata), 유린류, 해우류, 고래류, 영장류, 설치류, 토끼류 등)로부터 유래된 세포가 이용된다. 하나의 실시태양에서 영장류(즉, 침팬지, 일본 원숭이, 인간), 특히 인간으로부터 유래된 세포가 이용된다. 본 발명은 이에 한정적인 것은 아니다. 본 발명에 이용되는 세포는 줄기세포 또는 체세포이다. 상기-기술된 세포는 조작의 목적으로 이용된다. 개화 식물(즉, 단자엽식물 또는 쌍자엽식물)로부터 유래된 세포가 이용된다. 바람직하게는 쌍자엽식물이 이용된다. 더욱 바람직하게는 벼과(Gramineae) 가지과(Solanaceae), 박과(Cucurbitaceae), 십자화과(Crucifera), 산형과(Umbelliferae), 장미과(Rosaceae), 콩과(Leguminosae), 지치과(Boraginaceae)로부터의 세포가 이용된다. 바람직하게는 밀, 옥수수, 쌀, 보리, 사탕수수, 담배, 피망, 가지, 메론, 토마토, 딸기, 고구마, 브라시카(Brassica), 양배추, 부추, 브로콜리, 대두, 알팔파, 아마, 당근, 오이, 감귤, 중국 양배추, 상추, 복숭아, 감자, 지치(Lithospermum eythrohizon), 콥티스 리조메(Coptis rhizome), 포플라 및 사과로부터 유래된 세포가 이용된다. 식물 세포는 식물체 일부, 기관, 조직, 배양 세포 등이다. 세포, 조직, 기관 또는 개체를 형질전환시키는 기술은 당분야에 잘 알려져 있다. 이들 기술은 여기에 인용된 문헌에 잘 기술되어 있다. 핵산 분자는 생물체 세포 내로 일시적으로 또는 안정적으로 도입된다. 유전자를 일시적으로 또는 안정적으로 도입시키는 기술은 당분야에 잘 알려져 있다. 형질전환 식물을 생성하기 위해 본 발명에서 이용되는 세포를 분화시키는 기술은 당분야에 잘 알려져 있다. 이들 기술은 인용된 문헌에 잘 기술되어 있음이 이해될 것이다. 형질전환 식물로부터 종자를 수득하는 기술은 당분야에 잘 알려져 있다. 이들 기술은 여기에 논의된 문헌에 기술되어 있다.

여기에 사용된 "줄기세포"라는 용어는 자가 복제 및 다능성이 가능한 세포를 나타낸다. 일반적으로 줄기세포는 손상된 조직을 재생시킬 수 있다. 여기에 사용된 줄기세포는 배아 줄기(ES) 세포 또는 조직 줄기세포(조직성 줄기세포, 조직-특이적 줄기세포 또는 체세포성 줄기세포라고도 불림)에 한정적이지 않다. 줄기세포는 상기-기술된 능력을 지닐 수 있는 한 인공적으로 생성된 세포도 된다. "배아 줄기세포"라는 용어는 초기 배아로부터 유래된 다능성 줄기세포를 나타낸다. 배아 줄기세포와 달리 조직 줄기세포의 분화 방향은 제한된다. 배아 줄기세포는 조직 내 특정한 위치에 정해져 있고 미분화된 세포 내 구조를 지닌다. 따라서 조직 줄기세포는 낮은 수준의 다능성을 지닌다. 조직 줄기세포에 있어서 핵/세포질의 비율이 높고 세포내 소기관이 거의 없다. 조직 줄기 세포는 일반적으로 다능성을 지니고 세포주기가 길고 개체 수명 이상으로 증식 능력을 유지시킬 수 있다. 여기에 사용된 줄기세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 배아 줄기세포 또는 조직 줄기세포도 된다.

조직 줄기세포는 피부계통, 소화계통, 골수계통, 신경계통 등과 같이 세포가 유래된 사이트의 카테고리로 분류된다. 피부계통 내의 조직 줄기세포는 상피 줄기세포, 모낭 줄기세포 등을 포함한다. 소화계통 내의 조직 줄기세포는 췌장(일반적) 줄기세포, 간 줄기세포 등을 포함한다. 골수계통 내의 조직 줄기세포는 조혈 줄기세포, 중간엽 줄기세포 등을 포함한다. 신경계통 내의 조직 줄기세포는 신경 줄기세포, 망막 줄기세포를 포함한다.

여기에 사용된 "체세포"라는 용어는 그의 DNA를 다음 세대에 전달하지 않는, 난, 정자 등과 같은 생식세포 이외의 어떠한 세포도 나타낸다. 일반적으로 체세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 자연-발생적이거나 유전적으로 변형된다.

줄기세포의 기원은 외배엽, 내배엽 또는 중배엽으로 분류된다. 신경 줄기세포를 포함한 외배엽 기원의 줄기세포는 대부분 뇌에 존재한다. 혈관 줄기세포, 조혈 줄기세포, 중간엽 줄기세포 등을 포함한 내배엽 기원의 줄기세포는 대부분 골수에 존재한다. 간 줄기세포, 췌장 줄기세포 등을 포함한 중배엽 기원의 줄기세포는 대부분 기관에 존재한다. 여기에 이용된 체세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 어떠한 배층으로부터도 유래된다.

여기에 사용된 "분리된"이라는 용어는 일반적인 환경 내의 적어도 자연적으로 수반되는 물질이 감소되고, 바람직하게는 실질적으로 차단되는 것을 나타낸다. 따라서 "분리된 세포"라는 용어는 일반적 환경 내에 어떠한 자연적으로 수반되는 물질(즉, 다른 세포, 단백질, 핵산 등)도 실질적으로 포함하지 않는 세포를 나타낸다. 핵산 또는 폴리펩타이드와 관련한 "분리된"이라는 용어는 재조합 DNA 기술에 의해 생성될 때 실질적으로 어떠한 세포 물질 또는 배양 배지도 포함하지 않거나 화학적으로 합성될 때 실질적으로 전구체 화학 물질 또는 다른 화학 물질도 포함하지 않는 핵산 또는 폴리펩타이드를 나타낸다. 바람직하게는 분리된 핵산은 생물체 내에서 자연적으로 핵산 측면에 위치한 서열을 포함하지 않는다(핵산의 5' 또는 3' 말단).

여기에 사용된 세포와 관련한 "수립된"이라는 용어는 세포의 특정한 성질(다능성)이 유지되고 세포가 배양 조건 하에서 안정한 증식을 수행하는 세포 상태를 나타낸다. 따라서 수립된 줄기세포는 다능성을 유지한다.

여기에 사용된 "분화된 세포"라는 용어는 특정화된 기능 또는 형태를 지닌 세포(즉, 근육세포, 신경세포 등)를 나타낸다. 줄기세포와 달리 분화된 세포는 다능성을 전혀 지니지 않거나 거의 없다. 분화된 세포의 예는 상피세포, 췌장 실질세포, 췌장 관세포, 간세포, 혈액세포, 심근세포, 골격근육세포, 골모세포, 골격 근육모세포, 신경세포, 혈관 내피세포, 색소세포, 평활근세포, 지방세포, 골세포, 연골세포 등을 포함한다. 여기에 이용된 세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 상기-기술된 어떠한 세포도 된다. 여기에 사용된 "분화" 또는 "세포 분화"라는 용어는 형태 및/또는 기능 상의 질적 차이를 지닌 2 이상의 형태의 세포가 단일 세포의 분열로부터 유래된 딸세포 집단에서 발생함을 나타낸다. 따라서 "분화"는 일반적으로 특이적인 감지가능 특징을 지니지 않는 세포의 집단(가계수)이 특이적 단백질의 생성과 같은 특징을 획득하는 과정을 포함한다.

여기에 사용된 세포, 생물체 등과 관련한 "상태"라는 용어는 세포, 생물체 등의 파라미터의 조건 또는 양식(즉, 세포주기, 외생적 작용제에 대한 반응, 신호 변환, 유전자 발현, 유전자 전사 등)을 나타낸다. 이러한 상태의 예는 분화된 상태, 미분화된 상태, 외생적 작용제에 대한 세포의 반응, 세포주기, 증식 상태 등을 포함하나 이에 한정적인 것은 아니다. 여기서는 특히 하기의 생물체의 환경 파라미터에 대한 목적 생물체의 반응성 또는 저항성이 생물체 상태의 척도로서 사용된다: 온도, 습도(즉, 절대습도, 상대습도), pH, 염 농도(즉, 모든 염 또는 특정 염의 농도), 영양물(즉, 탄수화물의 양 등), 금속(즉, 모든 금속 또는 특정 금속(즉, 중금속 등)의 양 또는 농도), 기체(즉, 모든 기체 또는 특정 기체의 양), 유기용매(즉, 모든 유기용매 또는 특정 유기용매(즉, 에탄올 등)의 양), 압력(즉, 국부적 또는 전체 압력 등), 대기압, 점도, 유속(즉, 생물체가 존재하는 배지의 유속), 광도(즉, 특정 파장을 지닌 광의 양), 광파장(즉, 가시광선, 자외선, 적외선 등), 전자파, 방사선, 중력, 장력, 음파, 목적 생물체 이외의 생물체(즉, 기생충, 병원성 박테리아 등), 화학제(즉, 약제 등), 항생제, 자연-발생적 물질, 정신적 스트레스, 물리적 스트레스 등.

여기에 사용된 실체와 관련한 "환경"(또는 독어로 "Umgeung")이라는 용어는 실체를 둘러싸는 환경을 나타낸다. 환경에 있어서 상태의 다양한 구성성분 및 양이 인식되고, 이는 환경 인자로 불린다. 환경 인자의 예는 상기-기술된 파라미터를 포함한다. 일반적으로 환경 인자는 비-생물학적 환경 인자와 생물학적 환경 인자로 크게 분류된다. 비-생물학적 환경 인자(무기 환경 인자)는 물리적 인자와 화학적 인자로 또는 대안으로 기후 인자와 토양 인자로 분류된다. 다양한 환경 인자는 생물체에 항상 독립적으로 작용하는 것이 아니라 서로 결합된다. 따라서 환경 인자는 하나 또는 전체로서(다양한 파라미터의 전체) 관찰된다.

여기에 사용된 "조직"이라는 용어는 다세포 생물 내의 실질적으로 동일한 기능 및/또는 형태를 지닌 세포의 집합체를 나타낸다. "조직"은 일반적으로 동일한 기원의 세포 집합체이나 세포가 동일한 기능 및/또는 형태를 지니는 한 다른 기원의 세포 집합체도 된다. 따라서 본 발명의 줄기세포가 조직을 재생시키는데 이용될 때 조직은 2 이상의 다른 기원의 세포 집합체로 구성된다. 일반적으로 조직은 기관의 일부를 구성한다. 동물 조직은 형태적, 기능적 또는 발달적 근거에 따라 상피조직, 결합조직, 근육조직, 신경조직 등으로 구분된다. 식물 조직은 조직을 구성하는 세포의 발달 단계에 따라 분열조직과 영구조직으로 크게 분류된다. 대안으로, 조직은 조직을 구성하는 세포 형태에 따라 단일조직과 복합조직으로 분류된다. 따라서 조직은 다양한 카테고리로 분류된다. 유전자 복제의 오류-빈발 빈도가 조절될 수 있는 한 어떠한 조직도 이용된다.

기관 또는 그의 일부가 본 발명에서 이용된다. 본 발명에서 주입되는 조직 또는 세포는 어떠한 기관으로부터도 유래된다. 여기에 사용된 "기관"이라는 용어는 특정 기능이 수행되는 개체 생물체의 특정 부분에 위치한 형태적으로 독립적인 구조를 나타낸다. 다세포 생물(즉, 동물, 식물)에서 기관은 특정한 방식으로 공간적으로 배열된 여러 조직으로 구성되고, 각 조직은 다수의 세포로 구성된다. 이러한 기관의 예는 혈관계통과 관련된 기관을 포함한다. 하나의 실시태양에서 본 발명에 의해 목표된 기관은 피부, 혈관, 각막, 신장, 심장, 간, 탯줄, 창자, 신경, 폐, 태반, 췌장, 뇌, 말초사지, 망막 등을 포함하나 이에 한정적인 것은 아니다. 유전자 복제의 오류-빈발 빈도가 조절될 수 있는 한 어떠한 기관 또는 그의 일부도 본 발명에 이용된다.

여기에 사용된 "생물성 물질"이라는 용어는 목적 생물체 또는 그의 일부에 의해 생성된 물질을 나타낸다. 이러한 생성물 물질의 예는 유전자 발현 생성물, 대사산물, 배설물 등을 포함하나 이에 한정적인 것은 아니다. 본 발명에 따라 유전 형질의 전환율을 조절함으로서 목적 생물체는 생성물 물질의 형태 및/또는 양을 변화시키게 된다. 본 발명은 이렇게-변화된 생성물 물질을 포함함이 이해될 것이다. 바람직하게는 생성물 물질은 대사산물이나 이에 한정적인 것은 아니다.

여기에 사용된 생물체와 관련한 "질병 모델"이라는 용어는 생물체에 특이적인 질병, 증후, 장애, 이상 등이 재현될 수 있는 생물체 모델을 나타낸다. 이러한 질병 모델은 본 발명의 방법에 의해 생성될 수 있다. 이러한 질병 모델의 예는 암 동물 모델, 심장병 동물 모델(즉, 심근경색 등), 심혈관질환 동물 모델(즉, 동맥경화 등), 중추신경질환 동물 모델(즉, 치매, 뇌경색 등) 등을 포함하나 이에 한정적인 것은 아니다.

(일반적 생화학 및 분자생물학)

(일반 기술)

여기에 이용된 분자생물학 기술, 생화학 기술, 미생물학 기술 및 세포생물학 기술은 당분야에 잘 알려져 있고 일반적으로 이용되고 예를 들어 Sambrook J. et al.(1989), Molecular Cloning: A Laboratory Manual, Cold Spring Harbor and its 3rd Ed. (2001); Ausubel, F.M.(1987), Current Protocols in Molecular Biology, Greene Pub. Associated and Wiley-Interscience; Ausubel, F.M.(1989), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associate and Wiley-Interscience; Innis, M.A.(1990), PCR Protocols: A Guide to Methods and Applications, Academic Press; Ausubel, F.M.(1992), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associates; Ausubel, F.M.(1995), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associates; Innis, M.A.(1995), PCR Protocols: A Guide to Methods and Applications, Academic Press; Ausubel, F.M.(1999), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Wiley, and annual updates; Sninsky, J.J. et al.(1999), PCR Applications: Protocols for Functional Genomics, Academic Press; Special issue, Jikken Igaku [Experimental Medicine] "Idenshi Donyu & Hatsugen Kaiseki Jikkenho [Experimental Methods for gene Introduction & Expression Analysis]", Yodo-sha, 1997 등에 기술되어 있다. 이들 간행물 각각의 일부(또는 가능하게는 전체)가 참고문헌으로 포함된다.

인공적으로 합성된 유전자를 제조하는 기술 및 핵산 화학은 예를 들어 참고문헌에 포함된 Gait, M.J.(1985), Oligonucleotide Synthesis: A Practical Approach, IRL Press; Gait, M.J.(1990), Oligonucleotide Synthesis: A Practical Approach, IRL Press; Eckstein, F.(1991), Oligonucleotides and Analogues: A Practical Approc, IRL Press; Adams, R.L. et al.(1992), The Biochemistry of the Nucleic Acids, Chapman & Hall; Shabarova, Z. et al.(1994), Adavanced Organic Chemistry of Nucleic Acids, Weinheim; Blackburn, G.M. et al.(1996), Nucleic Acids in Chemistry and Biology, Oxford University Press; Hermanson, G.T.(1996), Bioconjugate Techniques, Academic Press; 등에 기술되어 있다.

여기에 사용된 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드"는 동일한 의미를 지니고 어떠한 길이를 지닌 아미노산 폴리머를 나타낸다. 이러한 폴리머는 직선형, 분지형 또는 원형 체인이다. 아미노산은 자연-발생적 또는 비자연-발생적 아미노산 또는 그의 변이체이다. 본 용어는 다수의 폴리펩타이드 체인의 복합체로 집합되는 것을 포함한다. 또한 본 용어는 자연-발생적 또는 인공적으로 변형된 아미노산 폴리머를 포함한다. 이러한 변형은 예를 들어 이황화 결합 형성, 당화, 지질화, 아세틸화, 인산화 또는 다른 조작 또는 변형(즉, 표지 모이어티(moiety)와의 컨쥬게이션)을 포함한다. 이러한 정의는 적어도 하나 이상의 아미노산 유사체(즉, 자연-발생적 아미노산 등)를 포함한 폴리펩타이드, 펩타이드-유사 화합물(즉, 펩토이드) 및 당분야에 알려진 다른 변이체를 포함한다. 본 발명의 유전자 생성물은 일반적으로 폴리펩타이드 형태이다. 폴리펩타이드의 형성시 본 발명의 생성물 물질은 약제적 조성물로서 유용하다.

여기에 사용된 "폴리뉴클레오타이드", "올리고뉴클레오타이드" 및 "핵산"은 동일한 의미를 지니고 어떠한 길이를 지닌 뉴클레오타이드 폴리머를 나타낸다. 또한 이러한 용어는 "올리고뉴클레오타이드 변이체" 또는 "폴리뉴클레오타이드 변이체"를 포함한다. "올리고뉴클레오타이드 변이체" 또는 "폴리뉴클레오타이드 변이체"는 뉴클레오타이드 변이체를 포함하거나 일반적 결합과 다른 뉴클레오타이드 사이의 결합을 지닌 올리고뉴클레오타이드 또는 폴리뉴클레오타이드를 나타내고, 이는 상호교환가능하게 사용된다. 특히 이러한 올리고뉴클레오타이드의 예는 2'-O-메틸-리보뉴클레오타이드, 올리고뉴클레오타이드 내의 포스포디에스테르 결합이 포스포로티오에이트 결합으로 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 포스포디에스테르 결합이 N3'-P5' 포스포로마이데이트 결합으로 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 리보스 및 포스포디에스테르 결합이 펩타이드-핵산 결합이 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 우라실이 C-5 프로피닐 우라실로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 우라실이 C-5 티아졸 우라실로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 시토신이 C-5 프로피닐 시토신으로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 시토신이 C-5 페녹사진-변형된 시토신으로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 리보스가 2'-O-프로필 리보스로 치환된 올리고뉴클레오타이드 유도체 및 올리고뉴클레오타이드 내 리보스가 2-메톡시에톡시 리보스로 치환된 올리고뉴클레오타이드 유도체를 포함한다. 나타내지 않는 한 특정한 핵산 서열도 명백하게 나타난 서열뿐만 아니라 그의 보존적으로-변형된 변이체(즉, 퇴화성 코돈 치환) 및 상보적 서열을 포함한다. 특히, 퇴화성 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합된-염기 및/또는 디옥시이노신 잔기로 치환된 서열을 생성함으로서 생성된다(Batzer et al., Nucleic Acid Res. 19:5081(1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608(1985); Rossolini et al., Mol. Cell. Probes 8:91-98(1994)). 본 발명의 유전자는 일반적으로 폴리뉴클레오타이드 형태이다. 본 발명의 폴리뉴클레오타이드 형태의 유전자 또는 유전자 생성물은 본 발명의 방법에 유용하다.

여기에 사용된 "핵산 분자"라는 용어는 cDNA, mRNA, 게놈 DNA 등을 포함하여 "핵산", "올리고뉴클레오타이드" 및 "폴리뉴클레오타이드"라는 용어와 상호교환가능하게 사용된다. 여기에 사용된 핵산 및 핵산 분자는 "유전자"라는 용어의 개념에 의해 포함된다. 제공된 유전자의 서열을 인코드하는 핵산 분자는 "스플라이스 돌연변이체(변이체)"를 포함한다. 유사하게는, 핵산 분자에 의해 인코드된 특정 단백질은 핵산의 스플라이스 변이체에 의해 인코드된 단백질을 포함한다. 명칭이 나타내듯 "스플라이스 돌연변이체"는 유전자의 대안적 스플라이싱의 생성물이다. 전사 후 개시 핵산 전사가 스플라이스되어 다른(대안적) 핵산 스플라이스 생성물이 다른 폴리펩타이드를 인코드하게 된다. 스플라이스 변이체의 생성 메카니즘은 변화되나 대안적 엑손의 스플라이싱을 포함한다. 또한 통독(read-through) 전사에 의해 동일한 핵산으로부터 유래된 대안적 폴리펩타이드도 이러한 정의에 의해 포함된다. 스플라이스 생성물의 재조합 형태를 포함하여 스플라이싱 반응의 어떠한 생성물도 이러한 정의에 포함된다. 따라서 여기서 본 발명의 유전자는 스플라이스 돌연변이체를 포함한다.

여기에 사용된 유전자(즉, 핵산 서열, 아미노산 서열 등)의 "상동성"은 2 이상의 유전자 서열 사이의 동일성 비율을 나타낸다. 여기에 사용된 서열(핵산 서열, 아미노산 서열 등)의 동일성은 2 이상의 비교가능한 서열 사이의 동일한 서열(개별적 핵산, 아미노산 등)의 비율을 나타낸다. 따라서 2개의 제공된 서열 사이의 상동성이 클수록 그들 서열 사이의 동일성 또는 유사성이 크다. 2개의 유전자가 상동성을 지니는지 여부는 그들 서열을 직접 비교하거나 스트린전트 조건 하에서의 하이브리다이즈 방법에 의해 측정된다. 2개 유전자 서열이 서로 직접 비교될 때 이들 유전자는 대표적으로 서로 적어도 50% 이상, 바람직하게는 적어도 70% 이상, 더욱 바람직하게는 적어도 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 동일성을 지닌다. 여기에 사용된 유전자(즉, 핵산 서열, 아미노산 서열 등)의 "유사성"은 보존적 치환이 상기-기술된 상동성에서 양성(동일성)으로 고려될 때 2 이상의 서열 사이의 동일성 비율을 나타낸다. 따라서 상동성 및 유사성은 보존적 치환의 존재시 서로 다르다. 보존적 치환이 존재하지 않는 경우 상동성 및 유사성은 동일한 수치를 지닌다.

여기서 아미노산 서열 및 염기 서열의 유사성, 동일성 및 상동성은 디폴트 파라미터로 PSI-BLAST(서열 분석 기구)를 이용하여 비교된다. 그렇지 않은 경우 FASTA(디폴트 파리미터를 이용한)가 PSI-BLAST 대신 이용된다.

여기에 사용된 "아미노산"이라는 용어는 본 발명의 목적을 만족시키는 한 자연-발생적 또는 비자연-발생적 아미노산을 나타낸다. "아미노산 유도체" 또는 "아미노산 유사체"라는 용어는 자연-발생적 아미노산과 다르고 본래 아미노산과 유사한 기능을 지닌 아미노산을 나타낸다. 이러한 아미노산 유도체 및 아미노산 유사체는 당분야에 잘 알려져 있다.

"자연-발생적 아미노산"이라는 용어는 자연-발생적 아미노산의 L-이성질체를 나타낸다. 자연-발생적 아미노산은 글리신, 알라닌, 발린, 류신, 이소류신, 세린, 메티오닌, 트레오닌, 페닐알라닌, 티로신, 트립토판, 시스테인, 프롤린, 히스티딘, 아스파르트산, 아스파라긴, 글루탐산, 글루타민, γ-카르복시글루탐산, 아르기닌, 오르니틴 및 라이신이다. 나타내지 않는 한 D-아미노산을 이용한 실시태양이 본 발명의 범위 내에 있더라도 여기에 이용된 모든 아미노산은 L-이성질체이다. "비자연-발생적 아미노산"이라는 용어는 자연 내에서 일반적으로 발견되지 않는 아미노산을 나타낸다. 비자연-발생적 아미노산의 예는 노르류신, 파라-니트로페닐알라닌, 호모페닐알라닌, 파라-플루오로페닐알라닌, 3-아미노-2-벤질프로피온산, D- 또는 L-호모아르기닌 및 D-페닐알리닌을 포함한다. "아미노산 유사체"라는 용어는 아미노산과 유사한 물리적 성질 및/또는 기능을 지닌 분자를 나타내나 아미노산을 아니다. 아미노산 유사체의 예는 예를 들어 에티오닌, 카나바닌, 2-메틸글루타민 등을 포함한다. 아미노산 모방체는 아미노산의 일반적인 화학 구조와 다른 구조를 지니나 자연-발생적 아미노산과 유사한 방식으로 기능하는 화합물을 나타낸다.

여기에 사용된 "뉴클레오타이드"라는 용어는 자연-발생적 또는 비자연-발생적이다. "뉴클레오타이드 유도체" 또는 "뉴클레오타이드 유사체"라는 용어는 자연-발생적 뉴클레오타이드와 다르고 본래 뉴클레오타이드와 유사한 기능을 지닌 뉴클레오타이드를 나타낸다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 당분야에 잘 알려져 있다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 포스포로티오에이트, 포스포라미데이트, 메틸포스포네이트, 키랄-메틸포스포네이트, 2-O-메틸 리보뉴클레오타이드 및 펩타이드-핵산(PNA)를 포함하나 이에 한정적인 것은 아니다.

여기서 아미노산은 IUPAC-IUB Biochemical Nomenclature Commission에 의해 추척된 일반적으로 알려진 3문자 또는 1문자 기호로 표기된다. 유사하게는 뉴클레오타이드는 일반적으로 수용된 단일-문자 코드로 표기된다.

여기에 사용된 "상응하는" 아미노산 또는 핵산이라는 용어는 비교를 위한 참고로서 폴리펩타이드 또는 폴리뉴클레오타이드 내의 미리측정된 아미노산 또는 뉴클레오타이드와 유사한 기능을 지니거나 지닐 것으로 예상되는 제공된 폴리펩타이드 또는 폴리뉴클레오타이드 분자 내 아미노산 또는 뉴클레오타이드를 나타낸다. 특히, 효소 분자의 경우 본 용어는 활성 사이트(즉, DNA 중합효소의 프루프리딩 기능을 제공하는 범위) 내의 유사한 위치에 존재하고 촉매 활성에 유사하게 기여하는 아미노산을 나타낸다. 예를 들어 안티센스 분자의 경우 본 용어는 안티센스 분자의 특정 부분에 상응하는 오르쏠로그(ortholog) 내의 유사한 부분을 나타낸다. 상응하는 아미노산 및 핵산은 당분야에 알려진 정렬 기술을 이용하여 확인될 수 있다. 이러한 정렬 기술은 예를 들어 Needleman, S.B. and Wunsch, C.D., J. Mol. Biol. 48, 443-453, 1970에 기술되어 있다.

여기에 사용된 "상응하는" 유전자(즉, 폴리펩타이드 또는 폴리뉴클레오타이드 분자)라는 용어는 비교를 위한 참조로서 종 내의 미리 측정된 유전자와 동일한 기능을 지니거나 지닐 것으로 예상되는 제공된 종 내의 유전자(즉, 폴리펩타이드 또는 폴리뉴클레오타이드 분자)를 나타낸다. 이러한 기능을 지닌 유전자가 다수 존재하는 경우 본 용어는 동일한 진화 기원을 지닌 유전자를 나타낸다. 따라서 제공된 유전자에 상응하는 유전자는 제공된 유전자의 오르쏠로그가 된다. 따라서 마우스 DNA 중합효소 유전자에 상응하는 유전자는 다른 동물(인간, 래트, 돼지, 소 등)에서 발견될 수 있다. 이러한 상응하는 유전자는 당분야에 잘 알려진 기술에 의해 확인될 수 있다. 따라서 예를 들어 제공된 동물 내의 상응하는 유전자는 의문 서열로서 참조 유전자(즉, 마우스 DNA 중합효소 등)의 서열을 이용하여 동물(즉, 인간, 래트)의 서열 데이터베이스를 검색함으로서 발견될 수 있다.

여기에 사용된 "뉴클레오타이드"라는 용어는 자연-발생적 또는 비자연-발생적이다. "뉴클레오타이드 유도체" 또는 "뉴클레오타이드 유사체"라는 용어는 자연-발생적 뉴클레오타이드와 다르고 본래 뉴클레오타이드와 유사한 기능을 지닌 뉴클레오타이드를 나타낸다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 당분야에 잘 알려져 있다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체의 예는 포스포로티오에이트, 포스포라미데이트, 메틸포스포네이트, 키랄-메틸포스포네이트, 2-O-메틸 리보뉴클레오타이드 및 펩타이드-핵산(PNA)를 포함하나 이에 한정적인 것은 아니다.

여기에 사용된 "단편"이라는 용어는 참조 폴리펩타이드 또는 폴리뉴클레오타이드의 전체 길이(길이 n의)에 대해 1 내지 n-1의 범위의 서열 길이를 지닌 폴리펩타이드 또는 폴리뉴클레오타이드를 나타낸다. 단편의 길이는 목적에 따라 적당히 변할 수 있다. 예를 들어 폴리펩타이드의 경우 단편 길이의 하한선은 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 이상의 뉴클레오타이드를 포함한다. 여기에 명기되지 않은 정수에 의해 표현된 길이(즉, 11 등)도 하한선에 적당하다. 예를 들어 폴리뉴클레오타이드의 경우 단편 길이의 하한선은 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100 이상의 뉴클레오타이드를 포함한다. 여기에 명기되지 않은 정수에 의해 표현된 길이(즉, 11 등)도 하한선에 적당하다. 여기에 사용된 폴리펩타이드 또는 폴리뉴클레오타이드의 길이는 각각 아미노산 또는 핵산의 수에 의해 표현될 수 있다. 그러나 상기-기술된 숫자는 절대적인 것은 아니다. 동일한 기능이 유지되는 한 상한선 또는 하한선으로서 상기-기술된 숫자는 더 크거나 더 작은 숫자(즉, ±10%)를 포함한다. 이러한 목적으로 "약"이 숫자 앞에 놓인다. 그러나 숫자의 해석은 본 명세서 내의 "약"의 존재 또는 부재에 영향을 받지 않음이 이해되어야 한다. 유용한 단편의 길이는 적어도 하나 이상의 기능(즉, 다른 분자와의 특이적 상호작용 등)이 단편의 참조인 전체-길이 단백질의 기능 간에 유지되는지 여부에 따라 결정된다.

여기에 사용된 폴리뉴클레오타이드, 폴리펩타이드와 같은 생물학적 작용제와 "특이적으로 상호작용할 수 있는 작용제"라는 용어는 폴리뉴클레오타이드, 폴리펩타이드와 같은 생물학적 작용제에 대한 친화력을 지니고, 폴리뉴클레오타이드, 폴리펩타이드와 같은 다른 관련되지 않은 생물학적 작용제(특히 30% 이하의 동일성을 지닌)보다 상대적으로 더 높거나 동일하고, 바람직하게는 유의적으로(즉, 실질적으로 유의적으로) 더 높은 작용제를 나타낸다. 이러한 친화력은 예를 들어 하이브리다이즈 에세이, 결합 에세이 등으로 측정될 수 있다. 의도된 목적이 달성되는 한 여기에 사용된 "작용제"는 어떠한 물질 또는 다른 작용제(즉, 광, 방사선, 열, 전기 등과 같은 에너지)도 된다. 이러한 물질의 예는 단백질, 폴리펩타이드, 올리고펩타이드, 펩타이드, 폴리뉴클레오타이드, 올리고뉴클레오타이드, 뉴클레오타이드, 핵산(즉, cDNA, 게놈 DNA와 같은 DNA 및 mRNA와 같은 RNA), 폴리사카라이드, 올리고사카라이드, 지질, 저분자량 유기 분자(즉, 호르몬, 리간드, 정보 전달 물질, 결합 화학에 의해 합성된 분자, 저분자량 분자(즉, 약제적으로 수용가능한 저분자량 리간드 등)) 및 이들 분자의 결합을 포함하나 이에 한정적인 것은 아니다. 폴리뉴클레오타이드에 특이적인 작용제의 예는 미리 측정된 서열 상동성(즉, 70% 이상 서열 동일성)을 지닌 폴리뉴클레오타이드 서열에 대한 상보성을 지닌 폴리뉴클레오타이드, 프로모터 구역에 결합하는 전사 작용제와 같은 폴리펩타이드를 대표적으로 포함하나 이에 한정적인 것은 아니다. 폴리펩타이드에 특이적인 작용제의 예는 폴리펩타이드 또는 그의 유도체 또는 유사체에 특이적으로 지시된 항체(즉, 단일 체인 항체), 폴리펩타이드가 수용체 또는 리간드인 경우 특이적 리간드 또는 수용체, 폴리펩타이드가 효소인 경우 물질 등을 대표적으로 포함하나 이에 한정적인 것은 아니다. 이들 작용제는 여기서 생물체의 오류-빈발 빈도의 조절에 유용하다.

여기에 사용된 "저분자량 유기 분자"라는 용어는 상대적으로 작은 분자량을지닌 유기 분자를 나타낸다. 일반적으로 저분자량 유기 분자는 약 1,000 이하의 분자량을 나타내거나 1,000 이상의 분자량을 나타내기도 한다. 저분자량 유기 분자는 당분야에 알려진 방법 또는 그의 결합에 의해 일반적으로 합성될 수 있다. 이들 저분자량 유기 분자는 생물체에 의해 생성된다. 저분자량 유기 분자의 예는 호르몬, 리간드, 정보 전달 물질, 결합 화학에 의해 합성된 분자, 약제적으로 수용가능한 저분자량 분자(즉, 저분자량 리간드 등) 등을 포함하나 이에 한정적인 것은 아니다. 이들 작용제는 생물체의 오류-빈발 빈도의 조절에 유용하다.

여기에 사용된 "항체"라는 용어는 폴리클론 항체, 단일클론 항체, 인간 항체, 인간화 항체, 다기능성 항체, 키메라 항체 및 항-유전자형 항체 및 그의 단편(즉, F(ab')2 및 Fab 단편) 및 다른 재조합 컨쥬게이트를 포함한다. 이들 항체는 공유결합 또는 재조합을 통해 효소(즉, 알칼리성 포스파타제, 양고추냉이 퍼옥시다제, α-갈락토시다제 등)와 융합된다.

여기에 사용된 "항원"이라는 용어는 항체 분자가 특이적으로 결합하는 어떠한 물질도 나타낸다. 여기에 사용된 "면역원"이라는 용어는 림프구의 항원-특이적 면역 반응의 활성화를 개시시킬 수 있는 항원을 나타낸다.

여기에 사용된 "단일 체인 항체"라는 용어는 펩타이드 교차결합제를 통해 Fv 구역의 헤비 체인 단편과 라이트 체인 단편을 결합시킴으로서 형성된 단일 체인 폴리펩타이드를 나타낸다.

여기에 사용된 "복합 분자"라는 용어는 폴리펩타이드, 폴리뉴클레오타이드, 지질, 당, 저분자량 분자 등과 같은 다수의 분자가 서로 결합된 분자를 나타낸다. 이러한 복합 분자의 예는 당지질, 글리코펩타이드 등을 포함하나 이에 한정적인 것은 아니다. 분자가 유전자 또는 그의 생성물(즉, DNA 중합효소 등) 또는 본 발명의 작용제와 동일한 기능을 실질적으로 지니는 한 이들 분자는 유전자 및 그의 생성물(즉, DNA 중합효소 등) 또는 본 발명의 작용제로서 여기서 이용될 수 있다.

여기에 사용된 "분리된" 생물학적 작용제(즉, 핵산, 단백질 등)라는 용어는 자연-발생적 생물체의 세포 내 다른 생물학적 작용제로부터 실질적으로 분리되거나 정제된 생물학적 작용제를 나타낸다(즉, 핵산의 경우 핵산 및 의도된 핵산 분자 이외의 핵산 서열을 지닌 핵산 이외의 작용제; 단백질의 경우 단백질 및 의도된 단백질 이외의 아미노산 서열을 지닌 단백질 이외의 작용제). "분리된" 핵산 및 단백질은 표준 정제법에 의해 정제된 핵산 및 단백질을 포함한다. 또한 분리된 핵산 및 단백질은 화학적으로 합성된 핵산 및 단백질을 포함한다.

여기에 사용된 "정제된" 생물학적 작용제(즉, 핵산, 단백질 등)라는 용어는 자연적으로 수반된 작용제의 적어도 일부가 제거된 것을 나타낸다. 따라서 일반적으로 다수의 정제된 생물학적 작용제는 정상 상태 내의 생물학적 작용제보다 더 높다(즉, 농축된).

여기에 사용된 "정제된" 및 "분리된"이라는 용어는 동일한 형태의 생물학적 작용제가 바람직하게는 적어도 75 중량% 이상, 더욱 바람직하게는 85 중량% 이상, 더욱 더 바람직하게는 적어도 95 중량% 이상, 가장 바람직하게는 적어도 98 중량% 이상으로 존재함을 의미한다.

여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등과 같은 유전자 생성물의 "발현"이라는 용어는 유전자 등이 생체 내에서 미리 결정된 작용에 의해 영향을 받아 또다른 형태로 변화됨을 나타낸다. 바람직하게는 "발현"이라는 용어는 유전자, 폴리뉴클레오타이드 등이 전사되고 폴리펩타이드로 번역됨을 나타낸다. 본 발명의 하나의 실시태양에서 유전자는 mRNA로 전사된다. 더욱 바람직하게는 이들 폴리펩타이드는 후-번역 처리 변형을 지닌다.

여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등의 "발현 감소"라는 용어는 작용제의 작용이 부재할 때와 비교시 발현 수준이 본 발명의 작용제의 작용이 존재시 유의적으로 감소됨을 나타낸다. 바람직하게는, 발현 감소는 폴리펩타이드(즉, DNA 중합효소 등)의 발현량의 감소를 포함한다. 여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등의 "발현 증가"라는 용어는 작용제의 작용이 부재할 때와 비교시 발현 수준이 본 발명의 작용제의 작용이 존재시 유의적으로 증가됨을 나타낸다. 바람직하게는, 발현 증가는 폴리펩타이드(즉, DNA 중합효소 등)의 발현량의 증가를 포함한다. 여기에 사용된 유전자의 "발현 유도"라는 용어는 제공된 세포에 제공된 작용제를 적용함으로서 유전자의 발현량이 증가됨을 나타낸다. 따라서 발현 유도는 유전자 발현이 관찰되지 않을 때 유전자가 발현되게 하고, 유전자가 관찰될 때 유전자의 발현량을 증가시키는 것을 포함한다. 이들 유전자 또는 유전자 생성물(폴리펩타이드 또는 폴리뉴클레오타이드)의 증가 또는 감소는 본 발명에서 복제시 오류-빈발 빈도를 조절하는데 유용하다.

유전자의 경우 여기에 사용된 "특이적으로 발현된"이라는 용어는 유전자가 다른 사이트 또는 기간과 다른 수준에서(바람직하게는 더 높은) 특이적 사이트에서 또는 특이적 기간 동안 발현됨을 나타낸다. "특이적으로 발현된"이라는 용어는 유전자가 제공된 사이트에서만(특이적 사이트) 발현되거나 다른 사이트에서 발현되는 것을 나타낸다. 바람직하게는 "특이적으로 발현된"이라는 용어는 유전자가 제공된 사이트에서만 발현되는 것을 나타낸다. 따라서 본 발명의 실시태양에 따라 DNA 중합효소는 원하는 부분에서 특이적으로 또는 국부적으로 발현된다.

여기에 사용된 "생물학적 활성"이라는 용어는 다양한 기능(즉, 전사 증신 활성)을 나타내는 활성을 포함한 생물체 내의 작용제(즉, 폴리뉴클레오타이드, 단백질 등)에 의해 보유된 활성을 나타낸다. 예를 들어 2개의 작용제가 서로 상호작용할 때(즉, DNA 중합효소가 그의 특이적 서열에 결합시) 생물학적 활성은 DNA 중합효소와 특이적 서열 사이의 결합을 포함하고, 생물학적 변화가 결합에 의해 유발된다(즉, 특이적 뉴클레오타이드 중합반응; 복제 오류의 발생; 뉴클레오타이드 제거 능력; 미스매치된 염기쌍의 인식 등). 예를 들어 제공된 작용제가 효소인 경우 그의 생물학적 활성은 그의 효소 활성을 포함한다. 또다른 예로서 제공된 작용제가 리간드인 경우 그의 생물학적 활성은 작용제의 리간드에 대한 수용체로의 결합을 포함한다. 이러한 생물학적 활성은 당분야에 잘 알려진 기술로 측정될 수 있다.

여기에 사용된 "안티센스 (활성)"이라는 용어는 타겟 유전자 발현의 특이적 억제 또는 감소를 가능하게 하는 활성을 나타낸다. 안티센스 활성은 일반적으로 타겟 유전자(즉, DNA 중합효소 등)의 핵산 서열에 상보적인 적어도 8 이상의 인접 뉴클레오타이드의 길이를 지닌 핵산 서열에 의해 달성된다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드의 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드의 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드의 길이, 적어도 12 이상의 인접 뉴클레오타이드의 길이, 적어도 13 이상의 인접 뉴클레오타이드의 길이, 적어도 14 이상의 인접 뉴클레오타이드의 길이, 적어도 15 이상의 인접 뉴클레오타이드의 길이, 적어도 20 이상의 인접 뉴클레오타이드의 길이, 적어도 30 이상의 인접 뉴클레오타이드의 길이, 적어도 40 이상의 인접 뉴클레오타이드의 길이, 적어도 50 이상의 인접 뉴클레오타이드의 길이를 지닌다. 이들 핵산 서열은 그에 적어도 70% 이상의 상동성, 더욱 바람직하게는 적어도 80% 이상의 상동성, 더욱 더 바람직하게는 적어도 90% 이상의 상동성, 더욱 더 바람직하게는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다. 안티센스 활성은 바람직하게는 타겟 유전자의 핵산 서열의 5' 말단 서열에 상보적이다. 이러한 안티센스 핵산 서열은 하나 이상 또는 적어도 하나 이상의 뉴클레오타이드 치환, 첨가 및/또는 삭제를 지닌 상기-기술된 서열을 포함한다. 이러한 안티센스 활성을 지닌 분자는 생물체 내의 오류-빈발 빈도의 조절에 대해 여기서 유용하게 이용된다.

여기서 사용된 "RNAi"라는 용어는 RNA 간섭(interference)의 약자이고 이중-스트랜드 RNA(dsRNA로도 불림)와 같은 RNAi 유발하는 작용제가 세포 내로 도입되어 이에 상동적인 mRNA가 특이적으로 분해되어 유전자 생성물의 합성이 억제되는 현상 및 이러한 현상을 이용하는 기술을 나타낸다. 여기에 사용된 RNAi는 RNAi를 유발하는 작용제와 동일한 의미를 지닌다.

여기에 사용된 "RNAi 유발 작용제"라는 용어는 RNAi를 유발할 수 있는 어떠한 작용제도 나타낸다. 여기에 사용된 "유전자에 대한 RNAi 유발 작용제"는 작용제가 유전자와 관련하여 RNAi를 유발하고 RNAi의 효과가 달성됨을 나타낸다(즉, 유전자 발현의 억제 등). 이러한 RNAi 유발 작용제의 예는 타겟 유전자의 핵산 서열에 적어도 약 70% 이상의 상동성을 지닌 서열 또는 스트린전트 조건 하에서 하이브리다이즈 가능한 서열, 적어도 10 이상의 뉴클레오타이드 길이를 지닌 이중-스트랜드 부분을 포함한 RNA 또는 그의 변이체를 포함하나 이에 한정적인 것은 아니다. 여기서 이러한 작용제는 바람직하게는 3' 돌출 말단을 포함한 DNA이고, 더욱 바람직하게는 3' 돌출 말단은 2 이상의 뉴클레오타이드(즉, 2-4 뉴클레오타이드 길이)를 지닌다. RNAi는 여기서 생물체의 오류-빈발 빈도의 조절에 대해 유용하게 이용된다.

여기에 사용된 "스트린전트 조건 하에서 하이브리다이즈하는 폴리뉴클레오타이드"는 일반적으로 사용되고 당분야에 잘 알려진 조건을 나타낸다. 이러한 폴리뉴클레오타이드는 본 발명의 폴리펩타이드로부터 선택된 폴리뉴클레오타이드를 이용하여 콜로니 하이브리디제이션, 플라크 하이브리디제이션, 서던 블럿 하이브리디제이션 등을 수행함으로서 수득될 수 있다. 특히, 콜로니 또는 플라크로부터 유래된 DNA가 고정된 필터가 0.7∼1.0 M NaCl의 존재시 65℃에서 하이브리디제이션을 수행하는데 이용된다. 이후, 0.1∼2배 농도 SSC(식염수-구연산나트륨) 용액(1-배 농도 SSC 옹액은 150 mM 염화나트륨 및 15 mM 구연산 나트륨으로 구성됨)이 65℃에서 필터를 세척하는데 사용된다. 이러한 방법으로 확인된 폴리뉴클레오타이드는 "스트린전트 조건 하에서 하이브리다이즈하는 폴리뉴클레오타이드"로서 표기된다. 하이브리디제이션은 예를 들어 Molecular Cloning 2nd ed., Current Protocols in Molecular Biology, Supplement 1-38, DNA Cloning 1: Core Techniques, A Practical Approach, Second Edition, Oxford University Press (1995) 등에 기술된 방법에 따라 수행될 수 있다. 여기서 바람직하게는 스트린전트 조건 하에서 하이브리다이즈하는 서열은 A(아데닌) 또는 T(티민)만을 포함한 서열은 제외된다. "하이브리다이즈 가능한 폴리뉴클레오타이드"는 상기-기술된 하이브리디제이션 조건 하에서 다른 폴리뉴클레오타이드와 하이브리다이즈할 수 있는 폴리뉴클레오타이드를 나타낸다. 특히, 하이브리다이즈 가능한 폴리뉴클레오타이드는 여기에 상세하게 기술된 아미노산 서열을 지닌 폴리펩타이드를 인코드하는 DNA의 염기 서열에 적어도 60% 이상의 상동성을 지닌 폴리뉴클레오타이드, 바람직하게는 적어도 80% 이상의 상동성을 지닌 폴리뉴클레오타이드, 더욱 바람직하게는 적어도 95% 이상의 상동성을 지닌 폴리뉴클레오타이드를 포함한다.

"높은 스트린전트 조건"이라는 용어는 서열이 매우 상보적인 DNA 스트랜드의 하이브리디제이션을 가능하게 하고 유의적으로 미스매치된 DNA의 하이브리디제이션을 제외하도록 고안된 조건을 나타낸다. 하이브리디제이션 스트린전시는 주로 온도, 이온 강도 및 포름아마이드와 같은 변성제의 농도에 의해 결정된다. 하이브리디제이션 및 세척에 대한 "높은 스트린전트 조건"의 예는 65∼68℃에서의 0.0015 M 염화나트륨, 0.0015 M 구연산나트륨 또는 42℃에서의 0.015 M 염화나트륨, 0.0015 M 구연산나트륨 및 50% 포름아마이드이다. Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual (2nd ed., Cold Spring Harbor Laboratory, N.Y., 1989); Anderson et al., Nucleic Acid Hyrbridization: A Practicla Approach Ch. 4 (IRL Press Limited)(Oxford Express) 참조. 더 큰 스트린전트 조건(더 높은 온도, 더 낮은 이온 강도, 더 높은 포름아마이드 또는 다른 변성제와 같은)도 일반적으로 이용된다. 다른 작용제는 비-특이적 및/또는 백그라운드 하이브리디제이션의 감소 목적으로 하이브리다이즈 및 세척 완충액 내에 포함된다. 다른 적당한 작용제도 사용될 수 있으나 예는 0.1% 소 혈청 알부민, 0.1% 폴리비닐프롤리돈, 0.1% 피로인산나트륨, 0.1% 도데실황산나트륨(NaDodSO₄ 또는 SDS), Ficoll, Denhardt's 용액, 초음파 분해된 연어 정자 DNA(또는 또다른 비-상보적 DNA) 및 황산덱스트란이다. 이들 첨가제의 농도 및 형태는 하이브리디제이션 조건의 스트린전시에 실질적으로 영향을 미치지 않고 변호될 수 있다. 하이브리디제이션 실험은 일반적으로 pH 6.8∼7.4에서 수행된다; 그러나 일반적인 이온 강도 조건에서 하이브리디제이션 속도는 거의 pH에 독립적이다. Anderson et al., Nucleic Acid Hyrbridization: A Practicla Approach Ch. 4 (IRL Press Limited)(Oxford UK) 참조.

DNA 두가닥의 안정성에 영향을 미치는 작용제는 염기 조성, 길이 및 염기쌍 미스매치의 정도를 포함한다. 하이브리디제이션 조건은 이들 변이를 조정하기 위해 당업자에 의해 조정될 수 있고 DNA의 다른 서열 관련성이 하이브리드를 가능하게 한다. 완벽하게 매치된 DNA 두가닥의 융해온도는 하기 공식에 의해 추정된다:

Tm (℃) = 81.5 + 16.6 (log[Na+] + 0.41 (% G+C) - 600/N - 0.71 (% 포름아마이드)

상기 N은 형성된 두가닥의 길이이고, [Na+]은 하이브리디제이션 또는 세척 용액 내의 나트륨 이온의 몰 농도이고, % G+C는 하이브리드 내의 염기(구아닌+시토신)의 백분율이다. 불완전하게 매치된 하이브리드의 경우 융해온도는 1% 미스매치 각각에 대해 약 1℃까지 감소된다.

"중간의 스트린전트 조건"이라는 용어는 "높은 스트린전트 조건"하에서 발생할 수 있는 것 보다 더 큰 정도의 염기쌍 미스매치를 지닌 DNA 두가닥이 형성될 수 있는 조건을 나타낸다. 일반적인 "중간의 스트린전트 조건"의 예는 50∼65℃에서의 0.015 M 염화나트륨, 0.0115 M 구연산나트륨 또는 37∼50℃에서의 0.015 M 염화나트륨, 0.0015 M 구연산 나트륨 및 20% 포름아마이드이다. 예로서 0.015 M 나트륨 이온 내의 50℃의 "중간의 스트린전트 조건"은 약 21%의 미스매치를 가능하게 할 것이다.

"높은 스트린전트 조건"과 "중간의 스트린전트 조건"사이에 절대적인 구분은 없음이 당업자에 의해 인식될 것이다. 예를 들어 0.015 M 나트륨 이온(포름아마이드 없음)에서 완벽하게 매치된 긴 DNA의 융해온도는 약 71℃이다. 65℃에서 세척시 이는 약 6^ 미스매치가 된다. 더욱 뚜렷하게 관련된 서열을 포획하기 위해 당업자는 온도 또는 이온 강도를 단순히 저하시킬 수 있다.

1 M NaCl 내의 융해온도의 알맞은 계산은 하기에 의해 제공된다:

Tm = (A-T 염기쌍 당 2℃) + (G-C 염기쌍 당 4℃)

6X 구연산나트륨 염(SSC) 내의 나트륨 이온 농도가 1 M임을 주지해야 한다. Suggs et al., Developmental Biology Using Pruified Genes 683(Brown and Fox, eds., 1981).

DNA 중합효소 단백질을 인코드하는 자연-발생적 핵산은 PCR 프라이머 및 예를 들어 서열번호 1, 3, 41, 43, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65에 나타난 핵산 서열의 일부를 포함한 하이브리디제이션 프로브를 지닌 cDNA 라이브러리로부터 용이하게 분리된다. DNA 중합효소를 인코드하는 바람직한 핵산 또는 그의 변이체 또는 단편은 42℃에서 1% 소 혈청 알부민(BSA); 500 mM 인산나트륨(NaPO₄); 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 50℃에서 2xSSC(600 mM NaCl; 60 mM 구연산나트륨); 및 0.1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서, 더욱 바람직하게는 50℃에서 1% 소 혈청 알부민(BSA); 500 mM 인산나트륨(NaPO₄); 15% 포름아마이드; 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 50℃에서 1xSSC(300 mM NaCl; 30 mM 구연산나트륨); 및 1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서, 가장 바람직하게는 50℃에서 1% 소 혈청 알부민(BSA); 200 mM 인산나트륨(NaPO₄); 15% 포름아마이드; 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 65℃에서 0.5xSSC(150 mM NaCl; 15 mM 구연산나트륨); 및 0.1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서 서열번호 1, 3, 41, 43, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65에 나타난 서열의 전체 또는 일부에 하이브리다이즈 가능하다.

여기에 사용된 "프로브"라는 용어는 특이적 염기 서열을 지닌 핵산 분자 또는 예를 들어 특이적 아미노산 서열을 포함한 펩타이드를 포함하나 이에 한정적인 것은 아닌 것을 포함하여 검색에 사용되는 물질을 나타내고, 이는 시험관 내 및/또는 생체 내 선별과 같은 생물학적 실험에 사용된다.

일반적 프로브로서 핵산 분자의 예는 목적 유전자의 핵산 서열에 상동적이거나 상보적인 적어도 8 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열을 지닌 것을 포함한다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드 길이, 적어도 12 이상의 인접 뉴클레오타이드 길이, 적어도 13 이상의 인접 뉴클레오타이드 길이, 적어도 14 이상의 인접 뉴클레오타이드 길이, 적어도 15 이상의 인접 뉴클레오타이드 길이, 적어도 20 이상의 인접 뉴클레오타이드 길이, 적어도 25 이상의 인접 뉴클레오타이드 길이, 적어도 30 이상의 인접 뉴클레오타이드 길이, 적어도 40 이상의 인접 뉴클레오타이드 길이, 적어도 50 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열이다. 프로브로서 사용되는 핵산 서열은 상기-기술된 서열에 대해 적어도 70% 이상, 더욱 바람직하게는 적어도 80% 이상, 더욱 더 바람직하게는 적어도 90% 이상 또는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다.

여기에 사용된 "검색"이라는 용어는 제공된 핵산 서열이 전기적으로 또는 생물학적으로 또는 다른 방법을 이용하여 특이적 기능 및/또는 성질을 지닌 다른 핵산 염기 서열을 찾는데 이용되는 것을 나타낸다. 전기적 검색의 예는 BLAST(Altschul et al., J. Mol. Biol. 215:403-410 (1990)), FASTA(Pearson & Lipman, Proc. Natl. Acad. Sci., USA 85:2444-2448 (1988)), Smith and Waterman 방법(Smith and Waterman, J. Mol. Biol. 147:195-197 (1981)) 및 Needlman and Wunsch 방법(Needlman and Wunsch, J. Mol. Biol. 48:443-453 (1970)) 등을 포함하나 이에 한정적인 것은 아니다. 생물학적 검색의 예는 스트린전트 하이브리디제이션시 게놈 DNA가 나일론 멤브레인에 부착되는 마이크로에레이 또는 게놈 DNA가 유리 플레이트에 부착되는 마이크로어레이(마이크로에세이), PCR 및 원위치 하이브리디제이션을 포함하나 이에 한정적인 것은 아니다. 여기서 본 발명에 사용된 DNA 중합효소 등은 전기적 또는 생물학적 검색에 의해 확인된 상응하는 유전자를 포함된다.

여기서 사용된 "서열(아미노산, 뉴클레오타이드 등) 동일성, 상동성 또는 유사성의 백분율"은 비교 창에 최적으로 정렬된 2개의 서열을 비교함으로서 측정되고, 참조 서열(첨가 또는 삭제를 포함하지 않는(다른 서열이 첨가를 포함한 경우 갭이 발생함)에 비교시 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개 서열의 최적 정렬에 대해 첨가 또는 삭제(즉, 갭)를 포함함이 특징이다. 백분율은 매치된 위치의 수를 산출하기 위해 동일한 핵산 염기 또는 아미노산 잔기가 양쪽 서열 내 발생한 위치의 수를 측정하고, 매치된 위치의 수를 참조 서열 내 총 위치 수(즉, 창 크기)로 나누고, 서열 동일성의 백분율을 산출하기 위해 결과에 100을 곱함으로서 계산된다. 검색에 사용시 상동성은 당분야에 알려진 다양한 서열 비교 알고리즘 및 프로그램으로부터 선택된 적당한 기술에 의해 산정된다. 이러한 알고리즘 및 프로그램의 예는 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW(Pearson & Lipman, 1988, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, Altschul et al., 1990, J. Mol. Biol. 215(3):403-410, Thompson et al., 1994, Nucleic Acids Res. 22(2):4673-4680, Higgins et al., 1996, Methods Enzymol. 266:383-402, Altschul et al., 1990, J. Mol. Biol. 214(3):403-410, Altschul et al., 1993, Nature Genetics 3:266-272)를 포함하나 이에 한정적인 것은 아니다. 특히 바람직한 실시태양에서 단백질 또는 핵산 서열의 상동성은 당분야에 잘 알려진 Basic Local Alignment Search Tool(BLAST)를 이용하여 산정된다(Karlin and Altschul, 1990, Proc. Natl. Acad. Sci. USA 87:2267-2268, Alstschul et al., 1990, J. Mol. Biol. 214(3):403-410, Alstschul et al., 1997, Nuc. Acids, Res. 25:3389-3402). 특히 5 상술된-BLAST 프로그램이 비교 또는 검색을 달성하는 하기 태스크를 수행하는데 이용된다:

(1) BLASTP 및 BLAST3을 이용한 의문의 아미노산 서열과 단백질 서열 데이터베이스와의 비교;

(2) BLASTN을 이용한 의문의 뉴클레오타이드 서열과 뉴클레오타이드 서열 데이터베이스와의 비교;

(3) BLASTX를 이용한 의문의 뉴클레오타이드 서열(양쪽 스트랜드)이 6 리딩 프레임에 걸쳐 전환된 개념적으로 번역된 생성물과 단백질 서열 데이터베이스와의 비교;

(4) TBLASTN을 이용한 6 리딩 프레임(양쪽 스트랜드)에 걸쳐 전환된 모든 의문의 단백질 서열과 뉴클레오타이드 서열 데이터베이스의 비교; 및

(5) TBLASTX를 이용한 6 리딩 프레임에 걸쳐 전환된 의문의 뉴클레오타이드 서열과 뉴클레오타이드 서열 데이터베이스의 비교.

BLAST 프로그램은 의문의 아미노산 서열 또는 의문의 뉴클레오타이드 서열과 단백질 서열 데이터베이스 또는 핵산 서열 데이터베이스로부터 바람직하게 수득된 시험 서열 사이의 "고득점 세그먼트 쌍"이라 불리는 유사성 세그먼트를 명기함으로서 상동성 서열을 확인한다. 다수의 고득점 세그먼트 쌍은 바람직하게는 당분야에 잘 알려진 득점 매트릭스를 이용하여 확인된다(정렬된다). 바람직하게는 득점 매트릭스는 BLOSUM62 매트릭스이다(Gonnet et al., 1992, Science 256:1443-1445, Henikoff and Henikoff, 1993, Proteins 17:49-61). BLOSUM62 매트릭스만큼 바람직하지는 않으나 PAM 또는 PAM250 매트릭스도 이용된다(즉, Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation 참조). BLAST 프로그램은 모든 확인된 고득점 세그먼트 쌍의 통계적 유의성을 산정하고 바람직하게는 이용자 세트 상동성과 같은 이용자에 의해 독립적을 한정된 역치 수준의 유의성을 만족시키는 세그먼트를 선택한다. 바람직하게는 고득점 세그먼트 쌍의 통계적 유의성은 Karlin의 공식(Karlin and Altschul, 1990, Proc. Natl. Acad. Sci. USA 87:2267-2268 참조)을 이용하여 산정된다.

여기서 사용된 "프라이머"라는 용어는 거대분자 합성 효소 반응시 합성되는 거대분자 화합물의 반응의 개시에 필요한 물질을 나타낸다. 핵산 분자를 합성하기 위한 반응시 합성되는 거대분자 화합물의 일부에 상보적인 핵산 분자(즉, DNA, RNA 등)가 이용된다.

일반적으로 프라이머로 이용되는 핵산 분자는 목적 유전자의 핵산 서열에 상보적인 적어도 8 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열을 지닌 것을 포함한다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드 길이, 적어도 12 이상의 인접 뉴클레오타이드 길이, 적어도 13 이상의 인접 뉴클레오타이드 길이, 적어도 14 이상의 인접 뉴클레오타이드 길이, 적어도 15 이상의 인접 뉴클레오타이드 길이, 적어도 16 이상의 인접 뉴클레오타이드 길이, 적어도 17 이상의 인접 뉴클레오타이드 길이, 적어도 18 이상의 인접 뉴클레오타이드 길이, 적어도 19 이상의 인접 뉴클레오타이드 길이, 적어도 20 이상의 인접 뉴클레오타이드 길이, 적어도 25 이상의 인접 뉴클레오타이드 길이, 적어도 30 이상의 인접 뉴클레오타이드 길이, 적어도 40 이상의 인접 뉴클레오타이드 길이, 적어도 50 이상의 인접 뉴클레오타이드 길이를 지닌다. 프라이머로서 사용되는 핵산 서열은 상기-기술된 서열에 대해 적어도 70% 이상, 더욱 바람직하게는 적어도 80% 이상, 더욱 더 바람직하게는 적어도 90% 이상, 가장 바람직하게는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다. 프라이머로서 적당한 서열은 합성되는(증폭되는) 서열의 특성에 따라 달라진다. 당업자는 목적 서열에 따라 다른 적당한 프라이머를 고안할 수 있다. 이러한 프라이머 고안은 당분야에 잘 알려져 있고 수동으로 또는 컴퓨터 프로그램(즉, LASERGENE, Primer Select, DNAStar)을 이용하여 수행된다.

여기서 사용된 "에피토프"라는 용어는 항원-항체 반응을 유도할 수 있는 한 상세한 구조가 반드시 한정될 필요가 없는 항원 결정소를 나타낸다. 따라서 "에피토프"라는 용어는 특정 면역글로불린에 의한 인식에 관련된 아미노산 잔기 세트를 포함하고 또는 T 세포의 경우 이들 잔기는 T 세포 수용체 단백질 및/또는 주조직 적합 복합체(Major Histocompatibility Complex(MHC)) 수용체에 의한 인식에 필수적이다. 또한 이러한 용어는 "항원 결정소" 또는 "항원 결정소 사이트"와 상호교환가능하게 사용된다. 면역학 분야에서 생체 내 또는 시험관 내에서 에피토프는 (면역글로불린, T 세포 수용체 또는 HLA 분자에 의해 인식되는 사이트를 형성하는 분자의 특징이다(즉, 1차, 2차 및 3차 펩타이드 구조 및 전하). 펩타이드를 포함한 에피토프는 에피토프에 유일한 공간적 입체형태 내에 3 이상의 아미노산을 포함한다. 일반적으로 에피토프는 적어도 5 이상의 이러한 아미노산으로 구성되고, 더욱 바람직하게는 적어도 6, 7, 8, 9 또는 10 이상의 이러한 아미노산으로 구성된다. 에피토프의 길이가 더 커질수록 본래 펩타이드에 대한 에피토프의 유사성이 높아진다 즉, 더 긴 에피토프가 일반적으로 바람직하다. 입체형태가 고려될 때 이는 항상 그렇지는 않다. 당분야에 알려진 아미노산의 공간적 입체형태를 측정하는 방법은 예를 들어 X-선 결정학 및 2-차원 핵 자기 공명 분광학을 포함한다. 더욱이 제공된 단백질 내 에피토프의 확인은 당분야에 잘 알려진 기술을 이용하여 용이하게 달성된다. Geysen et al., Proc. Natl. Acad. Sci. USA (1984) 81:3998(제공된 항원 내 면역원성 에피토프의 위치를 측정하기 위해 펩타이드를 빠르게 합성하는 일반 방법); 미국 특허 제4,708,871(항원의 에피토프를 확인하고 화학적을 합성하는 절차) 및 Geysen et al., Molecular Immunology (1986) 23:709(제공된 항체에 대해 높은 친화력을 지닌 펩타이드를 확인하는 기술) 참조. 동일한 에피토프를 인식하는 항체는 간단한 면역에세이로 확인될 수 있다. 따라서 펩타이드를 포함한 에피토프를 측정하는 방법은 당분야에 잘 알려져 있다. 에피토프의 1차 핵산 또는 아미노산 서열이 제공된 경우 이러한 에피토프는 당업자에 의해 잘-알려진 일반적 기술을 이용하여 측정될 수 있다.

따라서 펩타이드를 포함한 에피토프는 적어도 3개 이상의 아미노산, 바람직하게는 적어도 4개 이상의 아미노산, 더욱 바람직하게는 적어도 5개 이상의 아미노산, 적어도 6개 이상의 아미노산, 적어도 7개 이상의 아미노산, 적어도 8개 이상의 아미노산, 적어도 9개 이상의 아미노산, 적어도 10개 이상의 아미노산, 적어도 15개 이상의 아미노산, 적어도 20개 이상의 아미노산, 적어도 25개 이상의 아미노산의 길이를 지닌 서열을 필요로 한다.

(유전자의 변형)

제공된 단백질 분자에 있어서(즉, DNA 중합효소 등), 서열 내에 포함된 제공된 아미노산은 상호작용성 결합 능력의 뚜렷한 감소 또는 손실 없이 양이온성 구역 또는 기질 분자 결합 사이트와 같은 단백질 구조 내에서 또다른 아미노산과 치환된다. 단백질의 제공된 생물학적 기능은 단백질의 상호작용성 능력 또는 다른 특성에 의해 정의된다. 따라서 특정한 아미노산 치환은 아미노산 서열 내에서 또는 DNA 코드 서열 수준에서 수행되어 치환 후 본래 특성을 유지하는 단백질을 생성한다. 따라서 여기서 정의된 펩타이드 및 이러한 펩타이드를 인코드하는 DNA의 다양한 변형이 생물학적 유용성의 뚜렷한 손실 없이 수행된다. 대안으로, DNA 중합효소를 인코드하는 핵산 서열이 변형되어 DNA 중합효소의 프루프리딩 기능이 변형되기도 한다.

상기-기술된 변형이 고안될 때 아미노산의 소수성 인덱스가 고려된다. 소수성 아미노산 인덱스는 일반적으로 당분야에 인식되는 단백질에 상호작용성 생물학적 기능을 제공하는데 중요한 역할을 한다(Kyte. J and Doollittle, R.F., J. Mol. Biol. 157(1):105-132, 1982). 아미노산의 소수성 성질은 단백질의 2차 구조에 기여하여 단백질과 다른 분자(즉, 효소, 물질, 수용체, DNA, 항체, 항원 등) 사이의 상호작용을 조절한다. 각각의 아미노산은 하기와 같은 그의 소수성 및 전하 특성에 기반한 소수성 인덱스를 제공한다: 이소류신(+4.5); 발린(+4.2); 류신(+3.8); 페닐알라닌(+2.8), 시스테인/시스틴(+2.5); 메티오닌(+1.9); 알라닌(+1.8), 글리신(-0.4); 트레오닌(-0.7); 세린(-0.8); 트립토판(-0.9); 티로신(-1.3); 프롤린(-1.6); 히스티딘(-3.2); 글루탐산(-3.5); 글루타민(-3.5); 아스파르트산(-3.5); 아스파라긴(-3.5); 라이신(-3.9) 및 아르기닌(-4.5).

제공된 아미노산이 유사한 소수성 인덱스를 지닌 또다른 아미노산으로 치환되면 수득된 단백질은 본래 단백질과 유사한 생물학적 기능을 여전히 지님이 잘 알려져 있다(즉, 동등한 효소 활성을 지닌 단백질). 이러한 아미노산 치환의 경우 소수성 인덱스는 바람직하게는 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내이다. 소수성에 기반한 이러한 아미노산 치환이 효과적임이 이해된다.

본 발명의 유전자를 변형시 친수성 인덱스가 고려된다. 미국 특허 제4,554,101호에 기술된 바와 같이 아미노산 잔기는 하기 친수성 인덱스를 제공한다: 아르기닌(+3.0); 라이신(+3.0); 아스파르트산(+3.0±1); 글루탐산(+3.0±1); 세린(+0.3); 아스파라긴(+0.2); 글루타민(+0.2); 글리신(0); 트레오닌(-0.4); 프롤린(-0.5±1); 알라닌(-0.5); 히스티딘(-0.5); 시스테인(-1.0); 메티오닌(-1.3); 발린(-1.5); 류신(-1.8); 이소류신(-1.8); 티로신(-2.3); 페닐알라닌(-2.5); 및 트립토판(-3.4). 아미노산이 유사한 친수성 인덱스를 지닌 또다른 아미노산으로 치환되고 생물학적 등가물을 여전히 제공함이 이해된다. 이러한 아미노산 치환의 경우 친수성 인덱스는 바람직하게는 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내이다.

여기서 사용된 "보존적 치환"이라는 용어는 치환된 아미노산 및 치환 아미노산이 유사한 친수성 인덱스 및/또는 소수성 인덱스를 지닌 아미노산 치환을 나타낸다. 예를 들어 보존적 치환은 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내의 친수성 또는 소수성 인덱스를 지닌 아미노산들 사이에서 수행된다. 보존적 치환의 예는 당분야에 잘 알려진 하기 잔기 쌍 각각의 치환을 포함하나 이에 한정적인 것은 아니다: 아르기닌과 라이신; 글루탐산과 아스파르트산; 발린, 류신 및 이소류신.

여기서 사용된 "변이체"라는 용어는 본래 물질과 부분적으로 다른 폴리펩타이드, 폴리뉴클레오타이드와 같은 물질을 나타낸다. 이러한 변이체의 예는 치환 변이체, 첨가 변이체, 삭제 변이체, 절제된 변이체, 대립유전자성 변이체 등을 포함한다. 이러한 변이체의 예는 참조 핵산 분자 또는 폴리펩타이드에 대해 하나 또는 수개의 치환, 첨가 및/또는 삭제를 지닌 뉴클레오타이드 또는 폴리뉴클레오타이드 또는 적어도 하나 이상의 치환, 첨가 및/또는 삭제를 지닌 뉴클레오타이드 또는 폴리펩타이드를 포함하나 이에 한정적인 것은 아니다. 변이체는 참조 분자(즉, 야생형 분자 등)의 생물학적 활성은 지니거나 지니지 않는다. 변이체는 목적에 따라 부가적인 생물학적 활성을 부여하거나 생물학적 활성의 일부가 결핍된다. 이러한 고안은 당분야에 잘 알려진 기술을 이용하여 수행될 수 있다. 대안으로, 특성이 이미 알려진 변이체는 생물체로부터의 분리에 의해 수득되어 변이체를 생성하고, 서열 정보를 수득하기 위해 변이체의 핵산 서열이 증폭된다. 따라서 숙주 세포에 있어서 이형성 종 또는 그의 생성물로부터 유래된 상응하는 유전자는 "변이체"로 간주된다.

여기서 사용된 "대립유전자"라는 용어는 2개 유전자가 서로 구별되는 상응하는 유전자와 동일한 좌위에 위치한 유전적 변이체를 나타낸다. 따라서 여기서 사용된 "대립유전자성 변이체"라는 용어는 제공된 유전자와 대립유전자 관계를 지닌 변이체를 나타낸다. 이러한 대립유전자성 변이체는 일반적으로 상응하는 대립유전자와 동일하거나 매우 유사한 서열을 지니고, 거의 다른 생물학적 활성을 지니지 않으나 일반적으로 거의 동일한 생물학적 활성을 지닌다. 여기서 사용된 "종 상동체" 또는 "상동체"라는 용어는 제공된 종 내에서 제공된 유전자와 아미노산 또는 뉴클레오타이드 상동성(바람직하게는 적어도 60% 이상의 상동성, 더욱 바람직하게는 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상 및 적어도 95% 이상의 상동성)을 지닌 것을 나타낸다. 이러한 종 상동체를 수득하는 방법은 본 명세서의 설명으로부터 명백하게 이해된다. "오르쏠로그(ortholog)"(또한 오르쏠로성 유전자)라는 용어는 일반 계통으로부터 유래된 다른 종(종분화에 의한) 내의 유전자를 나타낸다. 예를 들어 다유전자 구조를 지닌 헤모글로빈 유전자 패밀리의 경우 인간과 마우스 α-헤모글로빈 유전자는 오르쏠로그인 반면, 인간 α-헤모글로빈 유전자와 인간 β-헤모글로빈 유전자는 파라로그(paralog)(유전자 중복으로부터 발생된 유전자)이다. 오르쏠로그는 분자 계통수의 평가에 유용하다. 일반적으로 다른 종 내의 오르쏠로그는 본래 종과 동일한 기능을 지닌다. 따라서 본 발명의 오르쏠로그는 본 발명에 유용하다.

여기서 사용된 "보존적 (또는 보존적으로 변형된) 변이체"는 아미노산과 핵산 서열 모두에 적용된다. 특정한 핵산 서열에 대해 보존적으로 변형된 변이체는 동일하거나 실제로 동일한 아미노산 서열을 인코드하는 핵산을 나타낸다. 유전적 코드의 퇴보 때문에 다수의 기능적으로 동일한 핵산이 어떠한 제공된 단백질을 인코드한다. 예를 들어 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 인코드한다. 따라서 알라닌이 코돈에 의해 명시된 모든 위치에서 코돈은 인코드되는 폴리펩타이드를 변경시키지 않고 기술된 어떠한 상응하는 코돈으로도 변경될 수 있다. 이러한 핵산 변이는 보존적으로 변형된 변이체의 하나의 종을 나타내는 "침묵 변이"이다. 또한 여기서 폴리펩타이드를 인코드하는 모든 핵산 서열은 핵산의 모든 가능한 침묵 변이를 기술한다. 당업자는 핵산 내 각 코돈(메티오닌만을 위한 코돈인 AUG 및 트립토판만을 위한 코돈인 TGG를 제외한)은 기능적으로 동일한 분자를 산출하도록 변형될 수 있음이 인식할 것이다. 따라서 폴리펩타이드를 인코드하는 핵산의 각각의 침묵 변이는 각각의 기술된 서열 내에 함축된다. 바람직하게는 이러한 변형은 폴리펩타이드의 고차 구조에 크게 영향을 미칠 수 있는 아미노산인 시스테인의 치환을 제외하고 수행된다. 염기 서열의 이러한 변형 방법의 예는 제한효소 등을 이용한 분할; DNA 중합효소, Klenow 단편, DNA 리가제 등을 이용한 처리에 의한 라이게이션; 및 합성된 올리고뉴클레오타이드를 이용한 자리 특이적 염기 치환 방법(특이적-자리 지정 돌연변이유발; Mark Zoller and Michael Smith, Methods in Enzymology, 100, 468-500(1983))을 포함한다. 변형은 분자생물학 분야에서 일반적으로 이용되는 방법을 이용하여 수행될 수 있다.

기능적으로 동등한 폴리펩타이드를 제조하기 위해 아미노산 치환, 삭제 및/또는 변형이 아미노산 치환 이외에 수행될 수 있다. 아미노산 치환(들)은 1 내지 10개의 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 다른 아미노산으로의 대치와 같이 본래 펩타이드 체인의 적어도 하나 이상의 아미노산의 다른 아미노산으로의 대치를 나타낸다. 아미노산 첨가(들)는 본래 펩타이드 체인으로의 1 내지 10개 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 첨가와 같이 본래 펩타이드 체인으로의 적어도 하나 이상의 아미노산의 첨가를 나타낸다. 아미노산 삭제(들)는 1 내지 10개의 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 삭제와 같이 적어도 하나 이상의 아미노산의 삭제를 나타낸다. 아미노산 변형은 아미드화, 카르복시화, 당화, 인산화, 하이드록실화, 아실화(즉, 아세틸화) 등을 포함하나 이에 한정적인 것은 아니다. 치환되거나 첨가된 아미노산은 자연-발생적 또는 비자연-발생적 아미노산 또는 아미노산 유사체이다. 자연-발생적 아미노산이 바람직하다.

여기서 사용된 "펩타이드 유사체" 또는 "펩타이드 유도체"라는 용어는 펩타이드와 다르나 펩타이드와 동등한 적어도 하나 이상의 화학적 또는 생물학적 기능을 지닌 화합물을 나타낸다. 따라서 펩타이드 유사체는 본래 펩타이드에 대해 적어도 하나 이상의 아미노산 유사체 또는 아미노산 유도체 첨가 또는 치환을 지닌 것을 포함한다. 펩타이드 유사체는 상기-기술된 첨가 또는 치환을 지녀서 그의 기능은 본래 펩타이드와 실질적으로 동일하다(즉, 유사한 pKa 수치, 유사한 기능적 그룹, 다른 분자에 대한 유사한 결합 방식, 유사한 물-용해성 등). 이러한 펩타이드 유사체는 당분야에 잘 알려진 기술을 이용하여 제조될 수 있다. 따라서 펩타이드 유사체는 아미노산 유사체를 포함한 폴리머이다.

유사하게는, 여기서 사용된 "폴리뉴클레오타이드 유사체" 또는 "핵산 유사체"라는 용어는 폴리뉴클레오타이드 또는 핵산과 다르나 폴리뉴클레오타이드 또는 핵산과 동등한 적어도 하나 이상의 화학적 또는 생물학적 기능을 지닌 화합물을 나타낸다. 따라서 폴리뉴클레오타이드 또는 핵산 유사체는 본래 폴리뉴클레오타이드 또는 핵산에 대해 적어도 하나 이상의 뉴클레오타이드 유사체 또는 뉴클레오타이드 유도체 첨가 또는 치환을 지닌 것을 포함한다.

여기서 사용된 핵산 분자는 상기-기술된 바와 같이 핵산에 의해 발현되는 폴리펩타이드가 자연-발생적 폴리펩타이드와 실질적으로 동일한 활성을 지니는 한 핵산 서열의 일부가 삭제되거나 다른 염기(들)로 치환되거나 추가적 핵산 서열이 삽입된 것을 포함한다. 대안으로, 추가적 핵산은 핵산의 5' 말단 및/또는 3' 말단에 결합된다. 핵산 분자는 스트린전트 조건 하에서 폴리펩타이드를 인코드하는 유전자에 하이브리다이즈 가능하고 실질적으로 동일한 기능을 지닌 폴리펩타이드를 인코드하는 것을 포함한다. 이러한 유전자는 당분야에 알려져 있고 본 발명에 이용될 수 있다.

상기-기술된 핵산은 잘-알려진 PCR 방법 즉, 화학 합성에 의해 수득될 수 있다. 이러한 방법은 예를 들어 자리-지정 돌연변이유발, 하이브리디제이션 등과 결합된다.

여기서 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 "치환", "첨가" 또는 "삭제"라는 용어는 본래 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 아미노산 또는 그의 치환체 또는 뉴클레오타이드 또는 그의 치환체의 치환, 첨가 또는 삭제를 나타낸다. 이는 자리-지정 돌연변이유발 기술을 포함한 당분야에 잘 알려진 기술에 의해 달성된다. 폴리펩타이드 또는 폴리뉴클레오타이드는 어떠한 수(>0)의 치환, 첨가 또는 삭제도 지닌다. 상기 수는 의도된 기능(즉, 호르몬 및 사이토카인의 정보 전달 기능 등)을 유지하는 수의 치환, 첨가 또는 삭제를 지닌 변이체만큼 클 수 있다. 예를 들어 이러한 수는 하나 또는 수개, 바람직하게는 전체 길이의 20% 또는 10% 이내 또는 100 이하, 50 이하, 25 이하이다.

(유전공학)

여기서 사용된 DNA 중합효소와 같은 단백질, 그의 단편 및 변이체 등은 유전공학 기술에 의해 생성되고 도입될 수 있다.

유전자가 여기서 논의될 때 "벡터" 또는 "재조합 벡터"라는 용어는 타겟 세포로 목적 폴리뉴클레오타이드 서열을 전이시킬 수 있는 벡터를 나타낸다. 이러한 벡터는 자가-복제 또는 숙주 세포(즉, 원핵세포, 효모, 동물세포, 식물세포, 곤충세포, 개체 동물, 개체 식물 등) 내 염색체 내로의 통합이 가능하고, 본 발명의 폴리뉴클레오타이드의 전사에 적당한 프로모터를 포함한다. 클로닝에 적당한 벡터는 "클로닝 벡터"로 표기된다. 이러한 클로닝 벡터는 일반적으로 다수의 제한 사이트를 포함한 다수 클로닝 사이트를 포함한다. 제산 사이트 및 다수 클로닝 사이트는 당분야에 잘 알려져 있고 목적에 따라 적당히 또는 선택적으로 이용된다. 기술은 여기서 기술된 참고문헌에 기술되어 있다(즉, Sambrook et al. (상동)). 이러한 벡터는 예를 들어 플라스미드를 포함한다.

여기서 사용된 "플라스미드"라는 용어는 염색체와 떨어져서 존재하고 자가 복제하는 유전 인자를 나타낸다. 상세하게 논의시 세포 핵의 미토콘드리아, 엽록체 등 내에 포함된 DNA는 일반적으로 소기관 DNA라고 불리고 플라스미드와 구분된다 즉, 플라스미드에 포함되지 않는다.

플라스미드의 예는 하기를 포함하나 이에 한정적인 것은 아니다:

E. coli : pET (TAKARA), pUC (TOYOBO), pBR322 (TOYOBO), pBluescriptII (TOYOBO);

효모 : pAUR (TAKARA), pESP (TOYOBO), pESC (TOYOBO);

바실러스 섭틸리스 : pHY300PLK (TAKARA);

사상균 : pPRTI (TAKARA), pAUR316 (TAKARA);

동물세포 : pCMV (TOYOBO), pBK-CMV (TOYOBO) 등.

여기서 사용된 "발현 벡터"라는 용어는 구조 유전자 및 그의 발현을 조절하는 프로모터 및 추가적으로 숙주 세포 내에서 이들을 작동하게 하는 상태의 다양한 조절 요소를 포함한 핵산 서열을 나타낸다. 조절 요소는 바람직하게는 터미네이터, 약물-저항성 유전자와 같은 선택가능 마커 및 사일런서(silencer) 및/또는 인핸서를 포함한다. 생물체(즉, 식물) 발현 벡터의 형태 및 조절 요소의 형태는 숙주 세포에 따라 달라짐이 당업자에게 잘 알려져 있다. 특이적 프로모터를 세포 내로 도입시킴으로서 세포의 오류-빈발 빈도는 특정한 조건 하에서 조절될 수 있다.

여기서 사용된 원핵성 세포에 대한 "재조합 벡터"는 예를 들어 pcDNA 3(+), pBluscript-SK(+/-), pGEM-T, pEF-BOS, pEGFP, pHAT, pUC18, pFT-DEST^TM, 42GATEWAY(Invitrogen) 등을 포함한다.

여기서 사용된 동물 세포에 대한 "재조합 벡터"는 예를 들어 pcDNA I/Amp, pcDNA I, pCDM8(모든 Funakoshi, 일본 동경에서 구입가능함), pAGE107[일본 공개공보 제3-229호(Invitrogen)], pAGE103[J. Biochem., 101, 1307(1987)], pAMo, pAMoA[J. Biol. Chem., 268, 22782-22787(1993)], 쥐과 줄기세포 바이러스(Murine Stem Cell Virus(MSCV))에 기반한 레트로바이러스 발현 벡터, pEF-BOS, pEGFP 등을 포함한다.

식물세포에 사용되는 재조합 벡터의 예는 Ti 플라스미드, 담배 모자이크 바이러스 벡터, 콜리플라워 모자이크 바이러스 벡터, 제미니 바이러스 벡터 등을 포함한다.

곤충세포에 사용되는 재조합 벡터는 바큘로바이러스 벡터 등을 포함한다.

여기서 사용된 "터미네이터"라는 용어는 유전자의 단백질-인코드 구역의 다운스트림에 위치하고 DNA가 mRNA로 전사될 때 전사의 종결 및 폴리 A 서열의 첨가에 관련된 서열을 나타낸다. 터미네이터는 mRNA의 안정성에 기여하고 유전자 발현량에 영향을 미치는 것으로 알려져 있다.

여기서 사용된 "프로모터"라는 용어는 유전자의 전사 개시 사이트를 결정하고 전사 빈도를 직접 조절하는 DNA 구역인 염기 서열을 나타낸다. 전사는 프로모터에 결합하는 RNA 중합효소에 의해 시작된다. 따라서 프로모터로서 기능하는 제공된 유전자의 일부가 여기서 "프로모터 부분"으로 표기된다. 프로모터 구역은 일반적으로 추정 단백질 코딩 구역의 첫 번째 엑손의 약 2 kbp 업스트림 내에 위치한다. 따라서 DNA 분석 소프트웨어를 이용하여 게놈 염기 서열 내 단백질 코딩 구역을 예측함으로서 프로모터 구역을 추정하는 것이 가능하다. 추정 프로모터 구역은 일반적으로 구조 유전자의 업스트림에 위치하나 구조 유전자에 따라 다르게 추정 프로모터 구역은 구조 유전자의 다운스트림에 위치한다. 바람직하게는 추정 프로모터 구역은 첫 번째 엑손의 번역 개시 사이트의 약 2 kbp 업스트림에 위치한다.

여기서 사용된 "인핸서"라는 용어는 목적 유전자의 발현 효율을 강화시키기 위해 사용되는 서열을 나타낸다. 이러한 인핸서는 당분야에 잘 알려져 있다. 하나 이상의 인핸서가 사용되거나 어떠한 인핸서도 사용되지 않는다.

여기서 사용된 "사일런서"라는 용어는 유전자의 발현을 억제하거나 중지시키는 기능을 지닌 서열을 나타낸다. 본 발명에서 이러한 기능을 지닌 사일런서가 사용되거나 대안으로 어떠한 사일런서도 사용되지 않는다.

여기서 사용된 "실시가능하게 결합된"이라는 용어는 원하는 서열이 그의 발현(작동)이 전사 및 번역 조절 서열(즉, 프로모터, 인핸서 등) 또는 번역 조절 서열의 제어 하에 있도록 위치함을 나타낸다. 프로모터가 유전자에 실시가능하게 결합되기 위해 일반적으로 프로모터가 유전자의 바로 업스트림에 위치한다. 프로모터는 구조 유전자에 항상 인접할 필요는 없다.

여기서 형질전환, 형질도입, 트랜스펙션 등을 포함하여 어떠한 기술도 세포 내로 변형된 프루프리딩 기능을 지닌 DNA 중합효소를 인코드하는 핵산 분자를 도입시키기 위해 이용된다. 이러한 핵산 분자 도입 기술은 당분야에 잘 알려져 있고 일반적으로 사용되며 예를 들어 Ausubel F.A. et al., editors, (1988), Current Protocols in Molecular Biology, Wiley, New York, NY; Sambrook J. et al. (1987) Molecular Cloning: A Laboratory Manual, 2nd Ed. and its 3rd Ed. (2001), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; Special issue, Jikken Igaku [Experimental Medicine] "Experimental Method for Gene Introduction & Expression Analysis", Yodo-sha, 1997 등에 기술되어 있다. 유전자 도입은 노던 블럿팅 분석 및 웨스턴 블럿팅 분석 또는 잘 알려진 다른 일반적 기술과 같은 여기에 기술된 방법에 의해 확인될 수 있다.

트랜스펙션, 형질도입, 형질전환 등을 포함하여 DNA를 세포 내로 도입시키는 상기-기술된 어떠한 방법도 벡터 도입 방법으로 이용될 수 있다(즉, 인산칼슘 방법, 리포솜 방법, DAEA 덱스트란 방법, 일렉트로포레이션법, 입자 총(유전자 총) 방법 등).

여기서 사용된 "형질전환체"라는 용어는 형질전환에 의해 생성된, 세포와 같은 생물체 전체 또는 부분을 나타낸다. 형질전환체의 예는 원핵세포, 효모, 동물세포, 식물세포, 곤충세포 등을 포함한다. 형질전환체는 피험체에 따라 다르게 형질전환된 세포, 형질전환된 조직, 형질전환된 숙주 등으로 표기된다. 여기서 이용된 세포는 형질전환이다.

여기서 원핵세포가 유전적 작용에 이용되는 경우 원핵세포는 예를 들어 대장균속, 세라티아(Serratia)속, 바실러스(Bacillus)속, 브레비박테리움(Brevibacterium)속, 코리네박테리움(Corynebacterium)속, 마이크로박테리움(Microbacterium)속, 슈도모나스(Pseudomoonas)속 등이다. 특히 원핵세포는 예를 들어 Escherichia coli XL1-Blue, Escherichia coli XL2-Blue, Escherichia coli DH1 등이다.

여기서 이용되는 동물세포의 예는 마우스 골수종 세포, 래트 골수종 세포, 마우스 하이브리도마 세포, 중국 햄스터 난소(CHO) 세포, 어린 햄스터 신장(BHK) 세포, 아프리카 녹색 원숭이 신장 세포, 인간 백혈병 세포, HBT5637(일본공개공보 제63-299호), 인간 결장암 세포주 등을 포함한다. 마우스 골수종 세포는 ps20, NSO 등을 포함한다. 래트 골수종 세포는 YB2/0 등을 포함한다. 인간 배아 신장 세포는 HEK293(ATCC:CRL-1573) 등을 포함한다. 인간 백혈병 세포는 BALL-1 등을 포함한다. 아프리카 녹색 원숭이 신장 세포는 COS-1, COS-7 등을 포함한다. 인간 결장암 세포주는 HCT-15 등을 포함한다. 인간 신경모세포종은 SK-N-SH, SK-N-SH-5Y 등을 포함한다. 마우스 신경모세포종은 Neuro2A 등을 포함한다.

여기서 염화칼슘법, 일렉트로포레이션법(Methods. Enzymol., 194, 182(1990)), 리포렉션법, 스페로플라스트법(Proc. Natl. Acad. Sci. USA, 84, 1929 (1978)), 아세트산리튬법(J. Bacteriol., 153, 163 (1983)), Pcor. Natl. Acad. Sci. USA, 75, 1929 (1978)에 기술된 방법을 포함하여 어떠한 DNA 도입 방법도 재조합 벡터의 도입 방법으로 이용될 수 있다.

Current Protocols in Molecular Biology(상동)(특히, Units 9.9-9.14)에 기술된 여기서 이용된 레트로바이러스 감염 방법은 당분야에 잘 알려져 있다. 특히 예를 들어 배아 줄기세포가 단일-세포 현탁액 내로 트립신처리된 후 1∼2시간 동안 바이러스-생성 세포(팩키징 세포주)의 배양 상청액과 동시-배양되어 충분한 양의 감염된 세포를 수득하였다.

본 발명이 식물에 적용되는 경우 식물 발현 벡터는 아그로박테리움을 이용한 방법 및 직접 감염법과 같은 당분야에 잘 알려진 방법을 이용하여 식물세포 내로 도입된다. 아그로박테리움을 이용한 방법의 예는 예를 들어 Nagel et al.(1990), Microbiol. Lett., 67, 325에 기술된 방법을 포함한다. 본 방법에서 예를 들어 식물에 적당한 발현 벡터가 일렉트로포레이션에 의해 아그로박테리움 내로 삽입되고 형질전환된 아그로박테리움은 예를 들어 Gelvin et al., eds, (1994), Plant Molecular Biology Manual (Kluwer Academic Press Publishers)에 기술된 방법에 의해 식물세포 내로 도입된다. 식물 발현 벡터를 세포 내로 직접 도입시키는 방법의 예는 일렉트로포레이션(Shimamoto et al. (1989), Nature, 338:274-276; 및 Rhodes et al. (1989), Science, 240:204-207), 입자총법(Christou et al. (1991), Bio/Technology 9:957-962) 및 폴리에틸렌글리콜(PEG) 방법을 포함한다. 이들 방법은 당분야에 잘 알려져 있고, 이들 중 형질전환되는 식물에 적당한 방법이 적당하게 선택된다.

본 발명에서 목적 핵산 분자(도입된 유전자)는 형질전환체의 염색체 내로 도입되거나 도입되지 않는다. 바람직하게는 목적 핵산 분자(도입된 유전자)는 형질전환체의 염색체 내로, 더욱 바람직하게는 염색체 쌍 내로 도입된다.

형질전환된 세포는 당분야에 잘 알려진 방법에 의해 식물조직, 식물기관 및/또는 식물체로 분화된다.

식물세포, 식물조직 및 식물체는 당분야에 잘 알려진 방법에 의해 배양되고 분화되고 재생산된다. 배지의 예는 Murashige-Skoog(MS) 배지, Gamborg B5(B) 배지, White 배자, Nitsch & Nitsch 배지 등을 포함하나 이에 한정적인 것은 아니다. 이들 배지는 일반적으로 적당한 양의 식물 생장 조절 물질(식물 호르몬) 등이 보충된다.

여기서 사용된 식물과 관련된 "재분화" 또는 "재분화시키다"라는 용어는 전체 식물이 개체 식물의 일부로부터 복원되는 현상을 나타낸다. 예를 들어 세포, 잎, 뿌리 등과 같은 조직 세그먼트가 기관 또는 식물체로 재분화될 수 있다.

형질전환체를 식물체로 재분화시키는 방법은 당분야에 잘 알려져 있다. 이들 방법은 예를 들어 Rogers et al., Methods in Enzymology 118:627-640(1986); Tabata et al., Plant Cell Physiol., 28:73-82(1987); Shaw, Plant Molecular Biology: A practicial approach, IRL press(1988); Shimamoto et al., Nature 338:274(1989); Maliga et al., Methods in Plant Molecular Biology: A Laboratory course, Cold Spring Harbor Laboratory Press(1995) 등에 기술되어 있다. 따라서 상기-기술된 잘 알려진 방법은 식물을 재분화시키기 위해 당업자에 의해 목적 형질전환 식물에 따라 다르게 적당히 선택되고 이용될 수 있다. 형질전환된 식물은 도입된 목적 유전자를 지닌다. 도입된 유전자는 노던 블럿팅, 웨스턴 블럿팅 분석 등과 같은 여기에 기술된 방법 및 다른 잘 알려진 기술에 의해 확인될 수 있다.

종자는 형질전환된 식물로부터 수득된다. 도입된 유전자의 발현은 노던 블럿팅 또는 PCR에 의해 검출될 수 있다. 유전자 생성물 단백질의 발현은 필요한 경우 예를 들어 웨스턴 블럿팅에 의해 확인된다.

본 발명이 어떠한 생물체에도 적영될 수 있고 특히 식물에 유용함이 증명된다. 또한 본 발명은 다른 생물체에도 적용될 수 있다. 본 발명에서 이용되는 분자생물학 기술은 당분야에 잘 알려져 있고 일반적으로 이용되며, 예를 들어 Ausubel F.A. et al., editors, (1988), Current Protocols in Molecular Biology, Wiley, New York, NY; Sambrook J. et al. (1987) Molecular Cloning: A Laboratory Manual, Ver. 2 and Ver. 3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; Special issue, Jikken Igaku [Experimental Medicine] "Experimental Method for Gene Introduction & Expression Analysis", Yodo-sha, 1997 등에 기술되어 있다.

유전자 발현(즉, mRNA 발현, 폴리펩타이드 발현)은 mRNA 측정 및 면역 측정 방법을 포함한 적당한 방법에 의해 "검출"되거나 "정량화"된다. 분자생물학 측정 방법의 예는 노던 블럿팅 방법, 닷(dot) 블럿팅 방법, PCR법 등을 포함한다. 면역 측정 방법의 예는 ELISA법, RIA법, 형광항체법, 웨스턴 블럿팅 방법, 마이크로타이터 플레이트가 사용되는 면역조직화학염색법 등을 포함한다. 정량화 방법의 예는 ELISA법, RIA법 등을 포함한다. 어레이(즉, DNA 어레이, 단백질 어레이 등)를 이용한 유전자 분석법이 이용된다. DNA 어레이는 Saibo-Kogaku [Cell Engineering], special issue, "DNA Microarray and Up-to-date PCR Method", edited by Shujun-sha에서 광범위하게 조사되었다. 단백질 어레이는 Nat Genet. 2002 Dec; 32 Suppl:526-32에 상세히 기술되어 있다. 유전자 발현을 분석하는 방법의 예는 상기-기술된 방법 이외에 RT-PCR법, RACE법, SSCP법, 면역침전법, 투-하이브리드 시스템, 시험관 내 번역법 등 포함하나 이에 한정적인 것은 아니다. 다른 분석법은 예를 들어 "Genome Analysis Experimental Method, Yusuke Nakamura's Labo-Manual, edited by Yusuke Nakamura, Yodo-sha(2002) 등에 기술되어 있다. 상기-기술된 모든 간행물은 여기에 참고문헌에 포함된다.

여기서 사용된 "발현량"이라는 용어는 피험 세포 내에서 발현된 폴리펩타이드 또는 mRNA의 양을 나타낸다. 발현량은 면역 측정법(즉, ELISA법, RIA법, 형광항체법, 웨스턴 블럿팅 방법, 면역조직화학염색법 등)을 포함한 본 발명의 항체를 이용한 어떠한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 단백질 수준에서의 발현량 또는 분자생물학 측정법(즉, 노던 블럿팅 방법, 닷 블럿팅 방법, PCR법 등)을 포함한 어떠한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 mRNA 수준에서의 발현량을 포함한다. "발현량의 변화"라는 용어는 상기-기술된 면역 측정법 또는 분자생물학 측정법을 포함한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 단백질 또는 mRNA 수준에서의 발현량의 증가 또는 감소를 나타낸다. 따라서 본 발명에 따라 오류-빈발 빈도는 특정한 작용제(즉, DNA 중합효소 등)의 발현량을 변화시킴으로서 조절될 수 있다.

여기서 사용된 폴리뉴클레오타이드와 관련한 "업스트림"이라는 용어는 특정한 참조 포인트보다 5' 말단에 더 가까운 위치를 의미한다.

여기서 사용된 폴리뉴클레오타이드와 관련한 "다운스트림"이라는 용어는 특정 참조 포인트보다 3'말단에 더 가까운 위치를 의미한다.

여기서 사용된 "염기쌍" 및 "Watson & Crick 염기쌍"이라는 용어는 동일한 의미를 지니고, 이중-스트랜드 DNA에서 나타난 바와 같이 아데닌 잔기(A)는 2개 수소결합을 통해 티민 잔기(T) 또는 우라실 잔기(U)에 결합되고 시토신 잔기(C)는 3개 수소결합을 통해 구아닌 잔기(G)에 결합되는 서열 동일성에 기반하여 결합된 수소결합에 의해 함께 결합될 수 있음을 나타낸다(Stryer L., Biochemistry, 4th edition, 1995 참조).

여기서 사용된 폴리뉴클레오타이드와 관련한 "상보성" 또는 "상보적"이라는 용어는 그의 전체 상보성 구역이 상응하는 상보성 염기와 Watson-Crick 염기쌍을 형성할 수 있고 첫 번째 폴리뉴클레오타이드가 두 번째 폴리뉴클레오타이드에 대해 상보성인 것으로 간주되는 폴리뉴클레오타이드 서열을 나타낸다. 상보성 염기는 일반적으로 A와 T(또는 A와 U) 또는 C와 G이다. 여기서 사용된 "상보적"이라는 용어는 "상보성 폴리뉴클레오타이드", "상보성 핵산" 및 "상보성 뉴클레오타이드 서열"이라는 용어에 대한 동의어로 이용된다. 이들 용어는 실질적으로 함께 결합되는 2개의 폴리뉴클레오타이드의 특이적 세트가 아니라 서열에 기반한 폴리뉴클레오타이드 쌍에 적용된다.

배아 줄기(ES) 세포의 상동적 재조합을 통한 형질전환 동물 및 넉아웃 동물의 생성 및 분석은 중요한 의미를 제공한다. 형질전환 동물 또는 넉아웃 포유류는 예를 들어 상동적 재조합을 이용한 양성-음성 선택법에 의해 생성될 수 있다(미국특허 제5,464,764호; 미국특허 제5,487,992, 미국특허 제5,627,059; Proc. Natl. Acad. Sci. USA, Vol. 86, 8932-8935, 1989; Nature, Vol. 342, 435-438, 1989 등참조). 넉아웃 동물(또한 유전자 타겟팅이라고도 불림)의 생성은 예를 들어 Masami Murayama, masashi Yamamoto, eds. Jikken Igaku Bessatsu [Special Issue of Experimental Medicine], "Shintei Idenshi Kogaku Handobukku [Newly Revised Genetic Engineering Handbook]" Ver. 3, 1999, Yodo-sha, 특히 pp. 239-256; Shinichi Aizawa, (1995), Jikken Igaku Bessatsu [Special Issue of Experimental Medicine], "Jintagettingu - ES Saibo Wo Mottita Heni Mausu No Sakusei [Gene Targeting - Production of Mutant Mouse Using ES Cell] 등에서 조사되었다. 형질전환 동물 또는 넉아웃 포유류는 널리 이용되어 왔다. 본 발명에서 상기-기술된 방법은 필요에 따라 이용된다.

예를 들어 고등생물의 경우 재조합은 네오마이신 저항성 유전자를 이용한 양성 선택 또는 HSV의 티미딘 키나제 유전자 또는 디프테리아 독소 유전자를 이용한 음성 선택에 의해 효과적으로 선별된다. 넉아웃 PCR 또는 서던 블럿팅은 상동성 재조합체를 선별하는데 이용된다. 특히 타겟 유전자 일부가 양성 선택을 위해 네오마이신 저항성 유전자 등으로 치환되고, 음성 선택을 위한 HSVTK 유전자 등은 그의 말단에 결합되어 타겟팅 벡터를 유발한다. 타겟팅 벡터는 일렉트로포레이션에 의해 ES 세포 내로 도입된다. ES 세포는 G418 및 간시클로버(ganciclovir)의 존재시 선별된다. 생존한 콜로니가 분리되고 PCR 또는 서던 블럿팅되어 상동성 재조합을 선별한다.

상기-기술된 방법에서 타겟된 내생적 유전자는 분열되어 상응하는 기능이 부재하거나 감소된 수준의 기능을 지닌 형질전환 또는 넉아웃(타겟 유전자 재조합체, 유전자 분열된) 마우스를 수득하게 된다. 돌연변이가 타겟된 유전자에만 도입되기 때문에 본 방법은 유전자 기능의 분석에 유용하다.

원하는 상동성 재조합체가 선택된 후 수득된 재조합 ES 세포는 배반포 주입법 또는 집합 키메라법에 의해 정상 배아와 혼합되어 ES 세포와 숙주 배아의 키메라 마우스를 생성하게 된다. 배반포 주입법에서 ES 세포는 유리 피펫을 이용하여 배반포 내로 주입된다. 집합 키메라법에서 ES 세포 집단이 투명대가 없는 8-세포 단계 배아에 부착된다. 도입된 ES 세포를 지닌 배반포는 가임신된 양모의 자궁 내로 이식되어 키메라 마우스를 수득하게 된다. ES 세포는 전능성을 지니고 생체 내에서 생식세포를 포함한 어떠한 세포로도 분화될 수 있다. ES 세포로부터 유래된 생식세포를 지닌 키메라 마우스가 정상 마우스와 이종교배시 이형접합적으로 ES 세포의 염색체를 지닌 마우스가 수득된다. 수득된 마우스는 서로 이종교배되고, ES 세포의 동형접합성 변형된 염색체를 지닌 넉아웃 마우스가 수득된다. 키메라 마우스로부터 동형접합적으로 변형된 염색체를 지닌 넉아웃 마우스를 수득하기 위해 수컷 키메라 마우스가 암컷 야생형 마우스와 이종교배되어 F1 이형접합성 마우스를 생성한다. 수득된 수컷 및 암컷 이형접합성 마우스는 이종교배되고 F2 동형접합성 마우스가 선택된다. 원하는 유전자 돌연변이가 F1 및 F2 내로 도입되는지 여부는 재조합 ES 세포에 대한 에세이와 같이 서던 블럿팅, PCR, 염기 시퀀싱 등과 같은 일반적으로 이용되는 방법을 이용하여 측정된다.

다양한 유전자 기능이 선택적으로 분석될 수 없다는 문제점을 극복하는 또다른 기술로서 Cre 재조합효소의 세포 형태-특이적 발현이 Cre-loxP의 자리-특이적 재조합과 결합된 조건적 넉아웃 기술에 주목하고 있다. Cre-loxP를 이용하여 조건적 넉아웃 마우스를 수득하기 위해 네오마이신 저항성 유전자가 타겟 유전자의 발현을 저해하지 않는 사이트에 도입되고; loxP 서열이 엑손에 통합되는 방식으로 타겟팅 벡터가 ES 세포 내로 도입되고, 이는 나중에 제거되고, loxP 서열 내에서 파괴될 것이고; 이후 상동성 재조합체가 분리된다. 키메라 마우스는 분리된 콜로니로부터 수득된다. 따라서 유전적으로 변형된 마우스가 생성된다. 다음으로 E. colli의 P1 파지-유래된 자리-특이적 재조합 효소 Cre가 조직-특이적 방식으로 발현되는 형질전환 마우스가 마우스와 이종교배된다. 이러한 경우 유전자는 Cre를 발현하는 조직 내에서만 분열된다(Cre는 특히 loxP 서열(34 bp)를 인식하고, 2개의 loxP 서열 사이의 서열은 재조합되고 분열됨). Cre는 기관-특이적 프로모터에 결합된 Cre 유전자를 지닌 형질전환 마우스와 이종교배하거나 Cre 유전자를 지닌 바이러스 벡터를 이용함으로서(Stanford W. L., et al., Nature Genetics 2:756-768(2001) 성체 내에서 발현될 수 있다.

따라서 본 발명의 생물체가 생성될 수 있다.

(폴리펩타이드 생성 방법)

본 발명의 방법에 의해 생성된 미생물, 동물세포 등으로부터 유래된 형질전환체는 일반 배양법에 따라 배양된다. 본 발명의 폴리펩타이드가 생성되고 수득된다. 본 발명의 폴리펩타이드는 배양액으로부터 수집되어 본 발명의 폴리펩타이드를 생성할 수 있게 한다.

본 발명의 형질전환체는 숙주 세포에 이용되는 일반 방법에 따라 배양 배지 상에서 배양될 수 있다. 숙주로서 원핵생물(즉, E. coli) 또는 진핵생물(즉, 효모)로부터 수득된 형질전환체에 대한 배양 배지는 배지가 본 발명의 생물체가 동화할 수 있는 탄소원, 질소원, 무기염 등을 포함하고, 배지가 형질전환체의 효과적 배양을 가능하게 하는 한 자연-발생적 배양 배지 또는 합성적 배양 배지도 된다.

탄소원은 탄수화물(즉, 포도당, 과당, 자당, 이들을 함유한 당밀, 전분, 전분 가수분해물 등), 유기산(즉, 아세트산, 프로피온산 등), 알코올(즉, 에탄올, 프로판올 등)과 같은 생물체에 의해 동화될 수 있는 어떠한 탄소원도 포함한다.

질소원은 무기산 또는 유기산의 암모늄염(즉, 암모니아, 염화암모늄, 황산암모늄, 아세트산암모늄, 인산암모늄 등) 및 다른 질소-함유 물질(즉, 펩톤, 고기추출물, 효모추출물, 콘 스팁 리커(corn steep liquor), 카세인 가수분해물, 대두 케이크 및 대두 케이크 가수분해물, 다양한 발효 박테리아 및 그의 소화 생성물) 등을 포함한다.

인산칼륨(I), 인산칼륨(II), 인산마그네슘, 염화나트륨, 황산철(I), 황산마그네슘, 황산구리, 탄산칼슘 등과 같은 무기산의 염이 이용될 수 있다. 배양은 진탕 배양을 위한 호기성 조건, 깊은 폭기 교반 배양 하에서 수행된다.

배양 온도는 바람직하게는 15∼40℃이고, 다른 온도도 이용될 수 있다. 특히 본 발명에 따라 온도 저항성 생물체 또는 세포가 생성되는 경우 다른 온도가 가장 적당하다. 배양 시간은 일반적으로 5시간 내지 7일이다. 배양 배지의 pH는 3.0∼9.0에서 유지된다. 특히 본 발명에 따라 산 또는 알칼리 저항성 생물체 또는 세포가 생성되는 경우 다른 pH가 가장 적당하다. pH의 적정은 무기산 또는 유기산, 알칼리용액, 요소, 탄산칼슘, 암모니아 등을 이용하여 수행된다. 암피실린, 테트라사이클린 등과 같은 항생제는 배양 동안 배양 배지에 선택적으로 첨가된다.

유도성 프로머터를 포함한 발현 벡터를 이용하여 형질전환된 미생물을 배양할 때 배양 배지는 선택적으로 유도인자가 보충된다. 예를 들어 lac 프로모터를 포함한 발현 벡터를 이용하여 형질전환된 미생물이 배양될 때 이소프로필-β-D-티오갈락토피라노시드 등이 배양 배지에 첨가된다. 예를 들어 trp 프로모터를 포함한 발현 벡터를 이용하여 형질전환된 미생물이 배양될 때 인돌 아크릴산 등이 배양 배지에 첨가된다. 유전자가 도입된 세포 또는 기관은 발효조를 이용하여 대용량으로 배양될 수 있다. 배양 배지의 예는 일반적으로 이용되는 Murashige-Skoog(MS) 배지, White 배지 또는 옥신, 사이토카인과 같은 식물 호르몬이 보충된 이들 배지를 포함하나 이에 한정적인 것은 아니다.

예를 들어 동물세포가 이용될 때 세포를 배양하는 본 발명의 배양 배지는 일반적으로 이용되는 RPMI1640 배양 배지(The Journal of the American Medical Association, 199, 519 (1967)), Eagle's MEM 배양 배지(Science, 122, 501 (1952)), DMEME 배양 배지(Virology, 8, 396 (1959)), 199 배양 배지(Proceedings of the Society for the Biological Medicine, 73, 1(1950) 또는 소태아혈청이 보충된 이들 배양 배지를 포함한다.

배양은 일반적으로 예를 들어 5% CO₂ 대기 내에서 25∼40℃에서 pH 6∼8의 배지 내에서 1∼7일간 수행된다. 카나마이신, 페니실린, 스트렙토마이신과 같은 항생체는 배양동안 배양 배지에 선택적으로 첨가된다.

또한 본 발명의 폴리펩타이드는 당분야에 잘 알려지고 일반적으로 사용되는 효소를 분리하거나 정제하는 일반 방법을 이용하여 폴리펩타이드를 인코드하는 핵산 서열로 형질전환된 형질전환체 배양액으로부터 분리되거나 정제될 수 있다. 예를 들어 본 발명의 폴리펩타이드가 폴리펩타이드를 생성하기 위해 형질전환체 외부로 분비되면 배양액은 원심분리되어 용해성 프랙션을 수득한다. 정제된 표본은 용매 추출, 황산암모늄으로의 염석/탈염, 유기용매로의 침전, 수지로의 음이온교환크로마토그래피(즉, 디에틸아미노에틸(DEAE)-Sepharose, DIAION HPA-75(Mitsubishi Chemical Corporation)), 수지로의 양이온교환크로마토그래피(즉, S-Sepharose FF(Pharmacia)), 수지로의 소수성 크로마토그래피(즉, 부틸세파로스, 페닐세파로스), 분자체로의 겔 여과, 친화성 크로마토그래피, 크로마토포커싱, 전기영동(즉, 등전초점전기영동) 등과 같은 기술에 의해 용해성 프랙션으로부터 수득될 수 있다.

본 발명의 폴리펩타이드가 폴리펩타이드를 생성하기 위해 본 발명의 형질전환체 세포 내에서 용해된 형태로 축적되는 경우 배양액은 원심분리되어 배양액 내의 세포를 수집한다. 세포는 세척된 후 초음파 분쇄기, 프렌치 프레스, MANTON GAULIN 균질화기, Dinomil을 이용하여 분쇄되어 무-세포 추출 용액이 수득된다. 정제된 표본은 무-세포 추출 용액을 원심분리하거나 용매 추출, 황산암모늄으로의 염석/탈염, 유기용매로의 침전, 수지로의 음이온교환크로마토그래피(즉, 디에틸아미노에틸(DEAE)-Sepharose, DIAION HPA-75(Mitsubishi Chemical Corporation)), 수지로의 양이온교환크로마토그래피(즉, S-Sepharose FF(Pharmacia)), 수지로의 소수성 크로마토그래피(즉, 부틸세파로스, 페닐세파로스), 분자체로의 겔 여과, 친화성 크로마토그래피, 크로마토포커싱, 전기영동(즉, 등전초점전기영동) 등과 같은 기술에 의해 수득된 상청액으로부터 수득될 수 있다.

본 발명의 폴리펩타이드가 발현되어 세포 내에 불용성체로 형성되는 경우 세포는 채취되고 분쇄되고 원심분리된다. 수득된 침전 프랙션으로부터 본 발명의 폴리펩타이드가 일반적으로 이용되는 방법을 이용하여 수집된다. 불용성 폴리펩타이드는 폴리펩타이드 변성제를 이용하여 용해된다. 수득된 용해된 용액은 무-변성제 용액 또는 희석 용액 내로 희석되거나 폴리펩타이드 변성제의 농도가 나머 낮아서 폴리펩타이드를 변성시키지 못하는 경우 투석된다. 본 발명의 폴리펩타이드는 정상 3-차원 구조를 형성하게 되고, 정제된 표본은 상기 기술된 분리 및 정제에 의해 수득된다.

정제는 일반적으로 이용되는 단백질 정제법에 따라 수행될 수 있다(J. Evan. Sadler et al.: Methods in Enzymology, 83, 458). 대안으로, 본 발명의 폴리펩타이드는 다른 단백질과 융합되어 융합 단백질을 생성하고, 융합 단백질은 융합 단백질에 친화력을 지닌 물질을 이용한 친화성 크로마토그래피를 이용하여 정제될 수 있다(Akio Yamakawa, Experimental Medicine, 13, 469-474(1995)). 예를 들어 Lowe et al., Proc. Natl. Acad. Sci. USA, 86, 8227-8231(1995), Genes Develop., 4, 1288(1990)에 기술된 방법에 따라 단백질 A를 지닌 본 발명의 폴리펩타이드의 융합 단백질이 생성된 후 면역글로불린 G를 이용한 친화성 크로마토그래피로 정제된다.

FLAG 펩타이드를 지닌 본 발명의 폴리펩타이드의 융합 단백질이 생성된 후 항-FLAG 항체를 이용한 친화성 크로마토그래피로 정제된다(Proc. Natl. Acad. Sci. USA, 86, 8227(1989), Genes Develop., 4, 1288(1990)).

본 발명의 폴리펩타이드는 폴리펩타이드에 결합하는 항체를 이용한 친화성 크로마토그래피로 정제될 수 있다. 본 발명의 폴리펩타이드는 알려진 방법에 따라 시험관 내 전사/번역 시스템을 이용하여 생성될 수 있다(J. Biomolecular NMR, 6, 129-134; Science, 242, 1162-1164; J. Biochem., 110, 166-168(1991)).

또한 본 발명의 폴리펩타이드는 그의 아미노산 정보에 기반하여 Fmoc 방법(플루오르에닐메틸옥시카르보닐 방법), tBoc 방법(t-부틸옥시카르보닐 방법)과 같은 화학 합성법에 의해 생성될 수 있다. 펩타이드는 펩타이드 합성기(Advanced ChemTech, Applied Biosystems, Pharmacia Biotech, Protein Technology Instrument, Synthecell-Vega, PerSeptive, Shimazu 등에서 제조)를 이용하여 화학적으로 합성될 수 있다.

본 발명의 정제된 폴리펩타이드의 구조는 단백질화학에서 일반적으로 이용되는 방법에 의해 수행될 수 있다(예를 들어 Hisashi Hiroano. "Protein Structure Analysis for Gene Cloning", published by Tokyo Kagaku Dojin, 1993 참조). 본 발명의 신규한 ps20-유사 펩타이드의 생리적 활성이 알려진 측정 기술에 의해 측정될 수 있다(Cell, 75, 1389(1993); J. Cell Bio., 1146, 233(1999); Cancer Res. 58, 1238(1998); Neuron 17, 1157(1996); Science 289, 1197(2000) 등).

(선별)

여기서 사용된 "선별"이라는 용어는 특정한 작용/평가 방법을 이용하여 다수의 요소를 포함한 집단으로부터 목적의 제공된 특정 성질을 지닌 생물체, 물질과 같은 타겟의 선택을 나타낸다. 선별을 위해 작용제(즉, 항체), 본 발명의 폴리펩타이드 또는 핵산 분자가 이용될 수 있다. 선별은 시험관 내, 생체 내 또는 대안으로 인 실리코(in silico)(컴퓨터를 이용한 시스템에서)로 수득된 라이브러리를 이용하여 수행된다. 본 발명이 선별에 의해 수득된 원하는 활성을 지닌 화합물을 포함함이 이해될 것이다. 또한 본 발명은 본 발명의 개시에 기반한 컴퓨터 모델링에 의해 생성된 약물을 제공하고자 한다.

선별 또는 확인 방법은 당분야에 잘 알려져 있고 예를 들어 마이크로타이터 플레이트; DNA, 단백질과 같은 분자의 어레이 또는 칩으로 수행될 수 있다. 표본을 포함한 피험체의 예는 유전자 라이브러리, 조합 라이브러리를 이용하여 합성된 화합물 라이브러리를 포함하나 이에 한정적인 것은 아니다.

따라서 본 발명의 바람직한 실시태양에서 장애 또는 질병을 조절할 수 있는 작용제를 확인하는 방법이 제공된다. 이러한 조절 작용제는 질병에 대한 약제 또는 그의 전구체로 이용될 수 있다. 이러한 조절 작용제, 조절 작용제를 포함한 약제 및 이를 이용한 치료는 본 발명에 의해 포함된다.

따라서 본 발명이 본 발명의 개시의 관점에서 컴퓨터 모델리에 의해 수득된 약물을 제공함이 고려된다.

본 발명의 또다른 실시태양에서 본 발명은 효과적인 조절 활성을 지닌 본 발명의 화합물에 대한 선별 기구로서 이용되는 컴퓨터-원조 양적 구조 활성 관계(QSAR) 모델링 기술에 의해 수득된 화합물을 포함한다. 여기서 컴퓨터 기술은 컴퓨터에 의해 제조된 여러 기질 주형, 약물작용발생단, 본 발명의 활성 부분의 상동성 모델을 포함한다. 일반적으로 시험관 내에서 수득된 데이터를 기반으로 또다른 물질과 상호작용하는 물질의 일반적 특성 그룹을 모델링하는 방법은 최근 CATALYST^TM 약물작용발생단 방법(Ekins et al., Pharmacogenetics, 9:477-489, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 288:21-29, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 290:429-438, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 291:424-433, 1999), 비교 분자 분야 분석(comparative molecular filed analysis, CoMFA)(Jones et al., Drug Metabolism & Disposition, 24:1-6, 1996)을 포함한다. 본 발명에서 컴퓨터 모델링은 분자 모델링 소프트웨어를 이용하여 수행된다(즉, CATALYST^TMVersion 4 (Molecular Simulation, Inc., San Diego, CA).

활성 사이트에 대해 화합물을 맞추는 것은 당분야에 알려진 다양한 컴퓨터 모델링 기술을 이용하여 수행될 수 있다. 활성 사이트에 대한 화합물의 시각적 검사 및 수동 작동은 QUANTA(Molecular Simulations, Burlington, MA, 1992), SYBYL(Molecular Modeling Software, Tripos Associates, Inc., St. Louis, MO, 1992), AMBER(Weiner et al., J. Am. Chem. Soc., 106:765-784, 1984), CHARMM(Brooks et al., J. Comp. Chem., 4:187-217, 1983)과 같은 프로그램을 이용하여 수행될 수 있다. 더욱이 에너지 최소화는 CHARMM, AMBER와 같은 표준 힘의 장를 이용하여 수행될 수 있다. 다른 상세화된 컴퓨터 모델링 방법의 예는 GRID(Goodford et al., J. Med. Chem., 28:849-857, 1985), MCSS(Miranker and Karplus, Function and Genetics, 11:29-34, 1991), AUTODOCK(Goodsell and Olsen, Proteins: Structure, Function and Genetics, 8:195-202, 1990), DOCK(Kuntz et al., J. Mol. Biol., 161:269-288, 1982) 등을 포함한다. 더욱이 구조 화합물은 LUDI(Bohm, J. Comp. Aid. Molec. Design, 6:61-78, 1992), LEGEND(Nishibata and Itai, Tetrahedron, 47:8985, 1991), LeapFrog(Tripos Associates, St. Louis, MO)와 같은 컴퓨터 프로그램으로 빈 활성 사이트, 알려진 작은 분자 화합물의 활성 사이트를 이용하여 새롭게 구축될 수 있다. 상기-기술된 모델링 방법은 당분야에서 일반적으로 이용된다. 본 발명에 의해 포함된 화합물은 본 발명의 개시에 기반하여 당어자에 의해 적당히 고안될 수 있다.

(질병)

본 발명은 목적 생물체가 겪고 있는 질병 및 장애를 목표로한다(즉, 모델 동물의 생성 등).

하나의 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 순환계(혈액 세포 등)에 관한 것이다. 질병 또는 장애의 예는 빈혈(즉, 무형성 빈혈(특히 중증 무형성 빈혈), 신장 빈혈, 암성 빈혈, 속발성 빈혈, 불응성 빈혈), 암 또는 종양(즉, 백혈병); 화학치료 후 조혈부전, 혈소판감소증, 급성 림프구성 백혈병(특히 1차 완화(고-위험 그룹), 2차 완화 및 그후), 만성 골수성 백혈병(특히 1차 완화(고-위험 그룹), 2차 완화 및 그후), 다발성 골수종(특히 발병 후 초기)을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에서 목표된 질병 및 장애는 신경계에 관한 것이다. 이러한 질병 또는 장애의 예는 치매, 뇌중풍 및 그의 후유증, 뇌종양, 척추손상 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 면역체계에 관한 것이다. 이러한 질병 또는 장애의 예는 T-세포 결핍 증후군, 백혈병 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 운동 기관 및 골격계에 관한 것이다. 이러한 질병 또는 장애의 예는 골절, 골다공증, 관절 탈구, 부분탈구, 염좌, 인대 손상, 골관절염, 골육종, Ewing 육종, 골형성부전증, 골연골이형성증 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 피부계통에 관한 것이다. 이러한 질병 또는 장애의 예는 무모증, 흑색종, 피부 악성 림프종, 혈관육종, 조직구증, 수포증, 농포증, 피부염, 습진 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 내분비계에 관한 것이다. 이러한 질병 또는 장애의 예는 시상하부/뇌하수체 질환, 갑상선 질환, 부수갑상선(부갑상선) 질환, 부신피질/골수 질환, 당대사 이상, 지질대사 이상, 단백질대사 이상, 핵산대사 이상, 대사의 선천성 이상(페닐케톤뇨증, 갈락토스혈증, 호모시스틴뇨증, 단풍시럽뇨병), 알부민결핍혈증, 아스코르브산 합성능 결핍, 고빌리루빈혈증, 칼리크레인 결핍, 비만 세포 결핍, 요붕증, 바소프레신 분비 이상, 왜소증, 울만 질환(산 리파제 결핍), 점액다당류증 Ⅵ 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 호흡기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 폐질환(즉, 폐렴, 폐암), 기관지 질환 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 소화기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 식도질환(즉, 식도암), 위장/십이지장 질환(즉, 위암, 십이지장암), 소장질환/대장질환(즉, 결장 용종, 결장암, 직장암), 담관 질환, 간질환(즉, 간경화, 간염(A, B, C, D, E), 전격간염, 만성간염, 초기 간암, 알코올성 간질환, 약물 유도 간질환), 췌장질환(급성 췌장염, 만성 췌장염, 췌장암, 낭성 췌장질환), 복막/배벽/횡격막 질환(헤르니아), 헤르쉬스프룽병 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 비뇨기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 신장질환(즉, 신장부전, 초기 사구체질환, 신혈관성질환, 세뇨관기능 이상, 간질성 신장질환, 전신병에 의한 신장장애, 신장암), 방광질환(즉, 방광염, 방광암) 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 생식기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 남성 생식기관 질환(즉 남성불임, 전립샘비대, 전립선암, 고환암), 여성 생식기관 질환(즉, 여성불임, 난소 기능 장애, 자궁탈출증, 자궁선근증, 자궁암, 자궁내막증, 난소암, 융모질환) 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 순환기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 심장마비, 협심증, 심근경색증, 부정맥, 판막염, 심근/심낭막 질환, 선천심장병(즉, 심방중격결손증, 동맥관개방증, 팔로사징증), 동맥질환(즉, 동맥경화증, 동맥류), 정맥질환(즉, 정맥류), 림프관질환(즉, 림프부종) 등을 포함하나 이에 한정적인 것은 아니다.

본 발명에 의해 목표된 질병 및 장애는 식물의 질병 및 장애에 관한 것이다. 식물의 질병 또는 장애의 예는 벼 도열병, 추운 날씨에 의한 장애 등을 포함하나 이에 한정적인 것은 아니다.

본 발명에 따라 수득된 생성물 물질이 약제로서 이용될 때 약제는 약제적으로 수용가능한 담체를 더욱 포함한다. 당분야에 알려진 어떠한 약제적으로 수용가능한 담체도 본 발명의 약제에 이용된다.

약제적으로 수용가능한 담체 또는 적당한 포뮬레이션 물질은 항산화제, 방부제, 착색제, 향미제, 희석제, 유화제, 현탁제, 용매, 중진제, 거대 작용제, 완충액, 전달 운반제 및/또는 약제적 보조제를 포함하나 이에 한정적인 것은 아니다. 대표적으로 본 발명의 약제는 아디포넥틴(adiponectin) 또는 그의 변이체 또는 단편 또는 적어도 하나 이상의 약제적으로 수용가능한 담체, 부형제 또는 희석제를 지닌 그의 변이체 또는 유도체의 형태로 투여된다. 예를 들어 적당한 운반제는 비경구적 전달을 위한 조성물에 일반적으로 사용되는 다른 물질로 보충될 수 있는 주사용액, 생리적 용액 또는 인공 뇌척수액이다.

여기서 사용되는 수용가능한 담체, 부형제 또는 안정화제는 바람직하게는 수용자에 비독성적이고 바람직하게는 사용되는 투여량 및 농도에서 불활성이고, 바람직하게는 인산, 구연산 또는 다른 유기산; 아스코르브산, α-토코페롤; 저분자량 폴리펩타이드; 단백질(즉, 혈청알부민, 젤라틴 또는 면역글로불린); 친수성 폴리머(즉, 폴리비닐피롤리돈); 아미노산(즉, 글리신, 글루타민, 아스파라긴, 아르기닌 또는 라이신); 단당류, 이당류 및 다른 탄수화물(포도당, 만노즈 또는 덱스트린); 킬레이트제(즉, EDTA), 당알코올(즉, 만니톨 또는 소르비톨); 염-형성 반대이온(즉, 나트륨); 및/또는 비이온성 계면활성제(즉, Tween, 플루로닉스(pluronics) 또는 폴리에틸렌글리콜(PEG))를 포함한다.

적당한 담체의 예는 중성 완충 식염수 또는 혈청알부민이 혼합된 식염수를 포함한다. 바람직하게는 생성물은 적당한 부형제(즉, 자당)를 이용한 동결건조체로 포뮬레이트된다. 다른 표준 담체, 희석제 및 부형제는 원하는 바대로 포함된다. 다른 예시적 조성물은 약 pH 7.0∼8.5의 Tris 완충액 또는 약 pH 4.0∼5.5의 아세트산 완충액을 포함하고, 이는 소르비톨 또는 그의 적당한 치환체를 더욱 포함한다.

이후 본 발명의 약제의 일반적으로 이용되는 제조 방법이 기술될 것이다. 동물 약물 조성물, 준-약물, 해양 약물 조성물, 식품 조성물, 화장품 조성물이 알려진 제조 방법을 이용하여 제조될 수 있다.

본 발명의 생성물 물질은 약제적으로 수용가능한 담체와 혼합될 수 있고 고형 포뮬레이션(즉, 정제, 캡슐, 과립, 추출, 분말, 좌약) 또는 액체 포뮬레이션(즉, 시럽, 주사액, 현탁액, 용액, 분무제)으로서 경구적으로 또는 비경구적으로 투여될 수 있다. 약제적으로 수용가능한 담체의 예는 고형 포뮬레이션 내에 부형제, 윤활제, 결합제, 붕괴제, 붕괴억제제, 흡수 프로모터, 흡착제, 습윤제, 용해제, 안정화제를; 액체 포뮬레이션 내에 용매, 용해제, 현탁제, 등장제, 완충액, 연화제를 포함한다. 방부제, 항산화제, 착색제, 감미료와 같은 포뮬레이션 첨가제가 선택적으로 사용될 수 있다. 본 발명의 조성물은 본 발명의 생성물 물질 이외의 물질과 혼합될 수 있다. 투여의 비경구 경로의 예는 정맥내 주사, 근육내 주사, 비강내, 직장내, 질내, 경피를 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 부형제의 예는 포도당, 유당, 자당, D-만니톨, 결정화된 셀룰로즈, 전분, 탄산칼슘, 가벼운 규산 무수물, 염화나트륨, 카올린, 요소 등을 포함한다.

고형 포뮬레이션 내의 윤활제의 예는 스테아르산마그네슘, 스테아르산칼슘, 붕산 분말, 콜로이드성 실리카, 활석, 폴리에틸렌글리콜 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 결합제의 예는 물, 에탄올, 프로판올, 사카로스, D-만닌톨, 결정화된 셀룰로즈, 덱스트란, 메틸셀룰로즈, 하이드록시프록시셀룰로즈, 하이드록시프록시메틸셀룰로즈, 카르복시메틸셀룰로즈, 전분용액, 젤라틴용액, 폴리비닐피롤리돈, 인산칼슘, 인산칼륨, 셸랙(shellac) 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 붕괴제의 예는 전분, 카르복시메틸셀룰로즈, 카르복시메틸셀룰로즈 칼슘, 한천 분말, 라미나린(laminarin) 분말, 크로스카멜로즈(croscarmellose) 나트륨, 카르복시메틸 전분 나트륨, 나트륨 알기네이트, 나트륨 탄화수소물, 탄산칼슘, 폴리옥시에틸렌 소르비탄 지방산 에스테르, 라우릴 황산 나트륨, 전분, 모노글리세라이드 스테아레이트, 유당, 칼슘 글리코레이트 셀룰로즈 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 붕괴 억제제의 예는 수소-첨가된 오일, 사카로즈, 스테아린, 카카오 버터, 경화유 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 흡수 프로모터의 예는 4차암모늄염, 라우릴 황산나트륨 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 흡수제의 예는 전분, 유당, 카올린, 벤토나이트, 콜로이드성 실리카 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 습윤제의 예는 글리세린, 전분 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 용해제의 예는 아르기닌, 글루탐산, 아스파르트산 등을 포함하나 이에 한정적인 것은 아니다.

고형 포뮬레이션 내의 안정화제의 예는 인간 혈청알부민, 유당 등을 포함하나 이에 한정적인 것은 아니다.

정제, 환약 등이 고형 포뮬레이션으로 제조될 때 이들은 위장 또는 소장 내에서 용해가능한 물질의 필름으로 선택적으로 코팅된다(사카로스, 젤라틴, 하이드록시프로필셀룰로즈, 하이드록시프로필메틸셀룰로즈, 프탈레이트 등). 정제는 선택적으로 일반적인 코팅을 지닌 것을 포함한다(즉, 당의정, 젤라틴 코팅된 정제, 장 코팅된 정제, 필름 코팅된 정제 또는 이중 정제, 다층 정제 등). 캡슐은 경질캡슐 및 연질캡슐을 포함한다. 정제가 좌약을 형태로 몰드되는 경우 고급 알코올, 고급 알코올에스테르, 반-합성 글리세라이드 등이 상기-기술된 첨가제 이외에 첨가될 수 있다. 본 발명은 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 용액의 바람직한 예는 주사용액, 알코올, 프로필렌글리콜, 매크로골, 참기름, 옥수수유 등을 포함한다.

액체 포뮬레이션 내 용해제의 바람직한 예는 폴리에틸렌글리콜, 프로필렌글리콜, D-만니톨, 벤질 안식향산염, 에탄올, 트리스아미노메탄, 콜레스테롤, 트리에탄올아민, 탄산나트륨, 구연산나트륨 등을 포함하나 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 현탁제의 바람직한 예는 계면활성제(즉, 스테아릴트리에탄올아민, 라우릴황산나트륨, 라우릴아미노프로피온산, 레시틴, 염화벤잘코늄, 염화벤제토늄, 글리세린모노스테아레이트 등), 친수성 거대분자(즉, 폴리비닐알코올, 폴리비닐피롤리돈, 카르복시메틸셀룰로즈나트륨, 메틸셀룰로즈, 하이드록시메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈 등) 등을 포함한다.

액체 포뮬레이션 내 등장제의 바람직한 예는 염화나트륨, 글리세린, D-만니톨 등을 포함하나 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 완충액의 바람직한 예는 인산염, 아세트산염, 탄산염, 구연산염 등을 포함하나 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 연화제의 바람직한 예는 벤질알코올, 염화벤잘코늄, 염화수소프로카인 등을 포함하나 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 방부제의 바람직한 예는 파라하이드록시벤조에이트에스테르, 클로로부탄올, 벤질알코올, 2-페닐에틸알코올, 디하이드로아세트산, 소르부산 등을 포함하나 이에 한정적인 것은 아니다.

액체 포뮬레이션 내 항산화제의 바람직한 예는 아황산염, 아스코르브산, α-토코페롤, 시스테인 등을 포함하나 이에 한정적인 것은 아니다.

액체 작용제 및 현탁액이 주사제로서 제조되는 경우 이들은 멸균되고 바람직하게는 혈액과 등장성이다. 일반적으로 이들 작용제는 박테리아-보유 필터를 이용한 여과, 살균제와의 혼합 또는 방사선처리에 의해 무균성이 된다. 이들 처리 후 이들 작용제는 동결건조에 의해 고형화된다. 사용 직전에 멸균수 또는 멸균 주사 희석액(염화수소리도카인 수용액, 생리식염수, 포도당 수용액, 에탄올 또는 그의 혼합물)이 첨가된다.

본 발명의 약제적 조성물은 착색제, 방부제, 풍미제, 방향 화학제, 감미료 또는 다른 약물을 더욱 포함한다.

본 발명의 약제는 경구적으로 또는 비경구적으로 투여된다. 대안으로, 본 발명의 약제는 정맥내로 또는 피하로 투여된다. 전신으로 투여되는 경우 본 발명에서 사용되는 약제는 무-발열원의 약제적으로 수용가능한 수용액의 형태이다. pH, 등장성, 안정성 등에 관한 이러한 약제적으로 수용가능한 조성물의 제조는 당분야의 범위에 있다. 여기서 투여 방법은 경구 투여 및 비경구 투여(즉, 정맥내, 근육내, 피하, 비강내, 점막내, 직장내, 질내, 영향 받는 사이트에 국부적으로, 피부로)를 포함한다. 이러한 투여의 처방은 어떠한 형태로도 제공된다. 이러한 포뮬레이션 형태는 액체 포뮬레이션, 주사제, 지속성 제제 등을 포함한다.

본 발명의 약제는 동결건조된 케이크 또는 수용액의 형태로 원하는 정도의 순도를 지닌 당 체인 조성물을 선택적인 약제적으로 수용가능한 담체, 부형제 또는 안정화제와 혼합함으로서 보관용으로 제조된다(Japanese Pharmacopeia 14th Edtion or the latest edition; Remington's Pharmaceutical Sciences, 18th Edtion, A. R. Gennaro, ed., Mack Publishing Company, 1990 등).

다양한 전달 시스템이 알려져 있고 본 발명의 화합물을 투여하는데 이용될 수 있다(즉, 리포솜, 미립자, 마이크로캡슐). 도입 방법은 피내, 근육내, 복막내, 정맥내, 피하, 비강내, 경막외 및 구강 경로를 포함하나 이에 한정적인 것은 아니다. 화합물 또는 조성물은 어떠한 편리한 경로로도 투여되고(즉, 주입 또는 환약 주사에 의해, 상피 또는 점막피부 내층(즉, 구강 점막, 직장 및 창자 점막 등)에 의해) 다른 생물학적으로 활성인 작용제와 함께 투여된다. 투여는 전신정 또는 국부성이 될 수 있다. 더욱이 어떠한 적당한 경로(심실내 및 경막내 주사; 심실내 주사는 예를 들어 Ommaya 저장소와 같은 저장소에 부착된 심실내 카테테르에 의해 촉진됨)에 의해 본 발명의 약제적 화합물 또는 조성물을 중추신경계 내로 도입시키는 것이 바람직하다. 또한 흡입기 또는 연무기의 이용 및 연무제와의 포뮬레이션에 의해 폐 투여도 이용될 수 있다.

특정한 실시태양에서 본 발명의 생성물 물질 또는 동일한 것을 포함한 조성물을 치료가 요구되는 부위에 국부적으로 투여하는 것이 바람직하고(즉, 중추신경계, 뇌 등); 이는 예를 들어 수술 동안의 국부적 주입, 국부 도포(즉, 수술 후 상처와의 컨쥬게이션), 주사, 카테테르, 좌약, 임플란트(임플란트는 시알라스틱 멤브레인과 같은 멤브레인 또는 섬유를 포함한 다공성, 비-다공성 또는 젤라틴 물질임)에 의해 달성되나 이에 한정적인 것은 아니다. 바람직하게는 본 발명의 항체를 포함한 단백질의 투여시 단백질이 흡수되지 않는 물질을 이용하는 것이 고려되어야 한다.

또다른 실시태양에서 화합물 또는 조성물은 운반제, 특히 리포솜 내에서 전달될 수 있다(Langer, Science 249:1527-1533(1990); Treat et al., Liposomes in the Therapy of Infectious Disease and Cancer, Lopez-Berestein and Fidler(eds.), Liss, New York, pp.353-365 (1989); Lopez-Berestein, ibid., pp.317-327 참조).

또다른 실시태양에서 화합물 또는 조성물은 제어된 분비 시스템으로 전달될 수 있다. 하나의 실시태양에서 펌프가 이용된다(Langer, 상동; Sefton, CRC Crit. Ref. Biomed. Eng. 14:201(1987); Buchwald et al., Surgery 88:507(1980); Saudek et al., N. Engl. J. Med. 321:574(1989) 참조). 또다른 실시태양에서 중합 물질이 이용될 수 있다(Medical Applications of Controlled Release, Langer and Wise(eds.), CRC Pres., Boca Raton, Florida(1974); Controlled Drug Bioavailability, Drug Product Design and Performance, Smolen and Ball(eds.), Wiley, New York(1984); Ranger and Peppas, J., Macromol. Sci. Rev. Macromol. Chem. 23:61(1983); Levy et al., Science 228:190(1985); During et al., Ann. Neurol. 25:351(1989); Howard et al., J. Neurosurg. 71:105(1989) 참조).

또다른 실시태양에서 제어된 분비 시스템은 치료 타겟 즉 뇌에 근접하여 위치할 수 있어서 전신성 투여량의 프랙션만을 필요로 한다(Goodson, in Medical Applications of Controlled Release, 상동, vol. 2, pp.115-138(1984) 참조).

다른 제어된 분비 시스템은 Langer에 의한 보고서에서 논의되었다(Science 249:1527-1533(1990)).

본 발명의 치료 방법에 사용되는 화합물의 양은 이용 목적, 목표 질병(형태, 경중도 등), 환자의 연령, 체중, 성별 및 병력, 세포의 형상 또는 형태를 참고하여 당업자에 의해 용이하게 결정될 수 있다. 또한 피험자(환자)에게 적용되는 본 발명의 치료 방법의 빈도는 이용 목적, 목표 질병(형태, 경중도 등), 환자의 연령, 체중, 성별 및 병력, 치료의 진행을 참고하여 당업자에 의해 결정될 수 있다. 본 빈도의 예는 하루에 한 번 내지 수개월에 한 번(즉, 1주에 한 번 내지 1개월에 한번)을 포함한다. 바람직하게는 투여는 진행을 참고로 1주에 한 번 내지 1개월에 한 번으로 수행된다.

본 발명의 생성물 물질의 투여량은 피험자의 연령, 체중 및 건강상태 또는 투여 방법에 따라 달라지고, 일반적으로 성인의 경우 경구 투여시 하루에 0.01 mg 내지 10 g, 바람직하게는 0.1 mg 내지 1 g, 1 mg 내지 100 mg, 0.1 mg 내지 10 mg; 비경구 투여시 0.01 mg 내지 1g, 바람직하게는 0.01 mg 내지 100 mg, 0.1 mg 내지 100 mg, 1 mg 내지 100 mg, 0.1 mg 내지 10 mg을 포함하나 이에 한정적인 것은 아니다. 본 발명은 이에 한정적인 것은 아니다.

여기서 사용된 "투여하다"라는 용어는 본 발명의 폴리펩타이드, 폴리뉴클레오타이드 또는 이들을 함유한 약제적 조성물이 단독으로 또는 다른 치료 작용제와 결합하여 생물체의 세포 조직 내로 통합되는 것을 의미한다. 결합은 동시에(즉, 혼합물), 개별적이나 동시에 또는 동시발생적으로; 또는 연속적으로 투여된다. 이는 결합된 작용제는 치료 혼합물로서 함께 투여되는 프리젠테이션 및 결합된 작용제가 개별적이나 동시에 투여되는(즉, 개별적인 정맥 라인을 통해 동일한 개체로) 절차를 포함한다. "결합" 투여는 먼제 제공된 화합물 또는 작용제 중의 하나의 개별적 투여후 두 번째가 뒤따르는 것을 더욱 포함한다.

여기서 사용된 "지침"은 투여하거나 투여받는 사람에 대한 본 발명의 약제를 투여하는 방법, 진단 방법, 약제, 진단하거나 진단받는 사람(의사, 환자)을 설명한다. 본 지침은 본 발명의 진단제, 약제를 투여하는 적당한 방법을 나타내는 설명을 기술한다. 지침은 본 발명이 실행되는 국가 당국에 의해 정의된 포맷에 따라 준비되고(즉, 일본후생노동성, 미국 식품의약국(FDA)), 지침이 당국에 의해 승인된 것임을 명백하게 기술한다. 지침은 소위 팩키지 삽입물이고 일반적으로 종이 매체로 제공된다. 지침은 이에 한정적인 것은 아니고 전자 매체(즉, 웹 사이트 및 인터넷 상에 제공되는 전자 메일)의 형태로 제공된다.

본 발명의 방법으로의 치료 종결의 판단은 상업적으로 구입가능한 에세이 또는 기구를 이용한 표준 임상 실험의 결과 또는 목적 질병에 특이적인 임상적 증상의 소멸에 의해 확인된다. 치료는 목적 질병의 재발로 재시작될 수 있다.

또한 본 발명은 하나 이상의 약제적 조성물이 적재된 하나 이상의 용기를 포함한 약제적 팩키지 또는 키트를 제공한다. 약제적 생성물 또는 생물학적 생성물의 생산, 이용 또는 판매를 조절하는 정부 기관에 의해 정의된 형태의 고지가 본 용기에 임의로 부착되고, 인간으로의 투여에 대해 생산, 이용 또는 판매에 관한 정부 기관의 승인을 나타낸다.

(본 발명의 바람직한 실시태양의 설명)

이후, 본 발명은 실시예에 의해 설명될 것이다. 하기 기술된 실시예는 예시적인 목적으로만 제공된다. 따라서 본 발명의 범위는 부가된 청구항을 제외하고는 한정적이지 않다.

본 발명의 하나의 관점에서 생물체 또는 세포의 유전 형질의 전환율을 조절하는 방법이 제공된다. 그 방법은 다음과 같은 단계로 구성된다: (a) 생물체 또는 세포의 유전자의 복제에서 오류-빈발 빈도를 조절하는 단계. 이 경우에는 오류-빈발 빈도는 예를 들면, 또는 선택적으로, DNA 중합효소의 중합반응에서 오류를 증가시키는 것에 의해 DNA 중합효소의 프루프리딩 기능을 조절하는 것으로 조절될 수 있다. 이러한 오류-빈발 빈도 조절은 당분야에서 잘 알려진 기술을 이용하여 수행될 수 있다. 오류-빈발 빈도 조절은 통상적으로 수득될 수 없는 범위 및 거의 자연적인 진화에 대해 빠른 돌연변이 유발을 제공한다. 더욱이 유익성 돌연변이 보다 더 많은 빈도로 발생하는 유해성 돌연변이가 UV, 화학약품 또는 이와 같은 것을 이용한 당분야에서 알려진 어떠한 돌연변이 유발과 비교해도 실질적으로 감소될 수 있다. 이것은 본 발명의 방법에서 도입된 돌연변이가 자연-발생적 진화 현상에서의 돌연변이와 동일한 현상이기 때문이다.

진화 세포 또는 생물체에 대한 본 발명의 방법에서는 오류-빈발 빈도를 조절하는 단계 및 요구되는 형질에 대해 수득된 세포 또는 생물체 선별 단계가 각각 수행될 수 있다. 두 개의 개별적인 단계를 수행하는 것으로 오류-빈발 빈도(또는 진화의 속도)는 선택 압력을 발휘하지 않는 조건하에서 조절될 수 있다; 개체의 수는 어느 수에 대해 증가될 수 있다; 및 변형은 선별되고 확인되었다. 이러한 단계는 목적하는 진화된 세포 또는 생물체가 효과적이고 실제적으로 수득될 수 있도록 유사하게 두 번 반복되었다.

종래의 방법에서는 유익성 형질전환의 발생 빈도는 생물체 또는 세포의 형질전환 빈도에서 증가를 나타내며 증가된다. 그러나 동시에 유해성 돌연변이 또한 일어난다. 일반적으로 UV, 화학약품 또는 이와 같은 것을 이용하는 당분야에서 알려진 어떠한 돌연변이 유발에 의해 제공되는 유해성 돌연변이의 발생 빈도와 비교해서 유익성 돌연변이의 발생 빈도가 실질적으로 감소될 수 있기 때문에 유해성 돌연변이의 발생 빈도가 높다. 따라서 종래의 방법에서는 UV, 화학약품 또는 이와 같은 것을 이용하는 당분야에서 알려진 어떠한 돌연변이 유발 방법과 비교해서 유해성 돌연변이의 발생 빈도가 실질적으로 감소될 수 있는 동안 생물체 또는 세포에서 다수의 유익성 돌연변이를 유도하는 것은 불가능하다.

몇몇의 종래의 돌연변이 방법에서는 자연 돌연변이가 사용되었다. 그러나 이 경우에는 자연 돌연변이의 발생 빈도는 상당히 낮았다(즉, E. coli에 대해 10^-10 돌연변이(염기 당 복제 당) 등). 따라서 자연 돌연변이의 비율은 실용적이지는 않다. 더욱이 자연적으로 유익성 돌연변이가 발생한다. 따라서 자연 돌연변이의 의존하여 번식하는 것은 큰 생물체 개체군 및 긴 시간을 필요로 한다. 자연 돌연변이를 이용하는 방법과는 달리 본 발명의 방법은 오직 작은 생물체 개체군 및 한 개에서 몇 개의 발생에 대해 상응하는 시간만을 필요로 한다. 본 발명의 효과는 대단한 것이다.

자리-특이적 돌연변이에서는 오직 미리 결정된 돌연변이만이 유도될 수 있다. 신뢰도가 매우 높기는 하나 자리-특이적 돌연변이는 대규모 이용에는 어울리지 않고 돌연변이된 특성은 전체 생물체에 영향을 지니지 않는다. 따라서 자리-특이적 돌연변이는 반드시 유익성 돌연변이를 유발하는 것은 아니다. 따라서 자리-특이적 돌연변이는 자연 돌연변이를 모방한 것이라고 할 수 없고 유전자 재조합이 수행되는 것에 기인한 역효과의 불리한 점을 지닌다. 본 발명은 자연 돌연변이와 같이 실질적으로 동일한 돌연변이를 제공할 수 있지만 인공 돌연변이를 제공하지는 않는다.

다른 돌연변이 방법으로써 방사선, 돌연변이원 등을 이용하는 방법이 있다. 이러한 방법은 자연 돌연변이 보다 높은 빈도로 돌연변이를 발생시킬 수 있다. 그러나 방사선의 효과적인 분량 또는 돌연변이원의 효과적인 농도가 처리된 세포의 대부분을 사멸시킬 수도 있다. 다시 말하면 유해성 돌연변이는 생물체에 치명적이다. 돌연변이원을 이용하는 방법에 있어서 유해성 돌연변이 없이 돌연변이 유발을 유도하는 것을 불가능하다. 본 발명의 방법에 의해 유해성 돌연변이의 발생 빈도는 UV, 화학약품 또는 이와 유사한 것과 같은 상기 기술한 방법에 의한 돌연변이의 발생 빈도와 비교해서 실질적으로 감소될 수 있다. 본 발명의 방법은 오직 작은 생물체 개체군과 한 개에서 몇 개의 발생에 대해 상응하는 시간만을 필요로 한다.

본 발명에 따른 불균형 이론을 이용하여 유전적인 형질의 전환율을 조절하는 방법에 있어서, 조절된 프루프리딩 기능을 지니는 DNA 중합효소를 이용하는 것에 의해 많은 수의 돌연변이가 다른 스트랜드 보다 이중-스트랜드 게놈 DNA의 하나의 스트랜드 내로 도입되었다. 본 발명은 다수의 유익성 돌연변이가 유해성 돌연변이의 축적 없이 축적될 수 있다는 실험적인 수준에서 증명하는 첫 번째이다. 따라서 본 발명은 많은 돌연변이가 생물체 내로 도입되는 것이 요구되지만 생물체의 정상 생장(신진대사 등)은 유지하지 않는 불균형 이론을 반증한다. 따라서 본 발명은 획기적인-제조 발명이다. 특히 진핵세포 생물체는 복제의 다수의 양-방향성 기점(origin)을 지닌다. 만약 게놈 DNA가 복제의 양-방향성 기점을 지닌다면 불균형 방법은 유해성 돌연변이의 축적 없이 다수의 유익성 돌연변이를 축적할 수 없다. 본 발명의 방법에 따르면 유해성 돌연변이의 축적 없이 다수의 유익성 돌연변이가 축적될 수 있다는 것이 진핵세포 생물체에서조차 설명되었다.

바람직한 실시태양에서 래깅 스트랜드 및 리딩 스트랜드의 오직 하나 내로 개조된 프루프리딩 기능을 지닌 DNA 중합효소를 도입하기에 유리할 수도 있다.

본 발명에 의해 달성된 만족스러운 육종은 높은-속도 생물체 진화를 성취할 수 있을 것으로 생각된다. 높은-속도 생물체 진화는 일반적으로 개체의 상당한 유전적 다양성과 유익성 돌연변이의 안정된 확장을 요구한다. 안정된 확장은 정확한 DNA 복제에 의해 성취될 수 있는 반면 DNA 복제 동안 오류에 의한 돌연변이는 유전적 다양성을 생산한다.

본 발명의 효과는 진핵세포 생물체에서조차도 성취될 수 있는 높은-속도 진화이다. 진핵세포 생물체는 E. coli와는 달리 명확한 핵 구조를 가지고 있고 그들의 게놈은 다수의 염색체로 이루어져 있다. 따라서 본 발명은 종래의 기술로부터 기대되지 않을 수 없는 효과를 지닌다고 할 수 있다. 만약 진화 속도가 E. coli에서 조차 조절될 수 있다면 본 실시예에서 나타내기까지는 진화 속도가 진핵세포 생물체 및 그람-양성 박테리아에서 조절될 수 있다는 것은 기대할 수 없었을 것이다.

바람직한 실시태양에서 유전자 복제에서 역할을 하는 작용제는 적어도 두 종류 이상의 오류-빈발 빈도 작용제를 포함한다. 두 개의 오류-빈발 빈도 작용제는 바람직하게는 DNA 중합효소이다. 이러한 DNA 중합효소는 다양한 오류-빈발 빈도를 지닌다. 바람직한 실시태양에서 오류-빈발 빈도 작용제는 더 작은 오류-빈발 빈도를 지니는 작용제의 적어도 약 30% 이상, 더욱 바람직하게는 적어도 약 20% 이상, 더욱 바람직하게는 적어도 약 15% 이상을 포함하는 것이 바람직하다. 이러한 특징으로는 안정된 복제가 수행되는 동안 놀랄만한 진화를 보이며 발생되는 돌연변이의 증가 확률이다.

또다른 바람직한 실시태양에서, 본 발명에 따른 유전자 복제에서 역할을 하는 작용제(즉, DNA 중합효소 등)는 이질성 오류-빈발 서열을 지니는 것이 바람직하다. 균일하지 않은 오류-빈발 빈도는 종래의 기술과 비교해 진화의 속도를 증가하게 하고 오류 역치의 상한선을 제거하게 한다.

바람직한 실시태양에서 낮은 오류-빈발 빈도를 지니는 작용제는 실질적으로 오류가 없다. 그러나 실질적으로 게놈 당 오류가 없는 오류-빈발 빈도를 지니는 작용제는 바람직하게 사용될 수도 있다.

따라서 바람직한 실시태양에서 적어도 두 종류의 오류-빈발 빈도는 일반적으로 적어도 10¹까지, 바람직하게는 적어도 10²까지, 더욱 바람직하게는 적어도 10³ 까지 서로 다르다. 이러한 빈도의 다양함으로 진화의 속도는 더욱 효과적으로 조절될 수 있다.

본 발명의 하나의 실시태양에서 오류-빈발 빈도 조절 단계는 생물체의 DNA 중합효소의 오류-빈발 빈도 조절을 포함한다. 목적 생물체의 DNA 중합효소의 오류-빈발 빈도는 생물체 내에 존재하는 DNA 중합효소를 직접 조절하는 것에 의해 조절될 수도 있다. 또는 선택적으로 외부에서 생물체 내로 변형된 오류-빈발 빈도를 지니는 DNA 중합효소를 도입하는 것에 의해 조절될 수도 있다. 이러한 DNA 중합효소의 조절은 당분야에서 잘 알려진 생물학적 기술에 의해 수행될 수도 있다. 그 기술들은 본 발명의 다른 부분에서 설명한다. 비-제한 실시예에서, DNA 중합효소의 직접적인 조절은 돌연변이가 이미 도입된 생물체 라인을 교차시키는 것에 의해 수행될 수 있다.

또다른 실시태양에서 DNA 중합효소는 프루프리딩 기능을 지닌다. 목적 생물체에서 프루프리딩 기능을 지니는 DNA 중합효소는 일반적으로 존재한다. 이러한 프루프리딩 기능을 지니는 DNA 중합효소의 예들은 복구 기능을 지니는 DNA 중합효소 δ 및 ε, DnaQ, DNA 중합효소 β, θ 및 λ 등을 포함하나 이에 한정적인 것은 아니다. DNA 중합효소의 프루프리딩 기능은 생물체 내에 존재하는 DNA 중합효소를 직접 조절하는 것에 의해 조절될 수도 있다. 또는 선택적으로 외부에서 생물체 내로 변형된 프루프리딩 기능을 지니는 DNA 중합효소를 도입하는 것에 의해 조절될 수도 있다. 이러한 DNA 중합효소의 조절은 당분야에서 잘 알려진 생물학적 기술에 의해 수행될 수도 있다. 그 기술들은 본 발명의 다른 부분에서 설명한다. 비-제한 실시예에서, DNA 중합효소의 직접적인 조절은 돌연변이가 이미 도입된 생물체 라인을 교차시키는 것에 의해 수행될 수 있다. 바람직하게는 변형된 DNA 중합효소를 인코딩하는 핵산 분자는 플라스미드 내로 혼합되고 플라스미드는 생물체 내로 도입되어 핵산 분자는 일시적으로 발현된다. 플라스미드 또는 이와 유사한 것의 일시적인 발현 특성 때문에 플라스미드 또는 이와 유사한 것은 사라진다. 따라서 유전적인 형질의 전환율의 조절 후에 야생형에서와 같은 동일한 전환율은 복구될 수 있다.

또다른 실시태양에서 본 발명의 DNA 중합효소는 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 적어도 하나 이상의 중합효소를 포함한다. 또한 또다른 실시태양에서 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 본 발명에서 사용되는 DNA 중합효소의 오직 하나는 조절될 수도 있다. 오직 하나의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것에 의해 한번 나타난 유전자형(야생형 포함)은 보존된다; 돌연변이의 높은 비율은 허용될 수도 있다; 게놈에서 넒은 범위(유전자)는 개선될 수 있다; 원래 형질은 보증될 수 있고 다양성은 증가될 수 있다; 진화는 종래의 수준을 능가하는 속도로 가속화될 수도 있다; 및 돌연변이된 형질은 안정하다.

본 발명의 또다른 실시태양에서 오류-빈발 빈도의 조절 단계는 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 적어도 하나 이상의 중합효소를 조절하는 것을 포함한다. 이러한 프루프리딩 활성은 예를 들면 중합효소의 3'-> 5' 엑소뉴클레아제 활성 중심을 변경시키는 것에 의해 조절될 수 있다(선택적으로 ExoI 모티브, 프루프리딩 기능 활성 부위) (예를 들면, 316 위치에서의 아스파르트산 및 318 위치에서의 글루탐산 및 인간 DNA 중합효소 δ의 부위 주변). 본 발명은 이에 한정적인 것은 아니다.

본 발명의 바람직한 실시태양에서 오류-빈발 빈도 조절 단계는 야생형에서보다 더 높은 수준으로 오류-빈발 빈도를 증가시키는 것을 포함한다. 야생형에서보다 더 높은 수준으로 오류-빈발 빈도를 증가시키는 것에 의한 생물체의 유전 형질 전환율(즉, 진화의 속도)은 생물체에서 역효과 없이 증가되었다. 이러한 성취는 종래에서는 기대하지 않았다. 본 발명은 매우 훌륭한 효과를 지닌다.

또다른 실시태양에서 본 발명에서 사용을 위한 DNA 중합효소는 야행형에서보다 더 낮은 프루프리딩 기능을 지닌다. 이러한 DNA 중합효소는 자연-발생적일 수도 있지만 선택적으로 DNA 중합효소를 조절할 수도 있다.

하나의 실시태양에서 (변형된) 본 발명에서 사용을 위한 DNA 중합효소는 야생형 DNA 중합효소에서 보다 적어도 하나 이상의 수의 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지니는 것이 좋다. 야생형 DNA 중합효소에서 보다 적어도 하나 이상의 수의 부적당한 염기(돌연변이)를 제공하는 것에 의해 생물체에서 유전 형질 전환율(즉, 진화의 속도)은 생물체에 역효과 없이 증가되었다. 유전 형질 전환율은 만약 야생형 DNA 중합효소에서 보다 돌연변이된 염기의 수가 더 많으면 증가되는 경향을 보인다. 따라서 전환율을 증가시키기 위해 프루프리딩 기능은 바람직하게는 더 낮아진다. 프루프리딩 기능을 에세이하는 방법은 당분야에 잘 알려져 있다. 예를 들면 목적 DNA 중합효소(복제된 생성물 시퀀싱에 의해 결정; 프루프리딩 활성 측정에 의해 결정)에 대해 어울리는 적당한 에세이 시스템에 의해 수득된 생성물은 직접적 또는 간접적으로 시퀀스된다(예를 들면 시퀀서 또는 DNA 칩).

또다른 바람직한 실시태양에서 본 발명에서 사용되는 DNA 중합효소는 적어도 하나 이상의 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지니는 것이 바람직하다. 일반적으로 야생형 DNA 중합효소는 종종 수득된 생성물의 염기 서열에서 돌연변이를 제공하지 않는다. 따라서 이러한 경우 본 발명에서 사용되는 DNA 중합효소의 변형은 적어도 하나 이상의 부적당한 염기(돌연변이)를 제공하는 낮은 수준의 프루프리딩 기능을 지니는 것이 필요로 할 수도 있다. 이러한 프루프리딩 기능은 상기 기술된 에세시 시스템에 의해 측정될 수 있다. 더욱 바람직하게는 본 발명에서 사용을 위한 DNA 중합효소는 적어도 2개 이상의 미스매치 염기(돌연변이), 더욱 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9 및 10개 이상의 미스매치 염기 및 더욱 바람직하게는 적어도 15, 20, 25, 50 및 100개 이상의 미스매치 염기를 제공하는 프루프리딩 기능을 지닌다. 이것은 생물체의 유전 형질 전환율(즉, 진화의 속도)은 프루프리딩 기능의 수준에서 감소, 즉 염기서열에서 미스매치 염기(돌연변이)의 수의 증가를 나타내며 증가한다고 보여진다.

또다른 실시태양에서 본 발명에서 사용을 위한 DNA 중합효소는 10^-6 비율로 염기 서열에서 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지닌다. 일반적으로 돌연변이는 자연적-발생 생물체에서 10^-12 에서 10^-8의 비율에서 유도된다. 따라서 본 발명에서는 매우 낮아진 프루프리딩 기능을 지니는 DNA 중합효소를 이용하는 것이 바람직하다. 더욱 바람직하게는 본 발명에서 사용되는 DNA 중합효소는 10^-3 비율로, 더욱 바람직하게는 10^-2 비율로 염기 서열에서 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지닌다. 이것은 생물체의 유전 형질 전환율(즉, 진화의 속도)은 프루프리딩 기능의 수준에서 감소, 염기 서열 내 미스매치 염기(돌연변이)의 수의 증가를 나타내며 증가한다고 보여진다.

어떠한 실시태양에서 본 발명에 의해 목표된 생물체는 진핵세포 생물체일 수도 있다. 진핵세포 생물체는 E. coli와는 달리 프루프리딩 기능을 하게 하는 메카니즘을 지닌다. 따라서 진화의 속도는 모델로써 사용된 E. coli와 다른 방식으로 논의되거나 설명된다. 예상외로 본 발명은 조절될 수 있는 진핵세포 생물체를 포함하는 모든 생물체의 유전 형질 전환율(즉, 진화의 속도)을 설명한다. 따라서 본 발명은 종래의 기술에 의해 예측될 수 없는 효과를 제공한다. 특히 본 발명에 의해 진핵세포 생물체에서 진화의 속도가 조절될 수 있어 다음의 다양한 적용이 성취되었다; 진화 메카니즘의 설명; 게놈과 형질 사이의 관계 설명; 동물 및 식물을 포함한 다양한 고등생물의 진보; 존재하는 유기제의 진화 능력 조사; 더 나아간 생물체의 예측; 질병의 동물 모델의 제작 등. 본 발명에 의해 목표된 진핵세포 생물체의 예는 단세포생물(예를 들면 효모 등) 및 다세포생물(예를 들면 동물 및 식물)을 포함하나 이에 한정적인 것은 아니다. 이러한 생물체의 예는 먹장어목, 연골어강, 페트로니조니포메스(petronyzoniformes), 경골어류, 포유류강(예를 들면 단공류, 유대류, 반치류, 피익목, 익수목, 육식동물, 식충동물, 장비류, 기제류, 우제류, 관치목, 유린류, 바다소목, 고래류의 동물, 영장류, 설치목, 토끼목 등), 조류강, 파충류강, 양서류강, 어류강, 곤충강, 연형동물강, 쌍자엽식물, 단자엽식물(예를 들면, 밀, 옥수수, 벼, 보리, 사탕수수 등과 같은 벼과), 양치식물, 선태식물, 진균류, 시아노박테리아 등을 포함하나 이에 한정적인 것은 아니다. 바람직하게는 본 발명에 의해 목표된 생물체는 다세포생물일 수도 있다. 또다른 바람직한 실시태양에서 본 발명에 의해 목표된 생물체는 동물, 식물 또는 효모일 수도 있다. 더욱 바람직한 실시태양에서 본 발명에 의해 목표된 생물체는 포유동물일 수도 있으나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명에서 사용을 위한 생물체 또는 세포는 자연적으로 적어도 두 종류 이상의 중합효소를 지닌다. 만약 적어도 2 이상의 중합효소가 존재하면 이질성의 오류-빈발 빈도가 준비된 환경에서 제공하는 것이 용이하다. 더욱 바람직하게는 생물체 또는 세포가 자연적으로 적어도 두 종류 이상의 중합효소를 지니고 그것의 오류-빈발 빈도는 서로 다른 것이 좋다. 이러한 생물체 또는 세포는 변형된 생물체 또는 세포를 제공하는 데에 사용될 수 있다.

바람직한 실시태양에서 본 발명의 방법에 의해 수득된 변형된 생물체 또는 세포는 실질적으로 요구되는 형질로 변형된 후 야생형과 같은 생장을 나타낸다. 이러한 특징은 단지 본 발명이 역효과 없이 유전 형질의 전환율이 조절을 제공한 후 수득되었다. 이러한 특징은 종래의 돌연변이 유발 방법에 의해서는 성취될 수 없는 것이다. 따라서 이러한 특징은 본 발명에 의해 제공되는 유익한 효과인 것이다. 실질적으로 야생형과 동일한 생장을 하는 생물체 또는 세포는 야생형과 동일한 방식으로 처리될 수 있다.

또다른 실시태양에서 본 발명의 방법으로 변형된 생물체 또는 세포는 조절 전(즉, 야생형) 내성을 지니지 않았던 생물체 또는 세포의 환경에 대해 내성을 지닌다. 이러한 환경 파라미터의 예는 습도, pH, 염농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광파장, 전자파, 방사선, 중력, 장력, 음파, 생물체(예를 들면, 기생충 등), 생물체 이외의 것, 화학제, 항생제, 천연 물질, 정신적 스트레스 및 물리적 스트레스 및 이들의 결합인 작용제의 적어도 하나 이상을 포함한다. 따라서 이러한 작용제의 어떠한 결합도 사용될 수 있다. 두 개 또는 그 이상의 작용제 결합될 수도 있다.

온도의 예는 높은 온도, 낮은 온도, 매우 높은 온도(예를 들면 95℃ 등), 매우 낮은 온도(예를 들면 -80℃ 등), 넓은 온도 범위(예를 들면 150℃∼-270℃ 등) 등을 포함하나 이에 한정적인 것은 아니다.

습도의 예는 상대 습도 100%, 상대습도 0%, 0∼100%의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.

pH의 예는 0∼14 사이의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.

염농도의 예는 NaCl 농도(예를 들면 3% 등), 염농도 0∼100%의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.

영양물의 예는 단백질, 포도당, 지질, 비타민, 무기염 등을 포함하나 이에 한정적인 것은 아니다.

금속의 예는 무거운 금속(예를 들면, 수은, 카드듐 등), 납, 금, 우라늄, 은 등을 포함하나 이에 한정적인 것은 아니다.

기체의 예는 산소, 질소, 이산화탄소, 일산화탄소 및 이들의 혼합물 등을 포함하나 이에 한정적인 것은 아니다.

유기 용매의 예는 에탄올, 메탄올, 자일렌, 프로판올 등을 포함하나 이에 한정적인 것은 아니다.

압력의 예는 0∼10 톤/㎠의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.

점도의 예는 어떠한 유동체(예를 들면, 물, 글리세롤 등) 또는 그들의 혼합물의 점도 등을 포함하나 이에 한정적인 것은 아니다.

유속의 예는 0부터 빛의 속도까지의 임의의 지점을 포함하나 이에 한정적인 것은 아니다.

광도의 예는 암흑과 태양광선 수준 사이의 한 지점을 포함하나 이에 한정적인 것은 아니다.

광파장의 예는 가시광선, 자외선(UV-A, UV-B, UV-C 등), 적외선(원적외선, 근적외선 등) 등을 포함하나 이에 한정적인 것은 아니다.

전자파의 예는 임의의 파장을 지니는 전자파를 포함한다.

방사선의 예는 임의의 세기를 지니는 방사선을 포함한다.

중력의 예는 지구상의 임의의 중력 또는 중력 0부터 지구상의 중력까지의 임의의 지점 또는 지구상의 중력보다 더 크거나 동일한 중력을 포함하나 이에 한정적인 것은 아니다.

장력의 예는 임의의 힘을 지니는 장력을 포함한다.

음파의 예는 임의의 세기 및 파장을 지니는 음파를 포함한다.

목적 생물체 이외의 생물체는 기생충, 병원균, 곤충, 선충류 등을 포함하나 이에 한정적인 것은 아니다.

화학제의 예는 염산, 황산, 수산화나트륨 등을 포함하나 이에 한정적인 것은 아니다.

항생제의 예는 페니실린, 카나마이신, 스트렙토마이신, 퀴놀린 등을 포함하나 이에 한정적인 것은 아니다.

자연-발생 물질은 복어 독소, 뱀독소, 아칼로이드 등을 포함하나 이에 한정적인 것은 아니다.

정신적 스트레스의 예는 기아, 밀도, 한정된 공간, 높은 공간 등을 포함하나 이에 한정적인 것은 아니다.

물리적 스트레스는 진동, 소음, 흥분, 충격 등을 포함하나 이에 한정적인 것은 아니다.

또다른 실시태양에서 본 발명의 방법에 의해 목표된 생물체 또는 세포는 암세포이다. 본 발명에 의해 성취된 암 생물체 모델 또는 세포 모델은 종래의 방법과는 달리 자연-발생적 암과 같은 메카니즘에 의해 암을 발생시킨다. 따라서 암 생물체 모델 또는 세포 모델은 정확한 암 생물체 모델 또는 세포 모델로써 간주된다. 따라서 암 생물체 모델 또는 세포 모델은 약제학적 발전에 특히 유용한 것이다.

본 발명의 또다른 관점에서 조절된 유전 형질을 지니는 생물체 또는 세포를 제조하는 방법이 제공된다. 이 방법은 두 개의 단계로 구성된다: (a) 생물체 또는 세포 내 유전자 복제의 오류-빈발 빈도의 조절 또는 변화; 및 (b) 수득된 생물체 또는 세포의 재생산. 이러한 경우 유전 형질의 전환율의 조절에 관계된 기술은 상기에 설명되었다. 따라서 상기-설명된 기술은 생물체 또는 세포 내 유전자 복제의 오류-빈발 빈도의 변화 단계에서 이용될 수 있다. 유전 형질의 전환율을 재조절하기 위한 방법에 관하여 상기에 설명한 바와 같이 생물체 또는 세포는 오류-빈발 빈도를 조절하는 단계에서 사용될 수도 있다.

수득된 생물체 또는 세포를 재생산하는 단계는 만약 생물체 또는 세포가 조절된 유전 형질을 지닌다면 당분야에서 알려진 어떠한 방법을 이용해서도 수행될 수 있다. 재생산 기술은 번식, 증식 등과 자연 현상; 배양된 세포로부터 개체 식물의 재생산 등을 포함하나 이에 한정적인 것은 아니다. 이러한 기술들이 사용되는지 사용되지 않는지는 예를 들면 염기서열을 결정하는 것에 의한 확인; 항원성 또는 이와 유사한 것의 확인; 벡터가 사용된 경우 벡터의 검출; 형질 복원 테스트; 및 돌연변이 및 미분열의 높은 비율의 일치성의 확인에 의해 확실하게 될 수 있다. 이러한 테스트는 본 발명의 명세서에 기초한 기술에 의해 용이하게 수행될 수 있다.

바람직한 실시태양에 있어서 본 발명에 대한 생물체 및 세포 복원 방법은 요구되는 형질을 지니는 개체에 대해 재생산된 생물체 또는 세포의 선별을 더욱 포함한다. 이러한 요구되는 형질을 지니는 개체는 생물체 또는 세포(예를 들면, 상기-기술된 다양한 환경에 대한 내성 등) 또는 유전자에서 또는 대사산물 수준의 유전 형질에 기초해 선별될 수도 있다. 선별의 결과는 시각 조사, 시퀀싱, 다양한 생화학적 테스트, 현미경 관찰, 염색, 면역학적 검정법, 행동 분석 등을 포함하나 이에 한정적인 것은 아닌 다양한 기술에 의해 확인될 수 있다. 이러한 기술은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.

본 발명의 또다른 관점에 있어서 본 발명에 따라 생성된 유전 형질이 조절된 생물체 또는 세포가 제공된다. 생물체 또는 세포는 종래의 기술에 의해 성취될 수 없는 진화의 높은 속도가 수득된다. 따라서 생물체 또는 세포의 존재 그 차제는 명백하게 신규한 것이다. 생물체 또는 세포는 다음에 의해 특징지어진다. 예를 들면: 돌연변이 및 미분열의 높은 비율의 적합성; SNPs(단일 뉴클레오타이드 다형성)의 치우친 분포; 개체에 의존하는 게놈의 동일한 지역에서조차 다른 모드로 축적되는 경향을 지니는 돌연변이(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다 등. 본 발명의 생물체 또는 세포는 바람직하게는 실질적으로 야생형과 동일한 생장을 나타낸다. 일반적으로 빠른 돌연변이 유발을 겪는 생물체가 야생형과 동일한 생장을 나타내는 것은 불가능하다. 그러나 본 발명의 생물체 또는 세포는 실질적으로 야생형과 동일한 생장을 나타낼 수 있다. 따라서 본 발명은 매우 놀랄만한 효과를 지닌다. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.

본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 유전자를 인코딩하는 핵산 분자를 생성하기 위한 방법이 제공된다. 이 방법은 다음의 단계로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이의 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 인코딩하는 핵산 분자의 생성. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.

생물체 또는 세포 내 돌연변이는 당분야에 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 예는 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하나 이에 한정적인 것은 아니다.

돌연변이를 운반하는 유전자가 한번 확인되면 돌연변이를 운반하는 확인된 유전자를 인코딩하는 핵산 분자는 당분야에 잘 알려진 기술을 이용하여 생성될 수 있다. 생성 방법의 예는 뉴클레오타이드 신디사이저를 이용한 합성; 반-합성 방법(예를 들면, PCR 등); 등을 포함하나 이에 한정적인 것은 아니다. 합성된 핵산 분자가 목적 서열을 지니는지 여부는 당분야에 잘 알려진 기술을 이용하여 시퀀싱 또는 DNA 칩에 의해 결정될 수 있다.

따라서 본 발명은 본 발명의 방법에 의해 제조된 핵산 분자를 제공한다. 이러한 핵산 분자는 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래된 유전자이다. 따라서 유전자를 인코딩하는 핵산 분자의 존재 그 차제는 명백하게 신규한 것이다. 핵산 분자는 다음에 의해 특징지어 지나 이에 한정적인 것은 아니다: SNPs의 분포가 치우친다; 많은 돌연변이 수를 지니는 지역은 축적되고 다른 지역은 게놈 내에서 모자이크 패턴으로 분포되는 경향이 있다; 돌연변이는 개체에 의존하는 게놈의 동일한 지역에서조차도 다른 모델로 축적되는 경향을 나타낸다(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다; 등. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.

본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 유전자를 인코딩하는 폴리텝타이드의 제조 방법이 제공된다. 이 방법은 다음의 단계들로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 인코딩하는 폴리펩타이드의 제조. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에 있어서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.

생물체 또는 세포 내 돌연변이는 당분야에 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 예는 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하지만 이러한 기술로 제한되는 것은 아니다.

돌연변이를 운반하는 유전자가 한번 확인되면 돌연변이를 운반하는 확인된 유전자에 의해 인코딩되는 폴리펩타이드는 당분야에 잘 알려진 기술을 이용하여 제조될 수 있다. 제조 방법의 예는 펩타이드 합성기를 이용한 합성; 상기-논의된 유전자를 인코딩하는 핵산 분자는 유전자 조작 기술에 의해 합성되고 세포는 핵산 분자를 이용하여 형질전환되고, 유전자는 발현되며 발현된 생성물은 회수된다; 폴리펩타이드는 변형된 생물체 또는 세포로부터 정제된다; 등을 포함하지만 이러한 것들로 제한되는 것은 아니다.

본 발명의 또다른 관점에 있어서 본 발명의 방법에 의해 제조된 폴리펩타이드가 제공된다. 이러한 폴리펩타이드는 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래된 유전자에 의해 인코드된다. 따라서 유전자에 의해 인코드되는 폴리펩타이드의 존재 그 차제는 명백하게 신규한 것이다. 폴리펩타이드는 다음에 의해 특징지어 진다. 예를 들면 다음의 유전 형질을 지니는 아미노산 서열: SNPs의 분포가 치우친다; 많은 돌연변이 수를 지니는 지역은 축적되고 다른 지역은 게놈 내에 있어서 모자이크 패턴으로 분포되는 경향이 있다; 돌연변이는 개체에 의존하는 게놈의 동일한 지역에서조차도 다른 모델로 축적되는 경향을 나타낸다(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 정자 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다; 등. 본 발명은 이에 한정적인 것은 아니다. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.

본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 생물체의 대사산물을 생성하기 위한 방법이 제공된다. 이 방법은 다음의 단계들로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 포함하는 대사산물의 생성. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.

여기에 사용된 용어 "대사산물"은 세포 내 생존에 대한 활동(대사작용)에 의해 수득된다. 대사산물의 예는 아미노산, 지방산 및 이들의 유도체, 스테로이드, 모노사카라이드, 퓨린, 피리미딘, 뉴클레오타이드, 핵산, 단백질 등을 포함하나 이에 한정적인 것은 아니다. 한편 이러한 중합체 화합물 또는 탄수화물의 산화 또는 지방산의 산화의 가수분해에 의해 수득된 물질 또한 대사산물이라 부른다. 대사산물은 세포 내에 존재할 수도 있고 세포로부터 분비될 수도 있다.

본 발명의 방법에 있어서 생물체 또는 세포의 돌연변이는 당분야에서 잘 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 에는 대사산물의 확인(화합물 분석), 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하지만 이러한 기술로 제한되는 것은 아니다. 대산산물 확인 기술은 대사산물에 의존하여 당분야에서의 이러한 기술들이 알맞게 선택될 수 있다.

본 발명의 또다른 관점에 있어서 본 발명의 방법에 의해 생성된 대사산물이 제공된다. 이러한 대사산물은 또한 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래이고 대사산물의 존재 그 차제는 명백하게 신규한 것이다. 대사산물은 다음의 것들로 특징지어 지지만 이러한 것들로 제한되지는 않는다. 자신에 대해 더 낮은 독성을 가지는 것; 자발적으로 진화된 대사산물의 선매; 등. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.

본 발명의 또다른 관점에 있어서 생물체 또는 세포의 유전 형질을 조절하기 위한 핵산 분자가 제공된다. 핵산 분자는 변형된 오류-빈발 빈도를 지니는 DNA 중합효소를 인코딩하는 핵산 서열로 구성된다. DNA 중합효소는 프루프리딩 활성이 조절된 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 그룹에서 선택된 적어도 하나 이상의 중합효소일 수도 있다. 프루프리딩 활성은 예를 들면 중합효소의 3'-> 5' 엑소뉴클레아제 활성 중심을 형질전환시키는 것에 의해 조절될 수 있다(선택적으로 ExoI 모티브, 프루프리딩 기능 활성 부위) (예를 들면, 316 위치에서의 아스파르트산 및 318 위치에서의 글루탐산 및 인간 DNA 중합효소 δ의 부위 주변). 본 발명은 이러한 것들로 제한하지 않는다.

바람직하게는 본 발명의 핵산 분자에 포함된 DNA 중합효소를 인코딩하는 서열은 DNA 중합효소 δ 또는 ε를 인코드하는 것이 좋다. 그 이유는 이러한 DNA 중합효소는 자연적으로 프루프리딩 기능을 가지며 이 기능은 상대적으로 용이하게 변형되기 때문이다.

본 발명의 또다른 관점에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위한 핵산 분자를 포함하는 벡터가 제공된다. 벡터는 플라스미드 벡터일 수도 있다. 벡터는 바람직하게는 프로모터 서열, 인핸서 서열 및 필요한 경우 이와 유사한 것을 포함할 수도 있다. 벡터는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있고 또는 넘겨질 수도 있다.

본 발명의 또다른 실시태양에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위해 핵산 분자를 포함하는 세포가 제공된다. 본 발명의 핵산 분자는 벡터의 형태로 세포 내로 혼합될 수도 있다. 본 발명은 이에 한정적인 것은 아니다. 세포는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있고 또는 넘겨질 수도 있다. 바람직한 실시태양에서 세포는 제한하는 것은 아니지만 진핵세포인 것이 바람직하다. 만약 세포가 단지 핵산 분자를 증폭하기 위해 사용된다면 진핵세포는 바람직하게 사용될 수도 있을 것이다.

본 발명의 또다른 관점에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위해 핵산 분자를 포함하는 생물체 또는 세포가 제공된다. 생물체는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있다.

또다른 관점에 있어서, 본 발명은 제공된 본 발명의 방법에 의해 수득된 생물체 또는 세포 또는 이들의 일부분(예를 들면, 장기, 조직, 세포 등)에 의해 생성된 생성 물질을 제공한다. 본 발명에 의해 수득된 생물체 또는 이의 일부분은 종래의 방법에 의해 수득되지 않고 그들의 생성 물질은 신규한 물질을 포함할 수도 있다.

본 발명의 또다른 관점에 있어서 약제를 테스트하기 위한 방법이 제공되며 이는 다음의 단계로 구성된다: 질병 모델로써 본 발명의 생물체 또는 세포를 이용하는 약제의 효과 테스트; 대조군으로써 야생형 생물체 또는 세포를 이용하는 약제의 효과 테스트; 및 질병 모델과 대조군의 비교. 이러한 질병 모델은 종래의 방법에 의해 성취될 수 없는 자발적인 질병 진행 모델이다. 따라서 약품 테스트를 위한 방법에서 이러한 질병 모델을 이용하는 것으로 테스트 결과는 테스트의 높은 수준의 신뢰도의 결과로 종래의 방법에 의해서는 인지될 수 없는 자연 조건에서 수행된 테스트와 근접한다. 따라서 약학적 등의 개발 기간을 감소시키는 것이 가능하다. 선택적으로 테스트 결과 내 부작용 등의 정확한 정보를 수득하는 것이 가능할 수도 있다.

또다른 관점에 있어서, 본 발명은 생물체 또는 세포의 유전 형질의 전환율의 조절에서 이용에 대해 적어도 두 종류 이상의 중합효소의 세트에 관한 것이며 중합효소는 다른 오류-빈발 빈도는 지닌다. 이러한 중합효소 세트는 상기에 기술된 방법으로 종래에는 사용되지 않았으며 매우 신규한 것이다. 어떤 중합효소도 도입된 생물체 또는 세포 내에서 그들의 기능을 하는 한 사용될 수 있을 것이다. 따라서 중합효소는 두 개 또는 그 이상의 종으로부터, 바람직하게는 같은 동물 종으로부터 유래될 수도 있다. 상기 기술한 적용에 사용을 위한 중합효소는 유전자 도입을 거쳐 생물체 또는 세포 내로 도입될 수도 있다.

본 발명의 또다른 관점에 있어서, 본 발명은 변형된 유전 형질을 지니는 생물체 또는 세포의 도입에 이용하기 위해 적어도 두 종류 이상의 다른 오류-빈발 빈도를 지니는 중합효소의 세트가 제공된다. 이러한 중합효소 세트는 상기에 기술한 방법으로 종래에는 사용되지 않았으며 매우 신규한 것이다. 어떤 중합효소도 도입된 생물체 또는 세포 내에서 그들의 기능을 하는 한 사용될 수 있을 것이다. 따라서 중합효소는 두 개 또는 그 이상의 종으로부터, 바람직하게는 같은 동물 종으로부터 유래될 수도 있다. 상기 기술한 적용에 사용을 위한 중합효소는 유전자 도입을 거쳐 생물체 또는 세포 내로 도입될 수도 있다.

또다른 관점에 있어서, 본 발명은 생물체 또는 세포의 유전 형질의 전환율의 조절에서 이용에 대해 적어도 두 종류 이상의 중합효소의 세트의 이용에 관한 것이며 중합효소는 다른 오류-빈발 빈도는 지닌다. 상기 기술한 적용에 사용되는 중합효소는 상기에 기술되어 있고 아래의 실시예에 의해 사용되고 생성될 것이다.

또다른 관점에서, 본 발명은 변형된 유전 형질을 지니는 생물체 또는 세포의 도입에 이용하기 위해 중합효소의 세트의 이용에 관한 것이며 이 중합효소는 적어도 두 종류 이상의 다른 오류-빈발 빈도를 지닌다. 상기 기술한 적용에 사용을 위한 중합효소는 상기에 기술되어 있고 아래의 실시예에 의해 사용되고 생성될 것이다.

(불균형 유전적 다양성 하이브리드 모델)

A. 이질성 복제 정확성을 지니는 유전적 다양성의 돌연변이 분포

본 발명의 또다른 관점에 있어서, 유전적 다양성은 각각 길이 n의 바이너리 염기 서열에 의해 표현되는 것으로 가정하는 각각 2ⁿ 가능성 유전자형(또는 서열 영역)을 지니는 게놈 개체군으로 구성되어 있다. 최상의 적합성을 지니는 서열을 본 명세서에는 "마스터 서열"이라 부른다. 개체군의 크기는 매우 크고 안정적인 것으로 선택된다. 하나의 주형 서열의 복제는 하나의 직접 복사 서열을 생성하고 따라서 복제 오류는 하나의 단계에 의해 돌연변이에 고정된다. 단지 염기 치환만이 발생하고 여기서부터 서열 길이가 무시된다. 손쉬운 처리를 위해서 본 발명의 발명자들은 돌연변이 종 Ii(i=0, 1, ..., n) 내로 마스터 서열(I₀)의 모든 i-오류 돌연변이의 총합을 분류하였다. 상대 농도의 대응하는 총합은 Xi로 표시한다. Xi의 전환율은 다음으로 나타낸다:

여기서 Ai는 돌연변이 종 Ii의 복제 비율 상수(또는 적합성)이고; f는 총 농도 상수를 나타내고; 및 그 후

이고; Qii는 복제 정확성 또는 Ij의 완전한 오류 없는 복제에 의한 Ii의 생산 확률이고; 및 Qij는 Ij의 잘못된 복제에 의한 확률을 나타낸다.

게놈 서열은 중합효소에 의해 복제된다. Ek는 다른 정확성을 지닌 p 종류의 중합효소를 나타낸다(k=1, 2, ..., p). Ek의 상대 농도는 Ck로 표시한다. 중합효소 Ek의 단일-염기 정확성은 0 ≤q_k≤1로 표시되며 염기 오류 비율에 대한 Ek는 1-q_k이다. 동일 중합효소에 의한 하나의 서열의 일정한 복제 때문에 염기 오류 비율에 대한 Ek는 n(1-q_k)이다. 유전적 다양성의 게놈 평균 오류 비율에 대한 식은

로 나타낸다. 상동성 복제 정확도를 형질전환하는 것에 의해(예를 들면, M. Eigen, 1971(supra)) 이질성 복제 정확도는 다음과 같이 수득된다:

고정된 돌연변이 분포

는 유전적 다양성이다. 이것은 행렬 W={AjQij}의 고유벡터로 나타낸다. 도 5는 상동성 및 이질성 복제 정확도를 지니는 유전적 다양성의 예를 보여준다. 여기서 단순한 단일-피크 적합성 구역이 사용되었다. 복제 비율 상수 A₀는 마스터 서열로 지정하고 모든 다른 돌연변이 종들은 동일한 적합성을 지닌다.

오류 역치 미만의 상동성 복제 정확도를 지니는 균등한 유전적 다양성은 마스터 서열 주변에 위치한다(도 1의 (a) 참조). m=2.3 근처의 오류 역치에서 전이가 뚜렷하고 마스터 서열의 상대 농도는 10 크기 정도로 감소된다(c=0에서, 도 6참조). 이러한 현상은 오류 카타스트로프(catastrophe)라 부른다. 오류 역치 위에 유전적 다양성 위치는 균일한 분포로 교환되며 개체 농도는 극히 작다(예를 들면 Yi=8.88 x 10-¹⁶). 사실 한정된 개체는 오류가 축적되는 것과 같은 것을 선택하는 것에 의해서는 마스터 서열의 유전적 정보를 포함하는 것은 더욱 어렵다. 단지 오류 역치 이하에서만 유전적 다양성 진화가 가능하며 진화 속도는 오류 역치 근처의 최대점에 도달하는 것으로 나타난다.

본 발명의 불균형 모델(도 5의 (b)∼(d)은 각각 다른 정확도를 지니는 두 종류의 중합효소를 지닌다는 것을 가정한다. 중합효소 E₁은 오류가 없는 것이고 q₁=1이고 E₂는 오류-빈발이며 0≤q₂≤1이다; 각각은 c 및 1-c의 상대 농도에서 존재한다. 완전히 오류가 없는 중합효소의 가정은 현실적으로 나타나지 않지만 DNA-기초한 미생물에서 프루프리딩 중합효소의 오류 비율은 복제 당 게놈에 대해 0.003 오류 정도로 매우 작고 따라서 이 경우에서는 무시해도 좋다.

오류가 없는 중합효소의 상대 농도가 0<c<1정도로 매우 낮을 때 오류 역치는 증가 c를 나타내며 더 높은 평균 오류 비율로 이동하고 오류 카타스트로프의 정도는 감소한다(도 5의 (b) 및 도 6참조) C=0.1에서 오류 역치는 사라진다(도 5의 (c) 참조). 마스터 서열의 상대 농도는 점차적으로 감소하고 결국 균등 균일한 분포 보다 10⁷배나 더 높은 농도로 평등해 진다(도 6의 c=0.1에서). c>0.1일 때 평균 오류 비율에 의존하지 않는 마스터 서열은 충분한 농도 내에 존재한다(도 5의 (d) 및 도 6 참조). 도 6은 C_crit=0.1 근처의 유전적 다양성 원동력의 인상적인 변화를 나타낸다. 불균형 유전적 다양성 모델에 있어서 마스터 서열로부터 먼 거리에 있는 돌연변이는 유전적 다양성 위치의 손실을 일으키지 않고 존재할 수 있다.

B. 다수의 복제 작용제를 지니는 유전자 다양성에 대한 오류 역치

불균형 모델에 대한 오류 역치를 고려할 때 본 발명은 다음의 두 가지 난점을 만났었다: (i) 자연에서의 게놈 크기는 너무 커서 정확한 측정을 할 수가 없다; 바이러스: n>10³, 박테리아: n>10⁶; 및 (ⅱ) 자연에서의 게놈 복제는 하나의 유니트(복제 작용제)보다 더 많은 유니트로 분할되고 동시에 하나의 중합효소 보다 더 많은 중합효소가 참여한다. 다중 복제 작용제는 오류 역치에 영향을 주는 것을 나타난다. 본 발명의 발명자들은 마스터 서열의 상대 고정 농도의 근사값을 이용하여 오류 역치를 계산하였다.

여기서 A₀는 마스터 서열의 복제 비율 상수이고 A_i≠0는 다른 돌연변이 서열의 전체 평균이다; Q₀₀는 마스터 서열의 완전한 오류 없는 복제에 대한 복제 정확도이다. 이러한 근사값은 식(1)에 있어서 돌연변이로부터 마스터 서열까지의 역돌연변이의 고려를 무시하는 것에 의존한다. 정확한 용액을 지니는 어그리먼트(agreement)는 게놈 크기가 증가할 때 증가한다. 마스터 서열의 상대 고정 농도는 다음과 같은 임계 오류 비율로 사라진다:

여기서 s는 마스터 서열의 선택적인 우위이다. 다양한 복제 작용제를 지니는 불균형 모델에 대한 Q₀₀를 얻기 위해서 본 발명의 발명자들은 각각 상대 농도 c 및 1-c에서 존재하는 두 종류의 중합효소 E₁ 및 E₂를 가정한다. 프루프리딩 중합효소의 오류 비율은 매우 작으며 무시할 수 있다. 따라서 중합효소 E₁은 오류가 없고 q₁=1이며 E₂는 오류-빈발이며 0≤q₂≤1이다. 게놈 평균 오류 비율에 대한 식은 다음과 같다;

오류-빈발 중합효소 E2에 의해 게놈 복제의 확률은 이항 분포로부터 수득된다. 오류-빈발 중합효소 E2에 의한 비오류 확률은 Poisson 근사로부터 수득되며 여기서 게놈 크기는 복제 작용제의 수와 비교하여 매우 큰 것으로 가정한다. 그들을 곱하면 다음과 같은 식을 얻는다:

여기서 a는 게놈 내의 모든 작용제의 수이다. 식 (5)와 (7)을 결합하면 불균형 모델에 대한 오류 역치는 다음과 같다:

도 7은 복제 작용제의 다양한 수에서 오류 없는 중합효소의 상대 농도의 작용으로써 오류 역치를 나타낸다. 균등 모델에 대한 오류 역치(c=0)는 복제 작용제의 수에 의해 영향을 받지 않는다. 불균형 모델(c>0)에 있어서, 오류 없는 중합효소의 임계 농도에서 발생하는 특이성

은 오류 역치의 매우 뚜렷한 증가를 나타낸다. 이것은 c≥c_crit에서 오류 역치가 사라진다는 것을 의미한다. c_crit는 복제 작용제 수가 증가할 때 증가한다.

허용되는 오류 비율은 따라서 식(6) 및 (8)로부터 다음과 같이 수득된다:

c≥c_crit일 때 다음과 같은 두 가지 제약이 있다: (ⅰ) 게놈 크기 n은 한정된다; 및 (ⅱ) 오류-빈발 중합효소는 실제 생물체에서 0이 아닌 정확도 q_min을 지닌다. Escherichia coli의 완전한 프루프리딩-없는 DNA 중합효소의 오류 비율은 1-q_min=10^-5임을 가정한다. 도 8은 E. coli의 파라미터에 기초하여 허용 가능한 오류 비율의 예를 나타낸다. 플롯(plot)은 형태에 있어서 λ 전이와 유사하다. s=10에 대해 E. coli의 m_pms의 최대값은 복제 당 게놈에 대해 31오류가 된다. 이러한 오류 비율은 균등 모델의 오류 역치와 비교하여 충분히 높다(ln(s)=2.3).

본 발명의 발명자들은 무-오류 및 오류-빈발 중합효소가 존재하는 불균형-유전적 다양성 하이브리드 모델을 제공한다. 결과로써 유전적 다양성의 원동력은 오류 비율뿐만 아니라 다른 정확도를 지니는 중합효소의 속도 및 게놈을 변화시키는 복제 작용제의 수에 의해서도 결정된다는 것이 설명되었다. 명백하게 하기 위해 주목할만한 결과는 무-오류 및 오류-빈발 중합효소의 공존은 종래의 균등 모델과 비교할 때 유전적 다양성에 대해 오류 역치를 크게 증가시킬 수 있었다. 본 발명의 이러한 효과는 종래의 기술에 의해서는 밝혀질 수 없었던 것이다.

자연계 내의 많은 생물체들은 끊임없이 변화하는 환경에서 살고 있다. 이것은 숙주 면역 시스템을 피하는 미생물 병원균 및 암 세포에 대해 특히 사실이다. 유익성 돌연변이를 찾아내는 기회는 거리 증가와 함께 돌연변이 및 이로부터 가능한 후보자의 수의 큰 증가 때문에 마스터 서열로부터 Hamming 거리를 증가시킴으로써 증가될 것이다.

오류 비율에서 단순한 상동성 증가는 비록 일시적인 것일지라도 유해성 돌연변이의 적지 않은 손실을 초래한다. 마스터 서열로부터 단거리로 제한되는 돌연변이의 분포 범위의 균등 유전적 다양성의 오류 역치는 아주 작다. 균등 유전적 다양성은 국부적인 낮인 피크로 트랩될 것이고 마스터 서열로부터 먼 더 높은 피크로는 절대로 도달하지 못할 것이다. 균등 유전적 다양성은 한편, 유전적 정도를 읽지 않고 오류 역치를 증가시킬 것이고 이로부터 마스터 서열로부터 증가한 거리를 지니는 많은 유익성 돌연변이를 생산할 것이다. 균등 유전적 다양성은 서열 영역을 가로지르는 긴 거리에 도달할 수 있을 것이고 결국 더 높은 피크를 수득할 수 있을 것이다.

오류-빈발 중합효소의 진행성은 프루프리딩 능력을 지니는 주요 복제 중합효소의 진행성보다 훨씬 낮은 것으로 보여진다. 다수의 복제 작용제를 지니는 불균형 모델은 이러한 관찰을 계산에 넣는다. 이 모델에서 오류는 오류-빈발 중합효소가 관여하는 다양한 복제 작용제의 구역 내에 집중된다. 만약 오류-빈발 복제가 특정 유전자 지역 내로 제한된다면 지역의 오류 비율은 다른 유전자에 대한 손실이 최소한으로 유지될 때 크게 증가한다.

따라서 본 발명에 따르면, 만약 적어도 두 종류 이상의 오류-빈발 빈도에서 성취가 가능한 DNA 복제 작용제(예를 들면, 중합효소)가 생물체에 제공된다면 생물체는 개개의 생물체 평균을 유지하는 동안 종래의 기술과 비교할 때 두드러지게 증가된 진화 속도를 나타낼 수 있다는 것이 설명되었다.

여기에 언급된 모든 환자, 환자 적용, 저널기사 및 다른 참고문헌은 그대로 참고로써 결합되었다.

본 발명은 지금까지 본 발명의 이해를 용이하게 하기 위해 바람직한 실시태양을 참고로 설명되었다. 이하 본 발명은 실시예에 의해 설명될 것이다. 하기의 실시예들은 오직 예시의 목적으로만 제공된다. 따라서 본 발명의 범위는 첨부된 청구범위에 의한 것을 제외하고는 한정되지 않는다.

도 1은 본 발명의 실시예 1의 돌연변이체 및 그의 야생형이 실질적으로 동일한 생장 곡선을 지님을 나타낸다.

도 2는 고온 저항성이 부여된 본 발명의 실시예 1을 나타낸다.

도 3A는 고온 저항성이 부여된 본 발명의 실시예 1의 사진을 나타낸다. 고온에서 생장 가능한 돌연변이 균주는 pol3 돌연변이 균주로부터 분리된다(엑소뉴클레아제가 없는 DNA 중합효소 δ). *표는 모체 균주(AMY128-1) 및 7개의 다른 콜로니가 고온 저항성 균주이다.

도 3B는 고온 저항성이 부여된 본 발명의 실시예 1의 또다른 사진을 나타낸다. 고온에서 생장 가능한 돌연변이 균주는 pol2 돌연변이 균주로부터 분리된다(엑소뉴클레아제가 없는 DNA 중합효소 ε). *표는 모체 균주(AMY2-6) 및 7개의 다른 콜로니가 고온 저항성 균주이다.

도 4A는 고온 저항성이 부여된 본 발명의 실시예 1의 사진을 나타낸다. 화살표는 사멸하고 기포를 지닌 세포를 나타낸다. 고온 저항성 균주 1 및 2는 개별적 실험이 수행되었다. 모체 균주에서 어떠한 세포도 41℃에서 생존할 수 없었다. 본 발명의 방법에 의해 수득된 고온 저항성 균주는 41℃에서 생존할 수 있었다.

도 4B는 고온 저항성이 부여된 본 발명의 실시예 1의 또다른 사진을 나타낸다. 효모가 41℃에서 생존할 수 없을 것으로 여겨진 이러한 고온에서 생장 가능한 돌연변이 균주가 S. cerevisiae의 pol2 돌연변이 균주로부터 분리되었다(엑소뉴클레아제 활성이 없는 DNA 중합효소 ε). 상부는 모체 균주(AMY2-6)를 나타내고 다른 7개 콜로니는 고온 저항성 돌연변이 균주이다.

도 5는 상동성 복제 정확도 및 이질성 복제 정확도를 지닌 유전적 다양성의 예를 나타낸다.

도 6은 오류 재난(error catastrophe)을 나타낸다.

도 7은 다양한 수의 복제 작용제에서 무-오류 중합효소의 상대 농도의 기능으로서 오류 역치를 나타낸다.

도 8은 E. coli의 파라미터에 기반한 허용가능한 오류율의 예를 나타낸다.

도 9는 형질전환 마우스 내로 도입되는 벡터를 개략적으로 나타낸다.

도 10은 외부 유전자를 확인하기 위한 PCR 과정을 나타낸다. 좌측으로부터 mPGK2 Tg로, mPGK2 Tg 없이, Fth117 Tg로, mPGK2 Tg 벡터 및 Bluescript만(대조군) (각각 형질전환 마우스 #1) 및 #2 마우스 Tg 없이, #2 마우스 Tg로, #2Tg 벡터 및 pBluescript(각각 형질전환 마우스 #2). 마커는 우측 말단에 나타난다.

도 11은 마우스 고환 내 Cre 재조합효소(recombinase)의 발현을 나타낸다. a는 mPGK2를 나타내고, b는 Fth117을 나타내고, c는 대조군을 나타낸다. 막대는 50 ㎛를 나타낸다.

도 12는 mPGK2 프로모터에 의한 발현 구역을 나타낸다.

도 13은 Fth117 프로모터에 의한 발현 구역을 나타낸다.

도 14는 타겟팅 벡터를 개략적으로 나타낸다.

도 15는 조직-특이적 재조합 반응을 개략적으로 나타낸다.

도 16은 캘러스를 이용한 선별 방법을 개략적으로 나타낸다.

도 17은 실시예 8에서의 ES 세포에 대한 실험에 이용된 벡터를 개략적으로 나타낸다.

도 18은 Cre 재조합효소를 이용한 재조합(타겟팅) 벡터를 개략적으로 나타낸다.

(서열의 설명)

서열번호 1 : 효모 DNA 중합효소 δ 핵산 서열

서열번호 2 : 효모 DNA 중합효소 δ 아미노산 서열

서열번호 3 : 효모 DNA 중합효소 ε 핵산 서열

서열번호 4 : 효모 DNA 중합효소 ε 아미노산 서열

서열번호 5 : DnaQ 부분 서열 (Escherichia coli)

서열번호 6 : DnaQ 부분 서열 (Haemophilus influenzae)

서열번호 7: DnaQ 부분 서열 (Salmonella typhimurium)

서열번호 8 : DnaQ 부분 서열 (Vibrio cholerae)

서열번호 9 : DnaQ 부분 서열 (Pseudomonas aeruginosa)

서열번호 10 : DnaQ 부분 서열 (Neisseria meningitidis)

서열번호 11 : DnaQ 부분 서열 (Chlamydia trachomatis)

서열번호 12 : DnaQ 부분 서열 (Streptomyces coelicolor)

서열번호 13 : DnaQ 부분 서열 (Shigella flexneri 2a str. 301)

서열번호 14 : PolC 부분 서열 (Staphylococcus aureus)

서열번호 15 : PolC 부분 서열 (Bacillus subtilis)

서열번호 16 : PolC 부분 서열 (Mycoplasma pulmonis)

서열번호 17 : PolC 부분 서열 (Mycoplasma genitalium)

서열번호 18 : PolC 부분 서열 (Mycoplasma pneumoniae)

서열번호 19 : Pol Ⅲ 부분 서열 (Saccharomyces cerevisiae)

서열번호 20 : Pol Ⅱ 부분 서열 (Saccharomyces cerevisiae)

서열번호 21 : Polδ 부분 서열 (마우스)

서열번호 22 : Polε 부분 서열 (마우스)

서열번호 23 : Polδ 부분 서열 (인간)

서열번호 24 : Polε 부분 서열 (인간)

서열번호 25 : Polδ 부분 서열 (쌀)

서열번호 26 : Polδ 부분 서열 (Arabidopsis thaliana)

서열번호 27 : Polε 부분 서열 (Arabidopsis thaliana)

서열번호 28 : Polδ 부분 서열 (래트)

서열번호 29 : Polδ 부분 서열 (소)

서열번호 30 : Polδ 부분 서열 (대두)

서열번호 31 : Polδ 부분 서열 (과일 파리)

서열번호 32 : Polε 부분 서열 (과일 파리)

서열번호 33 : Polδ 효모 변형된 핵산 서열

서열번호 34 : Polδ 효모 변형된 아미노산 서열

서열번호 35 : Polε 효모 변형된 핵산 서열

서열번호 36 : Polε 효모 변형된 아미노산 서열

서열번호 37 : Polδ 전방 프라이머

서열번호 38 : Polδ 역방 프라이머

서열번호 39 : Polε 전방 프라이머

서열번호 40 : Polε 역방 프라이머

서열번호 41 : Escherichia coli DnaQ 핵산 서열

서열번호 42 : Escherichia coli DnaQ 아미노산 서열

서열번호 43 : Bacillus subtilis DnaQ 핵산 서열

서열번호 44 : Bacillus subtilis DnaQ 아미노산 서열

서열번호 45 : Arabidopsis thaliana DnaQ 핵산 서열

서열번호 46 : Arabidopsis thaliana DnaQ 아미노산 서열

서열번호 47 : 쌀 Polδ 핵산 서열

서열번호 48 : 쌀 Polδ 아미노산 서열

서열번호 49 : 대두 Polδ 핵산 서열

서열번호 50 : 대두 Polδ 아미노산 서열

서열번호 51 : 인간 Polδ 핵산 서열

서열번호 52 : 인간 Polδ 아미노산 서열

서열번호 52 : 인간 Polε 핵산 서열

서열번호 54 : 인간 Polε 아미노산 서열

서열번호 55 : 마우스 Polδ 핵산 서열

서열번호 56 : 마우스 Polδ 아미노산 서열

서열번호 57 : 마우스 Polε 핵산 서열

서열번호 58 : 마우스 Polε 아미노산 서열

서열번호 59 : 래트 Polδ 핵산 서열

서열번호 60 : 래트 Polδ 아미노산 서열

서열번호 61 : 소 Polδ 핵산 서열

서열번호 62 : 소 Polδ 아미노산 서열

서열번호 63 : 과일 파리 Polδ 핵산 서열

서열번호 64 : 과일 파리 Polδ 아미노산 서열

서열번호 65 : 과일 파리 Polε 핵산 서열

서열번호 66 : 과일 파리 Polε 아미노산 서열

서열번호 67 : Pold1 유전자의 5'말단 프라이머 SpeI-5' Pold1

서열번호 68 : Pold1 유전자의 3'말단 프라이머 EcoRI-3' Pold1

서열번호 69 : Pold1 유전자 내로 돌연변이를 도입시키기 위한 프라이머 서 열 (실시예 4)

서열번호 70 : Pold1 유전자의 돌연변이 cDNA 서열 (실시예 4)

서열번호 71 : mPGK2의 5' mPGK-sacII 프라이머

서열번호 72 : mPGK2의 3' mPGK-SpeI 프라이머

서열번호 73 : Fth117의 5' Fth117-sacII 프라이머

서열번호 74 : Fth117의 3' Fth117-SpeI 프라이머

서열번호 75 : 형질전환 마우스 #1의 Cre-F 프라이머

서열번호 76 : 형질전환 마우스 #1의 Cre-R 프라이머

서열번호 77 : 형질전환 마우스 #2의 Neo-F 프라이머

서열번호 78 : 형질전환 마우스 #2의 Neo-R 프라이머

서열번호 79 : 실시예 4에서 mRNA의 발현을 확인하기 위한 Neo-F 프라이머

서열번호 80 : 실시예 4에서 mRNA의 발현을 확인하기 위한 Neo-R 프라이머

서열번호 81 : Fth117의 약 5.7 kbp 서열 업스트림

서열번호 82 : Arabidopsis thaliana-유래 polδ를 증폭시키기 위한 Xbal-42120-F

서열번호 83 : Arabidopsis thaliana-유래 polδ를 증폭시키기 위한 2g42120-Sac1-R

서열번호 84 : 돌연변이 polδ 유전자 polδ (D316A)를 증폭시키기 위한 2g42120-D316A-F

서열번호 85 : 돌연변이 polδ 유전자 polδ (D316A)를 증폭시키기 위한 2g42120R

서열번호 86 : 마우스 고환으로부터 유래된 Kozak 서열을 포함한 Poldi 유전자(핵산 서열)

서열번호 87 : 마우스 고환으로부터 유래된 Kozak 서열을 포함한 Poldi 유전자(아미노산 서열)

서열번호 88 : 마우스 polδ 유전자 돌연변이체의 핵산 서열 (D400A)

서열번호 89 : 마우스 polδ 유전자 돌연변이체의 아미노산 서열 (D400A)

서열번호 90 : polδ의 핵산 서열 (At1g42120)

서열번호 91 : polδ의 아미노산 서열 (At1g42120)

서열번호 92 : 돌연변이 polδ 유전자 polδ(D316A) (핵산 서열)

서열번호 93 : 돌연변이 polδ 유전자 polδ(D316A) (아미노산 서열)

서열번호 94 : 455-bp mPGK2 프로모터 단편

서열번호 95 : Fth117 유전자의 5725-bp DNA 단편 업스트림

이후, 본 발명은 실시예에 의해 더욱 상세히 설명한다. 본 발명은 하기의 실시예들로 한정되는 것은 아니다. 하기의 실시예에 사용된 시약, 지지물 등 몇 개를 제외하고는 Sigma(세인트 루이스, 미국), Wako Pure Chemical Industries(오사카, 일본) 등으로부터 이용될 수 있었다. 동물들은 Japanese Universities에 의해 규정된 규칙에 따라 처리되고 테스트되었다.

(실시예 1 : 효모의 약물 내성 균주 및 높은 온도 내성 균주의 제조)

실시예 1에서 효모는 본 발명에 따른 불균형 돌연변이 효모로 조절될 수 있는 유전 형질의 전환율을 설명하기 위해 대표적인 진핵세포 생물체로써 사용되었다.

번식의 범위에 대한 불균형 돌연변이의 유용성을 확인하기 위해 약물 내성 및/또는 높은 온도 내성을 지니는 효모가 제조되었다.

돌연변이는 프루프리딩 기능을 조절하기 위해 DNA 중합효소 δ 및 DNA 중합효소 ε에 변이가 도입되었다(Alan Morrison & Akio Sungino, Mol. Gen. Genet. (1994) 242:289-296).

(원료)

본 실시예에서는 대상물질로써 효모(Saccharomyces cerevisiae)를 이용하였다. 정상 균주로써 AMY 52-3D : MATα, ura-52 leu2-1 ade2-1 his1-7 home-10 trp1-289 canR(Sugino 박사로부터 수득됨(오사카대학))이 이용되었다. 그 제조 방법은 다음과 같다.

효모의 정상 균주로써 ATCC(American Type Culture Collection으로부터 MYA-868(CG378)을 입수하였다.

오류-빈발 빈도는 DNA 중합효소 δ또는 ε의 프루프리딩 기능을 변화시키는 것에 의해 조절되었다. 프루프리딩 기능은 DNA 중합효소 δ또는 ε의 프루프리딩 부분에서 삭제부분을 지니는 불균형 돌연변이 균주를 제조하는 것에 의해 변화되었다. 돌연변이 균주를 제조하기 위해, 자리-특이적 돌연변이 유발이 일반적인 기술(Sambrook et al., Molecular Cloning: A Laboratory Manual, Ver. 2, Cold Spring Harbor Laboratory(Cold Spring Harbor. N. Y., 1989), supra)을 이용하여 정상 균주(Morrison A. & Gugino A., Mol. Gen. Gene. (1994)242:289-296)의 DNA 중합효소 δ또는 ε의 특정 부위에서 염기 치환을 수행하기 위해 사용되었다. 특히 전환이 수행되었다: polδ에서 322(D)->(A) 및 324(E)->(A); 및 polε에서 291(D)->(A) 및 293(E)->(A). 이러한 돌연변이는 DNA 중합효소 δ돌연변이 균주(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR; Sugino 교수로부터 수득됨(오사카 대학)) 및 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR; Sugino 교수로부터 수득됨(오사카 대학)). 이러한 균주의 당량은 polδ에서 322(D)->(A) 및 324(E)->(A); 및 polε에서 291(D)->(A) 및 293(E)->(A)와 같은 돌연변이를 도입하여 자리 특이적 돌연변이 유발을 이용하여 당분야의 기술을 이용하여 제조될 수 있다고 이해될 수 있다.

(약물 내성 균주의 제조방법)

상기 언급한 세 개의 균주는 완전한 배지(YPD 배지: 효모 추출물 10 g(Difco), BactoPepton 20 g(Difco) 및 포도당 20 g(Wako))를 함유한 한천 배지 배양기로 플레이트되었다. 5개의 단일 콜로니는 각 균주에 대해 임의로 수집되었다. 균주는 YPD 용액 배지 3 ml 내로 주입되었고 최종 농도가 1 x 10⁶이 될 때까지 30℃에서 진탕 배양하였다.

이것들을 1 mg/L의 사이클로헥시마이드(Sigma, St. Louis, MO, USA)를 함유한 YPD 평판 배양지에 희석하였다. 대조로써 약제를 포함하지 않는 YPD 평판 배양지에 주입하였다. 균주는 2일간 30℃으로 배양되었다. 수득된 콜로니수를 세었다.

(고온 내성 균주를 수득하는 방법)

상기 3 균주는 단일 콜로니로부터 액체 배양에서 점차 배양 온도를 올려 가 며 순화 배지에 옮겨졌다. 순화 배지 프로토콜은 다음과 같다;

37℃, 2일 -> 28℃, 1일 -> 38℃, 2일 -> 28℃, 1일 -> 39℃, 2일 -> 28℃, 1일 -> 40℃, 2일 -> 28℃, 1일; 마지막 배양은 냉장 보존("순화된 배지Ⅱ")

(생장곡선의 측정)

완전 액체 배양기(YPD) 안에서 진탕 배양하다. 생장(즉, 세포 밀도)의 측정은 530nm의 흡광도(OD)를 지표로 하여 측정하였다. 흡광도는 분광 광도계(Hitachi)를 이용해 측정하였다. 정상 균주 및 약제 내성 돌연변이의 생장 곡선을 위한 실험은 38.5℃에서 고온 내성 균주가 테스트되는 동안 생장 곡선을 수득하기 위해 28℃에서 테스트되었다.

(약제 저항서 균주의 결과)

약제를 포함하지 않는 배양지에서 증식시키는 동안에 사이클로헥시마이드 내성균이 DNA 중합효소 δ및 DNA 중합효소 ε 돌연변이에서는 나타났지만 야생형에서는 나타나지 않았다.

사이클로헥시마이드-내성 콜로니의 수

	콜로니의 수*					평균*
polδ	60	81	81	111	744	215
polε	3	39	138	0	0	36
WT	0	0	0	0	0	0

* 단위: x 10⁶

polδ 돌연변이로부터 수득될 수 있는 내성 균주는 10 mg/L의 사이클로헥시마이드까지 생장할 수 가 있다는 것을 관찰하였다.

야생형과 돌연변이의 생장 특성을 비교했지만 증식률에 차이는 없었다(표 2 및 도면 1 참조).

polδ 및 polε돌연변이의 생장 곡선

생장 시간	polδ	polε	WT
0	0.13	0.13	0.13
2	0.9	0.8	0.9
4	2.2	2.1	2.1
6	4.1	4.0	4.1
8	5.9	5.7	6.0
10	7.9	7.8	8.1
12	10.5	10.8	11.1
22	20.1	19.8	21.7
32	19.6	19.5	20.3
44	18.9	19.2	19.8

(시간) OD: 530nm

(고온 내성 균주의 결과)

순응된 배지는 40℃에서 2일간 배양되었고 그 후 한천 배양 배지에 주입해 38.5℃에서 배양하였다. 어미 균주는 고온에서는 완전히 생장할 수 없지만 돌연변이는 생존하는 것을 확인하였다(도 3A 및 3B9사진) 참조).

야생형 균주 및 돌연변이의 고온 하에서의 생장 특성을 비교하였다. 야생형 균주에서는 증식의 정지가 확인되었다(표 3 및 도 2 참조).

또한 순응된 배양은 41℃에서 계속되었다. 그 결과로써 41℃에서 생장 가능한 돌연변이가 발생한 것이 확인되었다(도 4A 및 4B).

고온 내성 균주의 생장 곡선

생장시간	클론 1	클론 2	WT
0	0.131	0.125	0.134
2	0.154	0.174	0.177
4	0.203	0.227	0.264
6	0.258	0.314	0.327
8	0.327	0.447	0.365
10	0.462	0.6	0.358
12	0.93	1.12	0.352
22	1.463	1.486	0.346

(시간) OD: 530nm

클론 1: polδ로부터 유래된 내성 균주

클론 2: polε로부터 유래된 내성 균주

효모는 E. coli와 같은 그람-음성 박테리아와는 다른 유전자 복제 메커니즘을 지닌다. 따라서 효모의 오류-빈발 빈도가 본 발명에 따른 유전 형질의 전환율을 조절하는 것에 의해 생물체의 생존에 영향을 주는 일 없이 실시할 수 있는지는 불명확했었다.

실시예 1에서, 진핵세포 생물체인 효모에서도 오류-빈발 빈도 조절에 의한 유전 형질의 전환율의 조절에 의해 그 생존에 영향을 주는 일 없이 생물의 유전 형질의 전환율을 조절할 수가 있는 것이 설명되었다.

(실시예 2: 플라스미드를 이용한 돌연변이 도입)

실시예 2에서는 플라스미드 벡터("불균형 돌연변이 유발 플라스미드")를 이용한 진핵세포 생물체에의 유전 형질의 전환율의 조절이 가능하다는 것을 설명하였다.

프루프리딩 기능은 실시예 1과 같이 DNA 중합효소 δ 및 DNA 중합효소 ε의 프루프리딩 기능(Alan　Morrison & Akio　Sugino, Mol.　Gen.　Genet.(1994) 242：289-296)내로 돌연변이를 도입하는 것에 의해 조절되었다.

돌연변이 DNA 중합효소(pol) δ 또는 DNA 중합효소 ε의 발현이 가능한 플라스미드 벡터가 도입되었다. 효모 세포는 돌연변이 세포를 생성하기 위한 벡터로 트랜스펙션에 의해 형질전환되었다. 돌연변이는 사이클로헥시마이드 등의 약제를 포함한 평판 배양기에서 배양하였다. 나타난 약제 내성 콜로니의수를 세었다.

(원료)

실시예 2에서는 효모(Saccharomyces cerevisiae)는 목적 생물체로써 사용되었다. 정상 균주로써 AMY52-3D : MATα, ura3-52 leu2-1 ade2-1 his1-7 home3-10 trp1-289 canR(ATCC, supra)가 사용되었다. 효모의 오류-빈발 빈도는 야생형 정상 균주 내로 돌연변이 DNA 중합효소 δ 또는 ε를 도입하는 것에 의해 조절되었다.

돌연변이 DNA 중합효소 δ 또는 ε를 인코딩하는 서열은 실시예 1에서 사용된 것과 같이 DNA 중합효소 δ(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR) 또는 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR) 돌연변이 균주를 이용하여 생산되었다.

플라스미드 벡터는 각각 돌연변이 DNA 중합효소 δ 및 ε를 인코딩하는 프로모터 Gal 및 핵산 서열을 포함한다. 핵산 서열은 효과적으로 프로모터에 연결되었다.

(방법)

(벡터의 제조)

이미 기술한 Sambrook, J., et al.(supra)과 같은 분자생물학적 기술이 여기에 사용되었다. polδ 및 polε 돌연변이 균주의 pol 부위(DNA 중합효소 δ 돌연변이 균주(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR) 및 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR)는 PCR에 의해 증폭되었고 polδ 및 polε 는 회수되었다. pol 부위의 회수를 위해 사용된 프라이머의 서열은 다음과 같다.

polδ(전):

서열번호 37: 5'- CCCGAGCTCATGAGTGAAAAAAGATCCCTT - '3 (δ);

pol 3 (역):

서열번호 38: 5'- CCCGCGGCCGCTTACCATTTGCTTAATTGT - '3 (δ);

polε(전):

서열번호 39: 5'- CCCGAGCTCATGATGTTTGGCAAGAAAAAA - '3(ε); 및

pol2 (역):

서열번호 40: 5'- CCCGCGGCCGCTCATATGGTCAAATCAGCA - '3(ε).

PCR 생성물은 GAL 프로모터를 지니는 벡터 내로 혼합된다.

(형질전환)

정상 효모 계통은 인산칼륨법을 이용하여 플라스미드 벡터로 트랜드펙트된다.

(돌연변이 도입)

형질전환된 효모는 진탕하며 48∼72시간 동안 28℃에서 갈락토스를 함유한 액체 배지에서 배양되었다.

(약제 내성의 확인)

세포는 24시간 동안 28℃에서 사이클로헥시마이드를 함유한 평판 배지(갈락토스로 채워진) 에서 배양되었다.

(결과)

DNA 중합효소 δ 및 DNA 중합효소 ε 돌연변이 중에서 사이클로헥시마이드 내성 박테리아는 세포가 어떠한 약제도 없이 배지에서 생장되는 동안 나타났지만 야생형 중에서는 나타나지 않았다.

(실시예 3: 동물로써 마우스 등을 포함하는 돌연변이 생물체의 제조)

실시예 3에서, 마우스(동물)는 불균등 돌연변이 생물체를 생산하기 위한 대표적인 진핵세포 생물체로써 이용되었다.

이질성 DNA 복제 프루프리딩 능력을 지닌 복제 복합체를 지니는 마우스는 유전자 타겟팅 기술을 이용하여 제조되었다.

복제 프루프리딩 기능은 DNA 중합효소 δ(서열번호 55(핵산 서열) 및 56(아미노산 서열)) 및/또는 DNA 중합효소 ε(서열번호 57(핵산 서열) 및 589아미노산 서열))의 프루프리딩 기능을 조절하는 것에 의해 조절되었다. 돌연변이는 다음과 같이 수행되었다: polδ에서, 315(D)->(A), 317(E)->(A); 및 polε에서 275(D)->(A), 277(E)->(A).

(유전자 타겟팅 기술)

유전자 타겟팅 기술은 예를 들면 Yagi T. et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명되어 있다. 돌연변이 pol을 지니는 타겟팅 벡터를 이용하여 상동성 재조합 마우스 ES 세포가 생성되었다.

재조합 ES 세포는 마우스 초기 배아에 도입되어 배반포를 형성하였다. 배반포는 가임신 마우스에 이식되어 키메라 마우스를 생성하였다.

키메라 마우스는 이종 교배되었다. 돌연변이가 도입된 생식 세포를 지니는 마우스가 선택되었다. 이종 교배는 상동성 돌연변이를 지니는 마우스가 수득될 때까지 계속되었다.

실시예 3에서 목적하는 것의 특성은 암의 징후의 척도로써 선택되었다.

(프로토콜)

(1. ES 세포의 제조)

배아 내의 세포 덩어리로부터 준비된 마우스 ES 세포(일본 쿠마모토 쿠마모토 대학 동물 자원 개발 연구 센터에서 입수 가능)는 5% CO₂ 내 37℃에서 20∼30% 소태아혈청으로 채워진 DMEM(Dulbeccos' Modified Eagle Medium) 내에서 공급자 세포를 이용하여 배양되었다.

공급자 세포는 예를 들면 "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명된 기술을 이용하여 준비되었다. 공급자 세포는 마우스 태아 섬유아세포의 일차 배양으로부터 수득되었다.

(2. 타겟팅 벡터를 이용한 pol 유전자의 상동성 재조합)

타겟팅 벡터는 효율적으로 상동성 재조합 ES 세포를 수득하기 위해 양성/음성법(Evans, M.J., Kaufman, M.H., Nature, 292, 154-156(198))에 의해 준비되었다.

타겟팅 벡터의 제조: 타겟팅 벡터는 예를 들면 Molecular Cloning, 2nd edition, Sambrook, J., et al, supra 및 Ausubel, F.M., Current Protocols in Molecular Biology, Green Publishing Associates and Wiley-Interscience, NY, 1987, supra에 설명된 기술에 의해 준비되었다.

타겟팅 벡터에 있어서 돌연변이 polδ 및/또는 polε 유전자는 양성 유전자와 음성 유전자 사이에 삽입되었다. 네오마이신 내성 유전자는 디프테리아 독소가 음성 유전자로써 사용되는 동안 양성 유전자로써 사용되었다.

pol 돌연변이에 대해 일-염기 돌연변이는 프루프리딩 활성을 제거하기 위해 polδ 및 polε 모두의 프루프리딩 활성 부위(서열번호 55 및 56(δ); 서열번호 57 및 58(ε)) 내로 도입되었다: polδ 내, 315(D)->(A), 317(E)->(A); 및 polε 내, 275(D)->(A), 277(E)->(A)(Morrison A. & Sugino A., Mol. Gen. Genet. 242:289-296, 1994; Goldsby R.E., et al., Proc. Natil. Acad. Sci. USA, 99:15560-15565, 2002)

(3. ES 세포 내로 벡터의 도입)

벡터는 전기 천공법에 의해 ES 세포 내로 도입되었다. 배양은 G418을 함유한 DMEM 배지(Flow Laboratory)를 이용하여 수행되었다(Sigma, St. Louis, MO, USA).

(4. ES 세포 재조합의 복구)

G418 존재에서 배양 후, 나타난 콜로니는 평판(DMEM 배지; Flow Laboratory)으로 옮겨졌다.

(5. 상동성 재조합의 확인)

게놈 DNA는 ES 세포로부터 추출되었다. 돌연변이 pol이 ES 세로 내로 도입되었는지 아닌지는 서던 블럿팅 및/또는 PCR에 의해 결정되었다.

(6. 키메라 마우스의 제조 - 배아 내로 재조합 ES 세포의 도입)

상기-설명된 재조합 세포는 미량 주사법으로 배반포 내로 도입된다. 배반포로써 ES 세포와 다른 숙주 마우스 배아가 예를 들면 "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명된 일반적인 방법으로 선택되었다.

(7. 키메라 마우스의 도입 - 가임신 마우스에의 배아 이식)

ES 세포가 129-주 마우스로부터 유래한 경우는 C57BL/6마우스의 척추 동물의 배반포 내에 주입된다. ES 세포가 TT-2 세포인 경우는 ICR 마우스의 8-세포기 배아에 주입해 가임신 마우스를 제조한다. ES 세포를 주입한 마우스 배아는 수양 부모의 자궁내 또는 난관내에 각각 이식을 실시해 키메라 마우스를 탄생시켰다.

(8. 키메라 마우스의 도입 - 마우스의 이종 교배)

키메라 마우스는 이종 교배되었다. 돌연변이 pol가 목적대로 생식 세포에 도입됐는지 아닌지는 PCR법 및/또는 DNA 시퀀싱에 의해 결정되었다. 이종 교배는 상동성 돌연변이 pol이 생성될 때까지 계속되었다.

(결과)

실시예 3에서 준비된 마우스로부터 암을 지니는 마우스가 선택되었다. 마우스는 종래의 기술과는 비교가 되지 않는 정도의 속도로 암을 자연스럽게 발생한 모델을 제공했다. 변형된 세포는 자연-발생 세포와 실질적으로 동일한 생장 속도를 지닌다. 그러나 변형된 세포의 돌연변이 비율은 발생 당 둘 또는 그 이상이고 이는 종래의 돌연변이와는 현저히 다른 것이다.

(다른 형질)

유사하게 당뇨병, 고혈압, 동맥 경화, 비만, 치매, 신경장애 등에 대한 선별을 수행하였다. 이러한 질병의 발병은 비율이 극도로 높아지고 있지만 본 발명은 각각의 증상을 자연스럽게 발생한 모델을 제공할 수가 있다. 따라서 본 발명의 방법은 동물에 있어도 적용이 가능할 것이다.

(다른 동물들)

다음으로, 모델로써 래트를 이용하여 유사한 실험이 수행되었다. 암의 래트 모델은 polδ(서열 번호 60의 아미노산 서열에 대해 315 위치 및 317 위의 D 및 E를 알라닌으로 한다)내로 돌연변이를 도입하는 것에 의해 신속히 준비될 수 있다.

(실시예 4: 다른 과정을 이용한 돌연변이 생물체의 도입)

다음으로 또다른 마우스 모델이 돌연변이 생물체가 도입되었는지 아닌지를 결정하기 위해 이용되었다. 그 과정을 아래에 설명한다.

(재료 및 방법)

<Pldl의 cDNA 준비>

mRNA는 TRIzol 시약(Invitrogen)을 이용하여 4-주된 신생아 C57BL/6 마우스(Charles River Japan)의 고환으로부터 추출되었다. 마우스 고환의 총 cDNA는 SuperScript Ⅲ 및 Oligo-dT 프라이머를 이용하여 추출된 mRNA의 역전사에 의해 제조되었다. 총 cDNA로 Poldl 유전자의 cDNA 단편이 Kozak 서열을 포함하도록 고안된 Poldl 유전자의 5'-말단 프라이머, SpeI-5'Poldl(GACTAGTGGCTATCTTGTGGCGGGAA)(서열번호 67) 및 3'말단 프라이머, EcoRI-3'Poldl(GGAATTCCTTGTCCCGTGTCAGGTCA)(서열번호 68)을 이용한 PCR에 의해 증폭되었다. 이러한 방법에서 야생형 Poldl의 cDNA가 수득되었다. 돌연변이(D400A)는 Poldl 유전자(서열번호 88(핵산 서열) 및 서열번호 89(아미노산 서열))로부터 3'-5' 엑소뉴클레아제 활성을 제거하기 위해 cDNA 내로 도입되었다. 이것을 성취하기 위해 프라이머 서열(CAGAACTTTGCCCTCCCATACCTC)(서열번호 69) 및 거기에 프라이머 상보를 도입한 돌연변이는 Poldl 돌연변이의 cDNA를 생성하기 위해 PCR 라이게이션을 필요로 한다. cDNA의 총-길이의 서열은 ABI3100 시퀀서(Biosystems, CA, USA 제공)에 의해 읽혀지고 동일한 서열을 찾기 위해 데이터베이스와 비교되었다. 이 cDNA는 모든 실험에 사용되었다. 야생형 및 돌연변이형 Poldl cDNAs를 준비하기 위한 PCR은 KOD DNA 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).

<프로모터 서열의 클로닝>

mPGK2의 mPGK2 프로모터 단편(서열번호 94): 455-염기쌍은 C57BL/6 마우스의 게놈 DNA의 5'mPGK2-sacⅡ 프라이머(TCCCCGCGGCTGCAGAGGATTTTCCACAG)(서열번호 71) 및 3'mPGK2-SpeI 프라이머(GGACTAGTATGGTATGCACAACAGCCTC)(서얼변호 72)를 이용하는 것에 의해 클론되었다. PCR은 KOD DNA 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).

Fthl17의 업스트림(upstream) 서열인 DNA 단편(서열번호 95): 5725-염기쌍은 5' Fthl17-sacⅡ 프라이머(TCCCCGCGGAGTGGTTGTGGGAGACTTAC)(서열번호 73) 및 3' Fthl17-SpeI 프라이머(GGACTAGTCAGTCCCACAGTCCCAAAGT)(서열번호 74)를 이용하는 것에 의해 클론되었다. PCR은 LA Taq 중합효소(TAKARA) 및 GC 버퍼(제조업자에의 해 제공)를 이용하여 수행되었다.

<형질전환 마우스의 제조>

형질전환 마우스의 도입을 위해 준비된 벡터 DNA(2ng/㎕)는 미세조작기구를 이용하여 C57B/6의 수정란의 전핵 내로 주입되었다. 유전자가 도입된 수정란 중에서 2-세포기(다음 날) 내의 배아가 가임신한 암컷 ICR 마우스의 난관 내로 이식되어 형질전환 마우스가 제조되었다.

<유전자 전이의 존재 또는 부재의 확인>

마우스의 꼬리는 작은 조각으로 잘려져 차례로 단백질 가수분해 효소 K를 함유한 가용성 완충액(50mM 트리스-HCl, 10mM EDTA, 200mM NaCl, 1% SDS) 내에 놓아두고 55℃에서 하룻밤 동안 인큐베이트하였다. 그 후 마우스의 게놈 DNA는 페놀/클로로포름 추출 및 에탄올 침전을 두 번 수행하는 것에 의해 준비되었다. 각 마우스의 게놈 DNA에 대해 유전자 전이의 존재 또는 부재는 Cre-F 프라이머(CTGAGAGTGATGAGGTTC)(서열번호 75)와 Cre-R 프라이머(CTAATCGCCATCTTCCAGCAG)(서열번호 76)를 이용하는 유전자 전이 마우스 #1 및 Neo-F 프라이머(GCTCGACGTTGTCACTGAAG)(서열번호 77)와 Neo-R 프라이머(CCAACGCTATGTCCTGATAG)(서열번호 78)유전자 전이 마우스 #2에 대한 PCR에 의해 결정되었다. PCR은 Ex-Taq 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).

<면역검색법>

mPGK2(출생 후 14주) 및 Fthl17(출생 후 13주)의 F₀-발생 유전자 전이 마우스가 실험에 사용되었다. 마우스는 Nembutla(50 mg/ml, Dainippon Pharmaceutical)로 마취되었고 복부 절개가 수행되었다. 처음으로 하나 또는 두 개의 부고환을 잘라내었다. 그 후 마우스는 4% 파라포름알데하이드로 관류 고정되었다. 두 개의 부고환은 추출되었고 4% 파라포름알데하이드에 4시간 동안 담구어졌다. 부고환은 PBS(수용액 내 NaCl 8 g, Na₂HPO₄ 1.15 g. KCl 0.2 g 및 KH₂PO₄ 0.2 g; 최종 부피: 1 L)로 간단히 세척되어 20% 인산자당 완충액(0.1M 인산(나트륨) 완충액(pH 7.3), 20% 자당)에 4℃에서 하룻밤동안 담구어 졌다. 그 후 조직은 OCT 혼합물(Tissue-Tek, Sakura Fineteck Japan)에 담구어 졌고 즉시 냉각되었다. 조직은 자온 유지 장치를 이용하여 5-㎛ 두께로 얇게 절단되었다. 얇게 절단된 부분은 20% Blocking One(Nacali Tesque) 및 0.05% Tween20을 함유한 PBS 내에서 인큐베이트되었다. 그 후 얇게 절단된 부분은 4000배 희석된 마우스 항-Cre 재조합 단일클론 항체(MAB3120, Chemicon)와 인큐베이트되었다. 두 번째 항체로써 비오틴화된 항-마우스 IgG 항체(Vector Laboratories Inc,)가 이용되었다. 발색 현상은 3,3-디아미노벤지딘(diaminobenzidien, DAB)(Dojindo Laboratories) 및 퍼옥시다제(Nacali Tesque)를 이용하여 수행되었다. DAB로 발색 현상 후 비교 염색은 메틸그린(Merck)을 이용하여 수행되었다.

<인공 수정>

임신한 암컷 말의 혈청 성선자극호르몬(PMSG)(CALBIOCHEM)은 암컷 C57BL/6 마우스(Charles River Japan)(마우스 당 5 IU) 내로 내부복막으로 주입되었다. 46 내지 48시간 후 인간 융모막 성선자극호르몬(hCG)(Teikohu Hormone MFG.)은 PMSG와 유사하게 마우스(마우스 당 5 IU) 내로 내부복막으로 주입되었다. 12시간 후 마우스는 경추탈골에 의해 안락사 되었고 난(egg) 덩어리는 추출되었다. 추출된 난은 0.3mg/ml 히알루로니다아제(hyaluronidase)(SIGMA)을 함유한 M2 배지에서 37℃에서 10분간 인큐베이트되었고 수정되지 않은 난이 수집되었다. 부고환은 관류 고정 전에 면역검색법에 대해 사용된 mPGK2 및 Fthl17의 형질전환 마우스로부터 추출되었다. 혈청은 부고환의 꼬리 부분으로부터 수집되었다. 수집된 정자는 5% CO₂ 인큐베이터 내 37℃에서 TYH 배지(인비트로 수정 배지)에 놓여져 활성화되었다. 그 후 정자는 수정되지 않은 난을 함유한 TYH 배지로 첨가되었다. 혼합물은 6시간 동안 동일한 5% CO₂ 인큐베이터 내에 있도록 하였다. 그 후 난은 세척되어 배아 배양 배지 WM으로 옮겨져 5% CO₂ 인큐베이터 내에서 37℃에서 하룻밤 동안 인큐베이션 되었다. 다음날 2-세포기에서 오직 난만이 가임신한 ICR 마우스의 난관 내로 이식되었다.

<mRNA를 이용한 유전자 발현의 확인>

TRIzol 시약(Invitrogen)이 형질전환 마우스 #2의 꼬리로부터 mRNA를 추출하기 위해 사용되어다. cDNA는 SuperScript Ⅲ(Invitrogen) 및 Oligi-dT 프라이머를 이용하여 추출된 mRNA의 역전사를 이용하여 수득되었고 Neo-F 프라이머(GCTCGACGTTGTCACTGAAG)(서열번호 79) 및 Neo-R 프라이머(CCAACGCTATGTCCTGATAG)(서열번호 80)을 이용하여 PCR되었다. 이것에 의해 mRNA 발현의 존재 또는 부재가 결정되어다. PCR은 Ex-Taq 중합효소를 이용하여 수행되었다(TAKARA).

타겟팅 벡터(도 18)로써 lox66과 lox71 사이의 지역의 서열은 pBluescriptⅡ 위에 생성되었다. 생성된 벡터 200 ng은 실온에서 2시간 동안 1 mg/ml BSA의 존재 하에 Cre 반응 완충액(BD Biosciences) 내 Cre 재조합 효소(BD Biosciences)와 반응되었다. 반응 후, Cre 재조합 효소를 비활성화하기 위해 70℃에서 5분간 인큐베이션이 수행되었다. 반응 용액은 컴페턴트(competent) 세포 내로 세포를 형질전환시키기 위해 열충격(heat shock)이 필요하였다. 형질전환된 세포는 LB-Amp 평판(1.5% 한천 분말(Nacali Tesque)이 LB 배지에 첨가되고 오토클레이브(autoclave)된 후 100 ㎍/ml 암피실린(SIGMA)으로 채워졌다)위에 플레이트되었다. 그 다음날 콜로니는 채취되었다. 콜로니는 LB-Amp 배지에서 배양되어 플라스미드가 추출되었다. 재조합은 ABI 시퀀서 3100을 이용하여 플라스미스를 시퀀싱한 결과에 기초해 확인되었다.

형질전환 마우스 생산의 목적은 진화의 속도가 정자형성 단계에 특이적인 돌연변이-형 Poldl의 과발현에 의해 조절될 수 있는지 아닌지를 결정하는 것이다.

또한 Cre 재조합의 발현에 의해 정자형성 단계에 특이적인 발현이 loxP 서열을 지니는 마우스 내에서 조절될 수 있다는 것이 고려된다. 따라서 두 개의 형질전환 마우스를 생산하기 위한 시도가 행해졌다: 정자형성 단계에서 명확하게 돌연변이-형 Poldl와 Cre 재조합 모두를 발현할 수 있는 형질전환 마우스 #1 및 loxP 서열을 이용하는 것에 의해 돌연변이-형 Poldl의 조직-특이적 과발현을 하게 하는 형질전환 마우스 #2(도 9).

(a) 형질전환 마우스 #1

형질전환 마우스 #1은 정자형성 단계에서 명확하게 돌연변이-형 Poldl와 Cre 재조합의 발현을 이끌어 낸다. 이러한 마우스를 생산하기 위해 정자형성 단계에서 유전자 발현을 이끌어내는 프로모터를 선택하는 것이 중요하다. 마우스의 고환에서 DNA 중합효소 δ는 정원세포 단계에서 발현되고 초기의 정모세포 단계부터 감수분열 전기까지 발현된다는 것이 제안되어 왔다(Dia Kamel, et al.,(1997) Biology of Reproduction, 57, 1367-1374).

따라서 정원세포 단계 또는 초기의 정모세포 단계에서 발현을 이끌어 내는 프로모터를 이용하는 것은 이해되었다. mPGK2(mouse phosphoglycerate kinase 2) 유전자 프로모터는 초기의 정모세포의 과발현을 위해 종종 사용된다(Nadia A. Higgy, et al.,(1995) Dev. Genetics, 16, 190-200). mPGK2 프로모터는 정자형성 단계에서 명확하게 발현을 이끌어 내는 프로모터에 대한 후보자로써 사용되었다. 또한 mPGK2 프로모터 보다 더 먼저 정자형성의 정원세포 단계에서 발현을 촉진하는 프로모터를 이용하는 것도 이해되었다. 그러나 정원세포 단계 또는 초기의 정모세포 단계에 대해 특이적인 발현이 실질적으로 가능한 프로모터는 없다는 것이 보고되어 왔다. 따라서 PCR에 의해 정원세포에서 명확하게 발현하는 것으로 알려진 유전자의 서열 업스트림을 클로닝하는 것에 의해 정자형성 단계에 대해 특이적인 신규한 프로모터를 개발하기 위한 시도가 행해졌다. 정원세포에서 특이적으로 발현하고 cDNA 서브트랙션법(subtracton method)(P. Jeremy Wang, et al., (2001), Nature genetics, 27, 422-426)에 의해 발견된 유전자 중에서 Fthl117(Ferritin heavy polypeptide-like 17) 유전자가 선택되었다. 유전자의 업스트림에 위치한 약 5.7kbp(서열번호 81)의 서열은 정원세포 단계에서 명확하게 발현하는 프로모터로써 이용되었다. 상기-설명된 정자형성 단계에 대해 특이적인 두 개의 프로모터는 형질전환 마우스 #1에 대한 벡터를 제조하기 위해 이용되었다. 도 9는 실제로 제조된 벡터를 개략적으로 보여준다. 돌연변이-형 Poldl 유전자와 Cre 재조합이 IRES(internal ribosome entry site)의 서열을 거쳐 연결된 벡터는 제조되었고 유전자는 정자형성 단계에서 명확하게 발현을 이끌어내지는 것이 예상된 프로모터에 의해 동시에 발현되었다.

생성된 벡터의 DNA의 형질전환 마우스를 생산하기 위해 수정란의 전핵 내로 미량주사되었다. 막 태어난 마우스내의 형질전환 유전자의 존재 또는 부재는 Cre 재조합에 대해 특이적인 프라이머를 이용한 PCR에 의해 결정되었다(도 10). 그 결과로써 mPGK2 프로모터(46마리 신생 마우스에서)에 대한 형질전환 마우스의 2개의 라인이 있었던 반면 Fthl17의 업스트림 서열에 대한 형질전환 마우스의 라인은 1개였다. 막 태어난 형질전환 마우스는 그들의 외양으로는 정상 마우스와 구별할 수 없었다. 프로모터의 발현 부위를 분석하기 위해 mPGK2(출생 후 14주) 및 Tfhl17(출생 후 13주 )의 F₀ 발생에서 형질전환 마우스의 고환이 추출되어 마우스 항-Cre 재조합 단일클론 항체를 이용하여 면역검색되었다(도 11). 도 11에서 DAB는 두 번째 항체의 발색 현상(블랙 브라운)에 대해 이용되었고 세포 내 염색 RNA 존재(블루 그린)에 대해 메틸 그린으로 염색된 것과 비교되었다. 대조군에서도 세뇨관의 바닥판에서 강한 블랙 브라운 발색 현상이 관찰되었다. 이러한 것의 배경은 첫 번째 항체가 마우스의 것이기 때문이다. 이러한 면역검색법의 결과에서 세뇨관 내의 블랙 브라운 발색 현상은 외래 Cre 재조합의 발현 부위를 나타낸다. 도 11에 따라 Cre 재조합은 mPGK2 프로모터를 이용한 형질전환 마우스와 Fthl17 서열 업스트림을 이용한 형질전환 마우스 모두의 고환의 세뇨관 내에서 발현되었다는 것이 확인되었다. 따라서 Fthl17 5.7-kbp 부위 서열 업스트림은 프모모터 활성을 지닌다는 가능성을 제안하였다. 또한 발색 현상은 mPGK2 프로모터가 사용되었을 때보다 Fthl17 서열 업스트림을 이용한 형질전환 마우스의 고환에서 Cre 재조합 염색의 결과에서 더 약했었다. 따라서 Fthl17의 서열 업스트림은 mPGK2 프로모터보다 더 낮은 프로모터 활성(발현 능력)을 지니는 다는 것이 제안된다. Russel et al.은 마우스, 래트, 개의 고환의 조직학적 분석을 이끌어냈고 서로로부터 정자형성의 단계를 구별하기 위해 표준을 요약하였다(Russell LD, Ettlin RA, Hikim APS, Cleggand ED.(1990), Histological and Histopathologicla Evaluation of Testis., Clearwaer, FL: Cache River Press). 이것에 따라 형질전환 마우스 #1의 염색 이미지에서 발현된 상기-설명된 두 개의 프로모터의 정자형성이 어떤 단계에서 결정되는 지를 결정하기 위해 한층 더 분석이 수행되었다. mPGK2 프로모터의 경우 발현은 주로 초기의 정모세포의 두 번째 단계에서 관찰되었다(도 12). 이 발현은 종래에 고려됐던 부위와는 다른 부위에서 관찰되었다. Fthl17의 서열 업스트림이 프로모터로써 사용된 경우에 발현은 초기의 정모세포 단계부터 정원세포 단계까지 관찰되었다(도 13). 염색의 결과에 따라 배경(염색된 바닥판)으로부터 정원세포 내 발현을 구별하기는 어려웠고 따라서 발현의 존재 또는 부재를 결정될 수 없었다.

상기-설명된 막 태어난 F₀ 발생은 mPGK2 프로모터(수컷 1, 암컷 1)를 이용한 형질전환 마우스와 Fthl17(수컷 1)의 서열 업스트림을 이용한 형질전환 마우스를 포함한다. 각 수컷의 고환은 면역검사법에 대한 샘플로써 사용되었다. 면역검사법에 대해 사용된 F₀ 발생 수컷은 출생 후 9주부터 복제에 대한 교미를 시작하였다. 실제 교미의 결과를 표 4(A)에 요약하였다.

	교미된 암컷의 수	임신한 암컷의 후	임신율
mPGK2	10	0	0%
Fthl17	10	6	60%

표 4(A)에서 복부가 커진 암컷을 임신한 암컷으로 계산하였다. mPGK2 프로모터를 이용한 수컷 형질전환 마우스의 경우에는 비록 약간의 암컷이 교미 다음날 임신이 확인되었기는 하지만 실제로 출산을 한 암컷은 없었다. 면역검사법이 더 수행되었을 때 형질전환 마우스는 마취되었고 마우스의 부고환은 관류 고정 전에 추출되었다. 정자는 인공 수정 시험을 위해 사용된 부고환으로부터 수득되었다(표 4(B)).

	수정되지 않은 난의 수	2-세포기의 수	신샌아의 수
mPGK2	23	0	0
Fthl17	22	8	?

마우스의 어느 것으로부터 수집된 정자도 수정되지 않은 난을 침범하였다. 비정상은 관찰된 어떠한 정자에서도 발견되지 않았다. Fthl17의 서열 업스트림을 이용하는 형질전환 마우스의 경우에는 약간의 난은 통상보다 낮은 비율로 인공 수정 다음 날 2-세포기로 계속 진행되었다. 신생아는 난이 이식된 대리모에게 태어난 것이 확인되었다. 그러나 mPGK2 프로모터를 이용한 형질전환 마우스의 경우에는 인공 수정 후에 전핵 단계로 계속 진행하는 약간의 수정란이 있었지만 인공 수정 다음날 2-세포기에 도달한 난은 없었다. 따라서 면역검색법을 위해 사용된 mPGK2 프로모터를 이용한 수컷 형질전환 마우스는 정자생성에서 비정상을 지닌다는 가능성이 제안되었다. mPGK2 프로모터를 이용한 정상 마우스와 유사한 방식으로 출산을 하는 F₀ 발생의 암컷에서는 비정상이 두드러지게 발견되지 않았다는 것을 주목해야 한다.

(b) 형질전환 마우스 #2

형질전환 마우스 #2는 조직-특이적 방식으로 Cre 재조합을 발현하는 마우스와 교미하는 것에 의해 수득되었고 따라서 돌연변이-형 Poldl은 조직-특이적 방식으로 과발현되었다. 이것을 성취하기 위해 몸 전체에서 과발현을 위한 CAG 프로모터, 두 개의 loxP 서열에 의해 샌드위치되 네오마이신 내성 유전자, 여기에 연결된 돌연변이-형 Poldl로 구성된 서열의 벡터가 제조되었다(도 9). 전사의 종결을 나타내는 폴리A 시그널이 네오마이신 내성 유전자의 말단에 첨가되었다. 따라서 돌연변이-형 Poldl의 발현은 Cre 재조합의 조직-특이적 발현에 의해 시작될 수 있었다. 형질전환 마우스 #2는 형질전환 마우스 #1에서와 같이 생성되었다. 네오마이신 내성 유전자에 대해 특이적인 프라이머를 이용한 PCR로(도 10) 형질전환된 마우스 4 라인(20 신생아 내에서)이 확인되었다. 형질전환 마우스의 4 라인 중에서 3 라인의 F₀ 발생 마우스는 정상 마우스와 유사한 성정을 나타내었다. 따라서 비록 형질 특성의 전환율이 본 발명에 따라 조절된다고 해도 마우스내에서 실질적으로 비정상은 나타나지 않았다고 말할 수 있다.

mRNA는 형질전환 마우스 #2의 3 생존 라인의 꼬리로부터 추출되어 네오마이신 내성 유전자에 특이적인 프라이머를 이용하여 RT-PCR 되었다. 그 결과로써 네오마이신 내성 유전자의 발현이 확인되었다.

(타겟팅 마우스의 생성)

조직 또는 시간-특이적인 방식으로 돌연변이-형 Poldl 유전자로 교체되는 정상 Poldl와 원래의 DNA 중합효소의 발현 방식을 가능한한 많이 포함하고 있는 조건부 타겟팅 마우스를 제조하기 위한 시도가 행해졌다. Cre 재조합을 이용한 재조합의 경우, 만약 서로를 향하게 하도록 하기 위해 두 개의 loxP 서열이 연결되어 있다면 재조합은 두 개의 loxP 서열 사이에서 일어나고 따라서 loxP 서열에 의해 샌드위치된 부위는 역전될 수 있다. 즉 역전된 부위로 대체될 수 있다. 그러나 만약 두 개의 loxP 서열이 오직 서로를 향하게만 된다면 교체는 가역 반응 과정이다. 재조합 반응을 비가역적으로 진행시키기 위해 돌연변이는 Kimi Araki et al.,(1997), Nucleic Acids Res., 25, 868-872에 설명된 바와 같이 loxP 서열의 일부 내로 도입될 수도 있다.

조건부 타겟팅 마우스는 돌연변이된 loxP 서열을 이용하여 제조되었다. Lox66과 lox71이 제공되었고 서로를 향하게 하였다. 돌연변이-형 Poldl의 돌연변이 부위를 포함하는 정상 엑손 10의 서열과 돌연변이-형 엑손 10에 대한 상보서열은 서열 내에서 연결되었다(도 14). 이러한 벡터는 타겟팅 마우스를 제조하기 위해 사용되었다. 만약 재조합이 Cre 재조합의 발현 때문에 두 개의 lox 서열 사이에서 일어난다면 스플라이싱에 사용된 엑손 10은 정상-형에서 돌연변이-형으로 변화할 것이라는 것이 예상된다(도 15). 이것에 의해 정상-형 내생 DNA 중합효소 δ는 Cre 재조합의 발현 때문에 돌연변이-형으로 교체될 것이다. 타겟팅 벡터가 제조되었을 때 엑손 10은 그 반대쪽 말단에서 인트론 부분이 스플라이싱에 필수적인 서열을 포함하기 위해 준비되었다.

그러나 lox 66과 lox 71 서열은 돌연변이를 포함하였다. 따라서 Cre 재조합에 따른 재조합 효율은 정상 loxP 서열이 사용되었을 때 보다 더 낮아 질 것으로 생각된다. lox 66과 lox 71 서열이 서로를 향하게 되었을 때 반응이 적당하게 일어나는지 아닌지를 조사하기 위해 Cre 재조합 자체가 재조합을 수행하기 위해 사용되었다. 이것을 성취하기 위해 lox 66과 lox 71(lox66-71 재조합 서열로써 언급된) 사이의 두 개의 엑손 10을 포함하는 서열이 pBluescript Ⅱ 위에서 제조되었다. Cre 재조합과 서열을 반응시키는 것에 의해 재조합 효율이 조사되었다. 반응의 발생에 관하여 양성 대조군에 대한 실험으로써 형질전환 마우스 #2에 대한 벡터 서열이 사용되었다. 그 결과로써 Cre 재조합을 이용한 반응은 15분 내에 플라스미드의 50%로 재조합이 나타났고 2시간 내에 100% 재조합이 나타났다. lox 66-71 재조합에 대하여 2시간 동안 반응이 수행되었을 때 정상 재조합은 낮은 빈도로 확인되었다(1/3). 따라서 lox 66-71 재조합 서열 내 재조합의 발생이 확인되었다.

(유전적 형질의 전환율의 조절)

이러한 마우스가 유전적 형질 전환 수단에 노출되었을 때(예를 들면 높은 온도, 높은 습도, 높은 염농도 등) 환경에 적응할 수 있었던 개체의 수는 정상 마우스와 비교하여 두드러지게 증가하였다.

이 실시예의 방법에 따라 DNA 중합효소 δ의 프루프리딩 활성을 제거하는 것에 의해 불균형 돌연변이가 리딩 및 지연 DNA 사슬 모두에 축적될 수 있다는 것이 드러났다. 또한 정자형성 단계에서 명확하게 돌연변이를 지니는 DNA 중합효소 δ를 발현하는 것에 의해 마우스의 몸 전체에 나타난 돌연변이의 비율이 가능한 한 많이 감소될 수 있다는 것 역시 드러났다. 또한 유전자 조작 등에 따른 이차적인 영향도 가능한 한 많이 억제될 수 있다는 것도 드러났다. 이 실시예에서 상기-설명된 요구들을 만족하는 불균형 진화 마우스가 수득되었다.

돌연변이 마우스 #1의 경우 정자형성 단계에서 명확하게 발현되는 프로모터를 조사하는 것이 가능했다. 정자형성 단계에서 명확하게 발현된다고 일반적으로 알려진 대부분의 프로모터는 감수분열 후 정자세포 단계에서 명확하게 발현된다. 이 실시예에서 DNA 사슬이 복제되는 정원세포 단계 또는 초기 정모세포 단계에서 에서 수컷 생식 세포에서 명확하게 발현되는 프로모터를 이용하는 것이 의도되었다. mPGK2 프로모터는 이 조건을 만족하는 유일한 프로모터였다. 따라서 이 실시예에서 신규한 프로모터와 같은 Fthl17의 서열 업스트림을 이용하는 시도가 행해졌다. 그 결과로써 적어도 초기 정모세포 단계에서는 발현이 확인되었다. 정원세포에 대해 형질전환 마우스 #1이 유효한 CAG-CAT-GFP 돌연변이 마우스(본 발명에서 제조된 형질전환 마우스 #2와 유사한 구조를 지니는 벡터를 이용하여 제조된 형질전환 마우스; 및 이 마우스 내에서 GFP의 발현이 Cre 재조합의 발현에 의해 시작된다)와 교미되었고 따라서 GFP는 Cre 재조합이 발현되는 형질전환 마우스 #1의 부위에서 발현된다는 것으로 생각되었다. 따라서 GFP 발현 부위와 Cre 재조합 발현 부위의 결과를 결합하는 것에 의해 이 실시예의 프로모터의 발현 부위를 분석하는 것이 가능하다. Fth 117의 서열 업스트림은 TATA 박스 등의 서열과 결합하는 염기 전사 인자를 포함하지 않는다는 것을 주목해야 한다.

mPGK2 프로모터의 발현에서 정자형성 단계 후 발현은 관찰되지 않았고 이는 종래의 보고와 비교하여 더 늦은 단계였다.

형질전환 마우스 #1로 제조된 두 마리의 형질전환 마우스는 다른 발현 부위를 지닌다는 것이 제안되었다. 따라서 이러한 마우스는 전환율을 조절하기 위해 다양한 부위의 발현 효율을 비교하는 데에 이용되기에 유용하다고 생각된다. 정자형성 단계에서 명확하게 Cre 재조합을 발현하는 형질전환 마우스의 제조는 조직-특이적인 방식에서 발생하는 loxP 서열의 재조합을 이용하는 것에 의해 조절 유전자 불완전한 마우스를 수득하는 것을 가능하게 한다. 따라서 이러한 마우스는 생식 세포 연구에 대한 재료로써 이용될 수 있다.

형질전환 마우스 #2는 조직-특이적인 방식으로 돌연변이-형 Poldl의 과발현을 성취하기 위해 조직-특이적인 방식에서 Cre 재조합을 발현하는 마우스와 교미될 수 있다. 형질전환 마우스 #1에서 프로모터의 발현이 정지되었을 때 돌연변이-형 Poldl의 발현은 더 이상 일어나지 않는다. 상기-설명된 교미에 의해 돌연변이-형 Poldl의 발현은 프로모터의 발현이 끝난 후 계속될 수 있다. 또한 뇌, 간 등과 같은 조직에서 특이적으로 발현되는 Cre 재조합 형질전환 마우스와 교미하는 것에 의해 과발현의 영향은 체세포 수준에서 조사될 수 있다.

이 실시예의 결과에 따라 유전자 형질의 전환율은 넉아웃 마우스에서 조절될 수 있을 것이라는 것이 이해될 것이다.

(실시예 5: 식물로써 벼를 이용한 돌연변이 생물체의 제조)

실시예 5에서는 벼(식물)는 불균형 돌연변이 생물체를 제조하기 위한 대표적인 진핵세포 생물체로써 이용된다.

유전자 타겟팅 기술은 예를 들면 Yagi T. et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 나타나 있다. 실시예 4에서 불균등 DNA 복제 프루프리딩 능력(Morrison A., et al., Mol. Gen. Genet., 242:289-296, 1994)을 지닌 복제 복합체를 지니는 식물이 제조되었다.

변형된 유전적 형질은 질병(도열병) 내성과 저온 내성을 지닌다.

(유전자 타겟팅 기술)

돌연변이 DNA 중합효소(pol)(Morrison A., et al., Mol. Gen. Genet., 242:289-296, 1994)를 지니는 타겟팅 벡터가 준비되었다. 캘러스 등과 같은 식물세포는 식물 세포의 pol 유전자에 대한 상동성 재조합을 필요로 한다. 이에 따라 세포는 식물 줄기 내로 분화하게 된다.

(프로토콜)

(1. 캘러스 세포의 제조)

캘러스 세포는 예를 들면 Plant Tissue Culture에 설명된 잘 알려진 기술로 준비된다: Theory and Practice, Bhojwani, S.S. and Razdan, N.K., Elsevier, Amsterdam, 1983. 특히 캘러스 세포는 식물 줄기로부터 준비된다(Davies, R., 1981, Nature, 291:531-532 and Luo, Z., et al., Plant Mol. Bio. Rep., 7:69-77, 1989).

(2. pol 유전자의 상동성 재조합)

상동성 염색체 세포를 효율적으로 수득하기 위해 상동성 재조합이 마우스에 대한 유전자 타겟팅법이 수행되었다. 예를 들면 양성/음성법(Yagi T., et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; Capecchi M.R., Science, 244(16), 1288-1292, 1989).

타겟팅 벡터의 준비: 타겟팅 벡터는 예를 들면 Molecular Cloning, 2nd edition, Sambrook, J., et al, supra, and Ausubel, F.M., Current Protocols in Molecular Biology, Green Publishing Associates and Wiley-Interscience, NY, 1987. 상동에 설명된 기술에 의해 준비되었다.

타겟팅 벡터에서 돌연변이 polδ 및 /또는 polε 유전자는 양성 유전자와 음성 유전자 사이에 삽입되었다. 디프테리아 독소가 음성 유전자로써 사용되는 동안 하이그로마이신 내성 유전자가 양성 유전자로써 사용되었다(Terada R., et al., Nature Biotech., 20:1030-1034, 2002).

Pol 돌연변이에 대해 염기 돌연변이가 프루프리딩 활성 을 제거하기 위해 polδ의 프루프리딩 활성 부위 내로 도입되었다(서열번호 48의 320 위치의 D 및 322 위치의 E는 알라닌(A)으로 치환된다)(Morrison A. & Sugino A., Mol. Gen. Genet. 242:289-296, 1994; Goldsby R.E., et al., Proc. Natil. Acad. Sci. USA, 99:15560-15565, 2002).

(3. 캘러스 세포 내로 벡터의 도입)

벡터는 예를 들면 "Shokubutsu Baiotekunoroji Ⅱ[Plant Biotechnology Ⅱ]", Yasuyuku & Kanji Ooyama, eds., Tokyo Kagakudojin, 1991에 설명된 기술에 의해 캘러스 세포 내로 도입된다. 실시에 5에서 벡터는 전기천공법, 아그로박테리움법 등에 의해 캘러스 세포 내로 도입되었다. 배양은 하이그로마이신(100 ㎍/ml, Invitrogen)을 함유한 DMEM 배지(Flow Laboratory)에서 수행되었다.

(4. 재조합 세포의 회수)

하이그로마이신 존재에서 배양 후, 재조합 세포는 회수되었다(Terada R., et al., Nature Biotech., 20:1030-1034, 2002).

(5. 상동성 재조합의 확인)

게놈 DNA는 재조합으로부터 추출되었다. 돌연변이 pol이 성공적으로 ES 세포 내로 도입되었는지 아닌지는 서던 블럿팅 및/또는 PCR에 의해 결정된다("Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4).

(6. 식물 줄기의 제조)

식물 줄기는 예를 들면 "Shokubutsu Baiotekunoroji Ⅱ[Plant Biotechnology Ⅱ]", Yasuyuku & Kanji Ooyama, eds., Tokyo Kagakudojin, 1991; and "Shokubutsu Soshikibaiyo no Gijyutsu[Plant Tissue Culture Technique]", Masayuki Takeuti, Tetsuo Nakajima, & Riki Kotani, eds., Asakura Shoten, 1988에 설명된 방법으로 제조된다. 실시예 5에서 캘러스는 식물 줄기 내로 분화된다. 이에 따라 일배체 세포는 이종교배 식물에 의해 준비된 꽃밥, 종자 등 및/또는 일배체 세포로부터 유래되고 이러한 것들은 당분야에 잘 알려진 기술(Maki, H. et al., J. Bacteriology, 153(3), 1361-1367, 1983; Miller, J.H., 1992, A Short course in bacterial genetics, Cold Spring Harber Laboratory Press, Cold Spring Harber, N.Y.)들을 이용하여 pol 돌연변이(돌연변이유발유전자 돌연변이)의 특성을 확인하기 위해 사용된다.

(결과)

돌연변이를 지니는 실시예 5에서 수득된 식물은 종래의 기술에 의해 수득된 식물과 비교해 빨리 저온 내성 및 질병 내성(예를 들면 도열병 등)을 수득될 수 있다는 것이 관찰된다. 변형된 세포는 자연-발생 세포와 실질적으로 동일한 생장 속도를 지니지만 변형된 세포의 돌연변이 비율은 발생 당 하나 또는 그 이상이었고 이것은 종래의 돌연변이와 두드러지게 구별된다.

(실시예 6: 아라비돕시스 탈리아나(Arabidopsis thaliana) 내 실험)

아라비돕시스 탈리아나가 돌연변이 생물체를 제조하기 위해 사용되었다

(방법 및 재료)

(polδ cDNA 클로닝)

polδ(Atlg42120)(서열번호 90(핵산 서열) 및 서열번호 91(아미노산 서열))는 아라비돕시스 탈리아나의 뿌리에서 유래된 총 mRNA의 다음의 프라이머를 이용한 PCR에 의해 증폭되고 pBluescript SK2에서 서브클론되었다(TOYOBO).

Xbal-42120-F: 5'-CTGAGTCTAGATTTCCCGCCATGGAAATCG-3'(서열번호 82)

2g42120-Sacl-R: 5'-AGCAACGAGCTCTTATGATTGGTTTATCTG-3'(서열번호 83)

(돌연변아-형 polδ 유전자 polδ(D316A)(서열번호 92(핵산 서열) 및 서열번호 93(아미노산 서열)))

D에서 A로 polδ 내 아미노산 316을 변화시키는 다음의 프라이머를 이용하여 점 돌연변이가 유도되었다.

2g42120-D316A-F: 5'-ATTTGCTGTCGATAATATCAGATTTCTTGG-3' (서열번호 84)

2g42120R: 5'-GAGTGAGGATTTGTACATGATCTGAAGG-3' (서열번호 85)

(형절전환을 위한 백터의 제조)

유전자를 일관되게 발현하는 바이너리 플라스미드가 변형된 pBI121(CLONTECH)에 의해 제조되었다. pBI121의 β-글루쿠로니다제(glucuronidase) 유전자는 제한효소 XbaI 및 SacI를 이용하여 추출되었고 polδ(D316A)(이하 polδ(D316A)라 한다)으로 치환되었다.

형질전환을 위한 대조로써 사용된 벡터로써 상기-설명된 pBI121(이하 GUS라 한다) 및 β-글루쿠로니다제 유전자(이하 GTP라 한다)에 대해 GTP 치환을 지니는 pBI121가 제조되었다.

(캘러스의 제조)

아라비돕시스 탈리아나(모사: Columbia)는 발아 배지 위에 뿌려져 2일 또는 3일 동안 4℃에서 저온처리되었다. 그 후 평판은 인큐베이터 내(22℃)로 옮겨졌다. 이 종자는 10일 동안 어두운 장소에서 생장되었다. 생장한 어린 줄기는 1cm 길이로 잘려 차례로 10일 동안 CIM 배지 위에 두었다. 캘러스가 수득되었다.

(아그로박테리움을 이용한 캘러스의 형질전환)

GUS 또는 GTP 또는 polδ(D316A)를 지닌 바이너리 플라스미드를 함유한 아그로박테리움 pMP90은 50 mg/L로 채워진 LB 배지 내로 인큐베이트되어 2일 동안 28℃에서 진탕배양 되었다. 아그로박테리움 배양(OD600 = 약 0.8) 1.4 ml은 박테리아를 수집하기 위해 벤치-탑(bench-top) 원심분리기에서 5분 동안 원심분리되었다. 박테리아는 AIM 1 ml에서 부유되었다(하기 설명). 캘러스된 어린 줄기 단편은 AIM 5 ml를 함유한 60-mm 페트리 접시 내로 옮겨졌다. 아그로박테리움 상청액 1 ml이 접시에 첨가되었고 실온에서 20분 동안 진탕배양되었다. 캘러스는 여분의 수분 함량을 제거하기 위해 살균된 필터 위에 놓여졌고 그 후 새로운 CIM 평판으로 옮겨졌다. 3일 후 형질전환된 캘러스는 AIM을 함유한 60-mm 페트리 접시로 옮겨졌다. 접시를 25분 동안 60 rpm으로 회전시켰고 5번 세척하였다.

세척 후, 캘러스는 수분 함량을 제거하기 위해 필터 위로 놓여졌고 카르베니실린(carbenicillin) 50 mg/L과 카나마이신(kanamycin) 50 mg/L가 함유한 CIM 배지에서 생장되었다(하기 설명)(CIM 배지는 본 발명에 의해 준비되었다).

캘러스의 형질전환 비율이 95% 또는 그 이상이었다는 것을 주목해야 한다(오직 GTP가 도입된 캘러스만을 측정하였다; 및 GTP 형광의 존재 또는 부재가 시험되었다).

(캘러스의 2차 배양 및 돌연변이의 선별)

캘러스는 10일 마다 새로운 CIM 평판으로 옮겨졌다. 이 경우 하나의 캘러스가 두 개로 나누어 졌다. 그 절반이 2차 배양을 위해 CIM 평판에 놓여졌고 다른 절반은 다양한 조건 하에서 내성 돌연변이에 대한 스크리닝을 위해 평판에 놓여졌다.

NaCl 200 mM 또는 300 mM가 선별 평판 위에 첨가되었다. 2차 배양 및 선별은 10일 마다 수행되었다.

(배지의 조성)

발아 배지(1 리터):

Murashige 최소 유기 배지(GIBCO BRL) 1/2 패키지

자당 10 g

젤란 검(Wako Pure Chemical Industries) 5 g

(CIM (1리터))

Gamborg's B5 배지 염 화합물(Nihon Pharmaceutical) 1 패키지

포도당 20 g

마이오이노시톨 100 mg

5% Mes-KOH(pH 5.7) 10 ml

젤란 검 5g

오토클레이빙 후 다음의 물질들이 추가되었다:

티아민 하이드로클로라이드 20 mg

니코틴산 1 mg

피리독신 하이드로클로라이드 1 mg

비오틴 10 mg

2,4-D 0.5 mg

키네틴 0.05 mg

(AIM (1리터))

Gamborg's B5 배지 염 화합물(Nihon Pharmaceutical) 1 패키지

포도당 20 g

5% Mes-KOH(pH 5.7) 10 ml

(결과)

결과로써, 상기-설명된 사용된 유전자(GFP, GUS(형질전환에 대한 대조군), polδ(D316A))는 각각 95% 또는 그 이상의 형질전환 비율을 나타내었다(GTP가 도입된 개체만이 측정되었다; 및 GTP 형광의 존재 또는 부재가 검사되었다).

(진화를 위한 조건)

실시예에서 수득된 식물들은 다음의 유전적 형질을 변형시키기 위한 조건에 노출되었다.

선별 돌연변이가 다음의 조건 하에서 수행되었다.

1) 37℃ 평판은 37℃에서 인큐베이터 내에 놓여졌다.

2) 200mM NaCl NaCl 200mM가 배지에 첨가되었고 식물은 22℃에서 생장되었다.

3) 300mM NaCl NaCl 200mM가 배지에 첨가되었고 식물은 22℃에서 생장되었다.

(선별 돌연변이의 결과)

각 처리의 결과는 아래에 설명할 것이다. 아래 표의 숫자는 왼쪽부터: 비-처리된 캘러스와 같은 생장을 한 캘러스의 수(내성)/죽지는 않았지만 생장하지도 않은 캘러스의 수(약한 내성)/죽은 캘러스의 수(영향을 받기 쉬운)를 나타낸다.

처리 GFP polδ

37℃ 0/24/27 1/18/10

200 mM NaCl 0/20/145 0/58/112

300 mM NaCl 0/0/165 0/4/146

상기에 설명한 바와 같이 고온 처리에 내성을 나타낸 식물의 수는 증가되었다. 게다가 염 농도에 대해서도, NaCl 200 mM에 내성을 나타낸 캘러스의 수(polδ)는 대조군 보다도 훨씬 높았다. 따라서 본 발명의 방법은 식물에 높은 염 농도에 대한 내성을 줄 수 있다는 것이 밝혀졌다. 특히, 300 mM NaCl의 경우, 대조군은 내성을 획득할 수 없었던 반면 본 발명의 방법은 내성을 획득할 수 있었다.

(실시예 7: 아라비돕시스 탈리아나를 이용한 연속적인 내성 실험)

다음으로, 내성과 같은 유전적 형질이 발생 이상 번식되는지 아닌지가 결정되었다. 이 실험에 대한 조건은 실시예 6에 사용되었던 것과 동일하였다.

개체의 수는 아래에 설명된다.

아라비돕시스 탈리아나나 캘러스를 이용한 염 내성 실험의 결과 <실험된 캘러스의 수>

플라스미드 형태	200 mM NaCl	300 mM NaCl
돌연변이 polδ	75	75
GTP	96	95
GUS	75	68

<선별 방법>

캘러스가 제조되었다. 임의의 온도에서 생장한 캘러스가 두 개로 나누어 졌다. 그 중 하나는 정상 배지에서 원래의 크기로 생장되었던 반면 다른 하나는 내성 획득을 시험하기 위한 선택 배지에서 배양되었다. 정상 배지에서 캘러스가 상당히 생장하였을 때 다른 하나가 두 번째 선별을 위해 선택 배지 내로 옮겨지는 동안 나머지 하나는 정상 배지로 옮겨졌다. 총 6회 선별이 수행되었다. 300 mM NaCl의 경우 캘러스의 내성은 획득되지 않았다. 따라서 모든 실험은 200 mM NaCl에 대해서만 수행되었다.

도 16은 이 실험을 개략적으로 나타낸다.

<불연속적인 실험>

6회 선별에서 불연속적으로 나타나는 내성 캘러스의 수가 세어졌다. 한번 내성을 획득하였다가 잃은 캘러스는 위양성(pseudopositive)으로 고려되었다.

불연속적 실험의 결과

플라스미드 형태	200 mM NaCl 내성 캘러스의 수
돌연변이 polδ	8
GTP	6
GUS	6

<연속적인 실험>

위양성 결과를 제거하기 위해 연속적으로 내성을 획득했던 캘러스의 수를 세었다. 6번째 선별까지 내성을 나타내었던 캘러스의 수는 다음과 같다.

플라스미드 형태	200 mM NaCl 내성 캘러스의 수
돌연변이 polδ	1
GTP	0
GUS	0

이와 같이 오직 돌연변이 polδ를 지닌 형질만이 연속적인 내성을 나타내었다. 이러한 형질은 6번째 발생을 넘어서도 내성을 포함한다. 본 발명은 유전적 형질의 전환율뿐만 아니라 안정성에 있어서도 종래의 기술을 뛰어 넘는 것으로 밝혀졌다.

(실시예 8: ES 세포를 이용한 실험)

다음으로, 본 발명을 ES 세포에 적용할 수 있는지 아닌지가 결정되었다. 그 과정은 다음과 같다.

C57BL/6 및 CBA F1 마우스 배아(전형적인 방법에 따라 오사카 대학의 Yagi 실험실에 의해 준비)로부터 수득된 ES 세포주(TT-2 세포)가 배양되었고 ES 세포 배양 배지(ESM)(20% FBS, 0.1 mM NEAA, 1 mM 피루브산, LIF(ESGRO, Amrad) 및 머캡토에탄올을 함유한 DMEM)내 피더 위에서 증식되었다.

도입된 벡터(도 17)가 다음과 같이 준비되었다. 돌연변이 Poldl의 cDNA, 정상 Poldl 또는 EGTP 유전자가 단백질 발현 벡터인 pcDNA 3.1(+) 내로 혼합되었다. 제한 효소 처리가 선형 DNA 단편을 수득하기 위해 수행되었고 도입되기 위한 유전자에 대해 차례로 사용되었다. 증식된 ES 세포는 0.25% 트립신 용액에 의해 제거되었다. ES 세포는 2.0 x 10⁶ ES 세포/큐벳의 비율로 큐벳(cuvette)에 놓여졌다. 세포는 25 nM 벡터 DNA 용액 100 ㎕와 혼합되어 유전자 도입을 위한 전기천공법을 수행하였다.

전기천공법 후, 세포는 48시간 동안 ESM을 이용하여 배양되었다. 그 후 세포는 G418(최종 농도: 200 ㎍/mL)(SIGMA)로 채워진 ESM 배지에서 배양되었다. 이것에 의해 유전자 도입된 세포가 구분되었다. 배양은 젤라틴-코팅된 평판에서 수행되었다. 그 후 ES 세포는 페니실린-스트렙토마이신(상업적 이용 가능한 생산품(GIBCO)의 100배 희석) 존재 하에서 배양되었다.

<6번째 에세이>

증식되고 트립신-처리된(2.5%, GIBCO) ES 세포는 10-cm 접시에 5.0 x 10⁶ 세포/접시로 뿌려졌다. 내성 콜로니는 6-TG(최종 농도: 200 ㎍/mL; SIGMA, 하이브리도마 테스트됨) 및 G418의 존재 하에서 구분되었다. 이 구분에서 세포는 젤라틴-코팅된 접시(0.1% 젤라틴 용액이 FALCON 353003 세포 배양 접시에 놓여진 후 37℃에서 37분간 인큐베이션되었다(SIGMA로부터 젤라틴 입수) 위에서 배양되었다. 배양 배지는 2일 마다 한번씩 교체되었다. 세포가 뿌려졌던 날은 0일로 간주하였다. 콜로니의 수는 11일에 세어졌다. 오직 상당히 번식되고 생장한 콜로니만이 세어졌다.

<실험의 결과>

#1 및 #2로 디자인된 돌연변이 Poldl의 두 개는 각각 전기전공법이 수행되었다. 양쪽의 경우에서 6개 10-cm 접시가 사용되었고 내성 콜로니가 나타난 것의 수를 세었다. 콜로니의 수는 아래에 나타낸다(0 x 6은 콜로니가 나타나지 않은 6개의 접시를 나타낸다).

돌연변이 Poldl 3 x 1, 1 x 2, 0 x 9

야생형 Poldl 0 x 6

EGTP 대조군 0 x 6

이 실시예의 결과에 따라 생장한 콜로니가 돌연변이 Poldl의 경우에만 관찰되었다. 돌연변이의 타겟이었던 수득된 콜로니 HGPRT 유전자에 대해 돌연변이의 도입을 확인하기 위해 부분적으로 시퀀스될 수 있었다.

이에 따라 돌연변이 Poldl 유전자의 과발현은 마우스 ES 세포 내로 돌연변이의 도입을 용이하게 한다는 것이 밝혀졌다. 따라서 ES 세포에서 유전적 형질의 전환율을 조절하는 것이 가능하고 비율 및 안정성도 증가되었다는 것이 설명되었다.

(실시예 9: 그람-양성 박테리아)

이 실시예에서 전형적인 그람-양성 박테리아인 바실러스 서브틸리스(Bacillus subtilis)가 숙주 세포로 사용되었고 돌연변이가 도입되었다. 돌연변이에서 각각 425 및 427 위치에서 아스파르트산 및 글루탐산이 중합효소 C에서 돌연변이되었고 서열번호 15에서 발생하였다. 중합효소 C 돌연변이는 플라스미드(pHY300PLK, TAKARA)를 통해 바실러스 서브틸리스 내로 도입된다. 그 후 박테리아는 진화를 위한 조건 하에 노출되었다.

돌연변이의 제조 후, 예를 들면 중간 고온(예를 들면 42℃)은 50℃ 또는 그 이상으로 점차 증가된다.

바실러스 서브틸리스는 광범위하게 연구된 토양 박테리아 형태이다. 생장 온도는 20∼50℃이다(박테리아는 pH 6∼7에서 30분 동안 2배가 된다).

상기에 설명한 바와 같이 진화를 위한 조건 하에서 본 실시예의 약간의 바실러스 형질은 55℃ 정도의 고온에서도 살 수 있었다. 형질은 2차 배양에서 그 특성을 유지할 수 있다.

이와 같이 E. coli와는 달리 DNA 복제 메커니즘을 지니는 박테리아의 진화 속도를 조절하는 것이 가능하다는 것이 밝혀져다.

(실시예 10: 유전자의 분리)

실시예 10에서 유전적 형질을 변화시키는 데에 역할을 하는 유전자가 분리된다. 실시예 1의 약제 내성을 획득한 생물체가 분리된다. 이 후 약제 내성을 포함한 유전자의 서열이 변형 및 변형된 생물체 이전의 원래의 생물체에서 결정된다. 그 결과로써 자이레이스(gyrase)(또는 토포이소중합효소 Ⅱ) 서브유니트 A 및 토포아이소머라제 Ⅳ 유전자가 변형된 것이 발견된다. 이 서열은 적당한 프라이머를 이용한 PCR에 의해 증폭되고 전체-길이 유전자가 분리된다. 원래의 유전자 및 변형된 유전자로부터 폴리펩타이드는 합성되고 그것의 활성이 측정된다. 그 결과로써 활성은 임의로 변화한다는 것이 발견된다. 따라서 본 발명의 방법은 유전자 수준에서 돌연변이를 순식간에 도입할 수 있다는 것이 설명된다.

(실시예 11: 새로운 생성 물질의 분리)

실시예 11에서 변형에 의해 수득된 새로운 생성 물질이 분리되었다. 실시예 1의 약제 내성을 획득한 생물체가 분리되었다. 이 후 변형 이전의 원래의 생물체에는 존재하지 않고 변형된 생물체에 존재하는 물질은 크로마토그래피 분석(예를 들면 HPLC 등)에 의해 확인된다. 새로운 생성 물질이 분리된다. 그 결과로써 자이레이스(또는 토포이소중합효소 Ⅱ) 서브유니트 A 및 토포아이소머라제 Ⅳ 유전자가 새로운 생성 물질이라는 것이 발견된다. 따라서 본 발명의 방법은 새로운 생성 물질의 도입에서 실질적으로 유용하다는 것이 설명된다.

(실시예 12: 오류-빈발 빈도를 변형하는 다른 방법)

상기-설명된 돌연변이 대신, DNA 복제의 정확도를 감소시키기 위해 중합효소 δ 및 ε의 중합효소 부분의 활성을 손상시키는 돌연변이의 도입이 가능하다.

(실시예 13: 오류-빈발 빈도 및 진화 속도 사이의 관계)

대조군으로써 돌연변이를 도입하는 종래의 방법(방사선, 화학적 처리 등)이 실시예 1에 설명된 바와 같이 약제 내성, 알코올 내성 및 고온 내성을 획득한 효모에 대한 실험에서 수행되었다. 그 결과로써 본 발명에 의한 내성 획득의 비율은 종래의 기술에 의한 것보다 두드러지게 더 높았다. 두 개의 실험이 동시에 시작되었을 때 내성 형질은 종래의 기술 보다 더 빨리 본 발명에 의해 수득될 수 있었다.

실시예 13에서, 점차적으로 변화하는 돌연변이 비율을 지니는 방법은 내성의 획득에 대해 요구되는 시간을 비교하기 위해 사용되었다. 그 결과로써 진화의 속도가 수득될 수 있었다.

여기에 임의의 바람직한 실시태양이 설명되었지만 첨부한 청구범위에 나타낸 것을 제외하고는 본 발명의 범위를 이러한 실시태양으로 제한하는 것은 아니다. 다양한 다른 변형 및 상응하는 것들은 명백할 것이고 여기에 설명된 것을 숙지한 후, 본 발명의 범위와 정신으로부터 벗어나지 않고 당분야의 이러한 기술에 의해 쉽게 제조될 수 있다. 여기에 인용되는 모든 특허, 공개된 특허출원 및 간행물은 여기에 충분히 나타난 것과 같이 참조로써 통합된다.

본 발명에 따라 종래의 방법과 비교해 생물체에 신속하고 실질적으로 부작용 없이 요구되는 형질을 수여할 수 있다. 또한 본 발명에 따라 생물체의 유전적 형질은 쉬운 조작에 의해 변형될 수 있다. 이것에 의해 종래의 방법에 의해서는 수 득될 수 없었던 유용한 생물체, 유전자, 유전자 생성물, 대사산물 등을 효과적으로 수득되는 것이 가능하다.

<110> Neo-Morgan Laboratory Incorporated FURUSAWA, Mitsuru <120> Method and system for rapidly conferring a desired trait to an organism <150> JP2003-092898 <151> 2003-03-28 <150> US10/684,141 <151> 2003-10-10 <160> 95 <170> KopatentIn 1.71 <210> 1 <211> 3551 <212> DNA <213> Saccharomyces cerevisiae <400> 1 acgcgtaact ttttattcta taaaatgttc aatgaggaca tctgctattc gcttatgaag 60 aacaaacact cagtactact gatctaaggc aattttcaag gataaaggaa aatagatatt 120 gagcacttgc tattaagcat taatctttat acatatacgc acagcaatga gtgaaaaaag 180 atcccttccc atggttgatg tgaagatcga tgacgaggat actccccagt tggaaaagaa 240 aatcaaacgg caatcaatag atcatggtgt tggaagtgaa cctgtttcaa caatagagat 300 tattccgagt gattcttttc gaaaatataa tagtcaaggc ttcaaagcaa aggatacaga 360 tttaatgggt acgcaattag agtctacttt tgaacaagag ctatcgcaaa tggaacatga 420 tatggccgac caagaagagc atgacctgtc atcattcgag cgtaagaaac ttccaaccga 480 ttttgaccca agtttgtatg atatttcttt ccaacaaatt gatgcggaac agagcgtact 540 gaatggtatc aaagatgaaa atacatctac cgtggtaagg ttttttggtg tcactagtga 600 aggacactct gtactttgta atgttacagg gttcaagaac tatctttacg tcccagcgcc 660 caattcttcc gacgctaacg atcaggagca aatcaacaag tttgtgcact atttaaacga 720 aacatttgac cacgctattg attcgattga agttgtatct aaacagtcta tctggggtta 780 ttccggagat accaaattac cattctggaa aatatacgtc acctatccgc atatggtcaa 840 caaactgcgt actgcgtttg aaagaggtca tctttcattc aactcgtggt tttctaacgg 900 cacgactact tatgataaca ttgcctacac tttaaggtta atggtagatt gtggaattgt 960 cggtatgtcc tggataacat taccaaaagg aaagtattcg atgattgagc ctaataacag 1020 agtttcctct tgtcagttgg aagtttcaat taattatcgt aacctaatag cacatcctgc 1080 tgagggtgat tggtctcata cagctccatt gcgtatcatg tcctttgata tcgagtgtgc 1140 tggtaggatt ggcgtctttc cggaacctga atacgatccc gtcatccaaa ttgccaacgt 1200 tgtgagtatt gctggcgcta agaaaccatt cattcgtaat gtgtttactc tgaatacatg 1260 ctcacccata acaggttcaa tgattttttc ccacgccact gaagaggaaa tgttgagcaa 1320 ttggcgtaac tttatcatca aagttgatcc tgatgttatc attggttata atactacaaa 1380 ttttgatatc ccttatcttt taaaccgtgc aaaggcgcta aaggtgaatg atttcccata 1440 ttttggaagg ttaaaaaccg ttaagcaaga aattaaagag tctgtgttct cttcgaaggc 1500 ttatggtaca agagaaacca aaaatgtcaa tattgacggc cgattacagt tggatctttt 1560 gcaatttatt cagcgtgagt ataaactaag atcctacacg ttgaatgcag tctctgcgca 1620 ctttttaggt gaacagaagg aggatgtaca ttatagcatc atttctgatc tacaaaatgg 1680 cgatagtgaa acaagaagaa ggttggccgt ttactgtttg aaagacgcct acctgccttt 1740 aaggcttatg gaaaaactaa tggcgttagt taactataca gaaatggctc gtgttacagg 1800 tgtgccattt tcatatttac tagctcgtgg tcaacaaatt aaagttgttt ctcaactatt 1860 tcgaaagtgc ctggagattg atactgtgat acctaacatg caatctcagg cctctgatga 1920 ccaatatgag ggtgccactg ttattgagcc tattcgtggt tattacgatg taccgattgc 1980 aactttggat ttcaattctt tatatccaag tattatgatg gcgcacaacc tatgttatac 2040 aacactttgt aacaaagcta ctgtagagag attgaatctt aaaattgacg aagactacgt 2100 cataacacct aatggagatt attttgttac cacaaaaaga aggcgtggta tattaccaat 2160 tattctggat gaattaataa gtgctagaaa acgcgctaaa aaagatctga gagatgagaa 2220 ggatccattc aaaagagatg ttttaaatgg tagacaattg gctttgaaga tttcagctaa 2280 ctctgtctat ggttttacag gagcgacggt gggtaaattg ccatgtttag ccatttcttc 2340 atctgttact gcttatggtc gtaccatgat tttaaaaact aaaaccgcag tccaagaaaa 2400 atattgtata aagaatggtt ataagcacga tgccgttgtg gtttacggtg acactgattc 2460 cgttatggta aagtttggta caacagattt aaaggaagct atggatcttg gtaccgaagc 2520 tgccaaatat gtctccactc tattcaaaca tccgattaac ttagaatttg aaaaagcata 2580 cttcccttac cttttgataa ataaaaagcg ttatgcaggt ttattctgga ctaatcctga 2640 caagtttgac aagttggacc aaaaaggcct tgcttctgtc cgtcgtgatt cctgttcctt 2700 ggtttctatt gttatgaata aagttttaaa gaaaatttta attgaaagaa atgtagatgg 2760 tgctttagct tttgtcagag aaactatcaa tgatattctg cataatagag tagatatttc 2820 aaagttgatt atatcaaaga cgttagcccc aaattacaca aatccacagc cgcacgccgt 2880 tttggctgaa cgtatgaaga ggagagaggg cgttggtcca aatgttggtg atcgtgtgga 2940 ctatgtcatt atcggtggta atgataaact ttacaataga gcagaagatc cattatttgt 3000 actagaaaac aatattcaag tggattcgcg ctattattta actaatcaat tacaaaatcc 3060 aatcattagt attgttgcac ctattattgg cgacaaacag gcgaacggta tgttcgttgt 3120 gaaatccatt aaaattaaca caggctctca aaaaggaggc ttgatgagct ttattaaaaa 3180 agttgaggct tgtaaaagtt gtaaaggtcc gttgaggaaa ggtgaaggcc ctctttgttc 3240 aaactgtcta gcaaggtctg gagaattata cataaaggca ttatacgatg tcagagattt 3300 agaggaaaaa tactcaagat tatggacaca atgccaaagg tgcgctggta acttacatag 3360 tgaagttttg tgttcaaata agaactgtga cattttttat atgcgggtta aggttaaaaa 3420 agagctgcag gagaaagtag aacaattaag caaatggtaa aaaacgatag ggtggcacat 3480 catattagga ttaagaaagg ctaacaactt tttgcatgtt ggtggatata tatgtatata 3540 taaatagata c 3551 <210> 2 <211> 1097 <212> PRT <213> Saccharomyces cerevisiae <400> 2 Met Ser Glu Lys Arg Ser Leu Pro Met Val Asp Val Lys Ile Asp Asp 1 5 10 15 Glu Asp Thr Pro Gln Leu Glu Lys Lys Ile Lys Arg Gln Ser Ile Asp 20 25 30 His Gly Val Gly Ser Glu Pro Val Ser Thr Ile Glu Ile Ile Pro Ser 35 40 45 Asp Ser Phe Arg Lys Tyr Asn Ser Gln Gly Phe Lys Ala Lys Asp Thr 50 55 60 Asp Leu Met Gly Thr Gln Leu Glu Ser Thr Phe Glu Gln Glu Leu Ser 65 70 75 80 Gln Met Glu His Asp Met Ala Asp Gln Glu Glu His Asp Leu Ser Ser 85 90 95 Phe Glu Arg Lys Lys Leu Pro Thr Asp Phe Asp Pro Ser Leu Tyr Asp 100 105 110 Ile Ser Phe Gln Gln Ile Asp Ala Glu Gln Ser Val Leu Asn Gly Ile 115 120 125 Lys Asp Glu Asn Thr Ser Thr Val Val Arg Phe Phe Gly Val Thr Ser 130 135 140 Glu Gly His Ser Val Leu Cys Asn Val Thr Gly Phe Lys Asn Tyr Leu 145 150 155 160 Tyr Val Pro Ala Pro Asn Ser Ser Asp Ala Asn Asp Gln Glu Gln Ile 165 170 175 Asn Lys Phe Val His Tyr Leu Asn Glu Thr Phe Asp His Ala Ile Asp 180 185 190 Ser Ile Glu Val Val Ser Lys Gln Ser Ile Trp Gly Tyr Ser Gly Asp 195 200 205 Thr Lys Leu Pro Phe Trp Lys Ile Tyr Val Thr Tyr Pro His Met Val 210 215 220 Asn Lys Leu Arg Thr Ala Phe Glu Arg Gly His Leu Ser Phe Asn Ser 225 230 235 240 Trp Phe Ser Asn Gly Thr Thr Thr Tyr Asp Asn Ile Ala Tyr Thr Leu 245 250 255 Arg Leu Met Val Asp Cys Gly Ile Val Gly Met Ser Trp Ile Thr Leu 260 265 270 Pro Lys Gly Lys Tyr Ser Met Ile Glu Pro Asn Asn Arg Val Ser Ser 275 280 285 Cys Gln Leu Glu Val Ser Ile Asn Tyr Arg Asn Leu Ile Ala His Pro 290 295 300 Ala Glu Gly Asp Trp Ser His Thr Ala Pro Leu Arg Ile Met Ser Phe 305 310 315 320 Asp Ile Glu Cys Ala Gly Arg Ile Gly Val Phe Pro Glu Pro Glu Tyr 325 330 335 Asp Pro Val Ile Gln Ile Ala Asn Val Val Ser Ile Ala Gly Ala Lys 340 345 350 Lys Pro Phe Ile Arg Asn Val Phe Thr Leu Asn Thr Cys Ser Pro Ile 355 360 365 Thr Gly Ser Met Ile Phe Ser His Ala Thr Glu Glu Glu Met Leu Ser 370 375 380 Asn Trp Arg Asn Phe Ile Ile Lys Val Asp Pro Asp Val Ile Ile Gly 385 390 395 400 Tyr Asn Thr Thr Asn Phe Asp Ile Pro Tyr Leu Leu Asn Arg Ala Lys 405 410 415 Ala Leu Lys Val Asn Asp Phe Pro Tyr Phe Gly Arg Leu Lys Thr Val 420 425 430 Lys Gln Glu Ile Lys Glu Ser Val Phe Ser Ser Lys Ala Tyr Gly Thr 435 440 445 Arg Glu Thr Lys Asn Val Asn Ile Asp Gly Arg Leu Gln Leu Asp Leu 450 455 460 Leu Gln Phe Ile Gln Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn 465 470 475 480 Ala Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His Tyr 485 490 495 Ser Ile Ile Ser Asp Leu Gln Asn Gly Asp Ser Glu Thr Arg Arg Arg 500 505 510 Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Met 515 520 525 Glu Lys Leu Met Ala Leu Val Asn Tyr Thr Glu Met Ala Arg Val Thr 530 535 540 Gly Val Pro Phe Ser Tyr Leu Leu Ala Arg Gly Gln Gln Ile Lys Val 545 550 555 560 Val Ser Gln Leu Phe Arg Lys Cys Leu Glu Ile Asp Thr Val Ile Pro 565 570 575 Asn Met Gln Ser Gln Ala Ser Asp Asp Gln Tyr Glu Gly Ala Thr Val 580 585 590 Ile Glu Pro Ile Arg Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp 595 600 605 Phe Asn Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr 610 615 620 Thr Thr Leu Cys Asn Lys Ala Thr Val Glu Arg Leu Asn Leu Lys Ile 625 630 635 640 Asp Glu Asp Tyr Val Ile Thr Pro Asn Gly Asp Tyr Phe Val Thr Thr 645 650 655 Lys Arg Arg Arg Gly Ile Leu Pro Ile Ile Leu Asp Glu Leu Ile Ser 660 665 670 Ala Arg Lys Arg Ala Lys Lys Asp Leu Arg Asp Glu Lys Asp Pro Phe 675 680 685 Lys Arg Asp Val Leu Asn Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala 690 695 700 Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Lys Leu Pro Cys 705 710 715 720 Leu Ala Ile Ser Ser Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Leu 725 730 735 Lys Thr Lys Thr Ala Val Gln Glu Lys Tyr Cys Ile Lys Asn Gly Tyr 740 745 750 Lys His Asp Ala Val Val Val Tyr Gly Asp Thr Asp Ser Val Met Val 755 760 765 Lys Phe Gly Thr Thr Asp Leu Lys Glu Ala Met Asp Leu Gly Thr Glu 770 775 780 Ala Ala Lys Tyr Val Ser Thr Leu Phe Lys His Pro Ile Asn Leu Glu 785 790 795 800 Phe Glu Lys Ala Tyr Phe Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr 805 810 815 Ala Gly Leu Phe Trp Thr Asn Pro Asp Lys Phe Asp Lys Leu Asp Gln 820 825 830 Lys Gly Leu Ala Ser Val Arg Arg Asp Ser Cys Ser Leu Val Ser Ile 835 840 845 Val Met Asn Lys Val Leu Lys Lys Ile Leu Ile Glu Arg Asn Val Asp 850 855 860 Gly Ala Leu Ala Phe Val Arg Glu Thr Ile Asn Asp Ile Leu His Asn 865 870 875 880 Arg Val Asp Ile Ser Lys Leu Ile Ile Ser Lys Thr Leu Ala Pro Asn 885 890 895 Tyr Thr Asn Pro Gln Pro His Ala Val Leu Ala Glu Arg Met Lys Arg 900 905 910 Arg Glu Gly Val Gly Pro Asn Val Gly Asp Arg Val Asp Tyr Val Ile 915 920 925 Ile Gly Gly Asn Asp Lys Leu Tyr Asn Arg Ala Glu Asp Pro Leu Phe 930 935 940 Val Leu Glu Asn Asn Ile Gln Val Asp Ser Arg Tyr Tyr Leu Thr Asn 945 950 955 960 Gln Leu Gln Asn Pro Ile Ile Ser Ile Val Ala Pro Ile Ile Gly Asp 965 970 975 Lys Gln Ala Asn Gly Met Phe Val Val Lys Ser Ile Lys Ile Asn Thr 980 985 990 Gly Ser Gln Lys Gly Gly Leu Met Ser Phe Ile Lys Lys Val Glu Ala 995 1000 1005 Cys Lys Ser Cys Lys Gly Pro Leu Arg Lys Gly Glu Gly Pro Leu Cys 1010 1015 1020 Ser Asn Cys Leu Ala Arg Ser Gly Glu Leu Tyr Ile Lys Ala Leu Tyr 1025 1030 1035 1040 Asp Val Arg Asp Leu Glu Glu Lys Tyr Ser Arg Leu Trp Thr Gln Cys 1045 1050 1055 Gln Arg Cys Ala Gly Asn Leu His Ser Glu Val Leu Cys Ser Asn Lys 1060 1065 1070 Asn Cys Asp Ile Phe Tyr Met Arg Val Lys Val Lys Lys Glu Leu Gln 1075 1080 1085 Glu Lys Val Glu Gln Leu Ser Lys Trp 1090 1095 <210> 3 <211> 7505 <212> DNA <213> Saccharomyces cerevisiae <400> 3 cgctctgccc tagttggaat gccatcgaac cacgaggatc ttggaatgga aaaccaccgc 60 cactgccatt tacgtttgca ttcatattcg cattaccttg gccattcacg ggcgtgttcc 120 tcggaatttg cattggtcgt tgctgttgtg gagtgtggga aaagcgatcg ttaacgccat 180 tctgctcact tgttgcatat gcgtacggat tataagacat cttggtatgg gcctttggtt 240 ttcgttttct gctattgata ctcagtagcg aggtcttaca atcgaaaagt caaaaagatg 300 agttgtagta taaaacaaca gctctggtgt gcaatatgga tcttgataca gagtctcgga 360 tatgctgttt tagcactgag aaaaagtaat agtaacactg tcagtgttcg tcaaaggccc 420 aagtttattg tcatttgaat tgtcagaatg gtttattttc aggtagggta accagaacgc 480 gtaagtttct tgcatctttt accattttaa ctggaagagg acctatcaaa aagagcatat 540 gatgatgaaa gagcacattc tatcaagata acactctcag gggacaagta tatgatgttt 600 ggcaagaaaa aaaacaacgg aggatcttcc actgcaagat attcagctgg caacaagtac 660 aacacactct caaataatta tgcgcttagc gcgcaacagc tcttaaatgc tagtaagatc 720 gatgacatcg attcgatgat gggatttgaa agatacgtac cgccgcaata caatggcagg 780 tttgatgcga aggatataga tcagattcca ggccgcgtag ggtggctgac gaacatgcac 840 gcaacgctgg tctctcagga aaccttatcc agtggtagta atggcggcgg caattcgaat 900 gacggagaac gtgtaacgac caaccaaggt atttccggag ttgacttcta ctttttagat 960 gaagagggtg ggagcttcaa gtcgacagtt gtctatgacc catacttctt tattgcgtgt 1020 aacgatgaat caagagtaaa tgatgtggag gaactagtga aaaaatatct ggaatcttgt 1080 ctcaaaagct tacaaatcat tagaaaggaa gatcttacca tggacaatca ccttttaggg 1140 ctgcagaaga cacttattaa gttatcattt gtaaattcca atcagttatt cgaggccagg 1200 aaactcctga ggccaatctt gcaggataat gccaataata atgtgcaaag aaatatatat 1260 aacgttgctg caaatggctc ggaaaaagtt gacgccaaac atctgatcga agatatcagg 1320 gaatatgatg tgccgtatca tgtccgagta tctatagaca aggacattag agtcggtaaa 1380 tggtataagg taactcaaca gggattcatt gaagatacta ggaaaattgc atttgccgac 1440 cctgtggtaa tggcatttga tatagaaacc acgaagccgc ctttaaaatt cccggattcc 1500 gccgtagatc aaataatgat gatttcgtat atgatcgatg gggaaggttt tttgataaca 1560 aatagggaga taatctctga ggatattgaa gactttgagt atacaccgaa accggagtat 1620 cctggttttt tcaccatatt taacgaaaac gatgaagtgg cgcttctaca aaggtttttt 1680 gaacatataa gagatgtacg acccactgtt atatccacct tcaatggtga ctttttcgat 1740 tggcctttta tacataacag aagtaagatt cacggcttgg acatgttcga tgaaattggt 1800 ttcgctccag atgctgaagg tgagtacaag tcctcatact gctctcacat ggattgtttc 1860 cgttgggtga agcgtgattc ttatttacca caaggttccc agggtttaaa agctgttact 1920 caatctaagc taggttataa cccaattgaa ctggatcccg aattaatgac gccgtatgca 1980 tttgaaaagc cacagcacct ttccgaatat tctgtttccg atgcagtcgc tacgtattac 2040 ctttacatga aatatgttca tccttttatc ttttcccttt gtactattat tcctttgaac 2100 ccggatgaaa cattgagaaa gggtaccggt actttgtgtg aaatgttgtt gatggttcaa 2160 gcttatcaac ataatattct tctaccaaat aagcatacag atcccattga gaggttctat 2220 gatggacatc ttctagaatc cgagacttac gtgggtggac atgtggagtc attagaagct 2280 ggtgttttta ggagtgattt gaagaatgaa ttcaagatag atccttctgc cattgatgaa 2340 ttattacaag aattaccaga agctttgaaa tttagtgtgg aagttgaaaa taagtccagt 2400 gtagataaag taacgaattt tgaggaaata aaaaaccaga taacgcagaa attattagag 2460 ttgaaggaaa acaatataag aaacgaacta cctttgatct atcatgtaga tgtcgcctct 2520 atgtacccaa acatcatgac tacaaataga ctacaaccag atagtatcaa agcagagcgc 2580 gattgtgcta gttgcgattt taatagaccc ggaaaaacct gtgcaagaaa gttaaaatgg 2640 gcttggagag gagaattctt tcccagtaag atggatgagt ataacatgat caagcgtgca 2700 ttacaaaatg agacttttcc caacaaaaac aagttttcta aaaagaaagt tttgacattt 2760 gatgaactaa gttacgcaga ccaagttatc cacataaaaa aacgtttaac tgaatattca 2820 aggaaagttt atcatagggt taaagtatca gaaattgtcg aacgagaagc cattgtctgc 2880 caaagagaaa atccattcta cgtcgatacc gtgaaatcct ttcgtgatag gcgttacgaa 2940 ttcaaaggtt tagccaagac ttggaaggga aatctgtcca aaattgaccc atctgataag 3000 catgcgagag acgaggccaa aaagatgatt gtgctttatg actcattaca attagctcac 3060 aaagttattt tgaattcgtt ttatgggtat gttatgagga aaggctctcg ttggtattcc 3120 atggaaatgg cggggattac gtgtttaaca ggtgccacga tcattcaaat ggcgagagct 3180 ttagtagaaa gggtaggaag accattagaa ttagatactg atggtatttg gtgtatctta 3240 ccaaaatctt tccctgaaac ttactttttt acattagaaa atggtaaaaa gctttatctc 3300 tcctacccat gttccatgct gaattacaga gttcaccaaa agtttacgaa tcaccaatac 3360 caagaattaa aagacccatt gaactatata tatgagacgc acagtgaaaa cacgattttt 3420 ttcgaagttg acggaccata taaggccatg attttgccta gttccaagga agaaggaaaa 3480 ggtataaaga aaagatatgc tgtcttcaat gaagacggct cacttgctga actgaaaggt 3540 tttgaattga agaggcgtgg tgaattacaa ctaataaaaa attttcaaag tgatattttc 3600 aaggtctttt tggaaggtga tacattagaa ggatgttaca gtgctgtagc aagcgtatgt 3660 aaccgttggt tagatgttct tgattcacat ggtcttatgt tagaagatga agacttggtc 3720 agtttgattt gtgaaaatag aagtatgtca aaaactttaa aggaatatga agggcaaaaa 3780 tctacttcta ttacgacggc aaggagattg ggggattttt tgggtgaaga tatggtaaaa 3840 gataaaggtc tacaatgtaa atatattatt agttcaaaac ctttcaatgc acctgttact 3900 gaacgagcca ttccagtcgc aatattttca gcggacattc ccatcaaaag gtcttttctg 3960 aggcgatgga cattagatcc atctttggaa gatctggata tcagaaccat aatcgattgg 4020 ggttattata gagaaagact tggatctgct atacaaaaga taattactat tccagcagca 4080 ttacaagggg tttccaatcc tgttccaagg gttgaacatc cagattggct aaaaagaaaa 4140 atcgctacaa aggaggataa gtttaagcag acttcactaa ccaaattttt ttcgaagaca 4200 aagaatgtac caacaatggg caagataaaa gatatcgagg atttgtttga accaactgta 4260 gaagaagata acgccaaaat taaaattgca agaactacta aaaagaaagc cgtatccaag 4320 aggaaaagaa atcagcttac aaatgaagaa gatccactag tattgccctc ggagattcct 4380 tccatggacg aggactatgt tgggtggcta aattatcaaa aaattaaatg gaaaatccaa 4440 gcaagagata gaaagcgtcg agaccaatta tttggtaata caaacagctc ccgtgaaaga 4500 agtgcactag gaagtatgat taggaagcaa gctgaatcat atgcgaactc cacttgggag 4560 gtcttacaat acaaggattc cggtgagcca ggggttttgg aagtatttgt aacaattaat 4620 ggcaaagtcc agaacatcac cttccatata ccaaaaacta tttatatgaa attcaaatct 4680 caaacaatgc cgctacaaaa gattaagaat tgccttattg aaaaatcttc tgcatcgtta 4740 ccaaataatc ccaaaacgtc taatccagca ggcggtcagc tattcaaaat tactctaccg 4800 gaatctgtct ttctggaaga aaaggaaaac tgcactagta tcttcaacga tgaaaatgta 4860 cttggtgtat ttgagggcac tatcactcct catcaaagag cgatcatgga tttgggagct 4920 tcggtaacgt tccgctcaaa agcaatgggt gcgttaggca agggaataca gcagggtttt 4980 gaaatgaagg atctttcaat ggcggaaaat gaaaggtatc tgagtggatt ttcaatggac 5040 attggctatt tactacattt cccaacatca attgggtatg aatttttttc attattcaag 5100 tcatggggag atactattac tatattagtt ttgaaaccat ccaaccaggc tcaggaaata 5160 aatgcctcat cattaggaca aatatacaaa caaatgtttg aaaaaaagaa aggtaaaata 5220 gaaacatatt cttacttggt tgatattaaa gaagatatca attttgagtt tgtatatttt 5280 acagatatct caaaattgta cagaagacta tcacaggaaa ctactaaatt aaaagaagaa 5340 agaggtctgc agtttttact cttgttacaa tctccgttta tcactaagct cttaggcaca 5400 atccggcttc taaaccagat gcccattgtt aagctttcct tgaatgaagt tcttctaccc 5460 caattgaact ggcaaccgac attattgaag aaacttgtta accacgtttt atccagtggt 5520 tcgtggattt ctcacttgat caagttatcc cagtatagta acattccaat ctgtaatttg 5580 aggctggata gtatggatta tattattgat gttctttatg caagaaaact aaaaaaagag 5640 aacatcgtgc tttggtggaa tgagaaagct ccacttccag atcatggagg cattcaaaat 5700 gattttgatt taaatacatc atggataatg aatgattcag aatttcccaa aattaataac 5760 tcaggtgtgt atgacaatgt agttctcgat gttggtgttg ataatttaac agtgaacaca 5820 attttgacat cagcattaat caatgatgct gaaggcagtg atctagttaa caataatatg 5880 ggtatagatg acaaagatgc cgttattaac tcgccatctg aattcgtgca cgacgccttt 5940 tctaatgacg ctttgaatgt tttaagaggt atgttaaagg agtggtggga tgaggcccta 6000 aaagaaaatt caaccgcaga tttgttggta aattccctgg caagttgggt tcaaaacccg 6060 aatgcgaaac tattcgacgg attactaaga tatcacgttc ataacttaac aaaaaaagcc 6120 ttacttcaat tagtaaatga atttagtgca cttggctcaa ctattgtata tgcagacagg 6180 aatcaaattc taataaagac aaacaagtac tcacctgaaa actgttacgc ctacagccaa 6240 tatatgatga aggcagttag aacaaatcca atgtttagtt atctggactt aaatatcaaa 6300 cgttattggg atctgctaat atggatggat aagtttaatt ttagtggatt agcatgtatt 6360 gaaatagagg aaaaggaaaa tcaggattat accgctgttt cgcaatggca actaaagaag 6420 tttctgtcac caatatatca gcccgaattt gaggattgga tgatgatcat attggatagt 6480 atgctaaaga caaagcagag ctatctaaaa ttgaattcag ggacgcaaag acctacccaa 6540 atagttaatg taaaaaaaca agataaggaa gatagtgttg aaaactcgtt gaacggattt 6600 tctcaccttt tttccaaacc actaatgaaa agagtcaaaa agctttttaa aaaccagcaa 6660 gagttcattt tagatcctca gtatgaggca gactatgtta ttcctgttct tcctggttcc 6720 catctgaatg tgaaaaatcc ccttctagaa cttgtcaaat cactctgcca tgtcatgtta 6780 ctttcaaaga gtacaatttt agaaatcagg accctgagaa aagaactgct gaagatattt 6840 gaattgcgtg agtttgctaa agtagcggaa ttcaaagatc caagtttgag tctcgtggtg 6900 ccggattttt tatgtgaata ctgttttttc atttctgata ttgacttttg taaggcagct 6960 cctgaatcta ttttttcatg cgtcagatgt cacaaagcct ttaatcaagt attgttgcaa 7020 gaacacctga ttcaaaaact acgttctgat atcgaatcct atttaattca agatttgaga 7080 tgctccagat gtcataaagt gaaacgtgac tatatgagtg cccactgtcc atgtgccggc 7140 gcgtgggaag gaactctccc cagagaaagc attgttcaaa agttaaatgt gtttaagcaa 7200 gtagccaagt attacggttt tgatatatta ttgagttgta ttgctgattt gaccatatga 7260 gtaagcagta tataacgcga ggttcaatgg cctctttacc atgaaaaaaa aaaaaaaaaa 7320 aaaaaaaagg taaggaaaaa gagtattttc aattcgtttc tgaacatata aatataaata 7380 accgaaaaat tagcccttga acataattaa cactcttctt tgatatttaa atcacaagta 7440 cttttctttt attttcttct taatactttt ggaaataaaa tgaatgtgac cactccggaa 7500 gttgc 7505 <210> 4 <211> 2222 <212> PRT <213> Saccharomyces cerevisiae <400> 4 Met Met Phe Gly Lys Lys Lys Asn Asn Gly Gly Ser Ser Thr Ala Arg 1 5 10 15 Tyr Ser Ala Gly Asn Lys Tyr Asn Thr Leu Ser Asn Asn Tyr Ala Leu 20 25 30 Ser Ala Gln Gln Leu Leu Asn Ala Ser Lys Ile Asp Asp Ile Asp Ser 35 40 45 Met Met Gly Phe Glu Arg Tyr Val Pro Pro Gln Tyr Asn Gly Arg Phe 50 55 60 Asp Ala Lys Asp Ile Asp Gln Ile Pro Gly Arg Val Gly Trp Leu Thr 65 70 75 80 Asn Met His Ala Thr Leu Val Ser Gln Glu Thr Leu Ser Ser Gly Ser 85 90 95 Asn Gly Gly Gly Asn Ser Asn Asp Gly Glu Arg Val Thr Thr Asn Gln 100 105 110 Gly Ile Ser Gly Val Asp Phe Tyr Phe Leu Asp Glu Glu Gly Gly Ser 115 120 125 Phe Lys Ser Thr Val Val Tyr Asp Pro Tyr Phe Phe Ile Ala Cys Asn 130 135 140 Asp Glu Ser Arg Val Asn Asp Val Glu Glu Leu Val Lys Lys Tyr Leu 145 150 155 160 Glu Ser Cys Leu Lys Ser Leu Gln Ile Ile Arg Lys Glu Asp Leu Thr 165 170 175 Met Asp Asn His Leu Leu Gly Leu Gln Lys Thr Leu Ile Lys Leu Ser 180 185 190 Phe Val Asn Ser Asn Gln Leu Phe Glu Ala Arg Lys Leu Leu Arg Pro 195 200 205 Ile Leu Gln Asp Asn Ala Asn Asn Asn Val Gln Arg Asn Ile Tyr Asn 210 215 220 Val Ala Ala Asn Gly Ser Glu Lys Val Asp Ala Lys His Leu Ile Glu 225 230 235 240 Asp Ile Arg Glu Tyr Asp Val Pro Tyr His Val Arg Val Ser Ile Asp 245 250 255 Lys Asp Ile Arg Val Gly Lys Trp Tyr Lys Val Thr Gln Gln Gly Phe 260 265 270 Ile Glu Asp Thr Arg Lys Ile Ala Phe Ala Asp Pro Val Val Met Ala 275 280 285 Phe Asp Ile Glu Thr Thr Lys Pro Pro Leu Lys Phe Pro Asp Ser Ala 290 295 300 Val Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Glu Gly Phe 305 310 315 320 Leu Ile Thr Asn Arg Glu Ile Ile Ser Glu Asp Ile Glu Asp Phe Glu 325 330 335 Tyr Thr Pro Lys Pro Glu Tyr Pro Gly Phe Phe Thr Ile Phe Asn Glu 340 345 350 Asn Asp Glu Val Ala Leu Leu Gln Arg Phe Phe Glu His Ile Arg Asp 355 360 365 Val Arg Pro Thr Val Ile Ser Thr Phe Asn Gly Asp Phe Phe Asp Trp 370 375 380 Pro Phe Ile His Asn Arg Ser Lys Ile His Gly Leu Asp Met Phe Asp 385 390 395 400 Glu Ile Gly Phe Ala Pro Asp Ala Glu Gly Glu Tyr Lys Ser Ser Tyr 405 410 415 Cys Ser His Met Asp Cys Phe Arg Trp Val Lys Arg Asp Ser Tyr Leu 420 425 430 Pro Gln Gly Ser Gln Gly Leu Lys Ala Val Thr Gln Ser Lys Leu Gly 435 440 445 Tyr Asn Pro Ile Glu Leu Asp Pro Glu Leu Met Thr Pro Tyr Ala Phe 450 455 460 Glu Lys Pro Gln His Leu Ser Glu Tyr Ser Val Ser Asp Ala Val Ala 465 470 475 480 Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ser Leu 485 490 495 Cys Thr Ile Ile Pro Leu Asn Pro Asp Glu Thr Leu Arg Lys Gly Thr 500 505 510 Gly Thr Leu Cys Glu Met Leu Leu Met Val Gln Ala Tyr Gln His Asn 515 520 525 Ile Leu Leu Pro Asn Lys His Thr Asp Pro Ile Glu Arg Phe Tyr Asp 530 535 540 Gly His Leu Leu Glu Ser Glu Thr Tyr Val Gly Gly His Val Glu Ser 545 550 555 560 Leu Glu Ala Gly Val Phe Arg Ser Asp Leu Lys Asn Glu Phe Lys Ile 565 570 575 Asp Pro Ser Ala Ile Asp Glu Leu Leu Gln Glu Leu Pro Glu Ala Leu 580 585 590 Lys Phe Ser Val Glu Val Glu Asn Lys Ser Ser Val Asp Lys Val Thr 595 600 605 Asn Phe Glu Glu Ile Lys Asn Gln Ile Thr Gln Lys Leu Leu Glu Leu 610 615 620 Lys Glu Asn Asn Ile Arg Asn Glu Leu Pro Leu Ile Tyr His Val Asp 625 630 635 640 Val Ala Ser Met Tyr Pro Asn Ile Met Thr Thr Asn Arg Leu Gln Pro 645 650 655 Asp Ser Ile Lys Ala Glu Arg Asp Cys Ala Ser Cys Asp Phe Asn Arg 660 665 670 Pro Gly Lys Thr Cys Ala Arg Lys Leu Lys Trp Ala Trp Arg Gly Glu 675 680 685 Phe Phe Pro Ser Lys Met Asp Glu Tyr Asn Met Ile Lys Arg Ala Leu 690 695 700 Gln Asn Glu Thr Phe Pro Asn Lys Asn Lys Phe Ser Lys Lys Lys Val 705 710 715 720 Leu Thr Phe Asp Glu Leu Ser Tyr Ala Asp Gln Val Ile His Ile Lys 725 730 735 Lys Arg Leu Thr Glu Tyr Ser Arg Lys Val Tyr His Arg Val Lys Val 740 745 750 Ser Glu Ile Val Glu Arg Glu Ala Ile Val Cys Gln Arg Glu Asn Pro 755 760 765 Phe Tyr Val Asp Thr Val Lys Ser Phe Arg Asp Arg Arg Tyr Glu Phe 770 775 780 Lys Gly Leu Ala Lys Thr Trp Lys Gly Asn Leu Ser Lys Ile Asp Pro 785 790 795 800 Ser Asp Lys His Ala Arg Asp Glu Ala Lys Lys Met Ile Val Leu Tyr 805 810 815 Asp Ser Leu Gln Leu Ala His Lys Val Ile Leu Asn Ser Phe Tyr Gly 820 825 830 Tyr Val Met Arg Lys Gly Ser Arg Trp Tyr Ser Met Glu Met Ala Gly 835 840 845 Ile Thr Cys Leu Thr Gly Ala Thr Ile Ile Gln Met Ala Arg Ala Leu 850 855 860 Val Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp 865 870 875 880 Cys Ile Leu Pro Lys Ser Phe Pro Glu Thr Tyr Phe Phe Thr Leu Glu 885 890 895 Asn Gly Lys Lys Leu Tyr Leu Ser Tyr Pro Cys Ser Met Leu Asn Tyr 900 905 910 Arg Val His Gln Lys Phe Thr Asn His Gln Tyr Gln Glu Leu Lys Asp 915 920 925 Pro Leu Asn Tyr Ile Tyr Glu Thr His Ser Glu Asn Thr Ile Phe Phe 930 935 940 Glu Val Asp Gly Pro Tyr Lys Ala Met Ile Leu Pro Ser Ser Lys Glu 945 950 955 960 Glu Gly Lys Gly Ile Lys Lys Arg Tyr Ala Val Phe Asn Glu Asp Gly 965 970 975 Ser Leu Ala Glu Leu Lys Gly Phe Glu Leu Lys Arg Arg Gly Glu Leu 980 985 990 Gln Leu Ile Lys Asn Phe Gln Ser Asp Ile Phe Lys Val Phe Leu Glu 995 1000 1005 Gly Asp Thr Leu Glu Gly Cys Tyr Ser Ala Val Ala Ser Val Cys Asn 1010 1015 1020 Arg Trp Leu Asp Val Leu Asp Ser His Gly Leu Met Leu Glu Asp Glu 1025 1030 1035 1040 Asp Leu Val Ser Leu Ile Cys Glu Asn Arg Ser Met Ser Lys Thr Leu 1045 1050 1055 Lys Glu Tyr Glu Gly Gln Lys Ser Thr Ser Ile Thr Thr Ala Arg Arg 1060 1065 1070 Leu Gly Asp Phe Leu Gly Glu Asp Met Val Lys Asp Lys Gly Leu Gln 1075 1080 1085 Cys Lys Tyr Ile Ile Ser Ser Lys Pro Phe Asn Ala Pro Val Thr Glu 1090 1095 1100 Arg Ala Ile Pro Val Ala Ile Phe Ser Ala Asp Ile Pro Ile Lys Arg 1105 1110 1115 1120 Ser Phe Leu Arg Arg Trp Thr Leu Asp Pro Ser Leu Glu Asp Leu Asp 1125 1130 1135 Ile Arg Thr Ile Ile Asp Trp Gly Tyr Tyr Arg Glu Arg Leu Gly Ser 1140 1145 1150 Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln Gly Val Ser 1155 1160 1165 Asn Pro Val Pro Arg Val Glu His Pro Asp Trp Leu Lys Arg Lys Ile 1170 1175 1180 Ala Thr Lys Glu Asp Lys Phe Lys Gln Thr Ser Leu Thr Lys Phe Phe 1185 1190 1195 1200 Ser Lys Thr Lys Asn Val Pro Thr Met Gly Lys Ile Lys Asp Ile Glu 1205 1210 1215 Asp Leu Phe Glu Pro Thr Val Glu Glu Asp Asn Ala Lys Ile Lys Ile 1220 1225 1230 Ala Arg Thr Thr Lys Lys Lys Ala Val Ser Lys Arg Lys Arg Asn Gln 1235 1240 1245 Leu Thr Asn Glu Glu Asp Pro Leu Val Leu Pro Ser Glu Ile Pro Ser 1250 1255 1260 Met Asp Glu Asp Tyr Val Gly Trp Leu Asn Tyr Gln Lys Ile Lys Trp 1265 1270 1275 1280 Lys Ile Gln Ala Arg Asp Arg Lys Arg Arg Asp Gln Leu Phe Gly Asn 1285 1290 1295 Thr Asn Ser Ser Arg Glu Arg Ser Ala Leu Gly Ser Met Ile Arg Lys 1300 1305 1310 Gln Ala Glu Ser Tyr Ala Asn Ser Thr Trp Glu Val Leu Gln Tyr Lys 1315 1320 1325 Asp Ser Gly Glu Pro Gly Val Leu Glu Val Phe Val Thr Ile Asn Gly 1330 1335 1340 Lys Val Gln Asn Ile Thr Phe His Ile Pro Lys Thr Ile Tyr Met Lys 1345 1350 1355 1360 Phe Lys Ser Gln Thr Met Pro Leu Gln Lys Ile Lys Asn Cys Leu Ile 1365 1370 1375 Glu Lys Ser Ser Ala Ser Leu Pro Asn Asn Pro Lys Thr Ser Asn Pro 1380 1385 1390 Ala Gly Gly Gln Leu Phe Lys Ile Thr Leu Pro Glu Ser Val Phe Leu 1395 1400 1405 Glu Glu Lys Glu Asn Cys Thr Ser Ile Phe Asn Asp Glu Asn Val Leu 1410 1415 1420 Gly Val Phe Glu Gly Thr Ile Thr Pro His Gln Arg Ala Ile Met Asp 1425 1430 1435 1440 Leu Gly Ala Ser Val Thr Phe Arg Ser Lys Ala Met Gly Ala Leu Gly 1445 1450 1455 Lys Gly Ile Gln Gln Gly Phe Glu Met Lys Asp Leu Ser Met Ala Glu 1460 1465 1470 Asn Glu Arg Tyr Leu Ser Gly Phe Ser Met Asp Ile Gly Tyr Leu Leu 1475 1480 1485 His Phe Pro Thr Ser Ile Gly Tyr Glu Phe Phe Ser Leu Phe Lys Ser 1490 1495 1500 Trp Gly Asp Thr Ile Thr Ile Leu Val Leu Lys Pro Ser Asn Gln Ala 1505 1510 1515 1520 Gln Glu Ile Asn Ala Ser Ser Leu Gly Gln Ile Tyr Lys Gln Met Phe 1525 1530 1535 Glu Lys Lys Lys Gly Lys Ile Glu Thr Tyr Ser Tyr Leu Val Asp Ile 1540 1545 1550 Lys Glu Asp Ile Asn Phe Glu Phe Val Tyr Phe Thr Asp Ile Ser Lys 1555 1560 1565 Leu Tyr Arg Arg Leu Ser Gln Glu Thr Thr Lys Leu Lys Glu Glu Arg 1570 1575 1580 Gly Leu Gln Phe Leu Leu Leu Leu Gln Ser Pro Phe Ile Thr Lys Leu 1585 1590 1595 1600 Leu Gly Thr Ile Arg Leu Leu Asn Gln Met Pro Ile Val Lys Leu Ser 1605 1610 1615 Leu Asn Glu Val Leu Leu Pro Gln Leu Asn Trp Gln Pro Thr Leu Leu 1620 1625 1630 Lys Lys Leu Val Asn His Val Leu Ser Ser Gly Ser Trp Ile Ser His 1635 1640 1645 Leu Ile Lys Leu Ser Gln Tyr Ser Asn Ile Pro Ile Cys Asn Leu Arg 1650 1655 1660 Leu Asp Ser Met Asp Tyr Ile Ile Asp Val Leu Tyr Ala Arg Lys Leu 1665 1670 1675 1680 Lys Lys Glu Asn Ile Val Leu Trp Trp Asn Glu Lys Ala Pro Leu Pro 1685 1690 1695 Asp His Gly Gly Ile Gln Asn Asp Phe Asp Leu Asn Thr Ser Trp Ile 1700 1705 1710 Met Asn Asp Ser Glu Phe Pro Lys Ile Asn Asn Ser Gly Val Tyr Asp 1715 1720 1725 Asn Val Val Leu Asp Val Gly Val Asp Asn Leu Thr Val Asn Thr Ile 1730 1735 1740 Leu Thr Ser Ala Leu Ile Asn Asp Ala Glu Gly Ser Asp Leu Val Asn 1745 1750 1755 1760 Asn Asn Met Gly Ile Asp Asp Lys Asp Ala Val Ile Asn Ser Pro Ser 1765 1770 1775 Glu Phe Val His Asp Ala Phe Ser Asn Asp Ala Leu Asn Val Leu Arg 1780 1785 1790 Gly Met Leu Lys Glu Trp Trp Asp Glu Ala Leu Lys Glu Asn Ser Thr 1795 1800 1805 Ala Asp Leu Leu Val Asn Ser Leu Ala Ser Trp Val Gln Asn Pro Asn 1810 1815 1820 Ala Lys Leu Phe Asp Gly Leu Leu Arg Tyr His Val His Asn Leu Thr 1825 1830 1835 1840 Lys Lys Ala Leu Leu Gln Leu Val Asn Glu Phe Ser Ala Leu Gly Ser 1845 1850 1855 Thr Ile Val Tyr Ala Asp Arg Asn Gln Ile Leu Ile Lys Thr Asn Lys 1860 1865 1870 Tyr Ser Pro Glu Asn Cys Tyr Ala Tyr Ser Gln Tyr Met Met Lys Ala 1875 1880 1885 Val Arg Thr Asn Pro Met Phe Ser Tyr Leu Asp Leu Asn Ile Lys Arg 1890 1895 1900 Tyr Trp Asp Leu Leu Ile Trp Met Asp Lys Phe Asn Phe Ser Gly Leu 1905 1910 1915 1920 Ala Cys Ile Glu Ile Glu Glu Lys Glu Asn Gln Asp Tyr Thr Ala Val 1925 1930 1935 Ser Gln Trp Gln Leu Lys Lys Phe Leu Ser Pro Ile Tyr Gln Pro Glu 1940 1945 1950 Phe Glu Asp Trp Met Met Ile Ile Leu Asp Ser Met Leu Lys Thr Lys 1955 1960 1965 Gln Ser Tyr Leu Lys Leu Asn Ser Gly Thr Gln Arg Pro Thr Gln Ile 1970 1975 1980 Val Asn Val Lys Lys Gln Asp Lys Glu Asp Ser Val Glu Asn Ser Leu 1985 1990 1995 2000 Asn Gly Phe Ser His Leu Phe Ser Lys Pro Leu Met Lys Arg Val Lys 2005 2010 2015 Lys Leu Phe Lys Asn Gln Gln Glu Phe Ile Leu Asp Pro Gln Tyr Glu 2020 2025 2030 Ala Asp Tyr Val Ile Pro Val Leu Pro Gly Ser His Leu Asn Val Lys 2035 2040 2045 Asn Pro Leu Leu Glu Leu Val Lys Ser Leu Cys His Val Met Leu Leu 2050 2055 2060 Ser Lys Ser Thr Ile Leu Glu Ile Arg Thr Leu Arg Lys Glu Leu Leu 2065 2070 2075 2080 Lys Ile Phe Glu Leu Arg Glu Phe Ala Lys Val Ala Glu Phe Lys Asp 2085 2090 2095 Pro Ser Leu Ser Leu Val Val Pro Asp Phe Leu Cys Glu Tyr Cys Phe 2100 2105 2110 Phe Ile Ser Asp Ile Asp Phe Cys Lys Ala Ala Pro Glu Ser Ile Phe 2115 2120 2125 Ser Cys Val Arg Cys His Lys Ala Phe Asn Gln Val Leu Leu Gln Glu 2130 2135 2140 His Leu Ile Gln Lys Leu Arg Ser Asp Ile Glu Ser Tyr Leu Ile Gln 2145 2150 2155 2160 Asp Leu Arg Cys Ser Arg Cys His Lys Val Lys Arg Asp Tyr Met Ser 2165 2170 2175 Ala His Cys Pro Cys Ala Gly Ala Trp Glu Gly Thr Leu Pro Arg Glu 2180 2185 2190 Ser Ile Val Gln Lys Leu Asn Val Phe Lys Gln Val Ala Lys Tyr Tyr 2195 2200 2205 Gly Phe Asp Ile Leu Leu Ser Cys Ile Ala Asp Leu Thr Ile 2210 2215 2220 <210> 5 <211> 12 <212> PRT <213> Escherichia coli <400> 5 Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn 1 5 10 <210> 6 <211> 12 <212> PRT <213> Haemophilus influenzae <400> 6 Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn 1 5 10 <210> 7 <211> 12 <212> PRT <213> Salmonella typhimurium <400> 7 Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn 1 5 10 <210> 8 <211> 12 <212> PRT <213> Vibrio cholerae <400> 8 Ile Val Val Leu Asp Thr Glu Thr Thr Gly Met Asn 1 5 10 <210> 9 <211> 12 <212> PRT <213> Pseudomonas aeruginosa <400> 9 Ser Val Val Leu Asp Thr Glu Thr Thr Gly Met Pro 1 5 10 <210> 10 <211> 12 <212> PRT <213> Neisseria meningitidis <400> 10 Gln Ile Ile Leu Asp Thr Glu Thr Thr Gly Leu Tyr 1 5 10 <210> 11 <211> 12 <212> PRT <213> Chlamydia trachomatis <400> 11 Phe Val Cys Leu Asp Cys Glu Thr Thr Gly Leu Asp 1 5 10 <210> 12 <211> 12 <212> PRT <213> Streptomyces coelicolor <400> 12 Leu Ala Ala Phe Asp Thr Glu Thr Thr Gly Val Asp 1 5 10 <210> 13 <211> 12 <212> PRT <213> Shigella flexneri 2a str. 301 <400> 13 Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn 1 5 10 <210> 14 <211> 12 <212> PRT <213> Staphylococcus aureus <400> 14 Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser 1 5 10 <210> 15 <211> 12 <212> PRT <213> Bacillus subtilis <400> 15 Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser 1 5 10 <210> 16 <211> 12 <212> PRT <213> Mycoplasma pulmonis <400> 16 Tyr Val Val Tyr Asp Ile Glu Thr Thr Gly Leu Ser 1 5 10 <210> 17 <211> 12 <212> PRT <213> Mycoplasma genitalium <400> 17 Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His 1 5 10 <210> 18 <211> 12 <212> PRT <213> Mycoplasma pneumoniae <400> 18 Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His 1 5 10 <210> 19 <211> 12 <212> PRT <213> Saccharomyces cerevisiae <400> 19 Ile Met Ser Phe Asp Ile Glu Cys Ala Gly Arg Ile 1 5 10 <210> 20 <211> 12 <212> PRT <213> Saccharomyces cerevisiae <400> 20 Val Met Ala Phe Asp Ile Glu Thr Thr Lys Pro Pro 1 5 10 <210> 21 <211> 12 <212> PRT <213> Mus musculus <400> 21 Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 22 <211> 12 <212> PRT <213> Mus musculus <400> 22 Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro 1 5 10 <210> 23 <211> 12 <212> PRT <213> Homo sapiens <400> 23 Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 24 <211> 12 <212> PRT <213> Homo sapiens <400> 24 Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro 1 5 10 <210> 25 <211> 12 <212> PRT <213> Oryza sativa <400> 25 Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 26 <211> 12 <212> PRT <213> Arabidopsis thaliana <400> 26 Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 27 <211> 12 <212> PRT <213> Arabidopsis thaliana <400> 27 Val Cys Ala Phe Asp Ile Glu Thr Val Lys Leu Pro 1 5 10 <210> 28 <211> 12 <212> PRT <213> Rattus norvegicus <400> 28 Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 29 <211> 12 <212> PRT <213> Bos taurus <400> 29 Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 30 <211> 12 <212> PRT <213> Glycine max <400> 30 Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 31 <211> 12 <212> PRT <213> Drosophila melanogaster <400> 31 Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys 1 5 10 <210> 32 <211> 12 <212> PRT <213> Drosophila melanogaster <400> 32 Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro 1 5 10 <210> 33 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Mutated pol delta <400> 33 atcatgtcct ttgctatcgc ttgtgctggt aggatt 36 <210> 34 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Mutated pol delta <400> 34 Ile Met Ser Phe Ala Ile Ala Cys Ala Gly Arg Ile 1 5 10 <210> 35 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Mutated pol epsilon <400> 35 gtaatggcat ttgctatagc taccacgaag ccgcct 36 <210> 36 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Mutated pol epsilon <400> 36 Val Met Ala Phe Ala Ile Ala Thr Thr Lys Pro Pro 1 5 10 <210> 37 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Primer <400> 37 cccgagctca tgagtgaaaa aagatccctt 30 <210> 38 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Primer <400> 38 cccgcggccg cttaccattt gcttaattgt 30 <210> 39 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Primer <400> 39 cccgagctca tgatgtttgg caagaaaaaa 30 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence:Primer <400> 40 cccgcggccg ctcatatggt caaatcagca 30 <210> 41 <211> 1592 <212> DNA <213> Escherichia coli <400> 41 gaattcaaat acaaaaaaac cgcaaaatta aaaatcttgc ggctctctga actcattttc 60 atgagtgaat agtggcggaa cggacgggac tcgaacccgc gaccccctgc gtgacaggca 120 ggtattcaac cgactgaact accgctccgc gttgtgttcc gttgggaacg aggcgaatag 180 ttacgaattg cctcgacctc gtcaacggtt tttctatctt ttgaatcgtt tgctgcaaaa 240 atcgcccaag tcgctatttt tagcgccttt cacaggtatt tatgctcgcc agaggcaact 300 tccgcctttc ttctgcacca gatcgagacg ggcttcatga gctgcaatct cttcatctgt 360 cgcaaaaaca acgcgtaact tacttgcctg acgtacaatg cgctgaattg ttgcttcacc 420 ttgttgctgt tgtgtctctc cttccatcgc aaaagccatc gacgtttgac caccggtcat 480 cgccagataa acttccgcaa ggatctgggc atcgagtaat gccccgtgca gcgttcgttt 540 actgttatct atttcgtagc gagcacataa cgcatcgagg ctgttgcgct taccgggaaa 600 cattttcctc gccaccgcaa ggctatcggt gaccttacag aaagtattgg tcttcggaat 660 atcgcgctta agcaacgaaa actcgtagtc cataaagccg atatcgaacg ctgcgttatg 720 gatcaccaac tccgcgccgc gaatatagtc catgaactca tcggctactt cggcaaacgt 780 gggcttatcg agcaaaaatt catcggcaat accatgtacg ccaaaggctt ccggatccac 840 cagccgatcg ggtttgagat aaacatggaa gttattgccc gtcaggcgac ggttcaccac 900 ttcaacggca ccaatctcaa tgatcttgtg gccttcatag tgcgcaccaa tctggttcat 960 accggtggtt tcggtatcga gaacgatctg gcgtgtaatt gcagtgctca tagcggtcat 1020 ttatgtcaga cttgtcgttt tacagttcga ttcaattaca ggaagtctac cagagatgct 1080 taaacaggta gaaattttca ccgatggttc gtgtctgggc aatccaggac ctgggggtta 1140 cggcgctatt ttacgctatc gcggacgcga gaaaaccttt agcgctggct acacccgcac 1200 caccaacaac cgtatggagt tgatggccgc tattgtcgcg ctggaggcgt taaaagaaca 1260 ttgcgaagtc attttgagta ccgacagcca gtatgtccgc cagggtatca cccagtggat 1320 ccataactgg aaaaaacgtg gctggaaaac cgcagacaaa aaaccagtaa aaaatgtcga 1380 tctctggcaa cgtcttgatg ctgcattggg gcagcatcaa atcaaatggg aatgggttaa 1440 aggccatgcc ggacacccgg aaaacgaacg ctgtgatgaa ctggctcgtg ccgcggcgat 1500 gaatcccaca ctggaagata caggctacca agttgaagtt taagcctgtg gtttacgaca 1560 ttgccgggtg gctccaaccg cctagcgaat tc 1592 <210> 42 <211> 243 <212> PRT <213> Escherichia coli <400> 42 Met Ser Thr Ala Ile Thr Arg Gln Ile Val Leu Asp Thr Glu Thr Thr 1 5 10 15 Gly Met Asn Gln Ile Gly Ala His Tyr Glu Gly His Lys Ile Ile Glu 20 25 30 Ile Gly Ala Val Glu Val Val Asn Arg Arg Leu Thr Gly Asn Asn Phe 35 40 45 His Val Tyr Leu Lys Pro Asp Arg Leu Val Asp Pro Glu Ala Phe Gly 50 55 60 Val His Gly Ile Ala Asp Glu Phe Leu Leu Asp Lys Pro Thr Phe Ala 65 70 75 80 Glu Val Ala Asp Glu Phe Met Asp Tyr Ile Arg Gly Ala Glu Leu Val 85 90 95 Ile His Asn Ala Ala Phe Asp Ile Gly Phe Met Asp Tyr Glu Phe Ser 100 105 110 Leu Leu Lys Arg Asp Ile Pro Lys Thr Asn Thr Phe Cys Lys Val Thr 115 120 125 Asp Ser Leu Ala Val Ala Arg Lys Met Phe Pro Gly Lys Arg Asn Ser 130 135 140 Leu Asp Ala Leu Cys Ala Arg Tyr Glu Ile Asp Asn Ser Lys Arg Thr 145 150 155 160 Leu His Gly Ala Leu Leu Asp Ala Gln Ile Leu Ala Glu Val Tyr Leu 165 170 175 Ala Met Thr Gly Gly Gln Thr Ser Met Ala Phe Ala Met Glu Gly Glu 180 185 190 Thr Gln Gln Gln Gln Gly Glu Ala Thr Ile Gln Arg Ile Val Arg Gln 195 200 205 Ala Ser Lys Leu Arg Val Val Phe Ala Thr Asp Glu Glu Ile Ala Ala 210 215 220 His Glu Ala Arg Leu Asp Leu Val Gln Lys Lys Gly Gly Ser Cys Leu 225 230 235 240 Trp Arg Ala <210> 43 <211> 4866 <212> DNA <213> Bacillus subtilis <400> 43 ggtaccgctt cacttatgat gtttttaggg agggatactg tcttaatgga acagttatca 60 gtaaacagaa ggcagtttca aattcttctg cagcagatta atatgacaga tgataccttc 120 atgacatact ttgaacatgg cgagattaaa aagctgacaa ttcacaaagc ttctaagtct 180 tggcattttc attttcaatt taaatctttg ctgccttttc aaatatatga cacattaaca 240 acgaggctga cgcaatcgtt tgcccacata gcaaaagtga catcttcaat tgaagttcag 300 gatgccgagg tcagtgaaag tatcgttcaa gactactggt cacgctgcat tgaagaactg 360 cagggcattt cgccgccgat tatcagtctt ttaaaccagc aaaaaccgaa gctgaagggc 420 aataaactga ttgtcaaaac caaaacagat acagaagcgg ctgcgctaaa gaacaaatac 480 agttccatga ttcaagcaga ataccgtcaa tttggctttc cggatcttca gcttgatgct 540 gaaatatttg tatccgagca agaagttcaa aagtttcggg agcaaaagct tgcggaagac 600 caagagcggg ctatgcaggc cttgattgaa atggagaaga aagataaaga aagtgatgaa 660 gaccaagcac catctggtcc tcttgttatc ggttatcaaa ttaaagataa cgaggaaatc 720 cgaacacttg acagcatcat ggacgaagaa cggagaatta cggtccaagg ttatgtgttt 780 gatgtggaga cgcgcgagct gaagagcggg cgcacgctgt gtatcttcaa aattacagac 840 tatacaaata gtattttgat caaaatgttt gcacgtgaaa aagaagatgc ggcgctgatg 900 aagtctctga aaaaaggaat gtgggtaaaa gcacgcggaa gcattcaaaa tgatacattt 960 gtcagagacc ttgtcatgat cgcaaatgac gtaaacgaaa taaaagcaaa aacccgtgaa 1020 gattcagcac ctgaaggaga aaaaagagtg gaattgcatc ttcattcccc aatgagccaa 1080 atggatgctg ttacgggtat cggaaagctt gtcgaacagg cgaaaaaatg ggggcatgag 1140 gccatcgctt tgaccgacca tgctgtcgtt caatccttcc ctgatgcgta ttctgcggcc 1200 aaaaagcatg gaattaaaat gatttacggg atggaagcga atctcgtgga tgatggcgtg 1260 ccaattgctt ataatgccgc acatcgtctg ctcgaagaag aaacatatgt tgtttttgac 1320 gttgagacga caggattgtc tgctgtatac gataccatta ttgagctggc tgcagtaaaa 1380 gtaaaaggcg gagaaattat tgataaattt gaggcgtttg cgaacccgca tcgtccgctt 1440 tccgccacaa tcatagagct gacagggatc acagatgata tgctacaaga cgctccggat 1500 gtcgtagatg taataagaga tttcagagaa tggattggcg atgatattct tgtcgctcat 1560 aatgcaagct ttgatatggg attcttaaat gtagcctata aaaaacttct tgaagtcgaa 1620 aaagctaaaa acccagtcat tgatacgctt gaacttggac gttttctcta tccggaattt 1680 aagaaccacc ggttgaacac actttgtaaa aagtttgata tcgagctcac acagcatcac 1740 cgtgcgatct atgatactga ggcaaccgct tatttgcttc tgaaaatgct gaaagacgca 1800 gctgaaaaag gtattcagta ccatgatgag ttgaatgaaa atatgggtca gtccaatgct 1860 tatcaaagat caagaccgta tcatgcaaca ttacttgccg tgaacagcac gggacttaaa 1920 aatttattta agcttgtgtc actttctcat attcattatt tttacagagt gccgcgtatt 1980 ccgagatctc agcttgagaa atacagggaa gggcttctga tcggttctgc ttgtgacagg 2040 ggagaggttt ttgagggaat gatgcaaaaa tcgcctgaag aggtggaaga tatcgcgtca 2100 ttctatgatt accttgaggt tcagccgcct gaagtgtatc gtcacttgct ggagcttgaa 2160 ctggtccgtg atgaaaaagc gctgaaagaa attattgcga atatcacgaa gctgggggaa 2220 aagcttaata aaccggttgt tgctacggga aatgttcatt acttgaatga tgaggataaa 2280 atctacagaa agattttaat atcctcacaa ggcggggcaa atccgctgaa taggcatgaa 2340 ctgccgaaag tgcatttcag aacgacagac gaaatgcttg aagctttttc tttcttaggt 2400 gaagaaaaag cgaaggagat cgtagtcacc aatacccaaa aggttgcttc tttagttgat 2460 gacatcaagc cgattaaaga tgatttatat acgccgaaaa tcgaaggcgc tgatgaagag 2520 atcagagaaa tgagctatca gcgtgcaaga agcatttacg gggaagagct gcctgaaatt 2580 gtcgaagcgc ggattgaaaa agagttaaag agtattattg gccacggatt tgctgttatt 2640 tacttgatct ctcacaaact tgtaaaacgt tcactagatg acgggtatct cgttggttcc 2700 cgtggttccg taggatcttc attagttgcg acacttactg agattactga ggtaaacccg 2760 ctgccgccgc actatgtttg tcctgagtgc cagcattctg agttctttaa tgacggttct 2820 gtcggttctg gttttgacct gcctgacaag acatgccctc attgcggaac gcctttgaaa 2880 aaagacggcc atgatattcc atttgaaacg ttcttaggat ttaaagggga caaagtacct 2940 gatatcgatt tgaacttctc aggggaatat cagccgcaag cacacaatta cacaaaagta 3000 ttgttcggag aagacaatgt atatcgtgcg ggaacaatag gcacggtggc agaaaaaaca 3060 gcctacggtt atgtaaaagg ctatgccgga gacaacaatc ttcatatgcg cggtgccgaa 3120 atagatcggc tcgtacaggg atgcacaggt gtaaaacgta caactggaca gcaccctggc 3180 ggtattatcg tagttccgga ttatatggat atttatgatt tttcaccgat ccagttcccg 3240 gcagatgcca caggttcaga gtggaaaacg actcattttg atttccactc catccatgac 3300 aacctgttaa aacttgatat tctcggacac gatgacccga ctgttattcg gatgcttcaa 3360 gacttaagcg gaatagatcc gaaaacaatt ccgacggatg atcctgaagt gatgaagatc 3420 ttccagggaa ccgaatcact cggtgtgact gaagaacaga ttggctgtaa aacgggcact 3480 cttggaattc ctgaattcgg aacccgattt gtccggcaga tgcttgaaga tacaaagccg 3540 accacttttt ctgagctcgt tcagatttca ggcttgtctc acggaactga tgtatggctt 3600 ggcaatgcac aggagctcat ccacaataat atttgtgagc tgagtgaggt tatcggctgc 3660 cgtgatgaca ttatggttta tttaatctat caaggccttg agccgtccct tgcctttaaa 3720 atcatggaat tcgtgcgtaa aggaaaagga ttaacgcctg aatgggaaga agaaatgaaa 3780 aataacaatg tcccagactg gtatattgat tcctgtaaaa agattaaata catgttcccg 3840 aaagcccacg ccgcggcata tgtcttaatg gcagtccgca ttgcttactt taaagtgcat 3900 catgctcttt tgtattatgc ggcttatttt accgttcgtg cagatgactt tgatattgat 3960 acaatgatca agggctctac agcaatcaga gcggtaatgg aggatataaa cgctaaagga 4020 cttgatgctt caccgaagga aaagaacctt ctgactgttt tagaattagc gcttgagatg 4080 tgtgagagag gctattcatt ccaaaaagtc gatttatatc gctccagcgc cacagagttt 4140 attattgacg gcaacagtct tattccgccg tttaactcta ttccagggtt agggacgaac 4200 gctgctttga acattgtaaa agctcgcgaa gaaggcgaat tcctctcaaa agaagatttg 4260 caaaagagag ggaaagtatc aaaaacgatt ttagagtact tagatcgcca tggctgtctg 4320 gagtcactgc ctgatcaaaa ccaattgtca ctgttctaat atggaaagca gaatttctca 4380 gaaattctgc ttctatgcat acataagcgc aaaaagtgcc atcgtaatat tagagtttct 4440 gtcacttgct taggtatgaa ggtaagcgta tatccatttg caataaaaat atggttatgg 4500 tatagtttta ttggaaatgc taacgattac cgaggcaaag agtggggaaa cccgctcttt 4560 tgtattgaac aggagaattt tgtctcgaca tgttcatcgt ttacttttta gcccctgctc 4620 ttttgaagca gggtttttat gcagagtgac gagacgaata tgagatcgac agcacaagga 4680 ggaagaacat gagcaaaaaa gtgactgaca ccgttcaaga aatggctcag ccaatcgtag 4740 acagccttca gctggaactc gttgacattg aatttgtcaa agagggccaa agctggttcc 4800 ttcgcgtgtt tattgattcc gatgacggtg tggatattga ggaatgtgcc aaagtaagcg 4860 aagctt 4866 <210> 44 <211> 1437 <212> PRT <213> Bacillus subtilis <400> 44 Met Glu Gln Leu Ser Val Asn Arg Arg Gln Phe Gln Ile Leu Leu Gln 1 5 10 15 Gln Ile Asn Met Thr Asp Asp Thr Phe Met Thr Tyr Phe Glu His Gly 20 25 30 Glu Ile Lys Lys Leu Thr Ile His Lys Ala Ser Lys Ser Trp His Phe 35 40 45 His Phe Gln Phe Lys Ser Leu Leu Pro Phe Gln Ile Tyr Asp Thr Leu 50 55 60 Thr Thr Arg Leu Thr Gln Ser Phe Ala His Ile Ala Lys Val Thr Ser 65 70 75 80 Ser Ile Glu Val Gln Asp Ala Glu Val Ser Glu Ser Ile Val Gln Asp 85 90 95 Tyr Trp Ser Arg Cys Ile Glu Glu Leu Gln Gly Ile Ser Pro Pro Ile 100 105 110 Ile Ser Leu Leu Asn Gln Gln Lys Pro Lys Leu Lys Gly Asn Lys Leu 115 120 125 Ile Val Lys Thr Lys Thr Asp Thr Glu Ala Ala Ala Leu Lys Asn Lys 130 135 140 Tyr Ser Ser Met Ile Gln Ala Glu Tyr Arg Gln Phe Gly Phe Pro Asp 145 150 155 160 Leu Gln Leu Asp Ala Glu Ile Phe Val Ser Glu Gln Glu Val Gln Lys 165 170 175 Phe Arg Glu Gln Lys Leu Ala Glu Asp Gln Glu Arg Ala Met Gln Ala 180 185 190 Leu Ile Glu Met Glu Lys Lys Asp Lys Glu Ser Asp Glu Asp Gln Ala 195 200 205 Pro Ser Gly Pro Leu Val Ile Gly Tyr Gln Ile Lys Asp Asn Glu Glu 210 215 220 Ile Arg Thr Leu Asp Ser Ile Met Asp Glu Glu Arg Arg Ile Thr Val 225 230 235 240 Gln Gly Tyr Val Phe Asp Val Glu Thr Arg Glu Leu Lys Ser Gly Arg 245 250 255 Thr Leu Cys Ile Phe Lys Ile Thr Asp Tyr Thr Asn Ser Ile Leu Ile 260 265 270 Lys Met Phe Ala Arg Glu Lys Glu Asp Ala Ala Leu Met Lys Ser Leu 275 280 285 Lys Lys Gly Met Trp Val Lys Ala Arg Gly Ser Ile Gln Asn Asp Thr 290 295 300 Phe Val Arg Asp Leu Val Met Ile Ala Asn Asp Val Asn Glu Ile Lys 305 310 315 320 Ala Lys Thr Arg Glu Asp Ser Ala Pro Glu Gly Glu Lys Arg Val Glu 325 330 335 Leu His Leu His Ser Pro Met Ser Gln Met Asp Ala Val Thr Gly Ile 340 345 350 Gly Lys Leu Val Glu Gln Ala Lys Lys Trp Gly His Glu Ala Ile Ala 355 360 365 Leu Thr Asp His Ala Val Val Gln Ser Phe Pro Asp Ala Tyr Ser Ala 370 375 380 Ala Lys Lys His Gly Ile Lys Met Ile Tyr Gly Met Glu Ala Asn Leu 385 390 395 400 Val Asp Asp Gly Val Pro Ile Ala Tyr Asn Ala Ala His Arg Leu Leu 405 410 415 Glu Glu Glu Thr Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser 420 425 430 Ala Val Tyr Asp Thr Ile Ile Glu Leu Ala Ala Val Lys Val Lys Gly 435 440 445 Gly Glu Ile Ile Asp Lys Phe Glu Ala Phe Ala Asn Pro His Arg Pro 450 455 460 Leu Ser Ala Thr Ile Ile Glu Leu Thr Gly Ile Thr Asp Asp Met Leu 465 470 475 480 Gln Asp Ala Pro Asp Val Val Asp Val Ile Arg Asp Phe Arg Glu Trp 485 490 495 Ile Gly Asp Asp Ile Leu Val Ala His Asn Ala Ser Phe Asp Met Gly 500 505 510 Phe Leu Asn Val Ala Tyr Lys Lys Leu Leu Glu Val Glu Lys Ala Lys 515 520 525 Asn Pro Val Ile Asp Thr Leu Glu Leu Gly Arg Phe Leu Tyr Pro Glu 530 535 540 Phe Lys Asn His Arg Leu Asn Thr Leu Cys Lys Lys Phe Asp Ile Glu 545 550 555 560 Leu Thr Gln His His Arg Ala Ile Tyr Asp Thr Glu Ala Thr Ala Tyr 565 570 575 Leu Leu Leu Lys Met Leu Lys Asp Ala Ala Glu Lys Gly Ile Gln Tyr 580 585 590 His Asp Glu Leu Asn Glu Asn Met Gly Gln Ser Asn Ala Tyr Gln Arg 595 600 605 Ser Arg Pro Tyr His Ala Thr Leu Leu Ala Val Asn Ser Thr Gly Leu 610 615 620 Lys Asn Leu Phe Lys Leu Val Ser Leu Ser His Ile His Tyr Phe Tyr 625 630 635 640 Arg Val Pro Arg Ile Pro Arg Ser Gln Leu Glu Lys Tyr Arg Glu Gly 645 650 655 Leu Leu Ile Gly Ser Ala Cys Asp Arg Gly Glu Val Phe Glu Gly Met 660 665 670 Met Gln Lys Ser Pro Glu Glu Val Glu Asp Ile Ala Ser Phe Tyr Asp 675 680 685 Tyr Leu Glu Val Gln Pro Pro Glu Val Tyr Arg His Leu Leu Glu Leu 690 695 700 Glu Leu Val Arg Asp Glu Lys Ala Leu Lys Glu Ile Ile Ala Asn Ile 705 710 715 720 Thr Lys Leu Gly Glu Lys Leu Asn Lys Pro Val Val Ala Thr Gly Asn 725 730 735 Val His Tyr Leu Asn Asp Glu Asp Lys Ile Tyr Arg Lys Ile Leu Ile 740 745 750 Ser Ser Gln Gly Gly Ala Asn Pro Leu Asn Arg His Glu Leu Pro Lys 755 760 765 Val His Phe Arg Thr Thr Asp Glu Met Leu Glu Ala Phe Ser Phe Leu 770 775 780 Gly Glu Glu Lys Ala Lys Glu Ile Val Val Thr Asn Thr Gln Lys Val 785 790 795 800 Ala Ser Leu Val Asp Asp Ile Lys Pro Ile Lys Asp Asp Leu Tyr Thr 805 810 815 Pro Lys Ile Glu Gly Ala Asp Glu Glu Ile Arg Glu Met Ser Tyr Gln 820 825 830 Arg Ala Arg Ser Ile Tyr Gly Glu Glu Leu Pro Glu Ile Val Glu Ala 835 840 845 Arg Ile Glu Lys Glu Leu Lys Ser Ile Ile Gly His Gly Phe Ala Val 850 855 860 Ile Tyr Leu Ile Ser His Lys Leu Val Lys Arg Ser Leu Asp Asp Gly 865 870 875 880 Tyr Leu Val Gly Ser Arg Gly Ser Val Gly Ser Ser Leu Val Ala Thr 885 890 895 Leu Thr Glu Ile Thr Glu Val Asn Pro Leu Pro Pro His Tyr Val Cys 900 905 910 Pro Glu Cys Gln His Ser Glu Phe Phe Asn Asp Gly Ser Val Gly Ser 915 920 925 Gly Phe Asp Leu Pro Asp Lys Thr Cys Pro His Cys Gly Thr Pro Leu 930 935 940 Lys Lys Asp Gly His Asp Ile Pro Phe Glu Thr Phe Leu Gly Phe Lys 945 950 955 960 Gly Asp Lys Val Pro Asp Ile Asp Leu Asn Phe Ser Gly Glu Tyr Gln 965 970 975 Pro Gln Ala His Asn Tyr Thr Lys Val Leu Phe Gly Glu Asp Asn Val 980 985 990 Tyr Arg Ala Gly Thr Ile Gly Thr Val Ala Glu Lys Thr Ala Tyr Gly 995 1000 1005 Tyr Val Lys Gly Tyr Ala Gly Asp Asn Asn Leu His Met Arg Gly Ala 1010 1015 1020 Glu Ile Asp Arg Leu Val Gln Gly Cys Thr Gly Val Lys Arg Thr Thr 1025 1030 1035 1040 Gly Gln His Pro Gly Gly Ile Ile Val Val Pro Asp Tyr Met Asp Ile 1045 1050 1055 Tyr Asp Phe Ser Pro Ile Gln Phe Pro Ala Asp Ala Thr Gly Ser Glu 1060 1065 1070 Trp Lys Thr Thr His Phe Asp Phe His Ser Ile His Asp Asn Leu Leu 1075 1080 1085 Lys Leu Asp Ile Leu Gly His Asp Asp Pro Thr Val Ile Arg Met Leu 1090 1095 1100 Gln Asp Leu Ser Gly Ile Asp Pro Lys Thr Ile Pro Thr Asp Asp Pro 1105 1110 1115 1120 Glu Val Met Lys Ile Phe Gln Gly Thr Glu Ser Leu Gly Val Thr Glu 1125 1130 1135 Glu Gln Ile Gly Cys Lys Thr Gly Thr Leu Gly Ile Pro Glu Phe Gly 1140 1145 1150 Thr Arg Phe Val Arg Gln Met Leu Glu Asp Thr Lys Pro Thr Thr Phe 1155 1160 1165 Ser Glu Leu Val Gln Ile Ser Gly Leu Ser His Gly Thr Asp Val Trp 1170 1175 1180 Leu Gly Asn Ala Gln Glu Leu Ile His Asn Asn Ile Cys Glu Leu Ser 1185 1190 1195 1200 Glu Val Ile Gly Cys Arg Asp Asp Ile Met Val Tyr Leu Ile Tyr Gln 1205 1210 1215 Gly Leu Glu Pro Ser Leu Ala Phe Lys Ile Met Glu Phe Val Arg Lys 1220 1225 1230 Gly Lys Gly Leu Thr Pro Glu Trp Glu Glu Glu Met Lys Asn Asn Asn 1235 1240 1245 Val Pro Asp Trp Tyr Ile Asp Ser Cys Lys Lys Ile Lys Tyr Met Phe 1250 1255 1260 Pro Lys Ala His Ala Ala Ala Tyr Val Leu Met Ala Val Arg Ile Ala 1265 1270 1275 1280 Tyr Phe Lys Val His His Ala Leu Leu Tyr Tyr Ala Ala Tyr Phe Thr 1285 1290 1295 Val Arg Ala Asp Asp Phe Asp Ile Asp Thr Met Ile Lys Gly Ser Thr 1300 1305 1310 Ala Ile Arg Ala Val Met Glu Asp Ile Asn Ala Lys Gly Leu Asp Ala 1315 1320 1325 Ser Pro Lys Glu Lys Asn Leu Leu Thr Val Leu Glu Leu Ala Leu Glu 1330 1335 1340 Met Cys Glu Arg Gly Tyr Ser Phe Gln Lys Val Asp Leu Tyr Arg Ser 1345 1350 1355 1360 Ser Ala Thr Glu Phe Ile Ile Asp Gly Asn Ser Leu Ile Pro Pro Phe 1365 1370 1375 Asn Ser Ile Pro Gly Leu Gly Thr Asn Ala Ala Leu Asn Ile Val Lys 1380 1385 1390 Ala Arg Glu Glu Gly Glu Phe Leu Ser Lys Glu Asp Leu Gln Lys Arg 1395 1400 1405 Gly Lys Val Ser Lys Thr Ile Leu Glu Tyr Leu Asp Arg His Gly Cys 1410 1415 1420 Leu Glu Ser Leu Pro Asp Gln Asn Gln Leu Ser Leu Phe 1425 1430 1435 <210> 45 <211> 1081 <212> PRT <213> Arabidopsis thaliana <400> 45 Met Asn Arg Ser Gly Ile Ser Lys Lys Arg Pro Pro Pro Ser Asn Thr 1 5 10 15 Pro Pro Pro Ala Gly Lys His Arg Ala Thr Gly Asp Ser Thr Pro Ser 20 25 30 Pro Ala Ile Gly Thr Leu Asp Asp Glu Phe Met Met Glu Glu Asp Val 35 40 45 Phe Leu Asp Glu Thr Leu Leu Tyr Gly Asp Glu Asp Glu Glu Ser Leu 50 55 60 Ile Leu Arg Asp Ile Glu Glu Arg Glu Ser Arg Ser Ser Ala Trp Ala 65 70 75 80 Arg Pro Pro Leu Ser Pro Ala Tyr Leu Ser Asn Ser Gln Ile Phe Gln 85 90 95 Gln Leu Glu Ile Asp Ser Ile Ile Ala Glu Ser His Lys Glu Leu Leu 100 105 110 Pro Gly Ser Ser Gly Gln Ala Pro Ile Ile Arg Met Phe Gly Val Thr 115 120 125 Arg Glu Gly Asn Ser Val Cys Cys Phe Val His Gly Phe Glu Pro Tyr 130 135 140 Phe Tyr Ile Ala Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser Asn 145 150 155 160 Phe His Gln Ser Leu Glu Gly Arg Met Arg Glu Ser Asn Lys Asn Ala 165 170 175 Lys Val Pro Lys Phe Val Lys Arg Ile Glu Met Val Gln Lys Arg Ser 180 185 190 Ile Met Tyr Tyr Gln Gln Gln Lys Ser Gln Thr Phe Leu Lys Ile Thr 195 200 205 Val Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg 210 215 220 Gly Leu Gln Ile Asp Gly Leu Gly Met Lys Ser Phe Gln Thr Tyr Glu 225 230 235 240 Ser Asn Ile Leu Phe Val Leu Arg Phe Met Val Asp Cys Asp Ile Val 245 250 255 Gly Gly Asn Trp Ile Glu Val Pro Thr Gly Lys Tyr Lys Lys Asn Ala 260 265 270 Arg Thr Leu Ser Tyr Cys Gln Leu Glu Phe His Cys Leu Tyr Ser Asp 275 280 285 Leu Ile Ser His Ala Ala Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe 290 295 300 Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe 305 310 315 320 Pro Glu Ala Lys His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr 325 330 335 Leu Gln Gly Glu Asp His Pro Phe Val Arg Asn Val Met Thr Leu Lys 340 345 350 Ser Cys Ala Pro Ile Val Gly Val Asp Val Met Ser Phe Glu Thr Glu 355 360 365 Arg Glu Val Leu Leu Ala Trp Arg Asp Leu Ile Arg Asp Val Asp Pro 370 375 380 Asp Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu 385 390 395 400 Ile Glu Arg Ala Ala Thr Leu Gly Ile Glu Glu Phe Pro Leu Leu Gly 405 410 415 Arg Val Lys Asn Ser Arg Val Arg Val Arg Asp Ser Thr Phe Ser Ser 420 425 430 Arg Gln Gln Gly Ile Arg Glu Ser Lys Glu Thr Thr Ile Glu Gly Arg 435 440 445 Phe Gln Phe Asp Leu Ile Gln Ala Ile His Arg Asp His Lys Leu Ser 450 455 460 Ser Tyr Ser Leu Asn Ser Val Ser Ala His Phe Leu Ser Glu Gln Lys 465 470 475 480 Glu Asp Val His His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Ala 485 490 495 Glu Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu 500 505 510 Pro Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu 515 520 525 Met Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ala Arg Gly 530 535 540 Gln Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Lys Gly Lys Gln Lys 545 550 555 560 Asn Leu Val Leu Pro Asn Ala Lys Gln Ser Gly Ser Glu Gln Gly Thr 565 570 575 Tyr Glu Gly Ala Thr Val Leu Glu Ala Arg Thr Gly Phe Tyr Glu Lys 580 585 590 Pro Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met 595 600 605 Ala Tyr Asn Leu Cys Tyr Cys Thr Leu Val Thr Pro Glu Asp Val Arg 610 615 620 Lys Leu Asn Leu Pro Pro Glu His Val Thr Lys Thr Pro Ser Gly Glu 625 630 635 640 Thr Phe Val Lys Gln Thr Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu 645 650 655 Glu Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu 660 665 670 Ala Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala 675 680 685 Leu Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val 690 695 700 Gly Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly 705 710 715 720 Arg Gln Met Ile Glu Gln Thr Lys Lys Leu Val Glu Asp Lys Phe Thr 725 730 735 Thr Leu Gly Gly Tyr Gln Tyr Asn Ala Glu Val Ile Tyr Gly Asp Thr 740 745 750 Asp Ser Val Met Val Gln Phe Gly Val Ser Asp Val Glu Ala Ala Met 755 760 765 Thr Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Ile Lys 770 775 780 Pro Ile Lys Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile 785 790 795 800 Asn Lys Lys Arg Tyr Ala Gly Leu Leu Trp Thr Asn Pro Gln Gln Phe 805 810 815 Asp Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys 820 825 830 Leu Leu Val Lys Asn Leu Val Thr Glu Ser Leu Asn Lys Ile Leu Ile 835 840 845 Asp Arg Asp Val Pro Gly Ala Ala Glu Asn Val Lys Lys Thr Ile Ser 850 855 860 Asp Leu Leu Met Asn Arg Ile Asp Leu Ser Leu Leu Val Ile Thr Lys 865 870 875 880 Gly Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ser Ala His Gly 885 890 895 Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn 900 905 910 Val Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala 915 920 925 Lys Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Gln Asn Asn 930 935 940 Ile Pro Ile Asp Pro Asn Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro 945 950 955 960 Leu Leu Arg Ile Phe Glu Pro Val Leu Lys Asn Ala Ser Lys Glu Leu 965 970 975 Leu His Gly Ser His Thr Arg Ser Ile Ser Ile Thr Thr Pro Ser Asn 980 985 990 Ser Gly Ile Met Lys Phe Ala Lys Lys Gln Leu Ser Cys Val Gly Cys 995 1000 1005 Lys Val Pro Ile Arg Tyr Phe Val Gln Trp Asn Thr Met Arg Lys Leu 1010 1015 1020 Gln Gly Lys Arg Ser Arg Val Ile Leu Gln Lys Arg Val Ser Arg Tyr 1025 1030 1035 1040 Ala Ala Trp Leu Ser Leu Lys Arg Phe Leu Gly Gly Cys Gly His Ser 1045 1050 1055 Ala Arg Ser Val Lys Ala Leu Phe Ile Lys Met Ser Cys Ala Pro Val 1060 1065 1070 Glu Ile Val Gln Tyr Phe Thr Gly Glu 1075 1080 <210> 46 <211> 2154 <212> PRT <213> Arabidopsis thaliana <400> 46 Met Ser Gly Arg Arg Cys Asp Arg Arg Leu Asn Val Gln Lys Val Ser 1 5 10 15 Ala Ala Asp Glu Leu Glu Thr Lys Leu Gly Phe Gly Leu Phe Ser Gln 20 25 30 Gly Glu Thr Arg Leu Gly Trp Leu Leu Thr Phe Ala Ser Ser Ser Trp 35 40 45 Glu Asp Ala Asp Thr Gly Lys Thr Phe Ser Cys Val Asp Leu Phe Phe 50 55 60 Val Thr Gln Asp Gly Ser Ser Phe Lys Thr Lys Tyr Lys Phe Arg Pro 65 70 75 80 Tyr Leu Tyr Ala Ala Thr Lys Asp Asn Met Glu Leu Glu Val Glu Ala 85 90 95 Tyr Leu Arg Arg Arg Tyr Glu Arg Gln Val Ala Asp Ile Gln Ile Val 100 105 110 His Lys Glu Asp Leu Tyr Leu Lys Asn His Leu Ser Gly Leu Gln Lys 115 120 125 Lys Tyr Leu Lys Val Ser Phe Asp Thr Val Gln Gln Leu Val Glu Val 130 135 140 Lys Arg Asp Leu Leu His Ile Val Glu Arg Asn Leu Ala Lys Phe Asn 145 150 155 160 Ala Leu Glu Ala Tyr Glu Ser Ile Leu Ser Gly Lys Arg Glu Gln Arg 165 170 175 Pro Gln Asp Cys Leu Asp Ser Val Val Asp Leu Arg Glu Tyr Asp Val 180 185 190 Pro Tyr His Val Arg Phe Ala Ile Asp Asn Asp Val Arg Ser Gly Gln 195 200 205 Trp Tyr Asn Val Ser Ile Ser Ser Thr Asp Val Ile Leu Glu Lys Arg 210 215 220 Thr Asp Leu Leu Gln Arg Ala Glu Val Arg Val Cys Ala Phe Asp Ile 225 230 235 240 Glu Thr Val Lys Leu Pro Leu Lys Phe Pro Asp Ala Glu Tyr Asp Gln 245 250 255 Ile Met Met Ile Ser Tyr Met Val Asp Gly Gln Gly Phe Leu Ile Thr 260 265 270 Asn Arg Glu Cys Val Gly Lys Asp Ile Glu Asp Leu Glu Tyr Thr Pro 275 280 285 Lys Pro Glu Phe Glu Gly Tyr Phe Lys Val Thr Asn Val Thr Asn Glu 290 295 300 Val Glu Leu Leu Arg Lys Trp Phe Ser His Met Gln Glu Leu Lys Pro 305 310 315 320 Gly Ile Tyr Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro Phe Ile 325 330 335 Glu Arg Arg Ala Ser His His Gly Ile Lys Met Asn Glu Glu Leu Gly 340 345 350 Phe Arg Cys Asp Gln Asn Gln Gly Glu Cys Arg Ala Lys Phe Val Cys 355 360 365 His Leu Asp Cys Phe Ser Trp Val Lys Arg Asp Ser Tyr Leu Pro Gln 370 375 380 Gly Ser Gln Gly Leu Lys Ala Val Thr Lys Val Lys Leu Gly Tyr Asp 385 390 395 400 Pro Leu Glu Val Asn Pro Glu Asp Met Val Arg Phe Ala Met Glu Lys 405 410 415 Pro Gln Thr Met Ala Ser Tyr Ser Val Ser Asp Ala Val Ala Thr Tyr 420 425 430 Tyr Leu Tyr Met Thr Tyr Val His Pro Phe Val Phe Ser Leu Ala Thr 435 440 445 Ile Ile Pro Met Val Pro Asp Glu Val Leu Arg Lys Gly Ser Gly Thr 450 455 460 Leu Cys Glu Met Leu Leu Met Val Glu Ala Tyr Lys Ala Asn Val Val 465 470 475 480 Cys Pro Asn Lys Asn Gln Ala Asp Pro Glu Lys Phe Tyr Gln Gly Lys 485 490 495 Leu Leu Glu Ser Glu Thr Tyr Ile Gly Gly His Val Glu Cys Leu Gln 500 505 510 Ser Gly Val Phe Arg Ser Asp Ile Pro Thr Ser Phe Lys Leu Asp Ala 515 520 525 Ser Ala Tyr Gln Gln Leu Ile Asp Asn Leu Gly Arg Asp Leu Glu Tyr 530 535 540 Ala Ile Thr Val Glu Gly Lys Met Arg Met Asp Ser Val Ser Asn Phe 545 550 555 560 Asp Glu Val Lys Glu Val Ile Arg Glu Lys Leu Glu Lys Leu Arg Asp 565 570 575 Asp Pro Ile Arg Glu Glu Gly Pro Leu Ile Tyr His Leu Asp Val Ala 580 585 590 Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro Pro Ser 595 600 605 Ile Val Thr Asp Glu Val Cys Thr Ala Cys Asp Phe Asn Gly Pro Glu 610 615 620 Lys Thr Cys Leu Arg Lys Leu Glu Trp Val Trp Arg Gly Val Thr Phe 625 630 635 640 Lys Gly Asn Lys Ser Glu Tyr Tyr His Leu Lys Lys Gln Ile Glu Ser 645 650 655 Glu Ser Val Asp Ala Gly Ala Asn Met Gln Ser Ser Lys Pro Phe Leu 660 665 670 Asp Leu Pro Lys Val Glu Gln Gln Ser Lys Leu Lys Glu Arg Leu Lys 675 680 685 Lys Tyr Cys Gln Lys Ala Tyr Ser Arg Val Leu Asp Lys Pro Ile Thr 690 695 700 Glu Val Arg Glu Ala Gly Ile Cys Met Arg Glu Asn Pro Phe Tyr Val 705 710 715 720 Asp Thr Val Arg Ser Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Thr Leu 725 730 735 Asn Lys Val Trp Lys Gly Lys Leu Ser Glu Ala Lys Ala Ser Gly Asn 740 745 750 Leu Ile Lys Ile Gln Glu Ala His Asp Met Val Val Val Tyr Asp Ser 755 760 765 Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr Val 770 775 780 Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala Gly Val Val 785 790 795 800 Thr Tyr Thr Gly Ala Lys Ile Ile Gln Asn Ala Arg Leu Leu Ile Glu 805 810 815 Arg Ile Gly Lys Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys Ala 820 825 830 Leu Pro Gly Ser Phe Pro Glu Asn Phe Thr Phe Lys Thr Ile Asp Met 835 840 845 Lys Lys Phe Thr Ile Ser Tyr Pro Cys Val Ile Leu Asn Val Asp Val 850 855 860 Ala Lys Asn Asn Ser Asn Asp Gln Tyr Gln Thr Leu Val Asp Pro Val 865 870 875 880 Arg Lys Thr Tyr Asn Ser Arg Ser Glu Cys Ser Ile Glu Phe Glu Val 885 890 895 Asp Gly Pro Tyr Lys Ala Met Ile Ile Pro Ala Ser Lys Glu Glu Gly 900 905 910 Ile Leu Ile Lys Lys Arg Tyr Ala Val Phe Asn His Asp Gly Thr Ile 915 920 925 Ala Glu Leu Lys Gly Phe Glu Met Lys Arg Arg Gly Glu Leu Lys Leu 930 935 940 Ile Lys Val Phe Gln Ala Glu Leu Phe Asp Lys Phe Leu His Gly Ser 945 950 955 960 Thr Leu Glu Glu Cys Tyr Ser Ala Val Ala Ala Val Ala Asn Arg Trp 965 970 975 Leu Asp Leu Leu Glu Gly Gln Gly Lys Asp Ile Ala Asp Ser Glu Leu 980 985 990 Leu Asp Tyr Ile Ser Glu Ser Ser Thr Met Ser Lys Ser Leu Ala Asp 995 1000 1005 Tyr Gly Gln Gln Lys Ser Cys Ala Val Thr Thr Ala Lys Arg Leu Ala 1010 1015 1020 Asp Phe Leu Gly Asp Thr Met Val Lys Asp Lys Gly Leu Arg Cys Gln 1025 1030 1035 1040 Tyr Ile Val Ala Arg Glu Pro Glu Gly Thr Pro Val Ser Glu Arg Ala 1045 1050 1055 Val Pro Val Ala Ile Phe Gln Thr Asp Asp Pro Glu Lys Lys Phe Tyr 1060 1065 1070 Leu Gln Lys Trp Cys Lys Ile Ser Ser Tyr Thr Gly Ile Arg Ser Ile 1075 1080 1085 Ile Asp Trp Met Tyr Tyr Lys Gln Arg Leu His Ser Ala Ile Gln Lys 1090 1095 1100 Val Ile Thr Ile Pro Ala Ala Met Gln Lys Val Ala Asn Pro Val Leu 1105 1110 1115 1120 Arg Val Arg His Pro Tyr Trp Leu Glu Lys Lys Val Cys Asp Lys Phe 1125 1130 1135 Arg Gln Gly Lys Ile Val Asp Met Phe Ser Ser Ala Asn Lys Asp His 1140 1145 1150 Ser Thr Thr Gln Asp Asn Val Val Ala Asp Ile Glu Glu Phe Cys Lys 1155 1160 1165 Glu Asn Arg Pro Ser Val Lys Gly Pro Lys Pro Val Ala Arg Ser Phe 1170 1175 1180 Glu Val Asp Arg Asn His Ser Glu Gly Lys Gln Gln Glu Ser Trp Asp 1185 1190 1195 1200 Pro Glu Phe His Asp Ile Ser Leu Gln Asn Val Asp Lys Asn Val Asp 1205 1210 1215 Tyr Gln Gly Trp Leu Glu Leu Glu Lys Arg Lys Trp Lys Met Thr Leu 1220 1225 1230 Thr Asn Lys Lys Lys Arg Arg Phe Asp Asp Leu Lys Pro Cys Asn Gln 1235 1240 1245 Ile Asp Ala His Lys Ile Asn Lys Lys Val Cys Lys Gly Arg Val Gly 1250 1255 1260 Val Gly Ser Tyr Phe Arg Arg Pro Glu Glu Ala Leu Thr Ser Ser Tyr 1265 1270 1275 1280 Leu Gln Ile Ile Gln Leu Val Gln Ser Pro Gln Ser Gly Gln Phe Phe 1285 1290 1295 Ala Trp Val Val Val Glu Gly Leu Met Leu Lys Ile Pro Leu Thr Ile 1300 1305 1310 Pro Arg Val Phe Tyr Ile Asn Ser Lys Ala Ser Ile Ala Gly Asn Phe 1315 1320 1325 Thr Gly Lys Cys Ile Asn Lys Ile Leu Pro His Gly Lys Pro Cys Tyr 1330 1335 1340 Asn Leu Met Glu Ala Arg His Leu His Asn Thr His Ile Leu Leu Leu 1345 1350 1355 1360 Val Asn Ile Gln Glu Asp Gln Phe Ile Lys Glu Ser Lys Lys Leu Ala 1365 1370 1375 Ala Leu Leu Ala Asp Pro Glu Ile Glu Gly Ile Tyr Glu Thr Lys Met 1380 1385 1390 Pro Leu Glu Phe Ser Ala Ile Cys Gln Ile Gly Cys Val Cys Lys Ile 1395 1400 1405 Glu Asp Thr Ala Lys His Arg Asn Thr Gln Asp Gly Trp Lys Leu Gly 1410 1415 1420 Glu Leu His Arg Ile Thr Thr Thr Glu Cys Arg Tyr Leu Glu Asn Ser 1425 1430 1435 1440 Ile Pro Leu Val Tyr Leu Tyr His Ser Thr Ser Thr Gly Arg Ala Val 1445 1450 1455 Tyr Val Leu Tyr Cys His Ala Ser Lys Leu Met Ser Val Val Val Val 1460 1465 1470 Asn Pro Tyr Gly Asp Lys Glu Leu Leu Ser Ser Ala Leu Glu Arg Gln 1475 1480 1485 Phe Arg Asp Arg Cys Gln Glu Leu Ser Pro Glu Pro Phe Ser Trp Asp 1490 1495 1500 Gly Ile Leu Phe Gln Val Glu Tyr Val Asp His Pro Glu Ala Ala Thr 1505 1510 1515 1520 Lys Phe Leu Gln Lys Ala Leu Cys Glu Tyr Arg Glu Glu Asn Cys Gly 1525 1530 1535 Ala Thr Val Ala Val Ile Glu Cys Pro Asp Phe Asn Thr Thr Lys Glu 1540 1545 1550 Gly Val Lys Ala Leu Glu Asp Phe Pro Cys Val Arg Ile Pro Phe Asn 1555 1560 1565 Asp Asp Asp Asn Ser Tyr Gln Pro Val Ser Trp Gln Arg Pro Ala Ala 1570 1575 1580 Lys Ile Ala Val Leu Arg Cys Ala Ser Ala Ile Gln Trp Leu Asp Arg 1585 1590 1595 1600 Arg Ile Ala Gln Ser Arg Tyr Ala His Val Pro Leu Gly Asn Phe Gly 1605 1610 1615 Arg Asp Trp Leu Thr Phe Thr Val Asp Ile Phe Leu Ser Arg Ala Leu 1620 1625 1630 Arg Asp Gln Gln Gln Val Leu Trp Val Ser Asp Asn Gly Val Pro Asp 1635 1640 1645 Leu Gly Asp Ile Asn Asn Glu Glu Thr Phe Leu Ala Asp Glu Leu Gln 1650 1655 1660 Glu Thr Ser Leu Leu Phe Pro Gly Ala Tyr Arg Lys Val Ser Val Glu 1665 1670 1675 1680 Leu Lys Val His Arg Leu Ala Val Asn Ala Leu Leu Lys Ser Asp Leu 1685 1690 1695 Val Ser Glu Met Glu Gly Gly Gly Phe Leu Gly Val Asn Ser Arg Gly 1700 1705 1710 Ser Ser Leu Asn Asp Asn Gly Ser Phe Asp Glu Asn Asn Gly Cys Ala 1715 1720 1725 Gln Ala Phe Arg Val Leu Lys Gln Leu Ile Lys Arg Leu Leu His Asp 1730 1735 1740 Ala Cys Asn Ser Gly Asn Ile Tyr Ala Asp Ser Ile Leu Gln His Leu 1745 1750 1755 1760 Ser Trp Trp Leu Arg Ser Pro Ser Ser Lys Leu His Asp Pro Ala Leu 1765 1770 1775 His Leu Met Leu His Lys Val Met Gln Lys Val Phe Ala Leu Leu Leu 1780 1785 1790 Thr Asp Leu Arg Arg Leu Gly Ala Ile Ile Ile Tyr Ala Asp Phe Ser 1795 1800 1805 Lys Val Ile Ile Asp Thr Gly Lys Phe Asp Leu Ser Ala Ala Lys Thr 1810 1815 1820 Tyr Cys Glu Ser Leu Leu Thr Val Met Gly Ser Arg Asp Ile Phe Lys 1825 1830 1835 1840 Leu Ile Leu Leu Glu Pro Val His Tyr Trp His Ser Leu Leu Phe Met 1845 1850 1855 Asp Gln His Asn Tyr Ala Gly Ile Arg Ala Thr Gly Asp Glu Ile Ser 1860 1865 1870 Gly Asn Glu Val Thr Ile Glu Pro Lys Trp Ser Val Ala Arg His Leu 1875 1880 1885 Pro Glu Tyr Ile Gln Lys Asp Phe Ile Ile Ile Val Ala Thr Phe Ile 1890 1895 1900 Phe Gly Pro Trp Lys Phe Ala Leu Glu Lys Lys Arg Gly Ser Ala Glu 1905 1910 1915 1920 Ser Leu Glu Ala Glu Met Val Glu Tyr Leu Lys Glu Gln Ile Gly Thr 1925 1930 1935 Arg Phe Ile Ser Met Ile Val Glu Lys Ile Gly Asn Ile Arg Ser His 1940 1945 1950 Ile Lys Asp Ile Asn Val Ser Asp Ala Ser Trp Ala Ser Gly Gln Ala 1955 1960 1965 Pro Lys Gly Asp Tyr Thr Phe Glu Phe Ile Gln Ile Ile Thr Ala Val 1970 1975 1980 Leu Ala Leu Asp Gln Asn Val Gln Gln Asp Val Leu Val Met Arg Lys 1985 1990 1995 2000 Ile Leu Leu Lys Tyr Ile Lys Val Lys Glu Cys Ala Ala Glu Ala Glu 2005 2010 2015 Phe Ile Asp Pro Gly Pro Ser Phe Ile Leu Pro Asn Val Ala Cys Ser 2020 2025 2030 Asn Cys Gly Ala Tyr Arg Asp Leu Asp Phe Cys Arg Asp Ser Ala Leu 2035 2040 2045 Leu Thr Glu Lys Glu Trp Ser Cys Ala Asp Pro Gln Cys Val Lys Ile 2050 2055 2060 Tyr Asp Lys Glu Gln Ile Glu Ser Ser Ile Ile Gln Met Val Arg Gln 2065 2070 2075 2080 Arg Glu Arg Met Tyr Gln Leu Gln Asp Leu Val Cys Asn Arg Cys Asn 2085 2090 2095 Gln Val Lys Ala Ala His Leu Thr Glu Gln Cys Glu Cys Ser Gly Ser 2100 2105 2110 Phe Arg Cys Lys Glu Ser Gly Ser Asp Phe His Lys Arg Ile Glu Ile 2115 2120 2125 Phe Leu Asp Ile Ala Lys Arg Gln Lys Phe Arg Leu Leu Glu Glu Cys 2130 2135 2140 Ile Ser Trp Ile Leu Phe Ala Thr Ser Cys 2145 2150 <210> 47 <211> 3706 <212> DNA <213> Oryza sativa <400> 47 ctctcttccc gcgttcccct ctccctcccc ctcccccctc tccggcgatg agctcaggcg 60 gacgcggcgg caagcggcga ggggcgccgc ccccggggcc atccggggcg gcggcgaagc 120 gggcccaccc cggtggcacc ccgcagccgc ctccgcccgc cgcgacggcg gcggcgcccg 180 tggcggagga ggaggacatg atggacgagg acgtcttcct cgacgagacc atcctggcgg 240 aggacgagga ggcgttgctg ctgctcgacc gggacgaggc cctcgcctca cgcctctccc 300 gctggaggcg ccccgcgctc cccgccgacc tagcgtccgg ctgctcgcgc aatgttgctt 360 ttcagcagct ggagatagat tatgttattg gtgagagcca caaagtactg ctccccaact 420 catctggtcc tgcagctata ctcaggatat ttggcgtaac tagagaaggt cacagtgtat 480 gctgccaagt gcatggattt gagccatatt tttacatcag ttgtccaatg gggatgggcc 540 ctgatgatat ttcacgcttc caccaaacac tagaggggag gatgaaggat tcaaatagga 600 acagcaacgt gccaaggttt gtgaagagaa tcgaacttgt gcagaagcag acaatcatgc 660 attaccaacc acagcaatct cagcctttcc tcaagatagt ggttgctttg ccaacaatgg 720 ttgctagttg tcgcggcatc ctggaaaggg gcataacaat tgaaggcctt ggttcgaaga 780 gttttctgac atatgaaagc aacattcttt ttgcacttcg cttcatgatt gactgcaata 840 ttgttggtgg taattggatt gaagttcctg ccggaaagta tatgaaggca gctcgtatca 900 tgtcctattg tcagctagag ttggattgcc tatattcgga tttggtaagc catgctgctg 960 aaggagaaca ttctaagatg gctccatttc gcatattaag ttttgatatt gaatgtgccg 1020 gtcgcaaagg tcacttccca gaaccaactc atgatcccgt tattcagata gctaacttgg 1080 tcacccttca aggagaagga caaccttttg tacgcaatgt tatgacgctt aaatcatgtt 1140 ctcccattgt tggagttgat gttatgtcat ttgacacaga gagggatgtt ctacttgctt 1200 ggagggattt catacgtgaa gtggaccctg atattattat tggatacaat atctgcaaat 1260 ttgacttacc ctatcttatt gagagagctg aagttcttaa gatagtagag tttccaatac 1320 ttggacgaat cagaaatagt cgtgttcgtg tccgtgacac aactttctct tcaaggcaat 1380 atggtatgcg tgaaagtaaa gatgtagcag tggaaggaag agtacaattt gatcttctgc 1440 aggctatgca acgggattac aagcttagtt cttattcatt aaactctgta tctgcacatt 1500 tcctcgggga gcaaaaagag gatgttcatc actcaattat atctgatctt caaaatggga 1560 attcagagac acgaagacgg cttgcggttt attgtttgaa ggatgcctat cttccacaac 1620 gactgctaga taagttgatg tatatctaca actatgtgga aatggcaaga gtcactggag 1680 ttcccatttc atttcttctt tcaaggggac agagcattaa ggtcctctca cagctactca 1740 ggaaagcaaa acagaaaaac cttgttatac caaatataaa gggtcaagcg tctggacagg 1800 atacctttga aggtgcaact gttttggagg caagggctgg attttatgag aaacccattg 1860 cgactttgga ctttgcttcg ttgtatccat ccatcatgat ggcatataac ctatgctact 1920 gtactttggt cccccctgag gatgcccgca aactcaacct gcctccagaa agtgtcaaca 1980 aaaccccatc tggtgaaaca tttgtgaaac cagatgtgca aaagggtata cttcctgaaa 2040 tccttgaaga attgttggct gctcggaaaa gggcgaaagc agatttgaag gaagcaaagg 2100 atccatttga aagggccgtt cttgatggtc gtcagcttgc cctaaaaata agcgcaaact 2160 ctgtctatgg ttttactgga gcgactgttg gtcaattacc ttgtttagaa atttcttcaa 2220 gtgtgaccag ctatggtcga cagatgattg aacatacaaa aaagcttgtt gaagataaat 2280 tcacgacact tggaggctat gagcacaatg cagaggtcat ctatggagat actgattctg 2340 taatggtaca gttcggtgtt tctactgttg aggacgcaat gaagctagga agagaagctg 2400 cagactacat tagtggaaca tttattaagc ccatcaagct tgagtttgag aagatctatt 2460 tcccttatct actgattagc aagaagagat atgctggttt gtactggaca aatcctgaga 2520 aatttgacaa aatggacacg aaaggtattg aaacagtgag aagggacaac tgtttattag 2580 taaagaacct ggttactgag tgccttcata aaatactagt ggacagagat gttcctggtg 2640 cagttcaata tgtcaagaac accatttctg atctactaat gaaccgtgta gacttatctc 2700 ttctagttat aacaaagggt ttgactaaaa caggagagga ttatgctgtc aaagctgccc 2760 atgtggagct tgctgagaga atgcgaaaga gggacgctgc tactgctcct actgttggtg 2820 accgggttcc ttatgttata atcaaagcag caaaaggggc aaaggcatat gagaggtcag 2880 aagatcctat ttatgttttg gataataaca taccaataga tccccaatac taccttgaga 2940 accaaatcag caaaccactt ttgaggatct ttgagccgat tctgaagaat gccagtagag 3000 agctgcttca tggaagtcac accagggctg tttcaatctc aactccttca aatagtggaa 3060 taatgaaatt tgcaaagaaa caattgacat gcctcggatg caaagcagtt ataagtggtt 3120 ccaatcaaac gctttgcttt cattgcaagg gaagagaagc agagttatac tgcaaaactg 3180 taggaaacgt ttctgagctg gagatgctct ttgggaggct ctggacgcag tgccaggagt 3240 gccaaggctc ccttcatcag gacgttctct gcacaagccg ggattgtcct attttctacc 3300 gccgaagaaa ggcgcagaag gatatggctg aagctagagt acagcttcaa cgttgggact 3360 tctgagtcct ctcatactga cggagtacta ctttccccaa atattgcgaa accattactg 3420 tgaggcacgc cattgcggga tcatgtgatt gcatcttcat gcatgatggc tctggcttgt 3480 ttagttggat cggctgaaat agctttgttc tacggtcagt ttgttgtatt tttaggtggt 3540 aggttatctg tacctctagc cgctaacagg gtaatctagt tgcttccctt ggtgcattga 3600 tgcagccatg tgtaaggtag ataaacaatt ttttttcatc atcttttaac ttcatgaggt 3660 gattgaggct gagaagcacc cattcaagaa aaaaaaaaaa aaaaaa 3706 <210> 48 <211> 1105 <212> PRT <213> Oryza sativa <400> 48 Met Ser Ser Gly Gly Arg Gly Gly Lys Arg Arg Gly Ala Pro Pro Pro 1 5 10 15 Gly Pro Ser Gly Ala Ala Ala Lys Arg Ala His Pro Gly Gly Thr Pro 20 25 30 Gln Pro Pro Pro Pro Ala Ala Thr Ala Ala Ala Pro Val Ala Glu Glu 35 40 45 Glu Asp Met Met Asp Glu Asp Val Phe Leu Asp Glu Thr Ile Leu Ala 50 55 60 Glu Asp Glu Glu Ala Leu Leu Leu Leu Asp Arg Asp Glu Ala Leu Ala 65 70 75 80 Ser Arg Leu Ser Arg Trp Arg Arg Pro Ala Leu Pro Ala Asp Leu Ala 85 90 95 Ser Gly Cys Ser Arg Asn Val Ala Phe Gln Gln Leu Glu Ile Asp Tyr 100 105 110 Val Ile Gly Glu Ser His Lys Val Leu Leu Pro Asn Ser Ser Gly Pro 115 120 125 Ala Ala Ile Leu Arg Ile Phe Gly Val Thr Arg Glu Gly His Ser Val 130 135 140 Cys Cys Gln Val His Gly Phe Glu Pro Tyr Phe Tyr Ile Ser Cys Pro 145 150 155 160 Met Gly Met Gly Pro Asp Asp Ile Ser Arg Phe His Gln Thr Leu Glu 165 170 175 Gly Arg Met Lys Asp Ser Asn Arg Asn Ser Asn Val Pro Arg Phe Val 180 185 190 Lys Arg Ile Glu Leu Val Gln Lys Gln Thr Ile Met His Tyr Gln Pro 195 200 205 Gln Gln Ser Gln Pro Phe Leu Lys Ile Val Val Ala Leu Pro Thr Met 210 215 220 Val Ala Ser Cys Arg Gly Ile Leu Glu Arg Gly Ile Thr Ile Glu Gly 225 230 235 240 Leu Gly Ser Lys Ser Phe Leu Thr Tyr Glu Ser Asn Ile Leu Phe Ala 245 250 255 Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly Gly Asn Trp Ile Glu 260 265 270 Val Pro Ala Gly Lys Tyr Met Lys Ala Ala Arg Ile Met Ser Tyr Cys 275 280 285 Gln Leu Glu Leu Asp Cys Leu Tyr Ser Asp Leu Val Ser His Ala Ala 290 295 300 Glu Gly Glu His Ser Lys Met Ala Pro Phe Arg Ile Leu Ser Phe Asp 305 310 315 320 Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro Glu Pro Thr His Asp 325 330 335 Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu Gln Gly Glu Gly Gln 340 345 350 Pro Phe Val Arg Asn Val Met Thr Leu Lys Ser Cys Ser Pro Ile Val 355 360 365 Gly Val Asp Val Met Ser Phe Asp Thr Glu Arg Asp Val Leu Leu Ala 370 375 380 Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp Ile Ile Ile Gly Tyr 385 390 395 400 Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile Glu Arg Ala Glu Val 405 410 415 Leu Lys Ile Val Glu Phe Pro Ile Leu Gly Arg Ile Arg Asn Ser Arg 420 425 430 Val Arg Val Arg Asp Thr Thr Phe Ser Ser Arg Gln Tyr Gly Met Arg 435 440 445 Glu Ser Lys Asp Val Ala Val Glu Gly Arg Val Gln Phe Asp Leu Leu 450 455 460 Gln Ala Met Gln Arg Asp Tyr Lys Leu Ser Ser Tyr Ser Leu Asn Ser 465 470 475 480 Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His His Ser 485 490 495 Ile Ile Ser Asp Leu Gln Asn Gly Asn Ser Glu Thr Arg Arg Arg Leu 500 505 510 Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Gln Arg Leu Leu Asp 515 520 525 Lys Leu Met Tyr Ile Tyr Asn Tyr Val Glu Met Ala Arg Val Thr Gly 530 535 540 Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln Ser Ile Lys Val Leu 545 550 555 560 Ser Gln Leu Leu Arg Lys Ala Lys Gln Lys Asn Leu Val Ile Pro Asn 565 570 575 Ile Lys Gly Gln Ala Ser Gly Gln Asp Thr Phe Glu Gly Ala Thr Val 580 585 590 Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro Ile Ala Thr Leu Asp 595 600 605 Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala Tyr Asn Leu Cys Tyr 610 615 620 Cys Thr Leu Val Pro Pro Glu Asp Ala Arg Lys Leu Asn Leu Pro Pro 625 630 635 640 Glu Ser Val Asn Lys Thr Pro Ser Gly Glu Thr Phe Val Lys Pro Asp 645 650 655 Val Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu Glu Leu Leu Ala Ala 660 665 670 Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala Lys Asp Pro Phe Glu 675 680 685 Arg Ala Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn 690 695 700 Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Gln Leu Pro Cys Leu 705 710 715 720 Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg Gln Met Ile Glu His 725 730 735 Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr Leu Gly Gly Tyr Glu 740 745 750 His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Gln 755 760 765 Phe Gly Val Ser Thr Val Glu Asp Ala Met Lys Leu Gly Arg Glu Ala 770 775 780 Ala Asp Tyr Ile Ser Gly Thr Phe Ile Lys Pro Ile Lys Leu Glu Phe 785 790 795 800 Glu Lys Ile Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala 805 810 815 Gly Leu Tyr Trp Thr Asn Pro Glu Lys Phe Asp Lys Met Asp Thr Lys 820 825 830 Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu Leu Val Lys Asn Leu 835 840 845 Val Thr Glu Cys Leu His Lys Ile Leu Val Asp Arg Asp Val Pro Gly 850 855 860 Ala Val Gln Tyr Val Lys Asn Thr Ile Ser Asp Leu Leu Met Asn Arg 865 870 875 880 Val Asp Leu Ser Leu Leu Val Ile Thr Lys Gly Leu Thr Lys Thr Gly 885 890 895 Glu Asp Tyr Ala Val Lys Ala Ala His Val Glu Leu Ala Glu Arg Met 900 905 910 Arg Lys Arg Asp Ala Ala Thr Ala Pro Thr Val Gly Asp Arg Val Pro 915 920 925 Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys Ala Tyr Glu Arg Ser 930 935 940 Glu Asp Pro Ile Tyr Val Leu Asp Asn Asn Ile Pro Ile Asp Pro Gln 945 950 955 960 Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Leu Leu Arg Ile Phe Glu 965 970 975 Pro Ile Leu Lys Asn Ala Ser Arg Glu Leu Leu His Gly Ser His Thr 980 985 990 Arg Ala Val Ser Ile Ser Thr Pro Ser Asn Ser Gly Ile Met Lys Phe 995 1000 1005 Ala Lys Lys Gln Leu Thr Cys Leu Gly Cys Lys Ala Val Ile Ser Gly 1010 1015 1020 Ser Asn Gln Thr Leu Cys Phe His Cys Lys Gly Arg Glu Ala Glu Leu 1025 1030 1035 1040 Tyr Cys Lys Thr Val Gly Asn Val Ser Glu Leu Glu Met Leu Phe Gly 1045 1050 1055 Arg Leu Trp Thr Gln Cys Gln Glu Cys Gln Gly Ser Leu His Gln Asp 1060 1065 1070 Val Leu Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Arg Arg Arg Lys 1075 1080 1085 Ala Gln Lys Asp Met Ala Glu Ala Arg Val Gln Leu Gln Arg Trp Asp 1090 1095 1100 Phe 110 <210> 49 <211> 3427 <212> DNA <213> Glycine max <400> 49 tgattaccct cccactccac actctccgct gtctctccct cccaattccg atgagcaaca 60 acgcctcccg gaagcgcgcg ccgccgcctc cgtcccaacc tccgccggcg aacaagccct 120 aatgactcag gaagaagagt tcatggacga agacgtgttc ataaacgaaa ccctcgtctc 180 cgaggacgaa gaatccctca ttctccgcga cattgagcag cgccaggccc tcgccaaccg 240 cctctccaag tggacacgtc ctcctctctc cgccggctac gtcgcccaat ctcgtagcgt 300 cctttttcag cagctagaga ttgattacgt gattgcagag agtcacgggg agttgctgcc 360 gaactcgtct ggacctgtcg ccattatcag aatatttgga gttactaagg aaggacacag 420 tgtttgttgc aatgttcatg ggtttgaacc atatttctac atctgttgcc ctcctggaat 480 gggtccagat gatatctccc attttcatca aactctcgag ggaaggatga gagaagccaa 540 tagaaacagt aatgtgggaa aattcgttcg ccgtattgaa atggtgcaga gaaggagtat 600 tatgtactat cagcaatcca attcccaacc ctttctcaaa attgtagttg cactcccaac 660 aatggttgcc agctgccgtg gtattcttga taggggtatt caacttgatg gtctgggaat 720 gaagagcttc ttgacttatg aaagcaatgt actttttgcc cttcgcttca tgattgattg 780 taacatagtt ggtggaaatt ggattgggat tcctgccgga aaatataaga aaacagcgaa 840 aagcttgtct tactgccagt tagagtttga ttgcttgtat tctgaattga ttagtcatgc 900 tccagaaggg gaatattcaa agatggctcc gtttcgcatt ttgagttttg acatcgagtg 960 tgctggtcgt aaaggtcatt ttcctgagcc tacccatgat cctgttatcc agattgctaa 1020 tttggttact ttacaaggag aagaccagcc atttattcgt aatgtgatga cccttaaatc 1080 atgttctcct atcgttggtg ttgatgtgat gccatttgaa acagaaagag aagtcctgct 1140 ggcttggagg gattttattc gtgaagtgga ccctgatatt attattggat acaacatttg 1200 caaatttgac ttgccatatc ttattgagag agctttgaac ctgaagatag cagaatttcc 1260 aattctgggt cgtatcagga acagtagagt tcgagtaaag gatacaactt tctcatcaag 1320 gcagtacgga accagggaaa gtaaagaagt tgcagtagaa gggagagtta cgtttgattt 1380 actccaggtt atgcaaagag actacaaatt aagttcttat tcactgaatt ctgtgtcatc 1440 acacttcctt tctgagcaga aagaggatgt tcatcattca attatatccg atcttcagaa 1500 tggaaatgca gaaactagga ggcgccttgc tgtgtattgt ttgaaggatg catatctccc 1560 tcagcggctt ttggataaat tgatgttcat ttacaattat gtggagatgg ctcgagtaac 1620 aggtgtccca atttcttttc tactttccag aggccaaagc attaaggtac tttctcaact 1680 tcttaggagg gcaaggcaga agaatctggt cattcctaat gccaaacagg ctgggtctga 1740 acaaggaaca tttgaaggtg ccactgtatt ggaggcaagg gctggatttt atgaaaaacc 1800 aattgctact ttagattttg catccttgta tccatctatt atgatggcct ataacttatg 1860 ttattgcact ctggtgatcc ctgaagatgc tcgcaagctc aacatacctc cagagtctgt 1920 gaacagaact ccatctggtg aaacatttgt taaatcaaat ttgcagaagg gaatacttcc 1980 tgaaatactt gaagagctat taacagcccg taaaagggca aaagcagact taaaggaggc 2040 caaggatccc ctggagaagg cagtgctaga tggtagacag ctagccctga agattagtgc 2100 caattctgtg tatgggttta caggggctac cattggtcag ttaccatgtt tagagatatc 2160 atcgagtgta acaagctatg gtcgacaaat gatcgagcac acgaaaaaac ttgtggaaga 2220 taaatttacg acacttaatg gctatgaaca caatgccgag gtaatatatg gagacacaga 2280 ttcagtcatg gtacaatttg gtgtttctgc tgtagaagag gctatgaact tggggagaga 2340 agctgctgaa catattagtg gaactttcac aaaacccatc aaactagaat ttgagaaggt 2400 ttactatcca tatctcctga ttagcaagaa gagatatgct ggtttgtttt ggacaaaacc 2460 agacaacttt gacaaaatgg acactaaagg tattgaaaca gttcgaagag acaattgttt 2520 attggtcaaa aacctggtga acgattgcct tcacaaaata ttgattgaca gggacattcc 2580 tggggcagtc cagtatgtca agaatgcaat ttcagatctt ctcatgaatc gtatggactt 2640 atcacttctg gttattacaa agggtttaac gaagacagga gatgattacg aagtaaaggc 2700 agctcatgtt gaacttgctg aaaggatgcg caagcgagat gctgccactg ctccaaatgt 2760 tggagacaga gtaccatatg ttattattaa agctgcaaaa ggtgcaaagg catatgagag 2820 atcagaggat cctatctatg tgctagagaa caacataccc atagatcctc attactatct 2880 tgagaatcaa attagcaagc caattctgag aatttttgag ccaattctga agaatgctag 2940 caaagagctt ctccatggaa gtcatacaag atctatttct atttctacac cgtcaaacag 3000 tggcatattg agatttgcta agaaacagct acctgcattg gttgtaaagc tttacttggc 3060 aagggttatc acactctctg ttcacattgc aaaggaaggg aggctgagct gtactgtaaa 3120 acagtatctc aagtgtctga gctggagatg ctttttggga ggttgtggac acagtgtcag 3180 gagtgccaag gttcacttca tcaggatgtt ctctgcacca gtcgggattg tccaattttc 3240 tatcgacgaa aaaaggcaca gaaagatatg ggtgaagcaa agttgcaatt ggacagatgg 3300 aacttctaag ttttgccaag aatttgacct tgcggatctc ttcgaaccaa tggacacaaa 3360 tacaatctgg tgtttgccac aatcctgaca tttgtaatgt gagtaaaagc ccacaatttg 3420 tttactg 3427 <210> 50 <211> 1088 <212> PRT <213> Glycine max <400> 50 Met Thr Gln Glu Glu Glu Phe Met Asp Glu Asp Val Phe Ile Asn Glu 1 5 10 15 Thr Leu Val Ser Glu Asp Glu Glu Ser Leu Ile Leu Arg Asp Ile Glu 20 25 30 Gln Arg Gln Ala Leu Ala Asn Arg Leu Ser Lys Trp Thr Arg Pro Pro 35 40 45 Leu Ser Ala Gly Tyr Val Ala Gln Ser Arg Ser Val Leu Phe Gln Gln 50 55 60 Leu Glu Ile Asp Tyr Val Ile Ala Glu Ser His Gly Glu Leu Leu Pro 65 70 75 80 Asn Ser Ser Gly Pro Val Ala Ile Ile Arg Ile Phe Gly Val Thr Lys 85 90 95 Glu Gly His Ser Val Cys Cys Asn Val His Gly Phe Glu Pro Tyr Phe 100 105 110 Tyr Ile Cys Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser His Phe 115 120 125 His Gln Thr Leu Glu Gly Arg Met Arg Glu Ala Asn Arg Asn Ser Asn 130 135 140 Val Gly Lys Phe Val Arg Arg Ile Glu Met Val Gln Arg Arg Ser Ile 145 150 155 160 Met Tyr Tyr Gln Gln Ser Asn Ser Gln Pro Phe Leu Lys Ile Val Val 165 170 175 Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg Gly 180 185 190 Ile Gln Leu Asp Gly Leu Gly Met Lys Ser Phe Leu Thr Tyr Glu Ser 195 200 205 Asn Val Leu Phe Ala Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly 210 215 220 Gly Asn Trp Ile Gly Ile Pro Ala Gly Lys Tyr Lys Lys Thr Ala Lys 225 230 235 240 Ser Leu Ser Tyr Cys Gln Leu Glu Phe Asp Cys Leu Tyr Ser Glu Leu 245 250 255 Ile Ser His Ala Pro Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe Arg 260 265 270 Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro 275 280 285 Glu Pro Thr His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu 290 295 300 Gln Gly Glu Asp Gln Pro Phe Ile Arg Asn Val Met Thr Leu Lys Ser 305 310 315 320 Cys Ser Pro Ile Val Gly Val Asp Val Met Pro Phe Glu Thr Glu Arg 325 330 335 Glu Val Leu Leu Ala Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp 340 345 350 Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile 355 360 365 Glu Arg Ala Leu Asn Leu Lys Ile Ala Glu Phe Pro Ile Leu Gly Arg 370 375 380 Ile Arg Asn Ser Arg Val Arg Val Lys Asp Thr Thr Phe Ser Ser Arg 385 390 395 400 Gln Tyr Gly Thr Arg Glu Ser Lys Glu Val Ala Val Glu Gly Arg Val 405 410 415 Thr Phe Asp Leu Leu Gln Val Met Gln Arg Asp Tyr Lys Leu Ser Ser 420 425 430 Tyr Ser Leu Asn Ser Val Ser Ser His Phe Leu Ser Glu Gln Lys Glu 435 440 445 Asp Val His His Ser Ile Ile Ser Asp Leu Gln Asn Gly Asn Ala Glu 450 455 460 Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro 465 470 475 480 Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu Met 485 490 495 Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln 500 505 510 Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Arg Ala Arg Gln Lys Asn 515 520 525 Leu Val Ile Pro Asn Ala Lys Gln Ala Gly Ser Glu Gln Gly Thr Phe 530 535 540 Glu Gly Ala Thr Val Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro 545 550 555 560 Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala 565 570 575 Tyr Asn Leu Cys Tyr Cys Thr Leu Val Ile Pro Glu Asp Ala Arg Lys 580 585 590 Leu Asn Ile Pro Pro Glu Ser Val Asn Arg Thr Pro Ser Gly Glu Thr 595 600 605 Phe Val Lys Ser Asn Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu 610 615 620 Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala 625 630 635 640 Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala Leu 645 650 655 Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Ile Gly 660 665 670 Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg 675 680 685 Gln Met Ile Glu His Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr 690 695 700 Leu Asn Gly Tyr Glu His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp 705 710 715 720 Ser Val Met Val Gln Phe Gly Val Ser Ala Val Glu Glu Ala Met Asn 725 730 735 Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Thr Lys Pro 740 745 750 Ile Lys Leu Glu Phe Glu Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Ser 755 760 765 Lys Lys Arg Tyr Ala Gly Leu Phe Trp Thr Lys Pro Asp Asn Phe Asp 770 775 780 Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu 785 790 795 800 Leu Val Lys Asn Leu Val Asn Asp Cys Leu His Lys Ile Leu Ile Asp 805 810 815 Arg Asp Ile Pro Gly Ala Val Gln Tyr Val Lys Asn Ala Ile Ser Asp 820 825 830 Leu Leu Met Asn Arg Met Asp Leu Ser Leu Leu Val Ile Thr Lys Gly 835 840 845 Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ala Ala His Val Glu 850 855 860 Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn Val 865 870 875 880 Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys 885 890 895 Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Glu Asn Asn Ile 900 905 910 Pro Ile Asp Pro His Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Ile 915 920 925 Leu Arg Ile Phe Glu Pro Ile Leu Lys Asn Ala Ser Lys Glu Leu Leu 930 935 940 His Gly Ser His Thr Arg Ser Ile Ser Ile Ser Thr Pro Ser Asn Ser 945 950 955 960 Gly Ile Leu Arg Phe Ala Lys Lys Gln Leu Pro Ala Leu Val Val Lys 965 970 975 Leu Tyr Leu Ala Arg Val Ile Thr Leu Ser Val His Ile Ala Lys Glu 980 985 990 Gly Arg Leu Ser Cys Thr Val Lys Gln Tyr Leu Lys Cys Leu Ser Trp 995 1000 1005 Arg Cys Phe Leu Gly Gly Cys Gly His Ser Val Arg Ser Ala Lys Val 1010 1015 1020 His Phe Ile Arg Met Phe Ser Ala Pro Val Gly Ile Val Gln Phe Ser 1025 1030 1035 1040 Ile Asp Glu Lys Arg His Arg Lys Ile Trp Val Lys Gln Ser Cys Asn 1045 1050 1055 Trp Thr Asp Gly Thr Ser Lys Phe Cys Gln Glu Phe Asp Leu Ala Asp 1060 1065 1070 Leu Phe Glu Pro Met Asp Thr Asn Thr Ile Trp Cys Leu Pro Gln Ser 1075 1080 1085 <210> 51 <211> 3435 <212> DNA <213> Homo sapiens <400> 51 acggcggcgt aggctgtggc gggaaacgct gtttgaagcg ggatggatgg caagcggcgg 60 ccaggcccag ggcccggggt gcccccaaag cgggcccgtg ggggcctctg ggatgatgat 120 gatgcacctc ggccatccca attcgaggag gacctggcac tgatggagga gatggaggca 180 gaacacaggc tgcaggagca ggaggaggag gagctgcagt cagtcctgga gggggttgca 240 gacgggcagg tcccaccatc agccatagat cctcgctggc ttcggcccac accaccagcg 300 ctggaccccc agacagagcc cctcatcttc caacagttgg agattgacca ttatgtgggc 360 ccagcgcagc ctgtgcctgg ggggccccca ccatcccacg gctccgtgcc tgtgctccgc 420 gccttcgggg tcaccgatga ggggttctct gtctgctgcc acatccacgg cttcgctccc 480 tacttctaca ccccagcgcc ccctggtttc gggcccgagc acatgggtga cctgcaacgg 540 gagctgaact tggccatcaa ccgggacagt cgcgggggga gggagctgac tgggccggcc 600 gtgctggctg tggaactgtg ctcccgagag agcatgtttg ggtaccacgg gcacggcccc 660 tccccgttcc tgcgcatcac cgtggcgctg ccgcgcctcg tggccccggc ccgccgtctc 720 ctggaacagg gcatccgtgt ggcaggcctg ggcacgccca gcttcgcgcc ctacgaggcc 780 aacgtcgact ttgagatccg gttcatggtg gacacggaca tcgtcggctg caactggctg 840 gagctcccag ccgggaaata cgccctgagg ctgaaggaga aggctacgca gtgccagctg 900 gaggcggacg tgctgtggtc tgacgtggtc agtcacccac cggaagggcc atggcagcgc 960 attgcgccct tgcgcgtgct cagcttcgat atcgagtgcg ccggccgcaa aggcatcttc 1020 cctgagcctg agcgggaccc tgtcatccag atctgctcgc tgggcctgcg ctggggggag 1080 ccggagccct tcctacgcct ggcgctcacc ctgcggccct gtgcccccat cctgggtgcc 1140 aaggtgcaga gctacgagaa ggaggaggac ctgctgcagg cctggtccac cttcatccgt 1200 atcatggacc ccgatgtgat caccggttac aacatccaga acttcgacct tccgtacctc 1260 atctctcggg cccagaccct caaggtacaa acattccctt tcctgggccg tgtggccggc 1320 ctttgctcca acatccggga ctcttcattc cagtccaagc agacgggccg gcgggacacc 1380 aaggttgtca gcatggtggg ccgcgtgcag atggacatgc tgcaggtgct gctgcgggag 1440 tacaagctcc gctcctacac gctcaatgcc gtgagcttcc acttcctggg cgagcagaag 1500 gaggacgtgc agcacagcat catcaccgac ctgcagaatg ggaacgacca gacccgccgc 1560 cgcctggctg tgtactgcct aaaggatgct tacctgccac tgcggctgct ggagcggctc 1620 atggtgctgg tgaacgccgt ggagatggcg agggtcactg gcgtgcccct cagctacctg 1680 ctcagtcgtg gccagcaggt caaggtcgta tcccagctgt tgcggcaggc catgcacgag 1740 gggctgctga tgcccgtggt gaagtcagag ggcggcgagg actacacggg agccactgtc 1800 attgagcccc tcaaagggta ctacgacgtc cccatcgcca ccctggactt ctcctcgctg 1860 tacccgtcca tcatgatggc ccacaacctg tgttacacca cactccttcg gcccgggact 1920 gcacagaaac tgggcctgac tgaggatcag ttcatcagga cccccaccgg ggacgagttt 1980 gtgaagacct cagtgcgtaa ggggctgctg ccccagatcc tggagaacct gctcagtgcc 2040 cggaagaggg ccaaggccga gctggccaag gagacagacc ccctccggcg ccaggtcctg 2100 gatggacggc agctggcgct gaaggtgagc gccaactccg tatacggctt cactggcgcc 2160 caggtgggca agttgccgtg cctggagatc tcacagagcg tcacggggtt cggacgtcag 2220 atgatcgaga aaaccaagca gctggtggag tctaagtaca cagtggagaa tggctacagc 2280 accagcgcca aggtggtgta tggtgacact gactccgtca tgtgccgatt cggcgtgtcc 2340 tcggtggctg aggcgatggc cctgggcggg gaggccgcgg actgggtgtc aggtcacttc 2400 ccgtcgccca tccggctgga gtttgagaag gtctacttcc catacctgct tatcagcaag 2460 aagcgctacg cgggcctgct cttctcctcc cggcccgacg cccacgaccg catggactgc 2520 aagggcctgg aggcggtgcg cagggacaac tgccccctcg tggccaacct ggtcactgcc 2580 tcactgcgcc gcctgctcat cgaccgagac cctgagggcg cggtggctca cgcacaggac 2640 gtcatctcgg acctgctgtg caaccgcatc gatatctccc agctggtcat caccaaggag 2700 ctgacccgcg cggcctccga ctatgccggc aagcaggccc acgtggagct ggccgagagg 2760 atgaggaagc gggaccccgg gagtgcgccc agcctgggcg accgcgtccc ctacgtgatc 2820 atcagtgccg ccaagggtgt ggccgcctac atgaagtcgg aggacccgct gttcgtgctg 2880 gagcacagcc tgcccattga cacgcagtac tacctggagc agcagctggc caagcccctc 2940 ctgcgcatct tcgagcccat cctgggcgag ggccgtgccg aggctgtgct actgcggggg 3000 gaccacacgc gctgcaagac ggtgctcacg ggcaaggtgg gcggcctcct ggccttcgcc 3060 aaacgccgca actgctgcat tggctgccgc acagtgctca gccaccaggg agccgtgtgt 3120 gagttctgcc agccccggga gtctgagctg tatcagaagg aggtatccca tctgaatgcc 3180 ctggaggagc gcttctcgcg cctctggacg cagtgccagc gctgccaggg cagcctgcac 3240 gaggacgtca tctgcaccag ccgggactgc cccatcttct acatgcgcaa gaaggtgcgg 3300 aaggacctgg aagaccagga gcagctcctg cggcgcttcg gaccccctgg acctgaggcc 3360 tggtgacctt gcaagcatcc catggggcgg gggcgggacc agggagaatt aataaagttc 3420 tggacttttg ctaca 3435 <210> 52 <211> 1107 <212> PRT <213> Homo sapiens <400> 52 Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Arg Pro Ser 20 25 30 Gln Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His 35 40 45 Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Val Leu Glu Gly 50 55 60 Val Ala Asp Gly Gln Val Pro Pro Ser Ala Ile Asp Pro Arg Trp Leu 65 70 75 80 Arg Pro Thr Pro Pro Ala Leu Asp Pro Gln Thr Glu Pro Leu Ile Phe 85 90 95 Gln Gln Leu Glu Ile Asp His Tyr Val Gly Pro Ala Gln Pro Val Pro 100 105 110 Gly Gly Pro Pro Pro Ser His Gly Ser Val Pro Val Leu Arg Ala Phe 115 120 125 Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe 130 135 140 Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His 145 150 155 160 Met Gly Asp Leu Gln Arg Glu Leu Asn Leu Ala Ile Asn Arg Asp Ser 165 170 175 Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu 180 185 190 Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro 195 200 205 Phe Leu Arg Ile Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg 210 215 220 Arg Leu Leu Glu Gln Gly Ile Arg Val Ala Gly Leu Gly Thr Pro Ser 225 230 235 240 Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val 245 250 255 Asp Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys 260 265 270 Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gln Cys Gln Leu Glu Ala 275 280 285 Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp 290 295 300 Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala 305 310 315 320 Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln 325 330 335 Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg 340 345 350 Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val 355 360 365 Gln Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe 370 375 380 Ile Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn 385 390 395 400 Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Gln 405 410 415 Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn Ile Arg 420 425 430 Asp Ser Ser Phe Gln Ser Lys Gln Thr Gly Arg Arg Asp Thr Lys Val 435 440 445 Val Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu 450 455 460 Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His 465 470 475 480 Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp 485 490 495 Leu Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys 500 505 510 Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val 515 520 525 Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser 530 535 540 Tyr Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu 545 550 555 560 Arg Gln Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu 565 570 575 Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly 580 585 590 Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro 595 600 605 Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro 610 615 620 Gly Thr Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Arg Thr 625 630 635 640 Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu 645 650 655 Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala 660 665 670 Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly 675 680 685 Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr 690 695 700 Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val 705 710 715 720 Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu 725 730 735 Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val 740 745 750 Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val 755 760 765 Ala Glu Ala Met Ala Leu Gly Gly Glu Ala Ala Asp Trp Val Ser Gly 770 775 780 His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro 785 790 795 800 Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser 805 810 815 Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val 820 825 830 Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu 835 840 845 Arg Arg Leu Leu Ile Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala 850 855 860 Gln Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln 865 870 875 880 Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly 885 890 895 Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro 900 905 910 Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser 915 920 925 Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe 930 935 940 Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln 945 950 955 960 Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu 965 970 975 Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys 980 985 990 Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg 995 1000 1005 Arg Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala 1010 1015 1020 Val Cys Glu Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu 1025 1030 1035 1040 Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr 1045 1050 1055 Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr 1060 1065 1070 Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp 1075 1080 1085 Leu Glu Asp Gln Glu Gln Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro 1090 1095 1100 Glu Ala Trp 1105 <210> 53 <211> 6912 <212> DNA <213> Homo sapiens <400> 53 cgccaaattt ctcccctgaa gcagaggtgg tagccaacgg ctccatgtct ctgaggagcg 60 gcgggcggcg gcgcgcggac ccaggcgcgg atggcgaggc cagcagggat gatggcgcca 120 cttcctcagt ttcggcactc aagcgcctgg aacggagtca gtggacggat aagatggatt 180 tgcggtttgg ttttgagcgg ctgaaggagc ctggtgagaa gacaggctgg ctcattaaca 240 tgcatcctac cgagatttta gatgaagata agcgcttagg cagtgcagtg gattactact 300 ttattcaaga tgacggaagc agatttaagg tggctttgcc ctataaaccg tatttctaca 360 ttgcgaccag aaagggttgt gagcgagaag tttcatcttt tctctccaag aagtttcagg 420 gcaaaattgc aaaagtggag actgtcccca aagaggatct ggacttgcca aatcacttgg 480 tgggtttgaa gcgaaattac atcaggctgt ccttccacac tgtggaggat cttgtcaaag 540 tgaggaagga gatctcccct gccgtgaaga agaacaggga gcaggatcac gccagcgacg 600 cgtacacagc tctgctttcc agtgttctgc agaggggcgg tgtcattact gatgaagagg 660 aaacctctaa gaagatagct gaccagttgg acaacattgt ggacatgcgc gagtacgatg 720 ttccctacca catccgcctc tccattgacc tgaagatcca cgtggctcat tggtacaatg 780 tcagataccg aggaaatgct tttccggtag aaatcacccg ccgagatgac cttgttgaac 840 gacctgaccc tgtggttttg gcatttgaca ttgagacgac caaactgccc ctcaagtttc 900 ctgatgctga gacagaccag attatgatga tttcctacat gatcgatggc cagggctacc 960 tcatcaccaa cagggagatt gtttcagaag atattgaaga ttttgagttc acccccaagc 1020 cagaatatga aggccccttt tgtgtcttca atgaacccga tgaggctcat ctgatccaaa 1080 ggtggtttga acacgtccag gagaccaaac ccaccatcat ggtcacctac aacggggact 1140 tttttgactg gccatttgtg gaggcccggg cagcagtcca cggtctgagc atgcagcagg 1200 agataggctt ccagaaggac agccaggggg agtacaaggc gccccagtgc atccacatgg 1260 actgcctcag gtgggtgaag agggacagtt accttcctgt gggcagtcat aatctcaagg 1320 cggccgccaa ggccaagcta ggctatgatc ccgtggagct agacccggag gacatgtgcc 1380 ggatggccac ggagcagccc cagactctgg ccacgtattc tgtgtcagat gctgtcgcca 1440 cttactacct gtacatgaag tacgtccacc cattcatctt tgctctgtgc accattattc 1500 ccatggagcc cgacgaggtg ctgcggaagg gctctggcac tctgtgtgag gccttgctga 1560 tggtgcaggc cttccacgcc aacatcatct tccccaacaa gcaagagcag gagttcaata 1620 agctgacgga cgacggacac gtgctggact ctgagaccta cgtcgggggc cacgtggagg 1680 ccctcgagtc tggggttttc cgcagcgata tcccttgccg gtttaggatg aatcctgccg 1740 cctttgactt cctgctgcag cgggttgaga agaccttgcg ccacgccctt gaggaagagg 1800 agaaagtgcc tgtggagcaa gtcaccaact ttgaagaggt gtgtgatgag attaagagca 1860 agcttgcctc cctgaaggac gttcccagcc gcatcgagtg tccactcatc taccacctgg 1920 acgtgggggc catgtacccc aacatcatcc tgaccaaccg cctgcagccc tctgccatgg 1980 tggacgaagc cacctgtgct gcctgtgact tcaataagcc tggagcaaac tgccagcgga 2040 agatggcctg gcagtggagg ggcgagttca tgccagccag tcgcagcgaa taccatcgga 2100 tccagcacca gctggagtca gagaagttcc cccccttgtt cccagagggg ccagctcggg 2160 cctttcatga actgtcccgc gaggaacagg cgaaatacga gaagagaagg ctggcggatt 2220 actgccggaa agcctacaag aagatccaca tcaccaaggt ggaagagcgt ctcaccacca 2280 tctgccagcg ggaaaactcc ttctacgtgg acaccgtgcg tgccttccgg gacaggcgtt 2340 acgagttcaa agggctccac aaggtgtgga aaaagaagct ctcggcggcc gtggaggtgg 2400 gcgacgcggc tgaggtgaag cgctgcaaga acatggaggt gctgtatgac tcgctgcagc 2460 tggcccacaa gtgcatcctg aactccttct atggctatgt catgcgcaag ggggctcgct 2520 ggtactccat ggagatggct ggcatcgtct gcttcacagg ggccaacatc atcacccagg 2580 cacgggagct gatcgagcag attgggaggc ccttagagct ggacacagat ggtatatggt 2640 gcgtcctgcc caacagcttc ccagaaaatt ttgtcttcaa gacgaccaat gtgaagaagc 2700 ccaaagtgac catctcctac ccaggcgcca tgttgaacat catggtcaag gaaggcttca 2760 ccaatgacca gtaccaggag ctggctgagc cgtcctcact cacctacgtc acccgctcag 2820 agaacagcat cttttttgag gttgatgggc cctaccttgc catgattctt ccagcctcca 2880 aggaagaagg caagaaattg aagaagaggt atgctgtgtt caatgaagac ggttctctgg 2940 ctgagctcaa gggctttgag gtcaaacgcc gcggggaact gcagctgatt aagatcttcc 3000 aatcctcggt gtttgaggcc ttcctcaagg gcagcacgct ggaagaggtg tatggctctg 3060 tagccaaggt ggctgactac tggctggacg tgctgtacag caaggcagcc aacatgcctg 3120 actctgagct attcgagctc atctctgaga accgttccat gtctcggaag ctggaagatt 3180 acggggagca gaagtctaca tccatcagca cagcaaagcg cctggccgag ttcctgggag 3240 accagatggt caaggatgca gggctgagtt gccgctacat catctcccgc aagcccgagg 3300 gctcccctgt cacggagagg gccatcccac ttgccatttt ccaagcagag cccacggtga 3360 ggaagcactt tctccggaaa tggctcaaga gctcttccct tcaagacttt gatattcgag 3420 caattctgga ttgggactac tacattgagc ggctgggaag cgccatccag aagatcatca 3480 ccatccctgc ggccctgcag caggtaaaga acccagtgcc acgtgtcaaa caccccgact 3540 ggctgcacaa aaaactgctg gagaagaatg atgtctacaa gcagaagaag atcagtgagc 3600 tcttcaccct ggagggcagg agacaggtca cgatggccga ggcctcagaa gacagtccga 3660 ggccaagtgc tcctgacatg gaggacttcg gcctcgtaaa gctgcctcac ccagcagccc 3720 ctgtcactgt gaagaggaag cgagttcttt gggagagcca ggaggagtcc caggacctca 3780 cgccgactgt gccctggcag gaaatcttgg ggcagcctcc cgccctggga accagccagg 3840 aggaatggct tgtctggctc cggttccaca agaagaagtg gcagctgcag gcccggcagc 3900 gcctcgcccg caggaagagg cagcgtctgg agtcggcaga gggtgtgctc aggcccgggg 3960 ccatccggga tggtcctgcc acggggctgg ggagcttctt gcgaagaact gcccgcagca 4020 tcctggacct tccgtggcag attgtgcaga tcagcgagac cagccaggcc ggcctgttca 4080 ggctgtgggc gctcgttggc agtgacttgc actgcatcag gctgagcatc ccccgtgtgt 4140 tctacgtgaa ccagcgagtc gctaaagcgg aggagggtgc ttcgtatcgc aaggtaaatc 4200 gggtccttcc tcgctccaac atggtctaca atctctatga gtattcagtg ccagaggaca 4260 tgtaccagga acacatcaac gagatcaacg ctgagctgtc agcgccagac atcgagggcg 4320 tatatgagac tcaggttccg ttactgttcc gggccctggt gcacctgggc tgtgtgtgtg 4380 tggtcaataa acagctggtg aggcaccttt caggctggga agcagagacc tttgctcttg 4440 agcacctgga gatgcgctct ctggcccagt tcagctacct ggaaccaggg agtatccgcc 4500 atatctacct gtaccaccac gcacaggccc acaaagcgct cttcgggatc ttcatcccct 4560 cacagcgcag ggcatccgtc tttgtgctgg acactgtgcg cagcaaccag atgcccagcc 4620 ttggcgccct gtactcagca gagcacggcc tcctcctgga gaaggtgggc cctgagctcc 4680 tgccaccccc caaacacacc ttcgaagttc gggcagaaac tgacctgaag accatctgca 4740 gagccatcca gcgattcctg ctcgcctaca aggaggagcg ccgggggccc acactcatcg 4800 ctgttcagtc cagctgggag ctgaagaggc tggccagtga aattcctgtc ttggaggaat 4860 tcccactggt gcctatctgt gtggctgaca agatcaacta tggggtcctg gactggcagc 4920 gccatggagc ccggcgcatg atccgtcact acctcaacct ggacacctgc ctgtcgcagg 4980 ccttcgagat gagcaggtac tttcacattc ccattgggaa cctaccagag gacatctcca 5040 cattcggctc cgacctcttc tttgcccgcc acctccagcg ccacaaccac ctgctctggc 5100 tgtcccctac agcccgccct gacctgggtg gaaaggaggc tgatgacaac tgtcttgtca 5160 tggagttcga tgaccaagcc actgttgaga tcaacagttc aggctgttac tccacagtgt 5220 gtgtggagct ggaccttcag aacctggccg tcaacaccat tctccagtct caccatgtca 5280 acgacatgga gggggccgac agcatgggga tcagcttcga cgtgatccag caggcctccc 5340 tggaggacat gatcacgggt ggtcaggctg ccagtgcccc ggccagctac gatgagacag 5400 ccctgtgctc taacaccttc aggatcctga agagcatggt cgtgggctgg gtgaaggaga 5460 tcacccagta ccacaacatc tatgcagaca accaggtgat gcacttctac cgctggcttc 5520 ggtcgccatc ctctctgctt catgaccctg ccctgcaccg cacactccac aacatgatga 5580 agaagctctt cctgcagctc atcgctgagt tcaagcgcct ggggtcatca gtcatctacg 5640 ccaacttcaa ccgcatcatc ctctgtacaa agaagcgccg tgtggaagat gccatcgctt 5700 acgtggagta catcaccagc agcatccatt caaaggagac cttccattct ctgacaattt 5760 ctttctctcg atgctgggaa tttcttctct ggatggatcc atctaactat ggcggaatca 5820 aaggaaaagt ttcatctcgt attcactgtg gactgcaaga ctcccagaaa gcagggggag 5880 cagaggatga gcaggaaaat gaggacgatg aggaggaaag agatggggag gaggaggaag 5940 aggcggagga atccaacgtg gaggatttac tggaaaacaa ctggaacatt ttgcagtttt 6000 tgccacaggc agcctcctgc cagaactact tcctcatgat tgtttcagcg tacatcgtgg 6060 ccgtgtacca ctgcatgaag gacgggctga ggcgcagtgc tccagggagc acccccgtga 6120 ggaggagggg ggccagccag ctctcccagg aggccgaggg ggcggtcgga gcccttcccg 6180 gaatgatcac cttctctcag gattatgtcg caaatgagct cactcagagc ttcttcacca 6240 tcactcagaa gattcagaag aaagtcacag gctctcggaa ctccactgag ctctcagaga 6300 tgtttcctgt cctccccggt tcccacttgc tgctcaataa ccctgccctg gagttcatca 6360 aatacgtgtg caaggtgctg tccctggaca ccaacatcac aaaccaggtg aataagctga 6420 accgagacct gcttcgcctg gtggatgtcg gcgagttctc cgaggaggcc cagttccgag 6480 acccctgccg ctcctacgtg cttcctgagg tcatctgccg cagctgtaac ttctgccgcg 6540 acctggacct gtgtaaagac tcttccttct cagaggatgg ggcggtcctg cctcagtggc 6600 tctgctccaa ctgtcaggcg ccctacgact cctctgccat cgagatgacg ctggtggaag 6660 ttctacagaa gaagctgatg gccttcaccc tgcaggacct ggtctgcctg aagtgccgcg 6720 gggtgaagga gaccagcatg cctgtgtact gcacgtgcgc gggagacttc gccctcacca 6780 tccacaccca ggtcttcatg gaacagatcg gaatattccg gaacattgcc cagcactacg 6840 gcatgtcgta cctcctggag accctggagt ggctgctgca gaagaaccca cagctgggcc 6900 attagccagc cc 6912 <210> 54 <211> 2286 <212> PRT <213> Homo sapiens <400> 54 Met Ser Leu Arg Ser Gly Gly Arg Arg Arg Ala Asp Pro Gly Ala Asp 1 5 10 15 Gly Glu Ala Ser Arg Asp Asp Gly Ala Thr Ser Ser Val Ser Ala Leu 20 25 30 Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe 35 40 45 Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Lys Thr Gly Trp Leu Ile 50 55 60 Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Gly Ser 65 70 75 80 Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val 85 90 95 Ala Leu Pro Tyr Lys Pro Tyr Phe Tyr Ile Ala Thr Arg Lys Gly Cys 100 105 110 Glu Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile 115 120 125 Ala Lys Val Glu Thr Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His 130 135 140 Leu Val Gly Leu Lys Arg Asn Tyr Ile Arg Leu Ser Phe His Thr Val 145 150 155 160 Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys 165 170 175 Asn Arg Glu Gln Asp His Ala Ser Asp Ala Tyr Thr Ala Leu Leu Ser 180 185 190 Ser Val Leu Gln Arg Gly Gly Val Ile Thr Asp Glu Glu Glu Thr Ser 195 200 205 Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr 210 215 220 Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Lys Ile His Val 225 230 235 240 Ala His Trp Tyr Asn Val Arg Tyr Arg Gly Asn Ala Phe Pro Val Glu 245 250 255 Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu 260 265 270 Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala 275 280 285 Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly 290 295 300 Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe 305 310 315 320 Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn 325 330 335 Glu Pro Asp Glu Ala His Leu Ile Gln Arg Trp Phe Glu His Val Gln 340 345 350 Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp 355 360 365 Trp Pro Phe Val Glu Ala Arg Ala Ala Val His Gly Leu Ser Met Gln 370 375 380 Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro 385 390 395 400 Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr 405 410 415 Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu 420 425 430 Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala 435 440 445 Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val 450 455 460 Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala 465 470 475 480 Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly 485 490 495 Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala 500 505 510 Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr 515 520 525 Asp Asp Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val 530 535 540 Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe 545 550 555 560 Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys 565 570 575 Thr Leu Arg His Ala Leu Glu Glu Glu Glu Lys Val Pro Val Glu Gln 580 585 590 Val Thr Asn Phe Glu Glu Val Cys Asp Glu Ile Lys Ser Lys Leu Ala 595 600 605 Ser Leu Lys Asp Val Pro Ser Arg Ile Glu Cys Pro Leu Ile Tyr His 610 615 620 Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu 625 630 635 640 Gln Pro Ser Ala Met Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe 645 650 655 Asn Lys Pro Gly Ala Asn Cys Gln Arg Lys Met Ala Trp Gln Trp Arg 660 665 670 Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His 675 680 685 Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala 690 695 700 Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys 705 710 715 720 Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Ile 725 730 735 Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser 740 745 750 Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe 755 760 765 Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu 770 775 780 Val Gly Asp Ala Ala Glu Val Lys Arg Cys Lys Asn Met Glu Val Leu 785 790 795 800 Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr 805 810 815 Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala 820 825 830 Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu 835 840 845 Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile 850 855 860 Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Phe Lys Thr 865 870 875 880 Thr Asn Val Lys Lys Pro Lys Val Thr Ile Ser Tyr Pro Gly Ala Met 885 890 895 Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn Asp Gln Tyr Gln Glu 900 905 910 Leu Ala Glu Pro Ser Ser Leu Thr Tyr Val Thr Arg Ser Glu Asn Ser 915 920 925 Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala 930 935 940 Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn 945 950 955 960 Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg 965 970 975 Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala 980 985 990 Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys 995 1000 1005 Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met 1010 1015 1020 Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser 1025 1030 1035 1040 Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr 1045 1050 1055 Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala 1060 1065 1070 Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro 1075 1080 1085 Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr 1090 1095 1100 Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln 1105 1110 1115 1120 Asp Phe Asp Ile Arg Ala Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg 1125 1130 1135 Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln 1140 1145 1150 Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His 1155 1160 1165 Lys Lys Leu Leu Glu Lys Asn Asp Val Tyr Lys Gln Lys Lys Ile Ser 1170 1175 1180 Glu Leu Phe Thr Leu Glu Gly Arg Arg Gln Val Thr Met Ala Glu Ala 1185 1190 1195 1200 Ser Glu Asp Ser Pro Arg Pro Ser Ala Pro Asp Met Glu Asp Phe Gly 1205 1210 1215 Leu Val Lys Leu Pro His Pro Ala Ala Pro Val Thr Val Lys Arg Lys 1220 1225 1230 Arg Val Leu Trp Glu Ser Gln Glu Glu Ser Gln Asp Leu Thr Pro Thr 1235 1240 1245 Val Pro Trp Gln Glu Ile Leu Gly Gln Pro Pro Ala Leu Gly Thr Ser 1250 1255 1260 Gln Glu Glu Trp Leu Val Trp Leu Arg Phe His Lys Lys Lys Trp Gln 1265 1270 1275 1280 Leu Gln Ala Arg Gln Arg Leu Ala Arg Arg Lys Arg Gln Arg Leu Glu 1285 1290 1295 Ser Ala Glu Gly Val Leu Arg Pro Gly Ala Ile Arg Asp Gly Pro Ala 1300 1305 1310 Thr Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Leu Asp 1315 1320 1325 Leu Pro Trp Gln Ile Val Gln Ile Ser Glu Thr Ser Gln Ala Gly Leu 1330 1335 1340 Phe Arg Leu Trp Ala Leu Val Gly Ser Asp Leu His Cys Ile Arg Leu 1345 1350 1355 1360 Ser Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu 1365 1370 1375 Glu Gly Ala Ser Tyr Arg Lys Val Asn Arg Val Leu Pro Arg Ser Asn 1380 1385 1390 Met Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln 1395 1400 1405 Glu His Ile Asn Glu Ile Asn Ala Glu Leu Ser Ala Pro Asp Ile Glu 1410 1415 1420 Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val His 1425 1430 1435 1440 Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Val Arg His Leu Ser 1445 1450 1455 Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser 1460 1465 1470 Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr 1475 1480 1485 Leu Tyr His His Ala Gln Ala His Lys Ala Leu Phe Gly Ile Phe Ile 1490 1495 1500 Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser 1505 1510 1515 1520 Asn Gln Met Pro Ser Leu Gly Ala Leu Tyr Ser Ala Glu His Gly Leu 1525 1530 1535 Leu Leu Glu Lys Val Gly Pro Glu Leu Leu Pro Pro Pro Lys His Thr 1540 1545 1550 Phe Glu Val Arg Ala Glu Thr Asp Leu Lys Thr Ile Cys Arg Ala Ile 1555 1560 1565 Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu 1570 1575 1580 Ile Ala Val Gln Ser Ser Trp Glu Leu Lys Arg Leu Ala Ser Glu Ile 1585 1590 1595 1600 Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Cys Val Ala Asp Lys 1605 1610 1615 Ile Asn Tyr Gly Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met 1620 1625 1630 Ile Arg His Tyr Leu Asn Leu Asp Thr Cys Leu Ser Gln Ala Phe Glu 1635 1640 1645 Met Ser Arg Tyr Phe His Ile Pro Ile Gly Asn Leu Pro Glu Asp Ile 1650 1655 1660 Ser Thr Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln Arg His 1665 1670 1675 1680 Asn His Leu Leu Trp Leu Ser Pro Thr Ala Arg Pro Asp Leu Gly Gly 1685 1690 1695 Lys Glu Ala Asp Asp Asn Cys Leu Val Met Glu Phe Asp Asp Gln Ala 1700 1705 1710 Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu 1715 1720 1725 Leu Asp Leu Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His 1730 1735 1740 Val Asn Asp Met Glu Gly Ala Asp Ser Met Gly Ile Ser Phe Asp Val 1745 1750 1755 1760 Ile Gln Gln Ala Ser Leu Glu Asp Met Ile Thr Gly Gly Gln Ala Ala 1765 1770 1775 Ser Ala Pro Ala Ser Tyr Asp Glu Thr Ala Leu Cys Ser Asn Thr Phe 1780 1785 1790 Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln 1795 1800 1805 Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp 1810 1815 1820 Leu Arg Ser Pro Ser Ser Leu Leu His Asp Pro Ala Leu His Arg Thr 1825 1830 1835 1840 Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe 1845 1850 1855 Lys Arg Leu Gly Ser Ser Val Ile Tyr Ala Asn Phe Asn Arg Ile Ile 1860 1865 1870 Leu Cys Thr Lys Lys Arg Arg Val Glu Asp Ala Ile Ala Tyr Val Glu 1875 1880 1885 Tyr Ile Thr Ser Ser Ile His Ser Lys Glu Thr Phe His Ser Leu Thr 1890 1895 1900 Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser 1905 1910 1915 1920 Asn Tyr Gly Gly Ile Lys Gly Lys Val Ser Ser Arg Ile His Cys Gly 1925 1930 1935 Leu Gln Asp Ser Gln Lys Ala Gly Gly Ala Glu Asp Glu Gln Glu Asn 1940 1945 1950 Glu Asp Asp Glu Glu Glu Arg Asp Gly Glu Glu Glu Glu Glu Ala Glu 1955 1960 1965 Glu Ser Asn Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln 1970 1975 1980 Phe Leu Pro Gln Ala Ala Ser Cys Gln Asn Tyr Phe Leu Met Ile Val 1985 1990 1995 2000 Ser Ala Tyr Ile Val Ala Val Tyr His Cys Met Lys Asp Gly Leu Arg 2005 2010 2015 Arg Ser Ala Pro Gly Ser Thr Pro Val Arg Arg Arg Gly Ala Ser Gln 2020 2025 2030 Leu Ser Gln Glu Ala Glu Gly Ala Val Gly Ala Leu Pro Gly Met Ile 2035 2040 2045 Thr Phe Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe 2050 2055 2060 Thr Ile Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Ser 2065 2070 2075 2080 Thr Glu Leu Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu 2085 2090 2095 Leu Asn Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu 2100 2105 2110 Ser Leu Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp 2115 2120 2125 Leu Leu Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe 2130 2135 2140 Arg Asp Pro Cys Arg Ser Tyr Val Leu Pro Glu Val Ile Cys Arg Ser 2145 2150 2155 2160 Cys Asn Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser 2165 2170 2175 Glu Asp Gly Ala Val Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala 2180 2185 2190 Pro Tyr Asp Ser Ser Ala Ile Glu Met Thr Leu Val Glu Val Leu Gln 2195 2200 2205 Lys Lys Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys 2210 2215 2220 Arg Gly Val Lys Glu Thr Ser Met Pro Val Tyr Cys Thr Cys Ala Gly 2225 2230 2235 2240 Asp Phe Ala Leu Thr Ile His Thr Gln Val Phe Met Glu Gln Ile Gly 2245 2250 2255 Ile Phe Arg Asn Ile Ala Gln His Tyr Gly Met Ser Tyr Leu Leu Glu 2260 2265 2270 Thr Leu Glu Trp Leu Leu Gln Lys Asn Pro Gln Leu Gly His 2275 2280 2285 <210> 55 <211> 3390 <212> DNA <213> Mus musculus <400> 55 atcttgtggc gggaaaagct gtttgaggcg atggattgta agcggcgaca aggaccaggc 60 cctggggtgc ccccaaagcg ggctcgaggg cacctctggg atgaggacga gccttcgccg 120 tcgcagtttg aggcgaacct ggcactgctg gaggaaatag aggctgagaa ccggctgcag 180 gaggcagagg aggagctgca gctgccccca gagggcaccg tgggtgggca gttttccact 240 gcagacattg accctcggtg gcggcggccc accctacgtg ccctggaccc cagcacggag 300 cccctcatct tccagcagct ggagattgac cactatgtgg gctcagcacc acccctgcca 360 gaacggcccc tgccatcccg gaactcagtg cccatactga gggcctttgg ggtcaccgat 420 gaaggcttct ccgtctgctg ccacatacag ggctttgccc cctacttcta cacccccgcg 480 cctcctggtt ttggggccga gcacctgagt gagctgcagc aggagctgaa cgcagccatc 540 agccgggacc agcgcggtgg gaaggagctc tcagggccgg cagtgctggc aatagagcta 600 tgctcccgtg agagcatgtt tgggtaccac ggtcatggcc cttctccatt tctccgcatc 660 accctggcac taccccgcct tatggcacca gcccgccgcc ttctggaaca gggtgtccga 720 gtgccaggcc tgggcacccc gagcttcgca ccctacgaag ccaacgtgga ctttgagatc 780 cggttcatgg tggatgctga cattgtggga tgcaactggt tggagctgcc agctggaaag 840 tacgttcgga gggcggagaa gaaggccacc ctgtgtcagc tggaggtgga cgtgctgtgg 900 tcagatgtga tcagtcaccc accggagggg cagtggcagc gcattgcacc cctgcgtgtg 960 cttagcttcg acatcgagtg tgctggccga aaaggcatct tccctgagcc tgagcgtgac 1020 cccgtgatcc agatctgttc tctggggctg cgctgggggg agccggagcc attcttgcgt 1080 ctggcactca cgctgcggcc ctgtgccccc atcctgggtg ccaaagtgca gagctatgag 1140 cgggaagaag acctgctcca ggcctgggcc gacttcatcc ttgccatgga ccctgacgtg 1200 atcaccggct acaacattca gaactttgac ctcccatacc tcatctctcg ggcacaggcc 1260 ctaaaggtgg accgcttccc tttcctgggc cgcgtgactg gtctccgctc caacatccgt 1320 gactcctcct tccaatcaag gcaggtcggc cggcgggaca gtaaggtgat cagcatggtg 1380 ggtcgcgttc agatggatat gctgcaggtg ctgcttcggg aacacaagct ccgctcctac 1440 acgctcaacg ctgtgagttt ccacttcctg ggcgagcaga aggaggacgt tcagcacagc 1500 atcatcaccg acctgcagaa tgggaacgaa cagacgcgcc gccgcctggc cgtgtactgc 1560 ctgaaggacg cctttctgcc actccgacta ctagagcgcc ttatggtgct ggtgaacaat 1620 gtggagatgg cgcgtgtcac cggtgtaccc cttgggtacc tgctcacccg gggccagcag 1680 gtcaaggtcg tgtctcagct gctgcgccag gccatgcgcc aggggctgct gatgcctgtg 1740 gtgaagaccg agggcggtga ggactacacg ggagccacag tcattgagcc cctcaaaggg 1800 tactatgacg tccccattgc caccctggac ttctcctcct tgtacccatc catcatgatg 1860 gcccataatc tgtgctacac cacgctgctc cgacctgggg ctgcccagaa gctgggcctt 1920 aaaccagatg agttcatcaa gacacccact ggggatgagt ttgtgaagtc atctgtacgg 1980 aagggcctcc tgccccagat cctggagaat ctgctgagtg cccgcaagag ggccaaggct 2040 gagctggctc aggagacgga ccccctgcgg cgacaggtct tggacggccg gcaactggca 2100 ctaaaagtga gtgccaactc cgtatatggc ttcactggtg cccaggtggg caagctgcca 2160 tgtttggaaa tctcccagag tgtcactggg ttcgggcggc agatgattga gaaaaccaag 2220 cagcttgtgg agtccaagta caccgtggaa aatggctacg atgccaacgc caaggtagtc 2280 tacggtgaca cggactctgt gatgtgccgg tttggcgtct cctctgtggc tgaagcaatg 2340 tctctggggc gggaggctgc aaactgggta tccagtcact tcccatcacc catccggctg 2400 gagttcgaga aggtttactt cccatacctg ctcatcagca agaagcgcta tgctggcctg 2460 ctcttctcct cccgctctga tgcccatgac aaaatggact gcaagggcct ggaggctgtg 2520 cgcagggaca actgtcccct ggtggccaac ctcgttacat cctccctgcg ccggatcctc 2580 gtggaccggg accctgatgg ggcagtagcc catgccaagg acgtcatctc ggacctgctg 2640 tgcaaccgca tagacatctc ccagctggtc atcaccaaag agttgacccg cgcagcagca 2700 gactatgctg gcaagcaggc tcacgtggag ctggctgaga ggatgaggaa gcgcgacccc 2760 ggcagtgcgc ccagcctggg tgaccgagtc ccctatgtga tcattggtgc tgctaagggt 2820 gtggccgcct acatgaagtc ggaggacccc ctgtttgtgc tggagcacag cctgcccatc 2880 gacactcagt actacctgga gcagcagctg gccaagccgc tcttgcgcat ctttgagccc 2940 atcctgggtg agggccgtgc agagtctgtg ctgctgcgcg gtgaccacac acgatgcaag 3000 actgtgctca ccagcaaggt gggcggcctc ttggccttca ccaagcgccg caactgttgc 3060 attggctgcc gctccgtaat cgaccatcaa ggagccgtgt gtaagttctg tcagccacgg 3120 gagtcggagc tctctcagaa ggaggtgtca cacctgaatg ccttggaaga acggttctct 3180 cgcctctgga cacagtgtca acgctgccag ggcagcttgc atgaggacgt catctgtacc 3240 agccgtgact gtcccatctt ctacatgcgc aagaaggtgc gcaaggacct ggaagaccag 3300 gaacggctgc tgcagcgctt tggaccgccc ggccctgagg cctggtgacc tgacacggga 3360 caaggaataa agttcagatc tttgctaaaa 3390 <210> 56 <211> 1105 <212> PRT <213> Mus musculus <400> 56 Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln 20 25 30 Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg 35 40 45 Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val 50 55 60 Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro 65 70 75 80 Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln 85 90 95 Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Arg 100 105 110 Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val 115 120 125 Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro 130 135 140 Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser 145 150 155 160 Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly 165 170 175 Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser 180 185 190 Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu 195 200 205 Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu 210 215 220 Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala 225 230 235 240 Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala 245 250 255 Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val 260 265 270 Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val 275 280 285 Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg 290 295 300 Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg 305 310 315 320 Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys 325 330 335 Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala 340 345 350 Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser 355 360 365 Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu 370 375 380 Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp 385 390 395 400 Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe 405 410 415 Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser 420 425 430 Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser 435 440 445 Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu 450 455 460 His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu 465 470 475 480 Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln 485 490 495 Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys 500 505 510 Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val 515 520 525 Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu 530 535 540 Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln 545 550 555 560 Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly 565 570 575 Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr 580 585 590 Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile 595 600 605 Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala 610 615 620 Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr 625 630 635 640 Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln 645 650 655 Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu 660 665 670 Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln 675 680 685 Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala 690 695 700 Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly 705 710 715 720 Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys 725 730 735 Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly 740 745 750 Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu 755 760 765 Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe 770 775 780 Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu 785 790 795 800 Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser 805 810 815 Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg 820 825 830 Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg 835 840 845 Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp 850 855 860 Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val 865 870 875 880 Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln 885 890 895 Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser 900 905 910 Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala 915 920 925 Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu 930 935 940 Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu 945 950 955 960 Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg 965 970 975 Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val 980 985 990 Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn 995 1000 1005 Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys 1010 1015 1020 Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Ser Gln Lys Glu Val Ser 1025 1030 1035 1040 His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys 1045 1050 1055 Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg 1060 1065 1070 Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu 1075 1080 1085 Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala 1090 1095 1100 Trp 110 <210> 57 <211> 7119 <212> DNA <213> Mus musculus <400> 57 gccaaattct ccccggagcc tgagggagct ttggagcgtc gcaatggtcc tgaggaacag 60 tggacggagg caccccgagc cgggcgcgga tggcgaaggc agccgggatg atggtccctc 120 ttcctcagtc tcagcactca agcgtctgga acggagccag tggacagaca agatggactt 180 acggtttggt ttcgaaaggc tgaaagagcc tggagaaagg actggctggc tgatcaacat 240 gcaccctact gagatcttag atgaagacaa acgcttagtc agcgcggtgg attactactt 300 cattcaagat gatggaagca gatttaaggt ggccttgccc tatatgccgt atttctacat 360 tgcagcgaga aagggttgtg atcgagaagt ttcatctttt ctatccaaga agtttcaggg 420 aaaaattgca aagttagaga atgtgcccaa agaagatctg gacttgccaa atcacttggt 480 gggcttgaag cggagttaca tcaagctgtc cttccacact gtggaggacc ttgtcaaagt 540 gagaaaggag atctctcctg ctgtgaagaa gaaccgagag caggaccatg ctagtgatga 600 gtatacaaca atgctctcca gtattctgca aggtggcagt gtaattactg atgaggagga 660 aacctctaag aagatagctg accaattgga caacatagtg gacatgcggg agtatgatgt 720 tccctaccac attcgcctct ccattgacct cagaatccat gtggcccact ggtacaatgt 780 tagatttcga ggaaatgctt ttcctgtgga aatcacccga cgagatgatc ttgtggaacg 840 acctgaccct gtggttttgg catttgacat cgagacgacc aaactgcctc tcaaattccc 900 tgatgctgag accgatcaga tcatgatgat ctcctatatg attgatggcc agggctacct 960 catcactaac agggagattg tttcagaaga tattgaagat tttgagttca cccctaagcc 1020 agaatatgaa gggccctttt gtgttttcaa tgaacccgac gaggtccatc tgatccagag 1080 atggtttgag catatccagg agaccaaacc taccattatg gtcacctaca atggggattt 1140 ttttgactgg ccatttgtgg aggctagggc agcaattcat ggcctcagca tgtaccagga 1200 gataggcttc cagaaggata gccaggggga atataaggca ccacagtgca tccacatgga 1260 ctgcctcagg tgggtgaaga gggacagtta ccttcctgtg ggcagtcata atctcaaggc 1320 agctgccaag gccaaacttg gctatgaccc tgtagagctg gaccctgagg acatgtgtcg 1380 tatggccact gaacagcccc agactctggc cacttactca gtgtcagatg ctgtggctac 1440 ttactacctg tacatgaaat acgtccaccc cttcatattc gccctgtgca ccattattcc 1500 catggaacct gatgaggtgc tgcggaaggg ctccgggaca ctgtgtgaag ccttgctgat 1560 ggtgcaagct ttccatgcca acattatctt ccccaataag caagagcagg agttcaacaa 1620 gctgacagat gatggccacg tgctagatgc tgagacctac gttgggggcc acgtggaggc 1680 actagagtct ggtgtcttca gaagtgatat cccctgccgg tttaggatga atcctgcagc 1740 ctttgatttc ctgctgcaac gagtcgagaa gactatgcgc cacgccattg aagaagaaga 1800 gaaggtgcct gtggaacaag ccaccaactt tcaagaggtg tgtgagcaga ttaagaccaa 1860 gctcacctcc ctaaaagatg ttcctaacag aattgaatgt cctctaatct atcatctaga 1920 tgtgggggcc atgtatccta acataattct taccaaccgc ctacagcctt ctgccatagt 1980 ggatgaggcc acctgtgctg cctgtgactt caataagcct ggagcaagtt gtcagaggaa 2040 gatggcctgg cagtggaggg gagaattcat gccagccagt cgcagtgaat accatcggat 2100 tcagcatcag ctggagtcgg agaagtttcc ccctttgttt ccagaggggc cagcacgggc 2160 ctttcacgag ctgtcccgtg aagaacaggc taaatatgag aagaggaggc tggcagatta 2220 ttgccggaaa gcctataaga agatccatgt gaccaaggta gaagaacgtc taactaccat 2280 ctgccagcgg gaaaactcat tttatgtgga cacagtgcgg gccttcagag acaggcgcta 2340 tgagttcaaa ggactgcaca aggtgtggaa gaagaagctc tcggcagctg tagaggtggg 2400 cgatgcatca gaggtgaagc gctgcaagaa catggagatc ctttacgatt cactgcagct 2460 ggctcacaag tgcatcctga actccttcta cggctatgtc atgcgcaaag gagctcgctg 2520 gtattccatg gagatggctg gtatcgtctg ctttacagga gccaacatca tcacccaagc 2580 aagagaactg attgagcaga tcgggaggcc tttagaattg gacacggacg gaatatggtg 2640 cgtcctaccc aatagctttc ctgaaaattt tgtcatcaag acaaccaatg cgaagaaacc 2700 caaactgacc atctcctatc ctggtgccat gttgaacatc atggtcaagg aaggctttac 2760 caaccaccag taccaggaac taacagagcc ttcgtctctc acctatgtca cccactctga 2820 gaatagtatc ttttttgaag tcgatggacc ataccttgct atgatccttc cagcctccaa 2880 ggaagaaggc aagaagctga agaaaagata tgctgtgttc aatgaagatg gttccttggc 2940 tgaactgaaa ggttttgagg tgaaacgccg aggggagttg cagctgatta aaatattcca 3000 gtcctcagtt tttgaggcct tcctcaaggg cagcacactg gaggaagtgt atggctcggt 3060 ggccaaagtg gctgactact ggctagatgt gctctatagc aaggctgcta atatgcccga 3120 ttctgaattg tttgagctga tttctgagaa ccgctccatg tctcggaagc tggaagatta 3180 cggggagcag aagtctacat ccatcagcac agcaaagcgc ctggctgagt tcctgggaga 3240 ccagatggtc aaagatgctg gactgagctg ccgctatatc atctcccgaa agccagaggg 3300 gtctcctgtc actgagaggg ccattccact tgccattttc caagcagagc ctacagtgag 3360 gaaacatttt ctccggaaat ggctaaagag ttcatcactt caagactttg atattcggac 3420 aattctggac tgggactact acatagagag gctggggagt gccatccaga aaatcatcac 3480 catccccgca gctctgcagc aggtgaagaa cccagttcca cgtgtcaaac atccagactg 3540 gctacacaaa aaactactag agaagaatga tatctacaaa cagaagaaga tcagtgagct 3600 ctttgtgctt gaaggaaaga gacagattgt gatggcccag gcttcagaaa acagtctgag 3660 tctctgcact ccagacatgg aggacattgg actcacaaag ccacaccact ctacagtccc 3720 agttgctact aagaggaagc gagtctggga gacccaaaag gagtctcagg atattgcact 3780 aactgtgccc tggcaagagg tcttagggca gcctccctcc cttggaacca cacaggaaga 3840 gtggttggtc tggctccagt tccacaagaa aaagtggcag ctgcaggccc aacagcgcct 3900 agccctcagg aagaagcaac gcttagagtc agcagaagat atgccaaggc ttgggcctat 3960 ccgagaggag ccttccacag gactggggag ctttttgcga aggactgccc gcagcatcat 4020 ggaccttcca tggcagataa tacagatcag tgagaccaga caggctggtc tgttccggct 4080 gtgggctatc attggcaatg acttgcactg catcaagctg agtatccctc gagtattcta 4140 tgtaaaccag cgggttgcca aagcagagga tggacctgca tatcggaagg tgaatcgggg 4200 gctcttcctt cgttccaaca ttgtctacaa tctctatgag tattcagtac cagaggacat 4260 gtaccaagaa cacatcaacg agatcaacac tgagttgtca gtaccagaca ttgagggcgt 4320 gtatgagaca caggtcccat tgttattccg ggccctcgtg cagctgggct gtgtgtgtgt 4380 ggtcaacaag cagctgacaa ggcacctttc gggctgggaa gctgaaactt ttgccctcga 4440 gcaccttgaa atgcgttctc tggcccagtt cagctacttg gaaccaggga gtatccgcca 4500 tatctacctg taccatcaca ctcagggcca caaggcactc tttggggtct ttatcccctc 4560 acagcgaaga gcatctgtgt ttgtgttgga tactgtacga agcaaccaaa tgccagggct 4620 cagtgccctg tactcatcag aacacagcct gctgctggac aaggtggacc ccaagctcct 4680 gcctccccca aaacacacct ttgaagttcg tgctgaaacc aacctggaga ctatctgcag 4740 agccatccag cgcttcctgc ttgcctacaa ggaagagcgc cgagggccca cactcatcgc 4800 tgtccagtct agctgggagc tgtgtaggct gaccagtgag attccagtct tagaagagtt 4860 cccactagtg cctatccgag tggctgacaa gatcagctat gcagtcctag actggcagcg 4920 ccatggagct cgccgaatga tccggcacta cctcaattta gacttgtgcc tgtcgcaggc 4980 ctttgagatg agcaggtact tccacatccc tgttggaaac ctgccggaag acatctccat 5040 ctttggctca gacctctttt ttgcacgcca cctccagcac cataaccacc tgctttggct 5100 atcccctacc tctcggcctg acctgggtgg gaaggaagct gatgacaacc gccttgtcat 5160 ggagtttgat gaccgagcca ctgtggagat caatagttct ggctgttact ctactgtgtg 5220 cgtggaactg gacattcaaa atctggcagt caacaccatc ctccagtccc atcatgtcaa 5280 tgacatggag ggggctggca gcatgggcat cagcttcgat gtgatccagc aggcctccct 5340 agaggacatg gtaacaggca atcaagctgc cagtgccctg gccaactacg atgagacagc 5400 cctctgctct agtaccttca ggatcctgaa gagcatggtg gttggctggg taaaggaaat 5460 cacacagtac cacaacatct atgctgacaa ccaggtaatg cacttctacc gctggctcca 5520 gtcaccgtgc tctctgctcc acgacccagc ccttcaccgg acgctgcaca atatgatgaa 5580 gaagctcttc ctgcagctca ttgctgagtt caagcgcctg gggtcatcag tcgtctatgc 5640 caacttcaat cgcatcattc tctgtacaaa gaagcgccga atagaggatg cccttgccta 5700 tgtggaatat attaccaaca gcatccattc taaagagatc ttccattccc tgaccatctc 5760 tttctctcga tgctgggaat tccttctctg gatggatcca tccaactatg gtggaatcaa 5820 aggaaaagtt ccatctagta ttcactgtgg acaggtaaaa gagcaagact cccaggcaag 5880 agaggaaact gatgaagagg aggaggacaa ggaaaaggac gaggaggaag agggcatggg 5940 agagtccgag gttgaggact tactggagaa caactggaac attctacagt tcttgcccca 6000 ggcagcctct tgccagagct acttcctcat gattgtttca gcatacatcg tagctgtgta 6060 ccaaagcatg aaggaggagt tgagacacag tgccccgggc agtacccctg tgaagaggaa 6120 gggggccagc cagttctccc aggagtctga aggggcaact ggatctcttc ctggaatgat 6180 cactttctct caagattatg tggcaaatga gctcactcag agcttcttca ccattactca 6240 gaaaattcag aagaaagtca caggttctcg gaacaccact gagccctcag agatgttccc 6300 cgtcctccct ggttcacact tgctgctcaa taatcctgct ctggagttca tcaaatatgt 6360 gtgcaaggta ctatctcagg atacaaacat cacaaatcag gtgaataagc tgaacagaga 6420 ccttcttcgc ctggtagacg ttggtgaatt ctctgaggag gcccagttca gagacccctg 6480 ccactcctac gtgctccctg aggtaatctg ccacagctgt aatttctgcc gagacctgga 6540 cctgtgcaaa gattcctctt tctctcagga tggagccatc ctgcctcagt ggctctgctc 6600 caattgtcaa gccccctatg actcctctgc cattgagtca gccttggtgg aagccctgca 6660 gaggaaactg atggccttca cacttcagga cctggtatgc ctcaagtgcc gtggtatgaa 6720 agagacccat atgcctgtgt actgcagctg cgcaggggac tttactctca ccatccgcac 6780 tgaggtcttc atggaacaga ttagaatctt ccagaacatt gccaagtact acagcatgtc 6840 atatctccag gagaccatag aatggctgtt acagacaagc cctgtatcaa actgttagca 6900 agcctaggct aaagacactt tggtatccca cacctactgc ctgctccaaa aggcagaacc 6960 actgaccacc ttgcttttcc aaactcatga gcacagccca gaaggaacag aagacttctg 7020 ctaacgtcat catgccataa acagacagaa gcagggaatg gctctatccc tagctgcctg 7080 ctaagtaaac acggttttga agcgtctgaa aaaaaaaaa 7119 <210> 58 <211> 2284 <212> PRT <213> Mus musculus <400> 58 Met Val Leu Arg Asn Ser Gly Arg Arg His Pro Glu Pro Gly Ala Asp 1 5 10 15 Gly Glu Gly Ser Arg Asp Asp Gly Pro Ser Ser Ser Val Ser Ala Leu 20 25 30 Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe 35 40 45 Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Arg Thr Gly Trp Leu Ile 50 55 60 Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Val Ser 65 70 75 80 Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val 85 90 95 Ala Leu Pro Tyr Met Pro Tyr Phe Tyr Ile Ala Ala Arg Lys Gly Cys 100 105 110 Asp Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile 115 120 125 Ala Lys Leu Glu Asn Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His 130 135 140 Leu Val Gly Leu Lys Arg Ser Tyr Ile Lys Leu Ser Phe His Thr Val 145 150 155 160 Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys 165 170 175 Asn Arg Glu Gln Asp His Ala Ser Asp Glu Tyr Thr Thr Met Leu Ser 180 185 190 Ser Ile Leu Gln Gly Gly Ser Val Ile Thr Asp Glu Glu Glu Thr Ser 195 200 205 Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr 210 215 220 Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Arg Ile His Val 225 230 235 240 Ala His Trp Tyr Asn Val Arg Phe Arg Gly Asn Ala Phe Pro Val Glu 245 250 255 Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu 260 265 270 Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala 275 280 285 Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly 290 295 300 Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe 305 310 315 320 Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn 325 330 335 Glu Pro Asp Glu Val His Leu Ile Gln Arg Trp Phe Glu His Ile Gln 340 345 350 Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp 355 360 365 Trp Pro Phe Val Glu Ala Arg Ala Ala Ile His Gly Leu Ser Met Tyr 370 375 380 Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro 385 390 395 400 Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr 405 410 415 Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu 420 425 430 Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala 435 440 445 Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val 450 455 460 Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala 465 470 475 480 Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly 485 490 495 Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala 500 505 510 Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr 515 520 525 Asp Asp Gly His Val Leu Asp Ala Glu Thr Tyr Val Gly Gly His Val 530 535 540 Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe 545 550 555 560 Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys 565 570 575 Thr Met Arg His Ala Ile Glu Glu Glu Glu Lys Val Pro Val Glu Gln 580 585 590 Ala Thr Asn Phe Gln Glu Val Cys Glu Gln Ile Lys Thr Lys Leu Thr 595 600 605 Ser Leu Lys Asp Val Pro Asn Arg Ile Glu Cys Pro Leu Ile Tyr His 610 615 620 Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu 625 630 635 640 Gln Pro Ser Ala Ile Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe 645 650 655 Asn Lys Pro Gly Ala Ser Cys Gln Arg Lys Met Ala Trp Gln Trp Arg 660 665 670 Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His 675 680 685 Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala 690 695 700 Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys 705 710 715 720 Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Val 725 730 735 Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser 740 745 750 Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe 755 760 765 Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu 770 775 780 Val Gly Asp Ala Ser Glu Val Lys Arg Cys Lys Asn Met Glu Ile Leu 785 790 795 800 Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr 805 810 815 Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala 820 825 830 Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu 835 840 845 Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile 850 855 860 Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Ile Lys Thr 865 870 875 880 Thr Asn Ala Lys Lys Pro Lys Leu Thr Ile Ser Tyr Pro Gly Ala Met 885 890 895 Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn His Gln Tyr Gln Glu 900 905 910 Leu Thr Glu Pro Ser Ser Leu Thr Tyr Val Thr His Ser Glu Asn Ser 915 920 925 Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala 930 935 940 Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn 945 950 955 960 Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg 965 970 975 Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala 980 985 990 Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys 995 1000 1005 Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met 1010 1015 1020 Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser 1025 1030 1035 1040 Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr 1045 1050 1055 Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala 1060 1065 1070 Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro 1075 1080 1085 Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr 1090 1095 1100 Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln 1105 1110 1115 1120 Asp Phe Asp Ile Arg Thr Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg 1125 1130 1135 Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln 1140 1145 1150 Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His 1155 1160 1165 Lys Lys Leu Leu Glu Lys Asn Asp Ile Tyr Lys Gln Lys Lys Ile Ser 1170 1175 1180 Glu Leu Phe Val Leu Glu Gly Lys Arg Gln Ile Val Met Ala Gln Ala 1185 1190 1195 1200 Ser Glu Asn Ser Leu Ser Leu Cys Thr Pro Asp Met Glu Asp Ile Gly 1205 1210 1215 Leu Thr Lys Pro His His Ser Thr Val Pro Val Ala Thr Lys Arg Lys 1220 1225 1230 Arg Val Trp Glu Thr Gln Lys Glu Ser Gln Asp Ile Ala Leu Thr Val 1235 1240 1245 Pro Trp Gln Glu Val Leu Gly Gln Pro Pro Ser Leu Gly Thr Thr Gln 1250 1255 1260 Glu Glu Trp Leu Val Trp Leu Gln Phe His Lys Lys Lys Trp Gln Leu 1265 1270 1275 1280 Gln Ala Gln Gln Arg Leu Ala Leu Arg Lys Lys Gln Arg Leu Glu Ser 1285 1290 1295 Ala Glu Asp Met Pro Arg Leu Gly Pro Ile Arg Glu Glu Pro Ser Thr 1300 1305 1310 Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Met Asp Leu 1315 1320 1325 Pro Trp Gln Ile Ile Gln Ile Ser Glu Thr Arg Gln Ala Gly Leu Phe 1330 1335 1340 Arg Leu Trp Ala Ile Ile Gly Asn Asp Leu His Cys Ile Lys Leu Ser 1345 1350 1355 1360 Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu Asp 1365 1370 1375 Gly Pro Ala Tyr Arg Lys Val Asn Arg Gly Leu Phe Leu Arg Ser Asn 1380 1385 1390 Ile Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln 1395 1400 1405 Glu His Ile Asn Glu Ile Asn Thr Glu Leu Ser Val Pro Asp Ile Glu 1410 1415 1420 Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val Gln 1425 1430 1435 1440 Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Thr Arg His Leu Ser 1445 1450 1455 Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser 1460 1465 1470 Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr 1475 1480 1485 Leu Tyr His His Thr Gln Gly His Lys Ala Leu Phe Gly Val Phe Ile 1490 1495 1500 Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser 1505 1510 1515 1520 Asn Gln Met Pro Gly Leu Ser Ala Leu Tyr Ser Ser Glu His Ser Leu 1525 1530 1535 Leu Leu Asp Lys Val Asp Pro Lys Leu Leu Pro Pro Pro Lys His Thr 1540 1545 1550 Phe Glu Val Arg Ala Glu Thr Asn Leu Glu Thr Ile Cys Arg Ala Ile 1555 1560 1565 Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu 1570 1575 1580 Ile Ala Val Gln Ser Ser Trp Glu Leu Cys Arg Leu Thr Ser Glu Ile 1585 1590 1595 1600 Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Arg Val Ala Asp Lys 1605 1610 1615 Ile Ser Tyr Ala Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met 1620 1625 1630 Ile Arg His Tyr Leu Asn Leu Asp Leu Cys Leu Ser Gln Ala Phe Glu 1635 1640 1645 Met Ser Arg Tyr Phe His Ile Pro Val Gly Asn Leu Pro Glu Asp Ile 1650 1655 1660 Ser Ile Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln His His 1665 1670 1675 1680 Asn His Leu Leu Trp Leu Ser Pro Thr Ser Arg Pro Asp Leu Gly Gly 1685 1690 1695 Lys Glu Ala Asp Asp Asn Arg Leu Val Met Glu Phe Asp Asp Arg Ala 1700 1705 1710 Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu 1715 1720 1725 Leu Asp Ile Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His 1730 1735 1740 Val Asn Asp Met Glu Gly Ala Gly Ser Met Gly Ile Ser Phe Asp Val 1745 1750 1755 1760 Ile Gln Gln Ala Ser Leu Glu Asp Met Val Thr Gly Asn Gln Ala Ala 1765 1770 1775 Ser Ala Leu Ala Asn Tyr Asp Glu Thr Ala Leu Cys Ser Ser Thr Phe 1780 1785 1790 Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln 1795 1800 1805 Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp 1810 1815 1820 Leu Gln Ser Pro Cys Ser Leu Leu His Asp Pro Ala Leu His Arg Thr 1825 1830 1835 1840 Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe 1845 1850 1855 Lys Arg Leu Gly Ser Ser Val Val Tyr Ala Asn Phe Asn Arg Ile Ile 1860 1865 1870 Leu Cys Thr Lys Lys Arg Arg Ile Glu Asp Ala Leu Ala Tyr Val Glu 1875 1880 1885 Tyr Ile Thr Asn Ser Ile His Ser Lys Glu Ile Phe His Ser Leu Thr 1890 1895 1900 Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser 1905 1910 1915 1920 Asn Tyr Gly Gly Ile Lys Gly Lys Val Pro Ser Ser Ile His Cys Gly 1925 1930 1935 Gln Val Lys Glu Gln Asp Ser Gln Ala Arg Glu Glu Thr Asp Glu Glu 1940 1945 1950 Glu Glu Asp Lys Glu Lys Asp Glu Glu Glu Glu Gly Met Gly Glu Ser 1955 1960 1965 Glu Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln Phe Leu 1970 1975 1980 Pro Gln Ala Ala Ser Cys Gln Ser Tyr Phe Leu Met Ile Val Ser Ala 1985 1990 1995 2000 Tyr Ile Val Ala Val Tyr Gln Ser Met Lys Glu Glu Leu Arg His Ser 2005 2010 2015 Ala Pro Gly Ser Thr Pro Val Lys Arg Lys Gly Ala Ser Gln Phe Ser 2020 2025 2030 Gln Glu Ser Glu Gly Ala Thr Gly Ser Leu Pro Gly Met Ile Thr Phe 2035 2040 2045 Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe Thr Ile 2050 2055 2060 Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Thr Thr Glu 2065 2070 2075 2080 Pro Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu Leu Asn 2085 2090 2095 Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu Ser Gln 2100 2105 2110 Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp Leu Leu 2115 2120 2125 Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe Arg Asp 2130 2135 2140 Pro Cys His Ser Tyr Val Leu Pro Glu Val Ile Cys His Ser Cys Asn 2145 2150 2155 2160 Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser Gln Asp 2165 2170 2175 Gly Ala Ile Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala Pro Tyr 2180 2185 2190 Asp Ser Ser Ala Ile Glu Ser Ala Leu Val Glu Ala Leu Gln Arg Lys 2195 2200 2205 Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys Arg Gly 2210 2215 2220 Met Lys Glu Thr His Met Pro Val Tyr Cys Ser Cys Ala Gly Asp Phe 2225 2230 2235 2240 Thr Leu Thr Ile Arg Thr Glu Val Phe Met Glu Gln Ile Arg Ile Phe 2245 2250 2255 Gln Asn Ile Ala Lys Tyr Tyr Ser Met Ser Tyr Leu Gln Glu Thr Ile 2260 2265 2270 Glu Trp Leu Leu Gln Thr Ser Pro Val Ser Asn Cys 2275 2280 <210> 59 <211> 3325 <212> DNA <213> Rattus norvegicus <400> 59 aggcgatgga tggtaaacgg cggcaagcgc ccagctctgg ggtgccccca aagcgggctt 60 gcaagggcct ctgggatgaa gatgagccgt cacagtttga ggagaacctg gcgctgctgg 120 aggagataga ggccgagaat cggctgcagg aggccgagga ggagctgcag ctgccccctg 180 agggcattgt gggtgggcag ttttccactg cagacattga cccacggtgg ctgcggccca 240 ccccacttgc cctggacccc agcacggagc ccctcatctt ccagcagctg gagattgacc 300 actatgtggg cacatcacct cccctgccag aaggaccccc cgcatctcgt aactcagtgc 360 ccatactgag ggcctttggg gtcaccgatg agggcttctc cgtctgctgc cacatccacg 420 gctttgcccc ctacttctac acccctgcac ctccgggttt tggggctgag cacctgagtg 480 aactacagcg ggagctgaat gcagccatca gccgggacca gcgtggtgga aaggagctct 540 cggggccggc agtgctagct atagagctgt gctcccgtga gagcatgttt gggtaccatg 600 gccacggccc ttctcccttt ctccgcatca ccctggcact accccgcctg atggcgccag 660 cccgccgcct cctggaacag ggtatccgag tgccaggcct gggcaccccg agctttgcac 720 cctatgaagc caatgtggac tttgagatcc ggttcatggt ggatgctgac attgtgggat 780 gcaactggtt ggagctccca gctggaaagt acgttcggag ggcagagaag aaggctacac 840 tgtgtcagct ggaggtggat gtgctgtggt cagacgtgat cagtcaccca ccagaagggc 900 agtggcagcg catcgcaccc ctgcgtgtgc ttagcttcga catcgagtgc gctggccgaa 960 aaggcatctt ccctgagcct gagcgtgacc ccgtgatcca gatctgttct ctggggctgc 1020 gctggggtga gccagagccc ttcttgcgcc tagcactcac gctgcggcct tgcgccccca 1080 tcctgggtgc caaagtacag agctatgaac gggaagaaga cctgctccag gcctgggcca 1140 ctttcatcct cgccatggac cctgacgtga tcaccggcta caacattcag aactttgacc 1200 tcccctacct catctctcgg gcacaaacct taaaggtgga ccgattccct ttcctgggcc 1260 gtgtgactgg tctccgctcc aacatccgtg actcctcctt ccaatcaagg caggtgggcc 1320 ggcgggacag taaggtggtc agcatggtgg gtcgcgttca gatggatatg ctgcaggtgc 1380 tgcttcggga gtacaagctc cgctcctaca cgctcaacgc tgtgagcttc cacttcctgg 1440 gtgagcagaa ggaggacgta cagcacagca tcatcactga cctacagaat gggaatgaac 1500 agacgcgtcg ccgcctggcc gtgtactgcc tgaaggatgc ctttctgcct cttcgcctac 1560 tcgagcgcct tatggtgctg gtgaacaatg tggagatggc gcgtgtcact ggtgtacccc 1620 ttgggtacct gctcagccga ggccagcagg tcaaggtcgt gtctcagctg ctgcgccagg 1680 ccatgcgcga ggggctgctg atgcctgtgg tgaagacgga gggaggtgag gactacacgg 1740 gagccactgt cattgagccc ctcaaagggt actatgatgt ccccattgcc accctggact 1800 tctcctctct gtacccatcc atcatgatgg cccacaatct gtgctacacc acattgctac 1860 ggcctggggc tgcccagaag ttgggcctta aaccagatga gttcatcaag acacccactg 1920 gggatgagtt tgtgaaggca tctgtgcgga agggcctcct gccccaaatc ctggagaatc 1980 tgctgagtgc ccggaagagg gccaaggctg agctggctca ggagacggac cccctgcggc 2040 gacaggtctt ggatggacgg cagctggcac taaaagtgag tcccaactct gtgtatggct 2100 tcactggtgc ccaggtgggc aagctgccgt gtttggagat ctcccagagt gtcactgggt 2160 tcgggcggca gatgattgag aaaaccaagc agctagtgga gaccaagtac actctggaaa 2220 atggctacga tgctaatgcc aaggtggtct acggtgacac tgactctgtg atgtgccgat 2280 ttggtgtctc ctctgtggct gaggcaatgt ctctggggcg ggaggctgca aactgggtat 2340 ccagtcactt cccatcaccc atccggctgg agttcgagaa ggtttacttt ccctacctgc 2400 tcatcagcaa gaagcgctat gccggcctac tcttctcctc ccgctctgat gcccatgaca 2460 gaatggactg caagggcctg gaggctgtgc gtagggacaa ctgtcccctg gtggccaacc 2520 ttgtcacatc ctctctgcgc agaatcctcg tggatcggga ccctgatggt gcagtagccc 2580 atgcaaagga tgtcatctcg gacctgctgt gcaaccgcat agacatctcc caactggtca 2640 tcaccaaaga gttgacccgc gcagcagcag actacgcggg caagcaggct catgtggagc 2700 tggctgagag gatgaggaag cgtgaccccg gcagtgcgcc caacttgggc gaccgagtac 2760 cctacgtgat cattggtgct gccaagggtg tggccgccta catgaagtcg gaggaccccc 2820 tgtttgtgct ggagcacagc ctgcccattg atactcagta ctacctggag cagcagctgg 2880 ccaagccgct attgcgcatc tttgagccca ttctgggtga gggccgcgcg gagtcagtgc 2940 tgctgcgcgg tgaccacaca cgctgcaaaa ccgtgctcac cagcaaggtg ggcggccttc 3000 tggccttcac caagcgccga aactcttgta ttggctgccg ctccgtaatc gaccatcaag 3060 gagccgtgtg taagttctgt cagccacggg agtctgagct ctatcagaag gaggtgtcac 3120 acctgaatgc cctggaggaa cgtttctcgc gcctctggac acagtgccag cgctgccagg 3180 gcagcttgca cgaggatgtc atctgtacca gccgcgactg tcccatcttc tacatgcgca 3240 agaaggtgcg caaggacctg gaggaccagg aacggctgct gcagcgcttt ggacctcctg 3300 gccctgaggc ctggtgacct gacaa 3325 <210> 60 <211> 1103 <212> PRT <213> Rattus norvegicus <400> 60 Met Asp Gly Lys Arg Arg Gln Ala Pro Ser Ser Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Cys Lys Gly Leu Trp Asp Glu Asp Glu Pro Ser Gln Phe Glu 20 25 30 Glu Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln 35 40 45 Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Ile Val Gly Gly 50 55 60 Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Leu Arg Pro Thr Pro 65 70 75 80 Leu Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu 85 90 95 Ile Asp His Tyr Val Gly Thr Ser Pro Pro Leu Pro Glu Gly Pro Pro 100 105 110 Ala Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val Thr Asp 115 120 125 Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe Ala Pro Tyr Phe 130 135 140 Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser Glu Leu 145 150 155 160 Gln Arg Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys 165 170 175 Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser Arg Glu 180 185 190 Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu Arg Ile 195 200 205 Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu Leu Glu 210 215 220 Gln Gly Ile Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr 225 230 235 240 Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala Asp Ile 245 250 255 Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg 260 265 270 Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val Leu Trp 275 280 285 Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala 290 295 300 Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly 305 310 315 320 Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys Ser Leu 325 330 335 Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr 340 345 350 Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu 355 360 365 Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Thr Phe Ile Leu Ala Met 370 375 380 Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro 385 390 395 400 Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Asp Arg Phe Pro Phe 405 410 415 Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe 420 425 430 Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Val Ser Met Val 435 440 445 Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu Tyr Lys 450 455 460 Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu Gly Glu 465 470 475 480 Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln Asn Gly 485 490 495 Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala 500 505 510 Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val Asn Asn 515 520 525 Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu Leu Ser 530 535 540 Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln Ala Met 545 550 555 560 Arg Glu Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly Glu Asp 565 570 575 Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val 580 585 590 Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile Met Met 595 600 605 Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln 610 615 620 Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp 625 630 635 640 Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro Gln Ile Leu 645 650 655 Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln 660 665 670 Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln Leu Ala 675 680 685 Leu Lys Val Ser Pro Asn Ser Val Tyr Gly Phe Thr Gly Ala Gln Val 690 695 700 Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly Phe Gly 705 710 715 720 Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr Lys Tyr Thr 725 730 735 Leu Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly Asp Thr 740 745 750 Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu Ala Met 755 760 765 Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe Pro Ser 770 775 780 Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile 785 790 795 800 Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala 805 810 815 His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg Asp Asn 820 825 830 Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg Ile Leu 835 840 845 Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp Val Ile 850 855 860 Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val Ile Thr 865 870 875 880 Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln Ala His 885 890 895 Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser Ala Pro 900 905 910 Asn Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly 915 920 925 Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu Glu His 930 935 940 Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys 945 950 955 960 Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu 965 970 975 Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val Leu Thr 980 985 990 Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn Ser Cys 995 1000 1005 Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys Lys Phe 1010 1015 1020 Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser His Leu 1025 1030 1035 1040 Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg 1045 1050 1055 Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg Asp Cys 1060 1065 1070 Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu Asp Gln 1075 1080 1085 Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala Trp 1090 1095 1100 <210> 61 <211> 3451 <212> DNA <213> Bos taurus <400> 61 agtcaggggt cacggcggcg tgggctgtgg cgggaaacac tgtttgaagc gggatggatg 60 gtaagcggcg accaggcccg gggcctgggg tgcccccaaa gcgggcccgt gggggcctct 120 gggatgagga tgaggcatac cggccctcgc agttcgagga ggagctggcg ctgatggagg 180 agatggaagc agagcgcagg ctgcaggagc aggaggagga ggagctgcag tcggccctgg 240 aggcggcgga cgggcaattc tccccaacgg ccatagatgc ccgctggctt cggcccgccc 300 cgcccgcctt ggacccccag atggagcctc tcatcttcca gcagttggag atcgaccatt 360 acgtggcccc agcgcggccc ctgcctgggg cgcccccgcc atcccaggac tcagttccca 420 tcctccgcgc cttcggggtc accaacgagg gggtctccgt ctgctgccac atccatggct 480 ttgcacccta cttctacacc ccagcgcccc ctggttttgg acctgagcac ctgagcgagc 540 tgcagcggga gctgagtgca gccatcagcc gggaccagcg cgggggcaag gagctcaccg 600 ggccggccgt gctggcggta gagctgtgct cccgggagag catgttcggg taccatgggc 660 acggcccctc cccgtttctg cgtatcacct tggcactgcc ccgcctcatg gcacctgccc 720 gccgcctcct ggagcagggc atccgcctgg ccggcctcgg cacccccagc tttgcgccct 780 acgaggccaa cgttgacttt gagatccggt tcatggtgga cacggacatc gtgggctgca 840 actggctgga gctcccagcc gggaaataca tcctgaggcc ggaggggaag gccactctgt 900 gtcagctgga ggccgacgtg ctgtggtcag acgtgatcag ccacccgccg gaaggagagt 960 ggcagcgaat cgcccctctg cgcgtgctca gcttcgacat cgagtgcgct ggtcgcaaag 1020 gcatcttccc tgagcccgag cgggaccccg tgatccagat ctgctcactg ggcctgcgct 1080 ggggcgagcc ggagcccttc ctgcgcctgg cgctcaccct gcggccctgc gcccccatcc 1140 tgggcgccaa ggtgcagagc tatgagcggg aggaggacct gctccaggcc tggtcgacct 1200 tcatccgcat catggatccc gatgtgatca ccggctacaa tatccagaac tttgaccttc 1260 cctacctcat ctcccgggcc cagaccctca aggtgccagg cttccccttg ctgggccgtg 1320 tgattggcct ccgctccaac atccgggagt cgtccttcca gtccaggcag actggccggc 1380 gggacagcaa ggtggtcagc atggtgggcc gcgtgcagat ggacatgctg caggtgctgc 1440 tgcgggagta caagctccgg tcctacacgc tcaatgccgt gagcttccac ttcctgggcg 1500 agcagaagga ggacgtgcag cacagcatca tcacagacct gcagaacggt aacgaccaga 1560 cgcgccgccg cctggccgtg tactgcctca aggacgcctt cctacccctg cggctgctgg 1620 agcggctcat ggtgctggtg aacgccatgg agatggcgcg cgtcaccggc gtgcccctcg 1680 gctacctgct cagccgcggc cagcaggtca aggtcgtgtc ccagctgctg cgacaggcca 1740 tgcgccaggg gctgttgatg cccgtggtga agacggaggg tggtgaggac tataccgggg 1800 ccacggtcat cgagccgctg aaagggtact acgacgttcc catcgccacc ttggacttct 1860 cctcgctgta cccgtccatc atgatggccc acaacctgtg ctacaccaca ctcctgcggc 1920 ccggggccgc ccagaaactg ggcctgaccg aggatcagtt catcaagacg cccacggggg 1980 acgagtttgt gaaggcatcg gtgcggaagg ggctgctccc ccagatcctg gaaaacctgc 2040 tcagcgcccg gaagagggcc aaggccgagc tggccaagga gacagacccc ctacggcggc 2100 aagtgttgga cgggcgccag ctggcgctga aagtgagtgc taactctgtg tacggcttca 2160 ctggcgccca ggtgggcagg ctcccgtgcc tggaaatctc acagagtgtc accgggttcg 2220 ggcgccagat gattgagaag acaaagcagc ttgtggagac caagtacacg gtggaaaacg 2280 gctacagcac cagcgccaag gtggtgtatg gtgacacaga ctcggtcatg tgccgctttg 2340 gcgtctcatc cgtggctgag gcgatggctt tgggacggga ggctgcagac tgggtgtccg 2400 gccacttccc ctcgcccatc cggctagagt ttgagaaagt ctacttcccc tacctgctca 2460 tcagcaagaa gcgttacgca ggcctgctct tctcctcccg gccggacgcc cacgaccgca 2520 tggactgcaa gggcctggag gccgtgcgca gggacaactg ccccctggtg gccaacctcg 2580 tcaccgcctc gctgcgccgc ctgctcatcg accgagaccc ctcgggcgcc gtggctcatg 2640 cacaggacgt catctccgat ctgctgtgta atcgcattga catctcgcag ctggtcatta 2700 ccaaggagct gactcgcgct gccgccgatt acgcgggcaa gcaggcccac gtggagctgg 2760 ccgagaggat gaggaagcgg gaccccggga gcgcgcccag cctgggcgac cgcgtcccct 2820 acgtgatcat cagcgctgcc aagggcgtgg ccgcctacat gaagtccgag gaccccctgt 2880 tcgtactgga gcacagcctg cccatcgaca cgcagtacta cctggagcag cagctcgcca 2940 agccgctcct gcgcatcttc gagcccatcc tgggcgaggg ccgtgccgag gctgtgctgc 3000 tgcgcgggga ccacactcgc tgcaagacgg tgctcacggg gaaggtgggc ggcctcctgg 3060 ccttcgccaa acgccggaac tgctgcatcg gctgccgcac tgtcctcagc caccagggag 3120 ccgtgtgcaa gttctgccag ccccgggagt cagagctgta ccagaaggag gtgtcccacc 3180 tgagtgccct ggaggagcga ttctcacgcc tgtggacgca gtgccagcgc tgccagggca 3240 gcctgcacga ggacgtcatc tgcaccagcc gggactgtcc catcttctac atgcgcaaga 3300 aggtgcggaa ggacctggag gaccaggagc ggctgctgcg gcgctttgga ccccccggcc 3360 cagaggcttg gtgacctctg acctcaacga acttcccacc ttgggggcgc gggggggaca 3420 gacggggaat taataaagct caggcctttt g 3451 <210> 62 <211> 1106 <212> PRT <213> Bos taurus <400> 62 Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Arg Gly Gly Leu Trp Asp Glu Asp Glu Ala Tyr Arg Pro Ser 20 25 30 Gln Phe Glu Glu Glu Leu Ala Leu Met Glu Glu Met Glu Ala Glu Arg 35 40 45 Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Ala Leu Glu Ala 50 55 60 Ala Asp Gly Gln Phe Ser Pro Thr Ala Ile Asp Ala Arg Trp Leu Arg 65 70 75 80 Pro Ala Pro Pro Ala Leu Asp Pro Gln Met Glu Pro Leu Ile Phe Gln 85 90 95 Gln Leu Glu Ile Asp His Tyr Val Ala Pro Ala Arg Pro Leu Pro Gly 100 105 110 Ala Pro Pro Pro Ser Gln Asp Ser Val Pro Ile Leu Arg Ala Phe Gly 115 120 125 Val Thr Asn Glu Gly Val Ser Val Cys Cys His Ile His Gly Phe Ala 130 135 140 Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His Leu 145 150 155 160 Ser Glu Leu Gln Arg Glu Leu Ser Ala Ala Ile Ser Arg Asp Gln Arg 165 170 175 Gly Gly Lys Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu Cys 180 185 190 Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe 195 200 205 Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg 210 215 220 Leu Leu Glu Gln Gly Ile Arg Leu Ala Gly Leu Gly Thr Pro Ser Phe 225 230 235 240 Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp 245 250 255 Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr 260 265 270 Ile Leu Arg Pro Glu Gly Lys Ala Thr Leu Cys Gln Leu Glu Ala Asp 275 280 285 Val Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Glu Trp Gln 290 295 300 Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly 305 310 315 320 Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile 325 330 335 Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu 340 345 350 Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln 355 360 365 Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe Ile 370 375 380 Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe 385 390 395 400 Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Pro Gly 405 410 415 Phe Pro Leu Leu Gly Arg Val Ile Gly Leu Arg Ser Asn Ile Arg Glu 420 425 430 Ser Ser Phe Gln Ser Arg Gln Thr Gly Arg Arg Asp Ser Lys Val Val 435 440 445 Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg 450 455 460 Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe 465 470 475 480 Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu 485 490 495 Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu 500 505 510 Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu 515 520 525 Val Asn Ala Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr 530 535 540 Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg 545 550 555 560 Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly 565 570 575 Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr 580 585 590 Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser 595 600 605 Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly 610 615 620 Ala Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Lys Thr Pro 625 630 635 640 Thr Gly Asp Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro 645 650 655 Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu 660 665 670 Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg 675 680 685 Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly 690 695 700 Ala Gln Val Gly Arg Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr 705 710 715 720 Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr 725 730 735 Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val Tyr 740 745 750 Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala 755 760 765 Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly His 770 775 780 Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr 785 790 795 800 Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg 805 810 815 Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg 820 825 830 Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu Arg 835 840 845 Arg Leu Leu Ile Asp Arg Asp Pro Ser Gly Ala Val Ala His Ala Gln 850 855 860 Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu 865 870 875 880 Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys 885 890 895 Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly 900 905 910 Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser Ala 915 920 925 Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val 930 935 940 Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln 945 950 955 960 Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly 965 970 975 Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr 980 985 990 Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg Arg 995 1000 1005 Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala Val 1010 1015 1020 Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val 1025 1030 1035 1040 Ser His Leu Ser Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln 1045 1050 1055 Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser 1060 1065 1070 Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu 1075 1080 1085 Glu Asp Gln Glu Arg Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro Glu 1090 1095 1100 Ala Trp 1105 <210> 63 <211> 3457 <212> DNA <213> Drosophila melanogaster <400> 63 ctctaacgtg cctaccaaca aaagcgcgcc ttattttttg gcatcgctct tgtcttatgg 60 atttgcaagt aacatttcac caaggtaccc agaatggatg gcaagcgcaa gtttaatgga 120 acctccaatg gacatgccaa gaagcccagg aatcctgatg acgatgagga aatgggcttt 180 gaggcggagc tggccgcctt cgagaactcc gaggacatgg accagactct gctaatgggc 240 gatggacccg agaaccaaac gaccagtgag cgttggtccc gtccgccgcc cccagaacta 300 gatccctcca agcacaactt ggagtttcag cagctggacg tggaaaacta tttgggacag 360 ccgttgccgg gaatgccagg tgcccaaata ggacccgtgc cggtggtccg aatgtttggt 420 gtcaccatgg agggtaactc tgtgtgctgc catgtgcatg gtttctgtcc atacttctac 480 atagaggcgc ccagtcaatt cgaggagcac cattgcgaga aactacaaaa agccttggat 540 caaaaggtta ttgccgatat tcgcaacaac aaagataatg tccaggaggc tgtgcttatg 600 gtggaactgg tggagaagct gaacatccat ggatacaatg gagacaagaa gcagaggtac 660 atcaaaatat cggttacgct gcccagattt gtggctgcgg cctcacgtct cctcaaaaag 720 gaagtgatca tgtcggagat tgacttccag gactgtcgcg cctttgagaa taacatagac 780 tttgacattc gcttcatggt ggacactgat gtggtgggtt gcaattggat agagcttccc 840 atgggtcact ggcgaataag gaacagtcac agcaagccgt tgcctgaatc ccgctgccag 900 attgaagtag acgtggcctt cgacagattt atatcccacg agcccgaagg tgaatggtcc 960 aaggtggctc ccttccggat cctctccttt gatattgaat gcgctggtcg caaaggaata 1020 tttccggaag ccaaaataga tccagtcatc cagatagcca atatggtgat aaggcaggga 1080 gaacgagaac ctttcattag gaatgtcttt accctaaatg aatgcgctcc aatcataggc 1140 agccaggtgt tgtgccacga caaggagacc cagatgctgg acaagtggtc tgcctttgtc 1200 cgggaagttg acccggatat tttgaccgga tataatatca acaactttga cttcccctat 1260 ttgcttaacc gagcagctca cttgaaggtc aggaactttg agtatttggg caggattaag 1320 aacattcgtt cggtgatcaa ggaacagatg ttgcagtcga agcagatggg tcgcagggaa 1380 aaccagtacg ttaattttga gggtagagtt cccttcgatc tcctctttgt cctgctgcgc 1440 gactacaaac tacgctcgta cactctcaac gctgtgagct atcactttct gcaggagcaa 1500 aaggaggatg tgcatcatag cattatcaca gatcttcaga atggagacga gcagacacgt 1560 cgccgttcgg ccatgtactg cctaaaggat gcctacttac cgcttagatt gctggagaag 1620 ttaatggcca ttgttaacta catggagatg gccagggtga cgggtgtgcc actggagtcc 1680 ttgctcaccc gcggacaaca gataaaggtt ttaagtcaat tgctgcgcaa ggccaaaacc 1740 aagggattca tcatgccctc gtacacctct cagggatcgg atgaacagta tgaaggagcg 1800 actgtgattg aaccaaaacg tggctactat gcggacccca tctccacgct ggatttcgcc 1860 tctctgtatc caagtataat gatggcgcat aatttgtgct acaccacctt ggttttgggt 1920 ggaactcgtg agaagctgcg gcagcaggag aacctgcagg acgatcaagt ggaacgtacg 1980 cctgcaaaca actactttgt gaagtctgag gtgcgtcgtg gtctgctccc tgagattctg 2040 gaatctcttt tggcggccag aaagcgtgcc aaaaatgacc taaaagtgga aacagatccg 2100 tttaaaagaa aggtcctgga tggcagacag ctggcgctga agatttcggc taattccgtg 2160 tacggattta ctggcgcaca ggttggaaag ttgccatgct tagagatctc gggcagcgtc 2220 accgcctacg gtcgtaccat gatcgagatg acgaaaaacg aagtggaatc ccattacaca 2280 caggccaatg gctacgagaa caatgcagtg gtcatctacg gcgacactga ttctgtgatg 2340 gttaatttcg gagtaaaaac tctggagcgc agcatggagc tgggacgcga ggctgccgaa 2400 ctggtcagtt ccaagttcgt gcatcctatt aaattggaat tcgagaaagt ttactatcct 2460 tacctgctga ttaacaagaa acgctatgcg ggattatact ttacgcgccc agatacctac 2520 gataaaatgg attgcaaggg catagaaacc gtgaggagag ataactctcc gctggtggcc 2580 aacctgatga actcctgcct gcagaaacta ctcatcgaaa gggatcccga tggtgcagtt 2640 gcctatgtga aacaggtgat agccgatctc ctctgcaatc gcatcgacat ctcgcacttg 2700 gtcataacca aggagttggc caaaacggat tacgcagcca aacaggcaca cgttgagctg 2760 gccgccaaga tgaagaaaag agatcccggt acggcgccca aactggggga tcgagttccc 2820 tatgtgatct gtgcggcagc caaaaacaca cccgcttacc agaaggccga ggatccgctg 2880 tatgtgctgg aaaacagcgt gcccatcgat gccacttact acctggaaca gcagctgtct 2940 aagccgctgc taaggatctt tgaacctatt ttgggcgaca atgccgagtc aattttgtta 3000 aaaggagaac acacgcgcac acgaactgtg gtaacatcca aagtgggtgg acttgctgga 3060 tttatgacca agaaaacgtc gtgtttgggc tgcaaatccc tgatgcccaa gggctacgaa 3120 caggcctgtc tgtgtccaca ctgcgagcca cgaatgagtg agctgtatca gaaggaggtg 3180 ggtgcgaaga gggaactgga ggagaccttc tctcgcctgt ggaccgagtg ccagcgatgc 3240 caggaatcct tgcacgagga ggttatctgc tccaacagag attgccccat cttctacatg 3300 cgacagaagg ttcgcatgga tctggacaat caggagaagc gggtgttgcg attcggcctg 3360 gccgagtggt aaccattgca tgagtttact gaattgttta atcctataat ttaataatta 3420 tattactaga agttattaaa aaaaaaaaaa aaaaaaa 3457 <210> 64 <211> 1092 <212> PRT <213> Drosophila melanogaster <400> 64 Met Asp Gly Lys Arg Lys Phe Asn Gly Thr Ser Asn Gly His Ala Lys 1 5 10 15 Lys Pro Arg Asn Pro Asp Asp Asp Glu Glu Met Gly Phe Glu Ala Glu 20 25 30 Leu Ala Ala Phe Glu Asn Ser Glu Asp Met Asp Gln Thr Leu Leu Met 35 40 45 Gly Asp Gly Pro Glu Asn Gln Thr Thr Ser Glu Arg Trp Ser Arg Pro 50 55 60 Pro Pro Pro Glu Leu Asp Pro Ser Lys His Asn Leu Glu Phe Gln Gln 65 70 75 80 Leu Asp Val Glu Asn Tyr Leu Gly Gln Pro Leu Pro Gly Met Pro Gly 85 90 95 Ala Gln Ile Gly Pro Val Pro Val Val Arg Met Phe Gly Val Thr Met 100 105 110 Glu Gly Asn Ser Val Cys Cys His Val His Gly Phe Cys Pro Tyr Phe 115 120 125 Tyr Ile Glu Ala Pro Ser Gln Phe Glu Glu His His Cys Glu Lys Leu 130 135 140 Gln Lys Ala Leu Asp Gln Lys Val Ile Ala Asp Ile Arg Asn Asn Lys 145 150 155 160 Asp Asn Val Gln Glu Ala Val Leu Met Val Glu Leu Val Glu Lys Leu 165 170 175 Asn Ile His Gly Tyr Asn Gly Asp Lys Lys Gln Arg Tyr Ile Lys Ile 180 185 190 Ser Val Thr Leu Pro Arg Phe Val Ala Ala Ala Ser Arg Leu Leu Lys 195 200 205 Lys Glu Val Ile Met Ser Glu Ile Asp Phe Gln Asp Cys Arg Ala Phe 210 215 220 Glu Asn Asn Ile Asp Phe Asp Ile Arg Phe Met Val Asp Thr Asp Val 225 230 235 240 Val Gly Cys Asn Trp Ile Glu Leu Pro Met Gly His Trp Arg Ile Arg 245 250 255 Asn Ser His Ser Lys Pro Leu Pro Glu Ser Arg Cys Gln Ile Glu Val 260 265 270 Asp Val Ala Phe Asp Arg Phe Ile Ser His Glu Pro Glu Gly Glu Trp 275 280 285 Ser Lys Val Ala Pro Phe Arg Ile Leu Ser Phe Asp Ile Glu Cys Ala 290 295 300 Gly Arg Lys Gly Ile Phe Pro Glu Ala Lys Ile Asp Pro Val Ile Gln 305 310 315 320 Ile Ala Asn Met Val Ile Arg Gln Gly Glu Arg Glu Pro Phe Ile Arg 325 330 335 Asn Val Phe Thr Leu Asn Glu Cys Ala Pro Ile Ile Gly Ser Gln Val 340 345 350 Leu Cys His Asp Lys Glu Thr Gln Met Leu Asp Lys Trp Ser Ala Phe 355 360 365 Val Arg Glu Val Asp Pro Asp Ile Leu Thr Gly Tyr Asn Ile Asn Asn 370 375 380 Phe Asp Phe Pro Tyr Leu Leu Asn Arg Ala Ala His Leu Lys Val Arg 385 390 395 400 Asn Phe Glu Tyr Leu Gly Arg Ile Lys Asn Ile Arg Ser Val Ile Lys 405 410 415 Glu Gln Met Leu Gln Ser Lys Gln Met Gly Arg Arg Glu Asn Gln Tyr 420 425 430 Val Asn Phe Glu Gly Arg Val Pro Phe Asp Leu Leu Phe Val Leu Leu 435 440 445 Arg Asp Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Tyr His 450 455 460 Phe Leu Gln Glu Gln Lys Glu Asp Val His His Ser Ile Ile Thr Asp 465 470 475 480 Leu Gln Asn Gly Asp Glu Gln Thr Arg Arg Arg Ser Ala Met Tyr Cys 485 490 495 Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Lys Leu Met Ala 500 505 510 Ile Val Asn Tyr Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Glu 515 520 525 Ser Leu Leu Thr Arg Gly Gln Gln Ile Lys Val Leu Ser Gln Leu Leu 530 535 540 Arg Lys Ala Lys Thr Lys Gly Phe Ile Met Pro Ser Tyr Thr Ser Gln 545 550 555 560 Gly Ser Asp Glu Gln Tyr Glu Gly Ala Thr Val Ile Glu Pro Lys Arg 565 570 575 Gly Tyr Tyr Ala Asp Pro Ile Ser Thr Leu Asp Phe Ala Ser Leu Tyr 580 585 590 Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Val Leu 595 600 605 Gly Gly Thr Arg Glu Lys Leu Arg Gln Gln Glu Asn Leu Gln Asp Asp 610 615 620 Gln Val Glu Arg Thr Pro Ala Asn Asn Tyr Phe Val Lys Ser Glu Val 625 630 635 640 Arg Arg Gly Leu Leu Pro Glu Ile Leu Glu Ser Leu Leu Ala Ala Arg 645 650 655 Lys Arg Ala Lys Asn Asp Leu Lys Val Glu Thr Asp Pro Phe Lys Arg 660 665 670 Lys Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn Ser 675 680 685 Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu 690 695 700 Ile Ser Gly Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Glu Met Thr 705 710 715 720 Lys Asn Glu Val Glu Ser His Tyr Thr Gln Ala Asn Gly Tyr Glu Asn 725 730 735 Asn Ala Val Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Asn Phe 740 745 750 Gly Val Lys Thr Leu Glu Arg Ser Met Glu Leu Gly Arg Glu Ala Ala 755 760 765 Glu Leu Val Ser Ser Lys Phe Val His Pro Ile Lys Leu Glu Phe Glu 770 775 780 Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr Ala Gly 785 790 795 800 Leu Tyr Phe Thr Arg Pro Asp Thr Tyr Asp Lys Met Asp Cys Lys Gly 805 810 815 Ile Glu Thr Val Arg Arg Asp Asn Ser Pro Leu Val Ala Asn Leu Met 820 825 830 Asn Ser Cys Leu Gln Lys Leu Leu Ile Glu Arg Asp Pro Asp Gly Ala 835 840 845 Val Ala Tyr Val Lys Gln Val Ile Ala Asp Leu Leu Cys Asn Arg Ile 850 855 860 Asp Ile Ser His Leu Val Ile Thr Lys Glu Leu Ala Lys Thr Asp Tyr 865 870 875 880 Ala Ala Lys Gln Ala His Val Glu Leu Ala Ala Lys Met Lys Lys Arg 885 890 895 Asp Pro Gly Thr Ala Pro Lys Leu Gly Asp Arg Val Pro Tyr Val Ile 900 905 910 Cys Ala Ala Ala Lys Asn Thr Pro Ala Tyr Gln Lys Ala Glu Asp Pro 915 920 925 Leu Tyr Val Leu Glu Asn Ser Val Pro Ile Asp Ala Thr Tyr Tyr Leu 930 935 940 Glu Gln Gln Leu Ser Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu 945 950 955 960 Gly Asp Asn Ala Glu Ser Ile Leu Leu Lys Gly Glu His Thr Arg Thr 965 970 975 Arg Thr Val Val Thr Ser Lys Val Gly Gly Leu Ala Gly Phe Met Thr 980 985 990 Lys Lys Thr Ser Cys Leu Gly Cys Lys Ser Leu Met Pro Lys Gly Tyr 995 1000 1005 Glu Gln Ala Cys Leu Cys Pro His Cys Glu Pro Arg Met Ser Glu Leu 1010 1015 1020 Tyr Gln Lys Glu Val Gly Ala Lys Arg Glu Leu Glu Glu Thr Phe Ser 1025 1030 1035 1040 Arg Leu Trp Thr Glu Cys Gln Arg Cys Gln Glu Ser Leu His Glu Glu 1045 1050 1055 Val Ile Cys Ser Asn Arg Asp Cys Pro Ile Phe Tyr Met Arg Gln Lys 1060 1065 1070 Val Arg Met Asp Leu Asp Asn Gln Glu Lys Arg Val Leu Arg Phe Gly 1075 1080 1085 Leu Ala Glu Trp 1090 <210> 65 <211> 9064 <212> DNA <213> Drosophila melanogaster <400> 65 ctgcagcttg ggaaaatact tttggacacc ccaaaaaaag ttaagcgcga tattttccca 60 ccgtgaccat gacaaccact gtgcgttcga aaggctctct ctctctctct ctctttcgcg 120 caaatcaaaa acacaaacag gtttatgtgt gcggagagtg tgtgcgacag agagcggcga 180 tatggaactg aaacgactgc aatgttttta tattccggca acgcatttcg cataaattac 240 aaattacaca gcataagtga atgcaagtgc aggggcggca gtcaaatggc cagctgcacc 300 cagaaaaagg gcaataagat tcgggataac aaaacttgat ggcgttcccg attttcccgg 360 acaagggagc gtatatgtat gtacacacaa aaaaaaaact taaccagcct tgcataacga 420 aacacgtgca ataaaaatat gactgattgt caacctctgc tgcaacttaa ttgctgccgc 480 agaggtaaaa ctgaaaaaca taaaaggggg gcgacaagtg cagcaagcga aaaaataaag 540 aactcaaaga gcgcatgcgc gccgctctcc cactctctct ccctctctct ctgtcgctcc 600 actgcgctgg aatcttacaa ctcgtgtagg tgagccggat ttttatgatg atgcgcctgt 660 gtgcgtgact gcatgatgcc attgcagcgg agaactagta gaaaaaagtt cacatttcag 720 cagttggaaa acacatggcc aacaggccaa ctcaagtggc cagcagctgt ccttatattg 780 tcagcaaata ggtcatttaa tgcccattac acgaaaatta tagctaaaat ggtcaagctg 840 tgatgaaata aacataaata ttatatttta tgatttcatc agatttttag catttttttt 900 tttaatttgt gttaggtaga actacaaagc taagaataat tgaggatttc taggtaaaac 960 ttatattctt aaaaccattt aataattttc ttgttttctt ttatttgtag taacatttta 1020 aaattggcgc caaacgtgtt actttacagt gctgtgcaac agccaaatgt cagcattctc 1080 tgcaacgcgt tagcacattt ctgagacgtt tgcagatttt tggcggcaac aagttattta 1140 catttattta ttttatttct gctaaacagc acggaaatgt ccgactccgg caaaggcaaa 1200 gtgctgcaaa atacgggtaa attcgtcagc gagaatcgca cagaaggcgt gagtggtcaa 1260 agttcgtgga tttcacgctg aacaagggat ttttcaatct tatccacagg acgacttctt 1320 caatgaggcg ggctatcgtc aatcccggga gaacgataaa atcgattcga aatatggctt 1380 cgatcgggtt aaggacagcc aggagcggac gggctacctc atcaacatgc attcggtaag 1440 ttaggaagcc cataaaacgt tgaaaatcat atccaataat ggctatgcca attgcagaac 1500 gaagttttgg atgaggacag aagattgatt gctgccttgg acctgttctt catccaaatg 1560 gatggttccc gcttcaaatg cacggtggcc tatcagccat atttactcat ccgaccagag 1620 gataatatgc atctggaagt ggcgcgattt ctgggtcgca agtattccgg ccagatttct 1680 ggactggagc acataaccaa agaagatttg gatctgccca atcatctatc cggtttgcag 1740 cagcagtaca taaaactttc gtttctcaat cagacagcca tgaccaaggt tagaagggaa 1800 ctcatgtccg cggtgaagag aaatcaggag cgacagaaat ccaacacata ctacatgcaa 1860 atgctggcca cctcgctggc ccaatcctcc gcaggttccg aggatgccac attgggtaag 1920 aggcagcagg attacatgga ttgtattgtg gacataaggg agcatgatgt gccttaccac 1980 gtcagagtgt ccatcgattt gcgcatcttt tgtggacagt ggtacaatat caggtgcaga 2040 agtggcgtgg aattgcctac gatcacctgc cgaccggata ttctggacag acccgaaccc 2100 gtggtcctgg cctttgatat agaaaccact aagctgcccc ttaagtttcc cgatgcccag 2160 acggatcagg ttatgatgat ctcgtacatg atcgatggtc agggttatct gataaccaat 2220 cgtgagatta tatcatccaa tgtggacgat tttgagtaca ctcccaagcc ggaattcgag 2280 ggtaacttta tagtattcaa cgaagagaac gagatgcagc tgctccagcg cttcttcgat 2340 cacatcatgg aggtgcgtcc ccacatcatt gttacataca acggcgactt cttcgattgg 2400 cccttcgtgg agacgcgtgc tgcagtgtac gatctggaca tgaagcaaga gattggcttc 2460 tccaagctac gggatggcaa ttatctaagt cgccctgcca tacacatgga ttgcctatgt 2520 tgggtgaaac gagattctta tttacctgtt ggatctcaag gcttaaaggc ggtggccaag 2580 gctaaattac gctatgatcc tgtggaactc gatccggagg atatgtgccg catggccgtg 2640 gaacagcccc aagtgctggc caattactct gtatccgatg cggtggccac atactatctg 2700 tacatgaagt atgtgcatcc atttatcttc gccctaaata cgattattcc catggaaccc 2760 gatgagatcc taagaaaggg ttccggcaca ctctgtgaaa cgttgctgat ggtggaggct 2820 taccatgccc agattgtgta tcccaacaag catcagagtg agctgaataa gctctccaac 2880 gagggacacg tactggattc ggaaacctat gtgggtggtc atgtggaggc tttggaatcg 2940 ggtgttttcc gggcggacat accatgccgt tttcgtctag atcctgctat ggtcaagcaa 3000 ctgcaggagc aggttgatgc agttctgcgc cacgctatcg aagtggagga aggcataccg 3060 ctcgagaagg tcttgaatct ggatgaagtg cggcaggaga ttgtgcaggg gctacagggt 3120 ctgcacgata tacccaatcg cttggagcag ccggtcatct atcacttgga tgtgggtgcc 3180 atgtacccca acattatttt gaccaatcgc ctgcagccct cggcaatggt tagtgactta 3240 gattgtgccg cctgtgactt caacaagcca ggagttcggt gcaaacgttc catggactgg 3300 ttgtggcgcg gcgagatgtt gcccgcctcc aggaacgagt ttcagcgcat tcagcagcag 3360 ctggagaccg agaagtttcc accccttttc cctggcggac cacagcgagc ctttcacgag 3420 ctctccaagg aggatcaggc ggcgtacgag aagaaacgtc tgacggatta ctgccgcaag 3480 gcttacaaga agaccaagct aaccaaattg gaaacgcgca cttcgaccat ctgccagaag 3540 gagaacagct tctatgtgga cacggtgcga gcttttcgcg atcgtcgcta cgagtacaaa 3600 ggactaacca aagtggcaaa agcatcggtg aatgctgcgg tggcttcggg agacgcggca 3660 gagatcaagg cagccaaggg cagggaggtg ctctacgatt ccctgcagtt ggcccacaag 3720 tgcatcctga actccttcta tggctacgtg atgaggagag gagcccgttg gcattccatg 3780 cctatggccg gcattgtgtg cctcacgggc tcgaatatta tcaccaaggc gagggaaatt 3840 atcgagcgag ttggtcgacc actcgaattg gacactgatg gtatatggtg catattgcct 3900 ggctcctttc cgcaggagtt taccattcac acgagtcatg agaagaaaaa gaagattaac 3960 atatcatatc cgaatgcagt gctaaacact atggttaaag atcattttac caacgatcag 4020 taccacgagt tgaggaagga taaggaaaac aatctaccca aatacgatat tcgagatgag 4080 aactctatat tcttcgaggt ggatggaccc taccttgcca tggtgttacc cgctgccaaa 4140 gaggagggca agaagctgaa gaaaagatat gcggtcttta atttcgatgg cacactggct 4200 gaactcaagg gattcgaggt gaagcgacgc ggtgaactgc agctgatcaa aaatttccag 4260 agttccgtct tcgaagcttt cctcgctggt agcacacttg aggaatgcta tgcatctgtg 4320 gccaaggtgg cggattactg gcttgatgta ctctacagca gaggatcaaa tctacccgac 4380 tcggagctat tcgaacttat ttcggagaac aagagcatgt ccaagaagct tgaggagtat 4440 ggcgcccaaa agagtacgtc catctccacg gccaagcgat tggctgagtt cctgggcgag 4500 cagatggtaa aggatgcggg tctggcttgt aagtacatta tttcgaagaa acccgaagga 4560 gcacccgtca ccgagagagc tattcccttg gccattttcc aatccgaacc gagcgtgagg 4620 cgacatcacc tgcgtcgctg gcttaaggac aacaccatgg gcgatgcgga tatacgcgat 4680 gtgctcgatt ggaactacta catagagaga ttgggtggga ccattcagaa gatcataacc 4740 ataccggcgg cactgcaggg actggccaat ccagtgccca gagttcagca tccggattgg 4800 ttgcacaaga aaatgctgga gaagaacgat gtgctcaagc agcgtcgcat caatgagatg 4860 ttcaccagca gacccaaacc gaaacctcta gccacagagg aggacaagct ggccgatatg 4920 gaagatttgg ctggtaaaga tggcggtgag ggtgctgcag gctgtccgat agtcaccaag 4980 agaaagagaa tccagctgga ggagcacgat gaggaggagg cacagccgca ggccaccact 5040 tggcgtcagg ccttgggcgc tccaccgccc atcggtgaaa ccagaaagac catcgttgag 5100 tgggtgagat ttcagaagaa gaaatggaaa tggcagcagg atcagcgcca gcgtaatcgc 5160 caggcgagca agcgaactcg aggcgaggat ccacgctaca ctgggcggtt ccttagacgt 5220 gcacaacgca ccctgttgga ccagccgtgg cagatcgtac agttggtgcc cgtcgacgac 5280 ctgggccact tcactgtgtg ggccttaatc ggcgaagagt tgcacaagat caagttgacg 5340 gtaccgagga ttttctatgt taatcagcga agtgctgctc ctccagagga gggtcaactt 5400 tggcgcaagg tcaatcgagt tctgccacga tccagacctg ttttcaatct ctatcgatat 5460 agtgtgcccg aacagctctt ccgggataac tcgctgggca tgctggcgga tctggcgacg 5520 cccgacattg agggcatata cgagacgcag atgacgttgg aatttcgcgc cctcatggac 5580 atgggctgca tttgcggtgt ccagcgcgag gaggcacgtc gcttggccca attggccacc 5640 aaggatctgg aaacatttag catcgagcag ctggaacagg gccccagact caggtcaaat 5700 atttggctag cgccaacaat cgattgcgca aaatctactt gtatcagcat aacacaccga 5760 cggccaagaa ggagatctgt gtcactgatc ccaatgccta gcaagaaggc atttgttttt 5820 gccttggaca cagtgcgtgc caatcaaatg ccgaacatga ggcaattgta taccgccgag 5880 cgtttggccc tgctcaagaa tctgacggca gaggagcaag ataaaattcc tgtagaggat 5940 tacacatttg aggttctcat tgaggtggat gtcaaacaaa tttaccggca catacagcgg 6000 gcactgacca cctacaaaca ggagcatcag ggaccaccca ccattctgtg ccttcaaacg 6060 gcgctgtcgg cgcgtaaact cagcctggcc atgccgatcc tgctggagtt tccccaggct 6120 cagattcata tctccgatga cgctagtttg ctttctggcc ttgattggca gcgacagggc 6180 tccagggcag tgatacgcca ctttctgaat ctgaacaatg ttcttgattt gatgttggat 6240 cagtgtcgct actttcatgt gcccattggc aatatgccgc cggatactgt gcttttcgga 6300 gcggatcttt tcttcgctcg cttgctgcag cggcataact ttgtgctgtg gtggtcggcg 6360 agtaccagac cagatttggg tggccgggag gcggacgaca gccggctgtt ggcggaattc 6420 gaggagagca ttagtgtggt gcaaaacaag gccggtttct atccggatgt ttgcgtggag 6480 ctggctctgg atagcctggc ggtgagtgcc ctgctccaat cgactaggat tcaggaaatg 6540 gaaggcgcct catctgccat tacgttcgat gtgatgccgc aggtctcgct ggaggagatg 6600 attggcactg ttccggcggc caccttgccg agttatgatg aaacggccct ctgttccgcc 6660 gccttccgcg ttatgcgctc catggtgaat ggttggttgc gagaggtatc catcaatagg 6720 aacatcttct cggacttcca gatcgtgcac ttctatcgat gggtgcgctc cagtaatgca 6780 ctactctatg atcctgcttt gagaagatct ctgaataatc tgatgaggaa gatgttcttg 6840 cgcattatag cagagttcaa gagattgggc gccaccatta tctatgcgga ctttaacagg 6900 attatcctta gttcgggtaa gaaaaccgtt tccgatgccc tgggctatgt ggactacatt 6960 gtgcaaagct tgaggaacaa ggagatgttc cactccatcc aactgagctt cgagcaatgc 7020 tggaacttta tgctctggat ggaccaggca aatttctcgg gaattagggg aaagctacca 7080 aagggaatcg atgagacagt gtcgtcaata gtttccacta ccatgatacg ggattctgaa 7140 cgcaatcaag atgacgacga ggatgaagaa gaggattcgg aaaaccgtga tccagtggag 7200 agcaacgagg ccgagcagga tcaagaggat gagctgtccc tggagctcaa ctggacaatt 7260 ggcgaacatc tgcccgatga aaacgagtgc cgcgaaaagt ttgaatccct gctgaccctc 7320 tttatgcaat ctttggccga aaagaagacc accgagcagg ccatcaagga tatctcgcac 7380 tgcgcgttcg actttatcct gaaactgcac aaaaactacg gcaagggcaa gcccagcccg 7440 ggcctagaac ttatccgcac tctgatcaag gcgttgagtg tggacaaaac gctggcggag 7500 cagatcaacg agttgcgccg aaatatgctg cgtctggtgg ggattggtga gttctcggac 7560 ttggctgagt gggaggatcc ctgcgacagt cacatcatca acgaggtcat ctgcaaagcg 7620 tgtaatcact gcagggacct ggatctctgc aaggacaagc atcgcgccat gaaagatgga 7680 gtgtgagtta cacaaatcag tacacataat ttaccacaaa taattgatta atgttggatt 7740 tttcagaccc gtttggctgt gtgcccagtg ctatgtggcc tatgataacg aggagatcga 7800 aatgagaatg ctggatgcac tgcagcgcaa gatgatgtcc tatgtgctgc aggatttgcg 7860 ctgttcgcgc tgcagcgaga tcaagcgcga gaatctggca gagttctgca cttgcgctgg 7920 caactttgtg cccctcatca gcgggaagga catccagaca ctgctgggca cattcaacaa 7980 ggtggctgcc aaccacaaga tgcagttgct ccagcagact gttcatcagg cgctgaccac 8040 gccacgctag gacctagttt gttgttgttt tctagatcgt agggcttaaa tatattgtat 8100 ttataatgga atttaattcg attttaatga gttttgagtt tatgatgtcg cacaagacga 8160 atgtctgtgt taaggaatgg acgcgcttta taattcaatg agattcacac acttttagtg 8220 gctttcgcat acgaatcgct tgttgttttc ccgattttat tggttttttt tgttgacttg 8280 cccgcggttt ttgggggcgc acaggcgaaa tcagcagctg aacttaaagc aattagacta 8340 actcattcgc gaagagcgat ctctactgtg gggcctgggt gatgggatcg accttaacat 8400 cggggaactg gaattcgggg aacttcagca tgtcggtctt gccatcgctg ccaaactgct 8460 tggccacacg gtccagttcg gtcttcagct cccgctcaat atcgggattg gagtccacca 8520 gcttgccacc gctgcaggtg agcaaaacaa ggattatgtc gaggcacacc aacggatgaa 8580 ggagccagaa cttacgcgct cttctgcttg tactcgcgca ctttgtccag aaacagctgc 8640 tggatgggat cggaggcctt gttcagggca ggggcaacga ttccgaagtt acgacgggcc 8700 tctgtgcgca ggacacgcat gccactcagc agggattgcg acagcatctg gaattgatag 8760 atccatgtta gaatagcaat aaacggcctt cttcatatgt aaccttaaaa aggttatgta 8820 atacaattgt ttgtttcgac gtttcccaat cggttttcaa gccgactttg ctagcaacta 8880 tatcttgtat tcaaattgta ttccctcaat cgatttttat gtattttaaa tcttgttttc 8940 accttatttt cctttgcaaa tgctaacttt cgtgcggaaa agtgacaatt gtcagttcac 9000 aatggcagtt ggtgttagtg atgtgcgcgt gatgggtgta tgcgatacta tcgtatgtaa 9060 gctt 9064 <210> 66 <211> 2220 <212> PRT <213> Drosophila melanogaster <400> 66 Met Ser Asp Ser Gly Lys Gly Lys Val Leu Gln Asn Thr Gly Lys Phe 1 5 10 15 Val Ser Glu Asn Arg Thr Glu Gly Asp Asp Phe Phe Asn Glu Ala Gly 20 25 30 Tyr Arg Gln Ser Arg Glu Asn Asp Lys Ile Asp Ser Lys Tyr Gly Phe 35 40 45 Asp Arg Val Lys Asp Ser Gln Glu Arg Thr Gly Tyr Leu Ile Asn Met 50 55 60 His Ser Asn Glu Val Leu Asp Glu Asp Arg Arg Leu Ile Ala Ala Leu 65 70 75 80 Asp Leu Phe Phe Ile Gln Met Asp Gly Ser Arg Phe Lys Cys Thr Val 85 90 95 Ala Tyr Gln Pro Tyr Leu Leu Ile Arg Pro Glu Asp Asn Met His Leu 100 105 110 Glu Val Ala Arg Phe Leu Gly Arg Lys Tyr Ser Gly Gln Ile Ser Gly 115 120 125 Leu Glu His Ile Thr Lys Glu Asp Leu Asp Leu Pro Asn His Leu Ser 130 135 140 Gly Leu Gln Gln Gln Tyr Ile Lys Leu Ser Phe Leu Asn Gln Thr Ala 145 150 155 160 Met Thr Lys Val Arg Arg Glu Leu Met Ser Ala Val Lys Arg Asn Gln 165 170 175 Glu Arg Gln Lys Ser Asn Thr Tyr Tyr Met Gln Met Leu Ala Thr Ser 180 185 190 Leu Ala Gln Ser Ser Ala Gly Ser Glu Asp Ala Thr Leu Gly Lys Arg 195 200 205 Gln Gln Asp Tyr Met Asp Cys Ile Val Asp Ile Arg Glu His Asp Val 210 215 220 Pro Tyr His Val Arg Val Ser Ile Asp Leu Arg Ile Phe Cys Gly Gln 225 230 235 240 Trp Tyr Asn Ile Arg Cys Arg Ser Gly Val Glu Leu Pro Thr Ile Thr 245 250 255 Cys Arg Pro Asp Ile Leu Asp Arg Pro Glu Pro Val Val Leu Ala Phe 260 265 270 Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala Gln Thr 275 280 285 Asp Gln Val Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly Tyr Leu 290 295 300 Ile Thr Asn Arg Glu Ile Ile Ser Ser Asn Val Asp Asp Phe Glu Tyr 305 310 315 320 Thr Pro Lys Pro Glu Phe Glu Gly Asn Phe Ile Val Phe Asn Glu Glu 325 330 335 Asn Glu Met Gln Leu Leu Gln Arg Phe Phe Asp His Ile Met Glu Val 340 345 350 Arg Pro His Ile Ile Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro 355 360 365 Phe Val Glu Thr Arg Ala Ala Val Tyr Asp Leu Asp Met Lys Gln Glu 370 375 380 Ile Gly Phe Ser Lys Leu Arg Asp Gly Asn Tyr Leu Ser Arg Pro Ala 385 390 395 400 Ile His Met Asp Cys Leu Cys Trp Val Lys Arg Asp Ser Tyr Leu Pro 405 410 415 Val Gly Ser Gln Gly Leu Lys Ala Val Ala Lys Ala Lys Leu Arg Tyr 420 425 430 Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala Val Glu 435 440 445 Gln Pro Gln Val Leu Ala Asn Tyr Ser Val Ser Asp Ala Val Ala Thr 450 455 460 Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala Leu Asn 465 470 475 480 Thr Ile Ile Pro Met Glu Pro Asp Glu Ile Leu Arg Lys Gly Ser Gly 485 490 495 Thr Leu Cys Glu Thr Leu Leu Met Val Glu Ala Tyr His Ala Gln Ile 500 505 510 Val Tyr Pro Asn Lys His Gln Ser Glu Leu Asn Lys Leu Ser Asn Glu 515 520 525 Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val Glu Ala 530 535 540 Leu Glu Ser Gly Val Phe Arg Ala Asp Ile Pro Cys Arg Phe Arg Leu 545 550 555 560 Asp Pro Ala Met Val Lys Gln Leu Gln Glu Gln Val Asp Ala Val Leu 565 570 575 Arg His Ala Ile Glu Val Glu Glu Gly Ile Pro Leu Glu Lys Val Leu 580 585 590 Asn Leu Asp Glu Val Arg Gln Glu Ile Val Gln Gly Leu Gln Gly Leu 595 600 605 His Asp Ile Pro Asn Arg Leu Glu Gln Pro Val Ile Tyr His Leu Asp 610 615 620 Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro 625 630 635 640 Ser Ala Met Val Ser Asp Leu Asp Cys Ala Ala Cys Asp Phe Asn Lys 645 650 655 Pro Gly Val Arg Cys Lys Arg Ser Met Asp Trp Leu Trp Arg Gly Glu 660 665 670 Met Leu Pro Ala Ser Arg Asn Glu Phe Gln Arg Ile Gln Gln Gln Leu 675 680 685 Glu Thr Glu Lys Phe Pro Pro Leu Phe Pro Gly Gly Pro Gln Arg Ala 690 695 700 Phe His Glu Leu Ser Lys Glu Asp Gln Ala Ala Tyr Glu Lys Lys Arg 705 710 715 720 Leu Thr Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Thr Lys Leu Thr Lys 725 730 735 Leu Glu Thr Arg Thr Ser Thr Ile Cys Gln Lys Glu Asn Ser Phe Tyr 740 745 750 Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Gly 755 760 765 Leu Thr Lys Val Ala Lys Ala Ser Val Asn Ala Ala Val Ala Ser Gly 770 775 780 Asp Ala Ala Glu Ile Lys Ala Ala Lys Gly Arg Glu Val Leu Tyr Asp 785 790 795 800 Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr 805 810 815 Val Met Arg Arg Gly Ala Arg Trp His Ser Met Pro Met Ala Gly Ile 820 825 830 Val Cys Leu Thr Gly Ser Asn Ile Ile Thr Lys Ala Arg Glu Ile Ile 835 840 845 Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys 850 855 860 Ile Leu Pro Gly Ser Phe Pro Gln Glu Phe Thr Ile His Thr Ser His 865 870 875 880 Glu Lys Lys Lys Lys Ile Asn Ile Ser Tyr Pro Asn Ala Val Leu Asn 885 890 895 Thr Met Val Lys Asp His Phe Thr Asn Asp Gln Tyr His Glu Leu Arg 900 905 910 Lys Asp Lys Glu Asn Asn Leu Pro Lys Tyr Asp Ile Arg Asp Glu Asn 915 920 925 Ser Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Val Leu Pro 930 935 940 Ala Ala Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe 945 950 955 960 Asn Phe Asp Gly Thr Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg 965 970 975 Arg Gly Glu Leu Gln Leu Ile Lys Asn Phe Gln Ser Ser Val Phe Glu 980 985 990 Ala Phe Leu Ala Gly Ser Thr Leu Glu Glu Cys Tyr Ala Ser Val Ala 995 1000 1005 Lys Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Arg Gly Ser Asn 1010 1015 1020 Leu Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Lys Ser Met 1025 1030 1035 1040 Ser Lys Lys Leu Glu Glu Tyr Gly Ala Gln Lys Ser Thr Ser Ile Ser 1045 1050 1055 Thr Ala Lys Arg Leu Ala Glu Phe Leu Gly Glu Gln Met Val Lys Asp 1060 1065 1070 Ala Gly Leu Ala Cys Lys Tyr Ile Ile Ser Lys Lys Pro Glu Gly Ala 1075 1080 1085 Pro Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ser Glu Pro 1090 1095 1100 Ser Val Arg Arg His His Leu Arg Arg Trp Leu Lys Asp Asn Thr Met 1105 1110 1115 1120 Gly Asp Ala Asp Ile Arg Asp Val Leu Asp Trp Asn Tyr Tyr Ile Glu 1125 1130 1135 Arg Leu Gly Gly Thr Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu 1140 1145 1150 Gln Gly Leu Ala Asn Pro Val Pro Arg Val Gln His Pro Asp Trp Leu 1155 1160 1165 His Lys Lys Met Leu Glu Lys Asn Asp Val Leu Lys Gln Arg Arg Ile 1170 1175 1180 Asn Glu Met Phe Thr Ser Arg Pro Lys Pro Lys Pro Leu Ala Thr Glu 1185 1190 1195 1200 Glu Asp Lys Leu Ala Asp Met Glu Asp Leu Ala Gly Lys Asp Gly Gly 1205 1210 1215 Glu Gly Ala Ala Gly Cys Pro Ile Val Thr Lys Arg Lys Arg Ile Gln 1220 1225 1230 Leu Glu Glu His Asp Glu Glu Glu Ala Gln Pro Gln Ala Thr Thr Trp 1235 1240 1245 Arg Gln Ala Leu Gly Ala Pro Pro Pro Ile Gly Glu Thr Arg Lys Thr 1250 1255 1260 Ile Val Glu Trp Val Arg Phe Gln Lys Lys Lys Trp Lys Trp Gln Gln 1265 1270 1275 1280 Asp Gln Arg Gln Arg Asn Arg Gln Ala Ser Lys Arg Thr Arg Gly Glu 1285 1290 1295 Asp Pro Arg Tyr Thr Gly Arg Phe Leu Arg Arg Ala Gln Arg Thr Leu 1300 1305 1310 Leu Asp Gln Pro Trp Gln Ile Val Gln Leu Val Pro Val Asp Asp Leu 1315 1320 1325 Gly His Phe Thr Val Trp Ala Leu Ile Gly Glu Glu Leu His Lys Ile 1330 1335 1340 Lys Leu Thr Val Pro Arg Ile Phe Tyr Val Asn Gln Arg Ser Ala Ala 1345 1350 1355 1360 Pro Pro Glu Glu Gly Gln Leu Trp Arg Lys Val Asn Arg Val Leu Pro 1365 1370 1375 Arg Ser Arg Pro Val Phe Asn Leu Tyr Arg Tyr Ser Val Pro Glu Gln 1380 1385 1390 Leu Phe Arg Asp Asn Ser Leu Gly Met Leu Ala Asp Leu Ala Thr Pro 1395 1400 1405 Asp Ile Glu Gly Ile Tyr Glu Thr Gln Met Thr Leu Glu Phe Arg Ala 1410 1415 1420 Leu Met Asp Met Gly Cys Ile Cys Gly Val Gln Arg Glu Glu Ala Arg 1425 1430 1435 1440 Arg Leu Ala Gln Leu Ala Thr Lys Asp Leu Glu Thr Phe Ser Ile Glu 1445 1450 1455 Gln Leu Glu Gln Gly Pro Arg Leu Arg Ser Asn Ile Trp Leu Ala Pro 1460 1465 1470 Thr Ile Asp Cys Ala Lys Ser Thr Cys Ile Ser Ile Thr His Arg Arg 1475 1480 1485 Pro Arg Arg Arg Ser Val Ser Leu Ile Pro Met Pro Ser Lys Lys Ala 1490 1495 1500 Phe Val Phe Ala Leu Asp Thr Val Arg Ala Asn Gln Met Pro Asn Met 1505 1510 1515 1520 Arg Gln Leu Tyr Thr Ala Glu Arg Leu Ala Leu Leu Lys Asn Leu Thr 1525 1530 1535 Ala Glu Glu Gln Asp Lys Ile Pro Val Glu Asp Tyr Thr Phe Glu Val 1540 1545 1550 Leu Ile Glu Val Asp Val Lys Gln Ile Tyr Arg His Ile Gln Arg Ala 1555 1560 1565 Leu Thr Thr Tyr Lys Gln Glu His Gln Gly Pro Pro Thr Ile Leu Cys 1570 1575 1580 Leu Gln Thr Ala Leu Ser Ala Arg Lys Leu Ser Leu Ala Met Pro Ile 1585 1590 1595 1600 Leu Leu Glu Phe Pro Gln Ala Gln Ile His Ile Ser Asp Asp Ala Ser 1605 1610 1615 Leu Leu Ser Gly Leu Asp Trp Gln Arg Gln Gly Ser Arg Ala Val Ile 1620 1625 1630 Arg His Phe Leu Asn Leu Asn Asn Val Leu Asp Leu Met Leu Asp Gln 1635 1640 1645 Cys Arg Tyr Phe His Val Pro Ile Gly Asn Met Pro Pro Asp Thr Val 1650 1655 1660 Leu Phe Gly Ala Asp Leu Phe Phe Ala Arg Leu Leu Gln Arg His Asn 1665 1670 1675 1680 Phe Val Leu Trp Trp Ser Ala Ser Thr Arg Pro Asp Leu Gly Gly Arg 1685 1690 1695 Glu Ala Asp Asp Ser Arg Leu Leu Ala Glu Phe Glu Glu Ser Ile Ser 1700 1705 1710 Val Val Gln Asn Lys Ala Gly Phe Tyr Pro Asp Val Cys Val Glu Leu 1715 1720 1725 Ala Leu Asp Ser Leu Ala Val Ser Ala Leu Leu Gln Ser Thr Arg Ile 1730 1735 1740 Gln Glu Met Glu Gly Ala Ser Ser Ala Ile Thr Phe Asp Val Met Pro 1745 1750 1755 1760 Gln Val Ser Leu Glu Glu Met Ile Gly Thr Val Pro Ala Ala Thr Leu 1765 1770 1775 Pro Ser Tyr Asp Glu Thr Ala Leu Cys Ser Ala Ala Phe Arg Val Met 1780 1785 1790 Arg Ser Met Val Asn Gly Trp Leu Arg Glu Val Ser Ile Asn Arg Asn 1795 1800 1805 Ile Phe Ser Asp Phe Gln Ile Val His Phe Tyr Arg Trp Val Arg Ser 1810 1815 1820 Ser Asn Ala Leu Leu Tyr Asp Pro Ala Leu Arg Arg Ser Leu Asn Asn 1825 1830 1835 1840 Leu Met Arg Lys Met Phe Leu Arg Ile Ile Ala Glu Phe Lys Arg Leu 1845 1850 1855 Gly Ala Thr Ile Ile Tyr Ala Asp Phe Asn Arg Ile Ile Leu Ser Ser 1860 1865 1870 Gly Lys Lys Thr Val Ser Asp Ala Leu Gly Tyr Val Asp Tyr Ile Val 1875 1880 1885 Gln Ser Leu Arg Asn Lys Glu Met Phe His Ser Ile Gln Leu Ser Phe 1890 1895 1900 Glu Gln Cys Trp Asn Phe Met Leu Trp Met Asp Gln Ala Asn Phe Ser 1905 1910 1915 1920 Gly Ile Arg Gly Lys Leu Pro Lys Gly Ile Asp Glu Thr Val Ser Ser 1925 1930 1935 Ile Val Ser Thr Thr Met Ile Arg Asp Ser Glu Arg Asn Gln Asp Asp 1940 1945 1950 Asp Glu Asp Glu Glu Glu Asp Ser Glu Asn Arg Asp Pro Val Glu Ser 1955 1960 1965 Asn Glu Ala Glu Gln Asp Gln Glu Asp Glu Leu Ser Leu Glu Leu Asn 1970 1975 1980 Trp Thr Ile Gly Glu His Leu Pro Asp Glu Asn Glu Cys Arg Glu Lys 1985 1990 1995 2000 Phe Glu Ser Leu Leu Thr Leu Phe Met Gln Ser Leu Ala Glu Lys Lys 2005 2010 2015 Thr Thr Glu Gln Ala Ile Lys Asp Ile Ser His Cys Ala Phe Asp Phe 2020 2025 2030 Ile Leu Lys Leu His Lys Asn Tyr Gly Lys Gly Lys Pro Ser Pro Gly 2035 2040 2045 Leu Glu Leu Ile Arg Thr Leu Ile Lys Ala Leu Ser Val Asp Lys Thr 2050 2055 2060 Leu Ala Glu Gln Ile Asn Glu Leu Arg Arg Asn Met Leu Arg Leu Val 2065 2070 2075 2080 Gly Ile Gly Glu Phe Ser Asp Leu Ala Glu Trp Glu Asp Pro Cys Asp 2085 2090 2095 Ser His Ile Ile Asn Glu Val Ile Cys Lys Ala Cys Asn His Cys Arg 2100 2105 2110 Asp Leu Asp Leu Cys Lys Asp Lys His Arg Ala Met Lys Asp Gly Cys 2115 2120 2125 Tyr Val Ala Tyr Asp Asn Glu Glu Ile Glu Met Arg Met Leu Asp Ala 2130 2135 2140 Leu Gln Arg Lys Met Met Ser Tyr Val Leu Gln Asp Leu Arg Cys Ser 2145 2150 2155 2160 Arg Cys Ser Glu Ile Lys Arg Glu Asn Leu Ala Glu Phe Cys Thr Cys 2165 2170 2175 Ala Gly Asn Phe Val Pro Leu Ile Ser Gly Lys Asp Ile Gln Thr Leu 2180 2185 2190 Leu Gly Thr Phe Asn Lys Val Ala Ala Asn His Lys Met Gln Leu Leu 2195 2200 2205 Gln Gln Thr Val His Gln Ala Leu Thr Thr Pro Arg 2210 2215 2220 <210> 67 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 67 gactagtggc tatcttgtgg cgggaa 26 <210> 68 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 68 ggaattcctt gtcccgtgtc aggtca 26 <210> 69 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 69 cagaactttg ccctcccata cctc 24 <210> 70 <211> 3318 <212> DNA <213> Mus musculus <400> 70 atggattgta agcggcgaca aggaccaggc cctggggtgc ccccaaagcg ggctcgaggg 60 cacctctggg atgaggacga gccttcgccg tcgcagtttg aggcgaacct ggcactgctg 120 gaggaaatag aggctgagaa ccggctgcag gaggcagagg aggagctgca gctgccccca 180 gagggcaccg tgggtgggca gttttccact gcagacattg accctcggtg gcggcggccc 240 accctacgtg ccctggaccc cagcacggag cccctcatct tccagcagct ggagattgac 300 cactatgtgg gctcagcacc acccctgcca gaagggcccc tgccatcccg gaactcagtg 360 cccatactga gggcctttgg ggtcaccgat gaaggcttct ccgtctgctg ccacatacag 420 ggctttgccc cctacttcta cacccccgcg cctcctggtt ttggggccga gcacctgagt 480 gagctgcagc aggagctgaa cgcagccatc agccgggacc agcgcggtgg gaaggagctc 540 tcagggccgg cagtgctggc aatagagcta tgctcccgtg agagcatgtt tgggtaccac 600 ggtcatggcc cttctccatt tctccgcatc accctggcac taccccgcct tatggcacca 660 gcccgccgcc ttctggaaca gggtgtccga gtgccaggcc tgggcacccc gagcttcgca 720 ccctacgaag ccaacgtgga ctttgagatc cggttcatgg tggatgctga cattgtggga 780 tgcaactggt tggagctgcc agctggaaag tacgttcgga gggcggagaa gaaggccacc 840 ctgtgtcagc tggaggtgga cgtgctgtgg tcagatgtga tcagtcaccc accggagggg 900 cagtggcagc gcattgcacc cctgcgtgtg cttagcttcg acatcgagtg tgctggccga 960 aaaggcatct tccctgagcc tgagcgtgac cccgtgatcc agatctgttc tctggggctg 1020 cgctgggggg agccggagcc attcttgcgt ctggcactca cgctgcggcc ctgtgccccc 1080 atcctgggtg ccaaagtgca gagctatgag cgggaagaag acctgctcca ggcctgggcc 1140 gacttcatcc ttgccatgga ccctgacgtg atcaccggct acaacattca gaactttgcc 1200 ctcccatacc tcatctctcg ggcacaggcc ctaaaggtgg accgcttccc tttcctgggc 1260 cgcgtgactg gtctccgctc caacatccgt gactcctcct tccaatcaag gcaggtcggc 1320 cggcgggaca gtaaggtgat cagcatggtg ggtcgcgttc agatggatat gctgcaggtg 1380 ctgcttcggg aacacaagct ccgctcctac acgctcaacg ctgtgagttt ccacttcctg 1440 ggcgagcaga aggaggacgt tcagcacagc atcatcaccg acctgcagaa tgggaacgaa 1500 cagacgcgcc gccgcctggc cgtgtactgc ctgaaggacg cctttctgcc actccgacta 1560 ctagagcgcc ttatggtgct ggtgaataat gtggagatgg cgcgtgtcac gggtgtaccc 1620 cttgggtacc tgctcacccg gggccagcag gtcaaggtcg tgtctcagct gctgcgccag 1680 gccatgcgcc aggggctgct gatgcctgtg gtgaagaccg agggcagtga ggactacacg 1740 ggagccacag tcattgagcc cctcaaaggg tactatgacg tccccattgc caccctggac 1800 ttctcctcct tgtacccatc catcatgatg gcccataatc tgtgctacac cacgctgctc 1860 cgacctgggg ctgcccagaa gctgggcctt aaaccagatg agttcatcaa gacacccact 1920 ggggatgagt ttgtgaagtc atctgtacgg aagggcctcc tgccccagat cctggagaat 1980 ctgctgagtg cccgcaagag ggccaaggct gagctggctc aggagacgga ccccctgcgg 2040 cgacaggtct tggacggccg gcaactggca ctaaaagtga gtgccaactc cgtatatggc 2100 ttcactggtg cccaggtggg caagctgcca tgtttggaga tctcccagag tgtcactggg 2160 ttcgggcggc agatgattga gaaaaccaag cagcttgtgg agtccaagta caccgtggaa 2220 aatggctacg atgccaacgc caaggtagtc tacggtgaca cggactctgt gatgtgccgg 2280 tttggcgtct cctctgtggc tgaagcaatg tctctggggc gggaggctgc aaactgggta 2340 tccagtcact tcccatcacc catccggctg gagttcgaga aggtttactt cccatacctg 2400 ctcatcagca agaagcgcta tgctggcctg ctcttctcct cccgctctga tgcccatgac 2460 aaaatggact gcaagggcct ggaggctgtg cgcagggaca actgtcccct ggtggccaac 2520 ctcgttacat cctctctgcg ccggatcctc gtggaccggg accctgatgg ggcagtagcc 2580 catgccaagg acgtcatctc ggacctgctg tgcaaccgca tagacatctc ccagctggtc 2640 atcaccaaag agttgacccg cgcagcagca gactatgctg gcaagcaggc tcacgtggag 2700 ctggctgaga ggatgaggaa gcgcgacccc ggcagtgcgc ccagcctggg tgaccgagtc 2760 ccctatgtga tcattggtgc tgctaagggt gtggccgcct acatgaagtc ggaggacccc 2820 ctgtttgtgc tggagcacag cctgcccatc gacactcagt actacctgga gcagcagctg 2880 gccaagccgc tcttgcgcat ctttgagccc atcctgggtg agggccgtgc agagtctgtg 2940 ctgctgcgcg gtgaccacac acgatgcaag actgtgctca ccagcaaggt gggcggcctc 3000 ttggccttca ccaagcgccg caactgttgc attggctgcc gctccgtaat cgaccatcaa 3060 ggagccgtgt gtaagttctg tcagccacgg gagtcggagc tctatcagaa ggaggtgtca 3120 cacctgaatg ccttggaaga acggttctct cgcctctgga cacagtgtca acgctgccag 3180 ggcagcttgc atgaggacgt catctgtacc agccgtgact gtcccatctt ctacatgcgc 3240 aagaaggtgc gcaaggacct ggaagaccag gaacggctgc tgcagcgctt tggaccgccc 3300 ggccctgagg cctggtga 3318 <210> 71 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 71 tccccgcggc tgcagaggat tttccacag 29 <210> 72 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 ggactagtat ggtatgcaca acagcctc 28 <210> 73 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 73 tccccgcgga gtggttgtgg gagacttac 29 <210> 74 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 ggactagtca gtcccacagt cccaaagt 28 <210> 75 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 ctgagagtga tgaggttc 18 <210> 76 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 76 ctaatcgcca tcttccagca g 21 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 gctcgacgtt gtcactgaag 20 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 ccaacgctat gtcctgatag 20 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 gctcgacgtt gtcactgaag 20 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 ccaacgctat gtcctgatag 20 <210> 81 <211> 5725 <212> DNA <213> Mus musculus <400> 81 agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60 agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120 gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180 acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240 atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300 gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360 ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420 attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480 acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540 gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600 ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660 atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720 tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780 ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840 tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900 tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960 gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020 catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080 taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140 ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200 ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260 gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320 atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380 ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440 ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500 ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560 gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620 cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680 tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740 tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800 atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860 tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920 caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980 tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040 aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100 ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160 caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220 ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280 taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340 cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400 ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460 catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520 atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580 ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640 ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700 tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760 ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820 gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880 ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940 aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000 taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060 agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120 ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180 actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240 tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300 ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360 agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420 ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480 acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540 aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600 ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660 gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720 caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780 tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840 ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900 gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960 ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020 aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080 gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140 gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200 ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260 tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320 cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380 tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440 tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500 ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560 acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620 gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680 aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740 gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800 cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860 gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920 acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980 tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040 cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100 tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160 ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220 tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280 catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340 ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400 tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460 cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520 ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580 gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640 agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700 gaggtacttt gggactgtgg gactg 5725 <210> 82 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 82 ctgagtctag atttcccgcc atggaaatcg 30 <210> 83 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 83 agcaacgagc tcttatgatt ggtttatctg 30 <210> 84 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 84 atttgctgtc gataatatca gatttcttgg 30 <210> 85 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 85 gagtgaggat ttgtacatga tctgaagg 28 <210> 86 <211> 3357 <212> DNA <213> Mus musculus <220> <221> CDS <222> (24)..(3338) <400> 86 ggcgggaaaa gctgtttgag gcg atg gat tgt aag cgg cga caa gga 47 Met Asp Cys Lys Arg Arg Gln Gly 1 5 cca ggc cct ggg gtg ccc cca aag cgg gct cga ggg cac ctc tgg gat 95 Pro Gly Pro Gly Val Pro Pro Lys Arg Ala Arg Gly His Leu Trp Asp 10 15 20 gag gac gag cct tcg ccg tcg cag ttt gag gcg aac ctg gca ctg ctg 143 Glu Asp Glu Pro Ser Pro Ser Gln Phe Glu Ala Asn Leu Ala Leu Leu 25 30 35 40 gag gaa ata gag gct gag aac cgg ctg cag gag gca gag gag gag ctg 191 Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln Glu Ala Glu Glu Glu Leu 45 50 55 cag ctg ccc cca gag ggc acc gtg ggt ggg cag ttt tcc act gca gac 239 Gln Leu Pro Pro Glu Gly Thr Val Gly Gly Gln Phe Ser Thr Ala Asp 60 65 70 att gac cct cgg tgg cgg cgg ccc acc cta cgt gcc ctg gac ccc agc 287 Ile Asp Pro Arg Trp Arg Arg Pro Thr Leu Arg Ala Leu Asp Pro Ser 75 80 85 acg gag ccc ctc atc ttc cag cag ctg gag att gac cac tat gtg ggc 335 Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu Ile Asp His Tyr Val Gly 90 95 100 tca gca cca ccc ctg cca gaa ggg ccc ctg cca tcc cgg aac tca gtg 383 Ser Ala Pro Pro Leu Pro Glu Gly Pro Leu Pro Ser Arg Asn Ser Val 105 110 115 120 ccc ata ctg agg gcc ttt ggg gtc acc gat gaa ggc ttc tcc gtc tgc 431 Pro Ile Leu Arg Ala Phe Gly Val Thr Asp Glu Gly Phe Ser Val Cys 125 130 135 tgc cac ata cag ggc ttt gcc ccc tac ttc tac acc ccc gcg cct cct 479 Cys His Ile Gln Gly Phe Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro 140 145 150 ggt ttt ggg gcc gag cac ctg agt gag ctg cag cag gag ctg aac gca 527 Gly Phe Gly Ala Glu His Leu Ser Glu Leu Gln Gln Glu Leu Asn Ala 155 160 165 gcc atc agc cgg gac cag cgc ggt ggg aag gag ctc tca ggg ccg gca 575 Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys Glu Leu Ser Gly Pro Ala 170 175 180 gtg ctg gca ata gag cta tgc tcc cgt gag agc atg ttt ggg tac cac 623 Val Leu Ala Ile Glu Leu Cys Ser Arg Glu Ser Met Phe Gly Tyr His 185 190 195 200 ggt cat ggc cct tct cca ttt ctc cgc atc acc ctg gca cta ccc cgc 671 Gly His Gly Pro Ser Pro Phe Leu Arg Ile Thr Leu Ala Leu Pro Arg 205 210 215 ctt atg gca cca gcc cgc cgc ctt ctg gaa cag ggt gtc cga gtg cca 719 Leu Met Ala Pro Ala Arg Arg Leu Leu Glu Gln Gly Val Arg Val Pro 220 225 230 ggc ctg ggc acc ccg agc ttc gca ccc tac gaa gcc aac gtg gac ttt 767 Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe 235 240 245 gag atc cgg ttc atg gtg gat gct gac att gtg gga tgc aac tgg ttg 815 Glu Ile Arg Phe Met Val Asp Ala Asp Ile Val Gly Cys Asn Trp Leu 250 255 260 gag ctg cca gct gga aag tac gtt cgg agg gcg gag aag aag gcc acc 863 Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg Ala Glu Lys Lys Ala Thr 265 270 275 280 ctg tgt cag ctg gag gtg gac gtg ctg tgg tca gat gtg atc agt cac 911 Leu Cys Gln Leu Glu Val Asp Val Leu Trp Ser Asp Val Ile Ser His 285 290 295 cca ccg gag ggg cag tgg cag cgc att gca ccc ctg cgt gtg ctt agc 959 Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala Pro Leu Arg Val Leu Ser 300 305 310 ttc gac atc gag tgt gct ggc cga aaa ggc atc ttc cct gag cct gag 1007 Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu 315 320 325 cgt gac ccc gtg atc cag atc tgt tct ctg ggg ctg cgc tgg ggg gag 1055 Arg Asp Pro Val Ile Gln Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu 330 335 340 ccg gag cca ttc ttg cgt ctg gca ctc acg ctg cgg ccc tgt gcc ccc 1103 Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro 345 350 355 360 atc ctg ggt gcc aaa gtg cag agc tat gag cgg gaa gaa gac ctg ctc 1151 Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu Arg Glu Glu Asp Leu Leu 365 370 375 cag gcc tgg gcc gac ttc atc ctt gcc atg gac cct gac gtg atc acc 1199 Gln Ala Trp Ala Asp Phe Ile Leu Ala Met Asp Pro Asp Val Ile Thr 380 385 390 ggc tac aac att cag aac ttt gac ctc cca tac ctc atc tct cgg gca 1247 Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala 395 400 405 cag gcc cta aag gtg gac cgc ttc cct ttc ctg ggc cgc gtg act ggt 1295 Gln Ala Leu Lys Val Asp Arg Phe Pro Phe Leu Gly Arg Val Thr Gly 410 415 420 ctc cgc tcc aac atc cgt gac tcc tcc ttc caa tca agg cag gtc ggc 1343 Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe Gln Ser Arg Gln Val Gly 425 430 435 440 cgg cgg gac agt aag gtg atc agc atg gtg ggt cgc gtt cag atg gat 1391 Arg Arg Asp Ser Lys Val Ile Ser Met Val Gly Arg Val Gln Met Asp 445 450 455 atg ctg cag gtg ctg ctt cgg gaa cac aag ctc cgc tcc tac acg ctc 1439 Met Leu Gln Val Leu Leu Arg Glu His Lys Leu Arg Ser Tyr Thr Leu 460 465 470 aac gct gtg agt ttc cac ttc ctg ggc gag cag aag gag gac gtt cag 1487 Asn Ala Val Ser Phe His Phe Leu Gly Glu Gln Lys Glu Asp Val Gln 475 480 485 cac agc atc atc acc gac ctg cag aat ggg aac gaa cag acg cgc cgc 1535 His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Glu Gln Thr Arg Arg 490 495 500 cgc ctg gcc gtg tac tgc ctg aag gac gcc ttt ctg cca ctc cga cta 1583 Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Phe Leu Pro Leu Arg Leu 505 510 515 520 cta gag cgc ctt atg gtg ctg gtg aat aat gtg gag atg gcg cgt gtc 1631 Leu Glu Arg Leu Met Val Leu Val Asn Asn Val Glu Met Ala Arg Val 525 530 535 acg ggt gta ccc ctt ggg tac ctg ctc acc cgg ggc cag cag gtc aag 1679 Thr Gly Val Pro Leu Gly Tyr Leu Leu Thr Arg Gly Gln Gln Val Lys 540 545 550 gtc gtg tct cag ctg ctg cgc cag gcc atg cgc cag ggg ctg ctg atg 1727 Val Val Ser Gln Leu Leu Arg Gln Ala Met Arg Gln Gly Leu Leu Met 555 560 565 cct gtg gtg aag acc gag ggc agt gag gac tac acg gga gcc aca gtc 1775 Pro Val Val Lys Thr Glu Gly Ser Glu Asp Tyr Thr Gly Ala Thr Val 570 575 580 att gag ccc ctc aaa ggg tac tat gac gtc ccc att gcc acc ctg gac 1823 Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp 585 590 595 600 ttc tcc tcc ttg tac cca tcc atc atg atg gcc cat aat ctg tgc tac 1871 Phe Ser Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr 605 610 615 acc acg ctg ctc cga cct ggg gct gcc cag aag ctg ggc ctt aaa cca 1919 Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln Lys Leu Gly Leu Lys Pro 620 625 630 gat gag ttc atc aag aca ccc act ggg gat gag ttt gtg aag tca tct 1967 Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp Glu Phe Val Lys Ser Ser 635 640 645 gta cgg aag ggc ctc ctg ccc cag atc ctg gag aat ctg ctg agt gcc 2015 Val Arg Lys Gly Leu Leu Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala 650 655 660 cgc aag agg gcc aag gct gag ctg gct cag gag acg gac ccc ctg cgg 2063 Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln Glu Thr Asp Pro Leu Arg 665 670 675 680 cga cag gtc ttg gac ggc cgg caa ctg gca cta aaa gtg agt gcc aac 2111 Arg Gln Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Val Ser Ala Asn 685 690 695 tcc gta tat ggc ttc act ggt gcc cag gtg ggc aag ctg cca tgt ttg 2159 Ser Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu 700 705 710 gag atc tcc cag agt gtc act ggg ttc ggg cgg cag atg att gag aaa 2207 Glu Ile Ser Gln Ser Val Thr Gly Phe Gly Arg Gln Met Ile Glu Lys 715 720 725 acc aag cag ctt gtg gag tcc aag tac acc gtg gaa aat ggc tac gat 2255 Thr Lys Gln Leu Val Glu Ser Lys Tyr Thr Val Glu Asn Gly Tyr Asp 730 735 740 gcc aac gcc aag gta gtc tac ggt gac acg gac tct gtg atg tgc cgg 2303 Ala Asn Ala Lys Val Val Tyr Gly Asp Thr Asp Ser Val Met Cys Arg 745 750 755 760 ttt ggc gtc tcc tct gtg gct gaa gca atg tct ctg ggg cgg gag gct 2351 Phe Gly Val Ser Ser Val Ala Glu Ala Met Ser Leu Gly Arg Glu Ala 765 770 775 gca aac tgg gta tcc agt cac ttc cca tca ccc atc cgg ctg gag ttc 2399 Ala Asn Trp Val Ser Ser His Phe Pro Ser Pro Ile Arg Leu Glu Phe 780 785 790 gag aag gtt tac ttc cca tac ctg ctc atc agc aag aag cgc tat gct 2447 Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala 795 800 805 ggc ctg ctc ttc tcc tcc cgc tct gat gcc cat gac aaa atg gac tgc 2495 Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala His Asp Lys Met Asp Cys 810 815 820 aag ggc ctg gag gct gtg cgc agg gac aac tgt ccc ctg gtg gcc aac 2543 Lys Gly Leu Glu Ala Val Arg Arg Asp Asn Cys Pro Leu Val Ala Asn 825 830 835 840 ctc gtt aca tcc tct ctg cgc cgg atc ctc gtg gac cgg gac cct gat 2591 Leu Val Thr Ser Ser Leu Arg Arg Ile Leu Val Asp Arg Asp Pro Asp 845 850 855 ggg gca gta gcc cat gcc aag gac gtc atc tcg gac ctg ctg tgc aac 2639 Gly Ala Val Ala His Ala Lys Asp Val Ile Ser Asp Leu Leu Cys Asn 860 865 870 cgc ata gac atc tcc cag ctg gtc atc acc aaa gag ttg acc cgc gca 2687 Arg Ile Asp Ile Ser Gln Leu Val Ile Thr Lys Glu Leu Thr Arg Ala 875 880 885 gca gca gac tat gct ggc aag cag gct cac gtg gag ctg gct gag agg 2735 Ala Ala Asp Tyr Ala Gly Lys Gln Ala His Val Glu Leu Ala Glu Arg 890 895 900 atg agg aag cgc gac ccc ggc agt gcg ccc agc ctg ggt gac cga gtc 2783 Met Arg Lys Arg Asp Pro Gly Ser Ala Pro Ser Leu Gly Asp Arg Val 905 910 915 920 ccc tat gtg atc att ggt gct gct aag ggt gtg gcc gcc tac atg aag 2831 Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly Val Ala Ala Tyr Met Lys 925 930 935 tcg gag gac ccc ctg ttt gtg ctg gag cac agc ctg ccc atc gac act 2879 Ser Glu Asp Pro Leu Phe Val Leu Glu His Ser Leu Pro Ile Asp Thr 940 945 950 cag tac tac ctg gag cag cag ctg gcc aag ccg ctc ttg cgc atc ttt 2927 Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe 955 960 965 gag ccc atc ctg ggt gag ggc cgt gca gag tct gtg ctg ctg cgc ggt 2975 Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu Ser Val Leu Leu Arg Gly 970 975 980 gac cac aca cga tgc aag act gtg ctc acc agc aag gtg ggc ggc ctc 3023 Asp His Thr Arg Cys Lys Thr Val Leu Thr Ser Lys Val Gly Gly Leu 985 990 995 1000 ttg gcc ttc acc aag cgc cgc aac tgt tgc att ggc tgc cgc tcc gta 3071 Leu Ala Phe Thr Lys Arg Arg Asn Cys Cys Ile Gly Cys Arg Ser Val 1005 1010 1015 atc gac cat caa gga gcc gtg tgt aag ttc tgt cag cca cgg gag tcg 3119 Ile Asp His Gln Gly Ala Val Cys Lys Phe Cys Gln Pro Arg Glu Ser 1020 1025 1030 gag ctc tat cag aag gag gtg tca cac ctg aat gcc ttg gaa gaa cgg 3167 Glu Leu Tyr Gln Lys Glu Val Ser His Leu Asn Ala Leu Glu Glu Arg 1035 1040 1045 ttc tct cgc ctc tgg aca cag tgt caa cgc tgc cag ggc agc ttg cat 3215 Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg Cys Gln Gly Ser Leu His 1050 1055 1060 gag gac gtc atc tgt acc agc cgt gac tgt ccc atc ttc tac atg cgc 3263 Glu Asp Val Ile Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg 1065 1070 1075 1080 aag aag gtg cgc aag gac ctg gaa gac cag gaa cgg ctg ctg cag cgc 3311 Lys Lys Val Arg Lys Asp Leu Glu Asp Gln Glu Arg Leu Leu Gln Arg 1085 1090 1095 ttt gga ccg ccc ggc cct gag gcc tgg tg acctgacacg ggacaag 3357 Phe Gly Pro Pro Gly Pro Glu Ala Trp 1100 1105 <210> 87 <211> 1105 <212> PRT <213> Mus musculus <400> 87 Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln 20 25 30 Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg 35 40 45 Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val 50 55 60 Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro 65 70 75 80 Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln 85 90 95 Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly 100 105 110 Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val 115 120 125 Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro 130 135 140 Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser 145 150 155 160 Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly 165 170 175 Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser 180 185 190 Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu 195 200 205 Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu 210 215 220 Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala 225 230 235 240 Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala 245 250 255 Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val 260 265 270 Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val 275 280 285 Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg 290 295 300 Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg 305 310 315 320 Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys 325 330 335 Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala 340 345 350 Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser 355 360 365 Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu 370 375 380 Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp 385 390 395 400 Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe 405 410 415 Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser 420 425 430 Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser 435 440 445 Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu 450 455 460 His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu 465 470 475 480 Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln 485 490 495 Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys 500 505 510 Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val 515 520 525 Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu 530 535 540 Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln 545 550 555 560 Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser 565 570 575 Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr 580 585 590 Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile 595 600 605 Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala 610 615 620 Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr 625 630 635 640 Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln 645 650 655 Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu 660 665 670 Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln 675 680 685 Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala 690 695 700 Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly 705 710 715 720 Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys 725 730 735 Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly 740 745 750 Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu 755 760 765 Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe 770 775 780 Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu 785 790 795 800 Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser 805 810 815 Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg 820 825 830 Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg 835 840 845 Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp 850 855 860 Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val 865 870 875 880 Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln 885 890 895 Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser 900 905 910 Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala 915 920 925 Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu 930 935 940 Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu 945 950 955 960 Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg 965 970 975 Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val 980 985 990 Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn 995 1000 1005 Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys 1010 1015 1020 Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser 1025 1030 1035 1040 His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys 1045 1050 1055 Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg 1060 1065 1070 Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu 1075 1080 1085 Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala 1090 1095 1100 Trp 110 <210> 88 <211> 3318 <212> DNA <213> Mus musculus <220> <221> CDS <222> (1)..(3315) <400> 88 atg gat tgt aag cgg cga caa gga cca ggc cct ggg gtg ccc cca aag 48 Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 cgg gct cga ggg cac ctc tgg gat gag gac gag cct tcg ccg tcg cag 96 Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln 20 25 30 ttt gag gcg aac ctg gca ctg ctg gag gaa ata gag gct gag aac cgg 144 Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg 35 40 45 ctg cag gag gca gag gag gag ctg cag ctg ccc cca gag ggc acc gtg 192 Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val 50 55 60 ggt ggg cag ttt tcc act gca gac att gac cct cgg tgg cgg cgg ccc 240 Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro 65 70 75 80 acc cta cgt gcc ctg gac ccc agc acg gag ccc ctc atc ttc cag cag 288 Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln 85 90 95 ctg gag att gac cac tat gtg ggc tca gca cca ccc ctg cca gaa ggg 336 Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly 100 105 110 ccc ctg cca tcc cgg aac tca gtg ccc ata ctg agg gcc ttt ggg gtc 384 Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val 115 120 125 acc gat gaa ggc ttc tcc gtc tgc tgc cac ata cag ggc ttt gcc ccc 432 Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro 130 135 140 tac ttc tac acc ccc gcg cct cct ggt ttt ggg gcc gag cac ctg agt 480 Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser 145 150 155 160 gag ctg cag cag gag ctg aac gca gcc atc agc cgg gac cag cgc ggt 528 Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly 165 170 175 ggg aag gag ctc tca ggg ccg gca gtg ctg gca ata gag cta tgc tcc 576 Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser 180 185 190 cgt gag agc atg ttt ggg tac cac ggt cat ggc cct tct cca ttt ctc 624 Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu 195 200 205 cgc atc acc ctg gca cta ccc cgc ctt atg gca cca gcc cgc cgc ctt 672 Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu 210 215 220 ctg gaa cag ggt gtc cga gtg cca ggc ctg ggc acc ccg agc ttc gca 720 Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala 225 230 235 240 ccc tac gaa gcc aac gtg gac ttt gag atc cgg ttc atg gtg gat gct 768 Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala 245 250 255 gac att gtg gga tgc aac tgg ttg gag ctg cca gct gga aag tac gtt 816 Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val 260 265 270 cgg agg gcg gag aag aag gcc acc ctg tgt cag ctg gag gtg gac gtg 864 Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val 275 280 285 ctg tgg tca gat gtg atc agt cac cca ccg gag ggg cag tgg cag cgc 912 Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg 290 295 300 att gca ccc ctg cgt gtg ctt agc ttc gac atc gag tgt gct ggc cga 960 Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg 305 310 315 320 aaa ggc atc ttc cct gag cct gag cgt gac ccc gtg atc cag atc tgt 1008 Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys 325 330 335 tct ctg ggg ctg cgc tgg ggg gag ccg gag cca ttc ttg cgt ctg gca 1056 Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala 340 345 350 ctc acg ctg cgg ccc tgt gcc ccc atc ctg ggt gcc aaa gtg cag agc 1104 Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser 355 360 365 tat gag cgg gaa gaa gac ctg ctc cag gcc tgg gcc gac ttc atc ctt 1152 Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu 370 375 380 gcc atg gac cct gac gtg atc acc ggc tac aac att cag aac ttt gcc 1200 Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala 385 390 395 400 ctc cca tac ctc atc tct cgg gca cag gcc cta aag gtg gac cgc ttc 1248 Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe 405 410 415 cct ttc ctg ggc cgc gtg act ggt ctc cgc tcc aac atc cgt gac tcc 1296 Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser 420 425 430 tcc ttc caa tca agg cag gtc ggc cgg cgg gac agt aag gtg atc agc 1344 Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser 435 440 445 atg gtg ggt cgc gtt cag atg gat atg ctg cag gtg ctg ctt cgg gaa 1392 Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu 450 455 460 cac aag ctc cgc tcc tac acg ctc aac gct gtg agt ttc cac ttc ctg 1440 His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu 465 470 475 480 ggc gag cag aag gag gac gtt cag cac agc atc atc acc gac ctg cag 1488 Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln 485 490 495 aat ggg aac gaa cag acg cgc cgc cgc ctg gcc gtg tac tgc ctg aag 1536 Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys 500 505 510 gac gcc ttt ctg cca ctc cga cta cta gag cgc ctt atg gtg ctg gtg 1584 Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val 515 520 525 aat aat gtg gag atg gcg cgt gtc acg ggt gta ccc ctt ggg tac ctg 1632 Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu 530 535 540 ctc acc cgg ggc cag cag gtc aag gtc gtg tct cag ctg ctg cgc cag 1680 Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln 545 550 555 560 gcc atg cgc cag ggg ctg ctg atg cct gtg gtg aag acc gag ggc agt 1728 Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser 565 570 575 gag gac tac acg gga gcc aca gtc att gag ccc ctc aaa ggg tac tat 1776 Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr 580 585 590 gac gtc ccc att gcc acc ctg gac ttc tcc tcc ttg tac cca tcc atc 1824 Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile 595 600 605 atg atg gcc cat aat ctg tgc tac acc acg ctg ctc cga cct ggg gct 1872 Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala 610 615 620 gcc cag aag ctg ggc ctt aaa cca gat gag ttc atc aag aca ccc act 1920 Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr 625 630 635 640 ggg gat gag ttt gtg aag tca tct gta cgg aag ggc ctc ctg ccc cag 1968 Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln 645 650 655 atc ctg gag aat ctg ctg agt gcc cgc aag agg gcc aag gct gag ctg 2016 Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu 660 665 670 gct cag gag acg gac ccc ctg cgg cga cag gtc ttg gac ggc cgg caa 2064 Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln 675 680 685 ctg gca cta aaa gtg agt gcc aac tcc gta tat ggc ttc act ggt gcc 2112 Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala 690 695 700 cag gtg ggc aag ctg cca tgt ttg gag atc tcc cag agt gtc act ggg 2160 Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly 705 710 715 720 ttc ggg cgg cag atg att gag aaa acc aag cag ctt gtg gag tcc aag 2208 Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys 725 730 735 tac acc gtg gaa aat ggc tac gat gcc aac gcc aag gta gtc tac ggt 2256 Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly 740 745 750 gac acg gac tct gtg atg tgc cgg ttt ggc gtc tcc tct gtg gct gaa 2304 Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu 755 760 765 gca atg tct ctg ggg cgg gag gct gca aac tgg gta tcc agt cac ttc 2352 Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe 770 775 780 cca tca ccc atc cgg ctg gag ttc gag aag gtt tac ttc cca tac ctg 2400 Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu 785 790 795 800 ctc atc agc aag aag cgc tat gct ggc ctg ctc ttc tcc tcc cgc tct 2448 Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser 805 810 815 gat gcc cat gac aaa atg gac tgc aag ggc ctg gag gct gtg cgc agg 2496 Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg 820 825 830 gac aac tgt ccc ctg gtg gcc aac ctc gtt aca tcc tct ctg cgc cgg 2544 Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg 835 840 845 atc ctc gtg gac cgg gac cct gat ggg gca gta gcc cat gcc aag gac 2592 Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp 850 855 860 gtc atc tcg gac ctg ctg tgc aac cgc ata gac atc tcc cag ctg gtc 2640 Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val 865 870 875 880 atc acc aaa gag ttg acc cgc gca gca gca gac tat gct ggc aag cag 2688 Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln 885 890 895 gct cac gtg gag ctg gct gag agg atg agg aag cgc gac ccc ggc agt 2736 Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser 900 905 910 gcg ccc agc ctg ggt gac cga gtc ccc tat gtg atc att ggt gct gct 2784 Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala 915 920 925 aag ggt gtg gcc gcc tac atg aag tcg gag gac ccc ctg ttt gtg ctg 2832 Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu 930 935 940 gag cac agc ctg ccc atc gac act cag tac tac ctg gag cag cag ctg 2880 Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu 945 950 955 960 gcc aag ccg ctc ttg cgc atc ttt gag ccc atc ctg ggt gag ggc cgt 2928 Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg 965 970 975 gca gag tct gtg ctg ctg cgc ggt gac cac aca cga tgc aag act gtg 2976 Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val 980 985 990 ctc acc agc aag gtg ggc ggc ctc ttg gcc ttc acc aag cgc cgc aac 3024 Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn 995 1000 1005 tgt tgc att ggc tgc cgc tcc gta atc gac cat caa gga gcc gtg tgt 3072 Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys 1010 1015 1020 aag ttc tgt cag cca cgg gag tcg gag ctc tat cag aag gag gtg tca 3120 Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser 1025 1030 1035 1040 cac ctg aat gcc ttg gaa gaa cgg ttc tct cgc ctc tgg aca cag tgt 3168 His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys 1045 1050 1055 caa cgc tgc cag ggc agc ttg cat gag gac gtc atc tgt acc agc cgt 3216 Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg 1060 1065 1070 gac tgt ccc atc ttc tac atg cgc aag aag gtg cgc aag gac ctg gaa 3264 Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu 1075 1080 1085 gac cag gaa cgg ctg ctg cag cgc ttt gga ccg ccc ggc cct gag gcc 3312 Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala 1090 1095 1100 tgg tga 3318 Trp 1105 <210> 89 <211> 1105 <212> PRT <213> Mus musculus <400> 89 Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys 1 5 10 15 Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln 20 25 30 Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg 35 40 45 Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val 50 55 60 Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro 65 70 75 80 Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln 85 90 95 Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly 100 105 110 Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val 115 120 125 Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro 130 135 140 Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser 145 150 155 160 Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly 165 170 175 Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser 180 185 190 Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu 195 200 205 Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu 210 215 220 Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala 225 230 235 240 Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala 245 250 255 Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val 260 265 270 Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val 275 280 285 Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg 290 295 300 Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg 305 310 315 320 Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys 325 330 335 Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala 340 345 350 Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser 355 360 365 Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu 370 375 380 Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala 385 390 395 400 Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe 405 410 415 Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser 420 425 430 Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser 435 440 445 Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu 450 455 460 His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu 465 470 475 480 Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln 485 490 495 Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys 500 505 510 Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val 515 520 525 Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu 530 535 540 Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln 545 550 555 560 Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser 565 570 575 Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr 580 585 590 Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile 595 600 605 Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala 610 615 620 Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr 625 630 635 640 Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln 645 650 655 Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu 660 665 670 Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln 675 680 685 Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala 690 695 700 Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly 705 710 715 720 Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys 725 730 735 Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly 740 745 750 Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu 755 760 765 Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe 770 775 780 Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu 785 790 795 800 Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser 805 810 815 Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg 820 825 830 Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg 835 840 845 Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp 850 855 860 Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val 865 870 875 880 Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln 885 890 895 Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser 900 905 910 Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala 915 920 925 Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu 930 935 940 Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu 945 950 955 960 Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg 965 970 975 Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val 980 985 990 Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn 995 1000 1005 Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys 1010 1015 1020 Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser 1025 1030 1035 1040 His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys 1045 1050 1055 Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg 1060 1065 1070 Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu 1075 1080 1085 Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala 1090 1095 1100 Trp 110 <210> 90 <211> 3684 <212> DNA <213> Arabidopsis thaliana <220> <221> CDS <222> (501)..(557) <220> <221> CDS <222> (689)..(817) <220> <221> CDS <222> (1007)..(1114) <220> <221> CDS <222> (1194)..(1319) <220> <221> CDS <222> (1468)..(1575) <220> <221> CDS <222> (1670)..(1786) <220> <221> CDS <222> (1858)..(1941) <220> <221> CDS <222> (2040)..(2108) <220> <221> CDS <222> (2198)..(2269) <220> <221> CDS <222> (2352)..(2444) <220> <221> CDS <222> (2546)..(2671) <220> <221> CDS <222> (2771)..(2872) <220> <221> CDS <222> (2964)..(3032) <220> <221> CDS <222> (3122)..(3181) <400> 90 agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60 actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120 ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180 cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240 gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300 aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360 tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420 gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480 ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533 Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg 1 5 10 aag caa tcc gat tac aat tcg ctg gta cgaactctat tactttatcg 580 Lys Gln Ser Asp Tyr Asn Ser Leu 15 acttgtagtg aaagacaaat gtaatcattc gtggtggtga ctgtttctac ttataagtgt 640 acgggctagg gtttgttatc tgattctgag tttttgcaat tgaagcag gat gag aga 697 Asp Glu Arg 1 ttc gag ata cag aag gag atg tac aga ggt cag caa tac agt cag att 745 Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile 5 10 15 tac ttt gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct 793 Tyr Phe Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala 20 25 30 35 cct act tgg aaa tct cat ttg cct ggt cagtgctttt gtttctctca 840 Pro Thr Trp Lys Ser His Leu Pro 40 tatttagcac aacaacgaag agcagttttt gagaattttc ttgggttaga tataattagg 900 tgaaatcagt gatttttagg gatttttgct atcttatgga ttacagttga gaaagattgc 960 tagtattgtt taaattatag atctgaatgt gaatttcatt tttgca gtg tgt aag 1015 Val Cys Lys 1 gtt ttg gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg 1063 Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu 5 10 15 ttc aaa cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa 1111 Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys 20 25 30 35 gag gttggt ttttattaac ctctactgtt tttttgagct atgtctatgc tgaatcaatc 1170 Glu tgagtatatt taacataatg cag agg tca gtt act ccg ctt gtt aaa 1217 Arg Ser Val Thr Pro Leu Val Lys 1 5 cca cat aac ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag 1265 Pro His Asn Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu 10 15 20 agt ggg aga gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat 1313 Ser Gly Arg Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr 25 30 35 40 gtg aca g gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt 1370 Val Thr tacaatgtgg caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct 1430 ttaagaaaat taacgttgaa gcctcccgtg cattgta ggt gtt gtt gtt gca 1482 Gly Val Val Val Ala 1 5 ctg cat ggg aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta 1530 Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val 10 15 20 cta gaa gct ggt tta cca cct cag att gag cgg cct atc gat cta cgtaa 1580 Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu 25 30 35 gtctagctat gttctcttcc ttttgctaac ctcatggctc aatcatttct ataagcaatc 1640 tctcatgata catccatatt gcatctgca gag gaa gat aaa tat gtc gtg tta 1693 Glu Glu Asp Lys Tyr Val Val Leu 1 5 ttg tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt 1741 Leu Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe 10 15 20 cag ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag gttc 1790 Gln Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu 25 30 35 aaatctctta acttgcaggt tgttcaacat atttctttcc ttaatttata ctttatggtt 1850 tgaacag gaa caa ggc ctt gca gca cag ata gtt cat gta gta att gct 1899 Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile Ala 1 5 10 gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag gtacttata 1950 Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln 15 20 25 acttttgttg ctgatatatt ctcagataca gttccagtaa ttatctgccc cagttatgtc 2010 ttatgatctt tattggttga tctttgtag aac ttg gcc tcg aaa gat caa tcg 2063 Asn Leu Ala Ser Lys Asp Gln Ser 1 5 aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc cag gt 2110 Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser Gln 10 15 20 cagttaactg gatctacgtg tgtgttatcg atatctattg agatgaaagt tcaaactcct 2170 gttttttttt ttgtggattg tttttag ata gct gca gga gtt tca gta gat 2221 Ile Ala Ala Gly Val Ser Val Asp 1 5 atc atg cca ggc acg aat gat cca gct aac ttc gca ttg cct cag cag g 2270 Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro Gln Gln 10 15 20 tctgcaaata cataagaaac attcaaaatc ccgcattttg tatcgataac tctgattcat 2330 aggcccttct cttttgttca g cct ctg aat aga tgt ctt ttc cct 2375 Pro Leu Asn Arg Cys Leu Phe Pro 1 5 gga tct tca cct tat aac acc ttc aga tca tgt aca aat cct cac tca 2423 Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr Asn Pro His Ser 10 15 20 ttt gat gtc gat aat atc agg tatgat tattattaat agttgaatac 2470 Phe Asp Val Asp Asn Ile Arg 25 30 aatctctctg attttacaac gataaaattc ttgggtttat ctgactgaaa acctcatatg 2530 ggggcatttt gcaga ttt ctt gga act tct ggt cag aac atc gat gac 2578 Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp 1 5 10 ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa aga 2626 Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg 15 20 25 acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc 2671 Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu 30 35 40 ggtaagaat tctccttgcc ctgcaagatt acttttttga actaagccca taaaaaaatg 2730 atcctttgag ttctatttgg ttttgattca cttgcgtaca ggt tgt tat cct ttc 2785 Gly Cys Tyr Pro Phe 1 5 acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833 Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe 10 15 20 gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag ggtaaaag 2880 Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys 25 30 caccttacac agagattaga aataacattc tcttttgtca aacatcaggc tttaactttt 2940 cttgggtaaa tatgaatgct gca ggg tca gaa ggg cag ctt gtc cgg 2987 Gly Ser Glu Gly Gln Leu Val Arg 1 5 ttg atc tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg 3032 Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala 10 15 20 gtgagttt aaaatttgag cagaatttga gaccatttac cctcatagat tgcagattct 3090 aaatctcaaa atcaccatgt ctatttcgca g gtg aac cta aga aat 3136 Val Asn Leu Arg Asn 1 5 ctg gaa tgt cac act tta agc ttt agc act cag ata aac caa tca 3181 Leu Glu Cys His Thr Leu Ser Phe Ser Thr Gln Ile Asn Gln Ser 10 15 20 taacattga gttgctactt tggtagatta tttcctgtct tgaagatgta atgttgagct 3240 ttttcagtaa cacactccta tgttctaacc aaatgtttgt taaaaatcct ttttcttgag 3300 tggaacttcc aaatctttgg atatattggt aatgctcatt gttttgtcct aattttctaa 3360 aaatctcgac acgagttctt aggtagtcac ataaaggaca aaaagggccg accagatagt 3420 gtcgtggtcg ttggtcagaa gaacgtgaaa agactgcaaa aataatctta aaaaaagcaa 3480 caagtgcaca gaatctcatg caaatgtctc tctctctctt ctcaacggct atatccatcc 3540 acacttatta cattataaaa ttaattaaat gcaataatgt aacgcattat attctccaac 3600 ggtccatttt cccgcatttc cctaaccttt cctttataac gcaaaacagt ttcatcttct 3660 acacttaaca ctttaatcct ctct 3684 <210> 91 <211> 440 <212> PRT <213> Arabidopsis thaliana <400> 91 Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr 1 5 10 15 Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly 20 25 30 Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr 35 40 45 Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys 50 55 60 Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr 65 70 75 80 Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser 85 90 95 Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His 100 105 110 Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu 115 120 125 Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val 130 135 140 Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp 145 150 155 160 Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu 165 170 175 Glu Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser 180 185 190 Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr 195 200 205 Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val 210 215 220 His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile 225 230 235 240 Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro 245 250 255 Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser 260 265 270 Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro 275 280 285 Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn 290 295 300 Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Asp Val Asp Asn Ile 305 310 315 320 Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr 325 330 335 Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp 340 345 350 Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe 355 360 365 Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe 370 375 380 Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu 385 390 395 400 Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly 405 410 415 Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser 420 425 430 Phe Ser Thr Gln Ile Asn Gln Ser 435 440 <210> 92 <211> 3684 <212> DNA <213> Arabidopsis thaliana <220> <221> CDS <222> (501)..(557) <220> <221> CDS <222> (689)..(817) <220> <221> CDS <222> (1007)..(1114) <220> <221> CDS <222> (1194)..(1319) <220> <221> CDS <222> (1468)..(1575) <220> <221> CDS <222> (1670)..(1786) <220> <221> CDS <222> (1858)..(1941) <220> <221> CDS <222> (2040)..(2108) <220> <221> CDS <222> (2198)..(2269) <220> <221> CDS <222> (2352)..(2444) <220> <221> CDS <222> (2546)..(2671) <220> <221> CDS <222> (2771)..(2872) <220> <221> CDS <222> (2964)..(3032) <220> <221> CDS <222> (3122)..(3181) <400> 92 agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60 actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120 ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180 cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240 gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300 aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360 tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420 gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480 ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533 Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg 1 5 10 aag caa tcc gat tac aat tcg ctg gta cgaactctat tactttatcg 580 Lys Gln Ser Asp Tyr Asn Ser Leu 15 acttgtagtg aaagacaaat gtaatcattc gtggtggtga ctgtttctac ttataagtgt 640 acgggctagg gtttgttatc tgattctgag tttttgcaat tgaagcag gat gag aga 697 Asp Glu Arg 1 ttc gag ata cag aag gag atg tac aga ggt cag caa tac agt cag att 745 Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile 5 10 15 tac ttt gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct 793 Tyr Phe Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala 20 25 30 35 cct act tgg aaa tct cat ttg cct ggt cagtgctttt gtttctctca 840 Pro Thr Trp Lys Ser His Leu Pro 40 tatttagcac aacaacgaag agcagttttt gagaattttc ttgggttaga tataattagg 900 tgaaatcagt gatttttagg gatttttgct atcttatgga ttacagttga gaaagattgc 960 tagtattgtt taaattatag atctgaatgt gaatttcatt tttgca gtg tgt aag 1015 Val Cys Lys 1 gtt ttg gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg 1063 Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu 5 10 15 ttc aaa cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa 1111 Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys 20 25 30 35 gag gttggt ttttattaac ctctactgtt tttttgagct atgtctatgc tgaatcaatc 1170 Glu tgagtatatt taacataatg cag agg tca gtt act ccg ctt gtt aaa 1217 Arg Ser Val Thr Pro Leu Val Lys 1 5 cca cat aac ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag 1265 Pro His Asn Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu 10 15 20 agt ggg aga gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat 1313 Ser Gly Arg Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr 25 30 35 40 gtg aca g gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt 1370 Val Thr tacaatgtgg caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct 1430 ttaagaaaat taacgttgaa gcctcccgtg cattgta ggt gtt gtt gtt gca 1482 Gly Val Val Val Ala 1 5 ctg cat ggg aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta 1530 Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val 10 15 20 cta gaa gct ggt tta cca cct cag att gag cgg cct atc gat cta cgtaa 1580 Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu 25 30 35 gtctagctat gttctcttcc ttttgctaac ctcatggctc aatcatttct ataagcaatc 1640 tctcatgata catccatatt gcatctgca gag gaa gat aaa tat gtc gtg tta 1693 Glu Glu Asp Lys Tyr Val Val Leu 1 5 ttg tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt 1741 Leu Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe 10 15 20 cag ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag gttc 1790 Gln Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu 25 30 35 aaatctctta acttgcaggt tgttcaacat atttctttcc ttaatttata ctttatggtt 1850 tgaacag gaa caa ggc ctt gca gca cag ata gtt cat gta gta att gct 1899 Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile Ala 1 5 10 gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag gtacttata 1950 Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln 15 20 25 acttttgttg ctgatatatt ctcagataca gttccagtaa ttatctgccc cagttatgtc 2010 ttatgatctt tattggttga tctttgtag aac ttg gcc tcg aaa gat caa tcg 2063 Asn Leu Ala Ser Lys Asp Gln Ser 1 5 aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc cag gt 2110 Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser Gln 10 15 20 cagttaactg gatctacgtg tgtgttatcg atatctattg agatgaaagt tcaaactcct 2170 gttttttttt ttgtggattg tttttag ata gct gca gga gtt tca gta gat 2221 Ile Ala Ala Gly Val Ser Val Asp 1 5 atc atg cca ggc acg aat gat cca gct aac ttc gca ttg cct cag cag g 2270 Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro Gln Gln 10 15 20 tctgcaaata cataagaaac attcaaaatc ccgcattttg tatcgataac tctgattcat 2330 aggcccttct cttttgttca g cct ctg aat aga tgt ctt ttc cct 2375 Pro Leu Asn Arg Cys Leu Phe Pro 1 5 gga tct tca cct tat aac acc ttc aga tca tgt aca aat cct cac tca 2423 Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr Asn Pro His Ser 10 15 20 ttt gct gtc gat aat atc agg tatgat tattattaat agttgaatac 2470 Phe Ala Val Asp Asn Ile Arg 25 30 aatctctctg attttacaac gataaaattc ttgggtttat ctgactgaaa acctcatatg 2530 ggggcatttt gcaga ttt ctt gga act tct ggt cag aac atc gat gac 2578 Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp 1 5 10 ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa aga 2626 Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg 15 20 25 acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc 2671 Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu 30 35 40 ggtaagaat tctccttgcc ctgcaagatt acttttttga actaagccca taaaaaaatg 2730 atcctttgag ttctatttgg ttttgattca cttgcgtaca ggt tgt tat cct ttc 2785 Gly Cys Tyr Pro Phe 1 5 acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833 Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe 10 15 20 gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag ggtaaaag 2880 Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys 25 30 caccttacac agagattaga aataacattc tcttttgtca aacatcaggc tttaactttt 2940 cttgggtaaa tatgaatgct gca ggg tca gaa ggg cag ctt gtc cgg 2987 Gly Ser Glu Gly Gln Leu Val Arg 1 5 ttg atc tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg 3032 Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala 10 15 20 gtgagttt aaaatttgag cagaatttga gaccatttac cctcatagat tgcagattct 3090 aaatctcaaa atcaccatgt ctatttcgca g gtg aac cta aga aat 3136 Val Asn Leu Arg Asn 1 5 ctg gaa tgt cac act tta agc ttt agc act cag ata aac caa tca 3181 Leu Glu Cys His Thr Leu Ser Phe Ser Thr Gln Ile Asn Gln Ser 10 15 20 taacattga gttgctactt tggtagatta tttcctgtct tgaagatgta atgttgagct 3240 ttttcagtaa cacactccta tgttctaacc aaatgtttgt taaaaatcct ttttcttgag 3300 tggaacttcc aaatctttgg atatattggt aatgctcatt gttttgtcct aattttctaa 3360 aaatctcgac acgagttctt aggtagtcac ataaaggaca aaaagggccg accagatagt 3420 gtcgtggtcg ttggtcagaa gaacgtgaaa agactgcaaa aataatctta aaaaaagcaa 3480 caagtgcaca gaatctcatg caaatgtctc tctctctctt ctcaacggct atatccatcc 3540 acacttatta cattataaaa ttaattaaat gcaataatgt aacgcattat attctccaac 3600 ggtccatttt cccgcatttc cctaaccttt cctttataac gcaaaacagt ttcatcttct 3660 acacttaaca ctttaatcct ctct 3684 <210> 93 <211> 440 <212> PRT <213> Arabidopsis thaliana <400> 93 Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr 1 5 10 15 Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly 20 25 30 Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr 35 40 45 Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys 50 55 60 Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr 65 70 75 80 Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser 85 90 95 Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His 100 105 110 Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu 115 120 125 Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val 130 135 140 Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp 145 150 155 160 Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu 165 170 175 Glu Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser 180 185 190 Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr 195 200 205 Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val 210 215 220 His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile 225 230 235 240 Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro 245 250 255 Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser 260 265 270 Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro 275 280 285 Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn 290 295 300 Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Ala Val Asp Asn Ile 305 310 315 320 Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr 325 330 335 Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp 340 345 350 Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe 355 360 365 Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe 370 375 380 Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu 385 390 395 400 Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly 405 410 415 Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser 420 425 430 Phe Ser Thr Gln Ile Asn Gln Ser 435 440 <210> 94 <211> 454 <212> DNA <213> Mus musculus <400> 94 ctgcagagga ttttccacag tataattaga gattggatgt ggggaagaat tatgtttttt 60 tttttctttt tggtaatctt atggttgggt atgctttatt ttctaattga tttgaaagag 120 gatatagaaa caaaagacag gagaaaaata atctggcctt ctgatactta tttgaaggct 180 ttctaatttc ccaactctaa ccccaagctc tccgttttac tgtttagtat tctaggctgg 240 cagtttgagt ctgtaccagg caaaaaacgt tccaaatcaa gatagacagg atggagaacc 300 aatcacagag ctggatttcc tttcaaattc taccaatggc tattgtgcag gagactttga 360 actcacaaag aaaggcgggg ccaagactta agcgttaaaa atcaccacca agccagcctc 420 ccagcagcag taaagaggct gttgtgcata ccat 454 <210> 95 <211> 5725 <212> DNA <213> Mus musculus <400> 95 agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60 agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120 gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180 acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240 atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300 gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360 ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420 attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480 acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540 gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600 ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660 atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720 tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780 ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840 tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900 tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960 gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020 catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080 taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140 ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200 ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260 gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320 atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380 ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440 ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500 ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560 gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620 cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680 tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740 tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800 atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860 tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920 caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980 tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040 aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100 ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160 caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220 ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280 taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340 cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400 ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460 catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520 atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580 ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640 ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700 tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760 ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820 gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880 ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940 aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000 taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060 agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120 ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180 actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240 tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300 ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360 agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420 ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480 acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540 aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600 ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660 gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720 caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780 tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840 ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900 gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960 ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020 aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080 gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140 gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200 ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260 tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320 cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380 tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440 tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500 ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560 acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620 gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680 aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740 gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800 cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860 gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920 acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980 tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040 cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100 tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160 ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220 tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280 catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340 ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400 tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460 cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520 ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580 gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640 agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700 gaggtacttt gggactgtgg gactg 5725

Claims

(a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한:

세포의 유전 형질의 전환율을 조절하는 방법
제 1항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
제 2항에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 1항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 1항에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법
제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 10¹이상까지 서로 다름을 특징으로 하는 방법
제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 10²이상까지 서로 다름을 특징으로 하는 방법
제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 10³이상까지 서로 다름을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
제 11항에 있어서, 상기 DNA 중합효소는 프루프리딩(proofreading) 기능을 지님을 특징으로 하는 방법
제 11항에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
제 16항에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
제 18항에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염 기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
제 1항에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩 (leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
제 37항에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
제 1항에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
제 1항에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
제 1항에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법
제 43항에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
(a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및

(b) 수득된 세포를 재생산시키는 단계를 포함한:

조절된 유전 형질을 지닌 세포를 생성하는 방법
제 45항에 있어서, 원하는 형질을 지닌 재생산된 세포를 선별하는 단계를 더욱 포함함을 특징으로 하는 방법
제 45항에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 45항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 45항에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으 로 무-오류임을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 10¹ 이상까지 서로 다름을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 10² 이상까지 서로 다름을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 10³ 이상까지 서로 다름을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
제 56항에 있어서, 상기 DNA 중합효소는 프루프리딩 기능을 지님을 특징으로 하는 방법
제 56항에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
제 61항에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
제 63항에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적 어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10^-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
제 45항에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈 발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
제 82항에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
제 45항에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
제 45항에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
제 45항에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법
제 88항에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
(a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및

(b) 수득된 생물체를 재생산시키는 단계를 포함한:

조절된 유전 형질을 지닌 생물체를 생성하는 방법
제 90항에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 세포
제 91항에 있어서, 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 세포
제 90항에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 생물체
제 93항에 있어서, 상기 생물체는 야생형 생물체와 실질적으로 동일한 생장을 지님을 특징으로 하는 생물체
(a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 유전자를 인코드하는 핵산 분자를 생성하는 단계를 포함한:

조절된 유전 형질을 지닌 유전자를 인코드하는 핵산 분자를 생성하는 방법
제 95항에 따른 방법에 의해 생성된 핵산 분자
(a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 단계를 포함한:

조절된 유전 형질을 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 방법
제 97항에 따른 방법에 의해 생성된 폴리펩타이드
(a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;

(b) 수득된 생물체를 재생산시키는 단계;

(c) 생물체 내의 돌연변이를 확인하는 단계; 및

(d) 확인된 돌연변이를 지닌 대사산물을 생성하는 단계를 포함한:

조절된 유전 형질을 지닌 생물체의 대사산물을 생성하는 방법
제 99항에 따른 방법에 의해 생성된 대사산물
조절된 오류-빈발 빈도를 지닌 DNA 중합효소를 인코드하는 핵산 서열을 포함한, 생물체의 유전 형질을 조절하기 위한 핵산 분자
제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소임을 특징으로 하는 핵산 분자
제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
제 101항에 따른 핵산 분자를 포함한 벡터
제 101항에 따른 핵산 분자를 포함한 세포
제 106항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 세포
제 107항에 있어서, 상기 진핵성 세포는 식물, 동물 및 효모로 구성된 군으로부터 선택됨을 특징으로 하는 세포
제 106항에 있어서, 상기 세포는 그람-양성 박테리아 세포임을 특징으로 하는 세포
제 106항에 있어서, 상기 세포는 유전 형질의 전환율을 조절하기 위해 이용됨을 특징으로 하는 방법
제 101항에 따른 핵산 분자를 포함한 생물체
제 106항에 따른 세포 또는 그의 일부에 의해 생성된 생성물 물질
제 106항에 따른 세포 또는 그의 일부에 포함된 핵산 분자
조절된 유전 형질에 관련된 유전자를 인코드하는 제 113항에 따른 핵산 분자
질병 모델로서 제 106항에 따른 세포를 이용하여 약물의 효과를 시험하는 단계;

대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및

질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
질병 모델로서 제 111항에 따른 생물체를 이용하여 약물의 효과를 시험하는 단계;

대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및

질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
생물체의 유전 형질의 전환율을 조절하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
제 117항에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
제 117항에 있어서, 상기 중합효소 세트는 동일한 종으로부터 유래됨을 특징으로 하는 세트
조절된 유전 형질을 지닌 생물체를 생성하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
제 120항에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
제 121항에 있어서, 상기 중합효소 세트는 동일한 생물체 종으로부터 유래됨을 특징으로 하는 세트
생물체의 유전 형질의 전환율을 조절하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용
조절된 유전 형질을 지닌 생물체를 생성하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용