KR20060002010A - 생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및시스템 - Google Patents
생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및시스템 Download PDFInfo
- Publication number
- KR20060002010A KR20060002010A KR1020057018129A KR20057018129A KR20060002010A KR 20060002010 A KR20060002010 A KR 20060002010A KR 1020057018129 A KR1020057018129 A KR 1020057018129A KR 20057018129 A KR20057018129 A KR 20057018129A KR 20060002010 A KR20060002010 A KR 20060002010A
- Authority
- KR
- South Korea
- Prior art keywords
- frequency
- error
- dna polymerase
- cell
- cells
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한 세포의 유전 형질의 전환율을 조절하기 위한 방법이 제공된다. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및 (b) 수득된 세포를 재생산시키는 단계를 포함한 조절된 유전 형질을 지닌 세포를 생성하기 위한 방법이 제공된다. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및 (b) 수득된 생물체를 재생산시키는 단계를 포함한 조절된 유전 형질을 지닌 생물체를 생성하기 위한 방법이 제공된다.
세포, 유전자 복제, 오류-빈발 빈도, 조절, 유전 형질, 전환율, 생물체
Description
본 발명은 생물체의 유전 형질을 빠르게 변형시키기 위한 방법 및 본 방법에 의해 수득된 생물체 및 생성물에 관한 것이다.
기록된 역사 이래로 인간은 생물체의 유전 형질을 변형시키고자 노력했다. 소위 유전공학의 도래 이전에 이종-교배 등이 원하는 형질을 지닌 생물체를 수득하기 위해 시도되었고 또는 대안으로 돌연변이가 방사선에 의해 무작위로 유발되어 변형된 유전 형질을 지닌 돌연변이화된 생물체가 분리되었다.
최근 진보된 유전공학은 변형된 유전 형질을 지닌 생물체를 수득하는 것을 크게 촉진시킨다. 외생적 유전자가 생물체 내로 도입되는 유전공학이 유전적으로 변형된 생물체의 생성에 널리 이용되었다. 그러나 외생적 유전자가 도입되기만 생물체는 원하는 유전 형질을 항상 수득하는 것은 아니다. 자연 진화 과정과 다른 조작은 기대하지 않은 결과를 야기한다. 따라서 정부 당국은 유전적으로 변형된 생물체(GMOs)로부터 유래된 식품을 통상의 식품보다 더욱 엄격하게 규제한다.
따라서 자연 진화와 순응하여 생물체에 원하는 유전 형질을 부여하는 방법 및 이러한 생물체를 생성하는 방법에 대한 본 분야의 증가된 요구가 있다.
현재 하기의 알려진 돌연변이유발 방법이 있다.
(1) 자연 돌연변이 : 생물체가 일반적 환경 하에서 생장할 때 발행된 돌연변이가 자연 돌연변이로 불린다. 자연 돌연변이에 대한 주요 원인은 DNA 복제 및 내생적 돌연변이원(뉴클레오타이드 아날로그) 내의 오류로 여겨진다 (Maki, "Shizenheni To Shufukukiko [Natural Mutation And Repair Mechanism]", Saibo Kogaku [Cell Engineering], Vol. 13, No.8, pp. 663-672, 1994).
(2) 방사선, 돌연변이원 등으로의 처리 : DNA는 자외선, X-선 등과 같은 방사선으로의 처리 또는 알킬화제 등과 같은 인공 돌연변이원으로의 처리에 의해 손상된다. 이러한 손상은 DNA 복제 과정에서 돌연변이로서 고정된다.
(3) PCR(중합효소 연쇄 반응)의 이용 : PCR시 DNA가 시험관 내에서 증폭되기 때문에 PCR 시스템은 세포내 돌연변이 억제 메카니즘이 부재한다. 따라서 돌연변이는 매우 자주 유도된다. DNA 셔플링(shuffling)(Stemmer, Nature, Vol. 370, pp. 389-391, Aug. 1994)이 PCR과 결합되면 유독한 돌연변이의 축적이 방지될 수 있고 다수의 유익한 돌연변이가 유전자 내에 축적될 수 있다.
(4) 돌연변이 인자 (또는 돌연변이유발 유전자(mutator))의 이용 : 거의 모든 생물체에서 자연 돌연변이의 빈도는 돌연변이 억제 메카니즘에 의해 매우 낮은 비율로 유지된다. 돌연변이 억제 메카니즘은 10 이상의 유전자와 관련된 다수의 단계를 포함한다. 돌연변이는 하나 이상의 유전자가 파괴된 생물체 내에서 높은 빈도로 발생한다. 이들 유전자가 돌연변이유발 유전자로 불린다(Maki 상동 및 Horst et al., Trends in Microbiology, Vol. 7, No. 1, pp. 29-36, Jan. 1999).
돌연변이유발 유전자를 이용한 방법은 불일치(disparity) 방법이다(Furusawa M. and Doi H. J. Theor. Biol. 157, pp. 127-133, 1992; 및 Furusawa M. and Doi H. Genetica 103, pp. 333-347, 1998; 일본 공개공보 8-163986; 일본 공개공보 8-163987; 일본 공개공보 9-23882; WO00/28015). 불일치 방법에서 실질적으로 생성된 생물체(특히 고등생물(즉, 진핵성 생물))가 정상적인 생장 곡선을 나타내는지 여부는 뚜렷하지 않았다. 더욱이 불일치 방법은 자연 진화를 촉진시키는지 증명되지 않았다.
다수의 복제 사이트를 보유한 염색체의 이배체 이상을 지닌 진핵세포 생물과 같은 "고등생물"(즉, 진핵생물)에 대한 불균형 돌연변이 모델의 시뮬레이션에서 치명적 돌연변이가 발생할 가능성이 있다. 불일치 방법이 실제 상황에 적용될 수 있는지 여부는 명백하지 않다.
불균형 돌연변이 모델의 시뮬레이션에서 돌연변이는 예를 들어 낮은 복제 정확성을 지닌 비-인접 체인 내로 무작위로 도입된다. 이러한 돌연변이가 진화에 기여하는지 여부는 명백하지 않다.
도입된 돌연변이유발 유전자를 지닌 E. coli의 돌연변이 균주를 이용하여 시도된 약물 저항성 실험에서 약물-저항성 균주가 수득되었다. 그러나 진화의 속도를 임의로 변화시키거나 제어시킬 수 있는 어떠한 시스템도 제안되지 않았다.
돌연변이가 실질적으로 불균형 방식으로 삽입되는지 여부에 관계없이 진화 속도의 측정을 제공하는 게놈-수준 분석에 의해 측정된 어떠한 실험도 없었다. 시퀀싱 기술 자체가 용이하게 수행될 수 있음을 고려할 때 돌연변이 사이트가 확인되었다고 보고된 어떠한 예도 없다고 할 수 있다.
발명의 개시
상기-기술된 문제점은 생물체의 진화 속도가 시간의 함수가 아니고 생물체의 오류-빈발 빈도를 조절함으로서 조절될 수 있음을 발견하고, 변형된 진화 속도를 지닌 실제 생물체가 자연-진화 생물체와 실질적으로 동일한 속도로 증식함을 증명한 본 발명자에 의해 해결되었다. 본 발명에 따라 오류 역치(threshold)는 생물체의 진화에 실질적으로 영향을 미치지 않음이 증명될 수 있었다.
본 발명의 또다른 관점에서 본 발명자는 이질성 복제 정확성을 지닌 유전적 다양성(quasispecies)의 오류 역치를 연구하였다. 본 발명자는 무-오류 및 오류-빈발 중합효소의 공존이 유전 정보의 분열적 손실없이 오류 역치를 증가시킬 수 있음을 증명하였다. 또한 본 발명자는 레플리코어(replicore)(복제 작용제)가 오류 역치에 영향을 미침을 나타내었다. 그 결과로서 본 발명자는 이질성 복제 정확성을 지닌 유전적 다양성이 다양한 돌연변이체를 생성하기 위해 선택적 진화에 관련된 유전적 비용을 감소시킴을 발견하였다.
적당한 진화는 이로운 돌연변이체의 유전적 다양성과 안정적 재생산을 요구한다. 게놈의 정확한 복제는 안정한 재생산을 보증하는 반면, 복제 동안의 오류는 유전적 다양성을 생성한다. 따라서 진화의 하나의 열쇠는 복제 정확성에 고유하다. 복제 정확성은 뉴클레오타이드 중합효소에 따라 달라진다. 세포내 중합효소는 상동성 복제 정확성을 지니는 것으로 여겨진다. 또한 진화 모델의 대부분의 연구는 상동성 복제 정확성에 기반하였다. 그러나 무-오류 및 오류-빈발 중합효 소는 자연-발생 생물체 내에 공존됨이 증명되었다. 따라서 본 발명은 자연에 적합하다.
본 발명은 하기를 제공한다.
1. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한:
세포의 유전 형질의 전환율을 조절하는 방법
2. 제 1항목에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
3. 제 2항목에 있어서, 적어도 약 30% 이상의 오류-빈발 빈도 작용제는 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
4. 제 1항목에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
5. 제 1항목에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법
6. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 101 이상까지 서로 다름을 특징으로 하는 방법
7. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 102 이상까지 서로 다름을 특징으로 하는 방법
8. 제 2항목에 있어서, 상기 오류-빈발 빈도는 적어도 103 이상까지 서로 다름을 특징으로 하는 방법
9. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
10. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
11. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
12. 제 11항목에 있어서, 상기 DNA 중합효소는 프루프리딩(proofreading) 기능을 지님을 특징으로 하는 방법
13. 제 11항목에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
14. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
15. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
16. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
17. 제 16항목에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
18. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
19. 제 18항목에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
20. 제 1항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
21. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
22. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
23. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
24. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
25. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
26. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
27. 제 12항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
28. 제 1항목에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
29. 제 1항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
30. 제 1항목에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
31. 제 1항목에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
32. 제 1항목에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
33. 제 1항목에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
34. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
35. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
36. 제 1항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
37. 제 1항목에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
38. 제 37항목에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
39. 제 1항목에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
40. 제 1항목에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
41. 제 1항목에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
42. 제 1항목에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
43. 제 1항목에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법
44. 제 43항목에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
45. (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및
(b) 수득된 세포를 재생산시키는 단계를 포함한:
조절된 유전 형질을 지닌 세포를 생성하는 방법
46. 제 45항목에 있어서, 원하는 형질을 지닌 재생산된 세포를 선별하는 단계를 더욱 포함함을 특징으로 하는 방법
47. 제 45항목에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
48. 제 45항목에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
49. 제 45항목에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
50. 제 45항목에 있어서, 상기 더 적은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법
51. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 101 이상까지 서로 다름을 특징으로 하는 방법
52. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 102 이상까지 서로 다름을 특징으로 하는 방법
53. 제 45항목에 있어서, 상기 오류-빈발 빈도는 적어도 103 이상까지 서로 다름을 특징으로 하는 방법
54. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
55. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
56. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
57. 제 56항목에 있어서, 상기 DNA 중합효소는 프루프리딩 기능을 지님을 특징으로 하는 방법
58. 제 56항목에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
59. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
60. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
61. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
62. 제 61항목에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
63. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
64. 제 63항목에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
65. 제 45항목에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
66. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
67. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
68. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
69. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
70. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
71. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
72. 제 57항목에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
73. 제 45항목에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
74. 제 45항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
75. 제 45항목에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
76. 제 45항목에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
77. 제 45항목에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
78. 제 45항목에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
79. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
80. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
81. 제 45항목에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
82. 제 45항목에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
83. 제 82항목에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
84. 제 45항목에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
85. 제 45항목에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
86. 제 45항목에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
87. 제 45항목에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
88. 제 45항목에 있어서, 상기 오류-빈발 빈도는 미리결정된 조건 하에서 조절됨을 특징으로 하는 방법
89. 제 88항목에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
90. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및
(b) 수득된 생물체를 재생산시키는 단계를 포함한:
조절된 유전 형질을 지닌 생물체를 생성하는 방법
91. 제 90항목에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 세포
92. 제 91항목에 있어서, 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 세포
93. 제 90항목에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 생물체
94. 제 93항목에 있어서, 상기 생물체는 야생형 생물체와 실질적으로 동일한 생장을 지님을 특징으로 하는 생물체
95. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;
(b) 수득된 생물체를 재생산시키는 단계;
(c) 생물체 내의 돌연변이를 확인하는 단계; 및
(d) 확인된 돌연변이를 지닌 유전자를 인코드하는 핵산 분자를 생성하는 단 계를 포함한:
조절된 유전 형질을 지닌 유전자를 인코드하는 핵산 분자를 생성하는 방법
96. 제 95항목에 따른 방법에 의해 생성된 핵산 분자
97. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;
(b) 수득된 생물체를 재생산시키는 단계;
(c) 생물체 내의 돌연변이를 확인하는 단계; 및
(d) 확인된 돌연변이를 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 단계를 포함한:
조절된 유전 형질을 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 방법
98. 제 97항목에 따른 방법에 의해 생성된 폴리펩타이드
99. (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;
(b) 수득된 생물체를 재생산시키는 단계;
(c) 생물체 내의 돌연변이를 확인하는 단계; 및
(d) 확인된 돌연변이를 지닌 대사산물을 생성하는 단계를 포함한:
조절된 유전 형질을 지닌 생물체의 대사산물을 생성하는 방법
100. 제 99항목에 따른 방법에 의해 생성된 대사산물
101. 조절된 오류-빈발 빈도를 지닌 DNA 중합효소를 인코드하는 핵산 서열을 포함한, 생물체의 유전 형질을 조절하기 위한 핵산 분자
102. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소임을 특징으로 하는 핵산 분자
103. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
104. 제 101항목에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
105. 제 101항목에 따른 핵산 분자를 포함한 벡터
106. 제 101항목에 따른 핵산 분자를 포함한 세포
107. 제 106항목에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 세포
108. 제 107항목에 있어서, 상기 진핵성 세포는 식물, 동물 및 효모로 구성된 군으로부터 선택됨을 특징으로 하는 세포
109. 제 106항목에 있어서, 상기 세포는 그람-양성 박테리아 세포임을 특징으로 하는 세포
110. 제 106항목에 있어서, 상기 세포는 유전 형질의 전환율을 조절하기 위해 이용됨을 특징으로 하는 방법
111. 제 101항목에 따른 핵산 분자를 포함한 생물체
112. 제 106항목에 따른 세포 또는 그의 일부에 의해 생성된 생성물 물질
113. 제 106항목에 따른 세포 또는 그의 일부에 포함된 핵산 분자
114. 조절된 유전 형질에 관련된 유전자를 인코드하는 제 113항목에 따른 핵산 분자
115. 질병 모델로서 제 106항목에 따른 세포를 이용하여 약물의 효과를 시험하는 단계;
대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및
질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
116. 질병 모델로서 제 111항목에 따른 생물체를 이용하여 약물의 효과를 시험하는 단계;
대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및
질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
117. 생물체의 유전 형질의 전환율을 조절하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
118. 제 117항목에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
119. 제 117항목에 있어서, 상기 중합효소 세트는 동일한 종으로부터 유래됨을 특징으로 하는 세트
120. 조절된 유전 형질을 지닌 생물체를 생성하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
121. 제 120항목에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
122. 제 121항목에 있어서, 상기 중합효소 세트는 동일한 생물체 종으로부터 유래됨을 특징으로 하는 세트
123. 생물체의 유전 형질의 전환율을 조절하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용
124. 조절된 유전 형질을 지닌 생물체를 생성하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용
따라서 여기에 기술된 본 발명은 자연 진화에 순응하여 생물체에 원하는 유전 형질을 부여하기 위한 방법을 제공하는 장점을 가능하게 한다.
본 발명의 이들 장점은 수반된 도면을 참조하여 하기 상세한 설명을 해석하고 이해함으로서 당업자에게 명백해질 것이다.
이하, 본 발명은 도면을 참조로 실시예를 통해 설명될 것이다.
본 명세서 전체를 통해 단수 형태 "a", "an" 및 "the"는 특별히 규정하지 않는 한 다수의 대상물을 포함함이 이해되어야 한다. 또한 여기에 사용된 용어는 언급되지 않는 한 일반적으로 사용되는 정의를 지님이 이해되어야 한다.
(용어)
하기 명세서 및 청구범위 내에서 하기 의미를 지니도록 정의된 많은 용어를 참조로 한다.
"생물체"라는 용어는 당분야에서 공표된 의미로 여기에 사용되고, 대표적으로 세포 구조, 증식(자가 재생산), 생장, 조절, 신진대사, 복구 능력 등과 같은 다양한 성질을 지닌 생명 과정을 수행하는 본체를 나타낸다. 일반적으로, 생물체는 핵산에 의해 제어되는 유전 및 단백질에 의해 제어되는 신진대사가 관련된 증식과 같은 기본 속성을 보유한다. 생물체는 바이러스, 원핵성 생물체, 진핵성 생물체(즉, 단세포 생물(즉, 효모 등) 및 다세포 생물(즉, 식물, 동물 등)) 등을 포함한다. 본 발명의 방법은 그람-양성 박테리아, 진핵성 생물체 등과 같은 고등생물을 포함한 어떠한 생물체에도 적용됨이 이해될 것이다.
"진핵성 생물체"라는 용어는 일반적으로 여기에 사용되고 핵 엔벨로프(envolope)를 지닌 뚜렷한 핵 구조를 지닌 생물체를 나타낸다. 진핵성 생물체의 예는 단세포 생물(즉, 효모 등), 식물(즉, 쌀, 밀, 옥수수, 대두 등), 동물(즉, 마우스, 래트, 소, 말, 돼지, 원숭이 등), 곤충(즉, 파리, 누에 등) 등을 포함하나 이에 한정적인 것은 아니다. 효모, 선충류, 과일 파리, 누에, 쌀, 밀, 대두, 옥수수, 아라비돕시스 탈리아나(Arabidopsis thaliana), 인간, 마우스, 래트, 소, 말, 돼지, 개구리, 물고기(즉, 제브라피쉬 등)가 여기서 모델로 사용되었으나 이에 한정적이지 않다.
여기에 사용된 바와 같이 "원핵성 생물체"라는 용어는 일반적 의미로 사용되고 뚜렷한 핵 구조를 지니지 않는 세포(들)로 구성된 생물체를 나타낸다. 원핵성 생물체의 예는 그람-음성 박테리아(즉, E. coli, 살모넬라 등), 그람-양성 박테리아(즉, 바실러스 섭틸리스, 방선균류, 스타필로코커스 등), 시아노박테리아, 수소 박테리아 등을 포함한다. 대표적으로 E. coli 이외에 그람-양성 박테리아가 여기에 사용되나 이에 한정적인 것은 아니다.
"단세포 생물"이라는 용어는 일반적 의미로 사용되고 하나의 세포로 구성된 생물체를 나타낸다. 단세포 생물은 진핵성 생물체와 원핵성 생물체 모두를 포함한다. 단세포 생물의 예는 박테리아(즉, E. coli, 바실러스 섭티리스 등), 효모, 사이노박테리아 등을 포함하나 이에 한정적인 것은 아니다.
여기에 사용된 바와 같이 "다세포 생물"이라는 용어는 다수의 세포로 구성된 개체 생물체를 나타낸다(일반적으로 다른 형태의 다수의 세포). 다세포 생물이 다른 형태의 세포로 구성되기 때문에 생물체의 생명 유지는 단세포 생물체와는 다른 항상성을 위한 높은 수준의 메카니즘을 요구한다. 대부분의 진핵성 생물체는 다세포 생물이다. 다세포 생물은 동물, 식물, 곤충 등을 포함한다. 놀랍게도 본 발명은 다세포 생물에 적용될 수 있음이 주지되어야 한다.
"동물"이라는 용어는 공표된 의미로 여기서 사용되고 척추동물 및 무척추동물(즉, 절지동물)을 나타낸다. 동물의 예는 포유강, 조강, 파충강, 양서강, 어강, 곤충강, 연충강(Vermes)을 포함하나 이에 한정적인 것은 아니다. 바람직하게는 동물은 척추동물(즉, 먹장어류, 페트로니조니포메스(Petronyzoniformes), 연골어류, 경골어류, 양서류, 파충류, 조류, 포유류 등)이나 이에 한정적인 것은 아니다. 특정한 실시태양에서 동물은 포유류(즉, 단공류, 유대류, 빈치류, 피익류, 익수류, 육식동물, 식충동물, 장비류, 기제류, 우제류, 투불리덴타타(tubulidentata), 유린류, 해우류, 고래류, 영장류, 설치류, 토끼류 등)이나 이에 한정적인 것은 아니다. 더욱 바람직하게는, 동물은 영장류(즉, 침팬지, 일본 원숭이, 인간) 또는 동물 모델(즉, 기제류, 우제류, 설치류(마우스 등), 토끼류 등)로 사용되는 어떠한 정이다. 본 발명은 본 발명의 방법이 어떠한 생물체에도 적용될 수 있음을 처음으로 증명하는 것이다.
여기에 사용된 바와 같이 "식물"이라는 용어는 엽록소, 단단한 세포벽, 풍부한 영구 배아 조직의 존재 및 운동력의 부재가 특징인 식물계에 속하는 어떠한 생물체도 나타낸다. 대표적으로 "식물"이라는 용어는 세포벽의 형성 및 엽록소에 의한 동화작용이 가능한 개화 식물을 나타낸다. "식물"이라는 용어는 어떠한 단자엽식물 및 쌍자엽식물도 나타낸다. 바람직한 식물은 쌀과(즉, 밀, 옥수수, 쌀, 보리, 사탕수수 등)의 단자엽식물과 같은 유용한 식물을 포함하나 이에 한정적인 것은 아니다. 바람직한 식물의 예는 담배, 피망, 가지, 메론, 토마토, 고구마, 양배추, 부추, 브로콜리, 당근, 오이, 감귤, 중국 양배추, 상추, 복숭아, 감자 및 사과를 포함한다. 바람직한 식물은 농작물에 한정적이지 않고 개화 식물, 나무, 잔디, 잡초 등을 포함한다. 규정하지 않는 한 "식물"이라는 용어는 식물체, 식물 기관, 식물 조직, 식물 세포 및 종자의 어떠한 것도 나타낸다. 식물 기관의 예는 뿌리, 잎, 줄기, 꽃 등을 포함한다. 식물 세포의 예는 캘러스, 부유 배양 세포 등을 포함한다. 본 발명은 본 발명의 방법이 어떠한 생물체에도 적용될 수 있음을 가장 먼저 증명한 것이다. 어떠한 생물체도 본 발명에 이용됨이 이해되어야 한다.
특정한 실시태양에서 본 발명에서 이용될 수 있는 식물 형태의 예는 가지과(Solanaceae), 화본과(Poaceae), 십자화과(Brassicaceae), 장미과(Rosaceae), 콩과(Leguminosae), 박과(Cucurbitaceae), 꿀풀과(Lamiaceae), 백합과(Liliaceae), 명아주과(Chenopodiaceae) 및 산형과(Umbelliferae)의 식물을 포함하나 이에 한정적인 것은 아니다.
여기에 사용된 "유전 형질"이라는 용어는 유전형이라고도 불리고, 유전자에 의해 제어되는 생물체의 형태학적 요소를 나타낸다. 유전 형질의 예는 예를 들어 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광파장, 전자파, 방사선, 중력, 장력, 음파, 다른 생물체, 화학제, 항생제, 천연물질, 정신적 스트레스, 물리적 스트레스 등과 같은 환경 파라미터에 대한 저항성을 포함하나 이에 한정적인 것은 아니다.
여기에 사용된 "유전자"라는 용어는 미리 결정된 길이의 서열을 지닌 세포 내에 존재하는 핵산을 나타낸다. 유전자는 유전 형질을 한정하거나 그렇지 않다. 여기에 사용된 "유전자"라는 용어는 일반적으로 게놈 내에 존재하는 서열을 나타내고 염색체 외부의 서열, 미토콘드리아 내 서열 등을 나타낸다. 유전자는 일반적으로 염색체 상의 제공된 서열 내에 배열된다. 단백질의 1차 구조를 한정하는 유전자는 구조 유전자로 불린다. 구조 유전자의 발현을 조절하는 유전자는 조절 유전자로 불린다(즉 프로모터). 여기서 유전자는 명시하지 않는 한 구조 유전자 및 조절 유전자를 포함한다. 따라서 예를 들어 "DNA 중합효소 유전자"라는 용어는 일반적으로 DNA 중합효소의 구조 유전자 및 그의 전사 및/또는 번역 조절 서열(즉, 프로모터)를 나타낸다. 본 발명에서 구조 유전자뿐만 아니라 전사 및/또는 번역의 조절 서열이 본 발명에 의해 타겟된 유전자로서 유용함이 이해될 것이다. 여기에 사용된 "유전자"는 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "핵산" 및 "핵산 분자" 및/또는 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드"를 나타낸다. 여기에 사용된 "유전자 생성물"은 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "핵산" 및 "핵산 분자" 및/또는 유전자에 의해 발현되는 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드" 포함한다. 본 설명에 따라 당업자는 유전자 생성물이 무엇인지 이해한다.
여기에 사용된 유전자에 관련한 "복제"라는 용어는 유전자 물질, DNA 또는 RNA가 그 자체의 사본을 재생산시키고, 모체 핵산 스트랜드(DNA 또는 RNA)이 모체 핵산과 동일한 구조 및 기능을 지닌 새로운 핵산 분자(각각 DNA 또는 RNA)를 형성하는 주형으로서 사용됨을 의미한다. 진핵세포에서 복제 효소(DNA 중합효소 α)를 포함한 복제 개시 복합체는 이중-스트랜드 DNA 분자 상의 많은 복제 기점(origin)에서 복제를 시작하도록 형성되고, 복제 반응은 복제의 기점으로부터 반대 방향으로 진행된다. 복제 개시는 세포 주기에 따라 제어된다. 효모에서 자발적 복제 서열은 복제의 기점으로 여겨진다. E. coli와 같은 원핵세포에서 복제 기점(ori)은 게놈 이중-스트랜드 원형 DNA 분자 상에 존재한다. 복제 개시 복합체는 ori에서 형성되고, 반응은 ori로부터 반대 방향으로 진행된다. 복제 개시 복합체는 복제 효소(DNA 중합효소 Ⅲ)을 포함한 10 이상의 단백질 요소를 포함한 복합 구조를 지닌다. 복제 반응시 이중-스트랜드 DNA의 나선형 구조는 부분적으로 다시 감기고; 짧은 DNA 프라이머가 합성되고; 새로운 DNA 스트랜드가 프라이머의 3'-OH 그룹으로부터 신장되고; Okazaki 단편이 상보성 스트랜드 주형상에서 합성되고; Okazaki 단편이 라이게이트되고; 프루프리딩이 수행되어 새롭게 복제된 스트랜드와 주형 스트랜드를 비교한다. 따라서 복제 반응은 많은 반응 단계를 통해 수행된다.
생물체의 유전 정보를 저장하는 게놈 DNA의 복제 메카니즘은 예를 들어 Kornberg A. and Baker T., "DNA Replication", New York, Freeman, 1992에 상세히 설명되어 있다. 일반적으로 상보성 스트랜드를 합성하여 이중-스트랜드 DNA를 형성하기 위해 주형으로서 DNA의 하나의 스트랜드를 이용하는 효소는 DNA 중합효소(DNA 복제 효소)라고 불린다. DNA 복제는 적어도 2종류 이상의 DNA 중합효소를 필요로한다. 일반적으로 이는 리딩 스트랜드 및 래깅 스트랜드가 동시에 합성되기 때문이다. DNA 복제는 복제 기점(ori)라고 불리는 DNA 상의 미리 결정된 위치로부터 시작된다. 예를 들어 박테리아는 그의 원형 게놈 DNA 상에 적어도 하나 이상의 양-방향 복제 기점을 지닌다. 따라서 그의 복제 동안 하나의 게놈 DNA 상에 동시에 작용하기 위해 일반적으로 4개의 DNA 중합효소가 필요하다. 본 발명에서 바람직하게는 복제 오류가 리딩 스트랜드 및 래깅 스트랜드 중 하나에서만 유리하게 조절되고, 또는 대안으로 2개의 스트랜드 사이의 복제 오류의 빈도 상의 차이가 유리하게 존재한다.
여기에 사용된 "복제 오류"라는 용어는 유전자(DNA 등)의 복제 동안 부정확한 뉴클레오타이드의 도입을 나타낸다. 일반적으로 복제 오류의 빈도는 108∼1012 중 하나로 낮다. 복제 오류 빈도가 낮은 이유는 뉴클레오타이드 첨가가 복제 동안 주형 DNA와 도입된 뉴클레오타이드 사이의 상보적 염기쌍에 의해 결정되기 때문이다; DNA 중합효소 δ, ε 등의 효소의 3'→5' 엑소뉴클레아제 활성(프루프리딩 기능)이 주형에 상보적이지 않은 쌍을 이루지 않은 뉴클레오타이드를 확인하고 제거한다. 따라서 본 발명에서 복제시 오류-빈발 빈도의 조절은 특정한 염기쌍 형성, 프루프리딩 기능 등을 방해함으로서 수행될 수 있다.
여기에 사용된 유전 형질과 관련한 "전환율"이라는 용어는 본래 생물체의 재생산 또는 분열 후 본래 생물체와 그의 선구체 사이의 유전 형질에서 발생하는 차이의 비율을 나타낸다. 이러한 전환율은 예를 들어 분열 또는 재생산 당 유전 형질 내의 변화를 지닌 생물체 수에 의해 표현될 수 있다. 이러한 유전 형질의 전환율은 여기서 대안으로 "진화"로 표기된다.
여기에 사용된 유전 형질의 전환율과 관련한 "조절하다"라는 용어는 유전 형질의 전환율이 자연-발생적 인자가 아닌 인공적 조작에 의해 변화됨을 의미한다. 따라서 유전 형질의 전환율의 조절은 유전 형질의 전환율을 감소시키거나 촉진시키는 것을 포함한다. 생물체의 유전 형질의 전환율을 감소시킴으로서 생물체는 실질적으로 유전 형질을 변화시키지 않는다. 즉, 생물체의 유전 형질의 전환율을 감소시킴으로서 생물의 진화 속도가 저하된다. 반대로, 생물체의 유전 형질의 전환율을 촉진시킴으로서 생물체는 정상 수준보다 더 자주 유전 형질을 변화시킨다. 즉, 생물체의 유전 형질의 전환율을 촉진시킴으로서 생물체의 진화 속도가 증가된다.
여기에 사용된 "무-오류"라는 용어는 유전자의 복제시 오류가 거의 없거나 실질적으로 전혀 없는 성질을 나타낸다. 무-오류 수준은 프루프리딩 효소(즉, DNA 중합효소 δ 및 ε 등)의 프루프리딩 기능의 정확성에 의해 영향 받는다.
여기에 사용된 "오류-빈발"이라는 용어는 유전자(DNA 등)의 복제시 오류가 발생하기 쉬운(즉, 복제 오류가 발생하기 쉬운) 성질을 나타낸다. 오류-빈발 수준은 프루프리딩 효소(즉, DNA 중합효소 δ 및 ε 등)의 프루프리딩 기능의 정확성에 의해 영향 받는다.
오류-빈발 상태 및 무-오류 상태는 절대적으로 구별될 수 있고(즉, 오류-빈발 빈도의 수준 등으로 측정될 수 있다), 또는 대안으로 상대적으로 구별될 수 있다(즉, 유전자 복제시 중요한 역할을 하는 2 이상의 작용제가 구분될 때 더 높은 오류-빈발 빈도를 지닌 작용제는 오류-빈발 유전자로 분류되는 반면 더 낮은 오류-빈발 빈도를 지닌 작용제는 무-오류 작용제로 분류된다).
여기에 사용된 "오류-빈발 빈도"라는 용어는 오류-빈발 성질의 수준을 나타낸다. 오류-빈발 빈도는 예를 들어 유전자 서열 내 돌연변이의 절대적 수(돌연변이 자체 수) 또는 유전자 서열 내 돌연변이의 상대적 수(전체 길이에 대한 돌연변이 수의 비율)에 의해 표현될 수 있다. 대안으로, 특정한 생물체 또는 효소를 언급시 오류-빈발 빈도는 그의 하나의 재생산 또는 분열 당 유전자 서열 내 돌연변이의 절대 수 또는 상대 수에 의해 표현된다. 언급하지 않는 한 오류-빈발 빈도는 하나의 복제 과정시 유전자 서열 내 오류 수에 의해 표현된다. 여기서 오류-빈발 빈도는 역 치수로서 "정확성"으로 표기된다. 균일한 오류-빈발 빈도는 다수의 유전자의 복제시 중요한 역할을 하는 작용제(중합효소 등)가 논의될 때 그의 오류-빈발 빈도는 서로 실질적으로 동일함을 의미한다. 반대로, 이질성 오류-빈발 빈도는 오류-빈발 빈도 상의 유의적인 차이가 다수의 유전자의 복제시 중요한 역할을 하는 다수의 작용제(중합효소 등) 중에 존재함을 의미한다.
여기에 사용된 오류-빈발 빈도와 관련한 "조절하다"라는 용어는 오류-빈발 빈도가 변화됨을 의미한다. 이러한 오류-빈발 빈도의 조절은 오류-빈발 빈도의 증가 및 감소를 포함한다. 오류-빈발 빈도를 조절하는 방법의 예는 프루프리딩 기능을 지닌 DNA 중합효소의 변형, 복제 동안 중합반응 또는 연장반응을 저해하거나 억제할 수 있는 작용제의 삽입, 이들 반응을 증진시키는 인자의 저해 또는 억제, 하나 이상의 염기의 삭제, 이중 DNA 복구 효소의 부재, 비정상 염기를 제거할 수 있는 복구 작용제의 변형, 미스매치된 염기쌍을 복구할 수 있는 복구 작용제의 변형, 복제 자체의 정확성의 감소를 포함하나 이에 한정적인 것은 아니다. 오류-빈발 빈도의 조절은 이중-스트랜드 DNA의 양쪽 스트랜드 또는 하나의 스트랜드 상에서 수행된다. 바람직하게는 오류-빈발 빈도의 조절은 하나의 스트랜드 상에서 유리하게 수행된다. 이는 불리한 돌연변이유발이 감소되기 때문이다.
여기에 사용된 "DNA 중합효소" 또는 "Pol"이라는 용어는 DNA를 중합시키기 위해 4개의 디옥시리보뉴클레오타이드 5'-트리포스페이트로부터 피로인산을 유리시키는 효소를 나타낸다. DNA 중합효소 반응은 주형 DNA, 프라이머 분자, Mg2+ 등을 요구한다. 상보적 뉴클레오타이드는 실질적으로 프라이머의 3'-OH 말단에 첨가되어 분자 체인을 연장시킨다.
E. coli가 적어도 3개 이상의 DNA 중합효소 Ⅰ, Ⅱ 및 Ⅲ를 보유한 것으로 알려져 있다. DNA 중합효소 Ⅰ은 손상된 DNA의 복구, 유전자 재조합 및 DNA 복제에 관련된다. DNA 중합효소 Ⅱ 및 Ⅲ은 보조적 기능을 지닌 것으로 여겨진다. 이들 효소 각각은 여러 단백질을 포함한 서브유니트 구조를 지니고 구조에 따라 핵심 효소(core enzyme) 또는 홀로효소(holoenzyme)으로 나뉜다. 핵심 효소는 α, ε 및 θ 서브유니트로 구성된다. 홀로효소는 α, ε 및 θ 서브유니트 이외에 τ, γ, δ 및 β 구성성분을 포함한다. 진핵세포는 다수의 DNA 중합효소를 지니는 것으로 알려져 있다. 고등생물에서는 다수의 DNA 중합효소 α, β, γ, δ, ε 등이 있다. 동물에서는 알려진 중합효소가 있다: 핵 DNA의 복제에 관련되고 세포 생장기에서 DNA 복제시 중요한 역할을 하는 DNA 중합효소 α; 핵 내의 DNA 복구에 관련되고 생장기 또는 휴지기에서 손상된 DNA의 복구에 중요한 역할을 하는 DNA 중합효소 β; 미토콘드리아 DNA의 복제 및 복구에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 γ; DNA 연장에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 δ; 래깅 스트랜드 사이의 갭의 복제에 관련되고 엑소뉴클레아제 활성을 지닌 DNA 중합효소 ε.
그람-양성 박테리아, 그람-음성 박테리아, 진핵성 생물체 등의 프루프리딩 기능을 지닌 DNA 중합효소에서 ExoI 모티프를 지닌 아미노산 서열이 3'→5' 엑소뉴클레아제 활성 센터에 중요한 역할을 하고 프루프리딩 기능의 정확성에 영향을 미치는 것으로 여겨진다.
서열번호 5 : DnaQ: 8-QIVLDTETTGMN-19 (Escherichia coli);
서열번호 6 : DnaQ: 7-QIVLDTETTGMN-18 (Haemophilus influenzae);
서열번호 7 : DnaQ: 8-QIVLDTETTGMN-19 (Salmonella typhimurium);
서열번호 8 : DnaQ: 12-IVVLDTETTGMN-23 (Vibrio cholerae);
서열번호 9 : DnaQ: 3-SVVLDTETTGMP-14 (Pseudomonas aeruginosa);
서열번호 10 : DnaQ: 5-QIILDTETTGLY-16 (Neisseria meningitidis);
서열번호 11 : DnaQ: 9-FVCLDCETTGLD-20 (Chlamydia trachomatis);
서열번호 12 : DnaQ: 9-LAAFDTETTGVD-20 (Streptomyces coelicolor);
서열번호 13 : DnaQ: 11-QIVLDTETTGMN-22 (Shigella flexneri 2a str. 301);
서열번호 14 : PolC: 420-YVVFDVETTGLS-431 (Staphylococcus aureus);
서열번호 15 : PolC: 421-YVVFDVETTGLS-432 (Bacillus subtilis);
서열번호 16 : PolC: 404-YVVYDIETTGLS-415 (Mycoplasma pulmonis);
서열번호 17 : PolC: 416-FVIFDIETTGLH-427 (Mycoplasma genitalium);
서열번호 18 : PolC: 408-FVIFDIETTGLH-419 (Mycoplasma pneumoniae);
서열번호 19 : Pol Ⅲ: 317-IMSFDIECAGRI-328 (Saccharomyces cerevisiae);
서열번호 20 : Pol Ⅲ: 286-VMAFDIETTKPP-297 (Saccharomyces cerevisiae);
서열번호 21 : Pol δ: 310-VLSFDIECAGRK-321 (마우스);
서열번호 22 : Pol ε: 271-VLAFDIETTKLP-282 (마우스);
서열번호 23 : Pol δ: 312-VLSFDIECAGRK-323 (인간);
서열번호 24 : Pol ε: 271-VLAFDIETTKLP-282 (인간);
서열번호 25 : Pol δ: 316-ILSFDIECAGRK-327 (쌀);
서열번호 26 : Pol δ: 306-VLSFDIECAGRK-317 (Arabidopsis thaliana);
서열번호 27 : Pol ε: 235-VCAFDIETVKLP-246 (Arabidopsis thaliana);
서열번호 28 : Pol δ: 308-VLSFDIECAGRK-319 (래트);
서열번호 29 : Pol δ: 311-VLSFDIECAGRK-322 (소);
서열번호 30 : Pol δ: 273-ILSFDIECAGRK-284 (대두);
서열번호 31 : Pol δ: 296-ILSFDIECAGRK-307 (과일 파리); 및
서열번호 32 : Pol ε: 269-VLAFDIETTKLP-280 (과일 파리);
명백하게는, 프루프리딩 기능을 지닌 DNA 중합효소는 잘 보존된 아스파르트산(즉, 인간 DNA 중합효소 δ 내 316 위치) 및 글루탐산(즉, 인간 DNA 중합효소 δ 내 318 위치)을 지닌다. 이러한 아스파르트산 및 글루탐산을 포함한 구역은 여기서 프루프리딩 기능 활성 사이트로 여겨진다.
E. coli와 같은 그람-음성 박테리아에는 2개의 DNA 중합효소 단백질 즉, 엑소뉴클레아제 활서을 지닌 분자 및 DNA 중합효소 합성 활성을 지닌 분자가 있다. 따라서 엑소뉴클레아제 활성을 조절함으로서 프루프리딩 기능이 조절될 수 있다.
그러나 진핵성 생물체(즉, 효모, 동물, 식물 등) 뿐만 아니라 그람-양성 박테리아(즉, B. subtilis 등)에는 하나의 DNA 중합효소가 DNA 합성 활성과 엑소뉴클레아제 활성 둘 모두를 지닌다. 따라서 프루프리딩 기능을 조절하기 위해 정상 DNA 합성 활성을 유지하는 동안 엑소뉴클레아제 활성을 조절하는 분자가 요구된다. 본 발명은 정상 DNA 합성 활성을 유지하는 동안 엑소뉴클레아제 활성을 조절할 수 있고 생물체의 진화에 이용될 수 있는 진핵성 생물체 및 그람-양성 박테리아의 DNA 중합효소 변이체를 제공한다. 이로 인해 E. coli와 다르고 예측되지 않았던 효과가 달성되었다. 따라서 본 발명은 상기-기술된 프루프리딩 기능 활성 사이트가 진핵성 생물체 및 그람-양성 박테리아, 특히 진핵성 생물체에서 예상외로 명기되었음을 발견함으로서 일부 달성된 것으로 여겨질 수 있다. 더욱이 본 발명의 유의적인 효과는 하기 실시예에서 예상외로 나타난 유전 형질의 획득이다.
많은 오류-빈발 DNA 중합효소가 인간뿐만 아니라 박테리아에서 발견되었다. 많은 복제성 DNA 중합효소는 일반적으로 프루프리딩 기능을 지닌다 즉, 3'→5' 엑소뉴클레아제 활성에 의해 오류를 제거하여 무-오류 복제를 수행한다. 그러나 오류-빈발 DNA 중합효소는 프루프리딩 기능을 지니지 않고 DNA 손상을 우회할 수 없고, 따라서 돌연변이를 유발한다. 오류-빈발 DNA 중합효소의 존재는 암의 발병, 진화, 항체 진화 등에 관련된다. 많은 DNA 중합효소는 오류-빈발이 되는 가능성을 지닌다. 그의 프루프리딩 기능을 분열시킴으로서 이들 DNA 중합효소는 오류-빈발이 될 수 있다. 따라서 복제의 정확성은 상기-기술된 프루프리딩 기능 활성 사이트를 변형시킴으로서 조절될 수 있다. 이러한 모델을 이용함으로서 한번 획득된 새로운 특성은 비정상없이 유리하게 진화될 수 있다. 이러한 점에서 본래 불일치 모델과 비교시 예상되지 않은 장점 및 효과는 획득될 수 있다.
유전적 다양성(quasispecies) 이론에서 Eigen은 오류-빈발 복제만이 고려된 진화 모델을 주장한다(M. Eigen, Naturwissenschaften 58, 465(1971)). 유전적 다양성 이론은 다양한 변형을 이용한다. 유전적 다양성은 가장 잘 맞는 서열의 안정한 앙상블로서 정의될 수 있고, 그의 돌연변이체는 선택적으로 서열 공간 내 가장 잘 맞는 서열 주변에 분포된다. 자연적 선택은 단일 서열이 아닌 전체 유전적 다양성 분포에서 발생하는 것으로 보인다. 유전적 다양성의 진화는 하기와 같이 발생한다: 주요 서열보다 더 높은 적합성을 지닌 돌연변이체가 유전적 다양성에 나타나고, 이러한 돌연변이체는 선택적으로 오래된 주요 서열을 복제하고, 이후 새로운 유전적 다양성 분포가 돌연변이체 주변을 조직한다.
유전적 다양성 이론은 유전 정보를 유지하기 위한 오류 역치가 존재함을 예측하고 결정하였다. 따라서 통상적으로 유전적 다양성은 이러한 역치하에서만 진화한다고 여겨진다(M. Eigen et al., Adv. Chem. Phys. 75, 149 (1989)). 이는 진화율의 상한선이 오류 역치의 상한선에 의해 한정됨을 의미한다. 유전적 다양성 이론은 오류 역치 가까이의 높은 비율로 진화하는 RNA 바이러스의 연구로 증명된 것을 보인다. 그러나 돌연변이화된 작용제의 표현형 내의 오류율의 증가를 지닌 작용제는 이러한 과정에서 중요한 역할을 하는 것으로 여겨진다.
박테리아 게놈이 단일 복제 기점을 지니는 반면 진핵성 생물체의 게놈은 다수의 복제 기점을 지닌다. 이는 게놈의 서열이 다수의 복제 유니트(복제 작용제, 레플리코어)를 포함함을 의미한다. 따라서 다수의 중합효소는 게놈 복제에 동시에 참여한다. 본 발명에서 오류 역치 상의 다수의 복제 작용제의 영향이 고려된다.
하나의 바람직한 실시태양에서 DNA 중합효소를 인코드하는 유전자 내로 3'→5' 엑소뉴클레아제 활성을 분열시킬 수 있는 돌연변이를 도입시킴으로서 감소된 프루프리딩 기능(즉, 높은 오류-빈발 빈도)을 지닌 DNA 중합효소를 인코드하는 핵산 분자 및 폴리펩타이드가 제공될 수 있다. 단일 DNA 중합효소 유전자(PolC, POL2, CDC2 등)에서 3'→5' 엑소뉴클레아제 활성(프루프리딩 기능)이 DNA 중합반응 활성을 지닌 분자 내에 포함되거나(즉, 진핵성 생물체, 그람-양성 박테리아 등) DNA 중합반응 활성을 인코드하는 유전자(즉, dnaE)와 다른 유전자(dnaQ)에 의해 인코드됨이(즉, 그람-음성 박테리아 등) 주지해야 한다(Kornberg A. and Baker T., "DNA Replication", New York, Freeman, 1992). 상기-기술된 특성의 이해에 기반하여 당업자는 본 발명에 따른 오류-빈발 빈도를 조절할 수 있다. 예를 들어 진핵성 생물체에서 DNA 중합효소 내로 DNA 중합반응 활성이 아닌 프루프리딩 기능을 실질적으로 변화시키는 돌연변이를 도입시키는 것이 바람직하다. 이러한 경우 상기-기술된 프루프리딩 기능과 관련된 2개의 산성 아미노산이 변형된다(바람직하게는 비-보존적 치환(즉, 알라닌, 발린 등의 치환))(Derbyshire et al., EMBO J. 10, pp. 17-24, Jan. 1991; Fijalkowska and Schaaper, "Mutants in the Exo I motif of Escherichia coli danQ: Defective proofreading and inviability due to error catastrophe", Proc. Natl. Acad. Sci. USA, Vol. 93, pp. 2856-2861, Apr. 1996). 본 발명은 이에 한정적이지 않다.
여기에 사용된 "프루프리딩 기능"이라는 용어는 세포의 DNA 내의 손상 및/또는 오류를 감지하고 복구하는 기능을 나타낸다. 이러한 기능은 아퓨린 사이트(apurinic site) 또는 아피리미딘 사이트(apyrimidinic site)에서 염기를 삽입시킴으로서 또는 대안으로 아퓨린-아피리미딘(A-P) 엔도뉴클레아제로 하나의 스트랜드를 분열시킨 후 5'→3' 엑소뉴클레아제로 사이트를 제거시킴으로서 달성된다. 제고된 부분에서 DNA는 합성되고 DNA 중합효소가 보충되고 합성된 DNA는 DNA 리가제에 의해 정상 DNA와 라이게이트된다. 이러한 반응은 절제 복구(excision repair)로 불린다. 알킬화제, 비정상 염기, 방사선, 자외선에 의한 손상된 DNA의 경우 손상된 부분은 복구가 상기-기술된 반응에 의해 수행되기 전에 DNA 글리코시다제로 제거된다(예정되지 않은 DNA 합성). 이러한 프루프리딩 기능을 지닌 DNA 중합효소의 예는 진핵성 생물체의 DNA 중합효소 δ, DNA 중합효소 ε 등을 포함하나 이에 한정적인 것은 아니다. 여기에 사용된 "정확도"라는 용어는 프루프리딩 기능 수준을 나타내는데 사용된다. "정확도"라는 용어는 DNA 복제 정확성을 나타낸다. 정상 DNA 중합효소는 일반적으로 높은 수준의 정확도를 지닌다. 변형에 의해 감소된 프루프리딩 기능을 지닌 DNA 중합효소는 낮은 수준의 정확도를 지닌다.
DNA 중합효소의 상기-기술된 프루프리딩 기능은 예를 들어 Kukel, T.A.: J. Biol. Chem., 260, 12866-12874(1985); Kunkel, T.A., Sabotino, R.D. & Bambara, R.A.: Proc, Natl., Acad. Sci. USA, 84, 4865-4869(1987); Wu. C.I. & Maeda, N.: Nature, 327, 167-170(1987); Roberts, J.D. & Kunkel. T.A.: Proc. Natl. Acad. Sci. USA, 85, 7064-7068(1988); Thomas, D.C., Fitzgerald, M.P. & Kunkel. T.A.: Basic Life Science, 52, 287-297(1990); Trinh, T.Q. & Siden, R.R., Nature, 352, 544-547(1991); Weston-Hafer, K. & Berg, D.E., Genetics, 127, 649-655(1991); Veaute, X. & Fuchs, R.P.P.: Science, 261, 598-600(1993); Roberts, J.D., Izuta, S., Thomas, D.C. & Kunkel, T.A.: J. Biol. Chem., 269-1711-1717(1994); Roch, W.A., Trinh, T.Q. & Siden, R.R., J. Bacteriol., 177, 4385-4391(1995); Kang S., Jaworski, A., Ohshirna, K. & Wells, Nat. Genet., 10, 213-218(1995); Fijalkowska. I.J., Jonczyk, P., Maliszewska-Tkaczyk, M., Bialoskorska, M. & Schaaper, R.M., Proc. Natl. Acad. Sci. USA., 95, 10020-10025(1998); Maliszewska-Tkaczyk, M., Bialoskorska, M. & Schaaper, R.M., Proc. Natl. Acad. Sci. USA., 97, 12678-12683(2000); Gwel, D., Jonezyk, P., Bialoskorska, M., Schaaper, R.M. & Fijalkowska, I.J.: Mutation Research, 501, 129-136(2002); Roberts, J.D., Thomas, D.C. & Kunkel. T.A.: Proc. Natl. Acad. Sci. USA, 88, 3465-3469(1991); Roberts, J.D., Nguyen, D. & Kunkel, T.A.: Biochemistry, 32, 4083-4089(1993); Francino, M.P., Chac, L., Riley, M.A. & Ochman, H.: Science, 272, 107-109(1996); A. Boulet, M. Simon, G. Faye, G.A. Bauer & P.M. Burgers, EMBO J., 8, 1849-1854(1989); Morrison A., Araki H., Clark A.B., Hamtake R.K., & Sugino A., Cell, 62(6), 1143-1151(1990) 등에 기술되어 있다.
여기에 사용된 진핵성 생물체의 "DNA 중합효소 δ"라는 용어는 프루프리딩 기능을 유도하는 엑소뉴클레아제 활성을 지니는 것으로 여겨지는 DNA 연장에 관련된 효소를 나타낸다. 대표적 DNA 중합효소 δ는 서열번호 1 및 2(핵산 서열 및 아미노산 서열 각각; polδ: X61920gi/171411/gb/M61710.1/YSCDPB2[171411])에 나타난 서열을 지닌다. 이러한 DNA 중합효소 δ의 프루프리딩 기능은 서열번호 2에 나타난 아미노산 서열의 322 위치에서 아미노산을 변형시킴으로서 조절될 수 있다. DNA 중합효소 δ는 참고문헌에 포함된 Simon, M. et al., EMBO J., 10, 2163-2170, 1991에 기술되어 있다. DNA 중합효소 δ의 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)(서열번호: 45), 쌀(서열번호: 47 및 48), 대두(서열번호: 49 및 50), 인간(서열번호: 51 및 52), 마우스(서열번호: 55 및 56), 래트(서열번호: 59 및 60), 소(서열번호: 61 및 62), 과일 파리(서열번호: 63 및 64)의 것을 포함하나 이에 한정적인 것은 아니다.
여기에 사용된 진핵성 생물체의 "DNA 중합효소 ε"는 프루프리딩 기능을 유도하는 엑소뉴클레아제 활성을 지닌, 래깅 스트랜드 사이의 갭의 복제에 관련된 효소를 나타낸다. 대표적인 DNA 중합효소 ε는 서열번호 3 및 4(핵산 서열 및 아미노산 서열, 각각; polε: M60416gi/171408/gb/M60416.1/YSCDNA[171408])에 나타난 서열을 지닌다. DNA 중합효소 ε의 프루프리딩 기능은 서열번호 4에 나타난 아미노산 서열의 391 위치에서 아미노산을 변형시킴으로서 조절될 수 있다. DNA 중합효소 ε는 예를 들어 참고문헌에 포함된 Morrison, A. et al., MGG. 242, 289-296, 1994; Araki H., et al., Nucleic Acids Res. 19, 4857-4872, 1991; 및 Ohya T., et al., Nucleic Acids Res. 28, 3846-3852, 2000에 기술되어 있다. DNA 중합효소 ε의 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)(서열번호: 46), 쌀(서열번호: 47 및 48), 인간(서열번호: 53 및 54), 마우스(서열번호: 57 및 58), 래트(서열번호: 59 및 60), 과일 파리(서열번호: 65 및 66)의 것을 포함하나 이에 한정적인 것은 아니다.
DNA 중합효소 δ 및 ε는 HUGO 카테고리에 따라 각각 POLD1/POL3 및 POLE/POL2로 표기된다. 두 용어 모두 여기에 사용된다.
다른 DNA 중합효소는 예를 들어 참고문헌에 포함된 Lawrence C.W. et al., J. Mol. Biol., 122, 1-21, 1978; Lawrence C.W. et al., Genetics 92, 397-408; Lawrence C.W. et al., MGG, 195, 487-490, 1984; Lawrence C.W. et al., MGG. 200, 86-91, 1985(DNA 중합효소 β 및 DNA 중합효소 ξ); Maher V.M. et al., Nature 261, 593-595, 1976; McGregor, W.G. et al., Mol. Cell. Biol. 19, 147-154, 1999 (DNA 중합효소 η); Strand M. et al., Nature 365, 275-276, 1993; Prolla T.A., et al., Mol. Cell. Biol. 15, 407-415, 1994; Kat A., et al., Proc. Natl. Acad. Sci. USA 90, 6424-6428; Bhattacharyya N.P., et al., Proc. Natl. Acad. Sci. USA 91, 6319-6323, 1994; Faber F.A., et al., Hum. Mol. Genet. 3, 253-256, 1994; Eshleman, J.R. et al., Oncogene 10, 33-37, 1995; Morrison A. et al, Proc. Natl. Acad. Sci. USA 88, 9473-9477, 1991; Morrison A., et al., EMBO J. 12, 1467-1473, 1993; Foury F., et al., EMBO J. 11, 2717-27256, 1992 (DNA 중합효소 λ, DNA 중합효소 μ 등)에 기술되어 있다.
여기에 사용된 DNA 중합효소를 인코드하는 유전자 및 생물체(즉, 효모 등)와 관련한 "야생형"이라는 용어는 공표된 의미로 DNA 중합효소를 인코드하는 자연-발생적 유전자 및 생물체(즉, 효모 등)가 유래된 종의 대부분의 멤버의 특성인 형태를 나타낸다. 따라서 일반적으로 특정한 종에서 처음으로 확인된 DNA 중합효소를 인코드하는 유전자 및 생물체(즉, 효모 등)의 형태가 야생형이라고 할 수 있다. 또한 야생형은 "자연 표준형"으로도 표기된다. 야생형 DNA 중합효소 δ는 서열번호 1 및 2에 나타난 서열을 지닌다. 야생형 DNA 중합효소 ε는 서열번호 3 및 44에 나타난 서열을 지닌다. 서열번호 41 내지 66에 나타난 서열을 지닌 DNA 중합효소도 야생형이다. 야생형 생물체는 일반적 효소 활성, 일반적 형질, 일반적 흡성, 일반적 생리기능, 일반적 재생산 및 일반적 게놈을 지닌다.
여기에 사용된 효소의 프루프리딩 기능과 관련한 "야생형보다 더 낮은"이라는 용어는 효소의 프루프리딩 기능이 야생형 효소보다 더 낮음(즉, 효소의 프루프리딩 과정 후 유지되는 돌연변이의 수가 야생형 효소보다 더 큼)을 의미한다. 야생형과의 비교는 상대적 또는 절대적 표현에 의해 수행될 수 있다. 이러한 비교는 오류-빈발 빈도를 이용하여 수행될 수 있다.
여기에 사용된 유전자와 관련한 "돌연변이"라는 용어는 유전자의 서열이 변화된 것을 의미하거나 유전자의 변화된 핵산 서열 또는 아미노산 서열의 상태를 나타낸다. 예를 들어 여기서 "돌연변이"라는 용어는 프루프리딩 기능의 변화를 유도하는 유전자 서열 내의 변화를 나타낸다. 한정하지 않는 한 "돌연변이" 및 "변이"라는 용어는 명세서에서 동일한 의미를 지닌다.
유용한 돌연변이체를 생성하기 위해 돌연변이유발이 생물체에 가장 일반적으로 수행된다. "돌연변이"라는 용어는 DNA 서열의 변화를 포함하여 유전자를 인코드하는 염기 서열 내 변화를 나타낸다. 돌연변이는 돌연변이를 지닌 개체 상의 그의 영향에 따라 하기 3가지 그룹으로 크게 분류된다: A) 중립 돌연변이(대부분의 돌연변이가 본 그룹으로 분류되고, 생물체의 생장 및 신진대사에 실질적으로 어떠한 영향도 존재하지 않는다); B) 유해성 돌연변이(그의 빈도는 중립 돌연변이보다 더 낮다). 이러한 형태의 돌연변이는 생물체의 생장 및 신진대사를 저해한다. 유해성 돌연변이는 생장에 필수적인 유전자를 분열시키는 치사성 돌연변이를 포함한다. 미생물의 경우 유해성 돌연변이의 비율은 종에 따라 다르나 일반적으로 총 돌연변이의 약 1/10 내지 1/100이다; C) 유익성 돌연변이(본 돌연변이는 생물체 번식에 유익하다). 발생 빈도는 중립 돌연변이에 비교하여 매우 낮다. 따라서 유익성 돌연변이를 지닌 개체 생물체를 수득하기 위해서는 생물체의 큰 집단 및 장기간이 요구된다. 생물체의 번식에 충분한 효과는 단일 돌연변이에 의헤서는 거의 획득되지 않고 종종 다수의 유익성 돌연변이의 축적을 필요로 한다.
여기에 사용된 특정한 생물체와 관련한 "생장"이라는 용어는 개체 생물체 내의 양적 증가를 나타낸다. 생물체의 생장은 신체 크기(신체 높이), 체중 등과 같은 측정된 수치의 양적 증가에 의해 인식될 수 있다. 개체 내 양적 증가는 각 세포의 증가 및 세포수의 증가에 따라 달라진다.
여기에 사용된 생물체와 관련한 "실질적으로 동일한 생장"은 생물체의 생장률이 참조 생물체(즉, 형질전환전 생물체)와 비교시 실질적으로 변화되지 않았음을 의미한다. 생장률이 실질적으로 변화되지 않은 범위의 예는 일반적 생장의 통계적 분포 내 1 편차의 범위를 포함하나 이에 한정적인 것은 아니다. 본 발명의 생물체에서 "실질적으로 동일한 생장"이라는 용어는 예를 들어 (1) 선구체의 수가 실질적으로 변화되지 않고; (2) 형태가 변화되더라도 일반적인 인공 돌연변이와 다른 어떠한 장애도 실질적으로 생성되지 않음을 의미한다. 매우 높은 돌연변이율에도 불구하고 외형이 "아름다운" 것으로 인식되고(이러한 특징이 생장에 직접적으로 관련되지 않더라도 본 특징은 본 발명의 방법에 의해 생성된 돌연변이체의 특성임); (3) 한번 획득된 형질, 유전형 또는 표현형은 퇴화하지 않는다.
여기에 사용된 "약물 저항성"이라는 용어는 박테리오파지, 박테리오신과 같은 생리적 활성 물질을 포함한 약물에 대한 내성 또는 저항성을 나타낸다. 약물 저항성은 약물에 대한 그의 수용체가 변화되거나 약물 작용에 관련된 하나 이상의 다양한 과정이 변화될 때 민감한 숙주에 의해 획득된다. 대안으로, 민감한 숙주가 항생제 자체를 불활성화시키는 능력을 획득하면 약물 저항성이 수득된다. 약물 저항성 생물체에 있어서 염색체 DNA 내의 돌연변이는 약물이 작용하는 효소 및/또는 리보솜 단백질을 변화시켜서 일반적 농도를 지닌 약물은 더 이상 효과적이지 않게 된다. 대안으로, 생물체는 다른 생물체로부터의 약물 저항성 플라스미드(즉, R 플라스미드)를 획득하여 약물을 불활성화시키는 능력을 지닌 효소가 수득된다. 대안으로 약물의 멤브레인 투과성이 감소되어 약물에 대한 저항성이 획득된다. 본 발명은 이에 한정적인 것은 아니다.
여기에 사용된 "암세포"라는 용어는 육종을 포함한 "악성 종양 세포"라는 용어와 동일한 의미를 지니고 영구적인 증식 능력을 지니고 불멸인 세포를 나타낸다. 암세포는 하기 방식으로 영구적 증식 능력을 획득하고 불멸이 된다. 특정한 비가역적 변화가 유전자 수준에서 정상 세포에 생성된다. 그 결과로서 정상 세포는 비정상 세포 즉, 암세포로 형질전환된다.
여기에 사용된 생물체와 관련한 "생성"이라는 용어는 개체 생물체가 생성됨을 의미한다.
여기에 사용된 생물체와 관련한 "재생산"이라는 용어는 다음 세대의 새로운 개체가 부모 개체로부터 생성됨을 의미한다. 재생산은 자연적 증가, 증식 등; 클로닝 기술(핵이식 등)과 같은 인공적 기술에 의한 인공적 증가, 증식 등을 포함하나 이에 한정적인 것은 아니다. 재생산 기술의 예는 식물의 경우 단일 세포의 배양; 절단체의 이식; 절단체의 정착 등을 포함하나 이에 한정적인 것은 아니다. 재생산된 생물체는 일반적으로 그의 부모로부터 유래된 유전 형질을 지닌다. 유성적으로 재생산된 생물체는 일반적으로 2개의 성으로부터 유래된 유전 형질을 지닌다. 일반적으로 이들 유전 형질은 실질적으로 동일한 비율로 2개의 성으로부터 유래된다. 무성적으로 재생산된 생물체는 그의 부모로부터 유래된 유전 형질을 지닌다.
"세포"라는 용어는 여기서 공표된 의미로 사용되고 자가 복제할 수 있고 이를 발현하기 위한 유전 정보 및 메카니즘을 지니고 외부로부터 생명체를 구분시키는 멤브레인 구조에 의해 둘러싸인 다세포 생물체 조직의 구조적 단위를 나타낸다. 여기에 사용된 세포는 자연-발생적 세포 또는 인공적으로 변형된 세포(즉, 융합세포, 유전적으로 변형된 세포 등)이다. 세포 급원의 예는 단일세포 배양, 배아, 정상적으로 생장된 형질전환 동물의 혈액 또는 신체 조직, 정상적으로 생장된 세포주로부터의 세포와 같은 세포 혼합물 등을 포함하나 이에 한정적인 것은 아니다.
본 발명에 이용되는 세포는 어떠한 생물체(즉, 어떠한 단세포 생물(즉, 박테리아, 효모 등) 또는 어떠한 다세포 생물(즉, 동물(척추동물, 무척추동물), 식물(즉, 단자엽식물, 쌍자엽식물 등))로부터도 유래된다. 예를 들어 척추동물(즉, 먹장어류, 페트로니조니포메스, 연골어류, 경골어류, 양서류, 파충류, 조류, 포유류 등)로부터 유래된 세포가 이용된다. 특히, 포유류(즉, 단공류, 유대류, 빈치류, 피익류, 익수류, 육식동물, 식충동물, 장비류, 기제류, 우제류, 투불리덴타타(tubulidentata), 유린류, 해우류, 고래류, 영장류, 설치류, 토끼류 등)로부터 유래된 세포가 이용된다. 하나의 실시태양에서 영장류(즉, 침팬지, 일본 원숭이, 인간), 특히 인간으로부터 유래된 세포가 이용된다. 본 발명은 이에 한정적인 것은 아니다. 본 발명에 이용되는 세포는 줄기세포 또는 체세포이다. 상기-기술된 세포는 조작의 목적으로 이용된다. 개화 식물(즉, 단자엽식물 또는 쌍자엽식물)로부터 유래된 세포가 이용된다. 바람직하게는 쌍자엽식물이 이용된다. 더욱 바람직하게는 벼과(Gramineae) 가지과(Solanaceae), 박과(Cucurbitaceae), 십자화과(Crucifera), 산형과(Umbelliferae), 장미과(Rosaceae), 콩과(Leguminosae), 지치과(Boraginaceae)로부터의 세포가 이용된다. 바람직하게는 밀, 옥수수, 쌀, 보리, 사탕수수, 담배, 피망, 가지, 메론, 토마토, 딸기, 고구마, 브라시카(Brassica), 양배추, 부추, 브로콜리, 대두, 알팔파, 아마, 당근, 오이, 감귤, 중국 양배추, 상추, 복숭아, 감자, 지치(Lithospermum eythrohizon), 콥티스 리조메(Coptis rhizome), 포플라 및 사과로부터 유래된 세포가 이용된다. 식물 세포는 식물체 일부, 기관, 조직, 배양 세포 등이다. 세포, 조직, 기관 또는 개체를 형질전환시키는 기술은 당분야에 잘 알려져 있다. 이들 기술은 여기에 인용된 문헌에 잘 기술되어 있다. 핵산 분자는 생물체 세포 내로 일시적으로 또는 안정적으로 도입된다. 유전자를 일시적으로 또는 안정적으로 도입시키는 기술은 당분야에 잘 알려져 있다. 형질전환 식물을 생성하기 위해 본 발명에서 이용되는 세포를 분화시키는 기술은 당분야에 잘 알려져 있다. 이들 기술은 인용된 문헌에 잘 기술되어 있음이 이해될 것이다. 형질전환 식물로부터 종자를 수득하는 기술은 당분야에 잘 알려져 있다. 이들 기술은 여기에 논의된 문헌에 기술되어 있다.
여기에 사용된 "줄기세포"라는 용어는 자가 복제 및 다능성이 가능한 세포를 나타낸다. 일반적으로 줄기세포는 손상된 조직을 재생시킬 수 있다. 여기에 사용된 줄기세포는 배아 줄기(ES) 세포 또는 조직 줄기세포(조직성 줄기세포, 조직-특이적 줄기세포 또는 체세포성 줄기세포라고도 불림)에 한정적이지 않다. 줄기세포는 상기-기술된 능력을 지닐 수 있는 한 인공적으로 생성된 세포도 된다. "배아 줄기세포"라는 용어는 초기 배아로부터 유래된 다능성 줄기세포를 나타낸다. 배아 줄기세포와 달리 조직 줄기세포의 분화 방향은 제한된다. 배아 줄기세포는 조직 내 특정한 위치에 정해져 있고 미분화된 세포 내 구조를 지닌다. 따라서 조직 줄기세포는 낮은 수준의 다능성을 지닌다. 조직 줄기세포에 있어서 핵/세포질의 비율이 높고 세포내 소기관이 거의 없다. 조직 줄기 세포는 일반적으로 다능성을 지니고 세포주기가 길고 개체 수명 이상으로 증식 능력을 유지시킬 수 있다. 여기에 사용된 줄기세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 배아 줄기세포 또는 조직 줄기세포도 된다.
조직 줄기세포는 피부계통, 소화계통, 골수계통, 신경계통 등과 같이 세포가 유래된 사이트의 카테고리로 분류된다. 피부계통 내의 조직 줄기세포는 상피 줄기세포, 모낭 줄기세포 등을 포함한다. 소화계통 내의 조직 줄기세포는 췌장(일반적) 줄기세포, 간 줄기세포 등을 포함한다. 골수계통 내의 조직 줄기세포는 조혈 줄기세포, 중간엽 줄기세포 등을 포함한다. 신경계통 내의 조직 줄기세포는 신경 줄기세포, 망막 줄기세포를 포함한다.
여기에 사용된 "체세포"라는 용어는 그의 DNA를 다음 세대에 전달하지 않는, 난, 정자 등과 같은 생식세포 이외의 어떠한 세포도 나타낸다. 일반적으로 체세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 자연-발생적이거나 유전적으로 변형된다.
줄기세포의 기원은 외배엽, 내배엽 또는 중배엽으로 분류된다. 신경 줄기세포를 포함한 외배엽 기원의 줄기세포는 대부분 뇌에 존재한다. 혈관 줄기세포, 조혈 줄기세포, 중간엽 줄기세포 등을 포함한 내배엽 기원의 줄기세포는 대부분 골수에 존재한다. 간 줄기세포, 췌장 줄기세포 등을 포함한 중배엽 기원의 줄기세포는 대부분 기관에 존재한다. 여기에 이용된 체세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 어떠한 배층으로부터도 유래된다.
여기에 사용된 "분리된"이라는 용어는 일반적인 환경 내의 적어도 자연적으로 수반되는 물질이 감소되고, 바람직하게는 실질적으로 차단되는 것을 나타낸다. 따라서 "분리된 세포"라는 용어는 일반적 환경 내에 어떠한 자연적으로 수반되는 물질(즉, 다른 세포, 단백질, 핵산 등)도 실질적으로 포함하지 않는 세포를 나타낸다. 핵산 또는 폴리펩타이드와 관련한 "분리된"이라는 용어는 재조합 DNA 기술에 의해 생성될 때 실질적으로 어떠한 세포 물질 또는 배양 배지도 포함하지 않거나 화학적으로 합성될 때 실질적으로 전구체 화학 물질 또는 다른 화학 물질도 포함하지 않는 핵산 또는 폴리펩타이드를 나타낸다. 바람직하게는 분리된 핵산은 생물체 내에서 자연적으로 핵산 측면에 위치한 서열을 포함하지 않는다(핵산의 5' 또는 3' 말단).
여기에 사용된 세포와 관련한 "수립된"이라는 용어는 세포의 특정한 성질(다능성)이 유지되고 세포가 배양 조건 하에서 안정한 증식을 수행하는 세포 상태를 나타낸다. 따라서 수립된 줄기세포는 다능성을 유지한다.
여기에 사용된 "분화된 세포"라는 용어는 특정화된 기능 또는 형태를 지닌 세포(즉, 근육세포, 신경세포 등)를 나타낸다. 줄기세포와 달리 분화된 세포는 다능성을 전혀 지니지 않거나 거의 없다. 분화된 세포의 예는 상피세포, 췌장 실질세포, 췌장 관세포, 간세포, 혈액세포, 심근세포, 골격근육세포, 골모세포, 골격 근육모세포, 신경세포, 혈관 내피세포, 색소세포, 평활근세포, 지방세포, 골세포, 연골세포 등을 포함한다. 여기에 이용된 세포는 이들이 유전자 복제의 오류-빈발 빈도를 조절할 수 있는 한 상기-기술된 어떠한 세포도 된다. 여기에 사용된 "분화" 또는 "세포 분화"라는 용어는 형태 및/또는 기능 상의 질적 차이를 지닌 2 이상의 형태의 세포가 단일 세포의 분열로부터 유래된 딸세포 집단에서 발생함을 나타낸다. 따라서 "분화"는 일반적으로 특이적인 감지가능 특징을 지니지 않는 세포의 집단(가계수)이 특이적 단백질의 생성과 같은 특징을 획득하는 과정을 포함한다.
여기에 사용된 세포, 생물체 등과 관련한 "상태"라는 용어는 세포, 생물체 등의 파라미터의 조건 또는 양식(즉, 세포주기, 외생적 작용제에 대한 반응, 신호 변환, 유전자 발현, 유전자 전사 등)을 나타낸다. 이러한 상태의 예는 분화된 상태, 미분화된 상태, 외생적 작용제에 대한 세포의 반응, 세포주기, 증식 상태 등을 포함하나 이에 한정적인 것은 아니다. 여기서는 특히 하기의 생물체의 환경 파라미터에 대한 목적 생물체의 반응성 또는 저항성이 생물체 상태의 척도로서 사용된다: 온도, 습도(즉, 절대습도, 상대습도), pH, 염 농도(즉, 모든 염 또는 특정 염의 농도), 영양물(즉, 탄수화물의 양 등), 금속(즉, 모든 금속 또는 특정 금속(즉, 중금속 등)의 양 또는 농도), 기체(즉, 모든 기체 또는 특정 기체의 양), 유기용매(즉, 모든 유기용매 또는 특정 유기용매(즉, 에탄올 등)의 양), 압력(즉, 국부적 또는 전체 압력 등), 대기압, 점도, 유속(즉, 생물체가 존재하는 배지의 유속), 광도(즉, 특정 파장을 지닌 광의 양), 광파장(즉, 가시광선, 자외선, 적외선 등), 전자파, 방사선, 중력, 장력, 음파, 목적 생물체 이외의 생물체(즉, 기생충, 병원성 박테리아 등), 화학제(즉, 약제 등), 항생제, 자연-발생적 물질, 정신적 스트레스, 물리적 스트레스 등.
여기에 사용된 실체와 관련한 "환경"(또는 독어로 "Umgeung")이라는 용어는 실체를 둘러싸는 환경을 나타낸다. 환경에 있어서 상태의 다양한 구성성분 및 양이 인식되고, 이는 환경 인자로 불린다. 환경 인자의 예는 상기-기술된 파라미터를 포함한다. 일반적으로 환경 인자는 비-생물학적 환경 인자와 생물학적 환경 인자로 크게 분류된다. 비-생물학적 환경 인자(무기 환경 인자)는 물리적 인자와 화학적 인자로 또는 대안으로 기후 인자와 토양 인자로 분류된다. 다양한 환경 인자는 생물체에 항상 독립적으로 작용하는 것이 아니라 서로 결합된다. 따라서 환경 인자는 하나 또는 전체로서(다양한 파라미터의 전체) 관찰된다.
여기에 사용된 "조직"이라는 용어는 다세포 생물 내의 실질적으로 동일한 기능 및/또는 형태를 지닌 세포의 집합체를 나타낸다. "조직"은 일반적으로 동일한 기원의 세포 집합체이나 세포가 동일한 기능 및/또는 형태를 지니는 한 다른 기원의 세포 집합체도 된다. 따라서 본 발명의 줄기세포가 조직을 재생시키는데 이용될 때 조직은 2 이상의 다른 기원의 세포 집합체로 구성된다. 일반적으로 조직은 기관의 일부를 구성한다. 동물 조직은 형태적, 기능적 또는 발달적 근거에 따라 상피조직, 결합조직, 근육조직, 신경조직 등으로 구분된다. 식물 조직은 조직을 구성하는 세포의 발달 단계에 따라 분열조직과 영구조직으로 크게 분류된다. 대안으로, 조직은 조직을 구성하는 세포 형태에 따라 단일조직과 복합조직으로 분류된다. 따라서 조직은 다양한 카테고리로 분류된다. 유전자 복제의 오류-빈발 빈도가 조절될 수 있는 한 어떠한 조직도 이용된다.
기관 또는 그의 일부가 본 발명에서 이용된다. 본 발명에서 주입되는 조직 또는 세포는 어떠한 기관으로부터도 유래된다. 여기에 사용된 "기관"이라는 용어는 특정 기능이 수행되는 개체 생물체의 특정 부분에 위치한 형태적으로 독립적인 구조를 나타낸다. 다세포 생물(즉, 동물, 식물)에서 기관은 특정한 방식으로 공간적으로 배열된 여러 조직으로 구성되고, 각 조직은 다수의 세포로 구성된다. 이러한 기관의 예는 혈관계통과 관련된 기관을 포함한다. 하나의 실시태양에서 본 발명에 의해 목표된 기관은 피부, 혈관, 각막, 신장, 심장, 간, 탯줄, 창자, 신경, 폐, 태반, 췌장, 뇌, 말초사지, 망막 등을 포함하나 이에 한정적인 것은 아니다. 유전자 복제의 오류-빈발 빈도가 조절될 수 있는 한 어떠한 기관 또는 그의 일부도 본 발명에 이용된다.
여기에 사용된 "생물성 물질"이라는 용어는 목적 생물체 또는 그의 일부에 의해 생성된 물질을 나타낸다. 이러한 생성물 물질의 예는 유전자 발현 생성물, 대사산물, 배설물 등을 포함하나 이에 한정적인 것은 아니다. 본 발명에 따라 유전 형질의 전환율을 조절함으로서 목적 생물체는 생성물 물질의 형태 및/또는 양을 변화시키게 된다. 본 발명은 이렇게-변화된 생성물 물질을 포함함이 이해될 것이다. 바람직하게는 생성물 물질은 대사산물이나 이에 한정적인 것은 아니다.
여기에 사용된 생물체와 관련한 "질병 모델"이라는 용어는 생물체에 특이적인 질병, 증후, 장애, 이상 등이 재현될 수 있는 생물체 모델을 나타낸다. 이러한 질병 모델은 본 발명의 방법에 의해 생성될 수 있다. 이러한 질병 모델의 예는 암 동물 모델, 심장병 동물 모델(즉, 심근경색 등), 심혈관질환 동물 모델(즉, 동맥경화 등), 중추신경질환 동물 모델(즉, 치매, 뇌경색 등) 등을 포함하나 이에 한정적인 것은 아니다.
(일반적 생화학 및 분자생물학)
(일반 기술)
여기에 이용된 분자생물학 기술, 생화학 기술, 미생물학 기술 및 세포생물학 기술은 당분야에 잘 알려져 있고 일반적으로 이용되고 예를 들어 Sambrook J. et al.(1989), Molecular Cloning: A Laboratory Manual, Cold Spring Harbor and its 3rd Ed. (2001); Ausubel, F.M.(1987), Current Protocols in Molecular Biology, Greene Pub. Associated and Wiley-Interscience; Ausubel, F.M.(1989), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associate and Wiley-Interscience; Innis, M.A.(1990), PCR Protocols: A Guide to Methods and Applications, Academic Press; Ausubel, F.M.(1992), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associates; Ausubel, F.M.(1995), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Green Pub. Associates; Innis, M.A.(1995), PCR Protocols: A Guide to Methods and Applications, Academic Press; Ausubel, F.M.(1999), Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Wiley, and annual updates; Sninsky, J.J. et al.(1999), PCR Applications: Protocols for Functional Genomics, Academic Press; Special issue, Jikken Igaku [Experimental Medicine] "Idenshi Donyu & Hatsugen Kaiseki Jikkenho [Experimental Methods for gene Introduction & Expression Analysis]", Yodo-sha, 1997 등에 기술되어 있다. 이들 간행물 각각의 일부(또는 가능하게는 전체)가 참고문헌으로 포함된다.
인공적으로 합성된 유전자를 제조하는 기술 및 핵산 화학은 예를 들어 참고문헌에 포함된 Gait, M.J.(1985), Oligonucleotide Synthesis: A Practical Approach, IRL Press; Gait, M.J.(1990), Oligonucleotide Synthesis: A Practical Approach, IRL Press; Eckstein, F.(1991), Oligonucleotides and Analogues: A Practical Approc, IRL Press; Adams, R.L. et al.(1992), The Biochemistry of the Nucleic Acids, Chapman & Hall; Shabarova, Z. et al.(1994), Adavanced Organic Chemistry of Nucleic Acids, Weinheim; Blackburn, G.M. et al.(1996), Nucleic Acids in Chemistry and Biology, Oxford University Press; Hermanson, G.T.(1996), Bioconjugate Techniques, Academic Press; 등에 기술되어 있다.
여기에 사용된 "단백질", "폴리펩타이드", "올리고펩타이드" 및 "펩타이드"는 동일한 의미를 지니고 어떠한 길이를 지닌 아미노산 폴리머를 나타낸다. 이러한 폴리머는 직선형, 분지형 또는 원형 체인이다. 아미노산은 자연-발생적 또는 비자연-발생적 아미노산 또는 그의 변이체이다. 본 용어는 다수의 폴리펩타이드 체인의 복합체로 집합되는 것을 포함한다. 또한 본 용어는 자연-발생적 또는 인공적으로 변형된 아미노산 폴리머를 포함한다. 이러한 변형은 예를 들어 이황화 결합 형성, 당화, 지질화, 아세틸화, 인산화 또는 다른 조작 또는 변형(즉, 표지 모이어티(moiety)와의 컨쥬게이션)을 포함한다. 이러한 정의는 적어도 하나 이상의 아미노산 유사체(즉, 자연-발생적 아미노산 등)를 포함한 폴리펩타이드, 펩타이드-유사 화합물(즉, 펩토이드) 및 당분야에 알려진 다른 변이체를 포함한다. 본 발명의 유전자 생성물은 일반적으로 폴리펩타이드 형태이다. 폴리펩타이드의 형성시 본 발명의 생성물 물질은 약제적 조성물로서 유용하다.
여기에 사용된 "폴리뉴클레오타이드", "올리고뉴클레오타이드" 및 "핵산"은 동일한 의미를 지니고 어떠한 길이를 지닌 뉴클레오타이드 폴리머를 나타낸다. 또한 이러한 용어는 "올리고뉴클레오타이드 변이체" 또는 "폴리뉴클레오타이드 변이체"를 포함한다. "올리고뉴클레오타이드 변이체" 또는 "폴리뉴클레오타이드 변이체"는 뉴클레오타이드 변이체를 포함하거나 일반적 결합과 다른 뉴클레오타이드 사이의 결합을 지닌 올리고뉴클레오타이드 또는 폴리뉴클레오타이드를 나타내고, 이는 상호교환가능하게 사용된다. 특히 이러한 올리고뉴클레오타이드의 예는 2'-O-메틸-리보뉴클레오타이드, 올리고뉴클레오타이드 내의 포스포디에스테르 결합이 포스포로티오에이트 결합으로 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 포스포디에스테르 결합이 N3'-P5' 포스포로마이데이트 결합으로 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 리보스 및 포스포디에스테르 결합이 펩타이드-핵산 결합이 전환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 우라실이 C-5 프로피닐 우라실로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 우라실이 C-5 티아졸 우라실로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 시토신이 C-5 프로피닐 시토신으로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 시토신이 C-5 페녹사진-변형된 시토신으로 치환된 올리고뉴클레오타이드 유도체, 올리고뉴클레오타이드 내 리보스가 2'-O-프로필 리보스로 치환된 올리고뉴클레오타이드 유도체 및 올리고뉴클레오타이드 내 리보스가 2-메톡시에톡시 리보스로 치환된 올리고뉴클레오타이드 유도체를 포함한다. 나타내지 않는 한 특정한 핵산 서열도 명백하게 나타난 서열뿐만 아니라 그의 보존적으로-변형된 변이체(즉, 퇴화성 코돈 치환) 및 상보적 서열을 포함한다. 특히, 퇴화성 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합된-염기 및/또는 디옥시이노신 잔기로 치환된 서열을 생성함으로서 생성된다(Batzer et al., Nucleic Acid Res. 19:5081(1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608(1985); Rossolini et al., Mol. Cell. Probes 8:91-98(1994)). 본 발명의 유전자는 일반적으로 폴리뉴클레오타이드 형태이다. 본 발명의 폴리뉴클레오타이드 형태의 유전자 또는 유전자 생성물은 본 발명의 방법에 유용하다.
여기에 사용된 "핵산 분자"라는 용어는 cDNA, mRNA, 게놈 DNA 등을 포함하여 "핵산", "올리고뉴클레오타이드" 및 "폴리뉴클레오타이드"라는 용어와 상호교환가능하게 사용된다. 여기에 사용된 핵산 및 핵산 분자는 "유전자"라는 용어의 개념에 의해 포함된다. 제공된 유전자의 서열을 인코드하는 핵산 분자는 "스플라이스 돌연변이체(변이체)"를 포함한다. 유사하게는, 핵산 분자에 의해 인코드된 특정 단백질은 핵산의 스플라이스 변이체에 의해 인코드된 단백질을 포함한다. 명칭이 나타내듯 "스플라이스 돌연변이체"는 유전자의 대안적 스플라이싱의 생성물이다. 전사 후 개시 핵산 전사가 스플라이스되어 다른(대안적) 핵산 스플라이스 생성물이 다른 폴리펩타이드를 인코드하게 된다. 스플라이스 변이체의 생성 메카니즘은 변화되나 대안적 엑손의 스플라이싱을 포함한다. 또한 통독(read-through) 전사에 의해 동일한 핵산으로부터 유래된 대안적 폴리펩타이드도 이러한 정의에 의해 포함된다. 스플라이스 생성물의 재조합 형태를 포함하여 스플라이싱 반응의 어떠한 생성물도 이러한 정의에 포함된다. 따라서 여기서 본 발명의 유전자는 스플라이스 돌연변이체를 포함한다.
여기에 사용된 유전자(즉, 핵산 서열, 아미노산 서열 등)의 "상동성"은 2 이상의 유전자 서열 사이의 동일성 비율을 나타낸다. 여기에 사용된 서열(핵산 서열, 아미노산 서열 등)의 동일성은 2 이상의 비교가능한 서열 사이의 동일한 서열(개별적 핵산, 아미노산 등)의 비율을 나타낸다. 따라서 2개의 제공된 서열 사이의 상동성이 클수록 그들 서열 사이의 동일성 또는 유사성이 크다. 2개의 유전자가 상동성을 지니는지 여부는 그들 서열을 직접 비교하거나 스트린전트 조건 하에서의 하이브리다이즈 방법에 의해 측정된다. 2개 유전자 서열이 서로 직접 비교될 때 이들 유전자는 대표적으로 서로 적어도 50% 이상, 바람직하게는 적어도 70% 이상, 더욱 바람직하게는 적어도 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 동일성을 지닌다. 여기에 사용된 유전자(즉, 핵산 서열, 아미노산 서열 등)의 "유사성"은 보존적 치환이 상기-기술된 상동성에서 양성(동일성)으로 고려될 때 2 이상의 서열 사이의 동일성 비율을 나타낸다. 따라서 상동성 및 유사성은 보존적 치환의 존재시 서로 다르다. 보존적 치환이 존재하지 않는 경우 상동성 및 유사성은 동일한 수치를 지닌다.
여기서 아미노산 서열 및 염기 서열의 유사성, 동일성 및 상동성은 디폴트 파라미터로 PSI-BLAST(서열 분석 기구)를 이용하여 비교된다. 그렇지 않은 경우 FASTA(디폴트 파리미터를 이용한)가 PSI-BLAST 대신 이용된다.
여기에 사용된 "아미노산"이라는 용어는 본 발명의 목적을 만족시키는 한 자연-발생적 또는 비자연-발생적 아미노산을 나타낸다. "아미노산 유도체" 또는 "아미노산 유사체"라는 용어는 자연-발생적 아미노산과 다르고 본래 아미노산과 유사한 기능을 지닌 아미노산을 나타낸다. 이러한 아미노산 유도체 및 아미노산 유사체는 당분야에 잘 알려져 있다.
"자연-발생적 아미노산"이라는 용어는 자연-발생적 아미노산의 L-이성질체를 나타낸다. 자연-발생적 아미노산은 글리신, 알라닌, 발린, 류신, 이소류신, 세린, 메티오닌, 트레오닌, 페닐알라닌, 티로신, 트립토판, 시스테인, 프롤린, 히스티딘, 아스파르트산, 아스파라긴, 글루탐산, 글루타민, γ-카르복시글루탐산, 아르기닌, 오르니틴 및 라이신이다. 나타내지 않는 한 D-아미노산을 이용한 실시태양이 본 발명의 범위 내에 있더라도 여기에 이용된 모든 아미노산은 L-이성질체이다. "비자연-발생적 아미노산"이라는 용어는 자연 내에서 일반적으로 발견되지 않는 아미노산을 나타낸다. 비자연-발생적 아미노산의 예는 노르류신, 파라-니트로페닐알라닌, 호모페닐알라닌, 파라-플루오로페닐알라닌, 3-아미노-2-벤질프로피온산, D- 또는 L-호모아르기닌 및 D-페닐알리닌을 포함한다. "아미노산 유사체"라는 용어는 아미노산과 유사한 물리적 성질 및/또는 기능을 지닌 분자를 나타내나 아미노산을 아니다. 아미노산 유사체의 예는 예를 들어 에티오닌, 카나바닌, 2-메틸글루타민 등을 포함한다. 아미노산 모방체는 아미노산의 일반적인 화학 구조와 다른 구조를 지니나 자연-발생적 아미노산과 유사한 방식으로 기능하는 화합물을 나타낸다.
여기에 사용된 "뉴클레오타이드"라는 용어는 자연-발생적 또는 비자연-발생적이다. "뉴클레오타이드 유도체" 또는 "뉴클레오타이드 유사체"라는 용어는 자연-발생적 뉴클레오타이드와 다르고 본래 뉴클레오타이드와 유사한 기능을 지닌 뉴클레오타이드를 나타낸다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 당분야에 잘 알려져 있다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 포스포로티오에이트, 포스포라미데이트, 메틸포스포네이트, 키랄-메틸포스포네이트, 2-O-메틸 리보뉴클레오타이드 및 펩타이드-핵산(PNA)를 포함하나 이에 한정적인 것은 아니다.
여기서 아미노산은 IUPAC-IUB Biochemical Nomenclature Commission에 의해 추척된 일반적으로 알려진 3문자 또는 1문자 기호로 표기된다. 유사하게는 뉴클레오타이드는 일반적으로 수용된 단일-문자 코드로 표기된다.
여기에 사용된 "상응하는" 아미노산 또는 핵산이라는 용어는 비교를 위한 참고로서 폴리펩타이드 또는 폴리뉴클레오타이드 내의 미리측정된 아미노산 또는 뉴클레오타이드와 유사한 기능을 지니거나 지닐 것으로 예상되는 제공된 폴리펩타이드 또는 폴리뉴클레오타이드 분자 내 아미노산 또는 뉴클레오타이드를 나타낸다. 특히, 효소 분자의 경우 본 용어는 활성 사이트(즉, DNA 중합효소의 프루프리딩 기능을 제공하는 범위) 내의 유사한 위치에 존재하고 촉매 활성에 유사하게 기여하는 아미노산을 나타낸다. 예를 들어 안티센스 분자의 경우 본 용어는 안티센스 분자의 특정 부분에 상응하는 오르쏠로그(ortholog) 내의 유사한 부분을 나타낸다. 상응하는 아미노산 및 핵산은 당분야에 알려진 정렬 기술을 이용하여 확인될 수 있다. 이러한 정렬 기술은 예를 들어 Needleman, S.B. and Wunsch, C.D., J. Mol. Biol. 48, 443-453, 1970에 기술되어 있다.
여기에 사용된 "상응하는" 유전자(즉, 폴리펩타이드 또는 폴리뉴클레오타이드 분자)라는 용어는 비교를 위한 참조로서 종 내의 미리 측정된 유전자와 동일한 기능을 지니거나 지닐 것으로 예상되는 제공된 종 내의 유전자(즉, 폴리펩타이드 또는 폴리뉴클레오타이드 분자)를 나타낸다. 이러한 기능을 지닌 유전자가 다수 존재하는 경우 본 용어는 동일한 진화 기원을 지닌 유전자를 나타낸다. 따라서 제공된 유전자에 상응하는 유전자는 제공된 유전자의 오르쏠로그가 된다. 따라서 마우스 DNA 중합효소 유전자에 상응하는 유전자는 다른 동물(인간, 래트, 돼지, 소 등)에서 발견될 수 있다. 이러한 상응하는 유전자는 당분야에 잘 알려진 기술에 의해 확인될 수 있다. 따라서 예를 들어 제공된 동물 내의 상응하는 유전자는 의문 서열로서 참조 유전자(즉, 마우스 DNA 중합효소 등)의 서열을 이용하여 동물(즉, 인간, 래트)의 서열 데이터베이스를 검색함으로서 발견될 수 있다.
여기에 사용된 "뉴클레오타이드"라는 용어는 자연-발생적 또는 비자연-발생적이다. "뉴클레오타이드 유도체" 또는 "뉴클레오타이드 유사체"라는 용어는 자연-발생적 뉴클레오타이드와 다르고 본래 뉴클레오타이드와 유사한 기능을 지닌 뉴클레오타이드를 나타낸다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체는 당분야에 잘 알려져 있다. 이러한 뉴클레오타이드 유도체 및 뉴클레오타이드 유사체의 예는 포스포로티오에이트, 포스포라미데이트, 메틸포스포네이트, 키랄-메틸포스포네이트, 2-O-메틸 리보뉴클레오타이드 및 펩타이드-핵산(PNA)를 포함하나 이에 한정적인 것은 아니다.
여기에 사용된 "단편"이라는 용어는 참조 폴리펩타이드 또는 폴리뉴클레오타이드의 전체 길이(길이 n의)에 대해 1 내지 n-1의 범위의 서열 길이를 지닌 폴리펩타이드 또는 폴리뉴클레오타이드를 나타낸다. 단편의 길이는 목적에 따라 적당히 변할 수 있다. 예를 들어 폴리펩타이드의 경우 단편 길이의 하한선은 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 이상의 뉴클레오타이드를 포함한다. 여기에 명기되지 않은 정수에 의해 표현된 길이(즉, 11 등)도 하한선에 적당하다. 예를 들어 폴리뉴클레오타이드의 경우 단편 길이의 하한선은 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100 이상의 뉴클레오타이드를 포함한다. 여기에 명기되지 않은 정수에 의해 표현된 길이(즉, 11 등)도 하한선에 적당하다. 여기에 사용된 폴리펩타이드 또는 폴리뉴클레오타이드의 길이는 각각 아미노산 또는 핵산의 수에 의해 표현될 수 있다. 그러나 상기-기술된 숫자는 절대적인 것은 아니다. 동일한 기능이 유지되는 한 상한선 또는 하한선으로서 상기-기술된 숫자는 더 크거나 더 작은 숫자(즉, ±10%)를 포함한다. 이러한 목적으로 "약"이 숫자 앞에 놓인다. 그러나 숫자의 해석은 본 명세서 내의 "약"의 존재 또는 부재에 영향을 받지 않음이 이해되어야 한다. 유용한 단편의 길이는 적어도 하나 이상의 기능(즉, 다른 분자와의 특이적 상호작용 등)이 단편의 참조인 전체-길이 단백질의 기능 간에 유지되는지 여부에 따라 결정된다.
여기에 사용된 폴리뉴클레오타이드, 폴리펩타이드와 같은 생물학적 작용제와 "특이적으로 상호작용할 수 있는 작용제"라는 용어는 폴리뉴클레오타이드, 폴리펩타이드와 같은 생물학적 작용제에 대한 친화력을 지니고, 폴리뉴클레오타이드, 폴리펩타이드와 같은 다른 관련되지 않은 생물학적 작용제(특히 30% 이하의 동일성을 지닌)보다 상대적으로 더 높거나 동일하고, 바람직하게는 유의적으로(즉, 실질적으로 유의적으로) 더 높은 작용제를 나타낸다. 이러한 친화력은 예를 들어 하이브리다이즈 에세이, 결합 에세이 등으로 측정될 수 있다. 의도된 목적이 달성되는 한 여기에 사용된 "작용제"는 어떠한 물질 또는 다른 작용제(즉, 광, 방사선, 열, 전기 등과 같은 에너지)도 된다. 이러한 물질의 예는 단백질, 폴리펩타이드, 올리고펩타이드, 펩타이드, 폴리뉴클레오타이드, 올리고뉴클레오타이드, 뉴클레오타이드, 핵산(즉, cDNA, 게놈 DNA와 같은 DNA 및 mRNA와 같은 RNA), 폴리사카라이드, 올리고사카라이드, 지질, 저분자량 유기 분자(즉, 호르몬, 리간드, 정보 전달 물질, 결합 화학에 의해 합성된 분자, 저분자량 분자(즉, 약제적으로 수용가능한 저분자량 리간드 등)) 및 이들 분자의 결합을 포함하나 이에 한정적인 것은 아니다. 폴리뉴클레오타이드에 특이적인 작용제의 예는 미리 측정된 서열 상동성(즉, 70% 이상 서열 동일성)을 지닌 폴리뉴클레오타이드 서열에 대한 상보성을 지닌 폴리뉴클레오타이드, 프로모터 구역에 결합하는 전사 작용제와 같은 폴리펩타이드를 대표적으로 포함하나 이에 한정적인 것은 아니다. 폴리펩타이드에 특이적인 작용제의 예는 폴리펩타이드 또는 그의 유도체 또는 유사체에 특이적으로 지시된 항체(즉, 단일 체인 항체), 폴리펩타이드가 수용체 또는 리간드인 경우 특이적 리간드 또는 수용체, 폴리펩타이드가 효소인 경우 물질 등을 대표적으로 포함하나 이에 한정적인 것은 아니다. 이들 작용제는 여기서 생물체의 오류-빈발 빈도의 조절에 유용하다.
여기에 사용된 "저분자량 유기 분자"라는 용어는 상대적으로 작은 분자량을지닌 유기 분자를 나타낸다. 일반적으로 저분자량 유기 분자는 약 1,000 이하의 분자량을 나타내거나 1,000 이상의 분자량을 나타내기도 한다. 저분자량 유기 분자는 당분야에 알려진 방법 또는 그의 결합에 의해 일반적으로 합성될 수 있다. 이들 저분자량 유기 분자는 생물체에 의해 생성된다. 저분자량 유기 분자의 예는 호르몬, 리간드, 정보 전달 물질, 결합 화학에 의해 합성된 분자, 약제적으로 수용가능한 저분자량 분자(즉, 저분자량 리간드 등) 등을 포함하나 이에 한정적인 것은 아니다. 이들 작용제는 생물체의 오류-빈발 빈도의 조절에 유용하다.
여기에 사용된 "항체"라는 용어는 폴리클론 항체, 단일클론 항체, 인간 항체, 인간화 항체, 다기능성 항체, 키메라 항체 및 항-유전자형 항체 및 그의 단편(즉, F(ab')2 및 Fab 단편) 및 다른 재조합 컨쥬게이트를 포함한다. 이들 항체는 공유결합 또는 재조합을 통해 효소(즉, 알칼리성 포스파타제, 양고추냉이 퍼옥시다제, α-갈락토시다제 등)와 융합된다.
여기에 사용된 "항원"이라는 용어는 항체 분자가 특이적으로 결합하는 어떠한 물질도 나타낸다. 여기에 사용된 "면역원"이라는 용어는 림프구의 항원-특이적 면역 반응의 활성화를 개시시킬 수 있는 항원을 나타낸다.
여기에 사용된 "단일 체인 항체"라는 용어는 펩타이드 교차결합제를 통해 Fv 구역의 헤비 체인 단편과 라이트 체인 단편을 결합시킴으로서 형성된 단일 체인 폴리펩타이드를 나타낸다.
여기에 사용된 "복합 분자"라는 용어는 폴리펩타이드, 폴리뉴클레오타이드, 지질, 당, 저분자량 분자 등과 같은 다수의 분자가 서로 결합된 분자를 나타낸다. 이러한 복합 분자의 예는 당지질, 글리코펩타이드 등을 포함하나 이에 한정적인 것은 아니다. 분자가 유전자 또는 그의 생성물(즉, DNA 중합효소 등) 또는 본 발명의 작용제와 동일한 기능을 실질적으로 지니는 한 이들 분자는 유전자 및 그의 생성물(즉, DNA 중합효소 등) 또는 본 발명의 작용제로서 여기서 이용될 수 있다.
여기에 사용된 "분리된" 생물학적 작용제(즉, 핵산, 단백질 등)라는 용어는 자연-발생적 생물체의 세포 내 다른 생물학적 작용제로부터 실질적으로 분리되거나 정제된 생물학적 작용제를 나타낸다(즉, 핵산의 경우 핵산 및 의도된 핵산 분자 이외의 핵산 서열을 지닌 핵산 이외의 작용제; 단백질의 경우 단백질 및 의도된 단백질 이외의 아미노산 서열을 지닌 단백질 이외의 작용제). "분리된" 핵산 및 단백질은 표준 정제법에 의해 정제된 핵산 및 단백질을 포함한다. 또한 분리된 핵산 및 단백질은 화학적으로 합성된 핵산 및 단백질을 포함한다.
여기에 사용된 "정제된" 생물학적 작용제(즉, 핵산, 단백질 등)라는 용어는 자연적으로 수반된 작용제의 적어도 일부가 제거된 것을 나타낸다. 따라서 일반적으로 다수의 정제된 생물학적 작용제는 정상 상태 내의 생물학적 작용제보다 더 높다(즉, 농축된).
여기에 사용된 "정제된" 및 "분리된"이라는 용어는 동일한 형태의 생물학적 작용제가 바람직하게는 적어도 75 중량% 이상, 더욱 바람직하게는 85 중량% 이상, 더욱 더 바람직하게는 적어도 95 중량% 이상, 가장 바람직하게는 적어도 98 중량% 이상으로 존재함을 의미한다.
여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등과 같은 유전자 생성물의 "발현"이라는 용어는 유전자 등이 생체 내에서 미리 결정된 작용에 의해 영향을 받아 또다른 형태로 변화됨을 나타낸다. 바람직하게는 "발현"이라는 용어는 유전자, 폴리뉴클레오타이드 등이 전사되고 폴리펩타이드로 번역됨을 나타낸다. 본 발명의 하나의 실시태양에서 유전자는 mRNA로 전사된다. 더욱 바람직하게는 이들 폴리펩타이드는 후-번역 처리 변형을 지닌다.
여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등의 "발현 감소"라는 용어는 작용제의 작용이 부재할 때와 비교시 발현 수준이 본 발명의 작용제의 작용이 존재시 유의적으로 감소됨을 나타낸다. 바람직하게는, 발현 감소는 폴리펩타이드(즉, DNA 중합효소 등)의 발현량의 감소를 포함한다. 여기에 사용된 유전자, 폴리뉴클레오타이드, 폴리펩타이드 등의 "발현 증가"라는 용어는 작용제의 작용이 부재할 때와 비교시 발현 수준이 본 발명의 작용제의 작용이 존재시 유의적으로 증가됨을 나타낸다. 바람직하게는, 발현 증가는 폴리펩타이드(즉, DNA 중합효소 등)의 발현량의 증가를 포함한다. 여기에 사용된 유전자의 "발현 유도"라는 용어는 제공된 세포에 제공된 작용제를 적용함으로서 유전자의 발현량이 증가됨을 나타낸다. 따라서 발현 유도는 유전자 발현이 관찰되지 않을 때 유전자가 발현되게 하고, 유전자가 관찰될 때 유전자의 발현량을 증가시키는 것을 포함한다. 이들 유전자 또는 유전자 생성물(폴리펩타이드 또는 폴리뉴클레오타이드)의 증가 또는 감소는 본 발명에서 복제시 오류-빈발 빈도를 조절하는데 유용하다.
유전자의 경우 여기에 사용된 "특이적으로 발현된"이라는 용어는 유전자가 다른 사이트 또는 기간과 다른 수준에서(바람직하게는 더 높은) 특이적 사이트에서 또는 특이적 기간 동안 발현됨을 나타낸다. "특이적으로 발현된"이라는 용어는 유전자가 제공된 사이트에서만(특이적 사이트) 발현되거나 다른 사이트에서 발현되는 것을 나타낸다. 바람직하게는 "특이적으로 발현된"이라는 용어는 유전자가 제공된 사이트에서만 발현되는 것을 나타낸다. 따라서 본 발명의 실시태양에 따라 DNA 중합효소는 원하는 부분에서 특이적으로 또는 국부적으로 발현된다.
여기에 사용된 "생물학적 활성"이라는 용어는 다양한 기능(즉, 전사 증신 활성)을 나타내는 활성을 포함한 생물체 내의 작용제(즉, 폴리뉴클레오타이드, 단백질 등)에 의해 보유된 활성을 나타낸다. 예를 들어 2개의 작용제가 서로 상호작용할 때(즉, DNA 중합효소가 그의 특이적 서열에 결합시) 생물학적 활성은 DNA 중합효소와 특이적 서열 사이의 결합을 포함하고, 생물학적 변화가 결합에 의해 유발된다(즉, 특이적 뉴클레오타이드 중합반응; 복제 오류의 발생; 뉴클레오타이드 제거 능력; 미스매치된 염기쌍의 인식 등). 예를 들어 제공된 작용제가 효소인 경우 그의 생물학적 활성은 그의 효소 활성을 포함한다. 또다른 예로서 제공된 작용제가 리간드인 경우 그의 생물학적 활성은 작용제의 리간드에 대한 수용체로의 결합을 포함한다. 이러한 생물학적 활성은 당분야에 잘 알려진 기술로 측정될 수 있다.
여기에 사용된 "안티센스 (활성)"이라는 용어는 타겟 유전자 발현의 특이적 억제 또는 감소를 가능하게 하는 활성을 나타낸다. 안티센스 활성은 일반적으로 타겟 유전자(즉, DNA 중합효소 등)의 핵산 서열에 상보적인 적어도 8 이상의 인접 뉴클레오타이드의 길이를 지닌 핵산 서열에 의해 달성된다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드의 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드의 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드의 길이, 적어도 12 이상의 인접 뉴클레오타이드의 길이, 적어도 13 이상의 인접 뉴클레오타이드의 길이, 적어도 14 이상의 인접 뉴클레오타이드의 길이, 적어도 15 이상의 인접 뉴클레오타이드의 길이, 적어도 20 이상의 인접 뉴클레오타이드의 길이, 적어도 30 이상의 인접 뉴클레오타이드의 길이, 적어도 40 이상의 인접 뉴클레오타이드의 길이, 적어도 50 이상의 인접 뉴클레오타이드의 길이를 지닌다. 이들 핵산 서열은 그에 적어도 70% 이상의 상동성, 더욱 바람직하게는 적어도 80% 이상의 상동성, 더욱 더 바람직하게는 적어도 90% 이상의 상동성, 더욱 더 바람직하게는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다. 안티센스 활성은 바람직하게는 타겟 유전자의 핵산 서열의 5' 말단 서열에 상보적이다. 이러한 안티센스 핵산 서열은 하나 이상 또는 적어도 하나 이상의 뉴클레오타이드 치환, 첨가 및/또는 삭제를 지닌 상기-기술된 서열을 포함한다. 이러한 안티센스 활성을 지닌 분자는 생물체 내의 오류-빈발 빈도의 조절에 대해 여기서 유용하게 이용된다.
여기서 사용된 "RNAi"라는 용어는 RNA 간섭(interference)의 약자이고 이중-스트랜드 RNA(dsRNA로도 불림)와 같은 RNAi 유발하는 작용제가 세포 내로 도입되어 이에 상동적인 mRNA가 특이적으로 분해되어 유전자 생성물의 합성이 억제되는 현상 및 이러한 현상을 이용하는 기술을 나타낸다. 여기에 사용된 RNAi는 RNAi를 유발하는 작용제와 동일한 의미를 지닌다.
여기에 사용된 "RNAi 유발 작용제"라는 용어는 RNAi를 유발할 수 있는 어떠한 작용제도 나타낸다. 여기에 사용된 "유전자에 대한 RNAi 유발 작용제"는 작용제가 유전자와 관련하여 RNAi를 유발하고 RNAi의 효과가 달성됨을 나타낸다(즉, 유전자 발현의 억제 등). 이러한 RNAi 유발 작용제의 예는 타겟 유전자의 핵산 서열에 적어도 약 70% 이상의 상동성을 지닌 서열 또는 스트린전트 조건 하에서 하이브리다이즈 가능한 서열, 적어도 10 이상의 뉴클레오타이드 길이를 지닌 이중-스트랜드 부분을 포함한 RNA 또는 그의 변이체를 포함하나 이에 한정적인 것은 아니다. 여기서 이러한 작용제는 바람직하게는 3' 돌출 말단을 포함한 DNA이고, 더욱 바람직하게는 3' 돌출 말단은 2 이상의 뉴클레오타이드(즉, 2-4 뉴클레오타이드 길이)를 지닌다. RNAi는 여기서 생물체의 오류-빈발 빈도의 조절에 대해 유용하게 이용된다.
여기에 사용된 "스트린전트 조건 하에서 하이브리다이즈하는 폴리뉴클레오타이드"는 일반적으로 사용되고 당분야에 잘 알려진 조건을 나타낸다. 이러한 폴리뉴클레오타이드는 본 발명의 폴리펩타이드로부터 선택된 폴리뉴클레오타이드를 이용하여 콜로니 하이브리디제이션, 플라크 하이브리디제이션, 서던 블럿 하이브리디제이션 등을 수행함으로서 수득될 수 있다. 특히, 콜로니 또는 플라크로부터 유래된 DNA가 고정된 필터가 0.7∼1.0 M NaCl의 존재시 65℃에서 하이브리디제이션을 수행하는데 이용된다. 이후, 0.1∼2배 농도 SSC(식염수-구연산나트륨) 용액(1-배 농도 SSC 옹액은 150 mM 염화나트륨 및 15 mM 구연산 나트륨으로 구성됨)이 65℃에서 필터를 세척하는데 사용된다. 이러한 방법으로 확인된 폴리뉴클레오타이드는 "스트린전트 조건 하에서 하이브리다이즈하는 폴리뉴클레오타이드"로서 표기된다. 하이브리디제이션은 예를 들어 Molecular Cloning 2nd ed., Current Protocols in Molecular Biology, Supplement 1-38, DNA Cloning 1: Core Techniques, A Practical Approach, Second Edition, Oxford University Press (1995) 등에 기술된 방법에 따라 수행될 수 있다. 여기서 바람직하게는 스트린전트 조건 하에서 하이브리다이즈하는 서열은 A(아데닌) 또는 T(티민)만을 포함한 서열은 제외된다. "하이브리다이즈 가능한 폴리뉴클레오타이드"는 상기-기술된 하이브리디제이션 조건 하에서 다른 폴리뉴클레오타이드와 하이브리다이즈할 수 있는 폴리뉴클레오타이드를 나타낸다. 특히, 하이브리다이즈 가능한 폴리뉴클레오타이드는 여기에 상세하게 기술된 아미노산 서열을 지닌 폴리펩타이드를 인코드하는 DNA의 염기 서열에 적어도 60% 이상의 상동성을 지닌 폴리뉴클레오타이드, 바람직하게는 적어도 80% 이상의 상동성을 지닌 폴리뉴클레오타이드, 더욱 바람직하게는 적어도 95% 이상의 상동성을 지닌 폴리뉴클레오타이드를 포함한다.
"높은 스트린전트 조건"이라는 용어는 서열이 매우 상보적인 DNA 스트랜드의 하이브리디제이션을 가능하게 하고 유의적으로 미스매치된 DNA의 하이브리디제이션을 제외하도록 고안된 조건을 나타낸다. 하이브리디제이션 스트린전시는 주로 온도, 이온 강도 및 포름아마이드와 같은 변성제의 농도에 의해 결정된다. 하이브리디제이션 및 세척에 대한 "높은 스트린전트 조건"의 예는 65∼68℃에서의 0.0015 M 염화나트륨, 0.0015 M 구연산나트륨 또는 42℃에서의 0.015 M 염화나트륨, 0.0015 M 구연산나트륨 및 50% 포름아마이드이다. Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual (2nd ed., Cold Spring Harbor Laboratory, N.Y., 1989); Anderson et al., Nucleic Acid Hyrbridization: A Practicla Approach Ch. 4 (IRL Press Limited)(Oxford Express) 참조. 더 큰 스트린전트 조건(더 높은 온도, 더 낮은 이온 강도, 더 높은 포름아마이드 또는 다른 변성제와 같은)도 일반적으로 이용된다. 다른 작용제는 비-특이적 및/또는 백그라운드 하이브리디제이션의 감소 목적으로 하이브리다이즈 및 세척 완충액 내에 포함된다. 다른 적당한 작용제도 사용될 수 있으나 예는 0.1% 소 혈청 알부민, 0.1% 폴리비닐프롤리돈, 0.1% 피로인산나트륨, 0.1% 도데실황산나트륨(NaDodSO4 또는 SDS), Ficoll, Denhardt's 용액, 초음파 분해된 연어 정자 DNA(또는 또다른 비-상보적 DNA) 및 황산덱스트란이다. 이들 첨가제의 농도 및 형태는 하이브리디제이션 조건의 스트린전시에 실질적으로 영향을 미치지 않고 변호될 수 있다. 하이브리디제이션 실험은 일반적으로 pH 6.8∼7.4에서 수행된다; 그러나 일반적인 이온 강도 조건에서 하이브리디제이션 속도는 거의 pH에 독립적이다. Anderson et al., Nucleic Acid Hyrbridization: A Practicla Approach Ch. 4 (IRL Press Limited)(Oxford UK) 참조.
DNA 두가닥의 안정성에 영향을 미치는 작용제는 염기 조성, 길이 및 염기쌍 미스매치의 정도를 포함한다. 하이브리디제이션 조건은 이들 변이를 조정하기 위해 당업자에 의해 조정될 수 있고 DNA의 다른 서열 관련성이 하이브리드를 가능하게 한다. 완벽하게 매치된 DNA 두가닥의 융해온도는 하기 공식에 의해 추정된다:
Tm (℃) = 81.5 + 16.6 (log[Na+] + 0.41 (% G+C) - 600/N - 0.71 (% 포름아마이드)
상기 N은 형성된 두가닥의 길이이고, [Na+]은 하이브리디제이션 또는 세척 용액 내의 나트륨 이온의 몰 농도이고, % G+C는 하이브리드 내의 염기(구아닌+시토신)의 백분율이다. 불완전하게 매치된 하이브리드의 경우 융해온도는 1% 미스매치 각각에 대해 약 1℃까지 감소된다.
"중간의 스트린전트 조건"이라는 용어는 "높은 스트린전트 조건"하에서 발생할 수 있는 것 보다 더 큰 정도의 염기쌍 미스매치를 지닌 DNA 두가닥이 형성될 수 있는 조건을 나타낸다. 일반적인 "중간의 스트린전트 조건"의 예는 50∼65℃에서의 0.015 M 염화나트륨, 0.0115 M 구연산나트륨 또는 37∼50℃에서의 0.015 M 염화나트륨, 0.0015 M 구연산 나트륨 및 20% 포름아마이드이다. 예로서 0.015 M 나트륨 이온 내의 50℃의 "중간의 스트린전트 조건"은 약 21%의 미스매치를 가능하게 할 것이다.
"높은 스트린전트 조건"과 "중간의 스트린전트 조건"사이에 절대적인 구분은 없음이 당업자에 의해 인식될 것이다. 예를 들어 0.015 M 나트륨 이온(포름아마이드 없음)에서 완벽하게 매치된 긴 DNA의 융해온도는 약 71℃이다. 65℃에서 세척시 이는 약 6^ 미스매치가 된다. 더욱 뚜렷하게 관련된 서열을 포획하기 위해 당업자는 온도 또는 이온 강도를 단순히 저하시킬 수 있다.
1 M NaCl 내의 융해온도의 알맞은 계산은 하기에 의해 제공된다:
Tm = (A-T 염기쌍 당 2℃) + (G-C 염기쌍 당 4℃)
6X 구연산나트륨 염(SSC) 내의 나트륨 이온 농도가 1 M임을 주지해야 한다. Suggs et al., Developmental Biology Using Pruified Genes 683(Brown and Fox, eds., 1981).
DNA 중합효소 단백질을 인코드하는 자연-발생적 핵산은 PCR 프라이머 및 예를 들어 서열번호 1, 3, 41, 43, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65에 나타난 핵산 서열의 일부를 포함한 하이브리디제이션 프로브를 지닌 cDNA 라이브러리로부터 용이하게 분리된다. DNA 중합효소를 인코드하는 바람직한 핵산 또는 그의 변이체 또는 단편은 42℃에서 1% 소 혈청 알부민(BSA); 500 mM 인산나트륨(NaPO4); 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 50℃에서 2xSSC(600 mM NaCl; 60 mM 구연산나트륨); 및 0.1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서, 더욱 바람직하게는 50℃에서 1% 소 혈청 알부민(BSA); 500 mM 인산나트륨(NaPO4); 15% 포름아마이드; 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 50℃에서 1xSSC(300 mM NaCl; 30 mM 구연산나트륨); 및 1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서, 가장 바람직하게는 50℃에서 1% 소 혈청 알부민(BSA); 200 mM 인산나트륨(NaPO4); 15% 포름아마이드; 1 mM EDTA; 및 7% SDS를 필수적으로 포함한 하이브리디제이션 완충액 및 65℃에서 0.5xSSC(150 mM NaCl; 15 mM 구연산나트륨); 및 0.1% SDS를 필수적으로 포함한 세척 완충액에 의해 정의된 낮은 스트린전트 조건 하에서 서열번호 1, 3, 41, 43, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65에 나타난 서열의 전체 또는 일부에 하이브리다이즈 가능하다.
여기에 사용된 "프로브"라는 용어는 특이적 염기 서열을 지닌 핵산 분자 또는 예를 들어 특이적 아미노산 서열을 포함한 펩타이드를 포함하나 이에 한정적인 것은 아닌 것을 포함하여 검색에 사용되는 물질을 나타내고, 이는 시험관 내 및/또는 생체 내 선별과 같은 생물학적 실험에 사용된다.
일반적 프로브로서 핵산 분자의 예는 목적 유전자의 핵산 서열에 상동적이거나 상보적인 적어도 8 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열을 지닌 것을 포함한다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드 길이, 적어도 12 이상의 인접 뉴클레오타이드 길이, 적어도 13 이상의 인접 뉴클레오타이드 길이, 적어도 14 이상의 인접 뉴클레오타이드 길이, 적어도 15 이상의 인접 뉴클레오타이드 길이, 적어도 20 이상의 인접 뉴클레오타이드 길이, 적어도 25 이상의 인접 뉴클레오타이드 길이, 적어도 30 이상의 인접 뉴클레오타이드 길이, 적어도 40 이상의 인접 뉴클레오타이드 길이, 적어도 50 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열이다. 프로브로서 사용되는 핵산 서열은 상기-기술된 서열에 대해 적어도 70% 이상, 더욱 바람직하게는 적어도 80% 이상, 더욱 더 바람직하게는 적어도 90% 이상 또는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다.
여기에 사용된 "검색"이라는 용어는 제공된 핵산 서열이 전기적으로 또는 생물학적으로 또는 다른 방법을 이용하여 특이적 기능 및/또는 성질을 지닌 다른 핵산 염기 서열을 찾는데 이용되는 것을 나타낸다. 전기적 검색의 예는 BLAST(Altschul et al., J. Mol. Biol. 215:403-410 (1990)), FASTA(Pearson & Lipman, Proc. Natl. Acad. Sci., USA 85:2444-2448 (1988)), Smith and Waterman 방법(Smith and Waterman, J. Mol. Biol. 147:195-197 (1981)) 및 Needlman and Wunsch 방법(Needlman and Wunsch, J. Mol. Biol. 48:443-453 (1970)) 등을 포함하나 이에 한정적인 것은 아니다. 생물학적 검색의 예는 스트린전트 하이브리디제이션시 게놈 DNA가 나일론 멤브레인에 부착되는 마이크로에레이 또는 게놈 DNA가 유리 플레이트에 부착되는 마이크로어레이(마이크로에세이), PCR 및 원위치 하이브리디제이션을 포함하나 이에 한정적인 것은 아니다. 여기서 본 발명에 사용된 DNA 중합효소 등은 전기적 또는 생물학적 검색에 의해 확인된 상응하는 유전자를 포함된다.
여기서 사용된 "서열(아미노산, 뉴클레오타이드 등) 동일성, 상동성 또는 유사성의 백분율"은 비교 창에 최적으로 정렬된 2개의 서열을 비교함으로서 측정되고, 참조 서열(첨가 또는 삭제를 포함하지 않는(다른 서열이 첨가를 포함한 경우 갭이 발생함)에 비교시 비교 창 내의 폴리뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 2개 서열의 최적 정렬에 대해 첨가 또는 삭제(즉, 갭)를 포함함이 특징이다. 백분율은 매치된 위치의 수를 산출하기 위해 동일한 핵산 염기 또는 아미노산 잔기가 양쪽 서열 내 발생한 위치의 수를 측정하고, 매치된 위치의 수를 참조 서열 내 총 위치 수(즉, 창 크기)로 나누고, 서열 동일성의 백분율을 산출하기 위해 결과에 100을 곱함으로서 계산된다. 검색에 사용시 상동성은 당분야에 알려진 다양한 서열 비교 알고리즘 및 프로그램으로부터 선택된 적당한 기술에 의해 산정된다. 이러한 알고리즘 및 프로그램의 예는 TBLASTN, BLASTP, FASTA, TFASTA 및 CLUSTALW(Pearson & Lipman, 1988, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, Altschul et al., 1990, J. Mol. Biol. 215(3):403-410, Thompson et al., 1994, Nucleic Acids Res. 22(2):4673-4680, Higgins et al., 1996, Methods Enzymol. 266:383-402, Altschul et al., 1990, J. Mol. Biol. 214(3):403-410, Altschul et al., 1993, Nature Genetics 3:266-272)를 포함하나 이에 한정적인 것은 아니다. 특히 바람직한 실시태양에서 단백질 또는 핵산 서열의 상동성은 당분야에 잘 알려진 Basic Local Alignment Search Tool(BLAST)를 이용하여 산정된다(Karlin and Altschul, 1990, Proc. Natl. Acad. Sci. USA 87:2267-2268, Alstschul et al., 1990, J. Mol. Biol. 214(3):403-410, Alstschul et al., 1997, Nuc. Acids, Res. 25:3389-3402). 특히 5 상술된-BLAST 프로그램이 비교 또는 검색을 달성하는 하기 태스크를 수행하는데 이용된다:
(1) BLASTP 및 BLAST3을 이용한 의문의 아미노산 서열과 단백질 서열 데이터베이스와의 비교;
(2) BLASTN을 이용한 의문의 뉴클레오타이드 서열과 뉴클레오타이드 서열 데이터베이스와의 비교;
(3) BLASTX를 이용한 의문의 뉴클레오타이드 서열(양쪽 스트랜드)이 6 리딩 프레임에 걸쳐 전환된 개념적으로 번역된 생성물과 단백질 서열 데이터베이스와의 비교;
(4) TBLASTN을 이용한 6 리딩 프레임(양쪽 스트랜드)에 걸쳐 전환된 모든 의문의 단백질 서열과 뉴클레오타이드 서열 데이터베이스의 비교; 및
(5) TBLASTX를 이용한 6 리딩 프레임에 걸쳐 전환된 의문의 뉴클레오타이드 서열과 뉴클레오타이드 서열 데이터베이스의 비교.
BLAST 프로그램은 의문의 아미노산 서열 또는 의문의 뉴클레오타이드 서열과 단백질 서열 데이터베이스 또는 핵산 서열 데이터베이스로부터 바람직하게 수득된 시험 서열 사이의 "고득점 세그먼트 쌍"이라 불리는 유사성 세그먼트를 명기함으로서 상동성 서열을 확인한다. 다수의 고득점 세그먼트 쌍은 바람직하게는 당분야에 잘 알려진 득점 매트릭스를 이용하여 확인된다(정렬된다). 바람직하게는 득점 매트릭스는 BLOSUM62 매트릭스이다(Gonnet et al., 1992, Science 256:1443-1445, Henikoff and Henikoff, 1993, Proteins 17:49-61). BLOSUM62 매트릭스만큼 바람직하지는 않으나 PAM 또는 PAM250 매트릭스도 이용된다(즉, Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation 참조). BLAST 프로그램은 모든 확인된 고득점 세그먼트 쌍의 통계적 유의성을 산정하고 바람직하게는 이용자 세트 상동성과 같은 이용자에 의해 독립적을 한정된 역치 수준의 유의성을 만족시키는 세그먼트를 선택한다. 바람직하게는 고득점 세그먼트 쌍의 통계적 유의성은 Karlin의 공식(Karlin and Altschul, 1990, Proc. Natl. Acad. Sci. USA 87:2267-2268 참조)을 이용하여 산정된다.
여기서 사용된 "프라이머"라는 용어는 거대분자 합성 효소 반응시 합성되는 거대분자 화합물의 반응의 개시에 필요한 물질을 나타낸다. 핵산 분자를 합성하기 위한 반응시 합성되는 거대분자 화합물의 일부에 상보적인 핵산 분자(즉, DNA, RNA 등)가 이용된다.
일반적으로 프라이머로 이용되는 핵산 분자는 목적 유전자의 핵산 서열에 상보적인 적어도 8 이상의 인접 뉴클레오타이드 길이를 지닌 핵산 서열을 지닌 것을 포함한다. 이러한 핵산 서열은 바람직하게는 적어도 9 이상의 인접 뉴클레오타이드 길이, 더욱 바람직하게는 적어도 10 이상의 인접 뉴클레오타이드 길이, 더욱 더 바람직하게는 적어도 11 이상의 인접 뉴클레오타이드 길이, 적어도 12 이상의 인접 뉴클레오타이드 길이, 적어도 13 이상의 인접 뉴클레오타이드 길이, 적어도 14 이상의 인접 뉴클레오타이드 길이, 적어도 15 이상의 인접 뉴클레오타이드 길이, 적어도 16 이상의 인접 뉴클레오타이드 길이, 적어도 17 이상의 인접 뉴클레오타이드 길이, 적어도 18 이상의 인접 뉴클레오타이드 길이, 적어도 19 이상의 인접 뉴클레오타이드 길이, 적어도 20 이상의 인접 뉴클레오타이드 길이, 적어도 25 이상의 인접 뉴클레오타이드 길이, 적어도 30 이상의 인접 뉴클레오타이드 길이, 적어도 40 이상의 인접 뉴클레오타이드 길이, 적어도 50 이상의 인접 뉴클레오타이드 길이를 지닌다. 프라이머로서 사용되는 핵산 서열은 상기-기술된 서열에 대해 적어도 70% 이상, 더욱 바람직하게는 적어도 80% 이상, 더욱 더 바람직하게는 적어도 90% 이상, 가장 바람직하게는 적어도 95% 이상의 상동성을 지닌 핵산 서열을 포함한다. 프라이머로서 적당한 서열은 합성되는(증폭되는) 서열의 특성에 따라 달라진다. 당업자는 목적 서열에 따라 다른 적당한 프라이머를 고안할 수 있다. 이러한 프라이머 고안은 당분야에 잘 알려져 있고 수동으로 또는 컴퓨터 프로그램(즉, LASERGENE, Primer Select, DNAStar)을 이용하여 수행된다.
여기서 사용된 "에피토프"라는 용어는 항원-항체 반응을 유도할 수 있는 한 상세한 구조가 반드시 한정될 필요가 없는 항원 결정소를 나타낸다. 따라서 "에피토프"라는 용어는 특정 면역글로불린에 의한 인식에 관련된 아미노산 잔기 세트를 포함하고 또는 T 세포의 경우 이들 잔기는 T 세포 수용체 단백질 및/또는 주조직 적합 복합체(Major Histocompatibility Complex(MHC)) 수용체에 의한 인식에 필수적이다. 또한 이러한 용어는 "항원 결정소" 또는 "항원 결정소 사이트"와 상호교환가능하게 사용된다. 면역학 분야에서 생체 내 또는 시험관 내에서 에피토프는 (면역글로불린, T 세포 수용체 또는 HLA 분자에 의해 인식되는 사이트를 형성하는 분자의 특징이다(즉, 1차, 2차 및 3차 펩타이드 구조 및 전하). 펩타이드를 포함한 에피토프는 에피토프에 유일한 공간적 입체형태 내에 3 이상의 아미노산을 포함한다. 일반적으로 에피토프는 적어도 5 이상의 이러한 아미노산으로 구성되고, 더욱 바람직하게는 적어도 6, 7, 8, 9 또는 10 이상의 이러한 아미노산으로 구성된다. 에피토프의 길이가 더 커질수록 본래 펩타이드에 대한 에피토프의 유사성이 높아진다 즉, 더 긴 에피토프가 일반적으로 바람직하다. 입체형태가 고려될 때 이는 항상 그렇지는 않다. 당분야에 알려진 아미노산의 공간적 입체형태를 측정하는 방법은 예를 들어 X-선 결정학 및 2-차원 핵 자기 공명 분광학을 포함한다. 더욱이 제공된 단백질 내 에피토프의 확인은 당분야에 잘 알려진 기술을 이용하여 용이하게 달성된다. Geysen et al., Proc. Natl. Acad. Sci. USA (1984) 81:3998(제공된 항원 내 면역원성 에피토프의 위치를 측정하기 위해 펩타이드를 빠르게 합성하는 일반 방법); 미국 특허 제4,708,871(항원의 에피토프를 확인하고 화학적을 합성하는 절차) 및 Geysen et al., Molecular Immunology (1986) 23:709(제공된 항체에 대해 높은 친화력을 지닌 펩타이드를 확인하는 기술) 참조. 동일한 에피토프를 인식하는 항체는 간단한 면역에세이로 확인될 수 있다. 따라서 펩타이드를 포함한 에피토프를 측정하는 방법은 당분야에 잘 알려져 있다. 에피토프의 1차 핵산 또는 아미노산 서열이 제공된 경우 이러한 에피토프는 당업자에 의해 잘-알려진 일반적 기술을 이용하여 측정될 수 있다.
따라서 펩타이드를 포함한 에피토프는 적어도 3개 이상의 아미노산, 바람직하게는 적어도 4개 이상의 아미노산, 더욱 바람직하게는 적어도 5개 이상의 아미노산, 적어도 6개 이상의 아미노산, 적어도 7개 이상의 아미노산, 적어도 8개 이상의 아미노산, 적어도 9개 이상의 아미노산, 적어도 10개 이상의 아미노산, 적어도 15개 이상의 아미노산, 적어도 20개 이상의 아미노산, 적어도 25개 이상의 아미노산의 길이를 지닌 서열을 필요로 한다.
(유전자의 변형)
제공된 단백질 분자에 있어서(즉, DNA 중합효소 등), 서열 내에 포함된 제공된 아미노산은 상호작용성 결합 능력의 뚜렷한 감소 또는 손실 없이 양이온성 구역 또는 기질 분자 결합 사이트와 같은 단백질 구조 내에서 또다른 아미노산과 치환된다. 단백질의 제공된 생물학적 기능은 단백질의 상호작용성 능력 또는 다른 특성에 의해 정의된다. 따라서 특정한 아미노산 치환은 아미노산 서열 내에서 또는 DNA 코드 서열 수준에서 수행되어 치환 후 본래 특성을 유지하는 단백질을 생성한다. 따라서 여기서 정의된 펩타이드 및 이러한 펩타이드를 인코드하는 DNA의 다양한 변형이 생물학적 유용성의 뚜렷한 손실 없이 수행된다. 대안으로, DNA 중합효소를 인코드하는 핵산 서열이 변형되어 DNA 중합효소의 프루프리딩 기능이 변형되기도 한다.
상기-기술된 변형이 고안될 때 아미노산의 소수성 인덱스가 고려된다. 소수성 아미노산 인덱스는 일반적으로 당분야에 인식되는 단백질에 상호작용성 생물학적 기능을 제공하는데 중요한 역할을 한다(Kyte. J and Doollittle, R.F., J. Mol. Biol. 157(1):105-132, 1982). 아미노산의 소수성 성질은 단백질의 2차 구조에 기여하여 단백질과 다른 분자(즉, 효소, 물질, 수용체, DNA, 항체, 항원 등) 사이의 상호작용을 조절한다. 각각의 아미노산은 하기와 같은 그의 소수성 및 전하 특성에 기반한 소수성 인덱스를 제공한다: 이소류신(+4.5); 발린(+4.2); 류신(+3.8); 페닐알라닌(+2.8), 시스테인/시스틴(+2.5); 메티오닌(+1.9); 알라닌(+1.8), 글리신(-0.4); 트레오닌(-0.7); 세린(-0.8); 트립토판(-0.9); 티로신(-1.3); 프롤린(-1.6); 히스티딘(-3.2); 글루탐산(-3.5); 글루타민(-3.5); 아스파르트산(-3.5); 아스파라긴(-3.5); 라이신(-3.9) 및 아르기닌(-4.5).
제공된 아미노산이 유사한 소수성 인덱스를 지닌 또다른 아미노산으로 치환되면 수득된 단백질은 본래 단백질과 유사한 생물학적 기능을 여전히 지님이 잘 알려져 있다(즉, 동등한 효소 활성을 지닌 단백질). 이러한 아미노산 치환의 경우 소수성 인덱스는 바람직하게는 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내이다. 소수성에 기반한 이러한 아미노산 치환이 효과적임이 이해된다.
본 발명의 유전자를 변형시 친수성 인덱스가 고려된다. 미국 특허 제4,554,101호에 기술된 바와 같이 아미노산 잔기는 하기 친수성 인덱스를 제공한다: 아르기닌(+3.0); 라이신(+3.0); 아스파르트산(+3.0±1); 글루탐산(+3.0±1); 세린(+0.3); 아스파라긴(+0.2); 글루타민(+0.2); 글리신(0); 트레오닌(-0.4); 프롤린(-0.5±1); 알라닌(-0.5); 히스티딘(-0.5); 시스테인(-1.0); 메티오닌(-1.3); 발린(-1.5); 류신(-1.8); 이소류신(-1.8); 티로신(-2.3); 페닐알라닌(-2.5); 및 트립토판(-3.4). 아미노산이 유사한 친수성 인덱스를 지닌 또다른 아미노산으로 치환되고 생물학적 등가물을 여전히 제공함이 이해된다. 이러한 아미노산 치환의 경우 친수성 인덱스는 바람직하게는 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내이다.
여기서 사용된 "보존적 치환"이라는 용어는 치환된 아미노산 및 치환 아미노산이 유사한 친수성 인덱스 및/또는 소수성 인덱스를 지닌 아미노산 치환을 나타낸다. 예를 들어 보존적 치환은 ±2 이내, 더욱 바람직하게는 ±1 이내, 더욱 더 바람직하게는 ±0.5 이내의 친수성 또는 소수성 인덱스를 지닌 아미노산들 사이에서 수행된다. 보존적 치환의 예는 당분야에 잘 알려진 하기 잔기 쌍 각각의 치환을 포함하나 이에 한정적인 것은 아니다: 아르기닌과 라이신; 글루탐산과 아스파르트산; 발린, 류신 및 이소류신.
여기서 사용된 "변이체"라는 용어는 본래 물질과 부분적으로 다른 폴리펩타이드, 폴리뉴클레오타이드와 같은 물질을 나타낸다. 이러한 변이체의 예는 치환 변이체, 첨가 변이체, 삭제 변이체, 절제된 변이체, 대립유전자성 변이체 등을 포함한다. 이러한 변이체의 예는 참조 핵산 분자 또는 폴리펩타이드에 대해 하나 또는 수개의 치환, 첨가 및/또는 삭제를 지닌 뉴클레오타이드 또는 폴리뉴클레오타이드 또는 적어도 하나 이상의 치환, 첨가 및/또는 삭제를 지닌 뉴클레오타이드 또는 폴리펩타이드를 포함하나 이에 한정적인 것은 아니다. 변이체는 참조 분자(즉, 야생형 분자 등)의 생물학적 활성은 지니거나 지니지 않는다. 변이체는 목적에 따라 부가적인 생물학적 활성을 부여하거나 생물학적 활성의 일부가 결핍된다. 이러한 고안은 당분야에 잘 알려진 기술을 이용하여 수행될 수 있다. 대안으로, 특성이 이미 알려진 변이체는 생물체로부터의 분리에 의해 수득되어 변이체를 생성하고, 서열 정보를 수득하기 위해 변이체의 핵산 서열이 증폭된다. 따라서 숙주 세포에 있어서 이형성 종 또는 그의 생성물로부터 유래된 상응하는 유전자는 "변이체"로 간주된다.
여기서 사용된 "대립유전자"라는 용어는 2개 유전자가 서로 구별되는 상응하는 유전자와 동일한 좌위에 위치한 유전적 변이체를 나타낸다. 따라서 여기서 사용된 "대립유전자성 변이체"라는 용어는 제공된 유전자와 대립유전자 관계를 지닌 변이체를 나타낸다. 이러한 대립유전자성 변이체는 일반적으로 상응하는 대립유전자와 동일하거나 매우 유사한 서열을 지니고, 거의 다른 생물학적 활성을 지니지 않으나 일반적으로 거의 동일한 생물학적 활성을 지닌다. 여기서 사용된 "종 상동체" 또는 "상동체"라는 용어는 제공된 종 내에서 제공된 유전자와 아미노산 또는 뉴클레오타이드 상동성(바람직하게는 적어도 60% 이상의 상동성, 더욱 바람직하게는 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상 및 적어도 95% 이상의 상동성)을 지닌 것을 나타낸다. 이러한 종 상동체를 수득하는 방법은 본 명세서의 설명으로부터 명백하게 이해된다. "오르쏠로그(ortholog)"(또한 오르쏠로성 유전자)라는 용어는 일반 계통으로부터 유래된 다른 종(종분화에 의한) 내의 유전자를 나타낸다. 예를 들어 다유전자 구조를 지닌 헤모글로빈 유전자 패밀리의 경우 인간과 마우스 α-헤모글로빈 유전자는 오르쏠로그인 반면, 인간 α-헤모글로빈 유전자와 인간 β-헤모글로빈 유전자는 파라로그(paralog)(유전자 중복으로부터 발생된 유전자)이다. 오르쏠로그는 분자 계통수의 평가에 유용하다. 일반적으로 다른 종 내의 오르쏠로그는 본래 종과 동일한 기능을 지닌다. 따라서 본 발명의 오르쏠로그는 본 발명에 유용하다.
여기서 사용된 "보존적 (또는 보존적으로 변형된) 변이체"는 아미노산과 핵산 서열 모두에 적용된다. 특정한 핵산 서열에 대해 보존적으로 변형된 변이체는 동일하거나 실제로 동일한 아미노산 서열을 인코드하는 핵산을 나타낸다. 유전적 코드의 퇴보 때문에 다수의 기능적으로 동일한 핵산이 어떠한 제공된 단백질을 인코드한다. 예를 들어 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 인코드한다. 따라서 알라닌이 코돈에 의해 명시된 모든 위치에서 코돈은 인코드되는 폴리펩타이드를 변경시키지 않고 기술된 어떠한 상응하는 코돈으로도 변경될 수 있다. 이러한 핵산 변이는 보존적으로 변형된 변이체의 하나의 종을 나타내는 "침묵 변이"이다. 또한 여기서 폴리펩타이드를 인코드하는 모든 핵산 서열은 핵산의 모든 가능한 침묵 변이를 기술한다. 당업자는 핵산 내 각 코돈(메티오닌만을 위한 코돈인 AUG 및 트립토판만을 위한 코돈인 TGG를 제외한)은 기능적으로 동일한 분자를 산출하도록 변형될 수 있음이 인식할 것이다. 따라서 폴리펩타이드를 인코드하는 핵산의 각각의 침묵 변이는 각각의 기술된 서열 내에 함축된다. 바람직하게는 이러한 변형은 폴리펩타이드의 고차 구조에 크게 영향을 미칠 수 있는 아미노산인 시스테인의 치환을 제외하고 수행된다. 염기 서열의 이러한 변형 방법의 예는 제한효소 등을 이용한 분할; DNA 중합효소, Klenow 단편, DNA 리가제 등을 이용한 처리에 의한 라이게이션; 및 합성된 올리고뉴클레오타이드를 이용한 자리 특이적 염기 치환 방법(특이적-자리 지정 돌연변이유발; Mark Zoller and Michael Smith, Methods in Enzymology, 100, 468-500(1983))을 포함한다. 변형은 분자생물학 분야에서 일반적으로 이용되는 방법을 이용하여 수행될 수 있다.
기능적으로 동등한 폴리펩타이드를 제조하기 위해 아미노산 치환, 삭제 및/또는 변형이 아미노산 치환 이외에 수행될 수 있다. 아미노산 치환(들)은 1 내지 10개의 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 다른 아미노산으로의 대치와 같이 본래 펩타이드 체인의 적어도 하나 이상의 아미노산의 다른 아미노산으로의 대치를 나타낸다. 아미노산 첨가(들)는 본래 펩타이드 체인으로의 1 내지 10개 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 첨가와 같이 본래 펩타이드 체인으로의 적어도 하나 이상의 아미노산의 첨가를 나타낸다. 아미노산 삭제(들)는 1 내지 10개의 아미노산, 바람직하게는 1 내지 5개의 아미노산, 더욱 바람직하게는 1 내지 3개의 아미노산의 삭제와 같이 적어도 하나 이상의 아미노산의 삭제를 나타낸다. 아미노산 변형은 아미드화, 카르복시화, 당화, 인산화, 하이드록실화, 아실화(즉, 아세틸화) 등을 포함하나 이에 한정적인 것은 아니다. 치환되거나 첨가된 아미노산은 자연-발생적 또는 비자연-발생적 아미노산 또는 아미노산 유사체이다. 자연-발생적 아미노산이 바람직하다.
여기서 사용된 "펩타이드 유사체" 또는 "펩타이드 유도체"라는 용어는 펩타이드와 다르나 펩타이드와 동등한 적어도 하나 이상의 화학적 또는 생물학적 기능을 지닌 화합물을 나타낸다. 따라서 펩타이드 유사체는 본래 펩타이드에 대해 적어도 하나 이상의 아미노산 유사체 또는 아미노산 유도체 첨가 또는 치환을 지닌 것을 포함한다. 펩타이드 유사체는 상기-기술된 첨가 또는 치환을 지녀서 그의 기능은 본래 펩타이드와 실질적으로 동일하다(즉, 유사한 pKa 수치, 유사한 기능적 그룹, 다른 분자에 대한 유사한 결합 방식, 유사한 물-용해성 등). 이러한 펩타이드 유사체는 당분야에 잘 알려진 기술을 이용하여 제조될 수 있다. 따라서 펩타이드 유사체는 아미노산 유사체를 포함한 폴리머이다.
유사하게는, 여기서 사용된 "폴리뉴클레오타이드 유사체" 또는 "핵산 유사체"라는 용어는 폴리뉴클레오타이드 또는 핵산과 다르나 폴리뉴클레오타이드 또는 핵산과 동등한 적어도 하나 이상의 화학적 또는 생물학적 기능을 지닌 화합물을 나타낸다. 따라서 폴리뉴클레오타이드 또는 핵산 유사체는 본래 폴리뉴클레오타이드 또는 핵산에 대해 적어도 하나 이상의 뉴클레오타이드 유사체 또는 뉴클레오타이드 유도체 첨가 또는 치환을 지닌 것을 포함한다.
여기서 사용된 핵산 분자는 상기-기술된 바와 같이 핵산에 의해 발현되는 폴리펩타이드가 자연-발생적 폴리펩타이드와 실질적으로 동일한 활성을 지니는 한 핵산 서열의 일부가 삭제되거나 다른 염기(들)로 치환되거나 추가적 핵산 서열이 삽입된 것을 포함한다. 대안으로, 추가적 핵산은 핵산의 5' 말단 및/또는 3' 말단에 결합된다. 핵산 분자는 스트린전트 조건 하에서 폴리펩타이드를 인코드하는 유전자에 하이브리다이즈 가능하고 실질적으로 동일한 기능을 지닌 폴리펩타이드를 인코드하는 것을 포함한다. 이러한 유전자는 당분야에 알려져 있고 본 발명에 이용될 수 있다.
상기-기술된 핵산은 잘-알려진 PCR 방법 즉, 화학 합성에 의해 수득될 수 있다. 이러한 방법은 예를 들어 자리-지정 돌연변이유발, 하이브리디제이션 등과 결합된다.
여기서 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 "치환", "첨가" 또는 "삭제"라는 용어는 본래 폴리펩타이드 또는 폴리뉴클레오타이드에 대한 아미노산 또는 그의 치환체 또는 뉴클레오타이드 또는 그의 치환체의 치환, 첨가 또는 삭제를 나타낸다. 이는 자리-지정 돌연변이유발 기술을 포함한 당분야에 잘 알려진 기술에 의해 달성된다. 폴리펩타이드 또는 폴리뉴클레오타이드는 어떠한 수(>0)의 치환, 첨가 또는 삭제도 지닌다. 상기 수는 의도된 기능(즉, 호르몬 및 사이토카인의 정보 전달 기능 등)을 유지하는 수의 치환, 첨가 또는 삭제를 지닌 변이체만큼 클 수 있다. 예를 들어 이러한 수는 하나 또는 수개, 바람직하게는 전체 길이의 20% 또는 10% 이내 또는 100 이하, 50 이하, 25 이하이다.
(유전공학)
여기서 사용된 DNA 중합효소와 같은 단백질, 그의 단편 및 변이체 등은 유전공학 기술에 의해 생성되고 도입될 수 있다.
유전자가 여기서 논의될 때 "벡터" 또는 "재조합 벡터"라는 용어는 타겟 세포로 목적 폴리뉴클레오타이드 서열을 전이시킬 수 있는 벡터를 나타낸다. 이러한 벡터는 자가-복제 또는 숙주 세포(즉, 원핵세포, 효모, 동물세포, 식물세포, 곤충세포, 개체 동물, 개체 식물 등) 내 염색체 내로의 통합이 가능하고, 본 발명의 폴리뉴클레오타이드의 전사에 적당한 프로모터를 포함한다. 클로닝에 적당한 벡터는 "클로닝 벡터"로 표기된다. 이러한 클로닝 벡터는 일반적으로 다수의 제한 사이트를 포함한 다수 클로닝 사이트를 포함한다. 제산 사이트 및 다수 클로닝 사이트는 당분야에 잘 알려져 있고 목적에 따라 적당히 또는 선택적으로 이용된다. 기술은 여기서 기술된 참고문헌에 기술되어 있다(즉, Sambrook et al. (상동)). 이러한 벡터는 예를 들어 플라스미드를 포함한다.
여기서 사용된 "플라스미드"라는 용어는 염색체와 떨어져서 존재하고 자가 복제하는 유전 인자를 나타낸다. 상세하게 논의시 세포 핵의 미토콘드리아, 엽록체 등 내에 포함된 DNA는 일반적으로 소기관 DNA라고 불리고 플라스미드와 구분된다 즉, 플라스미드에 포함되지 않는다.
플라스미드의 예는 하기를 포함하나 이에 한정적인 것은 아니다:
E. coli : pET (TAKARA), pUC (TOYOBO), pBR322 (TOYOBO), pBluescriptII (TOYOBO);
효모 : pAUR (TAKARA), pESP (TOYOBO), pESC (TOYOBO);
바실러스 섭틸리스 : pHY300PLK (TAKARA);
사상균 : pPRTI (TAKARA), pAUR316 (TAKARA);
동물세포 : pCMV (TOYOBO), pBK-CMV (TOYOBO) 등.
여기서 사용된 "발현 벡터"라는 용어는 구조 유전자 및 그의 발현을 조절하는 프로모터 및 추가적으로 숙주 세포 내에서 이들을 작동하게 하는 상태의 다양한 조절 요소를 포함한 핵산 서열을 나타낸다. 조절 요소는 바람직하게는 터미네이터, 약물-저항성 유전자와 같은 선택가능 마커 및 사일런서(silencer) 및/또는 인핸서를 포함한다. 생물체(즉, 식물) 발현 벡터의 형태 및 조절 요소의 형태는 숙주 세포에 따라 달라짐이 당업자에게 잘 알려져 있다. 특이적 프로모터를 세포 내로 도입시킴으로서 세포의 오류-빈발 빈도는 특정한 조건 하에서 조절될 수 있다.
여기서 사용된 원핵성 세포에 대한 "재조합 벡터"는 예를 들어 pcDNA 3(+), pBluscript-SK(+/-), pGEM-T, pEF-BOS, pEGFP, pHAT, pUC18, pFT-DESTTM, 42GATEWAY(Invitrogen) 등을 포함한다.
여기서 사용된 동물 세포에 대한 "재조합 벡터"는 예를 들어 pcDNA I/Amp, pcDNA I, pCDM8(모든 Funakoshi, 일본 동경에서 구입가능함), pAGE107[일본 공개공보 제3-229호(Invitrogen)], pAGE103[J. Biochem., 101, 1307(1987)], pAMo, pAMoA[J. Biol. Chem., 268, 22782-22787(1993)], 쥐과 줄기세포 바이러스(Murine Stem Cell Virus(MSCV))에 기반한 레트로바이러스 발현 벡터, pEF-BOS, pEGFP 등을 포함한다.
식물세포에 사용되는 재조합 벡터의 예는 Ti 플라스미드, 담배 모자이크 바이러스 벡터, 콜리플라워 모자이크 바이러스 벡터, 제미니 바이러스 벡터 등을 포함한다.
곤충세포에 사용되는 재조합 벡터는 바큘로바이러스 벡터 등을 포함한다.
여기서 사용된 "터미네이터"라는 용어는 유전자의 단백질-인코드 구역의 다운스트림에 위치하고 DNA가 mRNA로 전사될 때 전사의 종결 및 폴리 A 서열의 첨가에 관련된 서열을 나타낸다. 터미네이터는 mRNA의 안정성에 기여하고 유전자 발현량에 영향을 미치는 것으로 알려져 있다.
여기서 사용된 "프로모터"라는 용어는 유전자의 전사 개시 사이트를 결정하고 전사 빈도를 직접 조절하는 DNA 구역인 염기 서열을 나타낸다. 전사는 프로모터에 결합하는 RNA 중합효소에 의해 시작된다. 따라서 프로모터로서 기능하는 제공된 유전자의 일부가 여기서 "프로모터 부분"으로 표기된다. 프로모터 구역은 일반적으로 추정 단백질 코딩 구역의 첫 번째 엑손의 약 2 kbp 업스트림 내에 위치한다. 따라서 DNA 분석 소프트웨어를 이용하여 게놈 염기 서열 내 단백질 코딩 구역을 예측함으로서 프로모터 구역을 추정하는 것이 가능하다. 추정 프로모터 구역은 일반적으로 구조 유전자의 업스트림에 위치하나 구조 유전자에 따라 다르게 추정 프로모터 구역은 구조 유전자의 다운스트림에 위치한다. 바람직하게는 추정 프로모터 구역은 첫 번째 엑손의 번역 개시 사이트의 약 2 kbp 업스트림에 위치한다.
여기서 사용된 "인핸서"라는 용어는 목적 유전자의 발현 효율을 강화시키기 위해 사용되는 서열을 나타낸다. 이러한 인핸서는 당분야에 잘 알려져 있다. 하나 이상의 인핸서가 사용되거나 어떠한 인핸서도 사용되지 않는다.
여기서 사용된 "사일런서"라는 용어는 유전자의 발현을 억제하거나 중지시키는 기능을 지닌 서열을 나타낸다. 본 발명에서 이러한 기능을 지닌 사일런서가 사용되거나 대안으로 어떠한 사일런서도 사용되지 않는다.
여기서 사용된 "실시가능하게 결합된"이라는 용어는 원하는 서열이 그의 발현(작동)이 전사 및 번역 조절 서열(즉, 프로모터, 인핸서 등) 또는 번역 조절 서열의 제어 하에 있도록 위치함을 나타낸다. 프로모터가 유전자에 실시가능하게 결합되기 위해 일반적으로 프로모터가 유전자의 바로 업스트림에 위치한다. 프로모터는 구조 유전자에 항상 인접할 필요는 없다.
여기서 형질전환, 형질도입, 트랜스펙션 등을 포함하여 어떠한 기술도 세포 내로 변형된 프루프리딩 기능을 지닌 DNA 중합효소를 인코드하는 핵산 분자를 도입시키기 위해 이용된다. 이러한 핵산 분자 도입 기술은 당분야에 잘 알려져 있고 일반적으로 사용되며 예를 들어 Ausubel F.A. et al., editors, (1988), Current Protocols in Molecular Biology, Wiley, New York, NY; Sambrook J. et al. (1987) Molecular Cloning: A Laboratory Manual, 2nd Ed. and its 3rd Ed. (2001), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; Special issue, Jikken Igaku [Experimental Medicine] "Experimental Method for Gene Introduction & Expression Analysis", Yodo-sha, 1997 등에 기술되어 있다. 유전자 도입은 노던 블럿팅 분석 및 웨스턴 블럿팅 분석 또는 잘 알려진 다른 일반적 기술과 같은 여기에 기술된 방법에 의해 확인될 수 있다.
트랜스펙션, 형질도입, 형질전환 등을 포함하여 DNA를 세포 내로 도입시키는 상기-기술된 어떠한 방법도 벡터 도입 방법으로 이용될 수 있다(즉, 인산칼슘 방법, 리포솜 방법, DAEA 덱스트란 방법, 일렉트로포레이션법, 입자 총(유전자 총) 방법 등).
여기서 사용된 "형질전환체"라는 용어는 형질전환에 의해 생성된, 세포와 같은 생물체 전체 또는 부분을 나타낸다. 형질전환체의 예는 원핵세포, 효모, 동물세포, 식물세포, 곤충세포 등을 포함한다. 형질전환체는 피험체에 따라 다르게 형질전환된 세포, 형질전환된 조직, 형질전환된 숙주 등으로 표기된다. 여기서 이용된 세포는 형질전환이다.
여기서 원핵세포가 유전적 작용에 이용되는 경우 원핵세포는 예를 들어 대장균속, 세라티아(Serratia)속, 바실러스(Bacillus)속, 브레비박테리움(Brevibacterium)속, 코리네박테리움(Corynebacterium)속, 마이크로박테리움(Microbacterium)속, 슈도모나스(Pseudomoonas)속 등이다. 특히 원핵세포는 예를 들어 Escherichia coli XL1-Blue, Escherichia coli XL2-Blue, Escherichia coli DH1 등이다.
여기서 이용되는 동물세포의 예는 마우스 골수종 세포, 래트 골수종 세포, 마우스 하이브리도마 세포, 중국 햄스터 난소(CHO) 세포, 어린 햄스터 신장(BHK) 세포, 아프리카 녹색 원숭이 신장 세포, 인간 백혈병 세포, HBT5637(일본공개공보 제63-299호), 인간 결장암 세포주 등을 포함한다. 마우스 골수종 세포는 ps20, NSO 등을 포함한다. 래트 골수종 세포는 YB2/0 등을 포함한다. 인간 배아 신장 세포는 HEK293(ATCC:CRL-1573) 등을 포함한다. 인간 백혈병 세포는 BALL-1 등을 포함한다. 아프리카 녹색 원숭이 신장 세포는 COS-1, COS-7 등을 포함한다. 인간 결장암 세포주는 HCT-15 등을 포함한다. 인간 신경모세포종은 SK-N-SH, SK-N-SH-5Y 등을 포함한다. 마우스 신경모세포종은 Neuro2A 등을 포함한다.
여기서 염화칼슘법, 일렉트로포레이션법(Methods. Enzymol., 194, 182(1990)), 리포렉션법, 스페로플라스트법(Proc. Natl. Acad. Sci. USA, 84, 1929 (1978)), 아세트산리튬법(J. Bacteriol., 153, 163 (1983)), Pcor. Natl. Acad. Sci. USA, 75, 1929 (1978)에 기술된 방법을 포함하여 어떠한 DNA 도입 방법도 재조합 벡터의 도입 방법으로 이용될 수 있다.
Current Protocols in Molecular Biology(상동)(특히, Units 9.9-9.14)에 기술된 여기서 이용된 레트로바이러스 감염 방법은 당분야에 잘 알려져 있다. 특히 예를 들어 배아 줄기세포가 단일-세포 현탁액 내로 트립신처리된 후 1∼2시간 동안 바이러스-생성 세포(팩키징 세포주)의 배양 상청액과 동시-배양되어 충분한 양의 감염된 세포를 수득하였다.
본 발명이 식물에 적용되는 경우 식물 발현 벡터는 아그로박테리움을 이용한 방법 및 직접 감염법과 같은 당분야에 잘 알려진 방법을 이용하여 식물세포 내로 도입된다. 아그로박테리움을 이용한 방법의 예는 예를 들어 Nagel et al.(1990), Microbiol. Lett., 67, 325에 기술된 방법을 포함한다. 본 방법에서 예를 들어 식물에 적당한 발현 벡터가 일렉트로포레이션에 의해 아그로박테리움 내로 삽입되고 형질전환된 아그로박테리움은 예를 들어 Gelvin et al., eds, (1994), Plant Molecular Biology Manual (Kluwer Academic Press Publishers)에 기술된 방법에 의해 식물세포 내로 도입된다. 식물 발현 벡터를 세포 내로 직접 도입시키는 방법의 예는 일렉트로포레이션(Shimamoto et al. (1989), Nature, 338:274-276; 및 Rhodes et al. (1989), Science, 240:204-207), 입자총법(Christou et al. (1991), Bio/Technology 9:957-962) 및 폴리에틸렌글리콜(PEG) 방법을 포함한다. 이들 방법은 당분야에 잘 알려져 있고, 이들 중 형질전환되는 식물에 적당한 방법이 적당하게 선택된다.
본 발명에서 목적 핵산 분자(도입된 유전자)는 형질전환체의 염색체 내로 도입되거나 도입되지 않는다. 바람직하게는 목적 핵산 분자(도입된 유전자)는 형질전환체의 염색체 내로, 더욱 바람직하게는 염색체 쌍 내로 도입된다.
형질전환된 세포는 당분야에 잘 알려진 방법에 의해 식물조직, 식물기관 및/또는 식물체로 분화된다.
식물세포, 식물조직 및 식물체는 당분야에 잘 알려진 방법에 의해 배양되고 분화되고 재생산된다. 배지의 예는 Murashige-Skoog(MS) 배지, Gamborg B5(B) 배지, White 배자, Nitsch & Nitsch 배지 등을 포함하나 이에 한정적인 것은 아니다. 이들 배지는 일반적으로 적당한 양의 식물 생장 조절 물질(식물 호르몬) 등이 보충된다.
여기서 사용된 식물과 관련된 "재분화" 또는 "재분화시키다"라는 용어는 전체 식물이 개체 식물의 일부로부터 복원되는 현상을 나타낸다. 예를 들어 세포, 잎, 뿌리 등과 같은 조직 세그먼트가 기관 또는 식물체로 재분화될 수 있다.
형질전환체를 식물체로 재분화시키는 방법은 당분야에 잘 알려져 있다. 이들 방법은 예를 들어 Rogers et al., Methods in Enzymology 118:627-640(1986); Tabata et al., Plant Cell Physiol., 28:73-82(1987); Shaw, Plant Molecular Biology: A practicial approach, IRL press(1988); Shimamoto et al., Nature 338:274(1989); Maliga et al., Methods in Plant Molecular Biology: A Laboratory course, Cold Spring Harbor Laboratory Press(1995) 등에 기술되어 있다. 따라서 상기-기술된 잘 알려진 방법은 식물을 재분화시키기 위해 당업자에 의해 목적 형질전환 식물에 따라 다르게 적당히 선택되고 이용될 수 있다. 형질전환된 식물은 도입된 목적 유전자를 지닌다. 도입된 유전자는 노던 블럿팅, 웨스턴 블럿팅 분석 등과 같은 여기에 기술된 방법 및 다른 잘 알려진 기술에 의해 확인될 수 있다.
종자는 형질전환된 식물로부터 수득된다. 도입된 유전자의 발현은 노던 블럿팅 또는 PCR에 의해 검출될 수 있다. 유전자 생성물 단백질의 발현은 필요한 경우 예를 들어 웨스턴 블럿팅에 의해 확인된다.
본 발명이 어떠한 생물체에도 적영될 수 있고 특히 식물에 유용함이 증명된다. 또한 본 발명은 다른 생물체에도 적용될 수 있다. 본 발명에서 이용되는 분자생물학 기술은 당분야에 잘 알려져 있고 일반적으로 이용되며, 예를 들어 Ausubel F.A. et al., editors, (1988), Current Protocols in Molecular Biology, Wiley, New York, NY; Sambrook J. et al. (1987) Molecular Cloning: A Laboratory Manual, Ver. 2 and Ver. 3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; Special issue, Jikken Igaku [Experimental Medicine] "Experimental Method for Gene Introduction & Expression Analysis", Yodo-sha, 1997 등에 기술되어 있다.
유전자 발현(즉, mRNA 발현, 폴리펩타이드 발현)은 mRNA 측정 및 면역 측정 방법을 포함한 적당한 방법에 의해 "검출"되거나 "정량화"된다. 분자생물학 측정 방법의 예는 노던 블럿팅 방법, 닷(dot) 블럿팅 방법, PCR법 등을 포함한다. 면역 측정 방법의 예는 ELISA법, RIA법, 형광항체법, 웨스턴 블럿팅 방법, 마이크로타이터 플레이트가 사용되는 면역조직화학염색법 등을 포함한다. 정량화 방법의 예는 ELISA법, RIA법 등을 포함한다. 어레이(즉, DNA 어레이, 단백질 어레이 등)를 이용한 유전자 분석법이 이용된다. DNA 어레이는 Saibo-Kogaku [Cell Engineering], special issue, "DNA Microarray and Up-to-date PCR Method", edited by Shujun-sha에서 광범위하게 조사되었다. 단백질 어레이는 Nat Genet. 2002 Dec; 32 Suppl:526-32에 상세히 기술되어 있다. 유전자 발현을 분석하는 방법의 예는 상기-기술된 방법 이외에 RT-PCR법, RACE법, SSCP법, 면역침전법, 투-하이브리드 시스템, 시험관 내 번역법 등 포함하나 이에 한정적인 것은 아니다. 다른 분석법은 예를 들어 "Genome Analysis Experimental Method, Yusuke Nakamura's Labo-Manual, edited by Yusuke Nakamura, Yodo-sha(2002) 등에 기술되어 있다. 상기-기술된 모든 간행물은 여기에 참고문헌에 포함된다.
여기서 사용된 "발현량"이라는 용어는 피험 세포 내에서 발현된 폴리펩타이드 또는 mRNA의 양을 나타낸다. 발현량은 면역 측정법(즉, ELISA법, RIA법, 형광항체법, 웨스턴 블럿팅 방법, 면역조직화학염색법 등)을 포함한 본 발명의 항체를 이용한 어떠한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 단백질 수준에서의 발현량 또는 분자생물학 측정법(즉, 노던 블럿팅 방법, 닷 블럿팅 방법, PCR법 등)을 포함한 어떠한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 mRNA 수준에서의 발현량을 포함한다. "발현량의 변화"라는 용어는 상기-기술된 면역 측정법 또는 분자생물학 측정법을 포함한 적당한 방법에 의해 산정된 본 발명의 폴리펩타이드의 단백질 또는 mRNA 수준에서의 발현량의 증가 또는 감소를 나타낸다. 따라서 본 발명에 따라 오류-빈발 빈도는 특정한 작용제(즉, DNA 중합효소 등)의 발현량을 변화시킴으로서 조절될 수 있다.
여기서 사용된 폴리뉴클레오타이드와 관련한 "업스트림"이라는 용어는 특정한 참조 포인트보다 5' 말단에 더 가까운 위치를 의미한다.
여기서 사용된 폴리뉴클레오타이드와 관련한 "다운스트림"이라는 용어는 특정 참조 포인트보다 3'말단에 더 가까운 위치를 의미한다.
여기서 사용된 "염기쌍" 및 "Watson & Crick 염기쌍"이라는 용어는 동일한 의미를 지니고, 이중-스트랜드 DNA에서 나타난 바와 같이 아데닌 잔기(A)는 2개 수소결합을 통해 티민 잔기(T) 또는 우라실 잔기(U)에 결합되고 시토신 잔기(C)는 3개 수소결합을 통해 구아닌 잔기(G)에 결합되는 서열 동일성에 기반하여 결합된 수소결합에 의해 함께 결합될 수 있음을 나타낸다(Stryer L., Biochemistry, 4th edition, 1995 참조).
여기서 사용된 폴리뉴클레오타이드와 관련한 "상보성" 또는 "상보적"이라는 용어는 그의 전체 상보성 구역이 상응하는 상보성 염기와 Watson-Crick 염기쌍을 형성할 수 있고 첫 번째 폴리뉴클레오타이드가 두 번째 폴리뉴클레오타이드에 대해 상보성인 것으로 간주되는 폴리뉴클레오타이드 서열을 나타낸다. 상보성 염기는 일반적으로 A와 T(또는 A와 U) 또는 C와 G이다. 여기서 사용된 "상보적"이라는 용어는 "상보성 폴리뉴클레오타이드", "상보성 핵산" 및 "상보성 뉴클레오타이드 서열"이라는 용어에 대한 동의어로 이용된다. 이들 용어는 실질적으로 함께 결합되는 2개의 폴리뉴클레오타이드의 특이적 세트가 아니라 서열에 기반한 폴리뉴클레오타이드 쌍에 적용된다.
배아 줄기(ES) 세포의 상동적 재조합을 통한 형질전환 동물 및 넉아웃 동물의 생성 및 분석은 중요한 의미를 제공한다. 형질전환 동물 또는 넉아웃 포유류는 예를 들어 상동적 재조합을 이용한 양성-음성 선택법에 의해 생성될 수 있다(미국특허 제5,464,764호; 미국특허 제5,487,992, 미국특허 제5,627,059; Proc. Natl. Acad. Sci. USA, Vol. 86, 8932-8935, 1989; Nature, Vol. 342, 435-438, 1989 등참조). 넉아웃 동물(또한 유전자 타겟팅이라고도 불림)의 생성은 예를 들어 Masami Murayama, masashi Yamamoto, eds. Jikken Igaku Bessatsu [Special Issue of Experimental Medicine], "Shintei Idenshi Kogaku Handobukku [Newly Revised Genetic Engineering Handbook]" Ver. 3, 1999, Yodo-sha, 특히 pp. 239-256; Shinichi Aizawa, (1995), Jikken Igaku Bessatsu [Special Issue of Experimental Medicine], "Jintagettingu - ES Saibo Wo Mottita Heni Mausu No Sakusei [Gene Targeting - Production of Mutant Mouse Using ES Cell] 등에서 조사되었다. 형질전환 동물 또는 넉아웃 포유류는 널리 이용되어 왔다. 본 발명에서 상기-기술된 방법은 필요에 따라 이용된다.
예를 들어 고등생물의 경우 재조합은 네오마이신 저항성 유전자를 이용한 양성 선택 또는 HSV의 티미딘 키나제 유전자 또는 디프테리아 독소 유전자를 이용한 음성 선택에 의해 효과적으로 선별된다. 넉아웃 PCR 또는 서던 블럿팅은 상동성 재조합체를 선별하는데 이용된다. 특히 타겟 유전자 일부가 양성 선택을 위해 네오마이신 저항성 유전자 등으로 치환되고, 음성 선택을 위한 HSVTK 유전자 등은 그의 말단에 결합되어 타겟팅 벡터를 유발한다. 타겟팅 벡터는 일렉트로포레이션에 의해 ES 세포 내로 도입된다. ES 세포는 G418 및 간시클로버(ganciclovir)의 존재시 선별된다. 생존한 콜로니가 분리되고 PCR 또는 서던 블럿팅되어 상동성 재조합을 선별한다.
상기-기술된 방법에서 타겟된 내생적 유전자는 분열되어 상응하는 기능이 부재하거나 감소된 수준의 기능을 지닌 형질전환 또는 넉아웃(타겟 유전자 재조합체, 유전자 분열된) 마우스를 수득하게 된다. 돌연변이가 타겟된 유전자에만 도입되기 때문에 본 방법은 유전자 기능의 분석에 유용하다.
원하는 상동성 재조합체가 선택된 후 수득된 재조합 ES 세포는 배반포 주입법 또는 집합 키메라법에 의해 정상 배아와 혼합되어 ES 세포와 숙주 배아의 키메라 마우스를 생성하게 된다. 배반포 주입법에서 ES 세포는 유리 피펫을 이용하여 배반포 내로 주입된다. 집합 키메라법에서 ES 세포 집단이 투명대가 없는 8-세포 단계 배아에 부착된다. 도입된 ES 세포를 지닌 배반포는 가임신된 양모의 자궁 내로 이식되어 키메라 마우스를 수득하게 된다. ES 세포는 전능성을 지니고 생체 내에서 생식세포를 포함한 어떠한 세포로도 분화될 수 있다. ES 세포로부터 유래된 생식세포를 지닌 키메라 마우스가 정상 마우스와 이종교배시 이형접합적으로 ES 세포의 염색체를 지닌 마우스가 수득된다. 수득된 마우스는 서로 이종교배되고, ES 세포의 동형접합성 변형된 염색체를 지닌 넉아웃 마우스가 수득된다. 키메라 마우스로부터 동형접합적으로 변형된 염색체를 지닌 넉아웃 마우스를 수득하기 위해 수컷 키메라 마우스가 암컷 야생형 마우스와 이종교배되어 F1 이형접합성 마우스를 생성한다. 수득된 수컷 및 암컷 이형접합성 마우스는 이종교배되고 F2 동형접합성 마우스가 선택된다. 원하는 유전자 돌연변이가 F1 및 F2 내로 도입되는지 여부는 재조합 ES 세포에 대한 에세이와 같이 서던 블럿팅, PCR, 염기 시퀀싱 등과 같은 일반적으로 이용되는 방법을 이용하여 측정된다.
다양한 유전자 기능이 선택적으로 분석될 수 없다는 문제점을 극복하는 또다른 기술로서 Cre 재조합효소의 세포 형태-특이적 발현이 Cre-loxP의 자리-특이적 재조합과 결합된 조건적 넉아웃 기술에 주목하고 있다. Cre-loxP를 이용하여 조건적 넉아웃 마우스를 수득하기 위해 네오마이신 저항성 유전자가 타겟 유전자의 발현을 저해하지 않는 사이트에 도입되고; loxP 서열이 엑손에 통합되는 방식으로 타겟팅 벡터가 ES 세포 내로 도입되고, 이는 나중에 제거되고, loxP 서열 내에서 파괴될 것이고; 이후 상동성 재조합체가 분리된다. 키메라 마우스는 분리된 콜로니로부터 수득된다. 따라서 유전적으로 변형된 마우스가 생성된다. 다음으로 E. colli의 P1 파지-유래된 자리-특이적 재조합 효소 Cre가 조직-특이적 방식으로 발현되는 형질전환 마우스가 마우스와 이종교배된다. 이러한 경우 유전자는 Cre를 발현하는 조직 내에서만 분열된다(Cre는 특히 loxP 서열(34 bp)를 인식하고, 2개의 loxP 서열 사이의 서열은 재조합되고 분열됨). Cre는 기관-특이적 프로모터에 결합된 Cre 유전자를 지닌 형질전환 마우스와 이종교배하거나 Cre 유전자를 지닌 바이러스 벡터를 이용함으로서(Stanford W. L., et al., Nature Genetics 2:756-768(2001) 성체 내에서 발현될 수 있다.
따라서 본 발명의 생물체가 생성될 수 있다.
(폴리펩타이드 생성 방법)
본 발명의 방법에 의해 생성된 미생물, 동물세포 등으로부터 유래된 형질전환체는 일반 배양법에 따라 배양된다. 본 발명의 폴리펩타이드가 생성되고 수득된다. 본 발명의 폴리펩타이드는 배양액으로부터 수집되어 본 발명의 폴리펩타이드를 생성할 수 있게 한다.
본 발명의 형질전환체는 숙주 세포에 이용되는 일반 방법에 따라 배양 배지 상에서 배양될 수 있다. 숙주로서 원핵생물(즉, E. coli) 또는 진핵생물(즉, 효모)로부터 수득된 형질전환체에 대한 배양 배지는 배지가 본 발명의 생물체가 동화할 수 있는 탄소원, 질소원, 무기염 등을 포함하고, 배지가 형질전환체의 효과적 배양을 가능하게 하는 한 자연-발생적 배양 배지 또는 합성적 배양 배지도 된다.
탄소원은 탄수화물(즉, 포도당, 과당, 자당, 이들을 함유한 당밀, 전분, 전분 가수분해물 등), 유기산(즉, 아세트산, 프로피온산 등), 알코올(즉, 에탄올, 프로판올 등)과 같은 생물체에 의해 동화될 수 있는 어떠한 탄소원도 포함한다.
질소원은 무기산 또는 유기산의 암모늄염(즉, 암모니아, 염화암모늄, 황산암모늄, 아세트산암모늄, 인산암모늄 등) 및 다른 질소-함유 물질(즉, 펩톤, 고기추출물, 효모추출물, 콘 스팁 리커(corn steep liquor), 카세인 가수분해물, 대두 케이크 및 대두 케이크 가수분해물, 다양한 발효 박테리아 및 그의 소화 생성물) 등을 포함한다.
인산칼륨(I), 인산칼륨(II), 인산마그네슘, 염화나트륨, 황산철(I), 황산마그네슘, 황산구리, 탄산칼슘 등과 같은 무기산의 염이 이용될 수 있다. 배양은 진탕 배양을 위한 호기성 조건, 깊은 폭기 교반 배양 하에서 수행된다.
배양 온도는 바람직하게는 15∼40℃이고, 다른 온도도 이용될 수 있다. 특히 본 발명에 따라 온도 저항성 생물체 또는 세포가 생성되는 경우 다른 온도가 가장 적당하다. 배양 시간은 일반적으로 5시간 내지 7일이다. 배양 배지의 pH는 3.0∼9.0에서 유지된다. 특히 본 발명에 따라 산 또는 알칼리 저항성 생물체 또는 세포가 생성되는 경우 다른 pH가 가장 적당하다. pH의 적정은 무기산 또는 유기산, 알칼리용액, 요소, 탄산칼슘, 암모니아 등을 이용하여 수행된다. 암피실린, 테트라사이클린 등과 같은 항생제는 배양 동안 배양 배지에 선택적으로 첨가된다.
유도성 프로머터를 포함한 발현 벡터를 이용하여 형질전환된 미생물을 배양할 때 배양 배지는 선택적으로 유도인자가 보충된다. 예를 들어 lac 프로모터를 포함한 발현 벡터를 이용하여 형질전환된 미생물이 배양될 때 이소프로필-β-D-티오갈락토피라노시드 등이 배양 배지에 첨가된다. 예를 들어 trp 프로모터를 포함한 발현 벡터를 이용하여 형질전환된 미생물이 배양될 때 인돌 아크릴산 등이 배양 배지에 첨가된다. 유전자가 도입된 세포 또는 기관은 발효조를 이용하여 대용량으로 배양될 수 있다. 배양 배지의 예는 일반적으로 이용되는 Murashige-Skoog(MS) 배지, White 배지 또는 옥신, 사이토카인과 같은 식물 호르몬이 보충된 이들 배지를 포함하나 이에 한정적인 것은 아니다.
예를 들어 동물세포가 이용될 때 세포를 배양하는 본 발명의 배양 배지는 일반적으로 이용되는 RPMI1640 배양 배지(The Journal of the American Medical Association, 199, 519 (1967)), Eagle's MEM 배양 배지(Science, 122, 501 (1952)), DMEME 배양 배지(Virology, 8, 396 (1959)), 199 배양 배지(Proceedings of the Society for the Biological Medicine, 73, 1(1950) 또는 소태아혈청이 보충된 이들 배양 배지를 포함한다.
배양은 일반적으로 예를 들어 5% CO2 대기 내에서 25∼40℃에서 pH 6∼8의 배지 내에서 1∼7일간 수행된다. 카나마이신, 페니실린, 스트렙토마이신과 같은 항생체는 배양동안 배양 배지에 선택적으로 첨가된다.
또한 본 발명의 폴리펩타이드는 당분야에 잘 알려지고 일반적으로 사용되는 효소를 분리하거나 정제하는 일반 방법을 이용하여 폴리펩타이드를 인코드하는 핵산 서열로 형질전환된 형질전환체 배양액으로부터 분리되거나 정제될 수 있다. 예를 들어 본 발명의 폴리펩타이드가 폴리펩타이드를 생성하기 위해 형질전환체 외부로 분비되면 배양액은 원심분리되어 용해성 프랙션을 수득한다. 정제된 표본은 용매 추출, 황산암모늄으로의 염석/탈염, 유기용매로의 침전, 수지로의 음이온교환크로마토그래피(즉, 디에틸아미노에틸(DEAE)-Sepharose, DIAION HPA-75(Mitsubishi Chemical Corporation)), 수지로의 양이온교환크로마토그래피(즉, S-Sepharose FF(Pharmacia)), 수지로의 소수성 크로마토그래피(즉, 부틸세파로스, 페닐세파로스), 분자체로의 겔 여과, 친화성 크로마토그래피, 크로마토포커싱, 전기영동(즉, 등전초점전기영동) 등과 같은 기술에 의해 용해성 프랙션으로부터 수득될 수 있다.
본 발명의 폴리펩타이드가 폴리펩타이드를 생성하기 위해 본 발명의 형질전환체 세포 내에서 용해된 형태로 축적되는 경우 배양액은 원심분리되어 배양액 내의 세포를 수집한다. 세포는 세척된 후 초음파 분쇄기, 프렌치 프레스, MANTON GAULIN 균질화기, Dinomil을 이용하여 분쇄되어 무-세포 추출 용액이 수득된다. 정제된 표본은 무-세포 추출 용액을 원심분리하거나 용매 추출, 황산암모늄으로의 염석/탈염, 유기용매로의 침전, 수지로의 음이온교환크로마토그래피(즉, 디에틸아미노에틸(DEAE)-Sepharose, DIAION HPA-75(Mitsubishi Chemical Corporation)), 수지로의 양이온교환크로마토그래피(즉, S-Sepharose FF(Pharmacia)), 수지로의 소수성 크로마토그래피(즉, 부틸세파로스, 페닐세파로스), 분자체로의 겔 여과, 친화성 크로마토그래피, 크로마토포커싱, 전기영동(즉, 등전초점전기영동) 등과 같은 기술에 의해 수득된 상청액으로부터 수득될 수 있다.
본 발명의 폴리펩타이드가 발현되어 세포 내에 불용성체로 형성되는 경우 세포는 채취되고 분쇄되고 원심분리된다. 수득된 침전 프랙션으로부터 본 발명의 폴리펩타이드가 일반적으로 이용되는 방법을 이용하여 수집된다. 불용성 폴리펩타이드는 폴리펩타이드 변성제를 이용하여 용해된다. 수득된 용해된 용액은 무-변성제 용액 또는 희석 용액 내로 희석되거나 폴리펩타이드 변성제의 농도가 나머 낮아서 폴리펩타이드를 변성시키지 못하는 경우 투석된다. 본 발명의 폴리펩타이드는 정상 3-차원 구조를 형성하게 되고, 정제된 표본은 상기 기술된 분리 및 정제에 의해 수득된다.
정제는 일반적으로 이용되는 단백질 정제법에 따라 수행될 수 있다(J. Evan. Sadler et al.: Methods in Enzymology, 83, 458). 대안으로, 본 발명의 폴리펩타이드는 다른 단백질과 융합되어 융합 단백질을 생성하고, 융합 단백질은 융합 단백질에 친화력을 지닌 물질을 이용한 친화성 크로마토그래피를 이용하여 정제될 수 있다(Akio Yamakawa, Experimental Medicine, 13, 469-474(1995)). 예를 들어 Lowe et al., Proc. Natl. Acad. Sci. USA, 86, 8227-8231(1995), Genes Develop., 4, 1288(1990)에 기술된 방법에 따라 단백질 A를 지닌 본 발명의 폴리펩타이드의 융합 단백질이 생성된 후 면역글로불린 G를 이용한 친화성 크로마토그래피로 정제된다.
FLAG 펩타이드를 지닌 본 발명의 폴리펩타이드의 융합 단백질이 생성된 후 항-FLAG 항체를 이용한 친화성 크로마토그래피로 정제된다(Proc. Natl. Acad. Sci. USA, 86, 8227(1989), Genes Develop., 4, 1288(1990)).
본 발명의 폴리펩타이드는 폴리펩타이드에 결합하는 항체를 이용한 친화성 크로마토그래피로 정제될 수 있다. 본 발명의 폴리펩타이드는 알려진 방법에 따라 시험관 내 전사/번역 시스템을 이용하여 생성될 수 있다(J. Biomolecular NMR, 6, 129-134; Science, 242, 1162-1164; J. Biochem., 110, 166-168(1991)).
또한 본 발명의 폴리펩타이드는 그의 아미노산 정보에 기반하여 Fmoc 방법(플루오르에닐메틸옥시카르보닐 방법), tBoc 방법(t-부틸옥시카르보닐 방법)과 같은 화학 합성법에 의해 생성될 수 있다. 펩타이드는 펩타이드 합성기(Advanced ChemTech, Applied Biosystems, Pharmacia Biotech, Protein Technology Instrument, Synthecell-Vega, PerSeptive, Shimazu 등에서 제조)를 이용하여 화학적으로 합성될 수 있다.
본 발명의 정제된 폴리펩타이드의 구조는 단백질화학에서 일반적으로 이용되는 방법에 의해 수행될 수 있다(예를 들어 Hisashi Hiroano. "Protein Structure Analysis for Gene Cloning", published by Tokyo Kagaku Dojin, 1993 참조). 본 발명의 신규한 ps20-유사 펩타이드의 생리적 활성이 알려진 측정 기술에 의해 측정될 수 있다(Cell, 75, 1389(1993); J. Cell Bio., 1146, 233(1999); Cancer Res. 58, 1238(1998); Neuron 17, 1157(1996); Science 289, 1197(2000) 등).
(선별)
여기서 사용된 "선별"이라는 용어는 특정한 작용/평가 방법을 이용하여 다수의 요소를 포함한 집단으로부터 목적의 제공된 특정 성질을 지닌 생물체, 물질과 같은 타겟의 선택을 나타낸다. 선별을 위해 작용제(즉, 항체), 본 발명의 폴리펩타이드 또는 핵산 분자가 이용될 수 있다. 선별은 시험관 내, 생체 내 또는 대안으로 인 실리코(in silico)(컴퓨터를 이용한 시스템에서)로 수득된 라이브러리를 이용하여 수행된다. 본 발명이 선별에 의해 수득된 원하는 활성을 지닌 화합물을 포함함이 이해될 것이다. 또한 본 발명은 본 발명의 개시에 기반한 컴퓨터 모델링에 의해 생성된 약물을 제공하고자 한다.
선별 또는 확인 방법은 당분야에 잘 알려져 있고 예를 들어 마이크로타이터 플레이트; DNA, 단백질과 같은 분자의 어레이 또는 칩으로 수행될 수 있다. 표본을 포함한 피험체의 예는 유전자 라이브러리, 조합 라이브러리를 이용하여 합성된 화합물 라이브러리를 포함하나 이에 한정적인 것은 아니다.
따라서 본 발명의 바람직한 실시태양에서 장애 또는 질병을 조절할 수 있는 작용제를 확인하는 방법이 제공된다. 이러한 조절 작용제는 질병에 대한 약제 또는 그의 전구체로 이용될 수 있다. 이러한 조절 작용제, 조절 작용제를 포함한 약제 및 이를 이용한 치료는 본 발명에 의해 포함된다.
따라서 본 발명이 본 발명의 개시의 관점에서 컴퓨터 모델리에 의해 수득된 약물을 제공함이 고려된다.
본 발명의 또다른 실시태양에서 본 발명은 효과적인 조절 활성을 지닌 본 발명의 화합물에 대한 선별 기구로서 이용되는 컴퓨터-원조 양적 구조 활성 관계(QSAR) 모델링 기술에 의해 수득된 화합물을 포함한다. 여기서 컴퓨터 기술은 컴퓨터에 의해 제조된 여러 기질 주형, 약물작용발생단, 본 발명의 활성 부분의 상동성 모델을 포함한다. 일반적으로 시험관 내에서 수득된 데이터를 기반으로 또다른 물질과 상호작용하는 물질의 일반적 특성 그룹을 모델링하는 방법은 최근 CATALYSTTM 약물작용발생단 방법(Ekins et al., Pharmacogenetics, 9:477-489, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 288:21-29, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 290:429-438, 1999; Ekins et al., J. Pharmacol. & Exp. Ther., 291:424-433, 1999), 비교 분자 분야 분석(comparative molecular filed analysis, CoMFA)(Jones et al., Drug Metabolism & Disposition, 24:1-6, 1996)을 포함한다. 본 발명에서 컴퓨터 모델링은 분자 모델링 소프트웨어를 이용하여 수행된다(즉, CATALYSTTM Version 4 (Molecular Simulation, Inc., San Diego, CA).
활성 사이트에 대해 화합물을 맞추는 것은 당분야에 알려진 다양한 컴퓨터 모델링 기술을 이용하여 수행될 수 있다. 활성 사이트에 대한 화합물의 시각적 검사 및 수동 작동은 QUANTA(Molecular Simulations, Burlington, MA, 1992), SYBYL(Molecular Modeling Software, Tripos Associates, Inc., St. Louis, MO, 1992), AMBER(Weiner et al., J. Am. Chem. Soc., 106:765-784, 1984), CHARMM(Brooks et al., J. Comp. Chem., 4:187-217, 1983)과 같은 프로그램을 이용하여 수행될 수 있다. 더욱이 에너지 최소화는 CHARMM, AMBER와 같은 표준 힘의 장를 이용하여 수행될 수 있다. 다른 상세화된 컴퓨터 모델링 방법의 예는 GRID(Goodford et al., J. Med. Chem., 28:849-857, 1985), MCSS(Miranker and Karplus, Function and Genetics, 11:29-34, 1991), AUTODOCK(Goodsell and Olsen, Proteins: Structure, Function and Genetics, 8:195-202, 1990), DOCK(Kuntz et al., J. Mol. Biol., 161:269-288, 1982) 등을 포함한다. 더욱이 구조 화합물은 LUDI(Bohm, J. Comp. Aid. Molec. Design, 6:61-78, 1992), LEGEND(Nishibata and Itai, Tetrahedron, 47:8985, 1991), LeapFrog(Tripos Associates, St. Louis, MO)와 같은 컴퓨터 프로그램으로 빈 활성 사이트, 알려진 작은 분자 화합물의 활성 사이트를 이용하여 새롭게 구축될 수 있다. 상기-기술된 모델링 방법은 당분야에서 일반적으로 이용된다. 본 발명에 의해 포함된 화합물은 본 발명의 개시에 기반하여 당어자에 의해 적당히 고안될 수 있다.
(질병)
본 발명은 목적 생물체가 겪고 있는 질병 및 장애를 목표로한다(즉, 모델 동물의 생성 등).
하나의 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 순환계(혈액 세포 등)에 관한 것이다. 질병 또는 장애의 예는 빈혈(즉, 무형성 빈혈(특히 중증 무형성 빈혈), 신장 빈혈, 암성 빈혈, 속발성 빈혈, 불응성 빈혈), 암 또는 종양(즉, 백혈병); 화학치료 후 조혈부전, 혈소판감소증, 급성 림프구성 백혈병(특히 1차 완화(고-위험 그룹), 2차 완화 및 그후), 만성 골수성 백혈병(특히 1차 완화(고-위험 그룹), 2차 완화 및 그후), 다발성 골수종(특히 발병 후 초기)을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에서 목표된 질병 및 장애는 신경계에 관한 것이다. 이러한 질병 또는 장애의 예는 치매, 뇌중풍 및 그의 후유증, 뇌종양, 척추손상 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 면역체계에 관한 것이다. 이러한 질병 또는 장애의 예는 T-세포 결핍 증후군, 백혈병 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 운동 기관 및 골격계에 관한 것이다. 이러한 질병 또는 장애의 예는 골절, 골다공증, 관절 탈구, 부분탈구, 염좌, 인대 손상, 골관절염, 골육종, Ewing 육종, 골형성부전증, 골연골이형성증 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 피부계통에 관한 것이다. 이러한 질병 또는 장애의 예는 무모증, 흑색종, 피부 악성 림프종, 혈관육종, 조직구증, 수포증, 농포증, 피부염, 습진 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 내분비계에 관한 것이다. 이러한 질병 또는 장애의 예는 시상하부/뇌하수체 질환, 갑상선 질환, 부수갑상선(부갑상선) 질환, 부신피질/골수 질환, 당대사 이상, 지질대사 이상, 단백질대사 이상, 핵산대사 이상, 대사의 선천성 이상(페닐케톤뇨증, 갈락토스혈증, 호모시스틴뇨증, 단풍시럽뇨병), 알부민결핍혈증, 아스코르브산 합성능 결핍, 고빌리루빈혈증, 칼리크레인 결핍, 비만 세포 결핍, 요붕증, 바소프레신 분비 이상, 왜소증, 울만 질환(산 리파제 결핍), 점액다당류증 Ⅵ 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 호흡기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 폐질환(즉, 폐렴, 폐암), 기관지 질환 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 소화기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 식도질환(즉, 식도암), 위장/십이지장 질환(즉, 위암, 십이지장암), 소장질환/대장질환(즉, 결장 용종, 결장암, 직장암), 담관 질환, 간질환(즉, 간경화, 간염(A, B, C, D, E), 전격간염, 만성간염, 초기 간암, 알코올성 간질환, 약물 유도 간질환), 췌장질환(급성 췌장염, 만성 췌장염, 췌장암, 낭성 췌장질환), 복막/배벽/횡격막 질환(헤르니아), 헤르쉬스프룽병 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 비뇨기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 신장질환(즉, 신장부전, 초기 사구체질환, 신혈관성질환, 세뇨관기능 이상, 간질성 신장질환, 전신병에 의한 신장장애, 신장암), 방광질환(즉, 방광염, 방광암) 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 생식기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 남성 생식기관 질환(즉 남성불임, 전립샘비대, 전립선암, 고환암), 여성 생식기관 질환(즉, 여성불임, 난소 기능 장애, 자궁탈출증, 자궁선근증, 자궁암, 자궁내막증, 난소암, 융모질환) 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에 의해 목표된 질병 및 장애는 순환기계통에 관한 것이다. 이러한 질병 또는 장애의 예는 심장마비, 협심증, 심근경색증, 부정맥, 판막염, 심근/심낭막 질환, 선천심장병(즉, 심방중격결손증, 동맥관개방증, 팔로사징증), 동맥질환(즉, 동맥경화증, 동맥류), 정맥질환(즉, 정맥류), 림프관질환(즉, 림프부종) 등을 포함하나 이에 한정적인 것은 아니다.
본 발명에 의해 목표된 질병 및 장애는 식물의 질병 및 장애에 관한 것이다. 식물의 질병 또는 장애의 예는 벼 도열병, 추운 날씨에 의한 장애 등을 포함하나 이에 한정적인 것은 아니다.
본 발명에 따라 수득된 생성물 물질이 약제로서 이용될 때 약제는 약제적으로 수용가능한 담체를 더욱 포함한다. 당분야에 알려진 어떠한 약제적으로 수용가능한 담체도 본 발명의 약제에 이용된다.
약제적으로 수용가능한 담체 또는 적당한 포뮬레이션 물질은 항산화제, 방부제, 착색제, 향미제, 희석제, 유화제, 현탁제, 용매, 중진제, 거대 작용제, 완충액, 전달 운반제 및/또는 약제적 보조제를 포함하나 이에 한정적인 것은 아니다. 대표적으로 본 발명의 약제는 아디포넥틴(adiponectin) 또는 그의 변이체 또는 단편 또는 적어도 하나 이상의 약제적으로 수용가능한 담체, 부형제 또는 희석제를 지닌 그의 변이체 또는 유도체의 형태로 투여된다. 예를 들어 적당한 운반제는 비경구적 전달을 위한 조성물에 일반적으로 사용되는 다른 물질로 보충될 수 있는 주사용액, 생리적 용액 또는 인공 뇌척수액이다.
여기서 사용되는 수용가능한 담체, 부형제 또는 안정화제는 바람직하게는 수용자에 비독성적이고 바람직하게는 사용되는 투여량 및 농도에서 불활성이고, 바람직하게는 인산, 구연산 또는 다른 유기산; 아스코르브산, α-토코페롤; 저분자량 폴리펩타이드; 단백질(즉, 혈청알부민, 젤라틴 또는 면역글로불린); 친수성 폴리머(즉, 폴리비닐피롤리돈); 아미노산(즉, 글리신, 글루타민, 아스파라긴, 아르기닌 또는 라이신); 단당류, 이당류 및 다른 탄수화물(포도당, 만노즈 또는 덱스트린); 킬레이트제(즉, EDTA), 당알코올(즉, 만니톨 또는 소르비톨); 염-형성 반대이온(즉, 나트륨); 및/또는 비이온성 계면활성제(즉, Tween, 플루로닉스(pluronics) 또는 폴리에틸렌글리콜(PEG))를 포함한다.
적당한 담체의 예는 중성 완충 식염수 또는 혈청알부민이 혼합된 식염수를 포함한다. 바람직하게는 생성물은 적당한 부형제(즉, 자당)를 이용한 동결건조체로 포뮬레이트된다. 다른 표준 담체, 희석제 및 부형제는 원하는 바대로 포함된다. 다른 예시적 조성물은 약 pH 7.0∼8.5의 Tris 완충액 또는 약 pH 4.0∼5.5의 아세트산 완충액을 포함하고, 이는 소르비톨 또는 그의 적당한 치환체를 더욱 포함한다.
이후 본 발명의 약제의 일반적으로 이용되는 제조 방법이 기술될 것이다. 동물 약물 조성물, 준-약물, 해양 약물 조성물, 식품 조성물, 화장품 조성물이 알려진 제조 방법을 이용하여 제조될 수 있다.
본 발명의 생성물 물질은 약제적으로 수용가능한 담체와 혼합될 수 있고 고형 포뮬레이션(즉, 정제, 캡슐, 과립, 추출, 분말, 좌약) 또는 액체 포뮬레이션(즉, 시럽, 주사액, 현탁액, 용액, 분무제)으로서 경구적으로 또는 비경구적으로 투여될 수 있다. 약제적으로 수용가능한 담체의 예는 고형 포뮬레이션 내에 부형제, 윤활제, 결합제, 붕괴제, 붕괴억제제, 흡수 프로모터, 흡착제, 습윤제, 용해제, 안정화제를; 액체 포뮬레이션 내에 용매, 용해제, 현탁제, 등장제, 완충액, 연화제를 포함한다. 방부제, 항산화제, 착색제, 감미료와 같은 포뮬레이션 첨가제가 선택적으로 사용될 수 있다. 본 발명의 조성물은 본 발명의 생성물 물질 이외의 물질과 혼합될 수 있다. 투여의 비경구 경로의 예는 정맥내 주사, 근육내 주사, 비강내, 직장내, 질내, 경피를 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 부형제의 예는 포도당, 유당, 자당, D-만니톨, 결정화된 셀룰로즈, 전분, 탄산칼슘, 가벼운 규산 무수물, 염화나트륨, 카올린, 요소 등을 포함한다.
고형 포뮬레이션 내의 윤활제의 예는 스테아르산마그네슘, 스테아르산칼슘, 붕산 분말, 콜로이드성 실리카, 활석, 폴리에틸렌글리콜 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 결합제의 예는 물, 에탄올, 프로판올, 사카로스, D-만닌톨, 결정화된 셀룰로즈, 덱스트란, 메틸셀룰로즈, 하이드록시프록시셀룰로즈, 하이드록시프록시메틸셀룰로즈, 카르복시메틸셀룰로즈, 전분용액, 젤라틴용액, 폴리비닐피롤리돈, 인산칼슘, 인산칼륨, 셸랙(shellac) 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 붕괴제의 예는 전분, 카르복시메틸셀룰로즈, 카르복시메틸셀룰로즈 칼슘, 한천 분말, 라미나린(laminarin) 분말, 크로스카멜로즈(croscarmellose) 나트륨, 카르복시메틸 전분 나트륨, 나트륨 알기네이트, 나트륨 탄화수소물, 탄산칼슘, 폴리옥시에틸렌 소르비탄 지방산 에스테르, 라우릴 황산 나트륨, 전분, 모노글리세라이드 스테아레이트, 유당, 칼슘 글리코레이트 셀룰로즈 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 붕괴 억제제의 예는 수소-첨가된 오일, 사카로즈, 스테아린, 카카오 버터, 경화유 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 흡수 프로모터의 예는 4차암모늄염, 라우릴 황산나트륨 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 흡수제의 예는 전분, 유당, 카올린, 벤토나이트, 콜로이드성 실리카 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 습윤제의 예는 글리세린, 전분 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 용해제의 예는 아르기닌, 글루탐산, 아스파르트산 등을 포함하나 이에 한정적인 것은 아니다.
고형 포뮬레이션 내의 안정화제의 예는 인간 혈청알부민, 유당 등을 포함하나 이에 한정적인 것은 아니다.
정제, 환약 등이 고형 포뮬레이션으로 제조될 때 이들은 위장 또는 소장 내에서 용해가능한 물질의 필름으로 선택적으로 코팅된다(사카로스, 젤라틴, 하이드록시프로필셀룰로즈, 하이드록시프로필메틸셀룰로즈, 프탈레이트 등). 정제는 선택적으로 일반적인 코팅을 지닌 것을 포함한다(즉, 당의정, 젤라틴 코팅된 정제, 장 코팅된 정제, 필름 코팅된 정제 또는 이중 정제, 다층 정제 등). 캡슐은 경질캡슐 및 연질캡슐을 포함한다. 정제가 좌약을 형태로 몰드되는 경우 고급 알코올, 고급 알코올에스테르, 반-합성 글리세라이드 등이 상기-기술된 첨가제 이외에 첨가될 수 있다. 본 발명은 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 용액의 바람직한 예는 주사용액, 알코올, 프로필렌글리콜, 매크로골, 참기름, 옥수수유 등을 포함한다.
액체 포뮬레이션 내 용해제의 바람직한 예는 폴리에틸렌글리콜, 프로필렌글리콜, D-만니톨, 벤질 안식향산염, 에탄올, 트리스아미노메탄, 콜레스테롤, 트리에탄올아민, 탄산나트륨, 구연산나트륨 등을 포함하나 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 현탁제의 바람직한 예는 계면활성제(즉, 스테아릴트리에탄올아민, 라우릴황산나트륨, 라우릴아미노프로피온산, 레시틴, 염화벤잘코늄, 염화벤제토늄, 글리세린모노스테아레이트 등), 친수성 거대분자(즉, 폴리비닐알코올, 폴리비닐피롤리돈, 카르복시메틸셀룰로즈나트륨, 메틸셀룰로즈, 하이드록시메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈 등) 등을 포함한다.
액체 포뮬레이션 내 등장제의 바람직한 예는 염화나트륨, 글리세린, D-만니톨 등을 포함하나 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 완충액의 바람직한 예는 인산염, 아세트산염, 탄산염, 구연산염 등을 포함하나 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 연화제의 바람직한 예는 벤질알코올, 염화벤잘코늄, 염화수소프로카인 등을 포함하나 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 방부제의 바람직한 예는 파라하이드록시벤조에이트에스테르, 클로로부탄올, 벤질알코올, 2-페닐에틸알코올, 디하이드로아세트산, 소르부산 등을 포함하나 이에 한정적인 것은 아니다.
액체 포뮬레이션 내 항산화제의 바람직한 예는 아황산염, 아스코르브산, α-토코페롤, 시스테인 등을 포함하나 이에 한정적인 것은 아니다.
액체 작용제 및 현탁액이 주사제로서 제조되는 경우 이들은 멸균되고 바람직하게는 혈액과 등장성이다. 일반적으로 이들 작용제는 박테리아-보유 필터를 이용한 여과, 살균제와의 혼합 또는 방사선처리에 의해 무균성이 된다. 이들 처리 후 이들 작용제는 동결건조에 의해 고형화된다. 사용 직전에 멸균수 또는 멸균 주사 희석액(염화수소리도카인 수용액, 생리식염수, 포도당 수용액, 에탄올 또는 그의 혼합물)이 첨가된다.
본 발명의 약제적 조성물은 착색제, 방부제, 풍미제, 방향 화학제, 감미료 또는 다른 약물을 더욱 포함한다.
본 발명의 약제는 경구적으로 또는 비경구적으로 투여된다. 대안으로, 본 발명의 약제는 정맥내로 또는 피하로 투여된다. 전신으로 투여되는 경우 본 발명에서 사용되는 약제는 무-발열원의 약제적으로 수용가능한 수용액의 형태이다. pH, 등장성, 안정성 등에 관한 이러한 약제적으로 수용가능한 조성물의 제조는 당분야의 범위에 있다. 여기서 투여 방법은 경구 투여 및 비경구 투여(즉, 정맥내, 근육내, 피하, 비강내, 점막내, 직장내, 질내, 영향 받는 사이트에 국부적으로, 피부로)를 포함한다. 이러한 투여의 처방은 어떠한 형태로도 제공된다. 이러한 포뮬레이션 형태는 액체 포뮬레이션, 주사제, 지속성 제제 등을 포함한다.
본 발명의 약제는 동결건조된 케이크 또는 수용액의 형태로 원하는 정도의 순도를 지닌 당 체인 조성물을 선택적인 약제적으로 수용가능한 담체, 부형제 또는 안정화제와 혼합함으로서 보관용으로 제조된다(Japanese Pharmacopeia 14th Edtion or the latest edition; Remington's Pharmaceutical Sciences, 18th Edtion, A. R. Gennaro, ed., Mack Publishing Company, 1990 등).
다양한 전달 시스템이 알려져 있고 본 발명의 화합물을 투여하는데 이용될 수 있다(즉, 리포솜, 미립자, 마이크로캡슐). 도입 방법은 피내, 근육내, 복막내, 정맥내, 피하, 비강내, 경막외 및 구강 경로를 포함하나 이에 한정적인 것은 아니다. 화합물 또는 조성물은 어떠한 편리한 경로로도 투여되고(즉, 주입 또는 환약 주사에 의해, 상피 또는 점막피부 내층(즉, 구강 점막, 직장 및 창자 점막 등)에 의해) 다른 생물학적으로 활성인 작용제와 함께 투여된다. 투여는 전신정 또는 국부성이 될 수 있다. 더욱이 어떠한 적당한 경로(심실내 및 경막내 주사; 심실내 주사는 예를 들어 Ommaya 저장소와 같은 저장소에 부착된 심실내 카테테르에 의해 촉진됨)에 의해 본 발명의 약제적 화합물 또는 조성물을 중추신경계 내로 도입시키는 것이 바람직하다. 또한 흡입기 또는 연무기의 이용 및 연무제와의 포뮬레이션에 의해 폐 투여도 이용될 수 있다.
특정한 실시태양에서 본 발명의 생성물 물질 또는 동일한 것을 포함한 조성물을 치료가 요구되는 부위에 국부적으로 투여하는 것이 바람직하고(즉, 중추신경계, 뇌 등); 이는 예를 들어 수술 동안의 국부적 주입, 국부 도포(즉, 수술 후 상처와의 컨쥬게이션), 주사, 카테테르, 좌약, 임플란트(임플란트는 시알라스틱 멤브레인과 같은 멤브레인 또는 섬유를 포함한 다공성, 비-다공성 또는 젤라틴 물질임)에 의해 달성되나 이에 한정적인 것은 아니다. 바람직하게는 본 발명의 항체를 포함한 단백질의 투여시 단백질이 흡수되지 않는 물질을 이용하는 것이 고려되어야 한다.
또다른 실시태양에서 화합물 또는 조성물은 운반제, 특히 리포솜 내에서 전달될 수 있다(Langer, Science 249:1527-1533(1990); Treat et al., Liposomes in the Therapy of Infectious Disease and Cancer, Lopez-Berestein and Fidler(eds.), Liss, New York, pp.353-365 (1989); Lopez-Berestein, ibid., pp.317-327 참조).
또다른 실시태양에서 화합물 또는 조성물은 제어된 분비 시스템으로 전달될 수 있다. 하나의 실시태양에서 펌프가 이용된다(Langer, 상동; Sefton, CRC Crit. Ref. Biomed. Eng. 14:201(1987); Buchwald et al., Surgery 88:507(1980); Saudek et al., N. Engl. J. Med. 321:574(1989) 참조). 또다른 실시태양에서 중합 물질이 이용될 수 있다(Medical Applications of Controlled Release, Langer and Wise(eds.), CRC Pres., Boca Raton, Florida(1974); Controlled Drug Bioavailability, Drug Product Design and Performance, Smolen and Ball(eds.), Wiley, New York(1984); Ranger and Peppas, J., Macromol. Sci. Rev. Macromol. Chem. 23:61(1983); Levy et al., Science 228:190(1985); During et al., Ann. Neurol. 25:351(1989); Howard et al., J. Neurosurg. 71:105(1989) 참조).
또다른 실시태양에서 제어된 분비 시스템은 치료 타겟 즉 뇌에 근접하여 위치할 수 있어서 전신성 투여량의 프랙션만을 필요로 한다(Goodson, in Medical Applications of Controlled Release, 상동, vol. 2, pp.115-138(1984) 참조).
다른 제어된 분비 시스템은 Langer에 의한 보고서에서 논의되었다(Science 249:1527-1533(1990)).
본 발명의 치료 방법에 사용되는 화합물의 양은 이용 목적, 목표 질병(형태, 경중도 등), 환자의 연령, 체중, 성별 및 병력, 세포의 형상 또는 형태를 참고하여 당업자에 의해 용이하게 결정될 수 있다. 또한 피험자(환자)에게 적용되는 본 발명의 치료 방법의 빈도는 이용 목적, 목표 질병(형태, 경중도 등), 환자의 연령, 체중, 성별 및 병력, 치료의 진행을 참고하여 당업자에 의해 결정될 수 있다. 본 빈도의 예는 하루에 한 번 내지 수개월에 한 번(즉, 1주에 한 번 내지 1개월에 한번)을 포함한다. 바람직하게는 투여는 진행을 참고로 1주에 한 번 내지 1개월에 한 번으로 수행된다.
본 발명의 생성물 물질의 투여량은 피험자의 연령, 체중 및 건강상태 또는 투여 방법에 따라 달라지고, 일반적으로 성인의 경우 경구 투여시 하루에 0.01 mg 내지 10 g, 바람직하게는 0.1 mg 내지 1 g, 1 mg 내지 100 mg, 0.1 mg 내지 10 mg; 비경구 투여시 0.01 mg 내지 1g, 바람직하게는 0.01 mg 내지 100 mg, 0.1 mg 내지 100 mg, 1 mg 내지 100 mg, 0.1 mg 내지 10 mg을 포함하나 이에 한정적인 것은 아니다. 본 발명은 이에 한정적인 것은 아니다.
여기서 사용된 "투여하다"라는 용어는 본 발명의 폴리펩타이드, 폴리뉴클레오타이드 또는 이들을 함유한 약제적 조성물이 단독으로 또는 다른 치료 작용제와 결합하여 생물체의 세포 조직 내로 통합되는 것을 의미한다. 결합은 동시에(즉, 혼합물), 개별적이나 동시에 또는 동시발생적으로; 또는 연속적으로 투여된다. 이는 결합된 작용제는 치료 혼합물로서 함께 투여되는 프리젠테이션 및 결합된 작용제가 개별적이나 동시에 투여되는(즉, 개별적인 정맥 라인을 통해 동일한 개체로) 절차를 포함한다. "결합" 투여는 먼제 제공된 화합물 또는 작용제 중의 하나의 개별적 투여후 두 번째가 뒤따르는 것을 더욱 포함한다.
여기서 사용된 "지침"은 투여하거나 투여받는 사람에 대한 본 발명의 약제를 투여하는 방법, 진단 방법, 약제, 진단하거나 진단받는 사람(의사, 환자)을 설명한다. 본 지침은 본 발명의 진단제, 약제를 투여하는 적당한 방법을 나타내는 설명을 기술한다. 지침은 본 발명이 실행되는 국가 당국에 의해 정의된 포맷에 따라 준비되고(즉, 일본후생노동성, 미국 식품의약국(FDA)), 지침이 당국에 의해 승인된 것임을 명백하게 기술한다. 지침은 소위 팩키지 삽입물이고 일반적으로 종이 매체로 제공된다. 지침은 이에 한정적인 것은 아니고 전자 매체(즉, 웹 사이트 및 인터넷 상에 제공되는 전자 메일)의 형태로 제공된다.
본 발명의 방법으로의 치료 종결의 판단은 상업적으로 구입가능한 에세이 또는 기구를 이용한 표준 임상 실험의 결과 또는 목적 질병에 특이적인 임상적 증상의 소멸에 의해 확인된다. 치료는 목적 질병의 재발로 재시작될 수 있다.
또한 본 발명은 하나 이상의 약제적 조성물이 적재된 하나 이상의 용기를 포함한 약제적 팩키지 또는 키트를 제공한다. 약제적 생성물 또는 생물학적 생성물의 생산, 이용 또는 판매를 조절하는 정부 기관에 의해 정의된 형태의 고지가 본 용기에 임의로 부착되고, 인간으로의 투여에 대해 생산, 이용 또는 판매에 관한 정부 기관의 승인을 나타낸다.
(본 발명의 바람직한 실시태양의 설명)
이후, 본 발명은 실시예에 의해 설명될 것이다. 하기 기술된 실시예는 예시적인 목적으로만 제공된다. 따라서 본 발명의 범위는 부가된 청구항을 제외하고는 한정적이지 않다.
본 발명의 하나의 관점에서 생물체 또는 세포의 유전 형질의 전환율을 조절하는 방법이 제공된다. 그 방법은 다음과 같은 단계로 구성된다: (a) 생물체 또는 세포의 유전자의 복제에서 오류-빈발 빈도를 조절하는 단계. 이 경우에는 오류-빈발 빈도는 예를 들면, 또는 선택적으로, DNA 중합효소의 중합반응에서 오류를 증가시키는 것에 의해 DNA 중합효소의 프루프리딩 기능을 조절하는 것으로 조절될 수 있다. 이러한 오류-빈발 빈도 조절은 당분야에서 잘 알려진 기술을 이용하여 수행될 수 있다. 오류-빈발 빈도 조절은 통상적으로 수득될 수 없는 범위 및 거의 자연적인 진화에 대해 빠른 돌연변이 유발을 제공한다. 더욱이 유익성 돌연변이 보다 더 많은 빈도로 발생하는 유해성 돌연변이가 UV, 화학약품 또는 이와 같은 것을 이용한 당분야에서 알려진 어떠한 돌연변이 유발과 비교해도 실질적으로 감소될 수 있다. 이것은 본 발명의 방법에서 도입된 돌연변이가 자연-발생적 진화 현상에서의 돌연변이와 동일한 현상이기 때문이다.
진화 세포 또는 생물체에 대한 본 발명의 방법에서는 오류-빈발 빈도를 조절하는 단계 및 요구되는 형질에 대해 수득된 세포 또는 생물체 선별 단계가 각각 수행될 수 있다. 두 개의 개별적인 단계를 수행하는 것으로 오류-빈발 빈도(또는 진화의 속도)는 선택 압력을 발휘하지 않는 조건하에서 조절될 수 있다; 개체의 수는 어느 수에 대해 증가될 수 있다; 및 변형은 선별되고 확인되었다. 이러한 단계는 목적하는 진화된 세포 또는 생물체가 효과적이고 실제적으로 수득될 수 있도록 유사하게 두 번 반복되었다.
종래의 방법에서는 유익성 형질전환의 발생 빈도는 생물체 또는 세포의 형질전환 빈도에서 증가를 나타내며 증가된다. 그러나 동시에 유해성 돌연변이 또한 일어난다. 일반적으로 UV, 화학약품 또는 이와 같은 것을 이용하는 당분야에서 알려진 어떠한 돌연변이 유발에 의해 제공되는 유해성 돌연변이의 발생 빈도와 비교해서 유익성 돌연변이의 발생 빈도가 실질적으로 감소될 수 있기 때문에 유해성 돌연변이의 발생 빈도가 높다. 따라서 종래의 방법에서는 UV, 화학약품 또는 이와 같은 것을 이용하는 당분야에서 알려진 어떠한 돌연변이 유발 방법과 비교해서 유해성 돌연변이의 발생 빈도가 실질적으로 감소될 수 있는 동안 생물체 또는 세포에서 다수의 유익성 돌연변이를 유도하는 것은 불가능하다.
몇몇의 종래의 돌연변이 방법에서는 자연 돌연변이가 사용되었다. 그러나 이 경우에는 자연 돌연변이의 발생 빈도는 상당히 낮았다(즉, E. coli에 대해 10-10 돌연변이(염기 당 복제 당) 등). 따라서 자연 돌연변이의 비율은 실용적이지는 않다. 더욱이 자연적으로 유익성 돌연변이가 발생한다. 따라서 자연 돌연변이의 의존하여 번식하는 것은 큰 생물체 개체군 및 긴 시간을 필요로 한다. 자연 돌연변이를 이용하는 방법과는 달리 본 발명의 방법은 오직 작은 생물체 개체군 및 한 개에서 몇 개의 발생에 대해 상응하는 시간만을 필요로 한다. 본 발명의 효과는 대단한 것이다.
자리-특이적 돌연변이에서는 오직 미리 결정된 돌연변이만이 유도될 수 있다. 신뢰도가 매우 높기는 하나 자리-특이적 돌연변이는 대규모 이용에는 어울리지 않고 돌연변이된 특성은 전체 생물체에 영향을 지니지 않는다. 따라서 자리-특이적 돌연변이는 반드시 유익성 돌연변이를 유발하는 것은 아니다. 따라서 자리-특이적 돌연변이는 자연 돌연변이를 모방한 것이라고 할 수 없고 유전자 재조합이 수행되는 것에 기인한 역효과의 불리한 점을 지닌다. 본 발명은 자연 돌연변이와 같이 실질적으로 동일한 돌연변이를 제공할 수 있지만 인공 돌연변이를 제공하지는 않는다.
다른 돌연변이 방법으로써 방사선, 돌연변이원 등을 이용하는 방법이 있다. 이러한 방법은 자연 돌연변이 보다 높은 빈도로 돌연변이를 발생시킬 수 있다. 그러나 방사선의 효과적인 분량 또는 돌연변이원의 효과적인 농도가 처리된 세포의 대부분을 사멸시킬 수도 있다. 다시 말하면 유해성 돌연변이는 생물체에 치명적이다. 돌연변이원을 이용하는 방법에 있어서 유해성 돌연변이 없이 돌연변이 유발을 유도하는 것을 불가능하다. 본 발명의 방법에 의해 유해성 돌연변이의 발생 빈도는 UV, 화학약품 또는 이와 유사한 것과 같은 상기 기술한 방법에 의한 돌연변이의 발생 빈도와 비교해서 실질적으로 감소될 수 있다. 본 발명의 방법은 오직 작은 생물체 개체군과 한 개에서 몇 개의 발생에 대해 상응하는 시간만을 필요로 한다.
본 발명에 따른 불균형 이론을 이용하여 유전적인 형질의 전환율을 조절하는 방법에 있어서, 조절된 프루프리딩 기능을 지니는 DNA 중합효소를 이용하는 것에 의해 많은 수의 돌연변이가 다른 스트랜드 보다 이중-스트랜드 게놈 DNA의 하나의 스트랜드 내로 도입되었다. 본 발명은 다수의 유익성 돌연변이가 유해성 돌연변이의 축적 없이 축적될 수 있다는 실험적인 수준에서 증명하는 첫 번째이다. 따라서 본 발명은 많은 돌연변이가 생물체 내로 도입되는 것이 요구되지만 생물체의 정상 생장(신진대사 등)은 유지하지 않는 불균형 이론을 반증한다. 따라서 본 발명은 획기적인-제조 발명이다. 특히 진핵세포 생물체는 복제의 다수의 양-방향성 기점(origin)을 지닌다. 만약 게놈 DNA가 복제의 양-방향성 기점을 지닌다면 불균형 방법은 유해성 돌연변이의 축적 없이 다수의 유익성 돌연변이를 축적할 수 없다. 본 발명의 방법에 따르면 유해성 돌연변이의 축적 없이 다수의 유익성 돌연변이가 축적될 수 있다는 것이 진핵세포 생물체에서조차 설명되었다.
바람직한 실시태양에서 래깅 스트랜드 및 리딩 스트랜드의 오직 하나 내로 개조된 프루프리딩 기능을 지닌 DNA 중합효소를 도입하기에 유리할 수도 있다.
본 발명에 의해 달성된 만족스러운 육종은 높은-속도 생물체 진화를 성취할 수 있을 것으로 생각된다. 높은-속도 생물체 진화는 일반적으로 개체의 상당한 유전적 다양성과 유익성 돌연변이의 안정된 확장을 요구한다. 안정된 확장은 정확한 DNA 복제에 의해 성취될 수 있는 반면 DNA 복제 동안 오류에 의한 돌연변이는 유전적 다양성을 생산한다.
본 발명의 효과는 진핵세포 생물체에서조차도 성취될 수 있는 높은-속도 진화이다. 진핵세포 생물체는 E. coli와는 달리 명확한 핵 구조를 가지고 있고 그들의 게놈은 다수의 염색체로 이루어져 있다. 따라서 본 발명은 종래의 기술로부터 기대되지 않을 수 없는 효과를 지닌다고 할 수 있다. 만약 진화 속도가 E. coli에서 조차 조절될 수 있다면 본 실시예에서 나타내기까지는 진화 속도가 진핵세포 생물체 및 그람-양성 박테리아에서 조절될 수 있다는 것은 기대할 수 없었을 것이다.
바람직한 실시태양에서 유전자 복제에서 역할을 하는 작용제는 적어도 두 종류 이상의 오류-빈발 빈도 작용제를 포함한다. 두 개의 오류-빈발 빈도 작용제는 바람직하게는 DNA 중합효소이다. 이러한 DNA 중합효소는 다양한 오류-빈발 빈도를 지닌다. 바람직한 실시태양에서 오류-빈발 빈도 작용제는 더 작은 오류-빈발 빈도를 지니는 작용제의 적어도 약 30% 이상, 더욱 바람직하게는 적어도 약 20% 이상, 더욱 바람직하게는 적어도 약 15% 이상을 포함하는 것이 바람직하다. 이러한 특징으로는 안정된 복제가 수행되는 동안 놀랄만한 진화를 보이며 발생되는 돌연변이의 증가 확률이다.
또다른 바람직한 실시태양에서, 본 발명에 따른 유전자 복제에서 역할을 하는 작용제(즉, DNA 중합효소 등)는 이질성 오류-빈발 서열을 지니는 것이 바람직하다. 균일하지 않은 오류-빈발 빈도는 종래의 기술과 비교해 진화의 속도를 증가하게 하고 오류 역치의 상한선을 제거하게 한다.
바람직한 실시태양에서 낮은 오류-빈발 빈도를 지니는 작용제는 실질적으로 오류가 없다. 그러나 실질적으로 게놈 당 오류가 없는 오류-빈발 빈도를 지니는 작용제는 바람직하게 사용될 수도 있다.
따라서 바람직한 실시태양에서 적어도 두 종류의 오류-빈발 빈도는 일반적으로 적어도 101까지, 바람직하게는 적어도 102까지, 더욱 바람직하게는 적어도 103 까지 서로 다르다. 이러한 빈도의 다양함으로 진화의 속도는 더욱 효과적으로 조절될 수 있다.
본 발명의 하나의 실시태양에서 오류-빈발 빈도 조절 단계는 생물체의 DNA 중합효소의 오류-빈발 빈도 조절을 포함한다. 목적 생물체의 DNA 중합효소의 오류-빈발 빈도는 생물체 내에 존재하는 DNA 중합효소를 직접 조절하는 것에 의해 조절될 수도 있다. 또는 선택적으로 외부에서 생물체 내로 변형된 오류-빈발 빈도를 지니는 DNA 중합효소를 도입하는 것에 의해 조절될 수도 있다. 이러한 DNA 중합효소의 조절은 당분야에서 잘 알려진 생물학적 기술에 의해 수행될 수도 있다. 그 기술들은 본 발명의 다른 부분에서 설명한다. 비-제한 실시예에서, DNA 중합효소의 직접적인 조절은 돌연변이가 이미 도입된 생물체 라인을 교차시키는 것에 의해 수행될 수 있다.
또다른 실시태양에서 DNA 중합효소는 프루프리딩 기능을 지닌다. 목적 생물체에서 프루프리딩 기능을 지니는 DNA 중합효소는 일반적으로 존재한다. 이러한 프루프리딩 기능을 지니는 DNA 중합효소의 예들은 복구 기능을 지니는 DNA 중합효소 δ 및 ε, DnaQ, DNA 중합효소 β, θ 및 λ 등을 포함하나 이에 한정적인 것은 아니다. DNA 중합효소의 프루프리딩 기능은 생물체 내에 존재하는 DNA 중합효소를 직접 조절하는 것에 의해 조절될 수도 있다. 또는 선택적으로 외부에서 생물체 내로 변형된 프루프리딩 기능을 지니는 DNA 중합효소를 도입하는 것에 의해 조절될 수도 있다. 이러한 DNA 중합효소의 조절은 당분야에서 잘 알려진 생물학적 기술에 의해 수행될 수도 있다. 그 기술들은 본 발명의 다른 부분에서 설명한다. 비-제한 실시예에서, DNA 중합효소의 직접적인 조절은 돌연변이가 이미 도입된 생물체 라인을 교차시키는 것에 의해 수행될 수 있다. 바람직하게는 변형된 DNA 중합효소를 인코딩하는 핵산 분자는 플라스미드 내로 혼합되고 플라스미드는 생물체 내로 도입되어 핵산 분자는 일시적으로 발현된다. 플라스미드 또는 이와 유사한 것의 일시적인 발현 특성 때문에 플라스미드 또는 이와 유사한 것은 사라진다. 따라서 유전적인 형질의 전환율의 조절 후에 야생형에서와 같은 동일한 전환율은 복구될 수 있다.
또다른 실시태양에서 본 발명의 DNA 중합효소는 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 적어도 하나 이상의 중합효소를 포함한다. 또한 또다른 실시태양에서 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 본 발명에서 사용되는 DNA 중합효소의 오직 하나는 조절될 수도 있다. 오직 하나의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것에 의해 한번 나타난 유전자형(야생형 포함)은 보존된다; 돌연변이의 높은 비율은 허용될 수도 있다; 게놈에서 넒은 범위(유전자)는 개선될 수 있다; 원래 형질은 보증될 수 있고 다양성은 증가될 수 있다; 진화는 종래의 수준을 능가하는 속도로 가속화될 수도 있다; 및 돌연변이된 형질은 안정하다.
본 발명의 또다른 실시태양에서 오류-빈발 빈도의 조절 단계는 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 군에서 선택된 적어도 하나 이상의 중합효소를 조절하는 것을 포함한다. 이러한 프루프리딩 활성은 예를 들면 중합효소의 3'-> 5' 엑소뉴클레아제 활성 중심을 변경시키는 것에 의해 조절될 수 있다(선택적으로 ExoI 모티브, 프루프리딩 기능 활성 부위) (예를 들면, 316 위치에서의 아스파르트산 및 318 위치에서의 글루탐산 및 인간 DNA 중합효소 δ의 부위 주변). 본 발명은 이에 한정적인 것은 아니다.
본 발명의 바람직한 실시태양에서 오류-빈발 빈도 조절 단계는 야생형에서보다 더 높은 수준으로 오류-빈발 빈도를 증가시키는 것을 포함한다. 야생형에서보다 더 높은 수준으로 오류-빈발 빈도를 증가시키는 것에 의한 생물체의 유전 형질 전환율(즉, 진화의 속도)은 생물체에서 역효과 없이 증가되었다. 이러한 성취는 종래에서는 기대하지 않았다. 본 발명은 매우 훌륭한 효과를 지닌다.
또다른 실시태양에서 본 발명에서 사용을 위한 DNA 중합효소는 야행형에서보다 더 낮은 프루프리딩 기능을 지닌다. 이러한 DNA 중합효소는 자연-발생적일 수도 있지만 선택적으로 DNA 중합효소를 조절할 수도 있다.
하나의 실시태양에서 (변형된) 본 발명에서 사용을 위한 DNA 중합효소는 야생형 DNA 중합효소에서 보다 적어도 하나 이상의 수의 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지니는 것이 좋다. 야생형 DNA 중합효소에서 보다 적어도 하나 이상의 수의 부적당한 염기(돌연변이)를 제공하는 것에 의해 생물체에서 유전 형질 전환율(즉, 진화의 속도)은 생물체에 역효과 없이 증가되었다. 유전 형질 전환율은 만약 야생형 DNA 중합효소에서 보다 돌연변이된 염기의 수가 더 많으면 증가되는 경향을 보인다. 따라서 전환율을 증가시키기 위해 프루프리딩 기능은 바람직하게는 더 낮아진다. 프루프리딩 기능을 에세이하는 방법은 당분야에 잘 알려져 있다. 예를 들면 목적 DNA 중합효소(복제된 생성물 시퀀싱에 의해 결정; 프루프리딩 활성 측정에 의해 결정)에 대해 어울리는 적당한 에세이 시스템에 의해 수득된 생성물은 직접적 또는 간접적으로 시퀀스된다(예를 들면 시퀀서 또는 DNA 칩).
또다른 바람직한 실시태양에서 본 발명에서 사용되는 DNA 중합효소는 적어도 하나 이상의 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지니는 것이 바람직하다. 일반적으로 야생형 DNA 중합효소는 종종 수득된 생성물의 염기 서열에서 돌연변이를 제공하지 않는다. 따라서 이러한 경우 본 발명에서 사용되는 DNA 중합효소의 변형은 적어도 하나 이상의 부적당한 염기(돌연변이)를 제공하는 낮은 수준의 프루프리딩 기능을 지니는 것이 필요로 할 수도 있다. 이러한 프루프리딩 기능은 상기 기술된 에세시 시스템에 의해 측정될 수 있다. 더욱 바람직하게는 본 발명에서 사용을 위한 DNA 중합효소는 적어도 2개 이상의 미스매치 염기(돌연변이), 더욱 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9 및 10개 이상의 미스매치 염기 및 더욱 바람직하게는 적어도 15, 20, 25, 50 및 100개 이상의 미스매치 염기를 제공하는 프루프리딩 기능을 지닌다. 이것은 생물체의 유전 형질 전환율(즉, 진화의 속도)은 프루프리딩 기능의 수준에서 감소, 즉 염기서열에서 미스매치 염기(돌연변이)의 수의 증가를 나타내며 증가한다고 보여진다.
또다른 실시태양에서 본 발명에서 사용을 위한 DNA 중합효소는 10-6 비율로 염기 서열에서 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지닌다. 일반적으로 돌연변이는 자연적-발생 생물체에서 10-12 에서 10-8의 비율에서 유도된다. 따라서 본 발명에서는 매우 낮아진 프루프리딩 기능을 지니는 DNA 중합효소를 이용하는 것이 바람직하다. 더욱 바람직하게는 본 발명에서 사용되는 DNA 중합효소는 10-3 비율로, 더욱 바람직하게는 10-2 비율로 염기 서열에서 미스매치 염기(돌연변이)를 제공하는 프루프리딩 기능을 지닌다. 이것은 생물체의 유전 형질 전환율(즉, 진화의 속도)은 프루프리딩 기능의 수준에서 감소, 염기 서열 내 미스매치 염기(돌연변이)의 수의 증가를 나타내며 증가한다고 보여진다.
어떠한 실시태양에서 본 발명에 의해 목표된 생물체는 진핵세포 생물체일 수도 있다. 진핵세포 생물체는 E. coli와는 달리 프루프리딩 기능을 하게 하는 메카니즘을 지닌다. 따라서 진화의 속도는 모델로써 사용된 E. coli와 다른 방식으로 논의되거나 설명된다. 예상외로 본 발명은 조절될 수 있는 진핵세포 생물체를 포함하는 모든 생물체의 유전 형질 전환율(즉, 진화의 속도)을 설명한다. 따라서 본 발명은 종래의 기술에 의해 예측될 수 없는 효과를 제공한다. 특히 본 발명에 의해 진핵세포 생물체에서 진화의 속도가 조절될 수 있어 다음의 다양한 적용이 성취되었다; 진화 메카니즘의 설명; 게놈과 형질 사이의 관계 설명; 동물 및 식물을 포함한 다양한 고등생물의 진보; 존재하는 유기제의 진화 능력 조사; 더 나아간 생물체의 예측; 질병의 동물 모델의 제작 등. 본 발명에 의해 목표된 진핵세포 생물체의 예는 단세포생물(예를 들면 효모 등) 및 다세포생물(예를 들면 동물 및 식물)을 포함하나 이에 한정적인 것은 아니다. 이러한 생물체의 예는 먹장어목, 연골어강, 페트로니조니포메스(petronyzoniformes), 경골어류, 포유류강(예를 들면 단공류, 유대류, 반치류, 피익목, 익수목, 육식동물, 식충동물, 장비류, 기제류, 우제류, 관치목, 유린류, 바다소목, 고래류의 동물, 영장류, 설치목, 토끼목 등), 조류강, 파충류강, 양서류강, 어류강, 곤충강, 연형동물강, 쌍자엽식물, 단자엽식물(예를 들면, 밀, 옥수수, 벼, 보리, 사탕수수 등과 같은 벼과), 양치식물, 선태식물, 진균류, 시아노박테리아 등을 포함하나 이에 한정적인 것은 아니다. 바람직하게는 본 발명에 의해 목표된 생물체는 다세포생물일 수도 있다. 또다른 바람직한 실시태양에서 본 발명에 의해 목표된 생물체는 동물, 식물 또는 효모일 수도 있다. 더욱 바람직한 실시태양에서 본 발명에 의해 목표된 생물체는 포유동물일 수도 있으나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명에서 사용을 위한 생물체 또는 세포는 자연적으로 적어도 두 종류 이상의 중합효소를 지닌다. 만약 적어도 2 이상의 중합효소가 존재하면 이질성의 오류-빈발 빈도가 준비된 환경에서 제공하는 것이 용이하다. 더욱 바람직하게는 생물체 또는 세포가 자연적으로 적어도 두 종류 이상의 중합효소를 지니고 그것의 오류-빈발 빈도는 서로 다른 것이 좋다. 이러한 생물체 또는 세포는 변형된 생물체 또는 세포를 제공하는 데에 사용될 수 있다.
바람직한 실시태양에서 본 발명의 방법에 의해 수득된 변형된 생물체 또는 세포는 실질적으로 요구되는 형질로 변형된 후 야생형과 같은 생장을 나타낸다. 이러한 특징은 단지 본 발명이 역효과 없이 유전 형질의 전환율이 조절을 제공한 후 수득되었다. 이러한 특징은 종래의 돌연변이 유발 방법에 의해서는 성취될 수 없는 것이다. 따라서 이러한 특징은 본 발명에 의해 제공되는 유익한 효과인 것이다. 실질적으로 야생형과 동일한 생장을 하는 생물체 또는 세포는 야생형과 동일한 방식으로 처리될 수 있다.
또다른 실시태양에서 본 발명의 방법으로 변형된 생물체 또는 세포는 조절 전(즉, 야생형) 내성을 지니지 않았던 생물체 또는 세포의 환경에 대해 내성을 지닌다. 이러한 환경 파라미터의 예는 습도, pH, 염농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광파장, 전자파, 방사선, 중력, 장력, 음파, 생물체(예를 들면, 기생충 등), 생물체 이외의 것, 화학제, 항생제, 천연 물질, 정신적 스트레스 및 물리적 스트레스 및 이들의 결합인 작용제의 적어도 하나 이상을 포함한다. 따라서 이러한 작용제의 어떠한 결합도 사용될 수 있다. 두 개 또는 그 이상의 작용제 결합될 수도 있다.
온도의 예는 높은 온도, 낮은 온도, 매우 높은 온도(예를 들면 95℃ 등), 매우 낮은 온도(예를 들면 -80℃ 등), 넓은 온도 범위(예를 들면 150℃∼-270℃ 등) 등을 포함하나 이에 한정적인 것은 아니다.
습도의 예는 상대 습도 100%, 상대습도 0%, 0∼100%의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.
pH의 예는 0∼14 사이의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.
염농도의 예는 NaCl 농도(예를 들면 3% 등), 염농도 0∼100%의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.
영양물의 예는 단백질, 포도당, 지질, 비타민, 무기염 등을 포함하나 이에 한정적인 것은 아니다.
금속의 예는 무거운 금속(예를 들면, 수은, 카드듐 등), 납, 금, 우라늄, 은 등을 포함하나 이에 한정적인 것은 아니다.
기체의 예는 산소, 질소, 이산화탄소, 일산화탄소 및 이들의 혼합물 등을 포함하나 이에 한정적인 것은 아니다.
유기 용매의 예는 에탄올, 메탄올, 자일렌, 프로판올 등을 포함하나 이에 한정적인 것은 아니다.
압력의 예는 0∼10 톤/㎠의 임의의 지점 등을 포함하나 이에 한정적인 것은 아니다.
점도의 예는 어떠한 유동체(예를 들면, 물, 글리세롤 등) 또는 그들의 혼합물의 점도 등을 포함하나 이에 한정적인 것은 아니다.
유속의 예는 0부터 빛의 속도까지의 임의의 지점을 포함하나 이에 한정적인 것은 아니다.
광도의 예는 암흑과 태양광선 수준 사이의 한 지점을 포함하나 이에 한정적인 것은 아니다.
광파장의 예는 가시광선, 자외선(UV-A, UV-B, UV-C 등), 적외선(원적외선, 근적외선 등) 등을 포함하나 이에 한정적인 것은 아니다.
전자파의 예는 임의의 파장을 지니는 전자파를 포함한다.
방사선의 예는 임의의 세기를 지니는 방사선을 포함한다.
중력의 예는 지구상의 임의의 중력 또는 중력 0부터 지구상의 중력까지의 임의의 지점 또는 지구상의 중력보다 더 크거나 동일한 중력을 포함하나 이에 한정적인 것은 아니다.
장력의 예는 임의의 힘을 지니는 장력을 포함한다.
음파의 예는 임의의 세기 및 파장을 지니는 음파를 포함한다.
목적 생물체 이외의 생물체는 기생충, 병원균, 곤충, 선충류 등을 포함하나 이에 한정적인 것은 아니다.
화학제의 예는 염산, 황산, 수산화나트륨 등을 포함하나 이에 한정적인 것은 아니다.
항생제의 예는 페니실린, 카나마이신, 스트렙토마이신, 퀴놀린 등을 포함하나 이에 한정적인 것은 아니다.
자연-발생 물질은 복어 독소, 뱀독소, 아칼로이드 등을 포함하나 이에 한정적인 것은 아니다.
정신적 스트레스의 예는 기아, 밀도, 한정된 공간, 높은 공간 등을 포함하나 이에 한정적인 것은 아니다.
물리적 스트레스는 진동, 소음, 흥분, 충격 등을 포함하나 이에 한정적인 것은 아니다.
또다른 실시태양에서 본 발명의 방법에 의해 목표된 생물체 또는 세포는 암세포이다. 본 발명에 의해 성취된 암 생물체 모델 또는 세포 모델은 종래의 방법과는 달리 자연-발생적 암과 같은 메카니즘에 의해 암을 발생시킨다. 따라서 암 생물체 모델 또는 세포 모델은 정확한 암 생물체 모델 또는 세포 모델로써 간주된다. 따라서 암 생물체 모델 또는 세포 모델은 약제학적 발전에 특히 유용한 것이다.
본 발명의 또다른 관점에서 조절된 유전 형질을 지니는 생물체 또는 세포를 제조하는 방법이 제공된다. 이 방법은 두 개의 단계로 구성된다: (a) 생물체 또는 세포 내 유전자 복제의 오류-빈발 빈도의 조절 또는 변화; 및 (b) 수득된 생물체 또는 세포의 재생산. 이러한 경우 유전 형질의 전환율의 조절에 관계된 기술은 상기에 설명되었다. 따라서 상기-설명된 기술은 생물체 또는 세포 내 유전자 복제의 오류-빈발 빈도의 변화 단계에서 이용될 수 있다. 유전 형질의 전환율을 재조절하기 위한 방법에 관하여 상기에 설명한 바와 같이 생물체 또는 세포는 오류-빈발 빈도를 조절하는 단계에서 사용될 수도 있다.
수득된 생물체 또는 세포를 재생산하는 단계는 만약 생물체 또는 세포가 조절된 유전 형질을 지닌다면 당분야에서 알려진 어떠한 방법을 이용해서도 수행될 수 있다. 재생산 기술은 번식, 증식 등과 자연 현상; 배양된 세포로부터 개체 식물의 재생산 등을 포함하나 이에 한정적인 것은 아니다. 이러한 기술들이 사용되는지 사용되지 않는지는 예를 들면 염기서열을 결정하는 것에 의한 확인; 항원성 또는 이와 유사한 것의 확인; 벡터가 사용된 경우 벡터의 검출; 형질 복원 테스트; 및 돌연변이 및 미분열의 높은 비율의 일치성의 확인에 의해 확실하게 될 수 있다. 이러한 테스트는 본 발명의 명세서에 기초한 기술에 의해 용이하게 수행될 수 있다.
바람직한 실시태양에 있어서 본 발명에 대한 생물체 및 세포 복원 방법은 요구되는 형질을 지니는 개체에 대해 재생산된 생물체 또는 세포의 선별을 더욱 포함한다. 이러한 요구되는 형질을 지니는 개체는 생물체 또는 세포(예를 들면, 상기-기술된 다양한 환경에 대한 내성 등) 또는 유전자에서 또는 대사산물 수준의 유전 형질에 기초해 선별될 수도 있다. 선별의 결과는 시각 조사, 시퀀싱, 다양한 생화학적 테스트, 현미경 관찰, 염색, 면역학적 검정법, 행동 분석 등을 포함하나 이에 한정적인 것은 아닌 다양한 기술에 의해 확인될 수 있다. 이러한 기술은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.
본 발명의 또다른 관점에 있어서 본 발명에 따라 생성된 유전 형질이 조절된 생물체 또는 세포가 제공된다. 생물체 또는 세포는 종래의 기술에 의해 성취될 수 없는 진화의 높은 속도가 수득된다. 따라서 생물체 또는 세포의 존재 그 차제는 명백하게 신규한 것이다. 생물체 또는 세포는 다음에 의해 특징지어진다. 예를 들면: 돌연변이 및 미분열의 높은 비율의 적합성; SNPs(단일 뉴클레오타이드 다형성)의 치우친 분포; 개체에 의존하는 게놈의 동일한 지역에서조차 다른 모드로 축적되는 경향을 지니는 돌연변이(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다 등. 본 발명의 생물체 또는 세포는 바람직하게는 실질적으로 야생형과 동일한 생장을 나타낸다. 일반적으로 빠른 돌연변이 유발을 겪는 생물체가 야생형과 동일한 생장을 나타내는 것은 불가능하다. 그러나 본 발명의 생물체 또는 세포는 실질적으로 야생형과 동일한 생장을 나타낼 수 있다. 따라서 본 발명은 매우 놀랄만한 효과를 지닌다. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.
본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 유전자를 인코딩하는 핵산 분자를 생성하기 위한 방법이 제공된다. 이 방법은 다음의 단계로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이의 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 인코딩하는 핵산 분자의 생성. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.
생물체 또는 세포 내 돌연변이는 당분야에 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 예는 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하나 이에 한정적인 것은 아니다.
돌연변이를 운반하는 유전자가 한번 확인되면 돌연변이를 운반하는 확인된 유전자를 인코딩하는 핵산 분자는 당분야에 잘 알려진 기술을 이용하여 생성될 수 있다. 생성 방법의 예는 뉴클레오타이드 신디사이저를 이용한 합성; 반-합성 방법(예를 들면, PCR 등); 등을 포함하나 이에 한정적인 것은 아니다. 합성된 핵산 분자가 목적 서열을 지니는지 여부는 당분야에 잘 알려진 기술을 이용하여 시퀀싱 또는 DNA 칩에 의해 결정될 수 있다.
따라서 본 발명은 본 발명의 방법에 의해 제조된 핵산 분자를 제공한다. 이러한 핵산 분자는 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래된 유전자이다. 따라서 유전자를 인코딩하는 핵산 분자의 존재 그 차제는 명백하게 신규한 것이다. 핵산 분자는 다음에 의해 특징지어 지나 이에 한정적인 것은 아니다: SNPs의 분포가 치우친다; 많은 돌연변이 수를 지니는 지역은 축적되고 다른 지역은 게놈 내에서 모자이크 패턴으로 분포되는 경향이 있다; 돌연변이는 개체에 의존하는 게놈의 동일한 지역에서조차도 다른 모델로 축적되는 경향을 나타낸다(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다; 등. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.
본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 유전자를 인코딩하는 폴리텝타이드의 제조 방법이 제공된다. 이 방법은 다음의 단계들로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 인코딩하는 폴리펩타이드의 제조. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에 있어서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.
생물체 또는 세포 내 돌연변이는 당분야에 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 예는 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하지만 이러한 기술로 제한되는 것은 아니다.
돌연변이를 운반하는 유전자가 한번 확인되면 돌연변이를 운반하는 확인된 유전자에 의해 인코딩되는 폴리펩타이드는 당분야에 잘 알려진 기술을 이용하여 제조될 수 있다. 제조 방법의 예는 펩타이드 합성기를 이용한 합성; 상기-논의된 유전자를 인코딩하는 핵산 분자는 유전자 조작 기술에 의해 합성되고 세포는 핵산 분자를 이용하여 형질전환되고, 유전자는 발현되며 발현된 생성물은 회수된다; 폴리펩타이드는 변형된 생물체 또는 세포로부터 정제된다; 등을 포함하지만 이러한 것들로 제한되는 것은 아니다.
본 발명의 또다른 관점에 있어서 본 발명의 방법에 의해 제조된 폴리펩타이드가 제공된다. 이러한 폴리펩타이드는 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래된 유전자에 의해 인코드된다. 따라서 유전자에 의해 인코드되는 폴리펩타이드의 존재 그 차제는 명백하게 신규한 것이다. 폴리펩타이드는 다음에 의해 특징지어 진다. 예를 들면 다음의 유전 형질을 지니는 아미노산 서열: SNPs의 분포가 치우친다; 많은 돌연변이 수를 지니는 지역은 축적되고 다른 지역은 게놈 내에 있어서 모자이크 패턴으로 분포되는 경향이 있다; 돌연변이는 개체에 의존하는 게놈의 동일한 지역에서조차도 다른 모델로 축적되는 경향을 나타낸다(특히, 이러한 경향은 선택 압력에 대해 영향 받기 쉽지 않은 지역에서 중요하다); 동일한 개체의 정자 게놈의 특정 지역에서 돌연변이의 분포(특히, 과다한 지역)는 임의적이지 않고 두드러지게 치우친다; 등. 본 발명은 이에 한정적인 것은 아니다. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.
본 발명의 또다른 관점에 있어서 조절된 유전 형질을 지니는 생물체의 대사산물을 생성하기 위한 방법이 제공된다. 이 방법은 다음의 단계들로 구성된다: (a) 생물체 또는 세포의 유전자 복제의 오류-빈발 빈도의 변화; (b) 수득된 생물체 또는 세포의 재생산; (c) 생물체 또는 세포 내 돌연변이 확인; 및 (d) 확인된 돌연변이를 포함하는 유전자를 포함하는 대사산물의 생성. 이러한 경우에 오류-빈발 빈도의 변화에 대한 기술 및 수득된 생물체 또는 세포의 재생산에 대한 기술은 상기에 설명되었고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 알맞게 수행될 수 있다. 본 발명의 실시태양은 이러한 기술을 이용하여 수행될 수 있다.
여기에 사용된 용어 "대사산물"은 세포 내 생존에 대한 활동(대사작용)에 의해 수득된다. 대사산물의 예는 아미노산, 지방산 및 이들의 유도체, 스테로이드, 모노사카라이드, 퓨린, 피리미딘, 뉴클레오타이드, 핵산, 단백질 등을 포함하나 이에 한정적인 것은 아니다. 한편 이러한 중합체 화합물 또는 탄수화물의 산화 또는 지방산의 산화의 가수분해에 의해 수득된 물질 또한 대사산물이라 부른다. 대사산물은 세포 내에 존재할 수도 있고 세포로부터 분비될 수도 있다.
본 발명의 방법에 있어서 생물체 또는 세포의 돌연변이는 당분야에서 잘 알려진 기술을 이용하여 확인될 수 있다. 확인 기술의 에는 대사산물의 확인(화합물 분석), 분자 생물학 기술(예를 들면, 시퀀싱, PCR, 서던 블럿 등), 면역화학적 기술(예를 들면 웨스턴 블럿 등), 현미경 관찰, 시각 조사 등을 포함하지만 이러한 기술로 제한되는 것은 아니다. 대산산물 확인 기술은 대사산물에 의존하여 당분야에서의 이러한 기술들이 알맞게 선택될 수 있다.
본 발명의 또다른 관점에 있어서 본 발명의 방법에 의해 생성된 대사산물이 제공된다. 이러한 대사산물은 또한 종래의 기술에 의해서는 성취될 수 없는 진화의 속도로 수득된 생물체 또는 세포로부터 유래이고 대사산물의 존재 그 차제는 명백하게 신규한 것이다. 대사산물은 다음의 것들로 특징지어 지지만 이러한 것들로 제한되지는 않는다. 자신에 대해 더 낮은 독성을 가지는 것; 자발적으로 진화된 대사산물의 선매; 등. 이러한 특성을 확인하기 위한 실험은 당분야에 알려져 있고 본 명세서의 관점에서의 기술에 의해 이와 같은 기술들이 용이하게 수행될 수 있다.
본 발명의 또다른 관점에 있어서 생물체 또는 세포의 유전 형질을 조절하기 위한 핵산 분자가 제공된다. 핵산 분자는 변형된 오류-빈발 빈도를 지니는 DNA 중합효소를 인코딩하는 핵산 서열로 구성된다. DNA 중합효소는 프루프리딩 활성이 조절된 진핵세포 생물체의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 이에 상응하는 DNA 중합효소로 구성된 그룹에서 선택된 적어도 하나 이상의 중합효소일 수도 있다. 프루프리딩 활성은 예를 들면 중합효소의 3'-> 5' 엑소뉴클레아제 활성 중심을 형질전환시키는 것에 의해 조절될 수 있다(선택적으로 ExoI 모티브, 프루프리딩 기능 활성 부위) (예를 들면, 316 위치에서의 아스파르트산 및 318 위치에서의 글루탐산 및 인간 DNA 중합효소 δ의 부위 주변). 본 발명은 이러한 것들로 제한하지 않는다.
바람직하게는 본 발명의 핵산 분자에 포함된 DNA 중합효소를 인코딩하는 서열은 DNA 중합효소 δ 또는 ε를 인코드하는 것이 좋다. 그 이유는 이러한 DNA 중합효소는 자연적으로 프루프리딩 기능을 가지며 이 기능은 상대적으로 용이하게 변형되기 때문이다.
본 발명의 또다른 관점에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위한 핵산 분자를 포함하는 벡터가 제공된다. 벡터는 플라스미드 벡터일 수도 있다. 벡터는 바람직하게는 프로모터 서열, 인핸서 서열 및 필요한 경우 이와 유사한 것을 포함할 수도 있다. 벡터는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있고 또는 넘겨질 수도 있다.
본 발명의 또다른 실시태양에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위해 핵산 분자를 포함하는 세포가 제공된다. 본 발명의 핵산 분자는 벡터의 형태로 세포 내로 혼합될 수도 있다. 본 발명은 이에 한정적인 것은 아니다. 세포는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있고 또는 넘겨질 수도 있다. 바람직한 실시태양에서 세포는 제한하는 것은 아니지만 진핵세포인 것이 바람직하다. 만약 세포가 단지 핵산 분자를 증폭하기 위해 사용된다면 진핵세포는 바람직하게 사용될 수도 있을 것이다.
본 발명의 또다른 관점에 있어서 본 발명에 따른 생물체 또는 세포의 유전 형질을 조절하기 위해 핵산 분자를 포함하는 생물체 또는 세포가 제공된다. 생물체는 생물체 또는 세포의 유전 형질을 조절하기 위해 키트 내로 혼합될 수도 있다.
또다른 관점에 있어서, 본 발명은 제공된 본 발명의 방법에 의해 수득된 생물체 또는 세포 또는 이들의 일부분(예를 들면, 장기, 조직, 세포 등)에 의해 생성된 생성 물질을 제공한다. 본 발명에 의해 수득된 생물체 또는 이의 일부분은 종래의 방법에 의해 수득되지 않고 그들의 생성 물질은 신규한 물질을 포함할 수도 있다.
본 발명의 또다른 관점에 있어서 약제를 테스트하기 위한 방법이 제공되며 이는 다음의 단계로 구성된다: 질병 모델로써 본 발명의 생물체 또는 세포를 이용하는 약제의 효과 테스트; 대조군으로써 야생형 생물체 또는 세포를 이용하는 약제의 효과 테스트; 및 질병 모델과 대조군의 비교. 이러한 질병 모델은 종래의 방법에 의해 성취될 수 없는 자발적인 질병 진행 모델이다. 따라서 약품 테스트를 위한 방법에서 이러한 질병 모델을 이용하는 것으로 테스트 결과는 테스트의 높은 수준의 신뢰도의 결과로 종래의 방법에 의해서는 인지될 수 없는 자연 조건에서 수행된 테스트와 근접한다. 따라서 약학적 등의 개발 기간을 감소시키는 것이 가능하다. 선택적으로 테스트 결과 내 부작용 등의 정확한 정보를 수득하는 것이 가능할 수도 있다.
또다른 관점에 있어서, 본 발명은 생물체 또는 세포의 유전 형질의 전환율의 조절에서 이용에 대해 적어도 두 종류 이상의 중합효소의 세트에 관한 것이며 중합효소는 다른 오류-빈발 빈도는 지닌다. 이러한 중합효소 세트는 상기에 기술된 방법으로 종래에는 사용되지 않았으며 매우 신규한 것이다. 어떤 중합효소도 도입된 생물체 또는 세포 내에서 그들의 기능을 하는 한 사용될 수 있을 것이다. 따라서 중합효소는 두 개 또는 그 이상의 종으로부터, 바람직하게는 같은 동물 종으로부터 유래될 수도 있다. 상기 기술한 적용에 사용을 위한 중합효소는 유전자 도입을 거쳐 생물체 또는 세포 내로 도입될 수도 있다.
본 발명의 또다른 관점에 있어서, 본 발명은 변형된 유전 형질을 지니는 생물체 또는 세포의 도입에 이용하기 위해 적어도 두 종류 이상의 다른 오류-빈발 빈도를 지니는 중합효소의 세트가 제공된다. 이러한 중합효소 세트는 상기에 기술한 방법으로 종래에는 사용되지 않았으며 매우 신규한 것이다. 어떤 중합효소도 도입된 생물체 또는 세포 내에서 그들의 기능을 하는 한 사용될 수 있을 것이다. 따라서 중합효소는 두 개 또는 그 이상의 종으로부터, 바람직하게는 같은 동물 종으로부터 유래될 수도 있다. 상기 기술한 적용에 사용을 위한 중합효소는 유전자 도입을 거쳐 생물체 또는 세포 내로 도입될 수도 있다.
또다른 관점에 있어서, 본 발명은 생물체 또는 세포의 유전 형질의 전환율의 조절에서 이용에 대해 적어도 두 종류 이상의 중합효소의 세트의 이용에 관한 것이며 중합효소는 다른 오류-빈발 빈도는 지닌다. 상기 기술한 적용에 사용되는 중합효소는 상기에 기술되어 있고 아래의 실시예에 의해 사용되고 생성될 것이다.
또다른 관점에서, 본 발명은 변형된 유전 형질을 지니는 생물체 또는 세포의 도입에 이용하기 위해 중합효소의 세트의 이용에 관한 것이며 이 중합효소는 적어도 두 종류 이상의 다른 오류-빈발 빈도를 지닌다. 상기 기술한 적용에 사용을 위한 중합효소는 상기에 기술되어 있고 아래의 실시예에 의해 사용되고 생성될 것이다.
(불균형 유전적 다양성 하이브리드 모델)
A. 이질성 복제 정확성을 지니는 유전적 다양성의 돌연변이 분포
본 발명의 또다른 관점에 있어서, 유전적 다양성은 각각 길이 n의 바이너리 염기 서열에 의해 표현되는 것으로 가정하는 각각 2n 가능성 유전자형(또는 서열 영역)을 지니는 게놈 개체군으로 구성되어 있다. 최상의 적합성을 지니는 서열을 본 명세서에는 "마스터 서열"이라 부른다. 개체군의 크기는 매우 크고 안정적인 것으로 선택된다. 하나의 주형 서열의 복제는 하나의 직접 복사 서열을 생성하고 따라서 복제 오류는 하나의 단계에 의해 돌연변이에 고정된다. 단지 염기 치환만이 발생하고 여기서부터 서열 길이가 무시된다. 손쉬운 처리를 위해서 본 발명의 발명자들은 돌연변이 종 Ii(i=0, 1, ..., n) 내로 마스터 서열(I0)의 모든 i-오류 돌연변이의 총합을 분류하였다. 상대 농도의 대응하는 총합은 Xi로 표시한다. Xi의 전환율은 다음으로 나타낸다:
여기서 Ai는 돌연변이 종 Ii의 복제 비율 상수(또는 적합성)이고; f는 총 농도 상수를 나타내고; 및 그 후 이고; Qii는 복제 정확성 또는 Ij의 완전한 오류 없는 복제에 의한 Ii의 생산 확률이고; 및 Qij는 Ij의 잘못된 복제에 의한 확률을 나타낸다.
게놈 서열은 중합효소에 의해 복제된다. Ek는 다른 정확성을 지닌 p 종류의 중합효소를 나타낸다(k=1, 2, ..., p). Ek의 상대 농도는 Ck로 표시한다. 중합효소 Ek의 단일-염기 정확성은 0 ≤qk≤1로 표시되며 염기 오류 비율에 대한 Ek는 1-qk이다. 동일 중합효소에 의한 하나의 서열의 일정한 복제 때문에 염기 오류 비율에 대한 Ek는 n(1-qk)이다. 유전적 다양성의 게놈 평균 오류 비율에 대한 식은 로 나타낸다. 상동성 복제 정확도를 형질전환하는 것에 의해(예를 들면, M. Eigen, 1971(supra)) 이질성 복제 정확도는 다음과 같이 수득된다:
고정된 돌연변이 분포는 유전적 다양성이다. 이것은 행렬 W={AjQij}의 고유벡터로 나타낸다. 도 5는 상동성 및 이질성 복제 정확도를 지니는 유전적 다양성의 예를 보여준다. 여기서 단순한 단일-피크 적합성 구역이 사용되었다. 복제 비율 상수 A0는 마스터 서열로 지정하고 모든 다른 돌연변이 종들은 동일한 적합성을 지닌다.
오류 역치 미만의 상동성 복제 정확도를 지니는 균등한 유전적 다양성은 마스터 서열 주변에 위치한다(도 1의 (a) 참조). m=2.3 근처의 오류 역치에서 전이가 뚜렷하고 마스터 서열의 상대 농도는 10 크기 정도로 감소된다(c=0에서, 도 6참조). 이러한 현상은 오류 카타스트로프(catastrophe)라 부른다. 오류 역치 위에 유전적 다양성 위치는 균일한 분포로 교환되며 개체 농도는 극히 작다(예를 들면 Yi=8.88 x 10-16). 사실 한정된 개체는 오류가 축적되는 것과 같은 것을 선택하는 것에 의해서는 마스터 서열의 유전적 정보를 포함하는 것은 더욱 어렵다. 단지 오류 역치 이하에서만 유전적 다양성 진화가 가능하며 진화 속도는 오류 역치 근처의 최대점에 도달하는 것으로 나타난다.
본 발명의 불균형 모델(도 5의 (b)∼(d)은 각각 다른 정확도를 지니는 두 종류의 중합효소를 지닌다는 것을 가정한다. 중합효소 E1은 오류가 없는 것이고 q1=1이고 E2는 오류-빈발이며 0≤q2≤1이다; 각각은 c 및 1-c의 상대 농도에서 존재한다. 완전히 오류가 없는 중합효소의 가정은 현실적으로 나타나지 않지만 DNA-기초한 미생물에서 프루프리딩 중합효소의 오류 비율은 복제 당 게놈에 대해 0.003 오류 정도로 매우 작고 따라서 이 경우에서는 무시해도 좋다.
오류가 없는 중합효소의 상대 농도가 0<c<1정도로 매우 낮을 때 오류 역치는 증가 c를 나타내며 더 높은 평균 오류 비율로 이동하고 오류 카타스트로프의 정도는 감소한다(도 5의 (b) 및 도 6참조) C=0.1에서 오류 역치는 사라진다(도 5의 (c) 참조). 마스터 서열의 상대 농도는 점차적으로 감소하고 결국 균등 균일한 분포 보다 107배나 더 높은 농도로 평등해 진다(도 6의 c=0.1에서). c>0.1일 때 평균 오류 비율에 의존하지 않는 마스터 서열은 충분한 농도 내에 존재한다(도 5의 (d) 및 도 6 참조). 도 6은 Ccrit=0.1 근처의 유전적 다양성 원동력의 인상적인 변화를 나타낸다. 불균형 유전적 다양성 모델에 있어서 마스터 서열로부터 먼 거리에 있는 돌연변이는 유전적 다양성 위치의 손실을 일으키지 않고 존재할 수 있다.
B. 다수의 복제 작용제를 지니는 유전자 다양성에 대한 오류 역치
불균형 모델에 대한 오류 역치를 고려할 때 본 발명은 다음의 두 가지 난점을 만났었다: (i) 자연에서의 게놈 크기는 너무 커서 정확한 측정을 할 수가 없다; 바이러스: n>103, 박테리아: n>106; 및 (ⅱ) 자연에서의 게놈 복제는 하나의 유니트(복제 작용제)보다 더 많은 유니트로 분할되고 동시에 하나의 중합효소 보다 더 많은 중합효소가 참여한다. 다중 복제 작용제는 오류 역치에 영향을 주는 것을 나타난다. 본 발명의 발명자들은 마스터 서열의 상대 고정 농도의 근사값을 이용하여 오류 역치를 계산하였다.
여기서 A0는 마스터 서열의 복제 비율 상수이고 Ai≠0는 다른 돌연변이 서열의 전체 평균이다; Q00는 마스터 서열의 완전한 오류 없는 복제에 대한 복제 정확도이다. 이러한 근사값은 식(1)에 있어서 돌연변이로부터 마스터 서열까지의 역돌연변이의 고려를 무시하는 것에 의존한다. 정확한 용액을 지니는 어그리먼트(agreement)는 게놈 크기가 증가할 때 증가한다. 마스터 서열의 상대 고정 농도는 다음과 같은 임계 오류 비율로 사라진다:
여기서 s는 마스터 서열의 선택적인 우위이다. 다양한 복제 작용제를 지니는 불균형 모델에 대한 Q00를 얻기 위해서 본 발명의 발명자들은 각각 상대 농도 c 및 1-c에서 존재하는 두 종류의 중합효소 E1 및 E2를 가정한다. 프루프리딩 중합효소의 오류 비율은 매우 작으며 무시할 수 있다. 따라서 중합효소 E1은 오류가 없고 q1=1이며 E2는 오류-빈발이며 0≤q2≤1이다. 게놈 평균 오류 비율에 대한 식은 다음과 같다;
오류-빈발 중합효소 E2에 의해 게놈 복제의 확률은 이항 분포로부터 수득된다. 오류-빈발 중합효소 E2에 의한 비오류 확률은 Poisson 근사로부터 수득되며 여기서 게놈 크기는 복제 작용제의 수와 비교하여 매우 큰 것으로 가정한다. 그들을 곱하면 다음과 같은 식을 얻는다:
여기서 a는 게놈 내의 모든 작용제의 수이다. 식 (5)와 (7)을 결합하면 불균형 모델에 대한 오류 역치는 다음과 같다:
도 7은 복제 작용제의 다양한 수에서 오류 없는 중합효소의 상대 농도의 작용으로써 오류 역치를 나타낸다. 균등 모델에 대한 오류 역치(c=0)는 복제 작용제의 수에 의해 영향을 받지 않는다. 불균형 모델(c>0)에 있어서, 오류 없는 중합효소의 임계 농도에서 발생하는 특이성
은 오류 역치의 매우 뚜렷한 증가를 나타낸다. 이것은 c≥ccrit에서 오류 역치가 사라진다는 것을 의미한다. ccrit는 복제 작용제 수가 증가할 때 증가한다.
허용되는 오류 비율은 따라서 식(6) 및 (8)로부터 다음과 같이 수득된다:
c≥ccrit일 때 다음과 같은 두 가지 제약이 있다: (ⅰ) 게놈 크기 n은 한정된다; 및 (ⅱ) 오류-빈발 중합효소는 실제 생물체에서 0이 아닌 정확도 qmin을 지닌다. Escherichia coli의 완전한 프루프리딩-없는 DNA 중합효소의 오류 비율은 1-qmin=10-5임을 가정한다. 도 8은 E. coli의 파라미터에 기초하여 허용 가능한 오류 비율의 예를 나타낸다. 플롯(plot)은 형태에 있어서 λ 전이와 유사하다. s=10에 대해 E. coli의 mpms의 최대값은 복제 당 게놈에 대해 31오류가 된다. 이러한 오류 비율은 균등 모델의 오류 역치와 비교하여 충분히 높다(ln(s)=2.3).
본 발명의 발명자들은 무-오류 및 오류-빈발 중합효소가 존재하는 불균형-유전적 다양성 하이브리드 모델을 제공한다. 결과로써 유전적 다양성의 원동력은 오류 비율뿐만 아니라 다른 정확도를 지니는 중합효소의 속도 및 게놈을 변화시키는 복제 작용제의 수에 의해서도 결정된다는 것이 설명되었다. 명백하게 하기 위해 주목할만한 결과는 무-오류 및 오류-빈발 중합효소의 공존은 종래의 균등 모델과 비교할 때 유전적 다양성에 대해 오류 역치를 크게 증가시킬 수 있었다. 본 발명의 이러한 효과는 종래의 기술에 의해서는 밝혀질 수 없었던 것이다.
자연계 내의 많은 생물체들은 끊임없이 변화하는 환경에서 살고 있다. 이것은 숙주 면역 시스템을 피하는 미생물 병원균 및 암 세포에 대해 특히 사실이다. 유익성 돌연변이를 찾아내는 기회는 거리 증가와 함께 돌연변이 및 이로부터 가능한 후보자의 수의 큰 증가 때문에 마스터 서열로부터 Hamming 거리를 증가시킴으로써 증가될 것이다.
오류 비율에서 단순한 상동성 증가는 비록 일시적인 것일지라도 유해성 돌연변이의 적지 않은 손실을 초래한다. 마스터 서열로부터 단거리로 제한되는 돌연변이의 분포 범위의 균등 유전적 다양성의 오류 역치는 아주 작다. 균등 유전적 다양성은 국부적인 낮인 피크로 트랩될 것이고 마스터 서열로부터 먼 더 높은 피크로는 절대로 도달하지 못할 것이다. 균등 유전적 다양성은 한편, 유전적 정도를 읽지 않고 오류 역치를 증가시킬 것이고 이로부터 마스터 서열로부터 증가한 거리를 지니는 많은 유익성 돌연변이를 생산할 것이다. 균등 유전적 다양성은 서열 영역을 가로지르는 긴 거리에 도달할 수 있을 것이고 결국 더 높은 피크를 수득할 수 있을 것이다.
오류-빈발 중합효소의 진행성은 프루프리딩 능력을 지니는 주요 복제 중합효소의 진행성보다 훨씬 낮은 것으로 보여진다. 다수의 복제 작용제를 지니는 불균형 모델은 이러한 관찰을 계산에 넣는다. 이 모델에서 오류는 오류-빈발 중합효소가 관여하는 다양한 복제 작용제의 구역 내에 집중된다. 만약 오류-빈발 복제가 특정 유전자 지역 내로 제한된다면 지역의 오류 비율은 다른 유전자에 대한 손실이 최소한으로 유지될 때 크게 증가한다.
따라서 본 발명에 따르면, 만약 적어도 두 종류 이상의 오류-빈발 빈도에서 성취가 가능한 DNA 복제 작용제(예를 들면, 중합효소)가 생물체에 제공된다면 생물체는 개개의 생물체 평균을 유지하는 동안 종래의 기술과 비교할 때 두드러지게 증가된 진화 속도를 나타낼 수 있다는 것이 설명되었다.
여기에 언급된 모든 환자, 환자 적용, 저널기사 및 다른 참고문헌은 그대로 참고로써 결합되었다.
본 발명은 지금까지 본 발명의 이해를 용이하게 하기 위해 바람직한 실시태양을 참고로 설명되었다. 이하 본 발명은 실시예에 의해 설명될 것이다. 하기의 실시예들은 오직 예시의 목적으로만 제공된다. 따라서 본 발명의 범위는 첨부된 청구범위에 의한 것을 제외하고는 한정되지 않는다.
도 1은 본 발명의 실시예 1의 돌연변이체 및 그의 야생형이 실질적으로 동일한 생장 곡선을 지님을 나타낸다.
도 2는 고온 저항성이 부여된 본 발명의 실시예 1을 나타낸다.
도 3A는 고온 저항성이 부여된 본 발명의 실시예 1의 사진을 나타낸다. 고온에서 생장 가능한 돌연변이 균주는 pol3 돌연변이 균주로부터 분리된다(엑소뉴클레아제가 없는 DNA 중합효소 δ). *표는 모체 균주(AMY128-1) 및 7개의 다른 콜로니가 고온 저항성 균주이다.
도 3B는 고온 저항성이 부여된 본 발명의 실시예 1의 또다른 사진을 나타낸다. 고온에서 생장 가능한 돌연변이 균주는 pol2 돌연변이 균주로부터 분리된다(엑소뉴클레아제가 없는 DNA 중합효소 ε). *표는 모체 균주(AMY2-6) 및 7개의 다른 콜로니가 고온 저항성 균주이다.
도 4A는 고온 저항성이 부여된 본 발명의 실시예 1의 사진을 나타낸다. 화살표는 사멸하고 기포를 지닌 세포를 나타낸다. 고온 저항성 균주 1 및 2는 개별적 실험이 수행되었다. 모체 균주에서 어떠한 세포도 41℃에서 생존할 수 없었다. 본 발명의 방법에 의해 수득된 고온 저항성 균주는 41℃에서 생존할 수 있었다.
도 4B는 고온 저항성이 부여된 본 발명의 실시예 1의 또다른 사진을 나타낸다. 효모가 41℃에서 생존할 수 없을 것으로 여겨진 이러한 고온에서 생장 가능한 돌연변이 균주가 S. cerevisiae의 pol2 돌연변이 균주로부터 분리되었다(엑소뉴클레아제 활성이 없는 DNA 중합효소 ε). 상부는 모체 균주(AMY2-6)를 나타내고 다른 7개 콜로니는 고온 저항성 돌연변이 균주이다.
도 5는 상동성 복제 정확도 및 이질성 복제 정확도를 지닌 유전적 다양성의 예를 나타낸다.
도 6은 오류 재난(error catastrophe)을 나타낸다.
도 7은 다양한 수의 복제 작용제에서 무-오류 중합효소의 상대 농도의 기능으로서 오류 역치를 나타낸다.
도 8은 E. coli의 파라미터에 기반한 허용가능한 오류율의 예를 나타낸다.
도 9는 형질전환 마우스 내로 도입되는 벡터를 개략적으로 나타낸다.
도 10은 외부 유전자를 확인하기 위한 PCR 과정을 나타낸다. 좌측으로부터 mPGK2 Tg로, mPGK2 Tg 없이, Fth117 Tg로, mPGK2 Tg 벡터 및 Bluescript만(대조군) (각각 형질전환 마우스 #1) 및 #2 마우스 Tg 없이, #2 마우스 Tg로, #2Tg 벡터 및 pBluescript(각각 형질전환 마우스 #2). 마커는 우측 말단에 나타난다.
도 11은 마우스 고환 내 Cre 재조합효소(recombinase)의 발현을 나타낸다. a는 mPGK2를 나타내고, b는 Fth117을 나타내고, c는 대조군을 나타낸다. 막대는 50 ㎛를 나타낸다.
도 12는 mPGK2 프로모터에 의한 발현 구역을 나타낸다.
도 13은 Fth117 프로모터에 의한 발현 구역을 나타낸다.
도 14는 타겟팅 벡터를 개략적으로 나타낸다.
도 15는 조직-특이적 재조합 반응을 개략적으로 나타낸다.
도 16은 캘러스를 이용한 선별 방법을 개략적으로 나타낸다.
도 17은 실시예 8에서의 ES 세포에 대한 실험에 이용된 벡터를 개략적으로 나타낸다.
도 18은 Cre 재조합효소를 이용한 재조합(타겟팅) 벡터를 개략적으로 나타낸다.
(서열의 설명)
서열번호 1 : 효모 DNA 중합효소 δ 핵산 서열
서열번호 2 : 효모 DNA 중합효소 δ 아미노산 서열
서열번호 3 : 효모 DNA 중합효소 ε 핵산 서열
서열번호 4 : 효모 DNA 중합효소 ε 아미노산 서열
서열번호 5 : DnaQ 부분 서열 (Escherichia coli)
서열번호 6 : DnaQ 부분 서열 (Haemophilus influenzae)
서열번호 7: DnaQ 부분 서열 (Salmonella typhimurium)
서열번호 8 : DnaQ 부분 서열 (Vibrio cholerae)
서열번호 9 : DnaQ 부분 서열 (Pseudomonas aeruginosa)
서열번호 10 : DnaQ 부분 서열 (Neisseria meningitidis)
서열번호 11 : DnaQ 부분 서열 (Chlamydia trachomatis)
서열번호 12 : DnaQ 부분 서열 (Streptomyces coelicolor)
서열번호 13 : DnaQ 부분 서열 (Shigella flexneri 2a str. 301)
서열번호 14 : PolC 부분 서열 (Staphylococcus aureus)
서열번호 15 : PolC 부분 서열 (Bacillus subtilis)
서열번호 16 : PolC 부분 서열 (Mycoplasma pulmonis)
서열번호 17 : PolC 부분 서열 (Mycoplasma genitalium)
서열번호 18 : PolC 부분 서열 (Mycoplasma pneumoniae)
서열번호 19 : Pol Ⅲ 부분 서열 (Saccharomyces cerevisiae)
서열번호 20 : Pol Ⅱ 부분 서열 (Saccharomyces cerevisiae)
서열번호 21 : Polδ 부분 서열 (마우스)
서열번호 22 : Polε 부분 서열 (마우스)
서열번호 23 : Polδ 부분 서열 (인간)
서열번호 24 : Polε 부분 서열 (인간)
서열번호 25 : Polδ 부분 서열 (쌀)
서열번호 26 : Polδ 부분 서열 (Arabidopsis thaliana)
서열번호 27 : Polε 부분 서열 (Arabidopsis thaliana)
서열번호 28 : Polδ 부분 서열 (래트)
서열번호 29 : Polδ 부분 서열 (소)
서열번호 30 : Polδ 부분 서열 (대두)
서열번호 31 : Polδ 부분 서열 (과일 파리)
서열번호 32 : Polε 부분 서열 (과일 파리)
서열번호 33 : Polδ 효모 변형된 핵산 서열
서열번호 34 : Polδ 효모 변형된 아미노산 서열
서열번호 35 : Polε 효모 변형된 핵산 서열
서열번호 36 : Polε 효모 변형된 아미노산 서열
서열번호 37 : Polδ 전방 프라이머
서열번호 38 : Polδ 역방 프라이머
서열번호 39 : Polε 전방 프라이머
서열번호 40 : Polε 역방 프라이머
서열번호 41 : Escherichia coli DnaQ 핵산 서열
서열번호 42 : Escherichia coli DnaQ 아미노산 서열
서열번호 43 : Bacillus subtilis DnaQ 핵산 서열
서열번호 44 : Bacillus subtilis DnaQ 아미노산 서열
서열번호 45 : Arabidopsis thaliana DnaQ 핵산 서열
서열번호 46 : Arabidopsis thaliana DnaQ 아미노산 서열
서열번호 47 : 쌀 Polδ 핵산 서열
서열번호 48 : 쌀 Polδ 아미노산 서열
서열번호 49 : 대두 Polδ 핵산 서열
서열번호 50 : 대두 Polδ 아미노산 서열
서열번호 51 : 인간 Polδ 핵산 서열
서열번호 52 : 인간 Polδ 아미노산 서열
서열번호 52 : 인간 Polε 핵산 서열
서열번호 54 : 인간 Polε 아미노산 서열
서열번호 55 : 마우스 Polδ 핵산 서열
서열번호 56 : 마우스 Polδ 아미노산 서열
서열번호 57 : 마우스 Polε 핵산 서열
서열번호 58 : 마우스 Polε 아미노산 서열
서열번호 59 : 래트 Polδ 핵산 서열
서열번호 60 : 래트 Polδ 아미노산 서열
서열번호 61 : 소 Polδ 핵산 서열
서열번호 62 : 소 Polδ 아미노산 서열
서열번호 63 : 과일 파리 Polδ 핵산 서열
서열번호 64 : 과일 파리 Polδ 아미노산 서열
서열번호 65 : 과일 파리 Polε 핵산 서열
서열번호 66 : 과일 파리 Polε 아미노산 서열
서열번호 67 : Pold1 유전자의 5'말단 프라이머 SpeI-5' Pold1
서열번호 68 : Pold1 유전자의 3'말단 프라이머 EcoRI-3' Pold1
서열번호 69 : Pold1 유전자 내로 돌연변이를 도입시키기 위한 프라이머 서 열 (실시예 4)
서열번호 70 : Pold1 유전자의 돌연변이 cDNA 서열 (실시예 4)
서열번호 71 : mPGK2의 5' mPGK-sacII 프라이머
서열번호 72 : mPGK2의 3' mPGK-SpeI 프라이머
서열번호 73 : Fth117의 5' Fth117-sacII 프라이머
서열번호 74 : Fth117의 3' Fth117-SpeI 프라이머
서열번호 75 : 형질전환 마우스 #1의 Cre-F 프라이머
서열번호 76 : 형질전환 마우스 #1의 Cre-R 프라이머
서열번호 77 : 형질전환 마우스 #2의 Neo-F 프라이머
서열번호 78 : 형질전환 마우스 #2의 Neo-R 프라이머
서열번호 79 : 실시예 4에서 mRNA의 발현을 확인하기 위한 Neo-F 프라이머
서열번호 80 : 실시예 4에서 mRNA의 발현을 확인하기 위한 Neo-R 프라이머
서열번호 81 : Fth117의 약 5.7 kbp 서열 업스트림
서열번호 82 : Arabidopsis thaliana-유래 polδ를 증폭시키기 위한 Xbal-42120-F
서열번호 83 : Arabidopsis thaliana-유래 polδ를 증폭시키기 위한 2g42120-Sac1-R
서열번호 84 : 돌연변이 polδ 유전자 polδ (D316A)를 증폭시키기 위한 2g42120-D316A-F
서열번호 85 : 돌연변이 polδ 유전자 polδ (D316A)를 증폭시키기 위한 2g42120R
서열번호 86 : 마우스 고환으로부터 유래된 Kozak 서열을 포함한 Poldi 유전자(핵산 서열)
서열번호 87 : 마우스 고환으로부터 유래된 Kozak 서열을 포함한 Poldi 유전자(아미노산 서열)
서열번호 88 : 마우스 polδ 유전자 돌연변이체의 핵산 서열 (D400A)
서열번호 89 : 마우스 polδ 유전자 돌연변이체의 아미노산 서열 (D400A)
서열번호 90 : polδ의 핵산 서열 (At1g42120)
서열번호 91 : polδ의 아미노산 서열 (At1g42120)
서열번호 92 : 돌연변이 polδ 유전자 polδ(D316A) (핵산 서열)
서열번호 93 : 돌연변이 polδ 유전자 polδ(D316A) (아미노산 서열)
서열번호 94 : 455-bp mPGK2 프로모터 단편
서열번호 95 : Fth117 유전자의 5725-bp DNA 단편 업스트림
이후, 본 발명은 실시예에 의해 더욱 상세히 설명한다. 본 발명은 하기의 실시예들로 한정되는 것은 아니다. 하기의 실시예에 사용된 시약, 지지물 등 몇 개를 제외하고는 Sigma(세인트 루이스, 미국), Wako Pure Chemical Industries(오사카, 일본) 등으로부터 이용될 수 있었다. 동물들은 Japanese Universities에 의해 규정된 규칙에 따라 처리되고 테스트되었다.
(실시예 1 : 효모의 약물 내성 균주 및 높은 온도 내성 균주의 제조)
실시예 1에서 효모는 본 발명에 따른 불균형 돌연변이 효모로 조절될 수 있는 유전 형질의 전환율을 설명하기 위해 대표적인 진핵세포 생물체로써 사용되었다.
번식의 범위에 대한 불균형 돌연변이의 유용성을 확인하기 위해 약물 내성 및/또는 높은 온도 내성을 지니는 효모가 제조되었다.
돌연변이는 프루프리딩 기능을 조절하기 위해 DNA 중합효소 δ 및 DNA 중합효소 ε에 변이가 도입되었다(Alan Morrison & Akio Sungino, Mol. Gen. Genet. (1994) 242:289-296).
(원료)
본 실시예에서는 대상물질로써 효모(Saccharomyces cerevisiae)를 이용하였다. 정상 균주로써 AMY 52-3D : MATα, ura-52 leu2-1 ade2-1 his1-7 home-10 trp1-289 canR(Sugino 박사로부터 수득됨(오사카대학))이 이용되었다. 그 제조 방법은 다음과 같다.
효모의 정상 균주로써 ATCC(American Type Culture Collection으로부터 MYA-868(CG378)을 입수하였다.
오류-빈발 빈도는 DNA 중합효소 δ또는 ε의 프루프리딩 기능을 변화시키는 것에 의해 조절되었다. 프루프리딩 기능은 DNA 중합효소 δ또는 ε의 프루프리딩 부분에서 삭제부분을 지니는 불균형 돌연변이 균주를 제조하는 것에 의해 변화되었다. 돌연변이 균주를 제조하기 위해, 자리-특이적 돌연변이 유발이 일반적인 기술(Sambrook et al., Molecular Cloning: A Laboratory Manual, Ver. 2, Cold Spring Harbor Laboratory(Cold Spring Harbor. N. Y., 1989), supra)을 이용하여 정상 균주(Morrison A. & Gugino A., Mol. Gen. Gene. (1994)242:289-296)의 DNA 중합효소 δ또는 ε의 특정 부위에서 염기 치환을 수행하기 위해 사용되었다. 특히 전환이 수행되었다: polδ에서 322(D)->(A) 및 324(E)->(A); 및 polε에서 291(D)->(A) 및 293(E)->(A). 이러한 돌연변이는 DNA 중합효소 δ돌연변이 균주(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR; Sugino 교수로부터 수득됨(오사카 대학)) 및 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR; Sugino 교수로부터 수득됨(오사카 대학)). 이러한 균주의 당량은 polδ에서 322(D)->(A) 및 324(E)->(A); 및 polε에서 291(D)->(A) 및 293(E)->(A)와 같은 돌연변이를 도입하여 자리 특이적 돌연변이 유발을 이용하여 당분야의 기술을 이용하여 제조될 수 있다고 이해될 수 있다.
(약물 내성 균주의 제조방법)
상기 언급한 세 개의 균주는 완전한 배지(YPD 배지: 효모 추출물 10 g(Difco), BactoPepton 20 g(Difco) 및 포도당 20 g(Wako))를 함유한 한천 배지 배양기로 플레이트되었다. 5개의 단일 콜로니는 각 균주에 대해 임의로 수집되었다. 균주는 YPD 용액 배지 3 ml 내로 주입되었고 최종 농도가 1 x 106이 될 때까지 30℃에서 진탕 배양하였다.
이것들을 1 mg/L의 사이클로헥시마이드(Sigma, St. Louis, MO, USA)를 함유한 YPD 평판 배양지에 희석하였다. 대조로써 약제를 포함하지 않는 YPD 평판 배양지에 주입하였다. 균주는 2일간 30℃으로 배양되었다. 수득된 콜로니수를 세었다.
(고온 내성 균주를 수득하는 방법)
상기 3 균주는 단일 콜로니로부터 액체 배양에서 점차 배양 온도를 올려 가 며 순화 배지에 옮겨졌다. 순화 배지 프로토콜은 다음과 같다;
37℃, 2일 -> 28℃, 1일 -> 38℃, 2일 -> 28℃, 1일 -> 39℃, 2일 -> 28℃, 1일 -> 40℃, 2일 -> 28℃, 1일; 마지막 배양은 냉장 보존("순화된 배지Ⅱ")
(생장곡선의 측정)
완전 액체 배양기(YPD) 안에서 진탕 배양하다. 생장(즉, 세포 밀도)의 측정은 530nm의 흡광도(OD)를 지표로 하여 측정하였다. 흡광도는 분광 광도계(Hitachi)를 이용해 측정하였다. 정상 균주 및 약제 내성 돌연변이의 생장 곡선을 위한 실험은 38.5℃에서 고온 내성 균주가 테스트되는 동안 생장 곡선을 수득하기 위해 28℃에서 테스트되었다.
(약제 저항서 균주의 결과)
약제를 포함하지 않는 배양지에서 증식시키는 동안에 사이클로헥시마이드 내성균이 DNA 중합효소 δ및 DNA 중합효소 ε 돌연변이에서는 나타났지만 야생형에서는 나타나지 않았다.
콜로니의 수* | 평균* | |||||
polδ | 60 | 81 | 81 | 111 | 744 | 215 |
polε | 3 | 39 | 138 | 0 | 0 | 36 |
WT | 0 | 0 | 0 | 0 | 0 | 0 |
* 단위: x 106
polδ 돌연변이로부터 수득될 수 있는 내성 균주는 10 mg/L의 사이클로헥시마이드까지 생장할 수 가 있다는 것을 관찰하였다.
야생형과 돌연변이의 생장 특성을 비교했지만 증식률에 차이는 없었다(표 2 및 도면 1 참조).
생장 시간 | polδ | polε | WT |
0 | 0.13 | 0.13 | 0.13 |
2 | 0.9 | 0.8 | 0.9 |
4 | 2.2 | 2.1 | 2.1 |
6 | 4.1 | 4.0 | 4.1 |
8 | 5.9 | 5.7 | 6.0 |
10 | 7.9 | 7.8 | 8.1 |
12 | 10.5 | 10.8 | 11.1 |
22 | 20.1 | 19.8 | 21.7 |
32 | 19.6 | 19.5 | 20.3 |
44 | 18.9 | 19.2 | 19.8 |
(시간) OD: 530nm
(고온 내성 균주의 결과)
순응된 배지는 40℃에서 2일간 배양되었고 그 후 한천 배양 배지에 주입해 38.5℃에서 배양하였다. 어미 균주는 고온에서는 완전히 생장할 수 없지만 돌연변이는 생존하는 것을 확인하였다(도 3A 및 3B9사진) 참조).
야생형 균주 및 돌연변이의 고온 하에서의 생장 특성을 비교하였다. 야생형 균주에서는 증식의 정지가 확인되었다(표 3 및 도 2 참조).
또한 순응된 배양은 41℃에서 계속되었다. 그 결과로써 41℃에서 생장 가능한 돌연변이가 발생한 것이 확인되었다(도 4A 및 4B).
생장시간 | 클론 1 | 클론 2 | WT |
0 | 0.131 | 0.125 | 0.134 |
2 | 0.154 | 0.174 | 0.177 |
4 | 0.203 | 0.227 | 0.264 |
6 | 0.258 | 0.314 | 0.327 |
8 | 0.327 | 0.447 | 0.365 |
10 | 0.462 | 0.6 | 0.358 |
12 | 0.93 | 1.12 | 0.352 |
22 | 1.463 | 1.486 | 0.346 |
(시간) OD: 530nm
클론 1: polδ로부터 유래된 내성 균주
클론 2: polε로부터 유래된 내성 균주
효모는 E. coli와 같은 그람-음성 박테리아와는 다른 유전자 복제 메커니즘을 지닌다. 따라서 효모의 오류-빈발 빈도가 본 발명에 따른 유전 형질의 전환율을 조절하는 것에 의해 생물체의 생존에 영향을 주는 일 없이 실시할 수 있는지는 불명확했었다.
실시예 1에서, 진핵세포 생물체인 효모에서도 오류-빈발 빈도 조절에 의한 유전 형질의 전환율의 조절에 의해 그 생존에 영향을 주는 일 없이 생물의 유전 형질의 전환율을 조절할 수가 있는 것이 설명되었다.
(실시예 2: 플라스미드를 이용한 돌연변이 도입)
실시예 2에서는 플라스미드 벡터("불균형 돌연변이 유발 플라스미드")를 이용한 진핵세포 생물체에의 유전 형질의 전환율의 조절이 가능하다는 것을 설명하였다.
프루프리딩 기능은 실시예 1과 같이 DNA 중합효소 δ 및 DNA 중합효소 ε의 프루프리딩 기능(Alan Morrison & Akio Sugino, Mol. Gen. Genet.(1994) 242:289-296)내로 돌연변이를 도입하는 것에 의해 조절되었다.
돌연변이 DNA 중합효소(pol) δ 또는 DNA 중합효소 ε의 발현이 가능한 플라스미드 벡터가 도입되었다. 효모 세포는 돌연변이 세포를 생성하기 위한 벡터로 트랜스펙션에 의해 형질전환되었다. 돌연변이는 사이클로헥시마이드 등의 약제를 포함한 평판 배양기에서 배양하였다. 나타난 약제 내성 콜로니의수를 세었다.
(원료)
실시예 2에서는 효모(Saccharomyces cerevisiae)는 목적 생물체로써 사용되었다. 정상 균주로써 AMY52-3D : MATα, ura3-52 leu2-1 ade2-1 his1-7 home3-10 trp1-289 canR(ATCC, supra)가 사용되었다. 효모의 오류-빈발 빈도는 야생형 정상 균주 내로 돌연변이 DNA 중합효소 δ 또는 ε를 도입하는 것에 의해 조절되었다.
돌연변이 DNA 중합효소 δ 또는 ε를 인코딩하는 서열은 실시예 1에서 사용된 것과 같이 DNA 중합효소 δ(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR) 또는 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR) 돌연변이 균주를 이용하여 생산되었다.
플라스미드 벡터는 각각 돌연변이 DNA 중합효소 δ 및 ε를 인코딩하는 프로모터 Gal 및 핵산 서열을 포함한다. 핵산 서열은 효과적으로 프로모터에 연결되었다.
(방법)
(벡터의 제조)
이미 기술한 Sambrook, J., et al.(supra)과 같은 분자생물학적 기술이 여기에 사용되었다. polδ 및 polε 돌연변이 균주의 pol 부위(DNA 중합효소 δ 돌연변이 균주(AMY128-1:Pol3-01 MATα, ura3-52 leu2-1 lys1-1 ade2-1 his1-7 hom3-10 trp1-289 canR) 및 DNA 중합효소 ε돌연변이 균주(AMY2-6; pol2-4 MATα, ura3-52 leu2-1 lys1-1 ade2-6 his1-7 hom3-10 try1-289 canR)는 PCR에 의해 증폭되었고 polδ 및 polε 는 회수되었다. pol 부위의 회수를 위해 사용된 프라이머의 서열은 다음과 같다.
polδ(전):
서열번호 37: 5'- CCCGAGCTCATGAGTGAAAAAAGATCCCTT - '3 (δ);
pol 3 (역):
서열번호 38: 5'- CCCGCGGCCGCTTACCATTTGCTTAATTGT - '3 (δ);
polε(전):
서열번호 39: 5'- CCCGAGCTCATGATGTTTGGCAAGAAAAAA - '3(ε); 및
pol2 (역):
서열번호 40: 5'- CCCGCGGCCGCTCATATGGTCAAATCAGCA - '3(ε).
PCR 생성물은 GAL 프로모터를 지니는 벡터 내로 혼합된다.
(형질전환)
정상 효모 계통은 인산칼륨법을 이용하여 플라스미드 벡터로 트랜드펙트된다.
(돌연변이 도입)
형질전환된 효모는 진탕하며 48∼72시간 동안 28℃에서 갈락토스를 함유한 액체 배지에서 배양되었다.
(약제 내성의 확인)
세포는 24시간 동안 28℃에서 사이클로헥시마이드를 함유한 평판 배지(갈락토스로 채워진) 에서 배양되었다.
(결과)
DNA 중합효소 δ 및 DNA 중합효소 ε 돌연변이 중에서 사이클로헥시마이드 내성 박테리아는 세포가 어떠한 약제도 없이 배지에서 생장되는 동안 나타났지만 야생형 중에서는 나타나지 않았다.
(실시예 3: 동물로써 마우스 등을 포함하는 돌연변이 생물체의 제조)
실시예 3에서, 마우스(동물)는 불균등 돌연변이 생물체를 생산하기 위한 대표적인 진핵세포 생물체로써 이용되었다.
이질성 DNA 복제 프루프리딩 능력을 지닌 복제 복합체를 지니는 마우스는 유전자 타겟팅 기술을 이용하여 제조되었다.
복제 프루프리딩 기능은 DNA 중합효소 δ(서열번호 55(핵산 서열) 및 56(아미노산 서열)) 및/또는 DNA 중합효소 ε(서열번호 57(핵산 서열) 및 589아미노산 서열))의 프루프리딩 기능을 조절하는 것에 의해 조절되었다. 돌연변이는 다음과 같이 수행되었다: polδ에서, 315(D)->(A), 317(E)->(A); 및 polε에서 275(D)->(A), 277(E)->(A).
(유전자 타겟팅 기술)
유전자 타겟팅 기술은 예를 들면 Yagi T. et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명되어 있다. 돌연변이 pol을 지니는 타겟팅 벡터를 이용하여 상동성 재조합 마우스 ES 세포가 생성되었다.
재조합 ES 세포는 마우스 초기 배아에 도입되어 배반포를 형성하였다. 배반포는 가임신 마우스에 이식되어 키메라 마우스를 생성하였다.
키메라 마우스는 이종 교배되었다. 돌연변이가 도입된 생식 세포를 지니는 마우스가 선택되었다. 이종 교배는 상동성 돌연변이를 지니는 마우스가 수득될 때까지 계속되었다.
실시예 3에서 목적하는 것의 특성은 암의 징후의 척도로써 선택되었다.
(프로토콜)
(1. ES 세포의 제조)
배아 내의 세포 덩어리로부터 준비된 마우스 ES 세포(일본 쿠마모토 쿠마모토 대학 동물 자원 개발 연구 센터에서 입수 가능)는 5% CO2 내 37℃에서 20∼30% 소태아혈청으로 채워진 DMEM(Dulbeccos' Modified Eagle Medium) 내에서 공급자 세포를 이용하여 배양되었다.
공급자 세포는 예를 들면 "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명된 기술을 이용하여 준비되었다. 공급자 세포는 마우스 태아 섬유아세포의 일차 배양으로부터 수득되었다.
(2. 타겟팅 벡터를 이용한 pol 유전자의 상동성 재조합)
타겟팅 벡터는 효율적으로 상동성 재조합 ES 세포를 수득하기 위해 양성/음성법(Evans, M.J., Kaufman, M.H., Nature, 292, 154-156(198))에 의해 준비되었다.
타겟팅 벡터의 제조: 타겟팅 벡터는 예를 들면 Molecular Cloning, 2nd edition, Sambrook, J., et al, supra 및 Ausubel, F.M., Current Protocols in Molecular Biology, Green Publishing Associates and Wiley-Interscience, NY, 1987, supra에 설명된 기술에 의해 준비되었다.
타겟팅 벡터에 있어서 돌연변이 polδ 및/또는 polε 유전자는 양성 유전자와 음성 유전자 사이에 삽입되었다. 네오마이신 내성 유전자는 디프테리아 독소가 음성 유전자로써 사용되는 동안 양성 유전자로써 사용되었다.
pol 돌연변이에 대해 일-염기 돌연변이는 프루프리딩 활성을 제거하기 위해 polδ 및 polε 모두의 프루프리딩 활성 부위(서열번호 55 및 56(δ); 서열번호 57 및 58(ε)) 내로 도입되었다: polδ 내, 315(D)->(A), 317(E)->(A); 및 polε 내, 275(D)->(A), 277(E)->(A)(Morrison A. & Sugino A., Mol. Gen. Genet. 242:289-296, 1994; Goldsby R.E., et al., Proc. Natil. Acad. Sci. USA, 99:15560-15565, 2002)
(3. ES 세포 내로 벡터의 도입)
벡터는 전기 천공법에 의해 ES 세포 내로 도입되었다. 배양은 G418을 함유한 DMEM 배지(Flow Laboratory)를 이용하여 수행되었다(Sigma, St. Louis, MO, USA).
(4. ES 세포 재조합의 복구)
G418 존재에서 배양 후, 나타난 콜로니는 평판(DMEM 배지; Flow Laboratory)으로 옮겨졌다.
(5. 상동성 재조합의 확인)
게놈 DNA는 ES 세포로부터 추출되었다. 돌연변이 pol이 ES 세로 내로 도입되었는지 아닌지는 서던 블럿팅 및/또는 PCR에 의해 결정되었다.
(6. 키메라 마우스의 제조 - 배아 내로 재조합 ES 세포의 도입)
상기-설명된 재조합 세포는 미량 주사법으로 배반포 내로 도입된다. 배반포로써 ES 세포와 다른 숙주 마우스 배아가 예를 들면 "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 설명된 일반적인 방법으로 선택되었다.
(7. 키메라 마우스의 도입 - 가임신 마우스에의 배아 이식)
ES 세포가 129-주 마우스로부터 유래한 경우는 C57BL/6마우스의 척추 동물의 배반포 내에 주입된다. ES 세포가 TT-2 세포인 경우는 ICR 마우스의 8-세포기 배아에 주입해 가임신 마우스를 제조한다. ES 세포를 주입한 마우스 배아는 수양 부모의 자궁내 또는 난관내에 각각 이식을 실시해 키메라 마우스를 탄생시켰다.
(8. 키메라 마우스의 도입 - 마우스의 이종 교배)
키메라 마우스는 이종 교배되었다. 돌연변이 pol가 목적대로 생식 세포에 도입됐는지 아닌지는 PCR법 및/또는 DNA 시퀀싱에 의해 결정되었다. 이종 교배는 상동성 돌연변이 pol이 생성될 때까지 계속되었다.
(결과)
실시예 3에서 준비된 마우스로부터 암을 지니는 마우스가 선택되었다. 마우스는 종래의 기술과는 비교가 되지 않는 정도의 속도로 암을 자연스럽게 발생한 모델을 제공했다. 변형된 세포는 자연-발생 세포와 실질적으로 동일한 생장 속도를 지닌다. 그러나 변형된 세포의 돌연변이 비율은 발생 당 둘 또는 그 이상이고 이는 종래의 돌연변이와는 현저히 다른 것이다.
(다른 형질)
유사하게 당뇨병, 고혈압, 동맥 경화, 비만, 치매, 신경장애 등에 대한 선별을 수행하였다. 이러한 질병의 발병은 비율이 극도로 높아지고 있지만 본 발명은 각각의 증상을 자연스럽게 발생한 모델을 제공할 수가 있다. 따라서 본 발명의 방법은 동물에 있어도 적용이 가능할 것이다.
(다른 동물들)
다음으로, 모델로써 래트를 이용하여 유사한 실험이 수행되었다. 암의 래트 모델은 polδ(서열 번호 60의 아미노산 서열에 대해 315 위치 및 317 위의 D 및 E를 알라닌으로 한다)내로 돌연변이를 도입하는 것에 의해 신속히 준비될 수 있다.
(실시예 4: 다른 과정을 이용한 돌연변이 생물체의 도입)
다음으로 또다른 마우스 모델이 돌연변이 생물체가 도입되었는지 아닌지를 결정하기 위해 이용되었다. 그 과정을 아래에 설명한다.
(재료 및 방법)
<Pldl의 cDNA 준비>
mRNA는 TRIzol 시약(Invitrogen)을 이용하여 4-주된 신생아 C57BL/6 마우스(Charles River Japan)의 고환으로부터 추출되었다. 마우스 고환의 총 cDNA는 SuperScript Ⅲ 및 Oligo-dT 프라이머를 이용하여 추출된 mRNA의 역전사에 의해 제조되었다. 총 cDNA로 Poldl 유전자의 cDNA 단편이 Kozak 서열을 포함하도록 고안된 Poldl 유전자의 5'-말단 프라이머, SpeI-5'Poldl(GACTAGTGGCTATCTTGTGGCGGGAA)(서열번호 67) 및 3'말단 프라이머, EcoRI-3'Poldl(GGAATTCCTTGTCCCGTGTCAGGTCA)(서열번호 68)을 이용한 PCR에 의해 증폭되었다. 이러한 방법에서 야생형 Poldl의 cDNA가 수득되었다. 돌연변이(D400A)는 Poldl 유전자(서열번호 88(핵산 서열) 및 서열번호 89(아미노산 서열))로부터 3'-5' 엑소뉴클레아제 활성을 제거하기 위해 cDNA 내로 도입되었다. 이것을 성취하기 위해 프라이머 서열(CAGAACTTTGCCCTCCCATACCTC)(서열번호 69) 및 거기에 프라이머 상보를 도입한 돌연변이는 Poldl 돌연변이의 cDNA를 생성하기 위해 PCR 라이게이션을 필요로 한다. cDNA의 총-길이의 서열은 ABI3100 시퀀서(Biosystems, CA, USA 제공)에 의해 읽혀지고 동일한 서열을 찾기 위해 데이터베이스와 비교되었다. 이 cDNA는 모든 실험에 사용되었다. 야생형 및 돌연변이형 Poldl cDNAs를 준비하기 위한 PCR은 KOD DNA 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).
<프로모터 서열의 클로닝>
mPGK2의 mPGK2 프로모터 단편(서열번호 94): 455-염기쌍은 C57BL/6 마우스의 게놈 DNA의 5'mPGK2-sacⅡ 프라이머(TCCCCGCGGCTGCAGAGGATTTTCCACAG)(서열번호 71) 및 3'mPGK2-SpeI 프라이머(GGACTAGTATGGTATGCACAACAGCCTC)(서얼변호 72)를 이용하는 것에 의해 클론되었다. PCR은 KOD DNA 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).
Fthl17의 업스트림(upstream) 서열인 DNA 단편(서열번호 95): 5725-염기쌍은 5' Fthl17-sacⅡ 프라이머(TCCCCGCGGAGTGGTTGTGGGAGACTTAC)(서열번호 73) 및 3' Fthl17-SpeI 프라이머(GGACTAGTCAGTCCCACAGTCCCAAAGT)(서열번호 74)를 이용하는 것에 의해 클론되었다. PCR은 LA Taq 중합효소(TAKARA) 및 GC 버퍼(제조업자에의 해 제공)를 이용하여 수행되었다.
<형질전환 마우스의 제조>
형질전환 마우스의 도입을 위해 준비된 벡터 DNA(2ng/㎕)는 미세조작기구를 이용하여 C57B/6의 수정란의 전핵 내로 주입되었다. 유전자가 도입된 수정란 중에서 2-세포기(다음 날) 내의 배아가 가임신한 암컷 ICR 마우스의 난관 내로 이식되어 형질전환 마우스가 제조되었다.
<유전자 전이의 존재 또는 부재의 확인>
마우스의 꼬리는 작은 조각으로 잘려져 차례로 단백질 가수분해 효소 K를 함유한 가용성 완충액(50mM 트리스-HCl, 10mM EDTA, 200mM NaCl, 1% SDS) 내에 놓아두고 55℃에서 하룻밤 동안 인큐베이트하였다. 그 후 마우스의 게놈 DNA는 페놀/클로로포름 추출 및 에탄올 침전을 두 번 수행하는 것에 의해 준비되었다. 각 마우스의 게놈 DNA에 대해 유전자 전이의 존재 또는 부재는 Cre-F 프라이머(CTGAGAGTGATGAGGTTC)(서열번호 75)와 Cre-R 프라이머(CTAATCGCCATCTTCCAGCAG)(서열번호 76)를 이용하는 유전자 전이 마우스 #1 및 Neo-F 프라이머(GCTCGACGTTGTCACTGAAG)(서열번호 77)와 Neo-R 프라이머(CCAACGCTATGTCCTGATAG)(서열번호 78)유전자 전이 마우스 #2에 대한 PCR에 의해 결정되었다. PCR은 Ex-Taq 중합효소를 이용하여 수행되었다(TOYOBO, Osaka, Japan).
<면역검색법>
mPGK2(출생 후 14주) 및 Fthl17(출생 후 13주)의 F0-발생 유전자 전이 마우스가 실험에 사용되었다. 마우스는 Nembutla(50 mg/ml, Dainippon Pharmaceutical)로 마취되었고 복부 절개가 수행되었다. 처음으로 하나 또는 두 개의 부고환을 잘라내었다. 그 후 마우스는 4% 파라포름알데하이드로 관류 고정되었다. 두 개의 부고환은 추출되었고 4% 파라포름알데하이드에 4시간 동안 담구어졌다. 부고환은 PBS(수용액 내 NaCl 8 g, Na2HPO4 1.15 g. KCl 0.2 g 및 KH2PO4 0.2 g; 최종 부피: 1 L)로 간단히 세척되어 20% 인산자당 완충액(0.1M 인산(나트륨) 완충액(pH 7.3), 20% 자당)에 4℃에서 하룻밤동안 담구어 졌다. 그 후 조직은 OCT 혼합물(Tissue-Tek, Sakura Fineteck Japan)에 담구어 졌고 즉시 냉각되었다. 조직은 자온 유지 장치를 이용하여 5-㎛ 두께로 얇게 절단되었다. 얇게 절단된 부분은 20% Blocking One(Nacali Tesque) 및 0.05% Tween20을 함유한 PBS 내에서 인큐베이트되었다. 그 후 얇게 절단된 부분은 4000배 희석된 마우스 항-Cre 재조합 단일클론 항체(MAB3120, Chemicon)와 인큐베이트되었다. 두 번째 항체로써 비오틴화된 항-마우스 IgG 항체(Vector Laboratories Inc,)가 이용되었다. 발색 현상은 3,3-디아미노벤지딘(diaminobenzidien, DAB)(Dojindo Laboratories) 및 퍼옥시다제(Nacali Tesque)를 이용하여 수행되었다. DAB로 발색 현상 후 비교 염색은 메틸그린(Merck)을 이용하여 수행되었다.
<인공 수정>
임신한 암컷 말의 혈청 성선자극호르몬(PMSG)(CALBIOCHEM)은 암컷 C57BL/6 마우스(Charles River Japan)(마우스 당 5 IU) 내로 내부복막으로 주입되었다. 46 내지 48시간 후 인간 융모막 성선자극호르몬(hCG)(Teikohu Hormone MFG.)은 PMSG와 유사하게 마우스(마우스 당 5 IU) 내로 내부복막으로 주입되었다. 12시간 후 마우스는 경추탈골에 의해 안락사 되었고 난(egg) 덩어리는 추출되었다. 추출된 난은 0.3mg/ml 히알루로니다아제(hyaluronidase)(SIGMA)을 함유한 M2 배지에서 37℃에서 10분간 인큐베이트되었고 수정되지 않은 난이 수집되었다. 부고환은 관류 고정 전에 면역검색법에 대해 사용된 mPGK2 및 Fthl17의 형질전환 마우스로부터 추출되었다. 혈청은 부고환의 꼬리 부분으로부터 수집되었다. 수집된 정자는 5% CO2 인큐베이터 내 37℃에서 TYH 배지(인비트로 수정 배지)에 놓여져 활성화되었다. 그 후 정자는 수정되지 않은 난을 함유한 TYH 배지로 첨가되었다. 혼합물은 6시간 동안 동일한 5% CO2 인큐베이터 내에 있도록 하였다. 그 후 난은 세척되어 배아 배양 배지 WM으로 옮겨져 5% CO2 인큐베이터 내에서 37℃에서 하룻밤 동안 인큐베이션 되었다. 다음날 2-세포기에서 오직 난만이 가임신한 ICR 마우스의 난관 내로 이식되었다.
<mRNA를 이용한 유전자 발현의 확인>
TRIzol 시약(Invitrogen)이 형질전환 마우스 #2의 꼬리로부터 mRNA를 추출하기 위해 사용되어다. cDNA는 SuperScript Ⅲ(Invitrogen) 및 Oligi-dT 프라이머를 이용하여 추출된 mRNA의 역전사를 이용하여 수득되었고 Neo-F 프라이머(GCTCGACGTTGTCACTGAAG)(서열번호 79) 및 Neo-R 프라이머(CCAACGCTATGTCCTGATAG)(서열번호 80)을 이용하여 PCR되었다. 이것에 의해 mRNA 발현의 존재 또는 부재가 결정되어다. PCR은 Ex-Taq 중합효소를 이용하여 수행되었다(TAKARA).
<Cre 재조합을 이용한 재조합 효율의 분석>
타겟팅 벡터(도 18)로써 lox66과 lox71 사이의 지역의 서열은 pBluescriptⅡ 위에 생성되었다. 생성된 벡터 200 ng은 실온에서 2시간 동안 1 mg/ml BSA의 존재 하에 Cre 반응 완충액(BD Biosciences) 내 Cre 재조합 효소(BD Biosciences)와 반응되었다. 반응 후, Cre 재조합 효소를 비활성화하기 위해 70℃에서 5분간 인큐베이션이 수행되었다. 반응 용액은 컴페턴트(competent) 세포 내로 세포를 형질전환시키기 위해 열충격(heat shock)이 필요하였다. 형질전환된 세포는 LB-Amp 평판(1.5% 한천 분말(Nacali Tesque)이 LB 배지에 첨가되고 오토클레이브(autoclave)된 후 100 ㎍/ml 암피실린(SIGMA)으로 채워졌다)위에 플레이트되었다. 그 다음날 콜로니는 채취되었다. 콜로니는 LB-Amp 배지에서 배양되어 플라스미드가 추출되었다. 재조합은 ABI 시퀀서 3100을 이용하여 플라스미스를 시퀀싱한 결과에 기초해 확인되었다.
형질전환 마우스 생산의 목적은 진화의 속도가 정자형성 단계에 특이적인 돌연변이-형 Poldl의 과발현에 의해 조절될 수 있는지 아닌지를 결정하는 것이다.
또한 Cre 재조합의 발현에 의해 정자형성 단계에 특이적인 발현이 loxP 서열을 지니는 마우스 내에서 조절될 수 있다는 것이 고려된다. 따라서 두 개의 형질전환 마우스를 생산하기 위한 시도가 행해졌다: 정자형성 단계에서 명확하게 돌연변이-형 Poldl와 Cre 재조합 모두를 발현할 수 있는 형질전환 마우스 #1 및 loxP 서열을 이용하는 것에 의해 돌연변이-형 Poldl의 조직-특이적 과발현을 하게 하는 형질전환 마우스 #2(도 9).
(a) 형질전환 마우스 #1
형질전환 마우스 #1은 정자형성 단계에서 명확하게 돌연변이-형 Poldl와 Cre 재조합의 발현을 이끌어 낸다. 이러한 마우스를 생산하기 위해 정자형성 단계에서 유전자 발현을 이끌어내는 프로모터를 선택하는 것이 중요하다. 마우스의 고환에서 DNA 중합효소 δ는 정원세포 단계에서 발현되고 초기의 정모세포 단계부터 감수분열 전기까지 발현된다는 것이 제안되어 왔다(Dia Kamel, et al.,(1997) Biology of Reproduction, 57, 1367-1374).
따라서 정원세포 단계 또는 초기의 정모세포 단계에서 발현을 이끌어 내는 프로모터를 이용하는 것은 이해되었다. mPGK2(mouse phosphoglycerate kinase 2) 유전자 프로모터는 초기의 정모세포의 과발현을 위해 종종 사용된다(Nadia A. Higgy, et al.,(1995) Dev. Genetics, 16, 190-200). mPGK2 프로모터는 정자형성 단계에서 명확하게 발현을 이끌어 내는 프로모터에 대한 후보자로써 사용되었다. 또한 mPGK2 프로모터 보다 더 먼저 정자형성의 정원세포 단계에서 발현을 촉진하는 프로모터를 이용하는 것도 이해되었다. 그러나 정원세포 단계 또는 초기의 정모세포 단계에 대해 특이적인 발현이 실질적으로 가능한 프로모터는 없다는 것이 보고되어 왔다. 따라서 PCR에 의해 정원세포에서 명확하게 발현하는 것으로 알려진 유전자의 서열 업스트림을 클로닝하는 것에 의해 정자형성 단계에 대해 특이적인 신규한 프로모터를 개발하기 위한 시도가 행해졌다. 정원세포에서 특이적으로 발현하고 cDNA 서브트랙션법(subtracton method)(P. Jeremy Wang, et al., (2001), Nature genetics, 27, 422-426)에 의해 발견된 유전자 중에서 Fthl117(Ferritin heavy polypeptide-like 17) 유전자가 선택되었다. 유전자의 업스트림에 위치한 약 5.7kbp(서열번호 81)의 서열은 정원세포 단계에서 명확하게 발현하는 프로모터로써 이용되었다. 상기-설명된 정자형성 단계에 대해 특이적인 두 개의 프로모터는 형질전환 마우스 #1에 대한 벡터를 제조하기 위해 이용되었다. 도 9는 실제로 제조된 벡터를 개략적으로 보여준다. 돌연변이-형 Poldl 유전자와 Cre 재조합이 IRES(internal ribosome entry site)의 서열을 거쳐 연결된 벡터는 제조되었고 유전자는 정자형성 단계에서 명확하게 발현을 이끌어내지는 것이 예상된 프로모터에 의해 동시에 발현되었다.
생성된 벡터의 DNA의 형질전환 마우스를 생산하기 위해 수정란의 전핵 내로 미량주사되었다. 막 태어난 마우스내의 형질전환 유전자의 존재 또는 부재는 Cre 재조합에 대해 특이적인 프라이머를 이용한 PCR에 의해 결정되었다(도 10). 그 결과로써 mPGK2 프로모터(46마리 신생 마우스에서)에 대한 형질전환 마우스의 2개의 라인이 있었던 반면 Fthl17의 업스트림 서열에 대한 형질전환 마우스의 라인은 1개였다. 막 태어난 형질전환 마우스는 그들의 외양으로는 정상 마우스와 구별할 수 없었다. 프로모터의 발현 부위를 분석하기 위해 mPGK2(출생 후 14주) 및 Tfhl17(출생 후 13주 )의 F0 발생에서 형질전환 마우스의 고환이 추출되어 마우스 항-Cre 재조합 단일클론 항체를 이용하여 면역검색되었다(도 11). 도 11에서 DAB는 두 번째 항체의 발색 현상(블랙 브라운)에 대해 이용되었고 세포 내 염색 RNA 존재(블루 그린)에 대해 메틸 그린으로 염색된 것과 비교되었다. 대조군에서도 세뇨관의 바닥판에서 강한 블랙 브라운 발색 현상이 관찰되었다. 이러한 것의 배경은 첫 번째 항체가 마우스의 것이기 때문이다. 이러한 면역검색법의 결과에서 세뇨관 내의 블랙 브라운 발색 현상은 외래 Cre 재조합의 발현 부위를 나타낸다. 도 11에 따라 Cre 재조합은 mPGK2 프로모터를 이용한 형질전환 마우스와 Fthl17 서열 업스트림을 이용한 형질전환 마우스 모두의 고환의 세뇨관 내에서 발현되었다는 것이 확인되었다. 따라서 Fthl17 5.7-kbp 부위 서열 업스트림은 프모모터 활성을 지닌다는 가능성을 제안하였다. 또한 발색 현상은 mPGK2 프로모터가 사용되었을 때보다 Fthl17 서열 업스트림을 이용한 형질전환 마우스의 고환에서 Cre 재조합 염색의 결과에서 더 약했었다. 따라서 Fthl17의 서열 업스트림은 mPGK2 프로모터보다 더 낮은 프로모터 활성(발현 능력)을 지니는 다는 것이 제안된다. Russel et al.은 마우스, 래트, 개의 고환의 조직학적 분석을 이끌어냈고 서로로부터 정자형성의 단계를 구별하기 위해 표준을 요약하였다(Russell LD, Ettlin RA, Hikim APS, Cleggand ED.(1990), Histological and Histopathologicla Evaluation of Testis., Clearwaer, FL: Cache River Press). 이것에 따라 형질전환 마우스 #1의 염색 이미지에서 발현된 상기-설명된 두 개의 프로모터의 정자형성이 어떤 단계에서 결정되는 지를 결정하기 위해 한층 더 분석이 수행되었다. mPGK2 프로모터의 경우 발현은 주로 초기의 정모세포의 두 번째 단계에서 관찰되었다(도 12). 이 발현은 종래에 고려됐던 부위와는 다른 부위에서 관찰되었다. Fthl17의 서열 업스트림이 프로모터로써 사용된 경우에 발현은 초기의 정모세포 단계부터 정원세포 단계까지 관찰되었다(도 13). 염색의 결과에 따라 배경(염색된 바닥판)으로부터 정원세포 내 발현을 구별하기는 어려웠고 따라서 발현의 존재 또는 부재를 결정될 수 없었다.
상기-설명된 막 태어난 F0 발생은 mPGK2 프로모터(수컷 1, 암컷 1)를 이용한 형질전환 마우스와 Fthl17(수컷 1)의 서열 업스트림을 이용한 형질전환 마우스를 포함한다. 각 수컷의 고환은 면역검사법에 대한 샘플로써 사용되었다. 면역검사법에 대해 사용된 F0 발생 수컷은 출생 후 9주부터 복제에 대한 교미를 시작하였다. 실제 교미의 결과를 표 4(A)에 요약하였다.
교미된 암컷의 수 | 임신한 암컷의 후 | 임신율 | |
mPGK2 | 10 | 0 | 0% |
Fthl17 | 10 | 6 | 60% |
표 4(A)에서 복부가 커진 암컷을 임신한 암컷으로 계산하였다. mPGK2 프로모터를 이용한 수컷 형질전환 마우스의 경우에는 비록 약간의 암컷이 교미 다음날 임신이 확인되었기는 하지만 실제로 출산을 한 암컷은 없었다. 면역검사법이 더 수행되었을 때 형질전환 마우스는 마취되었고 마우스의 부고환은 관류 고정 전에 추출되었다. 정자는 인공 수정 시험을 위해 사용된 부고환으로부터 수득되었다(표 4(B)).
수정되지 않은 난의 수 | 2-세포기의 수 | 신샌아의 수 | |
mPGK2 | 23 | 0 | 0 |
Fthl17 | 22 | 8 | ? |
마우스의 어느 것으로부터 수집된 정자도 수정되지 않은 난을 침범하였다. 비정상은 관찰된 어떠한 정자에서도 발견되지 않았다. Fthl17의 서열 업스트림을 이용하는 형질전환 마우스의 경우에는 약간의 난은 통상보다 낮은 비율로 인공 수정 다음 날 2-세포기로 계속 진행되었다. 신생아는 난이 이식된 대리모에게 태어난 것이 확인되었다. 그러나 mPGK2 프로모터를 이용한 형질전환 마우스의 경우에는 인공 수정 후에 전핵 단계로 계속 진행하는 약간의 수정란이 있었지만 인공 수정 다음날 2-세포기에 도달한 난은 없었다. 따라서 면역검색법을 위해 사용된 mPGK2 프로모터를 이용한 수컷 형질전환 마우스는 정자생성에서 비정상을 지닌다는 가능성이 제안되었다. mPGK2 프로모터를 이용한 정상 마우스와 유사한 방식으로 출산을 하는 F0 발생의 암컷에서는 비정상이 두드러지게 발견되지 않았다는 것을 주목해야 한다.
(b) 형질전환 마우스 #2
형질전환 마우스 #2는 조직-특이적 방식으로 Cre 재조합을 발현하는 마우스와 교미하는 것에 의해 수득되었고 따라서 돌연변이-형 Poldl은 조직-특이적 방식으로 과발현되었다. 이것을 성취하기 위해 몸 전체에서 과발현을 위한 CAG 프로모터, 두 개의 loxP 서열에 의해 샌드위치되 네오마이신 내성 유전자, 여기에 연결된 돌연변이-형 Poldl로 구성된 서열의 벡터가 제조되었다(도 9). 전사의 종결을 나타내는 폴리A 시그널이 네오마이신 내성 유전자의 말단에 첨가되었다. 따라서 돌연변이-형 Poldl의 발현은 Cre 재조합의 조직-특이적 발현에 의해 시작될 수 있었다. 형질전환 마우스 #2는 형질전환 마우스 #1에서와 같이 생성되었다. 네오마이신 내성 유전자에 대해 특이적인 프라이머를 이용한 PCR로(도 10) 형질전환된 마우스 4 라인(20 신생아 내에서)이 확인되었다. 형질전환 마우스의 4 라인 중에서 3 라인의 F0 발생 마우스는 정상 마우스와 유사한 성정을 나타내었다. 따라서 비록 형질 특성의 전환율이 본 발명에 따라 조절된다고 해도 마우스내에서 실질적으로 비정상은 나타나지 않았다고 말할 수 있다.
mRNA는 형질전환 마우스 #2의 3 생존 라인의 꼬리로부터 추출되어 네오마이신 내성 유전자에 특이적인 프라이머를 이용하여 RT-PCR 되었다. 그 결과로써 네오마이신 내성 유전자의 발현이 확인되었다.
(타겟팅 마우스의 생성)
조직 또는 시간-특이적인 방식으로 돌연변이-형 Poldl 유전자로 교체되는 정상 Poldl와 원래의 DNA 중합효소의 발현 방식을 가능한한 많이 포함하고 있는 조건부 타겟팅 마우스를 제조하기 위한 시도가 행해졌다. Cre 재조합을 이용한 재조합의 경우, 만약 서로를 향하게 하도록 하기 위해 두 개의 loxP 서열이 연결되어 있다면 재조합은 두 개의 loxP 서열 사이에서 일어나고 따라서 loxP 서열에 의해 샌드위치된 부위는 역전될 수 있다. 즉 역전된 부위로 대체될 수 있다. 그러나 만약 두 개의 loxP 서열이 오직 서로를 향하게만 된다면 교체는 가역 반응 과정이다. 재조합 반응을 비가역적으로 진행시키기 위해 돌연변이는 Kimi Araki et al.,(1997), Nucleic Acids Res., 25, 868-872에 설명된 바와 같이 loxP 서열의 일부 내로 도입될 수도 있다.
조건부 타겟팅 마우스는 돌연변이된 loxP 서열을 이용하여 제조되었다. Lox66과 lox71이 제공되었고 서로를 향하게 하였다. 돌연변이-형 Poldl의 돌연변이 부위를 포함하는 정상 엑손 10의 서열과 돌연변이-형 엑손 10에 대한 상보서열은 서열 내에서 연결되었다(도 14). 이러한 벡터는 타겟팅 마우스를 제조하기 위해 사용되었다. 만약 재조합이 Cre 재조합의 발현 때문에 두 개의 lox 서열 사이에서 일어난다면 스플라이싱에 사용된 엑손 10은 정상-형에서 돌연변이-형으로 변화할 것이라는 것이 예상된다(도 15). 이것에 의해 정상-형 내생 DNA 중합효소 δ는 Cre 재조합의 발현 때문에 돌연변이-형으로 교체될 것이다. 타겟팅 벡터가 제조되었을 때 엑손 10은 그 반대쪽 말단에서 인트론 부분이 스플라이싱에 필수적인 서열을 포함하기 위해 준비되었다.
그러나 lox 66과 lox 71 서열은 돌연변이를 포함하였다. 따라서 Cre 재조합에 따른 재조합 효율은 정상 loxP 서열이 사용되었을 때 보다 더 낮아 질 것으로 생각된다. lox 66과 lox 71 서열이 서로를 향하게 되었을 때 반응이 적당하게 일어나는지 아닌지를 조사하기 위해 Cre 재조합 자체가 재조합을 수행하기 위해 사용되었다. 이것을 성취하기 위해 lox 66과 lox 71(lox66-71 재조합 서열로써 언급된) 사이의 두 개의 엑손 10을 포함하는 서열이 pBluescript Ⅱ 위에서 제조되었다. Cre 재조합과 서열을 반응시키는 것에 의해 재조합 효율이 조사되었다. 반응의 발생에 관하여 양성 대조군에 대한 실험으로써 형질전환 마우스 #2에 대한 벡터 서열이 사용되었다. 그 결과로써 Cre 재조합을 이용한 반응은 15분 내에 플라스미드의 50%로 재조합이 나타났고 2시간 내에 100% 재조합이 나타났다. lox 66-71 재조합에 대하여 2시간 동안 반응이 수행되었을 때 정상 재조합은 낮은 빈도로 확인되었다(1/3). 따라서 lox 66-71 재조합 서열 내 재조합의 발생이 확인되었다.
(유전적 형질의 전환율의 조절)
이러한 마우스가 유전적 형질 전환 수단에 노출되었을 때(예를 들면 높은 온도, 높은 습도, 높은 염농도 등) 환경에 적응할 수 있었던 개체의 수는 정상 마우스와 비교하여 두드러지게 증가하였다.
이 실시예의 방법에 따라 DNA 중합효소 δ의 프루프리딩 활성을 제거하는 것에 의해 불균형 돌연변이가 리딩 및 지연 DNA 사슬 모두에 축적될 수 있다는 것이 드러났다. 또한 정자형성 단계에서 명확하게 돌연변이를 지니는 DNA 중합효소 δ를 발현하는 것에 의해 마우스의 몸 전체에 나타난 돌연변이의 비율이 가능한 한 많이 감소될 수 있다는 것 역시 드러났다. 또한 유전자 조작 등에 따른 이차적인 영향도 가능한 한 많이 억제될 수 있다는 것도 드러났다. 이 실시예에서 상기-설명된 요구들을 만족하는 불균형 진화 마우스가 수득되었다.
돌연변이 마우스 #1의 경우 정자형성 단계에서 명확하게 발현되는 프로모터를 조사하는 것이 가능했다. 정자형성 단계에서 명확하게 발현된다고 일반적으로 알려진 대부분의 프로모터는 감수분열 후 정자세포 단계에서 명확하게 발현된다. 이 실시예에서 DNA 사슬이 복제되는 정원세포 단계 또는 초기 정모세포 단계에서 에서 수컷 생식 세포에서 명확하게 발현되는 프로모터를 이용하는 것이 의도되었다. mPGK2 프로모터는 이 조건을 만족하는 유일한 프로모터였다. 따라서 이 실시예에서 신규한 프로모터와 같은 Fthl17의 서열 업스트림을 이용하는 시도가 행해졌다. 그 결과로써 적어도 초기 정모세포 단계에서는 발현이 확인되었다. 정원세포에 대해 형질전환 마우스 #1이 유효한 CAG-CAT-GFP 돌연변이 마우스(본 발명에서 제조된 형질전환 마우스 #2와 유사한 구조를 지니는 벡터를 이용하여 제조된 형질전환 마우스; 및 이 마우스 내에서 GFP의 발현이 Cre 재조합의 발현에 의해 시작된다)와 교미되었고 따라서 GFP는 Cre 재조합이 발현되는 형질전환 마우스 #1의 부위에서 발현된다는 것으로 생각되었다. 따라서 GFP 발현 부위와 Cre 재조합 발현 부위의 결과를 결합하는 것에 의해 이 실시예의 프로모터의 발현 부위를 분석하는 것이 가능하다. Fth 117의 서열 업스트림은 TATA 박스 등의 서열과 결합하는 염기 전사 인자를 포함하지 않는다는 것을 주목해야 한다.
mPGK2 프로모터의 발현에서 정자형성 단계 후 발현은 관찰되지 않았고 이는 종래의 보고와 비교하여 더 늦은 단계였다.
형질전환 마우스 #1로 제조된 두 마리의 형질전환 마우스는 다른 발현 부위를 지닌다는 것이 제안되었다. 따라서 이러한 마우스는 전환율을 조절하기 위해 다양한 부위의 발현 효율을 비교하는 데에 이용되기에 유용하다고 생각된다. 정자형성 단계에서 명확하게 Cre 재조합을 발현하는 형질전환 마우스의 제조는 조직-특이적인 방식에서 발생하는 loxP 서열의 재조합을 이용하는 것에 의해 조절 유전자 불완전한 마우스를 수득하는 것을 가능하게 한다. 따라서 이러한 마우스는 생식 세포 연구에 대한 재료로써 이용될 수 있다.
형질전환 마우스 #2는 조직-특이적인 방식으로 돌연변이-형 Poldl의 과발현을 성취하기 위해 조직-특이적인 방식에서 Cre 재조합을 발현하는 마우스와 교미될 수 있다. 형질전환 마우스 #1에서 프로모터의 발현이 정지되었을 때 돌연변이-형 Poldl의 발현은 더 이상 일어나지 않는다. 상기-설명된 교미에 의해 돌연변이-형 Poldl의 발현은 프로모터의 발현이 끝난 후 계속될 수 있다. 또한 뇌, 간 등과 같은 조직에서 특이적으로 발현되는 Cre 재조합 형질전환 마우스와 교미하는 것에 의해 과발현의 영향은 체세포 수준에서 조사될 수 있다.
이 실시예의 결과에 따라 유전자 형질의 전환율은 넉아웃 마우스에서 조절될 수 있을 것이라는 것이 이해될 것이다.
(실시예 5: 식물로써 벼를 이용한 돌연변이 생물체의 제조)
실시예 5에서는 벼(식물)는 불균형 돌연변이 생물체를 제조하기 위한 대표적인 진핵세포 생물체로써 이용된다.
유전자 타겟팅 기술은 예를 들면 Yagi T. et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; "Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4에 나타나 있다. 실시예 4에서 불균등 DNA 복제 프루프리딩 능력(Morrison A., et al., Mol. Gen. Genet., 242:289-296, 1994)을 지닌 복제 복합체를 지니는 식물이 제조되었다.
변형된 유전적 형질은 질병(도열병) 내성과 저온 내성을 지닌다.
(유전자 타겟팅 기술)
돌연변이 DNA 중합효소(pol)(Morrison A., et al., Mol. Gen. Genet., 242:289-296, 1994)를 지니는 타겟팅 벡터가 준비되었다. 캘러스 등과 같은 식물세포는 식물 세포의 pol 유전자에 대한 상동성 재조합을 필요로 한다. 이에 따라 세포는 식물 줄기 내로 분화하게 된다.
(프로토콜)
(1. 캘러스 세포의 제조)
캘러스 세포는 예를 들면 Plant Tissue Culture에 설명된 잘 알려진 기술로 준비된다: Theory and Practice, Bhojwani, S.S. and Razdan, N.K., Elsevier, Amsterdam, 1983. 특히 캘러스 세포는 식물 줄기로부터 준비된다(Davies, R., 1981, Nature, 291:531-532 and Luo, Z., et al., Plant Mol. Bio. Rep., 7:69-77, 1989).
(2. pol 유전자의 상동성 재조합)
상동성 염색체 세포를 효율적으로 수득하기 위해 상동성 재조합이 마우스에 대한 유전자 타겟팅법이 수행되었다. 예를 들면 양성/음성법(Yagi T., et al., Proc. Natl. Acad. Sci. USA, 87: 9918-9922, 1999; Capecchi M.R., Science, 244(16), 1288-1292, 1989).
타겟팅 벡터의 준비: 타겟팅 벡터는 예를 들면 Molecular Cloning, 2nd edition, Sambrook, J., et al, supra, and Ausubel, F.M., Current Protocols in Molecular Biology, Green Publishing Associates and Wiley-Interscience, NY, 1987. 상동에 설명된 기술에 의해 준비되었다.
타겟팅 벡터에서 돌연변이 polδ 및 /또는 polε 유전자는 양성 유전자와 음성 유전자 사이에 삽입되었다. 디프테리아 독소가 음성 유전자로써 사용되는 동안 하이그로마이신 내성 유전자가 양성 유전자로써 사용되었다(Terada R., et al., Nature Biotech., 20:1030-1034, 2002).
Pol 돌연변이에 대해 염기 돌연변이가 프루프리딩 활성 을 제거하기 위해 polδ의 프루프리딩 활성 부위 내로 도입되었다(서열번호 48의 320 위치의 D 및 322 위치의 E는 알라닌(A)으로 치환된다)(Morrison A. & Sugino A., Mol. Gen. Genet. 242:289-296, 1994; Goldsby R.E., et al., Proc. Natil. Acad. Sci. USA, 99:15560-15565, 2002).
(3. 캘러스 세포 내로 벡터의 도입)
벡터는 예를 들면 "Shokubutsu Baiotekunoroji Ⅱ[Plant Biotechnology Ⅱ]", Yasuyuku & Kanji Ooyama, eds., Tokyo Kagakudojin, 1991에 설명된 기술에 의해 캘러스 세포 내로 도입된다. 실시에 5에서 벡터는 전기천공법, 아그로박테리움법 등에 의해 캘러스 세포 내로 도입되었다. 배양은 하이그로마이신(100 ㎍/ml, Invitrogen)을 함유한 DMEM 배지(Flow Laboratory)에서 수행되었다.
(4. 재조합 세포의 회수)
하이그로마이신 존재에서 배양 후, 재조합 세포는 회수되었다(Terada R., et al., Nature Biotech., 20:1030-1034, 2002).
(5. 상동성 재조합의 확인)
게놈 DNA는 재조합으로부터 추출되었다. 돌연변이 pol이 성공적으로 ES 세포 내로 도입되었는지 아닌지는 서던 블럿팅 및/또는 PCR에 의해 결정된다("Gintagettingu no Saishingijyutsu[Up-to-date Gene Targeting Technology]", Takeshi Yagi, ed., Special issue, Jikken Igaku [Experimental Medicine], 2000, 4).
(6. 식물 줄기의 제조)
식물 줄기는 예를 들면 "Shokubutsu Baiotekunoroji Ⅱ[Plant Biotechnology Ⅱ]", Yasuyuku & Kanji Ooyama, eds., Tokyo Kagakudojin, 1991; and "Shokubutsu Soshikibaiyo no Gijyutsu[Plant Tissue Culture Technique]", Masayuki Takeuti, Tetsuo Nakajima, & Riki Kotani, eds., Asakura Shoten, 1988에 설명된 방법으로 제조된다. 실시예 5에서 캘러스는 식물 줄기 내로 분화된다. 이에 따라 일배체 세포는 이종교배 식물에 의해 준비된 꽃밥, 종자 등 및/또는 일배체 세포로부터 유래되고 이러한 것들은 당분야에 잘 알려진 기술(Maki, H. et al., J. Bacteriology, 153(3), 1361-1367, 1983; Miller, J.H., 1992, A Short course in bacterial genetics, Cold Spring Harber Laboratory Press, Cold Spring Harber, N.Y.)들을 이용하여 pol 돌연변이(돌연변이유발유전자 돌연변이)의 특성을 확인하기 위해 사용된다.
(결과)
돌연변이를 지니는 실시예 5에서 수득된 식물은 종래의 기술에 의해 수득된 식물과 비교해 빨리 저온 내성 및 질병 내성(예를 들면 도열병 등)을 수득될 수 있다는 것이 관찰된다. 변형된 세포는 자연-발생 세포와 실질적으로 동일한 생장 속도를 지니지만 변형된 세포의 돌연변이 비율은 발생 당 하나 또는 그 이상이었고 이것은 종래의 돌연변이와 두드러지게 구별된다.
(실시예 6: 아라비돕시스 탈리아나(Arabidopsis thaliana) 내 실험)
아라비돕시스 탈리아나가 돌연변이 생물체를 제조하기 위해 사용되었다
(방법 및 재료)
(polδ cDNA 클로닝)
polδ(Atlg42120)(서열번호 90(핵산 서열) 및 서열번호 91(아미노산 서열))는 아라비돕시스 탈리아나의 뿌리에서 유래된 총 mRNA의 다음의 프라이머를 이용한 PCR에 의해 증폭되고 pBluescript SK2에서 서브클론되었다(TOYOBO).
Xbal-42120-F: 5'-CTGAGTCTAGATTTCCCGCCATGGAAATCG-3'(서열번호 82)
2g42120-Sacl-R: 5'-AGCAACGAGCTCTTATGATTGGTTTATCTG-3'(서열번호 83)
(돌연변아-형 polδ 유전자 polδ(D316A)(서열번호 92(핵산 서열) 및 서열번호 93(아미노산 서열)))
D에서 A로 polδ 내 아미노산 316을 변화시키는 다음의 프라이머를 이용하여 점 돌연변이가 유도되었다.
2g42120-D316A-F: 5'-ATTTGCTGTCGATAATATCAGATTTCTTGG-3' (서열번호 84)
2g42120R: 5'-GAGTGAGGATTTGTACATGATCTGAAGG-3' (서열번호 85)
(형절전환을 위한 백터의 제조)
유전자를 일관되게 발현하는 바이너리 플라스미드가 변형된 pBI121(CLONTECH)에 의해 제조되었다. pBI121의 β-글루쿠로니다제(glucuronidase) 유전자는 제한효소 XbaI 및 SacI를 이용하여 추출되었고 polδ(D316A)(이하 polδ(D316A)라 한다)으로 치환되었다.
형질전환을 위한 대조로써 사용된 벡터로써 상기-설명된 pBI121(이하 GUS라 한다) 및 β-글루쿠로니다제 유전자(이하 GTP라 한다)에 대해 GTP 치환을 지니는 pBI121가 제조되었다.
(캘러스의 제조)
아라비돕시스 탈리아나(모사: Columbia)는 발아 배지 위에 뿌려져 2일 또는 3일 동안 4℃에서 저온처리되었다. 그 후 평판은 인큐베이터 내(22℃)로 옮겨졌다. 이 종자는 10일 동안 어두운 장소에서 생장되었다. 생장한 어린 줄기는 1cm 길이로 잘려 차례로 10일 동안 CIM 배지 위에 두었다. 캘러스가 수득되었다.
(아그로박테리움을 이용한 캘러스의 형질전환)
GUS 또는 GTP 또는 polδ(D316A)를 지닌 바이너리 플라스미드를 함유한 아그로박테리움 pMP90은 50 mg/L로 채워진 LB 배지 내로 인큐베이트되어 2일 동안 28℃에서 진탕배양 되었다. 아그로박테리움 배양(OD600 = 약 0.8) 1.4 ml은 박테리아를 수집하기 위해 벤치-탑(bench-top) 원심분리기에서 5분 동안 원심분리되었다. 박테리아는 AIM 1 ml에서 부유되었다(하기 설명). 캘러스된 어린 줄기 단편은 AIM 5 ml를 함유한 60-mm 페트리 접시 내로 옮겨졌다. 아그로박테리움 상청액 1 ml이 접시에 첨가되었고 실온에서 20분 동안 진탕배양되었다. 캘러스는 여분의 수분 함량을 제거하기 위해 살균된 필터 위에 놓여졌고 그 후 새로운 CIM 평판으로 옮겨졌다. 3일 후 형질전환된 캘러스는 AIM을 함유한 60-mm 페트리 접시로 옮겨졌다. 접시를 25분 동안 60 rpm으로 회전시켰고 5번 세척하였다.
세척 후, 캘러스는 수분 함량을 제거하기 위해 필터 위로 놓여졌고 카르베니실린(carbenicillin) 50 mg/L과 카나마이신(kanamycin) 50 mg/L가 함유한 CIM 배지에서 생장되었다(하기 설명)(CIM 배지는 본 발명에 의해 준비되었다).
캘러스의 형질전환 비율이 95% 또는 그 이상이었다는 것을 주목해야 한다(오직 GTP가 도입된 캘러스만을 측정하였다; 및 GTP 형광의 존재 또는 부재가 시험되었다).
(캘러스의 2차 배양 및 돌연변이의 선별)
캘러스는 10일 마다 새로운 CIM 평판으로 옮겨졌다. 이 경우 하나의 캘러스가 두 개로 나누어 졌다. 그 절반이 2차 배양을 위해 CIM 평판에 놓여졌고 다른 절반은 다양한 조건 하에서 내성 돌연변이에 대한 스크리닝을 위해 평판에 놓여졌다.
NaCl 200 mM 또는 300 mM가 선별 평판 위에 첨가되었다. 2차 배양 및 선별은 10일 마다 수행되었다.
(배지의 조성)
발아 배지(1 리터):
Murashige 최소 유기 배지(GIBCO BRL) 1/2 패키지
자당 10 g
젤란 검(Wako Pure Chemical Industries) 5 g
(CIM (1리터))
Gamborg's B5 배지 염 화합물(Nihon Pharmaceutical) 1 패키지
포도당 20 g
마이오이노시톨 100 mg
5% Mes-KOH(pH 5.7) 10 ml
젤란 검 5g
오토클레이빙 후 다음의 물질들이 추가되었다:
티아민 하이드로클로라이드 20 mg
니코틴산 1 mg
피리독신 하이드로클로라이드 1 mg
비오틴 10 mg
2,4-D 0.5 mg
키네틴 0.05 mg
(AIM (1리터))
Gamborg's B5 배지 염 화합물(Nihon Pharmaceutical) 1 패키지
포도당 20 g
5% Mes-KOH(pH 5.7) 10 ml
(결과)
결과로써, 상기-설명된 사용된 유전자(GFP, GUS(형질전환에 대한 대조군), polδ(D316A))는 각각 95% 또는 그 이상의 형질전환 비율을 나타내었다(GTP가 도입된 개체만이 측정되었다; 및 GTP 형광의 존재 또는 부재가 검사되었다).
(진화를 위한 조건)
실시예에서 수득된 식물들은 다음의 유전적 형질을 변형시키기 위한 조건에 노출되었다.
선별 돌연변이가 다음의 조건 하에서 수행되었다.
1) 37℃ 평판은 37℃에서 인큐베이터 내에 놓여졌다.
2) 200mM NaCl NaCl 200mM가 배지에 첨가되었고 식물은 22℃에서 생장되었다.
3) 300mM NaCl NaCl 200mM가 배지에 첨가되었고 식물은 22℃에서 생장되었다.
(선별 돌연변이의 결과)
각 처리의 결과는 아래에 설명할 것이다. 아래 표의 숫자는 왼쪽부터: 비-처리된 캘러스와 같은 생장을 한 캘러스의 수(내성)/죽지는 않았지만 생장하지도 않은 캘러스의 수(약한 내성)/죽은 캘러스의 수(영향을 받기 쉬운)를 나타낸다.
처리 GFP polδ
37℃ 0/24/27 1/18/10
200 mM NaCl 0/20/145 0/58/112
300 mM NaCl 0/0/165 0/4/146
상기에 설명한 바와 같이 고온 처리에 내성을 나타낸 식물의 수는 증가되었다. 게다가 염 농도에 대해서도, NaCl 200 mM에 내성을 나타낸 캘러스의 수(polδ)는 대조군 보다도 훨씬 높았다. 따라서 본 발명의 방법은 식물에 높은 염 농도에 대한 내성을 줄 수 있다는 것이 밝혀졌다. 특히, 300 mM NaCl의 경우, 대조군은 내성을 획득할 수 없었던 반면 본 발명의 방법은 내성을 획득할 수 있었다.
(실시예 7: 아라비돕시스 탈리아나를 이용한 연속적인 내성 실험)
다음으로, 내성과 같은 유전적 형질이 발생 이상 번식되는지 아닌지가 결정되었다. 이 실험에 대한 조건은 실시예 6에 사용되었던 것과 동일하였다.
개체의 수는 아래에 설명된다.
플라스미드 형태 | 200 mM NaCl | 300 mM NaCl |
돌연변이 polδ | 75 | 75 |
GTP | 96 | 95 |
GUS | 75 | 68 |
<선별 방법>
캘러스가 제조되었다. 임의의 온도에서 생장한 캘러스가 두 개로 나누어 졌다. 그 중 하나는 정상 배지에서 원래의 크기로 생장되었던 반면 다른 하나는 내성 획득을 시험하기 위한 선택 배지에서 배양되었다. 정상 배지에서 캘러스가 상당히 생장하였을 때 다른 하나가 두 번째 선별을 위해 선택 배지 내로 옮겨지는 동안 나머지 하나는 정상 배지로 옮겨졌다. 총 6회 선별이 수행되었다. 300 mM NaCl의 경우 캘러스의 내성은 획득되지 않았다. 따라서 모든 실험은 200 mM NaCl에 대해서만 수행되었다.
도 16은 이 실험을 개략적으로 나타낸다.
<불연속적인 실험>
6회 선별에서 불연속적으로 나타나는 내성 캘러스의 수가 세어졌다. 한번 내성을 획득하였다가 잃은 캘러스는 위양성(pseudopositive)으로 고려되었다.
플라스미드 형태 | 200 mM NaCl 내성 캘러스의 수 |
돌연변이 polδ | 8 |
GTP | 6 |
GUS | 6 |
<연속적인 실험>
위양성 결과를 제거하기 위해 연속적으로 내성을 획득했던 캘러스의 수를 세었다. 6번째 선별까지 내성을 나타내었던 캘러스의 수는 다음과 같다.
플라스미드 형태 | 200 mM NaCl 내성 캘러스의 수 |
돌연변이 polδ | 1 |
GTP | 0 |
GUS | 0 |
이와 같이 오직 돌연변이 polδ를 지닌 형질만이 연속적인 내성을 나타내었다. 이러한 형질은 6번째 발생을 넘어서도 내성을 포함한다. 본 발명은 유전적 형질의 전환율뿐만 아니라 안정성에 있어서도 종래의 기술을 뛰어 넘는 것으로 밝혀졌다.
(실시예 8: ES 세포를 이용한 실험)
다음으로, 본 발명을 ES 세포에 적용할 수 있는지 아닌지가 결정되었다. 그 과정은 다음과 같다.
<ES 세포의 준비>
C57BL/6 및 CBA F1 마우스 배아(전형적인 방법에 따라 오사카 대학의 Yagi 실험실에 의해 준비)로부터 수득된 ES 세포주(TT-2 세포)가 배양되었고 ES 세포 배양 배지(ESM)(20% FBS, 0.1 mM NEAA, 1 mM 피루브산, LIF(ESGRO, Amrad) 및 머캡토에탄올을 함유한 DMEM)내 피더 위에서 증식되었다.
도입된 벡터(도 17)가 다음과 같이 준비되었다. 돌연변이 Poldl의 cDNA, 정상 Poldl 또는 EGTP 유전자가 단백질 발현 벡터인 pcDNA 3.1(+) 내로 혼합되었다. 제한 효소 처리가 선형 DNA 단편을 수득하기 위해 수행되었고 도입되기 위한 유전자에 대해 차례로 사용되었다. 증식된 ES 세포는 0.25% 트립신 용액에 의해 제거되었다. ES 세포는 2.0 x 106 ES 세포/큐벳의 비율로 큐벳(cuvette)에 놓여졌다. 세포는 25 nM 벡터 DNA 용액 100 ㎕와 혼합되어 유전자 도입을 위한 전기천공법을 수행하였다.
전기천공법 후, 세포는 48시간 동안 ESM을 이용하여 배양되었다. 그 후 세포는 G418(최종 농도: 200 ㎍/mL)(SIGMA)로 채워진 ESM 배지에서 배양되었다. 이것에 의해 유전자 도입된 세포가 구분되었다. 배양은 젤라틴-코팅된 평판에서 수행되었다. 그 후 ES 세포는 페니실린-스트렙토마이신(상업적 이용 가능한 생산품(GIBCO)의 100배 희석) 존재 하에서 배양되었다.
<6번째 에세이>
증식되고 트립신-처리된(2.5%, GIBCO) ES 세포는 10-cm 접시에 5.0 x 106 세포/접시로 뿌려졌다. 내성 콜로니는 6-TG(최종 농도: 200 ㎍/mL; SIGMA, 하이브리도마 테스트됨) 및 G418의 존재 하에서 구분되었다. 이 구분에서 세포는 젤라틴-코팅된 접시(0.1% 젤라틴 용액이 FALCON 353003 세포 배양 접시에 놓여진 후 37℃에서 37분간 인큐베이션되었다(SIGMA로부터 젤라틴 입수) 위에서 배양되었다. 배양 배지는 2일 마다 한번씩 교체되었다. 세포가 뿌려졌던 날은 0일로 간주하였다. 콜로니의 수는 11일에 세어졌다. 오직 상당히 번식되고 생장한 콜로니만이 세어졌다.
<실험의 결과>
#1 및 #2로 디자인된 돌연변이 Poldl의 두 개는 각각 전기전공법이 수행되었다. 양쪽의 경우에서 6개 10-cm 접시가 사용되었고 내성 콜로니가 나타난 것의 수를 세었다. 콜로니의 수는 아래에 나타낸다(0 x 6은 콜로니가 나타나지 않은 6개의 접시를 나타낸다).
돌연변이 Poldl 3 x 1, 1 x 2, 0 x 9
야생형 Poldl 0 x 6
EGTP 대조군 0 x 6
이 실시예의 결과에 따라 생장한 콜로니가 돌연변이 Poldl의 경우에만 관찰되었다. 돌연변이의 타겟이었던 수득된 콜로니 HGPRT 유전자에 대해 돌연변이의 도입을 확인하기 위해 부분적으로 시퀀스될 수 있었다.
이에 따라 돌연변이 Poldl 유전자의 과발현은 마우스 ES 세포 내로 돌연변이의 도입을 용이하게 한다는 것이 밝혀졌다. 따라서 ES 세포에서 유전적 형질의 전환율을 조절하는 것이 가능하고 비율 및 안정성도 증가되었다는 것이 설명되었다.
(실시예 9: 그람-양성 박테리아)
이 실시예에서 전형적인 그람-양성 박테리아인 바실러스 서브틸리스(Bacillus subtilis)가 숙주 세포로 사용되었고 돌연변이가 도입되었다. 돌연변이에서 각각 425 및 427 위치에서 아스파르트산 및 글루탐산이 중합효소 C에서 돌연변이되었고 서열번호 15에서 발생하였다. 중합효소 C 돌연변이는 플라스미드(pHY300PLK, TAKARA)를 통해 바실러스 서브틸리스 내로 도입된다. 그 후 박테리아는 진화를 위한 조건 하에 노출되었다.
돌연변이의 제조 후, 예를 들면 중간 고온(예를 들면 42℃)은 50℃ 또는 그 이상으로 점차 증가된다.
바실러스 서브틸리스는 광범위하게 연구된 토양 박테리아 형태이다. 생장 온도는 20∼50℃이다(박테리아는 pH 6∼7에서 30분 동안 2배가 된다).
상기에 설명한 바와 같이 진화를 위한 조건 하에서 본 실시예의 약간의 바실러스 형질은 55℃ 정도의 고온에서도 살 수 있었다. 형질은 2차 배양에서 그 특성을 유지할 수 있다.
이와 같이 E. coli와는 달리 DNA 복제 메커니즘을 지니는 박테리아의 진화 속도를 조절하는 것이 가능하다는 것이 밝혀져다.
(실시예 10: 유전자의 분리)
실시예 10에서 유전적 형질을 변화시키는 데에 역할을 하는 유전자가 분리된다. 실시예 1의 약제 내성을 획득한 생물체가 분리된다. 이 후 약제 내성을 포함한 유전자의 서열이 변형 및 변형된 생물체 이전의 원래의 생물체에서 결정된다. 그 결과로써 자이레이스(gyrase)(또는 토포이소중합효소 Ⅱ) 서브유니트 A 및 토포아이소머라제 Ⅳ 유전자가 변형된 것이 발견된다. 이 서열은 적당한 프라이머를 이용한 PCR에 의해 증폭되고 전체-길이 유전자가 분리된다. 원래의 유전자 및 변형된 유전자로부터 폴리펩타이드는 합성되고 그것의 활성이 측정된다. 그 결과로써 활성은 임의로 변화한다는 것이 발견된다. 따라서 본 발명의 방법은 유전자 수준에서 돌연변이를 순식간에 도입할 수 있다는 것이 설명된다.
(실시예 11: 새로운 생성 물질의 분리)
실시예 11에서 변형에 의해 수득된 새로운 생성 물질이 분리되었다. 실시예 1의 약제 내성을 획득한 생물체가 분리되었다. 이 후 변형 이전의 원래의 생물체에는 존재하지 않고 변형된 생물체에 존재하는 물질은 크로마토그래피 분석(예를 들면 HPLC 등)에 의해 확인된다. 새로운 생성 물질이 분리된다. 그 결과로써 자이레이스(또는 토포이소중합효소 Ⅱ) 서브유니트 A 및 토포아이소머라제 Ⅳ 유전자가 새로운 생성 물질이라는 것이 발견된다. 따라서 본 발명의 방법은 새로운 생성 물질의 도입에서 실질적으로 유용하다는 것이 설명된다.
(실시예 12: 오류-빈발 빈도를 변형하는 다른 방법)
상기-설명된 돌연변이 대신, DNA 복제의 정확도를 감소시키기 위해 중합효소 δ 및 ε의 중합효소 부분의 활성을 손상시키는 돌연변이의 도입이 가능하다.
(실시예 13: 오류-빈발 빈도 및 진화 속도 사이의 관계)
대조군으로써 돌연변이를 도입하는 종래의 방법(방사선, 화학적 처리 등)이 실시예 1에 설명된 바와 같이 약제 내성, 알코올 내성 및 고온 내성을 획득한 효모에 대한 실험에서 수행되었다. 그 결과로써 본 발명에 의한 내성 획득의 비율은 종래의 기술에 의한 것보다 두드러지게 더 높았다. 두 개의 실험이 동시에 시작되었을 때 내성 형질은 종래의 기술 보다 더 빨리 본 발명에 의해 수득될 수 있었다.
실시예 13에서, 점차적으로 변화하는 돌연변이 비율을 지니는 방법은 내성의 획득에 대해 요구되는 시간을 비교하기 위해 사용되었다. 그 결과로써 진화의 속도가 수득될 수 있었다.
여기에 임의의 바람직한 실시태양이 설명되었지만 첨부한 청구범위에 나타낸 것을 제외하고는 본 발명의 범위를 이러한 실시태양으로 제한하는 것은 아니다. 다양한 다른 변형 및 상응하는 것들은 명백할 것이고 여기에 설명된 것을 숙지한 후, 본 발명의 범위와 정신으로부터 벗어나지 않고 당분야의 이러한 기술에 의해 쉽게 제조될 수 있다. 여기에 인용되는 모든 특허, 공개된 특허출원 및 간행물은 여기에 충분히 나타난 것과 같이 참조로써 통합된다.
본 발명에 따라 종래의 방법과 비교해 생물체에 신속하고 실질적으로 부작용 없이 요구되는 형질을 수여할 수 있다. 또한 본 발명에 따라 생물체의 유전적 형질은 쉬운 조작에 의해 변형될 수 있다. 이것에 의해 종래의 방법에 의해서는 수 득될 수 없었던 유용한 생물체, 유전자, 유전자 생성물, 대사산물 등을 효과적으로 수득되는 것이 가능하다.
<110> Neo-Morgan Laboratory Incorporated
FURUSAWA, Mitsuru
<120> Method and system for rapidly conferring a desired trait to an
organism
<150> JP2003-092898
<151> 2003-03-28
<150> US10/684,141
<151> 2003-10-10
<160> 95
<170> KopatentIn 1.71
<210> 1
<211> 3551
<212> DNA
<213> Saccharomyces cerevisiae
<400> 1
acgcgtaact ttttattcta taaaatgttc aatgaggaca tctgctattc gcttatgaag 60
aacaaacact cagtactact gatctaaggc aattttcaag gataaaggaa aatagatatt 120
gagcacttgc tattaagcat taatctttat acatatacgc acagcaatga gtgaaaaaag 180
atcccttccc atggttgatg tgaagatcga tgacgaggat actccccagt tggaaaagaa 240
aatcaaacgg caatcaatag atcatggtgt tggaagtgaa cctgtttcaa caatagagat 300
tattccgagt gattcttttc gaaaatataa tagtcaaggc ttcaaagcaa aggatacaga 360
tttaatgggt acgcaattag agtctacttt tgaacaagag ctatcgcaaa tggaacatga 420
tatggccgac caagaagagc atgacctgtc atcattcgag cgtaagaaac ttccaaccga 480
ttttgaccca agtttgtatg atatttcttt ccaacaaatt gatgcggaac agagcgtact 540
gaatggtatc aaagatgaaa atacatctac cgtggtaagg ttttttggtg tcactagtga 600
aggacactct gtactttgta atgttacagg gttcaagaac tatctttacg tcccagcgcc 660
caattcttcc gacgctaacg atcaggagca aatcaacaag tttgtgcact atttaaacga 720
aacatttgac cacgctattg attcgattga agttgtatct aaacagtcta tctggggtta 780
ttccggagat accaaattac cattctggaa aatatacgtc acctatccgc atatggtcaa 840
caaactgcgt actgcgtttg aaagaggtca tctttcattc aactcgtggt tttctaacgg 900
cacgactact tatgataaca ttgcctacac tttaaggtta atggtagatt gtggaattgt 960
cggtatgtcc tggataacat taccaaaagg aaagtattcg atgattgagc ctaataacag 1020
agtttcctct tgtcagttgg aagtttcaat taattatcgt aacctaatag cacatcctgc 1080
tgagggtgat tggtctcata cagctccatt gcgtatcatg tcctttgata tcgagtgtgc 1140
tggtaggatt ggcgtctttc cggaacctga atacgatccc gtcatccaaa ttgccaacgt 1200
tgtgagtatt gctggcgcta agaaaccatt cattcgtaat gtgtttactc tgaatacatg 1260
ctcacccata acaggttcaa tgattttttc ccacgccact gaagaggaaa tgttgagcaa 1320
ttggcgtaac tttatcatca aagttgatcc tgatgttatc attggttata atactacaaa 1380
ttttgatatc ccttatcttt taaaccgtgc aaaggcgcta aaggtgaatg atttcccata 1440
ttttggaagg ttaaaaaccg ttaagcaaga aattaaagag tctgtgttct cttcgaaggc 1500
ttatggtaca agagaaacca aaaatgtcaa tattgacggc cgattacagt tggatctttt 1560
gcaatttatt cagcgtgagt ataaactaag atcctacacg ttgaatgcag tctctgcgca 1620
ctttttaggt gaacagaagg aggatgtaca ttatagcatc atttctgatc tacaaaatgg 1680
cgatagtgaa acaagaagaa ggttggccgt ttactgtttg aaagacgcct acctgccttt 1740
aaggcttatg gaaaaactaa tggcgttagt taactataca gaaatggctc gtgttacagg 1800
tgtgccattt tcatatttac tagctcgtgg tcaacaaatt aaagttgttt ctcaactatt 1860
tcgaaagtgc ctggagattg atactgtgat acctaacatg caatctcagg cctctgatga 1920
ccaatatgag ggtgccactg ttattgagcc tattcgtggt tattacgatg taccgattgc 1980
aactttggat ttcaattctt tatatccaag tattatgatg gcgcacaacc tatgttatac 2040
aacactttgt aacaaagcta ctgtagagag attgaatctt aaaattgacg aagactacgt 2100
cataacacct aatggagatt attttgttac cacaaaaaga aggcgtggta tattaccaat 2160
tattctggat gaattaataa gtgctagaaa acgcgctaaa aaagatctga gagatgagaa 2220
ggatccattc aaaagagatg ttttaaatgg tagacaattg gctttgaaga tttcagctaa 2280
ctctgtctat ggttttacag gagcgacggt gggtaaattg ccatgtttag ccatttcttc 2340
atctgttact gcttatggtc gtaccatgat tttaaaaact aaaaccgcag tccaagaaaa 2400
atattgtata aagaatggtt ataagcacga tgccgttgtg gtttacggtg acactgattc 2460
cgttatggta aagtttggta caacagattt aaaggaagct atggatcttg gtaccgaagc 2520
tgccaaatat gtctccactc tattcaaaca tccgattaac ttagaatttg aaaaagcata 2580
cttcccttac cttttgataa ataaaaagcg ttatgcaggt ttattctgga ctaatcctga 2640
caagtttgac aagttggacc aaaaaggcct tgcttctgtc cgtcgtgatt cctgttcctt 2700
ggtttctatt gttatgaata aagttttaaa gaaaatttta attgaaagaa atgtagatgg 2760
tgctttagct tttgtcagag aaactatcaa tgatattctg cataatagag tagatatttc 2820
aaagttgatt atatcaaaga cgttagcccc aaattacaca aatccacagc cgcacgccgt 2880
tttggctgaa cgtatgaaga ggagagaggg cgttggtcca aatgttggtg atcgtgtgga 2940
ctatgtcatt atcggtggta atgataaact ttacaataga gcagaagatc cattatttgt 3000
actagaaaac aatattcaag tggattcgcg ctattattta actaatcaat tacaaaatcc 3060
aatcattagt attgttgcac ctattattgg cgacaaacag gcgaacggta tgttcgttgt 3120
gaaatccatt aaaattaaca caggctctca aaaaggaggc ttgatgagct ttattaaaaa 3180
agttgaggct tgtaaaagtt gtaaaggtcc gttgaggaaa ggtgaaggcc ctctttgttc 3240
aaactgtcta gcaaggtctg gagaattata cataaaggca ttatacgatg tcagagattt 3300
agaggaaaaa tactcaagat tatggacaca atgccaaagg tgcgctggta acttacatag 3360
tgaagttttg tgttcaaata agaactgtga cattttttat atgcgggtta aggttaaaaa 3420
agagctgcag gagaaagtag aacaattaag caaatggtaa aaaacgatag ggtggcacat 3480
catattagga ttaagaaagg ctaacaactt tttgcatgtt ggtggatata tatgtatata 3540
taaatagata c 3551
<210> 2
<211> 1097
<212> PRT
<213> Saccharomyces cerevisiae
<400> 2
Met Ser Glu Lys Arg Ser Leu Pro Met Val Asp Val Lys Ile Asp Asp
1 5 10 15
Glu Asp Thr Pro Gln Leu Glu Lys Lys Ile Lys Arg Gln Ser Ile Asp
20 25 30
His Gly Val Gly Ser Glu Pro Val Ser Thr Ile Glu Ile Ile Pro Ser
35 40 45
Asp Ser Phe Arg Lys Tyr Asn Ser Gln Gly Phe Lys Ala Lys Asp Thr
50 55 60
Asp Leu Met Gly Thr Gln Leu Glu Ser Thr Phe Glu Gln Glu Leu Ser
65 70 75 80
Gln Met Glu His Asp Met Ala Asp Gln Glu Glu His Asp Leu Ser Ser
85 90 95
Phe Glu Arg Lys Lys Leu Pro Thr Asp Phe Asp Pro Ser Leu Tyr Asp
100 105 110
Ile Ser Phe Gln Gln Ile Asp Ala Glu Gln Ser Val Leu Asn Gly Ile
115 120 125
Lys Asp Glu Asn Thr Ser Thr Val Val Arg Phe Phe Gly Val Thr Ser
130 135 140
Glu Gly His Ser Val Leu Cys Asn Val Thr Gly Phe Lys Asn Tyr Leu
145 150 155 160
Tyr Val Pro Ala Pro Asn Ser Ser Asp Ala Asn Asp Gln Glu Gln Ile
165 170 175
Asn Lys Phe Val His Tyr Leu Asn Glu Thr Phe Asp His Ala Ile Asp
180 185 190
Ser Ile Glu Val Val Ser Lys Gln Ser Ile Trp Gly Tyr Ser Gly Asp
195 200 205
Thr Lys Leu Pro Phe Trp Lys Ile Tyr Val Thr Tyr Pro His Met Val
210 215 220
Asn Lys Leu Arg Thr Ala Phe Glu Arg Gly His Leu Ser Phe Asn Ser
225 230 235 240
Trp Phe Ser Asn Gly Thr Thr Thr Tyr Asp Asn Ile Ala Tyr Thr Leu
245 250 255
Arg Leu Met Val Asp Cys Gly Ile Val Gly Met Ser Trp Ile Thr Leu
260 265 270
Pro Lys Gly Lys Tyr Ser Met Ile Glu Pro Asn Asn Arg Val Ser Ser
275 280 285
Cys Gln Leu Glu Val Ser Ile Asn Tyr Arg Asn Leu Ile Ala His Pro
290 295 300
Ala Glu Gly Asp Trp Ser His Thr Ala Pro Leu Arg Ile Met Ser Phe
305 310 315 320
Asp Ile Glu Cys Ala Gly Arg Ile Gly Val Phe Pro Glu Pro Glu Tyr
325 330 335
Asp Pro Val Ile Gln Ile Ala Asn Val Val Ser Ile Ala Gly Ala Lys
340 345 350
Lys Pro Phe Ile Arg Asn Val Phe Thr Leu Asn Thr Cys Ser Pro Ile
355 360 365
Thr Gly Ser Met Ile Phe Ser His Ala Thr Glu Glu Glu Met Leu Ser
370 375 380
Asn Trp Arg Asn Phe Ile Ile Lys Val Asp Pro Asp Val Ile Ile Gly
385 390 395 400
Tyr Asn Thr Thr Asn Phe Asp Ile Pro Tyr Leu Leu Asn Arg Ala Lys
405 410 415
Ala Leu Lys Val Asn Asp Phe Pro Tyr Phe Gly Arg Leu Lys Thr Val
420 425 430
Lys Gln Glu Ile Lys Glu Ser Val Phe Ser Ser Lys Ala Tyr Gly Thr
435 440 445
Arg Glu Thr Lys Asn Val Asn Ile Asp Gly Arg Leu Gln Leu Asp Leu
450 455 460
Leu Gln Phe Ile Gln Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn
465 470 475 480
Ala Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His Tyr
485 490 495
Ser Ile Ile Ser Asp Leu Gln Asn Gly Asp Ser Glu Thr Arg Arg Arg
500 505 510
Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Met
515 520 525
Glu Lys Leu Met Ala Leu Val Asn Tyr Thr Glu Met Ala Arg Val Thr
530 535 540
Gly Val Pro Phe Ser Tyr Leu Leu Ala Arg Gly Gln Gln Ile Lys Val
545 550 555 560
Val Ser Gln Leu Phe Arg Lys Cys Leu Glu Ile Asp Thr Val Ile Pro
565 570 575
Asn Met Gln Ser Gln Ala Ser Asp Asp Gln Tyr Glu Gly Ala Thr Val
580 585 590
Ile Glu Pro Ile Arg Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp
595 600 605
Phe Asn Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr
610 615 620
Thr Thr Leu Cys Asn Lys Ala Thr Val Glu Arg Leu Asn Leu Lys Ile
625 630 635 640
Asp Glu Asp Tyr Val Ile Thr Pro Asn Gly Asp Tyr Phe Val Thr Thr
645 650 655
Lys Arg Arg Arg Gly Ile Leu Pro Ile Ile Leu Asp Glu Leu Ile Ser
660 665 670
Ala Arg Lys Arg Ala Lys Lys Asp Leu Arg Asp Glu Lys Asp Pro Phe
675 680 685
Lys Arg Asp Val Leu Asn Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala
690 695 700
Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Lys Leu Pro Cys
705 710 715 720
Leu Ala Ile Ser Ser Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Leu
725 730 735
Lys Thr Lys Thr Ala Val Gln Glu Lys Tyr Cys Ile Lys Asn Gly Tyr
740 745 750
Lys His Asp Ala Val Val Val Tyr Gly Asp Thr Asp Ser Val Met Val
755 760 765
Lys Phe Gly Thr Thr Asp Leu Lys Glu Ala Met Asp Leu Gly Thr Glu
770 775 780
Ala Ala Lys Tyr Val Ser Thr Leu Phe Lys His Pro Ile Asn Leu Glu
785 790 795 800
Phe Glu Lys Ala Tyr Phe Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr
805 810 815
Ala Gly Leu Phe Trp Thr Asn Pro Asp Lys Phe Asp Lys Leu Asp Gln
820 825 830
Lys Gly Leu Ala Ser Val Arg Arg Asp Ser Cys Ser Leu Val Ser Ile
835 840 845
Val Met Asn Lys Val Leu Lys Lys Ile Leu Ile Glu Arg Asn Val Asp
850 855 860
Gly Ala Leu Ala Phe Val Arg Glu Thr Ile Asn Asp Ile Leu His Asn
865 870 875 880
Arg Val Asp Ile Ser Lys Leu Ile Ile Ser Lys Thr Leu Ala Pro Asn
885 890 895
Tyr Thr Asn Pro Gln Pro His Ala Val Leu Ala Glu Arg Met Lys Arg
900 905 910
Arg Glu Gly Val Gly Pro Asn Val Gly Asp Arg Val Asp Tyr Val Ile
915 920 925
Ile Gly Gly Asn Asp Lys Leu Tyr Asn Arg Ala Glu Asp Pro Leu Phe
930 935 940
Val Leu Glu Asn Asn Ile Gln Val Asp Ser Arg Tyr Tyr Leu Thr Asn
945 950 955 960
Gln Leu Gln Asn Pro Ile Ile Ser Ile Val Ala Pro Ile Ile Gly Asp
965 970 975
Lys Gln Ala Asn Gly Met Phe Val Val Lys Ser Ile Lys Ile Asn Thr
980 985 990
Gly Ser Gln Lys Gly Gly Leu Met Ser Phe Ile Lys Lys Val Glu Ala
995 1000 1005
Cys Lys Ser Cys Lys Gly Pro Leu Arg Lys Gly Glu Gly Pro Leu Cys
1010 1015 1020
Ser Asn Cys Leu Ala Arg Ser Gly Glu Leu Tyr Ile Lys Ala Leu Tyr
1025 1030 1035 1040
Asp Val Arg Asp Leu Glu Glu Lys Tyr Ser Arg Leu Trp Thr Gln Cys
1045 1050 1055
Gln Arg Cys Ala Gly Asn Leu His Ser Glu Val Leu Cys Ser Asn Lys
1060 1065 1070
Asn Cys Asp Ile Phe Tyr Met Arg Val Lys Val Lys Lys Glu Leu Gln
1075 1080 1085
Glu Lys Val Glu Gln Leu Ser Lys Trp
1090 1095
<210> 3
<211> 7505
<212> DNA
<213> Saccharomyces cerevisiae
<400> 3
cgctctgccc tagttggaat gccatcgaac cacgaggatc ttggaatgga aaaccaccgc 60
cactgccatt tacgtttgca ttcatattcg cattaccttg gccattcacg ggcgtgttcc 120
tcggaatttg cattggtcgt tgctgttgtg gagtgtggga aaagcgatcg ttaacgccat 180
tctgctcact tgttgcatat gcgtacggat tataagacat cttggtatgg gcctttggtt 240
ttcgttttct gctattgata ctcagtagcg aggtcttaca atcgaaaagt caaaaagatg 300
agttgtagta taaaacaaca gctctggtgt gcaatatgga tcttgataca gagtctcgga 360
tatgctgttt tagcactgag aaaaagtaat agtaacactg tcagtgttcg tcaaaggccc 420
aagtttattg tcatttgaat tgtcagaatg gtttattttc aggtagggta accagaacgc 480
gtaagtttct tgcatctttt accattttaa ctggaagagg acctatcaaa aagagcatat 540
gatgatgaaa gagcacattc tatcaagata acactctcag gggacaagta tatgatgttt 600
ggcaagaaaa aaaacaacgg aggatcttcc actgcaagat attcagctgg caacaagtac 660
aacacactct caaataatta tgcgcttagc gcgcaacagc tcttaaatgc tagtaagatc 720
gatgacatcg attcgatgat gggatttgaa agatacgtac cgccgcaata caatggcagg 780
tttgatgcga aggatataga tcagattcca ggccgcgtag ggtggctgac gaacatgcac 840
gcaacgctgg tctctcagga aaccttatcc agtggtagta atggcggcgg caattcgaat 900
gacggagaac gtgtaacgac caaccaaggt atttccggag ttgacttcta ctttttagat 960
gaagagggtg ggagcttcaa gtcgacagtt gtctatgacc catacttctt tattgcgtgt 1020
aacgatgaat caagagtaaa tgatgtggag gaactagtga aaaaatatct ggaatcttgt 1080
ctcaaaagct tacaaatcat tagaaaggaa gatcttacca tggacaatca ccttttaggg 1140
ctgcagaaga cacttattaa gttatcattt gtaaattcca atcagttatt cgaggccagg 1200
aaactcctga ggccaatctt gcaggataat gccaataata atgtgcaaag aaatatatat 1260
aacgttgctg caaatggctc ggaaaaagtt gacgccaaac atctgatcga agatatcagg 1320
gaatatgatg tgccgtatca tgtccgagta tctatagaca aggacattag agtcggtaaa 1380
tggtataagg taactcaaca gggattcatt gaagatacta ggaaaattgc atttgccgac 1440
cctgtggtaa tggcatttga tatagaaacc acgaagccgc ctttaaaatt cccggattcc 1500
gccgtagatc aaataatgat gatttcgtat atgatcgatg gggaaggttt tttgataaca 1560
aatagggaga taatctctga ggatattgaa gactttgagt atacaccgaa accggagtat 1620
cctggttttt tcaccatatt taacgaaaac gatgaagtgg cgcttctaca aaggtttttt 1680
gaacatataa gagatgtacg acccactgtt atatccacct tcaatggtga ctttttcgat 1740
tggcctttta tacataacag aagtaagatt cacggcttgg acatgttcga tgaaattggt 1800
ttcgctccag atgctgaagg tgagtacaag tcctcatact gctctcacat ggattgtttc 1860
cgttgggtga agcgtgattc ttatttacca caaggttccc agggtttaaa agctgttact 1920
caatctaagc taggttataa cccaattgaa ctggatcccg aattaatgac gccgtatgca 1980
tttgaaaagc cacagcacct ttccgaatat tctgtttccg atgcagtcgc tacgtattac 2040
ctttacatga aatatgttca tccttttatc ttttcccttt gtactattat tcctttgaac 2100
ccggatgaaa cattgagaaa gggtaccggt actttgtgtg aaatgttgtt gatggttcaa 2160
gcttatcaac ataatattct tctaccaaat aagcatacag atcccattga gaggttctat 2220
gatggacatc ttctagaatc cgagacttac gtgggtggac atgtggagtc attagaagct 2280
ggtgttttta ggagtgattt gaagaatgaa ttcaagatag atccttctgc cattgatgaa 2340
ttattacaag aattaccaga agctttgaaa tttagtgtgg aagttgaaaa taagtccagt 2400
gtagataaag taacgaattt tgaggaaata aaaaaccaga taacgcagaa attattagag 2460
ttgaaggaaa acaatataag aaacgaacta cctttgatct atcatgtaga tgtcgcctct 2520
atgtacccaa acatcatgac tacaaataga ctacaaccag atagtatcaa agcagagcgc 2580
gattgtgcta gttgcgattt taatagaccc ggaaaaacct gtgcaagaaa gttaaaatgg 2640
gcttggagag gagaattctt tcccagtaag atggatgagt ataacatgat caagcgtgca 2700
ttacaaaatg agacttttcc caacaaaaac aagttttcta aaaagaaagt tttgacattt 2760
gatgaactaa gttacgcaga ccaagttatc cacataaaaa aacgtttaac tgaatattca 2820
aggaaagttt atcatagggt taaagtatca gaaattgtcg aacgagaagc cattgtctgc 2880
caaagagaaa atccattcta cgtcgatacc gtgaaatcct ttcgtgatag gcgttacgaa 2940
ttcaaaggtt tagccaagac ttggaaggga aatctgtcca aaattgaccc atctgataag 3000
catgcgagag acgaggccaa aaagatgatt gtgctttatg actcattaca attagctcac 3060
aaagttattt tgaattcgtt ttatgggtat gttatgagga aaggctctcg ttggtattcc 3120
atggaaatgg cggggattac gtgtttaaca ggtgccacga tcattcaaat ggcgagagct 3180
ttagtagaaa gggtaggaag accattagaa ttagatactg atggtatttg gtgtatctta 3240
ccaaaatctt tccctgaaac ttactttttt acattagaaa atggtaaaaa gctttatctc 3300
tcctacccat gttccatgct gaattacaga gttcaccaaa agtttacgaa tcaccaatac 3360
caagaattaa aagacccatt gaactatata tatgagacgc acagtgaaaa cacgattttt 3420
ttcgaagttg acggaccata taaggccatg attttgccta gttccaagga agaaggaaaa 3480
ggtataaaga aaagatatgc tgtcttcaat gaagacggct cacttgctga actgaaaggt 3540
tttgaattga agaggcgtgg tgaattacaa ctaataaaaa attttcaaag tgatattttc 3600
aaggtctttt tggaaggtga tacattagaa ggatgttaca gtgctgtagc aagcgtatgt 3660
aaccgttggt tagatgttct tgattcacat ggtcttatgt tagaagatga agacttggtc 3720
agtttgattt gtgaaaatag aagtatgtca aaaactttaa aggaatatga agggcaaaaa 3780
tctacttcta ttacgacggc aaggagattg ggggattttt tgggtgaaga tatggtaaaa 3840
gataaaggtc tacaatgtaa atatattatt agttcaaaac ctttcaatgc acctgttact 3900
gaacgagcca ttccagtcgc aatattttca gcggacattc ccatcaaaag gtcttttctg 3960
aggcgatgga cattagatcc atctttggaa gatctggata tcagaaccat aatcgattgg 4020
ggttattata gagaaagact tggatctgct atacaaaaga taattactat tccagcagca 4080
ttacaagggg tttccaatcc tgttccaagg gttgaacatc cagattggct aaaaagaaaa 4140
atcgctacaa aggaggataa gtttaagcag acttcactaa ccaaattttt ttcgaagaca 4200
aagaatgtac caacaatggg caagataaaa gatatcgagg atttgtttga accaactgta 4260
gaagaagata acgccaaaat taaaattgca agaactacta aaaagaaagc cgtatccaag 4320
aggaaaagaa atcagcttac aaatgaagaa gatccactag tattgccctc ggagattcct 4380
tccatggacg aggactatgt tgggtggcta aattatcaaa aaattaaatg gaaaatccaa 4440
gcaagagata gaaagcgtcg agaccaatta tttggtaata caaacagctc ccgtgaaaga 4500
agtgcactag gaagtatgat taggaagcaa gctgaatcat atgcgaactc cacttgggag 4560
gtcttacaat acaaggattc cggtgagcca ggggttttgg aagtatttgt aacaattaat 4620
ggcaaagtcc agaacatcac cttccatata ccaaaaacta tttatatgaa attcaaatct 4680
caaacaatgc cgctacaaaa gattaagaat tgccttattg aaaaatcttc tgcatcgtta 4740
ccaaataatc ccaaaacgtc taatccagca ggcggtcagc tattcaaaat tactctaccg 4800
gaatctgtct ttctggaaga aaaggaaaac tgcactagta tcttcaacga tgaaaatgta 4860
cttggtgtat ttgagggcac tatcactcct catcaaagag cgatcatgga tttgggagct 4920
tcggtaacgt tccgctcaaa agcaatgggt gcgttaggca agggaataca gcagggtttt 4980
gaaatgaagg atctttcaat ggcggaaaat gaaaggtatc tgagtggatt ttcaatggac 5040
attggctatt tactacattt cccaacatca attgggtatg aatttttttc attattcaag 5100
tcatggggag atactattac tatattagtt ttgaaaccat ccaaccaggc tcaggaaata 5160
aatgcctcat cattaggaca aatatacaaa caaatgtttg aaaaaaagaa aggtaaaata 5220
gaaacatatt cttacttggt tgatattaaa gaagatatca attttgagtt tgtatatttt 5280
acagatatct caaaattgta cagaagacta tcacaggaaa ctactaaatt aaaagaagaa 5340
agaggtctgc agtttttact cttgttacaa tctccgttta tcactaagct cttaggcaca 5400
atccggcttc taaaccagat gcccattgtt aagctttcct tgaatgaagt tcttctaccc 5460
caattgaact ggcaaccgac attattgaag aaacttgtta accacgtttt atccagtggt 5520
tcgtggattt ctcacttgat caagttatcc cagtatagta acattccaat ctgtaatttg 5580
aggctggata gtatggatta tattattgat gttctttatg caagaaaact aaaaaaagag 5640
aacatcgtgc tttggtggaa tgagaaagct ccacttccag atcatggagg cattcaaaat 5700
gattttgatt taaatacatc atggataatg aatgattcag aatttcccaa aattaataac 5760
tcaggtgtgt atgacaatgt agttctcgat gttggtgttg ataatttaac agtgaacaca 5820
attttgacat cagcattaat caatgatgct gaaggcagtg atctagttaa caataatatg 5880
ggtatagatg acaaagatgc cgttattaac tcgccatctg aattcgtgca cgacgccttt 5940
tctaatgacg ctttgaatgt tttaagaggt atgttaaagg agtggtggga tgaggcccta 6000
aaagaaaatt caaccgcaga tttgttggta aattccctgg caagttgggt tcaaaacccg 6060
aatgcgaaac tattcgacgg attactaaga tatcacgttc ataacttaac aaaaaaagcc 6120
ttacttcaat tagtaaatga atttagtgca cttggctcaa ctattgtata tgcagacagg 6180
aatcaaattc taataaagac aaacaagtac tcacctgaaa actgttacgc ctacagccaa 6240
tatatgatga aggcagttag aacaaatcca atgtttagtt atctggactt aaatatcaaa 6300
cgttattggg atctgctaat atggatggat aagtttaatt ttagtggatt agcatgtatt 6360
gaaatagagg aaaaggaaaa tcaggattat accgctgttt cgcaatggca actaaagaag 6420
tttctgtcac caatatatca gcccgaattt gaggattgga tgatgatcat attggatagt 6480
atgctaaaga caaagcagag ctatctaaaa ttgaattcag ggacgcaaag acctacccaa 6540
atagttaatg taaaaaaaca agataaggaa gatagtgttg aaaactcgtt gaacggattt 6600
tctcaccttt tttccaaacc actaatgaaa agagtcaaaa agctttttaa aaaccagcaa 6660
gagttcattt tagatcctca gtatgaggca gactatgtta ttcctgttct tcctggttcc 6720
catctgaatg tgaaaaatcc ccttctagaa cttgtcaaat cactctgcca tgtcatgtta 6780
ctttcaaaga gtacaatttt agaaatcagg accctgagaa aagaactgct gaagatattt 6840
gaattgcgtg agtttgctaa agtagcggaa ttcaaagatc caagtttgag tctcgtggtg 6900
ccggattttt tatgtgaata ctgttttttc atttctgata ttgacttttg taaggcagct 6960
cctgaatcta ttttttcatg cgtcagatgt cacaaagcct ttaatcaagt attgttgcaa 7020
gaacacctga ttcaaaaact acgttctgat atcgaatcct atttaattca agatttgaga 7080
tgctccagat gtcataaagt gaaacgtgac tatatgagtg cccactgtcc atgtgccggc 7140
gcgtgggaag gaactctccc cagagaaagc attgttcaaa agttaaatgt gtttaagcaa 7200
gtagccaagt attacggttt tgatatatta ttgagttgta ttgctgattt gaccatatga 7260
gtaagcagta tataacgcga ggttcaatgg cctctttacc atgaaaaaaa aaaaaaaaaa 7320
aaaaaaaagg taaggaaaaa gagtattttc aattcgtttc tgaacatata aatataaata 7380
accgaaaaat tagcccttga acataattaa cactcttctt tgatatttaa atcacaagta 7440
cttttctttt attttcttct taatactttt ggaaataaaa tgaatgtgac cactccggaa 7500
gttgc 7505
<210> 4
<211> 2222
<212> PRT
<213> Saccharomyces cerevisiae
<400> 4
Met Met Phe Gly Lys Lys Lys Asn Asn Gly Gly Ser Ser Thr Ala Arg
1 5 10 15
Tyr Ser Ala Gly Asn Lys Tyr Asn Thr Leu Ser Asn Asn Tyr Ala Leu
20 25 30
Ser Ala Gln Gln Leu Leu Asn Ala Ser Lys Ile Asp Asp Ile Asp Ser
35 40 45
Met Met Gly Phe Glu Arg Tyr Val Pro Pro Gln Tyr Asn Gly Arg Phe
50 55 60
Asp Ala Lys Asp Ile Asp Gln Ile Pro Gly Arg Val Gly Trp Leu Thr
65 70 75 80
Asn Met His Ala Thr Leu Val Ser Gln Glu Thr Leu Ser Ser Gly Ser
85 90 95
Asn Gly Gly Gly Asn Ser Asn Asp Gly Glu Arg Val Thr Thr Asn Gln
100 105 110
Gly Ile Ser Gly Val Asp Phe Tyr Phe Leu Asp Glu Glu Gly Gly Ser
115 120 125
Phe Lys Ser Thr Val Val Tyr Asp Pro Tyr Phe Phe Ile Ala Cys Asn
130 135 140
Asp Glu Ser Arg Val Asn Asp Val Glu Glu Leu Val Lys Lys Tyr Leu
145 150 155 160
Glu Ser Cys Leu Lys Ser Leu Gln Ile Ile Arg Lys Glu Asp Leu Thr
165 170 175
Met Asp Asn His Leu Leu Gly Leu Gln Lys Thr Leu Ile Lys Leu Ser
180 185 190
Phe Val Asn Ser Asn Gln Leu Phe Glu Ala Arg Lys Leu Leu Arg Pro
195 200 205
Ile Leu Gln Asp Asn Ala Asn Asn Asn Val Gln Arg Asn Ile Tyr Asn
210 215 220
Val Ala Ala Asn Gly Ser Glu Lys Val Asp Ala Lys His Leu Ile Glu
225 230 235 240
Asp Ile Arg Glu Tyr Asp Val Pro Tyr His Val Arg Val Ser Ile Asp
245 250 255
Lys Asp Ile Arg Val Gly Lys Trp Tyr Lys Val Thr Gln Gln Gly Phe
260 265 270
Ile Glu Asp Thr Arg Lys Ile Ala Phe Ala Asp Pro Val Val Met Ala
275 280 285
Phe Asp Ile Glu Thr Thr Lys Pro Pro Leu Lys Phe Pro Asp Ser Ala
290 295 300
Val Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Glu Gly Phe
305 310 315 320
Leu Ile Thr Asn Arg Glu Ile Ile Ser Glu Asp Ile Glu Asp Phe Glu
325 330 335
Tyr Thr Pro Lys Pro Glu Tyr Pro Gly Phe Phe Thr Ile Phe Asn Glu
340 345 350
Asn Asp Glu Val Ala Leu Leu Gln Arg Phe Phe Glu His Ile Arg Asp
355 360 365
Val Arg Pro Thr Val Ile Ser Thr Phe Asn Gly Asp Phe Phe Asp Trp
370 375 380
Pro Phe Ile His Asn Arg Ser Lys Ile His Gly Leu Asp Met Phe Asp
385 390 395 400
Glu Ile Gly Phe Ala Pro Asp Ala Glu Gly Glu Tyr Lys Ser Ser Tyr
405 410 415
Cys Ser His Met Asp Cys Phe Arg Trp Val Lys Arg Asp Ser Tyr Leu
420 425 430
Pro Gln Gly Ser Gln Gly Leu Lys Ala Val Thr Gln Ser Lys Leu Gly
435 440 445
Tyr Asn Pro Ile Glu Leu Asp Pro Glu Leu Met Thr Pro Tyr Ala Phe
450 455 460
Glu Lys Pro Gln His Leu Ser Glu Tyr Ser Val Ser Asp Ala Val Ala
465 470 475 480
Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ser Leu
485 490 495
Cys Thr Ile Ile Pro Leu Asn Pro Asp Glu Thr Leu Arg Lys Gly Thr
500 505 510
Gly Thr Leu Cys Glu Met Leu Leu Met Val Gln Ala Tyr Gln His Asn
515 520 525
Ile Leu Leu Pro Asn Lys His Thr Asp Pro Ile Glu Arg Phe Tyr Asp
530 535 540
Gly His Leu Leu Glu Ser Glu Thr Tyr Val Gly Gly His Val Glu Ser
545 550 555 560
Leu Glu Ala Gly Val Phe Arg Ser Asp Leu Lys Asn Glu Phe Lys Ile
565 570 575
Asp Pro Ser Ala Ile Asp Glu Leu Leu Gln Glu Leu Pro Glu Ala Leu
580 585 590
Lys Phe Ser Val Glu Val Glu Asn Lys Ser Ser Val Asp Lys Val Thr
595 600 605
Asn Phe Glu Glu Ile Lys Asn Gln Ile Thr Gln Lys Leu Leu Glu Leu
610 615 620
Lys Glu Asn Asn Ile Arg Asn Glu Leu Pro Leu Ile Tyr His Val Asp
625 630 635 640
Val Ala Ser Met Tyr Pro Asn Ile Met Thr Thr Asn Arg Leu Gln Pro
645 650 655
Asp Ser Ile Lys Ala Glu Arg Asp Cys Ala Ser Cys Asp Phe Asn Arg
660 665 670
Pro Gly Lys Thr Cys Ala Arg Lys Leu Lys Trp Ala Trp Arg Gly Glu
675 680 685
Phe Phe Pro Ser Lys Met Asp Glu Tyr Asn Met Ile Lys Arg Ala Leu
690 695 700
Gln Asn Glu Thr Phe Pro Asn Lys Asn Lys Phe Ser Lys Lys Lys Val
705 710 715 720
Leu Thr Phe Asp Glu Leu Ser Tyr Ala Asp Gln Val Ile His Ile Lys
725 730 735
Lys Arg Leu Thr Glu Tyr Ser Arg Lys Val Tyr His Arg Val Lys Val
740 745 750
Ser Glu Ile Val Glu Arg Glu Ala Ile Val Cys Gln Arg Glu Asn Pro
755 760 765
Phe Tyr Val Asp Thr Val Lys Ser Phe Arg Asp Arg Arg Tyr Glu Phe
770 775 780
Lys Gly Leu Ala Lys Thr Trp Lys Gly Asn Leu Ser Lys Ile Asp Pro
785 790 795 800
Ser Asp Lys His Ala Arg Asp Glu Ala Lys Lys Met Ile Val Leu Tyr
805 810 815
Asp Ser Leu Gln Leu Ala His Lys Val Ile Leu Asn Ser Phe Tyr Gly
820 825 830
Tyr Val Met Arg Lys Gly Ser Arg Trp Tyr Ser Met Glu Met Ala Gly
835 840 845
Ile Thr Cys Leu Thr Gly Ala Thr Ile Ile Gln Met Ala Arg Ala Leu
850 855 860
Val Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp
865 870 875 880
Cys Ile Leu Pro Lys Ser Phe Pro Glu Thr Tyr Phe Phe Thr Leu Glu
885 890 895
Asn Gly Lys Lys Leu Tyr Leu Ser Tyr Pro Cys Ser Met Leu Asn Tyr
900 905 910
Arg Val His Gln Lys Phe Thr Asn His Gln Tyr Gln Glu Leu Lys Asp
915 920 925
Pro Leu Asn Tyr Ile Tyr Glu Thr His Ser Glu Asn Thr Ile Phe Phe
930 935 940
Glu Val Asp Gly Pro Tyr Lys Ala Met Ile Leu Pro Ser Ser Lys Glu
945 950 955 960
Glu Gly Lys Gly Ile Lys Lys Arg Tyr Ala Val Phe Asn Glu Asp Gly
965 970 975
Ser Leu Ala Glu Leu Lys Gly Phe Glu Leu Lys Arg Arg Gly Glu Leu
980 985 990
Gln Leu Ile Lys Asn Phe Gln Ser Asp Ile Phe Lys Val Phe Leu Glu
995 1000 1005
Gly Asp Thr Leu Glu Gly Cys Tyr Ser Ala Val Ala Ser Val Cys Asn
1010 1015 1020
Arg Trp Leu Asp Val Leu Asp Ser His Gly Leu Met Leu Glu Asp Glu
1025 1030 1035 1040
Asp Leu Val Ser Leu Ile Cys Glu Asn Arg Ser Met Ser Lys Thr Leu
1045 1050 1055
Lys Glu Tyr Glu Gly Gln Lys Ser Thr Ser Ile Thr Thr Ala Arg Arg
1060 1065 1070
Leu Gly Asp Phe Leu Gly Glu Asp Met Val Lys Asp Lys Gly Leu Gln
1075 1080 1085
Cys Lys Tyr Ile Ile Ser Ser Lys Pro Phe Asn Ala Pro Val Thr Glu
1090 1095 1100
Arg Ala Ile Pro Val Ala Ile Phe Ser Ala Asp Ile Pro Ile Lys Arg
1105 1110 1115 1120
Ser Phe Leu Arg Arg Trp Thr Leu Asp Pro Ser Leu Glu Asp Leu Asp
1125 1130 1135
Ile Arg Thr Ile Ile Asp Trp Gly Tyr Tyr Arg Glu Arg Leu Gly Ser
1140 1145 1150
Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln Gly Val Ser
1155 1160 1165
Asn Pro Val Pro Arg Val Glu His Pro Asp Trp Leu Lys Arg Lys Ile
1170 1175 1180
Ala Thr Lys Glu Asp Lys Phe Lys Gln Thr Ser Leu Thr Lys Phe Phe
1185 1190 1195 1200
Ser Lys Thr Lys Asn Val Pro Thr Met Gly Lys Ile Lys Asp Ile Glu
1205 1210 1215
Asp Leu Phe Glu Pro Thr Val Glu Glu Asp Asn Ala Lys Ile Lys Ile
1220 1225 1230
Ala Arg Thr Thr Lys Lys Lys Ala Val Ser Lys Arg Lys Arg Asn Gln
1235 1240 1245
Leu Thr Asn Glu Glu Asp Pro Leu Val Leu Pro Ser Glu Ile Pro Ser
1250 1255 1260
Met Asp Glu Asp Tyr Val Gly Trp Leu Asn Tyr Gln Lys Ile Lys Trp
1265 1270 1275 1280
Lys Ile Gln Ala Arg Asp Arg Lys Arg Arg Asp Gln Leu Phe Gly Asn
1285 1290 1295
Thr Asn Ser Ser Arg Glu Arg Ser Ala Leu Gly Ser Met Ile Arg Lys
1300 1305 1310
Gln Ala Glu Ser Tyr Ala Asn Ser Thr Trp Glu Val Leu Gln Tyr Lys
1315 1320 1325
Asp Ser Gly Glu Pro Gly Val Leu Glu Val Phe Val Thr Ile Asn Gly
1330 1335 1340
Lys Val Gln Asn Ile Thr Phe His Ile Pro Lys Thr Ile Tyr Met Lys
1345 1350 1355 1360
Phe Lys Ser Gln Thr Met Pro Leu Gln Lys Ile Lys Asn Cys Leu Ile
1365 1370 1375
Glu Lys Ser Ser Ala Ser Leu Pro Asn Asn Pro Lys Thr Ser Asn Pro
1380 1385 1390
Ala Gly Gly Gln Leu Phe Lys Ile Thr Leu Pro Glu Ser Val Phe Leu
1395 1400 1405
Glu Glu Lys Glu Asn Cys Thr Ser Ile Phe Asn Asp Glu Asn Val Leu
1410 1415 1420
Gly Val Phe Glu Gly Thr Ile Thr Pro His Gln Arg Ala Ile Met Asp
1425 1430 1435 1440
Leu Gly Ala Ser Val Thr Phe Arg Ser Lys Ala Met Gly Ala Leu Gly
1445 1450 1455
Lys Gly Ile Gln Gln Gly Phe Glu Met Lys Asp Leu Ser Met Ala Glu
1460 1465 1470
Asn Glu Arg Tyr Leu Ser Gly Phe Ser Met Asp Ile Gly Tyr Leu Leu
1475 1480 1485
His Phe Pro Thr Ser Ile Gly Tyr Glu Phe Phe Ser Leu Phe Lys Ser
1490 1495 1500
Trp Gly Asp Thr Ile Thr Ile Leu Val Leu Lys Pro Ser Asn Gln Ala
1505 1510 1515 1520
Gln Glu Ile Asn Ala Ser Ser Leu Gly Gln Ile Tyr Lys Gln Met Phe
1525 1530 1535
Glu Lys Lys Lys Gly Lys Ile Glu Thr Tyr Ser Tyr Leu Val Asp Ile
1540 1545 1550
Lys Glu Asp Ile Asn Phe Glu Phe Val Tyr Phe Thr Asp Ile Ser Lys
1555 1560 1565
Leu Tyr Arg Arg Leu Ser Gln Glu Thr Thr Lys Leu Lys Glu Glu Arg
1570 1575 1580
Gly Leu Gln Phe Leu Leu Leu Leu Gln Ser Pro Phe Ile Thr Lys Leu
1585 1590 1595 1600
Leu Gly Thr Ile Arg Leu Leu Asn Gln Met Pro Ile Val Lys Leu Ser
1605 1610 1615
Leu Asn Glu Val Leu Leu Pro Gln Leu Asn Trp Gln Pro Thr Leu Leu
1620 1625 1630
Lys Lys Leu Val Asn His Val Leu Ser Ser Gly Ser Trp Ile Ser His
1635 1640 1645
Leu Ile Lys Leu Ser Gln Tyr Ser Asn Ile Pro Ile Cys Asn Leu Arg
1650 1655 1660
Leu Asp Ser Met Asp Tyr Ile Ile Asp Val Leu Tyr Ala Arg Lys Leu
1665 1670 1675 1680
Lys Lys Glu Asn Ile Val Leu Trp Trp Asn Glu Lys Ala Pro Leu Pro
1685 1690 1695
Asp His Gly Gly Ile Gln Asn Asp Phe Asp Leu Asn Thr Ser Trp Ile
1700 1705 1710
Met Asn Asp Ser Glu Phe Pro Lys Ile Asn Asn Ser Gly Val Tyr Asp
1715 1720 1725
Asn Val Val Leu Asp Val Gly Val Asp Asn Leu Thr Val Asn Thr Ile
1730 1735 1740
Leu Thr Ser Ala Leu Ile Asn Asp Ala Glu Gly Ser Asp Leu Val Asn
1745 1750 1755 1760
Asn Asn Met Gly Ile Asp Asp Lys Asp Ala Val Ile Asn Ser Pro Ser
1765 1770 1775
Glu Phe Val His Asp Ala Phe Ser Asn Asp Ala Leu Asn Val Leu Arg
1780 1785 1790
Gly Met Leu Lys Glu Trp Trp Asp Glu Ala Leu Lys Glu Asn Ser Thr
1795 1800 1805
Ala Asp Leu Leu Val Asn Ser Leu Ala Ser Trp Val Gln Asn Pro Asn
1810 1815 1820
Ala Lys Leu Phe Asp Gly Leu Leu Arg Tyr His Val His Asn Leu Thr
1825 1830 1835 1840
Lys Lys Ala Leu Leu Gln Leu Val Asn Glu Phe Ser Ala Leu Gly Ser
1845 1850 1855
Thr Ile Val Tyr Ala Asp Arg Asn Gln Ile Leu Ile Lys Thr Asn Lys
1860 1865 1870
Tyr Ser Pro Glu Asn Cys Tyr Ala Tyr Ser Gln Tyr Met Met Lys Ala
1875 1880 1885
Val Arg Thr Asn Pro Met Phe Ser Tyr Leu Asp Leu Asn Ile Lys Arg
1890 1895 1900
Tyr Trp Asp Leu Leu Ile Trp Met Asp Lys Phe Asn Phe Ser Gly Leu
1905 1910 1915 1920
Ala Cys Ile Glu Ile Glu Glu Lys Glu Asn Gln Asp Tyr Thr Ala Val
1925 1930 1935
Ser Gln Trp Gln Leu Lys Lys Phe Leu Ser Pro Ile Tyr Gln Pro Glu
1940 1945 1950
Phe Glu Asp Trp Met Met Ile Ile Leu Asp Ser Met Leu Lys Thr Lys
1955 1960 1965
Gln Ser Tyr Leu Lys Leu Asn Ser Gly Thr Gln Arg Pro Thr Gln Ile
1970 1975 1980
Val Asn Val Lys Lys Gln Asp Lys Glu Asp Ser Val Glu Asn Ser Leu
1985 1990 1995 2000
Asn Gly Phe Ser His Leu Phe Ser Lys Pro Leu Met Lys Arg Val Lys
2005 2010 2015
Lys Leu Phe Lys Asn Gln Gln Glu Phe Ile Leu Asp Pro Gln Tyr Glu
2020 2025 2030
Ala Asp Tyr Val Ile Pro Val Leu Pro Gly Ser His Leu Asn Val Lys
2035 2040 2045
Asn Pro Leu Leu Glu Leu Val Lys Ser Leu Cys His Val Met Leu Leu
2050 2055 2060
Ser Lys Ser Thr Ile Leu Glu Ile Arg Thr Leu Arg Lys Glu Leu Leu
2065 2070 2075 2080
Lys Ile Phe Glu Leu Arg Glu Phe Ala Lys Val Ala Glu Phe Lys Asp
2085 2090 2095
Pro Ser Leu Ser Leu Val Val Pro Asp Phe Leu Cys Glu Tyr Cys Phe
2100 2105 2110
Phe Ile Ser Asp Ile Asp Phe Cys Lys Ala Ala Pro Glu Ser Ile Phe
2115 2120 2125
Ser Cys Val Arg Cys His Lys Ala Phe Asn Gln Val Leu Leu Gln Glu
2130 2135 2140
His Leu Ile Gln Lys Leu Arg Ser Asp Ile Glu Ser Tyr Leu Ile Gln
2145 2150 2155 2160
Asp Leu Arg Cys Ser Arg Cys His Lys Val Lys Arg Asp Tyr Met Ser
2165 2170 2175
Ala His Cys Pro Cys Ala Gly Ala Trp Glu Gly Thr Leu Pro Arg Glu
2180 2185 2190
Ser Ile Val Gln Lys Leu Asn Val Phe Lys Gln Val Ala Lys Tyr Tyr
2195 2200 2205
Gly Phe Asp Ile Leu Leu Ser Cys Ile Ala Asp Leu Thr Ile
2210 2215 2220
<210> 5
<211> 12
<212> PRT
<213> Escherichia coli
<400> 5
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
1 5 10
<210> 6
<211> 12
<212> PRT
<213> Haemophilus influenzae
<400> 6
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
1 5 10
<210> 7
<211> 12
<212> PRT
<213> Salmonella typhimurium
<400> 7
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
1 5 10
<210> 8
<211> 12
<212> PRT
<213> Vibrio cholerae
<400> 8
Ile Val Val Leu Asp Thr Glu Thr Thr Gly Met Asn
1 5 10
<210> 9
<211> 12
<212> PRT
<213> Pseudomonas aeruginosa
<400> 9
Ser Val Val Leu Asp Thr Glu Thr Thr Gly Met Pro
1 5 10
<210> 10
<211> 12
<212> PRT
<213> Neisseria meningitidis
<400> 10
Gln Ile Ile Leu Asp Thr Glu Thr Thr Gly Leu Tyr
1 5 10
<210> 11
<211> 12
<212> PRT
<213> Chlamydia trachomatis
<400> 11
Phe Val Cys Leu Asp Cys Glu Thr Thr Gly Leu Asp
1 5 10
<210> 12
<211> 12
<212> PRT
<213> Streptomyces coelicolor
<400> 12
Leu Ala Ala Phe Asp Thr Glu Thr Thr Gly Val Asp
1 5 10
<210> 13
<211> 12
<212> PRT
<213> Shigella flexneri 2a str. 301
<400> 13
Gln Ile Val Leu Asp Thr Glu Thr Thr Gly Met Asn
1 5 10
<210> 14
<211> 12
<212> PRT
<213> Staphylococcus aureus
<400> 14
Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
1 5 10
<210> 15
<211> 12
<212> PRT
<213> Bacillus subtilis
<400> 15
Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
1 5 10
<210> 16
<211> 12
<212> PRT
<213> Mycoplasma pulmonis
<400> 16
Tyr Val Val Tyr Asp Ile Glu Thr Thr Gly Leu Ser
1 5 10
<210> 17
<211> 12
<212> PRT
<213> Mycoplasma genitalium
<400> 17
Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His
1 5 10
<210> 18
<211> 12
<212> PRT
<213> Mycoplasma pneumoniae
<400> 18
Phe Val Ile Phe Asp Ile Glu Thr Thr Gly Leu His
1 5 10
<210> 19
<211> 12
<212> PRT
<213> Saccharomyces cerevisiae
<400> 19
Ile Met Ser Phe Asp Ile Glu Cys Ala Gly Arg Ile
1 5 10
<210> 20
<211> 12
<212> PRT
<213> Saccharomyces cerevisiae
<400> 20
Val Met Ala Phe Asp Ile Glu Thr Thr Lys Pro Pro
1 5 10
<210> 21
<211> 12
<212> PRT
<213> Mus musculus
<400> 21
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 22
<211> 12
<212> PRT
<213> Mus musculus
<400> 22
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
1 5 10
<210> 23
<211> 12
<212> PRT
<213> Homo sapiens
<400> 23
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 24
<211> 12
<212> PRT
<213> Homo sapiens
<400> 24
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
1 5 10
<210> 25
<211> 12
<212> PRT
<213> Oryza sativa
<400> 25
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 26
<211> 12
<212> PRT
<213> Arabidopsis thaliana
<400> 26
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 27
<211> 12
<212> PRT
<213> Arabidopsis thaliana
<400> 27
Val Cys Ala Phe Asp Ile Glu Thr Val Lys Leu Pro
1 5 10
<210> 28
<211> 12
<212> PRT
<213> Rattus norvegicus
<400> 28
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 29
<211> 12
<212> PRT
<213> Bos taurus
<400> 29
Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 30
<211> 12
<212> PRT
<213> Glycine max
<400> 30
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 31
<211> 12
<212> PRT
<213> Drosophila melanogaster
<400> 31
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys
1 5 10
<210> 32
<211> 12
<212> PRT
<213> Drosophila melanogaster
<400> 32
Val Leu Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro
1 5 10
<210> 33
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Mutated pol delta
<400> 33
atcatgtcct ttgctatcgc ttgtgctggt aggatt 36
<210> 34
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Mutated pol delta
<400> 34
Ile Met Ser Phe Ala Ile Ala Cys Ala Gly Arg Ile
1 5 10
<210> 35
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Mutated pol epsilon
<400> 35
gtaatggcat ttgctatagc taccacgaag ccgcct 36
<210> 36
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Mutated pol epsilon
<400> 36
Val Met Ala Phe Ala Ile Ala Thr Thr Lys Pro Pro
1 5 10
<210> 37
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Primer
<400> 37
cccgagctca tgagtgaaaa aagatccctt 30
<210> 38
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Primer
<400> 38
cccgcggccg cttaccattt gcttaattgt 30
<210> 39
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Primer
<400> 39
cccgagctca tgatgtttgg caagaaaaaa 30
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Primer
<400> 40
cccgcggccg ctcatatggt caaatcagca 30
<210> 41
<211> 1592
<212> DNA
<213> Escherichia coli
<400> 41
gaattcaaat acaaaaaaac cgcaaaatta aaaatcttgc ggctctctga actcattttc 60
atgagtgaat agtggcggaa cggacgggac tcgaacccgc gaccccctgc gtgacaggca 120
ggtattcaac cgactgaact accgctccgc gttgtgttcc gttgggaacg aggcgaatag 180
ttacgaattg cctcgacctc gtcaacggtt tttctatctt ttgaatcgtt tgctgcaaaa 240
atcgcccaag tcgctatttt tagcgccttt cacaggtatt tatgctcgcc agaggcaact 300
tccgcctttc ttctgcacca gatcgagacg ggcttcatga gctgcaatct cttcatctgt 360
cgcaaaaaca acgcgtaact tacttgcctg acgtacaatg cgctgaattg ttgcttcacc 420
ttgttgctgt tgtgtctctc cttccatcgc aaaagccatc gacgtttgac caccggtcat 480
cgccagataa acttccgcaa ggatctgggc atcgagtaat gccccgtgca gcgttcgttt 540
actgttatct atttcgtagc gagcacataa cgcatcgagg ctgttgcgct taccgggaaa 600
cattttcctc gccaccgcaa ggctatcggt gaccttacag aaagtattgg tcttcggaat 660
atcgcgctta agcaacgaaa actcgtagtc cataaagccg atatcgaacg ctgcgttatg 720
gatcaccaac tccgcgccgc gaatatagtc catgaactca tcggctactt cggcaaacgt 780
gggcttatcg agcaaaaatt catcggcaat accatgtacg ccaaaggctt ccggatccac 840
cagccgatcg ggtttgagat aaacatggaa gttattgccc gtcaggcgac ggttcaccac 900
ttcaacggca ccaatctcaa tgatcttgtg gccttcatag tgcgcaccaa tctggttcat 960
accggtggtt tcggtatcga gaacgatctg gcgtgtaatt gcagtgctca tagcggtcat 1020
ttatgtcaga cttgtcgttt tacagttcga ttcaattaca ggaagtctac cagagatgct 1080
taaacaggta gaaattttca ccgatggttc gtgtctgggc aatccaggac ctgggggtta 1140
cggcgctatt ttacgctatc gcggacgcga gaaaaccttt agcgctggct acacccgcac 1200
caccaacaac cgtatggagt tgatggccgc tattgtcgcg ctggaggcgt taaaagaaca 1260
ttgcgaagtc attttgagta ccgacagcca gtatgtccgc cagggtatca cccagtggat 1320
ccataactgg aaaaaacgtg gctggaaaac cgcagacaaa aaaccagtaa aaaatgtcga 1380
tctctggcaa cgtcttgatg ctgcattggg gcagcatcaa atcaaatggg aatgggttaa 1440
aggccatgcc ggacacccgg aaaacgaacg ctgtgatgaa ctggctcgtg ccgcggcgat 1500
gaatcccaca ctggaagata caggctacca agttgaagtt taagcctgtg gtttacgaca 1560
ttgccgggtg gctccaaccg cctagcgaat tc 1592
<210> 42
<211> 243
<212> PRT
<213> Escherichia coli
<400> 42
Met Ser Thr Ala Ile Thr Arg Gln Ile Val Leu Asp Thr Glu Thr Thr
1 5 10 15
Gly Met Asn Gln Ile Gly Ala His Tyr Glu Gly His Lys Ile Ile Glu
20 25 30
Ile Gly Ala Val Glu Val Val Asn Arg Arg Leu Thr Gly Asn Asn Phe
35 40 45
His Val Tyr Leu Lys Pro Asp Arg Leu Val Asp Pro Glu Ala Phe Gly
50 55 60
Val His Gly Ile Ala Asp Glu Phe Leu Leu Asp Lys Pro Thr Phe Ala
65 70 75 80
Glu Val Ala Asp Glu Phe Met Asp Tyr Ile Arg Gly Ala Glu Leu Val
85 90 95
Ile His Asn Ala Ala Phe Asp Ile Gly Phe Met Asp Tyr Glu Phe Ser
100 105 110
Leu Leu Lys Arg Asp Ile Pro Lys Thr Asn Thr Phe Cys Lys Val Thr
115 120 125
Asp Ser Leu Ala Val Ala Arg Lys Met Phe Pro Gly Lys Arg Asn Ser
130 135 140
Leu Asp Ala Leu Cys Ala Arg Tyr Glu Ile Asp Asn Ser Lys Arg Thr
145 150 155 160
Leu His Gly Ala Leu Leu Asp Ala Gln Ile Leu Ala Glu Val Tyr Leu
165 170 175
Ala Met Thr Gly Gly Gln Thr Ser Met Ala Phe Ala Met Glu Gly Glu
180 185 190
Thr Gln Gln Gln Gln Gly Glu Ala Thr Ile Gln Arg Ile Val Arg Gln
195 200 205
Ala Ser Lys Leu Arg Val Val Phe Ala Thr Asp Glu Glu Ile Ala Ala
210 215 220
His Glu Ala Arg Leu Asp Leu Val Gln Lys Lys Gly Gly Ser Cys Leu
225 230 235 240
Trp Arg Ala
<210> 43
<211> 4866
<212> DNA
<213> Bacillus subtilis
<400> 43
ggtaccgctt cacttatgat gtttttaggg agggatactg tcttaatgga acagttatca 60
gtaaacagaa ggcagtttca aattcttctg cagcagatta atatgacaga tgataccttc 120
atgacatact ttgaacatgg cgagattaaa aagctgacaa ttcacaaagc ttctaagtct 180
tggcattttc attttcaatt taaatctttg ctgccttttc aaatatatga cacattaaca 240
acgaggctga cgcaatcgtt tgcccacata gcaaaagtga catcttcaat tgaagttcag 300
gatgccgagg tcagtgaaag tatcgttcaa gactactggt cacgctgcat tgaagaactg 360
cagggcattt cgccgccgat tatcagtctt ttaaaccagc aaaaaccgaa gctgaagggc 420
aataaactga ttgtcaaaac caaaacagat acagaagcgg ctgcgctaaa gaacaaatac 480
agttccatga ttcaagcaga ataccgtcaa tttggctttc cggatcttca gcttgatgct 540
gaaatatttg tatccgagca agaagttcaa aagtttcggg agcaaaagct tgcggaagac 600
caagagcggg ctatgcaggc cttgattgaa atggagaaga aagataaaga aagtgatgaa 660
gaccaagcac catctggtcc tcttgttatc ggttatcaaa ttaaagataa cgaggaaatc 720
cgaacacttg acagcatcat ggacgaagaa cggagaatta cggtccaagg ttatgtgttt 780
gatgtggaga cgcgcgagct gaagagcggg cgcacgctgt gtatcttcaa aattacagac 840
tatacaaata gtattttgat caaaatgttt gcacgtgaaa aagaagatgc ggcgctgatg 900
aagtctctga aaaaaggaat gtgggtaaaa gcacgcggaa gcattcaaaa tgatacattt 960
gtcagagacc ttgtcatgat cgcaaatgac gtaaacgaaa taaaagcaaa aacccgtgaa 1020
gattcagcac ctgaaggaga aaaaagagtg gaattgcatc ttcattcccc aatgagccaa 1080
atggatgctg ttacgggtat cggaaagctt gtcgaacagg cgaaaaaatg ggggcatgag 1140
gccatcgctt tgaccgacca tgctgtcgtt caatccttcc ctgatgcgta ttctgcggcc 1200
aaaaagcatg gaattaaaat gatttacggg atggaagcga atctcgtgga tgatggcgtg 1260
ccaattgctt ataatgccgc acatcgtctg ctcgaagaag aaacatatgt tgtttttgac 1320
gttgagacga caggattgtc tgctgtatac gataccatta ttgagctggc tgcagtaaaa 1380
gtaaaaggcg gagaaattat tgataaattt gaggcgtttg cgaacccgca tcgtccgctt 1440
tccgccacaa tcatagagct gacagggatc acagatgata tgctacaaga cgctccggat 1500
gtcgtagatg taataagaga tttcagagaa tggattggcg atgatattct tgtcgctcat 1560
aatgcaagct ttgatatggg attcttaaat gtagcctata aaaaacttct tgaagtcgaa 1620
aaagctaaaa acccagtcat tgatacgctt gaacttggac gttttctcta tccggaattt 1680
aagaaccacc ggttgaacac actttgtaaa aagtttgata tcgagctcac acagcatcac 1740
cgtgcgatct atgatactga ggcaaccgct tatttgcttc tgaaaatgct gaaagacgca 1800
gctgaaaaag gtattcagta ccatgatgag ttgaatgaaa atatgggtca gtccaatgct 1860
tatcaaagat caagaccgta tcatgcaaca ttacttgccg tgaacagcac gggacttaaa 1920
aatttattta agcttgtgtc actttctcat attcattatt tttacagagt gccgcgtatt 1980
ccgagatctc agcttgagaa atacagggaa gggcttctga tcggttctgc ttgtgacagg 2040
ggagaggttt ttgagggaat gatgcaaaaa tcgcctgaag aggtggaaga tatcgcgtca 2100
ttctatgatt accttgaggt tcagccgcct gaagtgtatc gtcacttgct ggagcttgaa 2160
ctggtccgtg atgaaaaagc gctgaaagaa attattgcga atatcacgaa gctgggggaa 2220
aagcttaata aaccggttgt tgctacggga aatgttcatt acttgaatga tgaggataaa 2280
atctacagaa agattttaat atcctcacaa ggcggggcaa atccgctgaa taggcatgaa 2340
ctgccgaaag tgcatttcag aacgacagac gaaatgcttg aagctttttc tttcttaggt 2400
gaagaaaaag cgaaggagat cgtagtcacc aatacccaaa aggttgcttc tttagttgat 2460
gacatcaagc cgattaaaga tgatttatat acgccgaaaa tcgaaggcgc tgatgaagag 2520
atcagagaaa tgagctatca gcgtgcaaga agcatttacg gggaagagct gcctgaaatt 2580
gtcgaagcgc ggattgaaaa agagttaaag agtattattg gccacggatt tgctgttatt 2640
tacttgatct ctcacaaact tgtaaaacgt tcactagatg acgggtatct cgttggttcc 2700
cgtggttccg taggatcttc attagttgcg acacttactg agattactga ggtaaacccg 2760
ctgccgccgc actatgtttg tcctgagtgc cagcattctg agttctttaa tgacggttct 2820
gtcggttctg gttttgacct gcctgacaag acatgccctc attgcggaac gcctttgaaa 2880
aaagacggcc atgatattcc atttgaaacg ttcttaggat ttaaagggga caaagtacct 2940
gatatcgatt tgaacttctc aggggaatat cagccgcaag cacacaatta cacaaaagta 3000
ttgttcggag aagacaatgt atatcgtgcg ggaacaatag gcacggtggc agaaaaaaca 3060
gcctacggtt atgtaaaagg ctatgccgga gacaacaatc ttcatatgcg cggtgccgaa 3120
atagatcggc tcgtacaggg atgcacaggt gtaaaacgta caactggaca gcaccctggc 3180
ggtattatcg tagttccgga ttatatggat atttatgatt tttcaccgat ccagttcccg 3240
gcagatgcca caggttcaga gtggaaaacg actcattttg atttccactc catccatgac 3300
aacctgttaa aacttgatat tctcggacac gatgacccga ctgttattcg gatgcttcaa 3360
gacttaagcg gaatagatcc gaaaacaatt ccgacggatg atcctgaagt gatgaagatc 3420
ttccagggaa ccgaatcact cggtgtgact gaagaacaga ttggctgtaa aacgggcact 3480
cttggaattc ctgaattcgg aacccgattt gtccggcaga tgcttgaaga tacaaagccg 3540
accacttttt ctgagctcgt tcagatttca ggcttgtctc acggaactga tgtatggctt 3600
ggcaatgcac aggagctcat ccacaataat atttgtgagc tgagtgaggt tatcggctgc 3660
cgtgatgaca ttatggttta tttaatctat caaggccttg agccgtccct tgcctttaaa 3720
atcatggaat tcgtgcgtaa aggaaaagga ttaacgcctg aatgggaaga agaaatgaaa 3780
aataacaatg tcccagactg gtatattgat tcctgtaaaa agattaaata catgttcccg 3840
aaagcccacg ccgcggcata tgtcttaatg gcagtccgca ttgcttactt taaagtgcat 3900
catgctcttt tgtattatgc ggcttatttt accgttcgtg cagatgactt tgatattgat 3960
acaatgatca agggctctac agcaatcaga gcggtaatgg aggatataaa cgctaaagga 4020
cttgatgctt caccgaagga aaagaacctt ctgactgttt tagaattagc gcttgagatg 4080
tgtgagagag gctattcatt ccaaaaagtc gatttatatc gctccagcgc cacagagttt 4140
attattgacg gcaacagtct tattccgccg tttaactcta ttccagggtt agggacgaac 4200
gctgctttga acattgtaaa agctcgcgaa gaaggcgaat tcctctcaaa agaagatttg 4260
caaaagagag ggaaagtatc aaaaacgatt ttagagtact tagatcgcca tggctgtctg 4320
gagtcactgc ctgatcaaaa ccaattgtca ctgttctaat atggaaagca gaatttctca 4380
gaaattctgc ttctatgcat acataagcgc aaaaagtgcc atcgtaatat tagagtttct 4440
gtcacttgct taggtatgaa ggtaagcgta tatccatttg caataaaaat atggttatgg 4500
tatagtttta ttggaaatgc taacgattac cgaggcaaag agtggggaaa cccgctcttt 4560
tgtattgaac aggagaattt tgtctcgaca tgttcatcgt ttacttttta gcccctgctc 4620
ttttgaagca gggtttttat gcagagtgac gagacgaata tgagatcgac agcacaagga 4680
ggaagaacat gagcaaaaaa gtgactgaca ccgttcaaga aatggctcag ccaatcgtag 4740
acagccttca gctggaactc gttgacattg aatttgtcaa agagggccaa agctggttcc 4800
ttcgcgtgtt tattgattcc gatgacggtg tggatattga ggaatgtgcc aaagtaagcg 4860
aagctt 4866
<210> 44
<211> 1437
<212> PRT
<213> Bacillus subtilis
<400> 44
Met Glu Gln Leu Ser Val Asn Arg Arg Gln Phe Gln Ile Leu Leu Gln
1 5 10 15
Gln Ile Asn Met Thr Asp Asp Thr Phe Met Thr Tyr Phe Glu His Gly
20 25 30
Glu Ile Lys Lys Leu Thr Ile His Lys Ala Ser Lys Ser Trp His Phe
35 40 45
His Phe Gln Phe Lys Ser Leu Leu Pro Phe Gln Ile Tyr Asp Thr Leu
50 55 60
Thr Thr Arg Leu Thr Gln Ser Phe Ala His Ile Ala Lys Val Thr Ser
65 70 75 80
Ser Ile Glu Val Gln Asp Ala Glu Val Ser Glu Ser Ile Val Gln Asp
85 90 95
Tyr Trp Ser Arg Cys Ile Glu Glu Leu Gln Gly Ile Ser Pro Pro Ile
100 105 110
Ile Ser Leu Leu Asn Gln Gln Lys Pro Lys Leu Lys Gly Asn Lys Leu
115 120 125
Ile Val Lys Thr Lys Thr Asp Thr Glu Ala Ala Ala Leu Lys Asn Lys
130 135 140
Tyr Ser Ser Met Ile Gln Ala Glu Tyr Arg Gln Phe Gly Phe Pro Asp
145 150 155 160
Leu Gln Leu Asp Ala Glu Ile Phe Val Ser Glu Gln Glu Val Gln Lys
165 170 175
Phe Arg Glu Gln Lys Leu Ala Glu Asp Gln Glu Arg Ala Met Gln Ala
180 185 190
Leu Ile Glu Met Glu Lys Lys Asp Lys Glu Ser Asp Glu Asp Gln Ala
195 200 205
Pro Ser Gly Pro Leu Val Ile Gly Tyr Gln Ile Lys Asp Asn Glu Glu
210 215 220
Ile Arg Thr Leu Asp Ser Ile Met Asp Glu Glu Arg Arg Ile Thr Val
225 230 235 240
Gln Gly Tyr Val Phe Asp Val Glu Thr Arg Glu Leu Lys Ser Gly Arg
245 250 255
Thr Leu Cys Ile Phe Lys Ile Thr Asp Tyr Thr Asn Ser Ile Leu Ile
260 265 270
Lys Met Phe Ala Arg Glu Lys Glu Asp Ala Ala Leu Met Lys Ser Leu
275 280 285
Lys Lys Gly Met Trp Val Lys Ala Arg Gly Ser Ile Gln Asn Asp Thr
290 295 300
Phe Val Arg Asp Leu Val Met Ile Ala Asn Asp Val Asn Glu Ile Lys
305 310 315 320
Ala Lys Thr Arg Glu Asp Ser Ala Pro Glu Gly Glu Lys Arg Val Glu
325 330 335
Leu His Leu His Ser Pro Met Ser Gln Met Asp Ala Val Thr Gly Ile
340 345 350
Gly Lys Leu Val Glu Gln Ala Lys Lys Trp Gly His Glu Ala Ile Ala
355 360 365
Leu Thr Asp His Ala Val Val Gln Ser Phe Pro Asp Ala Tyr Ser Ala
370 375 380
Ala Lys Lys His Gly Ile Lys Met Ile Tyr Gly Met Glu Ala Asn Leu
385 390 395 400
Val Asp Asp Gly Val Pro Ile Ala Tyr Asn Ala Ala His Arg Leu Leu
405 410 415
Glu Glu Glu Thr Tyr Val Val Phe Asp Val Glu Thr Thr Gly Leu Ser
420 425 430
Ala Val Tyr Asp Thr Ile Ile Glu Leu Ala Ala Val Lys Val Lys Gly
435 440 445
Gly Glu Ile Ile Asp Lys Phe Glu Ala Phe Ala Asn Pro His Arg Pro
450 455 460
Leu Ser Ala Thr Ile Ile Glu Leu Thr Gly Ile Thr Asp Asp Met Leu
465 470 475 480
Gln Asp Ala Pro Asp Val Val Asp Val Ile Arg Asp Phe Arg Glu Trp
485 490 495
Ile Gly Asp Asp Ile Leu Val Ala His Asn Ala Ser Phe Asp Met Gly
500 505 510
Phe Leu Asn Val Ala Tyr Lys Lys Leu Leu Glu Val Glu Lys Ala Lys
515 520 525
Asn Pro Val Ile Asp Thr Leu Glu Leu Gly Arg Phe Leu Tyr Pro Glu
530 535 540
Phe Lys Asn His Arg Leu Asn Thr Leu Cys Lys Lys Phe Asp Ile Glu
545 550 555 560
Leu Thr Gln His His Arg Ala Ile Tyr Asp Thr Glu Ala Thr Ala Tyr
565 570 575
Leu Leu Leu Lys Met Leu Lys Asp Ala Ala Glu Lys Gly Ile Gln Tyr
580 585 590
His Asp Glu Leu Asn Glu Asn Met Gly Gln Ser Asn Ala Tyr Gln Arg
595 600 605
Ser Arg Pro Tyr His Ala Thr Leu Leu Ala Val Asn Ser Thr Gly Leu
610 615 620
Lys Asn Leu Phe Lys Leu Val Ser Leu Ser His Ile His Tyr Phe Tyr
625 630 635 640
Arg Val Pro Arg Ile Pro Arg Ser Gln Leu Glu Lys Tyr Arg Glu Gly
645 650 655
Leu Leu Ile Gly Ser Ala Cys Asp Arg Gly Glu Val Phe Glu Gly Met
660 665 670
Met Gln Lys Ser Pro Glu Glu Val Glu Asp Ile Ala Ser Phe Tyr Asp
675 680 685
Tyr Leu Glu Val Gln Pro Pro Glu Val Tyr Arg His Leu Leu Glu Leu
690 695 700
Glu Leu Val Arg Asp Glu Lys Ala Leu Lys Glu Ile Ile Ala Asn Ile
705 710 715 720
Thr Lys Leu Gly Glu Lys Leu Asn Lys Pro Val Val Ala Thr Gly Asn
725 730 735
Val His Tyr Leu Asn Asp Glu Asp Lys Ile Tyr Arg Lys Ile Leu Ile
740 745 750
Ser Ser Gln Gly Gly Ala Asn Pro Leu Asn Arg His Glu Leu Pro Lys
755 760 765
Val His Phe Arg Thr Thr Asp Glu Met Leu Glu Ala Phe Ser Phe Leu
770 775 780
Gly Glu Glu Lys Ala Lys Glu Ile Val Val Thr Asn Thr Gln Lys Val
785 790 795 800
Ala Ser Leu Val Asp Asp Ile Lys Pro Ile Lys Asp Asp Leu Tyr Thr
805 810 815
Pro Lys Ile Glu Gly Ala Asp Glu Glu Ile Arg Glu Met Ser Tyr Gln
820 825 830
Arg Ala Arg Ser Ile Tyr Gly Glu Glu Leu Pro Glu Ile Val Glu Ala
835 840 845
Arg Ile Glu Lys Glu Leu Lys Ser Ile Ile Gly His Gly Phe Ala Val
850 855 860
Ile Tyr Leu Ile Ser His Lys Leu Val Lys Arg Ser Leu Asp Asp Gly
865 870 875 880
Tyr Leu Val Gly Ser Arg Gly Ser Val Gly Ser Ser Leu Val Ala Thr
885 890 895
Leu Thr Glu Ile Thr Glu Val Asn Pro Leu Pro Pro His Tyr Val Cys
900 905 910
Pro Glu Cys Gln His Ser Glu Phe Phe Asn Asp Gly Ser Val Gly Ser
915 920 925
Gly Phe Asp Leu Pro Asp Lys Thr Cys Pro His Cys Gly Thr Pro Leu
930 935 940
Lys Lys Asp Gly His Asp Ile Pro Phe Glu Thr Phe Leu Gly Phe Lys
945 950 955 960
Gly Asp Lys Val Pro Asp Ile Asp Leu Asn Phe Ser Gly Glu Tyr Gln
965 970 975
Pro Gln Ala His Asn Tyr Thr Lys Val Leu Phe Gly Glu Asp Asn Val
980 985 990
Tyr Arg Ala Gly Thr Ile Gly Thr Val Ala Glu Lys Thr Ala Tyr Gly
995 1000 1005
Tyr Val Lys Gly Tyr Ala Gly Asp Asn Asn Leu His Met Arg Gly Ala
1010 1015 1020
Glu Ile Asp Arg Leu Val Gln Gly Cys Thr Gly Val Lys Arg Thr Thr
1025 1030 1035 1040
Gly Gln His Pro Gly Gly Ile Ile Val Val Pro Asp Tyr Met Asp Ile
1045 1050 1055
Tyr Asp Phe Ser Pro Ile Gln Phe Pro Ala Asp Ala Thr Gly Ser Glu
1060 1065 1070
Trp Lys Thr Thr His Phe Asp Phe His Ser Ile His Asp Asn Leu Leu
1075 1080 1085
Lys Leu Asp Ile Leu Gly His Asp Asp Pro Thr Val Ile Arg Met Leu
1090 1095 1100
Gln Asp Leu Ser Gly Ile Asp Pro Lys Thr Ile Pro Thr Asp Asp Pro
1105 1110 1115 1120
Glu Val Met Lys Ile Phe Gln Gly Thr Glu Ser Leu Gly Val Thr Glu
1125 1130 1135
Glu Gln Ile Gly Cys Lys Thr Gly Thr Leu Gly Ile Pro Glu Phe Gly
1140 1145 1150
Thr Arg Phe Val Arg Gln Met Leu Glu Asp Thr Lys Pro Thr Thr Phe
1155 1160 1165
Ser Glu Leu Val Gln Ile Ser Gly Leu Ser His Gly Thr Asp Val Trp
1170 1175 1180
Leu Gly Asn Ala Gln Glu Leu Ile His Asn Asn Ile Cys Glu Leu Ser
1185 1190 1195 1200
Glu Val Ile Gly Cys Arg Asp Asp Ile Met Val Tyr Leu Ile Tyr Gln
1205 1210 1215
Gly Leu Glu Pro Ser Leu Ala Phe Lys Ile Met Glu Phe Val Arg Lys
1220 1225 1230
Gly Lys Gly Leu Thr Pro Glu Trp Glu Glu Glu Met Lys Asn Asn Asn
1235 1240 1245
Val Pro Asp Trp Tyr Ile Asp Ser Cys Lys Lys Ile Lys Tyr Met Phe
1250 1255 1260
Pro Lys Ala His Ala Ala Ala Tyr Val Leu Met Ala Val Arg Ile Ala
1265 1270 1275 1280
Tyr Phe Lys Val His His Ala Leu Leu Tyr Tyr Ala Ala Tyr Phe Thr
1285 1290 1295
Val Arg Ala Asp Asp Phe Asp Ile Asp Thr Met Ile Lys Gly Ser Thr
1300 1305 1310
Ala Ile Arg Ala Val Met Glu Asp Ile Asn Ala Lys Gly Leu Asp Ala
1315 1320 1325
Ser Pro Lys Glu Lys Asn Leu Leu Thr Val Leu Glu Leu Ala Leu Glu
1330 1335 1340
Met Cys Glu Arg Gly Tyr Ser Phe Gln Lys Val Asp Leu Tyr Arg Ser
1345 1350 1355 1360
Ser Ala Thr Glu Phe Ile Ile Asp Gly Asn Ser Leu Ile Pro Pro Phe
1365 1370 1375
Asn Ser Ile Pro Gly Leu Gly Thr Asn Ala Ala Leu Asn Ile Val Lys
1380 1385 1390
Ala Arg Glu Glu Gly Glu Phe Leu Ser Lys Glu Asp Leu Gln Lys Arg
1395 1400 1405
Gly Lys Val Ser Lys Thr Ile Leu Glu Tyr Leu Asp Arg His Gly Cys
1410 1415 1420
Leu Glu Ser Leu Pro Asp Gln Asn Gln Leu Ser Leu Phe
1425 1430 1435
<210> 45
<211> 1081
<212> PRT
<213> Arabidopsis thaliana
<400> 45
Met Asn Arg Ser Gly Ile Ser Lys Lys Arg Pro Pro Pro Ser Asn Thr
1 5 10 15
Pro Pro Pro Ala Gly Lys His Arg Ala Thr Gly Asp Ser Thr Pro Ser
20 25 30
Pro Ala Ile Gly Thr Leu Asp Asp Glu Phe Met Met Glu Glu Asp Val
35 40 45
Phe Leu Asp Glu Thr Leu Leu Tyr Gly Asp Glu Asp Glu Glu Ser Leu
50 55 60
Ile Leu Arg Asp Ile Glu Glu Arg Glu Ser Arg Ser Ser Ala Trp Ala
65 70 75 80
Arg Pro Pro Leu Ser Pro Ala Tyr Leu Ser Asn Ser Gln Ile Phe Gln
85 90 95
Gln Leu Glu Ile Asp Ser Ile Ile Ala Glu Ser His Lys Glu Leu Leu
100 105 110
Pro Gly Ser Ser Gly Gln Ala Pro Ile Ile Arg Met Phe Gly Val Thr
115 120 125
Arg Glu Gly Asn Ser Val Cys Cys Phe Val His Gly Phe Glu Pro Tyr
130 135 140
Phe Tyr Ile Ala Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser Asn
145 150 155 160
Phe His Gln Ser Leu Glu Gly Arg Met Arg Glu Ser Asn Lys Asn Ala
165 170 175
Lys Val Pro Lys Phe Val Lys Arg Ile Glu Met Val Gln Lys Arg Ser
180 185 190
Ile Met Tyr Tyr Gln Gln Gln Lys Ser Gln Thr Phe Leu Lys Ile Thr
195 200 205
Val Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg
210 215 220
Gly Leu Gln Ile Asp Gly Leu Gly Met Lys Ser Phe Gln Thr Tyr Glu
225 230 235 240
Ser Asn Ile Leu Phe Val Leu Arg Phe Met Val Asp Cys Asp Ile Val
245 250 255
Gly Gly Asn Trp Ile Glu Val Pro Thr Gly Lys Tyr Lys Lys Asn Ala
260 265 270
Arg Thr Leu Ser Tyr Cys Gln Leu Glu Phe His Cys Leu Tyr Ser Asp
275 280 285
Leu Ile Ser His Ala Ala Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe
290 295 300
Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe
305 310 315 320
Pro Glu Ala Lys His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr
325 330 335
Leu Gln Gly Glu Asp His Pro Phe Val Arg Asn Val Met Thr Leu Lys
340 345 350
Ser Cys Ala Pro Ile Val Gly Val Asp Val Met Ser Phe Glu Thr Glu
355 360 365
Arg Glu Val Leu Leu Ala Trp Arg Asp Leu Ile Arg Asp Val Asp Pro
370 375 380
Asp Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu
385 390 395 400
Ile Glu Arg Ala Ala Thr Leu Gly Ile Glu Glu Phe Pro Leu Leu Gly
405 410 415
Arg Val Lys Asn Ser Arg Val Arg Val Arg Asp Ser Thr Phe Ser Ser
420 425 430
Arg Gln Gln Gly Ile Arg Glu Ser Lys Glu Thr Thr Ile Glu Gly Arg
435 440 445
Phe Gln Phe Asp Leu Ile Gln Ala Ile His Arg Asp His Lys Leu Ser
450 455 460
Ser Tyr Ser Leu Asn Ser Val Ser Ala His Phe Leu Ser Glu Gln Lys
465 470 475 480
Glu Asp Val His His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Ala
485 490 495
Glu Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu
500 505 510
Pro Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu
515 520 525
Met Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ala Arg Gly
530 535 540
Gln Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Lys Gly Lys Gln Lys
545 550 555 560
Asn Leu Val Leu Pro Asn Ala Lys Gln Ser Gly Ser Glu Gln Gly Thr
565 570 575
Tyr Glu Gly Ala Thr Val Leu Glu Ala Arg Thr Gly Phe Tyr Glu Lys
580 585 590
Pro Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met
595 600 605
Ala Tyr Asn Leu Cys Tyr Cys Thr Leu Val Thr Pro Glu Asp Val Arg
610 615 620
Lys Leu Asn Leu Pro Pro Glu His Val Thr Lys Thr Pro Ser Gly Glu
625 630 635 640
Thr Phe Val Lys Gln Thr Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu
645 650 655
Glu Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu
660 665 670
Ala Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala
675 680 685
Leu Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Val
690 695 700
Gly Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly
705 710 715 720
Arg Gln Met Ile Glu Gln Thr Lys Lys Leu Val Glu Asp Lys Phe Thr
725 730 735
Thr Leu Gly Gly Tyr Gln Tyr Asn Ala Glu Val Ile Tyr Gly Asp Thr
740 745 750
Asp Ser Val Met Val Gln Phe Gly Val Ser Asp Val Glu Ala Ala Met
755 760 765
Thr Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Ile Lys
770 775 780
Pro Ile Lys Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile
785 790 795 800
Asn Lys Lys Arg Tyr Ala Gly Leu Leu Trp Thr Asn Pro Gln Gln Phe
805 810 815
Asp Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys
820 825 830
Leu Leu Val Lys Asn Leu Val Thr Glu Ser Leu Asn Lys Ile Leu Ile
835 840 845
Asp Arg Asp Val Pro Gly Ala Ala Glu Asn Val Lys Lys Thr Ile Ser
850 855 860
Asp Leu Leu Met Asn Arg Ile Asp Leu Ser Leu Leu Val Ile Thr Lys
865 870 875 880
Gly Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ser Ala His Gly
885 890 895
Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn
900 905 910
Val Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala
915 920 925
Lys Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Gln Asn Asn
930 935 940
Ile Pro Ile Asp Pro Asn Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro
945 950 955 960
Leu Leu Arg Ile Phe Glu Pro Val Leu Lys Asn Ala Ser Lys Glu Leu
965 970 975
Leu His Gly Ser His Thr Arg Ser Ile Ser Ile Thr Thr Pro Ser Asn
980 985 990
Ser Gly Ile Met Lys Phe Ala Lys Lys Gln Leu Ser Cys Val Gly Cys
995 1000 1005
Lys Val Pro Ile Arg Tyr Phe Val Gln Trp Asn Thr Met Arg Lys Leu
1010 1015 1020
Gln Gly Lys Arg Ser Arg Val Ile Leu Gln Lys Arg Val Ser Arg Tyr
1025 1030 1035 1040
Ala Ala Trp Leu Ser Leu Lys Arg Phe Leu Gly Gly Cys Gly His Ser
1045 1050 1055
Ala Arg Ser Val Lys Ala Leu Phe Ile Lys Met Ser Cys Ala Pro Val
1060 1065 1070
Glu Ile Val Gln Tyr Phe Thr Gly Glu
1075 1080
<210> 46
<211> 2154
<212> PRT
<213> Arabidopsis thaliana
<400> 46
Met Ser Gly Arg Arg Cys Asp Arg Arg Leu Asn Val Gln Lys Val Ser
1 5 10 15
Ala Ala Asp Glu Leu Glu Thr Lys Leu Gly Phe Gly Leu Phe Ser Gln
20 25 30
Gly Glu Thr Arg Leu Gly Trp Leu Leu Thr Phe Ala Ser Ser Ser Trp
35 40 45
Glu Asp Ala Asp Thr Gly Lys Thr Phe Ser Cys Val Asp Leu Phe Phe
50 55 60
Val Thr Gln Asp Gly Ser Ser Phe Lys Thr Lys Tyr Lys Phe Arg Pro
65 70 75 80
Tyr Leu Tyr Ala Ala Thr Lys Asp Asn Met Glu Leu Glu Val Glu Ala
85 90 95
Tyr Leu Arg Arg Arg Tyr Glu Arg Gln Val Ala Asp Ile Gln Ile Val
100 105 110
His Lys Glu Asp Leu Tyr Leu Lys Asn His Leu Ser Gly Leu Gln Lys
115 120 125
Lys Tyr Leu Lys Val Ser Phe Asp Thr Val Gln Gln Leu Val Glu Val
130 135 140
Lys Arg Asp Leu Leu His Ile Val Glu Arg Asn Leu Ala Lys Phe Asn
145 150 155 160
Ala Leu Glu Ala Tyr Glu Ser Ile Leu Ser Gly Lys Arg Glu Gln Arg
165 170 175
Pro Gln Asp Cys Leu Asp Ser Val Val Asp Leu Arg Glu Tyr Asp Val
180 185 190
Pro Tyr His Val Arg Phe Ala Ile Asp Asn Asp Val Arg Ser Gly Gln
195 200 205
Trp Tyr Asn Val Ser Ile Ser Ser Thr Asp Val Ile Leu Glu Lys Arg
210 215 220
Thr Asp Leu Leu Gln Arg Ala Glu Val Arg Val Cys Ala Phe Asp Ile
225 230 235 240
Glu Thr Val Lys Leu Pro Leu Lys Phe Pro Asp Ala Glu Tyr Asp Gln
245 250 255
Ile Met Met Ile Ser Tyr Met Val Asp Gly Gln Gly Phe Leu Ile Thr
260 265 270
Asn Arg Glu Cys Val Gly Lys Asp Ile Glu Asp Leu Glu Tyr Thr Pro
275 280 285
Lys Pro Glu Phe Glu Gly Tyr Phe Lys Val Thr Asn Val Thr Asn Glu
290 295 300
Val Glu Leu Leu Arg Lys Trp Phe Ser His Met Gln Glu Leu Lys Pro
305 310 315 320
Gly Ile Tyr Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro Phe Ile
325 330 335
Glu Arg Arg Ala Ser His His Gly Ile Lys Met Asn Glu Glu Leu Gly
340 345 350
Phe Arg Cys Asp Gln Asn Gln Gly Glu Cys Arg Ala Lys Phe Val Cys
355 360 365
His Leu Asp Cys Phe Ser Trp Val Lys Arg Asp Ser Tyr Leu Pro Gln
370 375 380
Gly Ser Gln Gly Leu Lys Ala Val Thr Lys Val Lys Leu Gly Tyr Asp
385 390 395 400
Pro Leu Glu Val Asn Pro Glu Asp Met Val Arg Phe Ala Met Glu Lys
405 410 415
Pro Gln Thr Met Ala Ser Tyr Ser Val Ser Asp Ala Val Ala Thr Tyr
420 425 430
Tyr Leu Tyr Met Thr Tyr Val His Pro Phe Val Phe Ser Leu Ala Thr
435 440 445
Ile Ile Pro Met Val Pro Asp Glu Val Leu Arg Lys Gly Ser Gly Thr
450 455 460
Leu Cys Glu Met Leu Leu Met Val Glu Ala Tyr Lys Ala Asn Val Val
465 470 475 480
Cys Pro Asn Lys Asn Gln Ala Asp Pro Glu Lys Phe Tyr Gln Gly Lys
485 490 495
Leu Leu Glu Ser Glu Thr Tyr Ile Gly Gly His Val Glu Cys Leu Gln
500 505 510
Ser Gly Val Phe Arg Ser Asp Ile Pro Thr Ser Phe Lys Leu Asp Ala
515 520 525
Ser Ala Tyr Gln Gln Leu Ile Asp Asn Leu Gly Arg Asp Leu Glu Tyr
530 535 540
Ala Ile Thr Val Glu Gly Lys Met Arg Met Asp Ser Val Ser Asn Phe
545 550 555 560
Asp Glu Val Lys Glu Val Ile Arg Glu Lys Leu Glu Lys Leu Arg Asp
565 570 575
Asp Pro Ile Arg Glu Glu Gly Pro Leu Ile Tyr His Leu Asp Val Ala
580 585 590
Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro Pro Ser
595 600 605
Ile Val Thr Asp Glu Val Cys Thr Ala Cys Asp Phe Asn Gly Pro Glu
610 615 620
Lys Thr Cys Leu Arg Lys Leu Glu Trp Val Trp Arg Gly Val Thr Phe
625 630 635 640
Lys Gly Asn Lys Ser Glu Tyr Tyr His Leu Lys Lys Gln Ile Glu Ser
645 650 655
Glu Ser Val Asp Ala Gly Ala Asn Met Gln Ser Ser Lys Pro Phe Leu
660 665 670
Asp Leu Pro Lys Val Glu Gln Gln Ser Lys Leu Lys Glu Arg Leu Lys
675 680 685
Lys Tyr Cys Gln Lys Ala Tyr Ser Arg Val Leu Asp Lys Pro Ile Thr
690 695 700
Glu Val Arg Glu Ala Gly Ile Cys Met Arg Glu Asn Pro Phe Tyr Val
705 710 715 720
Asp Thr Val Arg Ser Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Thr Leu
725 730 735
Asn Lys Val Trp Lys Gly Lys Leu Ser Glu Ala Lys Ala Ser Gly Asn
740 745 750
Leu Ile Lys Ile Gln Glu Ala His Asp Met Val Val Val Tyr Asp Ser
755 760 765
Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr Val
770 775 780
Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala Gly Val Val
785 790 795 800
Thr Tyr Thr Gly Ala Lys Ile Ile Gln Asn Ala Arg Leu Leu Ile Glu
805 810 815
Arg Ile Gly Lys Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys Ala
820 825 830
Leu Pro Gly Ser Phe Pro Glu Asn Phe Thr Phe Lys Thr Ile Asp Met
835 840 845
Lys Lys Phe Thr Ile Ser Tyr Pro Cys Val Ile Leu Asn Val Asp Val
850 855 860
Ala Lys Asn Asn Ser Asn Asp Gln Tyr Gln Thr Leu Val Asp Pro Val
865 870 875 880
Arg Lys Thr Tyr Asn Ser Arg Ser Glu Cys Ser Ile Glu Phe Glu Val
885 890 895
Asp Gly Pro Tyr Lys Ala Met Ile Ile Pro Ala Ser Lys Glu Glu Gly
900 905 910
Ile Leu Ile Lys Lys Arg Tyr Ala Val Phe Asn His Asp Gly Thr Ile
915 920 925
Ala Glu Leu Lys Gly Phe Glu Met Lys Arg Arg Gly Glu Leu Lys Leu
930 935 940
Ile Lys Val Phe Gln Ala Glu Leu Phe Asp Lys Phe Leu His Gly Ser
945 950 955 960
Thr Leu Glu Glu Cys Tyr Ser Ala Val Ala Ala Val Ala Asn Arg Trp
965 970 975
Leu Asp Leu Leu Glu Gly Gln Gly Lys Asp Ile Ala Asp Ser Glu Leu
980 985 990
Leu Asp Tyr Ile Ser Glu Ser Ser Thr Met Ser Lys Ser Leu Ala Asp
995 1000 1005
Tyr Gly Gln Gln Lys Ser Cys Ala Val Thr Thr Ala Lys Arg Leu Ala
1010 1015 1020
Asp Phe Leu Gly Asp Thr Met Val Lys Asp Lys Gly Leu Arg Cys Gln
1025 1030 1035 1040
Tyr Ile Val Ala Arg Glu Pro Glu Gly Thr Pro Val Ser Glu Arg Ala
1045 1050 1055
Val Pro Val Ala Ile Phe Gln Thr Asp Asp Pro Glu Lys Lys Phe Tyr
1060 1065 1070
Leu Gln Lys Trp Cys Lys Ile Ser Ser Tyr Thr Gly Ile Arg Ser Ile
1075 1080 1085
Ile Asp Trp Met Tyr Tyr Lys Gln Arg Leu His Ser Ala Ile Gln Lys
1090 1095 1100
Val Ile Thr Ile Pro Ala Ala Met Gln Lys Val Ala Asn Pro Val Leu
1105 1110 1115 1120
Arg Val Arg His Pro Tyr Trp Leu Glu Lys Lys Val Cys Asp Lys Phe
1125 1130 1135
Arg Gln Gly Lys Ile Val Asp Met Phe Ser Ser Ala Asn Lys Asp His
1140 1145 1150
Ser Thr Thr Gln Asp Asn Val Val Ala Asp Ile Glu Glu Phe Cys Lys
1155 1160 1165
Glu Asn Arg Pro Ser Val Lys Gly Pro Lys Pro Val Ala Arg Ser Phe
1170 1175 1180
Glu Val Asp Arg Asn His Ser Glu Gly Lys Gln Gln Glu Ser Trp Asp
1185 1190 1195 1200
Pro Glu Phe His Asp Ile Ser Leu Gln Asn Val Asp Lys Asn Val Asp
1205 1210 1215
Tyr Gln Gly Trp Leu Glu Leu Glu Lys Arg Lys Trp Lys Met Thr Leu
1220 1225 1230
Thr Asn Lys Lys Lys Arg Arg Phe Asp Asp Leu Lys Pro Cys Asn Gln
1235 1240 1245
Ile Asp Ala His Lys Ile Asn Lys Lys Val Cys Lys Gly Arg Val Gly
1250 1255 1260
Val Gly Ser Tyr Phe Arg Arg Pro Glu Glu Ala Leu Thr Ser Ser Tyr
1265 1270 1275 1280
Leu Gln Ile Ile Gln Leu Val Gln Ser Pro Gln Ser Gly Gln Phe Phe
1285 1290 1295
Ala Trp Val Val Val Glu Gly Leu Met Leu Lys Ile Pro Leu Thr Ile
1300 1305 1310
Pro Arg Val Phe Tyr Ile Asn Ser Lys Ala Ser Ile Ala Gly Asn Phe
1315 1320 1325
Thr Gly Lys Cys Ile Asn Lys Ile Leu Pro His Gly Lys Pro Cys Tyr
1330 1335 1340
Asn Leu Met Glu Ala Arg His Leu His Asn Thr His Ile Leu Leu Leu
1345 1350 1355 1360
Val Asn Ile Gln Glu Asp Gln Phe Ile Lys Glu Ser Lys Lys Leu Ala
1365 1370 1375
Ala Leu Leu Ala Asp Pro Glu Ile Glu Gly Ile Tyr Glu Thr Lys Met
1380 1385 1390
Pro Leu Glu Phe Ser Ala Ile Cys Gln Ile Gly Cys Val Cys Lys Ile
1395 1400 1405
Glu Asp Thr Ala Lys His Arg Asn Thr Gln Asp Gly Trp Lys Leu Gly
1410 1415 1420
Glu Leu His Arg Ile Thr Thr Thr Glu Cys Arg Tyr Leu Glu Asn Ser
1425 1430 1435 1440
Ile Pro Leu Val Tyr Leu Tyr His Ser Thr Ser Thr Gly Arg Ala Val
1445 1450 1455
Tyr Val Leu Tyr Cys His Ala Ser Lys Leu Met Ser Val Val Val Val
1460 1465 1470
Asn Pro Tyr Gly Asp Lys Glu Leu Leu Ser Ser Ala Leu Glu Arg Gln
1475 1480 1485
Phe Arg Asp Arg Cys Gln Glu Leu Ser Pro Glu Pro Phe Ser Trp Asp
1490 1495 1500
Gly Ile Leu Phe Gln Val Glu Tyr Val Asp His Pro Glu Ala Ala Thr
1505 1510 1515 1520
Lys Phe Leu Gln Lys Ala Leu Cys Glu Tyr Arg Glu Glu Asn Cys Gly
1525 1530 1535
Ala Thr Val Ala Val Ile Glu Cys Pro Asp Phe Asn Thr Thr Lys Glu
1540 1545 1550
Gly Val Lys Ala Leu Glu Asp Phe Pro Cys Val Arg Ile Pro Phe Asn
1555 1560 1565
Asp Asp Asp Asn Ser Tyr Gln Pro Val Ser Trp Gln Arg Pro Ala Ala
1570 1575 1580
Lys Ile Ala Val Leu Arg Cys Ala Ser Ala Ile Gln Trp Leu Asp Arg
1585 1590 1595 1600
Arg Ile Ala Gln Ser Arg Tyr Ala His Val Pro Leu Gly Asn Phe Gly
1605 1610 1615
Arg Asp Trp Leu Thr Phe Thr Val Asp Ile Phe Leu Ser Arg Ala Leu
1620 1625 1630
Arg Asp Gln Gln Gln Val Leu Trp Val Ser Asp Asn Gly Val Pro Asp
1635 1640 1645
Leu Gly Asp Ile Asn Asn Glu Glu Thr Phe Leu Ala Asp Glu Leu Gln
1650 1655 1660
Glu Thr Ser Leu Leu Phe Pro Gly Ala Tyr Arg Lys Val Ser Val Glu
1665 1670 1675 1680
Leu Lys Val His Arg Leu Ala Val Asn Ala Leu Leu Lys Ser Asp Leu
1685 1690 1695
Val Ser Glu Met Glu Gly Gly Gly Phe Leu Gly Val Asn Ser Arg Gly
1700 1705 1710
Ser Ser Leu Asn Asp Asn Gly Ser Phe Asp Glu Asn Asn Gly Cys Ala
1715 1720 1725
Gln Ala Phe Arg Val Leu Lys Gln Leu Ile Lys Arg Leu Leu His Asp
1730 1735 1740
Ala Cys Asn Ser Gly Asn Ile Tyr Ala Asp Ser Ile Leu Gln His Leu
1745 1750 1755 1760
Ser Trp Trp Leu Arg Ser Pro Ser Ser Lys Leu His Asp Pro Ala Leu
1765 1770 1775
His Leu Met Leu His Lys Val Met Gln Lys Val Phe Ala Leu Leu Leu
1780 1785 1790
Thr Asp Leu Arg Arg Leu Gly Ala Ile Ile Ile Tyr Ala Asp Phe Ser
1795 1800 1805
Lys Val Ile Ile Asp Thr Gly Lys Phe Asp Leu Ser Ala Ala Lys Thr
1810 1815 1820
Tyr Cys Glu Ser Leu Leu Thr Val Met Gly Ser Arg Asp Ile Phe Lys
1825 1830 1835 1840
Leu Ile Leu Leu Glu Pro Val His Tyr Trp His Ser Leu Leu Phe Met
1845 1850 1855
Asp Gln His Asn Tyr Ala Gly Ile Arg Ala Thr Gly Asp Glu Ile Ser
1860 1865 1870
Gly Asn Glu Val Thr Ile Glu Pro Lys Trp Ser Val Ala Arg His Leu
1875 1880 1885
Pro Glu Tyr Ile Gln Lys Asp Phe Ile Ile Ile Val Ala Thr Phe Ile
1890 1895 1900
Phe Gly Pro Trp Lys Phe Ala Leu Glu Lys Lys Arg Gly Ser Ala Glu
1905 1910 1915 1920
Ser Leu Glu Ala Glu Met Val Glu Tyr Leu Lys Glu Gln Ile Gly Thr
1925 1930 1935
Arg Phe Ile Ser Met Ile Val Glu Lys Ile Gly Asn Ile Arg Ser His
1940 1945 1950
Ile Lys Asp Ile Asn Val Ser Asp Ala Ser Trp Ala Ser Gly Gln Ala
1955 1960 1965
Pro Lys Gly Asp Tyr Thr Phe Glu Phe Ile Gln Ile Ile Thr Ala Val
1970 1975 1980
Leu Ala Leu Asp Gln Asn Val Gln Gln Asp Val Leu Val Met Arg Lys
1985 1990 1995 2000
Ile Leu Leu Lys Tyr Ile Lys Val Lys Glu Cys Ala Ala Glu Ala Glu
2005 2010 2015
Phe Ile Asp Pro Gly Pro Ser Phe Ile Leu Pro Asn Val Ala Cys Ser
2020 2025 2030
Asn Cys Gly Ala Tyr Arg Asp Leu Asp Phe Cys Arg Asp Ser Ala Leu
2035 2040 2045
Leu Thr Glu Lys Glu Trp Ser Cys Ala Asp Pro Gln Cys Val Lys Ile
2050 2055 2060
Tyr Asp Lys Glu Gln Ile Glu Ser Ser Ile Ile Gln Met Val Arg Gln
2065 2070 2075 2080
Arg Glu Arg Met Tyr Gln Leu Gln Asp Leu Val Cys Asn Arg Cys Asn
2085 2090 2095
Gln Val Lys Ala Ala His Leu Thr Glu Gln Cys Glu Cys Ser Gly Ser
2100 2105 2110
Phe Arg Cys Lys Glu Ser Gly Ser Asp Phe His Lys Arg Ile Glu Ile
2115 2120 2125
Phe Leu Asp Ile Ala Lys Arg Gln Lys Phe Arg Leu Leu Glu Glu Cys
2130 2135 2140
Ile Ser Trp Ile Leu Phe Ala Thr Ser Cys
2145 2150
<210> 47
<211> 3706
<212> DNA
<213> Oryza sativa
<400> 47
ctctcttccc gcgttcccct ctccctcccc ctcccccctc tccggcgatg agctcaggcg 60
gacgcggcgg caagcggcga ggggcgccgc ccccggggcc atccggggcg gcggcgaagc 120
gggcccaccc cggtggcacc ccgcagccgc ctccgcccgc cgcgacggcg gcggcgcccg 180
tggcggagga ggaggacatg atggacgagg acgtcttcct cgacgagacc atcctggcgg 240
aggacgagga ggcgttgctg ctgctcgacc gggacgaggc cctcgcctca cgcctctccc 300
gctggaggcg ccccgcgctc cccgccgacc tagcgtccgg ctgctcgcgc aatgttgctt 360
ttcagcagct ggagatagat tatgttattg gtgagagcca caaagtactg ctccccaact 420
catctggtcc tgcagctata ctcaggatat ttggcgtaac tagagaaggt cacagtgtat 480
gctgccaagt gcatggattt gagccatatt tttacatcag ttgtccaatg gggatgggcc 540
ctgatgatat ttcacgcttc caccaaacac tagaggggag gatgaaggat tcaaatagga 600
acagcaacgt gccaaggttt gtgaagagaa tcgaacttgt gcagaagcag acaatcatgc 660
attaccaacc acagcaatct cagcctttcc tcaagatagt ggttgctttg ccaacaatgg 720
ttgctagttg tcgcggcatc ctggaaaggg gcataacaat tgaaggcctt ggttcgaaga 780
gttttctgac atatgaaagc aacattcttt ttgcacttcg cttcatgatt gactgcaata 840
ttgttggtgg taattggatt gaagttcctg ccggaaagta tatgaaggca gctcgtatca 900
tgtcctattg tcagctagag ttggattgcc tatattcgga tttggtaagc catgctgctg 960
aaggagaaca ttctaagatg gctccatttc gcatattaag ttttgatatt gaatgtgccg 1020
gtcgcaaagg tcacttccca gaaccaactc atgatcccgt tattcagata gctaacttgg 1080
tcacccttca aggagaagga caaccttttg tacgcaatgt tatgacgctt aaatcatgtt 1140
ctcccattgt tggagttgat gttatgtcat ttgacacaga gagggatgtt ctacttgctt 1200
ggagggattt catacgtgaa gtggaccctg atattattat tggatacaat atctgcaaat 1260
ttgacttacc ctatcttatt gagagagctg aagttcttaa gatagtagag tttccaatac 1320
ttggacgaat cagaaatagt cgtgttcgtg tccgtgacac aactttctct tcaaggcaat 1380
atggtatgcg tgaaagtaaa gatgtagcag tggaaggaag agtacaattt gatcttctgc 1440
aggctatgca acgggattac aagcttagtt cttattcatt aaactctgta tctgcacatt 1500
tcctcgggga gcaaaaagag gatgttcatc actcaattat atctgatctt caaaatggga 1560
attcagagac acgaagacgg cttgcggttt attgtttgaa ggatgcctat cttccacaac 1620
gactgctaga taagttgatg tatatctaca actatgtgga aatggcaaga gtcactggag 1680
ttcccatttc atttcttctt tcaaggggac agagcattaa ggtcctctca cagctactca 1740
ggaaagcaaa acagaaaaac cttgttatac caaatataaa gggtcaagcg tctggacagg 1800
atacctttga aggtgcaact gttttggagg caagggctgg attttatgag aaacccattg 1860
cgactttgga ctttgcttcg ttgtatccat ccatcatgat ggcatataac ctatgctact 1920
gtactttggt cccccctgag gatgcccgca aactcaacct gcctccagaa agtgtcaaca 1980
aaaccccatc tggtgaaaca tttgtgaaac cagatgtgca aaagggtata cttcctgaaa 2040
tccttgaaga attgttggct gctcggaaaa gggcgaaagc agatttgaag gaagcaaagg 2100
atccatttga aagggccgtt cttgatggtc gtcagcttgc cctaaaaata agcgcaaact 2160
ctgtctatgg ttttactgga gcgactgttg gtcaattacc ttgtttagaa atttcttcaa 2220
gtgtgaccag ctatggtcga cagatgattg aacatacaaa aaagcttgtt gaagataaat 2280
tcacgacact tggaggctat gagcacaatg cagaggtcat ctatggagat actgattctg 2340
taatggtaca gttcggtgtt tctactgttg aggacgcaat gaagctagga agagaagctg 2400
cagactacat tagtggaaca tttattaagc ccatcaagct tgagtttgag aagatctatt 2460
tcccttatct actgattagc aagaagagat atgctggttt gtactggaca aatcctgaga 2520
aatttgacaa aatggacacg aaaggtattg aaacagtgag aagggacaac tgtttattag 2580
taaagaacct ggttactgag tgccttcata aaatactagt ggacagagat gttcctggtg 2640
cagttcaata tgtcaagaac accatttctg atctactaat gaaccgtgta gacttatctc 2700
ttctagttat aacaaagggt ttgactaaaa caggagagga ttatgctgtc aaagctgccc 2760
atgtggagct tgctgagaga atgcgaaaga gggacgctgc tactgctcct actgttggtg 2820
accgggttcc ttatgttata atcaaagcag caaaaggggc aaaggcatat gagaggtcag 2880
aagatcctat ttatgttttg gataataaca taccaataga tccccaatac taccttgaga 2940
accaaatcag caaaccactt ttgaggatct ttgagccgat tctgaagaat gccagtagag 3000
agctgcttca tggaagtcac accagggctg tttcaatctc aactccttca aatagtggaa 3060
taatgaaatt tgcaaagaaa caattgacat gcctcggatg caaagcagtt ataagtggtt 3120
ccaatcaaac gctttgcttt cattgcaagg gaagagaagc agagttatac tgcaaaactg 3180
taggaaacgt ttctgagctg gagatgctct ttgggaggct ctggacgcag tgccaggagt 3240
gccaaggctc ccttcatcag gacgttctct gcacaagccg ggattgtcct attttctacc 3300
gccgaagaaa ggcgcagaag gatatggctg aagctagagt acagcttcaa cgttgggact 3360
tctgagtcct ctcatactga cggagtacta ctttccccaa atattgcgaa accattactg 3420
tgaggcacgc cattgcggga tcatgtgatt gcatcttcat gcatgatggc tctggcttgt 3480
ttagttggat cggctgaaat agctttgttc tacggtcagt ttgttgtatt tttaggtggt 3540
aggttatctg tacctctagc cgctaacagg gtaatctagt tgcttccctt ggtgcattga 3600
tgcagccatg tgtaaggtag ataaacaatt ttttttcatc atcttttaac ttcatgaggt 3660
gattgaggct gagaagcacc cattcaagaa aaaaaaaaaa aaaaaa 3706
<210> 48
<211> 1105
<212> PRT
<213> Oryza sativa
<400> 48
Met Ser Ser Gly Gly Arg Gly Gly Lys Arg Arg Gly Ala Pro Pro Pro
1 5 10 15
Gly Pro Ser Gly Ala Ala Ala Lys Arg Ala His Pro Gly Gly Thr Pro
20 25 30
Gln Pro Pro Pro Pro Ala Ala Thr Ala Ala Ala Pro Val Ala Glu Glu
35 40 45
Glu Asp Met Met Asp Glu Asp Val Phe Leu Asp Glu Thr Ile Leu Ala
50 55 60
Glu Asp Glu Glu Ala Leu Leu Leu Leu Asp Arg Asp Glu Ala Leu Ala
65 70 75 80
Ser Arg Leu Ser Arg Trp Arg Arg Pro Ala Leu Pro Ala Asp Leu Ala
85 90 95
Ser Gly Cys Ser Arg Asn Val Ala Phe Gln Gln Leu Glu Ile Asp Tyr
100 105 110
Val Ile Gly Glu Ser His Lys Val Leu Leu Pro Asn Ser Ser Gly Pro
115 120 125
Ala Ala Ile Leu Arg Ile Phe Gly Val Thr Arg Glu Gly His Ser Val
130 135 140
Cys Cys Gln Val His Gly Phe Glu Pro Tyr Phe Tyr Ile Ser Cys Pro
145 150 155 160
Met Gly Met Gly Pro Asp Asp Ile Ser Arg Phe His Gln Thr Leu Glu
165 170 175
Gly Arg Met Lys Asp Ser Asn Arg Asn Ser Asn Val Pro Arg Phe Val
180 185 190
Lys Arg Ile Glu Leu Val Gln Lys Gln Thr Ile Met His Tyr Gln Pro
195 200 205
Gln Gln Ser Gln Pro Phe Leu Lys Ile Val Val Ala Leu Pro Thr Met
210 215 220
Val Ala Ser Cys Arg Gly Ile Leu Glu Arg Gly Ile Thr Ile Glu Gly
225 230 235 240
Leu Gly Ser Lys Ser Phe Leu Thr Tyr Glu Ser Asn Ile Leu Phe Ala
245 250 255
Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly Gly Asn Trp Ile Glu
260 265 270
Val Pro Ala Gly Lys Tyr Met Lys Ala Ala Arg Ile Met Ser Tyr Cys
275 280 285
Gln Leu Glu Leu Asp Cys Leu Tyr Ser Asp Leu Val Ser His Ala Ala
290 295 300
Glu Gly Glu His Ser Lys Met Ala Pro Phe Arg Ile Leu Ser Phe Asp
305 310 315 320
Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro Glu Pro Thr His Asp
325 330 335
Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu Gln Gly Glu Gly Gln
340 345 350
Pro Phe Val Arg Asn Val Met Thr Leu Lys Ser Cys Ser Pro Ile Val
355 360 365
Gly Val Asp Val Met Ser Phe Asp Thr Glu Arg Asp Val Leu Leu Ala
370 375 380
Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp Ile Ile Ile Gly Tyr
385 390 395 400
Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile Glu Arg Ala Glu Val
405 410 415
Leu Lys Ile Val Glu Phe Pro Ile Leu Gly Arg Ile Arg Asn Ser Arg
420 425 430
Val Arg Val Arg Asp Thr Thr Phe Ser Ser Arg Gln Tyr Gly Met Arg
435 440 445
Glu Ser Lys Asp Val Ala Val Glu Gly Arg Val Gln Phe Asp Leu Leu
450 455 460
Gln Ala Met Gln Arg Asp Tyr Lys Leu Ser Ser Tyr Ser Leu Asn Ser
465 470 475 480
Val Ser Ala His Phe Leu Gly Glu Gln Lys Glu Asp Val His His Ser
485 490 495
Ile Ile Ser Asp Leu Gln Asn Gly Asn Ser Glu Thr Arg Arg Arg Leu
500 505 510
Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro Gln Arg Leu Leu Asp
515 520 525
Lys Leu Met Tyr Ile Tyr Asn Tyr Val Glu Met Ala Arg Val Thr Gly
530 535 540
Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln Ser Ile Lys Val Leu
545 550 555 560
Ser Gln Leu Leu Arg Lys Ala Lys Gln Lys Asn Leu Val Ile Pro Asn
565 570 575
Ile Lys Gly Gln Ala Ser Gly Gln Asp Thr Phe Glu Gly Ala Thr Val
580 585 590
Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro Ile Ala Thr Leu Asp
595 600 605
Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala Tyr Asn Leu Cys Tyr
610 615 620
Cys Thr Leu Val Pro Pro Glu Asp Ala Arg Lys Leu Asn Leu Pro Pro
625 630 635 640
Glu Ser Val Asn Lys Thr Pro Ser Gly Glu Thr Phe Val Lys Pro Asp
645 650 655
Val Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu Glu Leu Leu Ala Ala
660 665 670
Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala Lys Asp Pro Phe Glu
675 680 685
Arg Ala Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn
690 695 700
Ser Val Tyr Gly Phe Thr Gly Ala Thr Val Gly Gln Leu Pro Cys Leu
705 710 715 720
Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg Gln Met Ile Glu His
725 730 735
Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr Leu Gly Gly Tyr Glu
740 745 750
His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Gln
755 760 765
Phe Gly Val Ser Thr Val Glu Asp Ala Met Lys Leu Gly Arg Glu Ala
770 775 780
Ala Asp Tyr Ile Ser Gly Thr Phe Ile Lys Pro Ile Lys Leu Glu Phe
785 790 795 800
Glu Lys Ile Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala
805 810 815
Gly Leu Tyr Trp Thr Asn Pro Glu Lys Phe Asp Lys Met Asp Thr Lys
820 825 830
Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu Leu Val Lys Asn Leu
835 840 845
Val Thr Glu Cys Leu His Lys Ile Leu Val Asp Arg Asp Val Pro Gly
850 855 860
Ala Val Gln Tyr Val Lys Asn Thr Ile Ser Asp Leu Leu Met Asn Arg
865 870 875 880
Val Asp Leu Ser Leu Leu Val Ile Thr Lys Gly Leu Thr Lys Thr Gly
885 890 895
Glu Asp Tyr Ala Val Lys Ala Ala His Val Glu Leu Ala Glu Arg Met
900 905 910
Arg Lys Arg Asp Ala Ala Thr Ala Pro Thr Val Gly Asp Arg Val Pro
915 920 925
Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys Ala Tyr Glu Arg Ser
930 935 940
Glu Asp Pro Ile Tyr Val Leu Asp Asn Asn Ile Pro Ile Asp Pro Gln
945 950 955 960
Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Leu Leu Arg Ile Phe Glu
965 970 975
Pro Ile Leu Lys Asn Ala Ser Arg Glu Leu Leu His Gly Ser His Thr
980 985 990
Arg Ala Val Ser Ile Ser Thr Pro Ser Asn Ser Gly Ile Met Lys Phe
995 1000 1005
Ala Lys Lys Gln Leu Thr Cys Leu Gly Cys Lys Ala Val Ile Ser Gly
1010 1015 1020
Ser Asn Gln Thr Leu Cys Phe His Cys Lys Gly Arg Glu Ala Glu Leu
1025 1030 1035 1040
Tyr Cys Lys Thr Val Gly Asn Val Ser Glu Leu Glu Met Leu Phe Gly
1045 1050 1055
Arg Leu Trp Thr Gln Cys Gln Glu Cys Gln Gly Ser Leu His Gln Asp
1060 1065 1070
Val Leu Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Arg Arg Arg Lys
1075 1080 1085
Ala Gln Lys Asp Met Ala Glu Ala Arg Val Gln Leu Gln Arg Trp Asp
1090 1095 1100
Phe
110
<210> 49
<211> 3427
<212> DNA
<213> Glycine max
<400> 49
tgattaccct cccactccac actctccgct gtctctccct cccaattccg atgagcaaca 60
acgcctcccg gaagcgcgcg ccgccgcctc cgtcccaacc tccgccggcg aacaagccct 120
aatgactcag gaagaagagt tcatggacga agacgtgttc ataaacgaaa ccctcgtctc 180
cgaggacgaa gaatccctca ttctccgcga cattgagcag cgccaggccc tcgccaaccg 240
cctctccaag tggacacgtc ctcctctctc cgccggctac gtcgcccaat ctcgtagcgt 300
cctttttcag cagctagaga ttgattacgt gattgcagag agtcacgggg agttgctgcc 360
gaactcgtct ggacctgtcg ccattatcag aatatttgga gttactaagg aaggacacag 420
tgtttgttgc aatgttcatg ggtttgaacc atatttctac atctgttgcc ctcctggaat 480
gggtccagat gatatctccc attttcatca aactctcgag ggaaggatga gagaagccaa 540
tagaaacagt aatgtgggaa aattcgttcg ccgtattgaa atggtgcaga gaaggagtat 600
tatgtactat cagcaatcca attcccaacc ctttctcaaa attgtagttg cactcccaac 660
aatggttgcc agctgccgtg gtattcttga taggggtatt caacttgatg gtctgggaat 720
gaagagcttc ttgacttatg aaagcaatgt actttttgcc cttcgcttca tgattgattg 780
taacatagtt ggtggaaatt ggattgggat tcctgccgga aaatataaga aaacagcgaa 840
aagcttgtct tactgccagt tagagtttga ttgcttgtat tctgaattga ttagtcatgc 900
tccagaaggg gaatattcaa agatggctcc gtttcgcatt ttgagttttg acatcgagtg 960
tgctggtcgt aaaggtcatt ttcctgagcc tacccatgat cctgttatcc agattgctaa 1020
tttggttact ttacaaggag aagaccagcc atttattcgt aatgtgatga cccttaaatc 1080
atgttctcct atcgttggtg ttgatgtgat gccatttgaa acagaaagag aagtcctgct 1140
ggcttggagg gattttattc gtgaagtgga ccctgatatt attattggat acaacatttg 1200
caaatttgac ttgccatatc ttattgagag agctttgaac ctgaagatag cagaatttcc 1260
aattctgggt cgtatcagga acagtagagt tcgagtaaag gatacaactt tctcatcaag 1320
gcagtacgga accagggaaa gtaaagaagt tgcagtagaa gggagagtta cgtttgattt 1380
actccaggtt atgcaaagag actacaaatt aagttcttat tcactgaatt ctgtgtcatc 1440
acacttcctt tctgagcaga aagaggatgt tcatcattca attatatccg atcttcagaa 1500
tggaaatgca gaaactagga ggcgccttgc tgtgtattgt ttgaaggatg catatctccc 1560
tcagcggctt ttggataaat tgatgttcat ttacaattat gtggagatgg ctcgagtaac 1620
aggtgtccca atttcttttc tactttccag aggccaaagc attaaggtac tttctcaact 1680
tcttaggagg gcaaggcaga agaatctggt cattcctaat gccaaacagg ctgggtctga 1740
acaaggaaca tttgaaggtg ccactgtatt ggaggcaagg gctggatttt atgaaaaacc 1800
aattgctact ttagattttg catccttgta tccatctatt atgatggcct ataacttatg 1860
ttattgcact ctggtgatcc ctgaagatgc tcgcaagctc aacatacctc cagagtctgt 1920
gaacagaact ccatctggtg aaacatttgt taaatcaaat ttgcagaagg gaatacttcc 1980
tgaaatactt gaagagctat taacagcccg taaaagggca aaagcagact taaaggaggc 2040
caaggatccc ctggagaagg cagtgctaga tggtagacag ctagccctga agattagtgc 2100
caattctgtg tatgggttta caggggctac cattggtcag ttaccatgtt tagagatatc 2160
atcgagtgta acaagctatg gtcgacaaat gatcgagcac acgaaaaaac ttgtggaaga 2220
taaatttacg acacttaatg gctatgaaca caatgccgag gtaatatatg gagacacaga 2280
ttcagtcatg gtacaatttg gtgtttctgc tgtagaagag gctatgaact tggggagaga 2340
agctgctgaa catattagtg gaactttcac aaaacccatc aaactagaat ttgagaaggt 2400
ttactatcca tatctcctga ttagcaagaa gagatatgct ggtttgtttt ggacaaaacc 2460
agacaacttt gacaaaatgg acactaaagg tattgaaaca gttcgaagag acaattgttt 2520
attggtcaaa aacctggtga acgattgcct tcacaaaata ttgattgaca gggacattcc 2580
tggggcagtc cagtatgtca agaatgcaat ttcagatctt ctcatgaatc gtatggactt 2640
atcacttctg gttattacaa agggtttaac gaagacagga gatgattacg aagtaaaggc 2700
agctcatgtt gaacttgctg aaaggatgcg caagcgagat gctgccactg ctccaaatgt 2760
tggagacaga gtaccatatg ttattattaa agctgcaaaa ggtgcaaagg catatgagag 2820
atcagaggat cctatctatg tgctagagaa caacataccc atagatcctc attactatct 2880
tgagaatcaa attagcaagc caattctgag aatttttgag ccaattctga agaatgctag 2940
caaagagctt ctccatggaa gtcatacaag atctatttct atttctacac cgtcaaacag 3000
tggcatattg agatttgcta agaaacagct acctgcattg gttgtaaagc tttacttggc 3060
aagggttatc acactctctg ttcacattgc aaaggaaggg aggctgagct gtactgtaaa 3120
acagtatctc aagtgtctga gctggagatg ctttttggga ggttgtggac acagtgtcag 3180
gagtgccaag gttcacttca tcaggatgtt ctctgcacca gtcgggattg tccaattttc 3240
tatcgacgaa aaaaggcaca gaaagatatg ggtgaagcaa agttgcaatt ggacagatgg 3300
aacttctaag ttttgccaag aatttgacct tgcggatctc ttcgaaccaa tggacacaaa 3360
tacaatctgg tgtttgccac aatcctgaca tttgtaatgt gagtaaaagc ccacaatttg 3420
tttactg 3427
<210> 50
<211> 1088
<212> PRT
<213> Glycine max
<400> 50
Met Thr Gln Glu Glu Glu Phe Met Asp Glu Asp Val Phe Ile Asn Glu
1 5 10 15
Thr Leu Val Ser Glu Asp Glu Glu Ser Leu Ile Leu Arg Asp Ile Glu
20 25 30
Gln Arg Gln Ala Leu Ala Asn Arg Leu Ser Lys Trp Thr Arg Pro Pro
35 40 45
Leu Ser Ala Gly Tyr Val Ala Gln Ser Arg Ser Val Leu Phe Gln Gln
50 55 60
Leu Glu Ile Asp Tyr Val Ile Ala Glu Ser His Gly Glu Leu Leu Pro
65 70 75 80
Asn Ser Ser Gly Pro Val Ala Ile Ile Arg Ile Phe Gly Val Thr Lys
85 90 95
Glu Gly His Ser Val Cys Cys Asn Val His Gly Phe Glu Pro Tyr Phe
100 105 110
Tyr Ile Cys Cys Pro Pro Gly Met Gly Pro Asp Asp Ile Ser His Phe
115 120 125
His Gln Thr Leu Glu Gly Arg Met Arg Glu Ala Asn Arg Asn Ser Asn
130 135 140
Val Gly Lys Phe Val Arg Arg Ile Glu Met Val Gln Arg Arg Ser Ile
145 150 155 160
Met Tyr Tyr Gln Gln Ser Asn Ser Gln Pro Phe Leu Lys Ile Val Val
165 170 175
Ala Leu Pro Thr Met Val Ala Ser Cys Arg Gly Ile Leu Asp Arg Gly
180 185 190
Ile Gln Leu Asp Gly Leu Gly Met Lys Ser Phe Leu Thr Tyr Glu Ser
195 200 205
Asn Val Leu Phe Ala Leu Arg Phe Met Ile Asp Cys Asn Ile Val Gly
210 215 220
Gly Asn Trp Ile Gly Ile Pro Ala Gly Lys Tyr Lys Lys Thr Ala Lys
225 230 235 240
Ser Leu Ser Tyr Cys Gln Leu Glu Phe Asp Cys Leu Tyr Ser Glu Leu
245 250 255
Ile Ser His Ala Pro Glu Gly Glu Tyr Ser Lys Met Ala Pro Phe Arg
260 265 270
Ile Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly His Phe Pro
275 280 285
Glu Pro Thr His Asp Pro Val Ile Gln Ile Ala Asn Leu Val Thr Leu
290 295 300
Gln Gly Glu Asp Gln Pro Phe Ile Arg Asn Val Met Thr Leu Lys Ser
305 310 315 320
Cys Ser Pro Ile Val Gly Val Asp Val Met Pro Phe Glu Thr Glu Arg
325 330 335
Glu Val Leu Leu Ala Trp Arg Asp Phe Ile Arg Glu Val Asp Pro Asp
340 345 350
Ile Ile Ile Gly Tyr Asn Ile Cys Lys Phe Asp Leu Pro Tyr Leu Ile
355 360 365
Glu Arg Ala Leu Asn Leu Lys Ile Ala Glu Phe Pro Ile Leu Gly Arg
370 375 380
Ile Arg Asn Ser Arg Val Arg Val Lys Asp Thr Thr Phe Ser Ser Arg
385 390 395 400
Gln Tyr Gly Thr Arg Glu Ser Lys Glu Val Ala Val Glu Gly Arg Val
405 410 415
Thr Phe Asp Leu Leu Gln Val Met Gln Arg Asp Tyr Lys Leu Ser Ser
420 425 430
Tyr Ser Leu Asn Ser Val Ser Ser His Phe Leu Ser Glu Gln Lys Glu
435 440 445
Asp Val His His Ser Ile Ile Ser Asp Leu Gln Asn Gly Asn Ala Glu
450 455 460
Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Tyr Leu Pro
465 470 475 480
Gln Arg Leu Leu Asp Lys Leu Met Phe Ile Tyr Asn Tyr Val Glu Met
485 490 495
Ala Arg Val Thr Gly Val Pro Ile Ser Phe Leu Leu Ser Arg Gly Gln
500 505 510
Ser Ile Lys Val Leu Ser Gln Leu Leu Arg Arg Ala Arg Gln Lys Asn
515 520 525
Leu Val Ile Pro Asn Ala Lys Gln Ala Gly Ser Glu Gln Gly Thr Phe
530 535 540
Glu Gly Ala Thr Val Leu Glu Ala Arg Ala Gly Phe Tyr Glu Lys Pro
545 550 555 560
Ile Ala Thr Leu Asp Phe Ala Ser Leu Tyr Pro Ser Ile Met Met Ala
565 570 575
Tyr Asn Leu Cys Tyr Cys Thr Leu Val Ile Pro Glu Asp Ala Arg Lys
580 585 590
Leu Asn Ile Pro Pro Glu Ser Val Asn Arg Thr Pro Ser Gly Glu Thr
595 600 605
Phe Val Lys Ser Asn Leu Gln Lys Gly Ile Leu Pro Glu Ile Leu Glu
610 615 620
Glu Leu Leu Thr Ala Arg Lys Arg Ala Lys Ala Asp Leu Lys Glu Ala
625 630 635 640
Lys Asp Pro Leu Glu Lys Ala Val Leu Asp Gly Arg Gln Leu Ala Leu
645 650 655
Lys Ile Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala Thr Ile Gly
660 665 670
Gln Leu Pro Cys Leu Glu Ile Ser Ser Ser Val Thr Ser Tyr Gly Arg
675 680 685
Gln Met Ile Glu His Thr Lys Lys Leu Val Glu Asp Lys Phe Thr Thr
690 695 700
Leu Asn Gly Tyr Glu His Asn Ala Glu Val Ile Tyr Gly Asp Thr Asp
705 710 715 720
Ser Val Met Val Gln Phe Gly Val Ser Ala Val Glu Glu Ala Met Asn
725 730 735
Leu Gly Arg Glu Ala Ala Glu His Ile Ser Gly Thr Phe Thr Lys Pro
740 745 750
Ile Lys Leu Glu Phe Glu Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Ser
755 760 765
Lys Lys Arg Tyr Ala Gly Leu Phe Trp Thr Lys Pro Asp Asn Phe Asp
770 775 780
Lys Met Asp Thr Lys Gly Ile Glu Thr Val Arg Arg Asp Asn Cys Leu
785 790 795 800
Leu Val Lys Asn Leu Val Asn Asp Cys Leu His Lys Ile Leu Ile Asp
805 810 815
Arg Asp Ile Pro Gly Ala Val Gln Tyr Val Lys Asn Ala Ile Ser Asp
820 825 830
Leu Leu Met Asn Arg Met Asp Leu Ser Leu Leu Val Ile Thr Lys Gly
835 840 845
Leu Thr Lys Thr Gly Asp Asp Tyr Glu Val Lys Ala Ala His Val Glu
850 855 860
Leu Ala Glu Arg Met Arg Lys Arg Asp Ala Ala Thr Ala Pro Asn Val
865 870 875 880
Gly Asp Arg Val Pro Tyr Val Ile Ile Lys Ala Ala Lys Gly Ala Lys
885 890 895
Ala Tyr Glu Arg Ser Glu Asp Pro Ile Tyr Val Leu Glu Asn Asn Ile
900 905 910
Pro Ile Asp Pro His Tyr Tyr Leu Glu Asn Gln Ile Ser Lys Pro Ile
915 920 925
Leu Arg Ile Phe Glu Pro Ile Leu Lys Asn Ala Ser Lys Glu Leu Leu
930 935 940
His Gly Ser His Thr Arg Ser Ile Ser Ile Ser Thr Pro Ser Asn Ser
945 950 955 960
Gly Ile Leu Arg Phe Ala Lys Lys Gln Leu Pro Ala Leu Val Val Lys
965 970 975
Leu Tyr Leu Ala Arg Val Ile Thr Leu Ser Val His Ile Ala Lys Glu
980 985 990
Gly Arg Leu Ser Cys Thr Val Lys Gln Tyr Leu Lys Cys Leu Ser Trp
995 1000 1005
Arg Cys Phe Leu Gly Gly Cys Gly His Ser Val Arg Ser Ala Lys Val
1010 1015 1020
His Phe Ile Arg Met Phe Ser Ala Pro Val Gly Ile Val Gln Phe Ser
1025 1030 1035 1040
Ile Asp Glu Lys Arg His Arg Lys Ile Trp Val Lys Gln Ser Cys Asn
1045 1050 1055
Trp Thr Asp Gly Thr Ser Lys Phe Cys Gln Glu Phe Asp Leu Ala Asp
1060 1065 1070
Leu Phe Glu Pro Met Asp Thr Asn Thr Ile Trp Cys Leu Pro Gln Ser
1075 1080 1085
<210> 51
<211> 3435
<212> DNA
<213> Homo sapiens
<400> 51
acggcggcgt aggctgtggc gggaaacgct gtttgaagcg ggatggatgg caagcggcgg 60
ccaggcccag ggcccggggt gcccccaaag cgggcccgtg ggggcctctg ggatgatgat 120
gatgcacctc ggccatccca attcgaggag gacctggcac tgatggagga gatggaggca 180
gaacacaggc tgcaggagca ggaggaggag gagctgcagt cagtcctgga gggggttgca 240
gacgggcagg tcccaccatc agccatagat cctcgctggc ttcggcccac accaccagcg 300
ctggaccccc agacagagcc cctcatcttc caacagttgg agattgacca ttatgtgggc 360
ccagcgcagc ctgtgcctgg ggggccccca ccatcccacg gctccgtgcc tgtgctccgc 420
gccttcgggg tcaccgatga ggggttctct gtctgctgcc acatccacgg cttcgctccc 480
tacttctaca ccccagcgcc ccctggtttc gggcccgagc acatgggtga cctgcaacgg 540
gagctgaact tggccatcaa ccgggacagt cgcgggggga gggagctgac tgggccggcc 600
gtgctggctg tggaactgtg ctcccgagag agcatgtttg ggtaccacgg gcacggcccc 660
tccccgttcc tgcgcatcac cgtggcgctg ccgcgcctcg tggccccggc ccgccgtctc 720
ctggaacagg gcatccgtgt ggcaggcctg ggcacgccca gcttcgcgcc ctacgaggcc 780
aacgtcgact ttgagatccg gttcatggtg gacacggaca tcgtcggctg caactggctg 840
gagctcccag ccgggaaata cgccctgagg ctgaaggaga aggctacgca gtgccagctg 900
gaggcggacg tgctgtggtc tgacgtggtc agtcacccac cggaagggcc atggcagcgc 960
attgcgccct tgcgcgtgct cagcttcgat atcgagtgcg ccggccgcaa aggcatcttc 1020
cctgagcctg agcgggaccc tgtcatccag atctgctcgc tgggcctgcg ctggggggag 1080
ccggagccct tcctacgcct ggcgctcacc ctgcggccct gtgcccccat cctgggtgcc 1140
aaggtgcaga gctacgagaa ggaggaggac ctgctgcagg cctggtccac cttcatccgt 1200
atcatggacc ccgatgtgat caccggttac aacatccaga acttcgacct tccgtacctc 1260
atctctcggg cccagaccct caaggtacaa acattccctt tcctgggccg tgtggccggc 1320
ctttgctcca acatccggga ctcttcattc cagtccaagc agacgggccg gcgggacacc 1380
aaggttgtca gcatggtggg ccgcgtgcag atggacatgc tgcaggtgct gctgcgggag 1440
tacaagctcc gctcctacac gctcaatgcc gtgagcttcc acttcctggg cgagcagaag 1500
gaggacgtgc agcacagcat catcaccgac ctgcagaatg ggaacgacca gacccgccgc 1560
cgcctggctg tgtactgcct aaaggatgct tacctgccac tgcggctgct ggagcggctc 1620
atggtgctgg tgaacgccgt ggagatggcg agggtcactg gcgtgcccct cagctacctg 1680
ctcagtcgtg gccagcaggt caaggtcgta tcccagctgt tgcggcaggc catgcacgag 1740
gggctgctga tgcccgtggt gaagtcagag ggcggcgagg actacacggg agccactgtc 1800
attgagcccc tcaaagggta ctacgacgtc cccatcgcca ccctggactt ctcctcgctg 1860
tacccgtcca tcatgatggc ccacaacctg tgttacacca cactccttcg gcccgggact 1920
gcacagaaac tgggcctgac tgaggatcag ttcatcagga cccccaccgg ggacgagttt 1980
gtgaagacct cagtgcgtaa ggggctgctg ccccagatcc tggagaacct gctcagtgcc 2040
cggaagaggg ccaaggccga gctggccaag gagacagacc ccctccggcg ccaggtcctg 2100
gatggacggc agctggcgct gaaggtgagc gccaactccg tatacggctt cactggcgcc 2160
caggtgggca agttgccgtg cctggagatc tcacagagcg tcacggggtt cggacgtcag 2220
atgatcgaga aaaccaagca gctggtggag tctaagtaca cagtggagaa tggctacagc 2280
accagcgcca aggtggtgta tggtgacact gactccgtca tgtgccgatt cggcgtgtcc 2340
tcggtggctg aggcgatggc cctgggcggg gaggccgcgg actgggtgtc aggtcacttc 2400
ccgtcgccca tccggctgga gtttgagaag gtctacttcc catacctgct tatcagcaag 2460
aagcgctacg cgggcctgct cttctcctcc cggcccgacg cccacgaccg catggactgc 2520
aagggcctgg aggcggtgcg cagggacaac tgccccctcg tggccaacct ggtcactgcc 2580
tcactgcgcc gcctgctcat cgaccgagac cctgagggcg cggtggctca cgcacaggac 2640
gtcatctcgg acctgctgtg caaccgcatc gatatctccc agctggtcat caccaaggag 2700
ctgacccgcg cggcctccga ctatgccggc aagcaggccc acgtggagct ggccgagagg 2760
atgaggaagc gggaccccgg gagtgcgccc agcctgggcg accgcgtccc ctacgtgatc 2820
atcagtgccg ccaagggtgt ggccgcctac atgaagtcgg aggacccgct gttcgtgctg 2880
gagcacagcc tgcccattga cacgcagtac tacctggagc agcagctggc caagcccctc 2940
ctgcgcatct tcgagcccat cctgggcgag ggccgtgccg aggctgtgct actgcggggg 3000
gaccacacgc gctgcaagac ggtgctcacg ggcaaggtgg gcggcctcct ggccttcgcc 3060
aaacgccgca actgctgcat tggctgccgc acagtgctca gccaccaggg agccgtgtgt 3120
gagttctgcc agccccggga gtctgagctg tatcagaagg aggtatccca tctgaatgcc 3180
ctggaggagc gcttctcgcg cctctggacg cagtgccagc gctgccaggg cagcctgcac 3240
gaggacgtca tctgcaccag ccgggactgc cccatcttct acatgcgcaa gaaggtgcgg 3300
aaggacctgg aagaccagga gcagctcctg cggcgcttcg gaccccctgg acctgaggcc 3360
tggtgacctt gcaagcatcc catggggcgg gggcgggacc agggagaatt aataaagttc 3420
tggacttttg ctaca 3435
<210> 52
<211> 1107
<212> PRT
<213> Homo sapiens
<400> 52
Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Arg Pro Ser
20 25 30
Gln Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His
35 40 45
Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Val Leu Glu Gly
50 55 60
Val Ala Asp Gly Gln Val Pro Pro Ser Ala Ile Asp Pro Arg Trp Leu
65 70 75 80
Arg Pro Thr Pro Pro Ala Leu Asp Pro Gln Thr Glu Pro Leu Ile Phe
85 90 95
Gln Gln Leu Glu Ile Asp His Tyr Val Gly Pro Ala Gln Pro Val Pro
100 105 110
Gly Gly Pro Pro Pro Ser His Gly Ser Val Pro Val Leu Arg Ala Phe
115 120 125
Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe
130 135 140
Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His
145 150 155 160
Met Gly Asp Leu Gln Arg Glu Leu Asn Leu Ala Ile Asn Arg Asp Ser
165 170 175
Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu
180 185 190
Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro
195 200 205
Phe Leu Arg Ile Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg
210 215 220
Arg Leu Leu Glu Gln Gly Ile Arg Val Ala Gly Leu Gly Thr Pro Ser
225 230 235 240
Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val
245 250 255
Asp Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys
260 265 270
Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gln Cys Gln Leu Glu Ala
275 280 285
Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp
290 295 300
Gln Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala
305 310 315 320
Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln
325 330 335
Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg
340 345 350
Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val
355 360 365
Gln Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe
370 375 380
Ile Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn
385 390 395 400
Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Gln
405 410 415
Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn Ile Arg
420 425 430
Asp Ser Ser Phe Gln Ser Lys Gln Thr Gly Arg Arg Asp Thr Lys Val
435 440 445
Val Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu
450 455 460
Arg Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His
465 470 475 480
Phe Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp
485 490 495
Leu Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys
500 505 510
Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val
515 520 525
Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser
530 535 540
Tyr Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu
545 550 555 560
Arg Gln Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu
565 570 575
Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly
580 585 590
Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro
595 600 605
Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro
610 615 620
Gly Thr Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Arg Thr
625 630 635 640
Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu
645 650 655
Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala
660 665 670
Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly
675 680 685
Arg Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr
690 695 700
Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val
705 710 715 720
Thr Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu
725 730 735
Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val
740 745 750
Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val
755 760 765
Ala Glu Ala Met Ala Leu Gly Gly Glu Ala Ala Asp Trp Val Ser Gly
770 775 780
His Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro
785 790 795 800
Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser
805 810 815
Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val
820 825 830
Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu
835 840 845
Arg Arg Leu Leu Ile Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala
850 855 860
Gln Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln
865 870 875 880
Leu Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly
885 890 895
Lys Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro
900 905 910
Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser
915 920 925
Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe
930 935 940
Val Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln
945 950 955 960
Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu
965 970 975
Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys
980 985 990
Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg
995 1000 1005
Arg Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala
1010 1015 1020
Val Cys Glu Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu
1025 1030 1035 1040
Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr
1045 1050 1055
Gln Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr
1060 1065 1070
Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp
1075 1080 1085
Leu Glu Asp Gln Glu Gln Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro
1090 1095 1100
Glu Ala Trp
1105
<210> 53
<211> 6912
<212> DNA
<213> Homo sapiens
<400> 53
cgccaaattt ctcccctgaa gcagaggtgg tagccaacgg ctccatgtct ctgaggagcg 60
gcgggcggcg gcgcgcggac ccaggcgcgg atggcgaggc cagcagggat gatggcgcca 120
cttcctcagt ttcggcactc aagcgcctgg aacggagtca gtggacggat aagatggatt 180
tgcggtttgg ttttgagcgg ctgaaggagc ctggtgagaa gacaggctgg ctcattaaca 240
tgcatcctac cgagatttta gatgaagata agcgcttagg cagtgcagtg gattactact 300
ttattcaaga tgacggaagc agatttaagg tggctttgcc ctataaaccg tatttctaca 360
ttgcgaccag aaagggttgt gagcgagaag tttcatcttt tctctccaag aagtttcagg 420
gcaaaattgc aaaagtggag actgtcccca aagaggatct ggacttgcca aatcacttgg 480
tgggtttgaa gcgaaattac atcaggctgt ccttccacac tgtggaggat cttgtcaaag 540
tgaggaagga gatctcccct gccgtgaaga agaacaggga gcaggatcac gccagcgacg 600
cgtacacagc tctgctttcc agtgttctgc agaggggcgg tgtcattact gatgaagagg 660
aaacctctaa gaagatagct gaccagttgg acaacattgt ggacatgcgc gagtacgatg 720
ttccctacca catccgcctc tccattgacc tgaagatcca cgtggctcat tggtacaatg 780
tcagataccg aggaaatgct tttccggtag aaatcacccg ccgagatgac cttgttgaac 840
gacctgaccc tgtggttttg gcatttgaca ttgagacgac caaactgccc ctcaagtttc 900
ctgatgctga gacagaccag attatgatga tttcctacat gatcgatggc cagggctacc 960
tcatcaccaa cagggagatt gtttcagaag atattgaaga ttttgagttc acccccaagc 1020
cagaatatga aggccccttt tgtgtcttca atgaacccga tgaggctcat ctgatccaaa 1080
ggtggtttga acacgtccag gagaccaaac ccaccatcat ggtcacctac aacggggact 1140
tttttgactg gccatttgtg gaggcccggg cagcagtcca cggtctgagc atgcagcagg 1200
agataggctt ccagaaggac agccaggggg agtacaaggc gccccagtgc atccacatgg 1260
actgcctcag gtgggtgaag agggacagtt accttcctgt gggcagtcat aatctcaagg 1320
cggccgccaa ggccaagcta ggctatgatc ccgtggagct agacccggag gacatgtgcc 1380
ggatggccac ggagcagccc cagactctgg ccacgtattc tgtgtcagat gctgtcgcca 1440
cttactacct gtacatgaag tacgtccacc cattcatctt tgctctgtgc accattattc 1500
ccatggagcc cgacgaggtg ctgcggaagg gctctggcac tctgtgtgag gccttgctga 1560
tggtgcaggc cttccacgcc aacatcatct tccccaacaa gcaagagcag gagttcaata 1620
agctgacgga cgacggacac gtgctggact ctgagaccta cgtcgggggc cacgtggagg 1680
ccctcgagtc tggggttttc cgcagcgata tcccttgccg gtttaggatg aatcctgccg 1740
cctttgactt cctgctgcag cgggttgaga agaccttgcg ccacgccctt gaggaagagg 1800
agaaagtgcc tgtggagcaa gtcaccaact ttgaagaggt gtgtgatgag attaagagca 1860
agcttgcctc cctgaaggac gttcccagcc gcatcgagtg tccactcatc taccacctgg 1920
acgtgggggc catgtacccc aacatcatcc tgaccaaccg cctgcagccc tctgccatgg 1980
tggacgaagc cacctgtgct gcctgtgact tcaataagcc tggagcaaac tgccagcgga 2040
agatggcctg gcagtggagg ggcgagttca tgccagccag tcgcagcgaa taccatcgga 2100
tccagcacca gctggagtca gagaagttcc cccccttgtt cccagagggg ccagctcggg 2160
cctttcatga actgtcccgc gaggaacagg cgaaatacga gaagagaagg ctggcggatt 2220
actgccggaa agcctacaag aagatccaca tcaccaaggt ggaagagcgt ctcaccacca 2280
tctgccagcg ggaaaactcc ttctacgtgg acaccgtgcg tgccttccgg gacaggcgtt 2340
acgagttcaa agggctccac aaggtgtgga aaaagaagct ctcggcggcc gtggaggtgg 2400
gcgacgcggc tgaggtgaag cgctgcaaga acatggaggt gctgtatgac tcgctgcagc 2460
tggcccacaa gtgcatcctg aactccttct atggctatgt catgcgcaag ggggctcgct 2520
ggtactccat ggagatggct ggcatcgtct gcttcacagg ggccaacatc atcacccagg 2580
cacgggagct gatcgagcag attgggaggc ccttagagct ggacacagat ggtatatggt 2640
gcgtcctgcc caacagcttc ccagaaaatt ttgtcttcaa gacgaccaat gtgaagaagc 2700
ccaaagtgac catctcctac ccaggcgcca tgttgaacat catggtcaag gaaggcttca 2760
ccaatgacca gtaccaggag ctggctgagc cgtcctcact cacctacgtc acccgctcag 2820
agaacagcat cttttttgag gttgatgggc cctaccttgc catgattctt ccagcctcca 2880
aggaagaagg caagaaattg aagaagaggt atgctgtgtt caatgaagac ggttctctgg 2940
ctgagctcaa gggctttgag gtcaaacgcc gcggggaact gcagctgatt aagatcttcc 3000
aatcctcggt gtttgaggcc ttcctcaagg gcagcacgct ggaagaggtg tatggctctg 3060
tagccaaggt ggctgactac tggctggacg tgctgtacag caaggcagcc aacatgcctg 3120
actctgagct attcgagctc atctctgaga accgttccat gtctcggaag ctggaagatt 3180
acggggagca gaagtctaca tccatcagca cagcaaagcg cctggccgag ttcctgggag 3240
accagatggt caaggatgca gggctgagtt gccgctacat catctcccgc aagcccgagg 3300
gctcccctgt cacggagagg gccatcccac ttgccatttt ccaagcagag cccacggtga 3360
ggaagcactt tctccggaaa tggctcaaga gctcttccct tcaagacttt gatattcgag 3420
caattctgga ttgggactac tacattgagc ggctgggaag cgccatccag aagatcatca 3480
ccatccctgc ggccctgcag caggtaaaga acccagtgcc acgtgtcaaa caccccgact 3540
ggctgcacaa aaaactgctg gagaagaatg atgtctacaa gcagaagaag atcagtgagc 3600
tcttcaccct ggagggcagg agacaggtca cgatggccga ggcctcagaa gacagtccga 3660
ggccaagtgc tcctgacatg gaggacttcg gcctcgtaaa gctgcctcac ccagcagccc 3720
ctgtcactgt gaagaggaag cgagttcttt gggagagcca ggaggagtcc caggacctca 3780
cgccgactgt gccctggcag gaaatcttgg ggcagcctcc cgccctggga accagccagg 3840
aggaatggct tgtctggctc cggttccaca agaagaagtg gcagctgcag gcccggcagc 3900
gcctcgcccg caggaagagg cagcgtctgg agtcggcaga gggtgtgctc aggcccgggg 3960
ccatccggga tggtcctgcc acggggctgg ggagcttctt gcgaagaact gcccgcagca 4020
tcctggacct tccgtggcag attgtgcaga tcagcgagac cagccaggcc ggcctgttca 4080
ggctgtgggc gctcgttggc agtgacttgc actgcatcag gctgagcatc ccccgtgtgt 4140
tctacgtgaa ccagcgagtc gctaaagcgg aggagggtgc ttcgtatcgc aaggtaaatc 4200
gggtccttcc tcgctccaac atggtctaca atctctatga gtattcagtg ccagaggaca 4260
tgtaccagga acacatcaac gagatcaacg ctgagctgtc agcgccagac atcgagggcg 4320
tatatgagac tcaggttccg ttactgttcc gggccctggt gcacctgggc tgtgtgtgtg 4380
tggtcaataa acagctggtg aggcaccttt caggctggga agcagagacc tttgctcttg 4440
agcacctgga gatgcgctct ctggcccagt tcagctacct ggaaccaggg agtatccgcc 4500
atatctacct gtaccaccac gcacaggccc acaaagcgct cttcgggatc ttcatcccct 4560
cacagcgcag ggcatccgtc tttgtgctgg acactgtgcg cagcaaccag atgcccagcc 4620
ttggcgccct gtactcagca gagcacggcc tcctcctgga gaaggtgggc cctgagctcc 4680
tgccaccccc caaacacacc ttcgaagttc gggcagaaac tgacctgaag accatctgca 4740
gagccatcca gcgattcctg ctcgcctaca aggaggagcg ccgggggccc acactcatcg 4800
ctgttcagtc cagctgggag ctgaagaggc tggccagtga aattcctgtc ttggaggaat 4860
tcccactggt gcctatctgt gtggctgaca agatcaacta tggggtcctg gactggcagc 4920
gccatggagc ccggcgcatg atccgtcact acctcaacct ggacacctgc ctgtcgcagg 4980
ccttcgagat gagcaggtac tttcacattc ccattgggaa cctaccagag gacatctcca 5040
cattcggctc cgacctcttc tttgcccgcc acctccagcg ccacaaccac ctgctctggc 5100
tgtcccctac agcccgccct gacctgggtg gaaaggaggc tgatgacaac tgtcttgtca 5160
tggagttcga tgaccaagcc actgttgaga tcaacagttc aggctgttac tccacagtgt 5220
gtgtggagct ggaccttcag aacctggccg tcaacaccat tctccagtct caccatgtca 5280
acgacatgga gggggccgac agcatgggga tcagcttcga cgtgatccag caggcctccc 5340
tggaggacat gatcacgggt ggtcaggctg ccagtgcccc ggccagctac gatgagacag 5400
ccctgtgctc taacaccttc aggatcctga agagcatggt cgtgggctgg gtgaaggaga 5460
tcacccagta ccacaacatc tatgcagaca accaggtgat gcacttctac cgctggcttc 5520
ggtcgccatc ctctctgctt catgaccctg ccctgcaccg cacactccac aacatgatga 5580
agaagctctt cctgcagctc atcgctgagt tcaagcgcct ggggtcatca gtcatctacg 5640
ccaacttcaa ccgcatcatc ctctgtacaa agaagcgccg tgtggaagat gccatcgctt 5700
acgtggagta catcaccagc agcatccatt caaaggagac cttccattct ctgacaattt 5760
ctttctctcg atgctgggaa tttcttctct ggatggatcc atctaactat ggcggaatca 5820
aaggaaaagt ttcatctcgt attcactgtg gactgcaaga ctcccagaaa gcagggggag 5880
cagaggatga gcaggaaaat gaggacgatg aggaggaaag agatggggag gaggaggaag 5940
aggcggagga atccaacgtg gaggatttac tggaaaacaa ctggaacatt ttgcagtttt 6000
tgccacaggc agcctcctgc cagaactact tcctcatgat tgtttcagcg tacatcgtgg 6060
ccgtgtacca ctgcatgaag gacgggctga ggcgcagtgc tccagggagc acccccgtga 6120
ggaggagggg ggccagccag ctctcccagg aggccgaggg ggcggtcgga gcccttcccg 6180
gaatgatcac cttctctcag gattatgtcg caaatgagct cactcagagc ttcttcacca 6240
tcactcagaa gattcagaag aaagtcacag gctctcggaa ctccactgag ctctcagaga 6300
tgtttcctgt cctccccggt tcccacttgc tgctcaataa ccctgccctg gagttcatca 6360
aatacgtgtg caaggtgctg tccctggaca ccaacatcac aaaccaggtg aataagctga 6420
accgagacct gcttcgcctg gtggatgtcg gcgagttctc cgaggaggcc cagttccgag 6480
acccctgccg ctcctacgtg cttcctgagg tcatctgccg cagctgtaac ttctgccgcg 6540
acctggacct gtgtaaagac tcttccttct cagaggatgg ggcggtcctg cctcagtggc 6600
tctgctccaa ctgtcaggcg ccctacgact cctctgccat cgagatgacg ctggtggaag 6660
ttctacagaa gaagctgatg gccttcaccc tgcaggacct ggtctgcctg aagtgccgcg 6720
gggtgaagga gaccagcatg cctgtgtact gcacgtgcgc gggagacttc gccctcacca 6780
tccacaccca ggtcttcatg gaacagatcg gaatattccg gaacattgcc cagcactacg 6840
gcatgtcgta cctcctggag accctggagt ggctgctgca gaagaaccca cagctgggcc 6900
attagccagc cc 6912
<210> 54
<211> 2286
<212> PRT
<213> Homo sapiens
<400> 54
Met Ser Leu Arg Ser Gly Gly Arg Arg Arg Ala Asp Pro Gly Ala Asp
1 5 10 15
Gly Glu Ala Ser Arg Asp Asp Gly Ala Thr Ser Ser Val Ser Ala Leu
20 25 30
Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe
35 40 45
Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Lys Thr Gly Trp Leu Ile
50 55 60
Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Gly Ser
65 70 75 80
Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val
85 90 95
Ala Leu Pro Tyr Lys Pro Tyr Phe Tyr Ile Ala Thr Arg Lys Gly Cys
100 105 110
Glu Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile
115 120 125
Ala Lys Val Glu Thr Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His
130 135 140
Leu Val Gly Leu Lys Arg Asn Tyr Ile Arg Leu Ser Phe His Thr Val
145 150 155 160
Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys
165 170 175
Asn Arg Glu Gln Asp His Ala Ser Asp Ala Tyr Thr Ala Leu Leu Ser
180 185 190
Ser Val Leu Gln Arg Gly Gly Val Ile Thr Asp Glu Glu Glu Thr Ser
195 200 205
Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr
210 215 220
Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Lys Ile His Val
225 230 235 240
Ala His Trp Tyr Asn Val Arg Tyr Arg Gly Asn Ala Phe Pro Val Glu
245 250 255
Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu
260 265 270
Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala
275 280 285
Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly
290 295 300
Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe
305 310 315 320
Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn
325 330 335
Glu Pro Asp Glu Ala His Leu Ile Gln Arg Trp Phe Glu His Val Gln
340 345 350
Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp
355 360 365
Trp Pro Phe Val Glu Ala Arg Ala Ala Val His Gly Leu Ser Met Gln
370 375 380
Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro
385 390 395 400
Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr
405 410 415
Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu
420 425 430
Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala
435 440 445
Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val
450 455 460
Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala
465 470 475 480
Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly
485 490 495
Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala
500 505 510
Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr
515 520 525
Asp Asp Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val
530 535 540
Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe
545 550 555 560
Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys
565 570 575
Thr Leu Arg His Ala Leu Glu Glu Glu Glu Lys Val Pro Val Glu Gln
580 585 590
Val Thr Asn Phe Glu Glu Val Cys Asp Glu Ile Lys Ser Lys Leu Ala
595 600 605
Ser Leu Lys Asp Val Pro Ser Arg Ile Glu Cys Pro Leu Ile Tyr His
610 615 620
Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu
625 630 635 640
Gln Pro Ser Ala Met Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe
645 650 655
Asn Lys Pro Gly Ala Asn Cys Gln Arg Lys Met Ala Trp Gln Trp Arg
660 665 670
Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His
675 680 685
Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala
690 695 700
Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys
705 710 715 720
Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Ile
725 730 735
Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser
740 745 750
Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe
755 760 765
Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu
770 775 780
Val Gly Asp Ala Ala Glu Val Lys Arg Cys Lys Asn Met Glu Val Leu
785 790 795 800
Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr
805 810 815
Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala
820 825 830
Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu
835 840 845
Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile
850 855 860
Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Phe Lys Thr
865 870 875 880
Thr Asn Val Lys Lys Pro Lys Val Thr Ile Ser Tyr Pro Gly Ala Met
885 890 895
Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn Asp Gln Tyr Gln Glu
900 905 910
Leu Ala Glu Pro Ser Ser Leu Thr Tyr Val Thr Arg Ser Glu Asn Ser
915 920 925
Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala
930 935 940
Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn
945 950 955 960
Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg
965 970 975
Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala
980 985 990
Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys
995 1000 1005
Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met
1010 1015 1020
Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser
1025 1030 1035 1040
Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr
1045 1050 1055
Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala
1060 1065 1070
Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro
1075 1080 1085
Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr
1090 1095 1100
Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln
1105 1110 1115 1120
Asp Phe Asp Ile Arg Ala Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg
1125 1130 1135
Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln
1140 1145 1150
Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His
1155 1160 1165
Lys Lys Leu Leu Glu Lys Asn Asp Val Tyr Lys Gln Lys Lys Ile Ser
1170 1175 1180
Glu Leu Phe Thr Leu Glu Gly Arg Arg Gln Val Thr Met Ala Glu Ala
1185 1190 1195 1200
Ser Glu Asp Ser Pro Arg Pro Ser Ala Pro Asp Met Glu Asp Phe Gly
1205 1210 1215
Leu Val Lys Leu Pro His Pro Ala Ala Pro Val Thr Val Lys Arg Lys
1220 1225 1230
Arg Val Leu Trp Glu Ser Gln Glu Glu Ser Gln Asp Leu Thr Pro Thr
1235 1240 1245
Val Pro Trp Gln Glu Ile Leu Gly Gln Pro Pro Ala Leu Gly Thr Ser
1250 1255 1260
Gln Glu Glu Trp Leu Val Trp Leu Arg Phe His Lys Lys Lys Trp Gln
1265 1270 1275 1280
Leu Gln Ala Arg Gln Arg Leu Ala Arg Arg Lys Arg Gln Arg Leu Glu
1285 1290 1295
Ser Ala Glu Gly Val Leu Arg Pro Gly Ala Ile Arg Asp Gly Pro Ala
1300 1305 1310
Thr Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Leu Asp
1315 1320 1325
Leu Pro Trp Gln Ile Val Gln Ile Ser Glu Thr Ser Gln Ala Gly Leu
1330 1335 1340
Phe Arg Leu Trp Ala Leu Val Gly Ser Asp Leu His Cys Ile Arg Leu
1345 1350 1355 1360
Ser Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu
1365 1370 1375
Glu Gly Ala Ser Tyr Arg Lys Val Asn Arg Val Leu Pro Arg Ser Asn
1380 1385 1390
Met Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln
1395 1400 1405
Glu His Ile Asn Glu Ile Asn Ala Glu Leu Ser Ala Pro Asp Ile Glu
1410 1415 1420
Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val His
1425 1430 1435 1440
Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Val Arg His Leu Ser
1445 1450 1455
Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser
1460 1465 1470
Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr
1475 1480 1485
Leu Tyr His His Ala Gln Ala His Lys Ala Leu Phe Gly Ile Phe Ile
1490 1495 1500
Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser
1505 1510 1515 1520
Asn Gln Met Pro Ser Leu Gly Ala Leu Tyr Ser Ala Glu His Gly Leu
1525 1530 1535
Leu Leu Glu Lys Val Gly Pro Glu Leu Leu Pro Pro Pro Lys His Thr
1540 1545 1550
Phe Glu Val Arg Ala Glu Thr Asp Leu Lys Thr Ile Cys Arg Ala Ile
1555 1560 1565
Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu
1570 1575 1580
Ile Ala Val Gln Ser Ser Trp Glu Leu Lys Arg Leu Ala Ser Glu Ile
1585 1590 1595 1600
Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Cys Val Ala Asp Lys
1605 1610 1615
Ile Asn Tyr Gly Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met
1620 1625 1630
Ile Arg His Tyr Leu Asn Leu Asp Thr Cys Leu Ser Gln Ala Phe Glu
1635 1640 1645
Met Ser Arg Tyr Phe His Ile Pro Ile Gly Asn Leu Pro Glu Asp Ile
1650 1655 1660
Ser Thr Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln Arg His
1665 1670 1675 1680
Asn His Leu Leu Trp Leu Ser Pro Thr Ala Arg Pro Asp Leu Gly Gly
1685 1690 1695
Lys Glu Ala Asp Asp Asn Cys Leu Val Met Glu Phe Asp Asp Gln Ala
1700 1705 1710
Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu
1715 1720 1725
Leu Asp Leu Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His
1730 1735 1740
Val Asn Asp Met Glu Gly Ala Asp Ser Met Gly Ile Ser Phe Asp Val
1745 1750 1755 1760
Ile Gln Gln Ala Ser Leu Glu Asp Met Ile Thr Gly Gly Gln Ala Ala
1765 1770 1775
Ser Ala Pro Ala Ser Tyr Asp Glu Thr Ala Leu Cys Ser Asn Thr Phe
1780 1785 1790
Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln
1795 1800 1805
Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp
1810 1815 1820
Leu Arg Ser Pro Ser Ser Leu Leu His Asp Pro Ala Leu His Arg Thr
1825 1830 1835 1840
Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe
1845 1850 1855
Lys Arg Leu Gly Ser Ser Val Ile Tyr Ala Asn Phe Asn Arg Ile Ile
1860 1865 1870
Leu Cys Thr Lys Lys Arg Arg Val Glu Asp Ala Ile Ala Tyr Val Glu
1875 1880 1885
Tyr Ile Thr Ser Ser Ile His Ser Lys Glu Thr Phe His Ser Leu Thr
1890 1895 1900
Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser
1905 1910 1915 1920
Asn Tyr Gly Gly Ile Lys Gly Lys Val Ser Ser Arg Ile His Cys Gly
1925 1930 1935
Leu Gln Asp Ser Gln Lys Ala Gly Gly Ala Glu Asp Glu Gln Glu Asn
1940 1945 1950
Glu Asp Asp Glu Glu Glu Arg Asp Gly Glu Glu Glu Glu Glu Ala Glu
1955 1960 1965
Glu Ser Asn Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln
1970 1975 1980
Phe Leu Pro Gln Ala Ala Ser Cys Gln Asn Tyr Phe Leu Met Ile Val
1985 1990 1995 2000
Ser Ala Tyr Ile Val Ala Val Tyr His Cys Met Lys Asp Gly Leu Arg
2005 2010 2015
Arg Ser Ala Pro Gly Ser Thr Pro Val Arg Arg Arg Gly Ala Ser Gln
2020 2025 2030
Leu Ser Gln Glu Ala Glu Gly Ala Val Gly Ala Leu Pro Gly Met Ile
2035 2040 2045
Thr Phe Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe
2050 2055 2060
Thr Ile Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Ser
2065 2070 2075 2080
Thr Glu Leu Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu
2085 2090 2095
Leu Asn Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu
2100 2105 2110
Ser Leu Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp
2115 2120 2125
Leu Leu Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe
2130 2135 2140
Arg Asp Pro Cys Arg Ser Tyr Val Leu Pro Glu Val Ile Cys Arg Ser
2145 2150 2155 2160
Cys Asn Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser
2165 2170 2175
Glu Asp Gly Ala Val Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala
2180 2185 2190
Pro Tyr Asp Ser Ser Ala Ile Glu Met Thr Leu Val Glu Val Leu Gln
2195 2200 2205
Lys Lys Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys
2210 2215 2220
Arg Gly Val Lys Glu Thr Ser Met Pro Val Tyr Cys Thr Cys Ala Gly
2225 2230 2235 2240
Asp Phe Ala Leu Thr Ile His Thr Gln Val Phe Met Glu Gln Ile Gly
2245 2250 2255
Ile Phe Arg Asn Ile Ala Gln His Tyr Gly Met Ser Tyr Leu Leu Glu
2260 2265 2270
Thr Leu Glu Trp Leu Leu Gln Lys Asn Pro Gln Leu Gly His
2275 2280 2285
<210> 55
<211> 3390
<212> DNA
<213> Mus musculus
<400> 55
atcttgtggc gggaaaagct gtttgaggcg atggattgta agcggcgaca aggaccaggc 60
cctggggtgc ccccaaagcg ggctcgaggg cacctctggg atgaggacga gccttcgccg 120
tcgcagtttg aggcgaacct ggcactgctg gaggaaatag aggctgagaa ccggctgcag 180
gaggcagagg aggagctgca gctgccccca gagggcaccg tgggtgggca gttttccact 240
gcagacattg accctcggtg gcggcggccc accctacgtg ccctggaccc cagcacggag 300
cccctcatct tccagcagct ggagattgac cactatgtgg gctcagcacc acccctgcca 360
gaacggcccc tgccatcccg gaactcagtg cccatactga gggcctttgg ggtcaccgat 420
gaaggcttct ccgtctgctg ccacatacag ggctttgccc cctacttcta cacccccgcg 480
cctcctggtt ttggggccga gcacctgagt gagctgcagc aggagctgaa cgcagccatc 540
agccgggacc agcgcggtgg gaaggagctc tcagggccgg cagtgctggc aatagagcta 600
tgctcccgtg agagcatgtt tgggtaccac ggtcatggcc cttctccatt tctccgcatc 660
accctggcac taccccgcct tatggcacca gcccgccgcc ttctggaaca gggtgtccga 720
gtgccaggcc tgggcacccc gagcttcgca ccctacgaag ccaacgtgga ctttgagatc 780
cggttcatgg tggatgctga cattgtggga tgcaactggt tggagctgcc agctggaaag 840
tacgttcgga gggcggagaa gaaggccacc ctgtgtcagc tggaggtgga cgtgctgtgg 900
tcagatgtga tcagtcaccc accggagggg cagtggcagc gcattgcacc cctgcgtgtg 960
cttagcttcg acatcgagtg tgctggccga aaaggcatct tccctgagcc tgagcgtgac 1020
cccgtgatcc agatctgttc tctggggctg cgctgggggg agccggagcc attcttgcgt 1080
ctggcactca cgctgcggcc ctgtgccccc atcctgggtg ccaaagtgca gagctatgag 1140
cgggaagaag acctgctcca ggcctgggcc gacttcatcc ttgccatgga ccctgacgtg 1200
atcaccggct acaacattca gaactttgac ctcccatacc tcatctctcg ggcacaggcc 1260
ctaaaggtgg accgcttccc tttcctgggc cgcgtgactg gtctccgctc caacatccgt 1320
gactcctcct tccaatcaag gcaggtcggc cggcgggaca gtaaggtgat cagcatggtg 1380
ggtcgcgttc agatggatat gctgcaggtg ctgcttcggg aacacaagct ccgctcctac 1440
acgctcaacg ctgtgagttt ccacttcctg ggcgagcaga aggaggacgt tcagcacagc 1500
atcatcaccg acctgcagaa tgggaacgaa cagacgcgcc gccgcctggc cgtgtactgc 1560
ctgaaggacg cctttctgcc actccgacta ctagagcgcc ttatggtgct ggtgaacaat 1620
gtggagatgg cgcgtgtcac cggtgtaccc cttgggtacc tgctcacccg gggccagcag 1680
gtcaaggtcg tgtctcagct gctgcgccag gccatgcgcc aggggctgct gatgcctgtg 1740
gtgaagaccg agggcggtga ggactacacg ggagccacag tcattgagcc cctcaaaggg 1800
tactatgacg tccccattgc caccctggac ttctcctcct tgtacccatc catcatgatg 1860
gcccataatc tgtgctacac cacgctgctc cgacctgggg ctgcccagaa gctgggcctt 1920
aaaccagatg agttcatcaa gacacccact ggggatgagt ttgtgaagtc atctgtacgg 1980
aagggcctcc tgccccagat cctggagaat ctgctgagtg cccgcaagag ggccaaggct 2040
gagctggctc aggagacgga ccccctgcgg cgacaggtct tggacggccg gcaactggca 2100
ctaaaagtga gtgccaactc cgtatatggc ttcactggtg cccaggtggg caagctgcca 2160
tgtttggaaa tctcccagag tgtcactggg ttcgggcggc agatgattga gaaaaccaag 2220
cagcttgtgg agtccaagta caccgtggaa aatggctacg atgccaacgc caaggtagtc 2280
tacggtgaca cggactctgt gatgtgccgg tttggcgtct cctctgtggc tgaagcaatg 2340
tctctggggc gggaggctgc aaactgggta tccagtcact tcccatcacc catccggctg 2400
gagttcgaga aggtttactt cccatacctg ctcatcagca agaagcgcta tgctggcctg 2460
ctcttctcct cccgctctga tgcccatgac aaaatggact gcaagggcct ggaggctgtg 2520
cgcagggaca actgtcccct ggtggccaac ctcgttacat cctccctgcg ccggatcctc 2580
gtggaccggg accctgatgg ggcagtagcc catgccaagg acgtcatctc ggacctgctg 2640
tgcaaccgca tagacatctc ccagctggtc atcaccaaag agttgacccg cgcagcagca 2700
gactatgctg gcaagcaggc tcacgtggag ctggctgaga ggatgaggaa gcgcgacccc 2760
ggcagtgcgc ccagcctggg tgaccgagtc ccctatgtga tcattggtgc tgctaagggt 2820
gtggccgcct acatgaagtc ggaggacccc ctgtttgtgc tggagcacag cctgcccatc 2880
gacactcagt actacctgga gcagcagctg gccaagccgc tcttgcgcat ctttgagccc 2940
atcctgggtg agggccgtgc agagtctgtg ctgctgcgcg gtgaccacac acgatgcaag 3000
actgtgctca ccagcaaggt gggcggcctc ttggccttca ccaagcgccg caactgttgc 3060
attggctgcc gctccgtaat cgaccatcaa ggagccgtgt gtaagttctg tcagccacgg 3120
gagtcggagc tctctcagaa ggaggtgtca cacctgaatg ccttggaaga acggttctct 3180
cgcctctgga cacagtgtca acgctgccag ggcagcttgc atgaggacgt catctgtacc 3240
agccgtgact gtcccatctt ctacatgcgc aagaaggtgc gcaaggacct ggaagaccag 3300
gaacggctgc tgcagcgctt tggaccgccc ggccctgagg cctggtgacc tgacacggga 3360
caaggaataa agttcagatc tttgctaaaa 3390
<210> 56
<211> 1105
<212> PRT
<213> Mus musculus
<400> 56
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
20 25 30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
35 40 45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
50 55 60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65 70 75 80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
85 90 95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Arg
100 105 110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
115 120 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
130 135 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145 150 155 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
165 170 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
180 185 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
195 200 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
210 215 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225 230 235 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
245 250 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
260 265 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
275 280 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
290 295 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305 310 315 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
325 330 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
340 345 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
355 360 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
370 375 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp
385 390 395 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
405 410 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
420 425 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
435 440 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
450 455 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465 470 475 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
485 490 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
500 505 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
515 520 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
530 535 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545 550 555 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly
565 570 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
580 585 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
595 600 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
610 615 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625 630 635 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
645 650 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
660 665 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
675 680 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
690 695 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705 710 715 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
725 730 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
740 745 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
755 760 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
770 775 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785 790 795 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
805 810 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
820 825 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
835 840 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
850 855 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865 870 875 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
885 890 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
900 905 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
915 920 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
930 935 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945 950 955 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
965 970 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
980 985 990
Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn
995 1000 1005
Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys
1010 1015 1020
Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Ser Gln Lys Glu Val Ser
1025 1030 1035 1040
His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys
1045 1050 1055
Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg
1060 1065 1070
Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu
1075 1080 1085
Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala
1090 1095 1100
Trp
110
<210> 57
<211> 7119
<212> DNA
<213> Mus musculus
<400> 57
gccaaattct ccccggagcc tgagggagct ttggagcgtc gcaatggtcc tgaggaacag 60
tggacggagg caccccgagc cgggcgcgga tggcgaaggc agccgggatg atggtccctc 120
ttcctcagtc tcagcactca agcgtctgga acggagccag tggacagaca agatggactt 180
acggtttggt ttcgaaaggc tgaaagagcc tggagaaagg actggctggc tgatcaacat 240
gcaccctact gagatcttag atgaagacaa acgcttagtc agcgcggtgg attactactt 300
cattcaagat gatggaagca gatttaaggt ggccttgccc tatatgccgt atttctacat 360
tgcagcgaga aagggttgtg atcgagaagt ttcatctttt ctatccaaga agtttcaggg 420
aaaaattgca aagttagaga atgtgcccaa agaagatctg gacttgccaa atcacttggt 480
gggcttgaag cggagttaca tcaagctgtc cttccacact gtggaggacc ttgtcaaagt 540
gagaaaggag atctctcctg ctgtgaagaa gaaccgagag caggaccatg ctagtgatga 600
gtatacaaca atgctctcca gtattctgca aggtggcagt gtaattactg atgaggagga 660
aacctctaag aagatagctg accaattgga caacatagtg gacatgcggg agtatgatgt 720
tccctaccac attcgcctct ccattgacct cagaatccat gtggcccact ggtacaatgt 780
tagatttcga ggaaatgctt ttcctgtgga aatcacccga cgagatgatc ttgtggaacg 840
acctgaccct gtggttttgg catttgacat cgagacgacc aaactgcctc tcaaattccc 900
tgatgctgag accgatcaga tcatgatgat ctcctatatg attgatggcc agggctacct 960
catcactaac agggagattg tttcagaaga tattgaagat tttgagttca cccctaagcc 1020
agaatatgaa gggccctttt gtgttttcaa tgaacccgac gaggtccatc tgatccagag 1080
atggtttgag catatccagg agaccaaacc taccattatg gtcacctaca atggggattt 1140
ttttgactgg ccatttgtgg aggctagggc agcaattcat ggcctcagca tgtaccagga 1200
gataggcttc cagaaggata gccaggggga atataaggca ccacagtgca tccacatgga 1260
ctgcctcagg tgggtgaaga gggacagtta ccttcctgtg ggcagtcata atctcaaggc 1320
agctgccaag gccaaacttg gctatgaccc tgtagagctg gaccctgagg acatgtgtcg 1380
tatggccact gaacagcccc agactctggc cacttactca gtgtcagatg ctgtggctac 1440
ttactacctg tacatgaaat acgtccaccc cttcatattc gccctgtgca ccattattcc 1500
catggaacct gatgaggtgc tgcggaaggg ctccgggaca ctgtgtgaag ccttgctgat 1560
ggtgcaagct ttccatgcca acattatctt ccccaataag caagagcagg agttcaacaa 1620
gctgacagat gatggccacg tgctagatgc tgagacctac gttgggggcc acgtggaggc 1680
actagagtct ggtgtcttca gaagtgatat cccctgccgg tttaggatga atcctgcagc 1740
ctttgatttc ctgctgcaac gagtcgagaa gactatgcgc cacgccattg aagaagaaga 1800
gaaggtgcct gtggaacaag ccaccaactt tcaagaggtg tgtgagcaga ttaagaccaa 1860
gctcacctcc ctaaaagatg ttcctaacag aattgaatgt cctctaatct atcatctaga 1920
tgtgggggcc atgtatccta acataattct taccaaccgc ctacagcctt ctgccatagt 1980
ggatgaggcc acctgtgctg cctgtgactt caataagcct ggagcaagtt gtcagaggaa 2040
gatggcctgg cagtggaggg gagaattcat gccagccagt cgcagtgaat accatcggat 2100
tcagcatcag ctggagtcgg agaagtttcc ccctttgttt ccagaggggc cagcacgggc 2160
ctttcacgag ctgtcccgtg aagaacaggc taaatatgag aagaggaggc tggcagatta 2220
ttgccggaaa gcctataaga agatccatgt gaccaaggta gaagaacgtc taactaccat 2280
ctgccagcgg gaaaactcat tttatgtgga cacagtgcgg gccttcagag acaggcgcta 2340
tgagttcaaa ggactgcaca aggtgtggaa gaagaagctc tcggcagctg tagaggtggg 2400
cgatgcatca gaggtgaagc gctgcaagaa catggagatc ctttacgatt cactgcagct 2460
ggctcacaag tgcatcctga actccttcta cggctatgtc atgcgcaaag gagctcgctg 2520
gtattccatg gagatggctg gtatcgtctg ctttacagga gccaacatca tcacccaagc 2580
aagagaactg attgagcaga tcgggaggcc tttagaattg gacacggacg gaatatggtg 2640
cgtcctaccc aatagctttc ctgaaaattt tgtcatcaag acaaccaatg cgaagaaacc 2700
caaactgacc atctcctatc ctggtgccat gttgaacatc atggtcaagg aaggctttac 2760
caaccaccag taccaggaac taacagagcc ttcgtctctc acctatgtca cccactctga 2820
gaatagtatc ttttttgaag tcgatggacc ataccttgct atgatccttc cagcctccaa 2880
ggaagaaggc aagaagctga agaaaagata tgctgtgttc aatgaagatg gttccttggc 2940
tgaactgaaa ggttttgagg tgaaacgccg aggggagttg cagctgatta aaatattcca 3000
gtcctcagtt tttgaggcct tcctcaaggg cagcacactg gaggaagtgt atggctcggt 3060
ggccaaagtg gctgactact ggctagatgt gctctatagc aaggctgcta atatgcccga 3120
ttctgaattg tttgagctga tttctgagaa ccgctccatg tctcggaagc tggaagatta 3180
cggggagcag aagtctacat ccatcagcac agcaaagcgc ctggctgagt tcctgggaga 3240
ccagatggtc aaagatgctg gactgagctg ccgctatatc atctcccgaa agccagaggg 3300
gtctcctgtc actgagaggg ccattccact tgccattttc caagcagagc ctacagtgag 3360
gaaacatttt ctccggaaat ggctaaagag ttcatcactt caagactttg atattcggac 3420
aattctggac tgggactact acatagagag gctggggagt gccatccaga aaatcatcac 3480
catccccgca gctctgcagc aggtgaagaa cccagttcca cgtgtcaaac atccagactg 3540
gctacacaaa aaactactag agaagaatga tatctacaaa cagaagaaga tcagtgagct 3600
ctttgtgctt gaaggaaaga gacagattgt gatggcccag gcttcagaaa acagtctgag 3660
tctctgcact ccagacatgg aggacattgg actcacaaag ccacaccact ctacagtccc 3720
agttgctact aagaggaagc gagtctggga gacccaaaag gagtctcagg atattgcact 3780
aactgtgccc tggcaagagg tcttagggca gcctccctcc cttggaacca cacaggaaga 3840
gtggttggtc tggctccagt tccacaagaa aaagtggcag ctgcaggccc aacagcgcct 3900
agccctcagg aagaagcaac gcttagagtc agcagaagat atgccaaggc ttgggcctat 3960
ccgagaggag ccttccacag gactggggag ctttttgcga aggactgccc gcagcatcat 4020
ggaccttcca tggcagataa tacagatcag tgagaccaga caggctggtc tgttccggct 4080
gtgggctatc attggcaatg acttgcactg catcaagctg agtatccctc gagtattcta 4140
tgtaaaccag cgggttgcca aagcagagga tggacctgca tatcggaagg tgaatcgggg 4200
gctcttcctt cgttccaaca ttgtctacaa tctctatgag tattcagtac cagaggacat 4260
gtaccaagaa cacatcaacg agatcaacac tgagttgtca gtaccagaca ttgagggcgt 4320
gtatgagaca caggtcccat tgttattccg ggccctcgtg cagctgggct gtgtgtgtgt 4380
ggtcaacaag cagctgacaa ggcacctttc gggctgggaa gctgaaactt ttgccctcga 4440
gcaccttgaa atgcgttctc tggcccagtt cagctacttg gaaccaggga gtatccgcca 4500
tatctacctg taccatcaca ctcagggcca caaggcactc tttggggtct ttatcccctc 4560
acagcgaaga gcatctgtgt ttgtgttgga tactgtacga agcaaccaaa tgccagggct 4620
cagtgccctg tactcatcag aacacagcct gctgctggac aaggtggacc ccaagctcct 4680
gcctccccca aaacacacct ttgaagttcg tgctgaaacc aacctggaga ctatctgcag 4740
agccatccag cgcttcctgc ttgcctacaa ggaagagcgc cgagggccca cactcatcgc 4800
tgtccagtct agctgggagc tgtgtaggct gaccagtgag attccagtct tagaagagtt 4860
cccactagtg cctatccgag tggctgacaa gatcagctat gcagtcctag actggcagcg 4920
ccatggagct cgccgaatga tccggcacta cctcaattta gacttgtgcc tgtcgcaggc 4980
ctttgagatg agcaggtact tccacatccc tgttggaaac ctgccggaag acatctccat 5040
ctttggctca gacctctttt ttgcacgcca cctccagcac cataaccacc tgctttggct 5100
atcccctacc tctcggcctg acctgggtgg gaaggaagct gatgacaacc gccttgtcat 5160
ggagtttgat gaccgagcca ctgtggagat caatagttct ggctgttact ctactgtgtg 5220
cgtggaactg gacattcaaa atctggcagt caacaccatc ctccagtccc atcatgtcaa 5280
tgacatggag ggggctggca gcatgggcat cagcttcgat gtgatccagc aggcctccct 5340
agaggacatg gtaacaggca atcaagctgc cagtgccctg gccaactacg atgagacagc 5400
cctctgctct agtaccttca ggatcctgaa gagcatggtg gttggctggg taaaggaaat 5460
cacacagtac cacaacatct atgctgacaa ccaggtaatg cacttctacc gctggctcca 5520
gtcaccgtgc tctctgctcc acgacccagc ccttcaccgg acgctgcaca atatgatgaa 5580
gaagctcttc ctgcagctca ttgctgagtt caagcgcctg gggtcatcag tcgtctatgc 5640
caacttcaat cgcatcattc tctgtacaaa gaagcgccga atagaggatg cccttgccta 5700
tgtggaatat attaccaaca gcatccattc taaagagatc ttccattccc tgaccatctc 5760
tttctctcga tgctgggaat tccttctctg gatggatcca tccaactatg gtggaatcaa 5820
aggaaaagtt ccatctagta ttcactgtgg acaggtaaaa gagcaagact cccaggcaag 5880
agaggaaact gatgaagagg aggaggacaa ggaaaaggac gaggaggaag agggcatggg 5940
agagtccgag gttgaggact tactggagaa caactggaac attctacagt tcttgcccca 6000
ggcagcctct tgccagagct acttcctcat gattgtttca gcatacatcg tagctgtgta 6060
ccaaagcatg aaggaggagt tgagacacag tgccccgggc agtacccctg tgaagaggaa 6120
gggggccagc cagttctccc aggagtctga aggggcaact ggatctcttc ctggaatgat 6180
cactttctct caagattatg tggcaaatga gctcactcag agcttcttca ccattactca 6240
gaaaattcag aagaaagtca caggttctcg gaacaccact gagccctcag agatgttccc 6300
cgtcctccct ggttcacact tgctgctcaa taatcctgct ctggagttca tcaaatatgt 6360
gtgcaaggta ctatctcagg atacaaacat cacaaatcag gtgaataagc tgaacagaga 6420
ccttcttcgc ctggtagacg ttggtgaatt ctctgaggag gcccagttca gagacccctg 6480
ccactcctac gtgctccctg aggtaatctg ccacagctgt aatttctgcc gagacctgga 6540
cctgtgcaaa gattcctctt tctctcagga tggagccatc ctgcctcagt ggctctgctc 6600
caattgtcaa gccccctatg actcctctgc cattgagtca gccttggtgg aagccctgca 6660
gaggaaactg atggccttca cacttcagga cctggtatgc ctcaagtgcc gtggtatgaa 6720
agagacccat atgcctgtgt actgcagctg cgcaggggac tttactctca ccatccgcac 6780
tgaggtcttc atggaacaga ttagaatctt ccagaacatt gccaagtact acagcatgtc 6840
atatctccag gagaccatag aatggctgtt acagacaagc cctgtatcaa actgttagca 6900
agcctaggct aaagacactt tggtatccca cacctactgc ctgctccaaa aggcagaacc 6960
actgaccacc ttgcttttcc aaactcatga gcacagccca gaaggaacag aagacttctg 7020
ctaacgtcat catgccataa acagacagaa gcagggaatg gctctatccc tagctgcctg 7080
ctaagtaaac acggttttga agcgtctgaa aaaaaaaaa 7119
<210> 58
<211> 2284
<212> PRT
<213> Mus musculus
<400> 58
Met Val Leu Arg Asn Ser Gly Arg Arg His Pro Glu Pro Gly Ala Asp
1 5 10 15
Gly Glu Gly Ser Arg Asp Asp Gly Pro Ser Ser Ser Val Ser Ala Leu
20 25 30
Lys Arg Leu Glu Arg Ser Gln Trp Thr Asp Lys Met Asp Leu Arg Phe
35 40 45
Gly Phe Glu Arg Leu Lys Glu Pro Gly Glu Arg Thr Gly Trp Leu Ile
50 55 60
Asn Met His Pro Thr Glu Ile Leu Asp Glu Asp Lys Arg Leu Val Ser
65 70 75 80
Ala Val Asp Tyr Tyr Phe Ile Gln Asp Asp Gly Ser Arg Phe Lys Val
85 90 95
Ala Leu Pro Tyr Met Pro Tyr Phe Tyr Ile Ala Ala Arg Lys Gly Cys
100 105 110
Asp Arg Glu Val Ser Ser Phe Leu Ser Lys Lys Phe Gln Gly Lys Ile
115 120 125
Ala Lys Leu Glu Asn Val Pro Lys Glu Asp Leu Asp Leu Pro Asn His
130 135 140
Leu Val Gly Leu Lys Arg Ser Tyr Ile Lys Leu Ser Phe His Thr Val
145 150 155 160
Glu Asp Leu Val Lys Val Arg Lys Glu Ile Ser Pro Ala Val Lys Lys
165 170 175
Asn Arg Glu Gln Asp His Ala Ser Asp Glu Tyr Thr Thr Met Leu Ser
180 185 190
Ser Ile Leu Gln Gly Gly Ser Val Ile Thr Asp Glu Glu Glu Thr Ser
195 200 205
Lys Lys Ile Ala Asp Gln Leu Asp Asn Ile Val Asp Met Arg Glu Tyr
210 215 220
Asp Val Pro Tyr His Ile Arg Leu Ser Ile Asp Leu Arg Ile His Val
225 230 235 240
Ala His Trp Tyr Asn Val Arg Phe Arg Gly Asn Ala Phe Pro Val Glu
245 250 255
Ile Thr Arg Arg Asp Asp Leu Val Glu Arg Pro Asp Pro Val Val Leu
260 265 270
Ala Phe Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala
275 280 285
Glu Thr Asp Gln Ile Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly
290 295 300
Tyr Leu Ile Thr Asn Arg Glu Ile Val Ser Glu Asp Ile Glu Asp Phe
305 310 315 320
Glu Phe Thr Pro Lys Pro Glu Tyr Glu Gly Pro Phe Cys Val Phe Asn
325 330 335
Glu Pro Asp Glu Val His Leu Ile Gln Arg Trp Phe Glu His Ile Gln
340 345 350
Glu Thr Lys Pro Thr Ile Met Val Thr Tyr Asn Gly Asp Phe Phe Asp
355 360 365
Trp Pro Phe Val Glu Ala Arg Ala Ala Ile His Gly Leu Ser Met Tyr
370 375 380
Gln Glu Ile Gly Phe Gln Lys Asp Ser Gln Gly Glu Tyr Lys Ala Pro
385 390 395 400
Gln Cys Ile His Met Asp Cys Leu Arg Trp Val Lys Arg Asp Ser Tyr
405 410 415
Leu Pro Val Gly Ser His Asn Leu Lys Ala Ala Ala Lys Ala Lys Leu
420 425 430
Gly Tyr Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala
435 440 445
Thr Glu Gln Pro Gln Thr Leu Ala Thr Tyr Ser Val Ser Asp Ala Val
450 455 460
Ala Thr Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala
465 470 475 480
Leu Cys Thr Ile Ile Pro Met Glu Pro Asp Glu Val Leu Arg Lys Gly
485 490 495
Ser Gly Thr Leu Cys Glu Ala Leu Leu Met Val Gln Ala Phe His Ala
500 505 510
Asn Ile Ile Phe Pro Asn Lys Gln Glu Gln Glu Phe Asn Lys Leu Thr
515 520 525
Asp Asp Gly His Val Leu Asp Ala Glu Thr Tyr Val Gly Gly His Val
530 535 540
Glu Ala Leu Glu Ser Gly Val Phe Arg Ser Asp Ile Pro Cys Arg Phe
545 550 555 560
Arg Met Asn Pro Ala Ala Phe Asp Phe Leu Leu Gln Arg Val Glu Lys
565 570 575
Thr Met Arg His Ala Ile Glu Glu Glu Glu Lys Val Pro Val Glu Gln
580 585 590
Ala Thr Asn Phe Gln Glu Val Cys Glu Gln Ile Lys Thr Lys Leu Thr
595 600 605
Ser Leu Lys Asp Val Pro Asn Arg Ile Glu Cys Pro Leu Ile Tyr His
610 615 620
Leu Asp Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu
625 630 635 640
Gln Pro Ser Ala Ile Val Asp Glu Ala Thr Cys Ala Ala Cys Asp Phe
645 650 655
Asn Lys Pro Gly Ala Ser Cys Gln Arg Lys Met Ala Trp Gln Trp Arg
660 665 670
Gly Glu Phe Met Pro Ala Ser Arg Ser Glu Tyr His Arg Ile Gln His
675 680 685
Gln Leu Glu Ser Glu Lys Phe Pro Pro Leu Phe Pro Glu Gly Pro Ala
690 695 700
Arg Ala Phe His Glu Leu Ser Arg Glu Glu Gln Ala Lys Tyr Glu Lys
705 710 715 720
Arg Arg Leu Ala Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Ile His Val
725 730 735
Thr Lys Val Glu Glu Arg Leu Thr Thr Ile Cys Gln Arg Glu Asn Ser
740 745 750
Phe Tyr Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Phe
755 760 765
Lys Gly Leu His Lys Val Trp Lys Lys Lys Leu Ser Ala Ala Val Glu
770 775 780
Val Gly Asp Ala Ser Glu Val Lys Arg Cys Lys Asn Met Glu Ile Leu
785 790 795 800
Tyr Asp Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr
805 810 815
Gly Tyr Val Met Arg Lys Gly Ala Arg Trp Tyr Ser Met Glu Met Ala
820 825 830
Gly Ile Val Cys Phe Thr Gly Ala Asn Ile Ile Thr Gln Ala Arg Glu
835 840 845
Leu Ile Glu Gln Ile Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile
850 855 860
Trp Cys Val Leu Pro Asn Ser Phe Pro Glu Asn Phe Val Ile Lys Thr
865 870 875 880
Thr Asn Ala Lys Lys Pro Lys Leu Thr Ile Ser Tyr Pro Gly Ala Met
885 890 895
Leu Asn Ile Met Val Lys Glu Gly Phe Thr Asn His Gln Tyr Gln Glu
900 905 910
Leu Thr Glu Pro Ser Ser Leu Thr Tyr Val Thr His Ser Glu Asn Ser
915 920 925
Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Ile Leu Pro Ala
930 935 940
Ser Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe Asn
945 950 955 960
Glu Asp Gly Ser Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg Arg
965 970 975
Gly Glu Leu Gln Leu Ile Lys Ile Phe Gln Ser Ser Val Phe Glu Ala
980 985 990
Phe Leu Lys Gly Ser Thr Leu Glu Glu Val Tyr Gly Ser Val Ala Lys
995 1000 1005
Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Lys Ala Ala Asn Met
1010 1015 1020
Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Arg Ser Met Ser
1025 1030 1035 1040
Arg Lys Leu Glu Asp Tyr Gly Glu Gln Lys Ser Thr Ser Ile Ser Thr
1045 1050 1055
Ala Lys Arg Leu Ala Glu Phe Leu Gly Asp Gln Met Val Lys Asp Ala
1060 1065 1070
Gly Leu Ser Cys Arg Tyr Ile Ile Ser Arg Lys Pro Glu Gly Ser Pro
1075 1080 1085
Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ala Glu Pro Thr
1090 1095 1100
Val Arg Lys His Phe Leu Arg Lys Trp Leu Lys Ser Ser Ser Leu Gln
1105 1110 1115 1120
Asp Phe Asp Ile Arg Thr Ile Leu Asp Trp Asp Tyr Tyr Ile Glu Arg
1125 1130 1135
Leu Gly Ser Ala Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu Gln
1140 1145 1150
Gln Val Lys Asn Pro Val Pro Arg Val Lys His Pro Asp Trp Leu His
1155 1160 1165
Lys Lys Leu Leu Glu Lys Asn Asp Ile Tyr Lys Gln Lys Lys Ile Ser
1170 1175 1180
Glu Leu Phe Val Leu Glu Gly Lys Arg Gln Ile Val Met Ala Gln Ala
1185 1190 1195 1200
Ser Glu Asn Ser Leu Ser Leu Cys Thr Pro Asp Met Glu Asp Ile Gly
1205 1210 1215
Leu Thr Lys Pro His His Ser Thr Val Pro Val Ala Thr Lys Arg Lys
1220 1225 1230
Arg Val Trp Glu Thr Gln Lys Glu Ser Gln Asp Ile Ala Leu Thr Val
1235 1240 1245
Pro Trp Gln Glu Val Leu Gly Gln Pro Pro Ser Leu Gly Thr Thr Gln
1250 1255 1260
Glu Glu Trp Leu Val Trp Leu Gln Phe His Lys Lys Lys Trp Gln Leu
1265 1270 1275 1280
Gln Ala Gln Gln Arg Leu Ala Leu Arg Lys Lys Gln Arg Leu Glu Ser
1285 1290 1295
Ala Glu Asp Met Pro Arg Leu Gly Pro Ile Arg Glu Glu Pro Ser Thr
1300 1305 1310
Gly Leu Gly Ser Phe Leu Arg Arg Thr Ala Arg Ser Ile Met Asp Leu
1315 1320 1325
Pro Trp Gln Ile Ile Gln Ile Ser Glu Thr Arg Gln Ala Gly Leu Phe
1330 1335 1340
Arg Leu Trp Ala Ile Ile Gly Asn Asp Leu His Cys Ile Lys Leu Ser
1345 1350 1355 1360
Ile Pro Arg Val Phe Tyr Val Asn Gln Arg Val Ala Lys Ala Glu Asp
1365 1370 1375
Gly Pro Ala Tyr Arg Lys Val Asn Arg Gly Leu Phe Leu Arg Ser Asn
1380 1385 1390
Ile Val Tyr Asn Leu Tyr Glu Tyr Ser Val Pro Glu Asp Met Tyr Gln
1395 1400 1405
Glu His Ile Asn Glu Ile Asn Thr Glu Leu Ser Val Pro Asp Ile Glu
1410 1415 1420
Gly Val Tyr Glu Thr Gln Val Pro Leu Leu Phe Arg Ala Leu Val Gln
1425 1430 1435 1440
Leu Gly Cys Val Cys Val Val Asn Lys Gln Leu Thr Arg His Leu Ser
1445 1450 1455
Gly Trp Glu Ala Glu Thr Phe Ala Leu Glu His Leu Glu Met Arg Ser
1460 1465 1470
Leu Ala Gln Phe Ser Tyr Leu Glu Pro Gly Ser Ile Arg His Ile Tyr
1475 1480 1485
Leu Tyr His His Thr Gln Gly His Lys Ala Leu Phe Gly Val Phe Ile
1490 1495 1500
Pro Ser Gln Arg Arg Ala Ser Val Phe Val Leu Asp Thr Val Arg Ser
1505 1510 1515 1520
Asn Gln Met Pro Gly Leu Ser Ala Leu Tyr Ser Ser Glu His Ser Leu
1525 1530 1535
Leu Leu Asp Lys Val Asp Pro Lys Leu Leu Pro Pro Pro Lys His Thr
1540 1545 1550
Phe Glu Val Arg Ala Glu Thr Asn Leu Glu Thr Ile Cys Arg Ala Ile
1555 1560 1565
Gln Arg Phe Leu Leu Ala Tyr Lys Glu Glu Arg Arg Gly Pro Thr Leu
1570 1575 1580
Ile Ala Val Gln Ser Ser Trp Glu Leu Cys Arg Leu Thr Ser Glu Ile
1585 1590 1595 1600
Pro Val Leu Glu Glu Phe Pro Leu Val Pro Ile Arg Val Ala Asp Lys
1605 1610 1615
Ile Ser Tyr Ala Val Leu Asp Trp Gln Arg His Gly Ala Arg Arg Met
1620 1625 1630
Ile Arg His Tyr Leu Asn Leu Asp Leu Cys Leu Ser Gln Ala Phe Glu
1635 1640 1645
Met Ser Arg Tyr Phe His Ile Pro Val Gly Asn Leu Pro Glu Asp Ile
1650 1655 1660
Ser Ile Phe Gly Ser Asp Leu Phe Phe Ala Arg His Leu Gln His His
1665 1670 1675 1680
Asn His Leu Leu Trp Leu Ser Pro Thr Ser Arg Pro Asp Leu Gly Gly
1685 1690 1695
Lys Glu Ala Asp Asp Asn Arg Leu Val Met Glu Phe Asp Asp Arg Ala
1700 1705 1710
Thr Val Glu Ile Asn Ser Ser Gly Cys Tyr Ser Thr Val Cys Val Glu
1715 1720 1725
Leu Asp Ile Gln Asn Leu Ala Val Asn Thr Ile Leu Gln Ser His His
1730 1735 1740
Val Asn Asp Met Glu Gly Ala Gly Ser Met Gly Ile Ser Phe Asp Val
1745 1750 1755 1760
Ile Gln Gln Ala Ser Leu Glu Asp Met Val Thr Gly Asn Gln Ala Ala
1765 1770 1775
Ser Ala Leu Ala Asn Tyr Asp Glu Thr Ala Leu Cys Ser Ser Thr Phe
1780 1785 1790
Arg Ile Leu Lys Ser Met Val Val Gly Trp Val Lys Glu Ile Thr Gln
1795 1800 1805
Tyr His Asn Ile Tyr Ala Asp Asn Gln Val Met His Phe Tyr Arg Trp
1810 1815 1820
Leu Gln Ser Pro Cys Ser Leu Leu His Asp Pro Ala Leu His Arg Thr
1825 1830 1835 1840
Leu His Asn Met Met Lys Lys Leu Phe Leu Gln Leu Ile Ala Glu Phe
1845 1850 1855
Lys Arg Leu Gly Ser Ser Val Val Tyr Ala Asn Phe Asn Arg Ile Ile
1860 1865 1870
Leu Cys Thr Lys Lys Arg Arg Ile Glu Asp Ala Leu Ala Tyr Val Glu
1875 1880 1885
Tyr Ile Thr Asn Ser Ile His Ser Lys Glu Ile Phe His Ser Leu Thr
1890 1895 1900
Ile Ser Phe Ser Arg Cys Trp Glu Phe Leu Leu Trp Met Asp Pro Ser
1905 1910 1915 1920
Asn Tyr Gly Gly Ile Lys Gly Lys Val Pro Ser Ser Ile His Cys Gly
1925 1930 1935
Gln Val Lys Glu Gln Asp Ser Gln Ala Arg Glu Glu Thr Asp Glu Glu
1940 1945 1950
Glu Glu Asp Lys Glu Lys Asp Glu Glu Glu Glu Gly Met Gly Glu Ser
1955 1960 1965
Glu Val Glu Asp Leu Leu Glu Asn Asn Trp Asn Ile Leu Gln Phe Leu
1970 1975 1980
Pro Gln Ala Ala Ser Cys Gln Ser Tyr Phe Leu Met Ile Val Ser Ala
1985 1990 1995 2000
Tyr Ile Val Ala Val Tyr Gln Ser Met Lys Glu Glu Leu Arg His Ser
2005 2010 2015
Ala Pro Gly Ser Thr Pro Val Lys Arg Lys Gly Ala Ser Gln Phe Ser
2020 2025 2030
Gln Glu Ser Glu Gly Ala Thr Gly Ser Leu Pro Gly Met Ile Thr Phe
2035 2040 2045
Ser Gln Asp Tyr Val Ala Asn Glu Leu Thr Gln Ser Phe Phe Thr Ile
2050 2055 2060
Thr Gln Lys Ile Gln Lys Lys Val Thr Gly Ser Arg Asn Thr Thr Glu
2065 2070 2075 2080
Pro Ser Glu Met Phe Pro Val Leu Pro Gly Ser His Leu Leu Leu Asn
2085 2090 2095
Asn Pro Ala Leu Glu Phe Ile Lys Tyr Val Cys Lys Val Leu Ser Gln
2100 2105 2110
Asp Thr Asn Ile Thr Asn Gln Val Asn Lys Leu Asn Arg Asp Leu Leu
2115 2120 2125
Arg Leu Val Asp Val Gly Glu Phe Ser Glu Glu Ala Gln Phe Arg Asp
2130 2135 2140
Pro Cys His Ser Tyr Val Leu Pro Glu Val Ile Cys His Ser Cys Asn
2145 2150 2155 2160
Phe Cys Arg Asp Leu Asp Leu Cys Lys Asp Ser Ser Phe Ser Gln Asp
2165 2170 2175
Gly Ala Ile Leu Pro Gln Trp Leu Cys Ser Asn Cys Gln Ala Pro Tyr
2180 2185 2190
Asp Ser Ser Ala Ile Glu Ser Ala Leu Val Glu Ala Leu Gln Arg Lys
2195 2200 2205
Leu Met Ala Phe Thr Leu Gln Asp Leu Val Cys Leu Lys Cys Arg Gly
2210 2215 2220
Met Lys Glu Thr His Met Pro Val Tyr Cys Ser Cys Ala Gly Asp Phe
2225 2230 2235 2240
Thr Leu Thr Ile Arg Thr Glu Val Phe Met Glu Gln Ile Arg Ile Phe
2245 2250 2255
Gln Asn Ile Ala Lys Tyr Tyr Ser Met Ser Tyr Leu Gln Glu Thr Ile
2260 2265 2270
Glu Trp Leu Leu Gln Thr Ser Pro Val Ser Asn Cys
2275 2280
<210> 59
<211> 3325
<212> DNA
<213> Rattus norvegicus
<400> 59
aggcgatgga tggtaaacgg cggcaagcgc ccagctctgg ggtgccccca aagcgggctt 60
gcaagggcct ctgggatgaa gatgagccgt cacagtttga ggagaacctg gcgctgctgg 120
aggagataga ggccgagaat cggctgcagg aggccgagga ggagctgcag ctgccccctg 180
agggcattgt gggtgggcag ttttccactg cagacattga cccacggtgg ctgcggccca 240
ccccacttgc cctggacccc agcacggagc ccctcatctt ccagcagctg gagattgacc 300
actatgtggg cacatcacct cccctgccag aaggaccccc cgcatctcgt aactcagtgc 360
ccatactgag ggcctttggg gtcaccgatg agggcttctc cgtctgctgc cacatccacg 420
gctttgcccc ctacttctac acccctgcac ctccgggttt tggggctgag cacctgagtg 480
aactacagcg ggagctgaat gcagccatca gccgggacca gcgtggtgga aaggagctct 540
cggggccggc agtgctagct atagagctgt gctcccgtga gagcatgttt gggtaccatg 600
gccacggccc ttctcccttt ctccgcatca ccctggcact accccgcctg atggcgccag 660
cccgccgcct cctggaacag ggtatccgag tgccaggcct gggcaccccg agctttgcac 720
cctatgaagc caatgtggac tttgagatcc ggttcatggt ggatgctgac attgtgggat 780
gcaactggtt ggagctccca gctggaaagt acgttcggag ggcagagaag aaggctacac 840
tgtgtcagct ggaggtggat gtgctgtggt cagacgtgat cagtcaccca ccagaagggc 900
agtggcagcg catcgcaccc ctgcgtgtgc ttagcttcga catcgagtgc gctggccgaa 960
aaggcatctt ccctgagcct gagcgtgacc ccgtgatcca gatctgttct ctggggctgc 1020
gctggggtga gccagagccc ttcttgcgcc tagcactcac gctgcggcct tgcgccccca 1080
tcctgggtgc caaagtacag agctatgaac gggaagaaga cctgctccag gcctgggcca 1140
ctttcatcct cgccatggac cctgacgtga tcaccggcta caacattcag aactttgacc 1200
tcccctacct catctctcgg gcacaaacct taaaggtgga ccgattccct ttcctgggcc 1260
gtgtgactgg tctccgctcc aacatccgtg actcctcctt ccaatcaagg caggtgggcc 1320
ggcgggacag taaggtggtc agcatggtgg gtcgcgttca gatggatatg ctgcaggtgc 1380
tgcttcggga gtacaagctc cgctcctaca cgctcaacgc tgtgagcttc cacttcctgg 1440
gtgagcagaa ggaggacgta cagcacagca tcatcactga cctacagaat gggaatgaac 1500
agacgcgtcg ccgcctggcc gtgtactgcc tgaaggatgc ctttctgcct cttcgcctac 1560
tcgagcgcct tatggtgctg gtgaacaatg tggagatggc gcgtgtcact ggtgtacccc 1620
ttgggtacct gctcagccga ggccagcagg tcaaggtcgt gtctcagctg ctgcgccagg 1680
ccatgcgcga ggggctgctg atgcctgtgg tgaagacgga gggaggtgag gactacacgg 1740
gagccactgt cattgagccc ctcaaagggt actatgatgt ccccattgcc accctggact 1800
tctcctctct gtacccatcc atcatgatgg cccacaatct gtgctacacc acattgctac 1860
ggcctggggc tgcccagaag ttgggcctta aaccagatga gttcatcaag acacccactg 1920
gggatgagtt tgtgaaggca tctgtgcgga agggcctcct gccccaaatc ctggagaatc 1980
tgctgagtgc ccggaagagg gccaaggctg agctggctca ggagacggac cccctgcggc 2040
gacaggtctt ggatggacgg cagctggcac taaaagtgag tcccaactct gtgtatggct 2100
tcactggtgc ccaggtgggc aagctgccgt gtttggagat ctcccagagt gtcactgggt 2160
tcgggcggca gatgattgag aaaaccaagc agctagtgga gaccaagtac actctggaaa 2220
atggctacga tgctaatgcc aaggtggtct acggtgacac tgactctgtg atgtgccgat 2280
ttggtgtctc ctctgtggct gaggcaatgt ctctggggcg ggaggctgca aactgggtat 2340
ccagtcactt cccatcaccc atccggctgg agttcgagaa ggtttacttt ccctacctgc 2400
tcatcagcaa gaagcgctat gccggcctac tcttctcctc ccgctctgat gcccatgaca 2460
gaatggactg caagggcctg gaggctgtgc gtagggacaa ctgtcccctg gtggccaacc 2520
ttgtcacatc ctctctgcgc agaatcctcg tggatcggga ccctgatggt gcagtagccc 2580
atgcaaagga tgtcatctcg gacctgctgt gcaaccgcat agacatctcc caactggtca 2640
tcaccaaaga gttgacccgc gcagcagcag actacgcggg caagcaggct catgtggagc 2700
tggctgagag gatgaggaag cgtgaccccg gcagtgcgcc caacttgggc gaccgagtac 2760
cctacgtgat cattggtgct gccaagggtg tggccgccta catgaagtcg gaggaccccc 2820
tgtttgtgct ggagcacagc ctgcccattg atactcagta ctacctggag cagcagctgg 2880
ccaagccgct attgcgcatc tttgagccca ttctgggtga gggccgcgcg gagtcagtgc 2940
tgctgcgcgg tgaccacaca cgctgcaaaa ccgtgctcac cagcaaggtg ggcggccttc 3000
tggccttcac caagcgccga aactcttgta ttggctgccg ctccgtaatc gaccatcaag 3060
gagccgtgtg taagttctgt cagccacggg agtctgagct ctatcagaag gaggtgtcac 3120
acctgaatgc cctggaggaa cgtttctcgc gcctctggac acagtgccag cgctgccagg 3180
gcagcttgca cgaggatgtc atctgtacca gccgcgactg tcccatcttc tacatgcgca 3240
agaaggtgcg caaggacctg gaggaccagg aacggctgct gcagcgcttt ggacctcctg 3300
gccctgaggc ctggtgacct gacaa 3325
<210> 60
<211> 1103
<212> PRT
<213> Rattus norvegicus
<400> 60
Met Asp Gly Lys Arg Arg Gln Ala Pro Ser Ser Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Cys Lys Gly Leu Trp Asp Glu Asp Glu Pro Ser Gln Phe Glu
20 25 30
Glu Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln
35 40 45
Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Ile Val Gly Gly
50 55 60
Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Leu Arg Pro Thr Pro
65 70 75 80
Leu Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu
85 90 95
Ile Asp His Tyr Val Gly Thr Ser Pro Pro Leu Pro Glu Gly Pro Pro
100 105 110
Ala Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val Thr Asp
115 120 125
Glu Gly Phe Ser Val Cys Cys His Ile His Gly Phe Ala Pro Tyr Phe
130 135 140
Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser Glu Leu
145 150 155 160
Gln Arg Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys
165 170 175
Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser Arg Glu
180 185 190
Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu Arg Ile
195 200 205
Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu Leu Glu
210 215 220
Gln Gly Ile Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr
225 230 235 240
Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala Asp Ile
245 250 255
Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg
260 265 270
Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val Leu Trp
275 280 285
Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala
290 295 300
Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly
305 310 315 320
Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys Ser Leu
325 330 335
Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr
340 345 350
Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu
355 360 365
Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Thr Phe Ile Leu Ala Met
370 375 380
Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro
385 390 395 400
Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Asp Arg Phe Pro Phe
405 410 415
Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe
420 425 430
Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Val Ser Met Val
435 440 445
Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu Tyr Lys
450 455 460
Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu Gly Glu
465 470 475 480
Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln Asn Gly
485 490 495
Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala
500 505 510
Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val Asn Asn
515 520 525
Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu Leu Ser
530 535 540
Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln Ala Met
545 550 555 560
Arg Glu Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Gly Glu Asp
565 570 575
Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val
580 585 590
Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile Met Met
595 600 605
Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln
610 615 620
Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp
625 630 635 640
Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro Gln Ile Leu
645 650 655
Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln
660 665 670
Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln Leu Ala
675 680 685
Leu Lys Val Ser Pro Asn Ser Val Tyr Gly Phe Thr Gly Ala Gln Val
690 695 700
Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly Phe Gly
705 710 715 720
Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr Lys Tyr Thr
725 730 735
Leu Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly Asp Thr
740 745 750
Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu Ala Met
755 760 765
Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe Pro Ser
770 775 780
Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile
785 790 795 800
Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala
805 810 815
His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg Asp Asn
820 825 830
Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg Ile Leu
835 840 845
Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp Val Ile
850 855 860
Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val Ile Thr
865 870 875 880
Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln Ala His
885 890 895
Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser Ala Pro
900 905 910
Asn Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly
915 920 925
Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu Glu His
930 935 940
Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys
945 950 955 960
Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu
965 970 975
Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val Leu Thr
980 985 990
Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn Ser Cys
995 1000 1005
Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys Lys Phe
1010 1015 1020
Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser His Leu
1025 1030 1035 1040
Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg
1045 1050 1055
Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg Asp Cys
1060 1065 1070
Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu Asp Gln
1075 1080 1085
Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala Trp
1090 1095 1100
<210> 61
<211> 3451
<212> DNA
<213> Bos taurus
<400> 61
agtcaggggt cacggcggcg tgggctgtgg cgggaaacac tgtttgaagc gggatggatg 60
gtaagcggcg accaggcccg gggcctgggg tgcccccaaa gcgggcccgt gggggcctct 120
gggatgagga tgaggcatac cggccctcgc agttcgagga ggagctggcg ctgatggagg 180
agatggaagc agagcgcagg ctgcaggagc aggaggagga ggagctgcag tcggccctgg 240
aggcggcgga cgggcaattc tccccaacgg ccatagatgc ccgctggctt cggcccgccc 300
cgcccgcctt ggacccccag atggagcctc tcatcttcca gcagttggag atcgaccatt 360
acgtggcccc agcgcggccc ctgcctgggg cgcccccgcc atcccaggac tcagttccca 420
tcctccgcgc cttcggggtc accaacgagg gggtctccgt ctgctgccac atccatggct 480
ttgcacccta cttctacacc ccagcgcccc ctggttttgg acctgagcac ctgagcgagc 540
tgcagcggga gctgagtgca gccatcagcc gggaccagcg cgggggcaag gagctcaccg 600
ggccggccgt gctggcggta gagctgtgct cccgggagag catgttcggg taccatgggc 660
acggcccctc cccgtttctg cgtatcacct tggcactgcc ccgcctcatg gcacctgccc 720
gccgcctcct ggagcagggc atccgcctgg ccggcctcgg cacccccagc tttgcgccct 780
acgaggccaa cgttgacttt gagatccggt tcatggtgga cacggacatc gtgggctgca 840
actggctgga gctcccagcc gggaaataca tcctgaggcc ggaggggaag gccactctgt 900
gtcagctgga ggccgacgtg ctgtggtcag acgtgatcag ccacccgccg gaaggagagt 960
ggcagcgaat cgcccctctg cgcgtgctca gcttcgacat cgagtgcgct ggtcgcaaag 1020
gcatcttccc tgagcccgag cgggaccccg tgatccagat ctgctcactg ggcctgcgct 1080
ggggcgagcc ggagcccttc ctgcgcctgg cgctcaccct gcggccctgc gcccccatcc 1140
tgggcgccaa ggtgcagagc tatgagcggg aggaggacct gctccaggcc tggtcgacct 1200
tcatccgcat catggatccc gatgtgatca ccggctacaa tatccagaac tttgaccttc 1260
cctacctcat ctcccgggcc cagaccctca aggtgccagg cttccccttg ctgggccgtg 1320
tgattggcct ccgctccaac atccgggagt cgtccttcca gtccaggcag actggccggc 1380
gggacagcaa ggtggtcagc atggtgggcc gcgtgcagat ggacatgctg caggtgctgc 1440
tgcgggagta caagctccgg tcctacacgc tcaatgccgt gagcttccac ttcctgggcg 1500
agcagaagga ggacgtgcag cacagcatca tcacagacct gcagaacggt aacgaccaga 1560
cgcgccgccg cctggccgtg tactgcctca aggacgcctt cctacccctg cggctgctgg 1620
agcggctcat ggtgctggtg aacgccatgg agatggcgcg cgtcaccggc gtgcccctcg 1680
gctacctgct cagccgcggc cagcaggtca aggtcgtgtc ccagctgctg cgacaggcca 1740
tgcgccaggg gctgttgatg cccgtggtga agacggaggg tggtgaggac tataccgggg 1800
ccacggtcat cgagccgctg aaagggtact acgacgttcc catcgccacc ttggacttct 1860
cctcgctgta cccgtccatc atgatggccc acaacctgtg ctacaccaca ctcctgcggc 1920
ccggggccgc ccagaaactg ggcctgaccg aggatcagtt catcaagacg cccacggggg 1980
acgagtttgt gaaggcatcg gtgcggaagg ggctgctccc ccagatcctg gaaaacctgc 2040
tcagcgcccg gaagagggcc aaggccgagc tggccaagga gacagacccc ctacggcggc 2100
aagtgttgga cgggcgccag ctggcgctga aagtgagtgc taactctgtg tacggcttca 2160
ctggcgccca ggtgggcagg ctcccgtgcc tggaaatctc acagagtgtc accgggttcg 2220
ggcgccagat gattgagaag acaaagcagc ttgtggagac caagtacacg gtggaaaacg 2280
gctacagcac cagcgccaag gtggtgtatg gtgacacaga ctcggtcatg tgccgctttg 2340
gcgtctcatc cgtggctgag gcgatggctt tgggacggga ggctgcagac tgggtgtccg 2400
gccacttccc ctcgcccatc cggctagagt ttgagaaagt ctacttcccc tacctgctca 2460
tcagcaagaa gcgttacgca ggcctgctct tctcctcccg gccggacgcc cacgaccgca 2520
tggactgcaa gggcctggag gccgtgcgca gggacaactg ccccctggtg gccaacctcg 2580
tcaccgcctc gctgcgccgc ctgctcatcg accgagaccc ctcgggcgcc gtggctcatg 2640
cacaggacgt catctccgat ctgctgtgta atcgcattga catctcgcag ctggtcatta 2700
ccaaggagct gactcgcgct gccgccgatt acgcgggcaa gcaggcccac gtggagctgg 2760
ccgagaggat gaggaagcgg gaccccggga gcgcgcccag cctgggcgac cgcgtcccct 2820
acgtgatcat cagcgctgcc aagggcgtgg ccgcctacat gaagtccgag gaccccctgt 2880
tcgtactgga gcacagcctg cccatcgaca cgcagtacta cctggagcag cagctcgcca 2940
agccgctcct gcgcatcttc gagcccatcc tgggcgaggg ccgtgccgag gctgtgctgc 3000
tgcgcgggga ccacactcgc tgcaagacgg tgctcacggg gaaggtgggc ggcctcctgg 3060
ccttcgccaa acgccggaac tgctgcatcg gctgccgcac tgtcctcagc caccagggag 3120
ccgtgtgcaa gttctgccag ccccgggagt cagagctgta ccagaaggag gtgtcccacc 3180
tgagtgccct ggaggagcga ttctcacgcc tgtggacgca gtgccagcgc tgccagggca 3240
gcctgcacga ggacgtcatc tgcaccagcc gggactgtcc catcttctac atgcgcaaga 3300
aggtgcggaa ggacctggag gaccaggagc ggctgctgcg gcgctttgga ccccccggcc 3360
cagaggcttg gtgacctctg acctcaacga acttcccacc ttgggggcgc gggggggaca 3420
gacggggaat taataaagct caggcctttt g 3451
<210> 62
<211> 1106
<212> PRT
<213> Bos taurus
<400> 62
Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Arg Gly Gly Leu Trp Asp Glu Asp Glu Ala Tyr Arg Pro Ser
20 25 30
Gln Phe Glu Glu Glu Leu Ala Leu Met Glu Glu Met Glu Ala Glu Arg
35 40 45
Arg Leu Gln Glu Gln Glu Glu Glu Glu Leu Gln Ser Ala Leu Glu Ala
50 55 60
Ala Asp Gly Gln Phe Ser Pro Thr Ala Ile Asp Ala Arg Trp Leu Arg
65 70 75 80
Pro Ala Pro Pro Ala Leu Asp Pro Gln Met Glu Pro Leu Ile Phe Gln
85 90 95
Gln Leu Glu Ile Asp His Tyr Val Ala Pro Ala Arg Pro Leu Pro Gly
100 105 110
Ala Pro Pro Pro Ser Gln Asp Ser Val Pro Ile Leu Arg Ala Phe Gly
115 120 125
Val Thr Asn Glu Gly Val Ser Val Cys Cys His Ile His Gly Phe Ala
130 135 140
Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His Leu
145 150 155 160
Ser Glu Leu Gln Arg Glu Leu Ser Ala Ala Ile Ser Arg Asp Gln Arg
165 170 175
Gly Gly Lys Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu Cys
180 185 190
Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe
195 200 205
Leu Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg
210 215 220
Leu Leu Glu Gln Gly Ile Arg Leu Ala Gly Leu Gly Thr Pro Ser Phe
225 230 235 240
Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp
245 250 255
Thr Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr
260 265 270
Ile Leu Arg Pro Glu Gly Lys Ala Thr Leu Cys Gln Leu Glu Ala Asp
275 280 285
Val Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Glu Trp Gln
290 295 300
Arg Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly
305 310 315 320
Arg Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile
325 330 335
Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu
340 345 350
Ala Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln
355 360 365
Ser Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ser Thr Phe Ile
370 375 380
Arg Ile Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe
385 390 395 400
Asp Leu Pro Tyr Leu Ile Ser Arg Ala Gln Thr Leu Lys Val Pro Gly
405 410 415
Phe Pro Leu Leu Gly Arg Val Ile Gly Leu Arg Ser Asn Ile Arg Glu
420 425 430
Ser Ser Phe Gln Ser Arg Gln Thr Gly Arg Arg Asp Ser Lys Val Val
435 440 445
Ser Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg
450 455 460
Glu Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe
465 470 475 480
Leu Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu
485 490 495
Gln Asn Gly Asn Asp Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu
500 505 510
Lys Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu
515 520 525
Val Asn Ala Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr
530 535 540
Leu Leu Ser Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg
545 550 555 560
Gln Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly
565 570 575
Gly Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr
580 585 590
Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser
595 600 605
Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly
610 615 620
Ala Ala Gln Lys Leu Gly Leu Thr Glu Asp Gln Phe Ile Lys Thr Pro
625 630 635 640
Thr Gly Asp Glu Phe Val Lys Ala Ser Val Arg Lys Gly Leu Leu Pro
645 650 655
Gln Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu
660 665 670
Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg
675 680 685
Gln Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly
690 695 700
Ala Gln Val Gly Arg Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr
705 710 715 720
Gly Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Thr
725 730 735
Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val Tyr
740 745 750
Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala
755 760 765
Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly His
770 775 780
Phe Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr
785 790 795 800
Leu Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg
805 810 815
Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val Arg
820 825 830
Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu Arg
835 840 845
Arg Leu Leu Ile Asp Arg Asp Pro Ser Gly Ala Val Ala His Ala Gln
850 855 860
Asp Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu
865 870 875 880
Val Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys
885 890 895
Gln Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly
900 905 910
Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Ser Ala
915 920 925
Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val
930 935 940
Leu Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln
945 950 955 960
Leu Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly
965 970 975
Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr
980 985 990
Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg Arg
995 1000 1005
Asn Cys Cys Ile Gly Cys Arg Thr Val Leu Ser His Gln Gly Ala Val
1010 1015 1020
Cys Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val
1025 1030 1035 1040
Ser His Leu Ser Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln
1045 1050 1055
Cys Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser
1060 1065 1070
Arg Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu
1075 1080 1085
Glu Asp Gln Glu Arg Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro Glu
1090 1095 1100
Ala Trp
1105
<210> 63
<211> 3457
<212> DNA
<213> Drosophila melanogaster
<400> 63
ctctaacgtg cctaccaaca aaagcgcgcc ttattttttg gcatcgctct tgtcttatgg 60
atttgcaagt aacatttcac caaggtaccc agaatggatg gcaagcgcaa gtttaatgga 120
acctccaatg gacatgccaa gaagcccagg aatcctgatg acgatgagga aatgggcttt 180
gaggcggagc tggccgcctt cgagaactcc gaggacatgg accagactct gctaatgggc 240
gatggacccg agaaccaaac gaccagtgag cgttggtccc gtccgccgcc cccagaacta 300
gatccctcca agcacaactt ggagtttcag cagctggacg tggaaaacta tttgggacag 360
ccgttgccgg gaatgccagg tgcccaaata ggacccgtgc cggtggtccg aatgtttggt 420
gtcaccatgg agggtaactc tgtgtgctgc catgtgcatg gtttctgtcc atacttctac 480
atagaggcgc ccagtcaatt cgaggagcac cattgcgaga aactacaaaa agccttggat 540
caaaaggtta ttgccgatat tcgcaacaac aaagataatg tccaggaggc tgtgcttatg 600
gtggaactgg tggagaagct gaacatccat ggatacaatg gagacaagaa gcagaggtac 660
atcaaaatat cggttacgct gcccagattt gtggctgcgg cctcacgtct cctcaaaaag 720
gaagtgatca tgtcggagat tgacttccag gactgtcgcg cctttgagaa taacatagac 780
tttgacattc gcttcatggt ggacactgat gtggtgggtt gcaattggat agagcttccc 840
atgggtcact ggcgaataag gaacagtcac agcaagccgt tgcctgaatc ccgctgccag 900
attgaagtag acgtggcctt cgacagattt atatcccacg agcccgaagg tgaatggtcc 960
aaggtggctc ccttccggat cctctccttt gatattgaat gcgctggtcg caaaggaata 1020
tttccggaag ccaaaataga tccagtcatc cagatagcca atatggtgat aaggcaggga 1080
gaacgagaac ctttcattag gaatgtcttt accctaaatg aatgcgctcc aatcataggc 1140
agccaggtgt tgtgccacga caaggagacc cagatgctgg acaagtggtc tgcctttgtc 1200
cgggaagttg acccggatat tttgaccgga tataatatca acaactttga cttcccctat 1260
ttgcttaacc gagcagctca cttgaaggtc aggaactttg agtatttggg caggattaag 1320
aacattcgtt cggtgatcaa ggaacagatg ttgcagtcga agcagatggg tcgcagggaa 1380
aaccagtacg ttaattttga gggtagagtt cccttcgatc tcctctttgt cctgctgcgc 1440
gactacaaac tacgctcgta cactctcaac gctgtgagct atcactttct gcaggagcaa 1500
aaggaggatg tgcatcatag cattatcaca gatcttcaga atggagacga gcagacacgt 1560
cgccgttcgg ccatgtactg cctaaaggat gcctacttac cgcttagatt gctggagaag 1620
ttaatggcca ttgttaacta catggagatg gccagggtga cgggtgtgcc actggagtcc 1680
ttgctcaccc gcggacaaca gataaaggtt ttaagtcaat tgctgcgcaa ggccaaaacc 1740
aagggattca tcatgccctc gtacacctct cagggatcgg atgaacagta tgaaggagcg 1800
actgtgattg aaccaaaacg tggctactat gcggacccca tctccacgct ggatttcgcc 1860
tctctgtatc caagtataat gatggcgcat aatttgtgct acaccacctt ggttttgggt 1920
ggaactcgtg agaagctgcg gcagcaggag aacctgcagg acgatcaagt ggaacgtacg 1980
cctgcaaaca actactttgt gaagtctgag gtgcgtcgtg gtctgctccc tgagattctg 2040
gaatctcttt tggcggccag aaagcgtgcc aaaaatgacc taaaagtgga aacagatccg 2100
tttaaaagaa aggtcctgga tggcagacag ctggcgctga agatttcggc taattccgtg 2160
tacggattta ctggcgcaca ggttggaaag ttgccatgct tagagatctc gggcagcgtc 2220
accgcctacg gtcgtaccat gatcgagatg acgaaaaacg aagtggaatc ccattacaca 2280
caggccaatg gctacgagaa caatgcagtg gtcatctacg gcgacactga ttctgtgatg 2340
gttaatttcg gagtaaaaac tctggagcgc agcatggagc tgggacgcga ggctgccgaa 2400
ctggtcagtt ccaagttcgt gcatcctatt aaattggaat tcgagaaagt ttactatcct 2460
tacctgctga ttaacaagaa acgctatgcg ggattatact ttacgcgccc agatacctac 2520
gataaaatgg attgcaaggg catagaaacc gtgaggagag ataactctcc gctggtggcc 2580
aacctgatga actcctgcct gcagaaacta ctcatcgaaa gggatcccga tggtgcagtt 2640
gcctatgtga aacaggtgat agccgatctc ctctgcaatc gcatcgacat ctcgcacttg 2700
gtcataacca aggagttggc caaaacggat tacgcagcca aacaggcaca cgttgagctg 2760
gccgccaaga tgaagaaaag agatcccggt acggcgccca aactggggga tcgagttccc 2820
tatgtgatct gtgcggcagc caaaaacaca cccgcttacc agaaggccga ggatccgctg 2880
tatgtgctgg aaaacagcgt gcccatcgat gccacttact acctggaaca gcagctgtct 2940
aagccgctgc taaggatctt tgaacctatt ttgggcgaca atgccgagtc aattttgtta 3000
aaaggagaac acacgcgcac acgaactgtg gtaacatcca aagtgggtgg acttgctgga 3060
tttatgacca agaaaacgtc gtgtttgggc tgcaaatccc tgatgcccaa gggctacgaa 3120
caggcctgtc tgtgtccaca ctgcgagcca cgaatgagtg agctgtatca gaaggaggtg 3180
ggtgcgaaga gggaactgga ggagaccttc tctcgcctgt ggaccgagtg ccagcgatgc 3240
caggaatcct tgcacgagga ggttatctgc tccaacagag attgccccat cttctacatg 3300
cgacagaagg ttcgcatgga tctggacaat caggagaagc gggtgttgcg attcggcctg 3360
gccgagtggt aaccattgca tgagtttact gaattgttta atcctataat ttaataatta 3420
tattactaga agttattaaa aaaaaaaaaa aaaaaaa 3457
<210> 64
<211> 1092
<212> PRT
<213> Drosophila melanogaster
<400> 64
Met Asp Gly Lys Arg Lys Phe Asn Gly Thr Ser Asn Gly His Ala Lys
1 5 10 15
Lys Pro Arg Asn Pro Asp Asp Asp Glu Glu Met Gly Phe Glu Ala Glu
20 25 30
Leu Ala Ala Phe Glu Asn Ser Glu Asp Met Asp Gln Thr Leu Leu Met
35 40 45
Gly Asp Gly Pro Glu Asn Gln Thr Thr Ser Glu Arg Trp Ser Arg Pro
50 55 60
Pro Pro Pro Glu Leu Asp Pro Ser Lys His Asn Leu Glu Phe Gln Gln
65 70 75 80
Leu Asp Val Glu Asn Tyr Leu Gly Gln Pro Leu Pro Gly Met Pro Gly
85 90 95
Ala Gln Ile Gly Pro Val Pro Val Val Arg Met Phe Gly Val Thr Met
100 105 110
Glu Gly Asn Ser Val Cys Cys His Val His Gly Phe Cys Pro Tyr Phe
115 120 125
Tyr Ile Glu Ala Pro Ser Gln Phe Glu Glu His His Cys Glu Lys Leu
130 135 140
Gln Lys Ala Leu Asp Gln Lys Val Ile Ala Asp Ile Arg Asn Asn Lys
145 150 155 160
Asp Asn Val Gln Glu Ala Val Leu Met Val Glu Leu Val Glu Lys Leu
165 170 175
Asn Ile His Gly Tyr Asn Gly Asp Lys Lys Gln Arg Tyr Ile Lys Ile
180 185 190
Ser Val Thr Leu Pro Arg Phe Val Ala Ala Ala Ser Arg Leu Leu Lys
195 200 205
Lys Glu Val Ile Met Ser Glu Ile Asp Phe Gln Asp Cys Arg Ala Phe
210 215 220
Glu Asn Asn Ile Asp Phe Asp Ile Arg Phe Met Val Asp Thr Asp Val
225 230 235 240
Val Gly Cys Asn Trp Ile Glu Leu Pro Met Gly His Trp Arg Ile Arg
245 250 255
Asn Ser His Ser Lys Pro Leu Pro Glu Ser Arg Cys Gln Ile Glu Val
260 265 270
Asp Val Ala Phe Asp Arg Phe Ile Ser His Glu Pro Glu Gly Glu Trp
275 280 285
Ser Lys Val Ala Pro Phe Arg Ile Leu Ser Phe Asp Ile Glu Cys Ala
290 295 300
Gly Arg Lys Gly Ile Phe Pro Glu Ala Lys Ile Asp Pro Val Ile Gln
305 310 315 320
Ile Ala Asn Met Val Ile Arg Gln Gly Glu Arg Glu Pro Phe Ile Arg
325 330 335
Asn Val Phe Thr Leu Asn Glu Cys Ala Pro Ile Ile Gly Ser Gln Val
340 345 350
Leu Cys His Asp Lys Glu Thr Gln Met Leu Asp Lys Trp Ser Ala Phe
355 360 365
Val Arg Glu Val Asp Pro Asp Ile Leu Thr Gly Tyr Asn Ile Asn Asn
370 375 380
Phe Asp Phe Pro Tyr Leu Leu Asn Arg Ala Ala His Leu Lys Val Arg
385 390 395 400
Asn Phe Glu Tyr Leu Gly Arg Ile Lys Asn Ile Arg Ser Val Ile Lys
405 410 415
Glu Gln Met Leu Gln Ser Lys Gln Met Gly Arg Arg Glu Asn Gln Tyr
420 425 430
Val Asn Phe Glu Gly Arg Val Pro Phe Asp Leu Leu Phe Val Leu Leu
435 440 445
Arg Asp Tyr Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Tyr His
450 455 460
Phe Leu Gln Glu Gln Lys Glu Asp Val His His Ser Ile Ile Thr Asp
465 470 475 480
Leu Gln Asn Gly Asp Glu Gln Thr Arg Arg Arg Ser Ala Met Tyr Cys
485 490 495
Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Lys Leu Met Ala
500 505 510
Ile Val Asn Tyr Met Glu Met Ala Arg Val Thr Gly Val Pro Leu Glu
515 520 525
Ser Leu Leu Thr Arg Gly Gln Gln Ile Lys Val Leu Ser Gln Leu Leu
530 535 540
Arg Lys Ala Lys Thr Lys Gly Phe Ile Met Pro Ser Tyr Thr Ser Gln
545 550 555 560
Gly Ser Asp Glu Gln Tyr Glu Gly Ala Thr Val Ile Glu Pro Lys Arg
565 570 575
Gly Tyr Tyr Ala Asp Pro Ile Ser Thr Leu Asp Phe Ala Ser Leu Tyr
580 585 590
Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Val Leu
595 600 605
Gly Gly Thr Arg Glu Lys Leu Arg Gln Gln Glu Asn Leu Gln Asp Asp
610 615 620
Gln Val Glu Arg Thr Pro Ala Asn Asn Tyr Phe Val Lys Ser Glu Val
625 630 635 640
Arg Arg Gly Leu Leu Pro Glu Ile Leu Glu Ser Leu Leu Ala Ala Arg
645 650 655
Lys Arg Ala Lys Asn Asp Leu Lys Val Glu Thr Asp Pro Phe Lys Arg
660 665 670
Lys Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Ile Ser Ala Asn Ser
675 680 685
Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu Glu
690 695 700
Ile Ser Gly Ser Val Thr Ala Tyr Gly Arg Thr Met Ile Glu Met Thr
705 710 715 720
Lys Asn Glu Val Glu Ser His Tyr Thr Gln Ala Asn Gly Tyr Glu Asn
725 730 735
Asn Ala Val Val Ile Tyr Gly Asp Thr Asp Ser Val Met Val Asn Phe
740 745 750
Gly Val Lys Thr Leu Glu Arg Ser Met Glu Leu Gly Arg Glu Ala Ala
755 760 765
Glu Leu Val Ser Ser Lys Phe Val His Pro Ile Lys Leu Glu Phe Glu
770 775 780
Lys Val Tyr Tyr Pro Tyr Leu Leu Ile Asn Lys Lys Arg Tyr Ala Gly
785 790 795 800
Leu Tyr Phe Thr Arg Pro Asp Thr Tyr Asp Lys Met Asp Cys Lys Gly
805 810 815
Ile Glu Thr Val Arg Arg Asp Asn Ser Pro Leu Val Ala Asn Leu Met
820 825 830
Asn Ser Cys Leu Gln Lys Leu Leu Ile Glu Arg Asp Pro Asp Gly Ala
835 840 845
Val Ala Tyr Val Lys Gln Val Ile Ala Asp Leu Leu Cys Asn Arg Ile
850 855 860
Asp Ile Ser His Leu Val Ile Thr Lys Glu Leu Ala Lys Thr Asp Tyr
865 870 875 880
Ala Ala Lys Gln Ala His Val Glu Leu Ala Ala Lys Met Lys Lys Arg
885 890 895
Asp Pro Gly Thr Ala Pro Lys Leu Gly Asp Arg Val Pro Tyr Val Ile
900 905 910
Cys Ala Ala Ala Lys Asn Thr Pro Ala Tyr Gln Lys Ala Glu Asp Pro
915 920 925
Leu Tyr Val Leu Glu Asn Ser Val Pro Ile Asp Ala Thr Tyr Tyr Leu
930 935 940
Glu Gln Gln Leu Ser Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu
945 950 955 960
Gly Asp Asn Ala Glu Ser Ile Leu Leu Lys Gly Glu His Thr Arg Thr
965 970 975
Arg Thr Val Val Thr Ser Lys Val Gly Gly Leu Ala Gly Phe Met Thr
980 985 990
Lys Lys Thr Ser Cys Leu Gly Cys Lys Ser Leu Met Pro Lys Gly Tyr
995 1000 1005
Glu Gln Ala Cys Leu Cys Pro His Cys Glu Pro Arg Met Ser Glu Leu
1010 1015 1020
Tyr Gln Lys Glu Val Gly Ala Lys Arg Glu Leu Glu Glu Thr Phe Ser
1025 1030 1035 1040
Arg Leu Trp Thr Glu Cys Gln Arg Cys Gln Glu Ser Leu His Glu Glu
1045 1050 1055
Val Ile Cys Ser Asn Arg Asp Cys Pro Ile Phe Tyr Met Arg Gln Lys
1060 1065 1070
Val Arg Met Asp Leu Asp Asn Gln Glu Lys Arg Val Leu Arg Phe Gly
1075 1080 1085
Leu Ala Glu Trp
1090
<210> 65
<211> 9064
<212> DNA
<213> Drosophila melanogaster
<400> 65
ctgcagcttg ggaaaatact tttggacacc ccaaaaaaag ttaagcgcga tattttccca 60
ccgtgaccat gacaaccact gtgcgttcga aaggctctct ctctctctct ctctttcgcg 120
caaatcaaaa acacaaacag gtttatgtgt gcggagagtg tgtgcgacag agagcggcga 180
tatggaactg aaacgactgc aatgttttta tattccggca acgcatttcg cataaattac 240
aaattacaca gcataagtga atgcaagtgc aggggcggca gtcaaatggc cagctgcacc 300
cagaaaaagg gcaataagat tcgggataac aaaacttgat ggcgttcccg attttcccgg 360
acaagggagc gtatatgtat gtacacacaa aaaaaaaact taaccagcct tgcataacga 420
aacacgtgca ataaaaatat gactgattgt caacctctgc tgcaacttaa ttgctgccgc 480
agaggtaaaa ctgaaaaaca taaaaggggg gcgacaagtg cagcaagcga aaaaataaag 540
aactcaaaga gcgcatgcgc gccgctctcc cactctctct ccctctctct ctgtcgctcc 600
actgcgctgg aatcttacaa ctcgtgtagg tgagccggat ttttatgatg atgcgcctgt 660
gtgcgtgact gcatgatgcc attgcagcgg agaactagta gaaaaaagtt cacatttcag 720
cagttggaaa acacatggcc aacaggccaa ctcaagtggc cagcagctgt ccttatattg 780
tcagcaaata ggtcatttaa tgcccattac acgaaaatta tagctaaaat ggtcaagctg 840
tgatgaaata aacataaata ttatatttta tgatttcatc agatttttag catttttttt 900
tttaatttgt gttaggtaga actacaaagc taagaataat tgaggatttc taggtaaaac 960
ttatattctt aaaaccattt aataattttc ttgttttctt ttatttgtag taacatttta 1020
aaattggcgc caaacgtgtt actttacagt gctgtgcaac agccaaatgt cagcattctc 1080
tgcaacgcgt tagcacattt ctgagacgtt tgcagatttt tggcggcaac aagttattta 1140
catttattta ttttatttct gctaaacagc acggaaatgt ccgactccgg caaaggcaaa 1200
gtgctgcaaa atacgggtaa attcgtcagc gagaatcgca cagaaggcgt gagtggtcaa 1260
agttcgtgga tttcacgctg aacaagggat ttttcaatct tatccacagg acgacttctt 1320
caatgaggcg ggctatcgtc aatcccggga gaacgataaa atcgattcga aatatggctt 1380
cgatcgggtt aaggacagcc aggagcggac gggctacctc atcaacatgc attcggtaag 1440
ttaggaagcc cataaaacgt tgaaaatcat atccaataat ggctatgcca attgcagaac 1500
gaagttttgg atgaggacag aagattgatt gctgccttgg acctgttctt catccaaatg 1560
gatggttccc gcttcaaatg cacggtggcc tatcagccat atttactcat ccgaccagag 1620
gataatatgc atctggaagt ggcgcgattt ctgggtcgca agtattccgg ccagatttct 1680
ggactggagc acataaccaa agaagatttg gatctgccca atcatctatc cggtttgcag 1740
cagcagtaca taaaactttc gtttctcaat cagacagcca tgaccaaggt tagaagggaa 1800
ctcatgtccg cggtgaagag aaatcaggag cgacagaaat ccaacacata ctacatgcaa 1860
atgctggcca cctcgctggc ccaatcctcc gcaggttccg aggatgccac attgggtaag 1920
aggcagcagg attacatgga ttgtattgtg gacataaggg agcatgatgt gccttaccac 1980
gtcagagtgt ccatcgattt gcgcatcttt tgtggacagt ggtacaatat caggtgcaga 2040
agtggcgtgg aattgcctac gatcacctgc cgaccggata ttctggacag acccgaaccc 2100
gtggtcctgg cctttgatat agaaaccact aagctgcccc ttaagtttcc cgatgcccag 2160
acggatcagg ttatgatgat ctcgtacatg atcgatggtc agggttatct gataaccaat 2220
cgtgagatta tatcatccaa tgtggacgat tttgagtaca ctcccaagcc ggaattcgag 2280
ggtaacttta tagtattcaa cgaagagaac gagatgcagc tgctccagcg cttcttcgat 2340
cacatcatgg aggtgcgtcc ccacatcatt gttacataca acggcgactt cttcgattgg 2400
cccttcgtgg agacgcgtgc tgcagtgtac gatctggaca tgaagcaaga gattggcttc 2460
tccaagctac gggatggcaa ttatctaagt cgccctgcca tacacatgga ttgcctatgt 2520
tgggtgaaac gagattctta tttacctgtt ggatctcaag gcttaaaggc ggtggccaag 2580
gctaaattac gctatgatcc tgtggaactc gatccggagg atatgtgccg catggccgtg 2640
gaacagcccc aagtgctggc caattactct gtatccgatg cggtggccac atactatctg 2700
tacatgaagt atgtgcatcc atttatcttc gccctaaata cgattattcc catggaaccc 2760
gatgagatcc taagaaaggg ttccggcaca ctctgtgaaa cgttgctgat ggtggaggct 2820
taccatgccc agattgtgta tcccaacaag catcagagtg agctgaataa gctctccaac 2880
gagggacacg tactggattc ggaaacctat gtgggtggtc atgtggaggc tttggaatcg 2940
ggtgttttcc gggcggacat accatgccgt tttcgtctag atcctgctat ggtcaagcaa 3000
ctgcaggagc aggttgatgc agttctgcgc cacgctatcg aagtggagga aggcataccg 3060
ctcgagaagg tcttgaatct ggatgaagtg cggcaggaga ttgtgcaggg gctacagggt 3120
ctgcacgata tacccaatcg cttggagcag ccggtcatct atcacttgga tgtgggtgcc 3180
atgtacccca acattatttt gaccaatcgc ctgcagccct cggcaatggt tagtgactta 3240
gattgtgccg cctgtgactt caacaagcca ggagttcggt gcaaacgttc catggactgg 3300
ttgtggcgcg gcgagatgtt gcccgcctcc aggaacgagt ttcagcgcat tcagcagcag 3360
ctggagaccg agaagtttcc accccttttc cctggcggac cacagcgagc ctttcacgag 3420
ctctccaagg aggatcaggc ggcgtacgag aagaaacgtc tgacggatta ctgccgcaag 3480
gcttacaaga agaccaagct aaccaaattg gaaacgcgca cttcgaccat ctgccagaag 3540
gagaacagct tctatgtgga cacggtgcga gcttttcgcg atcgtcgcta cgagtacaaa 3600
ggactaacca aagtggcaaa agcatcggtg aatgctgcgg tggcttcggg agacgcggca 3660
gagatcaagg cagccaaggg cagggaggtg ctctacgatt ccctgcagtt ggcccacaag 3720
tgcatcctga actccttcta tggctacgtg atgaggagag gagcccgttg gcattccatg 3780
cctatggccg gcattgtgtg cctcacgggc tcgaatatta tcaccaaggc gagggaaatt 3840
atcgagcgag ttggtcgacc actcgaattg gacactgatg gtatatggtg catattgcct 3900
ggctcctttc cgcaggagtt taccattcac acgagtcatg agaagaaaaa gaagattaac 3960
atatcatatc cgaatgcagt gctaaacact atggttaaag atcattttac caacgatcag 4020
taccacgagt tgaggaagga taaggaaaac aatctaccca aatacgatat tcgagatgag 4080
aactctatat tcttcgaggt ggatggaccc taccttgcca tggtgttacc cgctgccaaa 4140
gaggagggca agaagctgaa gaaaagatat gcggtcttta atttcgatgg cacactggct 4200
gaactcaagg gattcgaggt gaagcgacgc ggtgaactgc agctgatcaa aaatttccag 4260
agttccgtct tcgaagcttt cctcgctggt agcacacttg aggaatgcta tgcatctgtg 4320
gccaaggtgg cggattactg gcttgatgta ctctacagca gaggatcaaa tctacccgac 4380
tcggagctat tcgaacttat ttcggagaac aagagcatgt ccaagaagct tgaggagtat 4440
ggcgcccaaa agagtacgtc catctccacg gccaagcgat tggctgagtt cctgggcgag 4500
cagatggtaa aggatgcggg tctggcttgt aagtacatta tttcgaagaa acccgaagga 4560
gcacccgtca ccgagagagc tattcccttg gccattttcc aatccgaacc gagcgtgagg 4620
cgacatcacc tgcgtcgctg gcttaaggac aacaccatgg gcgatgcgga tatacgcgat 4680
gtgctcgatt ggaactacta catagagaga ttgggtggga ccattcagaa gatcataacc 4740
ataccggcgg cactgcaggg actggccaat ccagtgccca gagttcagca tccggattgg 4800
ttgcacaaga aaatgctgga gaagaacgat gtgctcaagc agcgtcgcat caatgagatg 4860
ttcaccagca gacccaaacc gaaacctcta gccacagagg aggacaagct ggccgatatg 4920
gaagatttgg ctggtaaaga tggcggtgag ggtgctgcag gctgtccgat agtcaccaag 4980
agaaagagaa tccagctgga ggagcacgat gaggaggagg cacagccgca ggccaccact 5040
tggcgtcagg ccttgggcgc tccaccgccc atcggtgaaa ccagaaagac catcgttgag 5100
tgggtgagat ttcagaagaa gaaatggaaa tggcagcagg atcagcgcca gcgtaatcgc 5160
caggcgagca agcgaactcg aggcgaggat ccacgctaca ctgggcggtt ccttagacgt 5220
gcacaacgca ccctgttgga ccagccgtgg cagatcgtac agttggtgcc cgtcgacgac 5280
ctgggccact tcactgtgtg ggccttaatc ggcgaagagt tgcacaagat caagttgacg 5340
gtaccgagga ttttctatgt taatcagcga agtgctgctc ctccagagga gggtcaactt 5400
tggcgcaagg tcaatcgagt tctgccacga tccagacctg ttttcaatct ctatcgatat 5460
agtgtgcccg aacagctctt ccgggataac tcgctgggca tgctggcgga tctggcgacg 5520
cccgacattg agggcatata cgagacgcag atgacgttgg aatttcgcgc cctcatggac 5580
atgggctgca tttgcggtgt ccagcgcgag gaggcacgtc gcttggccca attggccacc 5640
aaggatctgg aaacatttag catcgagcag ctggaacagg gccccagact caggtcaaat 5700
atttggctag cgccaacaat cgattgcgca aaatctactt gtatcagcat aacacaccga 5760
cggccaagaa ggagatctgt gtcactgatc ccaatgccta gcaagaaggc atttgttttt 5820
gccttggaca cagtgcgtgc caatcaaatg ccgaacatga ggcaattgta taccgccgag 5880
cgtttggccc tgctcaagaa tctgacggca gaggagcaag ataaaattcc tgtagaggat 5940
tacacatttg aggttctcat tgaggtggat gtcaaacaaa tttaccggca catacagcgg 6000
gcactgacca cctacaaaca ggagcatcag ggaccaccca ccattctgtg ccttcaaacg 6060
gcgctgtcgg cgcgtaaact cagcctggcc atgccgatcc tgctggagtt tccccaggct 6120
cagattcata tctccgatga cgctagtttg ctttctggcc ttgattggca gcgacagggc 6180
tccagggcag tgatacgcca ctttctgaat ctgaacaatg ttcttgattt gatgttggat 6240
cagtgtcgct actttcatgt gcccattggc aatatgccgc cggatactgt gcttttcgga 6300
gcggatcttt tcttcgctcg cttgctgcag cggcataact ttgtgctgtg gtggtcggcg 6360
agtaccagac cagatttggg tggccgggag gcggacgaca gccggctgtt ggcggaattc 6420
gaggagagca ttagtgtggt gcaaaacaag gccggtttct atccggatgt ttgcgtggag 6480
ctggctctgg atagcctggc ggtgagtgcc ctgctccaat cgactaggat tcaggaaatg 6540
gaaggcgcct catctgccat tacgttcgat gtgatgccgc aggtctcgct ggaggagatg 6600
attggcactg ttccggcggc caccttgccg agttatgatg aaacggccct ctgttccgcc 6660
gccttccgcg ttatgcgctc catggtgaat ggttggttgc gagaggtatc catcaatagg 6720
aacatcttct cggacttcca gatcgtgcac ttctatcgat gggtgcgctc cagtaatgca 6780
ctactctatg atcctgcttt gagaagatct ctgaataatc tgatgaggaa gatgttcttg 6840
cgcattatag cagagttcaa gagattgggc gccaccatta tctatgcgga ctttaacagg 6900
attatcctta gttcgggtaa gaaaaccgtt tccgatgccc tgggctatgt ggactacatt 6960
gtgcaaagct tgaggaacaa ggagatgttc cactccatcc aactgagctt cgagcaatgc 7020
tggaacttta tgctctggat ggaccaggca aatttctcgg gaattagggg aaagctacca 7080
aagggaatcg atgagacagt gtcgtcaata gtttccacta ccatgatacg ggattctgaa 7140
cgcaatcaag atgacgacga ggatgaagaa gaggattcgg aaaaccgtga tccagtggag 7200
agcaacgagg ccgagcagga tcaagaggat gagctgtccc tggagctcaa ctggacaatt 7260
ggcgaacatc tgcccgatga aaacgagtgc cgcgaaaagt ttgaatccct gctgaccctc 7320
tttatgcaat ctttggccga aaagaagacc accgagcagg ccatcaagga tatctcgcac 7380
tgcgcgttcg actttatcct gaaactgcac aaaaactacg gcaagggcaa gcccagcccg 7440
ggcctagaac ttatccgcac tctgatcaag gcgttgagtg tggacaaaac gctggcggag 7500
cagatcaacg agttgcgccg aaatatgctg cgtctggtgg ggattggtga gttctcggac 7560
ttggctgagt gggaggatcc ctgcgacagt cacatcatca acgaggtcat ctgcaaagcg 7620
tgtaatcact gcagggacct ggatctctgc aaggacaagc atcgcgccat gaaagatgga 7680
gtgtgagtta cacaaatcag tacacataat ttaccacaaa taattgatta atgttggatt 7740
tttcagaccc gtttggctgt gtgcccagtg ctatgtggcc tatgataacg aggagatcga 7800
aatgagaatg ctggatgcac tgcagcgcaa gatgatgtcc tatgtgctgc aggatttgcg 7860
ctgttcgcgc tgcagcgaga tcaagcgcga gaatctggca gagttctgca cttgcgctgg 7920
caactttgtg cccctcatca gcgggaagga catccagaca ctgctgggca cattcaacaa 7980
ggtggctgcc aaccacaaga tgcagttgct ccagcagact gttcatcagg cgctgaccac 8040
gccacgctag gacctagttt gttgttgttt tctagatcgt agggcttaaa tatattgtat 8100
ttataatgga atttaattcg attttaatga gttttgagtt tatgatgtcg cacaagacga 8160
atgtctgtgt taaggaatgg acgcgcttta taattcaatg agattcacac acttttagtg 8220
gctttcgcat acgaatcgct tgttgttttc ccgattttat tggttttttt tgttgacttg 8280
cccgcggttt ttgggggcgc acaggcgaaa tcagcagctg aacttaaagc aattagacta 8340
actcattcgc gaagagcgat ctctactgtg gggcctgggt gatgggatcg accttaacat 8400
cggggaactg gaattcgggg aacttcagca tgtcggtctt gccatcgctg ccaaactgct 8460
tggccacacg gtccagttcg gtcttcagct cccgctcaat atcgggattg gagtccacca 8520
gcttgccacc gctgcaggtg agcaaaacaa ggattatgtc gaggcacacc aacggatgaa 8580
ggagccagaa cttacgcgct cttctgcttg tactcgcgca ctttgtccag aaacagctgc 8640
tggatgggat cggaggcctt gttcagggca ggggcaacga ttccgaagtt acgacgggcc 8700
tctgtgcgca ggacacgcat gccactcagc agggattgcg acagcatctg gaattgatag 8760
atccatgtta gaatagcaat aaacggcctt cttcatatgt aaccttaaaa aggttatgta 8820
atacaattgt ttgtttcgac gtttcccaat cggttttcaa gccgactttg ctagcaacta 8880
tatcttgtat tcaaattgta ttccctcaat cgatttttat gtattttaaa tcttgttttc 8940
accttatttt cctttgcaaa tgctaacttt cgtgcggaaa agtgacaatt gtcagttcac 9000
aatggcagtt ggtgttagtg atgtgcgcgt gatgggtgta tgcgatacta tcgtatgtaa 9060
gctt 9064
<210> 66
<211> 2220
<212> PRT
<213> Drosophila melanogaster
<400> 66
Met Ser Asp Ser Gly Lys Gly Lys Val Leu Gln Asn Thr Gly Lys Phe
1 5 10 15
Val Ser Glu Asn Arg Thr Glu Gly Asp Asp Phe Phe Asn Glu Ala Gly
20 25 30
Tyr Arg Gln Ser Arg Glu Asn Asp Lys Ile Asp Ser Lys Tyr Gly Phe
35 40 45
Asp Arg Val Lys Asp Ser Gln Glu Arg Thr Gly Tyr Leu Ile Asn Met
50 55 60
His Ser Asn Glu Val Leu Asp Glu Asp Arg Arg Leu Ile Ala Ala Leu
65 70 75 80
Asp Leu Phe Phe Ile Gln Met Asp Gly Ser Arg Phe Lys Cys Thr Val
85 90 95
Ala Tyr Gln Pro Tyr Leu Leu Ile Arg Pro Glu Asp Asn Met His Leu
100 105 110
Glu Val Ala Arg Phe Leu Gly Arg Lys Tyr Ser Gly Gln Ile Ser Gly
115 120 125
Leu Glu His Ile Thr Lys Glu Asp Leu Asp Leu Pro Asn His Leu Ser
130 135 140
Gly Leu Gln Gln Gln Tyr Ile Lys Leu Ser Phe Leu Asn Gln Thr Ala
145 150 155 160
Met Thr Lys Val Arg Arg Glu Leu Met Ser Ala Val Lys Arg Asn Gln
165 170 175
Glu Arg Gln Lys Ser Asn Thr Tyr Tyr Met Gln Met Leu Ala Thr Ser
180 185 190
Leu Ala Gln Ser Ser Ala Gly Ser Glu Asp Ala Thr Leu Gly Lys Arg
195 200 205
Gln Gln Asp Tyr Met Asp Cys Ile Val Asp Ile Arg Glu His Asp Val
210 215 220
Pro Tyr His Val Arg Val Ser Ile Asp Leu Arg Ile Phe Cys Gly Gln
225 230 235 240
Trp Tyr Asn Ile Arg Cys Arg Ser Gly Val Glu Leu Pro Thr Ile Thr
245 250 255
Cys Arg Pro Asp Ile Leu Asp Arg Pro Glu Pro Val Val Leu Ala Phe
260 265 270
Asp Ile Glu Thr Thr Lys Leu Pro Leu Lys Phe Pro Asp Ala Gln Thr
275 280 285
Asp Gln Val Met Met Ile Ser Tyr Met Ile Asp Gly Gln Gly Tyr Leu
290 295 300
Ile Thr Asn Arg Glu Ile Ile Ser Ser Asn Val Asp Asp Phe Glu Tyr
305 310 315 320
Thr Pro Lys Pro Glu Phe Glu Gly Asn Phe Ile Val Phe Asn Glu Glu
325 330 335
Asn Glu Met Gln Leu Leu Gln Arg Phe Phe Asp His Ile Met Glu Val
340 345 350
Arg Pro His Ile Ile Val Thr Tyr Asn Gly Asp Phe Phe Asp Trp Pro
355 360 365
Phe Val Glu Thr Arg Ala Ala Val Tyr Asp Leu Asp Met Lys Gln Glu
370 375 380
Ile Gly Phe Ser Lys Leu Arg Asp Gly Asn Tyr Leu Ser Arg Pro Ala
385 390 395 400
Ile His Met Asp Cys Leu Cys Trp Val Lys Arg Asp Ser Tyr Leu Pro
405 410 415
Val Gly Ser Gln Gly Leu Lys Ala Val Ala Lys Ala Lys Leu Arg Tyr
420 425 430
Asp Pro Val Glu Leu Asp Pro Glu Asp Met Cys Arg Met Ala Val Glu
435 440 445
Gln Pro Gln Val Leu Ala Asn Tyr Ser Val Ser Asp Ala Val Ala Thr
450 455 460
Tyr Tyr Leu Tyr Met Lys Tyr Val His Pro Phe Ile Phe Ala Leu Asn
465 470 475 480
Thr Ile Ile Pro Met Glu Pro Asp Glu Ile Leu Arg Lys Gly Ser Gly
485 490 495
Thr Leu Cys Glu Thr Leu Leu Met Val Glu Ala Tyr His Ala Gln Ile
500 505 510
Val Tyr Pro Asn Lys His Gln Ser Glu Leu Asn Lys Leu Ser Asn Glu
515 520 525
Gly His Val Leu Asp Ser Glu Thr Tyr Val Gly Gly His Val Glu Ala
530 535 540
Leu Glu Ser Gly Val Phe Arg Ala Asp Ile Pro Cys Arg Phe Arg Leu
545 550 555 560
Asp Pro Ala Met Val Lys Gln Leu Gln Glu Gln Val Asp Ala Val Leu
565 570 575
Arg His Ala Ile Glu Val Glu Glu Gly Ile Pro Leu Glu Lys Val Leu
580 585 590
Asn Leu Asp Glu Val Arg Gln Glu Ile Val Gln Gly Leu Gln Gly Leu
595 600 605
His Asp Ile Pro Asn Arg Leu Glu Gln Pro Val Ile Tyr His Leu Asp
610 615 620
Val Gly Ala Met Tyr Pro Asn Ile Ile Leu Thr Asn Arg Leu Gln Pro
625 630 635 640
Ser Ala Met Val Ser Asp Leu Asp Cys Ala Ala Cys Asp Phe Asn Lys
645 650 655
Pro Gly Val Arg Cys Lys Arg Ser Met Asp Trp Leu Trp Arg Gly Glu
660 665 670
Met Leu Pro Ala Ser Arg Asn Glu Phe Gln Arg Ile Gln Gln Gln Leu
675 680 685
Glu Thr Glu Lys Phe Pro Pro Leu Phe Pro Gly Gly Pro Gln Arg Ala
690 695 700
Phe His Glu Leu Ser Lys Glu Asp Gln Ala Ala Tyr Glu Lys Lys Arg
705 710 715 720
Leu Thr Asp Tyr Cys Arg Lys Ala Tyr Lys Lys Thr Lys Leu Thr Lys
725 730 735
Leu Glu Thr Arg Thr Ser Thr Ile Cys Gln Lys Glu Asn Ser Phe Tyr
740 745 750
Val Asp Thr Val Arg Ala Phe Arg Asp Arg Arg Tyr Glu Tyr Lys Gly
755 760 765
Leu Thr Lys Val Ala Lys Ala Ser Val Asn Ala Ala Val Ala Ser Gly
770 775 780
Asp Ala Ala Glu Ile Lys Ala Ala Lys Gly Arg Glu Val Leu Tyr Asp
785 790 795 800
Ser Leu Gln Leu Ala His Lys Cys Ile Leu Asn Ser Phe Tyr Gly Tyr
805 810 815
Val Met Arg Arg Gly Ala Arg Trp His Ser Met Pro Met Ala Gly Ile
820 825 830
Val Cys Leu Thr Gly Ser Asn Ile Ile Thr Lys Ala Arg Glu Ile Ile
835 840 845
Glu Arg Val Gly Arg Pro Leu Glu Leu Asp Thr Asp Gly Ile Trp Cys
850 855 860
Ile Leu Pro Gly Ser Phe Pro Gln Glu Phe Thr Ile His Thr Ser His
865 870 875 880
Glu Lys Lys Lys Lys Ile Asn Ile Ser Tyr Pro Asn Ala Val Leu Asn
885 890 895
Thr Met Val Lys Asp His Phe Thr Asn Asp Gln Tyr His Glu Leu Arg
900 905 910
Lys Asp Lys Glu Asn Asn Leu Pro Lys Tyr Asp Ile Arg Asp Glu Asn
915 920 925
Ser Ile Phe Phe Glu Val Asp Gly Pro Tyr Leu Ala Met Val Leu Pro
930 935 940
Ala Ala Lys Glu Glu Gly Lys Lys Leu Lys Lys Arg Tyr Ala Val Phe
945 950 955 960
Asn Phe Asp Gly Thr Leu Ala Glu Leu Lys Gly Phe Glu Val Lys Arg
965 970 975
Arg Gly Glu Leu Gln Leu Ile Lys Asn Phe Gln Ser Ser Val Phe Glu
980 985 990
Ala Phe Leu Ala Gly Ser Thr Leu Glu Glu Cys Tyr Ala Ser Val Ala
995 1000 1005
Lys Val Ala Asp Tyr Trp Leu Asp Val Leu Tyr Ser Arg Gly Ser Asn
1010 1015 1020
Leu Pro Asp Ser Glu Leu Phe Glu Leu Ile Ser Glu Asn Lys Ser Met
1025 1030 1035 1040
Ser Lys Lys Leu Glu Glu Tyr Gly Ala Gln Lys Ser Thr Ser Ile Ser
1045 1050 1055
Thr Ala Lys Arg Leu Ala Glu Phe Leu Gly Glu Gln Met Val Lys Asp
1060 1065 1070
Ala Gly Leu Ala Cys Lys Tyr Ile Ile Ser Lys Lys Pro Glu Gly Ala
1075 1080 1085
Pro Val Thr Glu Arg Ala Ile Pro Leu Ala Ile Phe Gln Ser Glu Pro
1090 1095 1100
Ser Val Arg Arg His His Leu Arg Arg Trp Leu Lys Asp Asn Thr Met
1105 1110 1115 1120
Gly Asp Ala Asp Ile Arg Asp Val Leu Asp Trp Asn Tyr Tyr Ile Glu
1125 1130 1135
Arg Leu Gly Gly Thr Ile Gln Lys Ile Ile Thr Ile Pro Ala Ala Leu
1140 1145 1150
Gln Gly Leu Ala Asn Pro Val Pro Arg Val Gln His Pro Asp Trp Leu
1155 1160 1165
His Lys Lys Met Leu Glu Lys Asn Asp Val Leu Lys Gln Arg Arg Ile
1170 1175 1180
Asn Glu Met Phe Thr Ser Arg Pro Lys Pro Lys Pro Leu Ala Thr Glu
1185 1190 1195 1200
Glu Asp Lys Leu Ala Asp Met Glu Asp Leu Ala Gly Lys Asp Gly Gly
1205 1210 1215
Glu Gly Ala Ala Gly Cys Pro Ile Val Thr Lys Arg Lys Arg Ile Gln
1220 1225 1230
Leu Glu Glu His Asp Glu Glu Glu Ala Gln Pro Gln Ala Thr Thr Trp
1235 1240 1245
Arg Gln Ala Leu Gly Ala Pro Pro Pro Ile Gly Glu Thr Arg Lys Thr
1250 1255 1260
Ile Val Glu Trp Val Arg Phe Gln Lys Lys Lys Trp Lys Trp Gln Gln
1265 1270 1275 1280
Asp Gln Arg Gln Arg Asn Arg Gln Ala Ser Lys Arg Thr Arg Gly Glu
1285 1290 1295
Asp Pro Arg Tyr Thr Gly Arg Phe Leu Arg Arg Ala Gln Arg Thr Leu
1300 1305 1310
Leu Asp Gln Pro Trp Gln Ile Val Gln Leu Val Pro Val Asp Asp Leu
1315 1320 1325
Gly His Phe Thr Val Trp Ala Leu Ile Gly Glu Glu Leu His Lys Ile
1330 1335 1340
Lys Leu Thr Val Pro Arg Ile Phe Tyr Val Asn Gln Arg Ser Ala Ala
1345 1350 1355 1360
Pro Pro Glu Glu Gly Gln Leu Trp Arg Lys Val Asn Arg Val Leu Pro
1365 1370 1375
Arg Ser Arg Pro Val Phe Asn Leu Tyr Arg Tyr Ser Val Pro Glu Gln
1380 1385 1390
Leu Phe Arg Asp Asn Ser Leu Gly Met Leu Ala Asp Leu Ala Thr Pro
1395 1400 1405
Asp Ile Glu Gly Ile Tyr Glu Thr Gln Met Thr Leu Glu Phe Arg Ala
1410 1415 1420
Leu Met Asp Met Gly Cys Ile Cys Gly Val Gln Arg Glu Glu Ala Arg
1425 1430 1435 1440
Arg Leu Ala Gln Leu Ala Thr Lys Asp Leu Glu Thr Phe Ser Ile Glu
1445 1450 1455
Gln Leu Glu Gln Gly Pro Arg Leu Arg Ser Asn Ile Trp Leu Ala Pro
1460 1465 1470
Thr Ile Asp Cys Ala Lys Ser Thr Cys Ile Ser Ile Thr His Arg Arg
1475 1480 1485
Pro Arg Arg Arg Ser Val Ser Leu Ile Pro Met Pro Ser Lys Lys Ala
1490 1495 1500
Phe Val Phe Ala Leu Asp Thr Val Arg Ala Asn Gln Met Pro Asn Met
1505 1510 1515 1520
Arg Gln Leu Tyr Thr Ala Glu Arg Leu Ala Leu Leu Lys Asn Leu Thr
1525 1530 1535
Ala Glu Glu Gln Asp Lys Ile Pro Val Glu Asp Tyr Thr Phe Glu Val
1540 1545 1550
Leu Ile Glu Val Asp Val Lys Gln Ile Tyr Arg His Ile Gln Arg Ala
1555 1560 1565
Leu Thr Thr Tyr Lys Gln Glu His Gln Gly Pro Pro Thr Ile Leu Cys
1570 1575 1580
Leu Gln Thr Ala Leu Ser Ala Arg Lys Leu Ser Leu Ala Met Pro Ile
1585 1590 1595 1600
Leu Leu Glu Phe Pro Gln Ala Gln Ile His Ile Ser Asp Asp Ala Ser
1605 1610 1615
Leu Leu Ser Gly Leu Asp Trp Gln Arg Gln Gly Ser Arg Ala Val Ile
1620 1625 1630
Arg His Phe Leu Asn Leu Asn Asn Val Leu Asp Leu Met Leu Asp Gln
1635 1640 1645
Cys Arg Tyr Phe His Val Pro Ile Gly Asn Met Pro Pro Asp Thr Val
1650 1655 1660
Leu Phe Gly Ala Asp Leu Phe Phe Ala Arg Leu Leu Gln Arg His Asn
1665 1670 1675 1680
Phe Val Leu Trp Trp Ser Ala Ser Thr Arg Pro Asp Leu Gly Gly Arg
1685 1690 1695
Glu Ala Asp Asp Ser Arg Leu Leu Ala Glu Phe Glu Glu Ser Ile Ser
1700 1705 1710
Val Val Gln Asn Lys Ala Gly Phe Tyr Pro Asp Val Cys Val Glu Leu
1715 1720 1725
Ala Leu Asp Ser Leu Ala Val Ser Ala Leu Leu Gln Ser Thr Arg Ile
1730 1735 1740
Gln Glu Met Glu Gly Ala Ser Ser Ala Ile Thr Phe Asp Val Met Pro
1745 1750 1755 1760
Gln Val Ser Leu Glu Glu Met Ile Gly Thr Val Pro Ala Ala Thr Leu
1765 1770 1775
Pro Ser Tyr Asp Glu Thr Ala Leu Cys Ser Ala Ala Phe Arg Val Met
1780 1785 1790
Arg Ser Met Val Asn Gly Trp Leu Arg Glu Val Ser Ile Asn Arg Asn
1795 1800 1805
Ile Phe Ser Asp Phe Gln Ile Val His Phe Tyr Arg Trp Val Arg Ser
1810 1815 1820
Ser Asn Ala Leu Leu Tyr Asp Pro Ala Leu Arg Arg Ser Leu Asn Asn
1825 1830 1835 1840
Leu Met Arg Lys Met Phe Leu Arg Ile Ile Ala Glu Phe Lys Arg Leu
1845 1850 1855
Gly Ala Thr Ile Ile Tyr Ala Asp Phe Asn Arg Ile Ile Leu Ser Ser
1860 1865 1870
Gly Lys Lys Thr Val Ser Asp Ala Leu Gly Tyr Val Asp Tyr Ile Val
1875 1880 1885
Gln Ser Leu Arg Asn Lys Glu Met Phe His Ser Ile Gln Leu Ser Phe
1890 1895 1900
Glu Gln Cys Trp Asn Phe Met Leu Trp Met Asp Gln Ala Asn Phe Ser
1905 1910 1915 1920
Gly Ile Arg Gly Lys Leu Pro Lys Gly Ile Asp Glu Thr Val Ser Ser
1925 1930 1935
Ile Val Ser Thr Thr Met Ile Arg Asp Ser Glu Arg Asn Gln Asp Asp
1940 1945 1950
Asp Glu Asp Glu Glu Glu Asp Ser Glu Asn Arg Asp Pro Val Glu Ser
1955 1960 1965
Asn Glu Ala Glu Gln Asp Gln Glu Asp Glu Leu Ser Leu Glu Leu Asn
1970 1975 1980
Trp Thr Ile Gly Glu His Leu Pro Asp Glu Asn Glu Cys Arg Glu Lys
1985 1990 1995 2000
Phe Glu Ser Leu Leu Thr Leu Phe Met Gln Ser Leu Ala Glu Lys Lys
2005 2010 2015
Thr Thr Glu Gln Ala Ile Lys Asp Ile Ser His Cys Ala Phe Asp Phe
2020 2025 2030
Ile Leu Lys Leu His Lys Asn Tyr Gly Lys Gly Lys Pro Ser Pro Gly
2035 2040 2045
Leu Glu Leu Ile Arg Thr Leu Ile Lys Ala Leu Ser Val Asp Lys Thr
2050 2055 2060
Leu Ala Glu Gln Ile Asn Glu Leu Arg Arg Asn Met Leu Arg Leu Val
2065 2070 2075 2080
Gly Ile Gly Glu Phe Ser Asp Leu Ala Glu Trp Glu Asp Pro Cys Asp
2085 2090 2095
Ser His Ile Ile Asn Glu Val Ile Cys Lys Ala Cys Asn His Cys Arg
2100 2105 2110
Asp Leu Asp Leu Cys Lys Asp Lys His Arg Ala Met Lys Asp Gly Cys
2115 2120 2125
Tyr Val Ala Tyr Asp Asn Glu Glu Ile Glu Met Arg Met Leu Asp Ala
2130 2135 2140
Leu Gln Arg Lys Met Met Ser Tyr Val Leu Gln Asp Leu Arg Cys Ser
2145 2150 2155 2160
Arg Cys Ser Glu Ile Lys Arg Glu Asn Leu Ala Glu Phe Cys Thr Cys
2165 2170 2175
Ala Gly Asn Phe Val Pro Leu Ile Ser Gly Lys Asp Ile Gln Thr Leu
2180 2185 2190
Leu Gly Thr Phe Asn Lys Val Ala Ala Asn His Lys Met Gln Leu Leu
2195 2200 2205
Gln Gln Thr Val His Gln Ala Leu Thr Thr Pro Arg
2210 2215 2220
<210> 67
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 67
gactagtggc tatcttgtgg cgggaa 26
<210> 68
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 68
ggaattcctt gtcccgtgtc aggtca 26
<210> 69
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 69
cagaactttg ccctcccata cctc 24
<210> 70
<211> 3318
<212> DNA
<213> Mus musculus
<400> 70
atggattgta agcggcgaca aggaccaggc cctggggtgc ccccaaagcg ggctcgaggg 60
cacctctggg atgaggacga gccttcgccg tcgcagtttg aggcgaacct ggcactgctg 120
gaggaaatag aggctgagaa ccggctgcag gaggcagagg aggagctgca gctgccccca 180
gagggcaccg tgggtgggca gttttccact gcagacattg accctcggtg gcggcggccc 240
accctacgtg ccctggaccc cagcacggag cccctcatct tccagcagct ggagattgac 300
cactatgtgg gctcagcacc acccctgcca gaagggcccc tgccatcccg gaactcagtg 360
cccatactga gggcctttgg ggtcaccgat gaaggcttct ccgtctgctg ccacatacag 420
ggctttgccc cctacttcta cacccccgcg cctcctggtt ttggggccga gcacctgagt 480
gagctgcagc aggagctgaa cgcagccatc agccgggacc agcgcggtgg gaaggagctc 540
tcagggccgg cagtgctggc aatagagcta tgctcccgtg agagcatgtt tgggtaccac 600
ggtcatggcc cttctccatt tctccgcatc accctggcac taccccgcct tatggcacca 660
gcccgccgcc ttctggaaca gggtgtccga gtgccaggcc tgggcacccc gagcttcgca 720
ccctacgaag ccaacgtgga ctttgagatc cggttcatgg tggatgctga cattgtggga 780
tgcaactggt tggagctgcc agctggaaag tacgttcgga gggcggagaa gaaggccacc 840
ctgtgtcagc tggaggtgga cgtgctgtgg tcagatgtga tcagtcaccc accggagggg 900
cagtggcagc gcattgcacc cctgcgtgtg cttagcttcg acatcgagtg tgctggccga 960
aaaggcatct tccctgagcc tgagcgtgac cccgtgatcc agatctgttc tctggggctg 1020
cgctgggggg agccggagcc attcttgcgt ctggcactca cgctgcggcc ctgtgccccc 1080
atcctgggtg ccaaagtgca gagctatgag cgggaagaag acctgctcca ggcctgggcc 1140
gacttcatcc ttgccatgga ccctgacgtg atcaccggct acaacattca gaactttgcc 1200
ctcccatacc tcatctctcg ggcacaggcc ctaaaggtgg accgcttccc tttcctgggc 1260
cgcgtgactg gtctccgctc caacatccgt gactcctcct tccaatcaag gcaggtcggc 1320
cggcgggaca gtaaggtgat cagcatggtg ggtcgcgttc agatggatat gctgcaggtg 1380
ctgcttcggg aacacaagct ccgctcctac acgctcaacg ctgtgagttt ccacttcctg 1440
ggcgagcaga aggaggacgt tcagcacagc atcatcaccg acctgcagaa tgggaacgaa 1500
cagacgcgcc gccgcctggc cgtgtactgc ctgaaggacg cctttctgcc actccgacta 1560
ctagagcgcc ttatggtgct ggtgaataat gtggagatgg cgcgtgtcac gggtgtaccc 1620
cttgggtacc tgctcacccg gggccagcag gtcaaggtcg tgtctcagct gctgcgccag 1680
gccatgcgcc aggggctgct gatgcctgtg gtgaagaccg agggcagtga ggactacacg 1740
ggagccacag tcattgagcc cctcaaaggg tactatgacg tccccattgc caccctggac 1800
ttctcctcct tgtacccatc catcatgatg gcccataatc tgtgctacac cacgctgctc 1860
cgacctgggg ctgcccagaa gctgggcctt aaaccagatg agttcatcaa gacacccact 1920
ggggatgagt ttgtgaagtc atctgtacgg aagggcctcc tgccccagat cctggagaat 1980
ctgctgagtg cccgcaagag ggccaaggct gagctggctc aggagacgga ccccctgcgg 2040
cgacaggtct tggacggccg gcaactggca ctaaaagtga gtgccaactc cgtatatggc 2100
ttcactggtg cccaggtggg caagctgcca tgtttggaga tctcccagag tgtcactggg 2160
ttcgggcggc agatgattga gaaaaccaag cagcttgtgg agtccaagta caccgtggaa 2220
aatggctacg atgccaacgc caaggtagtc tacggtgaca cggactctgt gatgtgccgg 2280
tttggcgtct cctctgtggc tgaagcaatg tctctggggc gggaggctgc aaactgggta 2340
tccagtcact tcccatcacc catccggctg gagttcgaga aggtttactt cccatacctg 2400
ctcatcagca agaagcgcta tgctggcctg ctcttctcct cccgctctga tgcccatgac 2460
aaaatggact gcaagggcct ggaggctgtg cgcagggaca actgtcccct ggtggccaac 2520
ctcgttacat cctctctgcg ccggatcctc gtggaccggg accctgatgg ggcagtagcc 2580
catgccaagg acgtcatctc ggacctgctg tgcaaccgca tagacatctc ccagctggtc 2640
atcaccaaag agttgacccg cgcagcagca gactatgctg gcaagcaggc tcacgtggag 2700
ctggctgaga ggatgaggaa gcgcgacccc ggcagtgcgc ccagcctggg tgaccgagtc 2760
ccctatgtga tcattggtgc tgctaagggt gtggccgcct acatgaagtc ggaggacccc 2820
ctgtttgtgc tggagcacag cctgcccatc gacactcagt actacctgga gcagcagctg 2880
gccaagccgc tcttgcgcat ctttgagccc atcctgggtg agggccgtgc agagtctgtg 2940
ctgctgcgcg gtgaccacac acgatgcaag actgtgctca ccagcaaggt gggcggcctc 3000
ttggccttca ccaagcgccg caactgttgc attggctgcc gctccgtaat cgaccatcaa 3060
ggagccgtgt gtaagttctg tcagccacgg gagtcggagc tctatcagaa ggaggtgtca 3120
cacctgaatg ccttggaaga acggttctct cgcctctgga cacagtgtca acgctgccag 3180
ggcagcttgc atgaggacgt catctgtacc agccgtgact gtcccatctt ctacatgcgc 3240
aagaaggtgc gcaaggacct ggaagaccag gaacggctgc tgcagcgctt tggaccgccc 3300
ggccctgagg cctggtga 3318
<210> 71
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 71
tccccgcggc tgcagaggat tttccacag 29
<210> 72
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 72
ggactagtat ggtatgcaca acagcctc 28
<210> 73
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 73
tccccgcgga gtggttgtgg gagacttac 29
<210> 74
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 74
ggactagtca gtcccacagt cccaaagt 28
<210> 75
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 75
ctgagagtga tgaggttc 18
<210> 76
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 76
ctaatcgcca tcttccagca g 21
<210> 77
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 77
gctcgacgtt gtcactgaag 20
<210> 78
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 78
ccaacgctat gtcctgatag 20
<210> 79
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 79
gctcgacgtt gtcactgaag 20
<210> 80
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 80
ccaacgctat gtcctgatag 20
<210> 81
<211> 5725
<212> DNA
<213> Mus musculus
<400> 81
agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60
agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120
gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180
acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240
atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300
gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360
ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420
attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480
acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540
gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600
ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660
atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720
tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780
ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840
tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900
tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960
gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020
catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080
taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140
ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200
ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260
gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320
atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380
ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440
ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500
ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560
gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620
cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680
tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740
tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800
atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860
tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920
caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980
tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040
aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100
ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160
caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220
ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280
taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340
cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400
ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460
catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520
atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580
ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640
ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700
tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760
ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820
gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880
ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940
aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000
taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060
agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120
ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180
actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240
tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300
ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360
agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420
ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480
acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540
aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600
ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660
gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720
caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780
tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840
ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900
gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960
ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020
aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080
gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140
gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200
ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260
tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320
cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380
tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440
tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500
ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560
acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620
gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680
aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740
gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800
cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860
gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920
acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980
tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040
cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100
tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160
ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220
tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280
catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340
ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400
tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460
cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520
ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580
gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640
agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700
gaggtacttt gggactgtgg gactg 5725
<210> 82
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 82
ctgagtctag atttcccgcc atggaaatcg 30
<210> 83
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 83
agcaacgagc tcttatgatt ggtttatctg 30
<210> 84
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 84
atttgctgtc gataatatca gatttcttgg 30
<210> 85
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 85
gagtgaggat ttgtacatga tctgaagg 28
<210> 86
<211> 3357
<212> DNA
<213> Mus musculus
<220>
<221> CDS
<222> (24)..(3338)
<400> 86
ggcgggaaaa gctgtttgag gcg atg gat tgt aag cgg cga caa gga 47
Met Asp Cys Lys Arg Arg Gln Gly
1 5
cca ggc cct ggg gtg ccc cca aag cgg gct cga ggg cac ctc tgg gat 95
Pro Gly Pro Gly Val Pro Pro Lys Arg Ala Arg Gly His Leu Trp Asp
10 15 20
gag gac gag cct tcg ccg tcg cag ttt gag gcg aac ctg gca ctg ctg 143
Glu Asp Glu Pro Ser Pro Ser Gln Phe Glu Ala Asn Leu Ala Leu Leu
25 30 35 40
gag gaa ata gag gct gag aac cgg ctg cag gag gca gag gag gag ctg 191
Glu Glu Ile Glu Ala Glu Asn Arg Leu Gln Glu Ala Glu Glu Glu Leu
45 50 55
cag ctg ccc cca gag ggc acc gtg ggt ggg cag ttt tcc act gca gac 239
Gln Leu Pro Pro Glu Gly Thr Val Gly Gly Gln Phe Ser Thr Ala Asp
60 65 70
att gac cct cgg tgg cgg cgg ccc acc cta cgt gcc ctg gac ccc agc 287
Ile Asp Pro Arg Trp Arg Arg Pro Thr Leu Arg Ala Leu Asp Pro Ser
75 80 85
acg gag ccc ctc atc ttc cag cag ctg gag att gac cac tat gtg ggc 335
Thr Glu Pro Leu Ile Phe Gln Gln Leu Glu Ile Asp His Tyr Val Gly
90 95 100
tca gca cca ccc ctg cca gaa ggg ccc ctg cca tcc cgg aac tca gtg 383
Ser Ala Pro Pro Leu Pro Glu Gly Pro Leu Pro Ser Arg Asn Ser Val
105 110 115 120
ccc ata ctg agg gcc ttt ggg gtc acc gat gaa ggc ttc tcc gtc tgc 431
Pro Ile Leu Arg Ala Phe Gly Val Thr Asp Glu Gly Phe Ser Val Cys
125 130 135
tgc cac ata cag ggc ttt gcc ccc tac ttc tac acc ccc gcg cct cct 479
Cys His Ile Gln Gly Phe Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro
140 145 150
ggt ttt ggg gcc gag cac ctg agt gag ctg cag cag gag ctg aac gca 527
Gly Phe Gly Ala Glu His Leu Ser Glu Leu Gln Gln Glu Leu Asn Ala
155 160 165
gcc atc agc cgg gac cag cgc ggt ggg aag gag ctc tca ggg ccg gca 575
Ala Ile Ser Arg Asp Gln Arg Gly Gly Lys Glu Leu Ser Gly Pro Ala
170 175 180
gtg ctg gca ata gag cta tgc tcc cgt gag agc atg ttt ggg tac cac 623
Val Leu Ala Ile Glu Leu Cys Ser Arg Glu Ser Met Phe Gly Tyr His
185 190 195 200
ggt cat ggc cct tct cca ttt ctc cgc atc acc ctg gca cta ccc cgc 671
Gly His Gly Pro Ser Pro Phe Leu Arg Ile Thr Leu Ala Leu Pro Arg
205 210 215
ctt atg gca cca gcc cgc cgc ctt ctg gaa cag ggt gtc cga gtg cca 719
Leu Met Ala Pro Ala Arg Arg Leu Leu Glu Gln Gly Val Arg Val Pro
220 225 230
ggc ctg ggc acc ccg agc ttc gca ccc tac gaa gcc aac gtg gac ttt 767
Gly Leu Gly Thr Pro Ser Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe
235 240 245
gag atc cgg ttc atg gtg gat gct gac att gtg gga tgc aac tgg ttg 815
Glu Ile Arg Phe Met Val Asp Ala Asp Ile Val Gly Cys Asn Trp Leu
250 255 260
gag ctg cca gct gga aag tac gtt cgg agg gcg gag aag aag gcc acc 863
Glu Leu Pro Ala Gly Lys Tyr Val Arg Arg Ala Glu Lys Lys Ala Thr
265 270 275 280
ctg tgt cag ctg gag gtg gac gtg ctg tgg tca gat gtg atc agt cac 911
Leu Cys Gln Leu Glu Val Asp Val Leu Trp Ser Asp Val Ile Ser His
285 290 295
cca ccg gag ggg cag tgg cag cgc att gca ccc ctg cgt gtg ctt agc 959
Pro Pro Glu Gly Gln Trp Gln Arg Ile Ala Pro Leu Arg Val Leu Ser
300 305 310
ttc gac atc gag tgt gct ggc cga aaa ggc atc ttc cct gag cct gag 1007
Phe Asp Ile Glu Cys Ala Gly Arg Lys Gly Ile Phe Pro Glu Pro Glu
315 320 325
cgt gac ccc gtg atc cag atc tgt tct ctg ggg ctg cgc tgg ggg gag 1055
Arg Asp Pro Val Ile Gln Ile Cys Ser Leu Gly Leu Arg Trp Gly Glu
330 335 340
ccg gag cca ttc ttg cgt ctg gca ctc acg ctg cgg ccc tgt gcc ccc 1103
Pro Glu Pro Phe Leu Arg Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro
345 350 355 360
atc ctg ggt gcc aaa gtg cag agc tat gag cgg gaa gaa gac ctg ctc 1151
Ile Leu Gly Ala Lys Val Gln Ser Tyr Glu Arg Glu Glu Asp Leu Leu
365 370 375
cag gcc tgg gcc gac ttc atc ctt gcc atg gac cct gac gtg atc acc 1199
Gln Ala Trp Ala Asp Phe Ile Leu Ala Met Asp Pro Asp Val Ile Thr
380 385 390
ggc tac aac att cag aac ttt gac ctc cca tac ctc atc tct cgg gca 1247
Gly Tyr Asn Ile Gln Asn Phe Asp Leu Pro Tyr Leu Ile Ser Arg Ala
395 400 405
cag gcc cta aag gtg gac cgc ttc cct ttc ctg ggc cgc gtg act ggt 1295
Gln Ala Leu Lys Val Asp Arg Phe Pro Phe Leu Gly Arg Val Thr Gly
410 415 420
ctc cgc tcc aac atc cgt gac tcc tcc ttc caa tca agg cag gtc ggc 1343
Leu Arg Ser Asn Ile Arg Asp Ser Ser Phe Gln Ser Arg Gln Val Gly
425 430 435 440
cgg cgg gac agt aag gtg atc agc atg gtg ggt cgc gtt cag atg gat 1391
Arg Arg Asp Ser Lys Val Ile Ser Met Val Gly Arg Val Gln Met Asp
445 450 455
atg ctg cag gtg ctg ctt cgg gaa cac aag ctc cgc tcc tac acg ctc 1439
Met Leu Gln Val Leu Leu Arg Glu His Lys Leu Arg Ser Tyr Thr Leu
460 465 470
aac gct gtg agt ttc cac ttc ctg ggc gag cag aag gag gac gtt cag 1487
Asn Ala Val Ser Phe His Phe Leu Gly Glu Gln Lys Glu Asp Val Gln
475 480 485
cac agc atc atc acc gac ctg cag aat ggg aac gaa cag acg cgc cgc 1535
His Ser Ile Ile Thr Asp Leu Gln Asn Gly Asn Glu Gln Thr Arg Arg
490 495 500
cgc ctg gcc gtg tac tgc ctg aag gac gcc ttt ctg cca ctc cga cta 1583
Arg Leu Ala Val Tyr Cys Leu Lys Asp Ala Phe Leu Pro Leu Arg Leu
505 510 515 520
cta gag cgc ctt atg gtg ctg gtg aat aat gtg gag atg gcg cgt gtc 1631
Leu Glu Arg Leu Met Val Leu Val Asn Asn Val Glu Met Ala Arg Val
525 530 535
acg ggt gta ccc ctt ggg tac ctg ctc acc cgg ggc cag cag gtc aag 1679
Thr Gly Val Pro Leu Gly Tyr Leu Leu Thr Arg Gly Gln Gln Val Lys
540 545 550
gtc gtg tct cag ctg ctg cgc cag gcc atg cgc cag ggg ctg ctg atg 1727
Val Val Ser Gln Leu Leu Arg Gln Ala Met Arg Gln Gly Leu Leu Met
555 560 565
cct gtg gtg aag acc gag ggc agt gag gac tac acg gga gcc aca gtc 1775
Pro Val Val Lys Thr Glu Gly Ser Glu Asp Tyr Thr Gly Ala Thr Val
570 575 580
att gag ccc ctc aaa ggg tac tat gac gtc ccc att gcc acc ctg gac 1823
Ile Glu Pro Leu Lys Gly Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp
585 590 595 600
ttc tcc tcc ttg tac cca tcc atc atg atg gcc cat aat ctg tgc tac 1871
Phe Ser Ser Leu Tyr Pro Ser Ile Met Met Ala His Asn Leu Cys Tyr
605 610 615
acc acg ctg ctc cga cct ggg gct gcc cag aag ctg ggc ctt aaa cca 1919
Thr Thr Leu Leu Arg Pro Gly Ala Ala Gln Lys Leu Gly Leu Lys Pro
620 625 630
gat gag ttc atc aag aca ccc act ggg gat gag ttt gtg aag tca tct 1967
Asp Glu Phe Ile Lys Thr Pro Thr Gly Asp Glu Phe Val Lys Ser Ser
635 640 645
gta cgg aag ggc ctc ctg ccc cag atc ctg gag aat ctg ctg agt gcc 2015
Val Arg Lys Gly Leu Leu Pro Gln Ile Leu Glu Asn Leu Leu Ser Ala
650 655 660
cgc aag agg gcc aag gct gag ctg gct cag gag acg gac ccc ctg cgg 2063
Arg Lys Arg Ala Lys Ala Glu Leu Ala Gln Glu Thr Asp Pro Leu Arg
665 670 675 680
cga cag gtc ttg gac ggc cgg caa ctg gca cta aaa gtg agt gcc aac 2111
Arg Gln Val Leu Asp Gly Arg Gln Leu Ala Leu Lys Val Ser Ala Asn
685 690 695
tcc gta tat ggc ttc act ggt gcc cag gtg ggc aag ctg cca tgt ttg 2159
Ser Val Tyr Gly Phe Thr Gly Ala Gln Val Gly Lys Leu Pro Cys Leu
700 705 710
gag atc tcc cag agt gtc act ggg ttc ggg cgg cag atg att gag aaa 2207
Glu Ile Ser Gln Ser Val Thr Gly Phe Gly Arg Gln Met Ile Glu Lys
715 720 725
acc aag cag ctt gtg gag tcc aag tac acc gtg gaa aat ggc tac gat 2255
Thr Lys Gln Leu Val Glu Ser Lys Tyr Thr Val Glu Asn Gly Tyr Asp
730 735 740
gcc aac gcc aag gta gtc tac ggt gac acg gac tct gtg atg tgc cgg 2303
Ala Asn Ala Lys Val Val Tyr Gly Asp Thr Asp Ser Val Met Cys Arg
745 750 755 760
ttt ggc gtc tcc tct gtg gct gaa gca atg tct ctg ggg cgg gag gct 2351
Phe Gly Val Ser Ser Val Ala Glu Ala Met Ser Leu Gly Arg Glu Ala
765 770 775
gca aac tgg gta tcc agt cac ttc cca tca ccc atc cgg ctg gag ttc 2399
Ala Asn Trp Val Ser Ser His Phe Pro Ser Pro Ile Arg Leu Glu Phe
780 785 790
gag aag gtt tac ttc cca tac ctg ctc atc agc aag aag cgc tat gct 2447
Glu Lys Val Tyr Phe Pro Tyr Leu Leu Ile Ser Lys Lys Arg Tyr Ala
795 800 805
ggc ctg ctc ttc tcc tcc cgc tct gat gcc cat gac aaa atg gac tgc 2495
Gly Leu Leu Phe Ser Ser Arg Ser Asp Ala His Asp Lys Met Asp Cys
810 815 820
aag ggc ctg gag gct gtg cgc agg gac aac tgt ccc ctg gtg gcc aac 2543
Lys Gly Leu Glu Ala Val Arg Arg Asp Asn Cys Pro Leu Val Ala Asn
825 830 835 840
ctc gtt aca tcc tct ctg cgc cgg atc ctc gtg gac cgg gac cct gat 2591
Leu Val Thr Ser Ser Leu Arg Arg Ile Leu Val Asp Arg Asp Pro Asp
845 850 855
ggg gca gta gcc cat gcc aag gac gtc atc tcg gac ctg ctg tgc aac 2639
Gly Ala Val Ala His Ala Lys Asp Val Ile Ser Asp Leu Leu Cys Asn
860 865 870
cgc ata gac atc tcc cag ctg gtc atc acc aaa gag ttg acc cgc gca 2687
Arg Ile Asp Ile Ser Gln Leu Val Ile Thr Lys Glu Leu Thr Arg Ala
875 880 885
gca gca gac tat gct ggc aag cag gct cac gtg gag ctg gct gag agg 2735
Ala Ala Asp Tyr Ala Gly Lys Gln Ala His Val Glu Leu Ala Glu Arg
890 895 900
atg agg aag cgc gac ccc ggc agt gcg ccc agc ctg ggt gac cga gtc 2783
Met Arg Lys Arg Asp Pro Gly Ser Ala Pro Ser Leu Gly Asp Arg Val
905 910 915 920
ccc tat gtg atc att ggt gct gct aag ggt gtg gcc gcc tac atg aag 2831
Pro Tyr Val Ile Ile Gly Ala Ala Lys Gly Val Ala Ala Tyr Met Lys
925 930 935
tcg gag gac ccc ctg ttt gtg ctg gag cac agc ctg ccc atc gac act 2879
Ser Glu Asp Pro Leu Phe Val Leu Glu His Ser Leu Pro Ile Asp Thr
940 945 950
cag tac tac ctg gag cag cag ctg gcc aag ccg ctc ttg cgc atc ttt 2927
Gln Tyr Tyr Leu Glu Gln Gln Leu Ala Lys Pro Leu Leu Arg Ile Phe
955 960 965
gag ccc atc ctg ggt gag ggc cgt gca gag tct gtg ctg ctg cgc ggt 2975
Glu Pro Ile Leu Gly Glu Gly Arg Ala Glu Ser Val Leu Leu Arg Gly
970 975 980
gac cac aca cga tgc aag act gtg ctc acc agc aag gtg ggc ggc ctc 3023
Asp His Thr Arg Cys Lys Thr Val Leu Thr Ser Lys Val Gly Gly Leu
985 990 995 1000
ttg gcc ttc acc aag cgc cgc aac tgt tgc att ggc tgc cgc tcc gta 3071
Leu Ala Phe Thr Lys Arg Arg Asn Cys Cys Ile Gly Cys Arg Ser Val
1005 1010 1015
atc gac cat caa gga gcc gtg tgt aag ttc tgt cag cca cgg gag tcg 3119
Ile Asp His Gln Gly Ala Val Cys Lys Phe Cys Gln Pro Arg Glu Ser
1020 1025 1030
gag ctc tat cag aag gag gtg tca cac ctg aat gcc ttg gaa gaa cgg 3167
Glu Leu Tyr Gln Lys Glu Val Ser His Leu Asn Ala Leu Glu Glu Arg
1035 1040 1045
ttc tct cgc ctc tgg aca cag tgt caa cgc tgc cag ggc agc ttg cat 3215
Phe Ser Arg Leu Trp Thr Gln Cys Gln Arg Cys Gln Gly Ser Leu His
1050 1055 1060
gag gac gtc atc tgt acc agc cgt gac tgt ccc atc ttc tac atg cgc 3263
Glu Asp Val Ile Cys Thr Ser Arg Asp Cys Pro Ile Phe Tyr Met Arg
1065 1070 1075 1080
aag aag gtg cgc aag gac ctg gaa gac cag gaa cgg ctg ctg cag cgc 3311
Lys Lys Val Arg Lys Asp Leu Glu Asp Gln Glu Arg Leu Leu Gln Arg
1085 1090 1095
ttt gga ccg ccc ggc cct gag gcc tgg tg acctgacacg ggacaag 3357
Phe Gly Pro Pro Gly Pro Glu Ala Trp
1100 1105
<210> 87
<211> 1105
<212> PRT
<213> Mus musculus
<400> 87
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
20 25 30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
35 40 45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
50 55 60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65 70 75 80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
85 90 95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
100 105 110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
115 120 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
130 135 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145 150 155 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
165 170 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
180 185 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
195 200 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
210 215 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225 230 235 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
245 250 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
260 265 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
275 280 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
290 295 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305 310 315 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
325 330 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
340 345 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
355 360 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
370 375 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Asp
385 390 395 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
405 410 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
420 425 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
435 440 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
450 455 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465 470 475 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
485 490 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
500 505 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
515 520 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
530 535 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545 550 555 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
565 570 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
580 585 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
595 600 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
610 615 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625 630 635 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
645 650 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
660 665 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
675 680 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
690 695 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705 710 715 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
725 730 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
740 745 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
755 760 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
770 775 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785 790 795 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
805 810 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
820 825 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
835 840 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
850 855 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865 870 875 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
885 890 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
900 905 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
915 920 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
930 935 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945 950 955 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
965 970 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
980 985 990
Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn
995 1000 1005
Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys
1010 1015 1020
Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser
1025 1030 1035 1040
His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys
1045 1050 1055
Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg
1060 1065 1070
Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu
1075 1080 1085
Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala
1090 1095 1100
Trp
110
<210> 88
<211> 3318
<212> DNA
<213> Mus musculus
<220>
<221> CDS
<222> (1)..(3315)
<400> 88
atg gat tgt aag cgg cga caa gga cca ggc cct ggg gtg ccc cca aag 48
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
cgg gct cga ggg cac ctc tgg gat gag gac gag cct tcg ccg tcg cag 96
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
20 25 30
ttt gag gcg aac ctg gca ctg ctg gag gaa ata gag gct gag aac cgg 144
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
35 40 45
ctg cag gag gca gag gag gag ctg cag ctg ccc cca gag ggc acc gtg 192
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
50 55 60
ggt ggg cag ttt tcc act gca gac att gac cct cgg tgg cgg cgg ccc 240
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65 70 75 80
acc cta cgt gcc ctg gac ccc agc acg gag ccc ctc atc ttc cag cag 288
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
85 90 95
ctg gag att gac cac tat gtg ggc tca gca cca ccc ctg cca gaa ggg 336
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
100 105 110
ccc ctg cca tcc cgg aac tca gtg ccc ata ctg agg gcc ttt ggg gtc 384
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
115 120 125
acc gat gaa ggc ttc tcc gtc tgc tgc cac ata cag ggc ttt gcc ccc 432
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
130 135 140
tac ttc tac acc ccc gcg cct cct ggt ttt ggg gcc gag cac ctg agt 480
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145 150 155 160
gag ctg cag cag gag ctg aac gca gcc atc agc cgg gac cag cgc ggt 528
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
165 170 175
ggg aag gag ctc tca ggg ccg gca gtg ctg gca ata gag cta tgc tcc 576
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
180 185 190
cgt gag agc atg ttt ggg tac cac ggt cat ggc cct tct cca ttt ctc 624
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
195 200 205
cgc atc acc ctg gca cta ccc cgc ctt atg gca cca gcc cgc cgc ctt 672
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
210 215 220
ctg gaa cag ggt gtc cga gtg cca ggc ctg ggc acc ccg agc ttc gca 720
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225 230 235 240
ccc tac gaa gcc aac gtg gac ttt gag atc cgg ttc atg gtg gat gct 768
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
245 250 255
gac att gtg gga tgc aac tgg ttg gag ctg cca gct gga aag tac gtt 816
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
260 265 270
cgg agg gcg gag aag aag gcc acc ctg tgt cag ctg gag gtg gac gtg 864
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
275 280 285
ctg tgg tca gat gtg atc agt cac cca ccg gag ggg cag tgg cag cgc 912
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
290 295 300
att gca ccc ctg cgt gtg ctt agc ttc gac atc gag tgt gct ggc cga 960
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305 310 315 320
aaa ggc atc ttc cct gag cct gag cgt gac ccc gtg atc cag atc tgt 1008
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
325 330 335
tct ctg ggg ctg cgc tgg ggg gag ccg gag cca ttc ttg cgt ctg gca 1056
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
340 345 350
ctc acg ctg cgg ccc tgt gcc ccc atc ctg ggt gcc aaa gtg cag agc 1104
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
355 360 365
tat gag cgg gaa gaa gac ctg ctc cag gcc tgg gcc gac ttc atc ctt 1152
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
370 375 380
gcc atg gac cct gac gtg atc acc ggc tac aac att cag aac ttt gcc 1200
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala
385 390 395 400
ctc cca tac ctc atc tct cgg gca cag gcc cta aag gtg gac cgc ttc 1248
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
405 410 415
cct ttc ctg ggc cgc gtg act ggt ctc cgc tcc aac atc cgt gac tcc 1296
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
420 425 430
tcc ttc caa tca agg cag gtc ggc cgg cgg gac agt aag gtg atc agc 1344
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
435 440 445
atg gtg ggt cgc gtt cag atg gat atg ctg cag gtg ctg ctt cgg gaa 1392
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
450 455 460
cac aag ctc cgc tcc tac acg ctc aac gct gtg agt ttc cac ttc ctg 1440
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465 470 475 480
ggc gag cag aag gag gac gtt cag cac agc atc atc acc gac ctg cag 1488
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
485 490 495
aat ggg aac gaa cag acg cgc cgc cgc ctg gcc gtg tac tgc ctg aag 1536
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
500 505 510
gac gcc ttt ctg cca ctc cga cta cta gag cgc ctt atg gtg ctg gtg 1584
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
515 520 525
aat aat gtg gag atg gcg cgt gtc acg ggt gta ccc ctt ggg tac ctg 1632
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
530 535 540
ctc acc cgg ggc cag cag gtc aag gtc gtg tct cag ctg ctg cgc cag 1680
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545 550 555 560
gcc atg cgc cag ggg ctg ctg atg cct gtg gtg aag acc gag ggc agt 1728
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
565 570 575
gag gac tac acg gga gcc aca gtc att gag ccc ctc aaa ggg tac tat 1776
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
580 585 590
gac gtc ccc att gcc acc ctg gac ttc tcc tcc ttg tac cca tcc atc 1824
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
595 600 605
atg atg gcc cat aat ctg tgc tac acc acg ctg ctc cga cct ggg gct 1872
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
610 615 620
gcc cag aag ctg ggc ctt aaa cca gat gag ttc atc aag aca ccc act 1920
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625 630 635 640
ggg gat gag ttt gtg aag tca tct gta cgg aag ggc ctc ctg ccc cag 1968
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
645 650 655
atc ctg gag aat ctg ctg agt gcc cgc aag agg gcc aag gct gag ctg 2016
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
660 665 670
gct cag gag acg gac ccc ctg cgg cga cag gtc ttg gac ggc cgg caa 2064
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
675 680 685
ctg gca cta aaa gtg agt gcc aac tcc gta tat ggc ttc act ggt gcc 2112
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
690 695 700
cag gtg ggc aag ctg cca tgt ttg gag atc tcc cag agt gtc act ggg 2160
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705 710 715 720
ttc ggg cgg cag atg att gag aaa acc aag cag ctt gtg gag tcc aag 2208
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
725 730 735
tac acc gtg gaa aat ggc tac gat gcc aac gcc aag gta gtc tac ggt 2256
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
740 745 750
gac acg gac tct gtg atg tgc cgg ttt ggc gtc tcc tct gtg gct gaa 2304
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
755 760 765
gca atg tct ctg ggg cgg gag gct gca aac tgg gta tcc agt cac ttc 2352
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
770 775 780
cca tca ccc atc cgg ctg gag ttc gag aag gtt tac ttc cca tac ctg 2400
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785 790 795 800
ctc atc agc aag aag cgc tat gct ggc ctg ctc ttc tcc tcc cgc tct 2448
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
805 810 815
gat gcc cat gac aaa atg gac tgc aag ggc ctg gag gct gtg cgc agg 2496
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
820 825 830
gac aac tgt ccc ctg gtg gcc aac ctc gtt aca tcc tct ctg cgc cgg 2544
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
835 840 845
atc ctc gtg gac cgg gac cct gat ggg gca gta gcc cat gcc aag gac 2592
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
850 855 860
gtc atc tcg gac ctg ctg tgc aac cgc ata gac atc tcc cag ctg gtc 2640
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865 870 875 880
atc acc aaa gag ttg acc cgc gca gca gca gac tat gct ggc aag cag 2688
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
885 890 895
gct cac gtg gag ctg gct gag agg atg agg aag cgc gac ccc ggc agt 2736
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
900 905 910
gcg ccc agc ctg ggt gac cga gtc ccc tat gtg atc att ggt gct gct 2784
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
915 920 925
aag ggt gtg gcc gcc tac atg aag tcg gag gac ccc ctg ttt gtg ctg 2832
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
930 935 940
gag cac agc ctg ccc atc gac act cag tac tac ctg gag cag cag ctg 2880
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945 950 955 960
gcc aag ccg ctc ttg cgc atc ttt gag ccc atc ctg ggt gag ggc cgt 2928
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
965 970 975
gca gag tct gtg ctg ctg cgc ggt gac cac aca cga tgc aag act gtg 2976
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
980 985 990
ctc acc agc aag gtg ggc ggc ctc ttg gcc ttc acc aag cgc cgc aac 3024
Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn
995 1000 1005
tgt tgc att ggc tgc cgc tcc gta atc gac cat caa gga gcc gtg tgt 3072
Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys
1010 1015 1020
aag ttc tgt cag cca cgg gag tcg gag ctc tat cag aag gag gtg tca 3120
Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser
1025 1030 1035 1040
cac ctg aat gcc ttg gaa gaa cgg ttc tct cgc ctc tgg aca cag tgt 3168
His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys
1045 1050 1055
caa cgc tgc cag ggc agc ttg cat gag gac gtc atc tgt acc agc cgt 3216
Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg
1060 1065 1070
gac tgt ccc atc ttc tac atg cgc aag aag gtg cgc aag gac ctg gaa 3264
Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu
1075 1080 1085
gac cag gaa cgg ctg ctg cag cgc ttt gga ccg ccc ggc cct gag gcc 3312
Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala
1090 1095 1100
tgg tga 3318
Trp
1105
<210> 89
<211> 1105
<212> PRT
<213> Mus musculus
<400> 89
Met Asp Cys Lys Arg Arg Gln Gly Pro Gly Pro Gly Val Pro Pro Lys
1 5 10 15
Arg Ala Arg Gly His Leu Trp Asp Glu Asp Glu Pro Ser Pro Ser Gln
20 25 30
Phe Glu Ala Asn Leu Ala Leu Leu Glu Glu Ile Glu Ala Glu Asn Arg
35 40 45
Leu Gln Glu Ala Glu Glu Glu Leu Gln Leu Pro Pro Glu Gly Thr Val
50 55 60
Gly Gly Gln Phe Ser Thr Ala Asp Ile Asp Pro Arg Trp Arg Arg Pro
65 70 75 80
Thr Leu Arg Ala Leu Asp Pro Ser Thr Glu Pro Leu Ile Phe Gln Gln
85 90 95
Leu Glu Ile Asp His Tyr Val Gly Ser Ala Pro Pro Leu Pro Glu Gly
100 105 110
Pro Leu Pro Ser Arg Asn Ser Val Pro Ile Leu Arg Ala Phe Gly Val
115 120 125
Thr Asp Glu Gly Phe Ser Val Cys Cys His Ile Gln Gly Phe Ala Pro
130 135 140
Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Ala Glu His Leu Ser
145 150 155 160
Glu Leu Gln Gln Glu Leu Asn Ala Ala Ile Ser Arg Asp Gln Arg Gly
165 170 175
Gly Lys Glu Leu Ser Gly Pro Ala Val Leu Ala Ile Glu Leu Cys Ser
180 185 190
Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro Phe Leu
195 200 205
Arg Ile Thr Leu Ala Leu Pro Arg Leu Met Ala Pro Ala Arg Arg Leu
210 215 220
Leu Glu Gln Gly Val Arg Val Pro Gly Leu Gly Thr Pro Ser Phe Ala
225 230 235 240
Pro Tyr Glu Ala Asn Val Asp Phe Glu Ile Arg Phe Met Val Asp Ala
245 250 255
Asp Ile Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys Tyr Val
260 265 270
Arg Arg Ala Glu Lys Lys Ala Thr Leu Cys Gln Leu Glu Val Asp Val
275 280 285
Leu Trp Ser Asp Val Ile Ser His Pro Pro Glu Gly Gln Trp Gln Arg
290 295 300
Ile Ala Pro Leu Arg Val Leu Ser Phe Asp Ile Glu Cys Ala Gly Arg
305 310 315 320
Lys Gly Ile Phe Pro Glu Pro Glu Arg Asp Pro Val Ile Gln Ile Cys
325 330 335
Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg Leu Ala
340 345 350
Leu Thr Leu Arg Pro Cys Ala Pro Ile Leu Gly Ala Lys Val Gln Ser
355 360 365
Tyr Glu Arg Glu Glu Asp Leu Leu Gln Ala Trp Ala Asp Phe Ile Leu
370 375 380
Ala Met Asp Pro Asp Val Ile Thr Gly Tyr Asn Ile Gln Asn Phe Ala
385 390 395 400
Leu Pro Tyr Leu Ile Ser Arg Ala Gln Ala Leu Lys Val Asp Arg Phe
405 410 415
Pro Phe Leu Gly Arg Val Thr Gly Leu Arg Ser Asn Ile Arg Asp Ser
420 425 430
Ser Phe Gln Ser Arg Gln Val Gly Arg Arg Asp Ser Lys Val Ile Ser
435 440 445
Met Val Gly Arg Val Gln Met Asp Met Leu Gln Val Leu Leu Arg Glu
450 455 460
His Lys Leu Arg Ser Tyr Thr Leu Asn Ala Val Ser Phe His Phe Leu
465 470 475 480
Gly Glu Gln Lys Glu Asp Val Gln His Ser Ile Ile Thr Asp Leu Gln
485 490 495
Asn Gly Asn Glu Gln Thr Arg Arg Arg Leu Ala Val Tyr Cys Leu Lys
500 505 510
Asp Ala Phe Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val Leu Val
515 520 525
Asn Asn Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Gly Tyr Leu
530 535 540
Leu Thr Arg Gly Gln Gln Val Lys Val Val Ser Gln Leu Leu Arg Gln
545 550 555 560
Ala Met Arg Gln Gly Leu Leu Met Pro Val Val Lys Thr Glu Gly Ser
565 570 575
Glu Asp Tyr Thr Gly Ala Thr Val Ile Glu Pro Leu Lys Gly Tyr Tyr
580 585 590
Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro Ser Ile
595 600 605
Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro Gly Ala
610 615 620
Ala Gln Lys Leu Gly Leu Lys Pro Asp Glu Phe Ile Lys Thr Pro Thr
625 630 635 640
Gly Asp Glu Phe Val Lys Ser Ser Val Arg Lys Gly Leu Leu Pro Gln
645 650 655
Ile Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala Glu Leu
660 665 670
Ala Gln Glu Thr Asp Pro Leu Arg Arg Gln Val Leu Asp Gly Arg Gln
675 680 685
Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr Gly Ala
690 695 700
Gln Val Gly Lys Leu Pro Cys Leu Glu Ile Ser Gln Ser Val Thr Gly
705 710 715 720
Phe Gly Arg Gln Met Ile Glu Lys Thr Lys Gln Leu Val Glu Ser Lys
725 730 735
Tyr Thr Val Glu Asn Gly Tyr Asp Ala Asn Ala Lys Val Val Tyr Gly
740 745 750
Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val Ala Glu
755 760 765
Ala Met Ser Leu Gly Arg Glu Ala Ala Asn Trp Val Ser Ser His Phe
770 775 780
Pro Ser Pro Ile Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro Tyr Leu
785 790 795 800
Leu Ile Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser Arg Ser
805 810 815
Asp Ala His Asp Lys Met Asp Cys Lys Gly Leu Glu Ala Val Arg Arg
820 825 830
Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ser Ser Leu Arg Arg
835 840 845
Ile Leu Val Asp Arg Asp Pro Asp Gly Ala Val Ala His Ala Lys Asp
850 855 860
Val Ile Ser Asp Leu Leu Cys Asn Arg Ile Asp Ile Ser Gln Leu Val
865 870 875 880
Ile Thr Lys Glu Leu Thr Arg Ala Ala Ala Asp Tyr Ala Gly Lys Gln
885 890 895
Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro Gly Ser
900 905 910
Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val Ile Ile Gly Ala Ala
915 920 925
Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe Val Leu
930 935 940
Glu His Ser Leu Pro Ile Asp Thr Gln Tyr Tyr Leu Glu Gln Gln Leu
945 950 955 960
Ala Lys Pro Leu Leu Arg Ile Phe Glu Pro Ile Leu Gly Glu Gly Arg
965 970 975
Ala Glu Ser Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys Thr Val
980 985 990
Leu Thr Ser Lys Val Gly Gly Leu Leu Ala Phe Thr Lys Arg Arg Asn
995 1000 1005
Cys Cys Ile Gly Cys Arg Ser Val Ile Asp His Gln Gly Ala Val Cys
1010 1015 1020
Lys Phe Cys Gln Pro Arg Glu Ser Glu Leu Tyr Gln Lys Glu Val Ser
1025 1030 1035 1040
His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr Gln Cys
1045 1050 1055
Gln Arg Cys Gln Gly Ser Leu His Glu Asp Val Ile Cys Thr Ser Arg
1060 1065 1070
Asp Cys Pro Ile Phe Tyr Met Arg Lys Lys Val Arg Lys Asp Leu Glu
1075 1080 1085
Asp Gln Glu Arg Leu Leu Gln Arg Phe Gly Pro Pro Gly Pro Glu Ala
1090 1095 1100
Trp
110
<210> 90
<211> 3684
<212> DNA
<213> Arabidopsis thaliana
<220>
<221> CDS
<222> (501)..(557)
<220>
<221> CDS
<222> (689)..(817)
<220>
<221> CDS
<222> (1007)..(1114)
<220>
<221> CDS
<222> (1194)..(1319)
<220>
<221> CDS
<222> (1468)..(1575)
<220>
<221> CDS
<222> (1670)..(1786)
<220>
<221> CDS
<222> (1858)..(1941)
<220>
<221> CDS
<222> (2040)..(2108)
<220>
<221> CDS
<222> (2198)..(2269)
<220>
<221> CDS
<222> (2352)..(2444)
<220>
<221> CDS
<222> (2546)..(2671)
<220>
<221> CDS
<222> (2771)..(2872)
<220>
<221> CDS
<222> (2964)..(3032)
<220>
<221> CDS
<222> (3122)..(3181)
<400> 90
agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60
actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120
ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180
cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240
gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300
aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360
tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420
gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480
ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg
1 5 10
aag caa tcc gat tac aat tcg ctg gta cgaactctat tactttatcg 580
Lys Gln Ser Asp Tyr Asn Ser Leu
15
acttgtagtg aaagacaaat gtaatcattc gtggtggtga ctgtttctac ttataagtgt 640
acgggctagg gtttgttatc tgattctgag tttttgcaat tgaagcag gat gag aga 697
Asp Glu Arg
1
ttc gag ata cag aag gag atg tac aga ggt cag caa tac agt cag att 745
Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile
5 10 15
tac ttt gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct 793
Tyr Phe Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala
20 25 30 35
cct act tgg aaa tct cat ttg cct ggt cagtgctttt gtttctctca 840
Pro Thr Trp Lys Ser His Leu Pro
40
tatttagcac aacaacgaag agcagttttt gagaattttc ttgggttaga tataattagg 900
tgaaatcagt gatttttagg gatttttgct atcttatgga ttacagttga gaaagattgc 960
tagtattgtt taaattatag atctgaatgt gaatttcatt tttgca gtg tgt aag 1015
Val Cys Lys
1
gtt ttg gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg 1063
Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu
5 10 15
ttc aaa cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa 1111
Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys
20 25 30 35
gag gttggt ttttattaac ctctactgtt tttttgagct atgtctatgc tgaatcaatc 1170
Glu
tgagtatatt taacataatg cag agg tca gtt act ccg ctt gtt aaa 1217
Arg Ser Val Thr Pro Leu Val Lys
1 5
cca cat aac ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag 1265
Pro His Asn Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu
10 15 20
agt ggg aga gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat 1313
Ser Gly Arg Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr
25 30 35 40
gtg aca g gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt 1370
Val Thr
tacaatgtgg caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct 1430
ttaagaaaat taacgttgaa gcctcccgtg cattgta ggt gtt gtt gtt gca 1482
Gly Val Val Val Ala
1 5
ctg cat ggg aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta 1530
Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val
10 15 20
cta gaa gct ggt tta cca cct cag att gag cgg cct atc gat cta cgtaa 1580
Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
25 30 35
gtctagctat gttctcttcc ttttgctaac ctcatggctc aatcatttct ataagcaatc 1640
tctcatgata catccatatt gcatctgca gag gaa gat aaa tat gtc gtg tta 1693
Glu Glu Asp Lys Tyr Val Val Leu
1 5
ttg tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt 1741
Leu Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe
10 15 20
cag ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag gttc 1790
Gln Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu
25 30 35
aaatctctta acttgcaggt tgttcaacat atttctttcc ttaatttata ctttatggtt 1850
tgaacag gaa caa ggc ctt gca gca cag ata gtt cat gta gta att gct 1899
Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile Ala
1 5 10
gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag gtacttata 1950
Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln
15 20 25
acttttgttg ctgatatatt ctcagataca gttccagtaa ttatctgccc cagttatgtc 2010
ttatgatctt tattggttga tctttgtag aac ttg gcc tcg aaa gat caa tcg 2063
Asn Leu Ala Ser Lys Asp Gln Ser
1 5
aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc cag gt 2110
Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser Gln
10 15 20
cagttaactg gatctacgtg tgtgttatcg atatctattg agatgaaagt tcaaactcct 2170
gttttttttt ttgtggattg tttttag ata gct gca gga gtt tca gta gat 2221
Ile Ala Ala Gly Val Ser Val Asp
1 5
atc atg cca ggc acg aat gat cca gct aac ttc gca ttg cct cag cag g 2270
Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro Gln Gln
10 15 20
tctgcaaata cataagaaac attcaaaatc ccgcattttg tatcgataac tctgattcat 2330
aggcccttct cttttgttca g cct ctg aat aga tgt ctt ttc cct 2375
Pro Leu Asn Arg Cys Leu Phe Pro
1 5
gga tct tca cct tat aac acc ttc aga tca tgt aca aat cct cac tca 2423
Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr Asn Pro His Ser
10 15 20
ttt gat gtc gat aat atc agg tatgat tattattaat agttgaatac 2470
Phe Asp Val Asp Asn Ile Arg
25 30
aatctctctg attttacaac gataaaattc ttgggtttat ctgactgaaa acctcatatg 2530
ggggcatttt gcaga ttt ctt gga act tct ggt cag aac atc gat gac 2578
Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp
1 5 10
ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa aga 2626
Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg
15 20 25
acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc 2671
Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu
30 35 40
ggtaagaat tctccttgcc ctgcaagatt acttttttga actaagccca taaaaaaatg 2730
atcctttgag ttctatttgg ttttgattca cttgcgtaca ggt tgt tat cct ttc 2785
Gly Cys Tyr Pro Phe
1 5
acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
10 15 20
gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag ggtaaaag 2880
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys
25 30
caccttacac agagattaga aataacattc tcttttgtca aacatcaggc tttaactttt 2940
cttgggtaaa tatgaatgct gca ggg tca gaa ggg cag ctt gtc cgg 2987
Gly Ser Glu Gly Gln Leu Val Arg
1 5
ttg atc tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg 3032
Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala
10 15 20
gtgagttt aaaatttgag cagaatttga gaccatttac cctcatagat tgcagattct 3090
aaatctcaaa atcaccatgt ctatttcgca g gtg aac cta aga aat 3136
Val Asn Leu Arg Asn
1 5
ctg gaa tgt cac act tta agc ttt agc act cag ata aac caa tca 3181
Leu Glu Cys His Thr Leu Ser Phe Ser Thr Gln Ile Asn Gln Ser
10 15 20
taacattga gttgctactt tggtagatta tttcctgtct tgaagatgta atgttgagct 3240
ttttcagtaa cacactccta tgttctaacc aaatgtttgt taaaaatcct ttttcttgag 3300
tggaacttcc aaatctttgg atatattggt aatgctcatt gttttgtcct aattttctaa 3360
aaatctcgac acgagttctt aggtagtcac ataaaggaca aaaagggccg accagatagt 3420
gtcgtggtcg ttggtcagaa gaacgtgaaa agactgcaaa aataatctta aaaaaagcaa 3480
caagtgcaca gaatctcatg caaatgtctc tctctctctt ctcaacggct atatccatcc 3540
acacttatta cattataaaa ttaattaaat gcaataatgt aacgcattat attctccaac 3600
ggtccatttt cccgcatttc cctaaccttt cctttataac gcaaaacagt ttcatcttct 3660
acacttaaca ctttaatcct ctct 3684
<210> 91
<211> 440
<212> PRT
<213> Arabidopsis thaliana
<400> 91
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr
1 5 10 15
Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly
20 25 30
Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr
35 40 45
Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys
50 55 60
Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr
65 70 75 80
Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser
85 90 95
Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His
100 105 110
Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu
115 120 125
Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val
130 135 140
Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp
145 150 155 160
Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
165 170 175
Glu Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser
180 185 190
Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr
195 200 205
Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val
210 215 220
His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile
225 230 235 240
Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro
245 250 255
Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser
260 265 270
Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro
275 280 285
Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn
290 295 300
Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Asp Val Asp Asn Ile
305 310 315 320
Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr
325 330 335
Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp
340 345 350
Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe
355 360 365
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
370 375 380
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu
385 390 395 400
Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly
405 410 415
Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser
420 425 430
Phe Ser Thr Gln Ile Asn Gln Ser
435 440
<210> 92
<211> 3684
<212> DNA
<213> Arabidopsis thaliana
<220>
<221> CDS
<222> (501)..(557)
<220>
<221> CDS
<222> (689)..(817)
<220>
<221> CDS
<222> (1007)..(1114)
<220>
<221> CDS
<222> (1194)..(1319)
<220>
<221> CDS
<222> (1468)..(1575)
<220>
<221> CDS
<222> (1670)..(1786)
<220>
<221> CDS
<222> (1858)..(1941)
<220>
<221> CDS
<222> (2040)..(2108)
<220>
<221> CDS
<222> (2198)..(2269)
<220>
<221> CDS
<222> (2352)..(2444)
<220>
<221> CDS
<222> (2546)..(2671)
<220>
<221> CDS
<222> (2771)..(2872)
<220>
<221> CDS
<222> (2964)..(3032)
<220>
<221> CDS
<222> (3122)..(3181)
<400> 92
agcgattcct tagcagaaag gcgctccatt tctctggcgt aaaccaaagg agatccttga 60
actgtttcct gcaccattgc tcttaaaacc cttctccggc acgaattctt ccaaccctgc 120
ttcaccaccg gaacattgag acaaaatctc gacggtgacg ctgaggttga aaaaaccaat 180
cgaaccgcag acgtaccagg aaccgaacca tgtatcaacg ccattgaaga agaagaagaa 240
gaagaaggtg aaaaacgaaa gattgagaat ttgtttgctt tgagcaacca aacctcagga 300
aaaaagagtt aaggtgggag tgtctggttc aaccggttta tatccggttc aaattaaacc 360
tcttacagtt aaccgggttt tgtgtttggt tcgattgttc ataaaagaaa gaagactctt 420
gtcgtcgatt agtgccaaag ttgaaagttg aaaccttttc tcagaatttt ctgctcagtt 480
ctgagttttt ttttcccgcc atg gaa atc gac tcc gag aaa att cac gaa agg 533
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg
1 5 10
aag caa tcc gat tac aat tcg ctg gta cgaactctat tactttatcg 580
Lys Gln Ser Asp Tyr Asn Ser Leu
15
acttgtagtg aaagacaaat gtaatcattc gtggtggtga ctgtttctac ttataagtgt 640
acgggctagg gtttgttatc tgattctgag tttttgcaat tgaagcag gat gag aga 697
Asp Glu Arg
1
ttc gag ata cag aag gag atg tac aga ggt cag caa tac agt cag att 745
Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly Gln Gln Tyr Ser Gln Ile
5 10 15
tac ttt gct cgt ctt cat ctc atg aga aca ctt ctc tac tct ctt gct 793
Tyr Phe Ala Arg Leu His Leu Met Arg Thr Leu Leu Tyr Ser Leu Ala
20 25 30 35
cct act tgg aaa tct cat ttg cct ggt cagtgctttt gtttctctca 840
Pro Thr Trp Lys Ser His Leu Pro
40
tatttagcac aacaacgaag agcagttttt gagaattttc ttgggttaga tataattagg 900
tgaaatcagt gatttttagg gatttttgct atcttatgga ttacagttga gaaagattgc 960
tagtattgtt taaattatag atctgaatgt gaatttcatt tttgca gtg tgt aag 1015
Val Cys Lys
1
gtt ttg gga ctt gaa aaa gga aaa gaa tgc ata att gtg gga acc ttg 1063
Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr Leu
5 10 15
ttc aaa cac atg aag ctt aaa cct tgt gtt ctc gat gaa tat tct aaa 1111
Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser Lys
20 25 30 35
gag gttggt ttttattaac ctctactgtt tttttgagct atgtctatgc tgaatcaatc 1170
Glu
tgagtatatt taacataatg cag agg tca gtt act ccg ctt gtt aaa 1217
Arg Ser Val Thr Pro Leu Val Lys
1 5
cca cat aac ttt atg cat cct gat gat aat ctg atc ctc gaa gac gag 1265
Pro His Asn Phe Met His Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu
10 15 20
agt ggg aga gtt aag ctt gct ggt tcc gca ctt tca cct gcg att tat 1313
Ser Gly Arg Val Lys Leu Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr
25 30 35 40
gtg aca g gtattgcaaa tgggttctta ctgtttttac tgtatgattt tttccttctt 1370
Val Thr
tacaatgtgg caaatcttag agattttgat caagctttcc tctcttaaaa gatgggttct 1430
ttaagaaaat taacgttgaa gcctcccgtg cattgta ggt gtt gtt gtt gca 1482
Gly Val Val Val Ala
1 5
ctg cat ggg aag gaa act aat gct ggt gaa ttc ttt gtt gag gat gta 1530
Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp Val
10 15 20
cta gaa gct ggt tta cca cct cag att gag cgg cct atc gat cta cgtaa 1580
Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
25 30 35
gtctagctat gttctcttcc ttttgctaac ctcatggctc aatcatttct ataagcaatc 1640
tctcatgata catccatatt gcatctgca gag gaa gat aaa tat gtc gtg tta 1693
Glu Glu Asp Lys Tyr Val Val Leu
1 5
ttg tcg ggc ctt tgt att gga agc aaa tcg gct aat ccc ctg cag ttt 1741
Leu Ser Gly Leu Cys Ile Gly Ser Lys Ser Ala Asn Pro Leu Gln Phe
10 15 20
cag ctt ctt gtt gac cat ata act ggg cat ctc gga gat gag gag gttc 1790
Gln Leu Leu Val Asp His Ile Thr Gly His Leu Gly Asp Glu Glu
25 30 35
aaatctctta acttgcaggt tgttcaacat atttctttcc ttaatttata ctttatggtt 1850
tgaacag gaa caa ggc ctt gca gca cag ata gtt cat gta gta att gct 1899
Glu Gln Gly Leu Ala Ala Gln Ile Val His Val Val Ile Ala
1 5 10
gga aac tct ttt gaa ttt ccc cgc aaa ctc att aat ggc cag gtacttata 1950
Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile Asn Gly Gln
15 20 25
acttttgttg ctgatatatt ctcagataca gttccagtaa ttatctgccc cagttatgtc 2010
ttatgatctt tattggttga tctttgtag aac ttg gcc tcg aaa gat caa tcg 2063
Asn Leu Ala Ser Lys Asp Gln Ser
1 5
aca ctg tat gag ccc atc aaa gag ctt gat atc atg tta agc cag gt 2110
Thr Leu Tyr Glu Pro Ile Lys Glu Leu Asp Ile Met Leu Ser Gln
10 15 20
cagttaactg gatctacgtg tgtgttatcg atatctattg agatgaaagt tcaaactcct 2170
gttttttttt ttgtggattg tttttag ata gct gca gga gtt tca gta gat 2221
Ile Ala Ala Gly Val Ser Val Asp
1 5
atc atg cca ggc acg aat gat cca gct aac ttc gca ttg cct cag cag g 2270
Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro Gln Gln
10 15 20
tctgcaaata cataagaaac attcaaaatc ccgcattttg tatcgataac tctgattcat 2330
aggcccttct cttttgttca g cct ctg aat aga tgt ctt ttc cct 2375
Pro Leu Asn Arg Cys Leu Phe Pro
1 5
gga tct tca cct tat aac acc ttc aga tca tgt aca aat cct cac tca 2423
Gly Ser Ser Pro Tyr Asn Thr Phe Arg Ser Cys Thr Asn Pro His Ser
10 15 20
ttt gct gtc gat aat atc agg tatgat tattattaat agttgaatac 2470
Phe Ala Val Asp Asn Ile Arg
25 30
aatctctctg attttacaac gataaaattc ttgggtttat ctgactgaaa acctcatatg 2530
ggggcatttt gcaga ttt ctt gga act tct ggt cag aac atc gat gac 2578
Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp
1 5 10
ctt ggc aag tac tca gag gct aag agc aag ctt gat ttt gtg gaa aga 2626
Leu Gly Lys Tyr Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg
15 20 25
acg ctg agg tgg aga cat ctt gcc cca act gca cct aat aca ctc 2671
Thr Leu Arg Trp Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu
30 35 40
ggtaagaat tctccttgcc ctgcaagatt acttttttga actaagccca taaaaaaatg 2730
atcctttgag ttctatttgg ttttgattca cttgcgtaca ggt tgt tat cct ttc 2785
Gly Cys Tyr Pro Phe
1 5
acc gat aga gac cct ttc ttg att gaa acc tgc ccg cat gtc tac ttc 2833
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
10 15 20
gtc ggg aat caa gat aaa tat gac aac cgt ttg ata aag ggtaaaag 2880
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys
25 30
caccttacac agagattaga aataacattc tcttttgtca aacatcaggc tttaactttt 2940
cttgggtaaa tatgaatgct gca ggg tca gaa ggg cag ctt gtc cgg 2987
Gly Ser Glu Gly Gln Leu Val Arg
1 5
ttg atc tgc att cct aag ttc tgt gag acc ggt att gct gtt gcg 3032
Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly Ile Ala Val Ala
10 15 20
gtgagttt aaaatttgag cagaatttga gaccatttac cctcatagat tgcagattct 3090
aaatctcaaa atcaccatgt ctatttcgca g gtg aac cta aga aat 3136
Val Asn Leu Arg Asn
1 5
ctg gaa tgt cac act tta agc ttt agc act cag ata aac caa tca 3181
Leu Glu Cys His Thr Leu Ser Phe Ser Thr Gln Ile Asn Gln Ser
10 15 20
taacattga gttgctactt tggtagatta tttcctgtct tgaagatgta atgttgagct 3240
ttttcagtaa cacactccta tgttctaacc aaatgtttgt taaaaatcct ttttcttgag 3300
tggaacttcc aaatctttgg atatattggt aatgctcatt gttttgtcct aattttctaa 3360
aaatctcgac acgagttctt aggtagtcac ataaaggaca aaaagggccg accagatagt 3420
gtcgtggtcg ttggtcagaa gaacgtgaaa agactgcaaa aataatctta aaaaaagcaa 3480
caagtgcaca gaatctcatg caaatgtctc tctctctctt ctcaacggct atatccatcc 3540
acacttatta cattataaaa ttaattaaat gcaataatgt aacgcattat attctccaac 3600
ggtccatttt cccgcatttc cctaaccttt cctttataac gcaaaacagt ttcatcttct 3660
acacttaaca ctttaatcct ctct 3684
<210> 93
<211> 440
<212> PRT
<213> Arabidopsis thaliana
<400> 93
Met Glu Ile Asp Ser Glu Lys Ile His Glu Arg Lys Gln Ser Asp Tyr
1 5 10 15
Asn Ser Leu Asp Glu Arg Phe Glu Ile Gln Lys Glu Met Tyr Arg Gly
20 25 30
Gln Gln Tyr Ser Gln Ile Tyr Phe Ala Arg Leu His Leu Met Arg Thr
35 40 45
Leu Leu Tyr Ser Leu Ala Pro Thr Trp Lys Ser His Leu Pro Val Cys
50 55 60
Lys Val Leu Gly Leu Glu Lys Gly Lys Glu Cys Ile Ile Val Gly Thr
65 70 75 80
Leu Phe Lys His Met Lys Leu Lys Pro Cys Val Leu Asp Glu Tyr Ser
85 90 95
Lys Glu Arg Ser Val Thr Pro Leu Val Lys Pro His Asn Phe Met His
100 105 110
Pro Asp Asp Asn Leu Ile Leu Glu Asp Glu Ser Gly Arg Val Lys Leu
115 120 125
Ala Gly Ser Ala Leu Ser Pro Ala Ile Tyr Val Thr Gly Val Val Val
130 135 140
Ala Leu His Gly Lys Glu Thr Asn Ala Gly Glu Phe Phe Val Glu Asp
145 150 155 160
Val Leu Glu Ala Gly Leu Pro Pro Gln Ile Glu Arg Pro Ile Asp Leu
165 170 175
Glu Glu Asp Lys Tyr Val Val Leu Leu Ser Gly Leu Cys Ile Gly Ser
180 185 190
Lys Ser Ala Asn Pro Leu Gln Phe Gln Leu Leu Val Asp His Ile Thr
195 200 205
Gly His Leu Gly Asp Glu Glu Glu Gln Gly Leu Ala Ala Gln Ile Val
210 215 220
His Val Val Ile Ala Gly Asn Ser Phe Glu Phe Pro Arg Lys Leu Ile
225 230 235 240
Asn Gly Gln Asn Leu Ala Ser Lys Asp Gln Ser Thr Leu Tyr Glu Pro
245 250 255
Ile Lys Glu Leu Asp Ile Met Leu Ser Gln Ile Ala Ala Gly Val Ser
260 265 270
Val Asp Ile Met Pro Gly Thr Asn Asp Pro Ala Asn Phe Ala Leu Pro
275 280 285
Gln Gln Pro Leu Asn Arg Cys Leu Phe Pro Gly Ser Ser Pro Tyr Asn
290 295 300
Thr Phe Arg Ser Cys Thr Asn Pro His Ser Phe Ala Val Asp Asn Ile
305 310 315 320
Arg Phe Leu Gly Thr Ser Gly Gln Asn Ile Asp Asp Leu Gly Lys Tyr
325 330 335
Ser Glu Ala Lys Ser Lys Leu Asp Phe Val Glu Arg Thr Leu Arg Trp
340 345 350
Arg His Leu Ala Pro Thr Ala Pro Asn Thr Leu Gly Cys Tyr Pro Phe
355 360 365
Thr Asp Arg Asp Pro Phe Leu Ile Glu Thr Cys Pro His Val Tyr Phe
370 375 380
Val Gly Asn Gln Asp Lys Tyr Asp Asn Arg Leu Ile Lys Gly Ser Glu
385 390 395 400
Gly Gln Leu Val Arg Leu Ile Cys Ile Pro Lys Phe Cys Glu Thr Gly
405 410 415
Ile Ala Val Ala Val Asn Leu Arg Asn Leu Glu Cys His Thr Leu Ser
420 425 430
Phe Ser Thr Gln Ile Asn Gln Ser
435 440
<210> 94
<211> 454
<212> DNA
<213> Mus musculus
<400> 94
ctgcagagga ttttccacag tataattaga gattggatgt ggggaagaat tatgtttttt 60
tttttctttt tggtaatctt atggttgggt atgctttatt ttctaattga tttgaaagag 120
gatatagaaa caaaagacag gagaaaaata atctggcctt ctgatactta tttgaaggct 180
ttctaatttc ccaactctaa ccccaagctc tccgttttac tgtttagtat tctaggctgg 240
cagtttgagt ctgtaccagg caaaaaacgt tccaaatcaa gatagacagg atggagaacc 300
aatcacagag ctggatttcc tttcaaattc taccaatggc tattgtgcag gagactttga 360
actcacaaag aaaggcgggg ccaagactta agcgttaaaa atcaccacca agccagcctc 420
ccagcagcag taaagaggct gttgtgcata ccat 454
<210> 95
<211> 5725
<212> DNA
<213> Mus musculus
<400> 95
agtggttgtg ggagacttac cgtcctcttg tctctggaga gtgccttcta ccatgtcatc 60
agaagggctg tcatcttggt ccccgatttc ttccacatca ttgtcctgag catcagcagc 120
gtctccaatg gggcagttta atttgaggca atacttactc ttcaactggc cgttactttc 180
acctggacta gacacatcgc gcttctgaga acacacttta tccaaaaacc ggataccgaa 240
atcctgcccg gactacatca tcaagttgat gtcctccttt ttcacgaaaa tctttgtggt 300
gtacctgtag ttcagcacct cttcaaatat gtgggagcag atgaaatcta tctctatgat 360
ggacaagctg tccagttcta gcttcttgaa aagtttcttt tttttttctt tcaatttttt 420
attaggtatt tagctcattt acatttccaa tgctatacca aaagtccccc atacccaccc 480
acccccactc ccctacccgc tcactccacc tttttggccc tggcgttccc ctgttctggg 540
gcatataaag tttgtgtgtc caatgggcct ctctttccag tgatggccga ctaggccatc 600
ttttgataca tatgcagcta gagtcaagag ctccggggta ctggttagtt cataatgttg 660
atccacctat agggttgcag atccctttag ctccttgggt actttctcta gctcctccat 720
tgggagccct gtgatccatc cattagctga ctgtgggcat ccacttctgt gtttgctagg 780
ccccggcata gtctcacaag agacagctac atctgggtcc tttcgataaa atcttgctag 840
tgtatgcaat ggtgtcagcg tttggatgct gattatgggg tggatccctg gataaggcag 900
tctctacatg gtccatcctt tcatctcagc tccaaacttt gtctctgtaa ctccttccaa 960
gggtgttttg ttcccacttc taaggagggg catagtgtcc acacttcagt cttctttttt 1020
catgagtttc atgtgtttag gaaattgtat cttatatctt gggtatccta ggttttgggc 1080
taatatccac ttatcagcga gtacatattg tgtgagttcc tttgtgaatg tgttacctca 1140
ctcaggaaga tgccctccag gtccatccat ttggctagga atttcataaa ttcattcttt 1200
ttaatagctg agtagtactc cattgtgtag atgtaccaca ttttctgtat ccattcctct 1260
gttgaggggc atctgggttc tttccagctt ctggctatta taaataaggc tgctatgaac 1320
atagtggagc atgtgtcctt cttaccagtt ggggcatctc ctggatatat gcccaggaga 1380
ggtattcctg gatcctccgg tagtactatg tccaattttc taaggaaccg ccagatggat 1440
ttccagagtg gttgtacaag cctgcaatcc caccaacaat ggaggagtgt tcctctttct 1500
ccacatcctc gccagcatct gctgtcacct gaatttttga tcttagccat tctgactggt 1560
gtgaggtgga atctcagggt tgttttgatt tgcatttccc tgatgattaa ggatgttgaa 1620
cattttttca ggtgcttctc tgccattcgg tattcctcag gtgagaattc tttgttcagt 1680
tctgagcccc atttttttaa tggggttatt tgattttctg aagtccacct tcttgagttc 1740
tttatatatg ttggatatta gtcccctatc tgatttagga taggtaaaga tcctttccca 1800
atctgttggt ggtctctttg tcttattgac agtgtctttt gccttgcaga aactttggag 1860
tttcattagg tcccatttgt caattctcga tcttacagca caagccattg ctgttctgtt 1920
caggaatttt tcccctgtgc ccatatcttc aaggcttttc cccactttct cctctataag 1980
tttcagtgtc tctggtttta tgtgaagttc tttgatccat ttagatttga ccttagtaca 2040
aggagataag tatggatcga ttcgcattct tctacatgat aacaaccagt tgtgccagca 2100
ccatttgttg aaaatgctgt ctttcttcca ctggatggtt ttagctccct tgtcgaagat 2160
caagtgacca taggtgtgtg ggttcatttc tgggtcttca attctattcc attggtctac 2220
ttgtctgtct ctataccagt accatgcagt ttttaccaca attgctctgt agtaaagctt 2280
taggtcaggc atggtgattc caccagaggt tcttttatcc ttgagaagag tttttgctat 2340
cctaggtttt ttgttattcc agatgaattt gcaaattgct ccttctaatt cgttgaagaa 2400
ttgagttgga attttgatgg ggattgcatt gaatctgtag attgcttttg gcaagatagc 2460
catttttaca atattgatcc tgccaatcca tgagcatggg agatctttcc atcttctgag 2520
atcttcttta atttctttct tcagagactt gaagttttta tcatacatat ctttcacttc 2580
ctcagttaga gtcacgccga gatattttat attatttgtg actattgaga agggtgttgt 2640
ttccctaatt tctttctcag actgtttatt ctttgtgtag agaaaggcca ttgacttgtt 2700
tgagttaatt ttatatccag ctacttcacc aaagctgttt atcaggttta ggagttctct 2760
ggtggaattt ttagggtcac ttatatatac tatcatatca tctgcgaaaa gtgatatttt 2820
gacttcctct tttccaattt gtatcccctt gatctccttt tgttgtcgaa ttgctcagca 2880
ctgcagtatt cttaacaaag ttgattctca ttagaaaata aagctgccat atgaccatct 2940
aacacttagt aactgggaaa atttgatttg atctggtgat ttgtcacagc aataacaaag 3000
taactatcac aatggctgaa acaagtctgc tcacttggaa tcaacacttt ttgtcccagg 3060
agcaacagag tcttcagtat caggggccta aatttagaga tgaaggtttg gacctgtagc 3120
ctgaacctct tgcagaagtg atgtattaaa aggctgatca acaatggtcg ctacaagagt 3180
actccaggcc agccaatcca acaagcccaa taccttgaag gatgaaaccc atgcccaaga 3240
tcacttcctg tgcctggtgg ctgggcctct actgagtgcc acaaagtaga agaaaaaact 3300
ctagatgcta gtgttcctct aagcatgaat aactgatata tattcatgct gctctacctc 3360
agatattcag acttttcccc ctggttttca gtaaatcaag ttggatcact ccactcttct 3420
ctctcctcct cttctcattt cctctgttca gcctcccctc ccagattctc cagtctgacc 3480
acgtttctaa acagtttgct aatttatctt ggcagctgag gcagctatgg gagccacagc 3540
aggcagagag cacaggagac tcagggttct cagcagggct ctcagcaggg ctctcagcag 3600
ggctgttgtg ggtgatcctt ggattctcta tcctccagga acagtttcac tgttccagaa 3660
gatggtgatg attctgacga ctgagatgca cgtgtggtgg tgtctctgga ggctaaagtg 3720
caggtgccaa gtggttccaa atagctgggt gcagtttgtc tcaggggcac ctctagaggg 3780
tcagcctgtt tctttcagcc tctagagggc agagatgagt cccagacctt gctctctaca 3840
ttatcctagc ctttctgtgc cctttgtgag gcgcctgcag ttaagaacgt gtccagcagg 3900
gggcgcagtg tacatgggtg ttctccagta acagtcttgg ctgggaagga gagctagatt 3960
ccaggttctt aaaatactgt tttcctgtac atacctaagt aatctttaca ttggaaaaca 4020
aacaaatagt aaagctctgt tgttgttgtt gataagtagc aaattaattt agggggagca 4080
gtttgggggg ctgatgggtc ttgttctgcc attcaggctg ggctgaagct cctagggtct 4140
gaagatgctc ctgtctcaga ctccaaagca tgggactgca tacagaagcg tgcaacagtg 4200
ctaggcttcc aatcaggttt cacattttgc ttctagacag aaatataatt tcctgaaacc 4260
tttcgttttg aaatgatgtc attattgggc ccccgcactc attgctgctg acgcccccct 4320
cccactatcc ctcgggctga aatgtcctga ttgggtgtca acgctcattt gcactgatgc 4380
tcccccctta atccctggag ctgaaatgtc ctgattgggt gccaaaattt tttccactga 4440
tgcctctccc atcccattag cactaggact gaaatgtcat gattgggcgc aaaaactaat 4500
ttccaattat gcccggcccc tccgattatc cctggtgctg agatgtcatg attggggcca 4560
acactcattt ctgctgatgg ccctcctctc ccattagacc tggacctgaa tccgtgtcat 4620
gattggacgc caacactcat ttccactgat gccccggccc tcccattagt cctgaggctg 4680
aacccctgtc atgattgggc tccaatcctc atttcaggtg atgctcagct cctcccatca 4740
gccctgtggc tgaatctctg tcacgattgg gccccaaccc tcatttctgc tgaggcccag 4800
cccctcccat tagccctggg gctgcatccc tgtcaccact agacaccaac actcatttct 4860
gctgatgccc cgcccatgcc attacccttg ggcctaaatc cctgtcatga ttgaactcca 4920
acccacattt ctcctgatac cctgactccc attatcctta ggcttaatcc gtgtcataat 4980
tgggcgccaa cactgatttc ctctgatgcc ctgcccctcc cattagcccg ggactgaatc 5040
cctgtcataa ttggacttga accctcattt ttgctgaggc ccagcgcctc ccatttgtcc 5100
tcgggctgat ccctgtcatg attgggcccc aaccctcatt tcggctgagg ccccactcct 5160
ccaattagcc ctgaggctga atccatgtca tgagtaggca ccaactctca ttaacactga 5220
tgcgctgccc cttacattag ccctggggct gaatccctgt catgattggg ccccaacact 5280
catttctgct gatggccctc ctctcccatt agacctgagg ctgaatccgt gtcatgattg 5340
ggcaccaaac cgcaattcca ctaaagcccc acccctccca ttaccatcct gccgaaacca 5400
tgtcttgtca tgattgggcc ccaaccctcc tttccactga tgcccccccc tcccttaagc 5460
cctcctgctg agaccacatc ttgattgggc actaacactc atttccgctg atgcccacca 5520
ctcccatttg ccctgggact taaaccctgt cgtgattggg tgtcaaccct catttccggt 5580
gatgccccgc ctcttcctat aaatcctggc gctcaaatac tgtggtcggt gggcaggaac 5640
agccatttgg atcactgcct gcagcctagc ggttgagctg ctctggcgat catctgttct 5700
gaggtacttt gggactgtgg gactg 5725
Claims (124)
- (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계를 포함한:세포의 유전 형질의 전환율을 조절하는 방법
- 제 1항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
- 제 2항에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 1항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 1항에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으로 무-오류임을 특징으로 하는 방법
- 제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 101 이상까지 서로 다름을 특징으로 하는 방법
- 제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 102 이상까지 서로 다름을 특징으로 하는 방법
- 제 2항에 있어서, 상기 오류-빈발 빈도는 적어도 103 이상까지 서로 다름을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
- 제 11항에 있어서, 상기 DNA 중합효소는 프루프리딩(proofreading) 기능을 지님을 특징으로 하는 방법
- 제 11항에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
- 제 16항에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
- 제 18항에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염 기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 12항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
- 제 1항에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩 (leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
- 제 37항에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
- 제 1항에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법
- 제 43항에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
- (a) 세포의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및(b) 수득된 세포를 재생산시키는 단계를 포함한:조절된 유전 형질을 지닌 세포를 생성하는 방법
- 제 45항에 있어서, 원하는 형질을 지닌 재생산된 세포를 선별하는 단계를 더욱 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 유전자 복제에 중요한 역할을 하는 적어도 2 종류 이상의 오류-빈발 빈도 작용제가 존재함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도 작용제의 적어도 약 30% 이상은 더 작은 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 45항에 있어서, 상기 유전자 복제에 중요한 역할을 하는 작용제는 이질성 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 45항에 있어서, 상기 더 작은 오류-빈발 빈도를 지닌 작용제는 실질적으 로 무-오류임을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 101 이상까지 서로 다름을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 102 이상까지 서로 다름을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도는 적어도 103 이상까지 서로 다름을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 비정상 염기를 제거할 수 있는 복구 작용제 및 미스매치된 염기쌍을 복구할 수 있는 복구 작용제로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제의 오류-빈발 빈도를 조절하는 것을 포함하고, 상기 작용제는 세포 내에 존재함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포 내 이중-스트랜드 게놈 DNA의 하나의 스트랜드와 다른 스트랜드 사이의 오류 수의 차이를 제공하는 것을 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 세포의 DNA 중합효소의 오류-빈발 빈도를 조절하는 것을 포함함을 특징으로 하는 방법
- 제 56항에 있어서, 상기 DNA 중합효소는 프루프리딩 기능을 지님을 특징으로 하는 방법
- 제 56항에 있어서, 상기 DNA 중합효소는 진핵세포의 DNA 중합효소 α, DNA 중합효소 β, DNA 중합효소 γ, DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소를 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 진핵세포의 DNA 중합효소 δ 및 DNA 중합효소 ε 및 그에 상응하는 DNA 중합효소로 구성된 군으로부터 선택된 적어도 하나 이상의 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 프루프리딩 활성을 조절하는 것을 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 세포 내로 DNA 중합효소 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
- 제 61항에 있어서, 상기 세포 내로 DNA 중합효소 변이체를 도입시키는 것은 유전자 도입 또는 플라스미드를 이용한 상동적 재조합 및 형질전환으로 구성된 군으로부터 선택된 방법으로 수행됨을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 것은 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체를 도입시키는 것을 포함함을 특징으로 하는 방법
- 제 63항에 있어서, 상기 진핵세포의 DNA 중합효소 δ 또는 그에 상응하는 DNA 중합효소의 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도를 조절하는 단계는 야생형 세포보다 더 높게 오류-빈발 빈도를 증가시키는 것을 포함함을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 야생형 DNA 중합효소보다 더 낮음을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적 어도 하나 이상의 미스매치된 염기를 제공하고, 적어도 하나 이상의 미스매치된 염기의 수는 야생형 DNA 중합효소보다 적어도 하나 이상까지 더 큼을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 적어도 2 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-6의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-3의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 57항에 있어서, 상기 DNA 중합효소의 프루프리딩 기능은 염기 서열 내 10-2의 비율로 적어도 하나 이상의 미스매치된 염기를 제공함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 그람-양성 또는 진핵성 세포임을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 단세포성 또는 다세포성 생물체임을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 동물, 식물, 진균 또는 효모 세포임을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 포유류 세포임을 특징으로 하는 방법
- 제 45항에 있어서, 유전 형질의 전환 후 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지님을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 자연적으로 지니고, 상기 적어도 2 종류 이상의 중합효소는 다른 오류-빈발 빈도를 지님을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 적어도 2 종류 이상의 중합효소를 지니고, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈 발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 환경에 대한 저항성을 지니고, 상기 저항성은 전환 이전 세포에 의해 보유되지 않음을 특징으로 하는 방법
- 제 82항에 있어서, 상기 환경은 파라미터로서 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 암 세포를 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 조직을 구성함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포는 생물체를 구성함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 세포의 유전 형질의 전환 후 세포를 조직 또는 생물체로 분화시키는 단계를 더욱 포함함을 특징으로 하는 방법
- 제 45항에 있어서, 상기 오류-빈발 빈도는 미리 결정된 조건 하에서 조절됨을 특징으로 하는 방법
- 제 88항에 있어서, 상기 오류-빈발 빈도는 온도, 습도, pH, 염 농도, 영양물, 금속, 기체, 유기 용매, 압력, 대기압, 점도, 유속, 광도, 광 파장, 전자파, 방사선, 중력, 장력, 음파, 상기 세포 이외의 세포, 화학제, 항생제, 천연물질, 정신적 스트레스 및 물리적 스트레스 또는 그의 결합으로 구성된 군으로부터 선택된 적어도 하나 이상의 작용제를 조절함으로서 조절됨을 특징으로 하는 방법
- (a) 생물체의 유전자 복제의 오류-빈발 빈도를 조절하는 단계; 및(b) 수득된 생물체를 재생산시키는 단계를 포함한:조절된 유전 형질을 지닌 생물체를 생성하는 방법
- 제 90항에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 세포
- 제 91항에 있어서, 상기 세포는 야생형 세포와 실질적으로 동일한 생장을 지님을 특징으로 하는 세포
- 제 90항에 따른 방법에 의해 생성된, 조절된 유전 형질을 지닌 생물체
- 제 93항에 있어서, 상기 생물체는 야생형 생물체와 실질적으로 동일한 생장을 지님을 특징으로 하는 생물체
- (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;(b) 수득된 생물체를 재생산시키는 단계;(c) 생물체 내의 돌연변이를 확인하는 단계; 및(d) 확인된 돌연변이를 지닌 유전자를 인코드하는 핵산 분자를 생성하는 단계를 포함한:조절된 유전 형질을 지닌 유전자를 인코드하는 핵산 분자를 생성하는 방법
- 제 95항에 따른 방법에 의해 생성된 핵산 분자
- (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;(b) 수득된 생물체를 재생산시키는 단계;(c) 생물체 내의 돌연변이를 확인하는 단계; 및(d) 확인된 돌연변이를 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 단계를 포함한:조절된 유전 형질을 지닌 유전자에 의해 인코드된 폴리펩타이드를 생성하는 방법
- 제 97항에 따른 방법에 의해 생성된 폴리펩타이드
- (a) 생물체의 유전자 복제의 오류-빈발 빈도를 변화시키는 단계;(b) 수득된 생물체를 재생산시키는 단계;(c) 생물체 내의 돌연변이를 확인하는 단계; 및(d) 확인된 돌연변이를 지닌 대사산물을 생성하는 단계를 포함한:조절된 유전 형질을 지닌 생물체의 대사산물을 생성하는 방법
- 제 99항에 따른 방법에 의해 생성된 대사산물
- 조절된 오류-빈발 빈도를 지닌 DNA 중합효소를 인코드하는 핵산 서열을 포함한, 생물체의 유전 형질을 조절하기 위한 핵산 분자
- 제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소임을 특징으로 하는 핵산 분자
- 제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 ε 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
- 제 101항에 있어서, 상기 DNA 중합효소는 진핵성 생물체의 DNA 중합효소 δ 또는 그람-양성 박테리아의 그에 상응하는 DNA 중합효소의 변이체이고, 상기 변이체는 그의 프루프리딩 활성만을 삭제하는 돌연변이를 포함함을 특징으로 하는 핵산 분자
- 제 101항에 따른 핵산 분자를 포함한 벡터
- 제 101항에 따른 핵산 분자를 포함한 세포
- 제 106항에 있어서, 상기 세포는 진핵성 세포임을 특징으로 하는 세포
- 제 107항에 있어서, 상기 진핵성 세포는 식물, 동물 및 효모로 구성된 군으로부터 선택됨을 특징으로 하는 세포
- 제 106항에 있어서, 상기 세포는 그람-양성 박테리아 세포임을 특징으로 하는 세포
- 제 106항에 있어서, 상기 세포는 유전 형질의 전환율을 조절하기 위해 이용됨을 특징으로 하는 방법
- 제 101항에 따른 핵산 분자를 포함한 생물체
- 제 106항에 따른 세포 또는 그의 일부에 의해 생성된 생성물 물질
- 제 106항에 따른 세포 또는 그의 일부에 포함된 핵산 분자
- 조절된 유전 형질에 관련된 유전자를 인코드하는 제 113항에 따른 핵산 분자
- 질병 모델로서 제 106항에 따른 세포를 이용하여 약물의 효과를 시험하는 단계;대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
- 질병 모델로서 제 111항에 따른 생물체를 이용하여 약물의 효과를 시험하는 단계;대조군으로서 야생형 세포를 이용하여 약물의 효과를 시험하는 단계; 및질병 모델과 대조군을 비교하는 단계를 포함한 약물의 시험 방법
- 생물체의 유전 형질의 전환율을 조절하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
- 제 117항에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
- 제 117항에 있어서, 상기 중합효소 세트는 동일한 종으로부터 유래됨을 특징으로 하는 세트
- 조절된 유전 형질을 지닌 생물체를 생성하는데 이용되기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소 세트
- 제 120항에 있어서, 상기 적어도 2 종류 이상의 중합효소 중 하나는 래깅(lagging) 스트랜드의 오류-빈발 빈도에 관련되고, 상기 적어도 2 종류 이상의 중합효소 중 또다른 하나는 리딩(leading) 스트랜드의 오류-빈발 빈도에 관련됨을 특징으로 하는 세트
- 제 121항에 있어서, 상기 중합효소 세트는 동일한 생물체 종으로부터 유래됨을 특징으로 하는 세트
- 생물체의 유전 형질의 전환율을 조절하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용
- 조절된 유전 형질을 지닌 생물체를 생성하기 위한 다른 오류-빈발 빈도를 지닌 적어도 2 종류 이상의 중합효소의 이용
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2003-00092898 | 2003-03-28 | ||
JP2003092898 | 2003-03-28 | ||
US10/684,141 US20050003536A1 (en) | 2003-03-28 | 2003-10-10 | Method and system for rapidly conferring a desired trait to an organism |
US10/684,141 | 2003-10-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060002010A true KR20060002010A (ko) | 2006-01-06 |
Family
ID=33134306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057018129A KR20060002010A (ko) | 2003-03-28 | 2004-03-26 | 생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및시스템 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20050054597A1 (ko) |
EP (1) | EP1608750A2 (ko) |
JP (1) | JP2006521113A (ko) |
KR (1) | KR20060002010A (ko) |
AU (1) | AU2004225648B2 (ko) |
BR (1) | BRPI0409528A (ko) |
CA (1) | CA2520479A1 (ko) |
WO (1) | WO2004087960A2 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001251086A1 (en) * | 2000-03-31 | 2001-10-15 | Sir Mortimer B. Davis Jewish General Hospital | Microchip arrays of regulatory genes |
US20050003536A1 (en) * | 2003-03-28 | 2005-01-06 | Neo-Morgan Laboratory Incorporated | Method and system for rapidly conferring a desired trait to an organism |
JP2007061025A (ja) * | 2005-08-31 | 2007-03-15 | Neo-Morgan Laboratory Inc | アルカリ耐性に優れた生物およびアルカリ耐性に優れた生物の作製方法 |
JP2007061022A (ja) * | 2005-08-31 | 2007-03-15 | Neo-Morgan Laboratory Inc | 有機溶媒耐性に優れた生物および有機溶媒耐性に優れた生物の作製方法 |
JP2007061024A (ja) * | 2005-08-31 | 2007-03-15 | Neo-Morgan Laboratory Inc | 乳酸耐性に優れた生物および乳酸耐性に優れた生物の作製方法 |
JP5119466B2 (ja) * | 2006-07-14 | 2013-01-16 | 独立行政法人産業技術総合研究所 | 酵母の製造方法、酵母、及び糖タンパク質又はβ−グルカンの製造方法 |
JP2011101596A (ja) * | 2008-03-03 | 2011-05-26 | Neo-Morgan Laboratory Inc | さえずり変異マウス |
EP2268821A1 (en) * | 2008-04-25 | 2011-01-05 | New York Blood Center, Inc. | Abi1/hssh3bp1 conditional knockout mouse |
US20090311790A1 (en) * | 2008-06-13 | 2009-12-17 | Neo-Morgan Laboratory Incorporated | Method of directing the evolution of an organism |
JP6111667B2 (ja) | 2011-04-28 | 2017-04-12 | 東レ株式会社 | 乳酸生産酵母変異株および乳酸の製造方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69835360T2 (de) * | 1997-01-17 | 2007-08-16 | Maxygen, Inc., Redwood City | EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION |
US6949383B2 (en) * | 1998-11-11 | 2005-09-27 | Japan Science And Technology Corporation | Mutagenesis method |
JP4304328B2 (ja) * | 2002-10-21 | 2009-07-29 | 独立行政法人農業・食品産業技術総合研究機構 | Dnaの変異導入法 |
US20050003536A1 (en) * | 2003-03-28 | 2005-01-06 | Neo-Morgan Laboratory Incorporated | Method and system for rapidly conferring a desired trait to an organism |
-
2004
- 2004-03-26 KR KR1020057018129A patent/KR20060002010A/ko not_active Application Discontinuation
- 2004-03-26 WO PCT/JP2004/004378 patent/WO2004087960A2/en active Application Filing
- 2004-03-26 AU AU2004225648A patent/AU2004225648B2/en not_active Ceased
- 2004-03-26 EP EP04723759A patent/EP1608750A2/en not_active Withdrawn
- 2004-03-26 CA CA002520479A patent/CA2520479A1/en not_active Abandoned
- 2004-03-26 JP JP2006507696A patent/JP2006521113A/ja active Pending
- 2004-03-26 BR BRPI0409528-6A patent/BRPI0409528A/pt not_active IP Right Cessation
- 2004-03-26 US US10/810,486 patent/US20050054597A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2006521113A (ja) | 2006-09-21 |
AU2004225648B2 (en) | 2008-05-01 |
WO2004087960A2 (en) | 2004-10-14 |
WO2004087960A3 (en) | 2004-12-16 |
EP1608750A2 (en) | 2005-12-28 |
AU2004225648A1 (en) | 2004-10-14 |
CA2520479A1 (en) | 2004-10-14 |
BRPI0409528A (pt) | 2006-05-02 |
US20050054597A1 (en) | 2005-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102194612B1 (ko) | 비-유전성 물질을 이용한 식물 게놈의 부위-특이적인 변형 방법 | |
AU2023204276A1 (en) | Novel CRISPR-associated transposases and uses thereof | |
AU2019276382B2 (en) | Use of Yr4DS gene of Aegilops tauschii in stripe rust resistance breeding of Triticeae plants | |
KR20180034402A (ko) | 신규한 crispr 효소 및 시스템 | |
AU2016355682A1 (en) | Haploid induction compositions and methods for use therefor | |
US6734019B1 (en) | Isolated DNA that encodes an Arabidopsis thaliana MSH3 protein involved in DNA mismatch repair and a method of modifying the mismatch repair system in a plant transformed with the isolated DNA | |
JP2015535010A (ja) | 部位特異的酵素および使用方法 | |
CN110892074A (zh) | 用于增加香蕉的保质期的组成物及方法 | |
CN108064297A (zh) | 小麦育性相关基因TaMS7及其应用方法 | |
CN111542610A (zh) | 精确基因组编辑的新策略 | |
KR20060002010A (ko) | 생물체에 원하는 형질을 빠르게 부여하기 위한 방법 및시스템 | |
CN109134633B (zh) | 抗稻瘟病蛋白和基因、分离的核酸及其应用 | |
WO2021104542A1 (zh) | 水稻基因OsATL15在调节农药的吸收转运中的应用 | |
CN107326035B (zh) | 一种调控水稻粒型和叶色的去泛素化酶基因ubp5及其应用 | |
JP4015911B2 (ja) | ブラシノステロイドの生合成に関与しているシトクロムp450モノオキシゲナーゼ遺伝子の改変および/または過剰発現による単子葉植物の形質の制御方法およびこの遺伝子を用いて改変された単子葉植物 | |
JP2006521113A5 (ko) | ||
CN111560055B (zh) | 水稻基因OsLAT3在调节敌草快的吸收累积中的应用 | |
CN111154770B (zh) | 水稻基因OsABCC2在调节农药的吸收转运中的应用 | |
CA2329756A1 (en) | Novel maize orthologues of bacterial reca proteins | |
JP2007143562A5 (ko) | ||
JP2007143562A (ja) | 所望の形質を生物に迅速に付与する方法およびシステム | |
KR20220066111A (ko) | Dna 염기 편집을 위한 방법 및 조성물 | |
US20050003536A1 (en) | Method and system for rapidly conferring a desired trait to an organism | |
CN112010953A (zh) | 小麦白粉病抗性相关蛋白Pm24及其编码基因和应用 | |
CN111019968B (zh) | NTS/dNTS组合在制备植物突变体中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |