KR20210053902A - 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde - Google Patents
글리코겐 저장 질환 iii 의 치료를 위한 미니-gde Download PDFInfo
- Publication number
- KR20210053902A KR20210053902A KR1020217006722A KR20217006722A KR20210053902A KR 20210053902 A KR20210053902 A KR 20210053902A KR 1020217006722 A KR1020217006722 A KR 1020217006722A KR 20217006722 A KR20217006722 A KR 20217006722A KR 20210053902 A KR20210053902 A KR 20210053902A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- seq
- glu
- ala
- ile
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2451—Glucanases acting on alpha-1,6-glucosidic bonds
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
- C12N9/1055—Levansucrase (2.4.1.10)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01025—4-Alpha-glucanotransferase (2.4.1.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01033—Amylo-alpha-1,6-glucosidase (3.2.1.33)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physical Education & Sports Medicine (AREA)
- Neurology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Saccharide Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines Containing Plant Substances (AREA)
Abstract
본 발명은 글리코겐 저장 질환 III 의 치료를 위한 미니-GDE 에 관한 것이다.
Description
본 발명은 글리코겐 저장 질환 III (Glycogen storage disease III, GSDIII) 의 치료에 관한 것이다.
AGL 유전자의 돌연변이는 글리코겐 탈분지 효소 (glycogen debranching enzyme, GDE), 또는 글리코겐 분해에 관여하는 효소인 "아밀로-알파-1,6-글루코시다제, 4-알파-글루카노트랜스페라아제" 의 유전적 결핍을 유발한다. GDE 는 단백질 상의 상이한 자리에서 일어나는 2개의 독립적인 촉매 활성을 갖는다: 4-알파-글루코트랜스페라아제 활성 및 아밀로-1,6-글루코시다제 활성. GDE 의 유전적 결핍은 글리코겐 저장 질환 III (GSD III) 에서 불완전한 글리코겐분해를 유발하고, 이는 다양한 기관, 주로 간과 근육에서 짧은 외쇄를 갖는 비정상적인 글리코겐의 축적을 초래한다. 상기 질환은 간비대, 저혈당증, 단신, 가변 근육병증 및 심근병증을 특징으로 한다. 대부분의 환자는 간과 근육 모두를 포함하는 질환 (IIIa 형) 을 갖는 반면, 일부 환자 (~15 %) 는 단지 간 관여를 갖는다 (IIIb 형). 간 증상은 대개 소아기에 나타난다. 간경변 및 간세포 암종은 일부 경우에 보고되어 왔다 (Chen et al., 2009, Scriver's Online Metabolic & Molecular Bases of inherited Disease, New York: McGraw-Hill; Kishnani et al., 2010, Genet Med 12, 446-463). 근육 약화가 소아기 동안 존재했을 수 있다. 그것은 성인에서 더욱 우세하게 되며 삼십대 또는 사십대에 발병한다. 진행성 근육 약화로부터 유의한 이환율이 존재하고, 후기 단계의 환자는 휠체어 신세를 지게 될 수 있다. 환자는 또한 심근병증을 발달시킬 수 있다. 이들 환자가 발병하는 증상의 중증도에는 상당한 임상적 가변성이 있다. 진행성 근육병증 및/또는 심근병증 및/또는 말초신경병증은 성인에서 주된 이환의 원인이다 (Kishnani et al., 2010, Genet Med 12, 446-463; Cornelio et al., 1984, Arch Neurol 41, 1027-1032; Coleman et al., 1992, Ann Intern Med 116, 896-900). 질환과 관련된 가능한 신경학적 증상의 보고는 주의 변동, 실행 기능의 결핍 및 손상된 감정 기술을 보고한 GSDIII 환자와 함께 일하는 임상의로부터 유래한다 (Michon et al., 2015, J Inherit Metab Dis, 38(3): 573-580). 따라서, 상기 질환의 GDE-/- 마우스 모델에서, 신경계 전반에 걸쳐 글리코겐의 광범위한 축적이 기록되었지만 (Pagliarani et al., 2014, Biochim Biophys Acta, 1842(11): 2318-2328; Liu et al., 2014, Mol Genet Metab, 111(4): 467-476), 글리코겐의 축적과 연관된 표현형의 신중한 특성분석이 여전히 누락되어 있다. 현재 치료법은 증상을 보이며, 질환에 대한 효과적인 치료법은 없다. 저혈당증은 옥수수전분 보충물을 포함하는 고탄수화물 빈번한 식사 또는 야간 위 적하 급식 (nocturnal gastric drip feedings) 에 의해 조절될 수 있다. 근육병증 환자는 낮시간 및 밤새 장내 주입 동안 고단백질 식이로 치료되어 왔다. 일부 환자에서 일시적인 증상의 개선이 기록되었지만, 고단백질 식이가 진행성 근육병증을 예방 또는 치료한다는 것을 입증하는 조직 연구 또는 장기간 데이터는 존재하지 않는다 (Kishnani et al., 2010, Genet Med 12, 446-463). 이러한 접근법은 이러한 질환의 장기간 경과 및 이환율을 변경하는데 거의 도움이 안된다.
그러므로, GSD III 의 장기간 치료에 대한 필요가 여전히 존재한다. 병든 조직에서 GDE 단백질을 안정적으로 대체하는 것을 목표로 하는 유전자 요법은 잠재적인 치료 접근법으로서 보인다. 그러나, 큰 크기의 GDE 이식유전자는 대부분의 유전자 요법 벡터의 크기 한계를 맞출 수 없으므로 큰 장애가 된다. 실제로, 인간 AGL 유전자는 85 kb 길이이고, 175 kDa GDE 단백질을 발현하는 4596-bp 코딩 영역 및 2371-bp 3' 비번역 서열을 포함하는 7.4-kb mRNA 를 코딩하는 35 개의 엑손으로 구성된다 (Bao Y et al., 1996, Genomics., 38(2):155-65). 이는 이것은 실제 문제가 되며, 그 이유는 GDE 발현 카세트 (예를 들어 AAV 벡터의 경우 적어도 프로모터, GDE 코딩 서열, polyA 신호 및 두 개의 ITR 을 포함함) 의 최소 크기는 생체내 (in vivo) 유전자 전달을 위한 AAV 유전자 요법 벡터 내로 패키징될 수 있는 게놈 크기 한계인, 5 kb 보다 클 것이기 때문이다. 본 발명자들은 이전에 듀얼 AAV 벡터의 사용으로 이러한 크기 한계를 극복할 것을 제안했다. 이러한 접근법에 뒤이어, 큰 이식유전자 코딩 서열의 일부를 각각 함유하는, 두 개의 벡터를 사용하여 동일한 세포를 형질도입한다. 듀얼 AAV 벡터의 사용은 유망하므로, 경제적 이유 및 현실적 이유 모두를 위해 오직 하나의 바이러스 벡터를 실행하는 유전자 요법 전략을 제공하는 것이 바람직할 것이다.
그러므로 GSD III 의 치료에서 유전자 요법을 개선하는 신규한 전략에 대한 필요가 존재한다.
본 발명의 제 1 양태는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된 기능성 절두된 (functional truncated) 인간 GDE 폴리펩티드에 관한 것이다. 특정 구현예에서, 기준 전장 인간 GDE 서열은 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 및 1235-1532 에서의 아미노산 잔기를 포함하거나;
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함하거나; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다.
다른 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 적어도 하나의 아미노산이거나;
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 적어도 하나의 아미노산이거나; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 적어도 하나의 아미노산이다.
또 다른 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
추가 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 15 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 30 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 81 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 103 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 129 의 아미노산의 결실; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 13 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 64 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 86 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 112 의 아미노산의 결실; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 14 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 65 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 87 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 113 의 아미노산의 결실.
추가의 특정 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기 표 2 에 제시된 바와 같은 결실 또는 결실의 조합을 포함한다. 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 하기를 포함한다:
(i) 하기 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) 하기 표 3 에 제시된 바와 같은, 결실 또는 결실의 조합.
그러한 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2-10 및 SEQ ID NO:48-52 로부터, 특히 SEQ ID NO:2-6 로부터 선택되는 서열을 갖는 것을, 제한 없이, 포함한다. 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2, 5 또는 6 으로부터 선택되는 서열을 포함하거나 그것으로 이루어지는 서열을 갖는다. 추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:5 에 제시된 서열을 포함하거나 그것으로 이루어지는 서열을 갖는다.
또다른 양태에서, 본 발명은 본원에 개시된 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.
추가의 양태에서, 본 발명은 하기를, 바람직하게는 이 순서대로, 포함하는 핵산 구축물에 관한 것이다:
- 프로모터;
- 임의로, 인트론;
- 본 발명의 기능성 절두된 인간 폴리펩티드를 코딩하는, 본원에 개시된 핵산 분자; 및
- 폴리아데닐화 신호.
또다른 양태에서, 본 발명은 하기를 포함하는 벡터에 관한 것이다:
- 본 발명의 핵산 분자; 또는
- 본 발명의 핵산 구축물.
특정 구현예에서, 벡터는 바이러스 벡터일 수 있다.
추가의 양태에 따르면, 본 발명은 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 구축물을 포함하는 바이러스 벡터로서, 기능성 비-인간 GDE 폴리펩티드는 약 1500 개 미만의 아미노산을 포함하는, 바이러스 벡터에 관한 것이다. 기능성 비-인간 GDE 폴리펩티드는 하기로 이루어지는 군에서, 제한 없이, 선택될 수 있다: SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 (Pteropus alecto) GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드이다.
본 발명의 벡터의 특정 구현예에서, 상기 벡터는 AAV 벡터 또는 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터일 수 있다. 특정 구현예에서, 벡터는 AAV 벡터, 예컨대 단일 가닥 또는 이중 가닥 자기 상보적 AAV 벡터, 바람직하게는 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV9P1, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖는 또는 키메라 캡시드를 갖는 AAV 벡터이다. 특정 구현예에서, AAV 벡터는 AAV9, AAV9P1 또는 AAV6 캡시드를 갖는다.
추가의 양태에서, 본 발명은 본 발명의 핵산 분자, 핵산 구축물 또는 벡터로 형질전환된 단리된 세포에 관한 것이다. 세포는, 예를 들어, 간 세포, 근육 세포, 심장 세포 또는 CNS 세포일 수 있다.
또다른 양태에서, 본 발명은 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포를, 약학적으로 허용가능한 담체에, 포함하는 약학적 조성물에 관한 것이다.
본 발명은 또한, 특정 양태에서, 약제로서 사용하기 위한, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 기능성 비-인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포에 관한 것이다.
추가의 양태에서, 본 발명은 GSDIII (코리병 (Cori disease)) 의 치료 방법에서 사용하기 위한, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 기능성 비-인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포에 관한 것이다.
본 발명은 또한 GSDIII (코리병) 의 치료 방법에서 사용하기 위한, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드에 관한 것이다.
도 1. 감소된 크기의 비-인간 포유류 GDE 서열. 아미노산 수로서 표현되는, 상이한 포유류 GDE 단백질의 크기가 보고된다 (paGDE: 검은날여우박쥐 GDE 서열, oGDE: 오랑우탄 GDE 서열, gGDE: 고릴라 GDE 서열, hoGDE: 말 GDE 서열, hGDE: 인간 아이소폼 (isoform) 1 GDE 서열).
도 2. 인간 GDE 서열 상의 상이한 절두의 도해적 표현. 세 가지 상이한 인간 GDE 절두, Δ1, Δ2-3 및 Δ4 가 보고된다.
도 3. gGDE 단백질 발현. GDE 녹-아웃 (knock-out) (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE (gGDE) 를 발현하는 단일 AAV9 벡터를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 웨스턴 블롯에 의해 심장에서 GDE 를 검출했다. 야생형 (Wild-type) (WT) GDE-KO 동물을 양성 및 음성 컨트롤로서 각각 사용했다.
도 4. AAV9-gGDE 벡터는 사두근으로부터 글리코겐을 효율적으로 제거한다. GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 사두근에서 글리코겐 축적을 측정했다. 이와 병행하여, 동일 연령 (age-matched) 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 글리코겐을 측정했다. 통계적 분석을 ANOVA 에 의해 수행했다 (*** = p<0.001, **** = p<0.0001, ns = 유의하지 않음).
도 5. AAV9-gGDE 벡터는 GSDIII 마우스에서 근육 기능을 구조한다 (rescue). GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 근육 기능을 와이어 행 테스트 (wire-hang test) 에 의해 점수매겼다. 그래프에서 동일 연령 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 측정된 와이어 행 성능이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (**** = p<0.0001, ns = 유의하지 않음).
도 6. 시험관내 절두된 GDE 활성의 측정. Huh-7 세포를 CMV 프로모터의 제어 하에 전체 크기 인간 GDE (hGDE), 하나의 절두된 인간 GDE (GDE Δ4) 또는 고릴라 GDE (gGDE) 를 발현하는 플라스미드로 트랜스펙션시켰다. 이와 병행하여 세포를 컨트롤로서의 GFP-발현 플라스미드로 트랜스펙션시켰다. 트랜스펙션 후 48 시간째에, 시토졸 추출물을 준비하고, GDE 활성을 측정했다. 막대그래프에서 한계 덱스트린의 소화로부터 방출된 글루코스로서 표현되는 GDE 활성의 수준이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (* = p<0.05 vs CMV-hGDE).
도 7. 절두된 GDE 가 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE) 또는 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1011 vg/마우스의 인간 전체 크기 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 주입후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다. 액틴을 로딩 컨트롤로서 사용했다.
도 8. 절두된 GDE 는 생체내에서 활성이다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 야생형 (wt) 또는 코돈 최적화된 (co) 인간 GDE 코딩 서열로부터 유래된 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE, AAV9-Δ4-GDE, AAV9-Δ2/3-GDE) 를 주입했다. 이와 병행하여 마우스에게 1x1011 vg/마우스의 코돈 최적화된 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDEco) 를 또는 컨트롤로서의 PBS 를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 활성을 분석했다.
도 9. 절두된 GDE 가 시험관내에서 생산된다. HEK293T 세포를 전체 크기 GDE (GDEfs) 또는 5 가지 절두된 인간 GDE (Δ9 + Δ2/3; Δ10 + Δ2/3; Δ11 + Δ2/3; Δ12 + Δ2/3; Δ13 + Δ2/3) 를 발현하는 플라스미드로 트랜스펙션시켰다. GFP 트랜스펙션된 세포를 컨트롤로서 사용했다. 트랜스펙션 후 3 일째에, 세포를 수확하고, 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
도 10. 절두된 GDE 는 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 2x1011 vg/마우스의 전체 크기 GDE (GDEfs) 또는 7 가지 절두된 인간 GDE (Δ2/3; Δ9 + Δ2/3; Δ10 + Δ2/3; Δ13 + Δ2/3; 및 Δ1) 를 발현하는 AAV9 벡터를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
도 2. 인간 GDE 서열 상의 상이한 절두의 도해적 표현. 세 가지 상이한 인간 GDE 절두, Δ1, Δ2-3 및 Δ4 가 보고된다.
도 3. gGDE 단백질 발현. GDE 녹-아웃 (knock-out) (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE (gGDE) 를 발현하는 단일 AAV9 벡터를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 웨스턴 블롯에 의해 심장에서 GDE 를 검출했다. 야생형 (Wild-type) (WT) GDE-KO 동물을 양성 및 음성 컨트롤로서 각각 사용했다.
도 4. AAV9-gGDE 벡터는 사두근으로부터 글리코겐을 효율적으로 제거한다. GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 사두근에서 글리코겐 축적을 측정했다. 이와 병행하여, 동일 연령 (age-matched) 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 글리코겐을 측정했다. 통계적 분석을 ANOVA 에 의해 수행했다 (*** = p<0.001, **** = p<0.0001, ns = 유의하지 않음).
도 5. AAV9-gGDE 벡터는 GSDIII 마우스에서 근육 기능을 구조한다 (rescue). GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 근육 기능을 와이어 행 테스트 (wire-hang test) 에 의해 점수매겼다. 그래프에서 동일 연령 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 측정된 와이어 행 성능이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (**** = p<0.0001, ns = 유의하지 않음).
도 6. 시험관내 절두된 GDE 활성의 측정. Huh-7 세포를 CMV 프로모터의 제어 하에 전체 크기 인간 GDE (hGDE), 하나의 절두된 인간 GDE (GDE Δ4) 또는 고릴라 GDE (gGDE) 를 발현하는 플라스미드로 트랜스펙션시켰다. 이와 병행하여 세포를 컨트롤로서의 GFP-발현 플라스미드로 트랜스펙션시켰다. 트랜스펙션 후 48 시간째에, 시토졸 추출물을 준비하고, GDE 활성을 측정했다. 막대그래프에서 한계 덱스트린의 소화로부터 방출된 글루코스로서 표현되는 GDE 활성의 수준이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (* = p<0.05 vs CMV-hGDE).
도 7. 절두된 GDE 가 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE) 또는 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1011 vg/마우스의 인간 전체 크기 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 주입후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다. 액틴을 로딩 컨트롤로서 사용했다.
도 8. 절두된 GDE 는 생체내에서 활성이다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 야생형 (wt) 또는 코돈 최적화된 (co) 인간 GDE 코딩 서열로부터 유래된 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE, AAV9-Δ4-GDE, AAV9-Δ2/3-GDE) 를 주입했다. 이와 병행하여 마우스에게 1x1011 vg/마우스의 코돈 최적화된 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDEco) 를 또는 컨트롤로서의 PBS 를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 활성을 분석했다.
도 9. 절두된 GDE 가 시험관내에서 생산된다. HEK293T 세포를 전체 크기 GDE (GDEfs) 또는 5 가지 절두된 인간 GDE (Δ9 + Δ2/3; Δ10 + Δ2/3; Δ11 + Δ2/3; Δ12 + Δ2/3; Δ13 + Δ2/3) 를 발현하는 플라스미드로 트랜스펙션시켰다. GFP 트랜스펙션된 세포를 컨트롤로서 사용했다. 트랜스펙션 후 3 일째에, 세포를 수확하고, 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
도 10. 절두된 GDE 는 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 2x1011 vg/마우스의 전체 크기 GDE (GDEfs) 또는 7 가지 절두된 인간 GDE (Δ2/3; Δ9 + Δ2/3; Δ10 + Δ2/3; Δ13 + Δ2/3; 및 Δ1) 를 발현하는 AAV9 벡터를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
발명의 상세한 설명
임의의 개시된 값 또는 범위에 대해 본원에서 사용되는 바와 같은, 용어 "약" 은 언급된 수치 값이 약간의 부정확성, 예를 들어, 그 값에 상당히 가까운 값 또는 거의, 예컨대 언급된 값 또는 범위의 플러스 또는 마이너스 10 %, 특히 예컨대 플러스 또는 마이너스 5% 를 허용한다는 것을 시사한다.
GDE 단백질의 삼차원 구조에 관한 지식의 결여에도 불구하고, 본 발명자들은 코딩 서열이 유전자 요법 벡터 내로 패키징될 수 있을 정도로 충분히 작으면서도, GDE 기능성을 보존하는 GDE 폴리펩티드를 식별했다, 그 외에는 "미니 (mini)-GDE 폴리펩티드" 로서 언급된다.
"유전자 요법 벡터" 는 유전자 요법에 적합한 임의의 벡터를 의미한다. 특히, 유전자 요법 벡터는 플라스미드 또는 재조합 바이러스 예컨대 레트로바이러스 또는 렌티바이러스에서 유래되는 바이러스 벡터일 수 있다. 바람직하게는, 바이러스 벡터는 AAV 벡터, 예컨대 간 조직 또는 근육 세포를 형질도입시키기에 적합한 AAV 벡터이다. 임상 시험에서 및 전임상 모델의 근육 질환에서의 광범위한 경험은 아데노-연관 바이러스 (adeno-associated virus) (AAV) 를 GSDIII 를 위한 생체내 유전자 요법에서 선택되는 벡터로서 시사한다. 이들 벡터는 간 및 근육을 효율적으로 형질도입시키고, 그들의 생산은 규모 확장할 수 있고, 다른 유전자 요법 벡터와 비교하여 그들은 상대적으로 낮은 면역원성 프로파일을 갖는다. 그러나, 유전자 대체를 위해 AAV 를 사용함에 있어서 가장 큰 제한 중 하나는 그들의 제한된 캡시드화 (encapsidation) 크기 한계 (약 5 kb) 이다. 실제로, 재조합 AAV 생산 동안, 5 kb 보다 큰 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 단편화된 게놈을 함유할 수 있으며, 이는 유전자 전달의 효능을 감소시킨다.
아래에서 상세히 설명될 바와 같이, 본 발명의 맥락에서, 표현 "미니-GDE 폴리펩티드" 는 (i) 기능성 절두된 인간 GDE 폴리펩티드 또는 (ii) 기능성 비-인간 GDE 폴리펩티드를 망라한다.
본 발명의 제 1 양태는 따라서 코딩 서열이 단일 AAV 벡터 내로 효율적으로 패키징될 수 있을 정도로 충분히 작은 기능성 미니-GDE 폴리펩티드이다.
"기능성" GDE 폴리펩티드는 GDE 단백질의 효소적 활성 중 적어도 하나, 바람직하게는 GDE 단백질의 효소적 활성의 전부를, 적어도 부분적으로, 유지하는 폴리펩티드를 의미한다. 그 결과, 본 발명에서 실행되는 기능성 GDE 폴리펩티드는 생체내에서 글리코겐 축적 및 근육 강도를 구조할 수 있다. 위에서 정의된 바와 같이, GDE 효소적 활성은 글리코겐 분해에 관여하는, 4-알파-글루코트랜스페라아제 활성 및 아밀로-1,6-글루코시다제 활성이다. GDE 의 트랜스페라아제 활성은 글리코겐의 글루코스 단위체 세 개를 하나의 사슬로부터 또다른 사슬로 재배치한다. 이는 하나의 글루코스 단위체를 분지점에 남기며, 이는 후속적으로 글루코시다제 활성에 의해 글루코스로서 방출된다. 특정 구현예에서, 본 발명의 기능성 미니-GDE 폴리펩티드는 전장 GDE 폴리펩티드와, 특히 전장 인간 GDE 폴리펩티드와 동일한 기능성을 갖는다. 예를 들어, 본 발명의 기능성 미니-GDE 폴리펩티드는 위에 기재된 하나, 바람직하게는 둘 모두의, 효소적 활성에 관하여 적어도 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 또는 적어도 99 %, 또는 전장 인간 GDE 단백질, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 의 전장 인간 GDE 단백질과 비교하여 적어도 100 % 의 활성을 가질 수 있다. 본 발명의 미니-GDE 단백질의 활성은 전장 인간 GDE 단백질, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 의 전장 인간 GDE 단백질의 활성의 심지어는 100 % 초과, 예컨대 110 %, 120 %, 130 %, 140 %, 150%, 200%, 500%, 700% 초과, 또는 심지어는 1000 % 초과일 수 있다.
통상의 기술자는 폴리펩티드가 기능성 GDE 폴리펩티드인지 여부를 용이하게 확인할 수 있다. 적합한 방법은 통상의 기술자에게 명백할 것이다. 예를 들어, 하나의 적합한 시험관내 방법은 폴리펩티드를 코딩하는 핵산을 벡터, 예컨대 플라스미드 또는 바이러스 벡터 내로 삽입하는 것, 숙주 세포, 예컨대 293T 또는 HeLa 세포, 또는 다른 세포 예컨대 Huh7 를, 벡터로 트랜스펙션 또는 형질도입시키는 것, 및 GDE 활성에 대해 어세이하는 것을 수반한다. 적합한 방법은 아래 실험 파트에서 더욱 상세히 기재된다. 예를 들어, GDE 활성은 균질화된 마우스 조직을 한계 덱스트린과 함께 인큐베이션한 후에 생산된 글루코스를 측정함으로써 확인될 수 있다. 다른 방법은 GDE KO 동물의 조직에서의 GDE 발현을, 예컨대 웨스턴 블롯에 의해, 확인함으로써, 글리코겐 포스포릴라아제-소화된 글리코겐으로부터 생산되는 글루코스를 따라감으로써, 벡터의 투여 후에, 예컨대 투여 후 1, 2 또는 3 개월째에 처리된 GDE-KO 동물의 근육 강도를 와이어 행에 의해 평가함으로써, 또는 근육 및/또는 심장 조직에서의 글리코겐 축적의 구조를 평가함으로써, GDE 활성을 시험하는 것을 포함한다.
본 발명의 제 1 양태의 제 1 변형예에서, 미니-GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 절두된, 기능성 절두된 인간 GDE 폴리펩티드이다.
용어 "절두된 인간 GDE 폴리펩티드" 는 절두된 인간 GDE 가 유래되는 기준 전장 인간 GDE 서열에 대해, 아미노산 결실에 의해 더 짧게 만들어진 임의의 인간 GDE 폴리펩티드를 망라한다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 1 개 아미노산이 결실된다. 바람직하게는, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된다. 바람직한 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 약 50, 100 또는 150 개 아미노산이 결실된다.
특정 구현예에서, 기준 전장 인간 GDE 서열에 대해 절두된 기능성 절두된 인간 GDE 폴리펩티드는 상기 기준 전장 인간 GDE 서열에 대해 하나 이상의 부가적 아미노산 변형을 포함할 수 있다. 특히, 아래에서 추가로 기재되는 결실(들)에 더하여, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열과 비교하여 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함할 수 있다. 예를 들어, 기능성 절두된 인간 GDE 폴리펩티드는, 절두된 인간 GDE 폴리펩티드의 기능성이 보존되는 한, 1 내지 10 (예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 개 부가적 아미노산 변형, 특히 1 내지 5 (예를 들어 1, 2, 3, 4 또는 5) 개 부가적 아미노산 변형을 포함할 수 있다.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드가 N-말단 결실을 포함할 때, 메티오닌이 N-말단 단부에 부가될 수 있다.
본 발명의 맥락에서, "기준 전장 인간 GDE 서열" 은 인간 GDE 의 모든 천연 아이소폼을 망라한다. Bao 및 동료들 (Genomics, 1997, 38, 155-165) 은 세 가지 GDE 단백질 아이소폼에 대해 코딩하는 여섯 가지 전사물 변이체의 존재를 식별했다. 전사물 변이체 1-4 는 동일한 단백질, 즉 GDE 아이소폼 1 에 대해 코딩한다. 전사물 변이체 5 및 6 은 GDE 아이소폼 2 및 3 각각에 대해 코딩한다.
용어 "기준 전장 인간 GDE 폴리펩티드" 는 따라서 전구체 형태, 뿐만 아니라 삽입(들), 결실 (들) 및/또는 치환(들)에 의해 변형된 또는 돌연변이된 GDE 의 기능성 유도체인 GDE 단백질 또는 그의 단편을 포함하는 인간 GDE 의 모든 천연 아이소폼을 망라한다. 특히, 기준 전장 인간 GDE 서열은 SEQ ID NO:1 (GDE 아이소폼 1 에 해당함), SEQ ID NO:40 (GDE 아이소폼 2 에 해당함) 및 SEQ ID NO:41 (GDE 아이소폼 3 에 해당함) 로 이루어지는 군으로부터 선택된다.
특정 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 1 에 해당하는, SEQ ID NO:1 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 1235-1532 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-667, 770-894, 1088-1194, 1233-1532 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087, 및/또는 1195-1232 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 110 개 또는 적어도 120 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 15 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 15 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 30 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 30 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 81 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 81 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 103 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 103 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 129 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 129 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 적어도 SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 15 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 30 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 81 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 103 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 129 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 위치 1 내지 156 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실
는 위치 1 내지 280 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-156 는 범위 1-280 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실
는 위치 1 내지 320 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-280 는 범위 223-320 와 중복되기 때문이다.
또다른 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 2 에 해당하는, SEQ ID NO:40 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-650, 753-877, 1071-1177, 1216-1515 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070, 및/또는 1178-1215 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 13 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 13 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 64 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 64 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 86 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 86 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 112 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 112 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 13 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 64 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 86 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 112 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 위치 1 내지 139 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실
는 위치 1 내지 263 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-139 는 범위 1-263 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실
는 위치 1 내지 303 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-263 는 범위 206-303 와 중복되기 때문이다.
또다른 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 3 에 해당하는, SEQ ID NO:41 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-651, 754-878, 1072-1178, 1217-1516 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071, 및/또는 1179-1216 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산;
- SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 14 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 14 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 65 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 65 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 87 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 87 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 113 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 113 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 14 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 65 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 87 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 113 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 위치 1 내지 140 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실
는 위치 1 내지 264 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-140 는 범위 1-264 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실
는 위치 1 내지 304 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-264 는 범위 207-304 와 중복되기 때문이다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 결실 또는 결실의 조합을 포함하며, 결실(들)은 표 1 에서 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7 및 Δ8 로서 언급되는 임의의 결실로부터 선택된다:
표 1:
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 2, 3, 4, 5, 6, 7 또는 8 개 결실의 조합을 포함할 수 있으며, 결실(들)은 표 1 에서 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7 및 Δ8 로서 언급되는 임의의 결실로부터 선택된다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합을 포함할 수 있으며, 결실(들)은 표 1 에서 언급된 바와 같다.
표 2:
명확하기 하기 위해, 표 2 는 다음과 같이 이해되어야 한다. 예를 들어 하기 결실의 조합을 포함하는 기능성 절두된 인간 GDE 폴리펩티드: "Δ1+Δ2+Δ3", 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 바와 같이, SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 결실 Δ1, Δ2 및 Δ3 을 포함한다. 다시 말하면, 이 예에서, 기준 전장 GDE 서열이 SEQ ID NO:1 일 때, 기능성 절두된 인간 GDE 폴리펩티드 "Δ1+Δ2+Δ3" 는 SEQ ID NO:1 에 대해 위치 1 내지 156, 위치 361-428 및 위치 668-769 의 모든 연속적 아미노산이 결실된, SEQ ID NO:1 에서 유래하는 기능성 절두된 인간 GDE 폴리펩티드에 해당한다. 따라서, 기준 전장 GDE 서열이 SEQ ID NO:40 일 때, 기능성 절두된 인간 GDE 폴리펩티드 "Δ1+Δ2+Δ3" 는 SEQ ID NO:40 에 대해 위치 1 내지 139, 위치 344-411 및 위치 651-752 의 모든 연속적 아미노산이 결실된, SEQ ID NO:40 에서 유래하는 기능성 절두된 인간 GDE 폴리펩티드에 해당한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 Δ2 및 Δ3 결실을 포함한다. 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 Δ2 및 Δ3 결실을 포함하고, SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에서, 특히 SEQ ID NO:1 에서 유래된다.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 132 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 30 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 81 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 103 개 연속적 아미노산, 적어도 125 개 연속적 아미노산, 또는 적어도 132 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 132 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 30 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 81 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 103 개 연속적 아미노산, 적어도 125 개 연속적 아미노산, 또는 적어도 132 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 13 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 64 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 86 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 112 개 연속적 아미노산, 또는 적어도 115 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 Z2 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 13 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 64 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 86 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 112 개 연속적 아미노산, 또는 적어도 115 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 14 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 65 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 87 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 113 개 연속적 아미노산, 또는 적어도 116 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 14 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 65 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 87 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 113 개 연속적 아미노산, 또는 적어도 116 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 하기를 포함한다:
(i) SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해, 표 3 에서 Δ9, Δ10, Δ11, Δ12, 및 Δ13 로서 언급되는 임의의 결실로부터 선택되는 결실 또는 결실의 조합.
표 3:
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ9 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, Δ11, Δ12 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ10 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ11 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ12 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ13 결실.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9 및 Δ10 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10, Δ11, Δ12 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ11 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ12 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ13 결실.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합 and
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, Δ11, Δ12, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은 Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:2: SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:3: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:4: SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:5: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 제 1 결실 및 위치 668 내지 769 의 아미노산의 제 2 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:6: SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:7: SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 제 1 결실, 위치 360 내지 428 의 아미노산의 제 2 결실, 및 위치 669 내지 720 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:8: SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:9: SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:10: SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:48: SEQ ID NO:1 에 대해 위치 1-15 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:49: SEQ ID NO:1 에 대해 위치 1-30 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:50: SEQ ID NO:1 에 대해 위치 1-81 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:51: SEQ ID NO:1 에 대해 위치 1-103 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드; 및
- SEQ ID NO:52: SEQ ID NO:1 에 대해 위치 1-129 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:2: SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:3: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:4: SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:5: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 제 1 결실 및 위치 668 내지 769 의 아미노산의 제 2 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:6: SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:7: SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 제 1 결실, 위치 360 내지 428 의 아미노산의 제 2 결실, 및 위치 669 내지 720 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:8: SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:9: SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드; 및
- SEQ ID NO:10: SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드.
결실이 N-말단 결실일 때, 서열의 N-말단 단부에 메티오닌이 부가될 수 있다. 예를 들어, SEQ ID NO:9 는 SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실 및 이러한 결실로부터 초래되는 서열의 N-말단 단부에서의 메티오닌의 부가를 포함한다. 본 출원은 본원에서 구체적으로 개시되는 모든 기능성 GDE 절두된 형태를 개시하며, 상기 기능성 GDE 절두된 형태는 그것의 N-말단 단부에 메티오닌 잔기를 포함한다.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52 로부터 선택되는 서열, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 을 포함하거나 또는 그것으로 이루어진다. 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 과 비교할 때, 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함할 수 있다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 와 비교할 때 1, 2, 3, 4 또는 5 개 아미노산 변형을 포함할 수 있다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 와 적어도 80, 85, 90, 95, 96, 97, 98 또는 적어도 99 퍼센트 서열 동일성을 가질 수 있다.
본 발명의 제 1 양태의 제 2 변형예에서, 미니-GDE 는 기능성 비-인간 GDE 폴리펩티드이다.
본 발명의 기능성 비-인간 GDE 폴리펩티드는 코딩 서열이 유전자 요법 벡터 내로, 특히 AAV 벡터 내로 패키징될 수 있을 정도로 충분히 작은 임의의 GDE 폴리펩티드일 수 있다. 실제로, 본 발명자들은 코딩 서열이 천연 인간 GDE 코딩 서열보다 더 짧은 비-인간 GDE 폴리펩티드는 유전자 요법 벡터를 사용하여 GSD III 을 치료하는데 사용될 수 있다는 것을 보였다. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 약 1500, 1480, 1460, 1440, 1420, 1400, 1380, 1360, 1340, 1320, 1300, 1280, 1260, 1240, 1220, 1200, 1180, 1160, 1140, 1120, 1100, 1080, 1060, 1040 개 미만, 1020, 또는 약 1000 개 미만의 아미노산을 포함한다.
특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 약 1000 내지 1500 개 아미노산, 약 1000 내지 1300 개 아미노산, 약 1300 내지 1500 개 아미노산 또는 약 1300 내지 1400 개 아미노산을 포함한다.
본 발명에 따르면, 본 발명의 기능성 비-인간 GDE 폴리펩티드는 위에서 정의된 바와 같이 인간 GDE 폴리펩티드의 생물학적 기능을 유지한다. 특히, 비-인간 GDE 폴리펩티드는 생체내에서 글리코겐 축적 및 근육 강도를 구조할 수 있다.
기능성 비-인간 GDE 폴리펩티드의 아미노산 서열 또는 그것의 코딩 서열은 임의의 비-인간 진핵생물 공급원, 예컨대 효모 또는 비-인간 포유류 또는 조류 종을 포함하는 비-인간 동물로부터 유래할 수 있다. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 비-인간 포유류 GDE 폴리펩티드이다.
또한, 비-인간 GDE 폴리펩티드는 기준 천연 GDE 폴리펩티드와 비교하여 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함하는 야생형 비-인간 GDE 폴리펩티드의 기능성 변이체일 수 있다. 예를 들어, 비-인간 GDE 폴리펩티드는 비-인간 GDE 폴리펩티드, 특히 비-인간 동물 GDE 폴리펩티드의 기능성 유도체, 예컨대 이들 동물 GDE 폴리펩티드와 적어도 80, 85, 90, 95, 96, 97, 98 또는 적어도 99 퍼센트 서열 동일성을 갖는 SEQ ID NO:11 내지 SEQ ID NO:17 의 폴리펩티드일 수 있다.
특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드 또는 그것의 코딩 서열은 말, 고릴라, 오랑우탄, 검은날여우박쥐, 수티 망가베이, 오리너구리, 오리 또는 태즈메이니아데빌 (Tasmania devil) 으로부터 유래된다.
특정 구현예에서, 비-인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다: SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드.
추가의 특정 구현예에서, 비-인간 GDE 폴리펩티드는 고릴라 GDE 폴리펩티드, 특히 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드이다.
또다른 양태에서, 본 발명은 본 발명의 미니-GDE 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.
용어 "핵산 분자" (또는 핵산 서열) 는 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 특히 본 발명에 따른 기능성 절두된 인간 GDE 폴리펩티드 또는 기능성 비-인간 GDE 폴리펩티드를 코딩하는 DNA 를 언급한다.
본 발명에 따르면, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 유전자 요법 벡터 내로 패키징될 수 있을 정도로 충분히 작으며, 유전자 요법 벡터는 위에서 정의된 바와 같다. 바람직한 구현예에서, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 AAV 벡터 내로 패키징될 수 있을 정도로 충분히 작다. 바람직하게는, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자의 크기는 약 5, 4.7, 4.5, 4.2, 4.1, 4, 3.7, 3.5, 3.2, 3, 2.7, 2.5, 2.2, 2, 또는 1.5 kb 미만이다. 바람직하게는, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 약 4.1 kb 미만이다.
미니-GDE 폴리펩티드를 코딩하는 본 발명의 핵산 분자의 서열은 생체내에서의 GDE 폴리펩티드의 발현을 위해 최적화될 수 있다. 서열 최적화는 코돈 최적화, GC 함량의 증가, CpG 아일랜드 (island) 의 수의 감소, 대안적 오픈 리딩 프레임 (ARF) 의 수의 감소 및 스플라이스 도너 및 스플라이스 억셉터 자리의 수의 감소를 포함하는, 핵산 서열의 다수의 변화를 포함할 수 있다. 유전 부호의 축퇴 때문에, 상이한 핵산 분자는 동일한 단백질을 코딩할 수 있다. 상이한 유기체의 유전 부호는 종종 동일한 아미노산을 코딩하는 여러 가지 코돈 중에서 다른 코돈보다 한 가지의 코돈을 사용하는 것을 향하여 편향된다는 것이 또한 잘 알려져 있다. 코돈 최적화를 통해서, 주어진 세포 상황에 존재하는 코돈 편향을 이용하는 변화가 뉴클레오티드 서열에 도입되어, 결과로서 생성되는 코돈 최적화된 뉴클레오티드 서열은 비-코돈 최적화된 서열과 비교하여 그러한 주어진 세포 상황에서 상대적으로 높은 수준에서 발현될 가능성이 더 높다. 본 발명의 바람직한 구현예에서, 미니-GDE 폴리펩티드를 코딩하는 그러한 서열 최적화된 뉴클레오티드 서열은, 예를 들어 인간 특이적 코돈 사용빈도 편향을 이용함으로써, 코돈-최적화되어, 동일한 미니-GDE 폴리펩티드에 대해 코딩하는 비-코돈 최적화된 뉴클레오티드 서열과 비교하여 인간 세포에서 그것의 발현을 개선하게 된다. 전장 인간 GDE 아이소폼 1 을 코딩하는 핵산 서열은 SEQ ID NO:37 에 제시되어 있다. 해당하는 코돈 최적화된 서열의 예는 SEQ ID NO:38 또는 SEQ ID NO:39 에 제시되어 있다.
특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:2 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:18 에 제시된 서열;
- SEQ ID NO:3 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:20 에 제시된 서열;
- SEQ ID NO:4 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:21 에 제시된 서열;
- SEQ ID NO:5 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:22 에 제시된 서열;
- SEQ ID NO:6 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:24 에 제시된 서열;
- SEQ ID NO:7 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:26 에 제시된 서열;
- SEQ ID NO:8 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:27 에 제시된 서열;
- SEQ ID NO:9 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:28 에 제시된 서열;
- SEQ ID NO:10 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:29 에 제시된 서열;
- SEQ ID NO:48 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:53 또는 SEQ ID NO:59 에 제시된 서열;
- SEQ ID NO:49 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:54 또는 SEQ ID NO:60 에 제시된 서열;
- SEQ ID NO:50 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:55 또는 SEQ ID NO:61 에 제시된 서열;
- SEQ ID NO:51 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:56 또는 SEQ ID NO:62 에 제시된 서열; 또는
- SEQ ID NO:52 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:57 또는 SEQ ID NO:63 에 제시된 서열.
추가의 특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:2 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:18 에 제시된 서열;
- SEQ ID NO:3 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:20 에 제시된 서열;
- SEQ ID NO:4 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:21 에 제시된 서열;
- SEQ ID NO:5 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:22 에 제시된 서열;
- SEQ ID NO:6 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:24 에 제시된 서열;
- SEQ ID NO:7 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:26 에 제시된 서열;
- SEQ ID NO:8 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:27 에 제시된 서열;
- SEQ ID NO:9 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:28 에 제시된 서열; 또는
- SEQ ID NO:10 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:29 에 제시된 서열.
이미 언급된 바와 같이, 상기 서열은 코돈-최적화될 수 있다. SEQ ID NO:19, SEQ ID NO:23 및 SEQ ID NO:25 에 제시된 서열은 SEQ ID NO:18, SEQ ID NO:22 및 SEQ ID NO:24 각각에 상응하는 코돈-최적화된 서열의 예이다.
또다른 특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:11 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:30 에 제시된 서열;
- SEQ ID NO:12 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:31 에 제시된 서열;
- SEQ ID NO:13 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:32 에 제시된 서열;
- SEQ ID NO:14 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:33 에 제시된 서열;
- SEQ ID NO:15 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:34 에 제시된 서열;
- SEQ ID NO:16 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:35 에 제시된 서열; 또는
- SEQ ID NO:17 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:36 에 제시된 서열.
위에서 정의된 바와 같은 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 SEQ ID NO:18 내지 26 의 뉴클레오티드 서열 중 임의의 것과 적어도 90 개 또는 적어도 95 퍼센트 동일성을 가질 수 있다. 특정 구현예에서, 위에서 정의된 바와 같은 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 SEQ ID NO:18 내지 36 및 SEQ ID NO:53 내지 57 의 뉴클레오티드 서열 중 임의의 것과 적어도 90 개 또는 적어도 95 퍼센트 동일성을 가질 수 있다. 특정 구현예에서, 본 발명의 핵산 분자는 SEQ ID NO:18 내지 36 의 뉴클레오티드 서열 중 임의의 것과 적어도 95 퍼센트 동일성, 예를 들어 적어도 96, 97, 98, 99 또는 100 퍼센트 동일성을 갖는다. 추가의 특정 구현예에서, 본 발명의 핵산 분자는 SEQ ID NO:18 내지 36 및 SEQ ID NO:53 내지 57 의 뉴클레오티드 서열 중 임의의 것과 적어도 95 퍼센트 동일성, 예를 들어 적어도 96, 97, 98, 99 또는 100 퍼센트 동일성을 갖는다.
용어 "동일한" 및 이의 변형은 두 개의 핵산 분자 사이의 또는 두 개의 폴리펩티드 분자 사이의 서열 동일성을 언급한다. 두 개의 비교되는 서열 둘 모두에서의 위치가 동일한 염기 또는 동일한 아미노산에 의해 점유될 때, 분자는 그 위치에서 동일하다. 두 개의 서열 사이의 동일성의 퍼센트는 두 개의 서열에 의해 공유되는 매치하는 위치의 수를 비교되는 위치의 수로 나눈 값 X 100 의 함수이다. 예를 들어, 두 개의 서열에서 위치 10 개 중 6 개가 매치되는 경우에 두 개의 서열은 60% 동일하다. 일반적으로, 두 개의 서열이 정렬될 때 비교가 이루어져서 최대 동일성을 제공한다. 통상의 기술자에게 알려진 다양한 생물정보학 도구 예컨대 BLAST 또는 FASTA 가 사용되어 핵산 서열을 정렬할 수 있다.
본 발명은 또한 본 발명의 핵산 분자를 포함하는 핵산 구축물에 관한 것이다. 핵산 구축물은 하나 이상의 발현 제어 서열 및/또는 발현을 개선하는 다른 서열에 작동가능하게 연결된, 본 발명의 핵산 서열을 포함하는 발현 카세트에 해당할 수 있다. 본원에서 사용되는 바와 같은, 용어 "작동가능하게 연결된" 은 기능적 관계에서 폴리뉴클레오티드 요소의 연결성을 언급한다. 핵산은 그것이 또다른 핵산 서열과의 기능적 관계에 배치될 때 "작동가능하게 연결된다". 예를 들어, 프로모터, 또는 또다른 전사 조절 서열은 그것이 코딩 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동가능하게 연결된다. 그러한 발현 제어 서열, 예컨대 프로모터, 인핸서 (예컨대 cis-조절 모듈 (CRM)), 인트론, polyA 신호 등이 당해 기술분야에 알려져 있다.
특정 구현예에서, 발현 카세트는 프로모터를 포함할 수 있다. 프로모터는 유비퀴터스 또는 조직-특이적 프로모터, 특히 GDE 의 발현이 바람직한 세포 또는 조직에서 예컨대 GDE-결핍 환자에서 GDE 발현이 바람직한 세포 또는 조직에서 발현을 촉진할 수 있는 프로모터일 수 있다.
특정 구현예에서, 프로모터는 근육-특이적 프로모터이다. 근육-특이적 프로모터의 비제한적 예는 근육 크레아틴 키나아제 (MCK) 프로모터를 포함한다. 적합한 근육 크레아틴 키나아제 프로모터의 비제한적 예는 인간 근육 크레아틴 키나아제 프로모터 및 절두된 뮤린 근육 크레아틴 키나아제 [(tMCK) 프로모터] 이다 (Wang B et al, Construction and analysis of compact muscle-selective promoters for AAV vectors. Gene Ther. 2008 Nov;15(22):1489-99) (대표적 GenBank Accession No. AF188002). 인간 근육 크레아틴 키나아제는 유전자 ID No. 1158 을 갖는다 (대표적 GenBank Accession No. NC_000019.9, 2012년 12월 26일에 억세스됨). 근육-특이적 프로모터의 다른 예는 합성 프로모터 C5.12 (spC5.12, 대안적으로 본원에서 "C5.12" 로서 언급됨), 예컨대 spC5.12 또는 spC5.12 프로모터 (Wang et al., Gene Therapy volume 15, pages 1489-1499 (2008) 에 개시됨), MHCK7 프로모터 (Salva et al. Mol Ther. 2007 Feb;15(2):320-9), 미오신 경쇄 (MLC) 프로모터, 예를 들어 MLC2 (Gene ID No. 4633; 대표적 GenBank Accession No. NG_007554.1, 2012년 12월 26일에 억세스됨); 미오신 중쇄 (MHC) 프로모터, 예를 들어 알파-MHC (Gene ID No. 4624; 대표적 GenBank Accession No. NG_023444.1, 2012년 12월 26일에 억세스됨); 데스민 프로모터 (Gene ID No. 1674; 대표적 GenBank Accession No. NG_008043.1, 2012년 12월 26일에 억세스됨); 심장 트로포닌 C 프로모터 (Gene ID No. 7134; 대표적 GenBank Accession No. NG_008963.1, 2012년 12월 26일에 억세스됨); 트로포닌 I 프로모터 (Gene ID Nos. 7135, 7136, 및 7137; 대표적 GenBank Accession Nos. NG_016649.1, NG_011621.1, 및 NG_007866.2, 2012년 12월 26일에 억세스됨); myoD 유전자 패밀리 프로모터 (Weintraub et al., Science, 251, 761 (1991); 유전자 ID No. 4654; 대표적 GenBank Accession No. NM_002478, 2012년 12월 26일에 억세스됨); 알파 액틴 프로모터 (Gene ID Nos. 58, 59, 및 70; 대표적 GenBank Accession Nos. NG_006672.1, NG_011541.1, 및 NG_007553.1, 2012년 12월 26일에 억세스됨); 베타 액틴 프로모터 (Gene ID No. 60; 대표적 GenBank Accession No. NG_007992.1, 2012년 12월 26일에 억세스됨); 감마 액틴 프로모터 (Gene ID No. 71 및 72; 대표적 GenBank Accession No. NG_011433.1 및 NM_001199893, 2012년 12월 26일에 억세스됨); Pitx3 의 안구 형태의 인트론 1 내에 존재하는 근육-특이적 프로모터 (Gene ID No. 5309) (Coulon et al; 근육-선택적 프로모터는 대표적 GenBank Accession No. NG_008147 (2012년 12월 26일에 억세스됨) 의 잔기 11219-11527 에 해당한다); 및 US 특허 공보 US 2003/0157064 에 기재된 프로모터, 및 CK6 프로모터 (Wang et al 2008 doi: 10.1038/gt.2008.104) 를 포함한다. 또다른 특정 구현예에서, 근육-특이적 프로모터는 MCK-유래 인핸서 및 spC5.12 프로모터의 조합을 포함하는 Wang et al., Gene Therapy volume 15, pages 1489-1499 (2008) 에 기재된 E-Syn 프로모터이다. 본 발명의 특정 구현예에서, 근육-특이적 프로모터는 spC5.12 프로모터, MHCK7 프로모터, E-syn 프로모터, 근육 크레아틴 키나아제 미오신 경쇄 (MLC) 프로모터, 미오신 중쇄 (MHC) 프로모터, 심장 트로포닌 C 프로모터, 트로포닌 I 프로모터, myoD 유전자 패밀리 프로모터, 알파 액틴 프로모터, 베타 액틴 프로모터, 감마 액틴 프로모터, Pitx3 의 안구 형태의 인트론 1 내에 존재하는 근육-특이적 프로모터, CK6 프로모터, CK8 프로모터 및 Acta1 프로모터로 이루어지는 군으로부터 선택된다. 특정 구현예에서, 근육-특이적 프로모터는 spC5.12, 데스민 및 MCK 프로모터로 이루어지는 군으로부터 선택된다. 추가의 구현예에서, 근육-특이적 프로모터는 spC5.12 및 MCK 프로모터로 이루어지는 군으로부터 선택된다. 특정 구현예에서, 근육-특이적 프로모터는 spC5.12 프로모터이다.
특정 구현예에서, 프로모터는 간-특이적 프로모터이다. 간-특이적 프로모터의 비제한적 예는 알파-1 안티트립신 프로모터 (hAAT), 트랜스티레틴 프로모터, 알부민 프로모터, 티록신-결합 글로불린 (TBG) 프로모터, LSP 프로모터 (갑상선 호르몬-결합 글로불린 프로모터 서열, 두 카피의 알파1-마이크로글로불린/비쿠닌 인핸서 서열, 및 리더 서열을 포함함 - Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) 등을 포함한다. 다른 유용한 간-특이적 프로모터, 예를 들어 Cold Spring Harbor Laboratory 에 의해 컴파일된 간 특이적 유전자 프로모터 데이타베이스에 열거된 것들 (http://rulai.cshl.edu/LSPD/) 이 당해 기술분야에 알려져 있다. 본 발명의 맥락에서 바람직한 간-특이적 프로모터는 hAAT 프로모터이다.
또다른 특정 구현예에서, 프로모터는 뉴런-특이적 프로모터이다. 뉴런-특이적 프로모터의 비제한적 예는 하기를 포함하나, 그에 한정되지 않는다: 통상의 기술자에게 명백한 것들 중에서 특히, 시냅신-1 (Syn) 프로모터, 뉴런-특이적 에놀라아제 (NSE) 프로모터 (Andersen et al., Cell. Mol. Neurobiol., 13:503-15 (1993)), 신경미세섬유 경쇄 유전자 프로모터 (Piccioli et al., Proc. Natl. Acad. Sci. USA, 88:5611-5 (1991)), 및 뉴런-특이적 vgf 유전자 프로모터 (Piccioli et al. Neuron, 15:373- 84 (1995)). 특정 구현예에서, 뉴런-특이적 프로모터는 Syn 프로모터이다. 다른 뉴런-특이적 프로모터는 하기를 제한 없이 포함한다: 시냅신-2 프로모터, 티로신 히드록실라아제 프로모터, 도파민 β-히드록실라아제 프로모터, 히포크산틴 포스포리보실트랜스페라아제 프로모터, 낮은 친화도 NGF 수용체 프로모터, 및 콜린 아세틸 트랜스페라아제 프로모터 (Bejanin et al., 1992; Carroll et al., 1995; Chin and Greengard, 1994; Foss-Petter et al., 1990; Harrington et al., 1987; Mercer et al., 1991; Patei et al., 1986). 운동 뉴런에 특이적인 대표적 프로모터는 알려진 운동 뉴런-유래 인자인, 칼시토닌 유전자-관련 펩티드 (Calcitonin Gene-Related Peptide, CGRP) 의 프로모터를, 제한 없이, 포함한다. 운동 뉴런에서 기능성인 다른 프로모터는 콜린 아세틸 트랜스페라아제 (ChAT), 뉴런 특이적 에놀라아제 (NSE), 시냅신 및 Hb9 의 프로모터를 포함한다. 본 발명에서 유용한 다른 뉴런-특이적 프로모터는 하기를, 제한 없이, 포함한다: GFAP (성상세포), 칼빈딘 (Calbindin) 2 (중간뉴런), Mnx1 (운동뉴런), 네스틴 (Nestin) (뉴런), 파르브알부민, 소마토스타틴 (Somatostatin) 및 Plp1 (희돌기교세포 및 슈반 (Schwann) 세포).
또다른 특정 구현예에서, 프로모터는 유비퀴터스 프로모터이다. 대표적 유비퀴터스 프로모터는 사이토메갈로바이러스 인핸서/치킨 베타 액틴 (CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV) (임의로 CMV 인핸서 포함) [예를 들어, Boshart et al, Cell, 41:521-530 (1985) 참고], PGK 프로모터, SV40 조기 프로모터, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서 포함), 디히드로폴레이트 리덕타아제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제 (PGK) 프로모터, 및 EF1 알파 프로모터를 포함한다.
또한, 프로모터는 또한 내생적 프로모터 예컨대 알부민 프로모터 또는 GDE 프로모터일 수 있다.
특정 구현예에서, 프로모터는 인핸서 서열, 예컨대 cis-조절 모듈 (CRM) 또는 인공 인핸서 서열과 연합된다. 본 발명의 실시에서 유용한 CRM 은 Rincon et al., Mol Ther. 2015 Jan;23(1):43-52, Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13 또는 Nair et al., Blood. 2014 May 15;123(20):3195-9 에 기재된 것들을 포함한다. 특히, 유전자의 근육-특이적 발현, 특히 심장 근육 및/또는 골격 근육에서의 발현을 향상시킬 수 있는 다른 조절 요소는 WO2015110449 에 개시된 것들이다. 인공 서열을 포함하는 핵산 조절 요소의 특정 예는 WO2015110449 에 개시된 서열에 존재하는 전사 인자 결합 자리 (TFBS) 를 재배열함으로써 수득되는 조절 요소를 포함한다. 상기 재배열은 TFBS 의 순서를 변화시키는 것 및/또는 다른 TFBS 에 상대적인 하나 이상의 TFBS 의 위치를 변화시키는 것 및/또는 TFBS 중 하나 이상의 카피 수를 변화시키는 것을 망라할 수 있다. 예를 들어, 근육-특이적 유전자 발현, 특히 심장 및 골격 근육-특이적 유전자 발현을 향상시키기 위한 핵산 조절 요소는 E2A, HNH 1, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, NF1, p53, C/EBP, LRF, 및 SREBP 에 대한; 또는 E2A, HNH 1, HNF3a, HNF3b, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, NF1, CEBP, LRF, MyoD, 및 SREBP 에 대한; 또는 HNF4, NF1, RSRFC4, C/EBP, LRF, 및 MyoD 에 대한, 또는 NF1, PPAR, p53, C/EBP, LRF, 및 MyoD 에 대한 결합 자리를 포함할 수 있다. 예를 들어, 근육-특이적 유전자 발현, 특히 골격 근육-특이적 유전자 발현을 향상시키기 위한 핵산 조절 요소는 E2A, NF1, SRFC, p53, C/EBP, LRF, 및 MyoD 에 대한; 또는 E2A, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, C/EBP, LRF, MyoD, SEREBP, 및 Tal1_b 에 대한; 또는 E2A, SRF, p53, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 HNF4, NF1, RSRFC4, C/EBP, LRF, 및 SREBP 에 대한; 또는 E2A, HNF3a, HNF3b, NF1, SRF, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, CEBP, 및 MyoD 에 대한 결합 자리를 또한 포함할 수 있다. 추가의 예에서, 이들 핵산 조절 요소는 적어도 2 개, 예컨대 2, 3, 4 개, 또는 더 많은 카피의 이전에 언급된 TFBS 중 하나 이상을 포함한다. 특히,유전자의 간-특이적 발현을 향상시킬 수 있는 다른 조절 요소는 WO2009130208 에 개시된 것들이다.
또다른 특정 구현예에서, 핵산 구축물은 인트론, 특히 프로모터와 GDE 코딩 서열 사이에 위치하는 인트론을 포함한다. 인트론은 mRNA 안정성 및 단백질의 생산을 증가시키기 위해 도입될 수 있다. 추가의 구현예에서, 인트론은 인간 베타 글로빈 b2 (또는 HBB2) 인트론, 응고 인자 IX (FIX) 인트론, SV40 인트론, hCMV 인트론 A (hCMVI), TPL 인트론 (TPLI), CHEF1 유전자 인트론1 (CHEFI), MVM 인트론 (Wu et al, 2008), FIX 절두된 인트론 1 (Wu et al., 2008, Mol Ther, 16(2):280-289; Kurachi et al., 1995, J Biol Chem., 270(10):5276-5281), β-글로빈/면역글로빈 중쇄 하이브리드 인트론 (인간 β-글로빈 인트론으로부터의 5'-도너 자리 및 면역글로불린 중쇄 가변 영역 인트론으로부터의 3'-억셉터 자리, Wu et al., 2008, Mol Ther, 16(2):280-289; Kurachi et al., 1995, J Biol Chem., 270(10):5276-5281), 아데노바이러스 스플라이스 도너 및 면역글로불린 G 스플라이스로 이루어지는 하이브리드 인트론 (Wong et al., 1985, Chromosoma, 92(2):124-135; Yew et al., 1997, Hum Gene Ther, 8(5):575-584; Choi T. et al., 1991, Mol Cell Biol, 11(6):3070-3074; Huang et al., 1990, Mol Cell Biol.,10(4):1805-1810), 하이브리드 19S/16S SV40 인트론 (19S 인트론으로부터의 5'-도너 자리 및 16S 인트론으로부터의 3'-억셉터 자리, Yew et al., 1997, Hum Gene Ther, 8(5):575-584) 또는 치킨 베타-글로빈 인트론이다. 또다른 추가의 구현예에서, 인트론은 상기 인트론에서 발견되는 대안적 오픈 리딩 프레임 (ARF) 의 수를 감소시키거나, 또는 심지어는 완전히 제거하도록 디자인된 변형된 인트론 (특히 변형된 HBB2 또는 FIX 인트론) 이다. 바람직하게는, 길이가 50 bp 가 넘고 시작 코돈과 같은 프레임에 있는 정지 코돈을 갖는 ARF 가 제거된다. 인트론의 서열을 변형시킴으로써 ARF 가 제거될 수 있다. 예를 들어, 변형은 뉴클레오티드 치환, 삽입 또는 결실에 의해, 바람직하게는 뉴클레오티드 치환에 의해 수행될 수 있다. 예로서, 관심 대상의 인트론의 서열에 존재하는 ATG 또는 GTG 시작 코돈에서 하나 이상의 뉴클레오티드, 특히 하나의 뉴클레오티드가 대체되어 비-시작 코돈을 초래할 수 있다. 예를 들어, 관심 대상의 인트론의 서열 내에서, ATG 또는 GTG 가 시작 코돈이 아닌 CTG 로 대체될 수 있다.
고전적 HBB2 인트론이 SEQ ID NO:42 에 제시되어 있다. 예를 들어, 이러한 HBB2 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 HBB2 인트론은 SEQ ID NO:43 에 제시된 서열을 갖는다. 고전적 FIX 인트론은 인간 FIX 의 제 1 인트론으로부터 유래되고, SEQ ID NO:44 에 제시되어 있다. FIX 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 FIX 인트론은 SEQ ID NO:45 에 제시된 서열을 갖는다. 핵산 구축물에서 사용되는 고전적 치킨-베타 글로빈 인트론은 SEQ ID NO:46 에 제시되어 있다. 치킨-베타 글로빈 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 치킨-베타 글로빈 인트론은 SEQ ID NO:47 에 제시된 서열을 갖는다.
발명자들은 이전에 WO2015/162302 에서 그러한 변형된 인트론, 특히 변형된 HBB2 또는 FIX 인트론이 유리한 특성을 갖고, 이식유전자의 발현을 유의하게 개선할 수 있다는 것을 보였다.
특정 구현예에서, 본 발명의 핵산 구축물은 인핸서가 임의로 선행하는 프로모터, 본 발명의 코딩 서열 (즉 미니-GDE 폴리펩티드를 코딩하는 핵산 분자), 및 폴리아데닐화 신호 예컨대 소 성장 호르몬 폴리아데닐화 신호 (bGH polyA), SV40 폴리아데닐화 신호, 또는 또다른 자연 발생적 또는 인공 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 특히, 폴리아데닐화 신호는 bGH polyA 이다. 바람직한 구현예에서, 매우 짧은 polyA 신호가 바람직하다. 예를 들어, 20 개 미만의 뉴클레오티드를 포함하는 매우 짧은 polyA 신호가 바람직하다. 특정 구현예에서, 폴리아데닐화 신호는 인간 가용성 뉴로필린-1 (sNRP) 폴리아데닐화 신호 (sNRP polyA; SEQ ID NO:58) 이다.
특정 구현예에서, 본 발명의 핵산 구축물은 인핸서가 임의로 선행하는 프로모터, 인트론, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 SpC5-12 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호 (예컨대 bGH polyA 또는 sNRP polyA, 특히 bGH polyA) 를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 인핸서, SpC5-12 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호 (예컨대 bGH polyA 또는 sNRP polyA, 특히 bGH polyA) 를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 인트론, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 본 발명의 추가의 특정 구현예에서 본 발명의 핵산 구축물은 프로모터, 임의적 인트론, 본 발명의 코딩 서열 및 polyA 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SV40 인트론; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 본 발명의 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 본 발명의 코딩 서열 및 polyA 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SV40 인트론; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SV40 인트론; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SV40 인트론; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA.
본 발명의 핵산 구축물을 디자인함에 있어서, 통상의 기술자는 상기 구축물을 세포 또는 기관에 전달하는데 사용되는 벡터의 크기 한계를 준수하는데 주의할 것이다. 특히, 통상의 기술자는 AAV 벡터의 주요 한계가 그것의 카고 (cargo) 용량이라는 것을 알고 있으며, 카고 용량은 AAV 혈청형 마다 다를 수 있으나 부모 바이러스 게놈의 크기 근처로 제한되는 것으로 여겨진다. 예를 들어, 5 kb 는 AAV8 캡시드 내로 패키징되는 것으로 통상적으로 여겨지는 최대 크기이다 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). 또한, 재조합 AAV 생산 동안, 5 kb 초과의 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 유전자 전달의 효능을 감소시키는 단편화된 게놈을 함유할 수 있다. 따라서, 통상의 기술자는 본 발명을 실시함에 있어서 AAV 5'- 및 3'-ITR 을 코딩하는 서열을 포함하는 결과로서 생성되는 핵산 서열이 바람직하게는 실시되는 AAV 벡터의 카고 용량의 110 % 를 초과하지 않도록, 특히 바람직하게는 5 kb 를 초과하지 않도록 본 발명의 핵산 구축물의 구성요소를 신중하게 선택할 것이다. 더 큰 카고 용량을 갖는 AAV 벡터가 또한 본 발명의 맥락에서 사용될 수 있다. 예를 들어 Vp2 서브유닛을 결여하는 AAV 입자는 더 큰 게놈 (즉 6 kb) 을 성공적으로 패키징하면서도 캡시드화된 게놈의 온전성을 하는 것으로 밝혀졌다 (Grieger et al., 2005, J Virol., 79(15):9933-9944).
본 발명은 또한 본원에 개시된 바와 같은 핵산 분자 또는 구축물을 포함하는 벡터에 관한 것이다. 특정 구현예에서, 벡터는 위에서 정의된 바와 같은 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자 또는 구축물을 포함한다. 또다른 특정 구현예에서, 벡터는 위에서 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 분자 또는 구축물을 포함한다.
특히, 본 발명의 벡터는 단백질 발현에, 바람직하게는 유전자 요법에서 사용하기에 적합한 벡터이다. 하나의 구현예에서, 벡터는 플라스미드 벡터이다. 또다른 구현예에서, 벡터는 본 발명의 핵산 분자, 특히 본 발명의 미니-GDE 폴리펩티드를 코딩하는 메신저 RNA 를 함유하는 나노입자이다. 또다른 구현예에서, 벡터는 표적 세포의 게놈에 본 발명의 핵산 분자 또는 구축물의 통합을 허용하는, 트랜스포존에 기반하는 시스템, 예컨대 과활성 슬리핑 뷰티 (Sleeping Beauty) (SB100X) 트랜스포존 시스템 (Mates et al. 2009) 이다. 또다른 구현예에서, 벡터는 임의의 관심의 세포 예컨대 간 조직 또는 세포, 근육 세포, CNS 세포 (예컨대 뇌 세포), 또는 조혈 줄기 세포 예컨대 적혈구 계통의 세포 (예컨대 적혈구) 를 표적화하는, 유전자 요법에 적합한 바이러스 벡터이다. 이 경우에, 본 발명의 핵산 구축물은 당해 기술분야에 잘 알려져 있는 효율적 바이러스 벡터를 생산하는데 적합한 서열을 또한 함유한다.
바이러스 벡터, 예컨대 레트로바이러스 벡터, 예를 들어 렌티바이러스 벡터, 또는 비-병원성 파르보바이러스, 더욱 바람직하게는 AAV 벡터는 본 발명의 핵산 분자 또는 구축물을 전달하는데 바람직하다. 인간 파르보바이러스 아데노-연관 바이러스 (AAV) 는 감염된 세포의 게놈 내로 통합되어 잠복 감염을 확립할 수 있는 복제에 관해 자연적으로 결함이 있는 데펜도바이러스이다. 마지막 특성은 포유류 바이러스 중에서 독특해 보이며, 그 이유는 염색체 19 (19q13.3-qter) 상에 위치하는, AAVS1 로 호칭되는, 인간 게놈에서의 특정 자리에서 통합이 일어나기 때문이다.
그러므로, AAV 벡터는 인간 유전자 요법을 위한 잠재적 벡터로서 상당한 관심을 유발했다. 바이러스의 유리한 특성 중에는 임의의 인간 질환과 그것의 관련성의 결여, 분열 및 비-분열 세포 둘 모두를 감염시키는 그것의 능력, 및 감염될 수 있는 상이한 조직으로부터 유래하는 세포주의 넓은 범위가 있다.
인간 또는 비-인간 영장류 (NHP) 로부터 단리된 잘 특성분석된 AAV 의 혈청형 중에서, 인간 혈청형 2 는 유전자 전달 벡터로서 개발된 첫번째 AAV 이다. 다른 현재 사용되는 AAV 혈청형은 AAV-1, AAV-2 변이체 (예컨대 Y44+500+730F+T491V 변화가 있는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2, Ling et al., 2016 Jul 18, Hum Gene Ther Methods. 에 개시됨), -3 및 AAV-3 변이체 (예컨대 두 가지 아미노산 변화, S663V+T492V 가 있는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체, Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042 에 개시됨), -3B 및 AAV-3B 변이체, -4, -5, -6 및 AAV-6 변이체 (예컨대 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체, Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026 에 개시됨), -7, -8, -9, -2G9, -10 예컨대 cy10 및 -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 라이신 및 세린 캡시드 돌연변이체 등을 포함한다. 또한, 다른 비-자연 조작된 변이체 및 키메라 AAV 가 또한 유용할 수 있다.
AAV 바이러스는 종래의 분자 생물학 기술을 사용하여 조작되어, 핵산 서열의 세포 특이적 전달, 면역원성의 최소화, 안정성 및 입자 수명의 조율, 효율적 분해, 핵으로의 정확한 전달을 위해 이들 입자를 최적화하는 것을 가능하게 만들 수 있다.
벡터 내로 조립하는데 바람직한 AAV 단편은 cap 단백질 (vp1, vp2, vp3 및 과가변 영역을 포함), rep 단백질 (rep 78, rep 68, rep 52, 및 rep 40 을 포함), 및 이들 단백질을 코딩하는 서열을 포함한다. 이들 단편은 여러 가지 벡터 시스템 및 숙주 세포에서 용이하게 이용될 수 있다.
Rep 단백질을 결여하는 AAV-기반 재조합 벡터는 숙주의 게놈 내로 낮은 효능으로 통합되고, 주로 표적 세포에서 수년간 지속될 수 있는 안정한 환형 에피솜으로서 존재한다.
AAV 자연 혈청형을 사용하는 것에 대안적으로, 비-자연 발생적 캡시드 단백질을 포함하는 AAV 를, 제한 없이, 포함하는 인공 AAV 혈청형이 본 발명의 맥락에서 사용될 수 있다. 그러한 인공 캡시드는 선별된 AAV 서열 (예를 들어, vp1 캡시드 단백질의 단편) 을 상이한 선별된 AAV 혈청형으로부터 수득될 수 있는 이종 서열, 비-AAV 바이러스 공급원으로부터의, 또는 비-바이러스 공급원으로부터의, 동일한 AAV 혈청형의 비-연속적 부분과의 조합으로 사용하여 임의의 적합한 기술에 의해 생성될 수 있다. 인공 AAV 혈청형은, 제한 없이, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화된" AAV 캡시드일 수 있다.
본 발명의 맥락에서, AAV 벡터는 관심의 표적 세포, 즉 관용원성 조직의 세포 (예를 들어 간세포) 및 치료적 관심의 조직(들)의 세포 예컨대 근육 세포, CNS 세포 또는 심장 세포를 형질도입시킬 수 있는 AAV 캡시드를 포함한다.
특정 구현예에 따르면, AAV 벡터는 AAV-1, -2, AAV-2 변이체 (예컨대 Y44+500+730F+T491V 변화가 있는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2, Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print] 에 개시됨), -3 및 AAV-3 변이체 (예컨대 두 가지 아미노산 변화, S663V+T492V 가 있는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체, Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042 에 개시됨), -3B 및 AAV-3B 변이체, -4, -5, -6 및 AAV-6 변이체 (예컨대 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체, Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026 에 개시됨), -7, -8, -9, -9P1, -2G9, -10 예컨대 -cy10 및 -rh10, -rh39, -rh43, -rh74, -dj, Anc80, LK03, AAV.PHP, AAV2i8, 돼지 AAV 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 라이신 및 세린 캡시드 돌연변이체의 것이다. 특정 구현예에서, AAV 벡터는 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형의 것이다 (즉 AAV 벡터는 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형의 캡시드를 갖는다) . 추가의 특정 구현예에서, AAV 벡터는 슈도타입 (pseudotyped) 벡터이며, 즉 그것의 게놈 및 캡시드는 상이한 혈청형의 AAV 로부터 유래한다. 예를 들어, 슈도타입 AAV 벡터는, 게놈은 위에서 언급된 AAV 혈청형 중 하나로부터 유래하고 캡시드는 또다른 혈청형으로부터 유래하는 벡터일 수 있다. 예를 들어, 슈도타입 벡터의 게놈은 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형으로부터 유래하는 캡시드를 가질 수 있고, 그것의 게놈은 상이한 혈청형으로부터 유래할 수 있다. 특정 구현예에서, AAV 벡터는 AAV6, AAV8, AAV9 또는 AAVrh74 혈청형, 특히 AAV6, AAV8, AAV9, 또는 AAV9P1 혈청형, 더욱 특히 AAV6, AAV9 또는 AAV9P1 혈청형의 캡시드를 갖는다.
특정 구현예에서, 벡터가 치료적 이식유전자를 근육 세포에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV8, AAV9 및 AAVrh74 로 이루어지는 군에서 선택될 수 있다.
또다른 특정 구현예에서, 벡터가 이식유전자를 간 세포에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV1, AAV5, AAV8, AAV9, AAVrh10, AAVrh39, AAVrh43, AAVrh74, AAV-LK03, AAV2G9, AAV.PHP, AAV-Anc80 및 AAV3B 로 이루어지는 군에서 선택될 수 있다.
추가의 특정 구현예에서, 벡터가 이식유전자를 CNS 에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV9, AAV9P1, AAV10 및 AAV2G9 로 이루어지는 군에서 선택될 수 있다.
또다른 구현예에서, 캡시드는 변형된 캡시드이다. 본 발명의 맥락에서, "변형된 캡시드" 는 키메라 캡시드 또는 하나 이상의 야생형 AAV VP 캡시드 단백질로부터 유래하는 하나 이상의 변이체 VP 캡시드 단백질을 포함하는 캡시드일 수 있다.
특정 구현예에서, AAV 벡터는 키메라 벡터이며, 즉 그것의 캡시드는 적어도 두 가지 상이한 AAV 혈청형으로부터 유래하는 VP 캡시드 단백질을 포함하거나, 또는 적어도 두 가지 AAV 혈청형으로부터 유래하는 VP 단백질 영역 또는 도메인을 조합하는 적어도 하나의 키메라 VP 단백질을 포함한다. 간 세포를 형질도입시키는데 유용한 그러한 키메라 AAV 벡터의 예는 Shen et al., Molecular Therapy, 2007 및 Tenney et al., Virology, 2014 에 기재되어 있다. 예를 들어, 키메라 AAV 벡터는 AAV8 캡시드 서열과 AAV8 혈청형과 상이한 AAV 혈청형의 서열, 예컨대 위에서 구체적으로 언급된 임의의 것들의 조합으로부터 유래할 수 있다. 또다른 구현예에서, AAV 벡터의 캡시드는 하나 이상의 변이체 VP 캡시드 단백질 예컨대 WO2015013313 에 기재된 것들, 특히 높은 간 향성을 제시하는 RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 및 RHM15-6 캡시드 변이체를 포함한다.
또다른 구현예에서, 변형된 캡시드는 또한 에러 프로운 (error prone) PCR 및/또는 펩티드 삽입에 의해 삽입된 캡시드 변형으로부터 유래할 수 있다 (예를 들어 Bartel et al., 2011 에 기재된 바와 같음). 특정 구현예에서, 변형된 캡시드는 PCT/EP2019/058560 에 개시된 바와 같이 P1 변형을 포함한다. 또한, 캡시드 변이체는 단일 아미노산 변화 예컨대 티로신 돌연변이체를 포함할 수 있다 (예를 들어 Zhong et al., 2008 에 기재된 바와 같음).
또한, AAV 벡터의 게놈은 단일 가닥 또는 자기 상보적 이중 가닥 게놈일 수 있다 (McCarty et al., Gene Therapy, 2003). 자기 상보적 이중 가닥 AAV 벡터는 AAV 말단 반복부 중 하나로부터 말단 분해 자리를 결실시킴으로써 생성된다. 복제하는 게놈이 야생형 AAV 게놈 길이의 절반인 이들 변형된 벡터는 DNA 이합체를 패키징하는 경향을 갖는다. 바람직한 구현예에서, 본 발명의 실시에서 구현되는 AAV 벡터는 단일 가닥 게놈을 갖고, 추가로 바람직하게는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 더욱 특히 AAV9 캡시드를 포함한다.
본 발명의 GDE 서열을 패키징하는데 사용되는 AAV 벡터는 또한 그것의 카고 용량을 증가시키기 위해서 변형될 수 있다. 예를 들어, Vp2 서브유닛을 결여하는 AAV 벡터는 더 큰 게놈 (즉 6 kb) 을 성공적으로 패키징하면서도 캡시드화된 게놈의 온전성을 유지하는 것으로 밝혀졌다 (Grieger et al., 2005).
당해 기술분야에 알려져 있는 바와 같이, 기능성 바이러스 벡터를 얻기 위해서 부가적 적합한 서열이 본 발명의 핵산 구축물에 도입될 수 있다. 적합한 서열은 AAV ITR 을 포함한다.
특정 구현예에서, AAV 벡터는 위에 기재된 바와 같은 근육-특이적 프로모터, 특히 간 세포 내로 발현의 일부 누출을 제시하는 근육-특이적 프로모터를 포함한다.
본 발명의 또다른 특정 구현예에서, AAV 벡터는 위에 기재된 바와 같은 간-특이적 프로모터를 포함한다. 간의 관용원성유도 및 대사 특성은 유리하게는 이 구현예 덕분에 구현되어 간세포에서 GDE 를 발현하고 그 단백질에 대한 면역 관용을 유도하는 고도로 효율적인 최적화된 벡터를 개발한다.
본 발명은 또한 본 발명의 핵산 분자, 구축물 또는 벡터로 형질전환된 또는 형질도입된 세포, 특히 단리된 세포, 예를 들어 간 세포, 심장 세포, CNS 세포 또는 근육 세포에 관한 것이다. 특정 구현예에서, 세포는 단리된 인간 세포이다. 추가의 특정 구현예에서, 세포는 인간 배아 줄기 세포가 아니다. 본 발명의 세포는 미니-GDE 폴리펩티드를 발현한다. 본 발명의 세포는 이를 필요로 하는 대상체, 예컨대 GDE-결핍 환자에게, 임의의 적당한 투여 경로에 의해 예컨대 상기 대상체의 간 내, CNS 내, 심장 내, 근육(들) 내 또는 혈류 내 주입을 통해 전달될 수 있다. 특정 구현예에서, 본 발명은 간 또는 근육 세포, 특히 치료될 대상체의 간 또는 근육 세포를 형질도입시키는 것, 및 핵산이 도입된 상기 형질도입된 간 및/또는 근육 세포를 대상체에게 투여하는 것을 수반한다. 특정 구현예에서, 간 세포는 치료될 환자로부터의 간 세포이거나, 또는 추가로 형질전환되고, 환자에 대한 후속적 투여를 위해 시험관내에서 간 세포로 분화된 간 줄기 세포이다. 또다른 구현예에서, 세포는 치료될 환자로부터의 근육 세포이거나, 또는 추가로 형질전환되고, 임의로 환자에 대한 후속적 투여를 위해 시험관내에서 근육 세포로 분화된 근육 줄기 세포이다.
본 발명은 또한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 또는 세포를 포함하는 약학적 조성물을 제공한다. 그러한 조성물은 치료적 유효량의 치료제 (본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포), 및 약학적으로 허용가능한 담체를 포함할 수 있다. 특정 구현예에서, 용어 "약학적으로 허용가능한" 은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 또는 미국 또는 유럽 약전 또는 동물, 및 인간에서의 사용에 관해 다른 일반적으로 인정되는 약전에서 열거되었다는 것을 의미한다. 용어 "담체" 는 치료제와 함께 투여되는 희석제, 아쥬반트, 부형제, 또는 비히클을 언급한다. 그러한 약학적 담체는 멸균 액체, 예컨대 물 및 석유, 동물, 식물 또는 합성 기원의 것, 예컨대 피넛유, 대두유, 참기름 등을 포함하는 오일일 수 있다. 물은 약학적 조성물이 정맥내 투여될 때 바람직한 담체이다. 염류 용액 및 수성 덱스트로스 및 글리세롤 용액이 또한 액체 담체로서, 특히 주사용 용액을 위해 이용될 수 있다. 적합한 약학적 부형제는 전분, 글루코스, 락토오스, 수크로스, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 탈크, 소듐 클로라이드, 건조된 탈지유, 글리세롤, 프로필렌 글리콜, 물, 에탄올 등을 포함한다.
조성물은, 바람직한 경우에, 또한 소량의 습윤화제 또는 유화제, 또는 pH 완충제를 함유할 수 있다. 이들 조성물은 용액, 현탁액, 에멀션, 정제, 환제, 캡슐, 분제, 지속 방출 제제 등의 형태를 취할 수 있다. 경구 제제는 표준 담체 예컨대 약학적 등급의 민나톨, 락토오스, 전분, 마그네슘 스테아레이트, 소듐 사카린, 셀룰로오스, 마그네슘 카르보네이트 등을 포함할 수 있다. 적합한 약학적 담체의 예는 "Remington's Pharmaceutical Sciences" by E. W. Martin 에 기재되어 있다. 그러한 조성물은 치료적 유효량의 치료제를, 바람직하게는 정제된 형태로, 적합한 양의 담체와 함께 함유할 것이며, 그에 따라 대상체에게 적절한 투여 형태를 제공할 것이다. 특정 구현예에서, 본 발명의 핵산, 벡터 또는 세포는 포스페이트-완충 식염수를 포함하고 0.25% 인간 혈청 알부민이 보충된 조성물로 제제화된다. 또다른 특정 구현예에서, 본 발명의 핵산, 벡터 또는 세포는 링거 락테이트 및 비-이온성 계면활성제, 예컨대 pluronic F68 을 총 조성물의 중량에 의해 최종 농도 0.01-0.0001%, 예컨대 농도 0.001% 로 포함하는 조성물로 제제화된다. 제제는 혈청 알부민, 특히 인간 혈청 알부민, 예컨대 0.25% 의 인간 혈청 알부민을 추가로 포함할 수 있다. 저장 또는 투여에 적당한 다른 제제는 당해 기술분야에, 특히 WO 2005/118792 또는 Allay et al., 2011 에서 알려져 있다.
바람직한 구현예에서, 조성물은 일상적 절차에 따라 인간에 대한 정맥내 투여에 적합한 약학적 조성물로서 제제화된다. 전형적으로, 정맥내 투여를 위한 조성물은 멸균 등장성 수성 완충제 중 용액이다. 필요한 경우에, 조성물은 가용화제 및 주입 자리에서 통증을 덜어주는 국부 마취제 예컨대 리그노카인을 또한 포함할 수 있다.
하나의 구현예에서, 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는 베지클, 특히 리포솜으로 전달될 수 있다. 또다른 구현예에서, 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는 제어 방출 시스템으로 전달될 수 있다.
특정 구현예에서, 핵산 분자는 본 발명의 미니-GDE 폴리펩티드를 코딩하는 전사물에 해당하는 mRNA 로서 전달된다. 특히, 본 발명의 mRNA 는 리포솜 예컨대 지질 나노입자 (LNP) 를 사용하여 전달될 수 있다.
본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포의 투여 방법은 피내, 근육내, 복강내, 정맥내, 피하, 비강내, 경막외, 및 경구 경로를 포함하나 그에 한정되지 않는다. 특정 구현예에서, 투여는 정맥내 또는 근육내 경로를 통한다. 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는, 벡터화되든 또는 벡터화되지 않든, 임의의 편리한 경로에 의해, 예를 들어 인퓨전 (infusion) 또는 볼루스 주입에 의해, 상피 또는 점막피부 내벽 (예를 들어, 경구 점막, 직장 및 창자 점막 등) 을 통한 흡수에 의해 투여될 수 있고, 다른 생물학적 활성제와 함께 투여될 수 있다. 투여는 전신 또는 국소일 수 있다.
특정 구현예에서, 본 발명의 약학적 조성물을 치료가 필요한 부위, 예를 들어 간 또는 근육에 국소적으로 투여하는 것이 바람직할 것이다. 이는, 예를 들어, 임플란트에 의해, 달성될 수 있으며, 상기 임플란트는 다공성, 비다공성, 또는 겔라틴성 물질, 예를 들어 멤브레인, 예컨대 실라스틱 멤브레인, 또는 섬유이다.
특정 구현예에서, 본 발명의 미니-GDE 폴리펩티드는 효소 대체 요법 (Enzyme Replacement Therapy, ERT) 에서, 특히 GSDIII 을 치료하기 위해 사용된다. 용어 "효소 대체 요법" 또는 "ERT" 은 일반적으로 정제된 효소를 그 효소가 결핍된 개체 내로 도입하는 것을 언급한다. 투여되는 본 발명의 폴리펩티드는 자연 공급원으로부터, 재조합 발현에 의해, 수득되거나, 시험관내 생산되거나, 또는 단리된 조직 또는 유체로부터 정제될 수 있다. 특히, ERT 에서 사용될 때, 본 발명의 폴리펩티드는 비경구적으로, 예컨대 복강내, 근육내, 혈관내 (즉 정맥내 또는 동맥내) 투여를 통해 투여될 수 있다. 특히 폴리펩티드는 정맥내 주입에 의해 투여된다. 상기 투여는 빈번히, 예컨대 매일, 매주, 격주 또는 격월, 특히 매주 또는 격주 반복될 수 있다.
GSDIII 의 치료에서 효과적인 본 발명의 치료제 (즉 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포) 의 양은 표준 임상 기술에 의해 확인될 수 있다. 또한, 생체내 및/또는 시험관내 어세이를 임의로 이용하여 최적 투여량 범위를 예측하는 것을 도울 수 있다. 제제에서 이용되는 정확한 양은 또한 투여 경로, 및 질환의 중증도에 따라 좌우될 것이고, 의사의 판단 및 각 환자의 상황에 따라 결정될 것이다. 필요로 하는 대상체에게 투여되는 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포의 투여량은 투여 경로, 치료되는 특정 질환, 대상체의 연령 또는 치료 효과를 달성하는데 필요한 발현 수준을, 제한 없이, 포함하는 여러 인자에 따라 달라질 것이다. 통상의 기술자는 이들 인자 등에 기반하여 요구되는 투여량 범위를, 통상의 지식에 기초하여, 용이하게 결정할 수 있다. 바이러스 벡터, 예컨대 AAV 벡터를, 대상체에게 투여하는 것을 포함하는 치료의 경우에, 벡터의 전형적인 투여량은 적어도 1x108 킬로그램 체중 당 벡터 게놈 (vector genomes per kilogram body weight) (vg/kg), 예컨대 적어도 1x109 vg/kg, 적어도 1x1010 vg/kg, 적어도 1x1011 vg/kg, 적어도 1x1012 vg/kg 적어도 1x1013 vg/kg, 또는 적어도 1x1014 vg/kg 이다.
본 발명은 또한 GSDIII 의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다.
간경변 및 간세포 암종이 또한 GSD III 에 걸린 환자에서 발병할 수 있다. 따라서, 본 발명은 또한 GSDIII 환자에서의 간경변 및 간세포 암종의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다.
본 발명은 또한 GSD III 의 치료 방법에 관한 것이며, 상기 방법은 이식유전자에 대한 (즉 핵산 분자에 의해 코딩되는 미니-GDE 폴리펩티드에 대한) 면역 반응을 유도하지 않거나, 또는 이식유전자에 대한 감소된 면역 반응을 유도하며, 치료적 유효량의 본 발명의 핵산, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 본 발명은 또한 GSD III 의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 반복 투여하는 것을 포함한다. 이 양태에서, 본 발명의 핵산 분자, 핵산 구축물 또는 벡터는 간 세포에서 기능성인 프로모터를 포함하여, 그로부터 생산되는 발현된 미니-GDE 폴리펩티드에 대한 면역 관용을 허용한다. 또한, 이 양태에서, 이 양태에서 사용되는 약학적 조성물은 간 세포에서 기능성인 프로모터를 포함하는 핵산 분자, 핵산 구축물 또는 벡터를 포함한다. 세포, 특히 간, 심장, CNS 또는 근육 세포의 전달의 경우에, 상기 세포는 치료를 필요로 하는 대상체로부터 이전에 수집되고, 본 발명의 핵산 분자, 핵산 구축물 또는 벡터를 도입하여 그들이 미니-GDE 폴리펩티드를 생산할 수 있게 만들어서 조작된 세포일 수 있다. 구현예에 따르면, 반복된 투여를 포함하는 양태에서, 상기 투여는 적어도 1 회 또는 그 이상 반복될 수 있고, 주기적 스케줄에 따라, 예컨대 1 주 1 회, 1 개월 1 회 또는 1 년 1 회 실시되는 것으로 여겨질 수 있다. 주기적 스케줄은 또한 2, 3, 4, 5, 6, 7, 8, 9 또는 10 년, 또는 10 년 초과 마다 1 회 투여를 포함할 수 있다. 또다른 특정 구현예에서, 본 발명의 바이러스 벡터의 각각의 투여의 투여는 각각의 연속적 투여에 상이한 바이러스를 사용하여 실시되어, 이전에 투여된 바이러스 벡터에 대한 가능한 면역 반응으로 인한 효능의 감소를 회피한다. 예를 들어, AAV8 캡시드를 포함하는 AAV 벡터의 제 1 투여가 실시되고, 그에 뒤이어 AAV9 캡시드를 포함하는 벡터의 투여가 실시될 수 있다.
본 발명에 따르면, 치료는 치유적, 완화 또는 예방적 효과를 포함할 수 있다. 따라서, 치료적 및 예방적 치료는 GSD III 의 증상의 개선 또는 특정 글리코겐 저장 질환의 발병 위험의 방지 또는 그렇지 않으면 감소를 포함한다. 용어 "예방적" 은 특정 병태의 중증도 또는 발병의 감소로 여겨질 수 있다. "예방적" 은 이전에 그 병태를 갖는 것으로 진단된 환자에서 특정 병태의 재발의 방지를 또한 포함한다. "치료적" 은 또한 기존 병태의 중증도를 감소시킬 수 있다. 용어 "치료" 는 본원에서 동물, 특히 포유류, 더욱 특히 인간 대상체에게 유익할 수 있는 임의의 섭생법을 언급하는데 사용된다.
본 발명은 또한 GSD III 의 치료를 위한 생체외 (ex vivo) 유전자 치료 방법에 관한 것이며, 상기 방법은 본 발명의 핵산 분자, 핵산 구축물 또는 벡터를 이를 필요로 하는 환자의 단리된 세포, 예를 들어 단리된 조혈 줄기 세포 내로 도입하는 것, 및 상기 세포를 이를 필요로 하는 상기 환자 내로 도입하는 것을 포함한다.
본 발명은 또한 약제로서 사용하기 위한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물에 관한 것이다.
본 발명은 또한 GDE 유전자에서의 돌연변이에 의해 야기되는 질환의 치료 방법에서, 특히 GSDIII (코리병) 의 치료 방법에서 사용하기 위한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물에 관한 것이다.
본 발명은 또한 GSD III (코리병) 을 치료하는데 유용한 약제의 제조에 있어서의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물의 용도에 관한 것이다.
실시예
본 발명은 하기 실험예 및 첨부된 도면을 참조하여 추가로 상세히 기술된다. 이들 실시예는 오직 설명의 목적을 위해 제공되고, 제한적으로 여겨지면 안된다.
물질 및 방법
웨스턴 블롯 분석
마우스 조직을 DNAse/RNAse 비함유 물에서 균질화시키고, 단백질 농도를 BCA 단백질 어세이 (BCA Protein Assay) 를 사용하여 확인했다. SDS-PAGE 전기영동을 4-15% 구배 폴리아크릴아미드 겔에서 수행했다. 전달 후에, 멤브레인을 차단하고, 항-GDE 항체 및 항-액틴 항체와 함께 인큐베이션했다. 멤브레인을 세정하고, 적당한 이차 항체와 함께 인큐베이션하고, Odyssey 이미지화 시스템에 의해 시각화했다.
효소 활성 측정
위에 기재된 바와 같이 균질화된 조직을 포스페이트 완충제 pH 6.9 에 용해된 한계 덱스트린과 함께 37℃ 에서 3-16 시간 동안 인큐베이션했다. 95℃ 에서 10 min 동안 인큐베이션한 후 11000 x g 에서 10 min 원심분리하여 반응을 중단시켰다. 상청액을 사용하여 생산된 글루코스를 상업적 글루코스 어세이 키트를 이용하여 측정했다. 농축된 H2SO4 로 반응을 중단시키고, 결과적인 흡광도를 EnSpire 알파 플레이트 리더 (Perkin-Elmer, Waltham, MA) 로 540 nm 에서 측정했다.
글리코겐 함량의 측정
글리코겐 함량을 조직 균질액에서 아스페르길루스 니게르 (Aspergillus Niger) 아밀로글루코시다제 (Sigma Aldrich, Saint Louis, MO) 로 총 소화 후에 방출되는 글루코스로서 간접적으로 측정했다. 샘플을 5 min 동안 95℃ 에서 인큐베이션한 후, 4℃ 에서 냉각시켰다; 그 후 0.1M 포타슘 아세테이트 pH5.5 중 1:50 로 희석한 25 μl 의 아밀로글루코시다제를 각각의 샘플에 첨가했다. 아밀로글루코시다제를 사용하지 않는 컨트롤 반응물을 각각의 샘플에 대해 준비했다. 샘플 및 컨트롤 반응물 둘 모두를 37℃ 에서 90 분 동안 인큐베이션했다. 샘플을 5 min 동안 95℃ 에서 인큐베이션하여 반응을 중단시켰다. 방출된 글루코스를 상업적 글루코스 어세이 키트 (Sigma Aldrich, Saint Louis, MO) 로 확인했고, 결과적인 흡광도를 EnSpire 알파 플레이트 리더 (Perkin-Elmer, Waltham, MA) 로 파장 540 nm 에서 획득했다.
근육 기능 시험
평균 행잉 타임 (mean hanging time) 을 측정하기 위해서, 4-mm 와이어 상에서 3 분 지속 행잉 시험 (three-minute lasting hanging test) 을 수행했다. 시험 시작시, "추락 (falling)" 점수 10 을 각각의 동물에게 부여한다. 마우스를 꼬리로 취급하고 와이어 근처로 가져온다. 작업자는 동물을 오직 앞다리로만 매단다. 동물이 제대로 매달리자마자, 180-초 타이머를 시작한다. 동물이 추락하는 경우에, 타이머를 중지하고, 추락 점수를 1 만큼 줄이고, 경과한 시간을 기록한다. 그 후 동물을 앞다리로 매달고, 타이머를 다시 시작한다. 타이머 또는 추락 점수가 0 에 도달할 때 시험을 중단한다. 결과를 분 당 추락의 회수로서 표현한다.
결과
AAV 는 생체내 유전자 요법에 선택되는 벡터이다. 유전자 대체에 AAV 를 사용하는 경우에 가장 큰 한계 중 하나는 5 Kb 로 한정되는 그것의 캡시드화 크기이다. 실제로, 재조합 AAV 생산 동안, 5 Kb 보다 더 큰 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 단편화된 게놈을 함유할 수 있으며, 이는 유전자 전달의 효능을 감소시킨다. 이러한 한계를 극복하는 상이한 접근법이 개발되었다. 특히 듀얼 AAV 벡터의 사용이 보고되었다. 이 접근법에 따르면, 큰 이식유전자 코딩 서열의 일부를 각각 함유하는, 두 가지 벡터를 사용하여 동일한 세포를 형질도입한다. i) 이식유전자에서 유래하는 중복 서열, ii) 스플라이싱 도너 및 억셉터와 조합된 내부 말단 반복부 (ITR) 또는 iii) 스플라이싱 도너 및 억셉터와 커플링된 이종 고도 재조합유전성 서열을 통해 두 가지 벡터의 재조합이 일어날 수 있다. 그러나, 듀얼 AAV 벡터가 상이한 동물 모델에서 효능을 입증했지만, 그것은 일부 결점을 갖는다. 여기에서 본 발명자들은 단일 AAV 에 맞고, 더 낮은 용량의 듀얼 AAV 벡터와 유사한 효능으로 GSDIII 마우스에서 글리코겐 축적 및 근육 기능을 구조하는 고릴라 GDE 의 사용에 대한 첫번째 데이타를 보고한다.
도 1 은 인간 GDE (hGDE) 보다 작은 4 가지 상이한 포유류 비-인간 GDE 단백질을 나타낸다 (이는 완전하지 않다).
도 2 는 절두된 인간 GDE (hGDE) Δ1, Δ2-3, 및 Δ4 서열을 나타낸다.
첫째로, 본 발명자들은 짧은 비-인간 포유류 GDE 에 의해 GSD III 마우스에서 유도되는 효과를 평가했다. 그 후 근육 특이적 프로모터 (SpC5-12), SV40 인트론, 고릴라 GDE (gGDE) 에 대한 코딩 서열 및 bGH polyA (AAV9-gGDE, 총 크기: 5.1 Kb) 로 구성된 이식유전자 발현 카세트를 사용하여 삼중 트랜스펙션 및 세슘 클로라이드 구배 정제에 의해 AAV9 벡터를 생산했다.
그 후 AAV9-gGDE 벡터를 3 개월령 GSDIII 마우스에게 1x1012 vg/마우스의 용량으로 주입하였으며, 이와 병행하여 CMV 프로모터의 번역 제어 하에 GDE 를 발현하는 듀얼 AAV 벡터를 2x1012 vg/마우스의 용량으로 주입했다. 벡터 주입후 3 개월째에, 마우스를 희생시키고, 조직을 분석하여 GSDIII 의 생화학적 수정을 평가했다. GDE 에 특이적인 항체로 위에 기재된 바와 같이 처리된 마우스의 심장에 대해 수행한 웨스턴 블롯은 AAV9-gGDE 의 주입이 GDE 보다 작고 (추정 크기 ~130 KDa) 특이적 항-GDE 항체에 의해 인지되는 단백질의 발현을 유도한다는 것을 시사한다 (도 3). 그 후 본 발명자들은 AAV9-gGDE 를 주입한 GDE-KO 동물의 사두근에서의 글리코겐 축적을 CMV 의 전사 제어 하에 GDE 를 발현하는 듀얼 AAV9 벡터 (듀얼-GDE) 와 비교하여 평가했다. 도 4 의 그래프에서 AAV-처리된 동물에서 및 미처리 야생형 (WT) 및 KO 동물에서 측정된 글리코겐의 수준이 보고된다. gGDE 를 발현하는 단일 벡터를 이용한 치료는 글리코겐 축적을 듀얼 AAV 벡터로 관찰되는 것과 비슷한 수준까지 없앴다. 부가적으로, 와이어 행에 의한 근육 기능의 측정은 두 개의 접근법 모두가 근육 강도의 구조에서 동등하게 효율적이라는 것을 시사한다 (도 5). 종합하면, 이들 데이타는 근육에서의 AAV-매개되는 gGDE 발현은 GSDIII 마우스의 글리코겐 축적 및 근육 강도를 구조한다는 것을 시사한다.
그 후 본 발명자들은 인간 GDE 서열의 절두된 형태의 활성을 시험관내 및 생체내 둘 모두에서 평가했다. 본 발명자들은 첫째로 간암 세포 (Huh-7) 를 CMV 프로모터의 전사 제어 하의 인간 GDE 에서 유래하는 하나의 절두된 형태를 코딩하는 플라스미드로 트랜스펙션시켰다. 발현 카세트는 또한 SV40 인트론 및 bGH 폴리아데닐화 신호를 함유했다. 트랜스펙션 후 2 일째에, 그 세포로부터 수득한 시토졸 추출물에서 활성을 측정했다. 한계 덱스트린으로부터의 글루코스에 기초하는, 활성 시험은 GDE 의 내생적 발현으로 인한 세포주에서의 기저 활성의 검출을 허용했다. 전체 크기 인간 GDE 과발현은 증가된 GDE 활성을 초래했다. 유사한 결과가 Δ4 절두된 인간 GDE 로 수득되었으나, 고릴라 GDE 로는 그렇지 않았다 (도 6). 그 후 본 발명자들은 GDE 를 발현하는 AAV 벡터의 근육내 주입에 의해 생체내에서 결과를 수득했다. GDE-KO 동물에게 인간 절두된 GDE (Δ1), 고릴라 GDE 를 발현하는 AAV9 벡터, 또는 인간 전체 크기 GDE 를 발현하는 듀얼 벡터를 근육내 주입했다. 주입 후 15 일째에, 앞정강근을 해부하고, GDE 발현 및 활성에 대해 분석했다 (도 7). 항-GDE 항체를 이용한 웨스턴 블롯 분석은 전체 크기 GDE 보다 분자량이 작은 밴드의 존재를 분명히 입증했다 (도 7).
SpC5.12 프로모터의 전사 제어 하의 야생형 (wt) 또는 코돈 최적화된 (co) 세 가지 상이한 절두된 hGDE 를 발현하는 AAV 벡터를 유도했다. 이들 벡터를 1E11 vg/마우스의 용량으로 암컷 GDE-KO 마우스의 오른쪽 앞정강근 (TA) 에 직접 주입했다. 주입 후 15 일째에, 주입된 마우스의 TA 로부터 수득된 추출물에서 GDE 활성을 측정했다. 어떠한 주입도 받지 않은 왼쪽 TA 에서 측정한 GDE 활성을 컨트롤 (Agl-/-, CTRL) 로서 사용했다. GDE 의 상이한 절두된 형태를 발현하는 단일 벡터 AAV 로 처리된 마우스의 TA 로부터 수득된 단백질 추출물은 컨트롤과 비교하여 더 높은 수준의 GDE 활성을 보였다 (도 8).
도 9 는 HEK293 세포에서 트랜스펙션에 의한 부가적 인간 절두된 GDE: Δ9 + Δ2/3; Δ10 + Δ2/3; Δ11 + Δ2/3; Δ12 + Δ2/3; Δ13 + Δ2/3 의 성공적 발현을 입증한다.
도 10 은 상기 인간 절두된 GDE 를 발현하는 AAV9 벡터로 주입 후 15 일째에, GDE-KO 마우스의 앞정강근에서의, 부가적 인간 절두된 GDE: Δ2/3; Δ9 + Δ2/3; Δ10 + Δ2/3; Δ13 + Δ2/3 의 성공적 발현을 추가로 입증한다.
제시된 데이타는 인간 GDE 또는 비-인간 GDE 의 절두된 형태인, GDE 의 더 짧은 형태는 시험관내 및 생체내 둘 모두에서 활성 형태로 발현될 수 있고, GSDIII 마우스에서 축적된 글리코겐을 분해하는데 사용될 수 있다는 것을 명백히 입증한다.
SEQUENCE LISTING
<110> GENETHON ET AL.
<120> MINI-GDE FOR THE TREATMENT OF GLYCOGEN STORAGE DISEASE III
<130> B2813PC00
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 1532
<212> PRT
<213> Homo sapiens
<400> 1
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
355 360 365
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
370 375 380
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
385 390 395 400
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
405 410 415
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
420 425 430
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
435 440 445
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
450 455 460
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
465 470 475 480
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
485 490 495
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
500 505 510
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
515 520 525
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
530 535 540
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
545 550 555 560
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
565 570 575
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
580 585 590
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
595 600 605
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
610 615 620
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
625 630 635 640
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
645 650 655
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
660 665 670
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
675 680 685
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
690 695 700
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
705 710 715 720
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
725 730 735
Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg
740 745 750
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
755 760 765
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
770 775 780
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
785 790 795 800
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
805 810 815
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
820 825 830
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
835 840 845
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
850 855 860
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
865 870 875 880
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala
885 890 895
Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu
900 905 910
Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp
915 920 925
Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala
930 935 940
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
945 950 955 960
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
965 970 975
Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe
980 985 990
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
995 1000 1005
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp
1010 1015 1020
Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys
1025 1030 1035
His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe
1040 1045 1050
Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr
1055 1060 1065
Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser
1070 1075 1080
Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys
1085 1090 1095
Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile
1100 1105 1110
Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala
1115 1120 1125
Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly
1130 1135 1140
Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu
1145 1150 1155
Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp
1160 1165 1170
Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser
1175 1180 1185
Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val
1190 1195 1200
Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg
1205 1210 1215
Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu
1220 1225 1230
Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val
1235 1240 1245
Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met
1250 1255 1260
Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro
1265 1270 1275
Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala
1280 1285 1290
Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr
1295 1300 1305
His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser
1310 1315 1320
Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu
1325 1330 1335
Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro
1340 1345 1350
Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala
1355 1360 1365
Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile
1370 1375 1380
Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp
1385 1390 1395
Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly
1400 1405 1410
Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr
1415 1420 1425
Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe
1430 1435 1440
Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe
1445 1450 1455
Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr
1460 1465 1470
Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His
1475 1480 1485
Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu
1490 1495 1500
Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln
1505 1510 1515
Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1520 1525 1530
<210> 2
<211> 1376
<212> PRT
<213> artificial
<220>
<223> D1 hGDE
<400> 2
Met Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys
1 5 10 15
Tyr Ser Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro
20 25 30
Asn Arg Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu
35 40 45
Lys Lys Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His
50 55 60
Thr Ala Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr
65 70 75 80
Asn Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg
85 90 95
Ala Leu Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu
100 105 110
Lys Gly Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile
115 120 125
Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu
130 135 140
Phe Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu
145 150 155 160
Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His
165 170 175
Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val
180 185 190
Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro
195 200 205
Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu
210 215 220
Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala
225 230 235 240
Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His
245 250 255
Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg
260 265 270
Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser
275 280 285
Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly
290 295 300
Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser
305 310 315 320
Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys
325 330 335
Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His
340 345 350
Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg
355 360 365
Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu
370 375 380
Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu
385 390 395 400
Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly
405 410 415
Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu
420 425 430
Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe
435 440 445
Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu
450 455 460
Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser
465 470 475 480
Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys
485 490 495
Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile
500 505 510
Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala
515 520 525
Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala
530 535 540
Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly
545 550 555 560
Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val
565 570 575
Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg
580 585 590
Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro
595 600 605
Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg
610 615 620
Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile
625 630 635 640
Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu
645 650 655
Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro
660 665 670
Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser
675 680 685
Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val
690 695 700
Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser
705 710 715 720
Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe
725 730 735
Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu
740 745 750
Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp
755 760 765
Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met
770 775 780
Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe
785 790 795 800
Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn
805 810 815
Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu
820 825 830
Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro
835 840 845
Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp
850 855 860
Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe
865 870 875 880
Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys
885 890 895
Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr
900 905 910
Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu
915 920 925
Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly
930 935 940
Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg
945 950 955 960
Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg
965 970 975
His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr
980 985 990
Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr
995 1000 1005
Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val
1010 1015 1020
Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly
1025 1030 1035
Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln
1040 1045 1050
Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro
1055 1060 1065
Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala
1070 1075 1080
Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe
1085 1090 1095
Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala
1100 1105 1110
Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val
1115 1120 1125
Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu
1130 1135 1140
Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys
1145 1150 1155
Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg
1160 1165 1170
Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp
1175 1180 1185
Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg
1190 1195 1200
Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp
1205 1210 1215
Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro
1220 1225 1230
Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala
1235 1240 1245
Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro
1250 1255 1260
Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn
1265 1270 1275
Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro
1280 1285 1290
Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr
1295 1300 1305
Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val
1310 1315 1320
Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg
1325 1330 1335
Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln
1340 1345 1350
Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr
1355 1360 1365
Ile Leu Glu Thr Leu Tyr Asp Leu
1370 1375
<210> 3
<211> 1464
<212> PRT
<213> artificial
<220>
<223> D2 hGDE
<400> 3
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Tyr Phe Thr Phe Pro Phe Glu Glu
355 360 365
Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala
370 375 380
Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu
385 390 395 400
Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu
405 410 415
Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu
420 425 430
Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr
435 440 445
Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro
450 455 460
Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro
465 470 475 480
Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp
485 490 495
Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala
500 505 510
Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr
515 520 525
Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu
530 535 540
Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn
545 550 555 560
Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr
565 570 575
Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr
580 585 590
Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe
595 600 605
Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val
610 615 620
Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu
625 630 635 640
His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln
645 650 655
Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His
660 665 670
Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr
675 680 685
Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile
690 695 700
Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro
705 710 715 720
Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val
725 730 735
Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln
740 745 750
Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu
755 760 765
Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu
770 775 780
Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr
785 790 795 800
Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala
805 810 815
Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr
820 825 830
Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys
835 840 845
Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys
850 855 860
Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro
865 870 875 880
Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp
885 890 895
Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr
900 905 910
Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys
915 920 925
Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile
930 935 940
Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser
945 950 955 960
Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser
965 970 975
Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser
980 985 990
Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu
995 1000 1005
Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe
1010 1015 1020
Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala
1025 1030 1035
Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg
1040 1045 1050
Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile
1055 1060 1065
Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg
1070 1075 1080
Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys
1085 1090 1095
Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg
1100 1105 1110
Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu
1115 1120 1125
Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His
1130 1135 1140
Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile
1145 1150 1155
Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val
1160 1165 1170
Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys
1175 1180 1185
Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn
1190 1195 1200
Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile
1205 1210 1215
Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser
1220 1225 1230
Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His
1235 1240 1245
Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile
1250 1255 1260
Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser
1265 1270 1275
Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile
1280 1285 1290
Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln
1295 1300 1305
Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu
1310 1315 1320
Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys
1325 1330 1335
Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp
1340 1345 1350
Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn
1355 1360 1365
Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp
1370 1375 1380
Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser
1385 1390 1395
Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val
1400 1405 1410
Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro
1415 1420 1425
Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys
1430 1435 1440
Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu
1445 1450 1455
Glu Thr Leu Tyr Asp Leu
1460
<210> 4
<211> 1430
<212> PRT
<213> artificial
<220>
<223> D3 hGDE
<400> 4
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
355 360 365
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
370 375 380
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
385 390 395 400
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
405 410 415
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
420 425 430
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
435 440 445
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
450 455 460
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
465 470 475 480
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
485 490 495
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
500 505 510
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
515 520 525
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
530 535 540
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
545 550 555 560
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
565 570 575
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
580 585 590
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
595 600 605
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
610 615 620
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
625 630 635 640
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
645 650 655
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Gly Lys Ile Glu Glu
660 665 670
Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg
675 680 685
Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile
690 695 700
Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly
705 710 715 720
Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu
725 730 735
Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro
740 745 750
His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe
755 760 765
Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro
770 775 780
Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala
785 790 795 800
Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp
805 810 815
Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala
820 825 830
Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn
835 840 845
Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met
850 855 860
Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala
865 870 875 880
Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile
885 890 895
Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala
900 905 910
Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val
915 920 925
Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln
930 935 940
Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala
945 950 955 960
Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu
965 970 975
Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly
980 985 990
Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile
995 1000 1005
Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu
1010 1015 1020
Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu
1025 1030 1035
Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp
1040 1045 1050
Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn
1055 1060 1065
Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr
1070 1075 1080
Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu
1085 1090 1095
Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile
1100 1105 1110
Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met
1115 1120 1125
Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr
1130 1135 1140
Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met
1145 1150 1155
Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro
1160 1165 1170
Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser
1175 1180 1185
Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile
1190 1195 1200
Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile
1205 1210 1215
Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe
1220 1225 1230
Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu
1235 1240 1245
Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser
1250 1255 1260
Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn
1265 1270 1275
Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu
1280 1285 1290
Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly
1295 1300 1305
Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys
1310 1315 1320
Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala
1325 1330 1335
Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile
1340 1345 1350
Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly
1355 1360 1365
Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu
1370 1375 1380
Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu
1385 1390 1395
Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys
1400 1405 1410
Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr
1415 1420 1425
Asp Leu
1430
<210> 5
<211> 1362
<212> PRT
<213> artificial
<220>
<223> D2,3 hGDE
<400> 5
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Tyr Phe Thr Phe Pro Phe Glu Glu
355 360 365
Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala
370 375 380
Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu
385 390 395 400
Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu
405 410 415
Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu
420 425 430
Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr
435 440 445
Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro
450 455 460
Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro
465 470 475 480
Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp
485 490 495
Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala
500 505 510
Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr
515 520 525
Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu
530 535 540
Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn
545 550 555 560
Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr
565 570 575
Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr
580 585 590
Asp Glu Leu Val Pro His Gln Gly Lys Ile Glu Glu Val Val Leu Glu
595 600 605
Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn
610 615 620
Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile
625 630 635 640
Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys
645 650 655
Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro
660 665 670
Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val
675 680 685
Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe
690 695 700
Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile
705 710 715 720
Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln
725 730 735
Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys
740 745 750
Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly
755 760 765
Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His
770 775 780
Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val
785 790 795 800
Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys
805 810 815
Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu
820 825 830
Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu
835 840 845
Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser
850 855 860
Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val
865 870 875 880
Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val
885 890 895
Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val
900 905 910
Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys
915 920 925
Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr
930 935 940
Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr
945 950 955 960
Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala
965 970 975
Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln
980 985 990
Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro
995 1000 1005
Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala
1010 1015 1020
Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
1025 1030 1035
Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly
1040 1045 1050
Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr
1055 1060 1065
Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg
1070 1075 1080
Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg
1085 1090 1095
Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala
1100 1105 1110
Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu
1115 1120 1125
Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val
1130 1135 1140
Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn
1145 1150 1155
Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu
1160 1165 1170
Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys
1175 1180 1185
Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys
1190 1195 1200
Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala
1205 1210 1215
Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile
1220 1225 1230
Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp
1235 1240 1245
Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp
1250 1255 1260
Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly
1265 1270 1275
Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu
1280 1285 1290
Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile
1295 1300 1305
Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu
1310 1315 1320
Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala
1325 1330 1335
Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala
1340 1345 1350
Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1355 1360
<210> 6
<211> 1339
<212> PRT
<213> artificial
<220>
<223> D4 hGDE
<400> 6
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
355 360 365
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
370 375 380
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
385 390 395 400
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
405 410 415
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
420 425 430
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
435 440 445
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
450 455 460
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
465 470 475 480
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
485 490 495
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
500 505 510
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
515 520 525
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
530 535 540
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
545 550 555 560
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
565 570 575
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
580 585 590
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
595 600 605
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
610 615 620
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
625 630 635 640
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
645 650 655
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
660 665 670
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
675 680 685
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
690 695 700
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
705 710 715 720
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
725 730 735
Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg
740 745 750
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
755 760 765
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
770 775 780
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
785 790 795 800
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
805 810 815
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
820 825 830
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
835 840 845
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
850 855 860
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
865 870 875 880
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Pro
885 890 895
His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile
900 905 910
Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg
915 920 925
Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro
930 935 940
Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala
945 950 955 960
Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro
965 970 975
Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr
980 985 990
Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe
995 1000 1005
Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln
1010 1015 1020
Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys
1025 1030 1035
Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly
1040 1045 1050
Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp
1055 1060 1065
Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala
1070 1075 1080
Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys
1085 1090 1095
Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe
1100 1105 1110
Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys
1115 1120 1125
Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu
1130 1135 1140
Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys
1145 1150 1155
His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr
1160 1165 1170
Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe
1175 1180 1185
Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys
1190 1195 1200
Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro
1205 1210 1215
Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly
1220 1225 1230
Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys
1235 1240 1245
Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly
1250 1255 1260
Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro
1265 1270 1275
Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser
1280 1285 1290
Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro
1295 1300 1305
Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu
1310 1315 1320
Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp
1325 1330 1335
Leu
<210> 7
<211> 1313
<212> PRT
<213> artificial
<220>
<223> D5 hGDE
<400> 7
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Asn Arg
210 215 220
Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp
225 230 235 240
Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu
245 250 255
Thr Thr Phe Ile Pro Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe
260 265 270
Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu
275 280 285
Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe
290 295 300
Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp
305 310 315 320
Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro
325 330 335
Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr
340 345 350
Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val
355 360 365
Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr
370 375 380
Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe
385 390 395 400
Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala
405 410 415
Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu
420 425 430
Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala
435 440 445
Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro
450 455 460
Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val
465 470 475 480
Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu
485 490 495
Val Pro His Gln Ile Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala
500 505 510
Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr
515 520 525
Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val
530 535 540
Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala
545 550 555 560
Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser
565 570 575
Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln
580 585 590
Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly
595 600 605
Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly
610 615 620
Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala
625 630 635 640
Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys
645 650 655
Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro
660 665 670
Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile
675 680 685
Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr
690 695 700
Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu
705 710 715 720
Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro
725 730 735
Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser
740 745 750
Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp
755 760 765
Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile
770 775 780
Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu
785 790 795 800
Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr
805 810 815
Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly
820 825 830
Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro
835 840 845
Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser
850 855 860
Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp
865 870 875 880
Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly
885 890 895
Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu
900 905 910
Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg
915 920 925
Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp
930 935 940
Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val
945 950 955 960
Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr
965 970 975
Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His
980 985 990
Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp
995 1000 1005
Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp
1010 1015 1020
Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly
1025 1030 1035
Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg
1040 1045 1050
Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val
1055 1060 1065
Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys
1070 1075 1080
Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly
1085 1090 1095
Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln
1100 1105 1110
Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp
1115 1120 1125
Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr
1130 1135 1140
Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu
1145 1150 1155
Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe
1160 1165 1170
Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys
1175 1180 1185
Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met
1190 1195 1200
Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr
1205 1210 1215
Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu
1220 1225 1230
Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg
1235 1240 1245
Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys
1250 1255 1260
Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp
1265 1270 1275
Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro
1280 1285 1290
Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu
1295 1300 1305
Thr Leu Tyr Asp Leu
1310
<210> 8
<211> 1252
<212> PRT
<213> artificial
<220>
<223> D6 hGDE
<400> 8
Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu
1 5 10 15
Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln
20 25 30
Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp
35 40 45
Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe
50 55 60
Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His
65 70 75 80
Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys
85 90 95
Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His
100 105 110
Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg
115 120 125
Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro
130 135 140
Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser
145 150 155 160
Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met
165 170 175
Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala
180 185 190
Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly
195 200 205
Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr
210 215 220
Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe
225 230 235 240
Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala
245 250 255
Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val
260 265 270
Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val
275 280 285
Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr
290 295 300
Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro
305 310 315 320
Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile
325 330 335
Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile
340 345 350
Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser
355 360 365
Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val
370 375 380
Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp
385 390 395 400
Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser
405 410 415
Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu
420 425 430
Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp
435 440 445
Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val
450 455 460
Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser
465 470 475 480
Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val
485 490 495
Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp
500 505 510
Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu
515 520 525
His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala
530 535 540
Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu
545 550 555 560
Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala
565 570 575
Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro
580 585 590
His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu
595 600 605
Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu
610 615 620
Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly
625 630 635 640
Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu
645 650 655
Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu
660 665 670
Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp
675 680 685
Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val
690 695 700
Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg
705 710 715 720
Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr
725 730 735
Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn
740 745 750
Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys
755 760 765
Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met
770 775 780
Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys
785 790 795 800
Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe
805 810 815
Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu
820 825 830
Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala
835 840 845
Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile
850 855 860
Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys
865 870 875 880
Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys
885 890 895
Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro
900 905 910
Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
915 920 925
Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro
930 935 940
Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly
945 950 955 960
Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys
965 970 975
Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg
980 985 990
Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly
995 1000 1005
Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys
1010 1015 1020
Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys
1025 1030 1035
Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp
1040 1045 1050
Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu
1055 1060 1065
Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys
1070 1075 1080
Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg
1085 1090 1095
Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr
1100 1105 1110
Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu
1115 1120 1125
Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val
1130 1135 1140
Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn
1145 1150 1155
Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp
1160 1165 1170
Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu
1175 1180 1185
Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn
1190 1195 1200
Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys
1205 1210 1215
Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe
1220 1225 1230
Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr
1235 1240 1245
Leu Tyr Asp Leu
1250
<210> 9
<211> 1108
<212> PRT
<213> artificial
<220>
<223> D7 hGDE
<400> 9
Met Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser
1 5 10 15
Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met
20 25 30
Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala
35 40 45
Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly
50 55 60
Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr
65 70 75 80
Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe
85 90 95
Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala
100 105 110
Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val
115 120 125
Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val
130 135 140
Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr
145 150 155 160
Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro
165 170 175
Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile
180 185 190
Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile
195 200 205
Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser
210 215 220
Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val
225 230 235 240
Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp
245 250 255
Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser
260 265 270
Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu
275 280 285
Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp
290 295 300
Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val
305 310 315 320
Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser
325 330 335
Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val
340 345 350
Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp
355 360 365
Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu
370 375 380
His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala
385 390 395 400
Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu
405 410 415
Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala
420 425 430
Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro
435 440 445
His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu
450 455 460
Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu
465 470 475 480
Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly
485 490 495
Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu
500 505 510
Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu
515 520 525
Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp
530 535 540
Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val
545 550 555 560
Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg
565 570 575
Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr
580 585 590
Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn
595 600 605
Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys
610 615 620
Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met
625 630 635 640
Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys
645 650 655
Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe
660 665 670
Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu
675 680 685
Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala
690 695 700
Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile
705 710 715 720
Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys
725 730 735
Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys
740 745 750
Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro
755 760 765
Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
770 775 780
Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro
785 790 795 800
Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly
805 810 815
Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys
820 825 830
Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg
835 840 845
Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly
850 855 860
Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn
865 870 875 880
Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile
885 890 895
Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu
900 905 910
Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His
915 920 925
Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala
930 935 940
Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala
945 950 955 960
Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala
965 970 975
Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr
980 985 990
Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu
995 1000 1005
Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln
1010 1015 1020
Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys
1025 1030 1035
Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr
1040 1045 1050
Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu
1055 1060 1065
Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn
1070 1075 1080
Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile
1085 1090 1095
Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1100 1105
<210> 10
<211> 1303
<212> PRT
<213> artificial
<220>
<223> D8 hGDE
<400> 10
Met His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser Pro His Leu Lys
1 5 10 15
Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe Ser Cys Asp Val
20 25 30
Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala Leu Ile Glu Asn
35 40 45
Asp His His Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe
50 55 60
Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala
65 70 75 80
Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr
85 90 95
Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr
100 105 110
Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe
115 120 125
Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp
130 135 140
Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile
145 150 155 160
Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe
165 170 175
Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg
180 185 190
Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile
195 200 205
Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys
210 215 220
Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg
225 230 235 240
Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile
245 250 255
Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp
260 265 270
Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala
275 280 285
Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu
290 295 300
His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn
305 310 315 320
Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn
325 330 335
Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met
340 345 350
Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly
355 360 365
Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met
370 375 380
Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu
385 390 395 400
Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr
405 410 415
Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp
420 425 430
Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr
435 440 445
Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn
450 455 460
Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His
465 470 475 480
Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val
485 490 495
Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln
500 505 510
Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser
515 520 525
Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu
530 535 540
Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr
545 550 555 560
Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu
565 570 575
Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala
580 585 590
Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe
595 600 605
Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp
610 615 620
Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln
625 630 635 640
Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp
645 650 655
Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu
660 665 670
Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu
675 680 685
Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr
690 695 700
Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys
705 710 715 720
Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp
725 730 735
Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile
740 745 750
Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln
755 760 765
Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly
770 775 780
Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe
785 790 795 800
Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val
805 810 815
Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro
820 825 830
Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys
835 840 845
Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser
850 855 860
Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly
865 870 875 880
Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu
885 890 895
Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly
900 905 910
Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp
915 920 925
Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp
930 935 940
Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala
945 950 955 960
Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln
965 970 975
Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn
980 985 990
Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile
995 1000 1005
Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn
1010 1015 1020
Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp
1025 1030 1035
Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser
1040 1045 1050
Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu
1055 1060 1065
Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr
1070 1075 1080
Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp
1085 1090 1095
Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser
1100 1105 1110
Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His
1115 1120 1125
Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp
1130 1135 1140
Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val
1145 1150 1155
Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu
1160 1165 1170
Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu
1175 1180 1185
Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu
1190 1195 1200
Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln
1205 1210 1215
Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys
1220 1225 1230
Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr
1235 1240 1245
Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu
1250 1255 1260
Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn
1265 1270 1275
Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile
1280 1285 1290
Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1295 1300
<210> 11
<211> 1377
<212> PRT
<213> Equus caballus
<400> 11
Met Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Ser
1 5 10 15
Tyr Ser Leu Ala Asp Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro
20 25 30
Asn Lys Lys Tyr Thr Trp His Asp Val Gly Gln Leu Val Glu Lys Leu
35 40 45
Lys Lys Glu Trp Asp Ile Leu Cys Ile Thr Asp Val Val Tyr Asn His
50 55 60
Thr Ala Ala Asn Ser Lys Trp Ile His Glu His Pro Glu Ser Ala Tyr
65 70 75 80
Asn Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg
85 90 95
Ala Leu Trp His Leu Ser Cys Asp Val Ala Glu Gly Lys Tyr Arg Glu
100 105 110
Lys Gly Val Pro Ala Leu Ile Glu Asn Asp His Gln Met Asn Cys Ile
115 120 125
Arg Lys Ile Ile Trp Glu Asp Ile Tyr Pro Lys Ile His Leu Trp Glu
130 135 140
Phe Phe Gln Val Asp Val His Lys Ala Val Glu Gln Phe Arg Gly Leu
145 150 155 160
Leu Thr Gln Glu Asn Arg Lys Ile Ile Ser Gln Pro Asp Pro Lys Gln
165 170 175
His Leu Lys Ile Ile Gln Asp Pro Glu Tyr Arg Arg Leu Gly Cys Thr
180 185 190
Val Asp Met Asn Ile Ala Leu Ala Thr Phe Ile Pro His Asp Asn Gly
195 200 205
Pro Ala Ala Ile Asp Glu Cys Cys Asn Trp Phe Arg Lys Arg Ile Glu
210 215 220
Glu Leu Asn Ala Glu Lys His Gln Leu Val Asn Tyr His Gln Glu Gln
225 230 235 240
Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly
245 250 255
His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr
260 265 270
Arg Tyr Phe Thr Phe Pro Phe Glu Glu Met Thr Pro Ser Thr Glu Glu
275 280 285
Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn
290 295 300
Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly
305 310 315 320
Ser Asp Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val
325 330 335
Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala
340 345 350
His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr His Phe Gln Gly Val
355 360 365
Arg Leu Asp Asn Cys His Ser Thr Pro Ile His Val Ala Glu Tyr Met
370 375 380
Leu Asp Ala Ala Arg Lys Leu Gln Pro Asn Leu Tyr Val Val Ala Glu
385 390 395 400
Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Ile Phe Val Thr Arg Leu
405 410 415
Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Ala Asp Ser His
420 425 430
Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser
435 440 445
Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala
450 455 460
Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg
465 470 475 480
Ser Ala Tyr Asp Ala Leu Pro Ser Ser Thr Ile Val Ser Met Ala Ser
485 490 495
Cys Ala Ser Gly Ser Thr Lys Gly Tyr Asp Glu Leu Val Pro His Gln
500 505 510
Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu
515 520 525
Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile
530 535 540
Ala Ala Arg Arg Ala Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys
545 550 555 560
Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Gln Asp Ile Val Ala
565 570 575
Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ser Val Ser
580 585 590
Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val
595 600 605
Pro His Met Tyr Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala
610 615 620
Arg Thr Ile Glu Arg His Thr Ile Pro Tyr Lys Lys Asp Glu Asn Ser
625 630 635 640
Ile Asn Gly Met Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln
645 650 655
Leu Asn Glu Ser Lys Ile Val Lys His Ala Gly Ile Val Thr Lys Gly
660 665 670
Pro Asn Glu Phe Val Gln Glu Ile Glu Phe Glu Asn Leu Thr Pro Gly
675 680 685
Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala
690 695 700
Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys
705 710 715 720
Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro
725 730 735
Phe Ala Ser Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu Asn Gln Val
740 745 750
Leu Tyr Arg Cys Glu Ser Glu Glu Gln Glu Asp Gly Gly Gly Cys Tyr
755 760 765
Asn Ile Pro Asn Trp Ser Ser Leu Lys Tyr Ala Gly Leu Gln Gly Leu
770 775 780
Met Ser Ile Leu Ala Glu Ile Arg Pro Arg Asn Asp Leu Gly His Pro
785 790 795 800
Phe Cys Asp Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser
805 810 815
Ser Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp
820 825 830
Leu Gln Ala Met Phe Leu Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile
835 840 845
Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu
850 855 860
Asp Ile Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr
865 870 875 880
Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Met Cys Gly Val Gly
885 890 895
Lys Phe Pro Ser Leu Pro Leu Leu Ser Pro Ser Leu Thr Asp Leu Pro
900 905 910
Tyr Arg Val Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Gly Ser
915 920 925
Leu Ala Ala Gly Leu Pro His Phe Ser Ala Gly Ile Phe Arg Cys Trp
930 935 940
Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Leu Leu Leu Val Thr Gly
945 950 955 960
Arg Tyr Leu Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu
965 970 975
Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Thr His Ala Arg
980 985 990
Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp
995 1000 1005
Tyr Cys Lys Ile Val Pro Asn Gly Leu Asp Ile Leu Arg Cys Pro
1010 1015 1020
Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Val Pro Leu Ser Ala
1025 1030 1035
Gly Thr Val Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
1040 1045 1050
Gln Arg His Val Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly
1055 1060 1065
Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr
1070 1075 1080
Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg
1085 1090 1095
Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg
1100 1105 1110
Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala
1115 1120 1125
Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu
1130 1135 1140
Glu Leu Ser Arg Lys Asn Ile Phe Pro Tyr His Glu Val Arg Val
1145 1150 1155
Lys Arg His Gly Lys Phe Val Thr Val Ser Tyr Asp Glu Trp Asn
1160 1165 1170
Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu
1175 1180 1185
Asp Pro Ser Asp Phe Asn Glu Lys His Pro Glu Leu Val His Lys
1190 1195 1200
Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys
1205 1210 1215
Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala
1220 1225 1230
Pro Glu Leu Phe Thr Pro Glu Lys Ala Trp Lys Ala Leu Glu Ile
1235 1240 1245
Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp
1250 1255 1260
Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp
1265 1270 1275
Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly
1280 1285 1290
Pro Glu Trp Leu Trp Pro Thr Gly Tyr Phe Leu Arg Ala Lys Leu
1295 1300 1305
Tyr Phe Ser Lys Leu Met Gly Pro Glu Thr Asn Ala Lys Thr Met
1310 1315 1320
Phe Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu
1325 1330 1335
Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Gly
1340 1345 1350
Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala
1355 1360 1365
Thr Val Leu Glu Thr Leu Tyr Asp Leu
1370 1375
<210> 12
<211> 1365
<212> PRT
<213> Gorilla gorilla
<400> 12
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Glu Tyr Phe Thr Phe Pro Phe Glu
355 360 365
Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys
370 375 380
Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro
385 390 395 400
Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu
405 410 415
Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro
420 425 430
Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile
435 440 445
Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr
450 455 460
Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln
465 470 475 480
Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu
485 490 495
Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu
500 505 510
Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg
515 520 525
Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro
530 535 540
Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp
545 550 555 560
Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser
565 570 575
Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly
580 585 590
Tyr Asp Glu Leu Val Pro His Gln Phe Leu Gly Lys Ile Glu Glu Val
595 600 605
Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Met Lys Pro Tyr Arg Lys
610 615 620
Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg
625 630 635 640
Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val
645 650 655
Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn
660 665 670
Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His
675 680 685
Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser
690 695 700
Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile
705 710 715 720
Leu Lys Ile Pro Phe Ala Ser Ile Ala Ser Arg Leu Thr Leu Ala Glu
725 730 735
Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly
740 745 750
Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly
755 760 765
Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp
770 775 780
Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile
785 790 795 800
Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu
805 810 815
Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro
820 825 830
Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr
835 840 845
Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln
850 855 860
Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu
865 870 875 880
Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu
885 890 895
Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln
900 905 910
Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile
915 920 925
Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu
930 935 940
Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe
945 950 955 960
Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly
965 970 975
Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln
980 985 990
Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Val Asp Ile Leu
995 1000 1005
Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro
1010 1015 1020
Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln
1025 1030 1035
Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg
1040 1045 1050
Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe
1055 1060 1065
Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly
1070 1075 1080
Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu
1085 1090 1095
Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp
1100 1105 1110
Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg
1115 1120 1125
Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu
1130 1135 1140
Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp
1145 1150 1155
Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His
1160 1165 1170
Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu
1175 1180 1185
Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser
1190 1195 1200
Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met
1205 1210 1215
Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala
1220 1225 1230
Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys
1235 1240 1245
Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn
1250 1255 1260
Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr
1265 1270 1275
His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg
1280 1285 1290
Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala
1295 1300 1305
Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val
1310 1315 1320
His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn
1325 1330 1335
Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp
1340 1345 1350
Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1355 1360 1365
<210> 13
<211> 1299
<212> PRT
<213> Pongo abelii
<400> 13
Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
35 40 45
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
100 105 110
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
180 185 190
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
210 215 220
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
225 230 235 240
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
245 250 255
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
260 265 270
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
275 280 285
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Glu Val
290 295 300
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
305 310 315 320
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
325 330 335
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
340 345 350
Ala Leu Thr Thr Phe Ile Pro His Asp Asn Gly Pro Ala Ala Ile Glu
355 360 365
Glu Cys Cys Asn Trp Phe Arg Lys Arg Ile Glu Glu Leu Asn Ser Glu
370 375 380
Lys His Gln Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
385 390 395 400
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
405 410 415
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
420 425 430
Pro Phe Glu Glu Met Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
435 440 445
Pro Asn Lys Ala Cys Leu Leu Met Ala His Asn Gly Trp Val Met Gly
450 455 460
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
465 470 475 480
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
485 490 495
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
500 505 510
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
515 520 525
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
530 535 540
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
545 550 555 560
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
565 570 575
Ile Arg Glu Ala Met Ser Ala Tyr Asp Ser His Glu Glu Gly Arg Leu
580 585 590
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
595 600 605
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
610 615 620
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
625 630 635 640
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
645 650 655
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
660 665 670
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
675 680 685
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
690 695 700
Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
705 710 715 720
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
725 730 735
Pro Ser Ile His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg
740 745 750
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
755 760 765
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
770 775 780
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
785 790 795 800
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
805 810 815
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Phe Ile
820 825 830
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
835 840 845
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
850 855 860
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
865 870 875 880
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Leu Pro His
885 890 895
Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala
900 905 910
Leu Arg Gly Met Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn
915 920 925
Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn
930 935 940
Leu Leu Gly Glu Gly Thr Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val
945 950 955 960
Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Val Val Pro Asn
965 970 975
Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp
980 985 990
Asp Ser Ala Pro Leu Pro Ala Gly Ala Leu Phe Asn Ile Thr Ala Gly
995 1000 1005
Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn
1010 1015 1020
Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg
1025 1030 1035
Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu
1040 1045 1050
Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu
1055 1060 1065
Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys His
1070 1075 1080
Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile
1085 1090 1095
Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser
1100 1105 1110
Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile
1115 1120 1125
Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln
1130 1135 1140
Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu
1145 1150 1155
Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys
1160 1165 1170
Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp
1175 1180 1185
Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn
1190 1195 1200
Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp
1205 1210 1215
Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser
1220 1225 1230
Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val
1235 1240 1245
Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro
1250 1255 1260
Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys
1265 1270 1275
Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Val Ala Thr Ile Leu
1280 1285 1290
Glu Thr Leu Tyr Asp Leu
1295
<210> 14
<211> 1390
<212> PRT
<213> Pteropus alecto
<400> 14
Met Gly His Gly Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu
1 5 10 15
Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Phe Glu Leu Gln
20 25 30
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Thr Val Thr Val His Thr
35 40 45
Asn Tyr Pro Tyr Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
50 55 60
Leu Glu Trp Glu Asn Pro Ser Glu Arg Glu Asp Asp Ser Asp Lys Tyr
65 70 75 80
Cys Lys Leu Asn Leu Gln Gln Ala Gly Ser Phe Gln Tyr Tyr Phe Leu
85 90 95
Arg Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Val
100 105 110
Leu Arg Val Gly Thr Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
115 120 125
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Leu Asp Glu Trp Glu
130 135 140
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
145 150 155 160
Thr Pro Leu Gln Thr Leu Gly Gln Ser Arg Ser Cys Tyr Ser Leu Ala
165 170 175
Asp Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Lys Lys Cys
180 185 190
Thr Trp Asp Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
195 200 205
Asn Ile Leu Cys Ile Thr Asp Val Val Tyr Asn His Thr Gly Asn Arg
210 215 220
Lys Ile Thr Lys Pro Asp Pro Lys Glu His Leu Lys Ile Ile Gln Asp
225 230 235 240
Pro Glu Tyr Arg Arg Leu Gly Cys Thr Val Asp Met Asn Ile Ala Leu
245 250 255
Ala Thr Phe Ile Pro Asn Glu Tyr Phe Thr Phe Pro Phe Glu Glu Met
260 265 270
Thr Leu Ser Thr Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys
275 280 285
Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg
290 295 300
Asn Phe Ala Glu Pro Gly Ser Asp Val Tyr Leu Arg Arg Glu Leu Ile
305 310 315 320
Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp
325 330 335
Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala
340 345 350
Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu
355 360 365
His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Lys Leu Gln Pro Asn
370 375 380
Leu Tyr Ile Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn
385 390 395 400
Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met
405 410 415
Ser Ala His Asp Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly
420 425 430
Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met
435 440 445
Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu
450 455 460
Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Ser Met
465 470 475 480
Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Lys Gly Tyr Asp
485 490 495
Glu Leu Val Pro His Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile
500 505 510
Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala
515 520 525
Val Ser Arg Thr Ala Phe Lys Asn Pro Lys Thr Ser Phe Tyr Ser Lys
530 535 540
Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu
545 550 555 560
Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Lys Arg Asp Glu
565 570 575
Asn Ser Ile Asn Gly Met Pro Asp Ile Thr Ala Glu Ile Arg Glu His
580 585 590
Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Ile Ala Thr
595 600 605
Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser
610 615 620
Pro Gly Ser Val Ile Val Phe Arg Val Ser Leu Asp Pro His Ala Gln
625 630 635 640
Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His
645 650 655
Phe Lys Ser Gly Ser Leu Ser Ala Asp Ser Ser Asp Pro Ile Leu Lys
660 665 670
Ile Pro Phe Ala Tyr Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu Asn
675 680 685
Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Gln Glu Asp Gly Gly Gly
690 695 700
Cys Tyr Asn Ile Pro Asn Trp Ser Ser Leu Lys Tyr Ala Gly Leu Gln
705 710 715 720
Glu Asn Ser Ser Leu Glu Leu Ala Pro Tyr Val Gly Phe Gly Gly Gly
725 730 735
Cys Gly Ala Ala Pro Ala Gly Leu Asn Arg Gly Gly Gly Val Arg Ser
740 745 750
Asp Gln Ala Ser Leu Glu Arg Phe Leu Thr Thr Leu Leu Ala Thr Val
755 760 765
Asp Tyr Thr Ala Leu Val Ser Thr Ser Val Cys Ser Pro His Ile Thr
770 775 780
Gly His Glu Gln Gln Pro Arg Leu Trp Glu Arg Ile Ala Ser Ala Asn
785 790 795 800
Asn Ile Ala Cys Tyr Phe Tyr Asp Phe Ser Gly Leu Met Ser Val Leu
805 810 815
Ala Glu Met Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asp Asn
820 825 830
Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile
835 840 845
Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Arg Trp Leu Gln Ala Met
850 855 860
Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe
865 870 875 880
Asp Ala Val Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp
885 890 895
Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His
900 905 910
Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Tyr Ala Ser
915 920 925
Leu Pro Leu Leu Ser Pro Ser Leu Met Asp Val Pro Tyr Arg Leu Asn
930 935 940
Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Thr Leu Ala Ala Gly
945 950 955 960
Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr
965 970 975
Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Leu Glu
980 985 990
Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu
995 1000 1005
Ile Pro Asn Leu Leu Gly Glu Gly Thr Tyr Ala Arg Tyr Asn Cys
1010 1015 1020
Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys
1025 1030 1035
Lys Val Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser
1040 1045 1050
Arg Met Tyr Pro Thr Asp Asp Ser Val Pro Leu Ser Ala Gly Thr
1055 1060 1065
Val Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Arg
1070 1075 1080
His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln
1085 1090 1095
Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Val Gly
1100 1105 1110
Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn
1115 1120 1125
Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg
1130 1135 1140
Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu
1145 1150 1155
Ile Val Gly Leu Ser Lys Ser Ala Ile Arg Trp Leu Leu Glu Leu
1160 1165 1170
Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg
1175 1180 1185
Asp Gly Lys Val Val Thr Val Ser Tyr Asp Glu Trp Asn Arg Lys
1190 1195 1200
Ile Gln Asp Asn Phe Glu Lys Leu Phe Tyr Val Ser Glu Asp Pro
1205 1210 1215
Ser Asp Phe Asn Glu Lys Asn Pro Asn Leu Val His Lys Arg Gly
1220 1225 1230
Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr
1235 1240 1245
Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu
1250 1255 1260
Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Gln Val Ala Glu
1265 1270 1275
Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp
1280 1285 1290
Asp Met Val Tyr Cys Gly Val Tyr Asp Asn Ala Leu Asp Asn Asp
1295 1300 1305
Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu
1310 1315 1320
Trp Leu Trp Leu Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe
1325 1330 1335
Ser Lys Leu Met Gly Pro Glu Thr Asn Ala Lys Thr Ile Phe Leu
1340 1345 1350
Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Ser Leu
1355 1360 1365
Ala Cys Phe Ala Leu Thr Thr Leu Leu Gln Leu Leu Asn Lys Ile
1370 1375 1380
Leu Ser Ala Ser Gln Ile Pro
1385 1390
<210> 15
<211> 1252
<212> PRT
<213> Cercocebus atys
<400> 15
Met Asn Ser Ile Arg Lys Met Ile Trp Glu Asp Ile Phe Pro Lys Leu
1 5 10 15
Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Lys Lys Lys Lys
20 25 30
Lys Lys Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp
35 40 45
Pro His Gln His Leu Lys Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe
50 55 60
Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His
65 70 75 80
Asp Asn Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe Arg Lys
85 90 95
Arg Ile Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His
100 105 110
Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg
115 120 125
Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro
130 135 140
Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Met Asp Phe Ser
145 150 155 160
Val Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met
165 170 175
Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala
180 185 190
Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly
195 200 205
Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Phe
210 215 220
Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe
225 230 235 240
Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala
245 250 255
Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val
260 265 270
Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Ile Phe Val
275 280 285
Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr
290 295 300
Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro
305 310 315 320
Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile
325 330 335
Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile
340 345 350
Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser
355 360 365
Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val
370 375 380
Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp
385 390 395 400
Asn Pro Gly Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser
405 410 415
Gly Ile Ile Ala Ala Arg Cys Ala Ile Asn Lys Leu His Gln Glu Leu
420 425 430
Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp
435 440 445
Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val
450 455 460
Ala Val Ser Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser
465 470 475 480
Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val
485 490 495
Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp
500 505 510
Glu Asn Ser Ile Asn Gly Met Pro Asp Ile Thr Val Glu Ile Arg Glu
515 520 525
His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala
530 535 540
Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu
545 550 555 560
Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala
565 570 575
Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro
580 585 590
His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ser Asp Pro Ile Leu
595 600 605
Lys Ile Pro Phe Ala Ser Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu
610 615 620
Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly
625 630 635 640
Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu
645 650 655
Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu
660 665 670
Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp
675 680 685
Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val
690 695 700
Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg
705 710 715 720
Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr
725 730 735
Thr Leu Leu Asp Ile Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn
740 745 750
Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys
755 760 765
Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Thr
770 775 780
Gly Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys
785 790 795 800
Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe
805 810 815
Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu
820 825 830
Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala
835 840 845
Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Thr
850 855 860
Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys
865 870 875 880
Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys
885 890 895
Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro
900 905 910
Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
915 920 925
Gln Arg His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro
930 935 940
Lys Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Val Thr Ala Gly
945 950 955 960
Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys
965 970 975
Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Thr
980 985 990
Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly
995 1000 1005
Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys
1010 1015 1020
Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys
1025 1030 1035
Val Val Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp
1040 1045 1050
Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu
1055 1060 1065
Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys
1070 1075 1080
Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg
1085 1090 1095
Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr
1100 1105 1110
Thr Ala Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu
1115 1120 1125
Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val
1130 1135 1140
Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn
1145 1150 1155
Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp
1160 1165 1170
Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu
1175 1180 1185
Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn
1190 1195 1200
Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys
1205 1210 1215
Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe
1220 1225 1230
Ser Cys Glu Thr Gln Ala Trp Ser Ile Ser Thr Ile Leu Glu Thr
1235 1240 1245
Leu Tyr Asp Leu
1250
<210> 16
<211> 1116
<212> PRT
<213> Ornithorhynchus anatinus
<400> 16
Met Phe Glu Gly Arg Ala Glu Gly Val Val Gly Glu Tyr Phe Thr Phe
1 5 10 15
Pro Tyr Gly Glu Met Thr Ser Val Glu Glu Glu Ser Leu Met His Gln
20 25 30
Pro Glu Lys Ala Cys Phe Phe Met Ala His Asn Gly Trp Val Met Gly
35 40 45
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Asp Val Tyr Leu
50 55 60
Arg Arg Glu Leu Val Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
65 70 75 80
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
85 90 95
Thr Glu Ile Thr Ala Lys Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
100 105 110
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
115 120 125
Lys Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
130 135 140
Glu Glu Leu Asp Asn Ile Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
145 150 155 160
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
165 170 175
Val Tyr Arg Phe Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
180 185 190
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
195 200 205
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
210 215 220
Leu Pro Ser Ser Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
225 230 235 240
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
245 250 255
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Ala Ala Thr Leu Ser Asn
260 265 270
Pro Ser Glu Val Asn Leu Gln Thr Gly Ile Ile Ala Gly Arg Arg Ala
275 280 285
Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
290 295 300
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Cys
305 310 315 320
Pro Ser Ser His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg
325 330 335
Asn Pro Lys Thr Ser Ala Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
340 345 350
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Val Glu Arg
355 360 365
Asn Val Gly Ser Tyr Val Lys Asp Ala Lys Ser Ile Asn Gly Met Pro
370 375 380
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
385 390 395 400
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Leu His Glu Tyr Val
405 410 415
Gln Glu Ile Glu Phe Glu Asn Leu Thr Pro Gly Ser Val Ile Ile Phe
420 425 430
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
435 440 445
Asn His Leu Thr Gln Phe Ser Pro Asn Phe Lys Ile Gly Ser Leu Pro
450 455 460
Val Asp Asn Ser Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Ile Ser
465 470 475 480
Ser Lys Leu Thr Leu Ala Asp Leu Asn Gln Leu Leu Tyr Arg Cys Glu
485 490 495
Ser Glu Glu Gln Glu Asp Gly Gly Gly Cys Tyr Asp Val Pro Asn Trp
500 505 510
Ser Pro Leu Lys Tyr Gly Gly Leu Gln Gly Leu Met Ser Val Met Ala
515 520 525
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
530 535 540
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
545 550 555 560
Arg Ser Gly Ser Ile Ala Glu Val Gly Lys Trp Phe Gln Ala Met Phe
565 570 575
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
580 585 590
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Ile Ala Trp Lys
595 600 605
Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu
610 615 620
Ser Leu Gly Ser Val Gln Met Cys Gly Ile Gly Lys Phe Pro Ser Leu
625 630 635 640
Pro Phe Leu Ser Pro Ser Leu Gly Asp Val Pro Tyr Arg Leu Asn Glu
645 650 655
Ile Thr Gln Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu
660 665 670
Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe
675 680 685
Ile Ala Leu Arg Gly Leu Leu Leu Ile Thr Gly Arg Phe Leu Glu Ala
690 695 700
Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile
705 710 715 720
Pro Asn Leu Leu Gly Gln Gly Thr Tyr Ala Arg Phe Asn Cys Arg Asp
725 730 735
Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Ile Val
740 745 750
Pro Lys Gly Thr Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro
755 760 765
Ser Asp Asp Ser Ser Ala Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu
770 775 780
Tyr Glu Val Ile Gln Glu Ala Met Gln Arg His Met Gln Gly Ile Gln
785 790 795 800
Phe Arg Glu Lys Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp
805 810 815
Glu Gly Phe Asn Val Thr Ala Gly Val Asp Asp Glu Ser Gly Phe Val
820 825 830
Tyr Gly Gly Asn His Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly
835 840 845
Glu Ser Asp Arg Gly Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp
850 855 860
Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Thr Val Arg Trp
865 870 875 880
Leu Val Glu Leu Ser Lys Lys Asn Val Phe Pro Tyr His Gly Val Thr
885 890 895
Val Lys Arg Asn Glu Lys Glu Val Leu Ile Thr Tyr Asp Glu Trp Asn
900 905 910
Arg Lys Ile Gln Asp His Phe Glu Lys Leu Phe Tyr Val Ser Glu Asp
915 920 925
Pro Ser Asp Thr Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly
930 935 940
Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln
945 950 955 960
Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe
965 970 975
Thr Pro Gln Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu
980 985 990
Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr
995 1000 1005
Cys Gly Val Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu
1010 1015 1020
Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro
1025 1030 1035
Val Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Lys Leu Met
1040 1045 1050
Gly Gln Glu Thr Tyr Thr Lys Thr Val Phe Leu Ile Lys Asn Val
1055 1060 1065
Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly
1070 1075 1080
Leu Pro Glu Leu Thr Asn Glu Asn Gly Gln Tyr Cys Ser Phe Ser
1085 1090 1095
Cys Glu Thr Gln Ala Trp Ser Ile Ala Val Ile Leu Glu Thr Leu
1100 1105 1110
Tyr Asp Leu
1115
<210> 17
<211> 1304
<212> PRT
<213> Anas platyrhynchos
<400> 17
Met His Pro Glu Cys Gly Tyr Asn Leu Val Asn Ser Pro His Leu Lys
1 5 10 15
Pro Ala Trp Val Leu Asp Arg Ala Leu Trp His Leu Thr Cys Met Val
20 25 30
Ala Asp Gly Lys Cys Ile Asp Lys Gly Val Pro Pro Leu Ile Glu Asn
35 40 45
Asp His His Leu Asn Cys Val Arg Lys Ile Ile Trp Glu Glu Ile Tyr
50 55 60
Pro Lys Ile Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala
65 70 75 80
Val Glu Gln Phe Arg Thr Leu Leu Thr Gln Gly Lys Glu Ser Lys Met
85 90 95
Ser Thr Lys Ser Asp Pro Asn Gln His Leu Gln Ile Val Gln Asp Pro
100 105 110
Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Ala
115 120 125
Thr Phe Ile Pro His Ser Asn Gly Pro Gly Ala Ile Glu Glu Cys Cys
130 135 140
Asn Trp Phe Arg Lys Arg Ile Glu Glu Leu Asn Ala Glu Gln His Arg
145 150 155 160
Gln Ile His His His Gln Glu Gln Ala Val Asn Cys Leu Ala Gly Thr
165 170 175
Val Val Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Ile
180 185 190
Ser Arg Lys Tyr Pro Leu Val Thr Arg Tyr Phe Thr Tyr Pro Phe Lys
195 200 205
Asp Met Thr Val Glu Glu Glu Glu Ala Met Ile His Arg Pro Asp Lys
210 215 220
Ala Cys Tyr Phe Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro
225 230 235 240
Leu Arg Asn Phe Ala Glu Pro Gly Ser Asn Val Tyr Leu Arg Arg Glu
245 250 255
Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro
260 265 270
Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile
275 280 285
Thr Ala Lys Tyr Phe His Gly Val Arg Leu Asp Asn Cys His Ser Thr
290 295 300
Pro Ile His Val Ala Glu Tyr Met Leu Asp Thr Ala Arg Lys Leu Arg
305 310 315 320
Ala Asp Leu Phe Val Val Ala Glu Leu Phe Thr Gly Asn Glu Glu Leu
325 330 335
Asp Asn Ile Phe Val Asn Arg Leu Gly Ile Thr Ser Leu Ile Arg Glu
340 345 350
Ala Met Thr Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg
355 360 365
Phe Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Arg Leu Arg Pro
370 375 380
Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp
385 390 395 400
Asn Glu Cys Pro Ile Gln His Arg Ser Ala Tyr Asp Ala Leu Pro Ser
405 410 415
Ala Met Ile Val Ser Met Ala Cys Cys Ala Thr Gly Ser Thr Lys Gly
420 425 430
Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg
435 440 445
Phe Tyr Ser Thr Trp Asn Pro Ala Ala His Leu Thr Ser Gly Glu Val
450 455 460
Asn Phe Gln Thr Gly Ile Leu Ala Gly Arg Leu Ala Ile Asn Arg Leu
465 470 475 480
His Gln Glu Leu Gly Ala Lys Gly Phe Asn Gln Val Tyr Val Asp Gln
485 490 495
Val Asp Glu Asp Ile Val Ala Val Thr Arg His Cys Pro Asn Thr His
500 505 510
Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg Asp Pro Lys Thr
515 520 525
Ser Phe Tyr Ser Lys Glu Val Pro Glu Met Cys Ile Pro Gly Lys Ile
530 535 540
Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Asn Pro
545 550 555 560
Tyr Lys Lys Asp Glu Arg Phe Ile Asn Gly Leu Pro Asn Phe Thr Val
565 570 575
Glu Leu Arg Glu His Ile Gln Ile Lys Asp Ser Lys Ile Ile Lys Gln
580 585 590
Ala Gly Thr Ala Ile Lys Gly Pro Asn Glu Phe Val Gln Glu Ile Glu
595 600 605
Phe Glu Asn Leu Thr Pro Gly Ser Val Ile Val Phe Arg Val Ser Leu
610 615 620
Asp Pro Lys Ala Gln Glu Ala Val Gly Val Leu Arg Ser His Leu Ile
625 630 635 640
Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Pro Asp Asp His Ser
645 650 655
Ala Pro Ile Leu Lys Thr Leu Phe Ser Ser Ile Ala Ser Lys Leu Ser
660 665 670
Leu Ala Asp Leu Asn Gln Val Leu Tyr Arg Cys Glu Ala Glu Glu Gln
675 680 685
Glu Asp Gly Gly Gly Cys Tyr Asn Ile Pro Asn Trp Ser Pro Leu Lys
690 695 700
Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Met Ala Asp Ile Arg Pro
705 710 715 720
Lys Asn Asp Leu Gly His Pro Phe Cys Asp Asn Leu Arg Ser Gly Asp
725 730 735
Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Thr Gly Ala
740 745 750
Cys Ala Glu Val Gly Lys Trp Leu Lys Ala Met Phe Ile Tyr Leu Lys
755 760 765
Lys Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Val
770 775 780
Gly Ala Tyr Thr Thr Leu Leu Asp Val Gly Trp His Gln Met Ser Ser
785 790 795 800
Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser
805 810 815
Ile Gln Met Cys Gly Ile Gly Lys Tyr Ser Cys Leu Pro Asp Leu Ser
820 825 830
Pro Ser Leu His Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Asn Glu
835 840 845
Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser
850 855 860
Ser Gly Ile Phe Arg Ser Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg
865 870 875 880
Gly Leu Met Leu Val Thr Gly Arg Tyr Leu Glu Ala Arg Asn Ile Ile
885 890 895
Leu Ala Phe Gly Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu
900 905 910
Gly Gln Gly Thr His Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp
915 920 925
Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Ile Val Pro Asn Gly Leu
930 935 940
Asp Ile Leu Arg Cys Pro Val Ser Arg Met Tyr Pro Arg Asp Asp Ser
945 950 955 960
Ser Pro Gln Pro Ala Gly Ser Val Asp Gln Pro Leu Tyr Glu Val Ile
965 970 975
Gln Glu Ala Met Gln Arg His Met Glu Gly Ile Asn Phe Arg Glu Arg
980 985 990
Asn Ala Gly Pro Gln Ile Asp Gln Asn Met Arg Asp Glu Gly Phe Asn
995 1000 1005
Val Thr Ala Gly Val Asp Arg Glu Thr Gly Phe Val Phe Gly Gly
1010 1015 1020
Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser
1025 1030 1035
Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly
1040 1045 1050
Ser Ala Val Glu Ile Val Gly Leu Cys Lys Ser Thr Val Arg Trp
1055 1060 1065
Leu Leu Asp Leu Ser Arg Lys Asn Glu Phe Pro Phe His Gly Val
1070 1075 1080
Thr Ile Lys Arg His Gly Lys Glu Glu Thr Ile Thr Tyr Asp Glu
1085 1090 1095
Trp Asp Arg Lys Ile Gln Ala His Phe Glu Lys Leu Phe Phe Val
1100 1105 1110
Ser Glu Asn Pro Ala Asp Pro Asn Glu Lys His Pro Asn Leu Val
1115 1120 1125
His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro
1130 1135 1140
Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val
1145 1150 1155
Val Ala Pro Glu Leu Phe Thr Pro Glu Arg Ala Trp Lys Ala Leu
1160 1165 1170
Gln Ile Ala Glu Glu Lys Leu Leu Gly Pro Leu Gly Met Lys Thr
1175 1180 1185
Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Val Tyr Asp Asn Ala
1190 1195 1200
Leu Asp Asn Asp Asn Tyr Asn Val Ala Arg Gly Phe Asn Tyr His
1205 1210 1215
Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala
1220 1225 1230
Lys Leu Tyr Phe Ser Lys Leu Ile Gly Pro Gln Ile Tyr Ala Lys
1235 1240 1245
Thr Val Val Met Ile Lys Asn Val Leu Ser Arg His Tyr Val His
1250 1255 1260
Leu Glu Arg Ser Ser Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu
1265 1270 1275
Asn Gly Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser
1280 1285 1290
Ile Ser Val Ile Leu Glu Ile Leu Tyr Asp Leu
1295 1300
<210> 18
<211> 4131
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D1 hGDEWT
<400> 18
atgattcatt ttaccccatt gcagactctt ggactatcta ggtcatgcta ctcccttgcc 60
aatcagttag aattaaatcc tgacttttca agacctaata gaaagtatac ctggaatgat 120
gttggacagc tagtggaaaa attaaaaaag gaatggaatg ttatttgtat tactgatgtt 180
gtctacaatc atactgctgc taatagtaaa tggatccagg aacatccaga atgtgcctat 240
aatcttgtaa attctccaca cttaaaacct gcctgggtct tagacagagc actttggcgt 300
ttctcctgtg atgttgcaga agggaaatac aaagaaaagg gaatacctgc tttgattgaa 360
aatgatcacc atatgaactc catccgaaaa ataatttggg aggatatttt tccaaagctt 420
aaactctggg aatttttcca agtagatgtc aacaaagcgg ttgagcaatt tagaagactt 480
cttacacaag aaaataggcg agtaaccaag tctgatccaa accaacacct tacgattatt 540
caagatcctg aatacagacg gtttggctgt actgtagata tgaacattgc actaacgact 600
ttcataccac atgacaaggg gccagcagca attgaagaat gctgtaattg gtttcataaa 660
agaatggagg aattaaattc agagaagcat cgactcatta actatcatca ggaacaggca 720
gttaattgcc ttttgggaaa tgtgttttat gaacgactgg ctggccatgg tccaaaacta 780
ggacctgtca ctagaaagca tcctttagtt accaggtatt ttactttccc atttgaagag 840
atagacttct ccatggaaga atctatgatt catctgccaa ataaagcttg ttttctgatg 900
gcacacaatg gatgggtaat gggagatgat cctcttcgaa actttgctga accgggttca 960
gaagtttacc taaggagaga acttatttgc tggggagaca gtgttaaatt acgctatggg 1020
aataaaccag aggactgtcc ttatctctgg gcacacatga aaaaatacac tgaaataact 1080
gcaacttatt tccagggagt acgtcttgat aactgccact caacacctct tcacgtagct 1140
gagtacatgt tggatgctgc taggaatttg caacccaatt tatatgtagt agctgaactg 1200
ttcacaggaa gtgaggacct agacaatgtc tttgttacta gactgggcat tagttcctta 1260
ataagagagg caatgagtgc atataatagt catgaagagg gcagattagt ttaccgatat 1320
ggaggagaac ctgttggatc ctttgttcag ccctgtttga ggcctttaat gccagctatt 1380
gcacatgccc tgtttatgga tattacgcat gataatgagt gtcctattgt gcatagatca 1440
gcgtatgatg ctcttccaag tactacaatt gtttctatgg catgttgtgc tagtggaagt 1500
acaagaggct atgatgaatt agtgcctcat cagatttcag tggtttctga agaacggttt 1560
tacactaagt ggaatcctga agcattgcct tcaaacacag gtgaagttaa tttccaaagc 1620
ggcattattg cagccaggtg tgctatcagt aaacttcatc aggagcttgg agccaagggt 1680
tttattcagg tgtatgtgga tcaagttgat gaagacatag tggcagtaac aagacactca 1740
cctagcatcc atcagtctgt tgtggctgta actagaactg ctttcaggaa tcccaagact 1800
tcattttaca gcaaggaagt gcctcaaatg tgcatccctg gcaaaattga agaagtagtt 1860
cttgaagcta gaactattga gagaaacacg aaaccttata ggaaggatga aaattcaatc 1920
aatggaacac cagatatcac agtagaaatt agagaacata ttcagcttaa tgaaagtaaa 1980
attgttaaac aagctggagt tgccacaaaa gggcccaatg aatatattca agaaatagaa 2040
tttgaaaact tgtctccagg aagtgttatt atattcagag ttagtcttga tccacatgca 2100
caagtcgctg ttggcattct tcgaaatcat ctgacacaat tcagtcctca ctttaaatct 2160
ggcagcctag ctgttgacaa tgcagatcct atattaaaaa ttccttttgc ttctcttgcc 2220
tatagattaa ctttggctga gctaaatcag atcctttacc gatgtgaatc agaagaaaag 2280
gaagatggtg gagggtgcta tgacatacca aactggtcag cccttaaata tgcaggtctt 2340
caaggtttaa tgtctgtatt ggcagaaata agaccaaaga atgacttggg gcatcctttt 2400
tgtaataatt tgaggtctgg agattggatg attgactatg tcagtaaccg gcttatttca 2460
cgatcaggaa ctattgctga agttggtaaa tggttgcagg ctatgttctt ctacctgaag 2520
cagatcccac gttaccttat cccatgttac tttgatgcta tattaattgg tgcatatacc 2580
actcttctgg atacagcatg gaagcagatg tcaagctttg ttcagaatgg ttcaaccttt 2640
gtgaaacacc tttcattggg ttcagttcaa ctgtgtggag taggaaaatt cccttccctg 2700
ccaattcttt cacctgccct aatggatgta ccttataggt taaatgagat cacaaaagaa 2760
aaggagcaat gttgtgtttc tctagctgca ggcttacctc atttttcttc tggtattttc 2820
cgctgctggg gaagggatac ttttattgca cttagaggta tactgctgat tactggacgc 2880
tatgtagaag ccaggaatat tattttagca tttgcgggta ccctgaggca tggtctcatt 2940
cctaatctac tgggtgaagg aatttatgcc agatacaatt gtcgggatgc tgtgtggtgg 3000
tggctgcagt gtatccagga ttactgtaaa atggttccaa atggactaga cattctcaag 3060
tgcccagttt ccagaatgta tcctacagat gattctgctc ctttgcctgc tggcacactg 3120
gatcagccat tgtttgaagt catacaggaa gcaatgcaaa aacacatgca gggcatacag 3180
ttccgagaaa ggaatgctgg tccccagata gatcgaaaca tgaaggacga aggttttaat 3240
ataactgcag gagttgatga agaaacagga tttgtttatg gaggaaatcg tttcaattgt 3300
ggcacatgga tggataaaat gggagaaagt gacagagcta gaaacagagg aatcccagcc 3360
acaccaagag atgggtctgc tgtggaaatt gtgggcctga gtaaatctgc tgttcgctgg 3420
ttgctggaat tatccaaaaa aaatattttc ccttatcatg aagtcacagt aaaaagacat 3480
ggaaaggcta taaaggtctc atatgatgag tggaacagaa aaatacaaga caactttgaa 3540
aagctatttc atgtttccga agacccttca gatttaaatg aaaagcatcc aaatctggtt 3600
cacaaacgtg gcatatacaa agatagttat ggagcttcaa gtccttggtg tgactatcag 3660
ctcaggccta attttaccat agcaatggtt gtggcccctg agctctttac tacagaaaaa 3720
gcatggaaag ctttggagat tgcagaaaaa aaattgcttg gtccccttgg catgaaaact 3780
ttagatccag atgatatggt ttactgtgga atttatgaca acgcattaga caatgacaac 3840
tacaatcttg ctaaaggttt caattatcac caaggacctg agtggctgtg gcctattggg 3900
tattttcttc gtgcaaaatt atatttttcc agattgatgg gcccggagac tactgcaaag 3960
actatagttt tggttaaaaa tgttctttcc cgacattatg ttcatcttga gagatcccct 4020
tggaaaggac ttccagaact gaccaatgag aatgcccagt actgtccttt cagctgtgaa 4080
acacaagcct ggtcaattgc tactattctt gagacacttt atgatttata g 4131
<210> 19
<211> 4131
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D1 hGDE co2
<400> 19
atgatccact tcacccctct gcagaccctg ggcctgagca gaagctgtta cagcctggcc 60
aaccagctgg aactgaaccc cgacttcagc agacccaacc ggaagtacac ctggaacgat 120
gtgggccagc tggtggaaaa actgaagaaa gaatggaacg tgatctgcat caccgacgtg 180
gtgtacaacc acaccgccgc caacagcaag tggatccaag agcaccctga gtgcgcctac 240
aacctggtca acagccctca cctgaaacct gcctgggtgc tcgatagagc cctgtggcgg 300
tttagctgtg atgtggccga gggcaagtac aaagagaagg gcatccccgc tctgatcgag 360
aacgaccacc acatgaacag catccggaag atcatctggg aagatatttt ccccaagctg 420
aagctgtggg agttcttcca ggtggacgtg aacaaggccg tggaacagtt cagacggctg 480
ctgacccaag agaacagaag agtgaccaag agcgacccca accagcacct gaccatcatt 540
caggaccccg agtatcggag attcggctgc accgtggaca tgaatatcgc cctgaccacc 600
ttcattcccc acgacaaagg acctgccgcc atcgaggaat gctgcaactg gttccacaag 660
cggatggaag aattgaacag cgagaagcac cggctgatca actaccacca agagcaggcc 720
gtgaactgcc tgctgggcaa cgtgttctat gagagactgg ccggacacgg ccctaagctg 780
ggacctgtga caagaaagca ccctctggtt acccggtact tcacctttcc attcgaagag 840
atcgacttct ccatggaaga gagcatgatc catctgccta acaaggcctg cttcctgatg 900
gctcacaacg gctgggttat gggcgacgac cctctgagaa atttcgccga gcctggcagc 960
gaggtgtacc tgagaagaga actgatctgt tggggcgaca gcgtgaagct gagatacggc 1020
aacaagcccg aggactgccc ttacctgtgg gcccatatga agaagtacac agagatcacc 1080
gccacctact ttcagggcgt cagactggac aactgccaca gcacacctct gcacgtggcc 1140
gagtacatgc tggacgccgc tagaaatctg cagcccaacc tgtatgtggt ggccgagctg 1200
tttaccggct ccgaggacct ggacaatgtg ttcgtgacca gactgggcat cagcagcctg 1260
atcagagaag ccatgtccgc ctacaatagc cacgaagagg gcagactggt gtacagatat 1320
ggcggcgagc ctgtgggcag cttcgttcag ccttgtctga ggcctctgat gcccgccatt 1380
gctcacgccc tgttcatgga catcacccac gataacgagt gccccatcgt gcacagaagc 1440
gcctacgacg ctctgcctag caccaccatt gtgtccatgg cctgttgtgc cagcggcagc 1500
acaagaggct atgacgaact ggtgccccac cagatttccg tggtgtccga ggaacggttc 1560
tacaccaagt ggaaccccga ggctctgccc agcaataccg gcgaagtgaa tttccagagc 1620
ggcatcattg ccgccagatg cgccatcagc aagctgcacc aagaactggg cgccaagggc 1680
ttcattcagg tgtacgtgga ccaggtcgac gaggacattg tggccgtgac aagacacagc 1740
cccagcatcc atcagagcgt ggtggctgtg accagaaccg ccttcagaaa ccccaagacc 1800
agcttctaca gcaaagaggt gccccagatg tgcatccccg gcaagattga ggaagtggtg 1860
ctcgaggccc ggaccatcga gagaaacacc aagccttacc ggaaggacga gaactccatc 1920
aacggcaccc ctgacatcac cgtggaaatc agagagcaca tccagctcaa cgagagcaag 1980
atcgtgaaac aggccggcgt ggccacaaag ggccccaacg agtatatcca agagattgag 2040
ttcgagaatc tgagccccgg cagcgtgatc atcttcagag tgtccctgga tcctcacgct 2100
caggtggccg tgggcatcct gagaaatcac ctgacacagt tcagcccaca cttcaagagc 2160
ggaagcctgg ccgtggacaa cgccgatcct atcctgaaga tccccttcgc ctctctggcc 2220
tacagactga cactggctga gctgaaccag atcctgtaca gatgcgagtc cgaagagaaa 2280
gaggatggcg gaggctgcta cgacatcccc aattggagcg ccctgaagta tgccggactg 2340
cagggactga tgtctgtgct ggccgagatc agacccaaga acgacctggg acaccccttc 2400
tgcaacaacc tgagatccgg cgactggatg atcgactacg tgtccaacag actgatcagc 2460
agatccggca caatcgccga agtcggcaaa tggctgcagg ccatgttctt ctacctgaag 2520
cagatccctc ggtatctgat cccctgctac ttcgacgcca tcctgatcgg cgcctacacc 2580
acactgctgg ataccgcctg gaagcagatg tccagcttcg tgcagaacgg cagcaccttc 2640
gtgaagcacc tgtctctggg aagcgtgcag ctgtgtggcg tgggcaaatt tcccagcctg 2700
cctatcctgt ctcctgcact gatggacgtg ccctaccggc tgaatgagat caccaaagaa 2760
aaagagcagt gctgcgtcag cctggctgct ggcctgcctc atttttccag cggcatcttc 2820
cggtgttggg gcagagacac ctttattgcc ctgagaggca tcctgctgat taccggcaga 2880
tacgtggaag cccggaacat catcctggcc tttgccggca cactgcggca cggactgatt 2940
cctaatctgc tcggcgaggg catctacgcc agatacaact gcagagatgc cgtgtggtgg 3000
tggctccagt gcatccagga ctactgcaag atggtgccca acggcctgga catcctgaag 3060
tgccctgtgt ccagaatgta ccctaccgac gatagcgccc ctctgcctgc cggaacactt 3120
gaccagcctc tgttcgaagt gattcaagag gccatgcaga aacacatgca gggaatccag 3180
tttcgcgagc ggaatgccgg acctcagatc gacagaaaca tgaaggatga gggcttcaac 3240
atcaccgctg gcgtggacga agagacaggc tttgtgtacg gcggcaaccg gttcaattgc 3300
ggcacctgga tggacaagat gggcgagtct gaccgggcca gaaacagagg aattcccgcc 3360
acacctagag atggcagcgc tgtggaaatc gtgggcctgt ctaagtctgc tgtgcggtgg 3420
ctgctcgaac tgagcaagaa gaatatcttt ccgtaccacg aagtgaccgt gaagcggcac 3480
ggcaaggcca tcaaggtgtc ctacgacgag tggaacagaa agatccagga caacttcgaa 3540
aagctgttcc atgtgtctga ggaccccagc gacctgaacg aaaagcaccc caacctggtg 3600
cacaagcgcg gcatctacaa ggacagctac ggcgcctctt ctccttggtg cgattaccag 3660
ctgcggccca acttcaccat tgccatggtg gttgcccctg agctgttcac cacagagaag 3720
gcctggaagg ccctggaaat cgccgagaag aaactgctgg gccctctggg catgaagaca 3780
ctggaccccg acgacatggt gtactgcgga atctacgaca acgccctgga taacgacaac 3840
tacaatctgg ccaaggggtt caattaccat cagggacccg agtggctgtg gcctatcggc 3900
tatttcctgc gggccaagct gtacttctcc agactgatgg gccctgagac aaccgccaag 3960
acaatcgtgc tcgtgaagaa cgtgctgagc cggcactatg tgcacctgga aagaagcccc 4020
tggaagggac tgcccgagct gaccaatgag aacgcccagt actgcccctt cagctgcgaa 4080
acacaggcct ggtctatcgc caccatcctg gaaaccctgt acgacctgtg a 4131
<210> 20
<211> 4395
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D2 hGDE
<400> 20
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 1140
ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1200
cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1260
gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1320
atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1380
cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1440
aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1500
actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1560
gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1620
ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1680
gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1740
atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagatt 1800
tcagtggttt ctgaagaacg gttttacact aagtggaatc ctgaagcatt gccttcaaac 1860
acaggtgaag ttaatttcca aagcggcatt attgcagcca ggtgtgctat cagtaaactt 1920
catcaggagc ttggagccaa gggttttatt caggtgtatg tggatcaagt tgatgaagac 1980
atagtggcag taacaagaca ctcacctagc atccatcagt ctgttgtggc tgtaactaga 2040
actgctttca ggaatcccaa gacttcattt tacagcaagg aagtgcctca aatgtgcatc 2100
cctggcaaaa ttgaagaagt agttcttgaa gctagaacta ttgagagaaa cacgaaacct 2160
tataggaagg atgaaaattc aatcaatgga acaccagata tcacagtaga aattagagaa 2220
catattcagc ttaatgaaag taaaattgtt aaacaagctg gagttgccac aaaagggccc 2280
aatgaatata ttcaagaaat agaatttgaa aacttgtctc caggaagtgt tattatattc 2340
agagttagtc ttgatccaca tgcacaagtc gctgttggca ttcttcgaaa tcatctgaca 2400
caattcagtc ctcactttaa atctggcagc ctagctgttg acaatgcaga tcctatatta 2460
aaaattcctt ttgcttctct tgcctataga ttaactttgg ctgagctaaa tcagatcctt 2520
taccgatgtg aatcagaaga aaaggaagat ggtggagggt gctatgacat accaaactgg 2580
tcagccctta aatatgcagg tcttcaaggt ttaatgtctg tattggcaga aataagacca 2640
aagaatgact tggggcatcc tttttgtaat aatttgaggt ctggagattg gatgattgac 2700
tatgtcagta accggcttat ttcacgatca ggaactattg ctgaagttgg taaatggttg 2760
caggctatgt tcttctacct gaagcagatc ccacgttacc ttatcccatg ttactttgat 2820
gctatattaa ttggtgcata taccactctt ctggatacag catggaagca gatgtcaagc 2880
tttgttcaga atggttcaac ctttgtgaaa cacctttcat tgggttcagt tcaactgtgt 2940
ggagtaggaa aattcccttc cctgccaatt ctttcacctg ccctaatgga tgtaccttat 3000
aggttaaatg agatcacaaa agaaaaggag caatgttgtg tttctctagc tgcaggctta 3060
cctcattttt cttctggtat tttccgctgc tggggaaggg atacttttat tgcacttaga 3120
ggtatactgc tgattactgg acgctatgta gaagccagga atattatttt agcatttgcg 3180
ggtaccctga ggcatggtct cattcctaat ctactgggtg aaggaattta tgccagatac 3240
aattgtcggg atgctgtgtg gtggtggctg cagtgtatcc aggattactg taaaatggtt 3300
ccaaatggac tagacattct caagtgccca gtttccagaa tgtatcctac agatgattct 3360
gctcctttgc ctgctggcac actggatcag ccattgtttg aagtcataca ggaagcaatg 3420
caaaaacaca tgcagggcat acagttccga gaaaggaatg ctggtcccca gatagatcga 3480
aacatgaagg acgaaggttt taatataact gcaggagttg atgaagaaac aggatttgtt 3540
tatggaggaa atcgtttcaa ttgtggcaca tggatggata aaatgggaga aagtgacaga 3600
gctagaaaca gaggaatccc agccacacca agagatgggt ctgctgtgga aattgtgggc 3660
ctgagtaaat ctgctgttcg ctggttgctg gaattatcca aaaaaaatat tttcccttat 3720
catgaagtca cagtaaaaag acatggaaag gctataaagg tctcatatga tgagtggaac 3780
agaaaaatac aagacaactt tgaaaagcta tttcatgttt ccgaagaccc ttcagattta 3840
aatgaaaagc atccaaatct ggttcacaaa cgtggcatat acaaagatag ttatggagct 3900
tcaagtcctt ggtgtgacta tcagctcagg cctaatttta ccatagcaat ggttgtggcc 3960
cctgagctct ttactacaga aaaagcatgg aaagctttgg agattgcaga aaaaaaattg 4020
cttggtcccc ttggcatgaa aactttagat ccagatgata tggtttactg tggaatttat 4080
gacaacgcat tagacaatga caactacaat cttgctaaag gtttcaatta tcaccaagga 4140
cctgagtggc tgtggcctat tgggtatttt cttcgtgcaa aattatattt ttccagattg 4200
atgggcccgg agactactgc aaagactata gttttggtta aaaatgttct ttcccgacat 4260
tatgttcatc ttgagagatc cccttggaaa ggacttccag aactgaccaa tgagaatgcc 4320
cagtactgtc ctttcagctg tgaaacacaa gcctggtcaa ttgctactat tcttgagaca 4380
ctttatgatt tatag 4395
<210> 21
<211> 4293
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D3 hGDE
<400> 21
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320
atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680
gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860
tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920
cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980
gatgaattag tgcctcatca gggcaaaatt gaagaagtag ttcttgaagc tagaactatt 2040
gagagaaaca cgaaacctta taggaaggat gaaaattcaa tcaatggaac accagatatc 2100
acagtagaaa ttagagaaca tattcagctt aatgaaagta aaattgttaa acaagctgga 2160
gttgccacaa aagggcccaa tgaatatatt caagaaatag aatttgaaaa cttgtctcca 2220
ggaagtgtta ttatattcag agttagtctt gatccacatg cacaagtcgc tgttggcatt 2280
cttcgaaatc atctgacaca attcagtcct cactttaaat ctggcagcct agctgttgac 2340
aatgcagatc ctatattaaa aattcctttt gcttctcttg cctatagatt aactttggct 2400
gagctaaatc agatccttta ccgatgtgaa tcagaagaaa aggaagatgg tggagggtgc 2460
tatgacatac caaactggtc agcccttaaa tatgcaggtc ttcaaggttt aatgtctgta 2520
ttggcagaaa taagaccaaa gaatgacttg gggcatcctt tttgtaataa tttgaggtct 2580
ggagattgga tgattgacta tgtcagtaac cggcttattt cacgatcagg aactattgct 2640
gaagttggta aatggttgca ggctatgttc ttctacctga agcagatccc acgttacctt 2700
atcccatgtt actttgatgc tatattaatt ggtgcatata ccactcttct ggatacagca 2760
tggaagcaga tgtcaagctt tgttcagaat ggttcaacct ttgtgaaaca cctttcattg 2820
ggttcagttc aactgtgtgg agtaggaaaa ttcccttccc tgccaattct ttcacctgcc 2880
ctaatggatg taccttatag gttaaatgag atcacaaaag aaaaggagca atgttgtgtt 2940
tctctagctg caggcttacc tcatttttct tctggtattt tccgctgctg gggaagggat 3000
acttttattg cacttagagg tatactgctg attactggac gctatgtaga agccaggaat 3060
attattttag catttgcggg taccctgagg catggtctca ttcctaatct actgggtgaa 3120
ggaatttatg ccagatacaa ttgtcgggat gctgtgtggt ggtggctgca gtgtatccag 3180
gattactgta aaatggttcc aaatggacta gacattctca agtgcccagt ttccagaatg 3240
tatcctacag atgattctgc tcctttgcct gctggcacac tggatcagcc attgtttgaa 3300
gtcatacagg aagcaatgca aaaacacatg cagggcatac agttccgaga aaggaatgct 3360
ggtccccaga tagatcgaaa catgaaggac gaaggtttta atataactgc aggagttgat 3420
gaagaaacag gatttgttta tggaggaaat cgtttcaatt gtggcacatg gatggataaa 3480
atgggagaaa gtgacagagc tagaaacaga ggaatcccag ccacaccaag agatgggtct 3540
gctgtggaaa ttgtgggcct gagtaaatct gctgttcgct ggttgctgga attatccaaa 3600
aaaaatattt tcccttatca tgaagtcaca gtaaaaagac atggaaaggc tataaaggtc 3660
tcatatgatg agtggaacag aaaaatacaa gacaactttg aaaagctatt tcatgtttcc 3720
gaagaccctt cagatttaaa tgaaaagcat ccaaatctgg ttcacaaacg tggcatatac 3780
aaagatagtt atggagcttc aagtccttgg tgtgactatc agctcaggcc taattttacc 3840
atagcaatgg ttgtggcccc tgagctcttt actacagaaa aagcatggaa agctttggag 3900
attgcagaaa aaaaattgct tggtcccctt ggcatgaaaa ctttagatcc agatgatatg 3960
gtttactgtg gaatttatga caacgcatta gacaatgaca actacaatct tgctaaaggt 4020
ttcaattatc accaaggacc tgagtggctg tggcctattg ggtattttct tcgtgcaaaa 4080
ttatattttt ccagattgat gggcccggag actactgcaa agactatagt tttggttaaa 4140
aatgttcttt cccgacatta tgttcatctt gagagatccc cttggaaagg acttccagaa 4200
ctgaccaatg agaatgccca gtactgtcct ttcagctgtg aaacacaagc ctggtcaatt 4260
gctactattc ttgagacact ttatgattta tag 4293
<210> 22
<211> 4089
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D2,3 hGDE WT
<400> 22
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 1140
ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1200
cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1260
gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1320
atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1380
cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1440
aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1500
actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1560
gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1620
ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1680
gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1740
atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagggc 1800
aaaattgaag aagtagttct tgaagctaga actattgaga gaaacacgaa accttatagg 1860
aaggatgaaa attcaatcaa tggaacacca gatatcacag tagaaattag agaacatatt 1920
cagcttaatg aaagtaaaat tgttaaacaa gctggagttg ccacaaaagg gcccaatgaa 1980
tatattcaag aaatagaatt tgaaaacttg tctccaggaa gtgttattat attcagagtt 2040
agtcttgatc cacatgcaca agtcgctgtt ggcattcttc gaaatcatct gacacaattc 2100
agtcctcact ttaaatctgg cagcctagct gttgacaatg cagatcctat attaaaaatt 2160
ccttttgctt ctcttgccta tagattaact ttggctgagc taaatcagat cctttaccga 2220
tgtgaatcag aagaaaagga agatggtgga gggtgctatg acataccaaa ctggtcagcc 2280
cttaaatatg caggtcttca aggtttaatg tctgtattgg cagaaataag accaaagaat 2340
gacttggggc atcctttttg taataatttg aggtctggag attggatgat tgactatgtc 2400
agtaaccggc ttatttcacg atcaggaact attgctgaag ttggtaaatg gttgcaggct 2460
atgttcttct acctgaagca gatcccacgt taccttatcc catgttactt tgatgctata 2520
ttaattggtg catataccac tcttctggat acagcatgga agcagatgtc aagctttgtt 2580
cagaatggtt caacctttgt gaaacacctt tcattgggtt cagttcaact gtgtggagta 2640
ggaaaattcc cttccctgcc aattctttca cctgccctaa tggatgtacc ttataggtta 2700
aatgagatca caaaagaaaa ggagcaatgt tgtgtttctc tagctgcagg cttacctcat 2760
ttttcttctg gtattttccg ctgctgggga agggatactt ttattgcact tagaggtata 2820
ctgctgatta ctggacgcta tgtagaagcc aggaatatta ttttagcatt tgcgggtacc 2880
ctgaggcatg gtctcattcc taatctactg ggtgaaggaa tttatgccag atacaattgt 2940
cgggatgctg tgtggtggtg gctgcagtgt atccaggatt actgtaaaat ggttccaaat 3000
ggactagaca ttctcaagtg cccagtttcc agaatgtatc ctacagatga ttctgctcct 3060
ttgcctgctg gcacactgga tcagccattg tttgaagtca tacaggaagc aatgcaaaaa 3120
cacatgcagg gcatacagtt ccgagaaagg aatgctggtc cccagataga tcgaaacatg 3180
aaggacgaag gttttaatat aactgcagga gttgatgaag aaacaggatt tgtttatgga 3240
ggaaatcgtt tcaattgtgg cacatggatg gataaaatgg gagaaagtga cagagctaga 3300
aacagaggaa tcccagccac accaagagat gggtctgctg tggaaattgt gggcctgagt 3360
aaatctgctg ttcgctggtt gctggaatta tccaaaaaaa atattttccc ttatcatgaa 3420
gtcacagtaa aaagacatgg aaaggctata aaggtctcat atgatgagtg gaacagaaaa 3480
atacaagaca actttgaaaa gctatttcat gtttccgaag acccttcaga tttaaatgaa 3540
aagcatccaa atctggttca caaacgtggc atatacaaag atagttatgg agcttcaagt 3600
ccttggtgtg actatcagct caggcctaat tttaccatag caatggttgt ggcccctgag 3660
ctctttacta cagaaaaagc atggaaagct ttggagattg cagaaaaaaa attgcttggt 3720
ccccttggca tgaaaacttt agatccagat gatatggttt actgtggaat ttatgacaac 3780
gcattagaca atgacaacta caatcttgct aaaggtttca attatcacca aggacctgag 3840
tggctgtggc ctattgggta ttttcttcgt gcaaaattat atttttccag attgatgggc 3900
ccggagacta ctgcaaagac tatagttttg gttaaaaatg ttctttcccg acattatgtt 3960
catcttgaga gatccccttg gaaaggactt ccagaactga ccaatgagaa tgcccagtac 4020
tgtcctttca gctgtgaaac acaagcctgg tcaattgcta ctattcttga gacactttat 4080
gatttatag 4089
<210> 23
<211> 4089
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D2,3 hGDE co2
<400> 23
atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60
accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120
ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180
aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240
tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300
aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360
gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420
gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480
acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540
ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600
gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660
accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720
agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780
gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840
atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900
ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960
aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020
tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080
tacttcacct ttccattcga agagatcgac ttctccatgg aagagagcat gatccatctg 1140
cctaacaagg cctgcttcct gatggctcac aacggctggg ttatgggcga cgaccctctg 1200
agaaatttcg ccgagcctgg cagcgaggtg tacctgagaa gagaactgat ctgttggggc 1260
gacagcgtga agctgagata cggcaacaag cccgaggact gcccttacct gtgggcccat 1320
atgaagaagt acacagagat caccgccacc tactttcagg gcgtcagact ggacaactgc 1380
cacagcacac ctctgcacgt ggccgagtac atgctggacg ccgctagaaa tctgcagccc 1440
aacctgtatg tggtggccga gctgtttacc ggctccgagg acctggacaa tgtgttcgtg 1500
accagactgg gcatcagcag cctgatcaga gaagccatgt ccgcctacaa tagccacgaa 1560
gagggcagac tggtgtacag atatggcggc gagcctgtgg gcagcttcgt tcagccttgt 1620
ctgaggcctc tgatgcccgc cattgctcac gccctgttca tggacatcac ccacgataac 1680
gagtgcccca tcgtgcacag aagcgcctac gacgctctgc ctagcaccac cattgtgtcc 1740
atggcctgtt gtgccagcgg cagcacaaga ggctatgacg aactggtgcc ccaccagggc 1800
aagattgagg aagtggtgct cgaggcccgg accatcgaga gaaacaccaa gccttaccgg 1860
aaggacgaga actccatcaa cggcacccct gacatcaccg tggaaatcag agagcacatc 1920
cagctcaacg agagcaagat cgtgaaacag gccggcgtgg ccacaaaggg ccccaacgag 1980
tatatccaag agattgagtt cgagaatctg agccccggca gcgtgatcat cttcagagtg 2040
tccctggatc ctcacgctca ggtggccgtg ggcatcctga gaaatcacct gacacagttc 2100
agcccacact tcaagagcgg aagcctggcc gtggacaacg ccgatcctat cctgaagatc 2160
cccttcgcct ctctggccta cagactgaca ctggctgagc tgaaccagat cctgtacaga 2220
tgcgagtccg aagagaaaga ggatggcgga ggctgctacg acatccccaa ttggagcgcc 2280
ctgaagtatg ccggactgca gggactgatg tctgtgctgg ccgagatcag acccaagaac 2340
gacctgggac accccttctg caacaacctg agatccggcg actggatgat cgactacgtg 2400
tccaacagac tgatcagcag atccggcaca atcgccgaag tcggcaaatg gctgcaggcc 2460
atgttcttct acctgaagca gatccctcgg tatctgatcc cctgctactt cgacgccatc 2520
ctgatcggcg cctacaccac actgctggat accgcctgga agcagatgtc cagcttcgtg 2580
cagaacggca gcaccttcgt gaagcacctg tctctgggaa gcgtgcagct gtgtggcgtg 2640
ggcaaatttc ccagcctgcc tatcctgtct cctgcactga tggacgtgcc ctaccggctg 2700
aatgagatca ccaaagaaaa agagcagtgc tgcgtcagcc tggctgctgg cctgcctcat 2760
ttttccagcg gcatcttccg gtgttggggc agagacacct ttattgccct gagaggcatc 2820
ctgctgatta ccggcagata cgtggaagcc cggaacatca tcctggcctt tgccggcaca 2880
ctgcggcacg gactgattcc taatctgctc ggcgagggca tctacgccag atacaactgc 2940
agagatgccg tgtggtggtg gctccagtgc atccaggact actgcaagat ggtgcccaac 3000
ggcctggaca tcctgaagtg ccctgtgtcc agaatgtacc ctaccgacga tagcgcccct 3060
ctgcctgccg gaacacttga ccagcctctg ttcgaagtga ttcaagaggc catgcagaaa 3120
cacatgcagg gaatccagtt tcgcgagcgg aatgccggac ctcagatcga cagaaacatg 3180
aaggatgagg gcttcaacat caccgctggc gtggacgaag agacaggctt tgtgtacggc 3240
ggcaaccggt tcaattgcgg cacctggatg gacaagatgg gcgagtctga ccgggccaga 3300
aacagaggaa ttcccgccac acctagagat ggcagcgctg tggaaatcgt gggcctgtct 3360
aagtctgctg tgcggtggct gctcgaactg agcaagaaga atatctttcc gtaccacgaa 3420
gtgaccgtga agcggcacgg caaggccatc aaggtgtcct acgacgagtg gaacagaaag 3480
atccaggaca acttcgaaaa gctgttccat gtgtctgagg accccagcga cctgaacgaa 3540
aagcacccca acctggtgca caagcgcggc atctacaagg acagctacgg cgcctcttct 3600
ccttggtgcg attaccagct gcggcccaac ttcaccattg ccatggtggt tgcccctgag 3660
ctgttcacca cagagaaggc ctggaaggcc ctggaaatcg ccgagaagaa actgctgggc 3720
cctctgggca tgaagacact ggaccccgac gacatggtgt actgcggaat ctacgacaac 3780
gccctggata acgacaacta caatctggcc aaggggttca attaccatca gggacccgag 3840
tggctgtggc ctatcggcta tttcctgcgg gccaagctgt acttctccag actgatgggc 3900
cctgagacaa ccgccaagac aatcgtgctc gtgaagaacg tgctgagccg gcactatgtg 3960
cacctggaaa gaagcccctg gaagggactg cccgagctga ccaatgagaa cgcccagtac 4020
tgccccttca gctgcgaaac acaggcctgg tctatcgcca ccatcctgga aaccctgtac 4080
gacctgtga 4089
<210> 24
<211> 4020
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D4 hGDE WT
<400> 24
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320
atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680
gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860
tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920
cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980
gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 2040
aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 2100
gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160
tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220
cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2280
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340
actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2400
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460
gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2520
tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580
ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640
gttgacaatg cagatcctat attaaaaatt ccttttgctt ctttacctca tttttcttct 2700
ggtattttcc gctgctgggg aagggatact tttattgcac ttagaggtat actgctgatt 2760
actggacgct atgtagaagc caggaatatt attttagcat ttgcgggtac cctgaggcat 2820
ggtctcattc ctaatctact gggtgaagga atttatgcca gatacaattg tcgggatgct 2880
gtgtggtggt ggctgcagtg tatccaggat tactgtaaaa tggttccaaa tggactagac 2940
attctcaagt gcccagtttc cagaatgtat cctacagatg attctgctcc tttgcctgct 3000
ggcacactgg atcagccatt gtttgaagtc atacaggaag caatgcaaaa acacatgcag 3060
ggcatacagt tccgagaaag gaatgctggt ccccagatag atcgaaacat gaaggacgaa 3120
ggttttaata taactgcagg agttgatgaa gaaacaggat ttgtttatgg aggaaatcgt 3180
ttcaattgtg gcacatggat ggataaaatg ggagaaagtg acagagctag aaacagagga 3240
atcccagcca caccaagaga tgggtctgct gtggaaattg tgggcctgag taaatctgct 3300
gttcgctggt tgctggaatt atccaaaaaa aatattttcc cttatcatga agtcacagta 3360
aaaagacatg gaaaggctat aaaggtctca tatgatgagt ggaacagaaa aatacaagac 3420
aactttgaaa agctatttca tgtttccgaa gacccttcag atttaaatga aaagcatcca 3480
aatctggttc acaaacgtgg catatacaaa gatagttatg gagcttcaag tccttggtgt 3540
gactatcagc tcaggcctaa ttttaccata gcaatggttg tggcccctga gctctttact 3600
acagaaaaag catggaaagc tttggagatt gcagaaaaaa aattgcttgg tccccttggc 3660
atgaaaactt tagatccaga tgatatggtt tactgtggaa tttatgacaa cgcattagac 3720
aatgacaact acaatcttgc taaaggtttc aattatcacc aaggacctga gtggctgtgg 3780
cctattgggt attttcttcg tgcaaaatta tatttttcca gattgatggg cccggagact 3840
actgcaaaga ctatagtttt ggttaaaaat gttctttccc gacattatgt tcatcttgag 3900
agatcccctt ggaaaggact tccagaactg accaatgaga atgcccagta ctgtcctttc 3960
agctgtgaaa cacaagcctg gtcaattgct actattcttg agacacttta tgatttatag 4020
<210> 25
<211> 4020
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D4 hGDE co2
<400> 25
atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60
accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120
ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180
aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240
tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300
aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360
gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420
gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480
acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540
ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600
gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660
accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720
agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780
gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840
atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900
ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960
aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020
tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080
gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 1140
ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 1200
ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1260
agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1320
atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1380
tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1440
agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1500
gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1560
cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1620
gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1680
gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1740
atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1800
gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1860
ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1920
ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1980
gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 2040
aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 2100
gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 2160
tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 2220
cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2280
aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2340
accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2400
gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2460
gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2520
agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2580
ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2640
gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctgcctca tttttccagc 2700
ggcatcttcc ggtgttgggg cagagacacc tttattgccc tgagaggcat cctgctgatt 2760
accggcagat acgtggaagc ccggaacatc atcctggcct ttgccggcac actgcggcac 2820
ggactgattc ctaatctgct cggcgagggc atctacgcca gatacaactg cagagatgcc 2880
gtgtggtggt ggctccagtg catccaggac tactgcaaga tggtgcccaa cggcctggac 2940
atcctgaagt gccctgtgtc cagaatgtac cctaccgacg atagcgcccc tctgcctgcc 3000
ggaacacttg accagcctct gttcgaagtg attcaagagg ccatgcagaa acacatgcag 3060
ggaatccagt ttcgcgagcg gaatgccgga cctcagatcg acagaaacat gaaggatgag 3120
ggcttcaaca tcaccgctgg cgtggacgaa gagacaggct ttgtgtacgg cggcaaccgg 3180
ttcaattgcg gcacctggat ggacaagatg ggcgagtctg accgggccag aaacagagga 3240
attcccgcca cacctagaga tggcagcgct gtggaaatcg tgggcctgtc taagtctgct 3300
gtgcggtggc tgctcgaact gagcaagaag aatatctttc cgtaccacga agtgaccgtg 3360
aagcggcacg gcaaggccat caaggtgtcc tacgacgagt ggaacagaaa gatccaggac 3420
aacttcgaaa agctgttcca tgtgtctgag gaccccagcg acctgaacga aaagcacccc 3480
aacctggtgc acaagcgcgg catctacaag gacagctacg gcgcctcttc tccttggtgc 3540
gattaccagc tgcggcccaa cttcaccatt gccatggtgg ttgcccctga gctgttcacc 3600
acagagaagg cctggaaggc cctggaaatc gccgagaaga aactgctggg ccctctgggc 3660
atgaagacac tggaccccga cgacatggtg tactgcggaa tctacgacaa cgccctggat 3720
aacgacaact acaatctggc caaggggttc aattaccatc agggacccga gtggctgtgg 3780
cctatcggct atttcctgcg ggccaagctg tacttctcca gactgatggg ccctgagaca 3840
accgccaaga caatcgtgct cgtgaagaac gtgctgagcc ggcactatgt gcacctggaa 3900
agaagcccct ggaagggact gcccgagctg accaatgaga acgcccagta ctgccccttc 3960
agctgcgaaa cacaggcctg gtctatcgcc accatcctgg aaaccctgta cgacctgtga 4020
<210> 26
<211> 3942
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D5 hGDE
<400> 26
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctaata ggcgagtaac caagtctgat ccaaaccaac accttacgat tattcaagat 720
cctgaataca gacggtttgg ctgtactgta gatatgaaca ttgcactaac gactttcata 780
ccatatttta ctttcccatt tgaagagata gacttctcca tggaagaatc tatgattcat 840
ctgccaaata aagcttgttt tctgatggca cacaatggat gggtaatggg agatgatcct 900
cttcgaaact ttgctgaacc gggttcagaa gtttacctaa ggagagaact tatttgctgg 960
ggagacagtg ttaaattacg ctatgggaat aaaccagagg actgtcctta tctctgggca 1020
cacatgaaaa aatacactga aataactgca acttatttcc agggagtacg tcttgataac 1080
tgccactcaa cacctcttca cgtagctgag tacatgttgg atgctgctag gaatttgcaa 1140
cccaatttat atgtagtagc tgaactgttc acaggaagtg aggacctaga caatgtcttt 1200
gttactagac tgggcattag ttccttaata agagaggcaa tgagtgcata taatagtcat 1260
gaagagggca gattagttta ccgatatgga ggagaacctg ttggatcctt tgttcagccc 1320
tgtttgaggc ctttaatgcc agctattgca catgccctgt ttatggatat tacgcatgat 1380
aatgagtgtc ctattgtgca tagatcagcg tatgatgctc ttccaagtac tacaattgtt 1440
tctatggcat gttgtgctag tggaagtaca agaggctatg atgaattagt gcctcatcag 1500
atttatgtgg atcaagttga tgaagacata gtggcagtaa caagacactc acctagcatc 1560
catcagtctg ttgtggctgt aactagaact gctttcagga atcccaagac ttcattttac 1620
agcaaggaag tgcctcaaat gtgcatccct ggcaaaattg aagaagtagt tcttgaagct 1680
agaactattg agagaaacac gaaaccttat aggaaggatg aaaattcaat caatggaaca 1740
ccagatatca cagtagaaat tagagaacat attcagctta atgaaagtaa aattgttaaa 1800
caagctggag ttgccacaaa agggcccaat gaatatattc aagaaataga atttgaaaac 1860
ttgtctccag gaagtgttat tatattcaga gttagtcttg atccacatgc acaagtcgct 1920
gttggcattc ttcgaaatca tctgacacaa ttcagtcctc actttaaatc tggcagccta 1980
gctgttgaca atgcagatcc tatattaaaa attccttttg cttctcttgc ctatagatta 2040
actttggctg agctaaatca gatcctttac cgatgtgaat cagaagaaaa ggaagatggt 2100
ggagggtgct atgacatacc aaactggtca gcccttaaat atgcaggtct tcaaggttta 2160
atgtctgtat tggcagaaat aagaccaaag aatgacttgg ggcatccttt ttgtaataat 2220
ttgaggtctg gagattggat gattgactat gtcagtaacc ggcttatttc acgatcagga 2280
actattgctg aagttggtaa atggttgcag gctatgttct tctacctgaa gcagatccca 2340
cgttacctta tcccatgtta ctttgatgct atattaattg gtgcatatac cactcttctg 2400
gatacagcat ggaagcagat gtcaagcttt gttcagaatg gttcaacctt tgtgaaacac 2460
ctttcattgg gttcagttca actgtgtgga gtaggaaaat tcccttccct gccaattctt 2520
tcacctgccc taatggatgt accttatagg ttaaatgaga tcacaaaaga aaaggagcaa 2580
tgttgtgttt ctctagctgc aggcttacct catttttctt ctggtatttt ccgctgctgg 2640
ggaagggata cttttattgc acttagaggt atactgctga ttactggacg ctatgtagaa 2700
gccaggaata ttattttagc atttgcgggt accctgaggc atggtctcat tcctaatcta 2760
ctgggtgaag gaatttatgc cagatacaat tgtcgggatg ctgtgtggtg gtggctgcag 2820
tgtatccagg attactgtaa aatggttcca aatggactag acattctcaa gtgcccagtt 2880
tccagaatgt atcctacaga tgattctgct cctttgcctg ctggcacact ggatcagcca 2940
ttgtttgaag tcatacagga agcaatgcaa aaacacatgc agggcataca gttccgagaa 3000
aggaatgctg gtccccagat agatcgaaac atgaaggacg aaggttttaa tataactgca 3060
ggagttgatg aagaaacagg atttgtttat ggaggaaatc gtttcaattg tggcacatgg 3120
atggataaaa tgggagaaag tgacagagct agaaacagag gaatcccagc cacaccaaga 3180
gatgggtctg ctgtggaaat tgtgggcctg agtaaatctg ctgttcgctg gttgctggaa 3240
ttatccaaaa aaaatatttt cccttatcat gaagtcacag taaaaagaca tggaaaggct 3300
ataaaggtct catatgatga gtggaacaga aaaatacaag acaactttga aaagctattt 3360
catgtttccg aagacccttc agatttaaat gaaaagcatc caaatctggt tcacaaacgt 3420
ggcatataca aagatagtta tggagcttca agtccttggt gtgactatca gctcaggcct 3480
aattttacca tagcaatggt tgtggcccct gagctcttta ctacagaaaa agcatggaaa 3540
gctttggaga ttgcagaaaa aaaattgctt ggtccccttg gcatgaaaac tttagatcca 3600
gatgatatgg tttactgtgg aatttatgac aacgcattag acaatgacaa ctacaatctt 3660
gctaaaggtt tcaattatca ccaaggacct gagtggctgt ggcctattgg gtattttctt 3720
cgtgcaaaat tatatttttc cagattgatg ggcccggaga ctactgcaaa gactatagtt 3780
ttggttaaaa atgttctttc ccgacattat gttcatcttg agagatcccc ttggaaagga 3840
cttccagaac tgaccaatga gaatgcccag tactgtcctt tcagctgtga aacacaagcc 3900
tggtcaattg ctactattct tgagacactt tatgatttat ag 3942
<210> 27
<211> 3759
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D6 hGDE
<400> 27
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 60
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 120
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 180
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 240
gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 300
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 360
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 420
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 480
atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 540
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 600
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 660
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 720
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 780
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 840
gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 900
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 960
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1020
tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1080
cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1140
gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 1200
aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 1260
gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 1320
tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1380
cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 1440
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 1500
actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 1560
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 1620
gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 1680
tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 1740
ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 1800
gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 1860
ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 1920
gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 1980
tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2040
aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2100
attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2160
taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2220
acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2280
tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2340
cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 2400
tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 2460
agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 2520
aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 2580
ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 2640
atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 2700
agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 2760
tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 2820
aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 2880
gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 2940
gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3000
gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3060
tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3120
aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3180
gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3240
atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 3300
tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 3360
ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 3420
gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 3480
aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 3540
gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 3600
gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 3660
ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 3720
tcaattgcta ctattcttga gacactttat gatttatag 3759
<210> 28
<211> 3327
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D7 hGDE
<400> 28
atggttacca ggtattttac tttcccattt gaagagatag acttctccat ggaagaatct 60
atgattcatc tgccaaataa agcttgtttt ctgatggcac acaatggatg ggtaatggga 120
gatgatcctc ttcgaaactt tgctgaaccg ggttcagaag tttacctaag gagagaactt 180
atttgctggg gagacagtgt taaattacgc tatgggaata aaccagagga ctgtccttat 240
ctctgggcac acatgaaaaa atacactgaa ataactgcaa cttatttcca gggagtacgt 300
cttgataact gccactcaac acctcttcac gtagctgagt acatgttgga tgctgctagg 360
aatttgcaac ccaatttata tgtagtagct gaactgttca caggaagtga ggacctagac 420
aatgtctttg ttactagact gggcattagt tccttaataa gagaggcaat gagtgcatat 480
aatagtcatg aagagggcag attagtttac cgatatggag gagaacctgt tggatccttt 540
gttcagccct gtttgaggcc tttaatgcca gctattgcac atgccctgtt tatggatatt 600
acgcatgata atgagtgtcc tattgtgcat agatcagcgt atgatgctct tccaagtact 660
acaattgttt ctatggcatg ttgtgctagt ggaagtacaa gaggctatga tgaattagtg 720
cctcatcaga tttcagtggt ttctgaagaa cggttttaca ctaagtggaa tcctgaagca 780
ttgccttcaa acacaggtga agttaatttc caaagcggca ttattgcagc caggtgtgct 840
atcagtaaac ttcatcagga gcttggagcc aagggtttta ttcaggtgta tgtggatcaa 900
gttgatgaag acatagtggc agtaacaaga cactcaccta gcatccatca gtctgttgtg 960
gctgtaacta gaactgcttt caggaatccc aagacttcat tttacagcaa ggaagtgcct 1020
caaatgtgca tccctggcaa aattgaagaa gtagttcttg aagctagaac tattgagaga 1080
aacacgaaac cttataggaa ggatgaaaat tcaatcaatg gaacaccaga tatcacagta 1140
gaaattagag aacatattca gcttaatgaa agtaaaattg ttaaacaagc tggagttgcc 1200
acaaaagggc ccaatgaata tattcaagaa atagaatttg aaaacttgtc tccaggaagt 1260
gttattatat tcagagttag tcttgatcca catgcacaag tcgctgttgg cattcttcga 1320
aatcatctga cacaattcag tcctcacttt aaatctggca gcctagctgt tgacaatgca 1380
gatcctatat taaaaattcc ttttgcttct cttgcctata gattaacttt ggctgagcta 1440
aatcagatcc tttaccgatg tgaatcagaa gaaaaggaag atggtggagg gtgctatgac 1500
ataccaaact ggtcagccct taaatatgca ggtcttcaag gtttaatgtc tgtattggca 1560
gaaataagac caaagaatga cttggggcat cctttttgta ataatttgag gtctggagat 1620
tggatgattg actatgtcag taaccggctt atttcacgat caggaactat tgctgaagtt 1680
ggtaaatggt tgcaggctat gttcttctac ctgaagcaga tcccacgtta ccttatccca 1740
tgttactttg atgctatatt aattggtgca tataccactc ttctggatac agcatggaag 1800
cagatgtcaa gctttgttca gaatggttca acctttgtga aacacctttc attgggttca 1860
gttcaactgt gtggagtagg aaaattccct tccctgccaa ttctttcacc tgccctaatg 1920
gatgtacctt ataggttaaa tgagatcaca aaagaaaagg agcaatgttg tgtttctcta 1980
gctgcaggct tacctcattt ttcttctggt attttccgct gctggggaag ggatactttt 2040
attgcactta gaggtatact gctgattact ggacgctatg tagaagccag gaatattatt 2100
ttagcatttg cgggtaccct gaggcatggt ctcattccta atctactggg tgaaggaatt 2160
tatgccagat acaattgtcg ggatgctgtg tggtggtggc tgcagtgtat ccaggattac 2220
tgtaaaatgg ttccaaatgg actagacatt ctcaagtgcc cagtttccag aatgtatcct 2280
acagatgatt ctgctccttt gcctgctggc acactggatc agccattgtt tgaagtcata 2340
caggaagcaa tgcaaaaaca catgcagggc atacagttcc gagaaaggaa tgctggtccc 2400
cagatagatc gaaacatgaa ggacgaaggt tttaatataa ctgcaggagt tgatgaagaa 2460
acaggatttg tttatggagg aaatcgtttc aattgtggca catggatgga taaaatggga 2520
gaaagtgaca gagctagaaa cagaggaatc ccagccacac caagagatgg gtctgctgtg 2580
gaaattgtgg gcctgagtaa atctgctgtt cgctggttgc tggaattatc caaaaaaaat 2640
attttccctt atcatgaagt cacagtaaaa agacatggaa aggctataaa ggtctcatat 2700
gatgagtgga acagaaaaat acaagacaac tttgaaaagc tatttcatgt ttccgaagac 2760
ccttcagatt taaatgaaaa gcatccaaat ctggttcaca aacgtggcat atacaaagat 2820
agttatggag cttcaagtcc ttggtgtgac tatcagctca ggcctaattt taccatagca 2880
atggttgtgg cccctgagct ctttactaca gaaaaagcat ggaaagcttt ggagattgca 2940
gaaaaaaaat tgcttggtcc ccttggcatg aaaactttag atccagatga tatggtttac 3000
tgtggaattt atgacaacgc attagacaat gacaactaca atcttgctaa aggtttcaat 3060
tatcaccaag gacctgagtg gctgtggcct attgggtatt ttcttcgtgc aaaattatat 3120
ttttccagat tgatgggccc ggagactact gcaaagacta tagttttggt taaaaatgtt 3180
ctttcccgac attatgttca tcttgagaga tccccttgga aaggacttcc agaactgacc 3240
aatgagaatg cccagtactg tcctttcagc tgtgaaacac aagcctggtc aattgctact 3300
attcttgaga cactttatga tttatag 3327
<210> 29
<211> 3912
<212> DNA
<213> artificial
<220>
<223> Nucleic acid sequence encoding D8 hGDE
<400> 29
atgcatccag aatgtgccta taatcttgta aattctccac acttaaaacc tgcctgggtc 60
ttagacagag cactttggcg tttctcctgt gatgttgcag aagggaaata caaagaaaag 120
ggaatacctg ctttgattga aaatgatcac catatgaact ccatccgaaa aataatttgg 180
gaggatattt ttccaaagct taaactctgg gaatttttcc aagtagatgt caacaaagcg 240
gttgagcaat ttagaagact tcttacacaa gaaaataggc gagtaaccaa gtctgatcca 300
aaccaacacc ttacgattat tcaagatcct gaatacagac ggtttggctg tactgtagat 360
atgaacattg cactaacgac tttcatacca catgacaagg ggccagcagc aattgaagaa 420
tgctgtaatt ggtttcataa aagaatggag gaattaaatt cagagaagca tcgactcatt 480
aactatcatc aggaacaggc agttaattgc cttttgggaa atgtgtttta tgaacgactg 540
gctggccatg gtccaaaact aggacctgtc actagaaagc atcctttagt taccaggtat 600
tttactttcc catttgaaga gatagacttc tccatggaag aatctatgat tcatctgcca 660
aataaagctt gttttctgat ggcacacaat ggatgggtaa tgggagatga tcctcttcga 720
aactttgctg aaccgggttc agaagtttac ctaaggagag aacttatttg ctggggagac 780
agtgttaaat tacgctatgg gaataaacca gaggactgtc cttatctctg ggcacacatg 840
aaaaaataca ctgaaataac tgcaacttat ttccagggag tacgtcttga taactgccac 900
tcaacacctc ttcacgtagc tgagtacatg ttggatgctg ctaggaattt gcaacccaat 960
ttatatgtag tagctgaact gttcacagga agtgaggacc tagacaatgt ctttgttact 1020
agactgggca ttagttcctt aataagagag gcaatgagtg catataatag tcatgaagag 1080
ggcagattag tttaccgata tggaggagaa cctgttggat cctttgttca gccctgtttg 1140
aggcctttaa tgccagctat tgcacatgcc ctgtttatgg atattacgca tgataatgag 1200
tgtcctattg tgcatagatc agcgtatgat gctcttccaa gtactacaat tgtttctatg 1260
gcatgttgtg ctagtggaag tacaagaggc tatgatgaat tagtgcctca tcagatttca 1320
gtggtttctg aagaacggtt ttacactaag tggaatcctg aagcattgcc ttcaaacaca 1380
ggtgaagtta atttccaaag cggcattatt gcagccaggt gtgctatcag taaacttcat 1440
caggagcttg gagccaaggg ttttattcag gtgtatgtgg atcaagttga tgaagacata 1500
gtggcagtaa caagacactc acctagcatc catcagtctg ttgtggctgt aactagaact 1560
gctttcagga atcccaagac ttcattttac agcaaggaag tgcctcaaat gtgcatccct 1620
ggcaaaattg aagaagtagt tcttgaagct agaactattg agagaaacac gaaaccttat 1680
aggaaggatg aaaattcaat caatggaaca ccagatatca cagtagaaat tagagaacat 1740
attcagctta atgaaagtaa aattgttaaa caagctggag ttgccacaaa agggcccaat 1800
gaatatattc aagaaataga atttgaaaac ttgtctccag gaagtgttat tatattcaga 1860
gttagtcttg atccacatgc acaagtcgct gttggcattc ttcgaaatca tctgacacaa 1920
ttcagtcctc actttaaatc tggcagccta gctgttgaca atgcagatcc tatattaaaa 1980
attccttttg cttctcttgc ctatagatta actttggctg agctaaatca gatcctttac 2040
cgatgtgaat cagaagaaaa ggaagatggt ggagggtgct atgacatacc aaactggtca 2100
gcccttaaat atgcaggtct tcaaggttta atgtctgtat tggcagaaat aagaccaaag 2160
aatgacttgg ggcatccttt ttgtaataat ttgaggtctg gagattggat gattgactat 2220
gtcagtaacc ggcttatttc acgatcagga actattgctg aagttggtaa atggttgcag 2280
gctatgttct tctacctgaa gcagatccca cgttacctta tcccatgtta ctttgatgct 2340
atattaattg gtgcatatac cactcttctg gatacagcat ggaagcagat gtcaagcttt 2400
gttcagaatg gttcaacctt tgtgaaacac ctttcattgg gttcagttca actgtgtgga 2460
gtaggaaaat tcccttccct gccaattctt tcacctgccc taatggatgt accttatagg 2520
ttaaatgaga tcacaaaaga aaaggagcaa tgttgtgttt ctctagctgc aggcttacct 2580
catttttctt ctggtatttt ccgctgctgg ggaagggata cttttattgc acttagaggt 2640
atactgctga ttactggacg ctatgtagaa gccaggaata ttattttagc atttgcgggt 2700
accctgaggc atggtctcat tcctaatcta ctgggtgaag gaatttatgc cagatacaat 2760
tgtcgggatg ctgtgtggtg gtggctgcag tgtatccagg attactgtaa aatggttcca 2820
aatggactag acattctcaa gtgcccagtt tccagaatgt atcctacaga tgattctgct 2880
cctttgcctg ctggcacact ggatcagcca ttgtttgaag tcatacagga agcaatgcaa 2940
aaacacatgc agggcataca gttccgagaa aggaatgctg gtccccagat agatcgaaac 3000
atgaaggacg aaggttttaa tataactgca ggagttgatg aagaaacagg atttgtttat 3060
ggaggaaatc gtttcaattg tggcacatgg atggataaaa tgggagaaag tgacagagct 3120
agaaacagag gaatcccagc cacaccaaga gatgggtctg ctgtggaaat tgtgggcctg 3180
agtaaatctg ctgttcgctg gttgctggaa ttatccaaaa aaaatatttt cccttatcat 3240
gaagtcacag taaaaagaca tggaaaggct ataaaggtct catatgatga gtggaacaga 3300
aaaatacaag acaactttga aaagctattt catgtttccg aagacccttc agatttaaat 3360
gaaaagcatc caaatctggt tcacaaacgt ggcatataca aagatagtta tggagcttca 3420
agtccttggt gtgactatca gctcaggcct aattttacca tagcaatggt tgtggcccct 3480
gagctcttta ctacagaaaa agcatggaaa gctttggaga ttgcagaaaa aaaattgctt 3540
ggtccccttg gcatgaaaac tttagatcca gatgatatgg tttactgtgg aatttatgac 3600
aacgcattag acaatgacaa ctacaatctt gctaaaggtt tcaattatca ccaaggacct 3660
gagtggctgt ggcctattgg gtattttctt cgtgcaaaat tatatttttc cagattgatg 3720
ggcccggaga ctactgcaaa gactatagtt ttggttaaaa atgttctttc ccgacattat 3780
gttcatcttg agagatcccc ttggaaagga cttccagaac tgaccaatga gaatgcccag 3840
tactgtcctt tcagctgtga aacacaagcc tggtcaattg ctactattct tgagacactt 3900
tatgatttat ag 3912
<210> 30
<211> 4134
<212> DNA
<213> Equus caballus
<400> 30
atgattcatt ttacaccatt gcagactctt ggactatcta ggtcatccta ctcccttgct 60
gaccagttag aattaaatcc tgacttttca agacctaata aaaagtatac ctggcatgat 120
gttggacagc tagtggaaaa attgaaaaag gaatgggata ttctttgtat tactgatgtt 180
gtctacaatc atactgctgc taatagtaaa tggatccatg aacatccaga aagtgcatat 240
aaccttgtga attctccaca cttaaaacct gcctgggtct tagacagagc actttggcat 300
ttatcctgtg atgtggcaga agggaaatac agagaaaaag gagtacctgc tctgattgaa 360
aatgatcatc aaatgaattg cattcgaaaa ataatttggg aggatattta tccaaagatt 420
cacctctggg aatttttcca agtagacgtt cacaaagcag ttgagcaatt tagaggactt 480
cttacacaag aaaataggaa aataatatct cagcctgatc caaagcaaca ccttaagatt 540
attcaggatc ctgaatacag acggcttggc tgtactgtag atatgaacat tgcactagca 600
actttcatac cacatgataa tgggccagct gcaattgatg aatgctgtaa ttggttccgt 660
aagagaattg aggaattaaa cgcagagaag catcaacttg tgaactatca tcaggagcag 720
gcagttaatt gccttttggg aaatgtattt tatgaacgac tggctggcca tggtcctaaa 780
ctaggacctg tcaccagaaa acatccttta gttaccagat attttacttt cccatttgaa 840
gaaatgaccc catccacaga agaatctatg attcatctcc caaataaagc ttgttttctg 900
atggcgcata atggatgggt aatgggagat gatccccttc ggaactttgc tgaaccaggt 960
tcagacgttt atctaaggag agaacttatc tgctggggag acagtgttaa attacgctat 1020
gggaataagc cagaggactg tccttacctc tgggcgcaca tgaaaaaata cactgaaata 1080
actgcaactc atttccaggg agtacgtctt gataactgcc actcaacacc aattcatgta 1140
gccgagtaca tgttggatgc cgctaggaaa ttgcaaccca atttatatgt agtagctgaa 1200
ctgttcacag gaagcgaaga cctggacaat atctttgtta ctagactggg cattagttcc 1260
ttaataagag aggcaatgag tgcagctgat agccatgagg agggcagatt agtttaccga 1320
tatggaggag agcctgttgg gtcctttgtt cagccctgtt tgaggccttt aatgccagct 1380
attgcacatg ccctgtttat ggatatcacc catgataatg agtgtcctat tgtgcatagg 1440
tcagcatatg atgctctccc gagttccacg attgtttcta tggcatcttg tgctagtgga 1500
agtactaaag gctatgatga attagtgcct catcagattt cagtggtttc tgaagaacga 1560
ttttatacta agtggaatcc tgaagcattg ccatcaaata caggtgaagt caatttccaa 1620
agcggaatta ttgcagccag gcgtgctatc aataaacttc atcaagagct tggggccaag 1680
ggtttcattc aggtgtatgt ggatcaggtt gatcaagata tagtggcggt aacaaggcac 1740
tcacctagca tccatcagtc tgttgtgtct gtgtcgagaa ctgctttcag gaatcccaag 1800
acgtcatttt acagcaagga agtgcctcat atgtacatcc ctggcaaaat tgaagaagta 1860
gttcttgaag ctagaactat tgagagacat acaatacctt ataagaagga tgaaaactca 1920
atcaatggaa tgccagatat cacagtagaa attagagaac atattcagct taatgaaagt 1980
aaaattgtta aacatgctgg aattgtcaca aaaggaccca atgaatttgt tcaagaaata 2040
gagtttgaaa acttgactcc aggaagtgtt attatattca gagttagtct tgatccacat 2100
gcacaagttg ctgttggaat tcttcgaaat catctgacac aattcagtcc tcactttaaa 2160
tctgggagcc ttgctgttga caacgcagat cctatattga aaattccttt tgcttctatt 2220
gcctctaaat taactttggc tgagctaaat caggtccttt atcgatgtga atcagaagaa 2280
caagaagatg gtggagggtg ttataacata ccaaactggt cgtctcttaa atatgcaggt 2340
cttcaaggat taatgtccat attggcagaa ataagaccaa ggaatgactt ggggcatccc 2400
ttttgtgaca atttgagatc tggagattgg atgattgact atgtcagtag ccggcttatt 2460
tcacgatcag gaactattgc tgaagttggt aaatggttgc aggctatgtt cctctacctg 2520
aagcagatcc cccgttatct tattccatgt tactttgatg ctatattaat tggtgcatac 2580
accactctcc tggatatagc atggaagcag atgtcaagct ttgttcagaa tggttctacc 2640
tttgtgaaac acctttctct gggttcagtc caaatgtgtg gagtaggaaa attcccttct 2700
ctgccacttc tttcaccttc ccttacggat ctaccatata gagtaaatga gatcacaaaa 2760
gaaaaggagc agtgttgtgg gtctctagct gcaggcttac ctcatttttc tgctggcatt 2820
ttccgctgct ggggaaggga taccttcatt gcgctcagag gtctgctgct ggttacggga 2880
cgctatttgg aggccaggaa tattatttta gcatttgctg gcaccctgag acacggtctc 2940
attcctaatc tcctgggtga aggaactcac gccagataca attgccggga tgctgtgtgg 3000
tggtggctac agtgtattca ggattactgt aaaattgttc caaatggcct ggacatcctc 3060
aggtgcccgg tttccagaat gtatcctaca gatgattctg ttcctttgtc tgctggcaca 3120
gtggatcaac cattgtttga agtaatacag gaagctatgc aaagacatgt gcagggcata 3180
cagttccgag aaaggaatgc tggtccacag atagatcgaa acatgaagga tgaaggtttt 3240
aatataactg caggagttga tgaagaaacg ggatttgttt atggaggaaa tcgcttcaat 3300
tgcggcacat ggatggataa aatgggagaa agtgacagag ctagaaacag aggaatcccg 3360
gccactccaa gagatgggtc tgctgtggaa attgtgggcc tgagtaaatc tgccgttcgt 3420
tggttgctgg aattatcccg aaaaaatatt ttcccttatc atgaagtccg agtaaaaaga 3480
catggaaagt ttgtgacagt ctcatatgat gagtggaaca gaaaaataca agacaacttt 3540
gaaaagctat ttcatgtgtc agaagaccct tcagatttta acgaaaagca tcctgagctg 3600
gttcacaaac gtggcatata caaagatagt tatggagcat caagcccttg gtgtgactac 3660
cagctcaggc ctaattttac catagcaatg gtcgtagccc ctgagctgtt taccccagaa 3720
aaagcatgga aagctttgga gattgcagaa aaaaaattgc ttggtcccct tggcatgaaa 3780
actttggatc cagatgatat ggtttactgt ggaatttatg acaatgcctt agacaatgac 3840
aactacaatc ttgctaaagg tttcaattat caccaaggac ctgagtggct gtggcccact 3900
ggatattttc ttcgtgcaaa attgtatttt tccaaattaa tgggtccaga gactaatgca 3960
aagactatgt ttttggttaa aaacgtcctt tccagacatt atgttcatct tgagagatcc 4020
ccttggaaag gacttccaga actgactaat gagaatggcc aatactgtcc tttcagctgt 4080
gaaacacaag cctggtcaat tgctactgtt cttgaaacac tctatgactt atag 4134
<210> 31
<211> 4098
<212> DNA
<213> Gorilla gorilla
<400> 31
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgaa ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtgaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaattcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacatctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
gagtatttta ctttcccatt tgaagagata gacttctcca tggaagaatc tatgattcat 1140
ctcccaaata aagcttgttt tctgatggca cacaatggat gggtaatggg agatgatcct 1200
cttcgaaact ttgctgaacc gggttcagaa gtttacctaa ggagagaact tatttgctgg 1260
ggagacagtg ttaaattacg ctatgggaat aaaccagagg actgtcctta tctctgggca 1320
cacatgaaaa aatacactga aataactgca acttatttcc agggagtacg tcttgataac 1380
tgccactcaa cacctcttca cgtagctgag tacatgttgg atgctgctag gaatttgcaa 1440
cccaatttat atgtagtagc tgaactgttc acaggaagtg aagatctgga caatgtcttt 1500
gttactagac tgggcattag ttccttaata agagaggcaa tgagtgcata taatagtcat 1560
gaagagggca gattagttta ccgatatgga ggagaacctg ttggatcctt tgttcagccc 1620
tgtttgaggc ctttaatgcc agctattgca catgccctgt ttatggatat tacgcatgat 1680
aatgagtgtc ctattgtgca tagatcagcg tatgatgctc ttccaagtac tacaattgtc 1740
tctatggcgt gttgtgctag tggaagtaca agaggctatg atgaattagt gcctcatcag 1800
ttcctaggca aaattgaaga agtagttctt gaagctagaa ctattgagag aaacatgaaa 1860
ccttatagga aggatgagaa ttcaatcaat ggaacgccag atatcacagt agaaattaga 1920
gaacatattc agcttaatga aagtaaaatt gttaaacaag ctggagttgc cacaaaaggg 1980
cccaatgaat atattcaaga aatagaattt gaaaacttgt ctccaggaag tgttattata 2040
ttcagagtta gtcttgatcc acatgcacaa gtcgctgttg gaattcttcg aaatcatctg 2100
acacaattca gtcctcactt taaatctggc agcctagctg ttgacaatgc agatcctata 2160
ttaaaaattc cttttgcttc tattgcctcc agattaactt tggctgagct aaatcagatc 2220
ctttaccgat gtgaatcaga agaaaaggaa gatggtggag ggtgctatga cataccaaac 2280
tggtcagccc ttaaatatgc aggtcttcaa ggtttaatgt ctgtattggc agaaataaga 2340
ccaaagaatg acttggggca tcctttttgt aataatttga gatctggaga ttggatgatt 2400
gactatgtca gtaaccggct tatttcacga tcaggaacta ttgctgaagt tggtaaatgg 2460
ttgcaggcta tgttcttcta cctgaagcag atcccacgtt accttatccc atgttacttt 2520
gatgctatat taattggtgc atataccact cttctggata cagcatggaa gcagatgtca 2580
agctttgttc agaatggttc aacctttgtg aaacaccttt cattgggttc agttcaactg 2640
tgtggagtag gaaaattccc ttccctgcca attctttcac ctgccctaat ggatgtacct 2700
tataggttaa atgagatcac aaaagaaaag gagcaatgtt gtgtttctct agctgcaggc 2760
ttacctcatt tttcttctgg tattttccgc tgctggggaa gggatacttt tattgcactt 2820
agaggtatac tgctgattac tggacgctat gtagaagcca ggaatattat tttagcattt 2880
gcgggtaccc tgaggcatgg tctcattcct aatctactgg gtgaaggaat ttatgccaga 2940
tacaattgtc gggatgctgt gtggtggtgg ctgcagtgta tccaggatta ctgtaaaatg 3000
gttccaaatg gtgtagacat tctcaagtgc ccagtttcca gaatgtatcc tacagatgat 3060
tctgctcctt tgcctgctgg cacactggat cagccattgt ttgaagtcat acaggaagca 3120
atgcaaaaac acatgcaggg catacagttc cgagaaagga atgctggtcc ccagatagat 3180
cgaaacatga aggacgaagg ttttaatata actgcaggag ttgatgaaga aacaggattt 3240
gtttatggag gaaatcgttt caattgtggc acatggatgg ataaaatggg agaaagtgac 3300
agagctagaa acagaggaat cccagccaca ccaagagatg ggtctgctgt ggaaattgtg 3360
ggcctgagta aatctgctgt tcgctggttg ctggaattat ccaaaaaaaa tattttccct 3420
tatcatgaag tcacagtaaa aagacatgga aaggctataa aggtctcata tgatgagtgg 3480
aacagaaaaa tacaagacaa ctttgaaaag ctatttcatg tttcagaaga cccttcagat 3540
ttaaatgaaa agcatccaaa tctggttcac aaacgtggca tatacaaaga tagttatgga 3600
gcgtcaagtc cttggtgtga ctatcagctc aggcctaatt ttaccatagc aatggttgtg 3660
gcccctgagc tctttactac agaaaaagca tggaaagctt tggagattgc agaaaaaaaa 3720
ttgcttggtc cccttggcat gaaaacttta gatccagatg atatggttta ctgtggaatt 3780
tatgacaatg cattagacaa tgacaactac aatcttgcta aaggtttcaa ttatcaccaa 3840
ggacctgagt ggctgtggcc tattgggtat tttcttcgtg caaaattata tttttccaga 3900
ttgatgggcc cggagactac tgcaaagact atagttttgg ttaaaaatgt tctttcccga 3960
cattatgttc atcttgagag atccccttgg aaaggacttc cagaactgac caatgagaat 4020
gcccagtact gtcctttcag ctgtgaaaca caagcctggt caattgctac tattcttgag 4080
acactttatg atttgtag 4098
<210> 32
<211> 3900
<212> DNA
<213> Pongo abelii
<400> 32
atggggcaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa gctggaaaag 60
accctcttca gacttgaaca agggtatgaa ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgcaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc cgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccactgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ccgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtgaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaattcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttcgaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacatctta cgattattca ggatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
gacaatgggc cagcagcaat tgaagagtgc tgtaactggt ttcgtaagag aattgaggaa 1140
ttaaattcag agaagcatca actcattaac tatcatcagg aacaggcagt gaattgcctt 1200
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat ggacttctcc 1320
atggaagaat ctatgattca tctcccaaat aaagcttgtt tactgatggc acacaatgga 1380
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680
gaagatctgg acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740
atgagtgcat atgatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cggctattgc acatgccctg 1860
tttatggata ttacacatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920
cttccaagta ctacaattgt ttctatggcg tgttgtgcta gtggaagtac aagaggctat 1980
gatgaattag tgcctcatca gatttcggtg gtttctgaag aacggtttta cactaagtgg 2040
aatcctgaag cattgccttc aaatacaggt gaagttaatt tccaaagcgg cattattgca 2100
gccaggtgtg ctatcaataa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160
tatgttgatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220
cagtctgttg tggctgtatc tagaactgct ttcaggaatc ccaagacttc attttacagc 2280
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340
actattgaga gaaacacgaa accttatagg aaggatgaga attcaatcaa tggaacgcca 2400
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460
gctggagttg ccacaaaagg gcccaatgaa tttattcaag aaatagaatt tgaaaacttg 2520
tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580
ggaattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640
gttgacaatg cagatcctat attaaaaatt ccttttgctt tacctcattt ttcttctggt 2700
attttccgct gctggggaag ggatactttt attgcactta gaggtatgct gctgattact 2760
ggacgctatg tagaagccag gaatattatt ttagcatttg ctggtaccct gaggcatggt 2820
ctcattccta atctactggg tgaaggaact tatgccagat acaattgtcg ggacgctgtg 2880
tggtggtggc tgcagtgtat ccaggattac tgtaaagtgg ttccaaatgg tctagacatt 2940
ctcaagtgcc cagtttccag aatgtatcct acagatgatt ctgctccttt gcctgctggc 3000
gcactgttta atataactgc aggagttgat gaagaaacag gatttgttta tggaggaaat 3060
cgtttcaatt gtggcacatg gatggataaa atgggagaaa gtgacagagc tagaaacaga 3120
ggaatcccag ccacaccaag agatgggtct gctgtggaaa ttgtgggcct gagtaaatct 3180
gctgttcgct ggttgctgga attatccaaa aaaaatattt tcccttatca tgaagtcaca 3240
gtaaaacatg gaaaggctat aaaggtctca tatgatgagt ggaacagaaa aatacaggat 3300
aactttgaaa agctgtttca tgtttcagaa gacccttcag atttaaatga aaagcatcca 3360
aatttggttc acaaacgtgg catatacaaa gatagttatg gagcttcaag tccttggtgt 3420
gactatcagc tcaggcctaa ttttaccata gcaatggttg tggcccctga gctctttact 3480
acagaaaaag catggaaagc tttggagatt gcagaaaaaa aattgcttgg tccccttggc 3540
atgaaaactt tagatccaga tgatatggtt tactgtggaa tttatgacaa tgcattagac 3600
aatgacaact acaatcttgc taaaggtttc aattatcacc aaggacctga gtggctgtgg 3660
cctattgggt attttcttcg tgcaaaatta tatttttcca gattgatggg cccggagact 3720
actgcaaaga ctatagtttt ggttaaaaat gttctttccc gacattatgt tcatcttgag 3780
agatcccctt ggaaaggact tccagaactg accaatgaga atgcccagta ctgtcctttc 3840
agctgtgaaa cacaagcctg gtcagttgct actattcttg agacacttta tgatttatag 3900
<210> 33
<211> 4173
<212> DNA
<213> Pteropus alecto
<400> 33
atgggtcacg gtaaacagat tagaatttta cttctgaacg aaatggaaaa gcttgaaaag 60
accctcttta gacttgaaca agggtttgaa ctacagttcc gattaggccc aactttacaa 120
ggaaaaacag ttactgtgca tacaaattac ccatatcctg gagaaacatt taatcgagaa 180
aaattccgtt ccctggaatg ggaaaatcca tcagaaagag aagatgattc tgataaatac 240
tgtaaactta atctccaaca agcgggatca tttcagtatt acttccttcg aggaaatgag 300
aagagtggtg ggggttacat agttgtggat cctgtattac gtgttggtac tgataatcat 360
gtgttaccct tagactgtgt tactctccag acatttttag ctaagtgttt gggacccttg 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gttacaacat gattcacttt 480
accccattgc agactcttgg ccagtctagg tcatgctact ctcttgctga tcagttagaa 540
ttaaatcctg acttttccag acctaataaa aagtgtacct gggatgatgt tggacagcta 600
gtggaaaaat tgaaaaagga atggaatatt ctttgtatca ccgatgttgt ctacaatcat 660
accggaaata ggaaaataac caagcctgat ccaaaagaac accttaagat aattcaggat 720
cctgaataca ggaggcttgg ctgtactgta gatatgaaca ttgcactagc gactttcata 780
ccaaatgagt attttacttt cccatttgag gaaatgaccc tctccacaga agaatctatg 840
attcatctcc caaataaagc ttgttttctg atggcacata atggatgggt aatgggagat 900
gatccccttc gaaactttgc tgaaccaggt tcagatgttt atctgaggag agaacttatt 960
tgctggggag acagtgttaa attacgctat gggaataaac cagaggactg tccttatctc 1020
tgggcacaca tgaaaaaata cactgaaata actgcaactt atttccaggg agtacgtctt 1080
gataactgcc actccacacc tcttcatgta gctgagtaca tgttggatgc tgctaggaaa 1140
ttgcaaccca atttatatat agtggcagaa ctgttcacag gaagtgaaga cttggacaat 1200
gtctttgtta ctagactggg aattagttcc ttaataagag aggcaatgag tgcacatgat 1260
agtcatgaag agggcagatt agtttaccga tatggaggag aacccgttgg gtcatttgtt 1320
cagccctgtt tgaggccttt gatgccagct attgcacatg ccctgtttat ggatattacc 1380
catgataatg agtgtcctat tgtgcataga tcagcatatg atgctctccc aagttccatg 1440
attgtttcta tggcgtgttg tgctagtggt agtactaaag gctatgatga attagtgcct 1500
catcaggtgt atgtggatca ggttgatgaa gacatagtgg cagtaacaag acactcacct 1560
agtatccatc agtctgttgt ggctgtgtct agaactgctt tcaagaatcc caagacttca 1620
ttttacagca aggaagtccc tcaaatgtgc atccctggca aaattgaaga agtagttctt 1680
gaagctagaa ctattgaaag aaatacaaaa ccttataaga gggatgaaaa ttcaatcaat 1740
ggaatgccag atatcacagc agaaattaga gaacatattc agcttaatga aagtaaaatt 1800
gttaaacaag ctggaattgc cacaaaagga cccaatgaat acattcaaga aatagaattt 1860
gaaaacttgt ctccaggaag tgttattgta ttcagagtta gtctcgatcc acatgcacaa 1920
gtcgctgttg gaattcttcg aaatcattta actcagttca gtcctcactt taaatctggg 1980
agcctttctg ccgacagctc agatcctata ttaaaaattc ctttcgctta tattgcctct 2040
aaattaactt tggctgagct aaatcaaata ctttaccggt gtgaatcaga agaacaagaa 2100
gatggtgggg gatgttataa tataccaaac tggtcatctc ttaaatatgc aggtcttcaa 2160
gagaatagtt ctttggagtt agctccttat gtgggctttg gtggaggttg tggggcagca 2220
cctgcaggtc taaatcgggg tgggggtgtt cggtccgacc aggcctcact agagcgattc 2280
ctgactacct tgcttgccac tgtggactat acagcccttg tgtccacttc tgtatgttca 2340
ccccacatca ctggacacga gcagcagccc aggctatggg aacgaattgc ctctgccaat 2400
aatatagcat gctatttcta tgacttttca ggattaatgt ctgtattagc agaaatgaga 2460
ccaaagaatg acttggggca tcctttttgt gataatttga gatctggaga ttggatgatt 2520
gactatgtca gtaatcggct tatttcacga tcgggaacta ttgctgaagt tggcagatgg 2580
ttgcaggcta tgttcttcta cctgaagcag atcccacgct atcttatccc atgttatttc 2640
gatgctgtat taatcggtgc atacaccact cttctggata cggcatggaa acaaatgtca 2700
agctttgttc agaatggttc tacctttgtg aaacaccttt cattgggttc tgtccagctg 2760
tgtggagtag gaaaatacgc ttctcttcca cttctttcac cttcgcttat ggatgtacca 2820
tacaggctaa atgagatcac aaaagaaaag gagcaatgtt gtgtgactct agctgcaggc 2880
ttgcctcatt tttcttctgg tattttccgc tgctggggaa gggatacttt tattgcactt 2940
agaggtatac tgctgattac cgggcgctat ttagaagcca ggaatattat tttagcgttt 3000
gctggtacct tgagacacgg tctcattcct aatctcctgg gtgaaggaac ttatgccaga 3060
tacaactgcc gggatgccgt gtggtggtgg ctgcagtgta ttcaagacta ctgtaaagtg 3120
gttccaaatg gcctagacat tctcaagtgc cctgtctcca gaatgtatcc tacagatgat 3180
tctgttcctt tgtcggccgg cacagtggat cagccattgt ttgaagtaat acaagaagct 3240
atgcagaggc acatgcaggg catacagttc cgagaaagga atgctggtcc acagatagat 3300
cgaaacatga aggatgaagg ttttaatata actgtagggg ttgatgaaga aacaggattt 3360
gtttatggag gaaatcgctt caattgcggc acatggatgg ataaaatggg agaaagtgac 3420
agagctagaa acagaggaat cccagccact ccaagagatg gatctgctgt ggaaattgtg 3480
ggcctaagta aatctgccat tcgctggttg ctggaattat ctaaaaaaaa tatttttcct 3540
tatcatgaag tcacagtaaa aagagatgga aaggttgtga cagtctcata tgatgagtgg 3600
aacagaaaaa tacaagacaa ctttgaaaag ctattttatg tgtccgaaga cccttcagac 3660
tttaatgaaa agaatccaaa tctggttcac aaacgtggta tatacaaaga cagttatgga 3720
gcttcaagcc cttggtgtga ctatcagctc aggcctaatt ttaccatagc aatggttgta 3780
gcccctgagc tctttactac agaaaaagca tggaaagctt tacaggtggc agaaaaaaaa 3840
ttgcttggtc cccttggcat gaaaactttg gatccagatg atatggttta ctgtggagtt 3900
tatgacaatg ccttagacaa tgacaactac aatcttgcga aaggtttcaa ttatcatcaa 3960
ggacctgagt ggctttggct cattgggtat tttcttcgtg caaaattata tttttccaaa 4020
ttaatgggtc cagagacgaa tgcaaagact atttttttgg ttaaaaatgt tctttcccgg 4080
cactatgttc atcttgagag tctggcttgt tttgccctca ccactctgct gcagctgctc 4140
aacaagatcc tttctgcttc ccagatccca tga 4173
<210> 34
<211> 3759
<212> DNA
<213> Cercocebus atys
<400> 34
atgaattcca tccgaaaaat gatttgggag gatatttttc caaagcttaa actctgggaa 60
tttttccaag tagacgtcaa caaaaaaaaa aaaaaaaaaa aaagacttct tacacaagaa 120
aataggagag taaccaagtc tgatccacac caacatctta agattattca agatcctgaa 180
tacagacgat ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 240
gacaatgggc cagcagcaat tgaagaatgc tgtaattggt ttcgtaagag aattgaggaa 300
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 360
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 420
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagaaat ggacttctcc 480
gtggaagaat ctatgattca tctcccaaat aaagcttgtt ttctgatggc acacaatgga 540
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac caggctcaga agtttaccta 600
aggagagaac ttatttgctg gggagacagt gttaaattgc gctatgggaa taaaccagag 660
gactgtcctt ttctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 720
cagggagtac gtcttgataa ctgccactca acacctcttc atgtagctga gtacatgttg 780
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 840
gaagatctgg acaatatctt tgttactaga ctgggcatta gttccttaat aagagaggca 900
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 960
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccttg 1020
tttatggata ttacccatga taatgagtgt cctattgtgc atagatcagc atatgatgct 1080
cttccaagta ctacaattgt ttctatggcg tgttgtgcta gtggaagtac aagaggctat 1140
gatgaattag tgcctcatca gatttcagtg gtttctgagg aacggtttta cactaagtgg 1200
aatcctggag cattgccttc aaatacaggt gaagttaatt tccaaagcgg cattattgca 1260
gccaggtgtg ctatcaataa gcttcatcag gagcttggag ccaagggttt tattcaggtg 1320
tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1380
cagtctgttg tggctgtatc tagaactgct ttcaggaatc ccaagacttc attttacagc 1440
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 1500
actattgaga gaaatacgaa accttacagg aaggatgaga attcaatcaa tggaatgcca 1560
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 1620
gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 1680
tctccaggaa gcgttattat attcagagtt agtcttgatc cacacgcaca agtcgctgtt 1740
ggaattcttc gaaatcatct gacccaattc agtcctcact ttaaatctgg gagcctagct 1800
gttgacaatt cagatcctat attaaaaatt ccctttgctt ctattgcctc caaattaact 1860
ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 1920
gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 1980
tctgtattgg cagaaataag accaaagaat gacttgggcc atcctttttg taataatttg 2040
agatctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2100
attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2160
taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2220
atagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2280
tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2340
cctgcactaa cgggtgtacc ttatagatta aatgagatca caaaagaaaa ggagcaatgt 2400
tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 2460
agggatactt ttattgcact tagaggcata ctgctgatta ctggacgcta tgtagaagcc 2520
aggaatatta ttttagcatt tgctggtacc ctgaggcatg gtctcattcc taatctactg 2580
ggtgaaggaa cttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 2640
atccaggatt actgtaaaat ggttccaaat ggtctagaca ttctcaagtg tccagtttcc 2700
agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 2760
tttgaagtca tacaggaagc aatgcaaaga cacatgcagg gcatacagtt ccgagaaagg 2820
aatgctggtc ccaagataga tcgaaacatg aaggatgaag gttttaatgt aactgcagga 2880
gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 2940
gataaaatgg gagaaagtga cagagctaga aacacaggaa tcccagccac accaagagat 3000
gggtctgctg tggaaattgt gggactgagt aaatctgctg ttcgctggtt gctggaatta 3060
tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggttgta 3120
aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3180
gtttcagaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3240
atatacaaag atagttatgg agcttcaagt ccctggtgtg actatcagct caggcctaat 3300
tttactatag caatggttgt ggcccctgag ctctttacta cagcaaaagc atggaaagct 3360
ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 3420
gatatggttt actgtggaat ttatgacaat gcattagaca atgacaacta caatcttgca 3480
aaaggtttca attatcacca aggacctgag tggctgtggc ctattggata ttttcttcgt 3540
gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 3600
gttaaaaatg ttctttcccg acactatgtt catcttgaga gatccccttg gaaaggactt 3660
ccagaactga ccaatgagaa tgcccaatac tgtcctttca gctgtgaaac acaagcctgg 3720
tcaatttcta ctattcttga gacactttat gatttatag 3759
<210> 35
<211> 3351
<212> DNA
<213> Ornithorhynchus anatinus
<400> 35
atgtttgaag gcagagcgga aggagtcgtt ggagagtact ttacttttcc gtatggagaa 60
atgacttctg tagaagaaga atctttgatg catcaacctg aaaaagcttg ttttttcatg 120
gcccataatg gttgggtcat gggagatgat ccattgagaa attttgctga gccagggtca 180
gatgtttacc tcaggagaga gcttgtttgc tggggagaca gtgttaaatt acgttatgga 240
aataaaccag aagactgccc ttacctctgg gcccacatga aaaaatatac tgaaataact 300
gccaagtatt ttcaaggagt gcgtcttgac aactgccact cgacacctct tcacgtagct 360
gagtatatgc tggatgctgc taggaaattg cagcccaatt tgtatgtagt ggctgagctg 420
ttcacaggaa gtgaggagct ggacaatatc tttgtgacta gactgggcat tagctcctta 480
ataagagaag ctatgagtgc atataatagc catgaagaag gcagattagt gtaccgcttt 540
ggaggagagc cagtgggatc tttcgttcag ccgtgtttga gacctttgat gccagctatt 600
gcacatgctc tgtttatgga tatcactcat gataacgaat gtcctattgt gcatcgatca 660
gcatatgatg ctcttccgag ctccaccata gtttccatgg cttgctgtgc tagtggaagt 720
actaggggct atgatgaatt agtacctcat cagatttctg tagtttctga agaacggttt 780
tataccaagt ggaacccagc agctactcta tcaaacccat ctgaagttaa tctccagact 840
ggaattatag caggaagacg tgccataaat aagctgcacc aagaacttgg agctaaaggt 900
tttattcagg tttatgtgga tcaggttgat gaagacatag tagcagtgac gagacactgt 960
cctagctctc accagtccgt agtggccgtg tctcgcactg cttttagaaa ccccaagact 1020
tctgcttaca gcaaagaagt gccgcagatg tgcatcccag gtaaaattga agaagtagtt 1080
cttgaggcca gaactgttga aagaaatgtt ggttcctacg taaaggatgc aaaatccatc 1140
aatggaatgc ccgacatcac agtagaaatt agagaacaca tccagcttaa tgaaagtaaa 1200
attgtaaaac aagctggagt tgccacaaaa ggtcttcatg aatatgtcca agaaatagaa 1260
tttgaaaatt tgaccccagg aagtgttatt atatttcgag taagccttga tccacacgca 1320
caagtggctg ttggaatact tcggaatcac ctgacacaat tcagtcctaa ttttaaaatt 1380
ggaagccttc ctgttgacaa ttcagatcct atattaaaaa ttccttttgc ttctatttca 1440
tctaaattaa ctttagctga cctaaatcaa ttactctacc gatgtgagtc agaagaacaa 1500
gaagatggtg gaggatgtta tgatgtacca aactggtcac ccctcaaata tgggggcctt 1560
caaggattaa tgtcagtaat ggctgaaatt aggccaaaga atgacttggg acatcctttt 1620
tgcaataatt tgcgatctgg agattggatg attgattatg tcagtaatcg actgatttcg 1680
cgctcaggat ctattgctga agttggtaaa tggttccaag ctatgttctt ctatctaaag 1740
cagattccac gttaccttat cccttgttat tttgatgcta tattaattgg tgcgtacacc 1800
actcttctgg atatagcctg gaagcagatg tcaagctttg tccagaatgg ttcaacattt 1860
gtaaaacacc tgtcattggg ttcagttcaa atgtgcggga taggaaagtt cccatctctg 1920
ccttttcttt ctccatcact tggtgatgtt ccctatagac tgaatgaaat tacacaggaa 1980
aaggaacagt gctgtgtttc tctagctgct gggttacctc atttttcatc tggaattttt 2040
cgctgctggg gaagagatac cttcatagca cttagaggtc tactgctaat tactggtcgc 2100
tttttagagg caaggaacat aattctagca tttgctggta ctctgagaca tggtcttatt 2160
cccaatcttc tcggccaggg gacgtatgcc agattcaatt gtcgagatgc agtgtggtgg 2220
tggcttcagt gtattcagga ttactgtaaa attgttccaa agggcacgga cattctcaag 2280
tgccccgtat ccagaatgta tccatcagat gactcttctg ctctaccagc cggcacattg 2340
gatcagccat tgtatgaagt aatacaggaa gctatgcagc gtcatatgca aggcatacag 2400
ttccgagaaa agaatgctgg tccacagatt gaccggaata tgaaggatga aggttttaat 2460
gtcactgcag gagttgatga tgaaagtggg tttgtttatg gaggcaatca cttcaactgt 2520
ggaacatgga tggataaaat gggagagagt gacagaggtc gcaacagagg aatcccagct 2580
acacccagag atgggtctgc tgtggaaatt gttggcctga gtaaatcaac tgttcgctgg 2640
ttggtagaat tatcgaaaaa aaatgtgttc ccttatcacg gagttacagt aaagagaaat 2700
gaaaaagagg tattaatcac atacgatgaa tggaacagga aaatccaaga ccactttgaa 2760
aagctattct atgtttcaga ggatccatca gatactaatg aaaagcatcc taatttggtt 2820
cataagcgtg gtatatacaa agatagctat ggagcttcaa gtccttggtg tgactaccag 2880
ctcaggccaa actttaccat agcaatggtt gtggctcctg aactctttac tcctcagaag 2940
gcatggaaag ctttggaaat agcagagaag aaattgcttg gtcccctggg catgaaaact 3000
ctggatccag atgatatggt gtactgtgga gtatatgata atgccctaga caatgacaac 3060
tacaaccttg ctaaaggttt taattaccac caaggacctg aatggttgtg gcctgttgga 3120
tattttcttc gtgcaaagtt atatttttcc aagttaatgg gtcaggaaac ttacacaaag 3180
actgtgtttt tgattaaaaa tgttctttcc cgtcattacg tccatcttga gagatcccct 3240
tggaaagggc ttccagagct gactaatgaa aatggacaat actgttcttt cagctgtgaa 3300
acacaggctt ggtcaattgc cgttattctt gaaactcttt atgatttatg a 3351
<210> 36
<211> 3915
<212> DNA
<213> Anas platyrhynchos
<400> 36
atgcatccag aatgtggcta taaccttgta aattcccctc acctgaagcc agcttgggtc 60
ttagatagag ctctgtggca cttgacctgt atggtggctg atggaaagtg tattgataaa 120
ggggtccctc cgttgattga aaatgatcac cacctgaatt gtgtccgtaa aataatttgg 180
gaagagatat atccaaaaat taaactgtgg gaatttttcc aagtggatgt taataaagct 240
gtggaacaat ttagaaccct tctaactcaa ggtaaagaaa gcaaaatgag cactaaatct 300
gatccaaatc aacatcttca gatagttcag gaccctgagt atagacgatt tggctgtact 360
gtagatatga atatagcatt ggcaaccttc ataccgcaca gcaatggacc aggtgcaata 420
gaagagtgtt gtaactggtt tcgcaagagg attgaggaac tgaatgctga gcaacacaga 480
cagattcatc accatcaaga gcaggcagtc aactgtcttg cggggactgt ggtttatgaa 540
cgactggctg gtcatggtcc taaactgggt cctattagta gaaaatatcc tttagttacc 600
aggtatttta cttacccatt caaagacatg actgtggagg aagaagaagc tatgatacat 660
cgcccagata aagcttgcta tttcatggcc cataatggat gggttatggg cgatgatcct 720
cttagaaact ttgcagaacc aggttcaaat gtttacttga gaagggagct tatttgctgg 780
ggagacagtg tgaaactgcg ttatgggaac aaacctgaag actgcccata cctctgggca 840
catatgaaaa aatacacaga aatcacagcc aaatatttcc atggcgttcg tcttgacaac 900
tgtcactcaa cacctattca tgtagctgag tacatgctgg acacagctag aaaattgcga 960
gcagatttgt ttgtagtggc tgaactgttc acaggaaatg aggagctgga caatatcttt 1020
gtgaataggc tgggcattac ctccttaata agagaggcaa tgacagctta taatagccat 1080
gaggagggaa ggttagttta tcgttttgga ggtgaacctg ttggctcttt tgttcagcca 1140
cgtttgagac ccctgatgcc agctattgct catgcactgt tcatggatat tacacatgat 1200
aatgagtgtc cgatccagca ccgatctgca tatgatgctc ttcccagtgc aatgattgtt 1260
tccatggcat gctgtgctac aggtagcacc aaaggttatg atgaacttgt accacaccag 1320
atatccgtag tatccgaaga gagattttat tcaacatgga atccagcagc acacctgact 1380
tctggtgaag ttaatttcca aacaggaatt ctagcaggaa ggctggccat aaacaggctg 1440
catcaggagc tgggagctaa aggttttaat caggtgtatg tagatcaagt tgatgaagat 1500
atagtggcag tgacaagaca ttgccctaat acacaccagt ctgttgtggc tgtaagtaga 1560
actgctttca gagatccaaa gacttccttc tacagtaaag aagtgcctga aatgtgtatc 1620
ccagggaaaa ttgaagaagt agtacttgag gctagaacca ttgagagaaa tactaatcct 1680
tacaaaaaag atgaacgttt tataaatgga ttgcctaact tcacagtgga actcagagag 1740
cacattcaga ttaaagacag taaaattata aagcaagctg gaactgccat aaaagggcca 1800
aatgaatttg ttcaagaaat agaatttgaa aatttaacac caggaagtgt aatagtattc 1860
agagttagtc ttgatccaaa ggcacaagag gctgttggtg tactccgtag tcatctgatc 1920
cagtttagtc ctcactttaa atctggaagt cttcctgatg atcattcagc acccatatta 1980
aaaacattat tttcttcaat tgcatctaaa ttaagtttgg ctgacctaaa tcaagtgctg 2040
tataggtgtg aggcagaaga acaagaagat ggtggaggct gttacaatat accaaactgg 2100
tcaccgttga agtatgcagg cctccaaggg ttaatgtcag taatggcaga cattagacca 2160
aagaatgatt tgggccaccc gttttgtgat aatttaagat ctggagattg gatgattgat 2220
tatgtcagca atcgtctgat ttcacgtact ggagcctgtg cagaagttgg taaatggttg 2280
aaggccatgt ttatctattt aaagaaaatt ccacgttacc ttatcccatg ttattttgat 2340
gccatattag tgggtgcata cacaacgctt ctggatgtgg gatggcatca gatgtctagc 2400
tttgtgcaga acggatcaac atttgttaaa cacctttcct tgggctcaat ccagatgtgt 2460
gggataggaa aatactcatg tttgcccgat ctgtctcctt ccttacatga tgttccctat 2520
agactgaatg agattacaaa tgagaaagaa cagtgttgtg tttctttggc agctggttta 2580
cctcactttt cttcagggat ttttcgctct tggggaaggg atacctttat tgcactgaga 2640
ggtctgatgt tagttacagg gcgttatcta gaagcaagaa acataatttt agcatttggt 2700
gggactttaa gacatggtct cattcccaac ctgctcggcc aggggacgca tgccagatac 2760
aactgtcgtg atgctgtatg gtggtggctt cagtgtatcc aggactactg taaaattgtt 2820
ccaaatggat tagacattct cagatgtcct gtttccagaa tgtacccaag agatgactct 2880
tctcctcaac ctgcaggcag tgtggatcag ccgctttatg aagtaataca ggaagcaatg 2940
caacgacaca tggaaggcat aaatttccga gaaaggaatg ccggcccaca gatagatcaa 3000
aacatgagag atgaaggttt taatgtaaca gcgggtgttg accgtgaaac tggctttgtc 3060
ttcggaggga accgtttcaa ttgtggcacc tggatggata aaatggggga gagtgacaga 3120
gctcgcaaca gaggaattcc tgctactccg agagatggct ctgctgtgga aattgttggc 3180
ttgtgcaagt caactgtacg ctggcttctg gatttgtcta ggaaaaatga gtttccattc 3240
catggagtca ccataaaaag acacggaaag gaggaaacta tcacatatga tgaatgggac 3300
agaaaaattc aagcacactt tgaaaagctc ttctttgtct ctgagaaccc agcagatcca 3360
aatgaaaaac atccaaatct tgttcacaaa cgtggaatct ataaagacag ctatggagct 3420
tcaagtccat ggtgtgatta ccaactcaga ccaaatttta caatagcaat ggttgtggca 3480
cctgagttgt tcacacctga gagagcttgg aaagctctgc agatagcaga ggaaaaacta 3540
cttggtccgt taggcatgaa aactttagac ccagatgata tggtgtactg tggagtatat 3600
gataatgctc ttgacaatga caactataat gtagccagag gttttaatta tcaccaagga 3660
cctgaatggc tgtggccaat tggatatttc cttcgtgcca aattgtactt ctcaaagcta 3720
attggtccac agatatacgc aaaaactgta gttatgataa agaatgtgct ttctcgccac 3780
tatgttcacc ttgaaaggtc atcctggaaa gggcttccag agctgaccaa tgaaaatgga 3840
caatattgcc ctttcagctg tgaaactcag gcctggtcaa ttagtgttat ccttgaaatc 3900
ctttatgatt tgtga 3915
<210> 37
<211> 4599
<212> DNA
<213> Homo sapiens
<400> 37
atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60
accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120
ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180
aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240
tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080
gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320
atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680
gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860
tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920
cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980
gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 2040
aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 2100
gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160
tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220
cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2280
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340
actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2400
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460
gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2520
tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580
ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640
gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 2700
ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 2760
gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 2820
tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2880
aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2940
attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 3000
taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 3060
acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 3120
tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 3180
cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 3240
tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 3300
agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 3360
aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 3420
ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 3480
atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 3540
agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 3600
tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 3660
aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 3720
gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 3780
gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3840
gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3900
tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3960
aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 4020
gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 4080
atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 4140
tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 4200
ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 4260
gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 4320
aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 4380
gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 4440
gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 4500
ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 4560
tcaattgcta ctattcttga gacactttat gatttatag 4599
<210> 38
<211> 4599
<212> DNA
<213> artificial
<220>
<223> hGDE co1
<400> 38
atgggccata gtaaacagat tcgcatactc ctcttgaacg agatggagaa actggagaag 60
acattgtttc ggttggagca ggggtacgag ctccagtttc gcctgggacc gacgctccaa 120
ggcaaagctg tgactgtata cacgaactat ccattcccgg gggagacgtt taacagggag 180
aagtttaggt ccctggactg ggagaaccca accgaacgag aggacgattc cgataaatat 240
tgcaagctca acttgcagca aagtggcagc tttcaatatt actttctcca aggcaatgag 300
aaaagtgggg gggggtatat tgttgtcgat ccaatactgc gcgtaggggc agataatcac 360
gttctcccgc tggattgcgt cactctccag acattcttgg ctaaatgctt ggggccgttt 420
gatgaatggg agtctcgctt gcgagtggcc aaagagtcag gttataacat gattcacttc 480
acaccactcc agacattggg acttagtcgg agctgttact cactcgcaaa tcaattggag 540
cttaacccag acttcagtcg gccaaatcgg aagtacacgt ggaacgacgt tggacaactt 600
gtcgaaaagt tgaagaaaga gtggaatgtg atttgcatca ctgacgtggt gtacaatcac 660
accgcagcca acagcaagtg gattcaggag cacccagagt gtgcgtacaa cctggtgaac 720
tcacctcacc tcaaacccgc ctgggtgctc gatagggctt tgtggcgctt ttcttgcgac 780
gtagcggaag gaaagtataa agagaaagga atacccgccc tcatagaaaa cgatcatcac 840
atgaattcta tacggaaaat catctgggag gatatatttc cgaaacttaa actttgggag 900
ttctttcaag tagatgtaaa caaggcggtg gagcaattca ggaggctcct cacccaagag 960
aatcgccggg ttactaaatc tgacccgaat caacacctta caataatcca agatccggaa 1020
tacaggaggt ttggttgcac tgtcgatatg aatattgcgc ttactacgtt catcccccac 1080
gacaagggcc cggccgcaat agaagaatgc tgcaattggt tccacaagcg gatggaagaa 1140
ctgaactctg aaaagcaccg ccttataaat tatcaccaag agcaggctgt gaactgtctg 1200
ctcggtaacg ttttttacga gcgcctggcc ggacacggac ctaaactcgg gccagtcact 1260
cgaaaacacc cactggttac gcgatacttc acattcccgt tcgaggagat cgacttttct 1320
atggaggaat ctatgatcca cctcccaaat aaagcttgtt ttcttatggc gcacaacgga 1380
tgggttatgg gggacgaccc actgcgaaac ttcgcagaac cgggtagtga ggtctacctt 1440
aggcgcgagc tcatttgttg gggcgacagc gtcaagctcc ggtatggaaa taagccagag 1500
gattgccctt acttgtgggc acacatgaag aagtatacgg aaataacagc tacctacttc 1560
cagggggtac gactggataa ctgccactcc acaccgttgc acgtggccga gtatatgctc 1620
gacgctgcgc gcaatttgca gccaaatctg tacgtcgtgg cagagctttt cactggaagt 1680
gaggacttgg ataacgtctt tgtgactcgc ctgggaatta gtagcttgat aagggaggct 1740
atgtccgcgt acaacagtca cgaggaagga cgattggttt atcgatatgg gggcgagcct 1800
gtaggctcct ttgtgcaacc ctgcttgcgg ccccttatgc ccgctatagc acacgcgctc 1860
ttcatggata tcacgcacga taatgaatgc cccatagtac acagatccgc ctacgacgcc 1920
cttccatcta cgacaatcgt ctctatggcc tgctgcgcct ccggcagcac tagaggctac 1980
gacgaactcg tcccacacca gatttcagtg gtatcagagg aacggtttta cactaaatgg 2040
aaccctgagg cgctcccatc taatactggc gaagtaaatt tccagtccgg aatcattgcg 2100
gcccgctgtg ctatctccaa gttgcatcag gaacttggag ctaaaggttt cattcaagta 2160
tatgtcgatc aggtcgatga agatattgtg gctgtgaccc gacactcccc atcaattcat 2220
caaagtgtag tggctgtaac tcggacggct tttcgcaacc caaagacttc attctactcc 2280
aaagaggttc cacagatgtg tattccggga aagatagaag aagtggtatt ggaagcccgg 2340
accatcgaga ggaacactaa accatatcga aaagacgaga actccattaa cggaacccct 2400
gacatcactg ttgagatccg cgagcatatt cagcttaacg aaagcaaaat cgttaagcag 2460
gccggcgttg ccactaaggg accaaacgaa tatatccaag aaatcgaatt cgaaaacctc 2520
agtcctggct ccgttattat ctttcgcgta tccctcgacc cacacgccca agttgcggta 2580
gggatcttga gaaaccacct cacacagttc agcccacact ttaaatcagg ctccctcgcc 2640
gttgataacg cggacccaat acttaagatc ccctttgcat cccttgcgta tcgacttact 2700
ctcgcagagc ttaatcaaat attgtaccgc tgcgagtccg aagagaagga agacggtggt 2760
ggctgctacg acatccctaa ttggagtgca cttaagtacg cggggctgca gggactgatg 2820
tcagtgcttg cagagataag gccgaagaat gaccttggcc atccattttg taataatctc 2880
cgaagtggtg attggatgat agattacgta tcaaaccgct tgatcagtcg gtctggtacc 2940
atcgcggaag tgggaaagtg gttgcaggca atgttctttt atctcaaaca aatcccacgg 3000
tacttgatac cttgctattt cgacgcaatt ctcatcggtg catacacgac cttgctggac 3060
acggcctgga agcagatgtc tagcttcgtt cagaacggtt ctaccttcgt aaagcacctc 3120
tcattgggtt cagtccaact ctgcggagtc gggaaattcc cttcacttcc tattctctca 3180
cctgccctca tggacgtgcc ctaccggctg aacgaaatta ctaaggagaa ggaacagtgt 3240
tgtgtttctt tggcggcagg cttgccgcac ttttccagtg gaatcttcag atgttgggga 3300
cgggacacat tcattgcgct ccggggtatt ttgttgataa cgggccgata cgttgaggca 3360
cgaaatatta ttctggcatt cgccgggacc ttgcggcacg ggctgatacc caacctgctg 3420
ggcgaaggga tttacgctcg ctataactgc cgagacgcag tttggtggtg gctgcagtgt 3480
attcaggact attgtaagat ggtaccgaac gggctcgaca tcttgaagtg tcccgttagt 3540
cgaatgtatc ccaccgacga ttcagctccc ctgcccgcgg gaacacttga ccaaccactc 3600
tttgaagtga tccaagaggc tatgcagaaa cacatgcagg gaatacagtt ccgagaacga 3660
aacgcagggc cgcagattga tcgaaatatg aaagacgaag gatttaatat cacggcaggg 3720
gtcgacgaag agacggggtt tgtctacggc gggaatagat ttaactgcgg cacctggatg 3780
gataaaatgg gagaaagtga ccgagcacgg aaccggggca taccagcaac cccccgagac 3840
gggagcgctg ttgagatcgt gggtctgtct aagagtgcgg ttcgctggct tctcgagctt 3900
tcaaaaaaaa atatatttcc ttaccacgag gtcacggtca aaaggcatgg aaaagccata 3960
aaagtgtcat acgacgagtg gaataggaaa atacaagata actttgaaaa gctgtttcac 4020
gttagcgaag atcccagcga tctcaacgaa aaacatccca atctggttca caaacgcggg 4080
atctataaag actcatatgg agctagttct ccttggtgcg attatcaact gagaccgaac 4140
tttacaatcg ccatggtagt tgcgcccgag ctctttacta cagaaaaagc ctggaaggca 4200
cttgagattg cggaaaagaa actgcttggc cctctcggga tgaaaacgct tgatcccgac 4260
gacatggtct attgcgggat ttacgacaac gcattggaca acgacaacta caacttggcg 4320
aaaggattta attatcacca gggtcctgag tggttgtggc ccattggata ctttcttcga 4380
gcgaagctgt atttttcaag gctgatgggg ccggaaacga cagcgaaaac tattgtgctt 4440
gtcaaaaacg tgcttagcag gcattacgtg cacctcgagc gcagcccttg gaaaggactt 4500
ccggagctta cgaacgaaaa cgcccagtat tgtccattta gctgtgagac gcaggcctgg 4560
tctattgcta ccatcctcga gacactctac gacttgtag 4599
<210> 39
<211> 4599
<212> DNA
<213> artificial
<220>
<223> hGDE co2
<400> 39
atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60
accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120
ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180
aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240
tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300
aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360
gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420
gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480
acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540
ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600
gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660
accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720
agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780
gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840
atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900
ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960
aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020
tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080
gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 1140
ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 1200
ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1260
agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1320
atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1380
tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1440
agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1500
gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1560
cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1620
gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1680
gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1740
atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1800
gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1860
ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1920
ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1980
gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 2040
aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 2100
gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 2160
tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 2220
cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2280
aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2340
accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2400
gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2460
gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2520
agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2580
ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2640
gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctggccta cagactgaca 2700
ctggctgagc tgaaccagat cctgtacaga tgcgagtccg aagagaaaga ggatggcgga 2760
ggctgctacg acatccccaa ttggagcgcc ctgaagtatg ccggactgca gggactgatg 2820
tctgtgctgg ccgagatcag acccaagaac gacctgggac accccttctg caacaacctg 2880
agatccggcg actggatgat cgactacgtg tccaacagac tgatcagcag atccggcaca 2940
atcgccgaag tcggcaaatg gctgcaggcc atgttcttct acctgaagca gatccctcgg 3000
tatctgatcc cctgctactt cgacgccatc ctgatcggcg cctacaccac actgctggat 3060
accgcctgga agcagatgtc cagcttcgtg cagaacggca gcaccttcgt gaagcacctg 3120
tctctgggaa gcgtgcagct gtgtggcgtg ggcaaatttc ccagcctgcc tatcctgtct 3180
cctgcactga tggacgtgcc ctaccggctg aatgagatca ccaaagaaaa agagcagtgc 3240
tgcgtcagcc tggctgctgg cctgcctcat ttttccagcg gcatcttccg gtgttggggc 3300
agagacacct ttattgccct gagaggcatc ctgctgatta ccggcagata cgtggaagcc 3360
cggaacatca tcctggcctt tgccggcaca ctgcggcacg gactgattcc taatctgctc 3420
ggcgagggca tctacgccag atacaactgc agagatgccg tgtggtggtg gctccagtgc 3480
atccaggact actgcaagat ggtgcccaac ggcctggaca tcctgaagtg ccctgtgtcc 3540
agaatgtacc ctaccgacga tagcgcccct ctgcctgccg gaacacttga ccagcctctg 3600
ttcgaagtga ttcaagaggc catgcagaaa cacatgcagg gaatccagtt tcgcgagcgg 3660
aatgccggac ctcagatcga cagaaacatg aaggatgagg gcttcaacat caccgctggc 3720
gtggacgaag agacaggctt tgtgtacggc ggcaaccggt tcaattgcgg cacctggatg 3780
gacaagatgg gcgagtctga ccgggccaga aacagaggaa ttcccgccac acctagagat 3840
ggcagcgctg tggaaatcgt gggcctgtct aagtctgctg tgcggtggct gctcgaactg 3900
agcaagaaga atatctttcc gtaccacgaa gtgaccgtga agcggcacgg caaggccatc 3960
aaggtgtcct acgacgagtg gaacagaaag atccaggaca acttcgaaaa gctgttccat 4020
gtgtctgagg accccagcga cctgaacgaa aagcacccca acctggtgca caagcgcggc 4080
atctacaagg acagctacgg cgcctcttct ccttggtgcg attaccagct gcggcccaac 4140
ttcaccattg ccatggtggt tgcccctgag ctgttcacca cagagaaggc ctggaaggcc 4200
ctggaaatcg ccgagaagaa actgctgggc cctctgggca tgaagacact ggaccccgac 4260
gacatggtgt actgcggaat ctacgacaac gccctggata acgacaacta caatctggcc 4320
aaggggttca attaccatca gggacccgag tggctgtggc ctatcggcta tttcctgcgg 4380
gccaagctgt acttctccag actgatgggc cctgagacaa ccgccaagac aatcgtgctc 4440
gtgaagaacg tgctgagccg gcactatgtg cacctggaaa gaagcccctg gaagggactg 4500
cccgagctga ccaatgagaa cgcccagtac tgccccttca gctgcgaaac acaggcctgg 4560
tctatcgcca ccatcctgga aaccctgtac gacctgtga 4599
<210> 40
<211> 1515
<212> PRT
<213> Homo sapiens
<400> 40
Met Ser Leu Leu Thr Cys Ala Phe Tyr Leu Gly Tyr Glu Leu Gln Phe
1 5 10 15
Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr Asn
20 25 30
Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser Leu
35 40 45
Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr Cys
50 55 60
Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu Gln
65 70 75 80
Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile Leu
85 90 95
Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr Leu
100 105 110
Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu Ser
115 120 125
Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe Thr
130 135 140
Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala Asn
145 150 155 160
Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr Thr
165 170 175
Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp Asn
180 185 190
Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn Ser
195 200 205
Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser
210 215 220
Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe
225 230 235 240
Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala
245 250 255
Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile Trp
260 265 270
Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp
275 280 285
Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn
290 295 300
Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln
305 310 315 320
Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala
325 330 335
Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu
340 345 350
Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys
355 360 365
His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu
370 375 380
Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly
385 390 395 400
Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro
405 410 415
Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro
420 425 430
Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp
435 440 445
Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg
450 455 460
Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn
465 470 475 480
Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr
485 490 495
Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His
500 505 510
Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn
515 520 525
Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu
530 535 540
Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile
545 550 555 560
Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val
565 570 575
Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu
580 585 590
Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr
595 600 605
His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu
610 615 620
Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr
625 630 635 640
Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu
645 650 655
Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr
660 665 670
Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile
675 680 685
Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr
690 695 700
Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro
705 710 715 720
Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn
725 730 735
Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro
740 745 750
Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn
755 760 765
Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp
770 775 780
Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile
785 790 795 800
Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln
805 810 815
Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg
820 825 830
Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn
835 840 845
His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val
850 855 860
Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr
865 870 875 880
Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser
885 890 895
Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser
900 905 910
Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu
915 920 925
Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg
930 935 940
Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg
945 950 955 960
Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe
965 970 975
Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala
980 985 990
Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln
995 1000 1005
Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu
1010 1015 1020
Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser
1025 1030 1035
Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu
1040 1045 1050
Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala
1055 1060 1065
Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly
1070 1075 1080
Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly
1085 1090 1095
Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr
1100 1105 1110
Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr
1115 1120 1125
Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys
1130 1135 1140
Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu
1145 1150 1155
Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro
1160 1165 1170
Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln
1175 1180 1185
Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg
1190 1195 1200
Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe
1205 1210 1215
Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly
1220 1225 1230
Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu
1235 1240 1245
Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp
1250 1255 1260
Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg
1265 1270 1275
Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu
1280 1285 1290
Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp
1295 1300 1305
Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His
1310 1315 1320
Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu
1325 1330 1335
Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser
1340 1345 1350
Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met
1355 1360 1365
Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala
1370 1375 1380
Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys
1385 1390 1395
Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn
1400 1405 1410
Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr
1415 1420 1425
His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg
1430 1435 1440
Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala
1445 1450 1455
Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val
1460 1465 1470
His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn
1475 1480 1485
Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp
1490 1495 1500
Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1505 1510 1515
<210> 41
<211> 1516
<212> PRT
<213> Homo sapiens
<400> 41
Met Ala Pro Ile Leu Ser Ile Asn Leu Phe Ile Gly Tyr Glu Leu Gln
1 5 10 15
Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr
20 25 30
Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser
35 40 45
Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr
50 55 60
Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
65 70 75 80
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
85 90 95
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
100 105 110
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
115 120 125
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
130 135 140
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
145 150 155 160
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
165 170 175
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
180 185 190
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
195 200 205
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
210 215 220
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
225 230 235 240
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
245 250 255
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
260 265 270
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
275 280 285
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
290 295 300
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
305 310 315 320
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
325 330 335
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
340 345 350
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
355 360 365
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
370 375 380
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
385 390 395 400
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
405 410 415
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
420 425 430
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
435 440 445
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
450 455 460
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
465 470 475 480
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
485 490 495
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
500 505 510
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
515 520 525
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
530 535 540
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
545 550 555 560
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
565 570 575
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
580 585 590
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
595 600 605
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
610 615 620
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
625 630 635 640
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
645 650 655
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
660 665 670
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
675 680 685
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
690 695 700
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
705 710 715 720
Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg
725 730 735
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
740 745 750
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
755 760 765
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
770 775 780
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
785 790 795 800
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
805 810 815
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
820 825 830
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
835 840 845
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
850 855 860
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala
865 870 875 880
Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu
885 890 895
Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp
900 905 910
Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala
915 920 925
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
930 935 940
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
945 950 955 960
Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe
965 970 975
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
980 985 990
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys
995 1000 1005
Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His
1010 1015 1020
Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro
1025 1030 1035
Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg
1040 1045 1050
Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu
1055 1060 1065
Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp
1070 1075 1080
Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr
1085 1090 1095
Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly
1100 1105 1110
Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile
1115 1120 1125
Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln
1130 1135 1140
Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile
1145 1150 1155
Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala
1160 1165 1170
Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile
1175 1180 1185
Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu
1190 1195 1200
Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly
1205 1210 1215
Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr
1220 1225 1230
Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly
1235 1240 1245
Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg
1250 1255 1260
Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val
1265 1270 1275
Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His
1280 1285 1290
Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr
1295 1300 1305
Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe
1310 1315 1320
His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn
1325 1330 1335
Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser
1340 1345 1350
Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala
1355 1360 1365
Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys
1370 1375 1380
Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met
1385 1390 1395
Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp
1400 1405 1410
Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn
1415 1420 1425
Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu
1430 1435 1440
Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr
1445 1450 1455
Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr
1460 1465 1470
Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr
1475 1480 1485
Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala
1490 1495 1500
Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1505 1510 1515
<210> 42
<211> 441
<212> DNA
<213> artificial
<220>
<223> HBB2 intron
<400> 42
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420
tggcccatca ctttggcaaa g 441
<210> 43
<211> 441
<212> DNA
<213> artificial
<220>
<223> modified HBB2 intron
<400> 43
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441
<210> 44
<211> 1438
<212> DNA
<213> artificial
<220>
<223> FIX intron
<400> 44
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 45
<211> 1438
<212> DNA
<213> artificial
<220>
<223> Modified FIX intron
<400> 45
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 46
<211> 881
<212> DNA
<213> artificial
<220>
<223> Chicken beta-globin intron
<400> 46
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 47
<211> 881
<212> DNA
<213> artificial
<220>
<223> modified chicken-beta globin intron
<400> 47
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 48
<211> 1518
<212> PRT
<213> artificial
<220>
<223> D1a + D2,3 hGDE
<400> 48
Met Glu Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu
1 5 10 15
Leu Gln Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val
20 25 30
Tyr Thr Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe
35 40 45
Arg Ser Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp
50 55 60
Lys Tyr Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr
65 70 75 80
Phe Leu Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp
85 90 95
Pro Ile Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys
100 105 110
Val Thr Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu
115 120 125
Trp Glu Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile
130 135 140
His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser
145 150 155 160
Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg
165 170 175
Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys
180 185 190
Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala
195 200 205
Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu
210 215 220
Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu
225 230 235 240
Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly
245 250 255
Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys
260 265 270
Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe
275 280 285
Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr
290 295 300
Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr
305 310 315 320
Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met
325 330 335
Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala
340 345 350
Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn
355 360 365
Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn
370 375 380
Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro
385 390 395 400
Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe
405 410 415
Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile
420 425 430
His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val
435 440 445
Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val
450 455 460
Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg
465 470 475 480
Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys
485 490 495
Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp
500 505 510
Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala
515 520 525
Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr
530 535 540
Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser
545 550 555 560
Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly
565 570 575
Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln
580 585 590
Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met
595 600 605
Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr
610 615 620
Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser
625 630 635 640
Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val
645 650 655
Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro
660 665 670
Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg
675 680 685
Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile
690 695 700
Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg
705 710 715 720
His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala
725 730 735
Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met
740 745 750
Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile
755 760 765
Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly
770 775 780
Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu
785 790 795 800
Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu
805 810 815
Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile
820 825 830
Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile
835 840 845
Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser
850 855 860
Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser
865 870 875 880
Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg
885 890 895
Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro
900 905 910
Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val
915 920 925
Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn
930 935 940
Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu
945 950 955 960
Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala
965 970 975
Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr
980 985 990
Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala
995 1000 1005
Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val
1010 1015 1020
Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys
1025 1030 1035
Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro
1040 1045 1050
Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val
1055 1060 1065
Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg
1070 1075 1080
Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu
1085 1090 1095
Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe
1100 1105 1110
Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu
1115 1120 1125
Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp
1130 1135 1140
Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu
1145 1150 1155
Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp
1160 1165 1170
Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu
1175 1180 1185
Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe
1190 1195 1200
Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp
1205 1210 1215
Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe
1220 1225 1230
Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys
1235 1240 1245
Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr
1250 1255 1260
Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser
1265 1270 1275
Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro
1280 1285 1290
Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val
1295 1300 1305
Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys
1310 1315 1320
Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His
1325 1330 1335
Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly
1340 1345 1350
Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr
1355 1360 1365
Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala
1370 1375 1380
Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu
1385 1390 1395
Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile
1400 1405 1410
Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly
1415 1420 1425
Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr
1430 1435 1440
Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu
1445 1450 1455
Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg
1460 1465 1470
His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu
1475 1480 1485
Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr
1490 1495 1500
Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1505 1510 1515
<210> 49
<211> 1503
<212> PRT
<213> artificial
<220>
<223> D1b1 + D2,3 hGDE
<400> 49
Met Leu Gln Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr
1 5 10 15
Val Tyr Thr Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys
20 25 30
Phe Arg Ser Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser
35 40 45
Asp Lys Tyr Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr
50 55 60
Tyr Phe Leu Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val
65 70 75 80
Asp Pro Ile Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp
85 90 95
Cys Val Thr Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp
100 105 110
Glu Trp Glu Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met
115 120 125
Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr
130 135 140
Ser Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn
145 150 155 160
Arg Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys
165 170 175
Lys Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr
180 185 190
Ala Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn
195 200 205
Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala
210 215 220
Leu Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys
225 230 235 240
Gly Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg
245 250 255
Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe
260 265 270
Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu
275 280 285
Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu
290 295 300
Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp
305 310 315 320
Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala
325 330 335
Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu
340 345 350
Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val
355 360 365
Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly
370 375 380
Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr
385 390 395 400
Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met
405 410 415
Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp
420 425 430
Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu
435 440 445
Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu
450 455 460
Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met
465 470 475 480
Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu
485 490 495
Asp Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp
500 505 510
Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe
515 520 525
Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile
530 535 540
Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu
545 550 555 560
Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val
565 570 575
Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe
580 585 590
Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala
595 600 605
Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala
610 615 620
Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser
625 630 635 640
Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu
645 650 655
Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala
660 665 670
Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe
675 680 685
Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr
690 695 700
Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr
705 710 715 720
Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln
725 730 735
Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr
740 745 750
Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn
755 760 765
Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn
770 775 780
Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn
785 790 795 800
Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val
805 810 815
Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly
820 825 830
Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly
835 840 845
Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala
850 855 860
Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr
865 870 875 880
Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile
885 890 895
Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser
900 905 910
Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys
915 920 925
Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg
930 935 940
Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln
945 950 955 960
Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys
965 970 975
Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr
980 985 990
Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val
995 1000 1005
Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys
1010 1015 1020
Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro
1025 1030 1035
Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val
1040 1045 1050
Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg
1055 1060 1065
Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu
1070 1075 1080
Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe
1085 1090 1095
Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu
1100 1105 1110
Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp
1115 1120 1125
Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu
1130 1135 1140
Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp
1145 1150 1155
Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu
1160 1165 1170
Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe
1175 1180 1185
Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp
1190 1195 1200
Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe
1205 1210 1215
Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys
1220 1225 1230
Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr
1235 1240 1245
Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser
1250 1255 1260
Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro
1265 1270 1275
Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val
1280 1285 1290
Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys
1295 1300 1305
Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His
1310 1315 1320
Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly
1325 1330 1335
Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr
1340 1345 1350
Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala
1355 1360 1365
Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu
1370 1375 1380
Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile
1385 1390 1395
Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly
1400 1405 1410
Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr
1415 1420 1425
Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu
1430 1435 1440
Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg
1445 1450 1455
His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu
1460 1465 1470
Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr
1475 1480 1485
Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1490 1495 1500
<210> 50
<211> 1452
<212> PRT
<213> artificial
<220>
<223> D1b2 + D2,3 hGDE
<400> 50
Met Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu
1 5 10 15
Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile
20 25 30
Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr
35 40 45
Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
50 55 60
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
65 70 75 80
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
85 90 95
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
100 105 110
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
115 120 125
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
130 135 140
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
145 150 155 160
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
165 170 175
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
180 185 190
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
195 200 205
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
210 215 220
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
225 230 235 240
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
245 250 255
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
260 265 270
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
275 280 285
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
290 295 300
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
305 310 315 320
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
325 330 335
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
340 345 350
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
355 360 365
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
370 375 380
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
385 390 395 400
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
405 410 415
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
420 425 430
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
435 440 445
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
450 455 460
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
465 470 475 480
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
485 490 495
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
500 505 510
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
515 520 525
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
530 535 540
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
545 550 555 560
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
565 570 575
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
580 585 590
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
595 600 605
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
610 615 620
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
625 630 635 640
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
645 650 655
Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg
660 665 670
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
675 680 685
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
690 695 700
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
705 710 715 720
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
725 730 735
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
740 745 750
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
755 760 765
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
770 775 780
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
785 790 795 800
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala
805 810 815
Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu
820 825 830
Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp
835 840 845
Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala
850 855 860
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
865 870 875 880
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
885 890 895
Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe
900 905 910
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
915 920 925
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys
930 935 940
Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu
945 950 955 960
Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu
965 970 975
Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu
980 985 990
Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu
995 1000 1005
Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr
1010 1015 1020
Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val
1025 1030 1035
Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His
1040 1045 1050
Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr
1055 1060 1065
Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp
1070 1075 1080
Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro
1085 1090 1095
Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala
1100 1105 1110
Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met
1115 1120 1125
Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly
1130 1135 1140
Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr
1145 1150 1155
Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg
1160 1165 1170
Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg
1175 1180 1185
Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala
1190 1195 1200
Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu
1205 1210 1215
Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val
1220 1225 1230
Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn
1235 1240 1245
Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu
1250 1255 1260
Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys
1265 1270 1275
Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys
1280 1285 1290
Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala
1295 1300 1305
Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile
1310 1315 1320
Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp
1325 1330 1335
Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp
1340 1345 1350
Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly
1355 1360 1365
Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu
1370 1375 1380
Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile
1385 1390 1395
Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu
1400 1405 1410
Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala
1415 1420 1425
Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala
1430 1435 1440
Thr Ile Leu Glu Thr Leu Tyr Asp Leu
1445 1450
<210> 51
<211> 1430
<212> PRT
<213> artificial
<220>
<223> D1b3 + D2,3 hGDE
<400> 51
Met Gly Gly Tyr Ile Val Val Asp Pro Ile Leu Arg Val Gly Ala Asp
1 5 10 15
Asn His Val Leu Pro Leu Asp Cys Val Thr Leu Gln Thr Phe Leu Ala
20 25 30
Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu Ser Arg Leu Arg Val Ala
35 40 45
Lys Glu Ser Gly Tyr Asn Met Ile His Phe Thr Pro Leu Gln Thr Leu
50 55 60
Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala Asn Gln Leu Glu Leu Asn
65 70 75 80
Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr Thr Trp Asn Asp Val Gly
85 90 95
Gln Leu Val Glu Lys Leu Lys Lys Glu Trp Asn Val Ile Cys Ile Thr
100 105 110
Asp Val Val Tyr Asn His Thr Ala Ala Asn Ser Lys Trp Ile Gln Glu
115 120 125
His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser Pro His Leu Lys Pro
130 135 140
Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe Ser Cys Asp Val Ala
145 150 155 160
Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala Leu Ile Glu Asn Asp
165 170 175
His His Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro
180 185 190
Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala Val
195 200 205
Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys
210 215 220
Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg
225 230 235 240
Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile
245 250 255
Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe
260 265 270
His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn
275 280 285
Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr
290 295 300
Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys
305 310 315 320
His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp
325 330 335
Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe
340 345 350
Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn
355 360 365
Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys
370 375 380
Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys
385 390 395 400
Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr
405 410 415
Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His
420 425 430
Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu
435 440 445
Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val
450 455 460
Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser
465 470 475 480
Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly
485 490 495
Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro
500 505 510
Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys
515 520 525
Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile
530 535 540
Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu
545 550 555 560
Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr
565 570 575
Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe
580 585 590
Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln
595 600 605
Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp
610 615 620
Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser
625 630 635 640
Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe
645 650 655
Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu
660 665 670
Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg
675 680 685
Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile
690 695 700
Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly
705 710 715 720
Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu
725 730 735
Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro
740 745 750
His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe
755 760 765
Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro
770 775 780
Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala
785 790 795 800
Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp
805 810 815
Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala
820 825 830
Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn
835 840 845
Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met
850 855 860
Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala
865 870 875 880
Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile
885 890 895
Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala
900 905 910
Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val
915 920 925
Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln
930 935 940
Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala
945 950 955 960
Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu
965 970 975
Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly
980 985 990
Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile
995 1000 1005
Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu
1010 1015 1020
Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu
1025 1030 1035
Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp
1040 1045 1050
Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn
1055 1060 1065
Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr
1070 1075 1080
Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu
1085 1090 1095
Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile
1100 1105 1110
Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met
1115 1120 1125
Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr
1130 1135 1140
Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met
1145 1150 1155
Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro
1160 1165 1170
Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser
1175 1180 1185
Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile
1190 1195 1200
Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile
1205 1210 1215
Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe
1220 1225 1230
Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu
1235 1240 1245
Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser
1250 1255 1260
Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn
1265 1270 1275
Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu
1280 1285 1290
Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly
1295 1300 1305
Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys
1310 1315 1320
Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala
1325 1330 1335
Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile
1340 1345 1350
Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly
1355 1360 1365
Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu
1370 1375 1380
Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu
1385 1390 1395
Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys
1400 1405 1410
Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr
1415 1420 1425
Asp Leu
1430
<210> 52
<211> 1404
<212> PRT
<213> artificial
<220>
<223> D1c + D2,3 hGDE
<400> 52
Met Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu
1 5 10 15
Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe
20 25 30
Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala
35 40 45
Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr
50 55 60
Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp
65 70 75 80
Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn
85 90 95
Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn
100 105 110
Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg
115 120 125
Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro
130 135 140
Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile
145 150 155 160
Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val
165 170 175
Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu
180 185 190
Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile
195 200 205
Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile
210 215 220
Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu
225 230 235 240
Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu
245 250 255
Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu
260 265 270
Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu
275 280 285
Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe
290 295 300
Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu
305 310 315 320
Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly
325 330 335
Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu
340 345 350
Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly
355 360 365
Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr
370 375 380
Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys
385 390 395 400
His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg
405 410 415
Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser
420 425 430
Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu
435 440 445
Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu
450 455 460
Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys
465 470 475 480
Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile
485 490 495
Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala
500 505 510
Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser
515 520 525
Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser
530 535 540
Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn
545 550 555 560
Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala
565 570 575
Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val
580 585 590
Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser
595 600 605
Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg
610 615 620
Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile
625 630 635 640
Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg
645 650 655
Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro
660 665 670
Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys
675 680 685
Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile
690 695 700
Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe
705 710 715 720
Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg
725 730 735
Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala
740 745 750
Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala
755 760 765
Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu
770 775 780
Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp
785 790 795 800
Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala
805 810 815
Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu
820 825 830
Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser
835 840 845
Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe
850 855 860
Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp
865 870 875 880
Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys
885 890 895
Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu
900 905 910
Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu
915 920 925
Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu
930 935 940
Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu
945 950 955 960
Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe
965 970 975
Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala
980 985 990
Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile
995 1000 1005
Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg
1010 1015 1020
Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys
1025 1030 1035
Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg
1040 1045 1050
Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu
1055 1060 1065
Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His
1070 1075 1080
Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile
1085 1090 1095
Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val
1100 1105 1110
Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys
1115 1120 1125
Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn
1130 1135 1140
Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile
1145 1150 1155
Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser
1160 1165 1170
Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His
1175 1180 1185
Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile
1190 1195 1200
Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser
1205 1210 1215
Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile
1220 1225 1230
Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln
1235 1240 1245
Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu
1250 1255 1260
Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys
1265 1270 1275
Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp
1280 1285 1290
Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn
1295 1300 1305
Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp
1310 1315 1320
Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser
1325 1330 1335
Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val
1340 1345 1350
Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro
1355 1360 1365
Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys
1370 1375 1380
Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu
1385 1390 1395
Glu Thr Leu Tyr Asp Leu
1400
<210> 53
<211> 4557
<212> DNA
<213> artificial
<220>
<223> D1a + D2,3 hGDE
<400> 53
atggaaaagc tggaaaagac cctgttccgg ctcgagcagg gctacgagct gcagtttaga 60
ctgggcccta cactgcaggg caaagccgtg accgtgtaca caaactaccc cttccctggc 120
gaaaccttca accgcgagaa gttcagaagc ctggactggg agaaccccac cgagagagag 180
gacgacagcg acaagtactg caagctgaac ctgcagcaga gcggctcctt ccagtactac 240
ttcctgcaag gcaacgagaa gtccggcgga ggctacatcg tggtggaccc tattctgaga 300
gtgggcgccg acaatcacgt gctgcctctg gattgtgtga ccctgcagac cttcctggcc 360
aagtgtctgg gccctttcga tgagtgggag agcagactgc gcgtggccaa agaaagcggc 420
tacaacatga tccacttcac ccctctgcag accctgggcc tgagcagaag ctgttacagc 480
ctggccaacc agctggaact gaaccccgac ttcagcagac ccaaccggaa gtacacctgg 540
aacgatgtgg gccagctggt ggaaaaactg aagaaagaat ggaacgtgat ctgcatcacc 600
gacgtggtgt acaaccacac cgccgccaac agcaagtgga tccaagagca ccctgagtgc 660
gcctacaacc tggtcaacag ccctcacctg aaacctgcct gggtgctcga tagagccctg 720
tggcggttta gctgtgatgt ggccgagggc aagtacaaag agaagggcat ccccgctctg 780
atcgagaacg accaccacat gaacagcatc cggaagatca tctgggaaga tattttcccc 840
aagctgaagc tgtgggagtt cttccaggtg gacgtgaaca aggccgtgga acagttcaga 900
cggctgctga cccaagagaa cagaagagtg accaagagcg accccaacca gcacctgacc 960
atcattcagg accccgagta tcggagattc ggctgcaccg tggacatgaa tatcgccctg 1020
accaccttca ttccccacga caaaggacct gccgccatcg aggaatgctg caactggttc 1080
cacaagcgga tggaagaatt gaacagcgag aagcaccggc tgatcaacta ccaccaagag 1140
caggccgtga actgcctgct gggcaacgtg ttctatgaga gactggccgg acacggccct 1200
aagctgggac ctgtgacaag aaagcaccct ctggttaccc ggtacttcac ctttccattc 1260
gaagagatcg acttctccat ggaagagagc atgatccatc tgcctaacaa ggcctgcttc 1320
ctgatggctc acaacggctg ggttatgggc gacgaccctc tgagaaattt cgccgagcct 1380
ggcagcgagg tgtacctgag aagagaactg atctgttggg gcgacagcgt gaagctgaga 1440
tacggcaaca agcccgagga ctgcccttac ctgtgggccc atatgaagaa gtacacagag 1500
atcaccgcca cctactttca gggcgtcaga ctggacaact gccacagcac acctctgcac 1560
gtggccgagt acatgctgga cgccgctaga aatctgcagc ccaacctgta tgtggtggcc 1620
gagctgttta ccggctccga ggacctggac aatgtgttcg tgaccagact gggcatcagc 1680
agcctgatca gagaagccat gtccgcctac aatagccacg aagagggcag actggtgtac 1740
agatatggcg gcgagcctgt gggcagcttc gttcagcctt gtctgaggcc tctgatgccc 1800
gccattgctc acgccctgtt catggacatc acccacgata acgagtgccc catcgtgcac 1860
agaagcgcct acgacgctct gcctagcacc accattgtgt ccatggcctg ttgtgccagc 1920
ggcagcacaa gaggctatga cgaactggtg ccccaccaga tttccgtggt gtccgaggaa 1980
cggttctaca ccaagtggaa ccccgaggct ctgcccagca ataccggcga agtgaatttc 2040
cagagcggca tcattgccgc cagatgcgcc atcagcaagc tgcaccaaga actgggcgcc 2100
aagggcttca ttcaggtgta cgtggaccag gtcgacgagg acattgtggc cgtgacaaga 2160
cacagcccca gcatccatca gagcgtggtg gctgtgacca gaaccgcctt cagaaacccc 2220
aagaccagct tctacagcaa agaggtgccc cagatgtgca tccccggcaa gattgaggaa 2280
gtggtgctcg aggcccggac catcgagaga aacaccaagc cttaccggaa ggacgagaac 2340
tccatcaacg gcacccctga catcaccgtg gaaatcagag agcacatcca gctcaacgag 2400
agcaagatcg tgaaacaggc cggcgtggcc acaaagggcc ccaacgagta tatccaagag 2460
attgagttcg agaatctgag ccccggcagc gtgatcatct tcagagtgtc cctggatcct 2520
cacgctcagg tggccgtggg catcctgaga aatcacctga cacagttcag cccacacttc 2580
aagagcggaa gcctggccgt ggacaacgcc gatcctatcc tgaagatccc cttcgcctct 2640
ctggcctaca gactgacact ggctgagctg aaccagatcc tgtacagatg cgagtccgaa 2700
gagaaagagg atggcggagg ctgctacgac atccccaatt ggagcgccct gaagtatgcc 2760
ggactgcagg gactgatgtc tgtgctggcc gagatcagac ccaagaacga cctgggacac 2820
cccttctgca acaacctgag atccggcgac tggatgatcg actacgtgtc caacagactg 2880
atcagcagat ccggcacaat cgccgaagtc ggcaaatggc tgcaggccat gttcttctac 2940
ctgaagcaga tccctcggta tctgatcccc tgctacttcg acgccatcct gatcggcgcc 3000
tacaccacac tgctggatac cgcctggaag cagatgtcca gcttcgtgca gaacggcagc 3060
accttcgtga agcacctgtc tctgggaagc gtgcagctgt gtggcgtggg caaatttccc 3120
agcctgccta tcctgtctcc tgcactgatg gacgtgccct accggctgaa tgagatcacc 3180
aaagaaaaag agcagtgctg cgtcagcctg gctgctggcc tgcctcattt ttccagcggc 3240
atcttccggt gttggggcag agacaccttt attgccctga gaggcatcct gctgattacc 3300
ggcagatacg tggaagcccg gaacatcatc ctggcctttg ccggcacact gcggcacgga 3360
ctgattccta atctgctcgg cgagggcatc tacgccagat acaactgcag agatgccgtg 3420
tggtggtggc tccagtgcat ccaggactac tgcaagatgg tgcccaacgg cctggacatc 3480
ctgaagtgcc ctgtgtccag aatgtaccct accgacgata gcgcccctct gcctgccgga 3540
acacttgacc agcctctgtt cgaagtgatt caagaggcca tgcagaaaca catgcaggga 3600
atccagtttc gcgagcggaa tgccggacct cagatcgaca gaaacatgaa ggatgagggc 3660
ttcaacatca ccgctggcgt ggacgaagag acaggctttg tgtacggcgg caaccggttc 3720
aattgcggca cctggatgga caagatgggc gagtctgacc gggccagaaa cagaggaatt 3780
cccgccacac ctagagatgg cagcgctgtg gaaatcgtgg gcctgtctaa gtctgctgtg 3840
cggtggctgc tcgaactgag caagaagaat atctttccgt accacgaagt gaccgtgaag 3900
cggcacggca aggccatcaa ggtgtcctac gacgagtgga acagaaagat ccaggacaac 3960
ttcgaaaagc tgttccatgt gtctgaggac cccagcgacc tgaacgaaaa gcaccccaac 4020
ctggtgcaca agcgcggcat ctacaaggac agctacggcg cctcttctcc ttggtgcgat 4080
taccagctgc ggcccaactt caccattgcc atggtggttg cccctgagct gttcaccaca 4140
gagaaggcct ggaaggccct ggaaatcgcc gagaagaaac tgctgggccc tctgggcatg 4200
aagacactgg accccgacga catggtgtac tgcggaatct acgacaacgc cctggataac 4260
gacaactaca atctggccaa ggggttcaat taccatcagg gacccgagtg gctgtggcct 4320
atcggctatt tcctgcgggc caagctgtac ttctccagac tgatgggccc tgagacaacc 4380
gccaagacaa tcgtgctcgt gaagaacgtg ctgagccggc actatgtgca cctggaaaga 4440
agcccctgga agggactgcc cgagctgacc aatgagaacg cccagtactg ccccttcagc 4500
tgcgaaacac aggcctggtc tatcgccacc atcctggaaa ccctgtacga cctgtga 4557
<210> 54
<211> 4512
<212> DNA
<213> artificial
<220>
<223> D1b1 + D2,3 hGDE
<400> 54
atgctgcagt ttagactggg ccctacactg cagggcaaag ccgtgaccgt gtacacaaac 60
taccccttcc ctggcgaaac cttcaaccgc gagaagttca gaagcctgga ctgggagaac 120
cccaccgaga gagaggacga cagcgacaag tactgcaagc tgaacctgca gcagagcggc 180
tccttccagt actacttcct gcaaggcaac gagaagtccg gcggaggcta catcgtggtg 240
gaccctattc tgagagtggg cgccgacaat cacgtgctgc ctctggattg tgtgaccctg 300
cagaccttcc tggccaagtg tctgggccct ttcgatgagt gggagagcag actgcgcgtg 360
gccaaagaaa gcggctacaa catgatccac ttcacccctc tgcagaccct gggcctgagc 420
agaagctgtt acagcctggc caaccagctg gaactgaacc ccgacttcag cagacccaac 480
cggaagtaca cctggaacga tgtgggccag ctggtggaaa aactgaagaa agaatggaac 540
gtgatctgca tcaccgacgt ggtgtacaac cacaccgccg ccaacagcaa gtggatccaa 600
gagcaccctg agtgcgccta caacctggtc aacagccctc acctgaaacc tgcctgggtg 660
ctcgatagag ccctgtggcg gtttagctgt gatgtggccg agggcaagta caaagagaag 720
ggcatccccg ctctgatcga gaacgaccac cacatgaaca gcatccggaa gatcatctgg 780
gaagatattt tccccaagct gaagctgtgg gagttcttcc aggtggacgt gaacaaggcc 840
gtggaacagt tcagacggct gctgacccaa gagaacagaa gagtgaccaa gagcgacccc 900
aaccagcacc tgaccatcat tcaggacccc gagtatcgga gattcggctg caccgtggac 960
atgaatatcg ccctgaccac cttcattccc cacgacaaag gacctgccgc catcgaggaa 1020
tgctgcaact ggttccacaa gcggatggaa gaattgaaca gcgagaagca ccggctgatc 1080
aactaccacc aagagcaggc cgtgaactgc ctgctgggca acgtgttcta tgagagactg 1140
gccggacacg gccctaagct gggacctgtg acaagaaagc accctctggt tacccggtac 1200
ttcacctttc cattcgaaga gatcgacttc tccatggaag agagcatgat ccatctgcct 1260
aacaaggcct gcttcctgat ggctcacaac ggctgggtta tgggcgacga ccctctgaga 1320
aatttcgccg agcctggcag cgaggtgtac ctgagaagag aactgatctg ttggggcgac 1380
agcgtgaagc tgagatacgg caacaagccc gaggactgcc cttacctgtg ggcccatatg 1440
aagaagtaca cagagatcac cgccacctac tttcagggcg tcagactgga caactgccac 1500
agcacacctc tgcacgtggc cgagtacatg ctggacgccg ctagaaatct gcagcccaac 1560
ctgtatgtgg tggccgagct gtttaccggc tccgaggacc tggacaatgt gttcgtgacc 1620
agactgggca tcagcagcct gatcagagaa gccatgtccg cctacaatag ccacgaagag 1680
ggcagactgg tgtacagata tggcggcgag cctgtgggca gcttcgttca gccttgtctg 1740
aggcctctga tgcccgccat tgctcacgcc ctgttcatgg acatcaccca cgataacgag 1800
tgccccatcg tgcacagaag cgcctacgac gctctgccta gcaccaccat tgtgtccatg 1860
gcctgttgtg ccagcggcag cacaagaggc tatgacgaac tggtgcccca ccagatttcc 1920
gtggtgtccg aggaacggtt ctacaccaag tggaaccccg aggctctgcc cagcaatacc 1980
ggcgaagtga atttccagag cggcatcatt gccgccagat gcgccatcag caagctgcac 2040
caagaactgg gcgccaaggg cttcattcag gtgtacgtgg accaggtcga cgaggacatt 2100
gtggccgtga caagacacag ccccagcatc catcagagcg tggtggctgt gaccagaacc 2160
gccttcagaa accccaagac cagcttctac agcaaagagg tgccccagat gtgcatcccc 2220
ggcaagattg aggaagtggt gctcgaggcc cggaccatcg agagaaacac caagccttac 2280
cggaaggacg agaactccat caacggcacc cctgacatca ccgtggaaat cagagagcac 2340
atccagctca acgagagcaa gatcgtgaaa caggccggcg tggccacaaa gggccccaac 2400
gagtatatcc aagagattga gttcgagaat ctgagccccg gcagcgtgat catcttcaga 2460
gtgtccctgg atcctcacgc tcaggtggcc gtgggcatcc tgagaaatca cctgacacag 2520
ttcagcccac acttcaagag cggaagcctg gccgtggaca acgccgatcc tatcctgaag 2580
atccccttcg cctctctggc ctacagactg acactggctg agctgaacca gatcctgtac 2640
agatgcgagt ccgaagagaa agaggatggc ggaggctgct acgacatccc caattggagc 2700
gccctgaagt atgccggact gcagggactg atgtctgtgc tggccgagat cagacccaag 2760
aacgacctgg gacacccctt ctgcaacaac ctgagatccg gcgactggat gatcgactac 2820
gtgtccaaca gactgatcag cagatccggc acaatcgccg aagtcggcaa atggctgcag 2880
gccatgttct tctacctgaa gcagatccct cggtatctga tcccctgcta cttcgacgcc 2940
atcctgatcg gcgcctacac cacactgctg gataccgcct ggaagcagat gtccagcttc 3000
gtgcagaacg gcagcacctt cgtgaagcac ctgtctctgg gaagcgtgca gctgtgtggc 3060
gtgggcaaat ttcccagcct gcctatcctg tctcctgcac tgatggacgt gccctaccgg 3120
ctgaatgaga tcaccaaaga aaaagagcag tgctgcgtca gcctggctgc tggcctgcct 3180
catttttcca gcggcatctt ccggtgttgg ggcagagaca cctttattgc cctgagaggc 3240
atcctgctga ttaccggcag atacgtggaa gcccggaaca tcatcctggc ctttgccggc 3300
acactgcggc acggactgat tcctaatctg ctcggcgagg gcatctacgc cagatacaac 3360
tgcagagatg ccgtgtggtg gtggctccag tgcatccagg actactgcaa gatggtgccc 3420
aacggcctgg acatcctgaa gtgccctgtg tccagaatgt accctaccga cgatagcgcc 3480
cctctgcctg ccggaacact tgaccagcct ctgttcgaag tgattcaaga ggccatgcag 3540
aaacacatgc agggaatcca gtttcgcgag cggaatgccg gacctcagat cgacagaaac 3600
atgaaggatg agggcttcaa catcaccgct ggcgtggacg aagagacagg ctttgtgtac 3660
ggcggcaacc ggttcaattg cggcacctgg atggacaaga tgggcgagtc tgaccgggcc 3720
agaaacagag gaattcccgc cacacctaga gatggcagcg ctgtggaaat cgtgggcctg 3780
tctaagtctg ctgtgcggtg gctgctcgaa ctgagcaaga agaatatctt tccgtaccac 3840
gaagtgaccg tgaagcggca cggcaaggcc atcaaggtgt cctacgacga gtggaacaga 3900
aagatccagg acaacttcga aaagctgttc catgtgtctg aggaccccag cgacctgaac 3960
gaaaagcacc ccaacctggt gcacaagcgc ggcatctaca aggacagcta cggcgcctct 4020
tctccttggt gcgattacca gctgcggccc aacttcacca ttgccatggt ggttgcccct 4080
gagctgttca ccacagagaa ggcctggaag gccctggaaa tcgccgagaa gaaactgctg 4140
ggccctctgg gcatgaagac actggacccc gacgacatgg tgtactgcgg aatctacgac 4200
aacgccctgg ataacgacaa ctacaatctg gccaaggggt tcaattacca tcagggaccc 4260
gagtggctgt ggcctatcgg ctatttcctg cgggccaagc tgtacttctc cagactgatg 4320
ggccctgaga caaccgccaa gacaatcgtg ctcgtgaaga acgtgctgag ccggcactat 4380
gtgcacctgg aaagaagccc ctggaaggga ctgcccgagc tgaccaatga gaacgcccag 4440
tactgcccct tcagctgcga aacacaggcc tggtctatcg ccaccatcct ggaaaccctg 4500
tacgacctgt ga 4512
<210> 55
<211> 4359
<212> DNA
<213> artificial
<220>
<223> D1b2 + D2,3 hGDE
<400> 55
atgaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 60
aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 120
gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 180
gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 240
acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 300
ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 360
gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 420
accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 480
agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 540
gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 600
atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 660
ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 720
aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 780
tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 840
gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 900
ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 960
ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1020
agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1080
atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1140
tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1200
agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1260
gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1320
cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1380
gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1440
gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1500
atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1560
gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1620
ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1680
ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1740
gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 1800
aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 1860
gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 1920
tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 1980
cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2040
aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2100
accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2160
gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2220
gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2280
agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2340
ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2400
gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctggccta cagactgaca 2460
ctggctgagc tgaaccagat cctgtacaga tgcgagtccg aagagaaaga ggatggcgga 2520
ggctgctacg acatccccaa ttggagcgcc ctgaagtatg ccggactgca gggactgatg 2580
tctgtgctgg ccgagatcag acccaagaac gacctgggac accccttctg caacaacctg 2640
agatccggcg actggatgat cgactacgtg tccaacagac tgatcagcag atccggcaca 2700
atcgccgaag tcggcaaatg gctgcaggcc atgttcttct acctgaagca gatccctcgg 2760
tatctgatcc cctgctactt cgacgccatc ctgatcggcg cctacaccac actgctggat 2820
accgcctgga agcagatgtc cagcttcgtg cagaacggca gcaccttcgt gaagcacctg 2880
tctctgggaa gcgtgcagct gtgtggcgtg ggcaaatttc ccagcctgcc tatcctgtct 2940
cctgcactga tggacgtgcc ctaccggctg aatgagatca ccaaagaaaa agagcagtgc 3000
tgcgtcagcc tggctgctgg cctgcctcat ttttccagcg gcatcttccg gtgttggggc 3060
agagacacct ttattgccct gagaggcatc ctgctgatta ccggcagata cgtggaagcc 3120
cggaacatca tcctggcctt tgccggcaca ctgcggcacg gactgattcc taatctgctc 3180
ggcgagggca tctacgccag atacaactgc agagatgccg tgtggtggtg gctccagtgc 3240
atccaggact actgcaagat ggtgcccaac ggcctggaca tcctgaagtg ccctgtgtcc 3300
agaatgtacc ctaccgacga tagcgcccct ctgcctgccg gaacacttga ccagcctctg 3360
ttcgaagtga ttcaagaggc catgcagaaa cacatgcagg gaatccagtt tcgcgagcgg 3420
aatgccggac ctcagatcga cagaaacatg aaggatgagg gcttcaacat caccgctggc 3480
gtggacgaag agacaggctt tgtgtacggc ggcaaccggt tcaattgcgg cacctggatg 3540
gacaagatgg gcgagtctga ccgggccaga aacagaggaa ttcccgccac acctagagat 3600
ggcagcgctg tggaaatcgt gggcctgtct aagtctgctg tgcggtggct gctcgaactg 3660
agcaagaaga atatctttcc gtaccacgaa gtgaccgtga agcggcacgg caaggccatc 3720
aaggtgtcct acgacgagtg gaacagaaag atccaggaca acttcgaaaa gctgttccat 3780
gtgtctgagg accccagcga cctgaacgaa aagcacccca acctggtgca caagcgcggc 3840
atctacaagg acagctacgg cgcctcttct ccttggtgcg attaccagct gcggcccaac 3900
ttcaccattg ccatggtggt tgcccctgag ctgttcacca cagagaaggc ctggaaggcc 3960
ctggaaatcg ccgagaagaa actgctgggc cctctgggca tgaagacact ggaccccgac 4020
gacatggtgt actgcggaat ctacgacaac gccctggata acgacaacta caatctggcc 4080
aaggggttca attaccatca gggacccgag tggctgtggc ctatcggcta tttcctgcgg 4140
gccaagctgt acttctccag actgatgggc cctgagacaa ccgccaagac aatcgtgctc 4200
gtgaagaacg tgctgagccg gcactatgtg cacctggaaa gaagcccctg gaagggactg 4260
cccgagctga ccaatgagaa cgcccagtac tgccccttca gctgcgaaac acaggcctgg 4320
tctatcgcca ccatcctgga aaccctgtac gacctgtga 4359
<210> 56
<211> 4293
<212> DNA
<213> artificial
<220>
<223> D1b3 + D2,3 hGDE
<400> 56
atgggaggct acatcgtggt ggaccctatt ctgagagtgg gcgccgacaa tcacgtgctg 60
cctctggatt gtgtgaccct gcagaccttc ctggccaagt gtctgggccc tttcgatgag 120
tgggagagca gactgcgcgt ggccaaagaa agcggctaca acatgatcca cttcacccct 180
ctgcagaccc tgggcctgag cagaagctgt tacagcctgg ccaaccagct ggaactgaac 240
cccgacttca gcagacccaa ccggaagtac acctggaacg atgtgggcca gctggtggaa 300
aaactgaaga aagaatggaa cgtgatctgc atcaccgacg tggtgtacaa ccacaccgcc 360
gccaacagca agtggatcca agagcaccct gagtgcgcct acaacctggt caacagccct 420
cacctgaaac ctgcctgggt gctcgataga gccctgtggc ggtttagctg tgatgtggcc 480
gagggcaagt acaaagagaa gggcatcccc gctctgatcg agaacgacca ccacatgaac 540
agcatccgga agatcatctg ggaagatatt ttccccaagc tgaagctgtg ggagttcttc 600
caggtggacg tgaacaaggc cgtggaacag ttcagacggc tgctgaccca agagaacaga 660
agagtgacca agagcgaccc caaccagcac ctgaccatca ttcaggaccc cgagtatcgg 720
agattcggct gcaccgtgga catgaatatc gccctgacca ccttcattcc ccacgacaaa 780
ggacctgccg ccatcgagga atgctgcaac tggttccaca agcggatgga agaattgaac 840
agcgagaagc accggctgat caactaccac caagagcagg ccgtgaactg cctgctgggc 900
aacgtgttct atgagagact ggccggacac ggccctaagc tgggacctgt gacaagaaag 960
caccctctgg ttacccggta cttcaccttt ccattcgaag agatcgactt ctccatggaa 1020
gagagcatga tccatctgcc taacaaggcc tgcttcctga tggctcacaa cggctgggtt 1080
atgggcgacg accctctgag aaatttcgcc gagcctggca gcgaggtgta cctgagaaga 1140
gaactgatct gttggggcga cagcgtgaag ctgagatacg gcaacaagcc cgaggactgc 1200
ccttacctgt gggcccatat gaagaagtac acagagatca ccgccaccta ctttcagggc 1260
gtcagactgg acaactgcca cagcacacct ctgcacgtgg ccgagtacat gctggacgcc 1320
gctagaaatc tgcagcccaa cctgtatgtg gtggccgagc tgtttaccgg ctccgaggac 1380
ctggacaatg tgttcgtgac cagactgggc atcagcagcc tgatcagaga agccatgtcc 1440
gcctacaata gccacgaaga gggcagactg gtgtacagat atggcggcga gcctgtgggc 1500
agcttcgttc agccttgtct gaggcctctg atgcccgcca ttgctcacgc cctgttcatg 1560
gacatcaccc acgataacga gtgccccatc gtgcacagaa gcgcctacga cgctctgcct 1620
agcaccacca ttgtgtccat ggcctgttgt gccagcggca gcacaagagg ctatgacgaa 1680
ctggtgcccc accagatttc cgtggtgtcc gaggaacggt tctacaccaa gtggaacccc 1740
gaggctctgc ccagcaatac cggcgaagtg aatttccaga gcggcatcat tgccgccaga 1800
tgcgccatca gcaagctgca ccaagaactg ggcgccaagg gcttcattca ggtgtacgtg 1860
gaccaggtcg acgaggacat tgtggccgtg acaagacaca gccccagcat ccatcagagc 1920
gtggtggctg tgaccagaac cgccttcaga aaccccaaga ccagcttcta cagcaaagag 1980
gtgccccaga tgtgcatccc cggcaagatt gaggaagtgg tgctcgaggc ccggaccatc 2040
gagagaaaca ccaagcctta ccggaaggac gagaactcca tcaacggcac ccctgacatc 2100
accgtggaaa tcagagagca catccagctc aacgagagca agatcgtgaa acaggccggc 2160
gtggccacaa agggccccaa cgagtatatc caagagattg agttcgagaa tctgagcccc 2220
ggcagcgtga tcatcttcag agtgtccctg gatcctcacg ctcaggtggc cgtgggcatc 2280
ctgagaaatc acctgacaca gttcagccca cacttcaaga gcggaagcct ggccgtggac 2340
aacgccgatc ctatcctgaa gatccccttc gcctctctgg cctacagact gacactggct 2400
gagctgaacc agatcctgta cagatgcgag tccgaagaga aagaggatgg cggaggctgc 2460
tacgacatcc ccaattggag cgccctgaag tatgccggac tgcagggact gatgtctgtg 2520
ctggccgaga tcagacccaa gaacgacctg ggacacccct tctgcaacaa cctgagatcc 2580
ggcgactgga tgatcgacta cgtgtccaac agactgatca gcagatccgg cacaatcgcc 2640
gaagtcggca aatggctgca ggccatgttc ttctacctga agcagatccc tcggtatctg 2700
atcccctgct acttcgacgc catcctgatc ggcgcctaca ccacactgct ggataccgcc 2760
tggaagcaga tgtccagctt cgtgcagaac ggcagcacct tcgtgaagca cctgtctctg 2820
ggaagcgtgc agctgtgtgg cgtgggcaaa tttcccagcc tgcctatcct gtctcctgca 2880
ctgatggacg tgccctaccg gctgaatgag atcaccaaag aaaaagagca gtgctgcgtc 2940
agcctggctg ctggcctgcc tcatttttcc agcggcatct tccggtgttg gggcagagac 3000
acctttattg ccctgagagg catcctgctg attaccggca gatacgtgga agcccggaac 3060
atcatcctgg cctttgccgg cacactgcgg cacggactga ttcctaatct gctcggcgag 3120
ggcatctacg ccagatacaa ctgcagagat gccgtgtggt ggtggctcca gtgcatccag 3180
gactactgca agatggtgcc caacggcctg gacatcctga agtgccctgt gtccagaatg 3240
taccctaccg acgatagcgc ccctctgcct gccggaacac ttgaccagcc tctgttcgaa 3300
gtgattcaag aggccatgca gaaacacatg cagggaatcc agtttcgcga gcggaatgcc 3360
ggacctcaga tcgacagaaa catgaaggat gagggcttca acatcaccgc tggcgtggac 3420
gaagagacag gctttgtgta cggcggcaac cggttcaatt gcggcacctg gatggacaag 3480
atgggcgagt ctgaccgggc cagaaacaga ggaattcccg ccacacctag agatggcagc 3540
gctgtggaaa tcgtgggcct gtctaagtct gctgtgcggt ggctgctcga actgagcaag 3600
aagaatatct ttccgtacca cgaagtgacc gtgaagcggc acggcaaggc catcaaggtg 3660
tcctacgacg agtggaacag aaagatccag gacaacttcg aaaagctgtt ccatgtgtct 3720
gaggacccca gcgacctgaa cgaaaagcac cccaacctgg tgcacaagcg cggcatctac 3780
aaggacagct acggcgcctc ttctccttgg tgcgattacc agctgcggcc caacttcacc 3840
attgccatgg tggttgcccc tgagctgttc accacagaga aggcctggaa ggccctggaa 3900
atcgccgaga agaaactgct gggccctctg ggcatgaaga cactggaccc cgacgacatg 3960
gtgtactgcg gaatctacga caacgccctg gataacgaca actacaatct ggccaagggg 4020
ttcaattacc atcagggacc cgagtggctg tggcctatcg gctatttcct gcgggccaag 4080
ctgtacttct ccagactgat gggccctgag acaaccgcca agacaatcgt gctcgtgaag 4140
aacgtgctga gccggcacta tgtgcacctg gaaagaagcc cctggaaggg actgcccgag 4200
ctgaccaatg agaacgccca gtactgcccc ttcagctgcg aaacacaggc ctggtctatc 4260
gccaccatcc tggaaaccct gtacgacctg tga 4293
<210> 57
<211> 4215
<212> DNA
<213> artificial
<220>
<223> D1c + D2,3 hGDE
<400> 57
atgcagacct tcctggccaa gtgtctgggc cctttcgatg agtgggagag cagactgcgc 60
gtggccaaag aaagcggcta caacatgatc cacttcaccc ctctgcagac cctgggcctg 120
agcagaagct gttacagcct ggccaaccag ctggaactga accccgactt cagcagaccc 180
aaccggaagt acacctggaa cgatgtgggc cagctggtgg aaaaactgaa gaaagaatgg 240
aacgtgatct gcatcaccga cgtggtgtac aaccacaccg ccgccaacag caagtggatc 300
caagagcacc ctgagtgcgc ctacaacctg gtcaacagcc ctcacctgaa acctgcctgg 360
gtgctcgata gagccctgtg gcggtttagc tgtgatgtgg ccgagggcaa gtacaaagag 420
aagggcatcc ccgctctgat cgagaacgac caccacatga acagcatccg gaagatcatc 480
tgggaagata ttttccccaa gctgaagctg tgggagttct tccaggtgga cgtgaacaag 540
gccgtggaac agttcagacg gctgctgacc caagagaaca gaagagtgac caagagcgac 600
cccaaccagc acctgaccat cattcaggac cccgagtatc ggagattcgg ctgcaccgtg 660
gacatgaata tcgccctgac caccttcatt ccccacgaca aaggacctgc cgccatcgag 720
gaatgctgca actggttcca caagcggatg gaagaattga acagcgagaa gcaccggctg 780
atcaactacc accaagagca ggccgtgaac tgcctgctgg gcaacgtgtt ctatgagaga 840
ctggccggac acggccctaa gctgggacct gtgacaagaa agcaccctct ggttacccgg 900
tacttcacct ttccattcga agagatcgac ttctccatgg aagagagcat gatccatctg 960
cctaacaagg cctgcttcct gatggctcac aacggctggg ttatgggcga cgaccctctg 1020
agaaatttcg ccgagcctgg cagcgaggtg tacctgagaa gagaactgat ctgttggggc 1080
gacagcgtga agctgagata cggcaacaag cccgaggact gcccttacct gtgggcccat 1140
atgaagaagt acacagagat caccgccacc tactttcagg gcgtcagact ggacaactgc 1200
cacagcacac ctctgcacgt ggccgagtac atgctggacg ccgctagaaa tctgcagccc 1260
aacctgtatg tggtggccga gctgtttacc ggctccgagg acctggacaa tgtgttcgtg 1320
accagactgg gcatcagcag cctgatcaga gaagccatgt ccgcctacaa tagccacgaa 1380
gagggcagac tggtgtacag atatggcggc gagcctgtgg gcagcttcgt tcagccttgt 1440
ctgaggcctc tgatgcccgc cattgctcac gccctgttca tggacatcac ccacgataac 1500
gagtgcccca tcgtgcacag aagcgcctac gacgctctgc ctagcaccac cattgtgtcc 1560
atggcctgtt gtgccagcgg cagcacaaga ggctatgacg aactggtgcc ccaccagatt 1620
tccgtggtgt ccgaggaacg gttctacacc aagtggaacc ccgaggctct gcccagcaat 1680
accggcgaag tgaatttcca gagcggcatc attgccgcca gatgcgccat cagcaagctg 1740
caccaagaac tgggcgccaa gggcttcatt caggtgtacg tggaccaggt cgacgaggac 1800
attgtggccg tgacaagaca cagccccagc atccatcaga gcgtggtggc tgtgaccaga 1860
accgccttca gaaaccccaa gaccagcttc tacagcaaag aggtgcccca gatgtgcatc 1920
cccggcaaga ttgaggaagt ggtgctcgag gcccggacca tcgagagaaa caccaagcct 1980
taccggaagg acgagaactc catcaacggc acccctgaca tcaccgtgga aatcagagag 2040
cacatccagc tcaacgagag caagatcgtg aaacaggccg gcgtggccac aaagggcccc 2100
aacgagtata tccaagagat tgagttcgag aatctgagcc ccggcagcgt gatcatcttc 2160
agagtgtccc tggatcctca cgctcaggtg gccgtgggca tcctgagaaa tcacctgaca 2220
cagttcagcc cacacttcaa gagcggaagc ctggccgtgg acaacgccga tcctatcctg 2280
aagatcccct tcgcctctct ggcctacaga ctgacactgg ctgagctgaa ccagatcctg 2340
tacagatgcg agtccgaaga gaaagaggat ggcggaggct gctacgacat ccccaattgg 2400
agcgccctga agtatgccgg actgcaggga ctgatgtctg tgctggccga gatcagaccc 2460
aagaacgacc tgggacaccc cttctgcaac aacctgagat ccggcgactg gatgatcgac 2520
tacgtgtcca acagactgat cagcagatcc ggcacaatcg ccgaagtcgg caaatggctg 2580
caggccatgt tcttctacct gaagcagatc cctcggtatc tgatcccctg ctacttcgac 2640
gccatcctga tcggcgccta caccacactg ctggataccg cctggaagca gatgtccagc 2700
ttcgtgcaga acggcagcac cttcgtgaag cacctgtctc tgggaagcgt gcagctgtgt 2760
ggcgtgggca aatttcccag cctgcctatc ctgtctcctg cactgatgga cgtgccctac 2820
cggctgaatg agatcaccaa agaaaaagag cagtgctgcg tcagcctggc tgctggcctg 2880
cctcattttt ccagcggcat cttccggtgt tggggcagag acacctttat tgccctgaga 2940
ggcatcctgc tgattaccgg cagatacgtg gaagcccgga acatcatcct ggcctttgcc 3000
ggcacactgc ggcacggact gattcctaat ctgctcggcg agggcatcta cgccagatac 3060
aactgcagag atgccgtgtg gtggtggctc cagtgcatcc aggactactg caagatggtg 3120
cccaacggcc tggacatcct gaagtgccct gtgtccagaa tgtaccctac cgacgatagc 3180
gcccctctgc ctgccggaac acttgaccag cctctgttcg aagtgattca agaggccatg 3240
cagaaacaca tgcagggaat ccagtttcgc gagcggaatg ccggacctca gatcgacaga 3300
aacatgaagg atgagggctt caacatcacc gctggcgtgg acgaagagac aggctttgtg 3360
tacggcggca accggttcaa ttgcggcacc tggatggaca agatgggcga gtctgaccgg 3420
gccagaaaca gaggaattcc cgccacacct agagatggca gcgctgtgga aatcgtgggc 3480
ctgtctaagt ctgctgtgcg gtggctgctc gaactgagca agaagaatat ctttccgtac 3540
cacgaagtga ccgtgaagcg gcacggcaag gccatcaagg tgtcctacga cgagtggaac 3600
agaaagatcc aggacaactt cgaaaagctg ttccatgtgt ctgaggaccc cagcgacctg 3660
aacgaaaagc accccaacct ggtgcacaag cgcggcatct acaaggacag ctacggcgcc 3720
tcttctcctt ggtgcgatta ccagctgcgg cccaacttca ccattgccat ggtggttgcc 3780
cctgagctgt tcaccacaga gaaggcctgg aaggccctgg aaatcgccga gaagaaactg 3840
ctgggccctc tgggcatgaa gacactggac cccgacgaca tggtgtactg cggaatctac 3900
gacaacgccc tggataacga caactacaat ctggccaagg ggttcaatta ccatcaggga 3960
cccgagtggc tgtggcctat cggctatttc ctgcgggcca agctgtactt ctccagactg 4020
atgggccctg agacaaccgc caagacaatc gtgctcgtga agaacgtgct gagccggcac 4080
tatgtgcacc tggaaagaag cccctggaag ggactgcccg agctgaccaa tgagaacgcc 4140
cagtactgcc ccttcagctg cgaaacacag gcctggtcta tcgccaccat cctggaaacc 4200
ctgtacgacc tgtga 4215
<210> 58
<211> 17
<212> DNA
<213> artificial
<220>
<223> sNRP1 polyadenylation signal
<400> 58
aaataaaata cgaaatg 17
<210> 59
<211> 4557
<212> DNA
<213> artificial
<220>
<223> delta-9 GDE (isoform 1 (SEQ ID NO:1); wt version)
<400> 59
atggagaaac tggaaaagac cctcttcaga cttgaacaag ggtatgagct acagttccga 60
ttaggcccaa ctttacaggg aaaagcagtt accgtgtata caaattaccc atttcctgga 120
gaaacattta atagagaaaa attccgttct ctggattggg aaaatccaac agaaagagaa 180
gatgattctg ataaatactg taaacttaat ctgcaacaat ctggttcatt tcagtattat 240
ttccttcaag gaaatgagaa aagtggtgga ggttacatag ttgtggaccc cattttacgt 300
gttggtgctg ataatcatgt gctacccttg gactgtgtta ctcttcagac atttttagct 360
aagtgtttgg gaccttttga tgaatgggaa agcagactta gggttgcaaa agaatcaggc 420
tacaacatga ttcattttac cccattgcag actcttggac tatctaggtc atgctactcc 480
cttgccaatc agttagaatt aaatcctgac ttttcaagac ctaatagaaa gtatacctgg 540
aatgatgttg gacagctagt ggaaaaatta aaaaaggaat ggaatgttat ttgtattact 600
gatgttgtct acaatcatac tgctgctaat agtaaatgga tccaggaaca tccagaatgt 660
gcctataatc ttgtaaattc tccacactta aaacctgcct gggtcttaga cagagcactt 720
tggcgtttct cctgtgatgt tgcagaaggg aaatacaaag aaaagggaat acctgctttg 780
attgaaaatg atcaccatat gaactccatc cgaaaaataa tttgggagga tatttttcca 840
aagcttaaac tctgggaatt tttccaagta gatgtcaaca aagcggttga gcaatttaga 900
agacttctta cacaagaaaa taggcgagta accaagtctg atccaaacca acaccttacg 960
attattcaag atcctgaata cagacggttt ggctgtactg tagatatgaa cattgcacta 1020
acgactttca taccacatga caaggggcca gcagcaattg aagaatgctg taattggttt 1080
cataaaagaa tggaggaatt aaattcagag aagcatcgac tcattaacta tcatcaggaa 1140
caggcagtta attgcctttt gggaaatgtg ttttatgaac gactggctgg ccatggtcca 1200
aaactaggac ctgtcactag aaagcatcct ttagttacca ggtattttac tttcccattt 1260
gaagagatag acttctccat ggaagaatct atgattcatc tgccaaataa agcttgtttt 1320
ctgatggcac acaatggatg ggtaatggga gatgatcctc ttcgaaactt tgctgaaccg 1380
ggttcagaag tttacctaag gagagaactt atttgctggg gagacagtgt taaattacgc 1440
tatgggaata aaccagagga ctgtccttat ctctgggcac acatgaaaaa atacactgaa 1500
ataactgcaa cttatttcca gggagtacgt cttgataact gccactcaac acctcttcac 1560
gtagctgagt acatgttgga tgctgctagg aatttgcaac ccaatttata tgtagtagct 1620
gaactgttca caggaagtga ggacctagac aatgtctttg ttactagact gggcattagt 1680
tccttaataa gagaggcaat gagtgcatat aatagtcatg aagagggcag attagtttac 1740
cgatatggag gagaacctgt tggatccttt gttcagccct gtttgaggcc tttaatgcca 1800
gctattgcac atgccctgtt tatggatatt acgcatgata atgagtgtcc tattgtgcat 1860
agatcagcgt atgatgctct tccaagtact acaattgttt ctatggcatg ttgtgctagt 1920
ggaagtacaa gaggctatga tgaattagtg cctcatcaga tttcagtggt ttctgaagaa 1980
cggttttaca ctaagtggaa tcctgaagca ttgccttcaa acacaggtga agttaatttc 2040
caaagcggca ttattgcagc caggtgtgct atcagtaaac ttcatcagga gcttggagcc 2100
aagggtttta ttcaggtgta tgtggatcaa gttgatgaag acatagtggc agtaacaaga 2160
cactcaccta gcatccatca gtctgttgtg gctgtaacta gaactgcttt caggaatccc 2220
aagacttcat tttacagcaa ggaagtgcct caaatgtgca tccctggcaa aattgaagaa 2280
gtagttcttg aagctagaac tattgagaga aacacgaaac cttataggaa ggatgaaaat 2340
tcaatcaatg gaacaccaga tatcacagta gaaattagag aacatattca gcttaatgaa 2400
agtaaaattg ttaaacaagc tggagttgcc acaaaagggc ccaatgaata tattcaagaa 2460
atagaatttg aaaacttgtc tccaggaagt gttattatat tcagagttag tcttgatcca 2520
catgcacaag tcgctgttgg cattcttcga aatcatctga cacaattcag tcctcacttt 2580
aaatctggca gcctagctgt tgacaatgca gatcctatat taaaaattcc ttttgcttct 2640
cttgcctata gattaacttt ggctgagcta aatcagatcc tttaccgatg tgaatcagaa 2700
gaaaaggaag atggtggagg gtgctatgac ataccaaact ggtcagccct taaatatgca 2760
ggtcttcaag gtttaatgtc tgtattggca gaaataagac caaagaatga cttggggcat 2820
cctttttgta ataatttgag gtctggagat tggatgattg actatgtcag taaccggctt 2880
atttcacgat caggaactat tgctgaagtt ggtaaatggt tgcaggctat gttcttctac 2940
ctgaagcaga tcccacgtta ccttatccca tgttactttg atgctatatt aattggtgca 3000
tataccactc ttctggatac agcatggaag cagatgtcaa gctttgttca gaatggttca 3060
acctttgtga aacacctttc attgggttca gttcaactgt gtggagtagg aaaattccct 3120
tccctgccaa ttctttcacc tgccctaatg gatgtacctt ataggttaaa tgagatcaca 3180
aaagaaaagg agcaatgttg tgtttctcta gctgcaggct tacctcattt ttcttctggt 3240
attttccgct gctggggaag ggatactttt attgcactta gaggtatact gctgattact 3300
ggacgctatg tagaagccag gaatattatt ttagcatttg cgggtaccct gaggcatggt 3360
ctcattccta atctactggg tgaaggaatt tatgccagat acaattgtcg ggatgctgtg 3420
tggtggtggc tgcagtgtat ccaggattac tgtaaaatgg ttccaaatgg actagacatt 3480
ctcaagtgcc cagtttccag aatgtatcct acagatgatt ctgctccttt gcctgctggc 3540
acactggatc agccattgtt tgaagtcata caggaagcaa tgcaaaaaca catgcagggc 3600
atacagttcc gagaaaggaa tgctggtccc cagatagatc gaaacatgaa ggacgaaggt 3660
tttaatataa ctgcaggagt tgatgaagaa acaggatttg tttatggagg aaatcgtttc 3720
aattgtggca catggatgga taaaatggga gaaagtgaca gagctagaaa cagaggaatc 3780
ccagccacac caagagatgg gtctgctgtg gaaattgtgg gcctgagtaa atctgctgtt 3840
cgctggttgc tggaattatc caaaaaaaat attttccctt atcatgaagt cacagtaaaa 3900
agacatggaa aggctataaa ggtctcatat gatgagtgga acagaaaaat acaagacaac 3960
tttgaaaagc tatttcatgt ttccgaagac ccttcagatt taaatgaaaa gcatccaaat 4020
ctggttcaca aacgtggcat atacaaagat agttatggag cttcaagtcc ttggtgtgac 4080
tatcagctca ggcctaattt taccatagca atggttgtgg cccctgagct ctttactaca 4140
gaaaaagcat ggaaagcttt ggagattgca gaaaaaaaat tgcttggtcc ccttggcatg 4200
aaaactttag atccagatga tatggtttac tgtggaattt atgacaacgc attagacaat 4260
gacaactaca atcttgctaa aggtttcaat tatcaccaag gacctgagtg gctgtggcct 4320
attgggtatt ttcttcgtgc aaaattatat ttttccagat tgatgggccc ggagactact 4380
gcaaagacta tagttttggt taaaaatgtt ctttcccgac attatgttca tcttgagaga 4440
tccccttgga aaggacttcc agaactgacc aatgagaatg cccagtactg tcctttcagc 4500
tgtgaaacac aagcctggtc aattgctact attcttgaga cactttatga tttatag 4557
<210> 60
<211> 4512
<212> DNA
<213> artificial
<220>
<223> delta-10 GDE (isoform 1 (SEQ ID NO:1); wt version)
<400> 60
atgctacagt tccgattagg cccaacttta cagggaaaag cagttaccgt gtatacaaat 60
tacccatttc ctggagaaac atttaataga gaaaaattcc gttctctgga ttgggaaaat 120
ccaacagaaa gagaagatga ttctgataaa tactgtaaac ttaatctgca acaatctggt 180
tcatttcagt attatttcct tcaaggaaat gagaaaagtg gtggaggtta catagttgtg 240
gaccccattt tacgtgttgg tgctgataat catgtgctac ccttggactg tgttactctt 300
cagacatttt tagctaagtg tttgggacct tttgatgaat gggaaagcag acttagggtt 360
gcaaaagaat caggctacaa catgattcat tttaccccat tgcagactct tggactatct 420
aggtcatgct actcccttgc caatcagtta gaattaaatc ctgacttttc aagacctaat 480
agaaagtata cctggaatga tgttggacag ctagtggaaa aattaaaaaa ggaatggaat 540
gttatttgta ttactgatgt tgtctacaat catactgctg ctaatagtaa atggatccag 600
gaacatccag aatgtgccta taatcttgta aattctccac acttaaaacc tgcctgggtc 660
ttagacagag cactttggcg tttctcctgt gatgttgcag aagggaaata caaagaaaag 720
ggaatacctg ctttgattga aaatgatcac catatgaact ccatccgaaa aataatttgg 780
gaggatattt ttccaaagct taaactctgg gaatttttcc aagtagatgt caacaaagcg 840
gttgagcaat ttagaagact tcttacacaa gaaaataggc gagtaaccaa gtctgatcca 900
aaccaacacc ttacgattat tcaagatcct gaatacagac ggtttggctg tactgtagat 960
atgaacattg cactaacgac tttcatacca catgacaagg ggccagcagc aattgaagaa 1020
tgctgtaatt ggtttcataa aagaatggag gaattaaatt cagagaagca tcgactcatt 1080
aactatcatc aggaacaggc agttaattgc cttttgggaa atgtgtttta tgaacgactg 1140
gctggccatg gtccaaaact aggacctgtc actagaaagc atcctttagt taccaggtat 1200
tttactttcc catttgaaga gatagacttc tccatggaag aatctatgat tcatctgcca 1260
aataaagctt gttttctgat ggcacacaat ggatgggtaa tgggagatga tcctcttcga 1320
aactttgctg aaccgggttc agaagtttac ctaaggagag aacttatttg ctggggagac 1380
agtgttaaat tacgctatgg gaataaacca gaggactgtc cttatctctg ggcacacatg 1440
aaaaaataca ctgaaataac tgcaacttat ttccagggag tacgtcttga taactgccac 1500
tcaacacctc ttcacgtagc tgagtacatg ttggatgctg ctaggaattt gcaacccaat 1560
ttatatgtag tagctgaact gttcacagga agtgaggacc tagacaatgt ctttgttact 1620
agactgggca ttagttcctt aataagagag gcaatgagtg catataatag tcatgaagag 1680
ggcagattag tttaccgata tggaggagaa cctgttggat cctttgttca gccctgtttg 1740
aggcctttaa tgccagctat tgcacatgcc ctgtttatgg atattacgca tgataatgag 1800
tgtcctattg tgcatagatc agcgtatgat gctcttccaa gtactacaat tgtttctatg 1860
gcatgttgtg ctagtggaag tacaagaggc tatgatgaat tagtgcctca tcagatttca 1920
gtggtttctg aagaacggtt ttacactaag tggaatcctg aagcattgcc ttcaaacaca 1980
ggtgaagtta atttccaaag cggcattatt gcagccaggt gtgctatcag taaacttcat 2040
caggagcttg gagccaaggg ttttattcag gtgtatgtgg atcaagttga tgaagacata 2100
gtggcagtaa caagacactc acctagcatc catcagtctg ttgtggctgt aactagaact 2160
gctttcagga atcccaagac ttcattttac agcaaggaag tgcctcaaat gtgcatccct 2220
ggcaaaattg aagaagtagt tcttgaagct agaactattg agagaaacac gaaaccttat 2280
aggaaggatg aaaattcaat caatggaaca ccagatatca cagtagaaat tagagaacat 2340
attcagctta atgaaagtaa aattgttaaa caagctggag ttgccacaaa agggcccaat 2400
gaatatattc aagaaataga atttgaaaac ttgtctccag gaagtgttat tatattcaga 2460
gttagtcttg atccacatgc acaagtcgct gttggcattc ttcgaaatca tctgacacaa 2520
ttcagtcctc actttaaatc tggcagccta gctgttgaca atgcagatcc tatattaaaa 2580
attccttttg cttctcttgc ctatagatta actttggctg agctaaatca gatcctttac 2640
cgatgtgaat cagaagaaaa ggaagatggt ggagggtgct atgacatacc aaactggtca 2700
gcccttaaat atgcaggtct tcaaggttta atgtctgtat tggcagaaat aagaccaaag 2760
aatgacttgg ggcatccttt ttgtaataat ttgaggtctg gagattggat gattgactat 2820
gtcagtaacc ggcttatttc acgatcagga actattgctg aagttggtaa atggttgcag 2880
gctatgttct tctacctgaa gcagatccca cgttacctta tcccatgtta ctttgatgct 2940
atattaattg gtgcatatac cactcttctg gatacagcat ggaagcagat gtcaagcttt 3000
gttcagaatg gttcaacctt tgtgaaacac ctttcattgg gttcagttca actgtgtgga 3060
gtaggaaaat tcccttccct gccaattctt tcacctgccc taatggatgt accttatagg 3120
ttaaatgaga tcacaaaaga aaaggagcaa tgttgtgttt ctctagctgc aggcttacct 3180
catttttctt ctggtatttt ccgctgctgg ggaagggata cttttattgc acttagaggt 3240
atactgctga ttactggacg ctatgtagaa gccaggaata ttattttagc atttgcgggt 3300
accctgaggc atggtctcat tcctaatcta ctgggtgaag gaatttatgc cagatacaat 3360
tgtcgggatg ctgtgtggtg gtggctgcag tgtatccagg attactgtaa aatggttcca 3420
aatggactag acattctcaa gtgcccagtt tccagaatgt atcctacaga tgattctgct 3480
cctttgcctg ctggcacact ggatcagcca ttgtttgaag tcatacagga agcaatgcaa 3540
aaacacatgc agggcataca gttccgagaa aggaatgctg gtccccagat agatcgaaac 3600
atgaaggacg aaggttttaa tataactgca ggagttgatg aagaaacagg atttgtttat 3660
ggaggaaatc gtttcaattg tggcacatgg atggataaaa tgggagaaag tgacagagct 3720
agaaacagag gaatcccagc cacaccaaga gatgggtctg ctgtggaaat tgtgggcctg 3780
agtaaatctg ctgttcgctg gttgctggaa ttatccaaaa aaaatatttt cccttatcat 3840
gaagtcacag taaaaagaca tggaaaggct ataaaggtct catatgatga gtggaacaga 3900
aaaatacaag acaactttga aaagctattt catgtttccg aagacccttc agatttaaat 3960
gaaaagcatc caaatctggt tcacaaacgt ggcatataca aagatagtta tggagcttca 4020
agtccttggt gtgactatca gctcaggcct aattttacca tagcaatggt tgtggcccct 4080
gagctcttta ctacagaaaa agcatggaaa gctttggaga ttgcagaaaa aaaattgctt 4140
ggtccccttg gcatgaaaac tttagatcca gatgatatgg tttactgtgg aatttatgac 4200
aacgcattag acaatgacaa ctacaatctt gctaaaggtt tcaattatca ccaaggacct 4260
gagtggctgt ggcctattgg gtattttctt cgtgcaaaat tatatttttc cagattgatg 4320
ggcccggaga ctactgcaaa gactatagtt ttggttaaaa atgttctttc ccgacattat 4380
gttcatcttg agagatcccc ttggaaagga cttccagaac tgaccaatga gaatgcccag 4440
tactgtcctt tcagctgtga aacacaagcc tggtcaattg ctactattct tgagacactt 4500
tatgatttat ag 4512
<210> 61
<211> 4359
<212> DNA
<213> artificial
<220>
<223> delta-11 GDE (isoform 1 (SEQ ID NO:1); wt version)
<400> 61
atgaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 60
aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 120
gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 180
gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 240
accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 300
ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 360
gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 420
actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 480
tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 540
gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 600
atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 660
tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 720
aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 780
tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 840
gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 900
ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 960
ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1020
agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1080
atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1140
tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1200
aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1260
gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1320
cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1380
gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1440
gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1500
atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1560
gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1620
tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1680
cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1740
gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 1800
aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 1860
gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 1920
tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1980
cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2040
aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2100
actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2160
gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2220
gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2280
tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2340
ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2400
gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 2460
ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 2520
gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 2580
tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2640
aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2700
attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2760
taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2820
acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2880
tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2940
cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 3000
tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 3060
agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 3120
aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 3180
ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 3240
atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 3300
agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 3360
tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 3420
aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 3480
gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 3540
gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3600
gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3660
tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3720
aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3780
gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3840
atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 3900
tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 3960
ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 4020
gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 4080
aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 4140
gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 4200
gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 4260
ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 4320
tcaattgcta ctattcttga gacactttat gatttatag 4359
<210> 62
<211> 4293
<212> DNA
<213> artificial
<220>
<223> delta-12 GDE (isoform 1 (SEQ ID NO:1); wt version)
<400> 62
atgggaggtt acatagttgt ggaccccatt ttacgtgttg gtgctgataa tcatgtgcta 60
cccttggact gtgttactct tcagacattt ttagctaagt gtttgggacc ttttgatgaa 120
tgggaaagca gacttagggt tgcaaaagaa tcaggctaca acatgattca ttttacccca 180
ttgcagactc ttggactatc taggtcatgc tactcccttg ccaatcagtt agaattaaat 240
cctgactttt caagacctaa tagaaagtat acctggaatg atgttggaca gctagtggaa 300
aaattaaaaa aggaatggaa tgttatttgt attactgatg ttgtctacaa tcatactgct 360
gctaatagta aatggatcca ggaacatcca gaatgtgcct ataatcttgt aaattctcca 420
cacttaaaac ctgcctgggt cttagacaga gcactttggc gtttctcctg tgatgttgca 480
gaagggaaat acaaagaaaa gggaatacct gctttgattg aaaatgatca ccatatgaac 540
tccatccgaa aaataatttg ggaggatatt tttccaaagc ttaaactctg ggaatttttc 600
caagtagatg tcaacaaagc ggttgagcaa tttagaagac ttcttacaca agaaaatagg 660
cgagtaacca agtctgatcc aaaccaacac cttacgatta ttcaagatcc tgaatacaga 720
cggtttggct gtactgtaga tatgaacatt gcactaacga ctttcatacc acatgacaag 780
gggccagcag caattgaaga atgctgtaat tggtttcata aaagaatgga ggaattaaat 840
tcagagaagc atcgactcat taactatcat caggaacagg cagttaattg ccttttggga 900
aatgtgtttt atgaacgact ggctggccat ggtccaaaac taggacctgt cactagaaag 960
catcctttag ttaccaggta ttttactttc ccatttgaag agatagactt ctccatggaa 1020
gaatctatga ttcatctgcc aaataaagct tgttttctga tggcacacaa tggatgggta 1080
atgggagatg atcctcttcg aaactttgct gaaccgggtt cagaagttta cctaaggaga 1140
gaacttattt gctggggaga cagtgttaaa ttacgctatg ggaataaacc agaggactgt 1200
ccttatctct gggcacacat gaaaaaatac actgaaataa ctgcaactta tttccaggga 1260
gtacgtcttg ataactgcca ctcaacacct cttcacgtag ctgagtacat gttggatgct 1320
gctaggaatt tgcaacccaa tttatatgta gtagctgaac tgttcacagg aagtgaggac 1380
ctagacaatg tctttgttac tagactgggc attagttcct taataagaga ggcaatgagt 1440
gcatataata gtcatgaaga gggcagatta gtttaccgat atggaggaga acctgttgga 1500
tcctttgttc agccctgttt gaggccttta atgccagcta ttgcacatgc cctgtttatg 1560
gatattacgc atgataatga gtgtcctatt gtgcatagat cagcgtatga tgctcttcca 1620
agtactacaa ttgtttctat ggcatgttgt gctagtggaa gtacaagagg ctatgatgaa 1680
ttagtgcctc atcagatttc agtggtttct gaagaacggt tttacactaa gtggaatcct 1740
gaagcattgc cttcaaacac aggtgaagtt aatttccaaa gcggcattat tgcagccagg 1800
tgtgctatca gtaaacttca tcaggagctt ggagccaagg gttttattca ggtgtatgtg 1860
gatcaagttg atgaagacat agtggcagta acaagacact cacctagcat ccatcagtct 1920
gttgtggctg taactagaac tgctttcagg aatcccaaga cttcatttta cagcaaggaa 1980
gtgcctcaaa tgtgcatccc tggcaaaatt gaagaagtag ttcttgaagc tagaactatt 2040
gagagaaaca cgaaacctta taggaaggat gaaaattcaa tcaatggaac accagatatc 2100
acagtagaaa ttagagaaca tattcagctt aatgaaagta aaattgttaa acaagctgga 2160
gttgccacaa aagggcccaa tgaatatatt caagaaatag aatttgaaaa cttgtctcca 2220
ggaagtgtta ttatattcag agttagtctt gatccacatg cacaagtcgc tgttggcatt 2280
cttcgaaatc atctgacaca attcagtcct cactttaaat ctggcagcct agctgttgac 2340
aatgcagatc ctatattaaa aattcctttt gcttctcttg cctatagatt aactttggct 2400
gagctaaatc agatccttta ccgatgtgaa tcagaagaaa aggaagatgg tggagggtgc 2460
tatgacatac caaactggtc agcccttaaa tatgcaggtc ttcaaggttt aatgtctgta 2520
ttggcagaaa taagaccaaa gaatgacttg gggcatcctt tttgtaataa tttgaggtct 2580
ggagattgga tgattgacta tgtcagtaac cggcttattt cacgatcagg aactattgct 2640
gaagttggta aatggttgca ggctatgttc ttctacctga agcagatccc acgttacctt 2700
atcccatgtt actttgatgc tatattaatt ggtgcatata ccactcttct ggatacagca 2760
tggaagcaga tgtcaagctt tgttcagaat ggttcaacct ttgtgaaaca cctttcattg 2820
ggttcagttc aactgtgtgg agtaggaaaa ttcccttccc tgccaattct ttcacctgcc 2880
ctaatggatg taccttatag gttaaatgag atcacaaaag aaaaggagca atgttgtgtt 2940
tctctagctg caggcttacc tcatttttct tctggtattt tccgctgctg gggaagggat 3000
acttttattg cacttagagg tatactgctg attactggac gctatgtaga agccaggaat 3060
attattttag catttgcggg taccctgagg catggtctca ttcctaatct actgggtgaa 3120
ggaatttatg ccagatacaa ttgtcgggat gctgtgtggt ggtggctgca gtgtatccag 3180
gattactgta aaatggttcc aaatggacta gacattctca agtgcccagt ttccagaatg 3240
tatcctacag atgattctgc tcctttgcct gctggcacac tggatcagcc attgtttgaa 3300
gtcatacagg aagcaatgca aaaacacatg cagggcatac agttccgaga aaggaatgct 3360
ggtccccaga tagatcgaaa catgaaggac gaaggtttta atataactgc aggagttgat 3420
gaagaaacag gatttgttta tggaggaaat cgtttcaatt gtggcacatg gatggataaa 3480
atgggagaaa gtgacagagc tagaaacaga ggaatcccag ccacaccaag agatgggtct 3540
gctgtggaaa ttgtgggcct gagtaaatct gctgttcgct ggttgctgga attatccaaa 3600
aaaaatattt tcccttatca tgaagtcaca gtaaaaagac atggaaaggc tataaaggtc 3660
tcatatgatg agtggaacag aaaaatacaa gacaactttg aaaagctatt tcatgtttcc 3720
gaagaccctt cagatttaaa tgaaaagcat ccaaatctgg ttcacaaacg tggcatatac 3780
aaagatagtt atggagcttc aagtccttgg tgtgactatc agctcaggcc taattttacc 3840
atagcaatgg ttgtggcccc tgagctcttt actacagaaa aagcatggaa agctttggag 3900
attgcagaaa aaaaattgct tggtcccctt ggcatgaaaa ctttagatcc agatgatatg 3960
gtttactgtg gaatttatga caacgcatta gacaatgaca actacaatct tgctaaaggt 4020
ttcaattatc accaaggacc tgagtggctg tggcctattg ggtattttct tcgtgcaaaa 4080
ttatattttt ccagattgat gggcccggag actactgcaa agactatagt tttggttaaa 4140
aatgttcttt cccgacatta tgttcatctt gagagatccc cttggaaagg acttccagaa 4200
ctgaccaatg agaatgccca gtactgtcct ttcagctgtg aaacacaagc ctggtcaatt 4260
gctactattc ttgagacact ttatgattta tag 4293
<210> 63
<211> 4215
<212> DNA
<213> artificial
<220>
<223> delta-13 GDE (isoform 1 (SEQ ID NO:1); wt version)
<400> 63
atgcagacat ttttagctaa gtgtttggga ccttttgatg aatgggaaag cagacttagg 60
gttgcaaaag aatcaggcta caacatgatt cattttaccc cattgcagac tcttggacta 120
tctaggtcat gctactccct tgccaatcag ttagaattaa atcctgactt ttcaagacct 180
aatagaaagt atacctggaa tgatgttgga cagctagtgg aaaaattaaa aaaggaatgg 240
aatgttattt gtattactga tgttgtctac aatcatactg ctgctaatag taaatggatc 300
caggaacatc cagaatgtgc ctataatctt gtaaattctc cacacttaaa acctgcctgg 360
gtcttagaca gagcactttg gcgtttctcc tgtgatgttg cagaagggaa atacaaagaa 420
aagggaatac ctgctttgat tgaaaatgat caccatatga actccatccg aaaaataatt 480
tgggaggata tttttccaaa gcttaaactc tgggaatttt tccaagtaga tgtcaacaaa 540
gcggttgagc aatttagaag acttcttaca caagaaaata ggcgagtaac caagtctgat 600
ccaaaccaac accttacgat tattcaagat cctgaataca gacggtttgg ctgtactgta 660
gatatgaaca ttgcactaac gactttcata ccacatgaca aggggccagc agcaattgaa 720
gaatgctgta attggtttca taaaagaatg gaggaattaa attcagagaa gcatcgactc 780
attaactatc atcaggaaca ggcagttaat tgccttttgg gaaatgtgtt ttatgaacga 840
ctggctggcc atggtccaaa actaggacct gtcactagaa agcatccttt agttaccagg 900
tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 960
ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1020
cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1080
gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1140
atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1200
cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1260
aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1320
actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1380
gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1440
ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1500
gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1560
atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagatt 1620
tcagtggttt ctgaagaacg gttttacact aagtggaatc ctgaagcatt gccttcaaac 1680
acaggtgaag ttaatttcca aagcggcatt attgcagcca ggtgtgctat cagtaaactt 1740
catcaggagc ttggagccaa gggttttatt caggtgtatg tggatcaagt tgatgaagac 1800
atagtggcag taacaagaca ctcacctagc atccatcagt ctgttgtggc tgtaactaga 1860
actgctttca ggaatcccaa gacttcattt tacagcaagg aagtgcctca aatgtgcatc 1920
cctggcaaaa ttgaagaagt agttcttgaa gctagaacta ttgagagaaa cacgaaacct 1980
tataggaagg atgaaaattc aatcaatgga acaccagata tcacagtaga aattagagaa 2040
catattcagc ttaatgaaag taaaattgtt aaacaagctg gagttgccac aaaagggccc 2100
aatgaatata ttcaagaaat agaatttgaa aacttgtctc caggaagtgt tattatattc 2160
agagttagtc ttgatccaca tgcacaagtc gctgttggca ttcttcgaaa tcatctgaca 2220
caattcagtc ctcactttaa atctggcagc ctagctgttg acaatgcaga tcctatatta 2280
aaaattcctt ttgcttctct tgcctataga ttaactttgg ctgagctaaa tcagatcctt 2340
taccgatgtg aatcagaaga aaaggaagat ggtggagggt gctatgacat accaaactgg 2400
tcagccctta aatatgcagg tcttcaaggt ttaatgtctg tattggcaga aataagacca 2460
aagaatgact tggggcatcc tttttgtaat aatttgaggt ctggagattg gatgattgac 2520
tatgtcagta accggcttat ttcacgatca ggaactattg ctgaagttgg taaatggttg 2580
caggctatgt tcttctacct gaagcagatc ccacgttacc ttatcccatg ttactttgat 2640
gctatattaa ttggtgcata taccactctt ctggatacag catggaagca gatgtcaagc 2700
tttgttcaga atggttcaac ctttgtgaaa cacctttcat tgggttcagt tcaactgtgt 2760
ggagtaggaa aattcccttc cctgccaatt ctttcacctg ccctaatgga tgtaccttat 2820
aggttaaatg agatcacaaa agaaaaggag caatgttgtg tttctctagc tgcaggctta 2880
cctcattttt cttctggtat tttccgctgc tggggaaggg atacttttat tgcacttaga 2940
ggtatactgc tgattactgg acgctatgta gaagccagga atattatttt agcatttgcg 3000
ggtaccctga ggcatggtct cattcctaat ctactgggtg aaggaattta tgccagatac 3060
aattgtcggg atgctgtgtg gtggtggctg cagtgtatcc aggattactg taaaatggtt 3120
ccaaatggac tagacattct caagtgccca gtttccagaa tgtatcctac agatgattct 3180
gctcctttgc ctgctggcac actggatcag ccattgtttg aagtcataca ggaagcaatg 3240
caaaaacaca tgcagggcat acagttccga gaaaggaatg ctggtcccca gatagatcga 3300
aacatgaagg acgaaggttt taatataact gcaggagttg atgaagaaac aggatttgtt 3360
tatggaggaa atcgtttcaa ttgtggcaca tggatggata aaatgggaga aagtgacaga 3420
gctagaaaca gaggaatccc agccacacca agagatgggt ctgctgtgga aattgtgggc 3480
ctgagtaaat ctgctgttcg ctggttgctg gaattatcca aaaaaaatat tttcccttat 3540
catgaagtca cagtaaaaag acatggaaag gctataaagg tctcatatga tgagtggaac 3600
agaaaaatac aagacaactt tgaaaagcta tttcatgttt ccgaagaccc ttcagattta 3660
aatgaaaagc atccaaatct ggttcacaaa cgtggcatat acaaagatag ttatggagct 3720
tcaagtcctt ggtgtgacta tcagctcagg cctaatttta ccatagcaat ggttgtggcc 3780
cctgagctct ttactacaga aaaagcatgg aaagctttgg agattgcaga aaaaaaattg 3840
cttggtcccc ttggcatgaa aactttagat ccagatgata tggtttactg tggaatttat 3900
gacaacgcat tagacaatga caactacaat cttgctaaag gtttcaatta tcaccaagga 3960
cctgagtggc tgtggcctat tgggtatttt cttcgtgcaa aattatattt ttccagattg 4020
atgggcccgg agactactgc aaagactata gttttggtta aaaatgttct ttcccgacat 4080
tatgttcatc ttgagagatc cccttggaaa ggacttccag aactgaccaa tgagaatgcc 4140
cagtactgtc ctttcagctg tgaaacacaa gcctggtcaa ttgctactat tcttgagaca 4200
ctttatgatt tatag 4215
Claims (15)
- 기준 전장 인간 GDE 서열, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 제시된 아미노산 서열을 갖는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된, 기능성 절두된 인간 GDE 폴리펩티드.
- 제 1 항에 있어서, 하기와 같은, 기능성 절두된 인간 GDE 폴리펩티드:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 및 1235-1532 에서의 아미노산 잔기를 포함하거나;
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함하거나; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다. - 제 1 항 또는 제 2 항에 있어서, 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합을 포함하는, 기능성 절두된 인간 GDE 폴리펩티드.
- 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, SEQ ID NO:2-6 및 SEQ ID NO:48-52 로부터 선택되는 서열을 갖는, 기능성 절두된 인간 GDE 폴리펩티드.
- 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, SEQ ID NO:5 로 이루어지는 아미노산 서열을 갖는, 기능성 절두된 인간 GDE 폴리펩티드.
- 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자.
- 하기를, 바람직하게는 이 순서대로, 포함하는 핵산 구축물:
- 프로모터;
- 임의로, 인트론;
- 제 6 항의 핵산 분자; 및
- 폴리아데닐화 신호. - 하기를 포함하는 벡터, 특히 바이러스 벡터:
- 제 6 항의 핵산 분자; 또는
- 제 7 항의 핵산 구축물. - 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 구축물을 포함하는 바이러스 벡터로서, 기능성 비-인간 GDE 폴리펩티드는 약 1500 개 미만의 아미노산을 포함하는, 바이러스 벡터.
- 제 9 항에 있어서, 기능성 비-인간 GDE 폴리펩티드는 SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 (Pteropus alecto) GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드로 이루어지는 군으로부터 선택되고, 기능성 비-인간 GDE 폴리펩티드는 바람직하게는 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드인, 바이러스 벡터.
- 제 8 항 내지 제 10 항 중 어느 한 항에 있어서, AAV 벡터인, 바이러스 벡터.
- 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물 또는 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터로 형질전환된 단리된 세포로서, 세포는 특히 간 세포, 근육 세포, 심장 세포 또는 CNS 세포인, 단리된 세포.
- 약제로서 사용하기 위한, 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드, 제 9 항에 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드, 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물, 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터, 또는 제 12 항에 따른 단리된 세포.
- GSDIII (코리병) 의 치료 방법에서 사용하기 위한, 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드, 제 9 항에 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드, 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물, 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터, 또는 제 12 항에 따른 단리된 세포.
- GSDIII (코리병) 의 치료 방법에서 사용하기 위한, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18306088.8 | 2018-08-08 | ||
EP18306088 | 2018-08-08 | ||
PCT/EP2019/071158 WO2020030661A1 (en) | 2018-08-08 | 2019-08-06 | Mini-gde for the treatment of glycogen storage disease iii |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210053902A true KR20210053902A (ko) | 2021-05-12 |
Family
ID=63311942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217006722A KR20210053902A (ko) | 2018-08-08 | 2019-08-06 | 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde |
Country Status (17)
Country | Link |
---|---|
US (1) | US20210292724A1 (ko) |
EP (2) | EP4230733A1 (ko) |
JP (2) | JP2021532810A (ko) |
KR (1) | KR20210053902A (ko) |
CN (1) | CN112654698A (ko) |
AU (1) | AU2019317754A1 (ko) |
BR (1) | BR112021002202A2 (ko) |
CA (1) | CA3107572A1 (ko) |
DK (1) | DK3833746T3 (ko) |
EA (1) | EA202190475A1 (ko) |
ES (1) | ES2946415T3 (ko) |
FI (1) | FI3833746T3 (ko) |
IL (1) | IL280570A (ko) |
MA (1) | MA53268B1 (ko) |
PL (1) | PL3833746T3 (ko) |
PT (1) | PT3833746T (ko) |
WO (1) | WO2020030661A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT202000003371A1 (it) * | 2020-02-19 | 2021-08-19 | Enea Agenzia Naz Per Le Nuove Tecnologie Lenergia E Lo Sviluppo Economico Sostenibile | Composto per il trattamento di una glicogenosi |
EP4189098A1 (en) | 2020-07-27 | 2023-06-07 | Anjarium Biosciences AG | Compositions of dna molecules, methods of making therefor, and methods of use thereof |
JP2023539219A (ja) | 2020-08-24 | 2023-09-13 | ジェネトン | 糖原病iiiの治療のためのc末端切断gde |
KR20240012370A (ko) | 2021-04-20 | 2024-01-29 | 안자리움 바이오사이언시스 아게 | 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노트랜스퍼라제를 인코딩하는 dna 분자의 조성물, 이를 제조하는 방법 및 이를 사용하는 방법 |
WO2023237731A1 (en) | 2022-06-09 | 2023-12-14 | Genethon | N-terminal truncated gde for the treatment of glycogen storage disease iii |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030157064A1 (en) | 2001-11-09 | 2003-08-21 | Pascal Neuville | Chimeric promoters for controlling expression in muscle cells |
MX360727B (es) | 2004-06-01 | 2018-11-14 | Genzyme Corp | Composiciones y metodos para evitar la agregacion del vector aav. |
DK2282764T3 (da) | 2008-04-22 | 2019-10-14 | Vib Vzw | Leverspecifikke nukleinsyreregulerende elementer samt fremgangsmåder og anvendelser heraf |
US20160089451A1 (en) * | 2013-02-20 | 2016-03-31 | Dustin D. Armstrong | Methods and compositions for treatment of forbes-cori disease |
CA3209883A1 (en) | 2013-07-22 | 2015-01-29 | The Children's Hospital Of Philadelphia | Variant aav and compositions, methods and uses for gene transfer to cells, organs and tissues |
EP3800261A1 (en) | 2014-01-21 | 2021-04-07 | Vrije Universiteit Brussel | Muscle-specific nucleic acid regulatory elements and methods and use thereof |
WO2015162302A2 (en) | 2014-04-25 | 2015-10-29 | Genethon | Treatment of hyperbilirubinemia |
WO2016106303A1 (en) * | 2014-12-23 | 2016-06-30 | THE UNITED STATES OF AMERICA, as representd by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES | Adeno-associated virus vectors encoding modified g6pc and uses thereof |
-
2019
- 2019-08-06 US US17/265,528 patent/US20210292724A1/en active Pending
- 2019-08-06 DK DK19746522.2T patent/DK3833746T3/da active
- 2019-08-06 CN CN201980052158.4A patent/CN112654698A/zh active Pending
- 2019-08-06 EP EP23163233.2A patent/EP4230733A1/en active Pending
- 2019-08-06 EP EP19746522.2A patent/EP3833746B1/en active Active
- 2019-08-06 PT PT197465222T patent/PT3833746T/pt unknown
- 2019-08-06 KR KR1020217006722A patent/KR20210053902A/ko active Search and Examination
- 2019-08-06 BR BR112021002202-3A patent/BR112021002202A2/pt unknown
- 2019-08-06 MA MA53268A patent/MA53268B1/fr unknown
- 2019-08-06 EA EA202190475A patent/EA202190475A1/ru unknown
- 2019-08-06 FI FIEP19746522.2T patent/FI3833746T3/fi active
- 2019-08-06 WO PCT/EP2019/071158 patent/WO2020030661A1/en unknown
- 2019-08-06 AU AU2019317754A patent/AU2019317754A1/en active Pending
- 2019-08-06 JP JP2021506450A patent/JP2021532810A/ja active Pending
- 2019-08-06 ES ES19746522T patent/ES2946415T3/es active Active
- 2019-08-06 CA CA3107572A patent/CA3107572A1/en active Pending
- 2019-08-06 PL PL19746522.2T patent/PL3833746T3/pl unknown
-
2021
- 2021-02-01 IL IL280570A patent/IL280570A/en unknown
-
2024
- 2024-02-26 JP JP2024026467A patent/JP2024054398A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3833746A1 (en) | 2021-06-16 |
PL3833746T3 (pl) | 2023-12-04 |
MA53268A (fr) | 2021-11-17 |
IL280570A (en) | 2021-03-25 |
EA202190475A1 (ru) | 2021-04-16 |
WO2020030661A1 (en) | 2020-02-13 |
EP4230733A1 (en) | 2023-08-23 |
US20210292724A1 (en) | 2021-09-23 |
PT3833746T (pt) | 2023-05-25 |
DK3833746T3 (da) | 2023-05-30 |
FI3833746T3 (fi) | 2023-06-01 |
BR112021002202A2 (pt) | 2021-05-04 |
JP2021532810A (ja) | 2021-12-02 |
CA3107572A1 (en) | 2020-02-13 |
JP2024054398A (ja) | 2024-04-16 |
MA53268B1 (fr) | 2023-06-28 |
CN112654698A (zh) | 2021-04-13 |
EP3833746B1 (en) | 2023-03-29 |
ES2946415T3 (es) | 2023-07-18 |
AU2019317754A1 (en) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110050063B (zh) | 酸性α-葡萄糖苷酶变体及其用途 | |
KR20210053902A (ko) | 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde | |
CN109843930B (zh) | 酸性α-葡萄糖苷酶变体及其用途 | |
RU2742352C2 (ru) | Векторы фактора fviii на основе аденоассоциированных вирусов, соответствующие вирусные частицы и содержащие их терапевтические композиции | |
KR102484396B1 (ko) | 아데노-관련된 바이러스 인자 viii 벡터 | |
US6544786B1 (en) | Method and vector for producing and transferring trans-spliced peptides | |
CN109790528B (zh) | 酸性α-葡萄糖苷酶变体及其用途 | |
KR20190100318A (ko) | 페닐케톤뇨증을 치료하기 위한 유전자 치료 | |
KR20220007056A (ko) | 뇌에서 증진된 특이성을 갖는 바이러스 조성물 | |
CN112424345A (zh) | Aav载体在青少年对象中的稳定表达 | |
CN113316639A (zh) | 用于治疗庞贝氏病的治疗性腺相关病毒 | |
CN110914419A (zh) | 糖原贮积病iii的治疗 | |
CN114555808A (zh) | 嵌合多肽及其用途 | |
KR20220112262A (ko) | Nadh 탈수소효소 단백질을 이용한 레버 유전성 시신경병증 치료용 조성물 및 방법 | |
KR20230002788A (ko) | 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물 | |
US20220395582A1 (en) | Compositions and methods of inducing differentiation of a hair cell | |
KR20230087436A (ko) | 당뇨병을 치료하기 위한 변형된 인슐린 및 글루코키나제 핵산 | |
RU2780329C2 (ru) | Варианты кислой альфа-глюкозидазы и их использование | |
RU2780410C2 (ru) | Варианты кислой альфа-глюкозидазы и их использование | |
RU2792432C2 (ru) | Стабильная экспрессия векторов на основе аденоассоциированного вируса у несовершеннолетних пациентов | |
KR20230066453A (ko) | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 | |
TW202221119A (zh) | Dna結合域轉活化子及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |