KR20210053902A - 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde - Google Patents

글리코겐 저장 질환 iii 의 치료를 위한 미니-gde Download PDF

Info

Publication number
KR20210053902A
KR20210053902A KR1020217006722A KR20217006722A KR20210053902A KR 20210053902 A KR20210053902 A KR 20210053902A KR 1020217006722 A KR1020217006722 A KR 1020217006722A KR 20217006722 A KR20217006722 A KR 20217006722A KR 20210053902 A KR20210053902 A KR 20210053902A
Authority
KR
South Korea
Prior art keywords
leu
seq
glu
ala
ile
Prior art date
Application number
KR1020217006722A
Other languages
English (en)
Inventor
주세페 론치티
파뜨리스 비달
페데리코 민고치
Original Assignee
제네똥
아쏘씨아씨옹 엥스띠뛰 드 미올로지
위니베르씨떼 데브리 발 데쏜느
인스티튜트 내셔널 드 라 싼테 에 드 라 리셰르셰 메디칼르 (인 썸)
쏘흐본느 유니베흐시테
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제네똥, 아쏘씨아씨옹 엥스띠뛰 드 미올로지, 위니베르씨떼 데브리 발 데쏜느, 인스티튜트 내셔널 드 라 싼테 에 드 라 리셰르셰 메디칼르 (인 썸), 쏘흐본느 유니베흐시테 filed Critical 제네똥
Publication of KR20210053902A publication Critical patent/KR20210053902A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1055Levansucrase (2.4.1.10)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/010254-Alpha-glucanotransferase (2.4.1.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01033Amylo-alpha-1,6-glucosidase (3.2.1.33)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Neurology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines Containing Plant Substances (AREA)

Abstract

본 발명은 글리코겐 저장 질환 III 의 치료를 위한 미니-GDE 에 관한 것이다.

Description

글리코겐 저장 질환 III 의 치료를 위한 미니-GDE
본 발명은 글리코겐 저장 질환 III (Glycogen storage disease III, GSDIII) 의 치료에 관한 것이다.
AGL 유전자의 돌연변이는 글리코겐 탈분지 효소 (glycogen debranching enzyme, GDE), 또는 글리코겐 분해에 관여하는 효소인 "아밀로-알파-1,6-글루코시다제, 4-알파-글루카노트랜스페라아제" 의 유전적 결핍을 유발한다. GDE 는 단백질 상의 상이한 자리에서 일어나는 2개의 독립적인 촉매 활성을 갖는다: 4-알파-글루코트랜스페라아제 활성 및 아밀로-1,6-글루코시다제 활성. GDE 의 유전적 결핍은 글리코겐 저장 질환 III (GSD III) 에서 불완전한 글리코겐분해를 유발하고, 이는 다양한 기관, 주로 간과 근육에서 짧은 외쇄를 갖는 비정상적인 글리코겐의 축적을 초래한다. 상기 질환은 간비대, 저혈당증, 단신, 가변 근육병증 및 심근병증을 특징으로 한다. 대부분의 환자는 간과 근육 모두를 포함하는 질환 (IIIa 형) 을 갖는 반면, 일부 환자 (~15 %) 는 단지 간 관여를 갖는다 (IIIb 형). 간 증상은 대개 소아기에 나타난다. 간경변 및 간세포 암종은 일부 경우에 보고되어 왔다 (Chen et al., 2009, Scriver's Online Metabolic & Molecular Bases of inherited Disease, New York: McGraw-Hill; Kishnani et al., 2010, Genet Med 12, 446-463). 근육 약화가 소아기 동안 존재했을 수 있다. 그것은 성인에서 더욱 우세하게 되며 삼십대 또는 사십대에 발병한다. 진행성 근육 약화로부터 유의한 이환율이 존재하고, 후기 단계의 환자는 휠체어 신세를 지게 될 수 있다. 환자는 또한 심근병증을 발달시킬 수 있다. 이들 환자가 발병하는 증상의 중증도에는 상당한 임상적 가변성이 있다. 진행성 근육병증 및/또는 심근병증 및/또는 말초신경병증은 성인에서 주된 이환의 원인이다 (Kishnani et al., 2010, Genet Med 12, 446-463; Cornelio et al., 1984, Arch Neurol 41, 1027-1032; Coleman et al., 1992, Ann Intern Med 116, 896-900). 질환과 관련된 가능한 신경학적 증상의 보고는 주의 변동, 실행 기능의 결핍 및 손상된 감정 기술을 보고한 GSDIII 환자와 함께 일하는 임상의로부터 유래한다 (Michon et al., 2015, J Inherit Metab Dis, 38(3): 573-580). 따라서, 상기 질환의 GDE-/- 마우스 모델에서, 신경계 전반에 걸쳐 글리코겐의 광범위한 축적이 기록되었지만 (Pagliarani et al., 2014, Biochim Biophys Acta, 1842(11): 2318-2328; Liu et al., 2014, Mol Genet Metab, 111(4): 467-476), 글리코겐의 축적과 연관된 표현형의 신중한 특성분석이 여전히 누락되어 있다. 현재 치료법은 증상을 보이며, 질환에 대한 효과적인 치료법은 없다. 저혈당증은 옥수수전분 보충물을 포함하는 고탄수화물 빈번한 식사 또는 야간 위 적하 급식 (nocturnal gastric drip feedings) 에 의해 조절될 수 있다. 근육병증 환자는 낮시간 및 밤새 장내 주입 동안 고단백질 식이로 치료되어 왔다. 일부 환자에서 일시적인 증상의 개선이 기록되었지만, 고단백질 식이가 진행성 근육병증을 예방 또는 치료한다는 것을 입증하는 조직 연구 또는 장기간 데이터는 존재하지 않는다 (Kishnani et al., 2010, Genet Med 12, 446-463). 이러한 접근법은 이러한 질환의 장기간 경과 및 이환율을 변경하는데 거의 도움이 안된다.
그러므로, GSD III 의 장기간 치료에 대한 필요가 여전히 존재한다. 병든 조직에서 GDE 단백질을 안정적으로 대체하는 것을 목표로 하는 유전자 요법은 잠재적인 치료 접근법으로서 보인다. 그러나, 큰 크기의 GDE 이식유전자는 대부분의 유전자 요법 벡터의 크기 한계를 맞출 수 없으므로 큰 장애가 된다. 실제로, 인간 AGL 유전자는 85 kb 길이이고, 175 kDa GDE 단백질을 발현하는 4596-bp 코딩 영역 및 2371-bp 3' 비번역 서열을 포함하는 7.4-kb mRNA 를 코딩하는 35 개의 엑손으로 구성된다 (Bao Y et al., 1996, Genomics., 38(2):155-65). 이는 이것은 실제 문제가 되며, 그 이유는 GDE 발현 카세트 (예를 들어 AAV 벡터의 경우 적어도 프로모터, GDE 코딩 서열, polyA 신호 및 두 개의 ITR 을 포함함) 의 최소 크기는 생체내 (in vivo) 유전자 전달을 위한 AAV 유전자 요법 벡터 내로 패키징될 수 있는 게놈 크기 한계인, 5 kb 보다 클 것이기 때문이다. 본 발명자들은 이전에 듀얼 AAV 벡터의 사용으로 이러한 크기 한계를 극복할 것을 제안했다. 이러한 접근법에 뒤이어, 큰 이식유전자 코딩 서열의 일부를 각각 함유하는, 두 개의 벡터를 사용하여 동일한 세포를 형질도입한다. 듀얼 AAV 벡터의 사용은 유망하므로, 경제적 이유 및 현실적 이유 모두를 위해 오직 하나의 바이러스 벡터를 실행하는 유전자 요법 전략을 제공하는 것이 바람직할 것이다.
그러므로 GSD III 의 치료에서 유전자 요법을 개선하는 신규한 전략에 대한 필요가 존재한다.
본 발명의 제 1 양태는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된 기능성 절두된 (functional truncated) 인간 GDE 폴리펩티드에 관한 것이다. 특정 구현예에서, 기준 전장 인간 GDE 서열은 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 및 1235-1532 에서의 아미노산 잔기를 포함하거나;
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함하거나; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다.
다른 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 적어도 하나의 아미노산이거나;
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 적어도 하나의 아미노산이거나; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 결실된 아미노산은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 적어도 하나의 아미노산이다.
또 다른 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175, 또는 적어도 200 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
추가 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 15 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 30 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 81 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 103 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 129 의 아미노산의 결실; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 13 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 64 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 86 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 112 의 아미노산의 결실; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 14 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 65 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 87 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 113 의 아미노산의 결실.
추가의 특정 구현예에서:
(i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실; 또는
(ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택되거나:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실; 또는
(iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기 표 2 에 제시된 바와 같은 결실 또는 결실의 조합을 포함한다. 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 하기를 포함한다:
(i) 하기 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) 하기 표 3 에 제시된 바와 같은, 결실 또는 결실의 조합.
그러한 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2-10 및 SEQ ID NO:48-52 로부터, 특히 SEQ ID NO:2-6 로부터 선택되는 서열을 갖는 것을, 제한 없이, 포함한다. 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2, 5 또는 6 으로부터 선택되는 서열을 포함하거나 그것으로 이루어지는 서열을 갖는다. 추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:5 에 제시된 서열을 포함하거나 그것으로 이루어지는 서열을 갖는다.
또다른 양태에서, 본 발명은 본원에 개시된 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.
추가의 양태에서, 본 발명은 하기를, 바람직하게는 이 순서대로, 포함하는 핵산 구축물에 관한 것이다:
- 프로모터;
- 임의로, 인트론;
- 본 발명의 기능성 절두된 인간 폴리펩티드를 코딩하는, 본원에 개시된 핵산 분자; 및
- 폴리아데닐화 신호.
또다른 양태에서, 본 발명은 하기를 포함하는 벡터에 관한 것이다:
- 본 발명의 핵산 분자; 또는
- 본 발명의 핵산 구축물.
특정 구현예에서, 벡터는 바이러스 벡터일 수 있다.
추가의 양태에 따르면, 본 발명은 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 구축물을 포함하는 바이러스 벡터로서, 기능성 비-인간 GDE 폴리펩티드는 약 1500 개 미만의 아미노산을 포함하는, 바이러스 벡터에 관한 것이다. 기능성 비-인간 GDE 폴리펩티드는 하기로 이루어지는 군에서, 제한 없이, 선택될 수 있다: SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 (Pteropus alecto) GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드이다.
본 발명의 벡터의 특정 구현예에서, 상기 벡터는 AAV 벡터 또는 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터일 수 있다. 특정 구현예에서, 벡터는 AAV 벡터, 예컨대 단일 가닥 또는 이중 가닥 자기 상보적 AAV 벡터, 바람직하게는 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV9P1, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖는 또는 키메라 캡시드를 갖는 AAV 벡터이다. 특정 구현예에서, AAV 벡터는 AAV9, AAV9P1 또는 AAV6 캡시드를 갖는다.
추가의 양태에서, 본 발명은 본 발명의 핵산 분자, 핵산 구축물 또는 벡터로 형질전환된 단리된 세포에 관한 것이다. 세포는, 예를 들어, 간 세포, 근육 세포, 심장 세포 또는 CNS 세포일 수 있다.
또다른 양태에서, 본 발명은 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포를, 약학적으로 허용가능한 담체에, 포함하는 약학적 조성물에 관한 것이다.
본 발명은 또한, 특정 양태에서, 약제로서 사용하기 위한, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 기능성 비-인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포에 관한 것이다.
추가의 양태에서, 본 발명은 GSDIII (코리병 (Cori disease)) 의 치료 방법에서 사용하기 위한, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드, 기능성 비-인간 GDE 폴리펩티드, 핵산 분자, 핵산 구축물, 벡터, 또는 세포에 관한 것이다.
본 발명은 또한 GSDIII (코리병) 의 치료 방법에서 사용하기 위한, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드에 관한 것이다.
도 1. 감소된 크기의 비-인간 포유류 GDE 서열. 아미노산 수로서 표현되는, 상이한 포유류 GDE 단백질의 크기가 보고된다 (paGDE: 검은날여우박쥐 GDE 서열, oGDE: 오랑우탄 GDE 서열, gGDE: 고릴라 GDE 서열, hoGDE: 말 GDE 서열, hGDE: 인간 아이소폼 (isoform) 1 GDE 서열).
도 2. 인간 GDE 서열 상의 상이한 절두의 도해적 표현. 세 가지 상이한 인간 GDE 절두, Δ1, Δ2-3 및 Δ4 가 보고된다.
도 3. gGDE 단백질 발현. GDE 녹-아웃 (knock-out) (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE (gGDE) 를 발현하는 단일 AAV9 벡터를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 웨스턴 블롯에 의해 심장에서 GDE 를 검출했다. 야생형 (Wild-type) (WT) GDE-KO 동물을 양성 및 음성 컨트롤로서 각각 사용했다.
도 4. AAV9-gGDE 벡터는 사두근으로부터 글리코겐을 효율적으로 제거한다. GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 동물을 희생시키고, 사두근에서 글리코겐 축적을 측정했다. 이와 병행하여, 동일 연령 (age-matched) 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 글리코겐을 측정했다. 통계적 분석을 ANOVA 에 의해 수행했다 (*** = p<0.001, **** = p<0.0001, ns = 유의하지 않음).
도 5. AAV9-gGDE 벡터는 GSDIII 마우스에서 근육 기능을 구조한다 (rescue). GDE 녹-아웃 (KO) 마우스에게 1x1012 vg/마우스의 고릴라 GDE 를 발현하는 단일 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1012 vg/마우스의 인간 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 벡터 주입후 3 개월째에, 근육 기능을 와이어 행 테스트 (wire-hang test) 에 의해 점수매겼다. 그래프에서 동일 연령 야생형 (WT) 및 GDE 녹-아웃 (KO) 동물에서 측정된 와이어 행 성능이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (**** = p<0.0001, ns = 유의하지 않음).
도 6. 시험관내 절두된 GDE 활성의 측정. Huh-7 세포를 CMV 프로모터의 제어 하에 전체 크기 인간 GDE (hGDE), 하나의 절두된 인간 GDE (GDE Δ4) 또는 고릴라 GDE (gGDE) 를 발현하는 플라스미드로 트랜스펙션시켰다. 이와 병행하여 세포를 컨트롤로서의 GFP-발현 플라스미드로 트랜스펙션시켰다. 트랜스펙션 후 48 시간째에, 시토졸 추출물을 준비하고, GDE 활성을 측정했다. 막대그래프에서 한계 덱스트린의 소화로부터 방출된 글루코스로서 표현되는 GDE 활성의 수준이 보여진다. 통계적 분석을 ANOVA 에 의해 수행했다 (* = p<0.05 vs CMV-hGDE).
도 7. 절두된 GDE 가 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE) 또는 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDE) 를 또는 2x1011 vg/마우스의 인간 전체 크기 GDE 를 발현하는 듀얼 AAV9 벡터 (AAV9-GDEov) 를 주입했다. 주입후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다. 액틴을 로딩 컨트롤로서 사용했다.
도 8. 절두된 GDE 는 생체내에서 활성이다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 1x1011 vg/마우스의 야생형 (wt) 또는 코돈 최적화된 (co) 인간 GDE 코딩 서열로부터 유래된 절두된 인간 GDE 를 발현하는 AAV9 벡터 (AAV9-Δ1-GDE, AAV9-Δ4-GDE, AAV9-Δ2/3-GDE) 를 주입했다. 이와 병행하여 마우스에게 1x1011 vg/마우스의 코돈 최적화된 고릴라 GDE 를 발현하는 AAV9 벡터 (AAV9-gGDEco) 를 또는 컨트롤로서의 PBS 를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 활성을 분석했다.
도 9. 절두된 GDE 가 시험관내에서 생산된다. HEK293T 세포를 전체 크기 GDE (GDEfs) 또는 5 가지 절두된 인간 GDE (Δ9 + Δ2/3; Δ10 + Δ2/3; Δ11 + Δ2/3; Δ12 + Δ2/3; Δ13 + Δ2/3) 를 발현하는 플라스미드로 트랜스펙션시켰다. GFP 트랜스펙션된 세포를 컨트롤로서 사용했다. 트랜스펙션 후 3 일째에, 세포를 수확하고, 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
도 10. 절두된 GDE 는 생체내에서 생산된다. GDE 녹-아웃 마우스의 앞정강근 (TA) 근육에 2x1011 vg/마우스의 전체 크기 GDE (GDEfs) 또는 7 가지 절두된 인간 GDE (Δ2/3; Δ9 + Δ2/3; Δ10 + Δ2/3; Δ13 + Δ2/3; 및 Δ1) 를 발현하는 AAV9 벡터를 주입했다. 주입 후 15 일째에, TA 를 수득하고 가공하여 GDE 의 발현을 웨스턴 블롯에 의해 분석했다.
발명의 상세한 설명
임의의 개시된 값 또는 범위에 대해 본원에서 사용되는 바와 같은, 용어 "약" 은 언급된 수치 값이 약간의 부정확성, 예를 들어, 그 값에 상당히 가까운 값 또는 거의, 예컨대 언급된 값 또는 범위의 플러스 또는 마이너스 10 %, 특히 예컨대 플러스 또는 마이너스 5% 를 허용한다는 것을 시사한다.
GDE 단백질의 삼차원 구조에 관한 지식의 결여에도 불구하고, 본 발명자들은 코딩 서열이 유전자 요법 벡터 내로 패키징될 수 있을 정도로 충분히 작으면서도, GDE 기능성을 보존하는 GDE 폴리펩티드를 식별했다, 그 외에는 "미니 (mini)-GDE 폴리펩티드" 로서 언급된다.
"유전자 요법 벡터" 는 유전자 요법에 적합한 임의의 벡터를 의미한다. 특히, 유전자 요법 벡터는 플라스미드 또는 재조합 바이러스 예컨대 레트로바이러스 또는 렌티바이러스에서 유래되는 바이러스 벡터일 수 있다. 바람직하게는, 바이러스 벡터는 AAV 벡터, 예컨대 간 조직 또는 근육 세포를 형질도입시키기에 적합한 AAV 벡터이다. 임상 시험에서 및 전임상 모델의 근육 질환에서의 광범위한 경험은 아데노-연관 바이러스 (adeno-associated virus) (AAV) 를 GSDIII 를 위한 생체내 유전자 요법에서 선택되는 벡터로서 시사한다. 이들 벡터는 간 및 근육을 효율적으로 형질도입시키고, 그들의 생산은 규모 확장할 수 있고, 다른 유전자 요법 벡터와 비교하여 그들은 상대적으로 낮은 면역원성 프로파일을 갖는다. 그러나, 유전자 대체를 위해 AAV 를 사용함에 있어서 가장 큰 제한 중 하나는 그들의 제한된 캡시드화 (encapsidation) 크기 한계 (약 5 kb) 이다. 실제로, 재조합 AAV 생산 동안, 5 kb 보다 큰 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 단편화된 게놈을 함유할 수 있으며, 이는 유전자 전달의 효능을 감소시킨다.
아래에서 상세히 설명될 바와 같이, 본 발명의 맥락에서, 표현 "미니-GDE 폴리펩티드" 는 (i) 기능성 절두된 인간 GDE 폴리펩티드 또는 (ii) 기능성 비-인간 GDE 폴리펩티드를 망라한다.
본 발명의 제 1 양태는 따라서 코딩 서열이 단일 AAV 벡터 내로 효율적으로 패키징될 수 있을 정도로 충분히 작은 기능성 미니-GDE 폴리펩티드이다.
"기능성" GDE 폴리펩티드는 GDE 단백질의 효소적 활성 중 적어도 하나, 바람직하게는 GDE 단백질의 효소적 활성의 전부를, 적어도 부분적으로, 유지하는 폴리펩티드를 의미한다. 그 결과, 본 발명에서 실행되는 기능성 GDE 폴리펩티드는 생체내에서 글리코겐 축적 및 근육 강도를 구조할 수 있다. 위에서 정의된 바와 같이, GDE 효소적 활성은 글리코겐 분해에 관여하는, 4-알파-글루코트랜스페라아제 활성 및 아밀로-1,6-글루코시다제 활성이다. GDE 의 트랜스페라아제 활성은 글리코겐의 글루코스 단위체 세 개를 하나의 사슬로부터 또다른 사슬로 재배치한다. 이는 하나의 글루코스 단위체를 분지점에 남기며, 이는 후속적으로 글루코시다제 활성에 의해 글루코스로서 방출된다. 특정 구현예에서, 본 발명의 기능성 미니-GDE 폴리펩티드는 전장 GDE 폴리펩티드와, 특히 전장 인간 GDE 폴리펩티드와 동일한 기능성을 갖는다. 예를 들어, 본 발명의 기능성 미니-GDE 폴리펩티드는 위에 기재된 하나, 바람직하게는 둘 모두의, 효소적 활성에 관하여 적어도 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 또는 적어도 99 %, 또는 전장 인간 GDE 단백질, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 의 전장 인간 GDE 단백질과 비교하여 적어도 100 % 의 활성을 가질 수 있다. 본 발명의 미니-GDE 단백질의 활성은 전장 인간 GDE 단백질, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 의 전장 인간 GDE 단백질의 활성의 심지어는 100 % 초과, 예컨대 110 %, 120 %, 130 %, 140 %, 150%, 200%, 500%, 700% 초과, 또는 심지어는 1000 % 초과일 수 있다.
통상의 기술자는 폴리펩티드가 기능성 GDE 폴리펩티드인지 여부를 용이하게 확인할 수 있다. 적합한 방법은 통상의 기술자에게 명백할 것이다. 예를 들어, 하나의 적합한 시험관내 방법은 폴리펩티드를 코딩하는 핵산을 벡터, 예컨대 플라스미드 또는 바이러스 벡터 내로 삽입하는 것, 숙주 세포, 예컨대 293T 또는 HeLa 세포, 또는 다른 세포 예컨대 Huh7 를, 벡터로 트랜스펙션 또는 형질도입시키는 것, 및 GDE 활성에 대해 어세이하는 것을 수반한다. 적합한 방법은 아래 실험 파트에서 더욱 상세히 기재된다. 예를 들어, GDE 활성은 균질화된 마우스 조직을 한계 덱스트린과 함께 인큐베이션한 후에 생산된 글루코스를 측정함으로써 확인될 수 있다. 다른 방법은 GDE KO 동물의 조직에서의 GDE 발현을, 예컨대 웨스턴 블롯에 의해, 확인함으로써, 글리코겐 포스포릴라아제-소화된 글리코겐으로부터 생산되는 글루코스를 따라감으로써, 벡터의 투여 후에, 예컨대 투여 후 1, 2 또는 3 개월째에 처리된 GDE-KO 동물의 근육 강도를 와이어 행에 의해 평가함으로써, 또는 근육 및/또는 심장 조직에서의 글리코겐 축적의 구조를 평가함으로써, GDE 활성을 시험하는 것을 포함한다.
본 발명의 제 1 양태의 제 1 변형예에서, 미니-GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 절두된, 기능성 절두된 인간 GDE 폴리펩티드이다.
용어 "절두된 인간 GDE 폴리펩티드" 는 절두된 인간 GDE 가 유래되는 기준 전장 인간 GDE 서열에 대해, 아미노산 결실에 의해 더 짧게 만들어진 임의의 인간 GDE 폴리펩티드를 망라한다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 1 개 아미노산이 결실된다. 바람직하게는, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된다. 바람직한 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열에 대해 적어도 약 50, 100 또는 150 개 아미노산이 결실된다.
특정 구현예에서, 기준 전장 인간 GDE 서열에 대해 절두된 기능성 절두된 인간 GDE 폴리펩티드는 상기 기준 전장 인간 GDE 서열에 대해 하나 이상의 부가적 아미노산 변형을 포함할 수 있다. 특히, 아래에서 추가로 기재되는 결실(들)에 더하여, 기능성 절두된 인간 GDE 폴리펩티드는 기준 전장 인간 GDE 서열과 비교하여 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함할 수 있다. 예를 들어, 기능성 절두된 인간 GDE 폴리펩티드는, 절두된 인간 GDE 폴리펩티드의 기능성이 보존되는 한, 1 내지 10 (예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10) 개 부가적 아미노산 변형, 특히 1 내지 5 (예를 들어 1, 2, 3, 4 또는 5) 개 부가적 아미노산 변형을 포함할 수 있다.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드가 N-말단 결실을 포함할 때, 메티오닌이 N-말단 단부에 부가될 수 있다.
본 발명의 맥락에서, "기준 전장 인간 GDE 서열" 은 인간 GDE 의 모든 천연 아이소폼을 망라한다. Bao 및 동료들 (Genomics, 1997, 38, 155-165) 은 세 가지 GDE 단백질 아이소폼에 대해 코딩하는 여섯 가지 전사물 변이체의 존재를 식별했다. 전사물 변이체 1-4 는 동일한 단백질, 즉 GDE 아이소폼 1 에 대해 코딩한다. 전사물 변이체 5 및 6 은 GDE 아이소폼 2 및 3 각각에 대해 코딩한다.
용어 "기준 전장 인간 GDE 폴리펩티드" 는 따라서 전구체 형태, 뿐만 아니라 삽입(들), 결실 (들) 및/또는 치환(들)에 의해 변형된 또는 돌연변이된 GDE 의 기능성 유도체인 GDE 단백질 또는 그의 단편을 포함하는 인간 GDE 의 모든 천연 아이소폼을 망라한다. 특히, 기준 전장 인간 GDE 서열은 SEQ ID NO:1 (GDE 아이소폼 1 에 해당함), SEQ ID NO:40 (GDE 아이소폼 2 에 해당함) 및 SEQ ID NO:41 (GDE 아이소폼 3 에 해당함) 로 이루어지는 군으로부터 선택된다.
특정 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 1 에 해당하는, SEQ ID NO:1 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 1235-1532 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-667, 770-894, 1088-1194, 1233-1532 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087, 및/또는 1195-1232 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:1 에 대해 위치 1-428, 668-769, 895-1087 및/또는 1195-1232 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 428 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 110 개 또는 적어도 120 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 15 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 15 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 30 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 30 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 81 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 81 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 103 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 103 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 129 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 129 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 156 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 361 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 668 내지 769 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 895 내지 1087 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1195 내지 1232 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 223 내지 320 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 360 내지 428 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 669 내지 720 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 280 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 425 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 적어도 SEQ ID NO:1 에 대해 위치 1 내지 230 에서의 아미노산으로부터 선택되는 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 15 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 30 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 81 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 103 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 129 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1195 내지 1232 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 360 내지 428 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 669 내지 720 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실;
- SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 위치 1 내지 156 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실
는 위치 1 내지 280 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-156 는 범위 1-280 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실; 및
- SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 결실
는 위치 1 내지 320 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-280 는 범위 223-320 와 중복되기 때문이다.
또다른 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 2 에 해당하는, SEQ ID NO:40 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-650, 753-877, 1071-1177, 1216-1515 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070, 및/또는 1178-1215 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:40 에 대해 위치 1-411, 651-752, 878-1070 및/또는 1178-1215 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 411 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651-752 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878-1070 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178-1215 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 13 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 13 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 64 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 64 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 86 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 86 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 112 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 112 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 139 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 344 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 651 내지 752 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 878 내지 1070 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1178 내지 1215 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 206 내지 303 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 343 내지 411 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 652 내지 703 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 263 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 408 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 213 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 13 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 64 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 86 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 112 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드 SEQ ID NO:40 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 344 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 651 내지 752 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 878 내지 1070 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1178 내지 1215 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 343 내지 411 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 652 내지 703 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실;
- SEQ ID NO:40 에 대해 위치 1 내지 408 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 213 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 위치 1 내지 139 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:40 에 대해 위치 1 내지 139 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실
는 위치 1 내지 263 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-139 는 범위 1-263 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:40 에 대해 위치 1 내지 263 의 아미노산의 결실; 및
- SEQ ID NO:40 에 대해 위치 206 내지 303 의 아미노산의 결실
는 위치 1 내지 303 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-263 는 범위 206-303 와 중복되기 때문이다.
또다른 구현예에서, 기준 전장 인간 GDE 서열은 GDE 아이소폼 3 에 해당하는, SEQ ID NO:41 에 제시된 아미노산 서열을 갖는다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-651, 754-878, 1072-1178, 1217-1516 에서의 아미노산 잔기를 포함한다.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 적어도 하나의 아미노산이다. 추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실되며, 결실된 아미노산(들)은 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071, 및/또는 1179-1216 에서의 임의의 아미노산으로부터 선택된다. 이 구현예에서, 결실된 아미노산은, 그들이 SEQ ID NO:41 에 대해 위치 1-412, 652-753, 879-1071 및/또는 1179-1216 에서의 임의의 아미노산으로부터 선택되는 한, 연속적 아미노산 또는 비-연속적 아미노산일 수 있다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 412 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350 개 또는 적어도 400 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652-753 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80 개 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879-1071 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20, 30, 40, 50, 80, 100, 125, 150, 175 개, 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179-1216 에서의 아미노산으로부터 선택되는 적어도 10, 15, 20 개 또는 적어도 30 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산;
- SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 14 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 14 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 25 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 65 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 65 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 87 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 87 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 113 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 113 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기가 결실된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 140 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 345 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 652 내지 753 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 879 내지 1071 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 150 개 연속적 아미노산, 적어도 175 개 연속적 아미노산 또는 적어도 190 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1179 내지 1216 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 207 내지 304 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 344 내지 412 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 653 내지 704 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산 또는 적어도 50 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 264 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 409 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산; 및/또는
- SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 214 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 50 개 연속적 아미노산 또는 적어도 100 개 연속적 아미노산.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 14 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 65 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 87 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 113 의 아미노산의 결실.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 하나의 결실을 포함하며, 결실은 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 345 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 652 내지 753 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 879 내지 1071 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1179 내지 1216 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 344 내지 412 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 653 내지 704 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실;
- SEQ ID NO:41 에 대해 위치 1 내지 409 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 214 의 아미노산의 결실.
명확하기 하기 위해, 이 구현예에서, 결실은 언급된 범위의 위치에서 모든 연속적 아미노산의 결실에 관한 것이다. 예를 들어, SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 위치 1 내지 140 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당한다.
또한 명확하기 하기 위해, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:41 에 대해 위치 1 내지 140 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실
는 위치 1 내지 264 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-140 는 범위 1-264 에 포함되기 때문이다.
또한, 예를 들어 하기를 포함하는 기능성 절두된 인간 GDE 폴리펩티드:
- SEQ ID NO:41 에 대해 위치 1 내지 264 의 아미노산의 결실; 및
- SEQ ID NO:41 에 대해 위치 207 내지 304 의 아미노산의 결실
는 위치 1 내지 304 의 모든 연속적 아미노산이 결실된 GDE 폴리펩티드에 해당하며, 범위 1-264 는 범위 207-304 와 중복되기 때문이다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 결실 또는 결실의 조합을 포함하며, 결실(들)은 표 1 에서 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7 및 Δ8 로서 언급되는 임의의 결실로부터 선택된다:
표 1:
Figure pct00001
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 2, 3, 4, 5, 6, 7 또는 8 개 결실의 조합을 포함할 수 있으며, 결실(들)은 표 1 에서 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7 및 Δ8 로서 언급되는 임의의 결실로부터 선택된다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합을 포함할 수 있으며, 결실(들)은 표 1 에서 언급된 바와 같다.
표 2:
Figure pct00002
Figure pct00003
Figure pct00004
명확하기 하기 위해, 표 2 는 다음과 같이 이해되어야 한다. 예를 들어 하기 결실의 조합을 포함하는 기능성 절두된 인간 GDE 폴리펩티드: "Δ1+Δ2+Δ3", 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 바와 같이, SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 결실 Δ1, Δ2 및 Δ3 을 포함한다. 다시 말하면, 이 예에서, 기준 전장 GDE 서열이 SEQ ID NO:1 일 때, 기능성 절두된 인간 GDE 폴리펩티드 "Δ1+Δ2+Δ3" 는 SEQ ID NO:1 에 대해 위치 1 내지 156, 위치 361-428 및 위치 668-769 의 모든 연속적 아미노산이 결실된, SEQ ID NO:1 에서 유래하는 기능성 절두된 인간 GDE 폴리펩티드에 해당한다. 따라서, 기준 전장 GDE 서열이 SEQ ID NO:40 일 때, 기능성 절두된 인간 GDE 폴리펩티드 "Δ1+Δ2+Δ3" 는 SEQ ID NO:40 에 대해 위치 1 내지 139, 위치 344-411 및 위치 651-752 의 모든 연속적 아미노산이 결실된, SEQ ID NO:40 에서 유래하는 기능성 절두된 인간 GDE 폴리펩티드에 해당한다.
특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 Δ2 및 Δ3 결실을 포함한다. 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 표 1 에서 언급된 Δ2 및 Δ3 결실을 포함하고, SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에서, 특히 SEQ ID NO:1 에서 유래된다.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 132 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 30 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 81 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 103 개 연속적 아미노산, 적어도 125 개 연속적 아미노산, 또는 적어도 132 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 132 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:1 에 대해 위치 1 내지 132 에서의 아미노산으로부터 선택되는 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 30 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 81 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 103 개 연속적 아미노산, 적어도 125 개 연속적 아미노산, 또는 적어도 132 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 13 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 64 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 86 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 112 개 연속적 아미노산, 또는 적어도 115 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 위치 1 내지 Z2 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:40 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 13 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 64 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 86 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 112 개 연속적 아미노산, 또는 적어도 115 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 115 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산 및 최대 115 개 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 14 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 65 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 87 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 113 개 연속적 아미노산, 또는 적어도 116 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 하나의 아미노산, 바람직하게는 SEQ ID NO:41 에 대해 위치 1 내지 116 에서의 아미노산으로부터 선택되는 적어도 10 개 연속적 아미노산, 적어도 14 개 연속적 아미노산, 적어도 15 개 연속적 아미노산, 적어도 25 개 연속적 아미노산, 적어도 50 개 연속적 아미노산, 적어도 60 개 연속적 아미노산, 적어도 65 개 연속적 아미노산, 적어도 75 개 연속적 아미노산, 적어도 80 개 연속적 아미노산, 적어도 85 개 연속적 아미노산, 적어도 87 개 연속적 아미노산, 적어도 100 개 연속적 아미노산, 적어도 110 개 연속적 아미노산, 적어도 113 개 연속적 아미노산, 또는 적어도 116 개 연속적 아미노산의 N-말단 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 하기를 포함한다:
(i) SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 대해, 표 3 에서 Δ9, Δ10, Δ11, Δ12, 및 Δ13 로서 언급되는 임의의 결실로부터 선택되는 결실 또는 결실의 조합.
표 3:
Figure pct00005
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ9 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:1 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, Δ11, Δ12 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ10 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ11 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ12 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ13 결실.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:1 에 대해 표 3 에서 언급된 바와 같은 Δ9 및 Δ10 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:40 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10, Δ11, Δ12 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ11 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ12 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ13 결실.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:40 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:40 에 대해 표 3 에서 언급된 바와 같은 Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ10 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ11 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ12 결실;
또는
(i) SEQ ID NO:41 에 대해 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합 and
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은, Δ13 결실.
특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:41 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은 Δ9, Δ10, Δ11, Δ12, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
추가의 특정 구현예에서, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에서 유래되고, 하기를 포함한다:
(i) SEQ ID NO:1 에 대해 표 1 에서 언급된 바와 같은 Δ2 및 Δ3 결실, 및
(ii) SEQ ID NO:41 에 대해 표 3 에서 언급된 바와 같은 Δ10, 및 Δ13 결실로부터 선택되는 결실 또는 결실의 조합.
또다른 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:2: SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:3: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:4: SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:5: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 제 1 결실 및 위치 668 내지 769 의 아미노산의 제 2 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:6: SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:7: SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 제 1 결실, 위치 360 내지 428 의 아미노산의 제 2 결실, 및 위치 669 내지 720 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:8: SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:9: SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:10: SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:48: SEQ ID NO:1 에 대해 위치 1-15 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:49: SEQ ID NO:1 에 대해 위치 1-30 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:50: SEQ ID NO:1 에 대해 위치 1-81 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:51: SEQ ID NO:1 에 대해 위치 1-103 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드; 및
- SEQ ID NO:52: SEQ ID NO:1 에 대해 위치 1-129 의 아미노산의 제 1 결실, 위치 361 내지 428 의 아미노산의 제 2 결실 및 위치 668 내지 769 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다:
- SEQ ID NO:2: SEQ ID NO:1 에 대해 위치 1 내지 156 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:3: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:4: SEQ ID NO:1 에 대해 위치 668 내지 769 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:5: SEQ ID NO:1 에 대해 위치 361 내지 428 의 아미노산의 제 1 결실 및 위치 668 내지 769 의 아미노산의 제 2 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:6: SEQ ID NO:1 에 대해 위치 895 내지 1087 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:7: SEQ ID NO:1 에 대해 위치 223 내지 320 의 아미노산의 제 1 결실, 위치 360 내지 428 의 아미노산의 제 2 결실, 및 위치 669 내지 720 의 아미노산의 제 3 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:8: SEQ ID NO:1 에 대해 위치 1 내지 280 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드;
- SEQ ID NO:9: SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드; 및
- SEQ ID NO:10: SEQ ID NO:1 에 대해 위치 1 내지 230 의 아미노산의 결실을 포함하는 기능성 절두된 인간 GDE 폴리펩티드.
결실이 N-말단 결실일 때, 서열의 N-말단 단부에 메티오닌이 부가될 수 있다. 예를 들어, SEQ ID NO:9 는 SEQ ID NO:1 에 대해 위치 1 내지 425 의 아미노산의 결실 및 이러한 결실로부터 초래되는 서열의 N-말단 단부에서의 메티오닌의 부가를 포함한다. 본 출원은 본원에서 구체적으로 개시되는 모든 기능성 GDE 절두된 형태를 개시하며, 상기 기능성 GDE 절두된 형태는 그것의 N-말단 단부에 메티오닌 잔기를 포함한다.
추가의 특정 구현예에서, 본 발명의 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52 로부터 선택되는 서열, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 을 포함하거나 또는 그것으로 이루어진다. 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 과 비교할 때, 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함할 수 있다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 와 비교할 때 1, 2, 3, 4 또는 5 개 아미노산 변형을 포함할 수 있다. 특히, 기능성 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:2 내지 10 및 SEQ ID NO:48 내지 52, 특히 SEQ ID NO:2 내지 10 로부터 선택되는 서열, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 및 SEQ ID NO:6 로부터 선택되는 서열, 더욱 특히 SEQ ID NO:5 와 적어도 80, 85, 90, 95, 96, 97, 98 또는 적어도 99 퍼센트 서열 동일성을 가질 수 있다.
본 발명의 제 1 양태의 제 2 변형예에서, 미니-GDE 는 기능성 비-인간 GDE 폴리펩티드이다.
본 발명의 기능성 비-인간 GDE 폴리펩티드는 코딩 서열이 유전자 요법 벡터 내로, 특히 AAV 벡터 내로 패키징될 수 있을 정도로 충분히 작은 임의의 GDE 폴리펩티드일 수 있다. 실제로, 본 발명자들은 코딩 서열이 천연 인간 GDE 코딩 서열보다 더 짧은 비-인간 GDE 폴리펩티드는 유전자 요법 벡터를 사용하여 GSD III 을 치료하는데 사용될 수 있다는 것을 보였다. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 약 1500, 1480, 1460, 1440, 1420, 1400, 1380, 1360, 1340, 1320, 1300, 1280, 1260, 1240, 1220, 1200, 1180, 1160, 1140, 1120, 1100, 1080, 1060, 1040 개 미만, 1020, 또는 약 1000 개 미만의 아미노산을 포함한다.
특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 약 1000 내지 1500 개 아미노산, 약 1000 내지 1300 개 아미노산, 약 1300 내지 1500 개 아미노산 또는 약 1300 내지 1400 개 아미노산을 포함한다.
본 발명에 따르면, 본 발명의 기능성 비-인간 GDE 폴리펩티드는 위에서 정의된 바와 같이 인간 GDE 폴리펩티드의 생물학적 기능을 유지한다. 특히, 비-인간 GDE 폴리펩티드는 생체내에서 글리코겐 축적 및 근육 강도를 구조할 수 있다.
기능성 비-인간 GDE 폴리펩티드의 아미노산 서열 또는 그것의 코딩 서열은 임의의 비-인간 진핵생물 공급원, 예컨대 효모 또는 비-인간 포유류 또는 조류 종을 포함하는 비-인간 동물로부터 유래할 수 있다. 특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드는 비-인간 포유류 GDE 폴리펩티드이다.
또한, 비-인간 GDE 폴리펩티드는 기준 천연 GDE 폴리펩티드와 비교하여 하나 이상의 아미노산 변형 예컨대 아미노산 삽입, 결실 및/또는 치환을 포함하는 야생형 비-인간 GDE 폴리펩티드의 기능성 변이체일 수 있다. 예를 들어, 비-인간 GDE 폴리펩티드는 비-인간 GDE 폴리펩티드, 특히 비-인간 동물 GDE 폴리펩티드의 기능성 유도체, 예컨대 이들 동물 GDE 폴리펩티드와 적어도 80, 85, 90, 95, 96, 97, 98 또는 적어도 99 퍼센트 서열 동일성을 갖는 SEQ ID NO:11 내지 SEQ ID NO:17 의 폴리펩티드일 수 있다.
특정 구현예에서, 기능성 비-인간 GDE 폴리펩티드 또는 그것의 코딩 서열은 말, 고릴라, 오랑우탄, 검은날여우박쥐, 수티 망가베이, 오리너구리, 오리 또는 태즈메이니아데빌 (Tasmania devil) 으로부터 유래된다.
특정 구현예에서, 비-인간 GDE 폴리펩티드는 하기로 이루어지는 군으로부터 선택된다: SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드.
추가의 특정 구현예에서, 비-인간 GDE 폴리펩티드는 고릴라 GDE 폴리펩티드, 특히 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드이다.
또다른 양태에서, 본 발명은 본 발명의 미니-GDE 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.
용어 "핵산 분자" (또는 핵산 서열) 는 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 특히 본 발명에 따른 기능성 절두된 인간 GDE 폴리펩티드 또는 기능성 비-인간 GDE 폴리펩티드를 코딩하는 DNA 를 언급한다.
본 발명에 따르면, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 유전자 요법 벡터 내로 패키징될 수 있을 정도로 충분히 작으며, 유전자 요법 벡터는 위에서 정의된 바와 같다. 바람직한 구현예에서, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 AAV 벡터 내로 패키징될 수 있을 정도로 충분히 작다. 바람직하게는, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자의 크기는 약 5, 4.7, 4.5, 4.2, 4.1, 4, 3.7, 3.5, 3.2, 3, 2.7, 2.5, 2.2, 2, 또는 1.5 kb 미만이다. 바람직하게는, 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 약 4.1 kb 미만이다.
미니-GDE 폴리펩티드를 코딩하는 본 발명의 핵산 분자의 서열은 생체내에서의 GDE 폴리펩티드의 발현을 위해 최적화될 수 있다. 서열 최적화는 코돈 최적화, GC 함량의 증가, CpG 아일랜드 (island) 의 수의 감소, 대안적 오픈 리딩 프레임 (ARF) 의 수의 감소 및 스플라이스 도너 및 스플라이스 억셉터 자리의 수의 감소를 포함하는, 핵산 서열의 다수의 변화를 포함할 수 있다. 유전 부호의 축퇴 때문에, 상이한 핵산 분자는 동일한 단백질을 코딩할 수 있다. 상이한 유기체의 유전 부호는 종종 동일한 아미노산을 코딩하는 여러 가지 코돈 중에서 다른 코돈보다 한 가지의 코돈을 사용하는 것을 향하여 편향된다는 것이 또한 잘 알려져 있다. 코돈 최적화를 통해서, 주어진 세포 상황에 존재하는 코돈 편향을 이용하는 변화가 뉴클레오티드 서열에 도입되어, 결과로서 생성되는 코돈 최적화된 뉴클레오티드 서열은 비-코돈 최적화된 서열과 비교하여 그러한 주어진 세포 상황에서 상대적으로 높은 수준에서 발현될 가능성이 더 높다. 본 발명의 바람직한 구현예에서, 미니-GDE 폴리펩티드를 코딩하는 그러한 서열 최적화된 뉴클레오티드 서열은, 예를 들어 인간 특이적 코돈 사용빈도 편향을 이용함으로써, 코돈-최적화되어, 동일한 미니-GDE 폴리펩티드에 대해 코딩하는 비-코돈 최적화된 뉴클레오티드 서열과 비교하여 인간 세포에서 그것의 발현을 개선하게 된다. 전장 인간 GDE 아이소폼 1 을 코딩하는 핵산 서열은 SEQ ID NO:37 에 제시되어 있다. 해당하는 코돈 최적화된 서열의 예는 SEQ ID NO:38 또는 SEQ ID NO:39 에 제시되어 있다.
특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:2 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:18 에 제시된 서열;
- SEQ ID NO:3 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:20 에 제시된 서열;
- SEQ ID NO:4 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:21 에 제시된 서열;
- SEQ ID NO:5 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:22 에 제시된 서열;
- SEQ ID NO:6 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:24 에 제시된 서열;
- SEQ ID NO:7 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:26 에 제시된 서열;
- SEQ ID NO:8 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:27 에 제시된 서열;
- SEQ ID NO:9 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:28 에 제시된 서열;
- SEQ ID NO:10 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:29 에 제시된 서열;
- SEQ ID NO:48 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:53 또는 SEQ ID NO:59 에 제시된 서열;
- SEQ ID NO:49 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:54 또는 SEQ ID NO:60 에 제시된 서열;
- SEQ ID NO:50 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:55 또는 SEQ ID NO:61 에 제시된 서열;
- SEQ ID NO:51 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:56 또는 SEQ ID NO:62 에 제시된 서열; 또는
- SEQ ID NO:52 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:57 또는 SEQ ID NO:63 에 제시된 서열.
추가의 특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:2 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:18 에 제시된 서열;
- SEQ ID NO:3 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:20 에 제시된 서열;
- SEQ ID NO:4 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:21 에 제시된 서열;
- SEQ ID NO:5 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:22 에 제시된 서열;
- SEQ ID NO:6 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:24 에 제시된 서열;
- SEQ ID NO:7 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:26 에 제시된 서열;
- SEQ ID NO:8 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:27 에 제시된 서열;
- SEQ ID NO:9 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:28 에 제시된 서열; 또는
- SEQ ID NO:10 에 제시된 아미노산 서열을 갖는 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:29 에 제시된 서열.
이미 언급된 바와 같이, 상기 서열은 코돈-최적화될 수 있다. SEQ ID NO:19, SEQ ID NO:23 및 SEQ ID NO:25 에 제시된 서열은 SEQ ID NO:18, SEQ ID NO:22 및 SEQ ID NO:24 각각에 상응하는 코돈-최적화된 서열의 예이다.
또다른 특정 구현예에서, 본 발명의 핵산 분자는 하기를 포함하거나 또는 그것으로 이루어진다:
- SEQ ID NO:11 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:30 에 제시된 서열;
- SEQ ID NO:12 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:31 에 제시된 서열;
- SEQ ID NO:13 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:32 에 제시된 서열;
- SEQ ID NO:14 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:33 에 제시된 서열;
- SEQ ID NO:15 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:34 에 제시된 서열;
- SEQ ID NO:16 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:35 에 제시된 서열; 또는
- SEQ ID NO:17 에 제시된 아미노산 서열을 갖는 비-인간 GDE 폴리펩티드를 코딩하는, SEQ ID NO:36 에 제시된 서열.
위에서 정의된 바와 같은 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 SEQ ID NO:18 내지 26 의 뉴클레오티드 서열 중 임의의 것과 적어도 90 개 또는 적어도 95 퍼센트 동일성을 가질 수 있다. 특정 구현예에서, 위에서 정의된 바와 같은 미니-GDE 폴리펩티드를 코딩하는 핵산 분자는 SEQ ID NO:18 내지 36 및 SEQ ID NO:53 내지 57 의 뉴클레오티드 서열 중 임의의 것과 적어도 90 개 또는 적어도 95 퍼센트 동일성을 가질 수 있다. 특정 구현예에서, 본 발명의 핵산 분자는 SEQ ID NO:18 내지 36 의 뉴클레오티드 서열 중 임의의 것과 적어도 95 퍼센트 동일성, 예를 들어 적어도 96, 97, 98, 99 또는 100 퍼센트 동일성을 갖는다. 추가의 특정 구현예에서, 본 발명의 핵산 분자는 SEQ ID NO:18 내지 36 및 SEQ ID NO:53 내지 57 의 뉴클레오티드 서열 중 임의의 것과 적어도 95 퍼센트 동일성, 예를 들어 적어도 96, 97, 98, 99 또는 100 퍼센트 동일성을 갖는다.
용어 "동일한" 및 이의 변형은 두 개의 핵산 분자 사이의 또는 두 개의 폴리펩티드 분자 사이의 서열 동일성을 언급한다. 두 개의 비교되는 서열 둘 모두에서의 위치가 동일한 염기 또는 동일한 아미노산에 의해 점유될 때, 분자는 그 위치에서 동일하다. 두 개의 서열 사이의 동일성의 퍼센트는 두 개의 서열에 의해 공유되는 매치하는 위치의 수를 비교되는 위치의 수로 나눈 값 X 100 의 함수이다. 예를 들어, 두 개의 서열에서 위치 10 개 중 6 개가 매치되는 경우에 두 개의 서열은 60% 동일하다. 일반적으로, 두 개의 서열이 정렬될 때 비교가 이루어져서 최대 동일성을 제공한다. 통상의 기술자에게 알려진 다양한 생물정보학 도구 예컨대 BLAST 또는 FASTA 가 사용되어 핵산 서열을 정렬할 수 있다.
본 발명은 또한 본 발명의 핵산 분자를 포함하는 핵산 구축물에 관한 것이다. 핵산 구축물은 하나 이상의 발현 제어 서열 및/또는 발현을 개선하는 다른 서열에 작동가능하게 연결된, 본 발명의 핵산 서열을 포함하는 발현 카세트에 해당할 수 있다. 본원에서 사용되는 바와 같은, 용어 "작동가능하게 연결된" 은 기능적 관계에서 폴리뉴클레오티드 요소의 연결성을 언급한다. 핵산은 그것이 또다른 핵산 서열과의 기능적 관계에 배치될 때 "작동가능하게 연결된다". 예를 들어, 프로모터, 또는 또다른 전사 조절 서열은 그것이 코딩 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동가능하게 연결된다. 그러한 발현 제어 서열, 예컨대 프로모터, 인핸서 (예컨대 cis-조절 모듈 (CRM)), 인트론, polyA 신호 등이 당해 기술분야에 알려져 있다.
특정 구현예에서, 발현 카세트는 프로모터를 포함할 수 있다. 프로모터는 유비퀴터스 또는 조직-특이적 프로모터, 특히 GDE 의 발현이 바람직한 세포 또는 조직에서 예컨대 GDE-결핍 환자에서 GDE 발현이 바람직한 세포 또는 조직에서 발현을 촉진할 수 있는 프로모터일 수 있다.
특정 구현예에서, 프로모터는 근육-특이적 프로모터이다. 근육-특이적 프로모터의 비제한적 예는 근육 크레아틴 키나아제 (MCK) 프로모터를 포함한다. 적합한 근육 크레아틴 키나아제 프로모터의 비제한적 예는 인간 근육 크레아틴 키나아제 프로모터 및 절두된 뮤린 근육 크레아틴 키나아제 [(tMCK) 프로모터] 이다 (Wang B et al, Construction and analysis of compact muscle-selective promoters for AAV vectors. Gene Ther. 2008 Nov;15(22):1489-99) (대표적 GenBank Accession No. AF188002). 인간 근육 크레아틴 키나아제는 유전자 ID No. 1158 을 갖는다 (대표적 GenBank Accession No. NC_000019.9, 2012년 12월 26일에 억세스됨). 근육-특이적 프로모터의 다른 예는 합성 프로모터 C5.12 (spC5.12, 대안적으로 본원에서 "C5.12" 로서 언급됨), 예컨대 spC5.12 또는 spC5.12 프로모터 (Wang et al., Gene Therapy volume 15, pages 1489-1499 (2008) 에 개시됨), MHCK7 프로모터 (Salva et al. Mol Ther. 2007 Feb;15(2):320-9), 미오신 경쇄 (MLC) 프로모터, 예를 들어 MLC2 (Gene ID No. 4633; 대표적 GenBank Accession No. NG_007554.1, 2012년 12월 26일에 억세스됨); 미오신 중쇄 (MHC) 프로모터, 예를 들어 알파-MHC (Gene ID No. 4624; 대표적 GenBank Accession No. NG_023444.1, 2012년 12월 26일에 억세스됨); 데스민 프로모터 (Gene ID No. 1674; 대표적 GenBank Accession No. NG_008043.1, 2012년 12월 26일에 억세스됨); 심장 트로포닌 C 프로모터 (Gene ID No. 7134; 대표적 GenBank Accession No. NG_008963.1, 2012년 12월 26일에 억세스됨); 트로포닌 I 프로모터 (Gene ID Nos. 7135, 7136, 및 7137; 대표적 GenBank Accession Nos. NG_016649.1, NG_011621.1, 및 NG_007866.2, 2012년 12월 26일에 억세스됨); myoD 유전자 패밀리 프로모터 (Weintraub et al., Science, 251, 761 (1991); 유전자 ID No. 4654; 대표적 GenBank Accession No. NM_002478, 2012년 12월 26일에 억세스됨); 알파 액틴 프로모터 (Gene ID Nos. 58, 59, 및 70; 대표적 GenBank Accession Nos. NG_006672.1, NG_011541.1, 및 NG_007553.1, 2012년 12월 26일에 억세스됨); 베타 액틴 프로모터 (Gene ID No. 60; 대표적 GenBank Accession No. NG_007992.1, 2012년 12월 26일에 억세스됨); 감마 액틴 프로모터 (Gene ID No. 71 및 72; 대표적 GenBank Accession No. NG_011433.1 및 NM_001199893, 2012년 12월 26일에 억세스됨); Pitx3 의 안구 형태의 인트론 1 내에 존재하는 근육-특이적 프로모터 (Gene ID No. 5309) (Coulon et al; 근육-선택적 프로모터는 대표적 GenBank Accession No. NG_008147 (2012년 12월 26일에 억세스됨) 의 잔기 11219-11527 에 해당한다); 및 US 특허 공보 US 2003/0157064 에 기재된 프로모터, 및 CK6 프로모터 (Wang et al 2008 doi: 10.1038/gt.2008.104) 를 포함한다. 또다른 특정 구현예에서, 근육-특이적 프로모터는 MCK-유래 인핸서 및 spC5.12 프로모터의 조합을 포함하는 Wang et al., Gene Therapy volume 15, pages 1489-1499 (2008) 에 기재된 E-Syn 프로모터이다. 본 발명의 특정 구현예에서, 근육-특이적 프로모터는 spC5.12 프로모터, MHCK7 프로모터, E-syn 프로모터, 근육 크레아틴 키나아제 미오신 경쇄 (MLC) 프로모터, 미오신 중쇄 (MHC) 프로모터, 심장 트로포닌 C 프로모터, 트로포닌 I 프로모터, myoD 유전자 패밀리 프로모터, 알파 액틴 프로모터, 베타 액틴 프로모터, 감마 액틴 프로모터, Pitx3 의 안구 형태의 인트론 1 내에 존재하는 근육-특이적 프로모터, CK6 프로모터, CK8 프로모터 및 Acta1 프로모터로 이루어지는 군으로부터 선택된다. 특정 구현예에서, 근육-특이적 프로모터는 spC5.12, 데스민 및 MCK 프로모터로 이루어지는 군으로부터 선택된다. 추가의 구현예에서, 근육-특이적 프로모터는 spC5.12 및 MCK 프로모터로 이루어지는 군으로부터 선택된다. 특정 구현예에서, 근육-특이적 프로모터는 spC5.12 프로모터이다.
특정 구현예에서, 프로모터는 간-특이적 프로모터이다. 간-특이적 프로모터의 비제한적 예는 알파-1 안티트립신 프로모터 (hAAT), 트랜스티레틴 프로모터, 알부민 프로모터, 티록신-결합 글로불린 (TBG) 프로모터, LSP 프로모터 (갑상선 호르몬-결합 글로불린 프로모터 서열, 두 카피의 알파1-마이크로글로불린/비쿠닌 인핸서 서열, 및 리더 서열을 포함함 - Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) 등을 포함한다. 다른 유용한 간-특이적 프로모터, 예를 들어 Cold Spring Harbor Laboratory 에 의해 컴파일된 간 특이적 유전자 프로모터 데이타베이스에 열거된 것들 (http://rulai.cshl.edu/LSPD/) 이 당해 기술분야에 알려져 있다. 본 발명의 맥락에서 바람직한 간-특이적 프로모터는 hAAT 프로모터이다.
또다른 특정 구현예에서, 프로모터는 뉴런-특이적 프로모터이다. 뉴런-특이적 프로모터의 비제한적 예는 하기를 포함하나, 그에 한정되지 않는다: 통상의 기술자에게 명백한 것들 중에서 특히, 시냅신-1 (Syn) 프로모터, 뉴런-특이적 에놀라아제 (NSE) 프로모터 (Andersen et al., Cell. Mol. Neurobiol., 13:503-15 (1993)), 신경미세섬유 경쇄 유전자 프로모터 (Piccioli et al., Proc. Natl. Acad. Sci. USA, 88:5611-5 (1991)), 및 뉴런-특이적 vgf 유전자 프로모터 (Piccioli et al. Neuron, 15:373- 84 (1995)). 특정 구현예에서, 뉴런-특이적 프로모터는 Syn 프로모터이다. 다른 뉴런-특이적 프로모터는 하기를 제한 없이 포함한다: 시냅신-2 프로모터, 티로신 히드록실라아제 프로모터, 도파민 β-히드록실라아제 프로모터, 히포크산틴 포스포리보실트랜스페라아제 프로모터, 낮은 친화도 NGF 수용체 프로모터, 및 콜린 아세틸 트랜스페라아제 프로모터 (Bejanin et al., 1992; Carroll et al., 1995; Chin and Greengard, 1994; Foss-Petter et al., 1990; Harrington et al., 1987; Mercer et al., 1991; Patei et al., 1986). 운동 뉴런에 특이적인 대표적 프로모터는 알려진 운동 뉴런-유래 인자인, 칼시토닌 유전자-관련 펩티드 (Calcitonin Gene-Related Peptide, CGRP) 의 프로모터를, 제한 없이, 포함한다. 운동 뉴런에서 기능성인 다른 프로모터는 콜린 아세틸 트랜스페라아제 (ChAT), 뉴런 특이적 에놀라아제 (NSE), 시냅신 및 Hb9 의 프로모터를 포함한다. 본 발명에서 유용한 다른 뉴런-특이적 프로모터는 하기를, 제한 없이, 포함한다: GFAP (성상세포), 칼빈딘 (Calbindin) 2 (중간뉴런), Mnx1 (운동뉴런), 네스틴 (Nestin) (뉴런), 파르브알부민, 소마토스타틴 (Somatostatin) 및 Plp1 (희돌기교세포 및 슈반 (Schwann) 세포).
또다른 특정 구현예에서, 프로모터는 유비퀴터스 프로모터이다. 대표적 유비퀴터스 프로모터는 사이토메갈로바이러스 인핸서/치킨 베타 액틴 (CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV) (임의로 CMV 인핸서 포함) [예를 들어, Boshart et al, Cell, 41:521-530 (1985) 참고], PGK 프로모터, SV40 조기 프로모터, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서 포함), 디히드로폴레이트 리덕타아제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제 (PGK) 프로모터, 및 EF1 알파 프로모터를 포함한다.
또한, 프로모터는 또한 내생적 프로모터 예컨대 알부민 프로모터 또는 GDE 프로모터일 수 있다.
특정 구현예에서, 프로모터는 인핸서 서열, 예컨대 cis-조절 모듈 (CRM) 또는 인공 인핸서 서열과 연합된다. 본 발명의 실시에서 유용한 CRM 은 Rincon et al., Mol Ther. 2015 Jan;23(1):43-52, Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13 또는 Nair et al., Blood. 2014 May 15;123(20):3195-9 에 기재된 것들을 포함한다. 특히, 유전자의 근육-특이적 발현, 특히 심장 근육 및/또는 골격 근육에서의 발현을 향상시킬 수 있는 다른 조절 요소는 WO2015110449 에 개시된 것들이다. 인공 서열을 포함하는 핵산 조절 요소의 특정 예는 WO2015110449 에 개시된 서열에 존재하는 전사 인자 결합 자리 (TFBS) 를 재배열함으로써 수득되는 조절 요소를 포함한다. 상기 재배열은 TFBS 의 순서를 변화시키는 것 및/또는 다른 TFBS 에 상대적인 하나 이상의 TFBS 의 위치를 변화시키는 것 및/또는 TFBS 중 하나 이상의 카피 수를 변화시키는 것을 망라할 수 있다. 예를 들어, 근육-특이적 유전자 발현, 특히 심장 및 골격 근육-특이적 유전자 발현을 향상시키기 위한 핵산 조절 요소는 E2A, HNH 1, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, NF1, p53, C/EBP, LRF, 및 SREBP 에 대한; 또는 E2A, HNH 1, HNF3a, HNF3b, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, NF1, CEBP, LRF, MyoD, 및 SREBP 에 대한; 또는 HNF4, NF1, RSRFC4, C/EBP, LRF, 및 MyoD 에 대한, 또는 NF1, PPAR, p53, C/EBP, LRF, 및 MyoD 에 대한 결합 자리를 포함할 수 있다. 예를 들어, 근육-특이적 유전자 발현, 특히 골격 근육-특이적 유전자 발현을 향상시키기 위한 핵산 조절 요소는 E2A, NF1, SRFC, p53, C/EBP, LRF, 및 MyoD 에 대한; 또는 E2A, NF1, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, HNF3a, C/EBP, LRF, MyoD, SEREBP, 및 Tal1_b 에 대한; 또는 E2A, SRF, p53, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 HNF4, NF1, RSRFC4, C/EBP, LRF, 및 SREBP 에 대한; 또는 E2A, HNF3a, HNF3b, NF1, SRF, C/EBP, LRF, MyoD, 및 SREBP 에 대한; 또는 E2A, CEBP, 및 MyoD 에 대한 결합 자리를 또한 포함할 수 있다. 추가의 예에서, 이들 핵산 조절 요소는 적어도 2 개, 예컨대 2, 3, 4 개, 또는 더 많은 카피의 이전에 언급된 TFBS 중 하나 이상을 포함한다. 특히,유전자의 간-특이적 발현을 향상시킬 수 있는 다른 조절 요소는 WO2009130208 에 개시된 것들이다.
또다른 특정 구현예에서, 핵산 구축물은 인트론, 특히 프로모터와 GDE 코딩 서열 사이에 위치하는 인트론을 포함한다. 인트론은 mRNA 안정성 및 단백질의 생산을 증가시키기 위해 도입될 수 있다. 추가의 구현예에서, 인트론은 인간 베타 글로빈 b2 (또는 HBB2) 인트론, 응고 인자 IX (FIX) 인트론, SV40 인트론, hCMV 인트론 A (hCMVI), TPL 인트론 (TPLI), CHEF1 유전자 인트론1 (CHEFI), MVM 인트론 (Wu et al, 2008), FIX 절두된 인트론 1 (Wu et al., 2008, Mol Ther, 16(2):280-289; Kurachi et al., 1995, J Biol Chem., 270(10):5276-5281), β-글로빈/면역글로빈 중쇄 하이브리드 인트론 (인간 β-글로빈 인트론으로부터의 5'-도너 자리 및 면역글로불린 중쇄 가변 영역 인트론으로부터의 3'-억셉터 자리, Wu et al., 2008, Mol Ther, 16(2):280-289; Kurachi et al., 1995, J Biol Chem., 270(10):5276-5281), 아데노바이러스 스플라이스 도너 및 면역글로불린 G 스플라이스로 이루어지는 하이브리드 인트론 (Wong et al., 1985, Chromosoma, 92(2):124-135; Yew et al., 1997, Hum Gene Ther, 8(5):575-584; Choi T. et al., 1991, Mol Cell Biol, 11(6):3070-3074; Huang et al., 1990, Mol Cell Biol.,10(4):1805-1810), 하이브리드 19S/16S SV40 인트론 (19S 인트론으로부터의 5'-도너 자리 및 16S 인트론으로부터의 3'-억셉터 자리, Yew et al., 1997, Hum Gene Ther, 8(5):575-584) 또는 치킨 베타-글로빈 인트론이다. 또다른 추가의 구현예에서, 인트론은 상기 인트론에서 발견되는 대안적 오픈 리딩 프레임 (ARF) 의 수를 감소시키거나, 또는 심지어는 완전히 제거하도록 디자인된 변형된 인트론 (특히 변형된 HBB2 또는 FIX 인트론) 이다. 바람직하게는, 길이가 50 bp 가 넘고 시작 코돈과 같은 프레임에 있는 정지 코돈을 갖는 ARF 가 제거된다. 인트론의 서열을 변형시킴으로써 ARF 가 제거될 수 있다. 예를 들어, 변형은 뉴클레오티드 치환, 삽입 또는 결실에 의해, 바람직하게는 뉴클레오티드 치환에 의해 수행될 수 있다. 예로서, 관심 대상의 인트론의 서열에 존재하는 ATG 또는 GTG 시작 코돈에서 하나 이상의 뉴클레오티드, 특히 하나의 뉴클레오티드가 대체되어 비-시작 코돈을 초래할 수 있다. 예를 들어, 관심 대상의 인트론의 서열 내에서, ATG 또는 GTG 가 시작 코돈이 아닌 CTG 로 대체될 수 있다.
고전적 HBB2 인트론이 SEQ ID NO:42 에 제시되어 있다. 예를 들어, 이러한 HBB2 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 HBB2 인트론은 SEQ ID NO:43 에 제시된 서열을 갖는다. 고전적 FIX 인트론은 인간 FIX 의 제 1 인트론으로부터 유래되고, SEQ ID NO:44 에 제시되어 있다. FIX 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 FIX 인트론은 SEQ ID NO:45 에 제시된 서열을 갖는다. 핵산 구축물에서 사용되는 고전적 치킨-베타 글로빈 인트론은 SEQ ID NO:46 에 제시되어 있다. 치킨-베타 글로빈 인트론은 상기 인트론 내의 시작 코돈 (ATG 및 GTG 코돈) 을 제거함으로써 변형될 수 있다. 특정 구현예에서, 변형된 치킨-베타 글로빈 인트론은 SEQ ID NO:47 에 제시된 서열을 갖는다.
발명자들은 이전에 WO2015/162302 에서 그러한 변형된 인트론, 특히 변형된 HBB2 또는 FIX 인트론이 유리한 특성을 갖고, 이식유전자의 발현을 유의하게 개선할 수 있다는 것을 보였다.
특정 구현예에서, 본 발명의 핵산 구축물은 인핸서가 임의로 선행하는 프로모터, 본 발명의 코딩 서열 (즉 미니-GDE 폴리펩티드를 코딩하는 핵산 분자), 및 폴리아데닐화 신호 예컨대 소 성장 호르몬 폴리아데닐화 신호 (bGH polyA), SV40 폴리아데닐화 신호, 또는 또다른 자연 발생적 또는 인공 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 특히, 폴리아데닐화 신호는 bGH polyA 이다. 바람직한 구현예에서, 매우 짧은 polyA 신호가 바람직하다. 예를 들어, 20 개 미만의 뉴클레오티드를 포함하는 매우 짧은 polyA 신호가 바람직하다. 특정 구현예에서, 폴리아데닐화 신호는 인간 가용성 뉴로필린-1 (sNRP) 폴리아데닐화 신호 (sNRP polyA; SEQ ID NO:58) 이다.
특정 구현예에서, 본 발명의 핵산 구축물은 인핸서가 임의로 선행하는 프로모터, 인트론, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 SpC5-12 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호 (예컨대 bGH polyA 또는 sNRP polyA, 특히 bGH polyA) 를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 또다른 구현예에서, 본 발명의 핵산 구축물은 인핸서, SpC5-12 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호 (예컨대 bGH polyA 또는 sNRP polyA, 특히 bGH polyA) 를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 인트론, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 본 발명의 추가의 특정 구현예에서 본 발명의 핵산 구축물은 프로모터, 임의적 인트론, 본 발명의 코딩 서열 및 polyA 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SV40 인트론; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 프로모터, 본 발명의 코딩 서열, 및 폴리아데닐화 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 본 발명의 추가의 특정 구현예에서, 본 발명의 핵산 구축물은 인핸서, 프로모터, 본 발명의 코딩 서열 및 polyA 신호를, 5' 내지 3' 방향으로, 포함하는 발현 카세트이다. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SV40 인트론; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51 또는 SEQ ID NO:52, 특히 SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5 또는 SEQ ID NO:6, 특히 SEQ ID NO:5 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SV40 인트론; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 추가의 특정 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: SpC5-12 프로모터; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SV40 인트론; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA. 또다른 구현예에서, 발현 카세트는 하기를, 5' 내지 3' 방향으로, 포함한다: CMV 프로모터; SEQ ID NO:12 의 아미노산 서열을 코딩하는 서열; 및 bGH polyA 또는 sNRP polyA, 특히 bGH polyA.
본 발명의 핵산 구축물을 디자인함에 있어서, 통상의 기술자는 상기 구축물을 세포 또는 기관에 전달하는데 사용되는 벡터의 크기 한계를 준수하는데 주의할 것이다. 특히, 통상의 기술자는 AAV 벡터의 주요 한계가 그것의 카고 (cargo) 용량이라는 것을 알고 있으며, 카고 용량은 AAV 혈청형 마다 다를 수 있으나 부모 바이러스 게놈의 크기 근처로 제한되는 것으로 여겨진다. 예를 들어, 5 kb 는 AAV8 캡시드 내로 패키징되는 것으로 통상적으로 여겨지는 최대 크기이다 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). 또한, 재조합 AAV 생산 동안, 5 kb 초과의 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 유전자 전달의 효능을 감소시키는 단편화된 게놈을 함유할 수 있다. 따라서, 통상의 기술자는 본 발명을 실시함에 있어서 AAV 5'- 및 3'-ITR 을 코딩하는 서열을 포함하는 결과로서 생성되는 핵산 서열이 바람직하게는 실시되는 AAV 벡터의 카고 용량의 110 % 를 초과하지 않도록, 특히 바람직하게는 5 kb 를 초과하지 않도록 본 발명의 핵산 구축물의 구성요소를 신중하게 선택할 것이다. 더 큰 카고 용량을 갖는 AAV 벡터가 또한 본 발명의 맥락에서 사용될 수 있다. 예를 들어 Vp2 서브유닛을 결여하는 AAV 입자는 더 큰 게놈 (즉 6 kb) 을 성공적으로 패키징하면서도 캡시드화된 게놈의 온전성을 하는 것으로 밝혀졌다 (Grieger et al., 2005, J Virol., 79(15):9933-9944).
본 발명은 또한 본원에 개시된 바와 같은 핵산 분자 또는 구축물을 포함하는 벡터에 관한 것이다. 특정 구현예에서, 벡터는 위에서 정의된 바와 같은 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자 또는 구축물을 포함한다. 또다른 특정 구현예에서, 벡터는 위에서 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 분자 또는 구축물을 포함한다.
특히, 본 발명의 벡터는 단백질 발현에, 바람직하게는 유전자 요법에서 사용하기에 적합한 벡터이다. 하나의 구현예에서, 벡터는 플라스미드 벡터이다. 또다른 구현예에서, 벡터는 본 발명의 핵산 분자, 특히 본 발명의 미니-GDE 폴리펩티드를 코딩하는 메신저 RNA 를 함유하는 나노입자이다. 또다른 구현예에서, 벡터는 표적 세포의 게놈에 본 발명의 핵산 분자 또는 구축물의 통합을 허용하는, 트랜스포존에 기반하는 시스템, 예컨대 과활성 슬리핑 뷰티 (Sleeping Beauty) (SB100X) 트랜스포존 시스템 (Mates et al. 2009) 이다. 또다른 구현예에서, 벡터는 임의의 관심의 세포 예컨대 간 조직 또는 세포, 근육 세포, CNS 세포 (예컨대 뇌 세포), 또는 조혈 줄기 세포 예컨대 적혈구 계통의 세포 (예컨대 적혈구) 를 표적화하는, 유전자 요법에 적합한 바이러스 벡터이다. 이 경우에, 본 발명의 핵산 구축물은 당해 기술분야에 잘 알려져 있는 효율적 바이러스 벡터를 생산하는데 적합한 서열을 또한 함유한다.
바이러스 벡터, 예컨대 레트로바이러스 벡터, 예를 들어 렌티바이러스 벡터, 또는 비-병원성 파르보바이러스, 더욱 바람직하게는 AAV 벡터는 본 발명의 핵산 분자 또는 구축물을 전달하는데 바람직하다. 인간 파르보바이러스 아데노-연관 바이러스 (AAV) 는 감염된 세포의 게놈 내로 통합되어 잠복 감염을 확립할 수 있는 복제에 관해 자연적으로 결함이 있는 데펜도바이러스이다. 마지막 특성은 포유류 바이러스 중에서 독특해 보이며, 그 이유는 염색체 19 (19q13.3-qter) 상에 위치하는, AAVS1 로 호칭되는, 인간 게놈에서의 특정 자리에서 통합이 일어나기 때문이다.
그러므로, AAV 벡터는 인간 유전자 요법을 위한 잠재적 벡터로서 상당한 관심을 유발했다. 바이러스의 유리한 특성 중에는 임의의 인간 질환과 그것의 관련성의 결여, 분열 및 비-분열 세포 둘 모두를 감염시키는 그것의 능력, 및 감염될 수 있는 상이한 조직으로부터 유래하는 세포주의 넓은 범위가 있다.
인간 또는 비-인간 영장류 (NHP) 로부터 단리된 잘 특성분석된 AAV 의 혈청형 중에서, 인간 혈청형 2 는 유전자 전달 벡터로서 개발된 첫번째 AAV 이다. 다른 현재 사용되는 AAV 혈청형은 AAV-1, AAV-2 변이체 (예컨대 Y44+500+730F+T491V 변화가 있는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2, Ling et al., 2016 Jul 18, Hum Gene Ther Methods. 에 개시됨), -3 및 AAV-3 변이체 (예컨대 두 가지 아미노산 변화, S663V+T492V 가 있는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체, Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042 에 개시됨), -3B 및 AAV-3B 변이체, -4, -5, -6 및 AAV-6 변이체 (예컨대 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체, Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026 에 개시됨), -7, -8, -9, -2G9, -10 예컨대 cy10 및 -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 라이신 및 세린 캡시드 돌연변이체 등을 포함한다. 또한, 다른 비-자연 조작된 변이체 및 키메라 AAV 가 또한 유용할 수 있다.
AAV 바이러스는 종래의 분자 생물학 기술을 사용하여 조작되어, 핵산 서열의 세포 특이적 전달, 면역원성의 최소화, 안정성 및 입자 수명의 조율, 효율적 분해, 핵으로의 정확한 전달을 위해 이들 입자를 최적화하는 것을 가능하게 만들 수 있다.
벡터 내로 조립하는데 바람직한 AAV 단편은 cap 단백질 (vp1, vp2, vp3 및 과가변 영역을 포함), rep 단백질 (rep 78, rep 68, rep 52, 및 rep 40 을 포함), 및 이들 단백질을 코딩하는 서열을 포함한다. 이들 단편은 여러 가지 벡터 시스템 및 숙주 세포에서 용이하게 이용될 수 있다.
Rep 단백질을 결여하는 AAV-기반 재조합 벡터는 숙주의 게놈 내로 낮은 효능으로 통합되고, 주로 표적 세포에서 수년간 지속될 수 있는 안정한 환형 에피솜으로서 존재한다.
AAV 자연 혈청형을 사용하는 것에 대안적으로, 비-자연 발생적 캡시드 단백질을 포함하는 AAV 를, 제한 없이, 포함하는 인공 AAV 혈청형이 본 발명의 맥락에서 사용될 수 있다. 그러한 인공 캡시드는 선별된 AAV 서열 (예를 들어, vp1 캡시드 단백질의 단편) 을 상이한 선별된 AAV 혈청형으로부터 수득될 수 있는 이종 서열, 비-AAV 바이러스 공급원으로부터의, 또는 비-바이러스 공급원으로부터의, 동일한 AAV 혈청형의 비-연속적 부분과의 조합으로 사용하여 임의의 적합한 기술에 의해 생성될 수 있다. 인공 AAV 혈청형은, 제한 없이, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화된" AAV 캡시드일 수 있다.
본 발명의 맥락에서, AAV 벡터는 관심의 표적 세포, 즉 관용원성 조직의 세포 (예를 들어 간세포) 및 치료적 관심의 조직(들)의 세포 예컨대 근육 세포, CNS 세포 또는 심장 세포를 형질도입시킬 수 있는 AAV 캡시드를 포함한다.
특정 구현예에 따르면, AAV 벡터는 AAV-1, -2, AAV-2 변이체 (예컨대 Y44+500+730F+T491V 변화가 있는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2, Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print] 에 개시됨), -3 및 AAV-3 변이체 (예컨대 두 가지 아미노산 변화, S663V+T492V 가 있는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체, Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042 에 개시됨), -3B 및 AAV-3B 변이체, -4, -5, -6 및 AAV-6 변이체 (예컨대 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체, Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026 에 개시됨), -7, -8, -9, -9P1, -2G9, -10 예컨대 -cy10 및 -rh10, -rh39, -rh43, -rh74, -dj, Anc80, LK03, AAV.PHP, AAV2i8, 돼지 AAV 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 라이신 및 세린 캡시드 돌연변이체의 것이다. 특정 구현예에서, AAV 벡터는 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형의 것이다 (즉 AAV 벡터는 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형의 캡시드를 갖는다) . 추가의 특정 구현예에서, AAV 벡터는 슈도타입 (pseudotyped) 벡터이며, 즉 그것의 게놈 및 캡시드는 상이한 혈청형의 AAV 로부터 유래한다. 예를 들어, 슈도타입 AAV 벡터는, 게놈은 위에서 언급된 AAV 혈청형 중 하나로부터 유래하고 캡시드는 또다른 혈청형으로부터 유래하는 벡터일 수 있다. 예를 들어, 슈도타입 벡터의 게놈은 AAV6, AAV8, AAV9, AAV9P1, AAVrh74 또는 AAV2i8 혈청형으로부터 유래하는 캡시드를 가질 수 있고, 그것의 게놈은 상이한 혈청형으로부터 유래할 수 있다. 특정 구현예에서, AAV 벡터는 AAV6, AAV8, AAV9 또는 AAVrh74 혈청형, 특히 AAV6, AAV8, AAV9, 또는 AAV9P1 혈청형, 더욱 특히 AAV6, AAV9 또는 AAV9P1 혈청형의 캡시드를 갖는다.
특정 구현예에서, 벡터가 치료적 이식유전자를 근육 세포에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV8, AAV9 및 AAVrh74 로 이루어지는 군에서 선택될 수 있다.
또다른 특정 구현예에서, 벡터가 이식유전자를 간 세포에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV1, AAV5, AAV8, AAV9, AAVrh10, AAVrh39, AAVrh43, AAVrh74, AAV-LK03, AAV2G9, AAV.PHP, AAV-Anc80 및 AAV3B 로 이루어지는 군에서 선택될 수 있다.
추가의 특정 구현예에서, 벡터가 이식유전자를 CNS 에 전달하는데 사용되는 경우에, AAV 벡터는, 특히, AAV9, AAV9P1, AAV10 및 AAV2G9 로 이루어지는 군에서 선택될 수 있다.
또다른 구현예에서, 캡시드는 변형된 캡시드이다. 본 발명의 맥락에서, "변형된 캡시드" 는 키메라 캡시드 또는 하나 이상의 야생형 AAV VP 캡시드 단백질로부터 유래하는 하나 이상의 변이체 VP 캡시드 단백질을 포함하는 캡시드일 수 있다.
특정 구현예에서, AAV 벡터는 키메라 벡터이며, 즉 그것의 캡시드는 적어도 두 가지 상이한 AAV 혈청형으로부터 유래하는 VP 캡시드 단백질을 포함하거나, 또는 적어도 두 가지 AAV 혈청형으로부터 유래하는 VP 단백질 영역 또는 도메인을 조합하는 적어도 하나의 키메라 VP 단백질을 포함한다. 간 세포를 형질도입시키는데 유용한 그러한 키메라 AAV 벡터의 예는 Shen et al., Molecular Therapy, 2007 및 Tenney et al., Virology, 2014 에 기재되어 있다. 예를 들어, 키메라 AAV 벡터는 AAV8 캡시드 서열과 AAV8 혈청형과 상이한 AAV 혈청형의 서열, 예컨대 위에서 구체적으로 언급된 임의의 것들의 조합으로부터 유래할 수 있다. 또다른 구현예에서, AAV 벡터의 캡시드는 하나 이상의 변이체 VP 캡시드 단백질 예컨대 WO2015013313 에 기재된 것들, 특히 높은 간 향성을 제시하는 RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 및 RHM15-6 캡시드 변이체를 포함한다.
또다른 구현예에서, 변형된 캡시드는 또한 에러 프로운 (error prone) PCR 및/또는 펩티드 삽입에 의해 삽입된 캡시드 변형으로부터 유래할 수 있다 (예를 들어 Bartel et al., 2011 에 기재된 바와 같음). 특정 구현예에서, 변형된 캡시드는 PCT/EP2019/058560 에 개시된 바와 같이 P1 변형을 포함한다. 또한, 캡시드 변이체는 단일 아미노산 변화 예컨대 티로신 돌연변이체를 포함할 수 있다 (예를 들어 Zhong et al., 2008 에 기재된 바와 같음).
또한, AAV 벡터의 게놈은 단일 가닥 또는 자기 상보적 이중 가닥 게놈일 수 있다 (McCarty et al., Gene Therapy, 2003). 자기 상보적 이중 가닥 AAV 벡터는 AAV 말단 반복부 중 하나로부터 말단 분해 자리를 결실시킴으로써 생성된다. 복제하는 게놈이 야생형 AAV 게놈 길이의 절반인 이들 변형된 벡터는 DNA 이합체를 패키징하는 경향을 갖는다. 바람직한 구현예에서, 본 발명의 실시에서 구현되는 AAV 벡터는 단일 가닥 게놈을 갖고, 추가로 바람직하게는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 더욱 특히 AAV9 캡시드를 포함한다.
본 발명의 GDE 서열을 패키징하는데 사용되는 AAV 벡터는 또한 그것의 카고 용량을 증가시키기 위해서 변형될 수 있다. 예를 들어, Vp2 서브유닛을 결여하는 AAV 벡터는 더 큰 게놈 (즉 6 kb) 을 성공적으로 패키징하면서도 캡시드화된 게놈의 온전성을 유지하는 것으로 밝혀졌다 (Grieger et al., 2005).
당해 기술분야에 알려져 있는 바와 같이, 기능성 바이러스 벡터를 얻기 위해서 부가적 적합한 서열이 본 발명의 핵산 구축물에 도입될 수 있다. 적합한 서열은 AAV ITR 을 포함한다.
특정 구현예에서, AAV 벡터는 위에 기재된 바와 같은 근육-특이적 프로모터, 특히 간 세포 내로 발현의 일부 누출을 제시하는 근육-특이적 프로모터를 포함한다.
본 발명의 또다른 특정 구현예에서, AAV 벡터는 위에 기재된 바와 같은 간-특이적 프로모터를 포함한다. 간의 관용원성유도 및 대사 특성은 유리하게는 이 구현예 덕분에 구현되어 간세포에서 GDE 를 발현하고 그 단백질에 대한 면역 관용을 유도하는 고도로 효율적인 최적화된 벡터를 개발한다.
본 발명은 또한 본 발명의 핵산 분자, 구축물 또는 벡터로 형질전환된 또는 형질도입된 세포, 특히 단리된 세포, 예를 들어 간 세포, 심장 세포, CNS 세포 또는 근육 세포에 관한 것이다. 특정 구현예에서, 세포는 단리된 인간 세포이다. 추가의 특정 구현예에서, 세포는 인간 배아 줄기 세포가 아니다. 본 발명의 세포는 미니-GDE 폴리펩티드를 발현한다. 본 발명의 세포는 이를 필요로 하는 대상체, 예컨대 GDE-결핍 환자에게, 임의의 적당한 투여 경로에 의해 예컨대 상기 대상체의 간 내, CNS 내, 심장 내, 근육(들) 내 또는 혈류 내 주입을 통해 전달될 수 있다. 특정 구현예에서, 본 발명은 간 또는 근육 세포, 특히 치료될 대상체의 간 또는 근육 세포를 형질도입시키는 것, 및 핵산이 도입된 상기 형질도입된 간 및/또는 근육 세포를 대상체에게 투여하는 것을 수반한다. 특정 구현예에서, 간 세포는 치료될 환자로부터의 간 세포이거나, 또는 추가로 형질전환되고, 환자에 대한 후속적 투여를 위해 시험관내에서 간 세포로 분화된 간 줄기 세포이다. 또다른 구현예에서, 세포는 치료될 환자로부터의 근육 세포이거나, 또는 추가로 형질전환되고, 임의로 환자에 대한 후속적 투여를 위해 시험관내에서 근육 세포로 분화된 근육 줄기 세포이다.
본 발명은 또한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 또는 세포를 포함하는 약학적 조성물을 제공한다. 그러한 조성물은 치료적 유효량의 치료제 (본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포), 및 약학적으로 허용가능한 담체를 포함할 수 있다. 특정 구현예에서, 용어 "약학적으로 허용가능한" 은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 또는 미국 또는 유럽 약전 또는 동물, 및 인간에서의 사용에 관해 다른 일반적으로 인정되는 약전에서 열거되었다는 것을 의미한다. 용어 "담체" 는 치료제와 함께 투여되는 희석제, 아쥬반트, 부형제, 또는 비히클을 언급한다. 그러한 약학적 담체는 멸균 액체, 예컨대 물 및 석유, 동물, 식물 또는 합성 기원의 것, 예컨대 피넛유, 대두유, 참기름 등을 포함하는 오일일 수 있다. 물은 약학적 조성물이 정맥내 투여될 때 바람직한 담체이다. 염류 용액 및 수성 덱스트로스 및 글리세롤 용액이 또한 액체 담체로서, 특히 주사용 용액을 위해 이용될 수 있다. 적합한 약학적 부형제는 전분, 글루코스, 락토오스, 수크로스, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 탈크, 소듐 클로라이드, 건조된 탈지유, 글리세롤, 프로필렌 글리콜, 물, 에탄올 등을 포함한다.
조성물은, 바람직한 경우에, 또한 소량의 습윤화제 또는 유화제, 또는 pH 완충제를 함유할 수 있다. 이들 조성물은 용액, 현탁액, 에멀션, 정제, 환제, 캡슐, 분제, 지속 방출 제제 등의 형태를 취할 수 있다. 경구 제제는 표준 담체 예컨대 약학적 등급의 민나톨, 락토오스, 전분, 마그네슘 스테아레이트, 소듐 사카린, 셀룰로오스, 마그네슘 카르보네이트 등을 포함할 수 있다. 적합한 약학적 담체의 예는 "Remington's Pharmaceutical Sciences" by E. W. Martin 에 기재되어 있다. 그러한 조성물은 치료적 유효량의 치료제를, 바람직하게는 정제된 형태로, 적합한 양의 담체와 함께 함유할 것이며, 그에 따라 대상체에게 적절한 투여 형태를 제공할 것이다. 특정 구현예에서, 본 발명의 핵산, 벡터 또는 세포는 포스페이트-완충 식염수를 포함하고 0.25% 인간 혈청 알부민이 보충된 조성물로 제제화된다. 또다른 특정 구현예에서, 본 발명의 핵산, 벡터 또는 세포는 링거 락테이트 및 비-이온성 계면활성제, 예컨대 pluronic F68 을 총 조성물의 중량에 의해 최종 농도 0.01-0.0001%, 예컨대 농도 0.001% 로 포함하는 조성물로 제제화된다. 제제는 혈청 알부민, 특히 인간 혈청 알부민, 예컨대 0.25% 의 인간 혈청 알부민을 추가로 포함할 수 있다. 저장 또는 투여에 적당한 다른 제제는 당해 기술분야에, 특히 WO 2005/118792 또는 Allay et al., 2011 에서 알려져 있다.
바람직한 구현예에서, 조성물은 일상적 절차에 따라 인간에 대한 정맥내 투여에 적합한 약학적 조성물로서 제제화된다. 전형적으로, 정맥내 투여를 위한 조성물은 멸균 등장성 수성 완충제 중 용액이다. 필요한 경우에, 조성물은 가용화제 및 주입 자리에서 통증을 덜어주는 국부 마취제 예컨대 리그노카인을 또한 포함할 수 있다.
하나의 구현예에서, 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는 베지클, 특히 리포솜으로 전달될 수 있다. 또다른 구현예에서, 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는 제어 방출 시스템으로 전달될 수 있다.
특정 구현예에서, 핵산 분자는 본 발명의 미니-GDE 폴리펩티드를 코딩하는 전사물에 해당하는 mRNA 로서 전달된다. 특히, 본 발명의 mRNA 는 리포솜 예컨대 지질 나노입자 (LNP) 를 사용하여 전달될 수 있다.
본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포의 투여 방법은 피내, 근육내, 복강내, 정맥내, 피하, 비강내, 경막외, 및 경구 경로를 포함하나 그에 한정되지 않는다. 특정 구현예에서, 투여는 정맥내 또는 근육내 경로를 통한다. 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포는, 벡터화되든 또는 벡터화되지 않든, 임의의 편리한 경로에 의해, 예를 들어 인퓨전 (infusion) 또는 볼루스 주입에 의해, 상피 또는 점막피부 내벽 (예를 들어, 경구 점막, 직장 및 창자 점막 등) 을 통한 흡수에 의해 투여될 수 있고, 다른 생물학적 활성제와 함께 투여될 수 있다. 투여는 전신 또는 국소일 수 있다.
특정 구현예에서, 본 발명의 약학적 조성물을 치료가 필요한 부위, 예를 들어 간 또는 근육에 국소적으로 투여하는 것이 바람직할 것이다. 이는, 예를 들어, 임플란트에 의해, 달성될 수 있으며, 상기 임플란트는 다공성, 비다공성, 또는 겔라틴성 물질, 예를 들어 멤브레인, 예컨대 실라스틱 멤브레인, 또는 섬유이다.
특정 구현예에서, 본 발명의 미니-GDE 폴리펩티드는 효소 대체 요법 (Enzyme Replacement Therapy, ERT) 에서, 특히 GSDIII 을 치료하기 위해 사용된다. 용어 "효소 대체 요법" 또는 "ERT" 은 일반적으로 정제된 효소를 그 효소가 결핍된 개체 내로 도입하는 것을 언급한다. 투여되는 본 발명의 폴리펩티드는 자연 공급원으로부터, 재조합 발현에 의해, 수득되거나, 시험관내 생산되거나, 또는 단리된 조직 또는 유체로부터 정제될 수 있다. 특히, ERT 에서 사용될 때, 본 발명의 폴리펩티드는 비경구적으로, 예컨대 복강내, 근육내, 혈관내 (즉 정맥내 또는 동맥내) 투여를 통해 투여될 수 있다. 특히 폴리펩티드는 정맥내 주입에 의해 투여된다. 상기 투여는 빈번히, 예컨대 매일, 매주, 격주 또는 격월, 특히 매주 또는 격주 반복될 수 있다.
GSDIII 의 치료에서 효과적인 본 발명의 치료제 (즉 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포) 의 양은 표준 임상 기술에 의해 확인될 수 있다. 또한, 생체내 및/또는 시험관내 어세이를 임의로 이용하여 최적 투여량 범위를 예측하는 것을 도울 수 있다. 제제에서 이용되는 정확한 양은 또한 투여 경로, 및 질환의 중증도에 따라 좌우될 것이고, 의사의 판단 및 각 환자의 상황에 따라 결정될 것이다. 필요로 하는 대상체에게 투여되는 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드 또는 세포의 투여량은 투여 경로, 치료되는 특정 질환, 대상체의 연령 또는 치료 효과를 달성하는데 필요한 발현 수준을, 제한 없이, 포함하는 여러 인자에 따라 달라질 것이다. 통상의 기술자는 이들 인자 등에 기반하여 요구되는 투여량 범위를, 통상의 지식에 기초하여, 용이하게 결정할 수 있다. 바이러스 벡터, 예컨대 AAV 벡터를, 대상체에게 투여하는 것을 포함하는 치료의 경우에, 벡터의 전형적인 투여량은 적어도 1x108 킬로그램 체중 당 벡터 게놈 (vector genomes per kilogram body weight) (vg/kg), 예컨대 적어도 1x109 vg/kg, 적어도 1x1010 vg/kg, 적어도 1x1011 vg/kg, 적어도 1x1012 vg/kg 적어도 1x1013 vg/kg, 또는 적어도 1x1014 vg/kg 이다.
본 발명은 또한 GSDIII 의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다.
간경변 및 간세포 암종이 또한 GSD III 에 걸린 환자에서 발병할 수 있다. 따라서, 본 발명은 또한 GSDIII 환자에서의 간경변 및 간세포 암종의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다.
본 발명은 또한 GSD III 의 치료 방법에 관한 것이며, 상기 방법은 이식유전자에 대한 (즉 핵산 분자에 의해 코딩되는 미니-GDE 폴리펩티드에 대한) 면역 반응을 유도하지 않거나, 또는 이식유전자에 대한 감소된 면역 반응을 유도하며, 치료적 유효량의 본 발명의 핵산, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 본 발명은 또한 GSD III 의 치료 방법에 관한 것이며, 상기 방법은 치료적 유효량의 본 발명의 핵산, 벡터, 미니-GDE 폴리펩티드, 약학적 조성물 또는 세포를 이를 필요로 하는 대상체에게 반복 투여하는 것을 포함한다. 이 양태에서, 본 발명의 핵산 분자, 핵산 구축물 또는 벡터는 간 세포에서 기능성인 프로모터를 포함하여, 그로부터 생산되는 발현된 미니-GDE 폴리펩티드에 대한 면역 관용을 허용한다. 또한, 이 양태에서, 이 양태에서 사용되는 약학적 조성물은 간 세포에서 기능성인 프로모터를 포함하는 핵산 분자, 핵산 구축물 또는 벡터를 포함한다. 세포, 특히 간, 심장, CNS 또는 근육 세포의 전달의 경우에, 상기 세포는 치료를 필요로 하는 대상체로부터 이전에 수집되고, 본 발명의 핵산 분자, 핵산 구축물 또는 벡터를 도입하여 그들이 미니-GDE 폴리펩티드를 생산할 수 있게 만들어서 조작된 세포일 수 있다. 구현예에 따르면, 반복된 투여를 포함하는 양태에서, 상기 투여는 적어도 1 회 또는 그 이상 반복될 수 있고, 주기적 스케줄에 따라, 예컨대 1 주 1 회, 1 개월 1 회 또는 1 년 1 회 실시되는 것으로 여겨질 수 있다. 주기적 스케줄은 또한 2, 3, 4, 5, 6, 7, 8, 9 또는 10 년, 또는 10 년 초과 마다 1 회 투여를 포함할 수 있다. 또다른 특정 구현예에서, 본 발명의 바이러스 벡터의 각각의 투여의 투여는 각각의 연속적 투여에 상이한 바이러스를 사용하여 실시되어, 이전에 투여된 바이러스 벡터에 대한 가능한 면역 반응으로 인한 효능의 감소를 회피한다. 예를 들어, AAV8 캡시드를 포함하는 AAV 벡터의 제 1 투여가 실시되고, 그에 뒤이어 AAV9 캡시드를 포함하는 벡터의 투여가 실시될 수 있다.
본 발명에 따르면, 치료는 치유적, 완화 또는 예방적 효과를 포함할 수 있다. 따라서, 치료적 및 예방적 치료는 GSD III 의 증상의 개선 또는 특정 글리코겐 저장 질환의 발병 위험의 방지 또는 그렇지 않으면 감소를 포함한다. 용어 "예방적" 은 특정 병태의 중증도 또는 발병의 감소로 여겨질 수 있다. "예방적" 은 이전에 그 병태를 갖는 것으로 진단된 환자에서 특정 병태의 재발의 방지를 또한 포함한다. "치료적" 은 또한 기존 병태의 중증도를 감소시킬 수 있다. 용어 "치료" 는 본원에서 동물, 특히 포유류, 더욱 특히 인간 대상체에게 유익할 수 있는 임의의 섭생법을 언급하는데 사용된다.
본 발명은 또한 GSD III 의 치료를 위한 생체외 (ex vivo) 유전자 치료 방법에 관한 것이며, 상기 방법은 본 발명의 핵산 분자, 핵산 구축물 또는 벡터를 이를 필요로 하는 환자의 단리된 세포, 예를 들어 단리된 조혈 줄기 세포 내로 도입하는 것, 및 상기 세포를 이를 필요로 하는 상기 환자 내로 도입하는 것을 포함한다.
본 발명은 또한 약제로서 사용하기 위한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물에 관한 것이다.
본 발명은 또한 GDE 유전자에서의 돌연변이에 의해 야기되는 질환의 치료 방법에서, 특히 GSDIII (코리병) 의 치료 방법에서 사용하기 위한 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물에 관한 것이다.
본 발명은 또한 GSD III (코리병) 을 치료하는데 유용한 약제의 제조에 있어서의 본 발명의 핵산 분자, 핵산 구축물, 벡터, 미니-GDE 폴리펩티드, 세포 또는 약학적 조성물의 용도에 관한 것이다.
실시예
본 발명은 하기 실험예 및 첨부된 도면을 참조하여 추가로 상세히 기술된다. 이들 실시예는 오직 설명의 목적을 위해 제공되고, 제한적으로 여겨지면 안된다.
물질 및 방법
웨스턴 블롯 분석
마우스 조직을 DNAse/RNAse 비함유 물에서 균질화시키고, 단백질 농도를 BCA 단백질 어세이 (BCA Protein Assay) 를 사용하여 확인했다. SDS-PAGE 전기영동을 4-15% 구배 폴리아크릴아미드 겔에서 수행했다. 전달 후에, 멤브레인을 차단하고, 항-GDE 항체 및 항-액틴 항체와 함께 인큐베이션했다. 멤브레인을 세정하고, 적당한 이차 항체와 함께 인큐베이션하고, Odyssey 이미지화 시스템에 의해 시각화했다.
효소 활성 측정
위에 기재된 바와 같이 균질화된 조직을 포스페이트 완충제 pH 6.9 에 용해된 한계 덱스트린과 함께 37℃ 에서 3-16 시간 동안 인큐베이션했다. 95℃ 에서 10 min 동안 인큐베이션한 후 11000 x g 에서 10 min 원심분리하여 반응을 중단시켰다. 상청액을 사용하여 생산된 글루코스를 상업적 글루코스 어세이 키트를 이용하여 측정했다. 농축된 H2SO4 로 반응을 중단시키고, 결과적인 흡광도를 EnSpire 알파 플레이트 리더 (Perkin-Elmer, Waltham, MA) 로 540 nm 에서 측정했다.
글리코겐 함량의 측정
글리코겐 함량을 조직 균질액에서 아스페르길루스 니게르 (Aspergillus Niger) 아밀로글루코시다제 (Sigma Aldrich, Saint Louis, MO) 로 총 소화 후에 방출되는 글루코스로서 간접적으로 측정했다. 샘플을 5 min 동안 95℃ 에서 인큐베이션한 후, 4℃ 에서 냉각시켰다; 그 후 0.1M 포타슘 아세테이트 pH5.5 중 1:50 로 희석한 25 μl 의 아밀로글루코시다제를 각각의 샘플에 첨가했다. 아밀로글루코시다제를 사용하지 않는 컨트롤 반응물을 각각의 샘플에 대해 준비했다. 샘플 및 컨트롤 반응물 둘 모두를 37℃ 에서 90 분 동안 인큐베이션했다. 샘플을 5 min 동안 95℃ 에서 인큐베이션하여 반응을 중단시켰다. 방출된 글루코스를 상업적 글루코스 어세이 키트 (Sigma Aldrich, Saint Louis, MO) 로 확인했고, 결과적인 흡광도를 EnSpire 알파 플레이트 리더 (Perkin-Elmer, Waltham, MA) 로 파장 540 nm 에서 획득했다.
근육 기능 시험
평균 행잉 타임 (mean hanging time) 을 측정하기 위해서, 4-mm 와이어 상에서 3 분 지속 행잉 시험 (three-minute lasting hanging test) 을 수행했다. 시험 시작시, "추락 (falling)" 점수 10 을 각각의 동물에게 부여한다. 마우스를 꼬리로 취급하고 와이어 근처로 가져온다. 작업자는 동물을 오직 앞다리로만 매단다. 동물이 제대로 매달리자마자, 180-초 타이머를 시작한다. 동물이 추락하는 경우에, 타이머를 중지하고, 추락 점수를 1 만큼 줄이고, 경과한 시간을 기록한다. 그 후 동물을 앞다리로 매달고, 타이머를 다시 시작한다. 타이머 또는 추락 점수가 0 에 도달할 때 시험을 중단한다. 결과를 분 당 추락의 회수로서 표현한다.
결과
AAV 는 생체내 유전자 요법에 선택되는 벡터이다. 유전자 대체에 AAV 를 사용하는 경우에 가장 큰 한계 중 하나는 5 Kb 로 한정되는 그것의 캡시드화 크기이다. 실제로, 재조합 AAV 생산 동안, 5 Kb 보다 더 큰 게놈은 낮은 효능으로 캡시드화되고, 결과로서 생성되는 AAV 는 단편화된 게놈을 함유할 수 있으며, 이는 유전자 전달의 효능을 감소시킨다. 이러한 한계를 극복하는 상이한 접근법이 개발되었다. 특히 듀얼 AAV 벡터의 사용이 보고되었다. 이 접근법에 따르면, 큰 이식유전자 코딩 서열의 일부를 각각 함유하는, 두 가지 벡터를 사용하여 동일한 세포를 형질도입한다. i) 이식유전자에서 유래하는 중복 서열, ii) 스플라이싱 도너 및 억셉터와 조합된 내부 말단 반복부 (ITR) 또는 iii) 스플라이싱 도너 및 억셉터와 커플링된 이종 고도 재조합유전성 서열을 통해 두 가지 벡터의 재조합이 일어날 수 있다. 그러나, 듀얼 AAV 벡터가 상이한 동물 모델에서 효능을 입증했지만, 그것은 일부 결점을 갖는다. 여기에서 본 발명자들은 단일 AAV 에 맞고, 더 낮은 용량의 듀얼 AAV 벡터와 유사한 효능으로 GSDIII 마우스에서 글리코겐 축적 및 근육 기능을 구조하는 고릴라 GDE 의 사용에 대한 첫번째 데이타를 보고한다.
도 1 은 인간 GDE (hGDE) 보다 작은 4 가지 상이한 포유류 비-인간 GDE 단백질을 나타낸다 (이는 완전하지 않다).
도 2 는 절두된 인간 GDE (hGDE) Δ1, Δ2-3, 및 Δ4 서열을 나타낸다.
첫째로, 본 발명자들은 짧은 비-인간 포유류 GDE 에 의해 GSD III 마우스에서 유도되는 효과를 평가했다. 그 후 근육 특이적 프로모터 (SpC5-12), SV40 인트론, 고릴라 GDE (gGDE) 에 대한 코딩 서열 및 bGH polyA (AAV9-gGDE, 총 크기: 5.1 Kb) 로 구성된 이식유전자 발현 카세트를 사용하여 삼중 트랜스펙션 및 세슘 클로라이드 구배 정제에 의해 AAV9 벡터를 생산했다.
그 후 AAV9-gGDE 벡터를 3 개월령 GSDIII 마우스에게 1x1012 vg/마우스의 용량으로 주입하였으며, 이와 병행하여 CMV 프로모터의 번역 제어 하에 GDE 를 발현하는 듀얼 AAV 벡터를 2x1012 vg/마우스의 용량으로 주입했다. 벡터 주입후 3 개월째에, 마우스를 희생시키고, 조직을 분석하여 GSDIII 의 생화학적 수정을 평가했다. GDE 에 특이적인 항체로 위에 기재된 바와 같이 처리된 마우스의 심장에 대해 수행한 웨스턴 블롯은 AAV9-gGDE 의 주입이 GDE 보다 작고 (추정 크기 ~130 KDa) 특이적 항-GDE 항체에 의해 인지되는 단백질의 발현을 유도한다는 것을 시사한다 (도 3). 그 후 본 발명자들은 AAV9-gGDE 를 주입한 GDE-KO 동물의 사두근에서의 글리코겐 축적을 CMV 의 전사 제어 하에 GDE 를 발현하는 듀얼 AAV9 벡터 (듀얼-GDE) 와 비교하여 평가했다. 도 4 의 그래프에서 AAV-처리된 동물에서 및 미처리 야생형 (WT) 및 KO 동물에서 측정된 글리코겐의 수준이 보고된다. gGDE 를 발현하는 단일 벡터를 이용한 치료는 글리코겐 축적을 듀얼 AAV 벡터로 관찰되는 것과 비슷한 수준까지 없앴다. 부가적으로, 와이어 행에 의한 근육 기능의 측정은 두 개의 접근법 모두가 근육 강도의 구조에서 동등하게 효율적이라는 것을 시사한다 (도 5). 종합하면, 이들 데이타는 근육에서의 AAV-매개되는 gGDE 발현은 GSDIII 마우스의 글리코겐 축적 및 근육 강도를 구조한다는 것을 시사한다.
그 후 본 발명자들은 인간 GDE 서열의 절두된 형태의 활성을 시험관내 및 생체내 둘 모두에서 평가했다. 본 발명자들은 첫째로 간암 세포 (Huh-7) 를 CMV 프로모터의 전사 제어 하의 인간 GDE 에서 유래하는 하나의 절두된 형태를 코딩하는 플라스미드로 트랜스펙션시켰다. 발현 카세트는 또한 SV40 인트론 및 bGH 폴리아데닐화 신호를 함유했다. 트랜스펙션 후 2 일째에, 그 세포로부터 수득한 시토졸 추출물에서 활성을 측정했다. 한계 덱스트린으로부터의 글루코스에 기초하는, 활성 시험은 GDE 의 내생적 발현으로 인한 세포주에서의 기저 활성의 검출을 허용했다. 전체 크기 인간 GDE 과발현은 증가된 GDE 활성을 초래했다. 유사한 결과가 Δ4 절두된 인간 GDE 로 수득되었으나, 고릴라 GDE 로는 그렇지 않았다 (도 6). 그 후 본 발명자들은 GDE 를 발현하는 AAV 벡터의 근육내 주입에 의해 생체내에서 결과를 수득했다. GDE-KO 동물에게 인간 절두된 GDE (Δ1), 고릴라 GDE 를 발현하는 AAV9 벡터, 또는 인간 전체 크기 GDE 를 발현하는 듀얼 벡터를 근육내 주입했다. 주입 후 15 일째에, 앞정강근을 해부하고, GDE 발현 및 활성에 대해 분석했다 (도 7). 항-GDE 항체를 이용한 웨스턴 블롯 분석은 전체 크기 GDE 보다 분자량이 작은 밴드의 존재를 분명히 입증했다 (도 7).
SpC5.12 프로모터의 전사 제어 하의 야생형 (wt) 또는 코돈 최적화된 (co) 세 가지 상이한 절두된 hGDE 를 발현하는 AAV 벡터를 유도했다. 이들 벡터를 1E11 vg/마우스의 용량으로 암컷 GDE-KO 마우스의 오른쪽 앞정강근 (TA) 에 직접 주입했다. 주입 후 15 일째에, 주입된 마우스의 TA 로부터 수득된 추출물에서 GDE 활성을 측정했다. 어떠한 주입도 받지 않은 왼쪽 TA 에서 측정한 GDE 활성을 컨트롤 (Agl-/-, CTRL) 로서 사용했다. GDE 의 상이한 절두된 형태를 발현하는 단일 벡터 AAV 로 처리된 마우스의 TA 로부터 수득된 단백질 추출물은 컨트롤과 비교하여 더 높은 수준의 GDE 활성을 보였다 (도 8).
도 9 는 HEK293 세포에서 트랜스펙션에 의한 부가적 인간 절두된 GDE: Δ9 + Δ2/3; Δ10 + Δ2/3; Δ11 + Δ2/3; Δ12 + Δ2/3; Δ13 + Δ2/3 의 성공적 발현을 입증한다.
도 10 은 상기 인간 절두된 GDE 를 발현하는 AAV9 벡터로 주입 후 15 일째에, GDE-KO 마우스의 앞정강근에서의, 부가적 인간 절두된 GDE: Δ2/3; Δ9 + Δ2/3; Δ10 + Δ2/3; Δ13 + Δ2/3 의 성공적 발현을 추가로 입증한다.
제시된 데이타는 인간 GDE 또는 비-인간 GDE 의 절두된 형태인, GDE 의 더 짧은 형태는 시험관내 및 생체내 둘 모두에서 활성 형태로 발현될 수 있고, GSDIII 마우스에서 축적된 글리코겐을 분해하는데 사용될 수 있다는 것을 명백히 입증한다.
SEQUENCE LISTING <110> GENETHON ET AL. <120> MINI-GDE FOR THE TREATMENT OF GLYCOGEN STORAGE DISEASE III <130> B2813PC00 <160> 63 <170> PatentIn version 3.5 <210> 1 <211> 1532 <212> PRT <213> Homo sapiens <400> 1 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 355 360 365 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 370 375 380 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 385 390 395 400 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 405 410 415 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 420 425 430 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 435 440 445 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 450 455 460 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 465 470 475 480 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 485 490 495 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 500 505 510 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 515 520 525 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 530 535 540 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 545 550 555 560 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 565 570 575 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 580 585 590 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 595 600 605 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 610 615 620 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 625 630 635 640 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 645 650 655 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 660 665 670 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 675 680 685 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 690 695 700 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 705 710 715 720 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 725 730 735 Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg 740 745 750 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 755 760 765 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 770 775 780 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 785 790 795 800 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 805 810 815 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 820 825 830 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 835 840 845 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 850 855 860 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 865 870 875 880 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala 885 890 895 Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu 900 905 910 Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp 915 920 925 Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala 930 935 940 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 945 950 955 960 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 965 970 975 Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe 980 985 990 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 995 1000 1005 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp 1010 1015 1020 Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys 1025 1030 1035 His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe 1040 1045 1050 Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr 1055 1060 1065 Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser 1070 1075 1080 Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys 1085 1090 1095 Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile 1100 1105 1110 Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala 1115 1120 1125 Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly 1130 1135 1140 Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu 1145 1150 1155 Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp 1160 1165 1170 Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser 1175 1180 1185 Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val 1190 1195 1200 Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg 1205 1210 1215 Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu 1220 1225 1230 Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val 1235 1240 1245 Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met 1250 1255 1260 Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro 1265 1270 1275 Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala 1280 1285 1290 Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr 1295 1300 1305 His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser 1310 1315 1320 Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu 1325 1330 1335 Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro 1340 1345 1350 Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala 1355 1360 1365 Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile 1370 1375 1380 Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp 1385 1390 1395 Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly 1400 1405 1410 Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr 1415 1420 1425 Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe 1430 1435 1440 Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe 1445 1450 1455 Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr 1460 1465 1470 Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His 1475 1480 1485 Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu 1490 1495 1500 Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln 1505 1510 1515 Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1520 1525 1530 <210> 2 <211> 1376 <212> PRT <213> artificial <220> <223> D1 hGDE <400> 2 Met Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys 1 5 10 15 Tyr Ser Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro 20 25 30 Asn Arg Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu 35 40 45 Lys Lys Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His 50 55 60 Thr Ala Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr 65 70 75 80 Asn Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg 85 90 95 Ala Leu Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu 100 105 110 Lys Gly Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile 115 120 125 Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu 130 135 140 Phe Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu 145 150 155 160 Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His 165 170 175 Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val 180 185 190 Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro 195 200 205 Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu 210 215 220 Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala 225 230 235 240 Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His 245 250 255 Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg 260 265 270 Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser 275 280 285 Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly 290 295 300 Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser 305 310 315 320 Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys 325 330 335 Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His 340 345 350 Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg 355 360 365 Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu 370 375 380 Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu 385 390 395 400 Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly 405 410 415 Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu 420 425 430 Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe 435 440 445 Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu 450 455 460 Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser 465 470 475 480 Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys 485 490 495 Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile 500 505 510 Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala 515 520 525 Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala 530 535 540 Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly 545 550 555 560 Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val 565 570 575 Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg 580 585 590 Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro 595 600 605 Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg 610 615 620 Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile 625 630 635 640 Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu 645 650 655 Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro 660 665 670 Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser 675 680 685 Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val 690 695 700 Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser 705 710 715 720 Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe 725 730 735 Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu 740 745 750 Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp 755 760 765 Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met 770 775 780 Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe 785 790 795 800 Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn 805 810 815 Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu 820 825 830 Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro 835 840 845 Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp 850 855 860 Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe 865 870 875 880 Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys 885 890 895 Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr 900 905 910 Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu 915 920 925 Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly 930 935 940 Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg 945 950 955 960 Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg 965 970 975 His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr 980 985 990 Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr 995 1000 1005 Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val 1010 1015 1020 Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly 1025 1030 1035 Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln 1040 1045 1050 Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro 1055 1060 1065 Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala 1070 1075 1080 Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe 1085 1090 1095 Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala 1100 1105 1110 Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val 1115 1120 1125 Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu 1130 1135 1140 Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys 1145 1150 1155 Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg 1160 1165 1170 Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp 1175 1180 1185 Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg 1190 1195 1200 Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp 1205 1210 1215 Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro 1220 1225 1230 Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala 1235 1240 1245 Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro 1250 1255 1260 Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn 1265 1270 1275 Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro 1280 1285 1290 Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr 1295 1300 1305 Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val 1310 1315 1320 Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg 1325 1330 1335 Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln 1340 1345 1350 Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr 1355 1360 1365 Ile Leu Glu Thr Leu Tyr Asp Leu 1370 1375 <210> 3 <211> 1464 <212> PRT <213> artificial <220> <223> D2 hGDE <400> 3 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Tyr Phe Thr Phe Pro Phe Glu Glu 355 360 365 Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala 370 375 380 Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu 385 390 395 400 Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu 405 410 415 Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu 420 425 430 Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr 435 440 445 Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro 450 455 460 Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro 465 470 475 480 Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp 485 490 495 Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala 500 505 510 Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr 515 520 525 Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu 530 535 540 Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn 545 550 555 560 Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr 565 570 575 Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr 580 585 590 Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe 595 600 605 Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val 610 615 620 Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu 625 630 635 640 His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln 645 650 655 Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His 660 665 670 Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr 675 680 685 Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile 690 695 700 Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro 705 710 715 720 Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val 725 730 735 Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln 740 745 750 Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu 755 760 765 Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu 770 775 780 Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr 785 790 795 800 Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala 805 810 815 Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr 820 825 830 Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys 835 840 845 Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys 850 855 860 Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro 865 870 875 880 Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp 885 890 895 Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr 900 905 910 Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys 915 920 925 Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile 930 935 940 Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser 945 950 955 960 Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser 965 970 975 Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser 980 985 990 Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu 995 1000 1005 Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe 1010 1015 1020 Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala 1025 1030 1035 Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg 1040 1045 1050 Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile 1055 1060 1065 Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg 1070 1075 1080 Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys 1085 1090 1095 Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg 1100 1105 1110 Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu 1115 1120 1125 Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His 1130 1135 1140 Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile 1145 1150 1155 Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val 1160 1165 1170 Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys 1175 1180 1185 Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn 1190 1195 1200 Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile 1205 1210 1215 Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser 1220 1225 1230 Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His 1235 1240 1245 Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile 1250 1255 1260 Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser 1265 1270 1275 Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile 1280 1285 1290 Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln 1295 1300 1305 Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu 1310 1315 1320 Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys 1325 1330 1335 Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp 1340 1345 1350 Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn 1355 1360 1365 Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp 1370 1375 1380 Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser 1385 1390 1395 Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val 1400 1405 1410 Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro 1415 1420 1425 Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys 1430 1435 1440 Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu 1445 1450 1455 Glu Thr Leu Tyr Asp Leu 1460 <210> 4 <211> 1430 <212> PRT <213> artificial <220> <223> D3 hGDE <400> 4 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 355 360 365 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 370 375 380 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 385 390 395 400 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 405 410 415 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 420 425 430 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 435 440 445 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 450 455 460 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 465 470 475 480 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 485 490 495 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 500 505 510 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 515 520 525 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 530 535 540 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 545 550 555 560 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 565 570 575 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 580 585 590 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 595 600 605 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 610 615 620 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 625 630 635 640 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 645 650 655 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Gly Lys Ile Glu Glu 660 665 670 Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg 675 680 685 Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile 690 695 700 Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly 705 710 715 720 Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu 725 730 735 Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro 740 745 750 His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe 755 760 765 Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro 770 775 780 Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala 785 790 795 800 Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp 805 810 815 Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala 820 825 830 Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn 835 840 845 Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met 850 855 860 Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala 865 870 875 880 Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile 885 890 895 Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala 900 905 910 Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val 915 920 925 Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln 930 935 940 Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala 945 950 955 960 Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu 965 970 975 Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly 980 985 990 Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile 995 1000 1005 Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu 1010 1015 1020 Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu 1025 1030 1035 Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp 1040 1045 1050 Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn 1055 1060 1065 Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr 1070 1075 1080 Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu 1085 1090 1095 Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile 1100 1105 1110 Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met 1115 1120 1125 Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr 1130 1135 1140 Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met 1145 1150 1155 Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro 1160 1165 1170 Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser 1175 1180 1185 Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile 1190 1195 1200 Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile 1205 1210 1215 Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe 1220 1225 1230 Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu 1235 1240 1245 Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser 1250 1255 1260 Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn 1265 1270 1275 Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu 1280 1285 1290 Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly 1295 1300 1305 Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys 1310 1315 1320 Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala 1325 1330 1335 Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile 1340 1345 1350 Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly 1355 1360 1365 Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu 1370 1375 1380 Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu 1385 1390 1395 Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys 1400 1405 1410 Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr 1415 1420 1425 Asp Leu 1430 <210> 5 <211> 1362 <212> PRT <213> artificial <220> <223> D2,3 hGDE <400> 5 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Tyr Phe Thr Phe Pro Phe Glu Glu 355 360 365 Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala 370 375 380 Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu 385 390 395 400 Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu 405 410 415 Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu 420 425 430 Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr 435 440 445 Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro 450 455 460 Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro 465 470 475 480 Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp 485 490 495 Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala 500 505 510 Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr 515 520 525 Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu 530 535 540 Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn 545 550 555 560 Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr 565 570 575 Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr 580 585 590 Asp Glu Leu Val Pro His Gln Gly Lys Ile Glu Glu Val Val Leu Glu 595 600 605 Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn 610 615 620 Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile 625 630 635 640 Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys 645 650 655 Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro 660 665 670 Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val 675 680 685 Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe 690 695 700 Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile 705 710 715 720 Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln 725 730 735 Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys 740 745 750 Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly 755 760 765 Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His 770 775 780 Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val 785 790 795 800 Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys 805 810 815 Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu 820 825 830 Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu 835 840 845 Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser 850 855 860 Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val 865 870 875 880 Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val 885 890 895 Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val 900 905 910 Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys 915 920 925 Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr 930 935 940 Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr 945 950 955 960 Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala 965 970 975 Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln 980 985 990 Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro 995 1000 1005 Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala 1010 1015 1020 Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 1025 1030 1035 Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly 1040 1045 1050 Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr 1055 1060 1065 Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg 1070 1075 1080 Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg 1085 1090 1095 Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala 1100 1105 1110 Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu 1115 1120 1125 Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val 1130 1135 1140 Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn 1145 1150 1155 Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu 1160 1165 1170 Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys 1175 1180 1185 Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys 1190 1195 1200 Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala 1205 1210 1215 Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile 1220 1225 1230 Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp 1235 1240 1245 Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp 1250 1255 1260 Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly 1265 1270 1275 Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu 1280 1285 1290 Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile 1295 1300 1305 Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu 1310 1315 1320 Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala 1325 1330 1335 Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala 1340 1345 1350 Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1355 1360 <210> 6 <211> 1339 <212> PRT <213> artificial <220> <223> D4 hGDE <400> 6 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 355 360 365 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 370 375 380 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 385 390 395 400 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 405 410 415 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 420 425 430 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 435 440 445 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 450 455 460 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 465 470 475 480 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 485 490 495 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 500 505 510 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 515 520 525 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 530 535 540 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 545 550 555 560 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 565 570 575 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 580 585 590 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 595 600 605 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 610 615 620 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 625 630 635 640 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 645 650 655 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 660 665 670 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 675 680 685 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 690 695 700 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 705 710 715 720 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 725 730 735 Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg 740 745 750 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 755 760 765 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 770 775 780 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 785 790 795 800 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 805 810 815 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 820 825 830 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 835 840 845 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 850 855 860 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 865 870 875 880 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Pro 885 890 895 His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile 900 905 910 Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg 915 920 925 Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro 930 935 940 Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala 945 950 955 960 Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro 965 970 975 Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr 980 985 990 Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe 995 1000 1005 Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln 1010 1015 1020 Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys 1025 1030 1035 Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly 1040 1045 1050 Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp 1055 1060 1065 Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala 1070 1075 1080 Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys 1085 1090 1095 Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe 1100 1105 1110 Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys 1115 1120 1125 Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu 1130 1135 1140 Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys 1145 1150 1155 His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr 1160 1165 1170 Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe 1175 1180 1185 Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys 1190 1195 1200 Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro 1205 1210 1215 Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly 1220 1225 1230 Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys 1235 1240 1245 Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly 1250 1255 1260 Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro 1265 1270 1275 Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser 1280 1285 1290 Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro 1295 1300 1305 Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu 1310 1315 1320 Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp 1325 1330 1335 Leu <210> 7 <211> 1313 <212> PRT <213> artificial <220> <223> D5 hGDE <400> 7 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Asn Arg 210 215 220 Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp 225 230 235 240 Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu 245 250 255 Thr Thr Phe Ile Pro Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe 260 265 270 Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu 275 280 285 Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe 290 295 300 Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp 305 310 315 320 Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro 325 330 335 Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr 340 345 350 Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val 355 360 365 Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr 370 375 380 Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe 385 390 395 400 Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala 405 410 415 Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu 420 425 430 Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala 435 440 445 Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro 450 455 460 Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val 465 470 475 480 Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu 485 490 495 Val Pro His Gln Ile Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala 500 505 510 Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr 515 520 525 Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val 530 535 540 Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala 545 550 555 560 Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser 565 570 575 Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln 580 585 590 Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly 595 600 605 Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly 610 615 620 Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala 625 630 635 640 Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys 645 650 655 Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro 660 665 670 Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile 675 680 685 Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr 690 695 700 Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu 705 710 715 720 Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro 725 730 735 Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser 740 745 750 Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp 755 760 765 Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile 770 775 780 Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu 785 790 795 800 Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr 805 810 815 Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly 820 825 830 Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro 835 840 845 Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser 850 855 860 Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp 865 870 875 880 Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly 885 890 895 Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu 900 905 910 Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg 915 920 925 Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp 930 935 940 Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val 945 950 955 960 Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr 965 970 975 Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His 980 985 990 Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp 995 1000 1005 Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp 1010 1015 1020 Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly 1025 1030 1035 Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg 1040 1045 1050 Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val 1055 1060 1065 Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys 1070 1075 1080 Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly 1085 1090 1095 Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln 1100 1105 1110 Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp 1115 1120 1125 Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr 1130 1135 1140 Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu 1145 1150 1155 Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe 1160 1165 1170 Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys 1175 1180 1185 Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met 1190 1195 1200 Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr 1205 1210 1215 Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu 1220 1225 1230 Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg 1235 1240 1245 Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys 1250 1255 1260 Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp 1265 1270 1275 Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro 1280 1285 1290 Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu 1295 1300 1305 Thr Leu Tyr Asp Leu 1310 <210> 8 <211> 1252 <212> PRT <213> artificial <220> <223> D6 hGDE <400> 8 Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu 1 5 10 15 Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln 20 25 30 Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp 35 40 45 Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe 50 55 60 Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His 65 70 75 80 Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys 85 90 95 Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His 100 105 110 Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg 115 120 125 Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro 130 135 140 Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser 145 150 155 160 Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met 165 170 175 Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala 180 185 190 Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly 195 200 205 Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr 210 215 220 Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe 225 230 235 240 Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala 245 250 255 Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val 260 265 270 Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val 275 280 285 Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr 290 295 300 Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro 305 310 315 320 Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile 325 330 335 Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile 340 345 350 Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser 355 360 365 Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val 370 375 380 Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp 385 390 395 400 Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser 405 410 415 Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu 420 425 430 Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp 435 440 445 Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val 450 455 460 Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser 465 470 475 480 Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val 485 490 495 Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp 500 505 510 Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu 515 520 525 His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala 530 535 540 Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu 545 550 555 560 Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala 565 570 575 Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro 580 585 590 His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu 595 600 605 Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu 610 615 620 Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly 625 630 635 640 Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu 645 650 655 Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu 660 665 670 Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp 675 680 685 Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val 690 695 700 Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg 705 710 715 720 Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr 725 730 735 Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn 740 745 750 Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys 755 760 765 Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met 770 775 780 Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys 785 790 795 800 Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe 805 810 815 Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu 820 825 830 Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala 835 840 845 Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile 850 855 860 Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys 865 870 875 880 Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys 885 890 895 Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro 900 905 910 Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 915 920 925 Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro 930 935 940 Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly 945 950 955 960 Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys 965 970 975 Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg 980 985 990 Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly 995 1000 1005 Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys 1010 1015 1020 Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys 1025 1030 1035 Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp 1040 1045 1050 Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu 1055 1060 1065 Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys 1070 1075 1080 Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg 1085 1090 1095 Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr 1100 1105 1110 Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu 1115 1120 1125 Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val 1130 1135 1140 Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn 1145 1150 1155 Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp 1160 1165 1170 Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu 1175 1180 1185 Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn 1190 1195 1200 Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys 1205 1210 1215 Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe 1220 1225 1230 Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr 1235 1240 1245 Leu Tyr Asp Leu 1250 <210> 9 <211> 1108 <212> PRT <213> artificial <220> <223> D7 hGDE <400> 9 Met Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser 1 5 10 15 Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met 20 25 30 Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala 35 40 45 Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly 50 55 60 Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr 65 70 75 80 Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe 85 90 95 Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala 100 105 110 Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val 115 120 125 Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val 130 135 140 Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr 145 150 155 160 Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro 165 170 175 Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile 180 185 190 Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile 195 200 205 Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser 210 215 220 Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val 225 230 235 240 Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp 245 250 255 Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser 260 265 270 Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu 275 280 285 Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp 290 295 300 Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val 305 310 315 320 Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser 325 330 335 Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val 340 345 350 Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp 355 360 365 Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu 370 375 380 His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala 385 390 395 400 Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu 405 410 415 Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala 420 425 430 Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro 435 440 445 His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu 450 455 460 Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu 465 470 475 480 Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly 485 490 495 Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu 500 505 510 Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu 515 520 525 Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp 530 535 540 Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val 545 550 555 560 Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg 565 570 575 Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr 580 585 590 Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn 595 600 605 Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys 610 615 620 Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met 625 630 635 640 Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys 645 650 655 Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe 660 665 670 Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu 675 680 685 Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala 690 695 700 Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile 705 710 715 720 Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys 725 730 735 Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys 740 745 750 Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro 755 760 765 Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 770 775 780 Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro 785 790 795 800 Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly 805 810 815 Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys 820 825 830 Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg 835 840 845 Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly 850 855 860 Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn 865 870 875 880 Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile 885 890 895 Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu 900 905 910 Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His 915 920 925 Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala 930 935 940 Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala 945 950 955 960 Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala 965 970 975 Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr 980 985 990 Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu 995 1000 1005 Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln 1010 1015 1020 Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys 1025 1030 1035 Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr 1040 1045 1050 Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu 1055 1060 1065 Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn 1070 1075 1080 Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile 1085 1090 1095 Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1100 1105 <210> 10 <211> 1303 <212> PRT <213> artificial <220> <223> D8 hGDE <400> 10 Met His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser Pro His Leu Lys 1 5 10 15 Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe Ser Cys Asp Val 20 25 30 Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala Leu Ile Glu Asn 35 40 45 Asp His His Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe 50 55 60 Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala 65 70 75 80 Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr 85 90 95 Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr 100 105 110 Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe 115 120 125 Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp 130 135 140 Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile 145 150 155 160 Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe 165 170 175 Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg 180 185 190 Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile 195 200 205 Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys 210 215 220 Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg 225 230 235 240 Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile 245 250 255 Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp 260 265 270 Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala 275 280 285 Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu 290 295 300 His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn 305 310 315 320 Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn 325 330 335 Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met 340 345 350 Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly 355 360 365 Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met 370 375 380 Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu 385 390 395 400 Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr 405 410 415 Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp 420 425 430 Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr 435 440 445 Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn 450 455 460 Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His 465 470 475 480 Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val 485 490 495 Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln 500 505 510 Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser 515 520 525 Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu 530 535 540 Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr 545 550 555 560 Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu 565 570 575 Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala 580 585 590 Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe 595 600 605 Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp 610 615 620 Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln 625 630 635 640 Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp 645 650 655 Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu 660 665 670 Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu 675 680 685 Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr 690 695 700 Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys 705 710 715 720 Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp 725 730 735 Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile 740 745 750 Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln 755 760 765 Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly 770 775 780 Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe 785 790 795 800 Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val 805 810 815 Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro 820 825 830 Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys 835 840 845 Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser 850 855 860 Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly 865 870 875 880 Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu 885 890 895 Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly 900 905 910 Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp 915 920 925 Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp 930 935 940 Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala 945 950 955 960 Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln 965 970 975 Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn 980 985 990 Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile 995 1000 1005 Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn 1010 1015 1020 Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp 1025 1030 1035 Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser 1040 1045 1050 Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu 1055 1060 1065 Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr 1070 1075 1080 Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp 1085 1090 1095 Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser 1100 1105 1110 Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His 1115 1120 1125 Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp 1130 1135 1140 Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val 1145 1150 1155 Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu 1160 1165 1170 Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu 1175 1180 1185 Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu 1190 1195 1200 Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln 1205 1210 1215 Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys 1220 1225 1230 Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr 1235 1240 1245 Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu 1250 1255 1260 Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn 1265 1270 1275 Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile 1280 1285 1290 Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1295 1300 <210> 11 <211> 1377 <212> PRT <213> Equus caballus <400> 11 Met Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Ser 1 5 10 15 Tyr Ser Leu Ala Asp Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro 20 25 30 Asn Lys Lys Tyr Thr Trp His Asp Val Gly Gln Leu Val Glu Lys Leu 35 40 45 Lys Lys Glu Trp Asp Ile Leu Cys Ile Thr Asp Val Val Tyr Asn His 50 55 60 Thr Ala Ala Asn Ser Lys Trp Ile His Glu His Pro Glu Ser Ala Tyr 65 70 75 80 Asn Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg 85 90 95 Ala Leu Trp His Leu Ser Cys Asp Val Ala Glu Gly Lys Tyr Arg Glu 100 105 110 Lys Gly Val Pro Ala Leu Ile Glu Asn Asp His Gln Met Asn Cys Ile 115 120 125 Arg Lys Ile Ile Trp Glu Asp Ile Tyr Pro Lys Ile His Leu Trp Glu 130 135 140 Phe Phe Gln Val Asp Val His Lys Ala Val Glu Gln Phe Arg Gly Leu 145 150 155 160 Leu Thr Gln Glu Asn Arg Lys Ile Ile Ser Gln Pro Asp Pro Lys Gln 165 170 175 His Leu Lys Ile Ile Gln Asp Pro Glu Tyr Arg Arg Leu Gly Cys Thr 180 185 190 Val Asp Met Asn Ile Ala Leu Ala Thr Phe Ile Pro His Asp Asn Gly 195 200 205 Pro Ala Ala Ile Asp Glu Cys Cys Asn Trp Phe Arg Lys Arg Ile Glu 210 215 220 Glu Leu Asn Ala Glu Lys His Gln Leu Val Asn Tyr His Gln Glu Gln 225 230 235 240 Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly 245 250 255 His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr 260 265 270 Arg Tyr Phe Thr Phe Pro Phe Glu Glu Met Thr Pro Ser Thr Glu Glu 275 280 285 Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn 290 295 300 Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly 305 310 315 320 Ser Asp Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val 325 330 335 Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala 340 345 350 His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr His Phe Gln Gly Val 355 360 365 Arg Leu Asp Asn Cys His Ser Thr Pro Ile His Val Ala Glu Tyr Met 370 375 380 Leu Asp Ala Ala Arg Lys Leu Gln Pro Asn Leu Tyr Val Val Ala Glu 385 390 395 400 Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Ile Phe Val Thr Arg Leu 405 410 415 Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Ala Asp Ser His 420 425 430 Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser 435 440 445 Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala 450 455 460 Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg 465 470 475 480 Ser Ala Tyr Asp Ala Leu Pro Ser Ser Thr Ile Val Ser Met Ala Ser 485 490 495 Cys Ala Ser Gly Ser Thr Lys Gly Tyr Asp Glu Leu Val Pro His Gln 500 505 510 Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu 515 520 525 Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile 530 535 540 Ala Ala Arg Arg Ala Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys 545 550 555 560 Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Gln Asp Ile Val Ala 565 570 575 Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ser Val Ser 580 585 590 Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val 595 600 605 Pro His Met Tyr Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala 610 615 620 Arg Thr Ile Glu Arg His Thr Ile Pro Tyr Lys Lys Asp Glu Asn Ser 625 630 635 640 Ile Asn Gly Met Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln 645 650 655 Leu Asn Glu Ser Lys Ile Val Lys His Ala Gly Ile Val Thr Lys Gly 660 665 670 Pro Asn Glu Phe Val Gln Glu Ile Glu Phe Glu Asn Leu Thr Pro Gly 675 680 685 Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala 690 695 700 Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys 705 710 715 720 Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro 725 730 735 Phe Ala Ser Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu Asn Gln Val 740 745 750 Leu Tyr Arg Cys Glu Ser Glu Glu Gln Glu Asp Gly Gly Gly Cys Tyr 755 760 765 Asn Ile Pro Asn Trp Ser Ser Leu Lys Tyr Ala Gly Leu Gln Gly Leu 770 775 780 Met Ser Ile Leu Ala Glu Ile Arg Pro Arg Asn Asp Leu Gly His Pro 785 790 795 800 Phe Cys Asp Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser 805 810 815 Ser Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp 820 825 830 Leu Gln Ala Met Phe Leu Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile 835 840 845 Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu 850 855 860 Asp Ile Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr 865 870 875 880 Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Met Cys Gly Val Gly 885 890 895 Lys Phe Pro Ser Leu Pro Leu Leu Ser Pro Ser Leu Thr Asp Leu Pro 900 905 910 Tyr Arg Val Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Gly Ser 915 920 925 Leu Ala Ala Gly Leu Pro His Phe Ser Ala Gly Ile Phe Arg Cys Trp 930 935 940 Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Leu Leu Leu Val Thr Gly 945 950 955 960 Arg Tyr Leu Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu 965 970 975 Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Thr His Ala Arg 980 985 990 Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp 995 1000 1005 Tyr Cys Lys Ile Val Pro Asn Gly Leu Asp Ile Leu Arg Cys Pro 1010 1015 1020 Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Val Pro Leu Ser Ala 1025 1030 1035 Gly Thr Val Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 1040 1045 1050 Gln Arg His Val Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly 1055 1060 1065 Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr 1070 1075 1080 Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg 1085 1090 1095 Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg 1100 1105 1110 Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala 1115 1120 1125 Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu 1130 1135 1140 Glu Leu Ser Arg Lys Asn Ile Phe Pro Tyr His Glu Val Arg Val 1145 1150 1155 Lys Arg His Gly Lys Phe Val Thr Val Ser Tyr Asp Glu Trp Asn 1160 1165 1170 Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu 1175 1180 1185 Asp Pro Ser Asp Phe Asn Glu Lys His Pro Glu Leu Val His Lys 1190 1195 1200 Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys 1205 1210 1215 Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala 1220 1225 1230 Pro Glu Leu Phe Thr Pro Glu Lys Ala Trp Lys Ala Leu Glu Ile 1235 1240 1245 Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp 1250 1255 1260 Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp 1265 1270 1275 Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly 1280 1285 1290 Pro Glu Trp Leu Trp Pro Thr Gly Tyr Phe Leu Arg Ala Lys Leu 1295 1300 1305 Tyr Phe Ser Lys Leu Met Gly Pro Glu Thr Asn Ala Lys Thr Met 1310 1315 1320 Phe Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu 1325 1330 1335 Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Gly 1340 1345 1350 Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala 1355 1360 1365 Thr Val Leu Glu Thr Leu Tyr Asp Leu 1370 1375 <210> 12 <211> 1365 <212> PRT <213> Gorilla gorilla <400> 12 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Glu Tyr Phe Thr Phe Pro Phe Glu 355 360 365 Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys 370 375 380 Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro 385 390 395 400 Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu 405 410 415 Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro 420 425 430 Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile 435 440 445 Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr 450 455 460 Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln 465 470 475 480 Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu 485 490 495 Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu 500 505 510 Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg 515 520 525 Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro 530 535 540 Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp 545 550 555 560 Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser 565 570 575 Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly 580 585 590 Tyr Asp Glu Leu Val Pro His Gln Phe Leu Gly Lys Ile Glu Glu Val 595 600 605 Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Met Lys Pro Tyr Arg Lys 610 615 620 Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile Arg 625 630 635 640 Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val 645 650 655 Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn 660 665 670 Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His 675 680 685 Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser 690 695 700 Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro Ile 705 710 715 720 Leu Lys Ile Pro Phe Ala Ser Ile Ala Ser Arg Leu Thr Leu Ala Glu 725 730 735 Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly 740 745 750 Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly 755 760 765 Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp 770 775 780 Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile 785 790 795 800 Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu 805 810 815 Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro 820 825 830 Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr 835 840 845 Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val Gln 850 855 860 Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu 865 870 875 880 Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu 885 890 895 Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln 900 905 910 Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile 915 920 925 Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu 930 935 940 Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe 945 950 955 960 Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly 965 970 975 Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln 980 985 990 Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Val Asp Ile Leu 995 1000 1005 Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro 1010 1015 1020 Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln 1025 1030 1035 Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg 1040 1045 1050 Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe 1055 1060 1065 Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly 1070 1075 1080 Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu 1085 1090 1095 Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp 1100 1105 1110 Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg 1115 1120 1125 Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu 1130 1135 1140 Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp 1145 1150 1155 Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His 1160 1165 1170 Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu 1175 1180 1185 Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser 1190 1195 1200 Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met 1205 1210 1215 Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala 1220 1225 1230 Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys 1235 1240 1245 Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn 1250 1255 1260 Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr 1265 1270 1275 His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg 1280 1285 1290 Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala 1295 1300 1305 Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val 1310 1315 1320 His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn 1325 1330 1335 Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp 1340 1345 1350 Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1355 1360 1365 <210> 13 <211> 1299 <212> PRT <213> Pongo abelii <400> 13 Met Gly His Ser Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 35 40 45 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 100 105 110 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 180 185 190 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 210 215 220 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 225 230 235 240 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 245 250 255 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 260 265 270 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 275 280 285 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Glu Val 290 295 300 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 305 310 315 320 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 325 330 335 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 340 345 350 Ala Leu Thr Thr Phe Ile Pro His Asp Asn Gly Pro Ala Ala Ile Glu 355 360 365 Glu Cys Cys Asn Trp Phe Arg Lys Arg Ile Glu Glu Leu Asn Ser Glu 370 375 380 Lys His Gln Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 385 390 395 400 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 405 410 415 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 420 425 430 Pro Phe Glu Glu Met Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 435 440 445 Pro Asn Lys Ala Cys Leu Leu Met Ala His Asn Gly Trp Val Met Gly 450 455 460 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 465 470 475 480 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 485 490 495 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 500 505 510 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 515 520 525 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 530 535 540 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 545 550 555 560 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 565 570 575 Ile Arg Glu Ala Met Ser Ala Tyr Asp Ser His Glu Glu Gly Arg Leu 580 585 590 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 595 600 605 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 610 615 620 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 625 630 635 640 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 645 650 655 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 660 665 670 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 675 680 685 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 690 695 700 Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 705 710 715 720 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 725 730 735 Pro Ser Ile His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg 740 745 750 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 755 760 765 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 770 775 780 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 785 790 795 800 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 805 810 815 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Phe Ile 820 825 830 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 835 840 845 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 850 855 860 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 865 870 875 880 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Leu Pro His 885 890 895 Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala 900 905 910 Leu Arg Gly Met Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn 915 920 925 Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn 930 935 940 Leu Leu Gly Glu Gly Thr Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val 945 950 955 960 Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Val Val Pro Asn 965 970 975 Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp 980 985 990 Asp Ser Ala Pro Leu Pro Ala Gly Ala Leu Phe Asn Ile Thr Ala Gly 995 1000 1005 Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn 1010 1015 1020 Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg 1025 1030 1035 Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu 1040 1045 1050 Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu 1055 1060 1065 Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys His 1070 1075 1080 Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile 1085 1090 1095 Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser 1100 1105 1110 Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile 1115 1120 1125 Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln 1130 1135 1140 Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu 1145 1150 1155 Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys 1160 1165 1170 Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp 1175 1180 1185 Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn 1190 1195 1200 Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp 1205 1210 1215 Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser 1220 1225 1230 Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val 1235 1240 1245 Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro 1250 1255 1260 Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys 1265 1270 1275 Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Val Ala Thr Ile Leu 1280 1285 1290 Glu Thr Leu Tyr Asp Leu 1295 <210> 14 <211> 1390 <212> PRT <213> Pteropus alecto <400> 14 Met Gly His Gly Lys Gln Ile Arg Ile Leu Leu Leu Asn Glu Met Glu 1 5 10 15 Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Phe Glu Leu Gln 20 25 30 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Thr Val Thr Val His Thr 35 40 45 Asn Tyr Pro Tyr Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 50 55 60 Leu Glu Trp Glu Asn Pro Ser Glu Arg Glu Asp Asp Ser Asp Lys Tyr 65 70 75 80 Cys Lys Leu Asn Leu Gln Gln Ala Gly Ser Phe Gln Tyr Tyr Phe Leu 85 90 95 Arg Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Val 100 105 110 Leu Arg Val Gly Thr Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 115 120 125 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Leu Asp Glu Trp Glu 130 135 140 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 145 150 155 160 Thr Pro Leu Gln Thr Leu Gly Gln Ser Arg Ser Cys Tyr Ser Leu Ala 165 170 175 Asp Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Lys Lys Cys 180 185 190 Thr Trp Asp Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 195 200 205 Asn Ile Leu Cys Ile Thr Asp Val Val Tyr Asn His Thr Gly Asn Arg 210 215 220 Lys Ile Thr Lys Pro Asp Pro Lys Glu His Leu Lys Ile Ile Gln Asp 225 230 235 240 Pro Glu Tyr Arg Arg Leu Gly Cys Thr Val Asp Met Asn Ile Ala Leu 245 250 255 Ala Thr Phe Ile Pro Asn Glu Tyr Phe Thr Phe Pro Phe Glu Glu Met 260 265 270 Thr Leu Ser Thr Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys 275 280 285 Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg 290 295 300 Asn Phe Ala Glu Pro Gly Ser Asp Val Tyr Leu Arg Arg Glu Leu Ile 305 310 315 320 Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp 325 330 335 Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala 340 345 350 Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu 355 360 365 His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Lys Leu Gln Pro Asn 370 375 380 Leu Tyr Ile Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn 385 390 395 400 Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met 405 410 415 Ser Ala His Asp Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly 420 425 430 Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met 435 440 445 Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu 450 455 460 Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Ser Met 465 470 475 480 Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Lys Gly Tyr Asp 485 490 495 Glu Leu Val Pro His Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile 500 505 510 Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala 515 520 525 Val Ser Arg Thr Ala Phe Lys Asn Pro Lys Thr Ser Phe Tyr Ser Lys 530 535 540 Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu 545 550 555 560 Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Lys Arg Asp Glu 565 570 575 Asn Ser Ile Asn Gly Met Pro Asp Ile Thr Ala Glu Ile Arg Glu His 580 585 590 Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Ile Ala Thr 595 600 605 Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser 610 615 620 Pro Gly Ser Val Ile Val Phe Arg Val Ser Leu Asp Pro His Ala Gln 625 630 635 640 Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His 645 650 655 Phe Lys Ser Gly Ser Leu Ser Ala Asp Ser Ser Asp Pro Ile Leu Lys 660 665 670 Ile Pro Phe Ala Tyr Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu Asn 675 680 685 Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Gln Glu Asp Gly Gly Gly 690 695 700 Cys Tyr Asn Ile Pro Asn Trp Ser Ser Leu Lys Tyr Ala Gly Leu Gln 705 710 715 720 Glu Asn Ser Ser Leu Glu Leu Ala Pro Tyr Val Gly Phe Gly Gly Gly 725 730 735 Cys Gly Ala Ala Pro Ala Gly Leu Asn Arg Gly Gly Gly Val Arg Ser 740 745 750 Asp Gln Ala Ser Leu Glu Arg Phe Leu Thr Thr Leu Leu Ala Thr Val 755 760 765 Asp Tyr Thr Ala Leu Val Ser Thr Ser Val Cys Ser Pro His Ile Thr 770 775 780 Gly His Glu Gln Gln Pro Arg Leu Trp Glu Arg Ile Ala Ser Ala Asn 785 790 795 800 Asn Ile Ala Cys Tyr Phe Tyr Asp Phe Ser Gly Leu Met Ser Val Leu 805 810 815 Ala Glu Met Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asp Asn 820 825 830 Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile 835 840 845 Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Arg Trp Leu Gln Ala Met 850 855 860 Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe 865 870 875 880 Asp Ala Val Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp 885 890 895 Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His 900 905 910 Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Tyr Ala Ser 915 920 925 Leu Pro Leu Leu Ser Pro Ser Leu Met Asp Val Pro Tyr Arg Leu Asn 930 935 940 Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Thr Leu Ala Ala Gly 945 950 955 960 Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr 965 970 975 Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Leu Glu 980 985 990 Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu 995 1000 1005 Ile Pro Asn Leu Leu Gly Glu Gly Thr Tyr Ala Arg Tyr Asn Cys 1010 1015 1020 Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys 1025 1030 1035 Lys Val Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser 1040 1045 1050 Arg Met Tyr Pro Thr Asp Asp Ser Val Pro Leu Ser Ala Gly Thr 1055 1060 1065 Val Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Arg 1070 1075 1080 His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln 1085 1090 1095 Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Val Gly 1100 1105 1110 Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn 1115 1120 1125 Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg 1130 1135 1140 Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu 1145 1150 1155 Ile Val Gly Leu Ser Lys Ser Ala Ile Arg Trp Leu Leu Glu Leu 1160 1165 1170 Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg 1175 1180 1185 Asp Gly Lys Val Val Thr Val Ser Tyr Asp Glu Trp Asn Arg Lys 1190 1195 1200 Ile Gln Asp Asn Phe Glu Lys Leu Phe Tyr Val Ser Glu Asp Pro 1205 1210 1215 Ser Asp Phe Asn Glu Lys Asn Pro Asn Leu Val His Lys Arg Gly 1220 1225 1230 Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr 1235 1240 1245 Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu 1250 1255 1260 Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Gln Val Ala Glu 1265 1270 1275 Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp 1280 1285 1290 Asp Met Val Tyr Cys Gly Val Tyr Asp Asn Ala Leu Asp Asn Asp 1295 1300 1305 Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu 1310 1315 1320 Trp Leu Trp Leu Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe 1325 1330 1335 Ser Lys Leu Met Gly Pro Glu Thr Asn Ala Lys Thr Ile Phe Leu 1340 1345 1350 Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Ser Leu 1355 1360 1365 Ala Cys Phe Ala Leu Thr Thr Leu Leu Gln Leu Leu Asn Lys Ile 1370 1375 1380 Leu Ser Ala Ser Gln Ile Pro 1385 1390 <210> 15 <211> 1252 <212> PRT <213> Cercocebus atys <400> 15 Met Asn Ser Ile Arg Lys Met Ile Trp Glu Asp Ile Phe Pro Lys Leu 1 5 10 15 Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Lys Lys Lys Lys 20 25 30 Lys Lys Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp 35 40 45 Pro His Gln His Leu Lys Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe 50 55 60 Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His 65 70 75 80 Asp Asn Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe Arg Lys 85 90 95 Arg Ile Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His 100 105 110 Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg 115 120 125 Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro 130 135 140 Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Met Asp Phe Ser 145 150 155 160 Val Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met 165 170 175 Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala 180 185 190 Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly 195 200 205 Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Phe 210 215 220 Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe 225 230 235 240 Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His Val Ala 245 250 255 Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val 260 265 270 Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Ile Phe Val 275 280 285 Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr 290 295 300 Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro 305 310 315 320 Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile 325 330 335 Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile 340 345 350 Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser 355 360 365 Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val 370 375 380 Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp 385 390 395 400 Asn Pro Gly Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser 405 410 415 Gly Ile Ile Ala Ala Arg Cys Ala Ile Asn Lys Leu His Gln Glu Leu 420 425 430 Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp 435 440 445 Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser Val Val 450 455 460 Ala Val Ser Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser 465 470 475 480 Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val 485 490 495 Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp 500 505 510 Glu Asn Ser Ile Asn Gly Met Pro Asp Ile Thr Val Glu Ile Arg Glu 515 520 525 His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala 530 535 540 Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu 545 550 555 560 Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala 565 570 575 Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro 580 585 590 His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ser Asp Pro Ile Leu 595 600 605 Lys Ile Pro Phe Ala Ser Ile Ala Ser Lys Leu Thr Leu Ala Glu Leu 610 615 620 Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly 625 630 635 640 Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu 645 650 655 Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu 660 665 670 Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp 675 680 685 Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val 690 695 700 Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg 705 710 715 720 Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr 725 730 735 Thr Leu Leu Asp Ile Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn 740 745 750 Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys 755 760 765 Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Thr 770 775 780 Gly Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys 785 790 795 800 Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe 805 810 815 Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu 820 825 830 Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala 835 840 845 Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Thr 850 855 860 Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys 865 870 875 880 Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys 885 890 895 Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro 900 905 910 Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 915 920 925 Gln Arg His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro 930 935 940 Lys Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Val Thr Ala Gly 945 950 955 960 Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys 965 970 975 Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Thr 980 985 990 Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly 995 1000 1005 Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys 1010 1015 1020 Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys 1025 1030 1035 Val Val Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp 1040 1045 1050 Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu 1055 1060 1065 Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys 1070 1075 1080 Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg 1085 1090 1095 Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr 1100 1105 1110 Thr Ala Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu 1115 1120 1125 Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val 1130 1135 1140 Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn 1145 1150 1155 Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp 1160 1165 1170 Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu 1175 1180 1185 Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn 1190 1195 1200 Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys 1205 1210 1215 Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe 1220 1225 1230 Ser Cys Glu Thr Gln Ala Trp Ser Ile Ser Thr Ile Leu Glu Thr 1235 1240 1245 Leu Tyr Asp Leu 1250 <210> 16 <211> 1116 <212> PRT <213> Ornithorhynchus anatinus <400> 16 Met Phe Glu Gly Arg Ala Glu Gly Val Val Gly Glu Tyr Phe Thr Phe 1 5 10 15 Pro Tyr Gly Glu Met Thr Ser Val Glu Glu Glu Ser Leu Met His Gln 20 25 30 Pro Glu Lys Ala Cys Phe Phe Met Ala His Asn Gly Trp Val Met Gly 35 40 45 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Asp Val Tyr Leu 50 55 60 Arg Arg Glu Leu Val Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 65 70 75 80 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 85 90 95 Thr Glu Ile Thr Ala Lys Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 100 105 110 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 115 120 125 Lys Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 130 135 140 Glu Glu Leu Asp Asn Ile Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 145 150 155 160 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 165 170 175 Val Tyr Arg Phe Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 180 185 190 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 195 200 205 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 210 215 220 Leu Pro Ser Ser Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 225 230 235 240 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 245 250 255 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Ala Ala Thr Leu Ser Asn 260 265 270 Pro Ser Glu Val Asn Leu Gln Thr Gly Ile Ile Ala Gly Arg Arg Ala 275 280 285 Ile Asn Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 290 295 300 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Cys 305 310 315 320 Pro Ser Ser His Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg 325 330 335 Asn Pro Lys Thr Ser Ala Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 340 345 350 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Val Glu Arg 355 360 365 Asn Val Gly Ser Tyr Val Lys Asp Ala Lys Ser Ile Asn Gly Met Pro 370 375 380 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 385 390 395 400 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Leu His Glu Tyr Val 405 410 415 Gln Glu Ile Glu Phe Glu Asn Leu Thr Pro Gly Ser Val Ile Ile Phe 420 425 430 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 435 440 445 Asn His Leu Thr Gln Phe Ser Pro Asn Phe Lys Ile Gly Ser Leu Pro 450 455 460 Val Asp Asn Ser Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Ile Ser 465 470 475 480 Ser Lys Leu Thr Leu Ala Asp Leu Asn Gln Leu Leu Tyr Arg Cys Glu 485 490 495 Ser Glu Glu Gln Glu Asp Gly Gly Gly Cys Tyr Asp Val Pro Asn Trp 500 505 510 Ser Pro Leu Lys Tyr Gly Gly Leu Gln Gly Leu Met Ser Val Met Ala 515 520 525 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 530 535 540 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 545 550 555 560 Arg Ser Gly Ser Ile Ala Glu Val Gly Lys Trp Phe Gln Ala Met Phe 565 570 575 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 580 585 590 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Ile Ala Trp Lys 595 600 605 Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu 610 615 620 Ser Leu Gly Ser Val Gln Met Cys Gly Ile Gly Lys Phe Pro Ser Leu 625 630 635 640 Pro Phe Leu Ser Pro Ser Leu Gly Asp Val Pro Tyr Arg Leu Asn Glu 645 650 655 Ile Thr Gln Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu 660 665 670 Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe 675 680 685 Ile Ala Leu Arg Gly Leu Leu Leu Ile Thr Gly Arg Phe Leu Glu Ala 690 695 700 Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile 705 710 715 720 Pro Asn Leu Leu Gly Gln Gly Thr Tyr Ala Arg Phe Asn Cys Arg Asp 725 730 735 Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Ile Val 740 745 750 Pro Lys Gly Thr Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro 755 760 765 Ser Asp Asp Ser Ser Ala Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu 770 775 780 Tyr Glu Val Ile Gln Glu Ala Met Gln Arg His Met Gln Gly Ile Gln 785 790 795 800 Phe Arg Glu Lys Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp 805 810 815 Glu Gly Phe Asn Val Thr Ala Gly Val Asp Asp Glu Ser Gly Phe Val 820 825 830 Tyr Gly Gly Asn His Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly 835 840 845 Glu Ser Asp Arg Gly Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp 850 855 860 Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Thr Val Arg Trp 865 870 875 880 Leu Val Glu Leu Ser Lys Lys Asn Val Phe Pro Tyr His Gly Val Thr 885 890 895 Val Lys Arg Asn Glu Lys Glu Val Leu Ile Thr Tyr Asp Glu Trp Asn 900 905 910 Arg Lys Ile Gln Asp His Phe Glu Lys Leu Phe Tyr Val Ser Glu Asp 915 920 925 Pro Ser Asp Thr Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly 930 935 940 Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln 945 950 955 960 Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe 965 970 975 Thr Pro Gln Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu 980 985 990 Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr 995 1000 1005 Cys Gly Val Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu 1010 1015 1020 Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro 1025 1030 1035 Val Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Lys Leu Met 1040 1045 1050 Gly Gln Glu Thr Tyr Thr Lys Thr Val Phe Leu Ile Lys Asn Val 1055 1060 1065 Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly 1070 1075 1080 Leu Pro Glu Leu Thr Asn Glu Asn Gly Gln Tyr Cys Ser Phe Ser 1085 1090 1095 Cys Glu Thr Gln Ala Trp Ser Ile Ala Val Ile Leu Glu Thr Leu 1100 1105 1110 Tyr Asp Leu 1115 <210> 17 <211> 1304 <212> PRT <213> Anas platyrhynchos <400> 17 Met His Pro Glu Cys Gly Tyr Asn Leu Val Asn Ser Pro His Leu Lys 1 5 10 15 Pro Ala Trp Val Leu Asp Arg Ala Leu Trp His Leu Thr Cys Met Val 20 25 30 Ala Asp Gly Lys Cys Ile Asp Lys Gly Val Pro Pro Leu Ile Glu Asn 35 40 45 Asp His His Leu Asn Cys Val Arg Lys Ile Ile Trp Glu Glu Ile Tyr 50 55 60 Pro Lys Ile Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala 65 70 75 80 Val Glu Gln Phe Arg Thr Leu Leu Thr Gln Gly Lys Glu Ser Lys Met 85 90 95 Ser Thr Lys Ser Asp Pro Asn Gln His Leu Gln Ile Val Gln Asp Pro 100 105 110 Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Ala 115 120 125 Thr Phe Ile Pro His Ser Asn Gly Pro Gly Ala Ile Glu Glu Cys Cys 130 135 140 Asn Trp Phe Arg Lys Arg Ile Glu Glu Leu Asn Ala Glu Gln His Arg 145 150 155 160 Gln Ile His His His Gln Glu Gln Ala Val Asn Cys Leu Ala Gly Thr 165 170 175 Val Val Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Ile 180 185 190 Ser Arg Lys Tyr Pro Leu Val Thr Arg Tyr Phe Thr Tyr Pro Phe Lys 195 200 205 Asp Met Thr Val Glu Glu Glu Glu Ala Met Ile His Arg Pro Asp Lys 210 215 220 Ala Cys Tyr Phe Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro 225 230 235 240 Leu Arg Asn Phe Ala Glu Pro Gly Ser Asn Val Tyr Leu Arg Arg Glu 245 250 255 Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro 260 265 270 Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile 275 280 285 Thr Ala Lys Tyr Phe His Gly Val Arg Leu Asp Asn Cys His Ser Thr 290 295 300 Pro Ile His Val Ala Glu Tyr Met Leu Asp Thr Ala Arg Lys Leu Arg 305 310 315 320 Ala Asp Leu Phe Val Val Ala Glu Leu Phe Thr Gly Asn Glu Glu Leu 325 330 335 Asp Asn Ile Phe Val Asn Arg Leu Gly Ile Thr Ser Leu Ile Arg Glu 340 345 350 Ala Met Thr Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg 355 360 365 Phe Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Arg Leu Arg Pro 370 375 380 Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp 385 390 395 400 Asn Glu Cys Pro Ile Gln His Arg Ser Ala Tyr Asp Ala Leu Pro Ser 405 410 415 Ala Met Ile Val Ser Met Ala Cys Cys Ala Thr Gly Ser Thr Lys Gly 420 425 430 Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg 435 440 445 Phe Tyr Ser Thr Trp Asn Pro Ala Ala His Leu Thr Ser Gly Glu Val 450 455 460 Asn Phe Gln Thr Gly Ile Leu Ala Gly Arg Leu Ala Ile Asn Arg Leu 465 470 475 480 His Gln Glu Leu Gly Ala Lys Gly Phe Asn Gln Val Tyr Val Asp Gln 485 490 495 Val Asp Glu Asp Ile Val Ala Val Thr Arg His Cys Pro Asn Thr His 500 505 510 Gln Ser Val Val Ala Val Ser Arg Thr Ala Phe Arg Asp Pro Lys Thr 515 520 525 Ser Phe Tyr Ser Lys Glu Val Pro Glu Met Cys Ile Pro Gly Lys Ile 530 535 540 Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Asn Pro 545 550 555 560 Tyr Lys Lys Asp Glu Arg Phe Ile Asn Gly Leu Pro Asn Phe Thr Val 565 570 575 Glu Leu Arg Glu His Ile Gln Ile Lys Asp Ser Lys Ile Ile Lys Gln 580 585 590 Ala Gly Thr Ala Ile Lys Gly Pro Asn Glu Phe Val Gln Glu Ile Glu 595 600 605 Phe Glu Asn Leu Thr Pro Gly Ser Val Ile Val Phe Arg Val Ser Leu 610 615 620 Asp Pro Lys Ala Gln Glu Ala Val Gly Val Leu Arg Ser His Leu Ile 625 630 635 640 Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Pro Asp Asp His Ser 645 650 655 Ala Pro Ile Leu Lys Thr Leu Phe Ser Ser Ile Ala Ser Lys Leu Ser 660 665 670 Leu Ala Asp Leu Asn Gln Val Leu Tyr Arg Cys Glu Ala Glu Glu Gln 675 680 685 Glu Asp Gly Gly Gly Cys Tyr Asn Ile Pro Asn Trp Ser Pro Leu Lys 690 695 700 Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Met Ala Asp Ile Arg Pro 705 710 715 720 Lys Asn Asp Leu Gly His Pro Phe Cys Asp Asn Leu Arg Ser Gly Asp 725 730 735 Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Thr Gly Ala 740 745 750 Cys Ala Glu Val Gly Lys Trp Leu Lys Ala Met Phe Ile Tyr Leu Lys 755 760 765 Lys Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Val 770 775 780 Gly Ala Tyr Thr Thr Leu Leu Asp Val Gly Trp His Gln Met Ser Ser 785 790 795 800 Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser 805 810 815 Ile Gln Met Cys Gly Ile Gly Lys Tyr Ser Cys Leu Pro Asp Leu Ser 820 825 830 Pro Ser Leu His Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Asn Glu 835 840 845 Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser 850 855 860 Ser Gly Ile Phe Arg Ser Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg 865 870 875 880 Gly Leu Met Leu Val Thr Gly Arg Tyr Leu Glu Ala Arg Asn Ile Ile 885 890 895 Leu Ala Phe Gly Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu 900 905 910 Gly Gln Gly Thr His Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp 915 920 925 Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Ile Val Pro Asn Gly Leu 930 935 940 Asp Ile Leu Arg Cys Pro Val Ser Arg Met Tyr Pro Arg Asp Asp Ser 945 950 955 960 Ser Pro Gln Pro Ala Gly Ser Val Asp Gln Pro Leu Tyr Glu Val Ile 965 970 975 Gln Glu Ala Met Gln Arg His Met Glu Gly Ile Asn Phe Arg Glu Arg 980 985 990 Asn Ala Gly Pro Gln Ile Asp Gln Asn Met Arg Asp Glu Gly Phe Asn 995 1000 1005 Val Thr Ala Gly Val Asp Arg Glu Thr Gly Phe Val Phe Gly Gly 1010 1015 1020 Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser 1025 1030 1035 Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly 1040 1045 1050 Ser Ala Val Glu Ile Val Gly Leu Cys Lys Ser Thr Val Arg Trp 1055 1060 1065 Leu Leu Asp Leu Ser Arg Lys Asn Glu Phe Pro Phe His Gly Val 1070 1075 1080 Thr Ile Lys Arg His Gly Lys Glu Glu Thr Ile Thr Tyr Asp Glu 1085 1090 1095 Trp Asp Arg Lys Ile Gln Ala His Phe Glu Lys Leu Phe Phe Val 1100 1105 1110 Ser Glu Asn Pro Ala Asp Pro Asn Glu Lys His Pro Asn Leu Val 1115 1120 1125 His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro 1130 1135 1140 Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val 1145 1150 1155 Val Ala Pro Glu Leu Phe Thr Pro Glu Arg Ala Trp Lys Ala Leu 1160 1165 1170 Gln Ile Ala Glu Glu Lys Leu Leu Gly Pro Leu Gly Met Lys Thr 1175 1180 1185 Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Val Tyr Asp Asn Ala 1190 1195 1200 Leu Asp Asn Asp Asn Tyr Asn Val Ala Arg Gly Phe Asn Tyr His 1205 1210 1215 Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala 1220 1225 1230 Lys Leu Tyr Phe Ser Lys Leu Ile Gly Pro Gln Ile Tyr Ala Lys 1235 1240 1245 Thr Val Val Met Ile Lys Asn Val Leu Ser Arg His Tyr Val His 1250 1255 1260 Leu Glu Arg Ser Ser Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu 1265 1270 1275 Asn Gly Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser 1280 1285 1290 Ile Ser Val Ile Leu Glu Ile Leu Tyr Asp Leu 1295 1300 <210> 18 <211> 4131 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D1 hGDEWT <400> 18 atgattcatt ttaccccatt gcagactctt ggactatcta ggtcatgcta ctcccttgcc 60 aatcagttag aattaaatcc tgacttttca agacctaata gaaagtatac ctggaatgat 120 gttggacagc tagtggaaaa attaaaaaag gaatggaatg ttatttgtat tactgatgtt 180 gtctacaatc atactgctgc taatagtaaa tggatccagg aacatccaga atgtgcctat 240 aatcttgtaa attctccaca cttaaaacct gcctgggtct tagacagagc actttggcgt 300 ttctcctgtg atgttgcaga agggaaatac aaagaaaagg gaatacctgc tttgattgaa 360 aatgatcacc atatgaactc catccgaaaa ataatttggg aggatatttt tccaaagctt 420 aaactctggg aatttttcca agtagatgtc aacaaagcgg ttgagcaatt tagaagactt 480 cttacacaag aaaataggcg agtaaccaag tctgatccaa accaacacct tacgattatt 540 caagatcctg aatacagacg gtttggctgt actgtagata tgaacattgc actaacgact 600 ttcataccac atgacaaggg gccagcagca attgaagaat gctgtaattg gtttcataaa 660 agaatggagg aattaaattc agagaagcat cgactcatta actatcatca ggaacaggca 720 gttaattgcc ttttgggaaa tgtgttttat gaacgactgg ctggccatgg tccaaaacta 780 ggacctgtca ctagaaagca tcctttagtt accaggtatt ttactttccc atttgaagag 840 atagacttct ccatggaaga atctatgatt catctgccaa ataaagcttg ttttctgatg 900 gcacacaatg gatgggtaat gggagatgat cctcttcgaa actttgctga accgggttca 960 gaagtttacc taaggagaga acttatttgc tggggagaca gtgttaaatt acgctatggg 1020 aataaaccag aggactgtcc ttatctctgg gcacacatga aaaaatacac tgaaataact 1080 gcaacttatt tccagggagt acgtcttgat aactgccact caacacctct tcacgtagct 1140 gagtacatgt tggatgctgc taggaatttg caacccaatt tatatgtagt agctgaactg 1200 ttcacaggaa gtgaggacct agacaatgtc tttgttacta gactgggcat tagttcctta 1260 ataagagagg caatgagtgc atataatagt catgaagagg gcagattagt ttaccgatat 1320 ggaggagaac ctgttggatc ctttgttcag ccctgtttga ggcctttaat gccagctatt 1380 gcacatgccc tgtttatgga tattacgcat gataatgagt gtcctattgt gcatagatca 1440 gcgtatgatg ctcttccaag tactacaatt gtttctatgg catgttgtgc tagtggaagt 1500 acaagaggct atgatgaatt agtgcctcat cagatttcag tggtttctga agaacggttt 1560 tacactaagt ggaatcctga agcattgcct tcaaacacag gtgaagttaa tttccaaagc 1620 ggcattattg cagccaggtg tgctatcagt aaacttcatc aggagcttgg agccaagggt 1680 tttattcagg tgtatgtgga tcaagttgat gaagacatag tggcagtaac aagacactca 1740 cctagcatcc atcagtctgt tgtggctgta actagaactg ctttcaggaa tcccaagact 1800 tcattttaca gcaaggaagt gcctcaaatg tgcatccctg gcaaaattga agaagtagtt 1860 cttgaagcta gaactattga gagaaacacg aaaccttata ggaaggatga aaattcaatc 1920 aatggaacac cagatatcac agtagaaatt agagaacata ttcagcttaa tgaaagtaaa 1980 attgttaaac aagctggagt tgccacaaaa gggcccaatg aatatattca agaaatagaa 2040 tttgaaaact tgtctccagg aagtgttatt atattcagag ttagtcttga tccacatgca 2100 caagtcgctg ttggcattct tcgaaatcat ctgacacaat tcagtcctca ctttaaatct 2160 ggcagcctag ctgttgacaa tgcagatcct atattaaaaa ttccttttgc ttctcttgcc 2220 tatagattaa ctttggctga gctaaatcag atcctttacc gatgtgaatc agaagaaaag 2280 gaagatggtg gagggtgcta tgacatacca aactggtcag cccttaaata tgcaggtctt 2340 caaggtttaa tgtctgtatt ggcagaaata agaccaaaga atgacttggg gcatcctttt 2400 tgtaataatt tgaggtctgg agattggatg attgactatg tcagtaaccg gcttatttca 2460 cgatcaggaa ctattgctga agttggtaaa tggttgcagg ctatgttctt ctacctgaag 2520 cagatcccac gttaccttat cccatgttac tttgatgcta tattaattgg tgcatatacc 2580 actcttctgg atacagcatg gaagcagatg tcaagctttg ttcagaatgg ttcaaccttt 2640 gtgaaacacc tttcattggg ttcagttcaa ctgtgtggag taggaaaatt cccttccctg 2700 ccaattcttt cacctgccct aatggatgta ccttataggt taaatgagat cacaaaagaa 2760 aaggagcaat gttgtgtttc tctagctgca ggcttacctc atttttcttc tggtattttc 2820 cgctgctggg gaagggatac ttttattgca cttagaggta tactgctgat tactggacgc 2880 tatgtagaag ccaggaatat tattttagca tttgcgggta ccctgaggca tggtctcatt 2940 cctaatctac tgggtgaagg aatttatgcc agatacaatt gtcgggatgc tgtgtggtgg 3000 tggctgcagt gtatccagga ttactgtaaa atggttccaa atggactaga cattctcaag 3060 tgcccagttt ccagaatgta tcctacagat gattctgctc ctttgcctgc tggcacactg 3120 gatcagccat tgtttgaagt catacaggaa gcaatgcaaa aacacatgca gggcatacag 3180 ttccgagaaa ggaatgctgg tccccagata gatcgaaaca tgaaggacga aggttttaat 3240 ataactgcag gagttgatga agaaacagga tttgtttatg gaggaaatcg tttcaattgt 3300 ggcacatgga tggataaaat gggagaaagt gacagagcta gaaacagagg aatcccagcc 3360 acaccaagag atgggtctgc tgtggaaatt gtgggcctga gtaaatctgc tgttcgctgg 3420 ttgctggaat tatccaaaaa aaatattttc ccttatcatg aagtcacagt aaaaagacat 3480 ggaaaggcta taaaggtctc atatgatgag tggaacagaa aaatacaaga caactttgaa 3540 aagctatttc atgtttccga agacccttca gatttaaatg aaaagcatcc aaatctggtt 3600 cacaaacgtg gcatatacaa agatagttat ggagcttcaa gtccttggtg tgactatcag 3660 ctcaggccta attttaccat agcaatggtt gtggcccctg agctctttac tacagaaaaa 3720 gcatggaaag ctttggagat tgcagaaaaa aaattgcttg gtccccttgg catgaaaact 3780 ttagatccag atgatatggt ttactgtgga atttatgaca acgcattaga caatgacaac 3840 tacaatcttg ctaaaggttt caattatcac caaggacctg agtggctgtg gcctattggg 3900 tattttcttc gtgcaaaatt atatttttcc agattgatgg gcccggagac tactgcaaag 3960 actatagttt tggttaaaaa tgttctttcc cgacattatg ttcatcttga gagatcccct 4020 tggaaaggac ttccagaact gaccaatgag aatgcccagt actgtccttt cagctgtgaa 4080 acacaagcct ggtcaattgc tactattctt gagacacttt atgatttata g 4131 <210> 19 <211> 4131 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D1 hGDE co2 <400> 19 atgatccact tcacccctct gcagaccctg ggcctgagca gaagctgtta cagcctggcc 60 aaccagctgg aactgaaccc cgacttcagc agacccaacc ggaagtacac ctggaacgat 120 gtgggccagc tggtggaaaa actgaagaaa gaatggaacg tgatctgcat caccgacgtg 180 gtgtacaacc acaccgccgc caacagcaag tggatccaag agcaccctga gtgcgcctac 240 aacctggtca acagccctca cctgaaacct gcctgggtgc tcgatagagc cctgtggcgg 300 tttagctgtg atgtggccga gggcaagtac aaagagaagg gcatccccgc tctgatcgag 360 aacgaccacc acatgaacag catccggaag atcatctggg aagatatttt ccccaagctg 420 aagctgtggg agttcttcca ggtggacgtg aacaaggccg tggaacagtt cagacggctg 480 ctgacccaag agaacagaag agtgaccaag agcgacccca accagcacct gaccatcatt 540 caggaccccg agtatcggag attcggctgc accgtggaca tgaatatcgc cctgaccacc 600 ttcattcccc acgacaaagg acctgccgcc atcgaggaat gctgcaactg gttccacaag 660 cggatggaag aattgaacag cgagaagcac cggctgatca actaccacca agagcaggcc 720 gtgaactgcc tgctgggcaa cgtgttctat gagagactgg ccggacacgg ccctaagctg 780 ggacctgtga caagaaagca ccctctggtt acccggtact tcacctttcc attcgaagag 840 atcgacttct ccatggaaga gagcatgatc catctgccta acaaggcctg cttcctgatg 900 gctcacaacg gctgggttat gggcgacgac cctctgagaa atttcgccga gcctggcagc 960 gaggtgtacc tgagaagaga actgatctgt tggggcgaca gcgtgaagct gagatacggc 1020 aacaagcccg aggactgccc ttacctgtgg gcccatatga agaagtacac agagatcacc 1080 gccacctact ttcagggcgt cagactggac aactgccaca gcacacctct gcacgtggcc 1140 gagtacatgc tggacgccgc tagaaatctg cagcccaacc tgtatgtggt ggccgagctg 1200 tttaccggct ccgaggacct ggacaatgtg ttcgtgacca gactgggcat cagcagcctg 1260 atcagagaag ccatgtccgc ctacaatagc cacgaagagg gcagactggt gtacagatat 1320 ggcggcgagc ctgtgggcag cttcgttcag ccttgtctga ggcctctgat gcccgccatt 1380 gctcacgccc tgttcatgga catcacccac gataacgagt gccccatcgt gcacagaagc 1440 gcctacgacg ctctgcctag caccaccatt gtgtccatgg cctgttgtgc cagcggcagc 1500 acaagaggct atgacgaact ggtgccccac cagatttccg tggtgtccga ggaacggttc 1560 tacaccaagt ggaaccccga ggctctgccc agcaataccg gcgaagtgaa tttccagagc 1620 ggcatcattg ccgccagatg cgccatcagc aagctgcacc aagaactggg cgccaagggc 1680 ttcattcagg tgtacgtgga ccaggtcgac gaggacattg tggccgtgac aagacacagc 1740 cccagcatcc atcagagcgt ggtggctgtg accagaaccg ccttcagaaa ccccaagacc 1800 agcttctaca gcaaagaggt gccccagatg tgcatccccg gcaagattga ggaagtggtg 1860 ctcgaggccc ggaccatcga gagaaacacc aagccttacc ggaaggacga gaactccatc 1920 aacggcaccc ctgacatcac cgtggaaatc agagagcaca tccagctcaa cgagagcaag 1980 atcgtgaaac aggccggcgt ggccacaaag ggccccaacg agtatatcca agagattgag 2040 ttcgagaatc tgagccccgg cagcgtgatc atcttcagag tgtccctgga tcctcacgct 2100 caggtggccg tgggcatcct gagaaatcac ctgacacagt tcagcccaca cttcaagagc 2160 ggaagcctgg ccgtggacaa cgccgatcct atcctgaaga tccccttcgc ctctctggcc 2220 tacagactga cactggctga gctgaaccag atcctgtaca gatgcgagtc cgaagagaaa 2280 gaggatggcg gaggctgcta cgacatcccc aattggagcg ccctgaagta tgccggactg 2340 cagggactga tgtctgtgct ggccgagatc agacccaaga acgacctggg acaccccttc 2400 tgcaacaacc tgagatccgg cgactggatg atcgactacg tgtccaacag actgatcagc 2460 agatccggca caatcgccga agtcggcaaa tggctgcagg ccatgttctt ctacctgaag 2520 cagatccctc ggtatctgat cccctgctac ttcgacgcca tcctgatcgg cgcctacacc 2580 acactgctgg ataccgcctg gaagcagatg tccagcttcg tgcagaacgg cagcaccttc 2640 gtgaagcacc tgtctctggg aagcgtgcag ctgtgtggcg tgggcaaatt tcccagcctg 2700 cctatcctgt ctcctgcact gatggacgtg ccctaccggc tgaatgagat caccaaagaa 2760 aaagagcagt gctgcgtcag cctggctgct ggcctgcctc atttttccag cggcatcttc 2820 cggtgttggg gcagagacac ctttattgcc ctgagaggca tcctgctgat taccggcaga 2880 tacgtggaag cccggaacat catcctggcc tttgccggca cactgcggca cggactgatt 2940 cctaatctgc tcggcgaggg catctacgcc agatacaact gcagagatgc cgtgtggtgg 3000 tggctccagt gcatccagga ctactgcaag atggtgccca acggcctgga catcctgaag 3060 tgccctgtgt ccagaatgta ccctaccgac gatagcgccc ctctgcctgc cggaacactt 3120 gaccagcctc tgttcgaagt gattcaagag gccatgcaga aacacatgca gggaatccag 3180 tttcgcgagc ggaatgccgg acctcagatc gacagaaaca tgaaggatga gggcttcaac 3240 atcaccgctg gcgtggacga agagacaggc tttgtgtacg gcggcaaccg gttcaattgc 3300 ggcacctgga tggacaagat gggcgagtct gaccgggcca gaaacagagg aattcccgcc 3360 acacctagag atggcagcgc tgtggaaatc gtgggcctgt ctaagtctgc tgtgcggtgg 3420 ctgctcgaac tgagcaagaa gaatatcttt ccgtaccacg aagtgaccgt gaagcggcac 3480 ggcaaggcca tcaaggtgtc ctacgacgag tggaacagaa agatccagga caacttcgaa 3540 aagctgttcc atgtgtctga ggaccccagc gacctgaacg aaaagcaccc caacctggtg 3600 cacaagcgcg gcatctacaa ggacagctac ggcgcctctt ctccttggtg cgattaccag 3660 ctgcggccca acttcaccat tgccatggtg gttgcccctg agctgttcac cacagagaag 3720 gcctggaagg ccctggaaat cgccgagaag aaactgctgg gccctctggg catgaagaca 3780 ctggaccccg acgacatggt gtactgcgga atctacgaca acgccctgga taacgacaac 3840 tacaatctgg ccaaggggtt caattaccat cagggacccg agtggctgtg gcctatcggc 3900 tatttcctgc gggccaagct gtacttctcc agactgatgg gccctgagac aaccgccaag 3960 acaatcgtgc tcgtgaagaa cgtgctgagc cggcactatg tgcacctgga aagaagcccc 4020 tggaagggac tgcccgagct gaccaatgag aacgcccagt actgcccctt cagctgcgaa 4080 acacaggcct ggtctatcgc caccatcctg gaaaccctgt acgacctgtg a 4131 <210> 20 <211> 4395 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D2 hGDE <400> 20 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 1140 ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1200 cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1260 gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1320 atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1380 cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1440 aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1500 actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1560 gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1620 ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1680 gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1740 atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagatt 1800 tcagtggttt ctgaagaacg gttttacact aagtggaatc ctgaagcatt gccttcaaac 1860 acaggtgaag ttaatttcca aagcggcatt attgcagcca ggtgtgctat cagtaaactt 1920 catcaggagc ttggagccaa gggttttatt caggtgtatg tggatcaagt tgatgaagac 1980 atagtggcag taacaagaca ctcacctagc atccatcagt ctgttgtggc tgtaactaga 2040 actgctttca ggaatcccaa gacttcattt tacagcaagg aagtgcctca aatgtgcatc 2100 cctggcaaaa ttgaagaagt agttcttgaa gctagaacta ttgagagaaa cacgaaacct 2160 tataggaagg atgaaaattc aatcaatgga acaccagata tcacagtaga aattagagaa 2220 catattcagc ttaatgaaag taaaattgtt aaacaagctg gagttgccac aaaagggccc 2280 aatgaatata ttcaagaaat agaatttgaa aacttgtctc caggaagtgt tattatattc 2340 agagttagtc ttgatccaca tgcacaagtc gctgttggca ttcttcgaaa tcatctgaca 2400 caattcagtc ctcactttaa atctggcagc ctagctgttg acaatgcaga tcctatatta 2460 aaaattcctt ttgcttctct tgcctataga ttaactttgg ctgagctaaa tcagatcctt 2520 taccgatgtg aatcagaaga aaaggaagat ggtggagggt gctatgacat accaaactgg 2580 tcagccctta aatatgcagg tcttcaaggt ttaatgtctg tattggcaga aataagacca 2640 aagaatgact tggggcatcc tttttgtaat aatttgaggt ctggagattg gatgattgac 2700 tatgtcagta accggcttat ttcacgatca ggaactattg ctgaagttgg taaatggttg 2760 caggctatgt tcttctacct gaagcagatc ccacgttacc ttatcccatg ttactttgat 2820 gctatattaa ttggtgcata taccactctt ctggatacag catggaagca gatgtcaagc 2880 tttgttcaga atggttcaac ctttgtgaaa cacctttcat tgggttcagt tcaactgtgt 2940 ggagtaggaa aattcccttc cctgccaatt ctttcacctg ccctaatgga tgtaccttat 3000 aggttaaatg agatcacaaa agaaaaggag caatgttgtg tttctctagc tgcaggctta 3060 cctcattttt cttctggtat tttccgctgc tggggaaggg atacttttat tgcacttaga 3120 ggtatactgc tgattactgg acgctatgta gaagccagga atattatttt agcatttgcg 3180 ggtaccctga ggcatggtct cattcctaat ctactgggtg aaggaattta tgccagatac 3240 aattgtcggg atgctgtgtg gtggtggctg cagtgtatcc aggattactg taaaatggtt 3300 ccaaatggac tagacattct caagtgccca gtttccagaa tgtatcctac agatgattct 3360 gctcctttgc ctgctggcac actggatcag ccattgtttg aagtcataca ggaagcaatg 3420 caaaaacaca tgcagggcat acagttccga gaaaggaatg ctggtcccca gatagatcga 3480 aacatgaagg acgaaggttt taatataact gcaggagttg atgaagaaac aggatttgtt 3540 tatggaggaa atcgtttcaa ttgtggcaca tggatggata aaatgggaga aagtgacaga 3600 gctagaaaca gaggaatccc agccacacca agagatgggt ctgctgtgga aattgtgggc 3660 ctgagtaaat ctgctgttcg ctggttgctg gaattatcca aaaaaaatat tttcccttat 3720 catgaagtca cagtaaaaag acatggaaag gctataaagg tctcatatga tgagtggaac 3780 agaaaaatac aagacaactt tgaaaagcta tttcatgttt ccgaagaccc ttcagattta 3840 aatgaaaagc atccaaatct ggttcacaaa cgtggcatat acaaagatag ttatggagct 3900 tcaagtcctt ggtgtgacta tcagctcagg cctaatttta ccatagcaat ggttgtggcc 3960 cctgagctct ttactacaga aaaagcatgg aaagctttgg agattgcaga aaaaaaattg 4020 cttggtcccc ttggcatgaa aactttagat ccagatgata tggtttactg tggaatttat 4080 gacaacgcat tagacaatga caactacaat cttgctaaag gtttcaatta tcaccaagga 4140 cctgagtggc tgtggcctat tgggtatttt cttcgtgcaa aattatattt ttccagattg 4200 atgggcccgg agactactgc aaagactata gttttggtta aaaatgttct ttcccgacat 4260 tatgttcatc ttgagagatc cccttggaaa ggacttccag aactgaccaa tgagaatgcc 4320 cagtactgtc ctttcagctg tgaaacacaa gcctggtcaa ttgctactat tcttgagaca 4380 ctttatgatt tatag 4395 <210> 21 <211> 4293 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D3 hGDE <400> 21 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320 atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680 gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860 tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920 cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980 gatgaattag tgcctcatca gggcaaaatt gaagaagtag ttcttgaagc tagaactatt 2040 gagagaaaca cgaaacctta taggaaggat gaaaattcaa tcaatggaac accagatatc 2100 acagtagaaa ttagagaaca tattcagctt aatgaaagta aaattgttaa acaagctgga 2160 gttgccacaa aagggcccaa tgaatatatt caagaaatag aatttgaaaa cttgtctcca 2220 ggaagtgtta ttatattcag agttagtctt gatccacatg cacaagtcgc tgttggcatt 2280 cttcgaaatc atctgacaca attcagtcct cactttaaat ctggcagcct agctgttgac 2340 aatgcagatc ctatattaaa aattcctttt gcttctcttg cctatagatt aactttggct 2400 gagctaaatc agatccttta ccgatgtgaa tcagaagaaa aggaagatgg tggagggtgc 2460 tatgacatac caaactggtc agcccttaaa tatgcaggtc ttcaaggttt aatgtctgta 2520 ttggcagaaa taagaccaaa gaatgacttg gggcatcctt tttgtaataa tttgaggtct 2580 ggagattgga tgattgacta tgtcagtaac cggcttattt cacgatcagg aactattgct 2640 gaagttggta aatggttgca ggctatgttc ttctacctga agcagatccc acgttacctt 2700 atcccatgtt actttgatgc tatattaatt ggtgcatata ccactcttct ggatacagca 2760 tggaagcaga tgtcaagctt tgttcagaat ggttcaacct ttgtgaaaca cctttcattg 2820 ggttcagttc aactgtgtgg agtaggaaaa ttcccttccc tgccaattct ttcacctgcc 2880 ctaatggatg taccttatag gttaaatgag atcacaaaag aaaaggagca atgttgtgtt 2940 tctctagctg caggcttacc tcatttttct tctggtattt tccgctgctg gggaagggat 3000 acttttattg cacttagagg tatactgctg attactggac gctatgtaga agccaggaat 3060 attattttag catttgcggg taccctgagg catggtctca ttcctaatct actgggtgaa 3120 ggaatttatg ccagatacaa ttgtcgggat gctgtgtggt ggtggctgca gtgtatccag 3180 gattactgta aaatggttcc aaatggacta gacattctca agtgcccagt ttccagaatg 3240 tatcctacag atgattctgc tcctttgcct gctggcacac tggatcagcc attgtttgaa 3300 gtcatacagg aagcaatgca aaaacacatg cagggcatac agttccgaga aaggaatgct 3360 ggtccccaga tagatcgaaa catgaaggac gaaggtttta atataactgc aggagttgat 3420 gaagaaacag gatttgttta tggaggaaat cgtttcaatt gtggcacatg gatggataaa 3480 atgggagaaa gtgacagagc tagaaacaga ggaatcccag ccacaccaag agatgggtct 3540 gctgtggaaa ttgtgggcct gagtaaatct gctgttcgct ggttgctgga attatccaaa 3600 aaaaatattt tcccttatca tgaagtcaca gtaaaaagac atggaaaggc tataaaggtc 3660 tcatatgatg agtggaacag aaaaatacaa gacaactttg aaaagctatt tcatgtttcc 3720 gaagaccctt cagatttaaa tgaaaagcat ccaaatctgg ttcacaaacg tggcatatac 3780 aaagatagtt atggagcttc aagtccttgg tgtgactatc agctcaggcc taattttacc 3840 atagcaatgg ttgtggcccc tgagctcttt actacagaaa aagcatggaa agctttggag 3900 attgcagaaa aaaaattgct tggtcccctt ggcatgaaaa ctttagatcc agatgatatg 3960 gtttactgtg gaatttatga caacgcatta gacaatgaca actacaatct tgctaaaggt 4020 ttcaattatc accaaggacc tgagtggctg tggcctattg ggtattttct tcgtgcaaaa 4080 ttatattttt ccagattgat gggcccggag actactgcaa agactatagt tttggttaaa 4140 aatgttcttt cccgacatta tgttcatctt gagagatccc cttggaaagg acttccagaa 4200 ctgaccaatg agaatgccca gtactgtcct ttcagctgtg aaacacaagc ctggtcaatt 4260 gctactattc ttgagacact ttatgattta tag 4293 <210> 22 <211> 4089 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D2,3 hGDE WT <400> 22 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 1140 ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1200 cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1260 gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1320 atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1380 cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1440 aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1500 actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1560 gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1620 ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1680 gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1740 atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagggc 1800 aaaattgaag aagtagttct tgaagctaga actattgaga gaaacacgaa accttatagg 1860 aaggatgaaa attcaatcaa tggaacacca gatatcacag tagaaattag agaacatatt 1920 cagcttaatg aaagtaaaat tgttaaacaa gctggagttg ccacaaaagg gcccaatgaa 1980 tatattcaag aaatagaatt tgaaaacttg tctccaggaa gtgttattat attcagagtt 2040 agtcttgatc cacatgcaca agtcgctgtt ggcattcttc gaaatcatct gacacaattc 2100 agtcctcact ttaaatctgg cagcctagct gttgacaatg cagatcctat attaaaaatt 2160 ccttttgctt ctcttgccta tagattaact ttggctgagc taaatcagat cctttaccga 2220 tgtgaatcag aagaaaagga agatggtgga gggtgctatg acataccaaa ctggtcagcc 2280 cttaaatatg caggtcttca aggtttaatg tctgtattgg cagaaataag accaaagaat 2340 gacttggggc atcctttttg taataatttg aggtctggag attggatgat tgactatgtc 2400 agtaaccggc ttatttcacg atcaggaact attgctgaag ttggtaaatg gttgcaggct 2460 atgttcttct acctgaagca gatcccacgt taccttatcc catgttactt tgatgctata 2520 ttaattggtg catataccac tcttctggat acagcatgga agcagatgtc aagctttgtt 2580 cagaatggtt caacctttgt gaaacacctt tcattgggtt cagttcaact gtgtggagta 2640 ggaaaattcc cttccctgcc aattctttca cctgccctaa tggatgtacc ttataggtta 2700 aatgagatca caaaagaaaa ggagcaatgt tgtgtttctc tagctgcagg cttacctcat 2760 ttttcttctg gtattttccg ctgctgggga agggatactt ttattgcact tagaggtata 2820 ctgctgatta ctggacgcta tgtagaagcc aggaatatta ttttagcatt tgcgggtacc 2880 ctgaggcatg gtctcattcc taatctactg ggtgaaggaa tttatgccag atacaattgt 2940 cgggatgctg tgtggtggtg gctgcagtgt atccaggatt actgtaaaat ggttccaaat 3000 ggactagaca ttctcaagtg cccagtttcc agaatgtatc ctacagatga ttctgctcct 3060 ttgcctgctg gcacactgga tcagccattg tttgaagtca tacaggaagc aatgcaaaaa 3120 cacatgcagg gcatacagtt ccgagaaagg aatgctggtc cccagataga tcgaaacatg 3180 aaggacgaag gttttaatat aactgcagga gttgatgaag aaacaggatt tgtttatgga 3240 ggaaatcgtt tcaattgtgg cacatggatg gataaaatgg gagaaagtga cagagctaga 3300 aacagaggaa tcccagccac accaagagat gggtctgctg tggaaattgt gggcctgagt 3360 aaatctgctg ttcgctggtt gctggaatta tccaaaaaaa atattttccc ttatcatgaa 3420 gtcacagtaa aaagacatgg aaaggctata aaggtctcat atgatgagtg gaacagaaaa 3480 atacaagaca actttgaaaa gctatttcat gtttccgaag acccttcaga tttaaatgaa 3540 aagcatccaa atctggttca caaacgtggc atatacaaag atagttatgg agcttcaagt 3600 ccttggtgtg actatcagct caggcctaat tttaccatag caatggttgt ggcccctgag 3660 ctctttacta cagaaaaagc atggaaagct ttggagattg cagaaaaaaa attgcttggt 3720 ccccttggca tgaaaacttt agatccagat gatatggttt actgtggaat ttatgacaac 3780 gcattagaca atgacaacta caatcttgct aaaggtttca attatcacca aggacctgag 3840 tggctgtggc ctattgggta ttttcttcgt gcaaaattat atttttccag attgatgggc 3900 ccggagacta ctgcaaagac tatagttttg gttaaaaatg ttctttcccg acattatgtt 3960 catcttgaga gatccccttg gaaaggactt ccagaactga ccaatgagaa tgcccagtac 4020 tgtcctttca gctgtgaaac acaagcctgg tcaattgcta ctattcttga gacactttat 4080 gatttatag 4089 <210> 23 <211> 4089 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D2,3 hGDE co2 <400> 23 atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60 accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120 ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180 aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240 tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300 aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360 gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420 gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480 acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540 ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600 gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660 accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720 agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780 gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840 atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900 ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960 aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020 tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080 tacttcacct ttccattcga agagatcgac ttctccatgg aagagagcat gatccatctg 1140 cctaacaagg cctgcttcct gatggctcac aacggctggg ttatgggcga cgaccctctg 1200 agaaatttcg ccgagcctgg cagcgaggtg tacctgagaa gagaactgat ctgttggggc 1260 gacagcgtga agctgagata cggcaacaag cccgaggact gcccttacct gtgggcccat 1320 atgaagaagt acacagagat caccgccacc tactttcagg gcgtcagact ggacaactgc 1380 cacagcacac ctctgcacgt ggccgagtac atgctggacg ccgctagaaa tctgcagccc 1440 aacctgtatg tggtggccga gctgtttacc ggctccgagg acctggacaa tgtgttcgtg 1500 accagactgg gcatcagcag cctgatcaga gaagccatgt ccgcctacaa tagccacgaa 1560 gagggcagac tggtgtacag atatggcggc gagcctgtgg gcagcttcgt tcagccttgt 1620 ctgaggcctc tgatgcccgc cattgctcac gccctgttca tggacatcac ccacgataac 1680 gagtgcccca tcgtgcacag aagcgcctac gacgctctgc ctagcaccac cattgtgtcc 1740 atggcctgtt gtgccagcgg cagcacaaga ggctatgacg aactggtgcc ccaccagggc 1800 aagattgagg aagtggtgct cgaggcccgg accatcgaga gaaacaccaa gccttaccgg 1860 aaggacgaga actccatcaa cggcacccct gacatcaccg tggaaatcag agagcacatc 1920 cagctcaacg agagcaagat cgtgaaacag gccggcgtgg ccacaaaggg ccccaacgag 1980 tatatccaag agattgagtt cgagaatctg agccccggca gcgtgatcat cttcagagtg 2040 tccctggatc ctcacgctca ggtggccgtg ggcatcctga gaaatcacct gacacagttc 2100 agcccacact tcaagagcgg aagcctggcc gtggacaacg ccgatcctat cctgaagatc 2160 cccttcgcct ctctggccta cagactgaca ctggctgagc tgaaccagat cctgtacaga 2220 tgcgagtccg aagagaaaga ggatggcgga ggctgctacg acatccccaa ttggagcgcc 2280 ctgaagtatg ccggactgca gggactgatg tctgtgctgg ccgagatcag acccaagaac 2340 gacctgggac accccttctg caacaacctg agatccggcg actggatgat cgactacgtg 2400 tccaacagac tgatcagcag atccggcaca atcgccgaag tcggcaaatg gctgcaggcc 2460 atgttcttct acctgaagca gatccctcgg tatctgatcc cctgctactt cgacgccatc 2520 ctgatcggcg cctacaccac actgctggat accgcctgga agcagatgtc cagcttcgtg 2580 cagaacggca gcaccttcgt gaagcacctg tctctgggaa gcgtgcagct gtgtggcgtg 2640 ggcaaatttc ccagcctgcc tatcctgtct cctgcactga tggacgtgcc ctaccggctg 2700 aatgagatca ccaaagaaaa agagcagtgc tgcgtcagcc tggctgctgg cctgcctcat 2760 ttttccagcg gcatcttccg gtgttggggc agagacacct ttattgccct gagaggcatc 2820 ctgctgatta ccggcagata cgtggaagcc cggaacatca tcctggcctt tgccggcaca 2880 ctgcggcacg gactgattcc taatctgctc ggcgagggca tctacgccag atacaactgc 2940 agagatgccg tgtggtggtg gctccagtgc atccaggact actgcaagat ggtgcccaac 3000 ggcctggaca tcctgaagtg ccctgtgtcc agaatgtacc ctaccgacga tagcgcccct 3060 ctgcctgccg gaacacttga ccagcctctg ttcgaagtga ttcaagaggc catgcagaaa 3120 cacatgcagg gaatccagtt tcgcgagcgg aatgccggac ctcagatcga cagaaacatg 3180 aaggatgagg gcttcaacat caccgctggc gtggacgaag agacaggctt tgtgtacggc 3240 ggcaaccggt tcaattgcgg cacctggatg gacaagatgg gcgagtctga ccgggccaga 3300 aacagaggaa ttcccgccac acctagagat ggcagcgctg tggaaatcgt gggcctgtct 3360 aagtctgctg tgcggtggct gctcgaactg agcaagaaga atatctttcc gtaccacgaa 3420 gtgaccgtga agcggcacgg caaggccatc aaggtgtcct acgacgagtg gaacagaaag 3480 atccaggaca acttcgaaaa gctgttccat gtgtctgagg accccagcga cctgaacgaa 3540 aagcacccca acctggtgca caagcgcggc atctacaagg acagctacgg cgcctcttct 3600 ccttggtgcg attaccagct gcggcccaac ttcaccattg ccatggtggt tgcccctgag 3660 ctgttcacca cagagaaggc ctggaaggcc ctggaaatcg ccgagaagaa actgctgggc 3720 cctctgggca tgaagacact ggaccccgac gacatggtgt actgcggaat ctacgacaac 3780 gccctggata acgacaacta caatctggcc aaggggttca attaccatca gggacccgag 3840 tggctgtggc ctatcggcta tttcctgcgg gccaagctgt acttctccag actgatgggc 3900 cctgagacaa ccgccaagac aatcgtgctc gtgaagaacg tgctgagccg gcactatgtg 3960 cacctggaaa gaagcccctg gaagggactg cccgagctga ccaatgagaa cgcccagtac 4020 tgccccttca gctgcgaaac acaggcctgg tctatcgcca ccatcctgga aaccctgtac 4080 gacctgtga 4089 <210> 24 <211> 4020 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D4 hGDE WT <400> 24 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320 atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680 gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860 tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920 cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980 gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 2040 aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 2100 gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160 tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220 cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2280 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340 actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2400 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460 gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2520 tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580 ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640 gttgacaatg cagatcctat attaaaaatt ccttttgctt ctttacctca tttttcttct 2700 ggtattttcc gctgctgggg aagggatact tttattgcac ttagaggtat actgctgatt 2760 actggacgct atgtagaagc caggaatatt attttagcat ttgcgggtac cctgaggcat 2820 ggtctcattc ctaatctact gggtgaagga atttatgcca gatacaattg tcgggatgct 2880 gtgtggtggt ggctgcagtg tatccaggat tactgtaaaa tggttccaaa tggactagac 2940 attctcaagt gcccagtttc cagaatgtat cctacagatg attctgctcc tttgcctgct 3000 ggcacactgg atcagccatt gtttgaagtc atacaggaag caatgcaaaa acacatgcag 3060 ggcatacagt tccgagaaag gaatgctggt ccccagatag atcgaaacat gaaggacgaa 3120 ggttttaata taactgcagg agttgatgaa gaaacaggat ttgtttatgg aggaaatcgt 3180 ttcaattgtg gcacatggat ggataaaatg ggagaaagtg acagagctag aaacagagga 3240 atcccagcca caccaagaga tgggtctgct gtggaaattg tgggcctgag taaatctgct 3300 gttcgctggt tgctggaatt atccaaaaaa aatattttcc cttatcatga agtcacagta 3360 aaaagacatg gaaaggctat aaaggtctca tatgatgagt ggaacagaaa aatacaagac 3420 aactttgaaa agctatttca tgtttccgaa gacccttcag atttaaatga aaagcatcca 3480 aatctggttc acaaacgtgg catatacaaa gatagttatg gagcttcaag tccttggtgt 3540 gactatcagc tcaggcctaa ttttaccata gcaatggttg tggcccctga gctctttact 3600 acagaaaaag catggaaagc tttggagatt gcagaaaaaa aattgcttgg tccccttggc 3660 atgaaaactt tagatccaga tgatatggtt tactgtggaa tttatgacaa cgcattagac 3720 aatgacaact acaatcttgc taaaggtttc aattatcacc aaggacctga gtggctgtgg 3780 cctattgggt attttcttcg tgcaaaatta tatttttcca gattgatggg cccggagact 3840 actgcaaaga ctatagtttt ggttaaaaat gttctttccc gacattatgt tcatcttgag 3900 agatcccctt ggaaaggact tccagaactg accaatgaga atgcccagta ctgtcctttc 3960 agctgtgaaa cacaagcctg gtcaattgct actattcttg agacacttta tgatttatag 4020 <210> 25 <211> 4020 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D4 hGDE co2 <400> 25 atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60 accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120 ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180 aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240 tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300 aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360 gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420 gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480 acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540 ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600 gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660 accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720 agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780 gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840 atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900 ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960 aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020 tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080 gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 1140 ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 1200 ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1260 agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1320 atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1380 tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1440 agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1500 gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1560 cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1620 gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1680 gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1740 atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1800 gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1860 ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1920 ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1980 gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 2040 aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 2100 gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 2160 tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 2220 cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2280 aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2340 accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2400 gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2460 gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2520 agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2580 ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2640 gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctgcctca tttttccagc 2700 ggcatcttcc ggtgttgggg cagagacacc tttattgccc tgagaggcat cctgctgatt 2760 accggcagat acgtggaagc ccggaacatc atcctggcct ttgccggcac actgcggcac 2820 ggactgattc ctaatctgct cggcgagggc atctacgcca gatacaactg cagagatgcc 2880 gtgtggtggt ggctccagtg catccaggac tactgcaaga tggtgcccaa cggcctggac 2940 atcctgaagt gccctgtgtc cagaatgtac cctaccgacg atagcgcccc tctgcctgcc 3000 ggaacacttg accagcctct gttcgaagtg attcaagagg ccatgcagaa acacatgcag 3060 ggaatccagt ttcgcgagcg gaatgccgga cctcagatcg acagaaacat gaaggatgag 3120 ggcttcaaca tcaccgctgg cgtggacgaa gagacaggct ttgtgtacgg cggcaaccgg 3180 ttcaattgcg gcacctggat ggacaagatg ggcgagtctg accgggccag aaacagagga 3240 attcccgcca cacctagaga tggcagcgct gtggaaatcg tgggcctgtc taagtctgct 3300 gtgcggtggc tgctcgaact gagcaagaag aatatctttc cgtaccacga agtgaccgtg 3360 aagcggcacg gcaaggccat caaggtgtcc tacgacgagt ggaacagaaa gatccaggac 3420 aacttcgaaa agctgttcca tgtgtctgag gaccccagcg acctgaacga aaagcacccc 3480 aacctggtgc acaagcgcgg catctacaag gacagctacg gcgcctcttc tccttggtgc 3540 gattaccagc tgcggcccaa cttcaccatt gccatggtgg ttgcccctga gctgttcacc 3600 acagagaagg cctggaaggc cctggaaatc gccgagaaga aactgctggg ccctctgggc 3660 atgaagacac tggaccccga cgacatggtg tactgcggaa tctacgacaa cgccctggat 3720 aacgacaact acaatctggc caaggggttc aattaccatc agggacccga gtggctgtgg 3780 cctatcggct atttcctgcg ggccaagctg tacttctcca gactgatggg ccctgagaca 3840 accgccaaga caatcgtgct cgtgaagaac gtgctgagcc ggcactatgt gcacctggaa 3900 agaagcccct ggaagggact gcccgagctg accaatgaga acgcccagta ctgccccttc 3960 agctgcgaaa cacaggcctg gtctatcgcc accatcctgg aaaccctgta cgacctgtga 4020 <210> 26 <211> 3942 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D5 hGDE <400> 26 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctaata ggcgagtaac caagtctgat ccaaaccaac accttacgat tattcaagat 720 cctgaataca gacggtttgg ctgtactgta gatatgaaca ttgcactaac gactttcata 780 ccatatttta ctttcccatt tgaagagata gacttctcca tggaagaatc tatgattcat 840 ctgccaaata aagcttgttt tctgatggca cacaatggat gggtaatggg agatgatcct 900 cttcgaaact ttgctgaacc gggttcagaa gtttacctaa ggagagaact tatttgctgg 960 ggagacagtg ttaaattacg ctatgggaat aaaccagagg actgtcctta tctctgggca 1020 cacatgaaaa aatacactga aataactgca acttatttcc agggagtacg tcttgataac 1080 tgccactcaa cacctcttca cgtagctgag tacatgttgg atgctgctag gaatttgcaa 1140 cccaatttat atgtagtagc tgaactgttc acaggaagtg aggacctaga caatgtcttt 1200 gttactagac tgggcattag ttccttaata agagaggcaa tgagtgcata taatagtcat 1260 gaagagggca gattagttta ccgatatgga ggagaacctg ttggatcctt tgttcagccc 1320 tgtttgaggc ctttaatgcc agctattgca catgccctgt ttatggatat tacgcatgat 1380 aatgagtgtc ctattgtgca tagatcagcg tatgatgctc ttccaagtac tacaattgtt 1440 tctatggcat gttgtgctag tggaagtaca agaggctatg atgaattagt gcctcatcag 1500 atttatgtgg atcaagttga tgaagacata gtggcagtaa caagacactc acctagcatc 1560 catcagtctg ttgtggctgt aactagaact gctttcagga atcccaagac ttcattttac 1620 agcaaggaag tgcctcaaat gtgcatccct ggcaaaattg aagaagtagt tcttgaagct 1680 agaactattg agagaaacac gaaaccttat aggaaggatg aaaattcaat caatggaaca 1740 ccagatatca cagtagaaat tagagaacat attcagctta atgaaagtaa aattgttaaa 1800 caagctggag ttgccacaaa agggcccaat gaatatattc aagaaataga atttgaaaac 1860 ttgtctccag gaagtgttat tatattcaga gttagtcttg atccacatgc acaagtcgct 1920 gttggcattc ttcgaaatca tctgacacaa ttcagtcctc actttaaatc tggcagccta 1980 gctgttgaca atgcagatcc tatattaaaa attccttttg cttctcttgc ctatagatta 2040 actttggctg agctaaatca gatcctttac cgatgtgaat cagaagaaaa ggaagatggt 2100 ggagggtgct atgacatacc aaactggtca gcccttaaat atgcaggtct tcaaggttta 2160 atgtctgtat tggcagaaat aagaccaaag aatgacttgg ggcatccttt ttgtaataat 2220 ttgaggtctg gagattggat gattgactat gtcagtaacc ggcttatttc acgatcagga 2280 actattgctg aagttggtaa atggttgcag gctatgttct tctacctgaa gcagatccca 2340 cgttacctta tcccatgtta ctttgatgct atattaattg gtgcatatac cactcttctg 2400 gatacagcat ggaagcagat gtcaagcttt gttcagaatg gttcaacctt tgtgaaacac 2460 ctttcattgg gttcagttca actgtgtgga gtaggaaaat tcccttccct gccaattctt 2520 tcacctgccc taatggatgt accttatagg ttaaatgaga tcacaaaaga aaaggagcaa 2580 tgttgtgttt ctctagctgc aggcttacct catttttctt ctggtatttt ccgctgctgg 2640 ggaagggata cttttattgc acttagaggt atactgctga ttactggacg ctatgtagaa 2700 gccaggaata ttattttagc atttgcgggt accctgaggc atggtctcat tcctaatcta 2760 ctgggtgaag gaatttatgc cagatacaat tgtcgggatg ctgtgtggtg gtggctgcag 2820 tgtatccagg attactgtaa aatggttcca aatggactag acattctcaa gtgcccagtt 2880 tccagaatgt atcctacaga tgattctgct cctttgcctg ctggcacact ggatcagcca 2940 ttgtttgaag tcatacagga agcaatgcaa aaacacatgc agggcataca gttccgagaa 3000 aggaatgctg gtccccagat agatcgaaac atgaaggacg aaggttttaa tataactgca 3060 ggagttgatg aagaaacagg atttgtttat ggaggaaatc gtttcaattg tggcacatgg 3120 atggataaaa tgggagaaag tgacagagct agaaacagag gaatcccagc cacaccaaga 3180 gatgggtctg ctgtggaaat tgtgggcctg agtaaatctg ctgttcgctg gttgctggaa 3240 ttatccaaaa aaaatatttt cccttatcat gaagtcacag taaaaagaca tggaaaggct 3300 ataaaggtct catatgatga gtggaacaga aaaatacaag acaactttga aaagctattt 3360 catgtttccg aagacccttc agatttaaat gaaaagcatc caaatctggt tcacaaacgt 3420 ggcatataca aagatagtta tggagcttca agtccttggt gtgactatca gctcaggcct 3480 aattttacca tagcaatggt tgtggcccct gagctcttta ctacagaaaa agcatggaaa 3540 gctttggaga ttgcagaaaa aaaattgctt ggtccccttg gcatgaaaac tttagatcca 3600 gatgatatgg tttactgtgg aatttatgac aacgcattag acaatgacaa ctacaatctt 3660 gctaaaggtt tcaattatca ccaaggacct gagtggctgt ggcctattgg gtattttctt 3720 cgtgcaaaat tatatttttc cagattgatg ggcccggaga ctactgcaaa gactatagtt 3780 ttggttaaaa atgttctttc ccgacattat gttcatcttg agagatcccc ttggaaagga 3840 cttccagaac tgaccaatga gaatgcccag tactgtcctt tcagctgtga aacacaagcc 3900 tggtcaattg ctactattct tgagacactt tatgatttat ag 3942 <210> 27 <211> 3759 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D6 hGDE <400> 27 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 60 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 120 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 180 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 240 gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 300 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 360 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 420 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 480 atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 540 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 600 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 660 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 720 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 780 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 840 gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 900 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 960 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1020 tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1080 cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1140 gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 1200 aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 1260 gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 1320 tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1380 cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 1440 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 1500 actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 1560 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 1620 gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 1680 tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 1740 ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 1800 gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 1860 ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 1920 gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 1980 tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2040 aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2100 attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2160 taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2220 acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2280 tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2340 cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 2400 tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 2460 agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 2520 aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 2580 ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 2640 atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 2700 agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 2760 tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 2820 aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 2880 gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 2940 gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3000 gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3060 tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3120 aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3180 gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3240 atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 3300 tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 3360 ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 3420 gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 3480 aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 3540 gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 3600 gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 3660 ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 3720 tcaattgcta ctattcttga gacactttat gatttatag 3759 <210> 28 <211> 3327 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D7 hGDE <400> 28 atggttacca ggtattttac tttcccattt gaagagatag acttctccat ggaagaatct 60 atgattcatc tgccaaataa agcttgtttt ctgatggcac acaatggatg ggtaatggga 120 gatgatcctc ttcgaaactt tgctgaaccg ggttcagaag tttacctaag gagagaactt 180 atttgctggg gagacagtgt taaattacgc tatgggaata aaccagagga ctgtccttat 240 ctctgggcac acatgaaaaa atacactgaa ataactgcaa cttatttcca gggagtacgt 300 cttgataact gccactcaac acctcttcac gtagctgagt acatgttgga tgctgctagg 360 aatttgcaac ccaatttata tgtagtagct gaactgttca caggaagtga ggacctagac 420 aatgtctttg ttactagact gggcattagt tccttaataa gagaggcaat gagtgcatat 480 aatagtcatg aagagggcag attagtttac cgatatggag gagaacctgt tggatccttt 540 gttcagccct gtttgaggcc tttaatgcca gctattgcac atgccctgtt tatggatatt 600 acgcatgata atgagtgtcc tattgtgcat agatcagcgt atgatgctct tccaagtact 660 acaattgttt ctatggcatg ttgtgctagt ggaagtacaa gaggctatga tgaattagtg 720 cctcatcaga tttcagtggt ttctgaagaa cggttttaca ctaagtggaa tcctgaagca 780 ttgccttcaa acacaggtga agttaatttc caaagcggca ttattgcagc caggtgtgct 840 atcagtaaac ttcatcagga gcttggagcc aagggtttta ttcaggtgta tgtggatcaa 900 gttgatgaag acatagtggc agtaacaaga cactcaccta gcatccatca gtctgttgtg 960 gctgtaacta gaactgcttt caggaatccc aagacttcat tttacagcaa ggaagtgcct 1020 caaatgtgca tccctggcaa aattgaagaa gtagttcttg aagctagaac tattgagaga 1080 aacacgaaac cttataggaa ggatgaaaat tcaatcaatg gaacaccaga tatcacagta 1140 gaaattagag aacatattca gcttaatgaa agtaaaattg ttaaacaagc tggagttgcc 1200 acaaaagggc ccaatgaata tattcaagaa atagaatttg aaaacttgtc tccaggaagt 1260 gttattatat tcagagttag tcttgatcca catgcacaag tcgctgttgg cattcttcga 1320 aatcatctga cacaattcag tcctcacttt aaatctggca gcctagctgt tgacaatgca 1380 gatcctatat taaaaattcc ttttgcttct cttgcctata gattaacttt ggctgagcta 1440 aatcagatcc tttaccgatg tgaatcagaa gaaaaggaag atggtggagg gtgctatgac 1500 ataccaaact ggtcagccct taaatatgca ggtcttcaag gtttaatgtc tgtattggca 1560 gaaataagac caaagaatga cttggggcat cctttttgta ataatttgag gtctggagat 1620 tggatgattg actatgtcag taaccggctt atttcacgat caggaactat tgctgaagtt 1680 ggtaaatggt tgcaggctat gttcttctac ctgaagcaga tcccacgtta ccttatccca 1740 tgttactttg atgctatatt aattggtgca tataccactc ttctggatac agcatggaag 1800 cagatgtcaa gctttgttca gaatggttca acctttgtga aacacctttc attgggttca 1860 gttcaactgt gtggagtagg aaaattccct tccctgccaa ttctttcacc tgccctaatg 1920 gatgtacctt ataggttaaa tgagatcaca aaagaaaagg agcaatgttg tgtttctcta 1980 gctgcaggct tacctcattt ttcttctggt attttccgct gctggggaag ggatactttt 2040 attgcactta gaggtatact gctgattact ggacgctatg tagaagccag gaatattatt 2100 ttagcatttg cgggtaccct gaggcatggt ctcattccta atctactggg tgaaggaatt 2160 tatgccagat acaattgtcg ggatgctgtg tggtggtggc tgcagtgtat ccaggattac 2220 tgtaaaatgg ttccaaatgg actagacatt ctcaagtgcc cagtttccag aatgtatcct 2280 acagatgatt ctgctccttt gcctgctggc acactggatc agccattgtt tgaagtcata 2340 caggaagcaa tgcaaaaaca catgcagggc atacagttcc gagaaaggaa tgctggtccc 2400 cagatagatc gaaacatgaa ggacgaaggt tttaatataa ctgcaggagt tgatgaagaa 2460 acaggatttg tttatggagg aaatcgtttc aattgtggca catggatgga taaaatggga 2520 gaaagtgaca gagctagaaa cagaggaatc ccagccacac caagagatgg gtctgctgtg 2580 gaaattgtgg gcctgagtaa atctgctgtt cgctggttgc tggaattatc caaaaaaaat 2640 attttccctt atcatgaagt cacagtaaaa agacatggaa aggctataaa ggtctcatat 2700 gatgagtgga acagaaaaat acaagacaac tttgaaaagc tatttcatgt ttccgaagac 2760 ccttcagatt taaatgaaaa gcatccaaat ctggttcaca aacgtggcat atacaaagat 2820 agttatggag cttcaagtcc ttggtgtgac tatcagctca ggcctaattt taccatagca 2880 atggttgtgg cccctgagct ctttactaca gaaaaagcat ggaaagcttt ggagattgca 2940 gaaaaaaaat tgcttggtcc ccttggcatg aaaactttag atccagatga tatggtttac 3000 tgtggaattt atgacaacgc attagacaat gacaactaca atcttgctaa aggtttcaat 3060 tatcaccaag gacctgagtg gctgtggcct attgggtatt ttcttcgtgc aaaattatat 3120 ttttccagat tgatgggccc ggagactact gcaaagacta tagttttggt taaaaatgtt 3180 ctttcccgac attatgttca tcttgagaga tccccttgga aaggacttcc agaactgacc 3240 aatgagaatg cccagtactg tcctttcagc tgtgaaacac aagcctggtc aattgctact 3300 attcttgaga cactttatga tttatag 3327 <210> 29 <211> 3912 <212> DNA <213> artificial <220> <223> Nucleic acid sequence encoding D8 hGDE <400> 29 atgcatccag aatgtgccta taatcttgta aattctccac acttaaaacc tgcctgggtc 60 ttagacagag cactttggcg tttctcctgt gatgttgcag aagggaaata caaagaaaag 120 ggaatacctg ctttgattga aaatgatcac catatgaact ccatccgaaa aataatttgg 180 gaggatattt ttccaaagct taaactctgg gaatttttcc aagtagatgt caacaaagcg 240 gttgagcaat ttagaagact tcttacacaa gaaaataggc gagtaaccaa gtctgatcca 300 aaccaacacc ttacgattat tcaagatcct gaatacagac ggtttggctg tactgtagat 360 atgaacattg cactaacgac tttcatacca catgacaagg ggccagcagc aattgaagaa 420 tgctgtaatt ggtttcataa aagaatggag gaattaaatt cagagaagca tcgactcatt 480 aactatcatc aggaacaggc agttaattgc cttttgggaa atgtgtttta tgaacgactg 540 gctggccatg gtccaaaact aggacctgtc actagaaagc atcctttagt taccaggtat 600 tttactttcc catttgaaga gatagacttc tccatggaag aatctatgat tcatctgcca 660 aataaagctt gttttctgat ggcacacaat ggatgggtaa tgggagatga tcctcttcga 720 aactttgctg aaccgggttc agaagtttac ctaaggagag aacttatttg ctggggagac 780 agtgttaaat tacgctatgg gaataaacca gaggactgtc cttatctctg ggcacacatg 840 aaaaaataca ctgaaataac tgcaacttat ttccagggag tacgtcttga taactgccac 900 tcaacacctc ttcacgtagc tgagtacatg ttggatgctg ctaggaattt gcaacccaat 960 ttatatgtag tagctgaact gttcacagga agtgaggacc tagacaatgt ctttgttact 1020 agactgggca ttagttcctt aataagagag gcaatgagtg catataatag tcatgaagag 1080 ggcagattag tttaccgata tggaggagaa cctgttggat cctttgttca gccctgtttg 1140 aggcctttaa tgccagctat tgcacatgcc ctgtttatgg atattacgca tgataatgag 1200 tgtcctattg tgcatagatc agcgtatgat gctcttccaa gtactacaat tgtttctatg 1260 gcatgttgtg ctagtggaag tacaagaggc tatgatgaat tagtgcctca tcagatttca 1320 gtggtttctg aagaacggtt ttacactaag tggaatcctg aagcattgcc ttcaaacaca 1380 ggtgaagtta atttccaaag cggcattatt gcagccaggt gtgctatcag taaacttcat 1440 caggagcttg gagccaaggg ttttattcag gtgtatgtgg atcaagttga tgaagacata 1500 gtggcagtaa caagacactc acctagcatc catcagtctg ttgtggctgt aactagaact 1560 gctttcagga atcccaagac ttcattttac agcaaggaag tgcctcaaat gtgcatccct 1620 ggcaaaattg aagaagtagt tcttgaagct agaactattg agagaaacac gaaaccttat 1680 aggaaggatg aaaattcaat caatggaaca ccagatatca cagtagaaat tagagaacat 1740 attcagctta atgaaagtaa aattgttaaa caagctggag ttgccacaaa agggcccaat 1800 gaatatattc aagaaataga atttgaaaac ttgtctccag gaagtgttat tatattcaga 1860 gttagtcttg atccacatgc acaagtcgct gttggcattc ttcgaaatca tctgacacaa 1920 ttcagtcctc actttaaatc tggcagccta gctgttgaca atgcagatcc tatattaaaa 1980 attccttttg cttctcttgc ctatagatta actttggctg agctaaatca gatcctttac 2040 cgatgtgaat cagaagaaaa ggaagatggt ggagggtgct atgacatacc aaactggtca 2100 gcccttaaat atgcaggtct tcaaggttta atgtctgtat tggcagaaat aagaccaaag 2160 aatgacttgg ggcatccttt ttgtaataat ttgaggtctg gagattggat gattgactat 2220 gtcagtaacc ggcttatttc acgatcagga actattgctg aagttggtaa atggttgcag 2280 gctatgttct tctacctgaa gcagatccca cgttacctta tcccatgtta ctttgatgct 2340 atattaattg gtgcatatac cactcttctg gatacagcat ggaagcagat gtcaagcttt 2400 gttcagaatg gttcaacctt tgtgaaacac ctttcattgg gttcagttca actgtgtgga 2460 gtaggaaaat tcccttccct gccaattctt tcacctgccc taatggatgt accttatagg 2520 ttaaatgaga tcacaaaaga aaaggagcaa tgttgtgttt ctctagctgc aggcttacct 2580 catttttctt ctggtatttt ccgctgctgg ggaagggata cttttattgc acttagaggt 2640 atactgctga ttactggacg ctatgtagaa gccaggaata ttattttagc atttgcgggt 2700 accctgaggc atggtctcat tcctaatcta ctgggtgaag gaatttatgc cagatacaat 2760 tgtcgggatg ctgtgtggtg gtggctgcag tgtatccagg attactgtaa aatggttcca 2820 aatggactag acattctcaa gtgcccagtt tccagaatgt atcctacaga tgattctgct 2880 cctttgcctg ctggcacact ggatcagcca ttgtttgaag tcatacagga agcaatgcaa 2940 aaacacatgc agggcataca gttccgagaa aggaatgctg gtccccagat agatcgaaac 3000 atgaaggacg aaggttttaa tataactgca ggagttgatg aagaaacagg atttgtttat 3060 ggaggaaatc gtttcaattg tggcacatgg atggataaaa tgggagaaag tgacagagct 3120 agaaacagag gaatcccagc cacaccaaga gatgggtctg ctgtggaaat tgtgggcctg 3180 agtaaatctg ctgttcgctg gttgctggaa ttatccaaaa aaaatatttt cccttatcat 3240 gaagtcacag taaaaagaca tggaaaggct ataaaggtct catatgatga gtggaacaga 3300 aaaatacaag acaactttga aaagctattt catgtttccg aagacccttc agatttaaat 3360 gaaaagcatc caaatctggt tcacaaacgt ggcatataca aagatagtta tggagcttca 3420 agtccttggt gtgactatca gctcaggcct aattttacca tagcaatggt tgtggcccct 3480 gagctcttta ctacagaaaa agcatggaaa gctttggaga ttgcagaaaa aaaattgctt 3540 ggtccccttg gcatgaaaac tttagatcca gatgatatgg tttactgtgg aatttatgac 3600 aacgcattag acaatgacaa ctacaatctt gctaaaggtt tcaattatca ccaaggacct 3660 gagtggctgt ggcctattgg gtattttctt cgtgcaaaat tatatttttc cagattgatg 3720 ggcccggaga ctactgcaaa gactatagtt ttggttaaaa atgttctttc ccgacattat 3780 gttcatcttg agagatcccc ttggaaagga cttccagaac tgaccaatga gaatgcccag 3840 tactgtcctt tcagctgtga aacacaagcc tggtcaattg ctactattct tgagacactt 3900 tatgatttat ag 3912 <210> 30 <211> 4134 <212> DNA <213> Equus caballus <400> 30 atgattcatt ttacaccatt gcagactctt ggactatcta ggtcatccta ctcccttgct 60 gaccagttag aattaaatcc tgacttttca agacctaata aaaagtatac ctggcatgat 120 gttggacagc tagtggaaaa attgaaaaag gaatgggata ttctttgtat tactgatgtt 180 gtctacaatc atactgctgc taatagtaaa tggatccatg aacatccaga aagtgcatat 240 aaccttgtga attctccaca cttaaaacct gcctgggtct tagacagagc actttggcat 300 ttatcctgtg atgtggcaga agggaaatac agagaaaaag gagtacctgc tctgattgaa 360 aatgatcatc aaatgaattg cattcgaaaa ataatttggg aggatattta tccaaagatt 420 cacctctggg aatttttcca agtagacgtt cacaaagcag ttgagcaatt tagaggactt 480 cttacacaag aaaataggaa aataatatct cagcctgatc caaagcaaca ccttaagatt 540 attcaggatc ctgaatacag acggcttggc tgtactgtag atatgaacat tgcactagca 600 actttcatac cacatgataa tgggccagct gcaattgatg aatgctgtaa ttggttccgt 660 aagagaattg aggaattaaa cgcagagaag catcaacttg tgaactatca tcaggagcag 720 gcagttaatt gccttttggg aaatgtattt tatgaacgac tggctggcca tggtcctaaa 780 ctaggacctg tcaccagaaa acatccttta gttaccagat attttacttt cccatttgaa 840 gaaatgaccc catccacaga agaatctatg attcatctcc caaataaagc ttgttttctg 900 atggcgcata atggatgggt aatgggagat gatccccttc ggaactttgc tgaaccaggt 960 tcagacgttt atctaaggag agaacttatc tgctggggag acagtgttaa attacgctat 1020 gggaataagc cagaggactg tccttacctc tgggcgcaca tgaaaaaata cactgaaata 1080 actgcaactc atttccaggg agtacgtctt gataactgcc actcaacacc aattcatgta 1140 gccgagtaca tgttggatgc cgctaggaaa ttgcaaccca atttatatgt agtagctgaa 1200 ctgttcacag gaagcgaaga cctggacaat atctttgtta ctagactggg cattagttcc 1260 ttaataagag aggcaatgag tgcagctgat agccatgagg agggcagatt agtttaccga 1320 tatggaggag agcctgttgg gtcctttgtt cagccctgtt tgaggccttt aatgccagct 1380 attgcacatg ccctgtttat ggatatcacc catgataatg agtgtcctat tgtgcatagg 1440 tcagcatatg atgctctccc gagttccacg attgtttcta tggcatcttg tgctagtgga 1500 agtactaaag gctatgatga attagtgcct catcagattt cagtggtttc tgaagaacga 1560 ttttatacta agtggaatcc tgaagcattg ccatcaaata caggtgaagt caatttccaa 1620 agcggaatta ttgcagccag gcgtgctatc aataaacttc atcaagagct tggggccaag 1680 ggtttcattc aggtgtatgt ggatcaggtt gatcaagata tagtggcggt aacaaggcac 1740 tcacctagca tccatcagtc tgttgtgtct gtgtcgagaa ctgctttcag gaatcccaag 1800 acgtcatttt acagcaagga agtgcctcat atgtacatcc ctggcaaaat tgaagaagta 1860 gttcttgaag ctagaactat tgagagacat acaatacctt ataagaagga tgaaaactca 1920 atcaatggaa tgccagatat cacagtagaa attagagaac atattcagct taatgaaagt 1980 aaaattgtta aacatgctgg aattgtcaca aaaggaccca atgaatttgt tcaagaaata 2040 gagtttgaaa acttgactcc aggaagtgtt attatattca gagttagtct tgatccacat 2100 gcacaagttg ctgttggaat tcttcgaaat catctgacac aattcagtcc tcactttaaa 2160 tctgggagcc ttgctgttga caacgcagat cctatattga aaattccttt tgcttctatt 2220 gcctctaaat taactttggc tgagctaaat caggtccttt atcgatgtga atcagaagaa 2280 caagaagatg gtggagggtg ttataacata ccaaactggt cgtctcttaa atatgcaggt 2340 cttcaaggat taatgtccat attggcagaa ataagaccaa ggaatgactt ggggcatccc 2400 ttttgtgaca atttgagatc tggagattgg atgattgact atgtcagtag ccggcttatt 2460 tcacgatcag gaactattgc tgaagttggt aaatggttgc aggctatgtt cctctacctg 2520 aagcagatcc cccgttatct tattccatgt tactttgatg ctatattaat tggtgcatac 2580 accactctcc tggatatagc atggaagcag atgtcaagct ttgttcagaa tggttctacc 2640 tttgtgaaac acctttctct gggttcagtc caaatgtgtg gagtaggaaa attcccttct 2700 ctgccacttc tttcaccttc ccttacggat ctaccatata gagtaaatga gatcacaaaa 2760 gaaaaggagc agtgttgtgg gtctctagct gcaggcttac ctcatttttc tgctggcatt 2820 ttccgctgct ggggaaggga taccttcatt gcgctcagag gtctgctgct ggttacggga 2880 cgctatttgg aggccaggaa tattatttta gcatttgctg gcaccctgag acacggtctc 2940 attcctaatc tcctgggtga aggaactcac gccagataca attgccggga tgctgtgtgg 3000 tggtggctac agtgtattca ggattactgt aaaattgttc caaatggcct ggacatcctc 3060 aggtgcccgg tttccagaat gtatcctaca gatgattctg ttcctttgtc tgctggcaca 3120 gtggatcaac cattgtttga agtaatacag gaagctatgc aaagacatgt gcagggcata 3180 cagttccgag aaaggaatgc tggtccacag atagatcgaa acatgaagga tgaaggtttt 3240 aatataactg caggagttga tgaagaaacg ggatttgttt atggaggaaa tcgcttcaat 3300 tgcggcacat ggatggataa aatgggagaa agtgacagag ctagaaacag aggaatcccg 3360 gccactccaa gagatgggtc tgctgtggaa attgtgggcc tgagtaaatc tgccgttcgt 3420 tggttgctgg aattatcccg aaaaaatatt ttcccttatc atgaagtccg agtaaaaaga 3480 catggaaagt ttgtgacagt ctcatatgat gagtggaaca gaaaaataca agacaacttt 3540 gaaaagctat ttcatgtgtc agaagaccct tcagatttta acgaaaagca tcctgagctg 3600 gttcacaaac gtggcatata caaagatagt tatggagcat caagcccttg gtgtgactac 3660 cagctcaggc ctaattttac catagcaatg gtcgtagccc ctgagctgtt taccccagaa 3720 aaagcatgga aagctttgga gattgcagaa aaaaaattgc ttggtcccct tggcatgaaa 3780 actttggatc cagatgatat ggtttactgt ggaatttatg acaatgcctt agacaatgac 3840 aactacaatc ttgctaaagg tttcaattat caccaaggac ctgagtggct gtggcccact 3900 ggatattttc ttcgtgcaaa attgtatttt tccaaattaa tgggtccaga gactaatgca 3960 aagactatgt ttttggttaa aaacgtcctt tccagacatt atgttcatct tgagagatcc 4020 ccttggaaag gacttccaga actgactaat gagaatggcc aatactgtcc tttcagctgt 4080 gaaacacaag cctggtcaat tgctactgtt cttgaaacac tctatgactt atag 4134 <210> 31 <211> 4098 <212> DNA <213> Gorilla gorilla <400> 31 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgaa ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtgaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaattcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacatctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 gagtatttta ctttcccatt tgaagagata gacttctcca tggaagaatc tatgattcat 1140 ctcccaaata aagcttgttt tctgatggca cacaatggat gggtaatggg agatgatcct 1200 cttcgaaact ttgctgaacc gggttcagaa gtttacctaa ggagagaact tatttgctgg 1260 ggagacagtg ttaaattacg ctatgggaat aaaccagagg actgtcctta tctctgggca 1320 cacatgaaaa aatacactga aataactgca acttatttcc agggagtacg tcttgataac 1380 tgccactcaa cacctcttca cgtagctgag tacatgttgg atgctgctag gaatttgcaa 1440 cccaatttat atgtagtagc tgaactgttc acaggaagtg aagatctgga caatgtcttt 1500 gttactagac tgggcattag ttccttaata agagaggcaa tgagtgcata taatagtcat 1560 gaagagggca gattagttta ccgatatgga ggagaacctg ttggatcctt tgttcagccc 1620 tgtttgaggc ctttaatgcc agctattgca catgccctgt ttatggatat tacgcatgat 1680 aatgagtgtc ctattgtgca tagatcagcg tatgatgctc ttccaagtac tacaattgtc 1740 tctatggcgt gttgtgctag tggaagtaca agaggctatg atgaattagt gcctcatcag 1800 ttcctaggca aaattgaaga agtagttctt gaagctagaa ctattgagag aaacatgaaa 1860 ccttatagga aggatgagaa ttcaatcaat ggaacgccag atatcacagt agaaattaga 1920 gaacatattc agcttaatga aagtaaaatt gttaaacaag ctggagttgc cacaaaaggg 1980 cccaatgaat atattcaaga aatagaattt gaaaacttgt ctccaggaag tgttattata 2040 ttcagagtta gtcttgatcc acatgcacaa gtcgctgttg gaattcttcg aaatcatctg 2100 acacaattca gtcctcactt taaatctggc agcctagctg ttgacaatgc agatcctata 2160 ttaaaaattc cttttgcttc tattgcctcc agattaactt tggctgagct aaatcagatc 2220 ctttaccgat gtgaatcaga agaaaaggaa gatggtggag ggtgctatga cataccaaac 2280 tggtcagccc ttaaatatgc aggtcttcaa ggtttaatgt ctgtattggc agaaataaga 2340 ccaaagaatg acttggggca tcctttttgt aataatttga gatctggaga ttggatgatt 2400 gactatgtca gtaaccggct tatttcacga tcaggaacta ttgctgaagt tggtaaatgg 2460 ttgcaggcta tgttcttcta cctgaagcag atcccacgtt accttatccc atgttacttt 2520 gatgctatat taattggtgc atataccact cttctggata cagcatggaa gcagatgtca 2580 agctttgttc agaatggttc aacctttgtg aaacaccttt cattgggttc agttcaactg 2640 tgtggagtag gaaaattccc ttccctgcca attctttcac ctgccctaat ggatgtacct 2700 tataggttaa atgagatcac aaaagaaaag gagcaatgtt gtgtttctct agctgcaggc 2760 ttacctcatt tttcttctgg tattttccgc tgctggggaa gggatacttt tattgcactt 2820 agaggtatac tgctgattac tggacgctat gtagaagcca ggaatattat tttagcattt 2880 gcgggtaccc tgaggcatgg tctcattcct aatctactgg gtgaaggaat ttatgccaga 2940 tacaattgtc gggatgctgt gtggtggtgg ctgcagtgta tccaggatta ctgtaaaatg 3000 gttccaaatg gtgtagacat tctcaagtgc ccagtttcca gaatgtatcc tacagatgat 3060 tctgctcctt tgcctgctgg cacactggat cagccattgt ttgaagtcat acaggaagca 3120 atgcaaaaac acatgcaggg catacagttc cgagaaagga atgctggtcc ccagatagat 3180 cgaaacatga aggacgaagg ttttaatata actgcaggag ttgatgaaga aacaggattt 3240 gtttatggag gaaatcgttt caattgtggc acatggatgg ataaaatggg agaaagtgac 3300 agagctagaa acagaggaat cccagccaca ccaagagatg ggtctgctgt ggaaattgtg 3360 ggcctgagta aatctgctgt tcgctggttg ctggaattat ccaaaaaaaa tattttccct 3420 tatcatgaag tcacagtaaa aagacatgga aaggctataa aggtctcata tgatgagtgg 3480 aacagaaaaa tacaagacaa ctttgaaaag ctatttcatg tttcagaaga cccttcagat 3540 ttaaatgaaa agcatccaaa tctggttcac aaacgtggca tatacaaaga tagttatgga 3600 gcgtcaagtc cttggtgtga ctatcagctc aggcctaatt ttaccatagc aatggttgtg 3660 gcccctgagc tctttactac agaaaaagca tggaaagctt tggagattgc agaaaaaaaa 3720 ttgcttggtc cccttggcat gaaaacttta gatccagatg atatggttta ctgtggaatt 3780 tatgacaatg cattagacaa tgacaactac aatcttgcta aaggtttcaa ttatcaccaa 3840 ggacctgagt ggctgtggcc tattgggtat tttcttcgtg caaaattata tttttccaga 3900 ttgatgggcc cggagactac tgcaaagact atagttttgg ttaaaaatgt tctttcccga 3960 cattatgttc atcttgagag atccccttgg aaaggacttc cagaactgac caatgagaat 4020 gcccagtact gtcctttcag ctgtgaaaca caagcctggt caattgctac tattcttgag 4080 acactttatg atttgtag 4098 <210> 32 <211> 3900 <212> DNA <213> Pongo abelii <400> 32 atggggcaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa gctggaaaag 60 accctcttca gacttgaaca agggtatgaa ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgcaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc cgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccactgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ccgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtgaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaattcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttcgaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacatctta cgattattca ggatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 gacaatgggc cagcagcaat tgaagagtgc tgtaactggt ttcgtaagag aattgaggaa 1140 ttaaattcag agaagcatca actcattaac tatcatcagg aacaggcagt gaattgcctt 1200 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat ggacttctcc 1320 atggaagaat ctatgattca tctcccaaat aaagcttgtt tactgatggc acacaatgga 1380 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680 gaagatctgg acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740 atgagtgcat atgatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cggctattgc acatgccctg 1860 tttatggata ttacacatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920 cttccaagta ctacaattgt ttctatggcg tgttgtgcta gtggaagtac aagaggctat 1980 gatgaattag tgcctcatca gatttcggtg gtttctgaag aacggtttta cactaagtgg 2040 aatcctgaag cattgccttc aaatacaggt gaagttaatt tccaaagcgg cattattgca 2100 gccaggtgtg ctatcaataa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160 tatgttgatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220 cagtctgttg tggctgtatc tagaactgct ttcaggaatc ccaagacttc attttacagc 2280 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340 actattgaga gaaacacgaa accttatagg aaggatgaga attcaatcaa tggaacgcca 2400 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460 gctggagttg ccacaaaagg gcccaatgaa tttattcaag aaatagaatt tgaaaacttg 2520 tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580 ggaattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640 gttgacaatg cagatcctat attaaaaatt ccttttgctt tacctcattt ttcttctggt 2700 attttccgct gctggggaag ggatactttt attgcactta gaggtatgct gctgattact 2760 ggacgctatg tagaagccag gaatattatt ttagcatttg ctggtaccct gaggcatggt 2820 ctcattccta atctactggg tgaaggaact tatgccagat acaattgtcg ggacgctgtg 2880 tggtggtggc tgcagtgtat ccaggattac tgtaaagtgg ttccaaatgg tctagacatt 2940 ctcaagtgcc cagtttccag aatgtatcct acagatgatt ctgctccttt gcctgctggc 3000 gcactgttta atataactgc aggagttgat gaagaaacag gatttgttta tggaggaaat 3060 cgtttcaatt gtggcacatg gatggataaa atgggagaaa gtgacagagc tagaaacaga 3120 ggaatcccag ccacaccaag agatgggtct gctgtggaaa ttgtgggcct gagtaaatct 3180 gctgttcgct ggttgctgga attatccaaa aaaaatattt tcccttatca tgaagtcaca 3240 gtaaaacatg gaaaggctat aaaggtctca tatgatgagt ggaacagaaa aatacaggat 3300 aactttgaaa agctgtttca tgtttcagaa gacccttcag atttaaatga aaagcatcca 3360 aatttggttc acaaacgtgg catatacaaa gatagttatg gagcttcaag tccttggtgt 3420 gactatcagc tcaggcctaa ttttaccata gcaatggttg tggcccctga gctctttact 3480 acagaaaaag catggaaagc tttggagatt gcagaaaaaa aattgcttgg tccccttggc 3540 atgaaaactt tagatccaga tgatatggtt tactgtggaa tttatgacaa tgcattagac 3600 aatgacaact acaatcttgc taaaggtttc aattatcacc aaggacctga gtggctgtgg 3660 cctattgggt attttcttcg tgcaaaatta tatttttcca gattgatggg cccggagact 3720 actgcaaaga ctatagtttt ggttaaaaat gttctttccc gacattatgt tcatcttgag 3780 agatcccctt ggaaaggact tccagaactg accaatgaga atgcccagta ctgtcctttc 3840 agctgtgaaa cacaagcctg gtcagttgct actattcttg agacacttta tgatttatag 3900 <210> 33 <211> 4173 <212> DNA <213> Pteropus alecto <400> 33 atgggtcacg gtaaacagat tagaatttta cttctgaacg aaatggaaaa gcttgaaaag 60 accctcttta gacttgaaca agggtttgaa ctacagttcc gattaggccc aactttacaa 120 ggaaaaacag ttactgtgca tacaaattac ccatatcctg gagaaacatt taatcgagaa 180 aaattccgtt ccctggaatg ggaaaatcca tcagaaagag aagatgattc tgataaatac 240 tgtaaactta atctccaaca agcgggatca tttcagtatt acttccttcg aggaaatgag 300 aagagtggtg ggggttacat agttgtggat cctgtattac gtgttggtac tgataatcat 360 gtgttaccct tagactgtgt tactctccag acatttttag ctaagtgttt gggacccttg 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gttacaacat gattcacttt 480 accccattgc agactcttgg ccagtctagg tcatgctact ctcttgctga tcagttagaa 540 ttaaatcctg acttttccag acctaataaa aagtgtacct gggatgatgt tggacagcta 600 gtggaaaaat tgaaaaagga atggaatatt ctttgtatca ccgatgttgt ctacaatcat 660 accggaaata ggaaaataac caagcctgat ccaaaagaac accttaagat aattcaggat 720 cctgaataca ggaggcttgg ctgtactgta gatatgaaca ttgcactagc gactttcata 780 ccaaatgagt attttacttt cccatttgag gaaatgaccc tctccacaga agaatctatg 840 attcatctcc caaataaagc ttgttttctg atggcacata atggatgggt aatgggagat 900 gatccccttc gaaactttgc tgaaccaggt tcagatgttt atctgaggag agaacttatt 960 tgctggggag acagtgttaa attacgctat gggaataaac cagaggactg tccttatctc 1020 tgggcacaca tgaaaaaata cactgaaata actgcaactt atttccaggg agtacgtctt 1080 gataactgcc actccacacc tcttcatgta gctgagtaca tgttggatgc tgctaggaaa 1140 ttgcaaccca atttatatat agtggcagaa ctgttcacag gaagtgaaga cttggacaat 1200 gtctttgtta ctagactggg aattagttcc ttaataagag aggcaatgag tgcacatgat 1260 agtcatgaag agggcagatt agtttaccga tatggaggag aacccgttgg gtcatttgtt 1320 cagccctgtt tgaggccttt gatgccagct attgcacatg ccctgtttat ggatattacc 1380 catgataatg agtgtcctat tgtgcataga tcagcatatg atgctctccc aagttccatg 1440 attgtttcta tggcgtgttg tgctagtggt agtactaaag gctatgatga attagtgcct 1500 catcaggtgt atgtggatca ggttgatgaa gacatagtgg cagtaacaag acactcacct 1560 agtatccatc agtctgttgt ggctgtgtct agaactgctt tcaagaatcc caagacttca 1620 ttttacagca aggaagtccc tcaaatgtgc atccctggca aaattgaaga agtagttctt 1680 gaagctagaa ctattgaaag aaatacaaaa ccttataaga gggatgaaaa ttcaatcaat 1740 ggaatgccag atatcacagc agaaattaga gaacatattc agcttaatga aagtaaaatt 1800 gttaaacaag ctggaattgc cacaaaagga cccaatgaat acattcaaga aatagaattt 1860 gaaaacttgt ctccaggaag tgttattgta ttcagagtta gtctcgatcc acatgcacaa 1920 gtcgctgttg gaattcttcg aaatcattta actcagttca gtcctcactt taaatctggg 1980 agcctttctg ccgacagctc agatcctata ttaaaaattc ctttcgctta tattgcctct 2040 aaattaactt tggctgagct aaatcaaata ctttaccggt gtgaatcaga agaacaagaa 2100 gatggtgggg gatgttataa tataccaaac tggtcatctc ttaaatatgc aggtcttcaa 2160 gagaatagtt ctttggagtt agctccttat gtgggctttg gtggaggttg tggggcagca 2220 cctgcaggtc taaatcgggg tgggggtgtt cggtccgacc aggcctcact agagcgattc 2280 ctgactacct tgcttgccac tgtggactat acagcccttg tgtccacttc tgtatgttca 2340 ccccacatca ctggacacga gcagcagccc aggctatggg aacgaattgc ctctgccaat 2400 aatatagcat gctatttcta tgacttttca ggattaatgt ctgtattagc agaaatgaga 2460 ccaaagaatg acttggggca tcctttttgt gataatttga gatctggaga ttggatgatt 2520 gactatgtca gtaatcggct tatttcacga tcgggaacta ttgctgaagt tggcagatgg 2580 ttgcaggcta tgttcttcta cctgaagcag atcccacgct atcttatccc atgttatttc 2640 gatgctgtat taatcggtgc atacaccact cttctggata cggcatggaa acaaatgtca 2700 agctttgttc agaatggttc tacctttgtg aaacaccttt cattgggttc tgtccagctg 2760 tgtggagtag gaaaatacgc ttctcttcca cttctttcac cttcgcttat ggatgtacca 2820 tacaggctaa atgagatcac aaaagaaaag gagcaatgtt gtgtgactct agctgcaggc 2880 ttgcctcatt tttcttctgg tattttccgc tgctggggaa gggatacttt tattgcactt 2940 agaggtatac tgctgattac cgggcgctat ttagaagcca ggaatattat tttagcgttt 3000 gctggtacct tgagacacgg tctcattcct aatctcctgg gtgaaggaac ttatgccaga 3060 tacaactgcc gggatgccgt gtggtggtgg ctgcagtgta ttcaagacta ctgtaaagtg 3120 gttccaaatg gcctagacat tctcaagtgc cctgtctcca gaatgtatcc tacagatgat 3180 tctgttcctt tgtcggccgg cacagtggat cagccattgt ttgaagtaat acaagaagct 3240 atgcagaggc acatgcaggg catacagttc cgagaaagga atgctggtcc acagatagat 3300 cgaaacatga aggatgaagg ttttaatata actgtagggg ttgatgaaga aacaggattt 3360 gtttatggag gaaatcgctt caattgcggc acatggatgg ataaaatggg agaaagtgac 3420 agagctagaa acagaggaat cccagccact ccaagagatg gatctgctgt ggaaattgtg 3480 ggcctaagta aatctgccat tcgctggttg ctggaattat ctaaaaaaaa tatttttcct 3540 tatcatgaag tcacagtaaa aagagatgga aaggttgtga cagtctcata tgatgagtgg 3600 aacagaaaaa tacaagacaa ctttgaaaag ctattttatg tgtccgaaga cccttcagac 3660 tttaatgaaa agaatccaaa tctggttcac aaacgtggta tatacaaaga cagttatgga 3720 gcttcaagcc cttggtgtga ctatcagctc aggcctaatt ttaccatagc aatggttgta 3780 gcccctgagc tctttactac agaaaaagca tggaaagctt tacaggtggc agaaaaaaaa 3840 ttgcttggtc cccttggcat gaaaactttg gatccagatg atatggttta ctgtggagtt 3900 tatgacaatg ccttagacaa tgacaactac aatcttgcga aaggtttcaa ttatcatcaa 3960 ggacctgagt ggctttggct cattgggtat tttcttcgtg caaaattata tttttccaaa 4020 ttaatgggtc cagagacgaa tgcaaagact atttttttgg ttaaaaatgt tctttcccgg 4080 cactatgttc atcttgagag tctggcttgt tttgccctca ccactctgct gcagctgctc 4140 aacaagatcc tttctgcttc ccagatccca tga 4173 <210> 34 <211> 3759 <212> DNA <213> Cercocebus atys <400> 34 atgaattcca tccgaaaaat gatttgggag gatatttttc caaagcttaa actctgggaa 60 tttttccaag tagacgtcaa caaaaaaaaa aaaaaaaaaa aaagacttct tacacaagaa 120 aataggagag taaccaagtc tgatccacac caacatctta agattattca agatcctgaa 180 tacagacgat ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 240 gacaatgggc cagcagcaat tgaagaatgc tgtaattggt ttcgtaagag aattgaggaa 300 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 360 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 420 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagaaat ggacttctcc 480 gtggaagaat ctatgattca tctcccaaat aaagcttgtt ttctgatggc acacaatgga 540 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac caggctcaga agtttaccta 600 aggagagaac ttatttgctg gggagacagt gttaaattgc gctatgggaa taaaccagag 660 gactgtcctt ttctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 720 cagggagtac gtcttgataa ctgccactca acacctcttc atgtagctga gtacatgttg 780 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 840 gaagatctgg acaatatctt tgttactaga ctgggcatta gttccttaat aagagaggca 900 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 960 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccttg 1020 tttatggata ttacccatga taatgagtgt cctattgtgc atagatcagc atatgatgct 1080 cttccaagta ctacaattgt ttctatggcg tgttgtgcta gtggaagtac aagaggctat 1140 gatgaattag tgcctcatca gatttcagtg gtttctgagg aacggtttta cactaagtgg 1200 aatcctggag cattgccttc aaatacaggt gaagttaatt tccaaagcgg cattattgca 1260 gccaggtgtg ctatcaataa gcttcatcag gagcttggag ccaagggttt tattcaggtg 1320 tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1380 cagtctgttg tggctgtatc tagaactgct ttcaggaatc ccaagacttc attttacagc 1440 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 1500 actattgaga gaaatacgaa accttacagg aaggatgaga attcaatcaa tggaatgcca 1560 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 1620 gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 1680 tctccaggaa gcgttattat attcagagtt agtcttgatc cacacgcaca agtcgctgtt 1740 ggaattcttc gaaatcatct gacccaattc agtcctcact ttaaatctgg gagcctagct 1800 gttgacaatt cagatcctat attaaaaatt ccctttgctt ctattgcctc caaattaact 1860 ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 1920 gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 1980 tctgtattgg cagaaataag accaaagaat gacttgggcc atcctttttg taataatttg 2040 agatctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2100 attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2160 taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2220 atagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2280 tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2340 cctgcactaa cgggtgtacc ttatagatta aatgagatca caaaagaaaa ggagcaatgt 2400 tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 2460 agggatactt ttattgcact tagaggcata ctgctgatta ctggacgcta tgtagaagcc 2520 aggaatatta ttttagcatt tgctggtacc ctgaggcatg gtctcattcc taatctactg 2580 ggtgaaggaa cttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 2640 atccaggatt actgtaaaat ggttccaaat ggtctagaca ttctcaagtg tccagtttcc 2700 agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 2760 tttgaagtca tacaggaagc aatgcaaaga cacatgcagg gcatacagtt ccgagaaagg 2820 aatgctggtc ccaagataga tcgaaacatg aaggatgaag gttttaatgt aactgcagga 2880 gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 2940 gataaaatgg gagaaagtga cagagctaga aacacaggaa tcccagccac accaagagat 3000 gggtctgctg tggaaattgt gggactgagt aaatctgctg ttcgctggtt gctggaatta 3060 tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggttgta 3120 aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3180 gtttcagaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3240 atatacaaag atagttatgg agcttcaagt ccctggtgtg actatcagct caggcctaat 3300 tttactatag caatggttgt ggcccctgag ctctttacta cagcaaaagc atggaaagct 3360 ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 3420 gatatggttt actgtggaat ttatgacaat gcattagaca atgacaacta caatcttgca 3480 aaaggtttca attatcacca aggacctgag tggctgtggc ctattggata ttttcttcgt 3540 gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 3600 gttaaaaatg ttctttcccg acactatgtt catcttgaga gatccccttg gaaaggactt 3660 ccagaactga ccaatgagaa tgcccaatac tgtcctttca gctgtgaaac acaagcctgg 3720 tcaatttcta ctattcttga gacactttat gatttatag 3759 <210> 35 <211> 3351 <212> DNA <213> Ornithorhynchus anatinus <400> 35 atgtttgaag gcagagcgga aggagtcgtt ggagagtact ttacttttcc gtatggagaa 60 atgacttctg tagaagaaga atctttgatg catcaacctg aaaaagcttg ttttttcatg 120 gcccataatg gttgggtcat gggagatgat ccattgagaa attttgctga gccagggtca 180 gatgtttacc tcaggagaga gcttgtttgc tggggagaca gtgttaaatt acgttatgga 240 aataaaccag aagactgccc ttacctctgg gcccacatga aaaaatatac tgaaataact 300 gccaagtatt ttcaaggagt gcgtcttgac aactgccact cgacacctct tcacgtagct 360 gagtatatgc tggatgctgc taggaaattg cagcccaatt tgtatgtagt ggctgagctg 420 ttcacaggaa gtgaggagct ggacaatatc tttgtgacta gactgggcat tagctcctta 480 ataagagaag ctatgagtgc atataatagc catgaagaag gcagattagt gtaccgcttt 540 ggaggagagc cagtgggatc tttcgttcag ccgtgtttga gacctttgat gccagctatt 600 gcacatgctc tgtttatgga tatcactcat gataacgaat gtcctattgt gcatcgatca 660 gcatatgatg ctcttccgag ctccaccata gtttccatgg cttgctgtgc tagtggaagt 720 actaggggct atgatgaatt agtacctcat cagatttctg tagtttctga agaacggttt 780 tataccaagt ggaacccagc agctactcta tcaaacccat ctgaagttaa tctccagact 840 ggaattatag caggaagacg tgccataaat aagctgcacc aagaacttgg agctaaaggt 900 tttattcagg tttatgtgga tcaggttgat gaagacatag tagcagtgac gagacactgt 960 cctagctctc accagtccgt agtggccgtg tctcgcactg cttttagaaa ccccaagact 1020 tctgcttaca gcaaagaagt gccgcagatg tgcatcccag gtaaaattga agaagtagtt 1080 cttgaggcca gaactgttga aagaaatgtt ggttcctacg taaaggatgc aaaatccatc 1140 aatggaatgc ccgacatcac agtagaaatt agagaacaca tccagcttaa tgaaagtaaa 1200 attgtaaaac aagctggagt tgccacaaaa ggtcttcatg aatatgtcca agaaatagaa 1260 tttgaaaatt tgaccccagg aagtgttatt atatttcgag taagccttga tccacacgca 1320 caagtggctg ttggaatact tcggaatcac ctgacacaat tcagtcctaa ttttaaaatt 1380 ggaagccttc ctgttgacaa ttcagatcct atattaaaaa ttccttttgc ttctatttca 1440 tctaaattaa ctttagctga cctaaatcaa ttactctacc gatgtgagtc agaagaacaa 1500 gaagatggtg gaggatgtta tgatgtacca aactggtcac ccctcaaata tgggggcctt 1560 caaggattaa tgtcagtaat ggctgaaatt aggccaaaga atgacttggg acatcctttt 1620 tgcaataatt tgcgatctgg agattggatg attgattatg tcagtaatcg actgatttcg 1680 cgctcaggat ctattgctga agttggtaaa tggttccaag ctatgttctt ctatctaaag 1740 cagattccac gttaccttat cccttgttat tttgatgcta tattaattgg tgcgtacacc 1800 actcttctgg atatagcctg gaagcagatg tcaagctttg tccagaatgg ttcaacattt 1860 gtaaaacacc tgtcattggg ttcagttcaa atgtgcggga taggaaagtt cccatctctg 1920 ccttttcttt ctccatcact tggtgatgtt ccctatagac tgaatgaaat tacacaggaa 1980 aaggaacagt gctgtgtttc tctagctgct gggttacctc atttttcatc tggaattttt 2040 cgctgctggg gaagagatac cttcatagca cttagaggtc tactgctaat tactggtcgc 2100 tttttagagg caaggaacat aattctagca tttgctggta ctctgagaca tggtcttatt 2160 cccaatcttc tcggccaggg gacgtatgcc agattcaatt gtcgagatgc agtgtggtgg 2220 tggcttcagt gtattcagga ttactgtaaa attgttccaa agggcacgga cattctcaag 2280 tgccccgtat ccagaatgta tccatcagat gactcttctg ctctaccagc cggcacattg 2340 gatcagccat tgtatgaagt aatacaggaa gctatgcagc gtcatatgca aggcatacag 2400 ttccgagaaa agaatgctgg tccacagatt gaccggaata tgaaggatga aggttttaat 2460 gtcactgcag gagttgatga tgaaagtggg tttgtttatg gaggcaatca cttcaactgt 2520 ggaacatgga tggataaaat gggagagagt gacagaggtc gcaacagagg aatcccagct 2580 acacccagag atgggtctgc tgtggaaatt gttggcctga gtaaatcaac tgttcgctgg 2640 ttggtagaat tatcgaaaaa aaatgtgttc ccttatcacg gagttacagt aaagagaaat 2700 gaaaaagagg tattaatcac atacgatgaa tggaacagga aaatccaaga ccactttgaa 2760 aagctattct atgtttcaga ggatccatca gatactaatg aaaagcatcc taatttggtt 2820 cataagcgtg gtatatacaa agatagctat ggagcttcaa gtccttggtg tgactaccag 2880 ctcaggccaa actttaccat agcaatggtt gtggctcctg aactctttac tcctcagaag 2940 gcatggaaag ctttggaaat agcagagaag aaattgcttg gtcccctggg catgaaaact 3000 ctggatccag atgatatggt gtactgtgga gtatatgata atgccctaga caatgacaac 3060 tacaaccttg ctaaaggttt taattaccac caaggacctg aatggttgtg gcctgttgga 3120 tattttcttc gtgcaaagtt atatttttcc aagttaatgg gtcaggaaac ttacacaaag 3180 actgtgtttt tgattaaaaa tgttctttcc cgtcattacg tccatcttga gagatcccct 3240 tggaaagggc ttccagagct gactaatgaa aatggacaat actgttcttt cagctgtgaa 3300 acacaggctt ggtcaattgc cgttattctt gaaactcttt atgatttatg a 3351 <210> 36 <211> 3915 <212> DNA <213> Anas platyrhynchos <400> 36 atgcatccag aatgtggcta taaccttgta aattcccctc acctgaagcc agcttgggtc 60 ttagatagag ctctgtggca cttgacctgt atggtggctg atggaaagtg tattgataaa 120 ggggtccctc cgttgattga aaatgatcac cacctgaatt gtgtccgtaa aataatttgg 180 gaagagatat atccaaaaat taaactgtgg gaatttttcc aagtggatgt taataaagct 240 gtggaacaat ttagaaccct tctaactcaa ggtaaagaaa gcaaaatgag cactaaatct 300 gatccaaatc aacatcttca gatagttcag gaccctgagt atagacgatt tggctgtact 360 gtagatatga atatagcatt ggcaaccttc ataccgcaca gcaatggacc aggtgcaata 420 gaagagtgtt gtaactggtt tcgcaagagg attgaggaac tgaatgctga gcaacacaga 480 cagattcatc accatcaaga gcaggcagtc aactgtcttg cggggactgt ggtttatgaa 540 cgactggctg gtcatggtcc taaactgggt cctattagta gaaaatatcc tttagttacc 600 aggtatttta cttacccatt caaagacatg actgtggagg aagaagaagc tatgatacat 660 cgcccagata aagcttgcta tttcatggcc cataatggat gggttatggg cgatgatcct 720 cttagaaact ttgcagaacc aggttcaaat gtttacttga gaagggagct tatttgctgg 780 ggagacagtg tgaaactgcg ttatgggaac aaacctgaag actgcccata cctctgggca 840 catatgaaaa aatacacaga aatcacagcc aaatatttcc atggcgttcg tcttgacaac 900 tgtcactcaa cacctattca tgtagctgag tacatgctgg acacagctag aaaattgcga 960 gcagatttgt ttgtagtggc tgaactgttc acaggaaatg aggagctgga caatatcttt 1020 gtgaataggc tgggcattac ctccttaata agagaggcaa tgacagctta taatagccat 1080 gaggagggaa ggttagttta tcgttttgga ggtgaacctg ttggctcttt tgttcagcca 1140 cgtttgagac ccctgatgcc agctattgct catgcactgt tcatggatat tacacatgat 1200 aatgagtgtc cgatccagca ccgatctgca tatgatgctc ttcccagtgc aatgattgtt 1260 tccatggcat gctgtgctac aggtagcacc aaaggttatg atgaacttgt accacaccag 1320 atatccgtag tatccgaaga gagattttat tcaacatgga atccagcagc acacctgact 1380 tctggtgaag ttaatttcca aacaggaatt ctagcaggaa ggctggccat aaacaggctg 1440 catcaggagc tgggagctaa aggttttaat caggtgtatg tagatcaagt tgatgaagat 1500 atagtggcag tgacaagaca ttgccctaat acacaccagt ctgttgtggc tgtaagtaga 1560 actgctttca gagatccaaa gacttccttc tacagtaaag aagtgcctga aatgtgtatc 1620 ccagggaaaa ttgaagaagt agtacttgag gctagaacca ttgagagaaa tactaatcct 1680 tacaaaaaag atgaacgttt tataaatgga ttgcctaact tcacagtgga actcagagag 1740 cacattcaga ttaaagacag taaaattata aagcaagctg gaactgccat aaaagggcca 1800 aatgaatttg ttcaagaaat agaatttgaa aatttaacac caggaagtgt aatagtattc 1860 agagttagtc ttgatccaaa ggcacaagag gctgttggtg tactccgtag tcatctgatc 1920 cagtttagtc ctcactttaa atctggaagt cttcctgatg atcattcagc acccatatta 1980 aaaacattat tttcttcaat tgcatctaaa ttaagtttgg ctgacctaaa tcaagtgctg 2040 tataggtgtg aggcagaaga acaagaagat ggtggaggct gttacaatat accaaactgg 2100 tcaccgttga agtatgcagg cctccaaggg ttaatgtcag taatggcaga cattagacca 2160 aagaatgatt tgggccaccc gttttgtgat aatttaagat ctggagattg gatgattgat 2220 tatgtcagca atcgtctgat ttcacgtact ggagcctgtg cagaagttgg taaatggttg 2280 aaggccatgt ttatctattt aaagaaaatt ccacgttacc ttatcccatg ttattttgat 2340 gccatattag tgggtgcata cacaacgctt ctggatgtgg gatggcatca gatgtctagc 2400 tttgtgcaga acggatcaac atttgttaaa cacctttcct tgggctcaat ccagatgtgt 2460 gggataggaa aatactcatg tttgcccgat ctgtctcctt ccttacatga tgttccctat 2520 agactgaatg agattacaaa tgagaaagaa cagtgttgtg tttctttggc agctggttta 2580 cctcactttt cttcagggat ttttcgctct tggggaaggg atacctttat tgcactgaga 2640 ggtctgatgt tagttacagg gcgttatcta gaagcaagaa acataatttt agcatttggt 2700 gggactttaa gacatggtct cattcccaac ctgctcggcc aggggacgca tgccagatac 2760 aactgtcgtg atgctgtatg gtggtggctt cagtgtatcc aggactactg taaaattgtt 2820 ccaaatggat tagacattct cagatgtcct gtttccagaa tgtacccaag agatgactct 2880 tctcctcaac ctgcaggcag tgtggatcag ccgctttatg aagtaataca ggaagcaatg 2940 caacgacaca tggaaggcat aaatttccga gaaaggaatg ccggcccaca gatagatcaa 3000 aacatgagag atgaaggttt taatgtaaca gcgggtgttg accgtgaaac tggctttgtc 3060 ttcggaggga accgtttcaa ttgtggcacc tggatggata aaatggggga gagtgacaga 3120 gctcgcaaca gaggaattcc tgctactccg agagatggct ctgctgtgga aattgttggc 3180 ttgtgcaagt caactgtacg ctggcttctg gatttgtcta ggaaaaatga gtttccattc 3240 catggagtca ccataaaaag acacggaaag gaggaaacta tcacatatga tgaatgggac 3300 agaaaaattc aagcacactt tgaaaagctc ttctttgtct ctgagaaccc agcagatcca 3360 aatgaaaaac atccaaatct tgttcacaaa cgtggaatct ataaagacag ctatggagct 3420 tcaagtccat ggtgtgatta ccaactcaga ccaaatttta caatagcaat ggttgtggca 3480 cctgagttgt tcacacctga gagagcttgg aaagctctgc agatagcaga ggaaaaacta 3540 cttggtccgt taggcatgaa aactttagac ccagatgata tggtgtactg tggagtatat 3600 gataatgctc ttgacaatga caactataat gtagccagag gttttaatta tcaccaagga 3660 cctgaatggc tgtggccaat tggatatttc cttcgtgcca aattgtactt ctcaaagcta 3720 attggtccac agatatacgc aaaaactgta gttatgataa agaatgtgct ttctcgccac 3780 tatgttcacc ttgaaaggtc atcctggaaa gggcttccag agctgaccaa tgaaaatgga 3840 caatattgcc ctttcagctg tgaaactcag gcctggtcaa ttagtgttat ccttgaaatc 3900 ctttatgatt tgtga 3915 <210> 37 <211> 4599 <212> DNA <213> Homo sapiens <400> 37 atgggacaca gtaaacagat tcgaatttta cttctgaacg aaatggagaa actggaaaag 60 accctcttca gacttgaaca agggtatgag ctacagttcc gattaggccc aactttacag 120 ggaaaagcag ttaccgtgta tacaaattac ccatttcctg gagaaacatt taatagagaa 180 aaattccgtt ctctggattg ggaaaatcca acagaaagag aagatgattc tgataaatac 240 tgtaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 300 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 360 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 420 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 480 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 540 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 600 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 660 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 720 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 780 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 840 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 900 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 960 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 1020 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 1080 gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 1140 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 1200 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1260 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1320 atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1380 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1440 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1500 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1560 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1620 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1680 gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1740 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1800 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1860 tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1920 cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1980 gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 2040 aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 2100 gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 2160 tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 2220 cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2280 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2340 actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2400 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2460 gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2520 tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2580 ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2640 gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 2700 ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 2760 gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 2820 tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2880 aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2940 attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 3000 taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 3060 acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 3120 tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 3180 cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 3240 tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 3300 agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 3360 aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 3420 ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 3480 atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 3540 agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 3600 tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 3660 aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 3720 gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 3780 gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3840 gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3900 tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3960 aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 4020 gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 4080 atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 4140 tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 4200 ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 4260 gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 4320 aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 4380 gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 4440 gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 4500 ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 4560 tcaattgcta ctattcttga gacactttat gatttatag 4599 <210> 38 <211> 4599 <212> DNA <213> artificial <220> <223> hGDE co1 <400> 38 atgggccata gtaaacagat tcgcatactc ctcttgaacg agatggagaa actggagaag 60 acattgtttc ggttggagca ggggtacgag ctccagtttc gcctgggacc gacgctccaa 120 ggcaaagctg tgactgtata cacgaactat ccattcccgg gggagacgtt taacagggag 180 aagtttaggt ccctggactg ggagaaccca accgaacgag aggacgattc cgataaatat 240 tgcaagctca acttgcagca aagtggcagc tttcaatatt actttctcca aggcaatgag 300 aaaagtgggg gggggtatat tgttgtcgat ccaatactgc gcgtaggggc agataatcac 360 gttctcccgc tggattgcgt cactctccag acattcttgg ctaaatgctt ggggccgttt 420 gatgaatggg agtctcgctt gcgagtggcc aaagagtcag gttataacat gattcacttc 480 acaccactcc agacattggg acttagtcgg agctgttact cactcgcaaa tcaattggag 540 cttaacccag acttcagtcg gccaaatcgg aagtacacgt ggaacgacgt tggacaactt 600 gtcgaaaagt tgaagaaaga gtggaatgtg atttgcatca ctgacgtggt gtacaatcac 660 accgcagcca acagcaagtg gattcaggag cacccagagt gtgcgtacaa cctggtgaac 720 tcacctcacc tcaaacccgc ctgggtgctc gatagggctt tgtggcgctt ttcttgcgac 780 gtagcggaag gaaagtataa agagaaagga atacccgccc tcatagaaaa cgatcatcac 840 atgaattcta tacggaaaat catctgggag gatatatttc cgaaacttaa actttgggag 900 ttctttcaag tagatgtaaa caaggcggtg gagcaattca ggaggctcct cacccaagag 960 aatcgccggg ttactaaatc tgacccgaat caacacctta caataatcca agatccggaa 1020 tacaggaggt ttggttgcac tgtcgatatg aatattgcgc ttactacgtt catcccccac 1080 gacaagggcc cggccgcaat agaagaatgc tgcaattggt tccacaagcg gatggaagaa 1140 ctgaactctg aaaagcaccg ccttataaat tatcaccaag agcaggctgt gaactgtctg 1200 ctcggtaacg ttttttacga gcgcctggcc ggacacggac ctaaactcgg gccagtcact 1260 cgaaaacacc cactggttac gcgatacttc acattcccgt tcgaggagat cgacttttct 1320 atggaggaat ctatgatcca cctcccaaat aaagcttgtt ttcttatggc gcacaacgga 1380 tgggttatgg gggacgaccc actgcgaaac ttcgcagaac cgggtagtga ggtctacctt 1440 aggcgcgagc tcatttgttg gggcgacagc gtcaagctcc ggtatggaaa taagccagag 1500 gattgccctt acttgtgggc acacatgaag aagtatacgg aaataacagc tacctacttc 1560 cagggggtac gactggataa ctgccactcc acaccgttgc acgtggccga gtatatgctc 1620 gacgctgcgc gcaatttgca gccaaatctg tacgtcgtgg cagagctttt cactggaagt 1680 gaggacttgg ataacgtctt tgtgactcgc ctgggaatta gtagcttgat aagggaggct 1740 atgtccgcgt acaacagtca cgaggaagga cgattggttt atcgatatgg gggcgagcct 1800 gtaggctcct ttgtgcaacc ctgcttgcgg ccccttatgc ccgctatagc acacgcgctc 1860 ttcatggata tcacgcacga taatgaatgc cccatagtac acagatccgc ctacgacgcc 1920 cttccatcta cgacaatcgt ctctatggcc tgctgcgcct ccggcagcac tagaggctac 1980 gacgaactcg tcccacacca gatttcagtg gtatcagagg aacggtttta cactaaatgg 2040 aaccctgagg cgctcccatc taatactggc gaagtaaatt tccagtccgg aatcattgcg 2100 gcccgctgtg ctatctccaa gttgcatcag gaacttggag ctaaaggttt cattcaagta 2160 tatgtcgatc aggtcgatga agatattgtg gctgtgaccc gacactcccc atcaattcat 2220 caaagtgtag tggctgtaac tcggacggct tttcgcaacc caaagacttc attctactcc 2280 aaagaggttc cacagatgtg tattccggga aagatagaag aagtggtatt ggaagcccgg 2340 accatcgaga ggaacactaa accatatcga aaagacgaga actccattaa cggaacccct 2400 gacatcactg ttgagatccg cgagcatatt cagcttaacg aaagcaaaat cgttaagcag 2460 gccggcgttg ccactaaggg accaaacgaa tatatccaag aaatcgaatt cgaaaacctc 2520 agtcctggct ccgttattat ctttcgcgta tccctcgacc cacacgccca agttgcggta 2580 gggatcttga gaaaccacct cacacagttc agcccacact ttaaatcagg ctccctcgcc 2640 gttgataacg cggacccaat acttaagatc ccctttgcat cccttgcgta tcgacttact 2700 ctcgcagagc ttaatcaaat attgtaccgc tgcgagtccg aagagaagga agacggtggt 2760 ggctgctacg acatccctaa ttggagtgca cttaagtacg cggggctgca gggactgatg 2820 tcagtgcttg cagagataag gccgaagaat gaccttggcc atccattttg taataatctc 2880 cgaagtggtg attggatgat agattacgta tcaaaccgct tgatcagtcg gtctggtacc 2940 atcgcggaag tgggaaagtg gttgcaggca atgttctttt atctcaaaca aatcccacgg 3000 tacttgatac cttgctattt cgacgcaatt ctcatcggtg catacacgac cttgctggac 3060 acggcctgga agcagatgtc tagcttcgtt cagaacggtt ctaccttcgt aaagcacctc 3120 tcattgggtt cagtccaact ctgcggagtc gggaaattcc cttcacttcc tattctctca 3180 cctgccctca tggacgtgcc ctaccggctg aacgaaatta ctaaggagaa ggaacagtgt 3240 tgtgtttctt tggcggcagg cttgccgcac ttttccagtg gaatcttcag atgttgggga 3300 cgggacacat tcattgcgct ccggggtatt ttgttgataa cgggccgata cgttgaggca 3360 cgaaatatta ttctggcatt cgccgggacc ttgcggcacg ggctgatacc caacctgctg 3420 ggcgaaggga tttacgctcg ctataactgc cgagacgcag tttggtggtg gctgcagtgt 3480 attcaggact attgtaagat ggtaccgaac gggctcgaca tcttgaagtg tcccgttagt 3540 cgaatgtatc ccaccgacga ttcagctccc ctgcccgcgg gaacacttga ccaaccactc 3600 tttgaagtga tccaagaggc tatgcagaaa cacatgcagg gaatacagtt ccgagaacga 3660 aacgcagggc cgcagattga tcgaaatatg aaagacgaag gatttaatat cacggcaggg 3720 gtcgacgaag agacggggtt tgtctacggc gggaatagat ttaactgcgg cacctggatg 3780 gataaaatgg gagaaagtga ccgagcacgg aaccggggca taccagcaac cccccgagac 3840 gggagcgctg ttgagatcgt gggtctgtct aagagtgcgg ttcgctggct tctcgagctt 3900 tcaaaaaaaa atatatttcc ttaccacgag gtcacggtca aaaggcatgg aaaagccata 3960 aaagtgtcat acgacgagtg gaataggaaa atacaagata actttgaaaa gctgtttcac 4020 gttagcgaag atcccagcga tctcaacgaa aaacatccca atctggttca caaacgcggg 4080 atctataaag actcatatgg agctagttct ccttggtgcg attatcaact gagaccgaac 4140 tttacaatcg ccatggtagt tgcgcccgag ctctttacta cagaaaaagc ctggaaggca 4200 cttgagattg cggaaaagaa actgcttggc cctctcggga tgaaaacgct tgatcccgac 4260 gacatggtct attgcgggat ttacgacaac gcattggaca acgacaacta caacttggcg 4320 aaaggattta attatcacca gggtcctgag tggttgtggc ccattggata ctttcttcga 4380 gcgaagctgt atttttcaag gctgatgggg ccggaaacga cagcgaaaac tattgtgctt 4440 gtcaaaaacg tgcttagcag gcattacgtg cacctcgagc gcagcccttg gaaaggactt 4500 ccggagctta cgaacgaaaa cgcccagtat tgtccattta gctgtgagac gcaggcctgg 4560 tctattgcta ccatcctcga gacactctac gacttgtag 4599 <210> 39 <211> 4599 <212> DNA <213> artificial <220> <223> hGDE co2 <400> 39 atgggccaca gcaagcagat cagaatcctg ctgctgaacg agatggaaaa gctggaaaag 60 accctgttcc ggctcgagca gggctacgag ctgcagttta gactgggccc tacactgcag 120 ggcaaagccg tgaccgtgta cacaaactac cccttccctg gcgaaacctt caaccgcgag 180 aagttcagaa gcctggactg ggagaacccc accgagagag aggacgacag cgacaagtac 240 tgcaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 300 aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 360 gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 420 gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 480 acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 540 ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 600 gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 660 accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 720 agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 780 gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 840 atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 900 ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 960 aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 1020 tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 1080 gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 1140 ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 1200 ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1260 agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1320 atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1380 tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1440 agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1500 gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1560 cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1620 gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1680 gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1740 atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1800 gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1860 ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1920 ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1980 gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 2040 aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 2100 gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 2160 tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 2220 cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2280 aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2340 accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2400 gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2460 gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2520 agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2580 ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2640 gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctggccta cagactgaca 2700 ctggctgagc tgaaccagat cctgtacaga tgcgagtccg aagagaaaga ggatggcgga 2760 ggctgctacg acatccccaa ttggagcgcc ctgaagtatg ccggactgca gggactgatg 2820 tctgtgctgg ccgagatcag acccaagaac gacctgggac accccttctg caacaacctg 2880 agatccggcg actggatgat cgactacgtg tccaacagac tgatcagcag atccggcaca 2940 atcgccgaag tcggcaaatg gctgcaggcc atgttcttct acctgaagca gatccctcgg 3000 tatctgatcc cctgctactt cgacgccatc ctgatcggcg cctacaccac actgctggat 3060 accgcctgga agcagatgtc cagcttcgtg cagaacggca gcaccttcgt gaagcacctg 3120 tctctgggaa gcgtgcagct gtgtggcgtg ggcaaatttc ccagcctgcc tatcctgtct 3180 cctgcactga tggacgtgcc ctaccggctg aatgagatca ccaaagaaaa agagcagtgc 3240 tgcgtcagcc tggctgctgg cctgcctcat ttttccagcg gcatcttccg gtgttggggc 3300 agagacacct ttattgccct gagaggcatc ctgctgatta ccggcagata cgtggaagcc 3360 cggaacatca tcctggcctt tgccggcaca ctgcggcacg gactgattcc taatctgctc 3420 ggcgagggca tctacgccag atacaactgc agagatgccg tgtggtggtg gctccagtgc 3480 atccaggact actgcaagat ggtgcccaac ggcctggaca tcctgaagtg ccctgtgtcc 3540 agaatgtacc ctaccgacga tagcgcccct ctgcctgccg gaacacttga ccagcctctg 3600 ttcgaagtga ttcaagaggc catgcagaaa cacatgcagg gaatccagtt tcgcgagcgg 3660 aatgccggac ctcagatcga cagaaacatg aaggatgagg gcttcaacat caccgctggc 3720 gtggacgaag agacaggctt tgtgtacggc ggcaaccggt tcaattgcgg cacctggatg 3780 gacaagatgg gcgagtctga ccgggccaga aacagaggaa ttcccgccac acctagagat 3840 ggcagcgctg tggaaatcgt gggcctgtct aagtctgctg tgcggtggct gctcgaactg 3900 agcaagaaga atatctttcc gtaccacgaa gtgaccgtga agcggcacgg caaggccatc 3960 aaggtgtcct acgacgagtg gaacagaaag atccaggaca acttcgaaaa gctgttccat 4020 gtgtctgagg accccagcga cctgaacgaa aagcacccca acctggtgca caagcgcggc 4080 atctacaagg acagctacgg cgcctcttct ccttggtgcg attaccagct gcggcccaac 4140 ttcaccattg ccatggtggt tgcccctgag ctgttcacca cagagaaggc ctggaaggcc 4200 ctggaaatcg ccgagaagaa actgctgggc cctctgggca tgaagacact ggaccccgac 4260 gacatggtgt actgcggaat ctacgacaac gccctggata acgacaacta caatctggcc 4320 aaggggttca attaccatca gggacccgag tggctgtggc ctatcggcta tttcctgcgg 4380 gccaagctgt acttctccag actgatgggc cctgagacaa ccgccaagac aatcgtgctc 4440 gtgaagaacg tgctgagccg gcactatgtg cacctggaaa gaagcccctg gaagggactg 4500 cccgagctga ccaatgagaa cgcccagtac tgccccttca gctgcgaaac acaggcctgg 4560 tctatcgcca ccatcctgga aaccctgtac gacctgtga 4599 <210> 40 <211> 1515 <212> PRT <213> Homo sapiens <400> 40 Met Ser Leu Leu Thr Cys Ala Phe Tyr Leu Gly Tyr Glu Leu Gln Phe 1 5 10 15 Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr Asn 20 25 30 Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser Leu 35 40 45 Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr Cys 50 55 60 Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu Gln 65 70 75 80 Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile Leu 85 90 95 Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr Leu 100 105 110 Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu Ser 115 120 125 Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe Thr 130 135 140 Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala Asn 145 150 155 160 Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr Thr 165 170 175 Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp Asn 180 185 190 Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn Ser 195 200 205 Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser 210 215 220 Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe 225 230 235 240 Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala 245 250 255 Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile Trp 260 265 270 Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp 275 280 285 Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn 290 295 300 Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln 305 310 315 320 Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala 325 330 335 Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu 340 345 350 Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys 355 360 365 His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu 370 375 380 Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly 385 390 395 400 Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro 405 410 415 Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu Pro 420 425 430 Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly Asp 435 440 445 Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg 450 455 460 Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn 465 470 475 480 Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr 485 490 495 Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His 500 505 510 Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn 515 520 525 Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu 530 535 540 Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile 545 550 555 560 Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val 565 570 575 Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu 580 585 590 Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr 595 600 605 His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu 610 615 620 Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr 625 630 635 640 Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser Glu 645 650 655 Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr 660 665 670 Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile 675 680 685 Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr 690 695 700 Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser Pro 705 710 715 720 Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn 725 730 735 Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro 740 745 750 Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn 755 760 765 Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp 770 775 780 Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile 785 790 795 800 Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln 805 810 815 Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg 820 825 830 Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg Asn 835 840 845 His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val 850 855 860 Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr 865 870 875 880 Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser 885 890 895 Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser 900 905 910 Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu 915 920 925 Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg 930 935 940 Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg 945 950 955 960 Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe 965 970 975 Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala 980 985 990 Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln 995 1000 1005 Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu 1010 1015 1020 Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser 1025 1030 1035 Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu 1040 1045 1050 Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala 1055 1060 1065 Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly 1070 1075 1080 Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly 1085 1090 1095 Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr 1100 1105 1110 Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr 1115 1120 1125 Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys 1130 1135 1140 Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu 1145 1150 1155 Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro 1160 1165 1170 Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln 1175 1180 1185 Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg 1190 1195 1200 Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe 1205 1210 1215 Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly 1220 1225 1230 Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu 1235 1240 1245 Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp 1250 1255 1260 Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg 1265 1270 1275 Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu 1280 1285 1290 Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp 1295 1300 1305 Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His 1310 1315 1320 Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu 1325 1330 1335 Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser 1340 1345 1350 Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met 1355 1360 1365 Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala 1370 1375 1380 Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys 1385 1390 1395 Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn 1400 1405 1410 Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr 1415 1420 1425 His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg 1430 1435 1440 Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala 1445 1450 1455 Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val 1460 1465 1470 His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn 1475 1480 1485 Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp 1490 1495 1500 Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1505 1510 1515 <210> 41 <211> 1516 <212> PRT <213> Homo sapiens <400> 41 Met Ala Pro Ile Leu Ser Ile Asn Leu Phe Ile Gly Tyr Glu Leu Gln 1 5 10 15 Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val Tyr Thr 20 25 30 Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe Arg Ser 35 40 45 Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp Lys Tyr 50 55 60 Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 65 70 75 80 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 85 90 95 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 100 105 110 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 115 120 125 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 130 135 140 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 145 150 155 160 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 165 170 175 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 180 185 190 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 195 200 205 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 210 215 220 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 225 230 235 240 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 245 250 255 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 260 265 270 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 275 280 285 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 290 295 300 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 305 310 315 320 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 325 330 335 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 340 345 350 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 355 360 365 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 370 375 380 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 385 390 395 400 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 405 410 415 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 420 425 430 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 435 440 445 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 450 455 460 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 465 470 475 480 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 485 490 495 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 500 505 510 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 515 520 525 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 530 535 540 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 545 550 555 560 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 565 570 575 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 580 585 590 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 595 600 605 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 610 615 620 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 625 630 635 640 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 645 650 655 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 660 665 670 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 675 680 685 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 690 695 700 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 705 710 715 720 Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg 725 730 735 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 740 745 750 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 755 760 765 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 770 775 780 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 785 790 795 800 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 805 810 815 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 820 825 830 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 835 840 845 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 850 855 860 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala 865 870 875 880 Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu 885 890 895 Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp 900 905 910 Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala 915 920 925 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 930 935 940 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 945 950 955 960 Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe 965 970 975 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 980 985 990 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys 995 1000 1005 Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His 1010 1015 1020 Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro 1025 1030 1035 Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg 1040 1045 1050 Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu 1055 1060 1065 Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp 1070 1075 1080 Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr 1085 1090 1095 Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly 1100 1105 1110 Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile 1115 1120 1125 Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln 1130 1135 1140 Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile 1145 1150 1155 Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala 1160 1165 1170 Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile 1175 1180 1185 Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu 1190 1195 1200 Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly 1205 1210 1215 Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr 1220 1225 1230 Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly 1235 1240 1245 Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg 1250 1255 1260 Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val 1265 1270 1275 Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His 1280 1285 1290 Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr 1295 1300 1305 Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe 1310 1315 1320 His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn 1325 1330 1335 Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser 1340 1345 1350 Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala 1355 1360 1365 Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys 1370 1375 1380 Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met 1385 1390 1395 Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp 1400 1405 1410 Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn 1415 1420 1425 Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu 1430 1435 1440 Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr 1445 1450 1455 Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg His Tyr 1460 1465 1470 Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr 1475 1480 1485 Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala 1490 1495 1500 Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1505 1510 1515 <210> 42 <211> 441 <212> DNA <213> artificial <220> <223> HBB2 intron <400> 42 gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60 cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120 gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180 atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240 aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300 ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360 tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420 tggcccatca ctttggcaaa g 441 <210> 43 <211> 441 <212> DNA <213> artificial <220> <223> modified HBB2 intron <400> 43 gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60 cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120 gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180 atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240 aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300 ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360 tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420 tggcccatca ctttggcaaa g 441 <210> 44 <211> 1438 <212> DNA <213> artificial <220> <223> FIX intron <400> 44 ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60 gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120 acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180 atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240 tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300 aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360 tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420 ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480 aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540 cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600 ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660 tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720 agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780 tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840 aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900 accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960 cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020 tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080 agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140 tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200 agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260 cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320 aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380 aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438 <210> 45 <211> 1438 <212> DNA <213> artificial <220> <223> Modified FIX intron <400> 45 ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60 gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120 acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180 atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240 tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300 aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360 tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420 ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480 aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540 cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600 ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660 tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720 agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780 tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840 aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900 accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960 cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020 tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080 agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140 tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200 agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260 cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320 aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380 aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438 <210> 46 <211> 881 <212> DNA <213> artificial <220> <223> Chicken beta-globin intron <400> 46 gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60 gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120 tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180 aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420 gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480 cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540 tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600 ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660 cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720 gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780 cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840 gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881 <210> 47 <211> 881 <212> DNA <213> artificial <220> <223> modified chicken-beta globin intron <400> 47 gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60 gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120 tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180 aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240 cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300 ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360 gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420 gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480 cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540 tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600 ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660 cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720 gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780 cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840 gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881 <210> 48 <211> 1518 <212> PRT <213> artificial <220> <223> D1a + D2,3 hGDE <400> 48 Met Glu Lys Leu Glu Lys Thr Leu Phe Arg Leu Glu Gln Gly Tyr Glu 1 5 10 15 Leu Gln Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr Val 20 25 30 Tyr Thr Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys Phe 35 40 45 Arg Ser Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser Asp 50 55 60 Lys Tyr Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr 65 70 75 80 Phe Leu Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp 85 90 95 Pro Ile Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys 100 105 110 Val Thr Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu 115 120 125 Trp Glu Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile 130 135 140 His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser 145 150 155 160 Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg 165 170 175 Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys 180 185 190 Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala 195 200 205 Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu 210 215 220 Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu 225 230 235 240 Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly 245 250 255 Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys 260 265 270 Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe 275 280 285 Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr 290 295 300 Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr 305 310 315 320 Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met 325 330 335 Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala 340 345 350 Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn 355 360 365 Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn 370 375 380 Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro 385 390 395 400 Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe 405 410 415 Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile 420 425 430 His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val 435 440 445 Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val 450 455 460 Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg 465 470 475 480 Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys 485 490 495 Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp 500 505 510 Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala 515 520 525 Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr 530 535 540 Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser 545 550 555 560 Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly 565 570 575 Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln 580 585 590 Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met 595 600 605 Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr 610 615 620 Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser 625 630 635 640 Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val 645 650 655 Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro 660 665 670 Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg 675 680 685 Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile 690 695 700 Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg 705 710 715 720 His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala 725 730 735 Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met 740 745 750 Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile 755 760 765 Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly 770 775 780 Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu 785 790 795 800 Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu 805 810 815 Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile 820 825 830 Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile 835 840 845 Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser 850 855 860 Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser 865 870 875 880 Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg 885 890 895 Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro 900 905 910 Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val 915 920 925 Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn 930 935 940 Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu 945 950 955 960 Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala 965 970 975 Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr 980 985 990 Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala 995 1000 1005 Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val 1010 1015 1020 Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys 1025 1030 1035 Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro 1040 1045 1050 Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val 1055 1060 1065 Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg 1070 1075 1080 Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu 1085 1090 1095 Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe 1100 1105 1110 Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu 1115 1120 1125 Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp 1130 1135 1140 Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu 1145 1150 1155 Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp 1160 1165 1170 Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu 1175 1180 1185 Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe 1190 1195 1200 Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp 1205 1210 1215 Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe 1220 1225 1230 Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys 1235 1240 1245 Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr 1250 1255 1260 Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser 1265 1270 1275 Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro 1280 1285 1290 Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val 1295 1300 1305 Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys 1310 1315 1320 Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His 1325 1330 1335 Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly 1340 1345 1350 Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr 1355 1360 1365 Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala 1370 1375 1380 Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu 1385 1390 1395 Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile 1400 1405 1410 Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly 1415 1420 1425 Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr 1430 1435 1440 Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu 1445 1450 1455 Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg 1460 1465 1470 His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu 1475 1480 1485 Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr 1490 1495 1500 Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1505 1510 1515 <210> 49 <211> 1503 <212> PRT <213> artificial <220> <223> D1b1 + D2,3 hGDE <400> 49 Met Leu Gln Phe Arg Leu Gly Pro Thr Leu Gln Gly Lys Ala Val Thr 1 5 10 15 Val Tyr Thr Asn Tyr Pro Phe Pro Gly Glu Thr Phe Asn Arg Glu Lys 20 25 30 Phe Arg Ser Leu Asp Trp Glu Asn Pro Thr Glu Arg Glu Asp Asp Ser 35 40 45 Asp Lys Tyr Cys Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr 50 55 60 Tyr Phe Leu Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val 65 70 75 80 Asp Pro Ile Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp 85 90 95 Cys Val Thr Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp 100 105 110 Glu Trp Glu Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met 115 120 125 Ile His Phe Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr 130 135 140 Ser Leu Ala Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn 145 150 155 160 Arg Lys Tyr Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys 165 170 175 Lys Glu Trp Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr 180 185 190 Ala Ala Asn Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn 195 200 205 Leu Val Asn Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala 210 215 220 Leu Trp Arg Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys 225 230 235 240 Gly Ile Pro Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg 245 250 255 Lys Ile Ile Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe 260 265 270 Phe Gln Val Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu 275 280 285 Thr Gln Glu Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu 290 295 300 Thr Ile Ile Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp 305 310 315 320 Met Asn Ile Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala 325 330 335 Ala Ile Glu Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu 340 345 350 Asn Ser Glu Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val 355 360 365 Asn Cys Leu Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly 370 375 380 Pro Lys Leu Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr 385 390 395 400 Phe Thr Phe Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met 405 410 415 Ile His Leu Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp 420 425 430 Val Met Gly Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu 435 440 445 Val Tyr Leu Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu 450 455 460 Arg Tyr Gly Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met 465 470 475 480 Lys Lys Tyr Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu 485 490 495 Asp Asn Cys His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp 500 505 510 Ala Ala Arg Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe 515 520 525 Thr Gly Ser Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile 530 535 540 Ser Ser Leu Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu 545 550 555 560 Gly Arg Leu Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val 565 570 575 Gln Pro Cys Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe 580 585 590 Met Asp Ile Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala 595 600 605 Tyr Asp Ala Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala 610 615 620 Ser Gly Ser Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser 625 630 635 640 Val Val Ser Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu 645 650 655 Pro Ser Asn Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala 660 665 670 Arg Cys Ala Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe 675 680 685 Ile Gln Val Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr 690 695 700 Arg His Ser Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr 705 710 715 720 Ala Phe Arg Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln 725 730 735 Met Cys Ile Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr 740 745 750 Ile Glu Arg Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn 755 760 765 Gly Thr Pro Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn 770 775 780 Glu Ser Lys Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn 785 790 795 800 Glu Tyr Ile Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val 805 810 815 Ile Ile Phe Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly 820 825 830 Ile Leu Arg Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly 835 840 845 Ser Leu Ala Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala 850 855 860 Ser Leu Ala Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr 865 870 875 880 Arg Cys Glu Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile 885 890 895 Pro Asn Trp Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser 900 905 910 Val Leu Ala Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys 915 920 925 Asn Asn Leu Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg 930 935 940 Leu Ile Ser Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln 945 950 955 960 Ala Met Phe Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys 965 970 975 Tyr Phe Asp Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr 980 985 990 Ala Trp Lys Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val 995 1000 1005 Lys His Leu Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys 1010 1015 1020 Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro 1025 1030 1035 Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu Gln Cys Cys Val 1040 1045 1050 Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly Ile Phe Arg 1055 1060 1065 Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile Leu Leu 1070 1075 1080 Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu Ala Phe 1085 1090 1095 Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu Gly Glu 1100 1105 1110 Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp Trp Trp 1115 1120 1125 Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn Gly Leu 1130 1135 1140 Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr Asp Asp 1145 1150 1155 Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu Phe Glu 1160 1165 1170 Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile Gln Phe 1175 1180 1185 Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met Lys Asp 1190 1195 1200 Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr Gly Phe 1205 1210 1215 Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met Asp Lys 1220 1225 1230 Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro Ala Thr 1235 1240 1245 Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser Lys Ser 1250 1255 1260 Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile Phe Pro 1265 1270 1275 Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile Lys Val 1280 1285 1290 Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe Glu Lys 1295 1300 1305 Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu Lys His 1310 1315 1320 Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser Tyr Gly 1325 1330 1335 Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn Phe Thr 1340 1345 1350 Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu Lys Ala 1355 1360 1365 Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly Pro Leu 1370 1375 1380 Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys Gly Ile 1385 1390 1395 Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala Lys Gly 1400 1405 1410 Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile Gly Tyr 1415 1420 1425 Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly Pro Glu 1430 1435 1440 Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu Ser Arg 1445 1450 1455 His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu Pro Glu 1460 1465 1470 Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys Glu Thr 1475 1480 1485 Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1490 1495 1500 <210> 50 <211> 1452 <212> PRT <213> artificial <220> <223> D1b2 + D2,3 hGDE <400> 50 Met Lys Leu Asn Leu Gln Gln Ser Gly Ser Phe Gln Tyr Tyr Phe Leu 1 5 10 15 Gln Gly Asn Glu Lys Ser Gly Gly Gly Tyr Ile Val Val Asp Pro Ile 20 25 30 Leu Arg Val Gly Ala Asp Asn His Val Leu Pro Leu Asp Cys Val Thr 35 40 45 Leu Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 50 55 60 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 65 70 75 80 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 85 90 95 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 100 105 110 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 115 120 125 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 130 135 140 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 145 150 155 160 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 165 170 175 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 180 185 190 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 195 200 205 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 210 215 220 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 225 230 235 240 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 245 250 255 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 260 265 270 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 275 280 285 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 290 295 300 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 305 310 315 320 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 325 330 335 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 340 345 350 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 355 360 365 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 370 375 380 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 385 390 395 400 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 405 410 415 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 420 425 430 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 435 440 445 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 450 455 460 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 465 470 475 480 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 485 490 495 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 500 505 510 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 515 520 525 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 530 535 540 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 545 550 555 560 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 565 570 575 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 580 585 590 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 595 600 605 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 610 615 620 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 625 630 635 640 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 645 650 655 Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg 660 665 670 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 675 680 685 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 690 695 700 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 705 710 715 720 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 725 730 735 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 740 745 750 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 755 760 765 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 770 775 780 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 785 790 795 800 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala 805 810 815 Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu 820 825 830 Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp 835 840 845 Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala 850 855 860 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 865 870 875 880 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 885 890 895 Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe 900 905 910 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 915 920 925 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys 930 935 940 Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu 945 950 955 960 Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu 965 970 975 Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu 980 985 990 Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu 995 1000 1005 Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr 1010 1015 1020 Phe Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val 1025 1030 1035 Glu Ala Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His 1040 1045 1050 Gly Leu Ile Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr 1055 1060 1065 Asn Cys Arg Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp 1070 1075 1080 Tyr Cys Lys Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro 1085 1090 1095 Val Ser Arg Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala 1100 1105 1110 Gly Thr Leu Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met 1115 1120 1125 Gln Lys His Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly 1130 1135 1140 Pro Gln Ile Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr 1145 1150 1155 Ala Gly Val Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg 1160 1165 1170 Phe Asn Cys Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg 1175 1180 1185 Ala Arg Asn Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala 1190 1195 1200 Val Glu Ile Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu 1205 1210 1215 Glu Leu Ser Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val 1220 1225 1230 Lys Arg His Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn 1235 1240 1245 Arg Lys Ile Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu 1250 1255 1260 Asp Pro Ser Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys 1265 1270 1275 Arg Gly Ile Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys 1280 1285 1290 Asp Tyr Gln Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala 1295 1300 1305 Pro Glu Leu Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile 1310 1315 1320 Ala Glu Lys Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp 1325 1330 1335 Pro Asp Asp Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp 1340 1345 1350 Asn Asp Asn Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly 1355 1360 1365 Pro Glu Trp Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu 1370 1375 1380 Tyr Phe Ser Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile 1385 1390 1395 Val Leu Val Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu 1400 1405 1410 Arg Ser Pro Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala 1415 1420 1425 Gln Tyr Cys Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala 1430 1435 1440 Thr Ile Leu Glu Thr Leu Tyr Asp Leu 1445 1450 <210> 51 <211> 1430 <212> PRT <213> artificial <220> <223> D1b3 + D2,3 hGDE <400> 51 Met Gly Gly Tyr Ile Val Val Asp Pro Ile Leu Arg Val Gly Ala Asp 1 5 10 15 Asn His Val Leu Pro Leu Asp Cys Val Thr Leu Gln Thr Phe Leu Ala 20 25 30 Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu Ser Arg Leu Arg Val Ala 35 40 45 Lys Glu Ser Gly Tyr Asn Met Ile His Phe Thr Pro Leu Gln Thr Leu 50 55 60 Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala Asn Gln Leu Glu Leu Asn 65 70 75 80 Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr Thr Trp Asn Asp Val Gly 85 90 95 Gln Leu Val Glu Lys Leu Lys Lys Glu Trp Asn Val Ile Cys Ile Thr 100 105 110 Asp Val Val Tyr Asn His Thr Ala Ala Asn Ser Lys Trp Ile Gln Glu 115 120 125 His Pro Glu Cys Ala Tyr Asn Leu Val Asn Ser Pro His Leu Lys Pro 130 135 140 Ala Trp Val Leu Asp Arg Ala Leu Trp Arg Phe Ser Cys Asp Val Ala 145 150 155 160 Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro Ala Leu Ile Glu Asn Asp 165 170 175 His His Met Asn Ser Ile Arg Lys Ile Ile Trp Glu Asp Ile Phe Pro 180 185 190 Lys Leu Lys Leu Trp Glu Phe Phe Gln Val Asp Val Asn Lys Ala Val 195 200 205 Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu Asn Arg Arg Val Thr Lys 210 215 220 Ser Asp Pro Asn Gln His Leu Thr Ile Ile Gln Asp Pro Glu Tyr Arg 225 230 235 240 Arg Phe Gly Cys Thr Val Asp Met Asn Ile Ala Leu Thr Thr Phe Ile 245 250 255 Pro His Asp Lys Gly Pro Ala Ala Ile Glu Glu Cys Cys Asn Trp Phe 260 265 270 His Lys Arg Met Glu Glu Leu Asn Ser Glu Lys His Arg Leu Ile Asn 275 280 285 Tyr His Gln Glu Gln Ala Val Asn Cys Leu Leu Gly Asn Val Phe Tyr 290 295 300 Glu Arg Leu Ala Gly His Gly Pro Lys Leu Gly Pro Val Thr Arg Lys 305 310 315 320 His Pro Leu Val Thr Arg Tyr Phe Thr Phe Pro Phe Glu Glu Ile Asp 325 330 335 Phe Ser Met Glu Glu Ser Met Ile His Leu Pro Asn Lys Ala Cys Phe 340 345 350 Leu Met Ala His Asn Gly Trp Val Met Gly Asp Asp Pro Leu Arg Asn 355 360 365 Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu Arg Arg Glu Leu Ile Cys 370 375 380 Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly Asn Lys Pro Glu Asp Cys 385 390 395 400 Pro Tyr Leu Trp Ala His Met Lys Lys Tyr Thr Glu Ile Thr Ala Thr 405 410 415 Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys His Ser Thr Pro Leu His 420 425 430 Val Ala Glu Tyr Met Leu Asp Ala Ala Arg Asn Leu Gln Pro Asn Leu 435 440 445 Tyr Val Val Ala Glu Leu Phe Thr Gly Ser Glu Asp Leu Asp Asn Val 450 455 460 Phe Val Thr Arg Leu Gly Ile Ser Ser Leu Ile Arg Glu Ala Met Ser 465 470 475 480 Ala Tyr Asn Ser His Glu Glu Gly Arg Leu Val Tyr Arg Tyr Gly Gly 485 490 495 Glu Pro Val Gly Ser Phe Val Gln Pro Cys Leu Arg Pro Leu Met Pro 500 505 510 Ala Ile Ala His Ala Leu Phe Met Asp Ile Thr His Asp Asn Glu Cys 515 520 525 Pro Ile Val His Arg Ser Ala Tyr Asp Ala Leu Pro Ser Thr Thr Ile 530 535 540 Val Ser Met Ala Cys Cys Ala Ser Gly Ser Thr Arg Gly Tyr Asp Glu 545 550 555 560 Leu Val Pro His Gln Ile Ser Val Val Ser Glu Glu Arg Phe Tyr Thr 565 570 575 Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn Thr Gly Glu Val Asn Phe 580 585 590 Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala Ile Ser Lys Leu His Gln 595 600 605 Glu Leu Gly Ala Lys Gly Phe Ile Gln Val Tyr Val Asp Gln Val Asp 610 615 620 Glu Asp Ile Val Ala Val Thr Arg His Ser Pro Ser Ile His Gln Ser 625 630 635 640 Val Val Ala Val Thr Arg Thr Ala Phe Arg Asn Pro Lys Thr Ser Phe 645 650 655 Tyr Ser Lys Glu Val Pro Gln Met Cys Ile Pro Gly Lys Ile Glu Glu 660 665 670 Val Val Leu Glu Ala Arg Thr Ile Glu Arg Asn Thr Lys Pro Tyr Arg 675 680 685 Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro Asp Ile Thr Val Glu Ile 690 695 700 Arg Glu His Ile Gln Leu Asn Glu Ser Lys Ile Val Lys Gln Ala Gly 705 710 715 720 Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile Gln Glu Ile Glu Phe Glu 725 730 735 Asn Leu Ser Pro Gly Ser Val Ile Ile Phe Arg Val Ser Leu Asp Pro 740 745 750 His Ala Gln Val Ala Val Gly Ile Leu Arg Asn His Leu Thr Gln Phe 755 760 765 Ser Pro His Phe Lys Ser Gly Ser Leu Ala Val Asp Asn Ala Asp Pro 770 775 780 Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala Tyr Arg Leu Thr Leu Ala 785 790 795 800 Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu Ser Glu Glu Lys Glu Asp 805 810 815 Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp Ser Ala Leu Lys Tyr Ala 820 825 830 Gly Leu Gln Gly Leu Met Ser Val Leu Ala Glu Ile Arg Pro Lys Asn 835 840 845 Asp Leu Gly His Pro Phe Cys Asn Asn Leu Arg Ser Gly Asp Trp Met 850 855 860 Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser Arg Ser Gly Thr Ile Ala 865 870 875 880 Glu Val Gly Lys Trp Leu Gln Ala Met Phe Phe Tyr Leu Lys Gln Ile 885 890 895 Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp Ala Ile Leu Ile Gly Ala 900 905 910 Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys Gln Met Ser Ser Phe Val 915 920 925 Gln Asn Gly Ser Thr Phe Val Lys His Leu Ser Leu Gly Ser Val Gln 930 935 940 Leu Cys Gly Val Gly Lys Phe Pro Ser Leu Pro Ile Leu Ser Pro Ala 945 950 955 960 Leu Met Asp Val Pro Tyr Arg Leu Asn Glu Ile Thr Lys Glu Lys Glu 965 970 975 Gln Cys Cys Val Ser Leu Ala Ala Gly Leu Pro His Phe Ser Ser Gly 980 985 990 Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe Ile Ala Leu Arg Gly Ile 995 1000 1005 Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala Arg Asn Ile Ile Leu 1010 1015 1020 Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile Pro Asn Leu Leu 1025 1030 1035 Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg Asp Ala Val Trp 1040 1045 1050 Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys Met Val Pro Asn 1055 1060 1065 Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg Met Tyr Pro Thr 1070 1075 1080 Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu Asp Gln Pro Leu 1085 1090 1095 Phe Glu Val Ile Gln Glu Ala Met Gln Lys His Met Gln Gly Ile 1100 1105 1110 Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile Asp Arg Asn Met 1115 1120 1125 Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val Asp Glu Glu Thr 1130 1135 1140 Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys Gly Thr Trp Met 1145 1150 1155 Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn Arg Gly Ile Pro 1160 1165 1170 Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile Val Gly Leu Ser 1175 1180 1185 Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser Lys Lys Asn Ile 1190 1195 1200 Phe Pro Tyr His Glu Val Thr Val Lys Arg His Gly Lys Ala Ile 1205 1210 1215 Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile Gln Asp Asn Phe 1220 1225 1230 Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser Asp Leu Asn Glu 1235 1240 1245 Lys His Pro Asn Leu Val His Lys Arg Gly Ile Tyr Lys Asp Ser 1250 1255 1260 Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln Leu Arg Pro Asn 1265 1270 1275 Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu Phe Thr Thr Glu 1280 1285 1290 Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys Lys Leu Leu Gly 1295 1300 1305 Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp Met Val Tyr Cys 1310 1315 1320 Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn Tyr Asn Leu Ala 1325 1330 1335 Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp Leu Trp Pro Ile 1340 1345 1350 Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser Arg Leu Met Gly 1355 1360 1365 Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val Lys Asn Val Leu 1370 1375 1380 Ser Arg His Tyr Val His Leu Glu Arg Ser Pro Trp Lys Gly Leu 1385 1390 1395 Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys Pro Phe Ser Cys 1400 1405 1410 Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu Glu Thr Leu Tyr 1415 1420 1425 Asp Leu 1430 <210> 52 <211> 1404 <212> PRT <213> artificial <220> <223> D1c + D2,3 hGDE <400> 52 Met Gln Thr Phe Leu Ala Lys Cys Leu Gly Pro Phe Asp Glu Trp Glu 1 5 10 15 Ser Arg Leu Arg Val Ala Lys Glu Ser Gly Tyr Asn Met Ile His Phe 20 25 30 Thr Pro Leu Gln Thr Leu Gly Leu Ser Arg Ser Cys Tyr Ser Leu Ala 35 40 45 Asn Gln Leu Glu Leu Asn Pro Asp Phe Ser Arg Pro Asn Arg Lys Tyr 50 55 60 Thr Trp Asn Asp Val Gly Gln Leu Val Glu Lys Leu Lys Lys Glu Trp 65 70 75 80 Asn Val Ile Cys Ile Thr Asp Val Val Tyr Asn His Thr Ala Ala Asn 85 90 95 Ser Lys Trp Ile Gln Glu His Pro Glu Cys Ala Tyr Asn Leu Val Asn 100 105 110 Ser Pro His Leu Lys Pro Ala Trp Val Leu Asp Arg Ala Leu Trp Arg 115 120 125 Phe Ser Cys Asp Val Ala Glu Gly Lys Tyr Lys Glu Lys Gly Ile Pro 130 135 140 Ala Leu Ile Glu Asn Asp His His Met Asn Ser Ile Arg Lys Ile Ile 145 150 155 160 Trp Glu Asp Ile Phe Pro Lys Leu Lys Leu Trp Glu Phe Phe Gln Val 165 170 175 Asp Val Asn Lys Ala Val Glu Gln Phe Arg Arg Leu Leu Thr Gln Glu 180 185 190 Asn Arg Arg Val Thr Lys Ser Asp Pro Asn Gln His Leu Thr Ile Ile 195 200 205 Gln Asp Pro Glu Tyr Arg Arg Phe Gly Cys Thr Val Asp Met Asn Ile 210 215 220 Ala Leu Thr Thr Phe Ile Pro His Asp Lys Gly Pro Ala Ala Ile Glu 225 230 235 240 Glu Cys Cys Asn Trp Phe His Lys Arg Met Glu Glu Leu Asn Ser Glu 245 250 255 Lys His Arg Leu Ile Asn Tyr His Gln Glu Gln Ala Val Asn Cys Leu 260 265 270 Leu Gly Asn Val Phe Tyr Glu Arg Leu Ala Gly His Gly Pro Lys Leu 275 280 285 Gly Pro Val Thr Arg Lys His Pro Leu Val Thr Arg Tyr Phe Thr Phe 290 295 300 Pro Phe Glu Glu Ile Asp Phe Ser Met Glu Glu Ser Met Ile His Leu 305 310 315 320 Pro Asn Lys Ala Cys Phe Leu Met Ala His Asn Gly Trp Val Met Gly 325 330 335 Asp Asp Pro Leu Arg Asn Phe Ala Glu Pro Gly Ser Glu Val Tyr Leu 340 345 350 Arg Arg Glu Leu Ile Cys Trp Gly Asp Ser Val Lys Leu Arg Tyr Gly 355 360 365 Asn Lys Pro Glu Asp Cys Pro Tyr Leu Trp Ala His Met Lys Lys Tyr 370 375 380 Thr Glu Ile Thr Ala Thr Tyr Phe Gln Gly Val Arg Leu Asp Asn Cys 385 390 395 400 His Ser Thr Pro Leu His Val Ala Glu Tyr Met Leu Asp Ala Ala Arg 405 410 415 Asn Leu Gln Pro Asn Leu Tyr Val Val Ala Glu Leu Phe Thr Gly Ser 420 425 430 Glu Asp Leu Asp Asn Val Phe Val Thr Arg Leu Gly Ile Ser Ser Leu 435 440 445 Ile Arg Glu Ala Met Ser Ala Tyr Asn Ser His Glu Glu Gly Arg Leu 450 455 460 Val Tyr Arg Tyr Gly Gly Glu Pro Val Gly Ser Phe Val Gln Pro Cys 465 470 475 480 Leu Arg Pro Leu Met Pro Ala Ile Ala His Ala Leu Phe Met Asp Ile 485 490 495 Thr His Asp Asn Glu Cys Pro Ile Val His Arg Ser Ala Tyr Asp Ala 500 505 510 Leu Pro Ser Thr Thr Ile Val Ser Met Ala Cys Cys Ala Ser Gly Ser 515 520 525 Thr Arg Gly Tyr Asp Glu Leu Val Pro His Gln Ile Ser Val Val Ser 530 535 540 Glu Glu Arg Phe Tyr Thr Lys Trp Asn Pro Glu Ala Leu Pro Ser Asn 545 550 555 560 Thr Gly Glu Val Asn Phe Gln Ser Gly Ile Ile Ala Ala Arg Cys Ala 565 570 575 Ile Ser Lys Leu His Gln Glu Leu Gly Ala Lys Gly Phe Ile Gln Val 580 585 590 Tyr Val Asp Gln Val Asp Glu Asp Ile Val Ala Val Thr Arg His Ser 595 600 605 Pro Ser Ile His Gln Ser Val Val Ala Val Thr Arg Thr Ala Phe Arg 610 615 620 Asn Pro Lys Thr Ser Phe Tyr Ser Lys Glu Val Pro Gln Met Cys Ile 625 630 635 640 Pro Gly Lys Ile Glu Glu Val Val Leu Glu Ala Arg Thr Ile Glu Arg 645 650 655 Asn Thr Lys Pro Tyr Arg Lys Asp Glu Asn Ser Ile Asn Gly Thr Pro 660 665 670 Asp Ile Thr Val Glu Ile Arg Glu His Ile Gln Leu Asn Glu Ser Lys 675 680 685 Ile Val Lys Gln Ala Gly Val Ala Thr Lys Gly Pro Asn Glu Tyr Ile 690 695 700 Gln Glu Ile Glu Phe Glu Asn Leu Ser Pro Gly Ser Val Ile Ile Phe 705 710 715 720 Arg Val Ser Leu Asp Pro His Ala Gln Val Ala Val Gly Ile Leu Arg 725 730 735 Asn His Leu Thr Gln Phe Ser Pro His Phe Lys Ser Gly Ser Leu Ala 740 745 750 Val Asp Asn Ala Asp Pro Ile Leu Lys Ile Pro Phe Ala Ser Leu Ala 755 760 765 Tyr Arg Leu Thr Leu Ala Glu Leu Asn Gln Ile Leu Tyr Arg Cys Glu 770 775 780 Ser Glu Glu Lys Glu Asp Gly Gly Gly Cys Tyr Asp Ile Pro Asn Trp 785 790 795 800 Ser Ala Leu Lys Tyr Ala Gly Leu Gln Gly Leu Met Ser Val Leu Ala 805 810 815 Glu Ile Arg Pro Lys Asn Asp Leu Gly His Pro Phe Cys Asn Asn Leu 820 825 830 Arg Ser Gly Asp Trp Met Ile Asp Tyr Val Ser Asn Arg Leu Ile Ser 835 840 845 Arg Ser Gly Thr Ile Ala Glu Val Gly Lys Trp Leu Gln Ala Met Phe 850 855 860 Phe Tyr Leu Lys Gln Ile Pro Arg Tyr Leu Ile Pro Cys Tyr Phe Asp 865 870 875 880 Ala Ile Leu Ile Gly Ala Tyr Thr Thr Leu Leu Asp Thr Ala Trp Lys 885 890 895 Gln Met Ser Ser Phe Val Gln Asn Gly Ser Thr Phe Val Lys His Leu 900 905 910 Ser Leu Gly Ser Val Gln Leu Cys Gly Val Gly Lys Phe Pro Ser Leu 915 920 925 Pro Ile Leu Ser Pro Ala Leu Met Asp Val Pro Tyr Arg Leu Asn Glu 930 935 940 Ile Thr Lys Glu Lys Glu Gln Cys Cys Val Ser Leu Ala Ala Gly Leu 945 950 955 960 Pro His Phe Ser Ser Gly Ile Phe Arg Cys Trp Gly Arg Asp Thr Phe 965 970 975 Ile Ala Leu Arg Gly Ile Leu Leu Ile Thr Gly Arg Tyr Val Glu Ala 980 985 990 Arg Asn Ile Ile Leu Ala Phe Ala Gly Thr Leu Arg His Gly Leu Ile 995 1000 1005 Pro Asn Leu Leu Gly Glu Gly Ile Tyr Ala Arg Tyr Asn Cys Arg 1010 1015 1020 Asp Ala Val Trp Trp Trp Leu Gln Cys Ile Gln Asp Tyr Cys Lys 1025 1030 1035 Met Val Pro Asn Gly Leu Asp Ile Leu Lys Cys Pro Val Ser Arg 1040 1045 1050 Met Tyr Pro Thr Asp Asp Ser Ala Pro Leu Pro Ala Gly Thr Leu 1055 1060 1065 Asp Gln Pro Leu Phe Glu Val Ile Gln Glu Ala Met Gln Lys His 1070 1075 1080 Met Gln Gly Ile Gln Phe Arg Glu Arg Asn Ala Gly Pro Gln Ile 1085 1090 1095 Asp Arg Asn Met Lys Asp Glu Gly Phe Asn Ile Thr Ala Gly Val 1100 1105 1110 Asp Glu Glu Thr Gly Phe Val Tyr Gly Gly Asn Arg Phe Asn Cys 1115 1120 1125 Gly Thr Trp Met Asp Lys Met Gly Glu Ser Asp Arg Ala Arg Asn 1130 1135 1140 Arg Gly Ile Pro Ala Thr Pro Arg Asp Gly Ser Ala Val Glu Ile 1145 1150 1155 Val Gly Leu Ser Lys Ser Ala Val Arg Trp Leu Leu Glu Leu Ser 1160 1165 1170 Lys Lys Asn Ile Phe Pro Tyr His Glu Val Thr Val Lys Arg His 1175 1180 1185 Gly Lys Ala Ile Lys Val Ser Tyr Asp Glu Trp Asn Arg Lys Ile 1190 1195 1200 Gln Asp Asn Phe Glu Lys Leu Phe His Val Ser Glu Asp Pro Ser 1205 1210 1215 Asp Leu Asn Glu Lys His Pro Asn Leu Val His Lys Arg Gly Ile 1220 1225 1230 Tyr Lys Asp Ser Tyr Gly Ala Ser Ser Pro Trp Cys Asp Tyr Gln 1235 1240 1245 Leu Arg Pro Asn Phe Thr Ile Ala Met Val Val Ala Pro Glu Leu 1250 1255 1260 Phe Thr Thr Glu Lys Ala Trp Lys Ala Leu Glu Ile Ala Glu Lys 1265 1270 1275 Lys Leu Leu Gly Pro Leu Gly Met Lys Thr Leu Asp Pro Asp Asp 1280 1285 1290 Met Val Tyr Cys Gly Ile Tyr Asp Asn Ala Leu Asp Asn Asp Asn 1295 1300 1305 Tyr Asn Leu Ala Lys Gly Phe Asn Tyr His Gln Gly Pro Glu Trp 1310 1315 1320 Leu Trp Pro Ile Gly Tyr Phe Leu Arg Ala Lys Leu Tyr Phe Ser 1325 1330 1335 Arg Leu Met Gly Pro Glu Thr Thr Ala Lys Thr Ile Val Leu Val 1340 1345 1350 Lys Asn Val Leu Ser Arg His Tyr Val His Leu Glu Arg Ser Pro 1355 1360 1365 Trp Lys Gly Leu Pro Glu Leu Thr Asn Glu Asn Ala Gln Tyr Cys 1370 1375 1380 Pro Phe Ser Cys Glu Thr Gln Ala Trp Ser Ile Ala Thr Ile Leu 1385 1390 1395 Glu Thr Leu Tyr Asp Leu 1400 <210> 53 <211> 4557 <212> DNA <213> artificial <220> <223> D1a + D2,3 hGDE <400> 53 atggaaaagc tggaaaagac cctgttccgg ctcgagcagg gctacgagct gcagtttaga 60 ctgggcccta cactgcaggg caaagccgtg accgtgtaca caaactaccc cttccctggc 120 gaaaccttca accgcgagaa gttcagaagc ctggactggg agaaccccac cgagagagag 180 gacgacagcg acaagtactg caagctgaac ctgcagcaga gcggctcctt ccagtactac 240 ttcctgcaag gcaacgagaa gtccggcgga ggctacatcg tggtggaccc tattctgaga 300 gtgggcgccg acaatcacgt gctgcctctg gattgtgtga ccctgcagac cttcctggcc 360 aagtgtctgg gccctttcga tgagtgggag agcagactgc gcgtggccaa agaaagcggc 420 tacaacatga tccacttcac ccctctgcag accctgggcc tgagcagaag ctgttacagc 480 ctggccaacc agctggaact gaaccccgac ttcagcagac ccaaccggaa gtacacctgg 540 aacgatgtgg gccagctggt ggaaaaactg aagaaagaat ggaacgtgat ctgcatcacc 600 gacgtggtgt acaaccacac cgccgccaac agcaagtgga tccaagagca ccctgagtgc 660 gcctacaacc tggtcaacag ccctcacctg aaacctgcct gggtgctcga tagagccctg 720 tggcggttta gctgtgatgt ggccgagggc aagtacaaag agaagggcat ccccgctctg 780 atcgagaacg accaccacat gaacagcatc cggaagatca tctgggaaga tattttcccc 840 aagctgaagc tgtgggagtt cttccaggtg gacgtgaaca aggccgtgga acagttcaga 900 cggctgctga cccaagagaa cagaagagtg accaagagcg accccaacca gcacctgacc 960 atcattcagg accccgagta tcggagattc ggctgcaccg tggacatgaa tatcgccctg 1020 accaccttca ttccccacga caaaggacct gccgccatcg aggaatgctg caactggttc 1080 cacaagcgga tggaagaatt gaacagcgag aagcaccggc tgatcaacta ccaccaagag 1140 caggccgtga actgcctgct gggcaacgtg ttctatgaga gactggccgg acacggccct 1200 aagctgggac ctgtgacaag aaagcaccct ctggttaccc ggtacttcac ctttccattc 1260 gaagagatcg acttctccat ggaagagagc atgatccatc tgcctaacaa ggcctgcttc 1320 ctgatggctc acaacggctg ggttatgggc gacgaccctc tgagaaattt cgccgagcct 1380 ggcagcgagg tgtacctgag aagagaactg atctgttggg gcgacagcgt gaagctgaga 1440 tacggcaaca agcccgagga ctgcccttac ctgtgggccc atatgaagaa gtacacagag 1500 atcaccgcca cctactttca gggcgtcaga ctggacaact gccacagcac acctctgcac 1560 gtggccgagt acatgctgga cgccgctaga aatctgcagc ccaacctgta tgtggtggcc 1620 gagctgttta ccggctccga ggacctggac aatgtgttcg tgaccagact gggcatcagc 1680 agcctgatca gagaagccat gtccgcctac aatagccacg aagagggcag actggtgtac 1740 agatatggcg gcgagcctgt gggcagcttc gttcagcctt gtctgaggcc tctgatgccc 1800 gccattgctc acgccctgtt catggacatc acccacgata acgagtgccc catcgtgcac 1860 agaagcgcct acgacgctct gcctagcacc accattgtgt ccatggcctg ttgtgccagc 1920 ggcagcacaa gaggctatga cgaactggtg ccccaccaga tttccgtggt gtccgaggaa 1980 cggttctaca ccaagtggaa ccccgaggct ctgcccagca ataccggcga agtgaatttc 2040 cagagcggca tcattgccgc cagatgcgcc atcagcaagc tgcaccaaga actgggcgcc 2100 aagggcttca ttcaggtgta cgtggaccag gtcgacgagg acattgtggc cgtgacaaga 2160 cacagcccca gcatccatca gagcgtggtg gctgtgacca gaaccgcctt cagaaacccc 2220 aagaccagct tctacagcaa agaggtgccc cagatgtgca tccccggcaa gattgaggaa 2280 gtggtgctcg aggcccggac catcgagaga aacaccaagc cttaccggaa ggacgagaac 2340 tccatcaacg gcacccctga catcaccgtg gaaatcagag agcacatcca gctcaacgag 2400 agcaagatcg tgaaacaggc cggcgtggcc acaaagggcc ccaacgagta tatccaagag 2460 attgagttcg agaatctgag ccccggcagc gtgatcatct tcagagtgtc cctggatcct 2520 cacgctcagg tggccgtggg catcctgaga aatcacctga cacagttcag cccacacttc 2580 aagagcggaa gcctggccgt ggacaacgcc gatcctatcc tgaagatccc cttcgcctct 2640 ctggcctaca gactgacact ggctgagctg aaccagatcc tgtacagatg cgagtccgaa 2700 gagaaagagg atggcggagg ctgctacgac atccccaatt ggagcgccct gaagtatgcc 2760 ggactgcagg gactgatgtc tgtgctggcc gagatcagac ccaagaacga cctgggacac 2820 cccttctgca acaacctgag atccggcgac tggatgatcg actacgtgtc caacagactg 2880 atcagcagat ccggcacaat cgccgaagtc ggcaaatggc tgcaggccat gttcttctac 2940 ctgaagcaga tccctcggta tctgatcccc tgctacttcg acgccatcct gatcggcgcc 3000 tacaccacac tgctggatac cgcctggaag cagatgtcca gcttcgtgca gaacggcagc 3060 accttcgtga agcacctgtc tctgggaagc gtgcagctgt gtggcgtggg caaatttccc 3120 agcctgccta tcctgtctcc tgcactgatg gacgtgccct accggctgaa tgagatcacc 3180 aaagaaaaag agcagtgctg cgtcagcctg gctgctggcc tgcctcattt ttccagcggc 3240 atcttccggt gttggggcag agacaccttt attgccctga gaggcatcct gctgattacc 3300 ggcagatacg tggaagcccg gaacatcatc ctggcctttg ccggcacact gcggcacgga 3360 ctgattccta atctgctcgg cgagggcatc tacgccagat acaactgcag agatgccgtg 3420 tggtggtggc tccagtgcat ccaggactac tgcaagatgg tgcccaacgg cctggacatc 3480 ctgaagtgcc ctgtgtccag aatgtaccct accgacgata gcgcccctct gcctgccgga 3540 acacttgacc agcctctgtt cgaagtgatt caagaggcca tgcagaaaca catgcaggga 3600 atccagtttc gcgagcggaa tgccggacct cagatcgaca gaaacatgaa ggatgagggc 3660 ttcaacatca ccgctggcgt ggacgaagag acaggctttg tgtacggcgg caaccggttc 3720 aattgcggca cctggatgga caagatgggc gagtctgacc gggccagaaa cagaggaatt 3780 cccgccacac ctagagatgg cagcgctgtg gaaatcgtgg gcctgtctaa gtctgctgtg 3840 cggtggctgc tcgaactgag caagaagaat atctttccgt accacgaagt gaccgtgaag 3900 cggcacggca aggccatcaa ggtgtcctac gacgagtgga acagaaagat ccaggacaac 3960 ttcgaaaagc tgttccatgt gtctgaggac cccagcgacc tgaacgaaaa gcaccccaac 4020 ctggtgcaca agcgcggcat ctacaaggac agctacggcg cctcttctcc ttggtgcgat 4080 taccagctgc ggcccaactt caccattgcc atggtggttg cccctgagct gttcaccaca 4140 gagaaggcct ggaaggccct ggaaatcgcc gagaagaaac tgctgggccc tctgggcatg 4200 aagacactgg accccgacga catggtgtac tgcggaatct acgacaacgc cctggataac 4260 gacaactaca atctggccaa ggggttcaat taccatcagg gacccgagtg gctgtggcct 4320 atcggctatt tcctgcgggc caagctgtac ttctccagac tgatgggccc tgagacaacc 4380 gccaagacaa tcgtgctcgt gaagaacgtg ctgagccggc actatgtgca cctggaaaga 4440 agcccctgga agggactgcc cgagctgacc aatgagaacg cccagtactg ccccttcagc 4500 tgcgaaacac aggcctggtc tatcgccacc atcctggaaa ccctgtacga cctgtga 4557 <210> 54 <211> 4512 <212> DNA <213> artificial <220> <223> D1b1 + D2,3 hGDE <400> 54 atgctgcagt ttagactggg ccctacactg cagggcaaag ccgtgaccgt gtacacaaac 60 taccccttcc ctggcgaaac cttcaaccgc gagaagttca gaagcctgga ctgggagaac 120 cccaccgaga gagaggacga cagcgacaag tactgcaagc tgaacctgca gcagagcggc 180 tccttccagt actacttcct gcaaggcaac gagaagtccg gcggaggcta catcgtggtg 240 gaccctattc tgagagtggg cgccgacaat cacgtgctgc ctctggattg tgtgaccctg 300 cagaccttcc tggccaagtg tctgggccct ttcgatgagt gggagagcag actgcgcgtg 360 gccaaagaaa gcggctacaa catgatccac ttcacccctc tgcagaccct gggcctgagc 420 agaagctgtt acagcctggc caaccagctg gaactgaacc ccgacttcag cagacccaac 480 cggaagtaca cctggaacga tgtgggccag ctggtggaaa aactgaagaa agaatggaac 540 gtgatctgca tcaccgacgt ggtgtacaac cacaccgccg ccaacagcaa gtggatccaa 600 gagcaccctg agtgcgccta caacctggtc aacagccctc acctgaaacc tgcctgggtg 660 ctcgatagag ccctgtggcg gtttagctgt gatgtggccg agggcaagta caaagagaag 720 ggcatccccg ctctgatcga gaacgaccac cacatgaaca gcatccggaa gatcatctgg 780 gaagatattt tccccaagct gaagctgtgg gagttcttcc aggtggacgt gaacaaggcc 840 gtggaacagt tcagacggct gctgacccaa gagaacagaa gagtgaccaa gagcgacccc 900 aaccagcacc tgaccatcat tcaggacccc gagtatcgga gattcggctg caccgtggac 960 atgaatatcg ccctgaccac cttcattccc cacgacaaag gacctgccgc catcgaggaa 1020 tgctgcaact ggttccacaa gcggatggaa gaattgaaca gcgagaagca ccggctgatc 1080 aactaccacc aagagcaggc cgtgaactgc ctgctgggca acgtgttcta tgagagactg 1140 gccggacacg gccctaagct gggacctgtg acaagaaagc accctctggt tacccggtac 1200 ttcacctttc cattcgaaga gatcgacttc tccatggaag agagcatgat ccatctgcct 1260 aacaaggcct gcttcctgat ggctcacaac ggctgggtta tgggcgacga ccctctgaga 1320 aatttcgccg agcctggcag cgaggtgtac ctgagaagag aactgatctg ttggggcgac 1380 agcgtgaagc tgagatacgg caacaagccc gaggactgcc cttacctgtg ggcccatatg 1440 aagaagtaca cagagatcac cgccacctac tttcagggcg tcagactgga caactgccac 1500 agcacacctc tgcacgtggc cgagtacatg ctggacgccg ctagaaatct gcagcccaac 1560 ctgtatgtgg tggccgagct gtttaccggc tccgaggacc tggacaatgt gttcgtgacc 1620 agactgggca tcagcagcct gatcagagaa gccatgtccg cctacaatag ccacgaagag 1680 ggcagactgg tgtacagata tggcggcgag cctgtgggca gcttcgttca gccttgtctg 1740 aggcctctga tgcccgccat tgctcacgcc ctgttcatgg acatcaccca cgataacgag 1800 tgccccatcg tgcacagaag cgcctacgac gctctgccta gcaccaccat tgtgtccatg 1860 gcctgttgtg ccagcggcag cacaagaggc tatgacgaac tggtgcccca ccagatttcc 1920 gtggtgtccg aggaacggtt ctacaccaag tggaaccccg aggctctgcc cagcaatacc 1980 ggcgaagtga atttccagag cggcatcatt gccgccagat gcgccatcag caagctgcac 2040 caagaactgg gcgccaaggg cttcattcag gtgtacgtgg accaggtcga cgaggacatt 2100 gtggccgtga caagacacag ccccagcatc catcagagcg tggtggctgt gaccagaacc 2160 gccttcagaa accccaagac cagcttctac agcaaagagg tgccccagat gtgcatcccc 2220 ggcaagattg aggaagtggt gctcgaggcc cggaccatcg agagaaacac caagccttac 2280 cggaaggacg agaactccat caacggcacc cctgacatca ccgtggaaat cagagagcac 2340 atccagctca acgagagcaa gatcgtgaaa caggccggcg tggccacaaa gggccccaac 2400 gagtatatcc aagagattga gttcgagaat ctgagccccg gcagcgtgat catcttcaga 2460 gtgtccctgg atcctcacgc tcaggtggcc gtgggcatcc tgagaaatca cctgacacag 2520 ttcagcccac acttcaagag cggaagcctg gccgtggaca acgccgatcc tatcctgaag 2580 atccccttcg cctctctggc ctacagactg acactggctg agctgaacca gatcctgtac 2640 agatgcgagt ccgaagagaa agaggatggc ggaggctgct acgacatccc caattggagc 2700 gccctgaagt atgccggact gcagggactg atgtctgtgc tggccgagat cagacccaag 2760 aacgacctgg gacacccctt ctgcaacaac ctgagatccg gcgactggat gatcgactac 2820 gtgtccaaca gactgatcag cagatccggc acaatcgccg aagtcggcaa atggctgcag 2880 gccatgttct tctacctgaa gcagatccct cggtatctga tcccctgcta cttcgacgcc 2940 atcctgatcg gcgcctacac cacactgctg gataccgcct ggaagcagat gtccagcttc 3000 gtgcagaacg gcagcacctt cgtgaagcac ctgtctctgg gaagcgtgca gctgtgtggc 3060 gtgggcaaat ttcccagcct gcctatcctg tctcctgcac tgatggacgt gccctaccgg 3120 ctgaatgaga tcaccaaaga aaaagagcag tgctgcgtca gcctggctgc tggcctgcct 3180 catttttcca gcggcatctt ccggtgttgg ggcagagaca cctttattgc cctgagaggc 3240 atcctgctga ttaccggcag atacgtggaa gcccggaaca tcatcctggc ctttgccggc 3300 acactgcggc acggactgat tcctaatctg ctcggcgagg gcatctacgc cagatacaac 3360 tgcagagatg ccgtgtggtg gtggctccag tgcatccagg actactgcaa gatggtgccc 3420 aacggcctgg acatcctgaa gtgccctgtg tccagaatgt accctaccga cgatagcgcc 3480 cctctgcctg ccggaacact tgaccagcct ctgttcgaag tgattcaaga ggccatgcag 3540 aaacacatgc agggaatcca gtttcgcgag cggaatgccg gacctcagat cgacagaaac 3600 atgaaggatg agggcttcaa catcaccgct ggcgtggacg aagagacagg ctttgtgtac 3660 ggcggcaacc ggttcaattg cggcacctgg atggacaaga tgggcgagtc tgaccgggcc 3720 agaaacagag gaattcccgc cacacctaga gatggcagcg ctgtggaaat cgtgggcctg 3780 tctaagtctg ctgtgcggtg gctgctcgaa ctgagcaaga agaatatctt tccgtaccac 3840 gaagtgaccg tgaagcggca cggcaaggcc atcaaggtgt cctacgacga gtggaacaga 3900 aagatccagg acaacttcga aaagctgttc catgtgtctg aggaccccag cgacctgaac 3960 gaaaagcacc ccaacctggt gcacaagcgc ggcatctaca aggacagcta cggcgcctct 4020 tctccttggt gcgattacca gctgcggccc aacttcacca ttgccatggt ggttgcccct 4080 gagctgttca ccacagagaa ggcctggaag gccctggaaa tcgccgagaa gaaactgctg 4140 ggccctctgg gcatgaagac actggacccc gacgacatgg tgtactgcgg aatctacgac 4200 aacgccctgg ataacgacaa ctacaatctg gccaaggggt tcaattacca tcagggaccc 4260 gagtggctgt ggcctatcgg ctatttcctg cgggccaagc tgtacttctc cagactgatg 4320 ggccctgaga caaccgccaa gacaatcgtg ctcgtgaaga acgtgctgag ccggcactat 4380 gtgcacctgg aaagaagccc ctggaaggga ctgcccgagc tgaccaatga gaacgcccag 4440 tactgcccct tcagctgcga aacacaggcc tggtctatcg ccaccatcct ggaaaccctg 4500 tacgacctgt ga 4512 <210> 55 <211> 4359 <212> DNA <213> artificial <220> <223> D1b2 + D2,3 hGDE <400> 55 atgaagctga acctgcagca gagcggctcc ttccagtact acttcctgca aggcaacgag 60 aagtccggcg gaggctacat cgtggtggac cctattctga gagtgggcgc cgacaatcac 120 gtgctgcctc tggattgtgt gaccctgcag accttcctgg ccaagtgtct gggccctttc 180 gatgagtggg agagcagact gcgcgtggcc aaagaaagcg gctacaacat gatccacttc 240 acccctctgc agaccctggg cctgagcaga agctgttaca gcctggccaa ccagctggaa 300 ctgaaccccg acttcagcag acccaaccgg aagtacacct ggaacgatgt gggccagctg 360 gtggaaaaac tgaagaaaga atggaacgtg atctgcatca ccgacgtggt gtacaaccac 420 accgccgcca acagcaagtg gatccaagag caccctgagt gcgcctacaa cctggtcaac 480 agccctcacc tgaaacctgc ctgggtgctc gatagagccc tgtggcggtt tagctgtgat 540 gtggccgagg gcaagtacaa agagaagggc atccccgctc tgatcgagaa cgaccaccac 600 atgaacagca tccggaagat catctgggaa gatattttcc ccaagctgaa gctgtgggag 660 ttcttccagg tggacgtgaa caaggccgtg gaacagttca gacggctgct gacccaagag 720 aacagaagag tgaccaagag cgaccccaac cagcacctga ccatcattca ggaccccgag 780 tatcggagat tcggctgcac cgtggacatg aatatcgccc tgaccacctt cattccccac 840 gacaaaggac ctgccgccat cgaggaatgc tgcaactggt tccacaagcg gatggaagaa 900 ttgaacagcg agaagcaccg gctgatcaac taccaccaag agcaggccgt gaactgcctg 960 ctgggcaacg tgttctatga gagactggcc ggacacggcc ctaagctggg acctgtgaca 1020 agaaagcacc ctctggttac ccggtacttc acctttccat tcgaagagat cgacttctcc 1080 atggaagaga gcatgatcca tctgcctaac aaggcctgct tcctgatggc tcacaacggc 1140 tgggttatgg gcgacgaccc tctgagaaat ttcgccgagc ctggcagcga ggtgtacctg 1200 agaagagaac tgatctgttg gggcgacagc gtgaagctga gatacggcaa caagcccgag 1260 gactgccctt acctgtgggc ccatatgaag aagtacacag agatcaccgc cacctacttt 1320 cagggcgtca gactggacaa ctgccacagc acacctctgc acgtggccga gtacatgctg 1380 gacgccgcta gaaatctgca gcccaacctg tatgtggtgg ccgagctgtt taccggctcc 1440 gaggacctgg acaatgtgtt cgtgaccaga ctgggcatca gcagcctgat cagagaagcc 1500 atgtccgcct acaatagcca cgaagagggc agactggtgt acagatatgg cggcgagcct 1560 gtgggcagct tcgttcagcc ttgtctgagg cctctgatgc ccgccattgc tcacgccctg 1620 ttcatggaca tcacccacga taacgagtgc cccatcgtgc acagaagcgc ctacgacgct 1680 ctgcctagca ccaccattgt gtccatggcc tgttgtgcca gcggcagcac aagaggctat 1740 gacgaactgg tgccccacca gatttccgtg gtgtccgagg aacggttcta caccaagtgg 1800 aaccccgagg ctctgcccag caataccggc gaagtgaatt tccagagcgg catcattgcc 1860 gccagatgcg ccatcagcaa gctgcaccaa gaactgggcg ccaagggctt cattcaggtg 1920 tacgtggacc aggtcgacga ggacattgtg gccgtgacaa gacacagccc cagcatccat 1980 cagagcgtgg tggctgtgac cagaaccgcc ttcagaaacc ccaagaccag cttctacagc 2040 aaagaggtgc cccagatgtg catccccggc aagattgagg aagtggtgct cgaggcccgg 2100 accatcgaga gaaacaccaa gccttaccgg aaggacgaga actccatcaa cggcacccct 2160 gacatcaccg tggaaatcag agagcacatc cagctcaacg agagcaagat cgtgaaacag 2220 gccggcgtgg ccacaaaggg ccccaacgag tatatccaag agattgagtt cgagaatctg 2280 agccccggca gcgtgatcat cttcagagtg tccctggatc ctcacgctca ggtggccgtg 2340 ggcatcctga gaaatcacct gacacagttc agcccacact tcaagagcgg aagcctggcc 2400 gtggacaacg ccgatcctat cctgaagatc cccttcgcct ctctggccta cagactgaca 2460 ctggctgagc tgaaccagat cctgtacaga tgcgagtccg aagagaaaga ggatggcgga 2520 ggctgctacg acatccccaa ttggagcgcc ctgaagtatg ccggactgca gggactgatg 2580 tctgtgctgg ccgagatcag acccaagaac gacctgggac accccttctg caacaacctg 2640 agatccggcg actggatgat cgactacgtg tccaacagac tgatcagcag atccggcaca 2700 atcgccgaag tcggcaaatg gctgcaggcc atgttcttct acctgaagca gatccctcgg 2760 tatctgatcc cctgctactt cgacgccatc ctgatcggcg cctacaccac actgctggat 2820 accgcctgga agcagatgtc cagcttcgtg cagaacggca gcaccttcgt gaagcacctg 2880 tctctgggaa gcgtgcagct gtgtggcgtg ggcaaatttc ccagcctgcc tatcctgtct 2940 cctgcactga tggacgtgcc ctaccggctg aatgagatca ccaaagaaaa agagcagtgc 3000 tgcgtcagcc tggctgctgg cctgcctcat ttttccagcg gcatcttccg gtgttggggc 3060 agagacacct ttattgccct gagaggcatc ctgctgatta ccggcagata cgtggaagcc 3120 cggaacatca tcctggcctt tgccggcaca ctgcggcacg gactgattcc taatctgctc 3180 ggcgagggca tctacgccag atacaactgc agagatgccg tgtggtggtg gctccagtgc 3240 atccaggact actgcaagat ggtgcccaac ggcctggaca tcctgaagtg ccctgtgtcc 3300 agaatgtacc ctaccgacga tagcgcccct ctgcctgccg gaacacttga ccagcctctg 3360 ttcgaagtga ttcaagaggc catgcagaaa cacatgcagg gaatccagtt tcgcgagcgg 3420 aatgccggac ctcagatcga cagaaacatg aaggatgagg gcttcaacat caccgctggc 3480 gtggacgaag agacaggctt tgtgtacggc ggcaaccggt tcaattgcgg cacctggatg 3540 gacaagatgg gcgagtctga ccgggccaga aacagaggaa ttcccgccac acctagagat 3600 ggcagcgctg tggaaatcgt gggcctgtct aagtctgctg tgcggtggct gctcgaactg 3660 agcaagaaga atatctttcc gtaccacgaa gtgaccgtga agcggcacgg caaggccatc 3720 aaggtgtcct acgacgagtg gaacagaaag atccaggaca acttcgaaaa gctgttccat 3780 gtgtctgagg accccagcga cctgaacgaa aagcacccca acctggtgca caagcgcggc 3840 atctacaagg acagctacgg cgcctcttct ccttggtgcg attaccagct gcggcccaac 3900 ttcaccattg ccatggtggt tgcccctgag ctgttcacca cagagaaggc ctggaaggcc 3960 ctggaaatcg ccgagaagaa actgctgggc cctctgggca tgaagacact ggaccccgac 4020 gacatggtgt actgcggaat ctacgacaac gccctggata acgacaacta caatctggcc 4080 aaggggttca attaccatca gggacccgag tggctgtggc ctatcggcta tttcctgcgg 4140 gccaagctgt acttctccag actgatgggc cctgagacaa ccgccaagac aatcgtgctc 4200 gtgaagaacg tgctgagccg gcactatgtg cacctggaaa gaagcccctg gaagggactg 4260 cccgagctga ccaatgagaa cgcccagtac tgccccttca gctgcgaaac acaggcctgg 4320 tctatcgcca ccatcctgga aaccctgtac gacctgtga 4359 <210> 56 <211> 4293 <212> DNA <213> artificial <220> <223> D1b3 + D2,3 hGDE <400> 56 atgggaggct acatcgtggt ggaccctatt ctgagagtgg gcgccgacaa tcacgtgctg 60 cctctggatt gtgtgaccct gcagaccttc ctggccaagt gtctgggccc tttcgatgag 120 tgggagagca gactgcgcgt ggccaaagaa agcggctaca acatgatcca cttcacccct 180 ctgcagaccc tgggcctgag cagaagctgt tacagcctgg ccaaccagct ggaactgaac 240 cccgacttca gcagacccaa ccggaagtac acctggaacg atgtgggcca gctggtggaa 300 aaactgaaga aagaatggaa cgtgatctgc atcaccgacg tggtgtacaa ccacaccgcc 360 gccaacagca agtggatcca agagcaccct gagtgcgcct acaacctggt caacagccct 420 cacctgaaac ctgcctgggt gctcgataga gccctgtggc ggtttagctg tgatgtggcc 480 gagggcaagt acaaagagaa gggcatcccc gctctgatcg agaacgacca ccacatgaac 540 agcatccgga agatcatctg ggaagatatt ttccccaagc tgaagctgtg ggagttcttc 600 caggtggacg tgaacaaggc cgtggaacag ttcagacggc tgctgaccca agagaacaga 660 agagtgacca agagcgaccc caaccagcac ctgaccatca ttcaggaccc cgagtatcgg 720 agattcggct gcaccgtgga catgaatatc gccctgacca ccttcattcc ccacgacaaa 780 ggacctgccg ccatcgagga atgctgcaac tggttccaca agcggatgga agaattgaac 840 agcgagaagc accggctgat caactaccac caagagcagg ccgtgaactg cctgctgggc 900 aacgtgttct atgagagact ggccggacac ggccctaagc tgggacctgt gacaagaaag 960 caccctctgg ttacccggta cttcaccttt ccattcgaag agatcgactt ctccatggaa 1020 gagagcatga tccatctgcc taacaaggcc tgcttcctga tggctcacaa cggctgggtt 1080 atgggcgacg accctctgag aaatttcgcc gagcctggca gcgaggtgta cctgagaaga 1140 gaactgatct gttggggcga cagcgtgaag ctgagatacg gcaacaagcc cgaggactgc 1200 ccttacctgt gggcccatat gaagaagtac acagagatca ccgccaccta ctttcagggc 1260 gtcagactgg acaactgcca cagcacacct ctgcacgtgg ccgagtacat gctggacgcc 1320 gctagaaatc tgcagcccaa cctgtatgtg gtggccgagc tgtttaccgg ctccgaggac 1380 ctggacaatg tgttcgtgac cagactgggc atcagcagcc tgatcagaga agccatgtcc 1440 gcctacaata gccacgaaga gggcagactg gtgtacagat atggcggcga gcctgtgggc 1500 agcttcgttc agccttgtct gaggcctctg atgcccgcca ttgctcacgc cctgttcatg 1560 gacatcaccc acgataacga gtgccccatc gtgcacagaa gcgcctacga cgctctgcct 1620 agcaccacca ttgtgtccat ggcctgttgt gccagcggca gcacaagagg ctatgacgaa 1680 ctggtgcccc accagatttc cgtggtgtcc gaggaacggt tctacaccaa gtggaacccc 1740 gaggctctgc ccagcaatac cggcgaagtg aatttccaga gcggcatcat tgccgccaga 1800 tgcgccatca gcaagctgca ccaagaactg ggcgccaagg gcttcattca ggtgtacgtg 1860 gaccaggtcg acgaggacat tgtggccgtg acaagacaca gccccagcat ccatcagagc 1920 gtggtggctg tgaccagaac cgccttcaga aaccccaaga ccagcttcta cagcaaagag 1980 gtgccccaga tgtgcatccc cggcaagatt gaggaagtgg tgctcgaggc ccggaccatc 2040 gagagaaaca ccaagcctta ccggaaggac gagaactcca tcaacggcac ccctgacatc 2100 accgtggaaa tcagagagca catccagctc aacgagagca agatcgtgaa acaggccggc 2160 gtggccacaa agggccccaa cgagtatatc caagagattg agttcgagaa tctgagcccc 2220 ggcagcgtga tcatcttcag agtgtccctg gatcctcacg ctcaggtggc cgtgggcatc 2280 ctgagaaatc acctgacaca gttcagccca cacttcaaga gcggaagcct ggccgtggac 2340 aacgccgatc ctatcctgaa gatccccttc gcctctctgg cctacagact gacactggct 2400 gagctgaacc agatcctgta cagatgcgag tccgaagaga aagaggatgg cggaggctgc 2460 tacgacatcc ccaattggag cgccctgaag tatgccggac tgcagggact gatgtctgtg 2520 ctggccgaga tcagacccaa gaacgacctg ggacacccct tctgcaacaa cctgagatcc 2580 ggcgactgga tgatcgacta cgtgtccaac agactgatca gcagatccgg cacaatcgcc 2640 gaagtcggca aatggctgca ggccatgttc ttctacctga agcagatccc tcggtatctg 2700 atcccctgct acttcgacgc catcctgatc ggcgcctaca ccacactgct ggataccgcc 2760 tggaagcaga tgtccagctt cgtgcagaac ggcagcacct tcgtgaagca cctgtctctg 2820 ggaagcgtgc agctgtgtgg cgtgggcaaa tttcccagcc tgcctatcct gtctcctgca 2880 ctgatggacg tgccctaccg gctgaatgag atcaccaaag aaaaagagca gtgctgcgtc 2940 agcctggctg ctggcctgcc tcatttttcc agcggcatct tccggtgttg gggcagagac 3000 acctttattg ccctgagagg catcctgctg attaccggca gatacgtgga agcccggaac 3060 atcatcctgg cctttgccgg cacactgcgg cacggactga ttcctaatct gctcggcgag 3120 ggcatctacg ccagatacaa ctgcagagat gccgtgtggt ggtggctcca gtgcatccag 3180 gactactgca agatggtgcc caacggcctg gacatcctga agtgccctgt gtccagaatg 3240 taccctaccg acgatagcgc ccctctgcct gccggaacac ttgaccagcc tctgttcgaa 3300 gtgattcaag aggccatgca gaaacacatg cagggaatcc agtttcgcga gcggaatgcc 3360 ggacctcaga tcgacagaaa catgaaggat gagggcttca acatcaccgc tggcgtggac 3420 gaagagacag gctttgtgta cggcggcaac cggttcaatt gcggcacctg gatggacaag 3480 atgggcgagt ctgaccgggc cagaaacaga ggaattcccg ccacacctag agatggcagc 3540 gctgtggaaa tcgtgggcct gtctaagtct gctgtgcggt ggctgctcga actgagcaag 3600 aagaatatct ttccgtacca cgaagtgacc gtgaagcggc acggcaaggc catcaaggtg 3660 tcctacgacg agtggaacag aaagatccag gacaacttcg aaaagctgtt ccatgtgtct 3720 gaggacccca gcgacctgaa cgaaaagcac cccaacctgg tgcacaagcg cggcatctac 3780 aaggacagct acggcgcctc ttctccttgg tgcgattacc agctgcggcc caacttcacc 3840 attgccatgg tggttgcccc tgagctgttc accacagaga aggcctggaa ggccctggaa 3900 atcgccgaga agaaactgct gggccctctg ggcatgaaga cactggaccc cgacgacatg 3960 gtgtactgcg gaatctacga caacgccctg gataacgaca actacaatct ggccaagggg 4020 ttcaattacc atcagggacc cgagtggctg tggcctatcg gctatttcct gcgggccaag 4080 ctgtacttct ccagactgat gggccctgag acaaccgcca agacaatcgt gctcgtgaag 4140 aacgtgctga gccggcacta tgtgcacctg gaaagaagcc cctggaaggg actgcccgag 4200 ctgaccaatg agaacgccca gtactgcccc ttcagctgcg aaacacaggc ctggtctatc 4260 gccaccatcc tggaaaccct gtacgacctg tga 4293 <210> 57 <211> 4215 <212> DNA <213> artificial <220> <223> D1c + D2,3 hGDE <400> 57 atgcagacct tcctggccaa gtgtctgggc cctttcgatg agtgggagag cagactgcgc 60 gtggccaaag aaagcggcta caacatgatc cacttcaccc ctctgcagac cctgggcctg 120 agcagaagct gttacagcct ggccaaccag ctggaactga accccgactt cagcagaccc 180 aaccggaagt acacctggaa cgatgtgggc cagctggtgg aaaaactgaa gaaagaatgg 240 aacgtgatct gcatcaccga cgtggtgtac aaccacaccg ccgccaacag caagtggatc 300 caagagcacc ctgagtgcgc ctacaacctg gtcaacagcc ctcacctgaa acctgcctgg 360 gtgctcgata gagccctgtg gcggtttagc tgtgatgtgg ccgagggcaa gtacaaagag 420 aagggcatcc ccgctctgat cgagaacgac caccacatga acagcatccg gaagatcatc 480 tgggaagata ttttccccaa gctgaagctg tgggagttct tccaggtgga cgtgaacaag 540 gccgtggaac agttcagacg gctgctgacc caagagaaca gaagagtgac caagagcgac 600 cccaaccagc acctgaccat cattcaggac cccgagtatc ggagattcgg ctgcaccgtg 660 gacatgaata tcgccctgac caccttcatt ccccacgaca aaggacctgc cgccatcgag 720 gaatgctgca actggttcca caagcggatg gaagaattga acagcgagaa gcaccggctg 780 atcaactacc accaagagca ggccgtgaac tgcctgctgg gcaacgtgtt ctatgagaga 840 ctggccggac acggccctaa gctgggacct gtgacaagaa agcaccctct ggttacccgg 900 tacttcacct ttccattcga agagatcgac ttctccatgg aagagagcat gatccatctg 960 cctaacaagg cctgcttcct gatggctcac aacggctggg ttatgggcga cgaccctctg 1020 agaaatttcg ccgagcctgg cagcgaggtg tacctgagaa gagaactgat ctgttggggc 1080 gacagcgtga agctgagata cggcaacaag cccgaggact gcccttacct gtgggcccat 1140 atgaagaagt acacagagat caccgccacc tactttcagg gcgtcagact ggacaactgc 1200 cacagcacac ctctgcacgt ggccgagtac atgctggacg ccgctagaaa tctgcagccc 1260 aacctgtatg tggtggccga gctgtttacc ggctccgagg acctggacaa tgtgttcgtg 1320 accagactgg gcatcagcag cctgatcaga gaagccatgt ccgcctacaa tagccacgaa 1380 gagggcagac tggtgtacag atatggcggc gagcctgtgg gcagcttcgt tcagccttgt 1440 ctgaggcctc tgatgcccgc cattgctcac gccctgttca tggacatcac ccacgataac 1500 gagtgcccca tcgtgcacag aagcgcctac gacgctctgc ctagcaccac cattgtgtcc 1560 atggcctgtt gtgccagcgg cagcacaaga ggctatgacg aactggtgcc ccaccagatt 1620 tccgtggtgt ccgaggaacg gttctacacc aagtggaacc ccgaggctct gcccagcaat 1680 accggcgaag tgaatttcca gagcggcatc attgccgcca gatgcgccat cagcaagctg 1740 caccaagaac tgggcgccaa gggcttcatt caggtgtacg tggaccaggt cgacgaggac 1800 attgtggccg tgacaagaca cagccccagc atccatcaga gcgtggtggc tgtgaccaga 1860 accgccttca gaaaccccaa gaccagcttc tacagcaaag aggtgcccca gatgtgcatc 1920 cccggcaaga ttgaggaagt ggtgctcgag gcccggacca tcgagagaaa caccaagcct 1980 taccggaagg acgagaactc catcaacggc acccctgaca tcaccgtgga aatcagagag 2040 cacatccagc tcaacgagag caagatcgtg aaacaggccg gcgtggccac aaagggcccc 2100 aacgagtata tccaagagat tgagttcgag aatctgagcc ccggcagcgt gatcatcttc 2160 agagtgtccc tggatcctca cgctcaggtg gccgtgggca tcctgagaaa tcacctgaca 2220 cagttcagcc cacacttcaa gagcggaagc ctggccgtgg acaacgccga tcctatcctg 2280 aagatcccct tcgcctctct ggcctacaga ctgacactgg ctgagctgaa ccagatcctg 2340 tacagatgcg agtccgaaga gaaagaggat ggcggaggct gctacgacat ccccaattgg 2400 agcgccctga agtatgccgg actgcaggga ctgatgtctg tgctggccga gatcagaccc 2460 aagaacgacc tgggacaccc cttctgcaac aacctgagat ccggcgactg gatgatcgac 2520 tacgtgtcca acagactgat cagcagatcc ggcacaatcg ccgaagtcgg caaatggctg 2580 caggccatgt tcttctacct gaagcagatc cctcggtatc tgatcccctg ctacttcgac 2640 gccatcctga tcggcgccta caccacactg ctggataccg cctggaagca gatgtccagc 2700 ttcgtgcaga acggcagcac cttcgtgaag cacctgtctc tgggaagcgt gcagctgtgt 2760 ggcgtgggca aatttcccag cctgcctatc ctgtctcctg cactgatgga cgtgccctac 2820 cggctgaatg agatcaccaa agaaaaagag cagtgctgcg tcagcctggc tgctggcctg 2880 cctcattttt ccagcggcat cttccggtgt tggggcagag acacctttat tgccctgaga 2940 ggcatcctgc tgattaccgg cagatacgtg gaagcccgga acatcatcct ggcctttgcc 3000 ggcacactgc ggcacggact gattcctaat ctgctcggcg agggcatcta cgccagatac 3060 aactgcagag atgccgtgtg gtggtggctc cagtgcatcc aggactactg caagatggtg 3120 cccaacggcc tggacatcct gaagtgccct gtgtccagaa tgtaccctac cgacgatagc 3180 gcccctctgc ctgccggaac acttgaccag cctctgttcg aagtgattca agaggccatg 3240 cagaaacaca tgcagggaat ccagtttcgc gagcggaatg ccggacctca gatcgacaga 3300 aacatgaagg atgagggctt caacatcacc gctggcgtgg acgaagagac aggctttgtg 3360 tacggcggca accggttcaa ttgcggcacc tggatggaca agatgggcga gtctgaccgg 3420 gccagaaaca gaggaattcc cgccacacct agagatggca gcgctgtgga aatcgtgggc 3480 ctgtctaagt ctgctgtgcg gtggctgctc gaactgagca agaagaatat ctttccgtac 3540 cacgaagtga ccgtgaagcg gcacggcaag gccatcaagg tgtcctacga cgagtggaac 3600 agaaagatcc aggacaactt cgaaaagctg ttccatgtgt ctgaggaccc cagcgacctg 3660 aacgaaaagc accccaacct ggtgcacaag cgcggcatct acaaggacag ctacggcgcc 3720 tcttctcctt ggtgcgatta ccagctgcgg cccaacttca ccattgccat ggtggttgcc 3780 cctgagctgt tcaccacaga gaaggcctgg aaggccctgg aaatcgccga gaagaaactg 3840 ctgggccctc tgggcatgaa gacactggac cccgacgaca tggtgtactg cggaatctac 3900 gacaacgccc tggataacga caactacaat ctggccaagg ggttcaatta ccatcaggga 3960 cccgagtggc tgtggcctat cggctatttc ctgcgggcca agctgtactt ctccagactg 4020 atgggccctg agacaaccgc caagacaatc gtgctcgtga agaacgtgct gagccggcac 4080 tatgtgcacc tggaaagaag cccctggaag ggactgcccg agctgaccaa tgagaacgcc 4140 cagtactgcc ccttcagctg cgaaacacag gcctggtcta tcgccaccat cctggaaacc 4200 ctgtacgacc tgtga 4215 <210> 58 <211> 17 <212> DNA <213> artificial <220> <223> sNRP1 polyadenylation signal <400> 58 aaataaaata cgaaatg 17 <210> 59 <211> 4557 <212> DNA <213> artificial <220> <223> delta-9 GDE (isoform 1 (SEQ ID NO:1); wt version) <400> 59 atggagaaac tggaaaagac cctcttcaga cttgaacaag ggtatgagct acagttccga 60 ttaggcccaa ctttacaggg aaaagcagtt accgtgtata caaattaccc atttcctgga 120 gaaacattta atagagaaaa attccgttct ctggattggg aaaatccaac agaaagagaa 180 gatgattctg ataaatactg taaacttaat ctgcaacaat ctggttcatt tcagtattat 240 ttccttcaag gaaatgagaa aagtggtgga ggttacatag ttgtggaccc cattttacgt 300 gttggtgctg ataatcatgt gctacccttg gactgtgtta ctcttcagac atttttagct 360 aagtgtttgg gaccttttga tgaatgggaa agcagactta gggttgcaaa agaatcaggc 420 tacaacatga ttcattttac cccattgcag actcttggac tatctaggtc atgctactcc 480 cttgccaatc agttagaatt aaatcctgac ttttcaagac ctaatagaaa gtatacctgg 540 aatgatgttg gacagctagt ggaaaaatta aaaaaggaat ggaatgttat ttgtattact 600 gatgttgtct acaatcatac tgctgctaat agtaaatgga tccaggaaca tccagaatgt 660 gcctataatc ttgtaaattc tccacactta aaacctgcct gggtcttaga cagagcactt 720 tggcgtttct cctgtgatgt tgcagaaggg aaatacaaag aaaagggaat acctgctttg 780 attgaaaatg atcaccatat gaactccatc cgaaaaataa tttgggagga tatttttcca 840 aagcttaaac tctgggaatt tttccaagta gatgtcaaca aagcggttga gcaatttaga 900 agacttctta cacaagaaaa taggcgagta accaagtctg atccaaacca acaccttacg 960 attattcaag atcctgaata cagacggttt ggctgtactg tagatatgaa cattgcacta 1020 acgactttca taccacatga caaggggcca gcagcaattg aagaatgctg taattggttt 1080 cataaaagaa tggaggaatt aaattcagag aagcatcgac tcattaacta tcatcaggaa 1140 caggcagtta attgcctttt gggaaatgtg ttttatgaac gactggctgg ccatggtcca 1200 aaactaggac ctgtcactag aaagcatcct ttagttacca ggtattttac tttcccattt 1260 gaagagatag acttctccat ggaagaatct atgattcatc tgccaaataa agcttgtttt 1320 ctgatggcac acaatggatg ggtaatggga gatgatcctc ttcgaaactt tgctgaaccg 1380 ggttcagaag tttacctaag gagagaactt atttgctggg gagacagtgt taaattacgc 1440 tatgggaata aaccagagga ctgtccttat ctctgggcac acatgaaaaa atacactgaa 1500 ataactgcaa cttatttcca gggagtacgt cttgataact gccactcaac acctcttcac 1560 gtagctgagt acatgttgga tgctgctagg aatttgcaac ccaatttata tgtagtagct 1620 gaactgttca caggaagtga ggacctagac aatgtctttg ttactagact gggcattagt 1680 tccttaataa gagaggcaat gagtgcatat aatagtcatg aagagggcag attagtttac 1740 cgatatggag gagaacctgt tggatccttt gttcagccct gtttgaggcc tttaatgcca 1800 gctattgcac atgccctgtt tatggatatt acgcatgata atgagtgtcc tattgtgcat 1860 agatcagcgt atgatgctct tccaagtact acaattgttt ctatggcatg ttgtgctagt 1920 ggaagtacaa gaggctatga tgaattagtg cctcatcaga tttcagtggt ttctgaagaa 1980 cggttttaca ctaagtggaa tcctgaagca ttgccttcaa acacaggtga agttaatttc 2040 caaagcggca ttattgcagc caggtgtgct atcagtaaac ttcatcagga gcttggagcc 2100 aagggtttta ttcaggtgta tgtggatcaa gttgatgaag acatagtggc agtaacaaga 2160 cactcaccta gcatccatca gtctgttgtg gctgtaacta gaactgcttt caggaatccc 2220 aagacttcat tttacagcaa ggaagtgcct caaatgtgca tccctggcaa aattgaagaa 2280 gtagttcttg aagctagaac tattgagaga aacacgaaac cttataggaa ggatgaaaat 2340 tcaatcaatg gaacaccaga tatcacagta gaaattagag aacatattca gcttaatgaa 2400 agtaaaattg ttaaacaagc tggagttgcc acaaaagggc ccaatgaata tattcaagaa 2460 atagaatttg aaaacttgtc tccaggaagt gttattatat tcagagttag tcttgatcca 2520 catgcacaag tcgctgttgg cattcttcga aatcatctga cacaattcag tcctcacttt 2580 aaatctggca gcctagctgt tgacaatgca gatcctatat taaaaattcc ttttgcttct 2640 cttgcctata gattaacttt ggctgagcta aatcagatcc tttaccgatg tgaatcagaa 2700 gaaaaggaag atggtggagg gtgctatgac ataccaaact ggtcagccct taaatatgca 2760 ggtcttcaag gtttaatgtc tgtattggca gaaataagac caaagaatga cttggggcat 2820 cctttttgta ataatttgag gtctggagat tggatgattg actatgtcag taaccggctt 2880 atttcacgat caggaactat tgctgaagtt ggtaaatggt tgcaggctat gttcttctac 2940 ctgaagcaga tcccacgtta ccttatccca tgttactttg atgctatatt aattggtgca 3000 tataccactc ttctggatac agcatggaag cagatgtcaa gctttgttca gaatggttca 3060 acctttgtga aacacctttc attgggttca gttcaactgt gtggagtagg aaaattccct 3120 tccctgccaa ttctttcacc tgccctaatg gatgtacctt ataggttaaa tgagatcaca 3180 aaagaaaagg agcaatgttg tgtttctcta gctgcaggct tacctcattt ttcttctggt 3240 attttccgct gctggggaag ggatactttt attgcactta gaggtatact gctgattact 3300 ggacgctatg tagaagccag gaatattatt ttagcatttg cgggtaccct gaggcatggt 3360 ctcattccta atctactggg tgaaggaatt tatgccagat acaattgtcg ggatgctgtg 3420 tggtggtggc tgcagtgtat ccaggattac tgtaaaatgg ttccaaatgg actagacatt 3480 ctcaagtgcc cagtttccag aatgtatcct acagatgatt ctgctccttt gcctgctggc 3540 acactggatc agccattgtt tgaagtcata caggaagcaa tgcaaaaaca catgcagggc 3600 atacagttcc gagaaaggaa tgctggtccc cagatagatc gaaacatgaa ggacgaaggt 3660 tttaatataa ctgcaggagt tgatgaagaa acaggatttg tttatggagg aaatcgtttc 3720 aattgtggca catggatgga taaaatggga gaaagtgaca gagctagaaa cagaggaatc 3780 ccagccacac caagagatgg gtctgctgtg gaaattgtgg gcctgagtaa atctgctgtt 3840 cgctggttgc tggaattatc caaaaaaaat attttccctt atcatgaagt cacagtaaaa 3900 agacatggaa aggctataaa ggtctcatat gatgagtgga acagaaaaat acaagacaac 3960 tttgaaaagc tatttcatgt ttccgaagac ccttcagatt taaatgaaaa gcatccaaat 4020 ctggttcaca aacgtggcat atacaaagat agttatggag cttcaagtcc ttggtgtgac 4080 tatcagctca ggcctaattt taccatagca atggttgtgg cccctgagct ctttactaca 4140 gaaaaagcat ggaaagcttt ggagattgca gaaaaaaaat tgcttggtcc ccttggcatg 4200 aaaactttag atccagatga tatggtttac tgtggaattt atgacaacgc attagacaat 4260 gacaactaca atcttgctaa aggtttcaat tatcaccaag gacctgagtg gctgtggcct 4320 attgggtatt ttcttcgtgc aaaattatat ttttccagat tgatgggccc ggagactact 4380 gcaaagacta tagttttggt taaaaatgtt ctttcccgac attatgttca tcttgagaga 4440 tccccttgga aaggacttcc agaactgacc aatgagaatg cccagtactg tcctttcagc 4500 tgtgaaacac aagcctggtc aattgctact attcttgaga cactttatga tttatag 4557 <210> 60 <211> 4512 <212> DNA <213> artificial <220> <223> delta-10 GDE (isoform 1 (SEQ ID NO:1); wt version) <400> 60 atgctacagt tccgattagg cccaacttta cagggaaaag cagttaccgt gtatacaaat 60 tacccatttc ctggagaaac atttaataga gaaaaattcc gttctctgga ttgggaaaat 120 ccaacagaaa gagaagatga ttctgataaa tactgtaaac ttaatctgca acaatctggt 180 tcatttcagt attatttcct tcaaggaaat gagaaaagtg gtggaggtta catagttgtg 240 gaccccattt tacgtgttgg tgctgataat catgtgctac ccttggactg tgttactctt 300 cagacatttt tagctaagtg tttgggacct tttgatgaat gggaaagcag acttagggtt 360 gcaaaagaat caggctacaa catgattcat tttaccccat tgcagactct tggactatct 420 aggtcatgct actcccttgc caatcagtta gaattaaatc ctgacttttc aagacctaat 480 agaaagtata cctggaatga tgttggacag ctagtggaaa aattaaaaaa ggaatggaat 540 gttatttgta ttactgatgt tgtctacaat catactgctg ctaatagtaa atggatccag 600 gaacatccag aatgtgccta taatcttgta aattctccac acttaaaacc tgcctgggtc 660 ttagacagag cactttggcg tttctcctgt gatgttgcag aagggaaata caaagaaaag 720 ggaatacctg ctttgattga aaatgatcac catatgaact ccatccgaaa aataatttgg 780 gaggatattt ttccaaagct taaactctgg gaatttttcc aagtagatgt caacaaagcg 840 gttgagcaat ttagaagact tcttacacaa gaaaataggc gagtaaccaa gtctgatcca 900 aaccaacacc ttacgattat tcaagatcct gaatacagac ggtttggctg tactgtagat 960 atgaacattg cactaacgac tttcatacca catgacaagg ggccagcagc aattgaagaa 1020 tgctgtaatt ggtttcataa aagaatggag gaattaaatt cagagaagca tcgactcatt 1080 aactatcatc aggaacaggc agttaattgc cttttgggaa atgtgtttta tgaacgactg 1140 gctggccatg gtccaaaact aggacctgtc actagaaagc atcctttagt taccaggtat 1200 tttactttcc catttgaaga gatagacttc tccatggaag aatctatgat tcatctgcca 1260 aataaagctt gttttctgat ggcacacaat ggatgggtaa tgggagatga tcctcttcga 1320 aactttgctg aaccgggttc agaagtttac ctaaggagag aacttatttg ctggggagac 1380 agtgttaaat tacgctatgg gaataaacca gaggactgtc cttatctctg ggcacacatg 1440 aaaaaataca ctgaaataac tgcaacttat ttccagggag tacgtcttga taactgccac 1500 tcaacacctc ttcacgtagc tgagtacatg ttggatgctg ctaggaattt gcaacccaat 1560 ttatatgtag tagctgaact gttcacagga agtgaggacc tagacaatgt ctttgttact 1620 agactgggca ttagttcctt aataagagag gcaatgagtg catataatag tcatgaagag 1680 ggcagattag tttaccgata tggaggagaa cctgttggat cctttgttca gccctgtttg 1740 aggcctttaa tgccagctat tgcacatgcc ctgtttatgg atattacgca tgataatgag 1800 tgtcctattg tgcatagatc agcgtatgat gctcttccaa gtactacaat tgtttctatg 1860 gcatgttgtg ctagtggaag tacaagaggc tatgatgaat tagtgcctca tcagatttca 1920 gtggtttctg aagaacggtt ttacactaag tggaatcctg aagcattgcc ttcaaacaca 1980 ggtgaagtta atttccaaag cggcattatt gcagccaggt gtgctatcag taaacttcat 2040 caggagcttg gagccaaggg ttttattcag gtgtatgtgg atcaagttga tgaagacata 2100 gtggcagtaa caagacactc acctagcatc catcagtctg ttgtggctgt aactagaact 2160 gctttcagga atcccaagac ttcattttac agcaaggaag tgcctcaaat gtgcatccct 2220 ggcaaaattg aagaagtagt tcttgaagct agaactattg agagaaacac gaaaccttat 2280 aggaaggatg aaaattcaat caatggaaca ccagatatca cagtagaaat tagagaacat 2340 attcagctta atgaaagtaa aattgttaaa caagctggag ttgccacaaa agggcccaat 2400 gaatatattc aagaaataga atttgaaaac ttgtctccag gaagtgttat tatattcaga 2460 gttagtcttg atccacatgc acaagtcgct gttggcattc ttcgaaatca tctgacacaa 2520 ttcagtcctc actttaaatc tggcagccta gctgttgaca atgcagatcc tatattaaaa 2580 attccttttg cttctcttgc ctatagatta actttggctg agctaaatca gatcctttac 2640 cgatgtgaat cagaagaaaa ggaagatggt ggagggtgct atgacatacc aaactggtca 2700 gcccttaaat atgcaggtct tcaaggttta atgtctgtat tggcagaaat aagaccaaag 2760 aatgacttgg ggcatccttt ttgtaataat ttgaggtctg gagattggat gattgactat 2820 gtcagtaacc ggcttatttc acgatcagga actattgctg aagttggtaa atggttgcag 2880 gctatgttct tctacctgaa gcagatccca cgttacctta tcccatgtta ctttgatgct 2940 atattaattg gtgcatatac cactcttctg gatacagcat ggaagcagat gtcaagcttt 3000 gttcagaatg gttcaacctt tgtgaaacac ctttcattgg gttcagttca actgtgtgga 3060 gtaggaaaat tcccttccct gccaattctt tcacctgccc taatggatgt accttatagg 3120 ttaaatgaga tcacaaaaga aaaggagcaa tgttgtgttt ctctagctgc aggcttacct 3180 catttttctt ctggtatttt ccgctgctgg ggaagggata cttttattgc acttagaggt 3240 atactgctga ttactggacg ctatgtagaa gccaggaata ttattttagc atttgcgggt 3300 accctgaggc atggtctcat tcctaatcta ctgggtgaag gaatttatgc cagatacaat 3360 tgtcgggatg ctgtgtggtg gtggctgcag tgtatccagg attactgtaa aatggttcca 3420 aatggactag acattctcaa gtgcccagtt tccagaatgt atcctacaga tgattctgct 3480 cctttgcctg ctggcacact ggatcagcca ttgtttgaag tcatacagga agcaatgcaa 3540 aaacacatgc agggcataca gttccgagaa aggaatgctg gtccccagat agatcgaaac 3600 atgaaggacg aaggttttaa tataactgca ggagttgatg aagaaacagg atttgtttat 3660 ggaggaaatc gtttcaattg tggcacatgg atggataaaa tgggagaaag tgacagagct 3720 agaaacagag gaatcccagc cacaccaaga gatgggtctg ctgtggaaat tgtgggcctg 3780 agtaaatctg ctgttcgctg gttgctggaa ttatccaaaa aaaatatttt cccttatcat 3840 gaagtcacag taaaaagaca tggaaaggct ataaaggtct catatgatga gtggaacaga 3900 aaaatacaag acaactttga aaagctattt catgtttccg aagacccttc agatttaaat 3960 gaaaagcatc caaatctggt tcacaaacgt ggcatataca aagatagtta tggagcttca 4020 agtccttggt gtgactatca gctcaggcct aattttacca tagcaatggt tgtggcccct 4080 gagctcttta ctacagaaaa agcatggaaa gctttggaga ttgcagaaaa aaaattgctt 4140 ggtccccttg gcatgaaaac tttagatcca gatgatatgg tttactgtgg aatttatgac 4200 aacgcattag acaatgacaa ctacaatctt gctaaaggtt tcaattatca ccaaggacct 4260 gagtggctgt ggcctattgg gtattttctt cgtgcaaaat tatatttttc cagattgatg 4320 ggcccggaga ctactgcaaa gactatagtt ttggttaaaa atgttctttc ccgacattat 4380 gttcatcttg agagatcccc ttggaaagga cttccagaac tgaccaatga gaatgcccag 4440 tactgtcctt tcagctgtga aacacaagcc tggtcaattg ctactattct tgagacactt 4500 tatgatttat ag 4512 <210> 61 <211> 4359 <212> DNA <213> artificial <220> <223> delta-11 GDE (isoform 1 (SEQ ID NO:1); wt version) <400> 61 atgaaactta atctgcaaca atctggttca tttcagtatt atttccttca aggaaatgag 60 aaaagtggtg gaggttacat agttgtggac cccattttac gtgttggtgc tgataatcat 120 gtgctaccct tggactgtgt tactcttcag acatttttag ctaagtgttt gggacctttt 180 gatgaatggg aaagcagact tagggttgca aaagaatcag gctacaacat gattcatttt 240 accccattgc agactcttgg actatctagg tcatgctact cccttgccaa tcagttagaa 300 ttaaatcctg acttttcaag acctaataga aagtatacct ggaatgatgt tggacagcta 360 gtggaaaaat taaaaaagga atggaatgtt atttgtatta ctgatgttgt ctacaatcat 420 actgctgcta atagtaaatg gatccaggaa catccagaat gtgcctataa tcttgtaaat 480 tctccacact taaaacctgc ctgggtctta gacagagcac tttggcgttt ctcctgtgat 540 gttgcagaag ggaaatacaa agaaaaggga atacctgctt tgattgaaaa tgatcaccat 600 atgaactcca tccgaaaaat aatttgggag gatatttttc caaagcttaa actctgggaa 660 tttttccaag tagatgtcaa caaagcggtt gagcaattta gaagacttct tacacaagaa 720 aataggcgag taaccaagtc tgatccaaac caacacctta cgattattca agatcctgaa 780 tacagacggt ttggctgtac tgtagatatg aacattgcac taacgacttt cataccacat 840 gacaaggggc cagcagcaat tgaagaatgc tgtaattggt ttcataaaag aatggaggaa 900 ttaaattcag agaagcatcg actcattaac tatcatcagg aacaggcagt taattgcctt 960 ttgggaaatg tgttttatga acgactggct ggccatggtc caaaactagg acctgtcact 1020 agaaagcatc ctttagttac caggtatttt actttcccat ttgaagagat agacttctcc 1080 atggaagaat ctatgattca tctgccaaat aaagcttgtt ttctgatggc acacaatgga 1140 tgggtaatgg gagatgatcc tcttcgaaac tttgctgaac cgggttcaga agtttaccta 1200 aggagagaac ttatttgctg gggagacagt gttaaattac gctatgggaa taaaccagag 1260 gactgtcctt atctctgggc acacatgaaa aaatacactg aaataactgc aacttatttc 1320 cagggagtac gtcttgataa ctgccactca acacctcttc acgtagctga gtacatgttg 1380 gatgctgcta ggaatttgca acccaattta tatgtagtag ctgaactgtt cacaggaagt 1440 gaggacctag acaatgtctt tgttactaga ctgggcatta gttccttaat aagagaggca 1500 atgagtgcat ataatagtca tgaagagggc agattagttt accgatatgg aggagaacct 1560 gttggatcct ttgttcagcc ctgtttgagg cctttaatgc cagctattgc acatgccctg 1620 tttatggata ttacgcatga taatgagtgt cctattgtgc atagatcagc gtatgatgct 1680 cttccaagta ctacaattgt ttctatggca tgttgtgcta gtggaagtac aagaggctat 1740 gatgaattag tgcctcatca gatttcagtg gtttctgaag aacggtttta cactaagtgg 1800 aatcctgaag cattgccttc aaacacaggt gaagttaatt tccaaagcgg cattattgca 1860 gccaggtgtg ctatcagtaa acttcatcag gagcttggag ccaagggttt tattcaggtg 1920 tatgtggatc aagttgatga agacatagtg gcagtaacaa gacactcacc tagcatccat 1980 cagtctgttg tggctgtaac tagaactgct ttcaggaatc ccaagacttc attttacagc 2040 aaggaagtgc ctcaaatgtg catccctggc aaaattgaag aagtagttct tgaagctaga 2100 actattgaga gaaacacgaa accttatagg aaggatgaaa attcaatcaa tggaacacca 2160 gatatcacag tagaaattag agaacatatt cagcttaatg aaagtaaaat tgttaaacaa 2220 gctggagttg ccacaaaagg gcccaatgaa tatattcaag aaatagaatt tgaaaacttg 2280 tctccaggaa gtgttattat attcagagtt agtcttgatc cacatgcaca agtcgctgtt 2340 ggcattcttc gaaatcatct gacacaattc agtcctcact ttaaatctgg cagcctagct 2400 gttgacaatg cagatcctat attaaaaatt ccttttgctt ctcttgccta tagattaact 2460 ttggctgagc taaatcagat cctttaccga tgtgaatcag aagaaaagga agatggtgga 2520 gggtgctatg acataccaaa ctggtcagcc cttaaatatg caggtcttca aggtttaatg 2580 tctgtattgg cagaaataag accaaagaat gacttggggc atcctttttg taataatttg 2640 aggtctggag attggatgat tgactatgtc agtaaccggc ttatttcacg atcaggaact 2700 attgctgaag ttggtaaatg gttgcaggct atgttcttct acctgaagca gatcccacgt 2760 taccttatcc catgttactt tgatgctata ttaattggtg catataccac tcttctggat 2820 acagcatgga agcagatgtc aagctttgtt cagaatggtt caacctttgt gaaacacctt 2880 tcattgggtt cagttcaact gtgtggagta ggaaaattcc cttccctgcc aattctttca 2940 cctgccctaa tggatgtacc ttataggtta aatgagatca caaaagaaaa ggagcaatgt 3000 tgtgtttctc tagctgcagg cttacctcat ttttcttctg gtattttccg ctgctgggga 3060 agggatactt ttattgcact tagaggtata ctgctgatta ctggacgcta tgtagaagcc 3120 aggaatatta ttttagcatt tgcgggtacc ctgaggcatg gtctcattcc taatctactg 3180 ggtgaaggaa tttatgccag atacaattgt cgggatgctg tgtggtggtg gctgcagtgt 3240 atccaggatt actgtaaaat ggttccaaat ggactagaca ttctcaagtg cccagtttcc 3300 agaatgtatc ctacagatga ttctgctcct ttgcctgctg gcacactgga tcagccattg 3360 tttgaagtca tacaggaagc aatgcaaaaa cacatgcagg gcatacagtt ccgagaaagg 3420 aatgctggtc cccagataga tcgaaacatg aaggacgaag gttttaatat aactgcagga 3480 gttgatgaag aaacaggatt tgtttatgga ggaaatcgtt tcaattgtgg cacatggatg 3540 gataaaatgg gagaaagtga cagagctaga aacagaggaa tcccagccac accaagagat 3600 gggtctgctg tggaaattgt gggcctgagt aaatctgctg ttcgctggtt gctggaatta 3660 tccaaaaaaa atattttccc ttatcatgaa gtcacagtaa aaagacatgg aaaggctata 3720 aaggtctcat atgatgagtg gaacagaaaa atacaagaca actttgaaaa gctatttcat 3780 gtttccgaag acccttcaga tttaaatgaa aagcatccaa atctggttca caaacgtggc 3840 atatacaaag atagttatgg agcttcaagt ccttggtgtg actatcagct caggcctaat 3900 tttaccatag caatggttgt ggcccctgag ctctttacta cagaaaaagc atggaaagct 3960 ttggagattg cagaaaaaaa attgcttggt ccccttggca tgaaaacttt agatccagat 4020 gatatggttt actgtggaat ttatgacaac gcattagaca atgacaacta caatcttgct 4080 aaaggtttca attatcacca aggacctgag tggctgtggc ctattgggta ttttcttcgt 4140 gcaaaattat atttttccag attgatgggc ccggagacta ctgcaaagac tatagttttg 4200 gttaaaaatg ttctttcccg acattatgtt catcttgaga gatccccttg gaaaggactt 4260 ccagaactga ccaatgagaa tgcccagtac tgtcctttca gctgtgaaac acaagcctgg 4320 tcaattgcta ctattcttga gacactttat gatttatag 4359 <210> 62 <211> 4293 <212> DNA <213> artificial <220> <223> delta-12 GDE (isoform 1 (SEQ ID NO:1); wt version) <400> 62 atgggaggtt acatagttgt ggaccccatt ttacgtgttg gtgctgataa tcatgtgcta 60 cccttggact gtgttactct tcagacattt ttagctaagt gtttgggacc ttttgatgaa 120 tgggaaagca gacttagggt tgcaaaagaa tcaggctaca acatgattca ttttacccca 180 ttgcagactc ttggactatc taggtcatgc tactcccttg ccaatcagtt agaattaaat 240 cctgactttt caagacctaa tagaaagtat acctggaatg atgttggaca gctagtggaa 300 aaattaaaaa aggaatggaa tgttatttgt attactgatg ttgtctacaa tcatactgct 360 gctaatagta aatggatcca ggaacatcca gaatgtgcct ataatcttgt aaattctcca 420 cacttaaaac ctgcctgggt cttagacaga gcactttggc gtttctcctg tgatgttgca 480 gaagggaaat acaaagaaaa gggaatacct gctttgattg aaaatgatca ccatatgaac 540 tccatccgaa aaataatttg ggaggatatt tttccaaagc ttaaactctg ggaatttttc 600 caagtagatg tcaacaaagc ggttgagcaa tttagaagac ttcttacaca agaaaatagg 660 cgagtaacca agtctgatcc aaaccaacac cttacgatta ttcaagatcc tgaatacaga 720 cggtttggct gtactgtaga tatgaacatt gcactaacga ctttcatacc acatgacaag 780 gggccagcag caattgaaga atgctgtaat tggtttcata aaagaatgga ggaattaaat 840 tcagagaagc atcgactcat taactatcat caggaacagg cagttaattg ccttttggga 900 aatgtgtttt atgaacgact ggctggccat ggtccaaaac taggacctgt cactagaaag 960 catcctttag ttaccaggta ttttactttc ccatttgaag agatagactt ctccatggaa 1020 gaatctatga ttcatctgcc aaataaagct tgttttctga tggcacacaa tggatgggta 1080 atgggagatg atcctcttcg aaactttgct gaaccgggtt cagaagttta cctaaggaga 1140 gaacttattt gctggggaga cagtgttaaa ttacgctatg ggaataaacc agaggactgt 1200 ccttatctct gggcacacat gaaaaaatac actgaaataa ctgcaactta tttccaggga 1260 gtacgtcttg ataactgcca ctcaacacct cttcacgtag ctgagtacat gttggatgct 1320 gctaggaatt tgcaacccaa tttatatgta gtagctgaac tgttcacagg aagtgaggac 1380 ctagacaatg tctttgttac tagactgggc attagttcct taataagaga ggcaatgagt 1440 gcatataata gtcatgaaga gggcagatta gtttaccgat atggaggaga acctgttgga 1500 tcctttgttc agccctgttt gaggccttta atgccagcta ttgcacatgc cctgtttatg 1560 gatattacgc atgataatga gtgtcctatt gtgcatagat cagcgtatga tgctcttcca 1620 agtactacaa ttgtttctat ggcatgttgt gctagtggaa gtacaagagg ctatgatgaa 1680 ttagtgcctc atcagatttc agtggtttct gaagaacggt tttacactaa gtggaatcct 1740 gaagcattgc cttcaaacac aggtgaagtt aatttccaaa gcggcattat tgcagccagg 1800 tgtgctatca gtaaacttca tcaggagctt ggagccaagg gttttattca ggtgtatgtg 1860 gatcaagttg atgaagacat agtggcagta acaagacact cacctagcat ccatcagtct 1920 gttgtggctg taactagaac tgctttcagg aatcccaaga cttcatttta cagcaaggaa 1980 gtgcctcaaa tgtgcatccc tggcaaaatt gaagaagtag ttcttgaagc tagaactatt 2040 gagagaaaca cgaaacctta taggaaggat gaaaattcaa tcaatggaac accagatatc 2100 acagtagaaa ttagagaaca tattcagctt aatgaaagta aaattgttaa acaagctgga 2160 gttgccacaa aagggcccaa tgaatatatt caagaaatag aatttgaaaa cttgtctcca 2220 ggaagtgtta ttatattcag agttagtctt gatccacatg cacaagtcgc tgttggcatt 2280 cttcgaaatc atctgacaca attcagtcct cactttaaat ctggcagcct agctgttgac 2340 aatgcagatc ctatattaaa aattcctttt gcttctcttg cctatagatt aactttggct 2400 gagctaaatc agatccttta ccgatgtgaa tcagaagaaa aggaagatgg tggagggtgc 2460 tatgacatac caaactggtc agcccttaaa tatgcaggtc ttcaaggttt aatgtctgta 2520 ttggcagaaa taagaccaaa gaatgacttg gggcatcctt tttgtaataa tttgaggtct 2580 ggagattgga tgattgacta tgtcagtaac cggcttattt cacgatcagg aactattgct 2640 gaagttggta aatggttgca ggctatgttc ttctacctga agcagatccc acgttacctt 2700 atcccatgtt actttgatgc tatattaatt ggtgcatata ccactcttct ggatacagca 2760 tggaagcaga tgtcaagctt tgttcagaat ggttcaacct ttgtgaaaca cctttcattg 2820 ggttcagttc aactgtgtgg agtaggaaaa ttcccttccc tgccaattct ttcacctgcc 2880 ctaatggatg taccttatag gttaaatgag atcacaaaag aaaaggagca atgttgtgtt 2940 tctctagctg caggcttacc tcatttttct tctggtattt tccgctgctg gggaagggat 3000 acttttattg cacttagagg tatactgctg attactggac gctatgtaga agccaggaat 3060 attattttag catttgcggg taccctgagg catggtctca ttcctaatct actgggtgaa 3120 ggaatttatg ccagatacaa ttgtcgggat gctgtgtggt ggtggctgca gtgtatccag 3180 gattactgta aaatggttcc aaatggacta gacattctca agtgcccagt ttccagaatg 3240 tatcctacag atgattctgc tcctttgcct gctggcacac tggatcagcc attgtttgaa 3300 gtcatacagg aagcaatgca aaaacacatg cagggcatac agttccgaga aaggaatgct 3360 ggtccccaga tagatcgaaa catgaaggac gaaggtttta atataactgc aggagttgat 3420 gaagaaacag gatttgttta tggaggaaat cgtttcaatt gtggcacatg gatggataaa 3480 atgggagaaa gtgacagagc tagaaacaga ggaatcccag ccacaccaag agatgggtct 3540 gctgtggaaa ttgtgggcct gagtaaatct gctgttcgct ggttgctgga attatccaaa 3600 aaaaatattt tcccttatca tgaagtcaca gtaaaaagac atggaaaggc tataaaggtc 3660 tcatatgatg agtggaacag aaaaatacaa gacaactttg aaaagctatt tcatgtttcc 3720 gaagaccctt cagatttaaa tgaaaagcat ccaaatctgg ttcacaaacg tggcatatac 3780 aaagatagtt atggagcttc aagtccttgg tgtgactatc agctcaggcc taattttacc 3840 atagcaatgg ttgtggcccc tgagctcttt actacagaaa aagcatggaa agctttggag 3900 attgcagaaa aaaaattgct tggtcccctt ggcatgaaaa ctttagatcc agatgatatg 3960 gtttactgtg gaatttatga caacgcatta gacaatgaca actacaatct tgctaaaggt 4020 ttcaattatc accaaggacc tgagtggctg tggcctattg ggtattttct tcgtgcaaaa 4080 ttatattttt ccagattgat gggcccggag actactgcaa agactatagt tttggttaaa 4140 aatgttcttt cccgacatta tgttcatctt gagagatccc cttggaaagg acttccagaa 4200 ctgaccaatg agaatgccca gtactgtcct ttcagctgtg aaacacaagc ctggtcaatt 4260 gctactattc ttgagacact ttatgattta tag 4293 <210> 63 <211> 4215 <212> DNA <213> artificial <220> <223> delta-13 GDE (isoform 1 (SEQ ID NO:1); wt version) <400> 63 atgcagacat ttttagctaa gtgtttggga ccttttgatg aatgggaaag cagacttagg 60 gttgcaaaag aatcaggcta caacatgatt cattttaccc cattgcagac tcttggacta 120 tctaggtcat gctactccct tgccaatcag ttagaattaa atcctgactt ttcaagacct 180 aatagaaagt atacctggaa tgatgttgga cagctagtgg aaaaattaaa aaaggaatgg 240 aatgttattt gtattactga tgttgtctac aatcatactg ctgctaatag taaatggatc 300 caggaacatc cagaatgtgc ctataatctt gtaaattctc cacacttaaa acctgcctgg 360 gtcttagaca gagcactttg gcgtttctcc tgtgatgttg cagaagggaa atacaaagaa 420 aagggaatac ctgctttgat tgaaaatgat caccatatga actccatccg aaaaataatt 480 tgggaggata tttttccaaa gcttaaactc tgggaatttt tccaagtaga tgtcaacaaa 540 gcggttgagc aatttagaag acttcttaca caagaaaata ggcgagtaac caagtctgat 600 ccaaaccaac accttacgat tattcaagat cctgaataca gacggtttgg ctgtactgta 660 gatatgaaca ttgcactaac gactttcata ccacatgaca aggggccagc agcaattgaa 720 gaatgctgta attggtttca taaaagaatg gaggaattaa attcagagaa gcatcgactc 780 attaactatc atcaggaaca ggcagttaat tgccttttgg gaaatgtgtt ttatgaacga 840 ctggctggcc atggtccaaa actaggacct gtcactagaa agcatccttt agttaccagg 900 tattttactt tcccatttga agagatagac ttctccatgg aagaatctat gattcatctg 960 ccaaataaag cttgttttct gatggcacac aatggatggg taatgggaga tgatcctctt 1020 cgaaactttg ctgaaccggg ttcagaagtt tacctaagga gagaacttat ttgctgggga 1080 gacagtgtta aattacgcta tgggaataaa ccagaggact gtccttatct ctgggcacac 1140 atgaaaaaat acactgaaat aactgcaact tatttccagg gagtacgtct tgataactgc 1200 cactcaacac ctcttcacgt agctgagtac atgttggatg ctgctaggaa tttgcaaccc 1260 aatttatatg tagtagctga actgttcaca ggaagtgagg acctagacaa tgtctttgtt 1320 actagactgg gcattagttc cttaataaga gaggcaatga gtgcatataa tagtcatgaa 1380 gagggcagat tagtttaccg atatggagga gaacctgttg gatcctttgt tcagccctgt 1440 ttgaggcctt taatgccagc tattgcacat gccctgttta tggatattac gcatgataat 1500 gagtgtccta ttgtgcatag atcagcgtat gatgctcttc caagtactac aattgtttct 1560 atggcatgtt gtgctagtgg aagtacaaga ggctatgatg aattagtgcc tcatcagatt 1620 tcagtggttt ctgaagaacg gttttacact aagtggaatc ctgaagcatt gccttcaaac 1680 acaggtgaag ttaatttcca aagcggcatt attgcagcca ggtgtgctat cagtaaactt 1740 catcaggagc ttggagccaa gggttttatt caggtgtatg tggatcaagt tgatgaagac 1800 atagtggcag taacaagaca ctcacctagc atccatcagt ctgttgtggc tgtaactaga 1860 actgctttca ggaatcccaa gacttcattt tacagcaagg aagtgcctca aatgtgcatc 1920 cctggcaaaa ttgaagaagt agttcttgaa gctagaacta ttgagagaaa cacgaaacct 1980 tataggaagg atgaaaattc aatcaatgga acaccagata tcacagtaga aattagagaa 2040 catattcagc ttaatgaaag taaaattgtt aaacaagctg gagttgccac aaaagggccc 2100 aatgaatata ttcaagaaat agaatttgaa aacttgtctc caggaagtgt tattatattc 2160 agagttagtc ttgatccaca tgcacaagtc gctgttggca ttcttcgaaa tcatctgaca 2220 caattcagtc ctcactttaa atctggcagc ctagctgttg acaatgcaga tcctatatta 2280 aaaattcctt ttgcttctct tgcctataga ttaactttgg ctgagctaaa tcagatcctt 2340 taccgatgtg aatcagaaga aaaggaagat ggtggagggt gctatgacat accaaactgg 2400 tcagccctta aatatgcagg tcttcaaggt ttaatgtctg tattggcaga aataagacca 2460 aagaatgact tggggcatcc tttttgtaat aatttgaggt ctggagattg gatgattgac 2520 tatgtcagta accggcttat ttcacgatca ggaactattg ctgaagttgg taaatggttg 2580 caggctatgt tcttctacct gaagcagatc ccacgttacc ttatcccatg ttactttgat 2640 gctatattaa ttggtgcata taccactctt ctggatacag catggaagca gatgtcaagc 2700 tttgttcaga atggttcaac ctttgtgaaa cacctttcat tgggttcagt tcaactgtgt 2760 ggagtaggaa aattcccttc cctgccaatt ctttcacctg ccctaatgga tgtaccttat 2820 aggttaaatg agatcacaaa agaaaaggag caatgttgtg tttctctagc tgcaggctta 2880 cctcattttt cttctggtat tttccgctgc tggggaaggg atacttttat tgcacttaga 2940 ggtatactgc tgattactgg acgctatgta gaagccagga atattatttt agcatttgcg 3000 ggtaccctga ggcatggtct cattcctaat ctactgggtg aaggaattta tgccagatac 3060 aattgtcggg atgctgtgtg gtggtggctg cagtgtatcc aggattactg taaaatggtt 3120 ccaaatggac tagacattct caagtgccca gtttccagaa tgtatcctac agatgattct 3180 gctcctttgc ctgctggcac actggatcag ccattgtttg aagtcataca ggaagcaatg 3240 caaaaacaca tgcagggcat acagttccga gaaaggaatg ctggtcccca gatagatcga 3300 aacatgaagg acgaaggttt taatataact gcaggagttg atgaagaaac aggatttgtt 3360 tatggaggaa atcgtttcaa ttgtggcaca tggatggata aaatgggaga aagtgacaga 3420 gctagaaaca gaggaatccc agccacacca agagatgggt ctgctgtgga aattgtgggc 3480 ctgagtaaat ctgctgttcg ctggttgctg gaattatcca aaaaaaatat tttcccttat 3540 catgaagtca cagtaaaaag acatggaaag gctataaagg tctcatatga tgagtggaac 3600 agaaaaatac aagacaactt tgaaaagcta tttcatgttt ccgaagaccc ttcagattta 3660 aatgaaaagc atccaaatct ggttcacaaa cgtggcatat acaaagatag ttatggagct 3720 tcaagtcctt ggtgtgacta tcagctcagg cctaatttta ccatagcaat ggttgtggcc 3780 cctgagctct ttactacaga aaaagcatgg aaagctttgg agattgcaga aaaaaaattg 3840 cttggtcccc ttggcatgaa aactttagat ccagatgata tggtttactg tggaatttat 3900 gacaacgcat tagacaatga caactacaat cttgctaaag gtttcaatta tcaccaagga 3960 cctgagtggc tgtggcctat tgggtatttt cttcgtgcaa aattatattt ttccagattg 4020 atgggcccgg agactactgc aaagactata gttttggtta aaaatgttct ttcccgacat 4080 tatgttcatc ttgagagatc cccttggaaa ggacttccag aactgaccaa tgagaatgcc 4140 cagtactgtc ctttcagctg tgaaacacaa gcctggtcaa ttgctactat tcttgagaca 4200 ctttatgatt tatag 4215

Claims (15)

  1. 기준 전장 인간 GDE 서열, 특히 SEQ ID NO:1, SEQ ID NO:40 또는 SEQ ID NO:41 에 제시된 아미노산 서열을 갖는 기준 전장 인간 GDE 서열에 대해 적어도 약 10, 20, 30, 40, 50, 60, 75, 90, 100, 125, 150, 175, 190, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 또는 적어도 약 525 개 아미노산이 결실된, 기능성 절두된 인간 GDE 폴리펩티드.
  2. 제 1 항에 있어서, 하기와 같은, 기능성 절두된 인간 GDE 폴리펩티드:
    (i) 기준 전장 인간 GDE 서열은 SEQ ID NO:1 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:1 에 대해 적어도 위치 429-666, 770-892, 1088-1194, 및 1235-1532 에서의 아미노산 잔기를 포함하거나;
    (ii) 기준 전장 인간 GDE 서열은 SEQ ID NO:40 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:40 에 대해 적어도 위치 412-649, 753-875, 1071-1177, 1218-1515 에서의 아미노산 잔기를 포함하거나; 또는
    (iii) 기준 전장 인간 GDE 서열은 SEQ ID NO:41 에 제시된 아미노산 서열을 갖고, 상기 절두된 인간 GDE 폴리펩티드는 SEQ ID NO:41 에 대해 적어도 위치 413-650, 754-876, 1072-1178, 1219-1516 에서의 아미노산 잔기를 포함한다.
  3. 제 1 항 또는 제 2 항에 있어서, 표 2 에 제시된 바와 같은, 결실 또는 결실의 조합을 포함하는, 기능성 절두된 인간 GDE 폴리펩티드.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, SEQ ID NO:2-6 및 SEQ ID NO:48-52 로부터 선택되는 서열을 갖는, 기능성 절두된 인간 GDE 폴리펩티드.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, SEQ ID NO:5 로 이루어지는 아미노산 서열을 갖는, 기능성 절두된 인간 GDE 폴리펩티드.
  6. 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드를 코딩하는 핵산 분자.
  7. 하기를, 바람직하게는 이 순서대로, 포함하는 핵산 구축물:
    - 프로모터;
    - 임의로, 인트론;
    - 제 6 항의 핵산 분자; 및
    - 폴리아데닐화 신호.
  8. 하기를 포함하는 벡터, 특히 바이러스 벡터:
    - 제 6 항의 핵산 분자; 또는
    - 제 7 항의 핵산 구축물.
  9. 기능성 비-인간 GDE 폴리펩티드를 코딩하는 핵산 구축물을 포함하는 바이러스 벡터로서, 기능성 비-인간 GDE 폴리펩티드는 약 1500 개 미만의 아미노산을 포함하는, 바이러스 벡터.
  10. 제 9 항에 있어서, 기능성 비-인간 GDE 폴리펩티드는 SEQ ID NO:11 의 말 GDE 폴리펩티드, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드, SEQ ID NO:13 의 오랑우탄 GDE 폴리펩티드, SEQ ID NO:14 의 검은날여우박쥐 (Pteropus alecto) GDE 폴리펩티드, SEQ ID NO:15 의 수티 망가베이 GDE 폴리펩티드, SEQ ID NO:16 의 오리너구리 GDE 폴리펩티드, 및 SEQ ID NO:17 의 오리 GDE 폴리펩티드로 이루어지는 군으로부터 선택되고, 기능성 비-인간 GDE 폴리펩티드는 바람직하게는 SEQ ID NO:12 의 고릴라 GDE 폴리펩티드인, 바이러스 벡터.
  11. 제 8 항 내지 제 10 항 중 어느 한 항에 있어서, AAV 벡터인, 바이러스 벡터.
  12. 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물 또는 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터로 형질전환된 단리된 세포로서, 세포는 특히 간 세포, 근육 세포, 심장 세포 또는 CNS 세포인, 단리된 세포.
  13. 약제로서 사용하기 위한, 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드, 제 9 항에 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드, 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물, 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터, 또는 제 12 항에 따른 단리된 세포.
  14. GSDIII (코리병) 의 치료 방법에서 사용하기 위한, 제 1 항 내지 제 5 항 중 어느 한 항의 기능성 절두된 인간 GDE 폴리펩티드, 제 9 항에 정의된 바와 같은 기능성 비-인간 GDE 폴리펩티드, 제 6 항의 핵산 분자, 제 7 항의 핵산 구축물, 제 8 항 내지 제 11 항 중 어느 한 항의 바이러스 벡터, 또는 제 12 항에 따른 단리된 세포.
  15. GSDIII (코리병) 의 치료 방법에서 사용하기 위한, SEQ ID NO:12 의 고릴라 GDE 폴리펩티드.
KR1020217006722A 2018-08-08 2019-08-06 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde KR20210053902A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18306088.8 2018-08-08
EP18306088 2018-08-08
PCT/EP2019/071158 WO2020030661A1 (en) 2018-08-08 2019-08-06 Mini-gde for the treatment of glycogen storage disease iii

Publications (1)

Publication Number Publication Date
KR20210053902A true KR20210053902A (ko) 2021-05-12

Family

ID=63311942

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217006722A KR20210053902A (ko) 2018-08-08 2019-08-06 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde

Country Status (17)

Country Link
US (1) US20210292724A1 (ko)
EP (2) EP4230733A1 (ko)
JP (2) JP2021532810A (ko)
KR (1) KR20210053902A (ko)
CN (1) CN112654698A (ko)
AU (1) AU2019317754A1 (ko)
BR (1) BR112021002202A2 (ko)
CA (1) CA3107572A1 (ko)
DK (1) DK3833746T3 (ko)
EA (1) EA202190475A1 (ko)
ES (1) ES2946415T3 (ko)
FI (1) FI3833746T3 (ko)
IL (1) IL280570A (ko)
MA (1) MA53268B1 (ko)
PL (1) PL3833746T3 (ko)
PT (1) PT3833746T (ko)
WO (1) WO2020030661A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT202000003371A1 (it) * 2020-02-19 2021-08-19 Enea Agenzia Naz Per Le Nuove Tecnologie Lenergia E Lo Sviluppo Economico Sostenibile Composto per il trattamento di una glicogenosi
EP4189098A1 (en) 2020-07-27 2023-06-07 Anjarium Biosciences AG Compositions of dna molecules, methods of making therefor, and methods of use thereof
JP2023539219A (ja) 2020-08-24 2023-09-13 ジェネトン 糖原病iiiの治療のためのc末端切断gde
KR20240012370A (ko) 2021-04-20 2024-01-29 안자리움 바이오사이언시스 아게 아밀로-알파-1, 6-글루코시다제, 4-알파-글루카노트랜스퍼라제를 인코딩하는 dna 분자의 조성물, 이를 제조하는 방법 및 이를 사용하는 방법
WO2023237731A1 (en) 2022-06-09 2023-12-14 Genethon N-terminal truncated gde for the treatment of glycogen storage disease iii

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030157064A1 (en) 2001-11-09 2003-08-21 Pascal Neuville Chimeric promoters for controlling expression in muscle cells
MX360727B (es) 2004-06-01 2018-11-14 Genzyme Corp Composiciones y metodos para evitar la agregacion del vector aav.
DK2282764T3 (da) 2008-04-22 2019-10-14 Vib Vzw Leverspecifikke nukleinsyreregulerende elementer samt fremgangsmåder og anvendelser heraf
US20160089451A1 (en) * 2013-02-20 2016-03-31 Dustin D. Armstrong Methods and compositions for treatment of forbes-cori disease
CA3209883A1 (en) 2013-07-22 2015-01-29 The Children's Hospital Of Philadelphia Variant aav and compositions, methods and uses for gene transfer to cells, organs and tissues
EP3800261A1 (en) 2014-01-21 2021-04-07 Vrije Universiteit Brussel Muscle-specific nucleic acid regulatory elements and methods and use thereof
WO2015162302A2 (en) 2014-04-25 2015-10-29 Genethon Treatment of hyperbilirubinemia
WO2016106303A1 (en) * 2014-12-23 2016-06-30 THE UNITED STATES OF AMERICA, as representd by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Adeno-associated virus vectors encoding modified g6pc and uses thereof

Also Published As

Publication number Publication date
EP3833746A1 (en) 2021-06-16
PL3833746T3 (pl) 2023-12-04
MA53268A (fr) 2021-11-17
IL280570A (en) 2021-03-25
EA202190475A1 (ru) 2021-04-16
WO2020030661A1 (en) 2020-02-13
EP4230733A1 (en) 2023-08-23
US20210292724A1 (en) 2021-09-23
PT3833746T (pt) 2023-05-25
DK3833746T3 (da) 2023-05-30
FI3833746T3 (fi) 2023-06-01
BR112021002202A2 (pt) 2021-05-04
JP2021532810A (ja) 2021-12-02
CA3107572A1 (en) 2020-02-13
JP2024054398A (ja) 2024-04-16
MA53268B1 (fr) 2023-06-28
CN112654698A (zh) 2021-04-13
EP3833746B1 (en) 2023-03-29
ES2946415T3 (es) 2023-07-18
AU2019317754A1 (en) 2021-02-18

Similar Documents

Publication Publication Date Title
CN110050063B (zh) 酸性α-葡萄糖苷酶变体及其用途
KR20210053902A (ko) 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde
CN109843930B (zh) 酸性α-葡萄糖苷酶变体及其用途
RU2742352C2 (ru) Векторы фактора fviii на основе аденоассоциированных вирусов, соответствующие вирусные частицы и содержащие их терапевтические композиции
KR102484396B1 (ko) 아데노-관련된 바이러스 인자 viii 벡터
US6544786B1 (en) Method and vector for producing and transferring trans-spliced peptides
CN109790528B (zh) 酸性α-葡萄糖苷酶变体及其用途
KR20190100318A (ko) 페닐케톤뇨증을 치료하기 위한 유전자 치료
KR20220007056A (ko) 뇌에서 증진된 특이성을 갖는 바이러스 조성물
CN112424345A (zh) Aav载体在青少年对象中的稳定表达
CN113316639A (zh) 用于治疗庞贝氏病的治疗性腺相关病毒
CN110914419A (zh) 糖原贮积病iii的治疗
CN114555808A (zh) 嵌合多肽及其用途
KR20220112262A (ko) Nadh 탈수소효소 단백질을 이용한 레버 유전성 시신경병증 치료용 조성물 및 방법
KR20230002788A (ko) 신피질 레이어 5 글루타메이트성 뉴런에서 유전자 발현을 선택적으로 조절하기 위한 인공 발현 작제물
US20220395582A1 (en) Compositions and methods of inducing differentiation of a hair cell
KR20230087436A (ko) 당뇨병을 치료하기 위한 변형된 인슐린 및 글루코키나제 핵산
RU2780329C2 (ru) Варианты кислой альфа-глюкозидазы и их использование
RU2780410C2 (ru) Варианты кислой альфа-глюкозидазы и их использование
RU2792432C2 (ru) Стабильная экспрессия векторов на основе аденоассоциированного вируса у несовершеннолетних пациентов
KR20230066453A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN117836420A (zh) 重组tert编码病毒基因组和运载体
TW202221119A (zh) Dna結合域轉活化子及其用途

Legal Events

Date Code Title Description
A201 Request for examination