KR20210082193A - 소형화 디스트로핀 및 그의 용도 - Google Patents
소형화 디스트로핀 및 그의 용도 Download PDFInfo
- Publication number
- KR20210082193A KR20210082193A KR1020217015030A KR20217015030A KR20210082193A KR 20210082193 A KR20210082193 A KR 20210082193A KR 1020217015030 A KR1020217015030 A KR 1020217015030A KR 20217015030 A KR20217015030 A KR 20217015030A KR 20210082193 A KR20210082193 A KR 20210082193A
- Authority
- KR
- South Korea
- Prior art keywords
- domain
- nucleic acid
- acid molecule
- leu
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/78—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Abstract
소형화 디스트로핀과 관련된 핵산 분자, 폴리펩티드, 세포, 벡터 및 제약 조성물이 본원에 개시된다. 소형화 디스트로핀의 생산 방법 및 치료적 사용 방법이 또한 개시된다.
Description
관련 출원에 대한 참조
본 출원은 2018년 10월 24일에 출원된 미국 가출원 번호 62/749982의 우선권 이익을 주장하며, 이는 그 전문이 본원에 참조로 포함된다.
분야
본원에 개시된 대상은 일반적으로 소형화 디스트로핀과 관련된 폴리뉴클레오티드, 폴리펩티드, 세포, 벡터, 용도 및 키트에 관한 것이다.
뒤시엔느 근육 이영양증 (DMD)은 3,500명의 남성 중 대략 1명이 앓고 있는 열성-유전성 근육 소모 장애이다. DMD는 X 염색체 상에 위치하는 디스트로핀 유전자 내의 돌연변이에 의해 유발된다. 이 유전자 내의 돌연변이는 디스트로핀 단백질의 이상 발현 또는 발현 부재로 이어진다.
디스트로핀은 근육 세포 완전성 및 기능의 조절을 담당하는 단백질 복합체의 주요 성분이다. DMD 환자는 전형적으로 소아기 동안 그 자신을 신체적으로 지탱하는 능력을 상실하고, 시간이 지남에 따라 점차적으로 더 약해진다. 이러한 골격근의 진행성 소모 및 심장 기능장애는 전형적으로, 주로 심장 또는 호흡 부전으로 인한 보행 상실 및 조기 사망으로 이어진다.
과거에 DMD를 치료하기 위한 일부 시도가 이루어졌다. 그러나, 이용가능한 치료 옵션은 야생형 디스트로핀 cDNA의 큰 크기 (대략 13.9 kb)로 인해 유의하게 제한되었으며, 이는 대략 4.9 kb 초과의 이종 DNA를 전달할 수 없는 아데노-연관 바이러스 (AAV)를 비롯한 표준 바이러스 벡터를 사용하여서는 DMD 환자에게 투여하여 발현시킬 수 없다. 따라서, 유전자 요법을 위한 벡터 내로 효율적으로 패키징될 수 있는 재조합 디스트로핀 유전자를 개발할 필요가 있다.
아데노-연관 바이러스 (AAV) 벡터는 감소된 또는 완전히 제거된 수준의 단백질 발현을 유발하는 유전적 결핍을 교정하는 것을 목표로 하는 유전자 치료 접근법에 유용한 것으로 나타났고 ([Nathwani et al.] 내지 [A.M Keeler et al.]), 유전자 녹다운, 게놈 편집 또는 변형 및 비-코딩 RNA 조정에 잠재적으로 유용하다 (Valdmanis et al., 2017).
디스트로핀의 근육-특이적 이소형의 전체 cDNA를 단일 rAAV 캡시드 내로 패키징하는 것은 디스트로핀 cDNA의 큰 크기 때문에 용이하게 달성될 수 없다. 이전의 연구는 디스트로핀의 특정한 도메인만을 발현하는 보다 작은 유전자 구축물의 개발에 초점을 맞추었다. 미국 특허 번호 6,869,777 및 8,501,920 (이들 각각은 참조로 포함됨)을 참조한다. 그러나, 이들 접근법은 단지 제한된 성공을 거두었다.
디스트로핀 유전자 내의 돌연변이를 갖는 환자를 치료하기 위한 보다 정확하고 효율적인 유전자 요법 도구에 대한 필요성, 특히 유전자 요법을 위한 벡터 내로 효율적으로 패키징될 수 있는 재조합 디스트로핀 유전자를 개발할 필요성이 남아있다.
본 개시내용은 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자이며, 여기서 소형화 디스트로핀 폴리펩티드는 디스트로핀의 스펙트린 반복부 2를 포함하지 않는 것인 핵산 분자를 제공한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인, 스펙트린 반복부 22 (R22) 도메인 또는 스펙트린 반복부 23 (R23) 도메인 또는 그의 임의의 조합을 포함하지 않는다. 일부 실시양태에서, R1 도메인은 펩티드 결합에 의해 R3 도메인에 직접 융합된다. 일부 실시양태에서, R1 도메인 및 R3 도메인은 아미노산 ARG-VAL (RV)에 의해 융합된다. 일부 실시양태에서, H2 도메인 및 R16 도메인은 링커에 의해 융합된다.
일부 실시양태에서, 링커는 서열식별번호(SEQ ID NO): 75 (IHTVREE TMMVMTEDMP LEI)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 nNOS 신호전달을 개선시킬 수 있다.
일부 실시양태에서, 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)를 포함하는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자가 본원에 개시되며, 여기서 핵산 분자는 서열식별번호: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATC)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일하고, 여기서 아미노산 서열은 nNOS 신호전달을 개선시킬 수 있다. 일부 실시양태에서, 아미노산 서열은 디스트로핀의 제1 도메인을 디스트로핀의 제2 도메인에 연결하는 링커이다. 일부 실시양태에서, 디스트로핀의 제1 도메인은 H2 도메인이고, 디스트로핀의 제2 도메인은 R16 도메인이다. 일부 실시양태에서, 아미노산 서열은 N 말단에 서열식별번호: 74의 서열을 추가로 포함한다.
일부 실시양태에서, 핵산 분자는 소형화 디스트로핀 폴리펩티드를 코딩한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함한다. 일부 실시양태에서, R1 도메인 및 R3 도메인은 아미노산 ARG-VAL (RV)에 의해 융합되고, H2 도메인 및 R16 도메인은 서열식별번호: 74-75의 조합에 제시된 아미노산 서열에 의해 융합된다. 일부 실시양태에서, (i) H1 도메인 및 R1 도메인은 직접 융합되거나, (ii) R3 도메인 및 H2 도메인은 직접 융합되거나, (iii) R16 및 R17 도메인은 직접 융합되거나, (iv) R17 및 R24 도메인은 직접 융합되거나, 또는 (v) R24 및 H4 도메인은 직접 융합되거나, 또는 (vi) 그의 임의의 조합이다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 ABD1 도메인 및/또는 CR 도메인을 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 아미노산 RV, R3 도메인, H2 도메인, 서열식별번호: 74-75에 제시된 바와 같은 아미노산 서열, R16 도메인, R17 도메인, R24 도메인, H4 도메인 및 CR 도메인으로 본질적으로 이루어지거나 또는 이로 이루어진다.
일부 실시양태에서, H1 도메인은 서열식별번호: 69에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R1 도메인은 서열식별번호: 70에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R3 도메인은 서열식별번호: 72에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H2 도메인은 서열식별번호: 73에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R16 도메인은 서열식별번호: 76에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R17 도메인은 서열식별번호: 77에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R24 도메인은 서열식별번호: 78에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H4 도메인은 서열식별번호: 79에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 68에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 N 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 80에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 C 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 118에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 뉴클레오티드 서열은 서열식별번호: 133의 뉴클레오티드 서열에 대해 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 (i) BXA-027741과 비교하여 더 낮은 CD4 증식을 갖는 것, (ii) BXA-027741과 비교하여 더 낮은 CD8 증식을 갖는 것, (iii) BXA-027741보다 더 높은 소형화 디스트로핀 폴리펩티드의 발현을 갖는 것, 및 (iv) 그의 임의의 조합으로 이루어진 군으로부터 선택된 1개 이상의 특성을 나타낸다.
일부 실시양태에서, 핵산 분자는, 스펙트린 반복부 1 (R1) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 핵산 분자는, 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 힌지 3 (H3) 도메인, 스펙트린 반복부 23 (R23) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.
일부 실시양태에서, (i) H1 도메인 및 R1 도메인은 직접 융합되거나, (ii) R16 및 R17 도메인은 직접 융합되거나, (iii) R17 및 H3 도메인은 직접 융합되거나, (iv) R23 및 R24 도메인은 직접 융합되거나, 또는 (v) R24 및 H4 도메인은 직접 융합되거나, 또는 (vi) 그의 임의의 조합이다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 3 (R3) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인 및/또는 스펙트린 반복부 22 (R22) 도메인을 포함하지 않는다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 ABD1 도메인 및/또는 CR 도메인을 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 서열식별번호: 84에 제시된 아미노산 서열, R16 도메인, R17 도메인, H3 도메인, R23 도메인, R24 도메인, H4 도메인 및 CR 도메인으로 본질적으로 이루어지거나 또는 이로 이루어진다. 일부 실시양태에서, H1 도메인은 서열식별번호: 82에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R1 도메인은 서열식별번호: 83에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R16 도메인은 서열식별번호: 85에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R17 도메인은 서열식별번호: 86에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H3 도메인은 서열식별번호: 87에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R23 도메인은 서열식별번호: 88에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R24 도메인은 서열식별번호: 89에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H4 도메인은 서열식별번호: 90에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 81에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 N 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 91에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 C 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 132에 대해 또는 C-말단 도메인이 결실된 서열식별번호: 132에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 뉴클레오티드 서열은 서열식별번호: 147 또는 서열식별번호: 148 또는 서열식별번호: 149의 뉴클레오티드 서열에 대해 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 BXA-196481보다 더 높은 소형화 디스트로핀 폴리펩티드의 발현을 나타낸다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드 발현은 BXA-196481 폴리펩티드 발현보다 적어도 약 1.5배, 적어도 약 1.6배, 적어도 약 1.7배, 적어도 약 1.8배, 적어도 약 1.9배, 적어도 약 2배, 적어도 약 2.1배, 적어도 약 2.2배, 적어도 약 2.3배, 적어도 약 2.4배, 적어도 약 2.5배, 적어도 약 2.6배, 적어도 약 2.7배, 적어도 약 2.8배, 적어도 약 2.9배 또는 적어도 약 3배 더 높다.
일부 실시양태에서, 핵산 분자는 프로모터를 추가로 포함한다. 일부 실시양태에서, 프로모터는 조직-특이적 프로모터이다. 일부 실시양태에서, 프로모터는 간세포, 근육 세포, 내피 세포, 뉴런 세포, 동모양 세포 또는 그의 임의의 조합에서 치료 단백질의 발현을 구동한다. 일부 실시양태에서, 프로모터는 마우스 티레틴 프로모터 (mTTR), 내인성 인간 인자 VIII 프로모터 (F8), 인간 알파-1-항트립신 프로모터 (hAAT), 인간 알부민 최소 프로모터, 마우스 알부민 프로모터, 트리스테트라프롤린 (TTP) 프로모터, CASI 프로모터, 시냅신 1 유전자 프로모터, CAG 프로모터, 시토메갈로바이러스 (CMV) 프로모터, α1-항트립신 (AAT), 근육 크레아틴 키나제 (MCK), 미오신 중쇄 알파 (αMHC), 미오글로빈 (MB), 데스민 (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK 및 포스포글리세레이트 키나제 (PGK) 프로모터로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 핵산 분자는 인트론 서열을 추가로 포함한다. 일부 실시양태에서, 인트론 서열은 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 5'에 위치한다. 일부 실시양태에서, 인트론 서열은 프로모터의 3'에 위치한다. 일부 실시양태에서, 인트론 서열은 합성 인트론 서열을 포함한다.
일부 실시양태에서, 핵산 분자는 전사후 조절 요소를 추가로 포함한다. 일부 실시양태에서, 전사후 조절 요소는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 3'에 위치한다. 일부 실시양태에서, 전사후 조절 요소는 돌연변이된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), 마이크로RNA 결합 부위 또는 DNA 핵 표적화 서열 또는 그의 임의의 조합을 포함한다.
일부 실시양태에서, 핵산 분자는 3'UTR 폴리(A) 테일 서열을 추가로 포함한다. 일부 실시양태에서, 3'UTR 폴리(A) 테일 서열은 bGH 폴리(A), 액틴 폴리(A), 헤모글로빈 폴리(A) 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 3'UTR 폴리(A) 테일 서열은 bGH 폴리(A)를 포함한다.
일부 실시양태에서, 핵산 분자는 인핸서 서열을 추가로 포함한다.
일부 실시양태에서, 핵산 분자는 제1 ITR 및/또는 제2 ITR을 추가로 포함한다. 일부 실시양태에서, 제1 ITR 및 제2 ITR은 동일하다. 일부 실시양태에서, 제1 ITR 및/또는 제2 ITR은 아데노-연관 바이러스로부터 유래된다.
일부 실시양태에서, 핵산 분자는 이종 모이어티를 포함한다. 일부 실시양태에서, 이종 모이어티는 알부민 또는 그의 단편, 이뮤노글로불린 Fc 영역, 인간 융모성 고나도트로핀의 β 서브유닛의 C-말단 펩티드 (CTP), PAS 서열, HAP 서열, 트랜스페린 또는 그의 단편, 알부민-결합 모이어티 또는 그의 유도체 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 본원에 개시된 핵산 분자를 포함하는 벡터가 제공된다. 일부 실시양태에서, 벡터는 아데노바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터, 바큘로바이러스 벡터, 헤르페스 바이러스 벡터로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다. 일부 실시양태에서, AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11로부터 선택된다. 일부 실시양태에서, AAV 벡터는 AAV9이다.
일부 실시양태에서, 본원에 개시된 핵산 분자 또는 벡터는 전달 작용제와 함께 제제화된다. 일부 실시양태에서, 전달 작용제는 지질 나노입자를 포함한다. 일부 실시양태에서, 전달 작용제는 리포솜, 비-지질 중합체 분자, 엔도솜 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 본원에 개시된 핵산 분자 또는 벡터는 정맥내, 경피, 피내, 피하, 폐 또는 경구 전달 또는 그의 임의의 조합을 위해 제제화된다. 일부 실시양태에서, 본원에 개시된 핵산 분자 또는 벡터는 정맥내 전달을 위해 제제화된다.
일부 실시양태에서, 본원에 개시된 핵산 분자 또는 벡터에 의해 코딩된 폴리펩티드가 제공된다.
일부 실시양태에서, 본원에 개시된 핵산 분자를 포함하는 숙주 세포가 제공된다. 일부 실시양태에서, 세포는 CHO 세포, HEK293 세포, HBK 세포, COS 세포, NSO 세포 또는 HT1080 세포이다.
일부 실시양태에서, (a) 본원에 개시된 핵산, 본원에 개시된 벡터, 본원에 개시된 폴리펩티드 또는 본원에 개시된 숙주 세포; 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 제공된다.
일부 실시양태에서, 본원에 개시된 핵산, 본원에 개시된 벡터, 본원에 개시된 폴리펩티드, 본원에 개시된 숙주 세포 또는 본원에 개시된 제약 조성물, 및 핵산 분자를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 제공된다.
일부 실시양태에서, 본원에 개시된 숙주 세포를 적합한 조건 하에 배양하고, 소형화 디스트로핀 폴리펩티드를 회수하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드를 생산하는 방법이 제공된다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에게 본원에 개시된 핵산, 본원에 개시된 벡터, 본원에 개시된 숙주 세포 또는 본원에 개시된 제약 조성물을 투여하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에서 소형화 디스트로핀 폴리펩티드를 발현시키는 방법이 제공된다.
일부 실시양태에서, 질환 또는 상태를 갖는 대상체에게 본원에 개시된 핵산, 본원에 개시된 벡터, 본원에 개시된 폴리펩티드, 본원에 개시된 숙주 세포 또는 본원에 개시된 제약 조성물을 투여하는 것을 포함하는, 질환 또는 상태를 갖는 대상체를 치료하는 방법이 제공된다. 일부 실시양태에서, 질환 또는 상태는 디스트로핀 결핍에 의해 유발된 질환이다. 일부 실시양태에서, 질환은 근육감소증, 심장 질환, 악액질, 뒤시엔느 근육 이영양증 (DMD), 베커 근육 이영양증 (BMD), X-연관 확장성 심근병증 (XLDC), 안면견갑상완 근육 이영양증, 근긴장성 근육 이영양증, 지대 근육 이영양증, 안인두 근육 이영양증, 에머리-드레이푸스 근육 이영양증, 원위 근육 이영양증 및/또는 선천성 근육 이영양증이다. 일부 실시양태에서, 제86항 내지 제89항 중 어느 한 항에 있어서, 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물이 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여되는 것인 방법. 일부 실시양태에서, 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물은 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여된다.
일부 실시양태에서, 방법은 대상체에게 제2 작용제를 투여하는 것을 추가로 포함한다.
일부 실시양태에서, 대상체는 인간이다. 일부 실시양태에서, 대상체에게 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물을 투여하는 것은, 투여 전 대상체에서의 디스트로핀 단백질 발현에 비해 증가된 디스트로핀 단백질 발현을 유발하며, 여기서 디스트로핀 단백질 발현은 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배 또는 적어도 약 100배만큼 증가된다.
일부 실시양태에서, 힌지 2 (H2) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 H2 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자가 본원에 개시된다.
도 1은 전장 인간 디스트로핀 단백질의 개략적 다이어그램을 보여준다. ABD1: 액틴-결합 도메인-1; H# (예를 들어, H1): 힌지 영역; R# (예를 들어, R1): 스펙트린-유사 반복부 도메인; ABD2: 액틴-결합 도메인-2; CR: 시스테인-풍부 도메인; C-말단: 단백질의 C-말단 도메인.
도 2는 소형화 디스트로핀 폴리펩티드 BXA-027741, BXA-027742, BXA-027743, BXA-027744, BXA-196480 및 BXA-196481, 뿐만 아니라 참조 포인트로서, 도 1의 전장 인간 디스트로핀 단백질의 개략적 다이어그램을 보여준다.
도 3은 표시된 소형화 디스트로핀 폴리펩티드를 발현하는 플라스미드의 형질감염 후 인간 동질유전자 유도-만능 줄기 세포 (iPSC)-유래 심근세포 (iCM) (내인성 디스트로핀 발현을 방지하는, 디스트로핀 유전자 내의 E2035X 조기 정지 코돈을 보유함)에서의 소형화 디스트로핀 mRNA 발현 대비 소형화 디스트로핀 폴리펩티드 발현의 비를 보여준다.
도 4는 BXA-027743의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 132), 뿐만 아니라 표시된 바와 같은 비교적 낮은 면역원성을 갖는 그의 접합부 J1 및 J7의 아미노산 서열의 개략적 다이어그램을 보여준다.
도 5는 BXA-027741의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 129) (여기서 화살표는 그의 접합부 J10, J11 및 J9를 가리킴)의 개략적 다이어그램을 보여준다.
도 6a는 시험된 40개-샘플 세포 패널 중, 표시된 바와 같은 다양한 접합부 펩티드로 펄싱되고 CD4+ 증식성 세포를 가진 샘플의 비율을 나타내는 히스토그램을 보여준다 (각각의 유색 정사각형은 1개의 환자 샘플을 나타냄). 도 6b는 시험된 40개-샘플 세포 패널 중, 표시된 바와 같은 다양한 접합부 펩티드로 펄싱되고 CD8+ 증식성 세포를 가진 샘플의 비율을 나타내는 히스토그램을 보여준다 (각각의 유색 정사각형은 1개의 환자 샘플을 나타냄).
도 7은 BXA-196473의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 119)의 개략적 다이어그램을 보여준다.
도 8a는 BXA-196477의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 118)의 개략적 다이어그램을 보여준다. RV: R1과 R3 사이의 아르기닌-발린 디펩티드; SEAQ: 세린-글루탐산-알라닌-글루타민 펩티드. 도 8b는 소형화 디스트로핀 폴리펩티드 BXA-027741 (서열식별번호: 129)의 R1과 R3 사이의 원래 접합부 10 주위에서의 3차원 폴딩 (좌측), 및 소형화 디스트로핀 폴리펩티드 BXA-196477 (서열식별번호: 118)의 접합부 10 버전 3 주위에서의 3차원 폴딩 (우측)을 보여준다.
도 9는 표시된 소형화 디스트로핀 폴리펩티드를 발현하는 플라스미드의 형질감염 후 인간 동질유전자 유도-만능 줄기 세포 (iPSC)-유래 심근세포 (iCM) (내인성 디스트로핀 발현을 방지하는, 디스트로핀 유전자 내의 E2035X 조기 정지 코돈을 보유함)에서의 소형화 디스트로핀 mRNA 발현 대비 소형화 디스트로핀 폴리펩티드 발현의 비를 보여준다.
도 10은 BXA-196474의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 120)의 개략적 다이어그램을 보여준다.
도 11은 BXA-196475의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 121)의 개략적 다이어그램을 보여준다.
도 12는 BXA-196476의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 122)의 개략적 다이어그램을 보여준다.
도 13은 BXA-196478의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 124)의 개략적 다이어그램을 보여준다.
도 14는 BXA-196479의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 125)의 개략적 다이어그램을 보여준다.
도 15 BXA-196477 및 BXA-213788의 소형화 디스트로핀 폴리펩티드를 발현하는 AAV9-구축물로 감염된 인간 DMD hiPSC CM에서의 전도 속도. 도 15a는 실험에 사용된 다중 전극 어레이 (MEA)의 사진 (좌측) 및 MEA의 개별 전극의 사진 (우측)을 보여준다. 도 15b는 실험 조건 하에 MEA의 28개 전극으로부터의 신호를 보여준다. 도 15c는 어레이를 가로지르는 임펄스 전도를 예시하는 그래프를 보여준다. 도 15d는 BXA-196477 (서열식별번호: 118) 및 BXA-213788 (서열식별번호: 152)의 소형화 디스트로핀 폴리펩티드의 개략적 다이어그램을 보여준다. 도 15e는 BXA-196477 (서열식별번호: 118) 및 BXA-213788의 소형화 디스트로핀 폴리펩티드를 발현하는 인간 DMD hiPSC CM의 전도 속도가 형질감염 후 시간의 함수로서 플롯팅된 그래프를 보여준다. 도 15f는 전도 속도가 측정된 세포에서의 소형화 디스트로핀 폴리펩티드의 발현을 나타내는 히스토그램을 보여준다.
도 16은 수행된 생체내 연구의 실험 설정을 요약한 개략도를 보여준다.
도 17 AAV9-BXA-196477 또는 AAV9-BXA-213788의 표적 결속. 도 17b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스의 근육 조직에서의 소형화 디스트로핀 폴리펩티드 및 밀 배아-응집소 (WGA) 발현의 면역-형광 가시화를 보여준다. 도 17a는 소형화 디스트로핀에 대해 양성인 다양한 근육 내 세포의 상대 수를 나타내는 히스토그램을 보여준다. 대각선 패턴을 갖는 막대 = WGA 양성 세포의 비율로서의 % BXA-196477 소형화 디스트로핀 양성 세포; 종축 패턴을 갖는 막대 = WGA 양성 세포의 비율로서의 % BXA-213788 소형화 디스트로핀.
도 18 4주령의 mdx4cv 마우스에서 결정된 AAV9-BXA-196477 또는 AAV9-BXA-213788의 표적 결속. 도 18a는 BXA-196477 (서열식별번호: 118) 및 BXA-213788 (서열식별번호: 152)의 소형화 디스트로핀 폴리펩티드의 개략적 다이어그램을 보여준다. 도 18b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스의 근육 조직에서의 바이러스 게놈의 상대량을 나타내는 히스토그램을 보여준다. 도 18c는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스의 심장에서의 소형화 디스트로핀 mRNA의 상대량을 나타내는 히스토그램을 보여준다. 도 18d는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스의 근육 조직에서의 소형화 디스트로핀 단백질의 상대량을 나타내는 히스토그램을 보여준다. Dia = 횡경막; Gas = 비복근; TA = 전경골근. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 19a는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스 (4주)의 혈청 중 크레아틴 키나제의 양을 나타내는 히스토그램을 보여준다. 도 19b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스 (12주)의 혈청 중 크레아틴 키나제의 양을 나타내는 히스토그램을 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 20 2개월령에서의 피크 테타니성 수축. 도 20a는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스 mdx4cv에서의 수축 특성 (힘 (뉴턴 미터 단위; Nm))을 나타내는 그래프를 보여준다. 도 20b는 처리된 마우스에서의 피크 테타니성 수축을 나타내는 히스토그램을 보여준다. 도 20c는 처리된 마우스에서의 TA 질량을 나타내는 히스토그램을 보여준다. 도 20d는 처리된 마우스에서의 힘/TA 질량을 나타내는 히스토그램을 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 21 수축-유도된 손상으로부터의 보호. 도 21a는 실험 설정을 약술하는 그래프를 보여준다. 도 21b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스에서의 근육의 수축 특성 (최대 등척성 토크)을 나타내는 그래프를 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 22a는 BXA-027741의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 129)의 개략적 다이어그램을 보여준다. 도 22b는 접합부 펩티드 1 내지 12의 면역원성을 나타내는 히스토그램을 보여준다.
도 23a는 접합부 펩티드에 대한 MHC I/CD8+ 면역 반응을 나타내는 히스토그램을 보여준다. 여기서 펩티드 J11v3은 도 22b의 펩티드 번호 3과 동일한 펩티드이다.
도 23b는 접합부 펩티드에 대한 MHC II/CD4+ 면역 반응을 나타내는 히스토그램을 보여준다. 여기서 펩티드 J11v3은 도 22b의 펩티드 번호 3과 동일한 펩티드이다.
도 2는 소형화 디스트로핀 폴리펩티드 BXA-027741, BXA-027742, BXA-027743, BXA-027744, BXA-196480 및 BXA-196481, 뿐만 아니라 참조 포인트로서, 도 1의 전장 인간 디스트로핀 단백질의 개략적 다이어그램을 보여준다.
도 3은 표시된 소형화 디스트로핀 폴리펩티드를 발현하는 플라스미드의 형질감염 후 인간 동질유전자 유도-만능 줄기 세포 (iPSC)-유래 심근세포 (iCM) (내인성 디스트로핀 발현을 방지하는, 디스트로핀 유전자 내의 E2035X 조기 정지 코돈을 보유함)에서의 소형화 디스트로핀 mRNA 발현 대비 소형화 디스트로핀 폴리펩티드 발현의 비를 보여준다.
도 4는 BXA-027743의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 132), 뿐만 아니라 표시된 바와 같은 비교적 낮은 면역원성을 갖는 그의 접합부 J1 및 J7의 아미노산 서열의 개략적 다이어그램을 보여준다.
도 5는 BXA-027741의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 129) (여기서 화살표는 그의 접합부 J10, J11 및 J9를 가리킴)의 개략적 다이어그램을 보여준다.
도 6a는 시험된 40개-샘플 세포 패널 중, 표시된 바와 같은 다양한 접합부 펩티드로 펄싱되고 CD4+ 증식성 세포를 가진 샘플의 비율을 나타내는 히스토그램을 보여준다 (각각의 유색 정사각형은 1개의 환자 샘플을 나타냄). 도 6b는 시험된 40개-샘플 세포 패널 중, 표시된 바와 같은 다양한 접합부 펩티드로 펄싱되고 CD8+ 증식성 세포를 가진 샘플의 비율을 나타내는 히스토그램을 보여준다 (각각의 유색 정사각형은 1개의 환자 샘플을 나타냄).
도 7은 BXA-196473의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 119)의 개략적 다이어그램을 보여준다.
도 8a는 BXA-196477의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 118)의 개략적 다이어그램을 보여준다. RV: R1과 R3 사이의 아르기닌-발린 디펩티드; SEAQ: 세린-글루탐산-알라닌-글루타민 펩티드. 도 8b는 소형화 디스트로핀 폴리펩티드 BXA-027741 (서열식별번호: 129)의 R1과 R3 사이의 원래 접합부 10 주위에서의 3차원 폴딩 (좌측), 및 소형화 디스트로핀 폴리펩티드 BXA-196477 (서열식별번호: 118)의 접합부 10 버전 3 주위에서의 3차원 폴딩 (우측)을 보여준다.
도 9는 표시된 소형화 디스트로핀 폴리펩티드를 발현하는 플라스미드의 형질감염 후 인간 동질유전자 유도-만능 줄기 세포 (iPSC)-유래 심근세포 (iCM) (내인성 디스트로핀 발현을 방지하는, 디스트로핀 유전자 내의 E2035X 조기 정지 코돈을 보유함)에서의 소형화 디스트로핀 mRNA 발현 대비 소형화 디스트로핀 폴리펩티드 발현의 비를 보여준다.
도 10은 BXA-196474의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 120)의 개략적 다이어그램을 보여준다.
도 11은 BXA-196475의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 121)의 개략적 다이어그램을 보여준다.
도 12는 BXA-196476의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 122)의 개략적 다이어그램을 보여준다.
도 13은 BXA-196478의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 124)의 개략적 다이어그램을 보여준다.
도 14는 BXA-196479의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 125)의 개략적 다이어그램을 보여준다.
도 15 BXA-196477 및 BXA-213788의 소형화 디스트로핀 폴리펩티드를 발현하는 AAV9-구축물로 감염된 인간 DMD hiPSC CM에서의 전도 속도. 도 15a는 실험에 사용된 다중 전극 어레이 (MEA)의 사진 (좌측) 및 MEA의 개별 전극의 사진 (우측)을 보여준다. 도 15b는 실험 조건 하에 MEA의 28개 전극으로부터의 신호를 보여준다. 도 15c는 어레이를 가로지르는 임펄스 전도를 예시하는 그래프를 보여준다. 도 15d는 BXA-196477 (서열식별번호: 118) 및 BXA-213788 (서열식별번호: 152)의 소형화 디스트로핀 폴리펩티드의 개략적 다이어그램을 보여준다. 도 15e는 BXA-196477 (서열식별번호: 118) 및 BXA-213788의 소형화 디스트로핀 폴리펩티드를 발현하는 인간 DMD hiPSC CM의 전도 속도가 형질감염 후 시간의 함수로서 플롯팅된 그래프를 보여준다. 도 15f는 전도 속도가 측정된 세포에서의 소형화 디스트로핀 폴리펩티드의 발현을 나타내는 히스토그램을 보여준다.
도 16은 수행된 생체내 연구의 실험 설정을 요약한 개략도를 보여준다.
도 17 AAV9-BXA-196477 또는 AAV9-BXA-213788의 표적 결속. 도 17b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스의 근육 조직에서의 소형화 디스트로핀 폴리펩티드 및 밀 배아-응집소 (WGA) 발현의 면역-형광 가시화를 보여준다. 도 17a는 소형화 디스트로핀에 대해 양성인 다양한 근육 내 세포의 상대 수를 나타내는 히스토그램을 보여준다. 대각선 패턴을 갖는 막대 = WGA 양성 세포의 비율로서의 % BXA-196477 소형화 디스트로핀 양성 세포; 종축 패턴을 갖는 막대 = WGA 양성 세포의 비율로서의 % BXA-213788 소형화 디스트로핀.
도 18 4주령의 mdx4cv 마우스에서 결정된 AAV9-BXA-196477 또는 AAV9-BXA-213788의 표적 결속. 도 18a는 BXA-196477 (서열식별번호: 118) 및 BXA-213788 (서열식별번호: 152)의 소형화 디스트로핀 폴리펩티드의 개략적 다이어그램을 보여준다. 도 18b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스의 근육 조직에서의 바이러스 게놈의 상대량을 나타내는 히스토그램을 보여준다. 도 18c는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스의 심장에서의 소형화 디스트로핀 mRNA의 상대량을 나타내는 히스토그램을 보여준다. 도 18d는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스의 근육 조직에서의 소형화 디스트로핀 단백질의 상대량을 나타내는 히스토그램을 보여준다. Dia = 횡경막; Gas = 비복근; TA = 전경골근. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 19a는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스 (4주)의 혈청 중 크레아틴 키나제의 양을 나타내는 히스토그램을 보여준다. 도 19b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 mdx4cv 마우스 (12주)의 혈청 중 크레아틴 키나제의 양을 나타내는 히스토그램을 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 20 2개월령에서의 피크 테타니성 수축. 도 20a는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스 mdx4cv에서의 수축 특성 (힘 (뉴턴 미터 단위; Nm))을 나타내는 그래프를 보여준다. 도 20b는 처리된 마우스에서의 피크 테타니성 수축을 나타내는 히스토그램을 보여준다. 도 20c는 처리된 마우스에서의 TA 질량을 나타내는 히스토그램을 보여준다. 도 20d는 처리된 마우스에서의 힘/TA 질량을 나타내는 히스토그램을 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 21 수축-유도된 손상으로부터의 보호. 도 21a는 실험 설정을 약술하는 그래프를 보여준다. 도 21b는 AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리된 마우스에서의 근육의 수축 특성 (최대 등척성 토크)을 나타내는 그래프를 보여준다. 처리된 마우스를 야생형 및 mdx4cv 비-처리된 마우스와 비교하였다.
도 22a는 BXA-027741의 소형화 디스트로핀 폴리펩티드 (서열식별번호: 129)의 개략적 다이어그램을 보여준다. 도 22b는 접합부 펩티드 1 내지 12의 면역원성을 나타내는 히스토그램을 보여준다.
도 23a는 접합부 펩티드에 대한 MHC I/CD8+ 면역 반응을 나타내는 히스토그램을 보여준다. 여기서 펩티드 J11v3은 도 22b의 펩티드 번호 3과 동일한 펩티드이다.
도 23b는 접합부 펩티드에 대한 MHC II/CD4+ 면역 반응을 나타내는 히스토그램을 보여준다. 여기서 펩티드 J11v3은 도 22b의 펩티드 번호 3과 동일한 펩티드이다.
5.1 개관
본 개시내용은 신규 소형화 디스트로핀 또는 이를 코딩하는 유전자에 관한 것이다. 소형화 디스트로핀은 조절 카세트에 작동가능하게 연결될 수 있다. 본 개시내용은 또한 근육 이영양증, 근육감소증, 심부전 또는 악액질을 갖는 대상체를 치료하는 방법에 관한 것이다. 추가로, 본 개시내용은 근육 이영양증, 근육감소증, 심부전 또는 악액질이 발생할 위험이 있는 대상체를 예방적으로 치료하는 방법에 관한 것이다. 근육 이영양증, 근육감소증, 심부전 또는 악액질을 갖거나 또는 이것이 발생할 위험이 있는 대상체를 치료하는 방법은 대상체에게 소형화 디스트로핀 유전자 및 전달 비히클을 포함하는 제약 조성물을 투여하는 것을 포함할 수 있다.
5.2 정의
본 개시내용이 보다 용이하게 이해될 수 있도록, 특정 용어가 먼저 정의된다. 본원에 달리 명백하게 제공된 경우를 제외하고는, 본 출원에 사용된 하기 용어들 각각은 하기에 제시된 의미를 가질 것이다. 추가의 정의는 본 출원 전체에 걸쳐 제시된다.
본원에 사용된 용어 "및/또는"은 2개의 명시된 특색 또는 성분 각각이 다른 것과 함께 또는 그 없이 구체적으로 개시된 것으로 여겨져야 한다. 따라서, 본원에서 "A 및/또는 B"와 같은 어구에 사용된 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" (단독) 및 "B" (단독)를 포함하는 것으로 의도된다. 마찬가지로, "A, B 및/또는 C"와 같은 어구에 사용된 용어 "및/또는"은 하기 측면 각각을 포괄하는 것으로 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A (단독); B (단독); 및 C (단독).
측면이 용어 "포함하는"을 사용하여 본원에 기재된 경우에, "로 이루어진" 및/또는 "로 본질적으로 이루어진"과 관련하여 기재된 것 외에 다른 것은 유사한 측면이 또한 제공되는 것으로 이해된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 과학 용어는 본 개시내용이 관련된 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 예를 들어, 문헌 [the Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press; The Dictionary of Cell and Molecular Biology, 3rd ed., 1999, Academic Press; 및 the Oxford Dictionary Of Biochemistry And Molecular Biology, Revised, 2000, Oxford University Press]은 통상의 기술자에게 본 개시내용에 사용된 많은 용어의 일반적 사전을 제공한다.
단위, 접두어 및 기호는 시스템 인터내셔널 드 유니테스(Systeme International de Unites) (SI) 허용 형태로 표시된다. 수치 범위는 범위를 정의하는 숫자를 포함한다. 본원에 제공된 표제는 본 개시내용의 다양한 측면을 제한하는 것이 아니며, 본 명세서를 전체로서 참조할 수 있다. 따라서, 바로 하기에 정의된 용어는 본 명세서를 그 전체로 참조하여 보다 충분히 정의된다.
디스트로핀 (DMD)은 디스트로핀을 코딩하는 대형 인간 X-연관 유전자이다. 단백질 디스트로핀은 근초의 세포질 면에 국재화되어 있는 427 kDa 세포골격 단백질이고, 근섬유 내 코스타미어에 풍부하다. 디스트로핀 단백질은 4개의 주요 기능적 도메인을 갖는다: 액틴-결합 아미노-말단 도메인 (ABD1); 힌지 및 "스펙트린 반복부 도메인"으로 불리는 일련의 막대를 포함하는 중앙 막대 도메인; 시스테인-풍부 도메인; 및 카르복실-말단.
본원에 사용된 용어 "소형화 디스트로핀 폴리펩티드" 또는 "소형화 디스트로핀 펩티드"는 전장 야생형 디스트로핀 폴리펩티드보다 크기가 더 작은 폴리펩티드를 지칭한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 DMD 동물 모델에서 근육 생리학 또는 해부학의 측정가능한 값을 야생형 값의 적어도 대략 10 또는 20%만큼 변경 (경우에 따라 증가 또는 감소)시켜, 이러한 값이 야생형 값에 더 가깝도록 할 수 있다 (예를 들어, mdx 마우스는 야생형 값의 50%인 근육 생리학 또는 해부학의 측정가능한 값을 갖고, 이러한 값은 야생형 값의 적어도 60%로 증가되거나; 또는 mdx 마우스는 야생형 값의 150%인 근육 생리학 또는 해부학의 측정가능한 값을 갖고, 이러한 값은 야생형 값의 최대 140%로 감소됨). 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 DMD 동물 모델에서 근육 생리학 또는 해부학의 측정가능한 값을 야생형 값의 적어도 대략 30%만큼 변경시킬 수 있다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 DMD 동물 모델에서 근육 생리학 또는 해부학의 측정가능한 값을 야생형 값과 유사한 수준 (예를 들어, ±4%)으로 변경시킬 수 있다.
본원에 사용된 용어 "스펙트린 반복부" 또는 "스펙트린-유사 반복부"는 디스트로핀을 포함하나 이에 제한되지는 않는 많은 구조 단백질의 막대-유사 형상을 담당하는 대략 100개의 아미노산으로 구성된 펩티드를 지칭하며, 여기서 스펙트린 반복부는 전형적으로 다수의 카피로 존재한다. 스펙트린 반복부는 자연 펩티드 서열의 돌연변이, 예컨대 아미노산 서열에서의 보존적 및/또는 비-보존적 변화, 뿐만 아니라 스펙트린 반복부의 말단에/말단으로부터 또는 스펙트린 반복부 내에 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산의 부가 또는 결실을 포함할 수 있다. 일부 실시양태에서, 각각의 스펙트린 반복부 (각각의 R1 내지 R24)는 자연 발생 스펙트린 반복부 (각각의 자연 발생 R1 내지 R24)에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는다.
본원에 사용된 용어 "스펙트린 반복부 코딩 서열"은 스펙트린 반복부 펩티드를 코딩하는 핵산 서열을 지칭한다. 이 용어는 스펙트린 반복부 (예를 들어, 자연 발생 및 돌연변이된 스펙트린 반복부 펩티드 둘 다)를 코딩하는 자연 및 합성 핵산 서열을 포함한다.
본원에 사용된 용어 "스펙트린 반복부 도메인"은 소형화 디스트로핀 폴리펩티드의 스펙트린 반복부를 함유하는 소형화 디스트로핀 폴리펩티드 내의 영역을 지칭한다.
용어 "융합된"은 제1 아미노산 서열이 자연에서 정상적으로는 연결되지 않는 제2 아미노산 서열에 인 프레임으로 연결되어 "융합" 단백질/폴리펩티드를 형성하는 것을 지칭한다. 정상적으로는 별개의 단백질에 존재하는 이들 융합된 아미노산 서열이 융합 폴리펩티드에서 합쳐질 수 있거나, 또는 정상적으로는 동일한 단백질에 존재하는 아미노산 서열이 융합 폴리펩티드에서 새로운 배열로 위치될 수 있다. 융합 단백질은, 예를 들어 화학적 펩티드 합성에 의해 또는 재조합 DNA 기술에 의해 생성되며, 이에 의해 폴리뉴클레오티드가 생성되고, 이어서 번역되며, 여기서 펩티드 영역은 목적하는 관계로 코딩된다. 융합 단백질은 또한 공유, 비-펩티드 결합에 의해 또는 비-공유 결합에 의해 제1 아미노산 서열과 회합된 제2 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 2개의 폴리펩티드 사이의 "융합"은 링커에 의해 달성된다. 링커는 아미노산 또는 다른 화학 구조일 수 있다. 일부 실시양태에서, 링커는 합성일 수 있다.
일부 실시양태에서, 2개의 폴리펩티드 사이의 "융합"은 직접 융합, 즉 개재 링커가 없는 융합이다. 용어 "직접 융합된" 또는 "직접 융합"은 펩티드 결합에 의한 2개의 폴리펩티드 쇄 사이의 연결을 지칭한다. 예를 들어, 제1 아미노산이 펩티드 결합에 의해 제2 아미노산에 "융합된" 경우에 제1 아미노산이 제2 아미노산에 "직접 융합된"다.
각각 보다 큰 폴리펩티드 또는 폴리뉴클레오티드의 부분인 폴리펩티드 모이어티 또는 폴리뉴클레오티드 모이어티와 관련하여 "이종" 및 "이종 모이어티"는, 폴리펩티드 또는 폴리뉴클레오티드가 그 폴리펩티드 또는 폴리뉴클레오티드 분자의 나머지 부분과 상이한 폴리펩티드 또는 폴리뉴클레오티드로부터 기원하는 것을 기재한다. 폴리펩티드 또는 폴리뉴클레오티드의 추가의 이종 성분은 각각 본원에 기재된 나머지 폴리펩티드 또는 폴리뉴클레오티드와 동일한 유기체로부터 기원할 수 있거나 또는 추가의 성분은 상이한 유기체로부터의 것일 수 있다. 예를 들어, 이종 폴리펩티드는 합성이거나, 또는 상이한 종, 개체의 상이한 세포 유형, 또는 별개의 개체의 세포의 동일한 또는 상이한 유형으로부터 유래될 수 있다. 한 측면에서, 이종 모이어티는 폴리펩티드를 생산하기 위해 또 다른 폴리펩티드에 융합된 폴리펩티드이다. 또 다른 측면에서, 이종 모이어티는 비-폴리펩티드, 예컨대 폴리펩티드 또는 단백질에 접합된 PEG이다.
본원에 사용된 용어 "근육 세포"는 골격근, 평활근 (예를 들어, 소화관, 방광 및 혈관으로부터) 및 심장 근육으로부터 유래된 세포를 포함하나 이에 제한되지는 않는, 근육 조직으로부터 유래된 세포를 지칭한다. 상기 용어는 시험관내, 생체외 및 생체내 근육 세포를 포함한다. 따라서, 예를 들어 단리된 심근세포는 세포가 대상체에서 생체내 존재하는 근육 조직에 존재하는 것처럼 근육 세포를 구성할 것이다. 이 용어는 또한 말단 분화된 및 비분화된 근육 세포 둘 다, 예컨대 근세포, 근관, 근모세포, 심근세포 및 심근모세포를 포괄한다.
유전자 조절 요소 (예를 들어, 인핸서 서열, 프로모터 서열)와 관련하여 본원에 사용된 용어 "근육-특이적"은 조절 요소가 다른 조직에서 조절 요소에 의해 구동되는 전사 활성과 비교하여 주로 근육 세포 또는 조직에서 전사 활성을 구동한다는 것 (예를 들어, 20:1)을 의미한다. 조절 요소의 근육-특이성을 결정하기 위한 검정이 관련 기술분야에 공지되어 있다 (예를 들어, 베타-갈락토시드 리포터의 발현을 구동하는 시험될 조절 요소를 포함하는 발현 벡터로 형질감염된 뮤린 근육 세포 및 간 세포를 사용하는 시험관내 검정).
본원에 사용된 용어 "아데노-연관 바이러스" 또는 "AAV"는 AAV 유형 1, AAV 유형 2, AAV 유형 3 (유형 3A 및 3B 포함), AAV 유형 4, AAV 유형 5, AAV 유형 6, AAV 유형 7, AAV 유형 8, AAV 유형 9, AAV 유형 10, AAV 유형 11, AAV 유형 12, AAV 유형 13, 뱀 AAV, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 양 AAV, 염소 AAV, 새우 AAV, 영장류 AAV, 비-영장류 AAV 및 양 AAV, 문헌 [Gao et al. (J. Virol. 78:6381 (2004)) 및 Moris et al. (Virol. 33:375 (2004))]에 의해 개시된 이들 AAV 혈청형 및 계통군, 및 현재 공지되어 있거나 또는 나중에 발견되는 임의의 다른 AAV를 포함하나 이에 제한되지는 않는다. 예를 들어, 문헌 [Fields et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers)]을 참조한다. AAV는 바이러스의 파르보비리다에 과 내의 데펜도파르보바이러스를 지칭한다. 예를 들어, AAV는 자연 발생 "야생형" 바이러스로부터 유래된 AAV, 자연 발생 cap 유전자에 의해 코딩되는 캡시드 단백질로부터 유래된 캡시드 내로 패키징된 재조합 AAV (rAAV) 게놈 및/또는 비-자연 캡시드 cap 유전자에 의해 코딩되는 캡시드 단백질로부터 유래된 캡시드 내로 패키징된 rAAV 게놈으로부터 유래된 AAV일 수 있다. 본원에 사용된 "AAV"는 바이러스 그 자체 또는 그의 유도체를 지칭하는데 사용될 수 있다. 상기 용어는 달리 명백하게 나타낸 경우를 제외하고는 모든 하위유형 및 자연 발생 및 재조합 형태 둘 다를 포괄한다. "영장류 AAV"는 영장류를 감염시키는 AAV를 지칭하고, "비-영장류 AAV"는 영장류 이외의 동물을 감염시키는 AAV를 지칭하고, "소 AAV"는 소 포유동물 등을 감염시키는 AAV를 지칭한다. 예를 들어, 문헌 [BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapter 69 (3 d ed., Lippincott-Raven Publishers)]을 참조한다.
용어 "rAAV"는 "재조합 AAV"를 지칭한다. 일부 실시양태에서, 재조합 AAV는 rep 및 cap 유전자의 일부 또는 모두가 이종 폴리뉴클레오티드 서열로 대체된 AAV 게놈을 갖는다.
본원에 사용된 "AAV 벡터" 또는 "아데노-연관 바이러스 벡터"는 AAV 기원이 아닌 폴리뉴클레오티드 서열 (즉, AAV에 대해 이종인 폴리뉴클레오티드), 전형적으로 세포의 유전자 형질전환을 위한 관심 서열을 포함하는 rAAV를 지칭한다. 일반적으로, 이종 폴리뉴클레오티드에는 적어도 1개 및 일반적으로 2개의 AAV 역전된 말단 반복부 서열 (ITR)이 플랭킹되어 있다.
"캡시드-무함유" 또는 "캡시드-부재" (또는 그의 변이) 바이러스 (예를 들어, AAV) 게놈 또는 핵산 분자는 캡시드가 없는 게놈 또는 핵산 분자를 지칭한다. 일부 실시양태에서, 캡시드-부재 게놈 또는 핵산 분자는, 예를 들어 AAV Rep 단백질을 코딩하는 서열을 함유하지 않는다.
"AAV" 또는 "AAV 바이러스 입자" 또는 "AAV 벡터" 또는 "rAAV 벡터 입자"는 적어도 1종의 AAV 캡시드 단백질 (전형적으로는 야생형 AAV의 모든 캡시드 단백질) 및 캡시드화 폴리뉴클레오티드로 구성된 바이러스 입자를 지칭한다. 입자가 이종 폴리뉴클레오티드 (즉, 야생형 AAV 게놈 이외의 폴리뉴클레오티드, 예컨대 포유동물 세포로 전달될 트랜스진)를 포함하는 경우에, 이는 전형적으로 "rAAV 벡터 입자" 또는 간단히 "AAV 벡터"로 지칭된다.
AAV에 대한 "헬퍼 바이러스"는 AAV (예를 들어, 야생형 AAV)가 포유동물 세포에 의해 복제 및 패키징되도록 하는 바이러스를 지칭한다. 아데노바이러스, 헤르페스바이러스 및 폭스바이러스, 예컨대 백시니아를 포함한, AAV에 대한 이러한 다양한 헬퍼 바이러스가 관련 기술분야에 공지되어 있다. 아데노바이러스는 다수의 상이한 하위군을 포괄하며, 하위군 C의 아데노바이러스 유형 5가 가장 통상적으로 사용된다. 인간, 비-인간 포유동물 및 조류 기원의 수많은 아데노바이러스가 공지되어 있고, 기탁기관, 예컨대 ATCC로부터 입수가능하다. 헤르페스 과의 바이러스는, 예를 들어 단순 포진 바이러스 (HSV) 및 엡스타인-바르 바이러스 (EBV), 뿐만 아니라 시토메갈로바이러스 (CMV) 및 가성광견병 바이러스 (PRV)를 포함하며, 이들 모두는 또한 기탁기관, 예컨대 ATCC로부터 입수가능하다.
본원에 사용된 용어 "역전된 말단 반복부" (또는 "ITR")는 뉴클레오티드의 단일 가닥 서열에 이어서 하류의 그의 역 상보체를 지칭한다. 초기 서열과 역 상보체 사이의 뉴클레오티드의 개재 서열은 0을 포함한 임의의 길이일 수 있다. AAV 게놈은 전형적으로 양쪽 말단에 역전된 말단 반복부 (ITR)를 포함하며, 여기서 각각의 말단은 전형적으로 회문식이고 헤어핀을 형성할 수 있다.
용어 "폴리뉴클레오티드" 및 "핵산"은 본원에서 상호교환가능하게 사용되고, 쇄에서 공유 결합된 복수의 뉴클레오티드 단량체로 구성된 생체중합체를 지칭한다.
본원에 사용된 용어 "향성"은 1종 이상의 특정한 세포 유형만을 감염시키는 바이러스 (예를 들어, AAV)의 능력, 및 특이적 세포 표면 모이어티와만 상호작용하여 세포 진입, 임의로 및 바람직하게는 이어서 바이러스 (예를 들어, AAV)에 의해 세포 내로 운반되는 서열의 발현 (예를 들어, 전사 및 임의로 번역) (예를 들어, 재조합 바이러스의 경우, 이종 뉴클레오티드 서열(들)의 발현)을 달성하는 그의 능력을 지칭한다.
본원에 사용된 용어 "형질도입"은 바이러스 (예를 들어, AAV)의 세포 내로의 진입 및 바이러스 내에 함유된 유전 물질의 세포 내로의 전달에 의해 바이러스 게놈으로부터 발현을 얻는 것을 지칭한다. 전형적으로, 바이러스 (예를 들어, AAV)는 그의 향성에 따라 세포에 진입한다.
"투여하는"은 관련 기술분야의 통상의 기술자에게 공지된 다양한 방법 및 전달 시스템 중 임의의 것을 사용하여 대상체에게 치료제를 물리적으로 도입하는 것을 지칭한다. 예를 들어 AAV 요법을 위한 예시적인 투여 경로는 정맥내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 복강내, 경기관, 피하, 각피하, 관절내, 피막하, 지주막하, 척수내, 경막외, 흉골내, 경구, 직장, 국소, 표피, 점막, 비강내, 질, 직장 및 설하 투여를 포함한다. 투여는 또한, 예를 들어 1회, 복수회 및/또는 1회 이상의 연장된 기간에 걸쳐 수행될 수 있다.
대상체의 "치료" 또는 "요법"은 질환과 연관된 증상, 합병증, 상태 또는 생화학적 징후의 발병, 진행, 발생, 중증도 또는 재발을 역전, 완화, 호전, 억제, 둔화 또는 예방할 목적으로 대상체에 대해 수행되는 임의의 유형의 개입 또는 과정 또는 그에 대한 활성제의 투여를 지칭한다.
본원에 사용된 "치료 유효량", "치료 용량", "유효 용량" 또는 "유효 투여량"은 본원에 기재된 바와 같은 치료 목적을 달성하는 양 또는 용량을 의미한다. 관련 기술분야의 통상의 기술자는 치료 유효량 등이 단일 용량으로 투여될 수 있거나 또는 다중 용량 (즉, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10회 또는 그 초과의 용량)의 투여에 의해 달성될 수 있다는 것을 추가로 이해할 것이다. 질환 퇴행을 촉진하거나 질환의 발생 또는 재발을 억제하는 치료제의 능력은 숙련된 진료의에게 공지된 다양한 방법을 사용하여, 예컨대 임상 시험 동안 인간 대상체에서, 인간에서의 효능을 예측하는 동물 모델 시스템에서, 또는 시험관내 검정에서 작용제의 활성을 검정함으로써 평가될 수 있다.
"대상체"는 임의의 인간 또는 비-인간 동물을 포함한다. 용어 "비인간 동물"은 척추동물, 예컨대 비인간 영장류, 양, 개, 및 설치류, 예컨대 마우스, 래트 및 기니 피그를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 대상체는 인간이다. 용어 "대상체" 및 "환자"는 본원에서 상호교환가능하게 사용된다.
본원에 사용된 용어 "ug" 및 "uM"은 각각 "μg" 및 "μM"과 상호교환가능하게 사용된다.
대안적 사용 (예를 들어, "또는")은 대안 중 하나, 둘 다 또는 그의 임의의 조합을 의미하는 것으로 이해되어야 한다. 본원에 사용된 단수 형태는 임의의 언급되거나 열거된 성분 또는 실체 중 "하나 이상"을 지칭하는 것으로 이해되어야 한다.
대략 또는 약: 본원에 사용된 용어 "대략" 또는 "약"은, 하나 이상의 관심 값에 적용될 때, 달리 언급되지 않는 한 또는 달리 문맥으로부터 명백하지 않는 한, 언급된 참조 값과 유사하고 언급된 참조 값의 어느 한 방향으로 (초과 또는 미만) 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 또는 그 미만 내에 속하는 값의 범위 내에 있는 값을 지칭한다 (이러한 수가 가능한 값의 100%를 초과하는 경우는 제외함). 용어 "대략" 또는 "약"이 본원에서 특정한 값에 적용되는 경우에, 용어 "대략" 또는 "약"이 없는 값이 또한 본원에 개시된다.
본원에 기재된 바와 같이, 임의의 농도 범위, 백분율 범위, 비 범위 또는 정수 범위는 달리 나타내지 않는 한, 언급된 범위 내의 임의의 정수의 값 및 적절한 경우 그의 분율 (예컨대 정수의 1/10 및 1/100)을 포함하는 것으로 이해되어야 한다.
본 개시내용의 다양한 측면이 하기의 서브섹션에서 추가로 상세하게 기재된다.
5.3 폴리뉴클레오티드 및 폴리펩티드
5.3.1 소형화 디스트로핀
본 개시내용은 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자에 관한 것이다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 적어도 3개의 힌지 도메인 및 적어도 5개의 스펙트린 반복부 도메인을 포함한다.
디스트로핀은 근섬유의 세포골격을 세포 막을 통해 주위 세포외 매트릭스에 연결하는 막대-형상 세포질 단백질이다. 이 단백질은 주로 운동에 사용되는 근육 (골격근) 및 심장 (심장) 근육에 위치한다. 소량의 디스트로핀이 뇌 내 신경 세포에 존재한다. 골격근 및 심장 근육에서, 디스트로핀은 근육이 수축 및 이완함에 따라 근섬유를 강화하고 이들을 손상으로부터 보호하기 위해 함께 작용하는 단백질 군 (단백질 복합체)의 일부이다. 디스트로핀 복합체는 각각의 근육 세포의 구조적 프레임워크 (세포골격)를 세포 외부의 단백질 및 다른 분자의 격자 (세포외 매트릭스)와 연결하는 앵커로서 작용한다. 디스트로핀 복합체는 또한 화학적 신호를 보내고 받는 단백질과 상호작용함으로써 세포 신호전달에서 역할을 할 수 있다.
전장 디스트로핀 단백질을 코딩하는 DMD 유전자는 유전자좌 Xp21에서 2.3 메가염기 (인간 게놈의 0.08%)를 포괄하는, 공지된 가장 긴 인간 유전자 중 하나이다. 근육에서의 1차 전사체는 약 2,100 킬로염기로 측정되고, 전사하는데 16시간이 걸리며; 성숙 mRNA는 14.0 킬로염기로 측정된다. 79개-엑손 근육 전사체는 3685개 아미노산 잔기의 단백질을 코딩한다.
디스트로핀에 대한 아미노산 및 뉴클레오티드 서열이 본원에 개시된다. 인간 야생형 디스트로핀인 이소형 Dp427m을 구성하는 아미노산 서열은 유니프롯(UniProt) 식별자 번호 NP_003997.1로 공지되어 있고, 표 1에 제시된다.
표 1. 전장 디스트로핀 단백질의 아미노산 서열 (NP_003997.1).
선택적 스플라이싱으로부터 생성된 다양한 다른 디스트로핀 이소형이 관련 기술분야에 공지되어 있다. 일부 실시양태에서, 구축물은 표 2에 언급된 뉴클레오티드 서열을 포함한다.
또한, 전장 디스트로핀 단백질을 코딩하는 뉴클레오티드 서열이 본원에 개시된다.
표 2. 전장 디스트로핀 단백질 (이소형 Dp427m)의 뉴클레오티드 서열.
야생형 전장 디스트로핀 단백질 (이소형 Dp427m)은 24개의 스펙트린 유사 반복부, 적어도 4개의 힌지 영역, 액틴 결합 도메인 (ABD1), 시스테인 풍부 도메인 (CR) 및 C 말단 도메인 (C-말단)을 함유한다. 각각의 도메인의 폴리펩티드 서열은 표 3에 제시되고, 각각의 도메인의 뉴클레오티드 서열은 표 4에 제시된다.
표 3. 디스트로핀 도메인의 아미노산 서열
표 4. 디스트로핀 도메인의 뉴클레오티드 서열
본 개시내용은 전장 디스트로핀 단백질, 즉 이소형 Dp427m보다 작고 자연 발생 디스트로핀 단백질 이소형과 동일하지 않은 소형화 디스트로핀 폴리펩티드, 또는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자에 관한 것이다. 본 개시내용이 소형화 디스트로핀 폴리펩티드를 개시하는 경우에, 본 개시내용은 또한 상응하는 개시된 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 및 그 반대의 경우를 또한 개시한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 핵산 분자는 유전자 요법에 적합하다. 따라서, 소형화 디스트로핀 폴리펩티드를 코딩하는 핵산 분자는 유전자 요법 벡터, 예를 들어 AAV 벡터 내에 피팅되도록 또는 재조합 발현에 적합하도록, 뿐만 아니라 생체내 투여 또는 발현된 경우에 소형화 디스트로핀 폴리펩티드에 대한 임의의 원치않는 면역 반응 (예를 들어, 체액성 면역 반응 및/또는 세포성 면역 반응, 예를 들어 CD4 및/또는 CD8)을 감소시키도록 구축된다. 일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 스펙트린 반복부 2 (R2) 도메인을 포함하지 않는다. 다른 실시양태에서, 소형화 디스트로핀 폴리펩티드는 스펙트린 반복부 2 (R2) 도메인 및 (1) 스펙트린 반복부 4 (R4) 도메인, (2) 스펙트린 반복부 5 (R5) 도메인, (3) 스펙트린 반복부 6 (R6) 도메인, (4) 스펙트린 반복부 7 (R7) 도메인, (5) 스펙트린 반복부 8 (R8) 도메인, (6) 스펙트린 반복부 9 (R9) 도메인, (7) 스펙트린 반복부 10 (R10) 도메인, (8) 스펙트린 반복부 11 (R11) 도메인, (9) 스펙트린 반복부 12 (R12) 도메인, (10) 스펙트린 반복부 13 (R13) 도메인, (11) 스펙트린 반복부 14 (R14) 도메인, (12) 스펙트린 반복부 15 (R15) 도메인, (13) 스펙트린 반복부 18 (R18) 도메인, (14) 스펙트린 반복부 19 (R19) 도메인, (15) 스펙트린 반복부 20 (R20) 도메인, (16) 스펙트린 반복부 21 (R21) 도메인, (17) 스펙트린 반복부 22 (R22) 도메인, 또는 (18) 스펙트린 반복부 23 (R23) 도메인, 또는 (19) 그의 임의의 조합을 포함하지 않는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인, 스펙트린 반복부 22 (R22) 도메인 및 스펙트린 반복부 23 (R23) 도메인을 포함하지 않는다.
특정 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인은 펩티드 결합에 의해 R3 도메인에 직접 융합된다 (예를 들어, 소형화 디스트로핀 폴리펩티드 BXA-027741 참조).
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R3 도메인은 아미노산 ARG-VAL (RV)에 의해 융합된다.
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 H2 도메인 및 R16 도메인은 링커에 의해 융합된다. 링커는 관련 기술분야에 공지된 임의의 링커일 수 있다. 다른 실시양태에서, 링커는 본원에 개시된 임의의 링커로부터 선택될 수 있다. 다른 실시양태에서, 링커는 섹션 5.3.2에서의 링커일 수 있다. 일부 실시양태에서, 링커는 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 H2 도메인 및 R16 도메인은 링커에 의해 융합된다. 일부 실시양태에서, 링커는 서열식별번호: 74-75의 조합 (SEAQ IHTVREE TMMVMTEDMP LEI)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함할 수 있다.
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 H2 도메인 및 R16 도메인은 링커에 의해 융합된다. 일부 실시양태에서, 링커는 서열식별번호: 74 (SEAQ)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함할 수 있다.
다른 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R3 도메인은 아미노산 ARG-VAL에 의해 융합되고, H2 도메인 및 R16 도메인은 링커, 예를 들어 서열식별번호: 74-75의 조합에 의해 융합된다.
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R3 도메인은 아미노산 ARG-VAL에 의해 융합되고, H2 도메인 및 R16 도메인은 링커, 예를 들어 서열식별번호: 74-75의 조합에 의해 융합되고, (i) H1 도메인 및 R1 도메인은 직접 융합되거나, (ii) R3 도메인 및 H2 도메인은 직접 융합되거나, (iii) R16 및 R17 도메인은 직접 융합되거나, (iv) R17 및 R24 도메인은 직접 융합되거나, 또는 (v) R24 및 H4 도메인은 직접 융합되거나, 또는 (vi) 그의 임의의 조합이다. 일부 실시양태에서, 본 개시내용에 유용한 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로: 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R3 도메인은 아미노산 ARG-VAL에 의해 융합되고, H2 도메인 및 R16 도메인은 링커, 예를 들어 서열식별번호: 74-75의 조합에 의해 융합되고, (i) H1 도메인 및 R1 도메인은 직접 융합되고, (ii) R3 도메인 및 H2 도메인은 직접 융합되고, (iii) R16 및 R17 도메인은 직접 융합되고, (iv) R17 및 R24 도메인은 직접 융합되고, (v) R24 및 H4 도메인은 직접 융합된다. 일부 실시양태에서, 본 개시내용에 유용한 소형화 디스트로핀 폴리펩티드는 ABD1 도메인 (임의로 N 말단에) 및/또는 CR 도메인 (임의로 N 말단에)을 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 아미노산 RV, R3 도메인, H2 도메인, 서열식별번호: 74-75의 조합에 제시된 바와 같은 아미노산 서열, R16 도메인, R17 도메인, R24 도메인, H4 도메인 및 CR 도메인으로 본질적으로 이루어지거나 또는 이로 이루어진다.
소형화 디스트로핀 폴리펩티드 내의 각각의 도메인은 상응하는 야생형 도메인으로부터의 1개 이상의 변화를 가질 수 있다.
예를 들어, 소형화 디스트로핀 BXA-196477은 하기 단백질 도메인으로 순서대로 이루어진다:
표 5A. 소형화 디스트로핀 폴리펩티드 BXA-196477의 아미노산 서열 및 도메인 구조.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드 내의 H1 도메인은 서열식별번호: 69에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R1 도메인은 서열식별번호: 70에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R3 도메인은 서열식별번호: 72에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H2 도메인은 서열식별번호: 73에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R16 도메인은 서열식별번호: 76에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R17 도메인은 서열식별번호: 77에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, R24 도메인은 서열식별번호: 78에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, H4 도메인은 서열식별번호: 79에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열이다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 68에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 폴리펩티드 서열을 N 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 80에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 폴리펩티드 서열을 C 말단에 추가로 포함한다.
표 5B. 소형화 디스트로핀 폴리펩티드 BXA-027743의 아미노산 서열 및 도메인 구조.
일부 실시양태에서, 본 개시내용은 스펙트린 반복부 1 (R1) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 제공한다. 일부 실시양태에서, 본 개시내용은 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 힌지 3 (H3) 도메인, 스펙트린 반복부 23 (R23) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 제공한다.
일부 실시양태에서, 본 개시내용은 스펙트린 반복부 1 (R1) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 포함한다. 일부 실시양태에서, 본 개시내용은 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 힌지 3 (H3) 도메인, 스펙트린 반복부 23 (R23) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 제공한다.
일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 하기 특징을 갖는다: (i) H1 도메인 및 R1 도메인은 직접 융합되거나, (ii) R16 및 R17 도메인은 직접 융합되거나, (iii) R17 및 H3 도메인은 직접 융합되거나, (iv) R23 및 R24 도메인은 직접 융합되거나, 또는 (v) R24 및 H4 도메인은 직접 융합되거나, 또는 (vi) 그의 임의의 조합. 일부 실시양태에서, 본 개시내용의 소형화 디스트로핀 폴리펩티드는 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 3 (R3) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인 및/또는 스펙트린 반복부 22 (R22) 도메인을 포함하지 않는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 ABD1 도메인 및/또는 CR 도메인을 추가로 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI), R16 도메인, R17 도메인, H3 도메인, R23 도메인, R24 도메인, H4 도메인 및 CR 도메인을 포함하거나, 본질적으로 이로 이루어지거나 또는 이로 이루어진다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 H1 도메인은 서열식별번호: 82에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다. 다른 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 R1 도메인은 서열식별번호: 83에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 R16 도메인은 서열식별번호: 85에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 R17 도메인은 서열식별번호: 86에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
다른 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 H3 도메인은 서열식별번호: 87에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 R23 도메인은 서열식별번호: 88에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
다른 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 R24 도메인은 서열식별번호: 89에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드에 유용한 H4 도메인은 서열식별번호: 90에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 81에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 N 말단에 추가로 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 91에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 C 말단에 추가로 포함한다.
일부 실시양태에서, 각각의 도메인을 코딩하는 핵산 서열은 하기일 수 있다:
표 6A. 소형화 디스트로핀 폴리펩티드 BXA-196477을 코딩하는 뉴클레오티드 서열 (및 도메인 구조).
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드 내의 H1 도메인을 코딩하는 핵산 서열은 서열식별번호: 94에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, R1 도메인을 코딩하는 핵산 서열은 서열식별번호: 95에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, R3 도메인을 코딩하는 핵산 서열은 서열식별번호: 97에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, H2 도메인을 코딩하는 핵산 서열은 서열식별번호: 98에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, R16 도메인을 코딩하는 핵산 서열은 서열식별번호: 101에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, R17 도메인을 코딩하는 핵산 서열은 서열식별번호: 102에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, R24 도메인을 코딩하는 핵산 서열은 서열식별번호: 103에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, H4 도메인을 코딩하는 핵산 서열은 서열식별번호: 104에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드 내의 ABD1 도메인을 코딩하는 핵산 서열은 서열식별번호: 93에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다. 일부 실시양태에서, 핵산 서열은 CR/C-말단을 코딩한다. 폴리펩티드는 서열식별번호: 105에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열이다.
표 6B. 소형화 디스트로핀 폴리펩티드 BXA-027743을 코딩하는 뉴클레오티드 서열 (및 도메인 구조).
본 개시내용의 다양한 소형화 디스트로핀 폴리펩티드가 표 7에 제시된다.
표 7. 소형화 디스트로핀 구축물의 아미노산 서열.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 118-132에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 118 (BXA-196477), 서열식별번호: 119 (BXA-196473), 서열식별번호: 120 (BXA-196474), 서열식별번호: 121 (BXA-196475), 서열식별번호: 122 (BXA-196476), 서열식별번호: 124 (BXA-196478) 또는 서열식별번호: 125 (BXA-196479) 중 하나에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 118에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 119에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 120에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 121에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 122에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 123에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 124에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 125에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다.
특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 126에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 127에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 128에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 129에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 130에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 131에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 132에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다.
일부 실시양태에서, 핵산 분자에 의해 코딩되는 소형화 디스트로핀 폴리펩티드는 화학식 (I)을 갖는다:
H1-R1-L1-R3-H2-L2-L3-R16-R17-R24-H4 (I)
여기서 H1은 디스트로핀의 힌지 1 도메인이고; R1은 디스트로핀의 스펙트린 반복부 1 도메인이고; L1은 아미노산 Arg-Val (RV)이고; R3은 디스트로핀의 스펙트린 반복부 3 도메인이고; H2는 디스트로핀의 힌지 2 도메인이고; L2는 서열식별번호: 74에 제시된 아미노산 서열 (SEAQ)이고; L3은 서열식별번호: 75에 제시된 아미노산 서열 (IHTVREE TMMVMTEDMP LEI)이고; R16은 디스트로핀의 스펙트린 반복부 16이고; R17은 디스트로핀의 스펙트린 반복부 17이고; R24는 디스트로핀의 스펙트린 반복부 24이고; H4는 디스트로핀의 힌지 4 도메인이고; (-)는 펩티드 결합이다.
일부 실시양태에서, 핵산 분자에 의해 코딩되는 소형화 디스트로핀 폴리펩티드는 (i) BXA-027741과 비교하여 더 낮은 CD4 증식을 갖는 것, (ii) BXA-027741과 비교하여 더 낮은 CD8 증식을 갖는 것, 및 (iv) 그의 임의의 조합으로 이루어진 군으로부터 선택된 1개 이상의 특성을 나타낸다.
일부 실시양태에서, 핵산 분자에 의해 코딩되는 소형화 디스트로핀 폴리펩티드는 화학식 (II)를 갖는다:
H1-R1-L-R16-R17-H3-R23-R24-H4 (II)
여기서 H1은 디스트로핀의 힌지 1 도메인이고; R1은 디스트로핀의 스펙트린 반복부 1 도메인이고; L은 서열식별번호: 84의 아미노산 (IHTVREETMMVMTEDMPLEI)이고; R16은 디스트로핀의 스펙트린 반복부 16이고; R17은 디스트로핀의 스펙트린 반복부 17이고; H3은 디스트로핀의 힌지 3 도메인이고; R23은 디스트로핀의 스펙트린 반복부 23이고; R24는 디스트로핀의 스펙트린 반복부 24이고; H4는 디스트로핀의 힌지 4 도메인이고; (-)는 펩티드 결합이다.
일부 실시양태에서, 핵산 분자에 의해 코딩되는 소형화 디스트로핀 폴리펩티드는 서열식별번호: 132에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함한다.
일부 실시양태에서, 뉴클레오티드 서열은 서열식별번호: 147의 뉴클레오티드 서열에 대해 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열을 포함한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 BXA-196481보다 더 높은 소형화 디스트로핀 폴리펩티드의 발현을 나타낸다. 일부 다른 실시양태에서, 소형화 디스트로핀 폴리펩티드 발현은 BXA-196481 폴리펩티드 발현보다 적어도 약 1.5배, 적어도 약 1.6배, 적어도 약 1.7배, 적어도 약 1.8배, 적어도 약 1.9배, 적어도 약 2배, 적어도 약 2.1배, 적어도 약 2.2배, 적어도 약 2.3배, 적어도 약 2.4배, 적어도 약 2.5배, 적어도 약 2.6배, 적어도 약 2.7배, 적어도 약 2.8배, 적어도 약 2.9배 또는 적어도 약 3배 더 높다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열에 의해 코딩될 수 있다. 뉴클레오티드 서열의 일부 예가 표 8에 제시된다.
표 8. 디스트로핀 구축물의 뉴클레오티드 서열.
서열식별번호: 148은 C-말단이 결실된 것을 제외하고는 구축물 BXA-027743과 동일한 구축물 BXA-212371을 코딩한다.
서열식별번호: 149는 BXA-212371과 동일하지만 더 짧은 3'UTR을 갖는 구축물 BXA-212372를 코딩한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 표 9에 제시된 구축물이거나 또는 이를 포함한다.
표 9. 소형화 디스트로핀 폴리펩티드 BXA-213788의 아미노산 서열.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 152에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 표 10에 제시된 구축물이거나 또는 이를 포함한다.
표 10. 소형화 디스트로핀 폴리펩티드 BXA-213780J11V3의 아미노산 서열.
서열식별번호: 153은 BXA-213780J11V3에서 내부 SEAQ 링커 (서열식별번호: 74)의 아미노산 A 및 Q뿐만 아니라 C-말단의 마지막 3개의 아미노산이 결실된 것을 제외하고는 구축물 BXA-196477과 동일한 구축물 BXA-213780J11V3을 코딩한다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 서열식별번호: 153에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다.
일부 실시양태에서, 소형화 디스트로핀 BXA-213780J11V3은 표 11에 제시된 뉴클레오티드 서열에 의해 코딩될 수 있다.
표 11. 소형화 디스트로핀 폴리펩티드 BXA-213780J11V3의 뉴클레오티드 서열.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드는 표 12에 열거된 아미노산 서열을 포함하는, 힌지 2 (H2) 도메인과 R16 스펙트린 반복부 16 (R16) 도메인 사이의 접합부를 갖는다.
표 12. 접합부의 아미노산 서열
다른 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 133-149에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 다른 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 133 (BXA-196477), 서열식별번호: 134 (BXA-196473), 서열식별번호: 135 (BXA-196474), 서열식별번호: 136 (BXA-196475), 서열식별번호: 137 (BXA-196476), 서열식별번호: 139 (BXA-196478), 서열식별번호: 140 (BXA-196479), 서열식별번호: 148 (BXA-212371) 또는 서열식별번호: 149 (BXA-212372)에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함한다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 133에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 134에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 일부 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 135에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함한다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 136에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함한다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 137에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함한다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 138에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 139에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 140에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 141에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 142에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 143에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 144에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 145에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 146에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 147에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 148에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다. 특정 실시양태에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열은 서열식별번호: 149에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 핵산 서열을 포함하며, 여기서 소형화 디스트로핀 폴리펩티드는 뉴클레오티드 서열로부터 발현된 경우에 적어도 1개의 디스트로핀 활성을 갖는다.
5.3.2 링커
아미노산 서열 또는 아미노산 서열을 코딩하는 뉴클레오티드 서열이 또한 본원에 제공된다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 100에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 뉴클레오티드 서열에 의해 코딩된 아미노산 서열에 관한 것이며, 여기서 아미노산 서열은 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)를 포함한다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 99-100의 조합에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열에 의해 코딩된 아미노산 서열에 관한 것이며, 여기서 아미노산 서열은 서열식별번호: 74-75의 조합 (SEAQIHTVREE TMMVMTEDMP LEI)을 포함한다.
일부 실시양태에서, 핵산 분자는 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)를 포함하는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하며, 여기서 핵산 분자는 서열식별번호: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATC)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일하다.
일부 실시양태에서, 아미노산 서열은 디스트로핀의 1개 이상의 도메인을 연결하는 링커로서 사용될 수 있다. 일부 실시양태에서, 링커는 디스트로핀의 제1 도메인과 디스트로핀의 제2 도메인을 연결한다. 일부 실시양태에서, 연결될 수 있는 디스트로핀의 제1 도메인 및 제2 도메인은 R1 도메인 및 R16 도메인이다. 다른 실시양태에서, 연결될 수 있는 디스트로핀의 제1 도메인 및 제2 도메인은 R3 도메인 및 R16 도메인이다. 다른 실시양태에서, 연결될 수 있는 디스트로핀의 제1 도메인 및 제2 도메인은 H2 도메인 및 R16 도메인이다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 99 (AGTGAAGCTCAG)에 대해 적어도 약 60%, 적어도 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 뉴클레오티드 서열을 포함하는 핵산 분자를 포함한다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATC)에 대해 적어도 약 60%, 적어도 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 뉴클레오티드 서열을 포함하는 핵산 분자를 포함한다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 99 및 100의 조합 (AGTGAAGCTCAGATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATC)에 대해 적어도 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 포함한다.
일부 실시양태에서, 링커는 소형화 디스트로핀 폴리펩티드의 2개의 도메인 (예를 들어, H2 및 R16 도메인)을 연결함으로써 본원에 개시된 소형화 디스트로핀 폴리펩티드 내에 위치한다. 일부 실시양태에서, 링커는 ABD1-H1-R1-R3-H2-L-R16-R17-R24-H4-CR-C 말단을 포함하는 소형화 디스트로핀 폴리펩티드에서 H2 도메인과 R16 도메인 사이에 위치하며, 여기서 ABD1은 액틴 결합 도메인 1이고, H1은 힌지 1 도메인이고, R1은 스펙트린 반복부 1 도메인이고, R3은 스펙트린 반복부 3 도메인이고, H2는 힌지 2 도메인이고, L은 링커, 예를 들어 서열식별번호: 74 또는 서열식별번호: 75 (또는 이들 둘 다의 조합) (또는 이들 서열에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열)이고, R16은 스펙트린 반복부 16 도메인이고, R17은 스펙트린 반복부 17 도메인이고, R24는 스펙트린 24 도메인이고, H4는 힌지 4 도메인이고, CR은 시스테인 풍부 도메인이고, C-말단은 임의적인 C-말단 도메인 (또는 그의 부분)이다.
본 개시내용은 또한 IHTVREETMMVMTEDMPLEI (서열식별번호: 84)를 포함하는 링커를 제공한다. 일부 실시양태에서, 서열식별번호: 75에 제시된 서열 (IHTVREETMMVMTEDMPLEI) (또는 서열식별번호: 84에 제시된 서열 (IHTVREETMMVMTEDMPLEI)에 대해 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열)을 포함하는 링커는 소형화 디스트로핀 폴리펩티드의 2개의 도메인 (예를 들어, R1 및 R16 도메인)을 연결함으로써 본원에 개시된 소형화 디스트로핀 폴리펩티드 내에 위치한다. 일부 실시양태에서, 링커는 ABD1-H1-R1-L-R16-R17-H3-R23-R24-H4-CR-C 말단을 포함하는 소형화 디스트로핀 폴리펩티드에서 R1과 R16 도메인 사이에 위치하며, 여기서 ABD1은 액틴 결합 도메인 1이고, H1은 힌지 1 도메인이고, R1은 스펙트린 반복부 1 도메인이고, L은 링커, 예를 들어 서열식별번호: 84이고, R16은 스펙트린 반복부 16 도메인이고, R17은 스펙트린 반복부 17 도메인이고, H3은 힌지 3 도메인이고, R23은 스펙트린 23 도메인이고, R24는 스펙트린 24 도메인이고, H4는 힌지 4 도메인이고, CR은 시스테인 풍부 도메인이고, C-말단은 C-말단 도메인 (또는 그의 부분)이다.
5.3.3 비-코딩 폴리뉴클레오티드
일부 측면에서, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 예를 들어 DNA 또는 RNA가 본원에 제공된다.
일부 실시양태에서, 본원에 개시된 핵산 분자는 비-코딩 성분을 포함한다. 일부 실시양태에서, 본원에 개시된 핵산 분자는 프로모터를 포함한다. 포유동물 숙주 세포 발현을 위한 특정의 예시적인 조절 서열은 포유동물 세포에서 높은 수준의 단백질 발현을 지시하는 바이러스 요소, 예컨대 시토메갈로바이러스 (CMV), 원숭이 바이러스 40 (SV40), 아데노바이러스 (예를 들어, 아데노바이러스 주요 후기 프로모터 (AdMLP)) 및 폴리오마로부터 유래된 프로모터 및/또는 인핸서를 포함한다. 대안적으로, 비바이러스 조절 서열, 예컨대 유비퀴틴 프로모터 또는 β-글로빈 프로모터가 사용될 수 있다. 추가로, 상이한 공급원으로부터의 서열로 구성된 조절 요소, 예컨대 SV40 초기 프로모터 및 인간 T 세포 백혈병 바이러스 유형 1의 긴 말단 반복부로부터의 서열을 함유하는 SRa 프로모터 시스템이 사용될 수 있다 (Takebe, Y. et al. (1988) Mol. Cell. Biol. 8:466-472). 특정 실시양태에서, 조절 서열은 조직 특이적 프로모터를 포함한다. 일부 실시양태에서, 조직 특이적 프로모터는 심장, 간, 폐, 눈, 신경계, 림프계, 중추 신경계, 뉴런 세포, 근육 및 줄기 세포로 이루어진 군으로부터 선택된 조직에서 관심 유전자의 발현을 구동한다.
일부 실시양태에서, 본원에 개시된 프로모터는 조직-특이적 프로모터이다. 일부 실시양태에서, 프로모터는 간세포, 근육 세포, 내피 세포, 동모양 세포 또는 뉴런 세포 또는 그의 임의의 조합에서 치료 단백질의 발현을 구동한다. 일부 실시양태에서, 프로모터는 시냅신 1 유전자 프로모터, 마우스 티레틴 프로모터 (mTTR), 내인성 인간 인자 VIII 프로모터 (F8), 인간 알파-1-항트립신 프로모터 (hAAT), 인간 알부민 최소 프로모터, 마우스 알부민 프로모터, 트리스테트라프롤린 (TTP) 프로모터, CASI 프로모터, CAG 프로모터, 시토메갈로바이러스 (CMV) 프로모터, α1-항트립신 (AAT) 프로모터, 근육 크레아틴 키나제 (MCK) 프로모터, 미오신 중쇄 알파 (αMHC) 프로모터, 미오글로빈 (MB) 프로모터, 데스민 (DES) 프로모터, SPc5-12 프로모터, 2R5Sc5-12 프로모터, dMCK 프로모터, tMCK 프로모터, α-시뉴클레인 프로모터 및 포스포글리세레이트 키나제 (PGK) 프로모터로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 본원에 개시된 핵산 분자는 인트론 서열을 포함한다. 일부 실시양태에서, 인트론 서열은 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 5'에 위치한다. 일부 실시양태에서, 인트론 서열은 프로모터의 3'에 위치한다. 일부 실시양태에서, 인트론 서열은 합성 인트론 서열을 포함한다.
일부 실시양태에서, 본원에 개시된 핵산 분자는 전사후 조절 요소를 포함한다. 일부 실시양태에서, 전사후 조절 요소는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 3'에 위치한다. 일부 실시양태에서, 전사후 조절 요소는 돌연변이된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), 마이크로RNA 결합 부위 또는 DNA 핵 표적화 서열 또는 그의 임의의 조합을 포함한다.
일부 실시양태에서, 본원에 개시된 핵산 분자는 3'UTR 폴리(A) 테일 서열을 포함한다. 일부 실시양태에서, 3'UTR 폴리(A) 테일 서열은 bGH 폴리(A), 액틴 폴리(A), 헤모글로빈 폴리(A) 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 3'UTR 폴리(A) 테일 서열은 bGH 폴리(A)를 포함한다.
일부 실시양태에서, 본원에 개시된 핵산 분자는 인핸서 서열을 포함한다. 일부 실시양태에서, 본원에 개시된 핵산 분자는 제1 역전된 말단 반복부 (ITR) 및/또는 제2 ITR을 포함한다. 일부 실시양태에서, 제1 ITR 및 제2 ITR은 동일하다. 일부 실시양태에서, 제1 ITR 및/또는 제2 ITR은 아데노-연관 바이러스로부터 유래된다. 일부 실시양태에서, 제1 ITR은 아데노-연관 바이러스로부터 유래되고, 제2 ITR은 아데노-연관 바이러스로부터 유래된다.
핵산 분자는 폴리펩티드의 번역을 보조하는 추가의 요소를 포함할 수 있는 것으로 추가로 인식된다. 이러한 서열은, 예를 들어 폴리펩티드를 코딩하는 폴리뉴클레오티드의 5' 말단에 부착된 코작 서열을 포함한다. 코작 컨센서스 서열은 번역 과정의 개시에서 역할을 하는 진핵 mRNA 상에서 발생하는 서열이고, 컨센서스 (gee)gccRccAUGG (서열식별번호: 150)를 가지며; 여기서 (1) 소문자는 한 위치에서 가장 통상적인 염기를 나타내고 그 위치에서 염기는 그럼에도 불구하고 달라질 수 있고; (2) 대문자는 고도로 보존된 염기를 나타내고, 즉 'AUGG' 서열은 불변이거나 또는 거의 변화하지 않고, 예외적으로 IUPAC 다의성 코드 'R'은 퓨린 (아데닌 또는 구아닌)이 이 위치에서 정상적으로 관찰된다는 것을 나타내고; (3) 괄호 안의 서열 ((gee))은 불확실한 유의성을 갖는다.
하나의 비제한적 실시양태에서, 핵산 분자는 코작 서열의 기능적 변이체 또는 그의 단편을 포함한다. 코작 서열의 기능적 변이체 또는 그의 단편은 리더가 결여된 서열로부터의 번역 수준과 비교할 때 단백질의 번역을 증가시키는 능력을 보유할 것이다. 이러한 기능적 단편은 코작 서열의 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40개의 연속 뉴클레오티드 또는 서열식별번호: 150 또는 서열식별번호: 151 (gccaccATGG)에 제시된 서열을 포함할 수 있다. 대안적으로, 기능적 변이체는 코작 서열 또는 서열식별번호: 150 또는 서열식별번호: 151에 제시된 서열에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함할 수 있다.
5.3.4 이종 모이어티
일부 실시양태에서, 본 개시내용의 폴리펩티드는 추가의 요소, 예를 들어 이종 모이어티를 추가로 포함할 수 있다. 이러한 요소는 폴리펩티드의 발현을 보조하고/거나, 폴리펩티드의 분비를 보조하고/거나, 폴리펩티드의 안정성을 개선시키고/거나, 폴리펩티드의 보다 효율적인 정제를 가능하게 하고/거나, 폴리펩티드의 활성을 조정할 수 있다. 일부 실시양태에서, 이종 모이어티는 폴리펩티드 모이어티이다. 다른 실시양태에서, 이종 모이어티는 비-폴리펩티드 모이어티이다.
일부 실시양태에서, 폴리펩티드는 폴리펩티드에 융합된 이종 모이어티를 포함한다.
일부 실시양태에서, 본원에 개시된 폴리펩티드는 1개 이상의 추가의 이종 모이어티를 포함한다. 일부 실시양태에서, 이종 모이어티는 반감기 연장 모이어티이다. 일부 실시양태에서, 이종 모이어티는 알부민 또는 그의 단편, 이뮤노글로불린 Fc 영역, 인간 융모성 고나도트로핀의 β 서브유닛의 C-말단 펩티드 (CTP), PAS 서열, HAP 서열, 트랜스페린 또는 그의 단편, 또는 알부민-결합 모이어티 또는 그의 유도체 또는 그의 임의의 조합을 포함한다.
일부 실시양태에서, 본원에 개시된 폴리펩티드는 1개 이상의 추가의 이종 모이어티를 포함한다. 일부 실시양태에서, 이종 모이어티는 반감기 연장 모이어티이다. 일부 실시양태에서, 이종 모이어티는 알부민, 이뮤노글로불린 불변 영역 또는 그의 부분, 이뮤노글로불린-결합 폴리펩티드, 이뮤노글로불린 G (IgG), 알부민-결합 폴리펩티드 (ABP), PAS화 모이어티, HES화 모이어티, XTEN, PEG화 모이어티 또는 Fc 영역 또는 그의 임의의 조합을 포함한다.
5.4 세포
특정 측면에서, 본원에 기재된 단백질을 (예를 들어, 재조합적으로) 발현하는 세포 (예를 들어, 숙주 세포) 및 본원에 기재된 단백질을 코딩하는 뉴클레오티드를 포함하는 발현 벡터가 본원에 제공된다.
일부 실시양태에서, 숙주 세포는 본원에 기재된 핵산 분자를 포함한다. 일부 실시양태에서, 숙주 세포는 본원에 기재된 벡터를 포함한다.
일부 실시양태에서, 숙주 세포는 진핵 세포이다. 일부 실시양태에서, 숙주 세포는 포유동물 세포, 곤충 세포, 효모 세포, 트랜스제닉 포유동물 세포 및 식물 세포로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 숙주 세포는 원핵 세포이다. 일부 실시양태에서, 원핵 세포는 박테리아 세포이다.
일부 실시양태에서, 숙주 세포는 포유동물 세포이다. 이러한 포유동물 숙주 세포는 CHO, VERO, BHK, Hela, MDCK, HEK 293, NIH 3T3, W138, BT483, Hs578T, HTB2, BT2O 및 T47D, NS0 (어떠한 이뮤노글로불린 쇄도 내인성으로 생산하지 않는 뮤린 골수종 세포주), CRL7O3O, COS (예를 들어, COS1 또는 COS), PER.C6, VERO, HsS78Bst, HEK-293T, HepG2, SP210, R1.1, B-W, L-M, BSC1, BSC40, YB/20, BMT10, HBK, NSO, HT1080 및 HsS78Bst 세포를 포함하나 이에 제한되지는 않는다.
5.5 벡터
5.5.1 아데노-연관 바이러스 (AAV)
5.5.1.1 개관
숙주 세포 및 치료적 개입을 위해 표적화된 세포에서의 재조합 발현을 위한 소형화 디스트로핀 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 포함하는 벡터 (예를 들어, 발현 벡터)가 본원에 제공된다. 본원에 사용된 용어 "벡터"는 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자; 또는 또 다른 핵산을 수송할 수 있는 이러한 핵산 분자를 포함하는 실체를 지칭하는 것으로 의도된다. 한 유형의 벡터는 추가의 DNA 절편이 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 또 다른 유형의 벡터는 추가의 DNA 절편이 바이러스 게놈 내로 라이게이션될 수 있는 바이러스 벡터이다. 특정 벡터 또는 벡터의 일부인 폴리뉴클레오티드는 이들이 도입되는 숙주 세포에서 자율 복제될 수 있다 (예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포 내로의 도입시에 숙주 세포의 게놈 내로 통합될 수 있고, 이에 의해 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 이들에 작동가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "재조합 발현 벡터" (또는 간단히 "발현 벡터")로 지칭된다. 일반적으로, 재조합 DNA 기술에 유용한 발현 벡터는 종종 플라스미드 형태이다. 본 명세서에서, "플라스미드" 및 "벡터"는 때때로 문맥에 따라 상호교환가능하게 사용될 수 있는데, 이는 플라스미드가 가장 통상적으로 사용되는 형태의 벡터이기 때문이다. 그러나, 또한 동등한 기능을 수행하는 다른 형태의 발현 벡터, 예컨대 바이러스 벡터 (예를 들어, 복제 결손 레트로바이러스, 아데노바이러스 및 아데노-연관 바이러스)가 본원에 개시된다.
일부 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 아데노-연관 바이러스 (AAV)를 사용하여 발현된다. AAV는 파르보비리다에 과의 외피가 없는 단일-가닥 DNA 바이러스이다. 파르보비리다에 과의 대부분의 다른 구성원과 대조적으로, AAV는 복제 결손이고, 헬퍼 바이러스, 예컨대 아데노바이러스 또는 헤르페스 바이러스의 존재 하에서만 효율적으로 복제될 수 있다.
AAV는 1960년대 중반에 아데노바이러스의 바이러스 제제의 오염물로서 처음 발견되었다. 문헌 [Atchison R W, Casto B C, HAMMON W M. Science. 149(3685), 754-756 (1965)]을 참조한다. 그 이후로, 재조합 DNA 벡터로서 AAV를 사용하기 위한 점점 더 안전하고 더 효과적인 방법이 개발되었다. 예를 들어, 문헌 [Hermonat P.L. and Muzyczka N. Proc Natl Acad Sci USA. 81(20), 6466-6470 (1984). 3. Laughlin C.A., et al. Gene, 23(1), 65-73 (1983). Matsushita T., et al. Gene Ther. 5(7), 938-945 (1998). Xiao X., et al. Journal of Virology. 72(3), 2224-2232 (1998)]을 참조한다. 적은 수의 AAV 게놈이 숙주 염색체 내로 통합되는 것으로 나타났다. 문헌 [Cheung AK, Hoggan MD, Hauswirth WW, et al. Integration of the adeno-associated virus genome into cellular DNA in latently infected human detroit 6 cells. J Virol 1980;33:739-748]을 참조한다. AAV는 임의의 공지된 아데노바이러스 항원과 면역학적으로 구별된다. AAV 캡시드는 단일 가닥 DNA (ssDNA) 게놈을 함유한다. 문헌 [Rose JA, Berns KI, Hoggan MD, et al. Proc Natl Acad Sci USA 1969;64:863-869]을 참조한다.
AAV는 2개의 역전된 말단 반복부 (ITR)가 플랭킹되어 있는 복제 (rep) 유전자 및 캡시드 (cap) 유전자를 코딩하는 단일 가닥의 4.7 kb DNA 게놈을 갖는다. 이는 우세하게 비-통합적이고 비-분열 조직에서 안정한 에피솜을 형성한다. 성인 인간 집단에서의 그의 높은 혈청유병률에도 불구하고, AAV는 어떠한 인간 질환과도 연관되지 않았다. 문헌 [Goncalves, M. Virol. J. 2, 43 (2005)]을 참조한다. AAV의 조직 내 안정한 발현, 그의 병원성의 결여 및 그의 높은 역가 생산의 용이성은 그를 매우 매력적인 벡터 및 인기있는 유전자 전달 플랫폼으로 만들었다.
재조합 AAV (rAAV)는 전형적으로 rep 및 cap 유전자의 일부 또는 모두가 이종 트랜스진 서열로 대체된 유전자 조작된 AAV이다. 재조합 AAV는 또한 유사분열후 세포에서 장기간 트랜스진 발현을 촉발할 수 있으며, 이는 재조합 AAV 게놈이 핵 내에서 대체로 원형 에피솜으로서 지속되기 때문일 가능성이 가장 크다. rAAV의 생산에 요구되는 rAAV의 유일한 DNA 시스-요소는 AAV 역전된 말단 반복부 (ITR)인 반면, rep, cap 및 아데노바이러스 헬퍼 유전자는 트랜스로 제공될 수 있다. 따라서, 본원에 개시된 일부 실시양태에서, rAAV는 ITR이 플랭킹되어 있는 이종 트랜스진 DNA만을 함유하고, 이 게놈은 혈청형-특이적 AAV 캡시드 내에 캡시드화된다.
AAV는 그가 외래 DNA를 세포 내로 전달하기 위한 벡터 시스템으로서 매력적이게 하는 독특한 특색을 소유한다. 배양물 내 세포의 AAV 감염은 일반적으로 비세포변성이고, 인간 및 다른 동물의 자연 감염은 침묵성 및 무증상이다. 더욱이, AAV는 많은 상이한 유형의 포유동물 세포를 감염시키므로 생체내 많은 상이한 조직을 표적화하는 것이 가능하다. AAV는 또한 이를 유전자 전달에 특히 매력적인 바이러스 시스템으로 만드는 추가의 이점, 예컨대 다른 형태의 유전자 전달과 비교하여 비교적 약한 면역 반응의 촉진 및 비-통합 에피솜 벡터 DNA에 기초한 분열 세포및 정지 세포 둘 다에서의 지속적 발현을 소유한다. 또한, AAV는 아데노바이러스를 불활성화시키는데 사용되는 조건 (수시간 동안 56℃ 내지 65℃)을 견디며, 이는 rAAV-기반 백신의 저온 보존을 덜 중요하게 만든다.
바이러스 DNA의 복제는 숙주-세포 게놈 내로의 통합에 요구되지 않고, 따라서 헬퍼 바이러스는 이 과정에 요구되지 않는다. AAV 프로바이러스 게놈은 재조합 게놈의 구축을 실행가능하게 만드는 플라스미드 내의 클로닝된 DNA와 같이 감염성이다. 추가로, AAV 복제, 게놈 캡시드화 및 통합을 지시하는 신호가 AAV 게놈의 ITR 내에 함유되어 있기 때문에, 게놈의 내부 대략 4.7 kb (복제 및 구조적 캡시드 단백질을 코딩함, rep-cap)는 따라서 외래 DNA, 예컨대 프로모터, 관심 DNA 및 폴리아데닐화 신호를 함유하는 유전자 카세트로 대체될 수 있다.
AAV 벡터는 시스 또는 트랜스로 기능하는 추가의 요소를 포함할 수 있다. 특정한 실시양태에서, 벡터 게놈을 포함하는 AAV 벡터는 또한 공여자 서열의 5' 또는 3' 말단에 플랭킹되어 있는 1개 이상의 역전된 말단 반복부 (ITR) 서열; 공여자 서열의 전사를 구동하는 발현 제어 요소 (예를 들어, 프로모터 또는 인핸서), 예컨대 구성적 또는 조절가능한 제어 요소 또는 조직-특이적 발현 제어 요소; 인트론 서열, 채움 또는 충전 폴리뉴클레오티드 서열; 및/또는 공여자 서열의 3'에 위치한 폴리-아데닌 서열을 갖는다.
일부 실시양태에서, AAV는 헬퍼 바이러스를 사용하여 복제된다. 아데노바이러스, 헤르페스바이러스 및 폭스바이러스, 예컨대 백시니아를 포함한, AAV에 대한 이러한 다양한 헬퍼 바이러스가 관련 기술분야에 공지되어 있다. 아데노바이러스는 다수의 상이한 하위군을 포괄하며, 하위군 C의 아데노바이러스 유형 5가 가장 통상적으로 사용된다. 인간, 비-인간 포유동물 및 조류 기원의 수많은 아데노바이러스가 공지되어 있고, 기탁기관, 예컨대 ATCC로부터 입수가능하다. 헤르페스 과의 바이러스는, 예를 들어 단순 포진 바이러스 (HSV) 및 엡스타인-바르 바이러스 (EBV), 뿐만 아니라 시토메갈로바이러스 (CMV) 및 가성광견병 바이러스 (PRV)를 포함하며; 이들은 또한 기탁기관, 예컨대 ATCC로부터 입수가능하다.
예시적인 AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 또는 AAV-2i8 중 임의의 것의 캡시드 서열, 또는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 또는 AAV-2i8의 캡시드 변이체를 포함한다. 본 발명의 재조합 AAV 벡터는 또한 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 또는 AAV-2i8 및 그의 변이체를 포함한다. 특정한 캡시드 변이체는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 또는 AAV-2i8의 캡시드 변이체, 예컨대 아미노산 치환, 결실 또는 삽입/부가를 갖는 캡시드 서열을 포함한다. 한 실시양태에서, AAV 벡터는 AAV9이다.
일부 측면에서, 본 개시내용은 별개의 조직 표적화 능력 (예를 들어, 조직 향성)을 갖는 AAV에 관한 것이다. 일부 실시양태에서, 변이체 AAV 캡시드 폴리펩티드는 비-변이체 모 캡시드 폴리펩티드와 비교하여 1종 이상의 인간 줄기 세포 유형에서 증가된 형질도입 또는 향성을 추가로 나타낸다. 일부 실시양태에서, 인간 줄기 세포 유형은 배아 줄기 세포, 성체 조직 줄기 세포 (즉, 체세포 줄기 세포), 골수 줄기 세포, 전구 세포, 유도된 만능 줄기 세포 및 재프로그램화된 줄기 세포를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 성체 줄기 세포는 유사기관 줄기 세포 (즉, 신체 내의 임의의 관심 기관 또는 기관계로부터 유래된 줄기 세포)를 포함할 수 있다. 일부 실시양태에서, AAV의 표적 조직은 생식선, 횡경막, 심장, 위, 간, 비장, 췌장, 근육 또는 신장이다. 일부 실시양태에서, AAV는 피부, 모발, 손발톱, 감각 수용체, 한선, 지선, 골, 근육, 뇌, 척수, 신경, 뇌하수체, 송과선, 시상하부, 갑상선, 부갑상선, 흉선, 부신, 췌장 (섬 조직), 심장, 혈관, 림프절, 림프관, 흉선, 비장, 편도, 코, 인두, 후두, 기관, 기관지, 폐, 구강, 인두, 식도, 위, 소장, 대장, 직장, 항문관, 치아, 타액선, 혀, 간, 담낭, 췌장, 충수, 신장, 요관, 방광, 요도, 고환, 수정관 (정관), 요도, 전립선, 음경, 음낭, 난소, 자궁, 자궁관 (난관), 질, 외음부 및 유선 (유방)을 포함하나 이에 제한되지는 않는 신체의 기관을 표적화한다. 신체의 기관계는 외피계, 골격계, 근육계, 신경계, 내분비계, 심혈관계, 림프계, 호흡기계, 소화기계, 비뇨기계 및 생식기계를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 변이체 캡시드 폴리펩티드를 갖는 AAV의 형질도입 및/또는 향성은 비-변이체 캡시드 폴리펩티드를 갖는 AAV와 비교하여 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 약 99% 또는 약 100%만큼 증가된다. 일부 실시양태에서, 형질도입 및/또는 향성은 약 5% 내지 약 80%, 약 10% 내지 약 70%, 약 20% 내지 약 60% 또는 약 30% 내지 약 60%만큼 증가된다.
5.5.1.2 복제, 캡시드 및 조립 AAV 유전자
AAV의 단일-가닥 게놈은 3종의 유전자인 rep (복제), cap (캡시드) 및 aap (조립)를 포함한다. 이들 3종의 유전자는 3종의 프로모터, 선택적 번역 개시 부위 및 차등 스플라이싱의 사용을 통해 적어도 9종의 유전자 산물을 생성한다.
rep 유전자는 바이러스 게놈 복제 및 패키징에 요구되는 4종의 단백질 (Rep78, Rep68, Rep52 및 Rep40)을 코딩한다.
cap 유전자 발현은 바이러스 캡시드 단백질 (VP1; VP2; VP3)을 생성하며, 이는 바이러스 게놈을 보호하는 외부 캡시드 쉘을 형성할 뿐만 아니라 세포 결합 및 내재화에 능동적으로 관여한다. 바이러스 코트는 이십면체 구조로 배열된 60종의 단백질로 구성되는 것으로 추정된다.
aap 유전자는 cap 유전자와 중첩되는 교대 리딩 프레임에서 조립-활성화 단백질 (AAP)을 코딩한다. 이러한 핵 단백질은 캡시드 조립을 위한 스캐폴딩 기능을 제공하는 것으로 생각되고, 일부 AAV 혈청형에서 VP 단백질의 핵소체 국재화에 역할을 한다.
일부 실시양태에서, rep, cap 또는 aap 유전자 중 1종 이상은 자연 발생이고, 예를 들어 rep, cap 또는 app 유전자는 파르보바이러스 rep, cap 또는 aap 유전자의 모두 또는 일부를 포함한다. 일부 실시양태에서, rep, cap 또는 aap 유전자 중 1종 이상은 합성 서열을 포함한다.
한 실시양태에서, rep 유전자는 합성 서열을 포함한다. 한 실시양태에서, cap 유전자는 합성 서열을 포함한다. 한 실시양태에서, aap 유전자는 합성 서열을 포함한다. 한 실시양태에서, rep 및 cap 유전자는 합성 서열을 포함한다. 한 실시양태에서, rep 및 aap 유전자는 합성 서열을 포함한다. 한 실시양태에서, cap 및 aap 유전자는 합성 서열을 포함한다. 한 실시양태에서, rep, cap 및 aap 유전자는 합성 서열을 포함한다.
일부 실시양태에서, rep는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 그의 임의의 조합으로부터 선택된 AAV 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV1 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV2 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV3 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV4 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV5 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV6 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV7 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV8 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV9 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV10 게놈으로부터의 것이다. 특정한 실시양태에서, rep는 AAV11 게놈으로부터의 것이다.
일부 실시양태에서, cap는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 그의 임의의 조합으로부터 선택된 AAV 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV1 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV2 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV3 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV4 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV5 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV6 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV7 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV8 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV9 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV10 게놈으로부터의 것이다. 특정한 실시양태에서, cap는 AAV11 게놈으로부터의 것이다.
일부 실시양태에서, aap는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 그의 임의의 조합으로부터 선택된 AAV 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV1 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV2 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV3 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV4 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV5 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV6 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV7 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV8 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV9 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV10 게놈으로부터의 것이다. 특정한 실시양태에서, aap는 AAV11 게놈으로부터의 것이다.
본원에 기재된 특정한 AAV 게놈은 상이한 AAV 게놈 (예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11로부터의 게놈)으로부터 유래된 유전자를 가질 수 있는 것으로 이해되어야 한다. 따라서, rep, cap 또는 aap의 임의의 가능한 순열/조합을 포함하는 AAV가 본원에 개시된다.
본원에 개시된 일부 실시양태에서, AAV는 재조합 AAV (rAAV)이다. 일부 실시양태에서, rAAV는 rep 유전자, cap 유전자 및 aap 유전자 중 1종 이상이 결여되어 있다. 일부 실시양태에서, rAAV는 rep 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 cap 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 aap 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 rep 유전자가 결여되어 있고, cap 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 rep 유전자가 결여되어 있고, aap 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 cap 유전자가 결여되어 있고, aap 유전자가 결여되어 있다. 일부 실시양태에서, rAAV는 rep 유전자, cap 유전자 및 aap 유전자가 결여되어 있다.
본원에 개시된 일부 실시양태에서, rAAV는 AAV 유전자 중 1종 이상의 발현이 변형되도록 rep 유전자, cap 유전자 및 aap 유전자 중 1종 이상이 돌연변이되도록 변형된다. 일부 실시양태에서, rep 유전자가 돌연변이된다. 일부 실시양태에서, cap 유전자가 돌연변이된다. 일부 실시양태에서, aap 유전자가 돌연변이된다. 일부 실시양태에서, rep 유전자 및 cap 유전자가 돌연변이된다. 일부 실시양태에서, rep 유전자 및 aap 유전자가 돌연변이된다. 일부 실시양태에서, cap 유전자 및 aap 유전자가 돌연변이된다. 일부 실시양태에서, cap 유전자, rep 유전자 및 aap 유전자가 돌연변이된다.
5.5.1.3 역전된 말단 반복부
특정 실시양태에서, AAV는 제1 ITR, 예를 들어 5' ITR 및 제2 ITR, 예를 들어 3' ITR을 포함한다. 전형적으로, ITR은 원핵 플라스미드로부터의 파르보바이러스 (예를 들어, AAV) DNA 복제 및 구제 또는 절제에 관여한다 (Samulski et al., 1983, 1987; Senapathy et al., 1984; Gottlieb and Muzyczka, 1988). 추가로, ITR은 AAV 프로바이러스 통합 및 AAV DNA의 비리온 내로의 패키징에 요구되는 최소 서열인 것으로 보고되었다 (McLaughlin et al., 1988; Samulski et al., 1989). 이들 요소는 파르보바이러스 게놈의 효율적인 증식에 필수적이다.
일부 실시양태에서, ITR은 자연 발생 ITR을 포함하며, 예를 들어 ITR은 파르보바이러스 ITR의 모두 또는 부분을 포함한다. 일부 실시양태에서, ITR은 합성 서열을 포함한다. 한 실시양태에서, 제1 ITR 또는 제2 ITR은 합성 서열을 포함한다. 또 다른 실시양태에서, 각각의 제1 ITR 및 제2 ITR은 합성 서열을 포함한다. 일부 실시양태에서, 제1 ITR 또는 제2 ITR은 자연 발생 서열을 포함한다. 또 다른 실시양태에서, 각각의 제1 ITR 및 제2 ITR은 자연 발생 서열을 포함한다.
일부 실시양태에서, ITR은 AAV 게놈으로부터의 ITR을 포함한다. 일부 실시양태에서, ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 그의 임의의 조합으로부터 선택된 AAV 게놈의 ITR이다. 특정한 실시양태에서, ITR은 AAV2 게놈의 ITR이다. 또 다른 실시양태에서, ITR은 AAV 게놈 중 1종 이상으로부터 유래된 ITR을 그의 5' 및 3' 말단에 포함하도록 유전자 조작된 합성 서열이다. 일부 실시양태에서, ITR은 동일한 게놈으로부터, 예를 들어 동일한 바이러스의 게놈으로부터, 또는 상이한 게놈으로부터, 예를 들어 2종 이상의 상이한 AAV 게놈의 게놈으로부터 유래된다. 특정 실시양태에서, ITR은 동일한 AAV 게놈으로부터 유래된다. 구체적 실시양태에서, 본 발명의 핵산 분자에 존재하는 2개의 ITR은 동일하고, 특히 AAV2 ITR일 수 있다. 하나의 특정한 실시양태에서, 제1 ITR 및 제2 ITR은 동일하다.
일부 실시양태에서, ITR은 헤어핀 루프 구조를 형성한다. 한 실시양태에서, 제1 ITR은 헤어핀 구조를 형성한다. 또 다른 실시양태에서, 제2 ITR은 헤어핀 구조를 형성한다. 또 다른 실시양태에서, 제1 ITR 및 제2 ITR 둘 다는 헤어핀 구조를 형성한다.
일부 실시양태에서, 본원에 기재된 핵산 분자 내의 ITR은 전사 활성화된 ITR이다. 전사-활성화된 ITR은 적어도 1개의 전사 활성 요소의 포함에 의해 전사 활성화된 야생형 ITR의 모두 또는 부분을 포함할 수 있다. 다양한 유형의 전사 활성 요소가 이와 관련하여 사용하기에 적합하다. 일부 실시양태에서, 전사 활성 요소는 구성적 전사 활성 요소이다. 구성적 전사 활성 요소는 유전자 전사의 진행중인 수준을 제공하고, 트랜스진이 진행중인 수준을 기준으로 발현되는 것이 바람직한 경우에 사용될 수 있다. 다른 실시양태에서, 전사 활성 요소는 유도성 전사 활성 요소이다. 유도성 전사 활성 요소는 일반적으로 유도인자 (또는 유도 조건)의 부재 하에 낮은 활성을 나타내고, 유도인자의 존재 (또는 유도 조건으로의 전환) 하에 상향-조절된다. 유도성 전사 활성 요소는 발현이 특정 시간 또는 특정 위치에서만 바람직한 경우 또는 유도제를 사용하여 발현 수준을 적정하는 것이 바람직한 경우에 사용될 수 있다. 전사 활성 요소는 또한 조직-특이적일 수 있으며; 즉, 이들은 특정 조직 또는 세포 유형에서만 활성을 나타낸다.
전사 활성 요소는 다양한 방식으로 ITR 내로 혼입될 수 있다. 일부 실시양태에서, 전사 활성 요소는 ITR의 임의의 부분의 5' 또는 ITR의 임의의 부분의 3'에 혼입된다. 다른 실시양태에서, 전사-활성화된 ITR의 전사 활성 요소는 2개의 ITR 서열 사이에 놓여 있다. 전사 활성 요소가 이격되어야 하는 2개 이상의 요소를 포함하는 경우에, 이들 요소는 ITR의 부분과 교대로 존재할 수 있다. 일부 실시양태에서, ITR의 헤어핀 구조는 결실되고, 전사 요소의 역전된 반복부로 대체된다. 이러한 후자의 배열은 구조 내 결실된 부분을 모방하는 헤어핀을 생성할 것이다. 다중 탠덤 전사 활성 요소가 또한 전사-활성화된 ITR에 존재할 수 있고, 이들은 인접하거나 이격될 수 있다. 추가로, 단백질 결합 부위 (예를 들어, Rep 결합 부위)가 전사-활성화된 ITR의 전사 활성 요소 내로 도입될 수 있다. 전사 활성 요소는 RNA 폴리머라제에 의한 DNA의 제어된 전사가 RNA를 형성할 수 있게 하는 임의의 서열을 포함할 수 있고, 예를 들어 하기 정의된 바와 같은 전사 활성 요소를 포함할 수 있다.
전사-활성화된 ITR은 핵산 분자로부터 운반 및 발현될 수 있는 트랜스진의 길이를 효과적으로 최대화하는 비교적 제한된 뉴클레오티드 서열 길이로 핵산 분자에 전사 활성화 및 ITR 기능 둘 다를 제공한다. 전사 활성 요소의 ITR 내로의 혼입은 다양한 방식으로 달성될 수 있다. ITR 서열 및 전사 활성 요소의 서열 요건의 비교는 ITR 내의 요소를 코딩하는 방식에 대한 통찰력을 제공할 수 있다. 예를 들어, 전사 활성은 전사 활성 요소의 기능적 요소를 복제하는 ITR 서열에의 특이적 변화의 도입을 통해 ITR에 부가될 수 있다. 특정한 뉴클레오티드 서열을 특정 부위에서 효율적으로 부가, 결실 및/또는 변화시키기 위한 다수의 기술이 관련 기술분야에 존재한다 (예를 들어, 문헌 [Deng and Nickoloff (1992) Anal. Biochem. 200:81-88] 참조). 전사-활성화된 ITR을 생성하는 또 다른 방식은 ITR 내 목적하는 위치에 제한 부위를 도입하는 것을 포함한다. 추가로, 다수의 전사 활성화 요소가 관련 기술분야에 공지된 방법을 사용하여 전사-활성화된 ITR 내로 혼입될 수 있다.
예시로서, 전사-활성화된 ITR은 1종 이상의 전사 활성 요소, 예컨대: TATA 박스, GC 박스, CCAAT 박스, Sp1 부위, Inr 영역, CRE (cAMP 조절 요소) 부위, ATF-1/CRE 부위, APBβ 박스, APBα 박스, CArG 박스, CCAC 박스 또는 관련 기술분야에 공지된 바와 같은 전사에 수반되는 임의의 다른 요소를 포함시킴으로써 생성될 수 있다.
5.5.1.4 관심 유전자 및 다른 서열
본 개시내용의 특정 측면은 대상체에게 AAV 요법을 투여하는 방법에 관한 것이다. 일부 실시양태에서, AAV는 관심 유전자 (GOI)를 포함한다. 일부 실시양태에서, GOI는 본원에 개시된 바와 같은 소형화 디스트로핀 폴리펩티드를 코딩하는, 본원에 개시된 바와 같은 뉴클레오티드 서열을 포함하는 핵산 분자이다.
발현될 GOI는, 사용자가 원하는 임의의 필요한 제어 요소 (예를 들어, 프로모터, 오퍼레이터)를 갖는, 단백질을 코딩하는 DNA 절편, 또는 전사되어 일부 RNA-함유 분자, 예컨대 리보자임 또는 안티센스 분자의 모두 또는 일부를 생산하는 비-코딩 DNA 절편일 수 있다.
일부 실시양태에서, AAV는 1개 초과의 GOI를 포함한다. 1개 초과의 GOI를 갖는 AAV에서, 일부 실시양태는 1개의 프로모터로부터 이들을 공동-발현하는 요소, 예컨대 IRES 또는 2A를 포함한다. 일부 실시양태에서, AAV는 IRES 요소에 의해 분리된 2개의 관심 유전자를 포함한다. 일부 실시양태에서, AAV는 2A 요소에 의해 분리된 2개의 관심 유전자를 포함한다. 일부 실시양태에서, AAV는 관심 유전자 사이의 IRES 요소에 의해 분리된 3개의 관심 유전자를 포함한다 (예를 들어, GOI-IRES-GOI-IRES-GOI). 일부 실시양태에서, AAV는 관심 유전자 사이의 2A 요소에 의해 분리된 3개의 관심 유전자를 포함한다.
일부 실시양태에서, AAV는 조절 서열을 포함한다. 일부 실시양태에서, AAV는 비-코딩 조절 DNA를 포함한다. 일부 실시양태에서, AAV 게놈은 숙주 세포에서의 항체 쇄 유전자의 발현을 제어하는 조절 서열을 포함한다. 용어 "조절 서열"은 항체 쇄 유전자의 전사 또는 번역을 제어하는 프로모터, 인핸서 및 다른 발현 제어 요소 (예를 들어, 폴리아데닐화 신호)를 포함하는 것으로 의도된다. 이러한 조절 서열은, 예를 들어 문헌 [Goeddel (Gene Expression Technology. Methods in Enzymology 185, Academic Press, San Diego, CA (1990))]에 기재되어 있다. 관련 기술분야의 통상의 기술자는 조절 서열의 선택을 포함한 AAV의 설계가 형질전환될 숙주 세포의 선택, 목적하는 단백질의 발현 수준 등과 같은 인자에 좌우될 수 있다는 것을 인지할 것이다. 일부 실시양태에서, AAV 게놈은 mRNA 스플라이스 공여자/스플라이스 수용자 부위를 포함한다. 포유동물 숙주 세포 발현을 위한 특정 조절 서열은 포유동물 세포에서 높은 수준의 단백질 발현을 지시하는 바이러스 요소, 예컨대 시토메갈로바이러스 (CMV), 원숭이 바이러스 40 (SV40), 아데노바이러스 (예를 들어, 아데노바이러스 주요 후기 프로모터 (AdMLP)) 및 폴리오마로부터 유래된 프로모터 및/또는 인핸서를 포함한다. 대안적으로, 비바이러스 조절 서열, 예컨대 유비퀴틴 프로모터 또는 β-글로빈 프로모터가 사용될 수 있다. 추가로, 상이한 공급원으로부터의 서열로 구성된 조절 요소, 예컨대 SV40 초기 프로모터 및 인간 T 세포 백혈병 바이러스 유형 1의 긴 말단 반복부로부터의 서열을 함유하는 SRa 프로모터 시스템이 사용될 수 있다 (Takebe, Y. et al. (1988) Mol. Cell. Biol. 8:466-472). 특정 실시양태에서, 조절 서열은 조직 특이적 프로모터를 포함한다. 일부 실시양태에서, 조직 특이적 프로모터는 심장, 간, 폐, 눈, 신경계, 림프계, 근육 및 줄기 세포로 이루어진 군으로부터 선택된 조직에서 관심 유전자의 발현을 구동한다.
5.5.1.5 AAV 제제
일부 실시양태에서, AAV 벡터는 전달 작용제와 함께 제제화된다. 일부 실시양태에서, 전달 작용제는 지질 나노입자를 포함한다. 일부 실시양태에서, 전달 작용제는 리포솜, 비-지질 중합체 분자, 엔도솜 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다.
5.5.2 비-AAV 벡터
프로모터에 작동가능하게 연결된 상기 기재된 폴리뉴클레오티드를 포함하는 벡터가 또한 본원에 제공된다. 뉴클레오티드 서열은 발현 제어 서열이 그 서열의 전사 및 번역을 제어하고 조절하는 경우에 발현 제어 서열 (예를 들어, 프로모터)에 "작동가능하게 연결"된다. 뉴클레오티드 서열을 언급하는 경우 용어 "작동가능하게 연결된"은 발현될 뉴클레오티드 서열 앞에 적절한 개시 신호 (예를 들어, ATG)를 갖고, 발현 제어 서열의 제어 하에 서열의 발현 및 서열에 의해 코딩되는 목적하는 생성물의 생산을 허용하도록 정확한 리딩 프레임을 유지하는 것을 포함한다. 재조합 핵산 분자 내로 삽입하고자 하는 유전자가 적절한 개시 신호를 함유하지 않는 경우, 이러한 개시 신호는 유전자 앞에 삽입될 수 있다. "벡터"는 또 다른 핵산 절편이 부착되어 그 부착된 절편의 복제를 일으키도록 할 수 있는 레플리콘, 예컨대 플라스미드, 파지 또는 코스미드이다. 프로모터는 박테리아, 효모, 곤충 또는 포유동물 프로모터일 수 있거나 또는 그와 동일할 수 있다.
일부 실시양태에서, 벡터는 플라스미드, 코스미드, 효모 인공 염색체 (YAC), 박테리오파지 또는 진핵 바이러스 DNA일 수 있다. 단백질 발현에 유용한 것으로 관련 기술분야에 공지된 다른 수많은 벡터 백본이 사용될 수 있다. 이러한 벡터는 다음을 포함하나 이에 제한되지는 않는다:
아데노바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터, 바큘로바이러스 벡터, 헤르페스 바이러스 벡터, 원숭이 바이러스 40 (SV40), 시토메갈로바이러스 (CMV), 마우스 유방 종양 바이러스 (MMTV) 및 몰로니 뮤린 백혈병 바이러스. 추가로, 한 부류의 벡터는 바이러스, 예컨대 소 유두종 바이러스, 폴리오마 바이러스, 바큘로바이러스, 레트로바이러스 또는 셈리키 포레스트 바이러스로부터 유래된 DNA 요소를 포함한다. 이러한 벡터는 상업적으로 수득되거나 또는 관련 기술분야에 널리 공지된 방법에 의해 기재된 서열로부터 조립될 수 있다.
일부 실시양태에서, 본원에 기재된 벡터는 전달 작용제와 함께 제제화된다. 일부 실시양태에서, 전달 작용제는 지질 나노입자를 포함한다. 일부 실시양태에서, 전달 작용제는 리포솜, 비-지질 중합체 분자, 엔도솜 및 그의 임의의 조합으로 이루어진 군으로부터 선택된다.
5.6 제약 조성물
본원에 개시된 다양한 폴리펩티드 및 폴리뉴클레오티드 (본원에서 "활성 화합물"로도 지칭됨)는 투여에 적합한 제약 조성물 내로 혼입될 수 있다. 이러한 조성물은 전형적으로 폴리펩티드 또는 폴리뉴클레오티드 및 제약상 허용되는 담체를 포함한다. 본원에 사용된 용어 "제약상 허용되는 담체"는 제약 투여에 상용성인, 임의의 및 모든 용매, 분산 매질, 코팅, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제 등을 포함하는 것으로 의도된다. 제약 활성 화합물에 대한 이러한 매질 및 작용제의 사용은 관련 기술분야에 널리 공지되어 있다. 임의의 통상적인 매질 또는 작용제가 활성 화합물과 비상용성인 경우를 제외하고는, 조성물에서의 그의 사용이 고려된다. 보충 활성 화합물이 또한 조성물 내로 혼입될 수 있다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 폴리펩티드 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 개시된다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 폴리펩티드를 포함하는 조성물 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 개시된다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 폴리뉴클레오티드 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 개시된다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 벡터 (예를 들어, rAAV) 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 개시된다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 숙주 세포 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물이 개시된다.
본 개시내용의 제약 조성물은 그의 의도된 투여 경로에 상용성이도록 제제화된다. 투여 경로의 예는 비경구, 예를 들어 정맥내, 피내, 피하, 경구, 경피 (국소) 및 경점막 및 그의 임의의 조합을 포함한다. 또 다른 투여 경로는 폐 투여를 포함한다. 추가로, 치료 유효량의 제약 조성물을 치료를 필요로 하는 영역에 국부로 투여하는 것이 바람직할 수 있다. 이는, 예를 들어 수술 동안 국부 또는 국소 주입 또는 관류, 국소 적용, 주사, 카테터, 좌제 또는 이식물 (예를 들어, 다공성, 비-다공성 또는 젤라틴성 물질, 예컨대 막, 예컨대 실라스틱 막 또는 섬유로부터 형성된 이식물) 등에 의해 달성될 수 있다. 또 다른 실시양태에서, 치료 유효량의 제약 조성물은 소포, 예컨대 리포솜으로 전달된다 (예를 들어, 문헌 [Langer, Science 249:1527-33, 1990 및 Treat et al., in Liposomes in the Therapy of Infectious Disease and Cancer, Lopez Berestein and Fidler (eds.), Liss, N.Y., pp. 353-65, 1989] 참조).
또 다른 실시양태에서, 치료 유효량의 제약 조성물은 제어 방출 시스템으로 전달될 수 있다. 한 예에서, 펌프가 사용될 수 있다 (예를 들어, 문헌 [Langer, Science 249:1527-33, 1990; Sefton, Crit. Rev. Biomed. Eng. 14:201-40, 1987; Buchwald et al., Surgery 88:507-16, 1980; Saudek et al., N Engl. J Med. 321:574-79, 1989] 참조). 또 다른 예에서, 중합체 물질이 사용될 수 있다 (예를 들어, 문헌 [Levy et al., Science 228:190-92, 1985; During et al., Ann. Neural. 25:351-56, 1989; Howard et al., J Neurosurg. 71:105-12, 1989] 참조). 문헌 [Langer (Science 249:1527-33, 1990)]에 의해 논의된 것과 같은 다른 제어 방출 시스템도 사용될 수 있다.
허용되는 담체, 부형제 또는 안정화제는 사용되는 투여량 및 농도에서 수용자에게 비독성이고, 완충제, 예컨대 포스페이트, 시트레이트 및 다른 유기 산; 항산화제, 예를 들어 아스코르브산 및 메티오닌; 보존제 (예컨대 옥타데실디메틸벤질 암모늄 클로라이드; 헥사메토늄 클로라이드; 벤즈알코늄 클로라이드, 벤제토늄 클로라이드; 페놀, 부틸 또는 벤질 알콜; 알킬 파라벤, 예컨대 메틸 또는 프로필 파라벤; 카테콜; 레조르시놀; 시클로헥산올; 3-펜탄올; 및 m-크레졸); 저분자량 (약 10개 미만의 잔기) 폴리펩티드; 단백질, 예컨대 혈청 알부민, 젤라틴 또는 이뮤노글로불린; 친수성 중합체, 예컨대 폴리비닐피롤리돈; 아미노산, 예컨대 글리신, 글루타민, 아스파라긴, 히스티딘, 아르기닌 또는 리신; 모노사카라이드, 디사카라이드 및 다른 탄수화물, 예를 들어 글루코스, 만노스 또는 덱스트린; 킬레이트화제, 예컨대 EDTA; 당, 예컨대 수크로스, 만니톨, 트레할로스 또는 소르비톨; 염-형성 반대-이온, 예컨대 나트륨; 금속 착물 (예를 들어, Zn-단백질 착물); 및/또는 비-이온성 계면활성제, 예컨대 트윈(TWEEN)™, 플루로닉스 (PLURONICS)™ 또는 폴리에틸렌 글리콜 (PEG)을 포함한다.
비경구 제제에 사용되는 제약상 허용되는 담체는 수성 비히클, 비수성 비히클, 항미생물제, 등장화제, 완충제, 항산화제, 국부 마취제, 현탁화제 및 분산제, 유화제, 격리제 또는 킬레이트화제 및 다른 제약상 허용되는 물질을 포함한다. 수성 비히클의 예는 염화나트륨 주사, 링거 주사, 등장성 덱스트로스 주사, 멸균수 주사, 덱스트로스 및 락테이트화 링거 주사를 포함한다. 비수성 비경구 비히클은 식물성 기원의 고정 오일, 목화씨 오일, 옥수수 오일, 참깨 오일 및 땅콩 오일을 포함한다. 정박테리아 또는 정진균 농도의 항미생물제가 다중-용량 용기에 패키징된 비경구 제제에 첨가될 수 있고, 여기에는 페놀 또는 크레졸, 수은, 벤질 알콜, 클로로부탄올, 메틸 및 프로필 p-히드록시벤조산 에스테르, 티메로살, 벤즈알코늄 클로라이드 및 벤제토늄 클로라이드가 포함된다. 등장화제는 염화나트륨 및 덱스트로스를 포함한다. 완충제는 포스페이트 및 시트레이트를 포함한다. 항산화제는 중황산나트륨을 포함한다. 국부 마취제는 프로카인 히드로클로라이드를 포함한다. 현탁화제 및 분산제는 소듐 카르복시메틸셀룰로스, 히드록시프로필 메틸셀룰로스 및 폴리비닐피롤리돈을 포함한다. 유화제는 폴리소르베이트 80 (트윈® 80)을 포함한다. 금속 이온의 격리제 또는 킬레이트화제는 EDTA를 포함한다. 제약 담체는 또한 수혼화성 비히클을 위한 에틸 알콜, 폴리에틸렌 글리콜 및 프로필렌 글리콜; 및 pH 조정을 위한 수산화나트륨, 염산, 시트르산 또는 락트산을 포함한다.
비경구, 피내 또는 피하 적용에 사용되는 용액 또는 현탁액은 하기 성분을 포함할 수 있다: 멸균 희석제, 예컨대 주사용수, 염수 용액, 고정 오일, 폴리에틸렌 글리콜, 글리세린, 프로필렌 글리콜 또는 다른 합성 용매; 항박테리아제, 예컨대 벤질 알콜 또는 메틸 파라벤; 항산화제, 예컨대 아스코르브산 또는 중아황산나트륨; 킬레이트화제, 예컨대 에틸렌디아민테트라아세트산; 완충제, 예컨대 아세테이트, 시트레이트 또는 포스페이트 및 장성 조정제, 예컨대 염화나트륨 또는 덱스트로스. pH는 산 또는 염기, 예컨대 염산 또는 수산화나트륨으로 조정될 수 있다. 비경구 제제는 앰플, 일회용 시린지, 또는 유리 또는 플라스틱으로 제조된 다중 용량 바이알에 봉입될 수 있다.
주사가능한 용도에 적합한 제약 조성물은 멸균 수용액 (수용성인 경우) 또는 분산액 및 멸균 주사가능한 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 정맥내 투여의 경우, 적합한 담체는 생리 염수, 정균수, 크레모포르 ELS (바스프(BASF); 뉴저지주 파시파니) 또는 포스페이트 완충 염수 (PBS)를 포함한다. 모든 경우에, 조성물은 멸균되어야 하고, 용이한 시린지성이 존재하는 정도로 유체이어야 한다. 이는 제조 및 저장 조건 하에 안정해야 하고, 미생물, 예컨대 박테리아 및 진균의 오염 작용에 대해 보존되어야 한다. 담체는, 예를 들어 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜 및 액체 폴리에틸렌 글리콜 등) 및 그의 적합한 혼합물을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은, 예를 들어 코팅, 예컨대 레시틴의 사용에 의해, 분산액의 경우 요구되는 입자 크기의 유지에 의해, 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 예방은 다양한 항박테리아제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 아스코르브산, 티메로살 등에 의해 달성될 수 있다. 많은 경우에, 등장화제, 예를 들어 당, 폴리알콜, 예컨대 만니톨, 소르비톨, 염화나트륨을 조성물에 포함시키는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 작용제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 포함시킴으로써 달성될 수 있다.
멸균 주사가능한 용액은 요구되는 양의 활성 화합물을 상기 열거된 성분 중 하나 또는 그의 조합과 함께 적절한 용매 중에 혼입시킨 후, 필요에 따라 여과 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 활성 화합물을 염기성 분산 매질 및 상기 열거된 것으로부터의 요구되는 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 제조 방법은 진공 건조 및 동결-건조일 수 있으며, 이는 그의 이전에 멸균-여과된 용액으로부터 활성 성분 플러스 임의의 추가의 목적하는 성분의 분말을 생성한다.
흡입에 의한 투여의 경우, 화합물은 적합한 추진제, 예를 들어 이산화탄소와 같은 기체를 함유하는 가압 용기 또는 분배기, 또는 네뷸라이저로부터 에어로졸 스프레이의 형태로 전달된다. 전신 투여는 또한 경점막 또는 경피 수단에 의할 수 있다.
경점막 또는 경피 투여의 경우, 투과될 장벽에 적절한 침투제가 제제에 사용된다. 이러한 침투제는 일반적으로 관련 기술분야에 공지되어 있고, 예를 들어 경점막 투여의 경우 세제, 담즙 염 및 푸시드산 유도체를 포함한다. 경점막 투여는 비강 스프레이 또는 좌제의 사용을 통해 달성될 수 있다. 경피 투여의 경우, 활성 화합물은 관련 기술분야에 일반적으로 공지된 바와 같은 연고, 살브, 겔 또는 크림으로 제제화된다. 화합물은 또한 직장 전달을 위한 좌제 (예를 들어, 통상적인 좌제 베이스, 예컨대 코코아 버터 및 다른 글리세리드 함유) 또는 정체 관장제의 형태로 제조될 수 있다.
한 실시양태에서, 활성 화합물은 신체로부터의 신속한 제거에 대해 화합물을 보호할 담체, 예컨대 이식물 및 마이크로캡슐화 전달 시스템을 비롯한 제어 방출 제제와 함께 제조된다. 생분해성, 생체적합성 중합체, 예컨대 에틸렌 비닐 아세테이트, 폴리무수물, 폴리글리콜산, 콜라겐, 폴리오르토에스테르 및 폴리락트산이 사용될 수 있다. 이러한 제제의 제조 방법은 관련 기술분야의 통상의 기술자에게 분명할 것이다. 물질은 또한 알자 코포레이션(Alza Corporation) 및 노바 파마슈티칼스, 인크.(Nova Pharmaceuticals, Inc.)로부터 상업적으로 입수될 수 있다. 리포솜 현탁액이 또한 제약상 허용되는 담체로서 사용될 수 있다. 이들은 관련 기술분야의 통상의 기술자에게 공지된 방법에 따라, 예를 들어 미국 특허 번호 4,522,811에 기재된 바와 같이 제조될 수 있다.
경구 또는 비경구 조성물을 투여의 용이성 및 투여량의 균일성을 위해 투여 단위 형태로 제제화하는 것이 특히 유리하다. 본원에 사용된 투여 단위 형태는 목적하는 치료 효과를 생성하도록 계산된 미리 결정된 양의 활성 화합물을 요구되는 제약 담체와 함께 함유하는, 치료될 대상체에 대한 단일 투여형으로서 적합한 물리적 이산 단위를 지칭한다. 본 개시내용의 투여 단위 형태에 대한 상세사항은 활성 화합물의 독특한 특징 및 달성하고자 하는 특정한 치료 효과, 및 개체의 치료를 위해 이러한 기능적 화합물을 배합하는 분야에 고유한 제한사항에 의해 지시되고 그에 직접 좌우된다. 제약 조성물은 투여에 대한 지침서와 함께 용기, 팩 또는 분배기에 포함될 수 있다.
5.7 용도 및 방법
5.7.1 소형화 디스트로핀의 생산 방법
본원에 기재된 숙주 세포를 적합한 조건 하에 배양하고, 소형화 디스트로핀 폴리펩티드를 회수하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드를 생산하는 방법이 또한 본원에 개시된다.
본원에 사용된 "단리된" 폴리뉴클레오티드 또는 핵산 분자는 핵산 분자의 자연 공급원 (예를 들어, 마우스 또는 인간)에 존재하는 다른 핵산 분자로부터 분리된 것이다. 더욱이, "단리된" 핵산 분자, 예컨대 cDNA 분자는 재조합 기술에 의해 생산되는 경우에 다른 세포 물질 또는 배양 배지가 실질적으로 없을 수 있거나 또는 화학적으로 합성되는 경우에 화학적 전구체 또는 다른 화학물질이 실질적으로 없을 수 있다. 예를 들어, 용어 "실질적으로 없는"은 다른 물질, 예를 들어 세포 물질, 배양 배지, 다른 핵산 분자, 화학적 전구체 및/또는 다른 화학물질이 약 15%, 10%, 5%, 2%, 1%, 0.5% 또는 0.1% 미만 (특히 약 10% 미만)인 폴리뉴클레오티드 또는 핵산 분자의 제제를 포함한다. 구체적 실시양태에서, 본원에 기재된 폴리펩티드를 코딩하는 핵산 분자(들)는 단리 또는 정제된다.
폴리뉴클레오티드는 관련 기술분야에 공지된 임의의 방법에 의해 수득될 수 있고, 폴리뉴클레오티드의 뉴클레오티드 서열은 그에 의해 결정될 수 있다. 본원에 기재된 폴리펩티드, 예를 들어 표 3 및 4에 기재된 폴리펩티드 및 이들 폴리펩티드의 변형된 버전을 코딩하는 뉴클레오티드 서열은 관련 기술분야에 널리 공지된 방법을 사용하여 결정될 수 있으며, 즉 특정한 아미노산을 코딩하는 것으로 공지된 뉴클레오티드 코돈은 폴리펩티드를 코딩하는 핵산을 생성하는 방식으로 조립된다. 폴리펩티드를 코딩하는 이러한 폴리뉴클레오티드는 화학적으로 합성된 올리고뉴클레오티드로부터 조립될 수 있으며 (예를 들어, 문헌 [Kutmeier G et al., (1994), BioTechniques 17: 242-6)]에 기재된 바와 같음), 이는 간략하게, 폴리펩티드를 코딩하는 서열의 부분을 함유하는 중첩 올리고뉴클레오티드의 합성, 이들 올리고뉴클레오티드의 어닐링 및 라이게이션, 및 이어서 라이게이션된 올리고뉴클레오티드의 PCR에 의한 증폭을 포함한다.
대안적으로, 본원에 기재된 폴리펩티드를 코딩하는 폴리뉴클레오티드는 관련 기술분야에 널리 공지된 방법 (예를 들어, PCR 및 다른 분자 클로닝 방법)을 사용하여 적합한 공급원 (예를 들어, 하이브리도마)으로부터의 핵산으로부터 생성될 수 있다. 예를 들어, 공지된 서열의 3' 및 5' 말단에 혼성화가능한 합성 프라이머를 사용하는 PCR 증폭은 관심 폴리펩티드를 생산하는 하이브리도마 세포로부터 수득된 게놈 DNA를 사용하여 수행될 수 있다. 이러한 PCR 증폭 방법은, 예를 들어 IL2, 링커 서열 또는 IL2-Rα를 코딩하는 서열을 포함하는 핵산을 수득하는데 사용될 수 있다. 증폭된 핵산은 숙주 세포에서의 발현을 위한 벡터 및 예를 들어 폴리펩티드를 생성하기 위한 추가의 클로닝을 위한 벡터 내로 클로닝될 수 있다.
특정한 폴리펩티드를 코딩하는 핵산을 함유하는 클론이 이용가능하지는 않지만 폴리펩티드 분자의 서열이 공지된 경우에, 폴리펩티드를 코딩하는 핵산은 화학적으로 합성되거나, 또는 서열의 3' 및 5' 말단에 혼성화가능한 합성 프라이머를 사용하는 PCR 증폭에 의해, 또는 예를 들어 폴리펩티드를 코딩하는 cDNA 라이브러리로부터의 cDNA 클론을 확인하기 위해 특정한 유전자 서열에 특이적인 올리고뉴클레오티드 프로브를 사용하는 클로닝에 의해, 적합한 공급원 (예를 들어, cDNA 라이브러리 또는 관심 단백질을 발현하는 임의의 조직 또는 세포, 예컨대 본원에 기재된 폴리펩티드를 발현하도록 선택된 하이브리도마 세포로부터 생성된 cDNA 라이브러리 또는 그로부터 단리된 핵산, 바람직하게는 폴리 A+ RNA)으로부터 수득될 수 있다. 이어서, PCR에 의해 생성된 증폭된 핵산이 관련 기술분야에 널리 공지된 임의의 방법을 사용하여 복제가능한 클로닝 벡터 내로 클로닝될 수 있다.
본원에 기재된 폴리펩티드를 코딩하는 DNA는 통상적인 절차를 사용하여 (예를 들어, 본원에 개시된 폴리펩티드를 코딩하는 유전자에 특이적으로 결합할 수 있는 올리고뉴클레오티드 프로브를 사용하여) 용이하게 단리 및 서열분석될 수 있다. 하이브리도마 세포는 이러한 DNA의 공급원으로서의 역할을 할 수 있다. 단리되면, DNA가 발현 벡터 내로 배치될 수 있고, 이어서 이는 달리 이뮤노글로불린 단백질을 생산하지 않는 숙주 세포, 예컨대 이. 콜라이(E. coli) 세포, 원숭이 COS 세포, 차이니즈 햄스터 난소 (CHO) 세포 (예를 들어, CHO GS 시스템™ (론자(Lonza))으로부터의 CHO 세포) 또는 골수종 세포 내로 형질감염되어, 재조합 숙주 세포에서의 폴리펩티드의 합성이 얻어진다.
5.7.1 치료 용도 및 방법
본원에 기재된 소형화 디스트로핀 폴리펩티드, 소형화 디스트로핀 폴리펩티드를 코딩하는 폴리뉴클레오티드, 소형화 디스트로핀 폴리펩티드를 코딩하는 폴리뉴클레오티드를 보유하는 벡터 (예를 들어, rAAV) 및 방법은 수많은 시험관내 및 생체내 유용성을 갖는다. 예를 들어, 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열, 예를 들어 벡터, 예를 들어 AAV 벡터, 또는 본원에 기재된 폴리펩티드는 배양물 내 세포에 시험관내 또는 생체외에서 투여되거나 또는 인간 대상체에게, 예를 들어 생체내에서 투여되어 질환을 치료할 수 있다.
따라서, 임의의 본원에 개시된 바와 같은 소형화 디스트로핀 핵산 분자, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 숙주 세포, 본원에 개시된 바와 같은 벡터 또는 본원에 개시된 바와 같은 제약 조성물 또는 그의 임의의 조합을 사용하는 치료 방법이 본원에 개시된다.
일부 실시양태에서, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에게 본원에 개시된 바와 같은 핵산, 본원에 개시된 바와 같은 벡터, 본원에 개시된 바와 같은 숙주 세포 또는 본원에 개시된 바와 같은 제약 조성물을 투여하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에서 소형화 디스트로핀 폴리펩티드를 발현시키는 방법이 본원에 개시된다.
일부 실시양태에서, 질환 또는 상태를 갖는 대상체에게 본원에 개시된 바와 같은 핵산, 본원에 개시된 바와 같은 벡터, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 숙주 세포 또는 본원에 개시된 바와 같은 제약 조성물을 투여하는 것을 포함하는, 질환 또는 상태를 갖는 대상체를 치료하는 방법이 본원에 개시된다. 일부 실시양태에서, 질환 또는 상태는 디스트로핀 결핍에 의해 유발된다. 일부 실시양태에서, 질환은 뒤시엔느 근육 이영양증 (DMD), 베커 근육 이영양증 (BMD), X-연관 확장성 심근병증 (XLDC), 안면견갑상완 근육 이영양증, 근긴장성 근육 이영양증, 지대 근육 이영양증, 안인두 근육 이영양증, 에머리-드레이푸스 근육 이영양증, 원위 근육 이영양증 및/또는 선천성 근육 이영양증이다. 다른 실시양태에서, 치료될 질환은 근육감소증, 심장 질환, 악액질이다.
일부 실시양태에서, 본원에 개시된 바와 같은 핵산 분자, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 벡터 (예를 들어, rAAV), 본원에 개시된 바와 같은 숙주 세포 또는 본원에 개시된 바와 같은 제약 조성물은 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여된다. 일부 실시양태에서, 본원에 개시된 바와 같은 핵산 분자, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 벡터, 본원에 개시된 바와 같은 숙주 세포 또는 본원에 개시된 바와 같은 제약 조성물은 국소, 표피 점막, 비강내, 경구, 질, 직장, 설하, 국소, 정맥내, 복강내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 경기관, 피하, 각피하, 관절내, 피막하, 지주막하, 척수내, 경막외 또는 흉골내 경로를 통해 투여된다. 일부 실시양태에서, 핵산 분자, 벡터 (예를 들어, rAAV), 본원에 개시된 바와 같은 숙주 세포 또는 폴리펩티드는 정맥내로 투여된다.
일부 실시양태에서, 치료 방법은 대상체에게 제2 작용제를 투여하는 것을 추가로 포함한다.
본원에 사용된 용어 "대상체"는 임의의 인간 또는 비-인간 동물을 포함한다. 예를 들어, 본원에 기재된 방법 및 조성물은 암을 갖는 대상체를 치료하는데 사용될 수 있다. 용어 "비-인간 동물"은 모든 척추동물, 예를 들어 포유동물 및 비-포유동물, 예컨대 비-인간 영장류, 양, 개, 소, 닭, 양서류, 파충류 등을 포함한다. 일부 실시양태에서, 대상체는 인간이다.
일부 실시양태에서, 대상체에게 핵산 분자, 벡터 (예를 들어, rAAV), 폴리펩티드, 숙주 세포 또는 제약 조성물을 투여하는 것은, 투여 전 대상체에서의 디스트로핀 단백질 발현에 비해 증가된 디스트로핀 단백질 발현을 유발하며, 여기서 디스트로핀 단백질 발현은 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배 또는 적어도 약 100배만큼 증가된다.
본 개시내용의 특정 측면에서, 방법은 대상체에게 AAV 요법을 투여하는 것을 포함하거나 또는 추가로 포함한다. 일부 실시양태에서, AAV 요법은 재조합 AAV를 투여하는 것을 포함한다. 관련 기술분야에 공지되고/거나 본원에 개시된 임의의 재조합 AAV가 본 개시내용의 방법에 사용될 수 있다. 일부 실시양태에서, AAV 요법은 AAV 유형 1, AAV 유형 2, AAV 유형 3 (유형 3A 및 3B 포함), AAV 유형 4, AAV 유형 5, AAV 유형 6, AAV 유형 7, AAV 유형 8, AAV 유형 9, AAV 유형 10, AAV 유형 11, AAV 유형 12, AAV 유형 13, 뱀 AAV, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 양 AAV, 염소 AAV, 새우 AAV 및 그의 임의의 조합으로 이루어진 군으로부터 선택된 AAV를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 1을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 2를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 3을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 4를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 5를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 6을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 7을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 8을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 9를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 10을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 11을 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 12를 투여하는 것을 포함한다. 특정 실시양태에서, AAV 요법은 AAV 유형 13을 투여하는 것을 포함한다.
일부 실시양태에서, 본원에 개시된 바와 같은 소형화 디스트로핀 핵산 분자, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 숙주 세포, 본원에 개시된 바와 같은 벡터 또는 본원에 개시된 바와 같은 제약 조성물 또는 그의 임의의 조합을 사용한 대상체의 치료는 유의한 염증 반응, 예를 들어 면역-매개 폐장염, 면역-매개 결장염, 면역-매개 간염, 면역-매개 신염 또는 신장 기능장애, 면역-매개 뇌하수체염, 면역-매개 갑상선기능저하증 및 갑상선기능항진증, 또는 다른 면역-매개 유해 반응을 유발하지 않는다. 일부 실시양태에서, 본원에 개시된 바와 같은 소형화 디스트로핀 핵산 분자, 본원에 개시된 바와 같은 폴리펩티드, 본원에 개시된 바와 같은 숙주 세포, 본원에 개시된 바와 같은 벡터, 본원에 개시된 바와 같은 제약 조성물 또는 그의 임의의 조합을 사용한 대상체의 치료는 유의한 심장 장애, 예를 들어 심실성 부정맥; 눈 장애, 예를 들어 홍채모양체염; 주입-관련 반응; 증가된 아밀라제, 증가된 리파제; 신경계 장애, 예를 들어 어지럼증, 말초 및 감각 신경병증; 피부 및 피하 조직 장애, 예를 들어 발진, 소양증, 낙설성 피부염, 다형성 홍반, 백반증 또는 건선; 호흡기, 흉부 및 종격 장애, 예를 들어 기침; 피로; 오심; 감소된 식욕; 변비; 관절통; 또는 설사를 유발하지 않는다.
5.8 키트
본원에 개시된 1종 이상의 핵산 분자, 본원에 개시된 바와 같은 1종 이상의 벡터 (예를 들어, rAAV), 본원에 개시된 바와 같은 1종 이상의 폴리펩티드 또는 본원에 개시된 바와 같은 1종 이상의 숙주 세포 또는 그의 임의의 조합을 포함하는 키트가 또한 본원에 개시된다. 일부 실시양태에서, 키트는 또한 임의의 상기 언급된 것 또는 그의 조합을 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함한다.
본원에 사용된 용어 "키트" 및 "시스템"은 본원에 개시된 적어도 1종 이상의 핵산 분자, 본원에 개시된 바와 같은 1종 이상의 벡터 (예를 들어, rAAV), 본원에 개시된 바와 같은 1종 이상의 폴리펩티드 또는 본원에 개시된 바와 같은 1종 이상의 숙주 세포 또는 그의 임의의 조합이, 구체적 실시양태에서, 1종 이상의 다른 유형의 요소 또는 성분 (예를 들어, 다른 유형의 생화학적 시약, 용기, 패키지, 예컨대 상업적 판매를 위해 의도된 패키징, 사용에 대한 지침서 등)과 조합된 것을 지칭하는 것으로 의도된다.
일부 실시양태에서, (a) 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드, 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드를 포함하는 조성물, 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드를 코딩하는 핵산, 벡터 (예를 들어, rAAV) 및/또는 숙주 세포 중 1종 이상; 및 (b) 임의의 상기 언급된 것을 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드 및 (b) 소형화 디스트로핀 폴리펩티드를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드를 포함하는 조성물 및 (b) 조성물을 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 소형화 디스트로핀 폴리펩티드를 코딩하는 핵산 및 (b) 핵산을 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 벡터 및 (b) 벡터를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 AAV 벡터 및 (b) 벡터를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다. 일부 실시양태에서, (a) 본원에 기재된 바와 같은 숙주 세포 및 (b) 숙주 세포를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트가 개시된다.
구체적 실시양태에서, 본원에 기재된 제약 조성물의 성분 중 1종 이상, 예컨대 본원에 제공된 1종 이상의 소형화 디스트로핀 펩티드로 충전된 1개 이상의 용기를 포함하는 제약 팩 또는 키트가 본원에 제공된다. 일부 실시양태에서, 키트는 본원에 기재된 제약 조성물 및 본원에 기재된 것과 같은 임의의 예방제 또는 치료제를 함유한다. 특정 실시양태에서, 키트는 T 세포 미토겐, 예컨대, 예를 들어 피토헤마글루티닌 (PHA) 및/또는 포르볼 미리스테이트 아세테이트 (PMA), 또는 TCR 복합체 자극 항체, 예컨대 항-CD3 항체 및 항-CD28 항체를 함유할 수 있다. 제약 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정된 형태의 통지서인, 인간 투여를 위한 제조, 사용 또는 판매에 대한 기관 승인을 반영하는 통지서가 이러한 용기(들)와 임의로 회합될 수 있다.
상기 방법에 사용될 수 있는 키트가 또한 본원에 제공된다. 한 실시양태에서, 키트는 1개 이상의 용기 내에 본원에 기재된 소형화 디스트로핀 폴리펩티드, 바람직하게는 정제된 소형화 디스트로핀 폴리펩티드를 포함한다. 구체적 실시양태에서, 본원에 기재된 키트는 실질적으로 단리된 소형화 디스트로핀 폴리펩티드를 대조군으로서 함유한다. 또 다른 구체적 실시양태에서, 본원에 기재된 키트는 소형화 디스트로핀 폴리펩티드 항원과 반응하지 않는 대조군 단백질을 추가로 포함한다. 또 다른 구체적 실시양태에서, 본원에 기재된 키트는 디스트로핀 항원에 대한 소형화 디스트로핀 폴리펩티드의 결합을 검출하기 위한 1종 이상의 요소를 함유한다 (예를 들어, 소형화 디스트로핀 폴리펩티드는 검출가능한 기질, 예컨대 형광 화합물, 효소 기질, 방사성 화합물 또는 발광 화합물에 접합될 수 있거나, 또는 제1 항체를 인식하는 제2 항체가 검출가능한 기질에 접합될 수 있음). 구체적 실시양태에서, 본원에 제공된 키트는 재조합적으로 생산된 또는 화학적으로 합성된 소형화 디스트로핀 폴리펩티드를 포함할 수 있다. 키트에 제공된 바와 같은 본원에 개시된 소형화 디스트로핀 폴리펩티드에 대한 항원은 또한 고체 지지체에 부착될 수 있다. 보다 구체적인 실시양태에서, 상기 기재된 키트의 검출 수단은 소형화 디스트로핀 폴리펩티드의 항원이 부착된 고체 지지체를 포함한다. 이러한 키트는 또한 비-부착된 리포터-표지된 항-인간 항체 또는 항-마우스/래트 항체를 포함할 수 있다. 이러한 실시양태에서, 항원에 대한 소형화 디스트로핀 폴리펩티드의 결합은 상기 리포터-표지된 항체의 결합에 의해 검출될 수 있다.
본 개시내용의 실시는 달리 나타내지 않는 한, 관련 기술분야의 기술 내에 있는 세포 생물학, 세포 배양, 분자 생물학, 트랜스제닉 생물학, 미생물학, 재조합 DNA 및 면역학의 통상적인 기술을 사용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 문헌 [Sambrook et al., ed. (1989) Molecular Cloning A Laboratory Manual (2nd ed.; Cold Spring Harbor Laboratory Press); Sambrook et al., ed. (1992) Molecular Cloning: A Laboratory Manual, (Cold Springs Harbor Laboratory, NY); D. N. Glover ed., (1985) DNA Cloning, Volumes I and II; Gait, ed. (1984) Oligonucleotide Synthesis; Mullis et al. 미국 특허 번호 4,683,195; Hames and Higgins, eds. (1984) Nucleic Acid Hybridization; Hames and Higgins, eds. (1984) Transcription And Translation; Freshney (1987) Culture Of Animal Cells (Alan R. Liss, Inc.); Immobilized Cells And Enzymes (IRL Press) (1986); Perbal (1984) A Practical Guide To Molecular Cloning; the treatise, Methods In Enzymology (Academic Press, Inc., N.Y.); Miller and Calos eds. (1987) Gene Transfer Vectors For Mammalian Cells, (Cold Spring Harbor Laboratory); Wu et al., eds., Methods In Enzymology, Vols. 154 and 155; Mayer and Walker, eds. (1987) Immunochemical Methods In Cell And Molecular Biology (Academic Press, London); Weir and Blackwell, eds., (1986) Handbook Of Experimental Immunology, Volumes I-IV; Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., (1986); Crooks, Antisense drug Technology: Principles, strategies and applications, 2nd Ed. CRC Press (2007) 및 Ausubel et al. (1989) Current Protocols in Molecular Biology (John Wiley and Sons, Baltimore, Md.)]을 참조한다.
상기 인용된 모든 참고문헌 뿐만 아니라 본원에 인용된 모든 참고문헌 및 아미노산 또는 뉴클레오티드 서열 (예를 들어, 진뱅크 번호 및/또는 유니프롯 번호)은 그 전문이 본원에 참조로 포함된다.
하기 실시예는 예시로서 비제한적으로 제공된다.
6. 실시예
6.1 감소된 면역원성 및 증진된 안정성을 갖는 신규 소형화 디스트로핀
디스트로핀 유전자 내의 돌연변이는 종종 상응하는 디스트로핀 단백질의 안정성 손상을 초래하며, 이는 다시 불안정한 디스트로핀 단백질의 프로테오솜 분해 및 이영양성 병리생리상태로 이어진다. 유사하게, AAV의 제한된 패키징 능력을 수용하기 위해 디스트로핀-코딩 DNA를 소형화하는 것은 상응하는 소형화 디스트로핀 단백질의 안정성을 손상시킬 수 있다.
다양한 소형화 디스트로핀 단백질의 안정성을 상응하는 디스트로핀 발현 벡터로 형질감염된 세포에서의 디스트로핀 단백질:mRNA 비를 비교함으로써 검사하였다. 내인성 디스트로핀 발현을 방지하는 디스트로핀 유전자 내의 E2035X 조기 정지 코돈을 보유하는 남성 인간 동질유전자 유도-만능 줄기 세포 (iPSC)-유래 심근세포 (iCM)를 생성하였다. 이들 세포를 소형화 디스트로핀 단백질을 발현하는 다양한 소형화 카세트로 형질감염시키고, 형질감염된 세포를 시험관내에서 24일 동안 배양한 후에 디스트로핀 단백질:mRNA 비를 검사하였다. 단백질 수준을 메소 스케일 디스커버리(Meso Scale Discovery; MSD) ELISA 검정에 의해 검사하고, mRNA 수준을 qrtPCR에 의해 검사하였다.
시험된 소형화 디스트로핀 및 시험 결과가 각각 도 2 및 도 3에 제시되어 있다. 데이터는 소형화 디스트로핀 펩티드 BXA-027741 (서열식별번호: 129) 및 BXA-027743 (서열식별번호: 132)이 최상의 단백질 안정성을 제공한다는 것을 나타냈다.
후속적으로, 이들 2종의 가장 안정한 설계 내에서 생성된 신규 접합부의 면역원성을 인 실리코 면역원성 예측 도구를 사용하여 시험하였다. BXA-027743 설계의 신규 접합부 (R1/링커R16 (접합부 J1), R17/H3 및 H3/R23 (접합부 J7)) (도 4 참조 및 제시되지 않음)는 상기 언급된 인 실리코 접근법에 기초하여 최소 면역원성 위험을 갖는 것으로 결정되었다.
BXA-027741 설계의 신규 접합부 (R1/R3 (접합부 J10), H2/링커R16 (접합부 J11) 및 R17/R24 (접합부 J9)) (도 5 참조)를 유사한 방식으로 분석하였다. 접합부 J9는 최소 면역원성 위험을 갖는 것으로 결정된 반면, 접합부 J10 및 J11은 개선될 수 있었다.
BXA-027741 설계의 상기 언급된 접합부 및 그의 접합부 변이체의 면역원성 잠재력을 하기 기재된 바와 같은 시험관내 T 세포 증식 검정을 사용하여 시험하였다. 간략하게, 말초 혈액 단핵 세포 (PBMC)의 샘플을 건강한 지원자 인간 대상체로부터 피콜 (지이 헬스케어(GE Healthcare)) 구배 원심분리에 의해 단리하고, 폴리머라제 연쇄 반응 (PCR) 증폭 및 올리고뉴클레오티드 프로브 (프로이뮨(ProImmune), 플로리다주 사라소타)와의 혼성화의 조합을 사용하여 인간 림프구 항원 (HLA) 부류 I 및 II 발현에 관하여 특징화하였다.
전세계 인구 빈도와 밀접하게 매칭되는 HLA 발현 프로파일을 갖는 40명의 공여자로부터의 PBMC 샘플의 패널을 추가의 분석에 사용하였다. PBMC 샘플을 증식 모니터링을 위한 CFSE (인비트로젠(Invitrogen), 캘리포니아주 칼스배드)로 표지하고, 96 웰 플레이트 내 10% 인간 AB (바이오리클레메이션(Bioreclamation), 뉴욕주 웨스트베리), 비-필수 아미노산 및 pen-strep (둘 다 깁코(Gibco)/피셔 사이언티픽(Fisher Scientific))을 함유하는 RPMI (론자, 스위스 바젤) 중에 웰당 200,000개 세포로 6회 반복하여 플레이팅하였다.
BXA-027741 접합부 펩티드, 그의 변이체 및 대조군 펩티드를 각각 40개의 PBMC 샘플의 패널과 함께 1 μM로 7일 동안 배양한 후, 배지를 세척해내고, 세포를 항-CD4 및 항 CD8 APC 모노클로날 항체 (비디 바이오사이언시스(BD Biosciences), 뉴저지주 프랭클린 레이크)로 표지하였다. 세척을 통한 미결합 항체의 제거 후, 세포를 PBS 중 3.7% 포르말린 (시그마(Sigma), 미주리주 세인트 루이스)으로 고정시키고, 유동 세포측정법에 의해 분석하여 증식성 CD4+ 세포 또는 CD8+ 세포의 백분율을 결정하였다.
상이한 BXA-027741 접합부 펩티드 및 그의 변이체와의 배양 7일 후에 양성 반응 (접합부 펩티드 또는 대조군 펩티드가 없는 배지에서 인큐베이션된 PBMC와 비교하여 CD4+ 또는 CD8+ T 증식성 세포의 수의 유의한 증가로 정의됨)을 나타낸 샘플 (40개의 공여자 샘플 중)의 백분율이 도 6a (CD4+) 및 도 6b (CD8+)에 제시되어 있다. 사용된 대조군 펩티드는 (1) 아바스틴 프레임워크 펩티드; (2) VL6-VL CDR3 펩티드; 및 (3) PADRE 펩티드-61309였다.
접합부 J10의 버전 3 (J10v3)은 접합부 J10 및 그의 다른 시험된 버전보다 우수하고, 접합부 J11의 버전 12 (J11v12)는 접합부 J11에 대한 면역원성 위험과 관련하여 전반적으로 우수한 것으로 밝혀졌다.
이어서, 소형화 디스트로핀 BXA-027741의 C-말단 도메인을 결실시켜, AAV의 제한된 패키징 능력을 보다 잘 수용하는 소형화 디스트로핀 BXA-196473 (서열식별번호: 119)을 생성하였다 (도 7). 이어서, 소형화 디스트로핀 BXA-196473에서 J10v3을 사용하여 J10을 대체하고 J11v12를 사용하여 J11을 대체함으로써, 소형화 디스트로핀 BXA-196477 (서열식별번호: 118)을 생성하였다 (도 8a 및 8b). J10v3 및 J11v12를 생성하기 위해, BXA-196473 (서열식별번호: 119)에서 각각 아미노산 RV를 아미노산 446과 447 사이에 삽입하고, 아미노산 SEAQ를 아미노산 606과 607 사이에 삽입하였다 (도 8a 및 8b).
BXA-196473 (서열식별번호: 119)을 하기와 같은 시험된 다른 접합부 버전으로 추가적으로 변형시켰다:
BXA-196474 (서열식별번호: 120): 접합부 9 버전 2 (J9v2) 및 접합부 11 버전 12 (J11v12)
BXA-196475 (서열식별번호: 121): 접합부 9 버전 5 (J9v5) 및 접합부 11 버전 12 (J11v12)
BXA-196476 (서열식별번호: 122): 접합부 9 버전 6 (J9v6) 및 접합부 11 버전 12 (J11v12)
BXA-196478 (서열식별번호: 124): 접합부 10 버전 6 (J10v6) 및 접합부 11 버전 12 (J11v12)
BXA-196479 (서열식별번호: 125): 접합부 11 버전 12 (J11v12)
J9v2는 BXA-196473에서 R17 도메인과 R24 도메인 사이, 즉 아미노산 843 내지 845의 아미노산 LER에서 KNI로의 치환이다.
J9v5는 BXA-196473에서 R17 도메인과 R24 도메인 사이, 즉 아미노산 842와 843 사이의 K의 삽입이다.
J9v6은 BXA-196473에서 R17 도메인과 R24 도메인 사이, 즉 아미노산 842와 843 사이의 KNI의 삽입이다.
J10v3은 BXA-196473에서 R1과 R3 도메인 사이, 즉 아미노산 446과 447 사이의 RV의 삽입이다.
J10v6은 BXA-196473에서 R1과 R3 도메인 사이, 즉 아미노산 446과 447 사이의 RVLLQDI의 삽입이다.
J11v12는 BXA-196473에서 H2 도메인과 R16 도메인 앞 링커 사이, 즉 아미노산 606과 607 사이의 SEAQ의 삽입이다.
이어서, 생성된 소형화 디스트로핀을 상기 기재된 바와 같이 안정성에 대해 시험하였다 (도 9). 결과는 BXA-196477 소형화 디스트로핀 설계 (J10V3 및 J11V12를 함유함)가 가장 낮은 면역원성 위험을 가질 뿐만 아니라, 또한 가장 안정하였다는 것을 나타냈다.
추가로, 소형화 디스트로핀 폴리펩티드 설계 BXA-212371을, 마지막 3개의 C-말단 아미노산을 결실시킴으로써 및 BXA-212371의 아미노산 위치 682 뒤에 아미노산 접합부 변이체 서열 KNDL을 삽입함으로써 (J2V10; 스펙트린 반복부 17 (R17) 도메인과 힌지 3 (H3) 도메인 사이) 변형시켰으며 (소형화 디스트로핀 BXA-213788, 서열식별번호: 152를 생성함), 이는 더 낮은 면역원성 위험을 갖는 것으로 밝혀졌다.
6.2 시험관내 생리학
DMD iCM은 다중-전극 어레이를 사용하여 동질유전자 야생형 iCM과 비교할 때, 더 낮은 Na+ 채널 진폭, 연장된 cFPD (Q-T 간격) 및 더 큰 박동율 변동성을 갖는다. DMD iCM은 또한 야생형 iCM보다 더 높은 Ca2+ 전달 및 더 낮은 임피던스를 가지며, 각각의 방법은 비-페이스 조절 세포에서의 박동률 변동성을 확인시켜 준다.
E2035X 돌연변이를 보유하는 DMD iCM에서의 소형화 디스트로핀 BXA-196477의 발현이 DMD 표현형을 완화시키고 세포의 생리학적 형질을 개선시킬 수 있는지 여부를 검사하였다. 다중-전극 어레이, 임피던스 수축 검정 및 Ca2+ 과도를 사용하여 소형화 디스트로핀 발현의 효과를 측정하였다. 본 발명자들은 또한 BXA-027743의 C-말단 도메인을 결실시켜 AAV의 제한된 패키징 능력을 보다 잘 수용하는 BXA-212371을 생성하였다. BXA196477에 대해 제안된 동일한 검정을 이용하여, DMD 표현형을 완화시키고 동일한 세포의 생리학적 형질을 개선시키는 BXA-212371의 기능적 능력을 검사하였다.
본 연구에 사용된 hiPSC CM은 셀룰라 다이나믹스 인터내셔널(Cellular Dynamics International) (위스콘신주 매디슨)로부터 구입한 DMD (E2035X) iCell이었다. 인간 심실 섬유모세포를 론자 (메릴랜드주 워커스빌)로부터 구입하였다. iCell hiPSC CM은 1차 성인 심근세포에 가까운 전기생리학적 특성을 가지며 다양한 심장 이온 채널 억제제뿐만 아니라 아드레날린성 및 무스카린성 수용체 효능제 및 길항제에 유사하게 반응하는 것으로 보고되었다. 본 발명자들의 연구는 hiPSC CM을 섬유모세포와 함께 공동배양하는 것이 다중-전극 어레이 (MEA)에서의 전기생리학적 연구를 위한 보다 안정한 제제를 제공하였다는 것을 보여주었다. hiPSC CM을 7% CO2 하에 0.1% 젤라틴 처리된 6-웰 배양 플레이트 상에서 7일 동안 배양한 다음, 트립신처리하고, 인간 성인 심장 섬유모세포로 약 5:1 비로 희석하였다. 이어서, hiPSC CM 및 섬유모세포의 현탁액을 라미닌-코팅된 9-웰 다중-전극 어레이 (MEA) 플레이트 (256-9웰MEA300/30iR-ITO-mq; 멀티채널 시스템즈(Multichannel Systems)) 상에서 공동배양하였다. hiPSC CM을 AAV9-mDys 발현 구축물 (소형화 디스트로핀 BXA-196477 및 BXA-213788을 발현함, 도 15d)로 1x106의 MOI로 48시간 동안 감염시킨 다음, hiPSC CM을 감염으로부터 7일 및 9일 후에 세포외 장 전위 (FP)에 대한 효과에 대해 평가하였다. BXA-196477 및 BXA-213788 둘 다는 DMD CM과 비교하여 전도 속도를 ~80%만큼 유의하게 개선시켰다 (이원 ANOVA, ***P<0.001, 터키 사후-검정 사용, n = 6) (도 15e). 디스트로핀 ELISA는 세포에서의 디스트로핀 발현을 확인시켜 주었다 (도 15f).
MEA 기술은 세포를 배양하거나 조직을 배치할 수 있는 매립된 기판-통합된 세포외 전극의 어레이로부터 흥분성 세포 또는 조직의 고효율 시공적 분석을 가능하게 한다. 세포외 장 전위 (FP)는 각각의 전극에 의해 기록되고, 세포 활동 전위에 상응한다. FP 형태, 지속기간 및 전도 속도의 평가는 처리의 이온 채널 활성뿐만 아니라 재분극 및 전도에 대한 효과의 그림을 제공한다. MEA 플레이트 상에서 hiPSC CM을 7일 동안 배양한 후에, 세포는 각각의 웰에 매립된 기록 전극 상에서 자발적으로 박동하는 단층을 형성하였다. 자발적 FP를 USB-MEA256-시스템 및 MC 랙 획득 소프트웨어 (멀티 채널 시스템즈)를 사용하여 10 kHz의 샘플링 주파수로 28개 전극/웰 (30um 직경, 300 um 중앙 대 중앙 간격)로부터 기록하였다. 일정한 5% CO2 및 95% O2 공급 하에 37℃의 가습 환경에서 20-분 평형 기간 후에, 각각의 웰을 300 μl 유지 배지 중 AAV9-mDys 발현 구축물로 형질감염시켰다. FP의 펄스간 간격 (IPI)에 대한 소형화 디스트로핀의 발현의 효과를 모니터링하고 기록하였다. 데이터를 매트랩 (매스웍스(Mathworks))에 기록된 맞춤 소프트웨어로 분석하였다. 심박수에 대한 대용물인 박동률 (박동/분)을 BR=60000/IPI를 사용하여 계산하였으며, 여기서 IPI는 각각의 조건 하에 정상-상태에서 100초 기록의 평균 IPI (msec)이다. 측정될 전기생리학적 파라미터는 재분극에 대한 대용물인 장 전위 지속기간 및 장 전위 전도 속도이다. 장 전위 지속기간을 박동률 변화에 대해 보정하였다 (FPDc). 모든 처리는 적어도 3회 반복하였다.
동기화된 단일 전파된 박동 동안 MEA 웰에 매립된 각각의 전극에 대한 장 전위 활성화 시간을 측정함으로써 전도 속도를 정량화하였다. 각각의 전극으로부터의 장 전위의 디지털화된 기록을 2.1 ms의 윈도우로 21-포인트 최소 제곱 평활 다항식 (Savitsky & Golay, 1964)을 사용하여 평활화하였다. 활성화 시간은 각각의 장 전위 파형의 음의 도함수에서의 피크에 대한 값이다. 가장 이른 활성화 시간과 가장 늦은 활성화 시간 둘 사이의 시간은 심근세포의 단층을 가로지르는 장 전위 전파에 대한 전도 시간이고, 이들 두 전극 사이의 거리는 전도 거리이다. 전도 시간을 각각의 전파의 전도 거리로 나눈 것은 MEA 웰 상의 단층 심근세포의 각각의 박동의 전도 속도이다 (도 15).
데이터는 둘 다의 소형화 디스트로핀 설계가 전도 속도를 유의하게 개선시켰다는 것을 보여준다 (도 15).
6.3 골격근 생리학의 생체내 회복
디스트로핀-결핍 골격근은 보다 적은 비력 (면적당 힘)을 생성하고, 수축-유도된 손상에 고도로 감수성이다. 디스트로핀 발현의 회복은 이들 장애를 완화시킬 수 있다. 이영양성 mdx 마우스를 2주령에서 안와후 주사에 의해 2e14vg/kg AAV9-C5-12-BXA-196477 또는 AAV9-C5-12-BXA-212371로 전신 처리하였다. 사지 근육 생리학을 8주령에서 검사하였다. 간략하게, 마우스 무릎을 클램핑하고, 발을 등자장치에 넣고, 근육을 바늘 전극으로 최대로 수축시키면서 등자장치를 이동시켰다. 본 검정은 피크 움찔수축 및 테타니성 근육 힘 생성 및 수축-유도된 손상을 측정한다.
6.4 이영양성 병리상태의 생체내 예방
DMD의 mdx 마우스 모델에서의 골격근은 전형적으로 ~3-4주령부터 괴사 및 재생을 겪는다. 재생된 근육은 전형적으로 크기가 보다 가변적이고, 동결된 횡단면 내 중앙에 위치한 핵을 함유한다. 또한, 재생된 근육에서는 섬유증이 보다 우세해진다. 비처리 mdx 근육 및 AAV9-C5-12-BXA-196477 또는 AAV9-C5-12-BXA-212371로 처리된 mdx 근육에서의 근섬유 크기, 중앙에 위치한 핵의 비율 및 섬유증을 측정하였다. 소형화 디스트로핀을 발현하는 근섬유의 비율을 또한 정량화하였다. HALO 및 콜럼부스 영상화 컴퓨터 프로그램을 사용하여 횡경막, 비복근, 전경골근 및 심장 근육을 검사하였다.
6.5 생체내 연구
연구 개요
mdx4cv 마우스를 2주령에서 2e14vg/kg AAV9-BXA-196477 또는 AAV9-BXA-213788로 처리하였다. 투여 2주 후에, n = 3 마우스를 종결시켜 소형화 디스트로핀의 표적 결속 (생체분포 및 발현 수준)을 검사하였다. 2개월령에서 우측 전경골근을 이전에 기재된 것 (Khairallah et al., 2012)과 유사하게 수축-유도된 손상에 대한 강도 및 저항성 (n = 10)에 대해 검사하였다. 마우스를 3개월령에서 종결시키고, 표적 결속 및 이영양증의 예방에 대해 검사하였다 (도 16).
표적 결속
면역-형광 - OCT에서 액체 N2 중 2-메틸부타인에 근육을 넣어 동결시켰다. 10um 동결 절편을 디스트로핀에 대한 항체 (Mandys106; DSHB; 1:200) 및 알렉사-647에 접합된 밀배아 응집소로 면역염색하였다. 알렉사-488 IgG2a 항체를 사용하여 디스트로핀 1차 항체를 표지하였다. 오페라 페닉스 고효율 스크리닝 공초점 현미경 (퍼킨-엘머(Perkin-Elmer))을 사용하여 절편을 영상화하고, 콜럼부스 소프트웨어를 사용하여 정량화하였다. 간략하게, 알렉사-647 영상을 반전시키고, M-모드를 사용하여 세포를 찾아내고, 횡단면 <2000um2 내의 선택 세포 집단에서 형태를 계산하였다. 다음에, 알렉사-488의 강도를 계산하고, mdx4cv 대조군 근육 초과의 강도를 갖는 집단을 선택하였다. 90% 초과의 근육이 4-주 및 12-주 마우스에서 소형화 디스트로핀에 대해 양성이었다 (도 17).
mRNA - 총 RNA의 단리를 위해, 퀴아젠 티슈라이저(Qiagen Tissuelyzer)를 사용하여 조직을 균질화하고, 퀴아젠 RN이지 96 유니버셜(Qiagen RNeasy 96 Universal) 조직 키트 (퀴아젠 카탈로그 번호 74881)를 사용하여 RNA를 단리하였다. 조직 (~15개)을 750ul의 퀴아졸 시약 및 1개의 5mm 강철 비드를 함유하는 RN이지 키트 수집 마이크로튜브에 넣고, 티슈라이저를 사용하여 30hz에서 2분 동안 균질화하고, 균질화될 때까지 이 단계를 반복하고, 이어서 4℃에서 1분 동안 6000xg로 원심분리하였다. 각각의 튜브에 150 ml의 클로로포름을 첨가하고, 샘플을 15초 동안 격렬하게 볼텍싱하였다. 실온에서 3분 인큐베이션한 후, 샘플을 4℃에서 15분 동안 6000xg로 회전시켰다. 수성 상을 제거하고 (~360ul), 1 부피의 RNAse 무함유 70% EtOH를 함유하는 새로운 튜브로 옮겼다. 모든 샘플을 96 웰 RN이지 96 플레이트로 옮기고, 플레이트를 에어포어(AirPore) 테이프로 밀봉하고, 실온에서 4분 동안 5600xg로 원심분리하였다. 웰당 400 ul의 RW1 완충제를 첨가하고, 플레이트를 재밀봉하고, 5600xg로 4분 동안 회전시켰다. 회전 동안, DNase 바이알당 550 ul의 RNAse 무함유 물을 첨가함으로써 DNase I 원액을 제조하였다. 670 ul의 DNase I 원액을 7.3ml RDD 완충제 중에 희석하고, 혼합하고, 4℃에서 저장하였다. 원심분리를 완료하였을 때, 관통물을 폐기하고, 80ul의 DNase I 믹스를 각각의 웰의 중앙에 직접 첨가하고, 플레이트를 실온에서 15분 동안 인큐베이션하였다. 인큐베이션 후, 400ul의 RW1을 각각의 웰에 첨가하고, 플레이트를 밀봉하고, 5600xg로 4분 동안 원심분리하였다. 관통물을 폐기하고, 웰당 800ul의 RPE 완충제를 첨가하고, 플레이트를 재밀봉하고, 5600xg로 4분 동안 회전시켰다. 이 과정을 반복하고, 플레이트를 5600xg로 10분 동안 원심분리하였다. 이어서, 각각의 웰의 중앙에 60 ul의 RNAse 무함유 물을 첨가하고, 5600xg로 4분 동안 원심분리함으로써, 각각의 샘플을 새로운 튜브 내로 용리시켰다. 회수를 개선시키기 위해, 60 uL를 플레이트 상에 다시 재적용하고, 5600xg로 추가 4분 동안 원심분리하였다. RNA 수율을 나노드롭 8000을 사용하여 정량화하였다.
RT-PCR - cDNA 합성 및 후속 PCR을 위해, 10 ul H2O 중 1 ug의 RNA를 96 웰 플레이트의 1개 웰에 첨가하였다 (플레이트-악시겐(Axygen), PCR-96-C-S). 각각의 웰에 10 ul의 마스터 믹스 (고용량 cDNA 역전사 키트, 어플라이드 바이오시스템(Applied Biosystem))를 첨가하고, 플레이트를 1000 rpm으로 원심분리하였다. cDNA 합성을 25℃에서 10분 동안, 37℃에서 120분 동안, 85℃에서 5분 동안 수행하고, 이어서 4℃에서 유지하였다. qPCR을 위해, 각각의 샘플을 384 웰 투명 반응 플레이트 (어플라이드 바이오시스템; 카탈로그 번호 4483285)에서 프라이머/프로브 세트 (정방향 프라이머 5'-TGGAAGATTGCTACGAGCGC-3'; 역방향 프라이머 5'-CAGGTCGCTGAACAGGTTCT-3'; 프로브-6FAM-GCAAGTTCGGCAAGCAGCACA-MGBNFG)로 이중으로 실행시켰다. 각각의 반응물에 2ul의 cDNA 및 8 uL의 마스터 믹스 (5 ul 패스트 어드밴스드 마스터 믹스, 0.5 ul 20X FAM 프라이머 프로브 믹스 및 2.5 ul 물)를 첨가하고, 플레이트를 1000 rpm으로 1분 동안 원심분리하였다. 데이터 분석용 ViiA7 시스템 및 퀀트 스튜디오(Quant Studio) 실시간 PCR 소프트웨어 (어플라이드 바이오시스템)를 사용하여 샘플을 95℃에서 20초 동안, 이어서 95℃에서 1초 동안 및 60℃에서 20초 동안의 40 사이클로 인큐베이션하였다.
벡터 게놈/게놈 DNA 단리 및 qPCR - 게놈 DNA 단리를 위해, 퀴아젠 티슈라이저를 사용하여 조직을 균질화하고, 퀴아젠 DN이지(DNeasy) 96 혈액 및 조직 키트 (퀴아젠 카탈로그 번호 69581)를 사용하여 게놈 DNA를 단리하였다. 200 ul의 프로테이나제 K-완충제 ATL 및 1개의 5 mm 강철 비드를 함유하는 96 웰 플레이트 (코스타 검정 블록 1 ml, 카탈로그 번호 3958)에 조직 (~10 mg)을 넣고, 티슈라이저 30hz를 사용하여 2분 균질화하고, 균질화될 때까지 반복하였다. 제조 지침서에 따른 게놈 DNA 단리. qPCR을 위해, 각각의 샘플을 384 웰 투명 반응 플레이트 (어플라이드 바이오시스템; 카탈로그 번호 4483285)에서 프라이머/프로브 세트 (정방향 프라이머 5'-TGGAAGATTGCTACGAGCGC-3'; 역방향 프라이머 5'-CAGGTCGCTGAACAGGTTCT-3'; 프로브-6FAM-GCAAGTTCGGCAAGCAGCACA-MGBNFG)로 이중으로 실행시켰다. 각각의 반응물에 2 ul의 게놈 DNA (80 ng) 및 8 uL의 마스터 믹스 (5 ul 패스트 어드밴스드 마스터 믹스, 0.5 ul 20X FAM 프라이머 프로브 믹스 및 2.5 ul 물)를 첨가하고, 플레이트를 1000 rpm으로 1분 동안 원심분리하였다. 데이터 분석용 ViiA7 시스템 및 퀀트 스튜디오 실시간 PCR 소프트웨어 (어플라이드 바이오시스템)를 사용하여 샘플을 95℃에서 20초 동안, 이어서 95℃에서 1초 동안 및 60℃에서 20초 동안의 40 사이클로 인큐베이션하였다.
MSD-ELISA - 단백질 발현을 Elisa 검정에 의해 결정하였다. 다중-검정 384-웰 플레이트 (메소 스케일 디스커버리, 카탈로그 번호 L21XB-4)를 비카르보네이트 완충제 중 2 ug/ml의 농도의 모노클로날 항체 Manex 1011b로 밤새 사전-코팅하였다. 이어서, 플레이트를 실온에서 진탕시키면서 4시간 동안 차단 완충제 (PBS 중 5% BSA)로 차단하였다. 조직 (~20 mg)을, 퀴아젠 티슈라이저를 사용하여 30hz에서 5분 동안 프로테아제 억제제 칵테일 정제 (로슈(Roche), 카탈로그 번호 04 693 159 001)와 함께 ripa 완충제 (시그마, 카탈로그 번호 R0278) 중 1mg 조직/10 ul 용해 완충제의 농도로 균질화시키고, 균질화될 때까지 이 단계를 반복하였다. 조직 ripa 용해물을 결합 완충제 (PBS 중 1% BSA, 0.05% 트윈 20, 20 mM 트리스 pH 7.5) 중에 1 대 3으로 희석하였다. 조직 용해물 및 술포-접합된 Mandys 106 (0.2 ug/ml)을 사전-코팅된 384 웰 플레이트에 첨가하고, 밤새 진탕시키면서 40℃에서 인큐베이션하였다. 플레이트를 0.05% 트윈 20을 함유하는 PBS로 세척하고, 계면활성제를 함유하는 40 ul MSD 판독 완충제 T (카탈로그 번호 R92TC-1)를 첨가하였다. 이어서, 플레이트를 MSD 섹터 6000 기계 상에서 판독하였다.
데이터는 4주령에서 >90% 가로무늬근 세포에서 발현 (mRNA 및 단백질)을 달성하기에 충분한 바이러스가 투여되었다는 것을 보여주었다 (도 18).
크레아틴 키나제 - 상업적으로 입수가능한 키트를 사용하여 혈청에서 근육 손상의 지표로서의 크레아틴 키나제를 측정하였다. 4주령에서 (전달 2주 후에) CK를 측정하였다. 또한, 수축-유도된 손상 프로토콜로부터 1개월 후인 3개월령에서 CK를 측정하였다 (하기 참조). ****P < 0.001, 일원 ANOVA + 터키 사후-검정, n = 10, mdx4cv와의 비교. 데이터는 BXA-196477 또는 BXA-213788로 처리된 마우스에서 크레아틴 키나제 수준 및 따라서 근육 손상이 유의하게 감소되었다는 것을 보여주었다 (도 19).
기능적 연구
전경골근 (TA) 근육 수축 특성을 제조업체 지침서 (오로라 사이언티픽(Aurora Scientific))에 따라 생체내 (족판) 장치에 의해 시험하였다. 간략하게, 피크 테타니성 수축은 힘 주파수 곡선에서 150Hz에서 달성되었다 (힘은 뉴턴 미터로서 토크로 측정됨). 피크 테타니성 수축은 야생형, mdx4cv 및 BXA-196477 또는 BXA-213788로 처리된 mdx4cv 마우스에서 동일하였다. 그러나, TA 근육 질량은 mdx4cv에서 더 커서 (****P < 0.001, 일원 ANOVA + 터키 사후-검정, n = 10), TA 질량에 대한 피크 테타니성 힘의 정규화는 mdx4cv 마우스에서 감소되었고 처리된 마우스에서는 야생형 수준이었다 (***P < 0.001, mdx4cv와의 비교; 일원 ANOVA + 터키 사후-검정, n = 10) (도 20).
전경골근 (TA) 근육 손상을 제조업체 지침서 (오로라 사이언티픽)에 따라 생체내 (족판) 장치에 의해 측정하였다. 150Hz (최대 등척성 토크)에서의 피크 테타니성 수축 동안, 족판을 90°에서 135° 도로 회전시켜 근육을 변형시켰다. 이러한 수축을 이전에 기재된 바와 같이 (Khairallah et al., 2012) 20회 수축에 대해 매분 반복하였다. 변형 직전의 최대 등척성 토크는 mdx4cv마우스에서 각각의 수축에 따라 유의하게 감소하였다 (P < 0.0001, 야생형과의 비교; 이원 ANOVA; n = 9-10). 대조적으로, BXA-196477 및 BXA-213788 둘 다는 야생형 수준과 유사하게 수축-유도된 손상을 방지하였다 (****P<0.0001 BXA-213788 및 **P<0.01 BXA-196477, mdx4cv와의 비교, 터키 사후-검정, n = 9-10). 데이터는 둘 다의 소형화 디스트로핀 설계가 TA 근육을 수축-유도된 손상으로부터 보호한다는 것을 보여준다 (도 21).
본원의 실시예에 기재된 소형화 디스트로핀 구축물의 시험관내 및 생체내 발현은 C5-12 프로모터의 제어 하에 있었고 (US 2004/0175727 참조), 여기서 처음 7개 및 마지막 13개의 뉴클레오티드가 제거되었다. 사용된 AAV는 AAV9였고, 여기서 ITR은 AAV2였다.
6.6 추가의 면역원성 연구
소형화 디스트로핀 폴리펩티드 BXA-027741 내의 힌지 2 (H2) 도메인과 R16 스펙트린 반복부 16 (R16) 사이에 생성된 신규 접합부 (표 12 참조: 서열식별번호: 156 내지 166; 서열식별번호: 155가 원래 서열이었음)의 면역원성을 인 실리코 면역원성 예측 도구를 사용하여 시험하였다. 신규 접합부 서열식별번호: 157 (도 22 참조)은 상기 언급된 인 실리코 접근법에 기초하여 최소 면역원성 위험을 갖는 것으로 결정되었다. 시험된 접합부 서열은 하기와 같이 넘버링된다: 서열식별번호: 155 (1), 서열식별번호: 156 (2), 서열식별번호: 157 (3), 서열식별번호: 158 (4), 서열식별번호: 159 (5), 서열식별번호: 160 (6), 서열식별번호: 161 (7), 서열식별번호: 162 (8), 서열식별번호: 163 (9), 서열식별번호: 164 (10), 서열식별번호: 165 (11), 서열식별번호: 166 (12) (도 22b 참조).
BXA-027741 설계의 상기 언급된 접합부 및 그의 접합부 변이체의 면역원성 잠재력을 상기 기재된 바와 같은 시험관내 T 세포 증식 검정을 사용하여 시험하였다. 데이터는 접합부 J11v3 (도 22b에서의 서열식별번호: 157, 3번)이 다른 시험된 접합부와 비교하여 유의하게 더 적은 CD8+ (도 23a) 및 CD4+ T (도 23b) 세포 증식을 유발하였고, 따라서 더 우수하다는 것을 나타낸다 (도 23). 소형화 디스트로핀 폴리펩티드 BXA-196477은 접합부 J11v3을 보유하도록 변형되었고, C-말단의 마지막 3개의 아미노산이 결실되었으며, 3'UTR이 단축되어, 소형화 디스트로핀 폴리펩티드 BXA-213780 (서열식별번호: 153) 및 뉴클레오티드 서열 서열식별번호: 154를 생성하였다.
SEQUENCE LISTING
<110> BRISTOL-MYERS SQUIBB COMPANY
Banks, Glen
<120> Miniaturized Dystrophins and Uses Thereof
<130> 13187-WO-PCT
<150> 62/749982
<151> 2018-10-24
<160> 166
<170> PatentIn version 3.5
<210> 1
<211> 3685
<212> PRT
<213> Homo sapiens
<400> 1
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr
660 665 670
Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val
675 680 685
Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro
690 695 700
Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile
705 710 715 720
Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr
725 730 735
Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys
740 745 750
Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg
755 760 765
Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala
770 775 780
Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser
785 790 795 800
Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys
805 810 815
Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile
820 825 830
Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr
835 840 845
Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr
850 855 860
Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu
865 870 875 880
Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala
885 890 895
Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val
900 905 910
Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg
915 920 925
Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr
930 935 940
Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr
945 950 955 960
Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu
965 970 975
Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln
980 985 990
Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys
995 1000 1005
Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu
1010 1015 1020
Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu
1025 1030 1035
His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile
1040 1045 1050
Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp
1055 1060 1065
Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile
1070 1075 1080
Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile
1085 1090 1095
Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln
1100 1105 1110
Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu
1115 1120 1125
Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln
1130 1135 1140
Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys
1145 1150 1155
Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met
1160 1165 1170
Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys
1175 1180 1185
Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
1190 1195 1200
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr
1205 1210 1215
Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln
1220 1225 1230
Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln
1235 1240 1245
Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu
1250 1255 1260
Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala
1265 1270 1275
Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu
1280 1285 1290
Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser
1295 1300 1305
Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile
1310 1315 1320
Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu
1325 1330 1335
Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu
1340 1345 1350
Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser
1355 1360 1365
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln
1370 1375 1380
Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala
1385 1390 1395
Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile
1400 1405 1410
Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys
1415 1420 1425
Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln
1430 1435 1440
Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe
1445 1450 1455
Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu
1460 1465 1470
Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu
1475 1480 1485
Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn
1490 1495 1500
His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu
1505 1510 1515
Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys
1520 1525 1530
Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu
1535 1540 1545
Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys
1550 1555 1560
Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys
1565 1570 1575
Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu
1580 1585 1590
Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp
1595 1600 1605
Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys
1610 1615 1620
Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu
1625 1630 1635
Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu
1640 1645 1650
Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu
1655 1660 1665
Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr
1670 1675 1680
Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala
1685 1690 1695
Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys
1700 1705 1710
Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg
1715 1720 1725
Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala
1730 1735 1740
Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser
1745 1750 1755
Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
1760 1765 1770
Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser
1775 1780 1785
Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln
1790 1795 1800
Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu
1805 1810 1815
Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn
1820 1825 1830
Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys
1835 1840 1845
Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp
1850 1855 1860
Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln
1865 1870 1875
Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu
1880 1885 1890
Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp
1895 1900 1905
Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
1910 1915 1920
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu
1925 1930 1935
Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser
1940 1945 1950
Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg
1955 1960 1965
Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met
1970 1975 1980
Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser
1985 1990 1995
Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu
2000 2005 2010
Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
2015 2020 2025
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
2030 2035 2040
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys
2045 2050 2055
Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
2060 2065 2070
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val
2075 2080 2085
Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
2090 2095 2100
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
2105 2110 2115
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro
2120 2125 2130
Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
2135 2140 2145
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
2150 2155 2160
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala
2165 2170 2175
Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
2180 2185 2190
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu
2195 2200 2205
Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe
2210 2215 2220
Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu
2225 2230 2235
Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val
2240 2245 2250
Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys
2255 2260 2265
Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile
2270 2275 2280
Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr
2285 2290 2295
Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln
2300 2305 2310
Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys
2315 2320 2325
Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp
2330 2335 2340
Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
2345 2350 2355
Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln
2360 2365 2370
Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His
2375 2380 2385
Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu
2390 2395 2400
Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln
2405 2410 2415
Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr
2420 2425 2430
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro
2435 2440 2445
Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser
2450 2455 2460
Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala
2465 2470 2475
Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile
2480 2485 2490
Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu
2495 2500 2505
Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg
2510 2515 2520
Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys
2525 2530 2535
Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg
2540 2545 2550
Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu
2555 2560 2565
Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr
2570 2575 2580
Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln
2585 2590 2595
Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val
2600 2605 2610
Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys
2615 2620 2625
Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu
2630 2635 2640
Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
2645 2650 2655
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile
2660 2665 2670
His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His
2675 2680 2685
Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
2690 2695 2700
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala
2705 2710 2715
Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu
2720 2725 2730
Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His
2735 2740 2745
Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu
2750 2755 2760
Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg
2765 2770 2775
Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser
2780 2785 2790
Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys
2795 2800 2805
Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu
2810 2815 2820
Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe
2825 2830 2835
Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg
2840 2845 2850
Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr
2855 2860 2865
Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
2870 2875 2880
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln
2885 2890 2895
Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr
2900 2905 2910
Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
2915 2920 2925
Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr
2930 2935 2940
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly
2945 2950 2955
Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp
2960 2965 2970
His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
2975 2980 2985
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr
2990 2995 3000
Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
3005 3010 3015
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp
3020 3025 3030
Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala
3035 3040 3045
Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
3050 3055 3060
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
3065 3070 3075
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
3080 3085 3090
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
3095 3100 3105
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
3110 3115 3120
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
3125 3130 3135
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
3140 3145 3150
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
3155 3160 3165
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
3170 3175 3180
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
3185 3190 3195
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
3200 3205 3210
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
3215 3220 3225
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
3230 3235 3240
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
3245 3250 3255
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
3260 3265 3270
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
3275 3280 3285
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
3290 3295 3300
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
3305 3310 3315
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
3320 3325 3330
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
3335 3340 3345
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
3350 3355 3360
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
3365 3370 3375
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
3380 3385 3390
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
3395 3400 3405
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala
3410 3415 3420
Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu
3425 3430 3435
His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser
3440 3445 3450
Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu
3455 3460 3465
His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser
3470 3475 3480
Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu
3485 3490 3495
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu
3500 3505 3510
Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys
3515 3520 3525
Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro
3530 3535 3540
Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu
3545 3550 3555
Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu
3560 3565 3570
Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser
3575 3580 3585
Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu
3590 3595 3600
Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu
3605 3610 3615
Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly
3620 3625 3630
Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
3635 3640 3645
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu
3650 3655 3660
Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys
3665 3670 3675
Pro Met Arg Glu Asp Thr Met
3680 3685
<210> 2
<211> 13957
<212> DNA
<213> Homo sapiens
<400> 2
gggattccct cactttcccc ctacaggact cagatctggg aggcaattac cttcggagaa 60
aaacgaatag gaaaaactga agtgttactt tttttaaagc tgctgaagtt tgttggtttc 120
tcattgtttt taagcctact ggagcaataa agtttgaaga acttttacca ggtttttttt 180
atcgctgcct tgatatacac ttttcaaaat gctttggtgg gaagaagtag aggactgtta 240
tgaaagagaa gatgttcaaa agaaaacatt cacaaaatgg gtaaatgcac aattttctaa 300
gtttgggaag cagcatattg agaacctctt cagtgaccta caggatggga ggcgcctcct 360
agacctcctc gaaggcctga cagggcaaaa actgccaaaa gaaaaaggat ccacaagagt 420
tcatgccctg aacaatgtca acaaggcact gcgggttttg cagaacaata atgttgattt 480
agtgaatatt ggaagtactg acatcgtaga tggaaatcat aaactgactc ttggtttgat 540
ttggaatata atcctccact ggcaggtcaa aaatgtaatg aaaaatatca tggctggatt 600
gcaacaaacc aacagtgaaa agattctcct gagctgggtc cgacaatcaa ctcgtaatta 660
tccacaggtt aatgtaatca acttcaccac cagctggtct gatggcctgg ctttgaatgc 720
tctcatccat agtcataggc cagacctatt tgactggaat agtgtggttt gccagcagtc 780
agccacacaa cgactggaac atgcattcaa catcgccaga tatcaattag gcatagagaa 840
actactcgat cctgaagatg ttgataccac ctatccagat aagaagtcca tcttaatgta 900
catcacatca ctcttccaag ttttgcctca acaagtgagc attgaagcca tccaggaagt 960
ggaaatgttg ccaaggccac ctaaagtgac taaagaagaa cattttcagt tacatcatca 1020
aatgcactat tctcaacaga tcacggtcag tctagcacag ggatatgaga gaacttcttc 1080
ccctaagcct cgattcaaga gctatgccta cacacaggct gcttatgtca ccacctctga 1140
ccctacacgg agcccatttc cttcacagca tttggaagct cctgaagaca agtcatttgg 1200
cagttcattg atggagagtg aagtaaacct ggaccgttat caaacagctt tagaagaagt 1260
attatcgtgg cttctttctg ctgaggacac attgcaagca caaggagaga tttctaatga 1320
tgtggaagtg gtgaaagacc agtttcatac tcatgagggg tacatgatgg atttgacagc 1380
ccatcagggc cgggttggta atattctaca attgggaagt aagctgattg gaacaggaaa 1440
attatcagaa gatgaagaaa ctgaagtaca agagcagatg aatctcctaa attcaagatg 1500
ggaatgcctc agggtagcta gcatggaaaa acaaagcaat ttacatagag ttttaatgga 1560
tctccagaat cagaaactga aagagttgaa tgactggcta acaaaaacag aagaaagaac 1620
aaggaaaatg gaggaagagc ctcttggacc tgatcttgaa gacctaaaac gccaagtaca 1680
acaacataag gtgcttcaag aagatctaga acaagaacaa gtcagggtca attctctcac 1740
tcacatggtg gtggtagttg atgaatctag tggagatcac gcaactgctg ctttggaaga 1800
acaacttaag gtattgggag atcgatgggc aaacatctgt agatggacag aagaccgctg 1860
ggttctttta caagacatcc ttctcaaatg gcaacgtctt actgaagaac agtgcctttt 1920
tagtgcatgg ctttcagaaa aagaagatgc agtgaacaag attcacacaa ctggctttaa 1980
agatcaaaat gaaatgttat caagtcttca aaaactggcc gttttaaaag cggatctaga 2040
aaagaaaaag caatccatgg gcaaactgta ttcactcaaa caagatcttc tttcaacact 2100
gaagaataag tcagtgaccc agaagacgga agcatggctg gataactttg cccggtgttg 2160
ggataattta gtccaaaaac ttgaaaagag tacagcacag atttcacagg ctgtcaccac 2220
cactcagcca tcactaacac agacaactgt aatggaaaca gtaactacgg tgaccacaag 2280
ggaacagatc ctggtaaagc atgctcaaga ggaacttcca ccaccacctc cccaaaagaa 2340
gaggcagatt actgtggatt ctgaaattag gaaaaggttg gatgttgata taactgaact 2400
tcacagctgg attactcgct cagaagctgt gttgcagagt cctgaatttg caatctttcg 2460
gaaggaaggc aacttctcag acttaaaaga aaaagtcaat gccatagagc gagaaaaagc 2520
tgagaagttc agaaaactgc aagatgccag cagatcagct caggccctgg tggaacagat 2580
ggtgaatgag ggtgttaatg cagatagcat caaacaagcc tcagaacaac tgaacagccg 2640
gtggatcgaa ttctgccagt tgctaagtga gagacttaac tggctggagt atcagaacaa 2700
catcatcgct ttctataatc agctacaaca attggagcag atgacaacta ctgctgaaaa 2760
ctggttgaaa atccaaccca ccaccccatc agagccaaca gcaattaaaa gtcagttaaa 2820
aatttgtaag gatgaagtca accggctatc aggtcttcaa cctcaaattg aacgattaaa 2880
aattcaaagc atagccctga aagagaaagg acaaggaccc atgttcctgg atgcagactt 2940
tgtggccttt acaaatcatt ttaagcaagt cttttctgat gtgcaggcca gagagaaaga 3000
gctacagaca atttttgaca ctttgccacc aatgcgctat caggagacca tgagtgccat 3060
caggacatgg gtccagcagt cagaaaccaa actctccata cctcaactta gtgtcaccga 3120
ctatgaaatc atggagcaga gactcgggga attgcaggct ttacaaagtt ctctgcaaga 3180
gcaacaaagt ggcctatact atctcagcac cactgtgaaa gagatgtcga agaaagcgcc 3240
ctctgaaatt agccggaaat atcaatcaga atttgaagaa attgagggac gctggaagaa 3300
gctctcctcc cagctggttg agcattgtca aaagctagag gagcaaatga ataaactccg 3360
aaaaattcag aatcacatac aaaccctgaa gaaatggatg gctgaagttg atgtttttct 3420
gaaggaggaa tggcctgccc ttggggattc agaaattcta aaaaagcagc tgaaacagtg 3480
cagactttta gtcagtgata ttcagacaat tcagcccagt ctaaacagtg tcaatgaagg 3540
tgggcagaag ataaagaatg aagcagagcc agagtttgct tcgagacttg agacagaact 3600
caaagaactt aacactcagt gggatcacat gtgccaacag gtctatgcca gaaaggaggc 3660
cttgaaggga ggtttggaga aaactgtaag cctccagaaa gatctatcag agatgcacga 3720
atggatgaca caagctgaag aagagtatct tgagagagat tttgaatata aaactccaga 3780
tgaattacag aaagcagttg aagagatgaa gagagctaaa gaagaggccc aacaaaaaga 3840
agcgaaagtg aaactcctta ctgagtctgt aaatagtgtc atagctcaag ctccacctgt 3900
agcacaagag gccttaaaaa aggaacttga aactctaacc accaactacc agtggctctg 3960
cactaggctg aatgggaaat gcaagacttt ggaagaagtt tgggcatgtt ggcatgagtt 4020
attgtcatac ttggagaaag caaacaagtg gctaaatgaa gtagaattta aacttaaaac 4080
cactgaaaac attcctggcg gagctgagga aatctctgag gtgctagatt cacttgaaaa 4140
tttgatgcga cattcagagg ataacccaaa tcagattcgc atattggcac agaccctaac 4200
agatggcgga gtcatggatg agctaatcaa tgaggaactt gagacattta attctcgttg 4260
gagggaacta catgaagagg ctgtaaggag gcaaaagttg cttgaacaga gcatccagtc 4320
tgcccaggag actgaaaaat ccttacactt aatccaggag tccctcacat tcattgacaa 4380
gcagttggca gcttatattg cagacaaggt ggacgcagct caaatgcctc aggaagccca 4440
gaaaatccaa tctgatttga caagtcatga gatcagttta gaagaaatga agaaacataa 4500
tcaggggaag gaggctgccc aaagagtcct gtctcagatt gatgttgcac agaaaaaatt 4560
acaagatgtc tccatgaagt ttcgattatt ccagaaacca gccaattttg agctgcgtct 4620
acaagaaagt aagatgattt tagatgaagt gaagatgcac ttgcctgcat tggaaacaaa 4680
gagtgtggaa caggaagtag tacagtcaca gctaaatcat tgtgtgaact tgtataaaag 4740
tctgagtgaa gtgaagtctg aagtggaaat ggtgataaag actggacgtc agattgtaca 4800
gaaaaagcag acggaaaatc ccaaagaact tgatgaaaga gtaacagctt tgaaattgca 4860
ttataatgag ctgggagcaa aggtaacaga aagaaagcaa cagttggaga aatgcttgaa 4920
attgtcccgt aagatgcgaa aggaaatgaa tgtcttgaca gaatggctgg cagctacaga 4980
tatggaattg acaaagagat cagcagttga aggaatgcct agtaatttgg attctgaagt 5040
tgcctgggga aaggctactc aaaaagagat tgagaaacag aaggtgcacc tgaagagtat 5100
cacagaggta ggagaggcct tgaaaacagt tttgggcaag aaggagacgt tggtggaaga 5160
taaactcagt cttctgaata gtaactggat agctgtcacc tcccgagcag aagagtggtt 5220
aaatcttttg ttggaatacc agaaacacat ggaaactttt gaccagaatg tggaccacat 5280
cacaaagtgg atcattcagg ctgacacact tttggatgaa tcagagaaaa agaaacccca 5340
gcaaaaagaa gacgtgctta agcgtttaaa ggcagaactg aatgacatac gcccaaaggt 5400
ggactctaca cgtgaccaag cagcaaactt gatggcaaac cgcggtgacc actgcaggaa 5460
attagtagag ccccaaatct cagagctcaa ccatcgattt gcagccattt cacacagaat 5520
taagactgga aaggcctcca ttcctttgaa ggaattggag cagtttaact cagatataca 5580
aaaattgctt gaaccactgg aggctgaaat tcagcagggg gtgaatctga aagaggaaga 5640
cttcaataaa gatatgaatg aagacaatga gggtactgta aaagaattgt tgcaaagagg 5700
agacaactta caacaaagaa tcacagatga gagaaagaga gaggaaataa agataaaaca 5760
gcagctgtta cagacaaaac ataatgctct caaggatttg aggtctcaaa gaagaaaaaa 5820
ggctctagaa atttctcatc agtggtatca gtacaagagg caggctgatg atctcctgaa 5880
atgcttggat gacattgaaa aaaaattagc cagcctacct gagcccagag atgaaaggaa 5940
aataaaggaa attgatcggg aattgcagaa gaagaaagag gagctgaatg cagtgcgtag 6000
gcaagctgag ggcttgtctg aggatggggc cgcaatggca gtggagccaa ctcagatcca 6060
gctcagcaag cgctggcggg aaattgagag caaatttgct cagtttcgaa gactcaactt 6120
tgcacaaatt cacactgtcc gtgaagaaac gatgatggtg atgactgaag acatgccttt 6180
ggaaatttct tatgtgcctt ctacttattt gactgaaatc actcatgtct cacaagccct 6240
attagaagtg gaacaacttc tcaatgctcc tgacctctgt gctaaggact ttgaagatct 6300
ctttaagcaa gaggagtctc tgaagaatat aaaagatagt ctacaacaaa gctcaggtcg 6360
gattgacatt attcatagca agaagacagc agcattgcaa agtgcaacgc ctgtggaaag 6420
ggtgaagcta caggaagctc tctcccagct tgatttccaa tgggaaaaag ttaacaaaat 6480
gtacaaggac cgacaagggc gatttgacag atctgttgag aaatggcggc gttttcatta 6540
tgatataaag atatttaatc agtggctaac agaagctgaa cagtttctca gaaagacaca 6600
aattcctgag aattgggaac atgctaaata caaatggtat cttaaggaac tccaggatgg 6660
cattgggcag cggcaaactg ttgtcagaac attgaatgca actggggaag aaataattca 6720
gcaatcctca aaaacagatg ccagtattct acaggaaaaa ttgggaagcc tgaatctgcg 6780
gtggcaggag gtctgcaaac agctgtcaga cagaaaaaag aggctagaag aacaaaagaa 6840
tatcttgtca gaatttcaaa gagatttaaa tgaatttgtt ttatggttgg aggaagcaga 6900
taacattgct agtatcccac ttgaacctgg aaaagagcag caactaaaag aaaagcttga 6960
gcaagtcaag ttactggtgg aagagttgcc cctgcgccag ggaattctca aacaattaaa 7020
tgaaactgga ggacccgtgc ttgtaagtgc tcccataagc ccagaagagc aagataaact 7080
tgaaaataag ctcaagcaga caaatctcca gtggataaag gtttccagag ctttacctga 7140
gaaacaagga gaaattgaag ctcaaataaa agaccttggg cagcttgaaa aaaagcttga 7200
agaccttgaa gagcagttaa atcatctgct gctgtggtta tctcctatta ggaatcagtt 7260
ggaaatttat aaccaaccaa accaagaagg accatttgac gttcaggaaa ctgaaatagc 7320
agttcaagct aaacaaccgg atgtggaaga gattttgtct aaagggcagc atttgtacaa 7380
ggaaaaacca gccactcagc cagtgaagag gaagttagaa gatctgagct ctgagtggaa 7440
ggcggtaaac cgtttacttc aagagctgag ggcaaagcag cctgacctag ctcctggact 7500
gaccactatt ggagcctctc ctactcagac tgttactctg gtgacacaac ctgtggttac 7560
taaggaaact gccatctcca aactagaaat gccatcttcc ttgatgttgg aggtacctgc 7620
tctggcagat ttcaaccggg cttggacaga acttaccgac tggctttctc tgcttgatca 7680
agttataaaa tcacagaggg tgatggtggg tgaccttgag gatatcaacg agatgatcat 7740
caagcagaag gcaacaatgc aggatttgga acagaggcgt ccccagttgg aagaactcat 7800
taccgctgcc caaaatttga aaaacaagac cagcaatcaa gaggctagaa caatcattac 7860
ggatcgaatt gaaagaattc agaatcagtg ggatgaagta caagaacacc ttcagaaccg 7920
gaggcaacag ttgaatgaaa tgttaaagga ttcaacacaa tggctggaag ctaaggaaga 7980
agctgagcag gtcttaggac aggccagagc caagcttgag tcatggaagg agggtcccta 8040
tacagtagat gcaatccaaa agaaaatcac agaaaccaag cagttggcca aagacctccg 8100
ccagtggcag acaaatgtag atgtggcaaa tgacttggcc ctgaaacttc tccgggatta 8160
ttctgcagat gataccagaa aagtccacat gataacagag aatatcaatg cctcttggag 8220
aagcattcat aaaagggtga gtgagcgaga ggctgctttg gaagaaactc atagattact 8280
gcaacagttc cccctggacc tggaaaagtt tcttgcctgg cttacagaag ctgaaacaac 8340
tgccaatgtc ctacaggatg ctacccgtaa ggaaaggctc ctagaagact ccaagggagt 8400
aaaagagctg atgaaacaat ggcaagacct ccaaggtgaa attgaagctc acacagatgt 8460
ttatcacaac ctggatgaaa acagccaaaa aatcctgaga tccctggaag gttccgatga 8520
tgcagtcctg ttacaaagac gtttggataa catgaacttc aagtggagtg aacttcggaa 8580
aaagtctctc aacattaggt cccatttgga agccagttct gaccagtgga agcgtctgca 8640
cctttctctg caggaacttc tggtgtggct acagctgaaa gatgatgaat taagccggca 8700
ggcacctatt ggaggcgact ttccagcagt tcagaagcag aacgatgtac atagggcctt 8760
caagagggaa ttgaaaacta aagaacctgt aatcatgagt actcttgaga ctgtacgaat 8820
atttctgaca gagcagcctt tggaaggact agagaaactc taccaggagc ccagagagct 8880
gcctcctgag gagagagccc agaatgtcac tcggcttcta cgaaagcagg ctgaggaggt 8940
caatactgag tgggaaaaat tgaacctgca ctccgctgac tggcagagaa aaatagatga 9000
gacccttgaa agactccagg aacttcaaga ggccacggat gagctggacc tcaagctgcg 9060
ccaagctgag gtgatcaagg gatcctggca gcccgtgggc gatctcctca ttgactctct 9120
ccaagatcac ctcgagaaag tcaaggcact tcgaggagaa attgcgcctc tgaaagagaa 9180
cgtgagccac gtcaatgacc ttgctcgcca gcttaccact ttgggcattc agctctcacc 9240
gtataacctc agcactctgg aagacctgaa caccagatgg aagcttctgc aggtggccgt 9300
cgaggaccga gtcaggcagc tgcatgaagc ccacagggac tttggtccag catctcagca 9360
ctttctttcc acgtctgtcc agggtccctg ggagagagcc atctcgccaa acaaagtgcc 9420
ctactatatc aaccacgaga ctcaaacaac ttgctgggac catcccaaaa tgacagagct 9480
ctaccagtct ttagctgacc tgaataatgt cagattctca gcttatagga ctgccatgaa 9540
actccgaaga ctgcagaagg ccctttgctt ggatctcttg agcctgtcag ctgcatgtga 9600
tgccttggac cagcacaacc tcaagcaaaa tgaccagccc atggatatcc tgcagattat 9660
taattgtttg accactattt atgaccgcct ggagcaagag cacaacaatt tggtcaacgt 9720
ccctctctgc gtggatatgt gtctgaactg gctgctgaat gtttatgata cgggacgaac 9780
agggaggatc cgtgtcctgt cttttaaaac tggcatcatt tccctgtgta aagcacattt 9840
ggaagacaag tacagatacc ttttcaagca agtggcaagt tcaacaggat tttgtgacca 9900
gcgcaggctg ggcctccttc tgcatgattc tatccaaatt ccaagacagt tgggtgaagt 9960
tgcatccttt gggggcagta acattgagcc aagtgtccgg agctgcttcc aatttgctaa 10020
taataagcca gagatcgaag cggccctctt cctagactgg atgagactgg aaccccagtc 10080
catggtgtgg ctgcccgtcc tgcacagagt ggctgctgca gaaactgcca agcatcaggc 10140
caaatgtaac atctgcaaag agtgtccaat cattggattc aggtacagga gtctaaagca 10200
ctttaattat gacatctgcc aaagctgctt tttttctggt cgagttgcaa aaggccataa 10260
aatgcactat cccatggtgg aatattgcac tccgactaca tcaggagaag atgttcgaga 10320
ctttgccaag gtactaaaaa acaaatttcg aaccaaaagg tattttgcga agcatccccg 10380
aatgggctac ctgccagtgc agactgtctt agagggggac aacatggaaa ctcccgttac 10440
tctgatcaac ttctggccag tagattctgc gcctgcctcg tcccctcagc tttcacacga 10500
tgatactcat tcacgcattg aacattatgc tagcaggcta gcagaaatgg aaaacagcaa 10560
tggatcttat ctaaatgata gcatctctcc taatgagagc atagatgatg aacatttgtt 10620
aatccagcat tactgccaaa gtttgaacca ggactccccc ctgagccagc ctcgtagtcc 10680
tgcccagatc ttgatttcct tagagagtga ggaaagaggg gagctagaga gaatcctagc 10740
agatcttgag gaagaaaaca ggaatctgca agcagaatat gaccgtctaa agcagcagca 10800
cgaacataaa ggcctgtccc cactgccgtc ccctcctgaa atgatgccca cctctcccca 10860
gagtccccgg gatgctgagc tcattgctga ggccaagcta ctgcgtcaac acaaaggccg 10920
cctggaagcc aggatgcaaa tcctggaaga ccacaataaa cagctggagt cacagttaca 10980
caggctaagg cagctgctgg agcaacccca ggcagaggcc aaagtgaatg gcacaacggt 11040
gtcctctcct tctacctctc tacagaggtc cgacagcagt cagcctatgc tgctccgagt 11100
ggttggcagt caaacttcgg actccatggg tgaggaagat cttctcagtc ctccccagga 11160
cacaagcaca gggttagagg aggtgatgga gcaactcaac aactccttcc ctagttcaag 11220
aggaagaaat acccctggaa agccaatgag agaggacaca atgtaggaag tcttttccac 11280
atggcagatg atttgggcag agcgatggag tccttagtat cagtcatgac agatgaagaa 11340
ggagcagaat aaatgtttta caactcctga ttcccgcatg gtttttataa tattcataca 11400
acaaagagga ttagacagta agagtttaca agaaataaat ctatattttt gtgaagggta 11460
gtggtattat actgtagatt tcagtagttt ctaagtctgt tattgttttg ttaacaatgg 11520
caggttttac acgtctatgc aattgtacaa aaaagttata agaaaactac atgtaaaatc 11580
ttgatagcta aataacttgc catttcttta tatggaacgc attttgggtt gtttaaaaat 11640
ttataacagt tataaagaaa gattgtaaac taaagtgtgc tttataaaaa aaagttgttt 11700
ataaaaaccc ctaaaaacaa aacaaacaca cacacacaca catacacaca cacacacaaa 11760
actttgaggc agcgcattgt tttgcatcct tttggcgtga tatccatatg aaattcatgg 11820
ctttttcttt ttttgcatat taaagataag acttcctcta ccaccacacc aaatgactac 11880
tacacactgc tcatttgaga actgtcagct gagtggggca ggcttgagtt ttcatttcat 11940
atatctatat gtctataagt atataaatac tatagttata tagataaaga gatacgaatt 12000
tctatagact gactttttcc attttttaaa tgttcatgtc acatcctaat agaaagaaat 12060
tacttctagt cagtcatcca ggcttacctg cttggtctag aatggatttt tcccggagcc 12120
ggaagccagg aggaaactac accacactaa aacattgtct acagctccag atgtttctca 12180
ttttaaacaa ctttccactg acaacgaaag taaagtaaag tattggattt ttttaaaggg 12240
aacatgtgaa tgaatacaca ggacttatta tatcagagtg agtaatcggt tggttggttg 12300
attgattgat tgattgatac attcagcttc ctgctgctag caatgccacg atttagattt 12360
aatgatgctt cagtggaaat caatcagaag gtattctgac cttgtgaaca tcagaaggta 12420
ttttttaact cccaagcagt agcaggacga tgatagggct ggagggctat ggattcccag 12480
cccatccctg tgaaggagta ggccactctt taagtgaagg attggatgat tgttcataat 12540
acataaagtt ctctgtaatt acaactaaat tattatgccc tcttctcaca gtcaaaagga 12600
actgggtggt ttggtttttg ttgctttttt agatttattg tcccatgtgg gatgagtttt 12660
taaatgccac aagacataat ttaaaataaa taaactttgg gaaaaggtgt aagacagtag 12720
ccccatcaca tttgtgatac tgacaggtat caacccagaa gcccatgaac tgtgtttcca 12780
tcctttgcat ttctctgcga gtagttccac acaggtttgt aagtaagtaa gaaagaaggc 12840
aaattgattc aaatgttaca aaaaaaccct tcttggtgga ttagacaggt taaatatata 12900
aacaaacaaa caaaaattgc tcaaaaaaga ggagaaaagc tcaagaggaa aagctaagga 12960
ctggtaggaa aaagctttac tctttcatgc cattttattt ctttttgatt tttaaatcat 13020
tcattcaata gataccaccg tgtgacctat aattttgcaa atctgttacc tctgacatca 13080
agtgtaatta gcttttggag agtgggctga catcaagtgt aattagcttt tggagagtgg 13140
gttttgtcca ttattaataa ttaattaatt aacatcaaac acggcttctc atgctatttc 13200
tacctcactt tggttttggg gtgttcctga taattgtgca cacctgagtt cacagcttca 13260
ccacttgtcc attgcgttat tttctttttc ctttataatt ctttcttttt ccttcataat 13320
tttcaaaaga aaacccaaag ctctaaggta acaaattacc aaattacatg aagatttggt 13380
ttttgtcttg catttttttc ctttatgtga cgctggacct tttctttacc caaggatttt 13440
taaaactcag atttaaaaca aggggttact ttacatccta ctaagaagtt taagtaagta 13500
agtttcattc taaaatcaga ggtaaataga gtgcataaat aattttgttt taatcttttt 13560
gtttttcttt tagacacatt agctctggag tgagtctgtc ataatatttg aacaaaaatt 13620
gagagcttta ttgctgcatt ttaagcataa ttaatttgga cattatttcg tgttgtgttc 13680
tttataacca ccgagtatta aactgtaaat cataatgtaa ctgaagcata aacatcacat 13740
ggcatgtttt gtcattgttt tcaggtactg agttcttact tgagtatcat aatatattgt 13800
gttttaacac caacactgta acatttacga attatttttt taaacttcag ttttactgca 13860
ttttcacaac atatcagact tcaccaaata tatgccttac tattgtatta tagtactgct 13920
ttactgtgta tctcaataaa gcacgcagtt atgttac 13957
<210> 3
<211> 252
<212> PRT
<213> Homo sapiens
<400> 3
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu
245 250
<210> 4
<211> 85
<212> PRT
<213> Homo sapiens
<400> 4
Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu
1 5 10 15
His His Gln Met His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln
20 25 30
Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala
35 40 45
Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro
50 55 60
Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser
65 70 75 80
Ser Leu Met Glu Ser
85
<210> 5
<211> 109
<212> PRT
<213> Homo sapiens
<400> 5
Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu Ser
1 5 10 15
Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile Ser
20 25 30
Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly Tyr
35 40 45
Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu Gln
50 55 60
Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu Glu
65 70 75 80
Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu Cys
85 90 95
Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His
100 105
<210> 6
<211> 111
<212> PRT
<213> Homo sapiens
<400> 6
Arg Val Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp
1 5 10 15
Trp Leu Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro
20 25 30
Leu Gly Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys
35 40 45
Val Leu Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu
50 55 60
Thr His Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr
65 70 75 80
Ala Ala Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn
85 90 95
Ile Cys Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile
100 105 110
<210> 7
<211> 111
<212> PRT
<213> Homo sapiens
<400> 7
Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala
1 5 10 15
Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly
20 25 30
Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val
35 40 45
Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr
50 55 60
Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr
65 70 75 80
Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn
85 90 95
Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala
100 105 110
<210> 8
<211> 49
<212> PRT
<213> Homo sapiens
<400> 8
Val Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr
1 5 10 15
Val Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln
20 25 30
Glu Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val
35 40 45
Asp
<210> 9
<211> 111
<212> PRT
<213> Homo sapiens
<400> 9
Ser Glu Ile Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser
1 5 10 15
Trp Ile Thr Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile
20 25 30
Phe Arg Lys Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala
35 40 45
Ile Glu Arg Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser
50 55 60
Arg Ser Ala Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn
65 70 75 80
Ala Asp Ser Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile
85 90 95
Glu Phe Cys Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr
100 105 110
<210> 10
<211> 109
<212> PRT
<213> Homo sapiens
<400> 10
Gln Asn Asn Ile Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln
1 5 10 15
Met Thr Thr Thr Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro
20 25 30
Ser Glu Pro Thr Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu
35 40 45
Val Asn Arg Leu Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile
50 55 60
Gln Ser Ile Ala Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp
65 70 75 80
Ala Asp Phe Val Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp
85 90 95
Val Gln Ala Arg Glu Lys Glu Leu Gln Thr Ile Phe Asp
100 105
<210> 11
<211> 109
<212> PRT
<213> Homo sapiens
<400> 11
Thr Leu Pro Pro Met Arg Tyr Gln Glu Thr Met Ser Ala Ile Arg Thr
1 5 10 15
Trp Val Gln Gln Ser Glu Thr Lys Leu Ser Ile Pro Gln Leu Ser Val
20 25 30
Thr Asp Tyr Glu Ile Met Glu Gln Arg Leu Gly Glu Leu Gln Ala Leu
35 40 45
Gln Ser Ser Leu Gln Glu Gln Gln Ser Gly Leu Tyr Tyr Leu Ser Thr
50 55 60
Thr Val Lys Glu Met Ser Lys Lys Ala Pro Ser Glu Ile Ser Arg Lys
65 70 75 80
Tyr Gln Ser Glu Phe Glu Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser
85 90 95
Ser Gln Leu Val Glu His Cys Gln Lys Leu Glu Glu Gln
100 105
<210> 12
<211> 109
<212> PRT
<213> Homo sapiens
<400> 12
Met Asn Lys Leu Arg Lys Ile Gln Asn His Ile Gln Thr Leu Lys Lys
1 5 10 15
Trp Met Ala Glu Val Asp Val Phe Leu Lys Glu Glu Trp Pro Ala Leu
20 25 30
Gly Asp Ser Glu Ile Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu
35 40 45
Val Ser Asp Ile Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu
50 55 60
Gly Gly Gln Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg
65 70 75 80
Leu Glu Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys
85 90 95
Gln Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly
100 105
<210> 13
<211> 109
<212> PRT
<213> Homo sapiens
<400> 13
Leu Glu Lys Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu
1 5 10 15
Trp Met Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr
20 25 30
Lys Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala
35 40 45
Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr Glu
50 55 60
Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln Glu Ala
65 70 75 80
Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln Trp Leu Cys
85 90 95
Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu Val
100 105
<210> 14
<211> 104
<212> PRT
<213> Homo sapiens
<400> 14
Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala Asn Lys
1 5 10 15
Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu Asn Ile Pro
20 25 30
Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser Leu Glu Asn Leu
35 40 45
Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile Arg Ile Leu Ala Gln
50 55 60
Thr Leu Thr Asp Gly Gly Val Met Asp Glu Leu Ile Asn Glu Glu Leu
65 70 75 80
Glu Thr Phe Asn Ser Arg Trp Arg Glu Leu His Glu Glu Ala Val Arg
85 90 95
Arg Gln Lys Leu Leu Glu Gln Ser
100
<210> 15
<211> 92
<212> PRT
<213> Homo sapiens
<400> 15
Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln Glu
1 5 10 15
Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala Asp Lys
20 25 30
Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile Gln Ser Asp
35 40 45
Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys Lys His Asn Gln
50 55 60
Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln Ile Asp Val Ala Gln
65 70 75 80
Lys Lys Leu Gln Asp Val Ser Met Lys Phe Arg Leu
85 90
<210> 16
<211> 109
<212> PRT
<213> Homo sapiens
<400> 16
Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu Ser Lys Met
1 5 10 15
Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu Glu Thr Lys Ser
20 25 30
Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn His Cys Val Asn Leu
35 40 45
Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu Val Glu Met Val Ile Lys
50 55 60
Thr Gly Arg Gln Ile Val Gln Lys Lys Gln Thr Glu Asn Pro Lys Glu
65 70 75 80
Leu Asp Glu Arg Val Thr Ala Leu Lys Leu His Tyr Asn Glu Leu Gly
85 90 95
Ala Lys Val Thr Glu Arg Lys Gln Gln Leu Glu Lys Cys
100 105
<210> 17
<211> 108
<212> PRT
<213> Homo sapiens
<400> 17
Leu Lys Leu Ser Arg Lys Met Arg Lys Glu Met Asn Val Leu Thr Glu
1 5 10 15
Trp Leu Ala Ala Thr Asp Met Glu Leu Thr Lys Arg Ser Ala Val Glu
20 25 30
Gly Met Pro Ser Asn Leu Asp Ser Glu Val Ala Trp Gly Lys Ala Thr
35 40 45
Gln Lys Glu Ile Glu Lys Gln Lys Val His Leu Lys Ser Ile Thr Glu
50 55 60
Val Gly Glu Ala Leu Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val
65 70 75 80
Glu Asp Lys Leu Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser
85 90 95
Arg Ala Glu Glu Trp Leu Asn Leu Leu Leu Glu Tyr
100 105
<210> 18
<211> 104
<212> PRT
<213> Homo sapiens
<400> 18
Gln Lys His Met Glu Thr Phe Asp Gln Asn Val Asp His Ile Thr Lys
1 5 10 15
Trp Ile Ile Gln Ala Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys
20 25 30
Pro Gln Gln Lys Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn
35 40 45
Asp Ile Arg Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu
50 55 60
Met Ala Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile
65 70 75 80
Ser Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr
85 90 95
Gly Lys Ala Ser Ile Pro Leu Lys
100
<210> 19
<211> 94
<212> PRT
<213> Homo sapiens
<400> 19
Glu Leu Glu Gln Phe Asn Ser Asp Ile Gln Lys Leu Leu Glu Pro Leu
1 5 10 15
Glu Ala Glu Ile Gln Gln Gly Val Asn Leu Lys Glu Glu Asp Phe Asn
20 25 30
Lys Asp Met Asn Glu Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln
35 40 45
Arg Gly Asp Asn Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu
50 55 60
Glu Ile Lys Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu
65 70 75 80
Lys Asp Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile
85 90
<210> 20
<211> 98
<212> PRT
<213> Homo sapiens
<400> 20
Ser His Gln Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys
1 5 10 15
Cys Leu Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg
20 25 30
Asp Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys
35 40 45
Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu Asp
50 55 60
Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser Lys Arg
65 70 75 80
Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg Leu Asn Phe
85 90 95
Ala Gln
<210> 21
<211> 20
<212> PRT
<213> Homo sapiens
<400> 21
Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met
1 5 10 15
Pro Leu Glu Ile
20
<210> 22
<211> 109
<212> PRT
<213> Homo sapiens
<400> 22
Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln
1 5 10 15
Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala
20 25 30
Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile
35 40 45
Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser
50 55 60
Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
65 70 75 80
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn
85 90 95
Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser
100 105
<210> 23
<211> 107
<212> PRT
<213> Homo sapiens
<400> 23
Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
1 5 10 15
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu
20 25 30
Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp
35 40 45
Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly
50 55 60
Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln
65 70 75 80
Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln
85 90 95
Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
100 105
<210> 24
<211> 117
<212> PRT
<213> Homo sapiens
<400> 24
Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe Val Leu
1 5 10 15
Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu Glu Pro Gly
20 25 30
Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val Lys Leu Leu Val
35 40 45
Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys Gln Leu Asn Glu Thr
50 55 60
Gly Gly Pro Val Leu Val Ser Ala Pro Ile Ser Pro Glu Glu Gln Asp
65 70 75 80
Lys Leu Glu Asn Lys Leu Lys Gln Thr Asn Leu Gln Trp Ile Lys Val
85 90 95
Ser Arg Ala Leu Pro Glu Lys Gln Gly Glu Ile Glu Ala Gln Ile Lys
100 105 110
Asp Leu Gly Gln Leu
115
<210> 25
<211> 101
<212> PRT
<213> Homo sapiens
<400> 25
Glu Lys Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu
1 5 10 15
Trp Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn
20 25 30
Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln Ala
35 40 45
Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His Leu Tyr
50 55 60
Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu Glu Asp Leu
65 70 75 80
Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln Glu Leu Arg Ala
85 90 95
Lys Gln Pro Asp Leu
100
<210> 26
<211> 41
<212> PRT
<213> Homo sapiens
<400> 26
Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr
1 5 10 15
Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu
20 25 30
Glu Met Pro Ser Ser Leu Met Leu Glu
35 40
<210> 27
<211> 110
<212> PRT
<213> Homo sapiens
<400> 27
Val Pro Ala Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu Leu Thr Asp
1 5 10 15
Trp Leu Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg Val Met Val
20 25 30
Gly Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln Lys Ala Thr
35 40 45
Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu Leu Ile Thr
50 55 60
Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr
65 70 75 80
Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val
85 90 95
Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn Glu Met
100 105 110
<210> 28
<211> 109
<212> PRT
<213> Homo sapiens
<400> 28
Leu Lys Asp Ser Thr Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln
1 5 10 15
Val Leu Gly Gln Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro
20 25 30
Tyr Thr Val Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu
35 40 45
Ala Lys Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp
50 55 60
Leu Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys
65 70 75 80
Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile His
85 90 95
Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr
100 105
<210> 29
<211> 116
<212> PRT
<213> Homo sapiens
<400> 29
His Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala
1 5 10 15
Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala Thr
20 25 30
Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu Leu Met
35 40 45
Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His Thr Asp Val
50 55 60
Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu Arg Ser Leu Glu
65 70 75 80
Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg Leu Asp Asn Met Asn
85 90 95
Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser Leu Asn Ile Arg Ser His
100 105 110
Leu Glu Ala Ser
115
<210> 30
<211> 129
<212> PRT
<213> Homo sapiens
<400> 30
Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val
1 5 10 15
Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly
20 25 30
Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe
35 40 45
Lys Arg Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu
50 55 60
Thr Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
65 70 75 80
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn
85 90 95
Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp
100 105 110
Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu
115 120 125
Thr
<210> 31
<211> 108
<212> PRT
<213> Homo sapiens
<400> 31
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu
1 5 10 15
Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
20 25 30
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
35 40 45
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
50 55 60
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
65 70 75 80
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln
85 90 95
Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu
100 105
<210> 32
<211> 72
<212> PRT
<213> Homo sapiens
<400> 32
Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
1 5 10 15
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr
20 25 30
Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met
35 40 45
Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser
50 55 60
Ala Tyr Arg Thr Ala Met Lys Leu
65 70
<210> 33
<211> 296
<212> PRT
<213> Homo sapiens
<400> 33
Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala
1 5 10 15
Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro
20 25 30
Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg
35 40 45
Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp
50 55 60
Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly
65 70 75 80
Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys
85 90 95
Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser
100 105 110
Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp
115 120 125
Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly
130 135 140
Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
145 150 155 160
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
165 170 175
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
180 185 190
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro
195 200 205
Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile
210 215 220
Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met
225 230 235 240
His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp
245 250 255
Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg
260 265 270
Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val
275 280 285
Leu Glu Gly Asp Asn Met Glu Thr
290 295
<210> 34
<211> 277
<212> PRT
<213> Homo sapiens
<400> 34
Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala Ser
1 5 10 15
Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu His Tyr
20 25 30
Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn
35 40 45
Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile
50 55 60
Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro
65 70 75 80
Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly
85 90 95
Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu
100 105 110
Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu
115 120 125
Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser
130 135 140
Pro Arg Asp Ala Glu Leu Ile Ala Glu Ala Lys Leu Leu Arg Gln His
145 150 155 160
Lys Gly Arg Leu Glu Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys
165 170 175
Gln Leu Glu Ser Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro
180 185 190
Gln Ala Glu Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr
195 200 205
Ser Leu Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val
210 215 220
Gly Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro
225 230 235 240
Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu Asn
245 250 255
Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys Pro Met
260 265 270
Arg Glu Asp Thr Met
275
<210> 35
<211> 208
<212> DNA
<213> Homo sapiens
<400> 35
gggattccct cactttcccc ctacaggact cagatctggg aggcaattac cttcggagaa 60
aaacgaatag gaaaaactga agtgttactt tttttaaagc tgctgaagtt tgttggtttc 120
tcattgtttt taagcctact ggagcaataa agtttgaaga acttttacca ggtttttttt 180
atcgctgcct tgatatacac ttttcaaa 208
<210> 36
<211> 756
<212> DNA
<213> Homo sapiens
<400> 36
atgctttggt gggaagaagt agaggactgt tatgaaagag aagatgttca aaagaaaaca 60
ttcacaaaat gggtaaatgc acaattttct aagtttggga agcagcatat tgagaacctc 120
ttcagtgacc tacaggatgg gaggcgcctc ctagacctcc tcgaaggcct gacagggcaa 180
aaactgccaa aagaaaaagg atccacaaga gttcatgccc tgaacaatgt caacaaggca 240
ctgcgggttt tgcagaacaa taatgttgat ttagtgaata ttggaagtac tgacatcgta 300
gatggaaatc ataaactgac tcttggtttg atttggaata taatcctcca ctggcaggtc 360
aaaaatgtaa tgaaaaatat catggctgga ttgcaacaaa ccaacagtga aaagattctc 420
ctgagctggg tccgacaatc aactcgtaat tatccacagg ttaatgtaat caacttcacc 480
accagctggt ctgatggcct ggctttgaat gctctcatcc atagtcatag gccagaccta 540
tttgactgga atagtgtggt ttgccagcag tcagccacac aacgactgga acatgcattc 600
aacatcgcca gatatcaatt aggcatagag aaactactcg atcctgaaga tgttgatacc 660
acctatccag ataagaagtc catcttaatg tacatcacat cactcttcca agttttgcct 720
caacaagtga gcattgaagc catccaggaa gtggaa 756
<210> 37
<211> 255
<212> DNA
<213> Homo sapiens
<400> 37
atgttgccaa ggccacctaa agtgactaaa gaagaacatt ttcagttaca tcatcaaatg 60
cactattctc aacagatcac ggtcagtcta gcacagggat atgagagaac ttcttcccct 120
aagcctcgat tcaagagcta tgcctacaca caggctgctt atgtcaccac ctctgaccct 180
acacggagcc catttccttc acagcatttg gaagctcctg aagacaagtc atttggcagt 240
tcattgatgg agagt 255
<210> 38
<211> 327
<212> DNA
<213> Homo sapiens
<400> 38
gaagtaaacc tggaccgtta tcaaacagct ttagaagaag tattatcgtg gcttctttct 60
gctgaggaca cattgcaagc acaaggagag atttctaatg atgtggaagt ggtgaaagac 120
cagtttcata ctcatgaggg gtacatgatg gatttgacag cccatcaggg ccgggttggt 180
aatattctac aattgggaag taagctgatt ggaacaggaa aattatcaga agatgaagaa 240
actgaagtac aagagcagat gaatctccta aattcaagat gggaatgcct cagggtagct 300
agcatggaaa aacaaagcaa tttacat 327
<210> 39
<211> 333
<212> DNA
<213> Homo sapiens
<400> 39
agagttttaa tggatctcca gaatcagaaa ctgaaagagt tgaatgactg gctaacaaaa 60
acagaagaaa gaacaaggaa aatggaggaa gagcctcttg gacctgatct tgaagaccta 120
aaacgccaag tacaacaaca taaggtgctt caagaagatc tagaacaaga acaagtcagg 180
gtcaattctc tcactcacat ggtggtggta gttgatgaat ctagtggaga tcacgcaact 240
gctgctttgg aagaacaact taaggtattg ggagatcgat gggcaaacat ctgtagatgg 300
acagaagacc gctgggttct tttacaagac atc 333
<210> 40
<211> 333
<212> DNA
<213> Homo sapiens
<400> 40
cttctcaaat ggcaacgtct tactgaagaa cagtgccttt ttagtgcatg gctttcagaa 60
aaagaagatg cagtgaacaa gattcacaca actggcttta aagatcaaaa tgaaatgtta 120
tcaagtcttc aaaaactggc cgttttaaaa gcggatctag aaaagaaaaa gcaatccatg 180
ggcaaactgt attcactcaa acaagatctt ctttcaacac tgaagaataa gtcagtgacc 240
cagaagacgg aagcatggct ggataacttt gcccggtgtt gggataattt agtccaaaaa 300
cttgaaaaga gtacagcaca gatttcacag gct 333
<210> 41
<211> 147
<212> DNA
<213> Homo sapiens
<400> 41
gtcaccacca ctcagccatc actaacacag acaactgtaa tggaaacagt aactacggtg 60
accacaaggg aacagatcct ggtaaagcat gctcaagagg aacttccacc accacctccc 120
caaaagaaga ggcagattac tgtggat 147
<210> 42
<211> 333
<212> DNA
<213> Homo sapiens
<400> 42
tctgaaatta ggaaaaggtt ggatgttgat ataactgaac ttcacagctg gattactcgc 60
tcagaagctg tgttgcagag tcctgaattt gcaatctttc ggaaggaagg caacttctca 120
gacttaaaag aaaaagtcaa tgccatagag cgagaaaaag ctgagaagtt cagaaaactg 180
caagatgcca gcagatcagc tcaggccctg gtggaacaga tggtgaatga gggtgttaat 240
gcagatagca tcaaacaagc ctcagaacaa ctgaacagcc ggtggatcga attctgccag 300
ttgctaagtg agagacttaa ctggctggag tat 333
<210> 43
<211> 327
<212> DNA
<213> Homo sapiens
<400> 43
cagaacaaca tcatcgcttt ctataatcag ctacaacaat tggagcagat gacaactact 60
gctgaaaact ggttgaaaat ccaacccacc accccatcag agccaacagc aattaaaagt 120
cagttaaaaa tttgtaagga tgaagtcaac cggctatcag gtcttcaacc tcaaattgaa 180
cgattaaaaa ttcaaagcat agccctgaaa gagaaaggac aaggacccat gttcctggat 240
gcagactttg tggcctttac aaatcatttt aagcaagtct tttctgatgt gcaggccaga 300
gagaaagagc tacagacaat ttttgac 327
<210> 44
<211> 327
<212> DNA
<213> Homo sapiens
<400> 44
actttgccac caatgcgcta tcaggagacc atgagtgcca tcaggacatg ggtccagcag 60
tcagaaacca aactctccat acctcaactt agtgtcaccg actatgaaat catggagcag 120
agactcgggg aattgcaggc tttacaaagt tctctgcaag agcaacaaag tggcctatac 180
tatctcagca ccactgtgaa agagatgtcg aagaaagcgc cctctgaaat tagccggaaa 240
tatcaatcag aatttgaaga aattgaggga cgctggaaga agctctcctc ccagctggtt 300
gagcattgtc aaaagctaga ggagcaa 327
<210> 45
<211> 327
<212> DNA
<213> Homo sapiens
<400> 45
atgaataaac tccgaaaaat tcagaatcac atacaaaccc tgaagaaatg gatggctgaa 60
gttgatgttt ttctgaagga ggaatggcct gcccttgggg attcagaaat tctaaaaaag 120
cagctgaaac agtgcagact tttagtcagt gatattcaga caattcagcc cagtctaaac 180
agtgtcaatg aaggtgggca gaagataaag aatgaagcag agccagagtt tgcttcgaga 240
cttgagacag aactcaaaga acttaacact cagtgggatc acatgtgcca acaggtctat 300
gccagaaagg aggccttgaa gggaggt 327
<210> 46
<211> 327
<212> DNA
<213> Homo sapiens
<400> 46
ttggagaaaa ctgtaagcct ccagaaagat ctatcagaga tgcacgaatg gatgacacaa 60
gctgaagaag agtatcttga gagagatttt gaatataaaa ctccagatga attacagaaa 120
gcagttgaag agatgaagag agctaaagaa gaggcccaac aaaaagaagc gaaagtgaaa 180
ctccttactg agtctgtaaa tagtgtcata gctcaagctc cacctgtagc acaagaggcc 240
ttaaaaaagg aacttgaaac tctaaccacc aactaccagt ggctctgcac taggctgaat 300
gggaaatgca agactttgga agaagtt 327
<210> 47
<211> 312
<212> DNA
<213> Homo sapiens
<400> 47
tgggcatgtt ggcatgagtt attgtcatac ttggagaaag caaacaagtg gctaaatgaa 60
gtagaattta aacttaaaac cactgaaaac attcctggcg gagctgagga aatctctgag 120
gtgctagatt cacttgaaaa tttgatgcga cattcagagg ataacccaaa tcagattcgc 180
atattggcac agaccctaac agatggcgga gtcatggatg agctaatcaa tgaggaactt 240
gagacattta attctcgttg gagggaacta catgaagagg ctgtaaggag gcaaaagttg 300
cttgaacaga gc 312
<210> 48
<211> 276
<212> DNA
<213> Homo sapiens
<400> 48
atccagtctg cccaggagac tgaaaaatcc ttacacttaa tccaggagtc cctcacattc 60
attgacaagc agttggcagc ttatattgca gacaaggtgg acgcagctca aatgcctcag 120
gaagcccaga aaatccaatc tgatttgaca agtcatgaga tcagtttaga agaaatgaag 180
aaacataatc aggggaagga ggctgcccaa agagtcctgt ctcagattga tgttgcacag 240
aaaaaattac aagatgtctc catgaagttt cgatta 276
<210> 49
<211> 327
<212> DNA
<213> Homo sapiens
<400> 49
ttccagaaac cagccaattt tgagctgcgt ctacaagaaa gtaagatgat tttagatgaa 60
gtgaagatgc acttgcctgc attggaaaca aagagtgtgg aacaggaagt agtacagtca 120
cagctaaatc attgtgtgaa cttgtataaa agtctgagtg aagtgaagtc tgaagtggaa 180
atggtgataa agactggacg tcagattgta cagaaaaagc agacggaaaa tcccaaagaa 240
cttgatgaaa gagtaacagc tttgaaattg cattataatg agctgggagc aaaggtaaca 300
gaaagaaagc aacagttgga gaaatgc 327
<210> 50
<211> 324
<212> DNA
<213> Homo sapiens
<400> 50
ttgaaattgt cccgtaagat gcgaaaggaa atgaatgtct tgacagaatg gctggcagct 60
acagatatgg aattgacaaa gagatcagca gttgaaggaa tgcctagtaa tttggattct 120
gaagttgcct ggggaaaggc tactcaaaaa gagattgaga aacagaaggt gcacctgaag 180
agtatcacag aggtaggaga ggccttgaaa acagttttgg gcaagaagga gacgttggtg 240
gaagataaac tcagtcttct gaatagtaac tggatagctg tcacctcccg agcagaagag 300
tggttaaatc ttttgttgga atac 324
<210> 51
<211> 312
<212> DNA
<213> Homo sapiens
<400> 51
cagaaacaca tggaaacttt tgaccagaat gtggaccaca tcacaaagtg gatcattcag 60
gctgacacac ttttggatga atcagagaaa aagaaacccc agcaaaaaga agacgtgctt 120
aagcgtttaa aggcagaact gaatgacata cgcccaaagg tggactctac acgtgaccaa 180
gcagcaaact tgatggcaaa ccgcggtgac cactgcagga aattagtaga gccccaaatc 240
tcagagctca accatcgatt tgcagccatt tcacacagaa ttaagactgg aaaggcctcc 300
attcctttga ag 312
<210> 52
<211> 282
<212> DNA
<213> Homo sapiens
<400> 52
gaattggagc agtttaactc agatatacaa aaattgcttg aaccactgga ggctgaaatt 60
cagcaggggg tgaatctgaa agaggaagac ttcaataaag atatgaatga agacaatgag 120
ggtactgtaa aagaattgtt gcaaagagga gacaacttac aacaaagaat cacagatgag 180
agaaagagag aggaaataaa gataaaacag cagctgttac agacaaaaca taatgctctc 240
aaggatttga ggtctcaaag aagaaaaaag gctctagaaa tt 282
<210> 53
<211> 294
<212> DNA
<213> Homo sapiens
<400> 53
tctcatcagt ggtatcagta caagaggcag gctgatgatc tcctgaaatg cttggatgac 60
attgaaaaaa aattagccag cctacctgag cccagagatg aaaggaaaat aaaggaaatt 120
gatcgggaat tgcagaagaa gaaagaggag ctgaatgcag tgcgtaggca agctgagggc 180
ttgtctgagg atggggccgc aatggcagtg gagccaactc agatccagct cagcaagcgc 240
tggcgggaaa ttgagagcaa atttgctcag tttcgaagac tcaactttgc acaa 294
<210> 54
<211> 60
<212> DNA
<213> Homo sapiens
<400> 54
attcacactg tccgtgaaga aacgatgatg gtgatgactg aagacatgcc tttggaaatt 60
<210> 55
<211> 327
<212> DNA
<213> Homo sapiens
<400> 55
tcttatgtgc cttctactta tttgactgaa atcactcatg tctcacaagc cctattagaa 60
gtggaacaac ttctcaatgc tcctgacctc tgtgctaagg actttgaaga tctctttaag 120
caagaggagt ctctgaagaa tataaaagat agtctacaac aaagctcagg tcggattgac 180
attattcata gcaagaagac agcagcattg caaagtgcaa cgcctgtgga aagggtgaag 240
ctacaggaag ctctctccca gcttgatttc caatgggaaa aagttaacaa aatgtacaag 300
gaccgacaag ggcgatttga cagatct 327
<210> 56
<211> 321
<212> DNA
<213> Homo sapiens
<400> 56
gttgagaaat ggcggcgttt tcattatgat ataaagatat ttaatcagtg gctaacagaa 60
gctgaacagt ttctcagaaa gacacaaatt cctgagaatt gggaacatgc taaatacaaa 120
tggtatctta aggaactcca ggatggcatt gggcagcggc aaactgttgt cagaacattg 180
aatgcaactg gggaagaaat aattcagcaa tcctcaaaaa cagatgccag tattctacag 240
gaaaaattgg gaagcctgaa tctgcggtgg caggaggtct gcaaacagct gtcagacaga 300
aaaaagaggc tagaagaaca a 321
<210> 57
<211> 351
<212> DNA
<213> Homo sapiens
<400> 57
aagaatatct tgtcagaatt tcaaagagat ttaaatgaat ttgttttatg gttggaggaa 60
gcagataaca ttgctagtat cccacttgaa cctggaaaag agcagcaact aaaagaaaag 120
cttgagcaag tcaagttact ggtggaagag ttgcccctgc gccagggaat tctcaaacaa 180
ttaaatgaaa ctggaggacc cgtgcttgta agtgctccca taagcccaga agagcaagat 240
aaacttgaaa ataagctcaa gcagacaaat ctccagtgga taaaggtttc cagagcttta 300
cctgagaaac aaggagaaat tgaagctcaa ataaaagacc ttgggcagct t 351
<210> 58
<211> 303
<212> DNA
<213> Homo sapiens
<400> 58
gaaaaaaagc ttgaagacct tgaagagcag ttaaatcatc tgctgctgtg gttatctcct 60
attaggaatc agttggaaat ttataaccaa ccaaaccaag aaggaccatt tgacgttcag 120
gaaactgaaa tagcagttca agctaaacaa ccggatgtgg aagagatttt gtctaaaggg 180
cagcatttgt acaaggaaaa accagccact cagccagtga agaggaagtt agaagatctg 240
agctctgagt ggaaggcggt aaaccgttta cttcaagagc tgagggcaaa gcagcctgac 300
cta 303
<210> 59
<211> 123
<212> DNA
<213> Homo sapiens
<400> 59
gctcctggac tgaccactat tggagcctct cctactcaga ctgttactct ggtgacacaa 60
cctgtggtta ctaaggaaac tgccatctcc aaactagaaa tgccatcttc cttgatgttg 120
gag 123
<210> 60
<211> 330
<212> DNA
<213> Homo sapiens
<400> 60
gtacctgctc tggcagattt caaccgggct tggacagaac ttaccgactg gctttctctg 60
cttgatcaag ttataaaatc acagagggtg atggtgggtg accttgagga tatcaacgag 120
atgatcatca agcagaaggc aacaatgcag gatttggaac agaggcgtcc ccagttggaa 180
gaactcatta ccgctgccca aaatttgaaa aacaagacca gcaatcaaga ggctagaaca 240
atcattacgg atcgaattga aagaattcag aatcagtggg atgaagtaca agaacacctt 300
cagaaccgga ggcaacagtt gaatgaaatg 330
<210> 61
<211> 327
<212> DNA
<213> Homo sapiens
<400> 61
ttaaaggatt caacacaatg gctggaagct aaggaagaag ctgagcaggt cttaggacag 60
gccagagcca agcttgagtc atggaaggag ggtccctata cagtagatgc aatccaaaag 120
aaaatcacag aaaccaagca gttggccaaa gacctccgcc agtggcagac aaatgtagat 180
gtggcaaatg acttggccct gaaacttctc cgggattatt ctgcagatga taccagaaaa 240
gtccacatga taacagagaa tatcaatgcc tcttggagaa gcattcataa aagggtgagt 300
gagcgagagg ctgctttgga agaaact 327
<210> 62
<211> 348
<212> DNA
<213> Homo sapiens
<400> 62
catagattac tgcaacagtt ccccctggac ctggaaaagt ttcttgcctg gcttacagaa 60
gctgaaacaa ctgccaatgt cctacaggat gctacccgta aggaaaggct cctagaagac 120
tccaagggag taaaagagct gatgaaacaa tggcaagacc tccaaggtga aattgaagct 180
cacacagatg tttatcacaa cctggatgaa aacagccaaa aaatcctgag atccctggaa 240
ggttccgatg atgcagtcct gttacaaaga cgtttggata acatgaactt caagtggagt 300
gaacttcgga aaaagtctct caacattagg tcccatttgg aagccagt 348
<210> 63
<211> 387
<212> DNA
<213> Homo sapiens
<400> 63
tctgaccagt ggaagcgtct gcacctttct ctgcaggaac ttctggtgtg gctacagctg 60
aaagatgatg aattaagccg gcaggcacct attggaggcg actttccagc agttcagaag 120
cagaacgatg tacatagggc cttcaagagg gaattgaaaa ctaaagaacc tgtaatcatg 180
agtactcttg agactgtacg aatatttctg acagagcagc ctttggaagg actagagaaa 240
ctctaccagg agcccagaga gctgcctcct gaggagagag cccagaatgt cactcggctt 300
ctacgaaagc aggctgagga ggtcaatact gagtgggaaa aattgaacct gcactccgct 360
gactggcaga gaaaaataga tgagacc 387
<210> 64
<211> 324
<212> DNA
<213> Homo sapiens
<400> 64
cttgaaagac tccaggaact tcaagaggcc acggatgagc tggacctcaa gctgcgccaa 60
gctgaggtga tcaagggatc ctggcagccc gtgggcgatc tcctcattga ctctctccaa 120
gatcacctcg agaaagtcaa ggcacttcga ggagaaattg cgcctctgaa agagaacgtg 180
agccacgtca atgaccttgc tcgccagctt accactttgg gcattcagct ctcaccgtat 240
aacctcagca ctctggaaga cctgaacacc agatggaagc ttctgcaggt ggccgtcgag 300
gaccgagtca ggcagctgca tgaa 324
<210> 65
<211> 216
<212> DNA
<213> Homo sapiens
<400> 65
gcccacaggg actttggtcc agcatctcag cactttcttt ccacgtctgt ccagggtccc 60
tgggagagag ccatctcgcc aaacaaagtg ccctactata tcaaccacga gactcaaaca 120
acttgctggg accatcccaa aatgacagag ctctaccagt ctttagctga cctgaataat 180
gtcagattct cagcttatag gactgccatg aaactc 216
<210> 66
<211> 888
<212> DNA
<213> Homo sapiens
<400> 66
cgaagactgc agaaggccct ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc 60
ttggaccagc acaacctcaa gcaaaatgac cagcccatgg atatcctgca gattattaat 120
tgtttgacca ctatttatga ccgcctggag caagagcaca acaatttggt caacgtccct 180
ctctgcgtgg atatgtgtct gaactggctg ctgaatgttt atgatacggg acgaacaggg 240
aggatccgtg tcctgtcttt taaaactggc atcatttccc tgtgtaaagc acatttggaa 300
gacaagtaca gatacctttt caagcaagtg gcaagttcaa caggattttg tgaccagcgc 360
aggctgggcc tccttctgca tgattctatc caaattccaa gacagttggg tgaagttgca 420
tcctttgggg gcagtaacat tgagccaagt gtccggagct gcttccaatt tgctaataat 480
aagccagaga tcgaagcggc cctcttccta gactggatga gactggaacc ccagtccatg 540
gtgtggctgc ccgtcctgca cagagtggct gctgcagaaa ctgccaagca tcaggccaaa 600
tgtaacatct gcaaagagtg tccaatcatt ggattcaggt acaggagtct aaagcacttt 660
aattatgaca tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg 720
cactatccca tggtggaata ttgcactccg actacatcag gagaagatgt tcgagacttt 780
gccaaggtac taaaaaacaa atttcgaacc aaaaggtatt ttgcgaagca tccccgaatg 840
ggctacctgc cagtgcagac tgtcttagag ggggacaaca tggaaact 888
<210> 67
<211> 834
<212> DNA
<213> Homo sapiens
<400> 67
cccgttactc tgatcaactt ctggccagta gattctgcgc ctgcctcgtc ccctcagctt 60
tcacacgatg atactcattc acgcattgaa cattatgcta gcaggctagc agaaatggaa 120
aacagcaatg gatcttatct aaatgatagc atctctccta atgagagcat agatgatgaa 180
catttgttaa tccagcatta ctgccaaagt ttgaaccagg actcccccct gagccagcct 240
cgtagtcctg cccagatctt gatttcctta gagagtgagg aaagagggga gctagagaga 300
atcctagcag atcttgagga agaaaacagg aatctgcaag cagaatatga ccgtctaaag 360
cagcagcacg aacataaagg cctgtcccca ctgccgtccc ctcctgaaat gatgcccacc 420
tctccccaga gtccccggga tgctgagctc attgctgagg ccaagctact gcgtcaacac 480
aaaggccgcc tggaagccag gatgcaaatc ctggaagacc acaataaaca gctggagtca 540
cagttacaca ggctaaggca gctgctggag caaccccagg cagaggccaa agtgaatggc 600
acaacggtgt cctctccttc tacctctcta cagaggtccg acagcagtca gcctatgctg 660
ctccgagtgg ttggcagtca aacttcggac tccatgggtg aggaagatct tctcagtcct 720
ccccaggaca caagcacagg gttagaggag gtgatggagc aactcaacaa ctccttccct 780
agttcaagag gaagaaatac ccctggaaag ccaatgagag aggacacaat gtag 834
<210> 68
<211> 252
<212> PRT
<213> Homo sapiens
<400> 68
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu
245 250
<210> 69
<211> 85
<212> PRT
<213> Homo sapiens
<400> 69
Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu
1 5 10 15
His His Gln Met His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln
20 25 30
Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala
35 40 45
Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro
50 55 60
Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser
65 70 75 80
Ser Leu Met Glu Ser
85
<210> 70
<211> 109
<212> PRT
<213> Homo sapiens
<400> 70
Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu Ser
1 5 10 15
Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile Ser
20 25 30
Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly Tyr
35 40 45
Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu Gln
50 55 60
Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu Glu
65 70 75 80
Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu Cys
85 90 95
Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His
100 105
<210> 71
<211> 2
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> RV-Linker
<400> 71
Arg Val
1
<210> 72
<211> 111
<212> PRT
<213> Homo sapiens
<400> 72
Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala
1 5 10 15
Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly
20 25 30
Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val
35 40 45
Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr
50 55 60
Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr
65 70 75 80
Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn
85 90 95
Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala
100 105 110
<210> 73
<211> 49
<212> PRT
<213> Homo sapiens
<400> 73
Val Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr
1 5 10 15
Val Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln
20 25 30
Glu Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val
35 40 45
Asp
<210> 74
<211> 4
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<223> SEAQ linker
<400> 74
Ser Glu Ala Gln
1
<210> 75
<211> 20
<212> PRT
<213> Homo sapiens
<400> 75
Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met
1 5 10 15
Pro Leu Glu Ile
20
<210> 76
<211> 109
<212> PRT
<213> Homo sapiens
<400> 76
Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln
1 5 10 15
Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala
20 25 30
Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile
35 40 45
Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser
50 55 60
Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
65 70 75 80
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn
85 90 95
Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser
100 105
<210> 77
<211> 107
<212> PRT
<213> Homo sapiens
<400> 77
Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
1 5 10 15
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu
20 25 30
Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp
35 40 45
Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly
50 55 60
Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln
65 70 75 80
Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln
85 90 95
Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
100 105
<210> 78
<211> 108
<212> PRT
<213> Homo sapiens
<400> 78
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu
1 5 10 15
Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
20 25 30
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
35 40 45
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
50 55 60
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
65 70 75 80
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln
85 90 95
Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu
100 105
<210> 79
<211> 72
<212> PRT
<213> Homo sapiens
<400> 79
Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
1 5 10 15
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr
20 25 30
Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met
35 40 45
Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser
50 55 60
Ala Tyr Arg Thr Ala Met Lys Leu
65 70
<210> 80
<211> 299
<212> PRT
<213> Homo sapiens
<400> 80
Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala
1 5 10 15
Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro
20 25 30
Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg
35 40 45
Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp
50 55 60
Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly
65 70 75 80
Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys
85 90 95
Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser
100 105 110
Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp
115 120 125
Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly
130 135 140
Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
145 150 155 160
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
165 170 175
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
180 185 190
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro
195 200 205
Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile
210 215 220
Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met
225 230 235 240
His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp
245 250 255
Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg
260 265 270
Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val
275 280 285
Leu Glu Gly Asp Asn Met Glu Thr Asp Thr Met
290 295
<210> 81
<211> 252
<212> PRT
<213> Homo sapiens
<400> 81
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu
245 250
<210> 82
<211> 85
<212> PRT
<213> Homo sapiens
<400> 82
Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu
1 5 10 15
His His Gln Met His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln
20 25 30
Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala
35 40 45
Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro
50 55 60
Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser
65 70 75 80
Ser Leu Met Glu Ser
85
<210> 83
<211> 109
<212> PRT
<213> Homo sapiens
<400> 83
Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu Ser
1 5 10 15
Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile Ser
20 25 30
Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly Tyr
35 40 45
Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu Gln
50 55 60
Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu Glu
65 70 75 80
Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu Cys
85 90 95
Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His
100 105
<210> 84
<211> 20
<212> PRT
<213> Homo sapiens
<400> 84
Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met
1 5 10 15
Pro Leu Glu Ile
20
<210> 85
<211> 109
<212> PRT
<213> Homo sapiens
<400> 85
Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln
1 5 10 15
Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala
20 25 30
Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile
35 40 45
Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser
50 55 60
Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
65 70 75 80
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn
85 90 95
Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser
100 105
<210> 86
<211> 107
<212> PRT
<213> Homo sapiens
<400> 86
Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln
1 5 10 15
Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu
20 25 30
Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp
35 40 45
Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly
50 55 60
Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln
65 70 75 80
Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln
85 90 95
Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
100 105
<210> 87
<211> 41
<212> PRT
<213> Homo sapiens
<400> 87
Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr
1 5 10 15
Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu
20 25 30
Glu Met Pro Ser Ser Leu Met Leu Glu
35 40
<210> 88
<211> 129
<212> PRT
<213> Homo sapiens
<400> 88
Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val
1 5 10 15
Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly
20 25 30
Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe
35 40 45
Lys Arg Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu
50 55 60
Thr Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys
65 70 75 80
Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn
85 90 95
Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp
100 105 110
Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu
115 120 125
Thr
<210> 89
<211> 108
<212> PRT
<213> Homo sapiens
<400> 89
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu
1 5 10 15
Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
20 25 30
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
35 40 45
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
50 55 60
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
65 70 75 80
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln
85 90 95
Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu
100 105
<210> 90
<211> 72
<212> PRT
<213> Homo sapiens
<400> 90
Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
1 5 10 15
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr
20 25 30
Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met
35 40 45
Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser
50 55 60
Ala Tyr Arg Thr Ala Met Lys Leu
65 70
<210> 91
<211> 352
<212> PRT
<213> Homo sapiens
<400> 91
Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala
1 5 10 15
Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro
20 25 30
Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg
35 40 45
Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp
50 55 60
Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly
65 70 75 80
Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys
85 90 95
Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser
100 105 110
Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp
115 120 125
Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly
130 135 140
Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
145 150 155 160
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
165 170 175
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
180 185 190
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro
195 200 205
Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile
210 215 220
Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met
225 230 235 240
His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp
245 250 255
Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg
260 265 270
Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val
275 280 285
Leu Glu Gly Asp Asn Met Glu Thr Pro Ala Gln Ile Leu Ile Ser Leu
290 295 300
Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu
305 310 315 320
Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln
325 330 335
His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Asp Thr Met
340 345 350
<210> 92
<211> 322
<212> DNA
<213> Homo sapiens
<400> 92
ccgccttcgg caccattcct cacgacaccc aaatatggca cgggtgagga atggtgggga 60
gttattttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac 120
tcccgggagt tattttagag cggaggaatg gtggacaccc aaataggcga cggttcctca 180
cccgtcgcca tatttgggtg tccgccctcg gccggggccg cattcctggg gccgggcggt 240
gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag ctacccggag 300
gagcgggagg ctctagacca cc 322
<210> 93
<211> 756
<212> DNA
<213> Homo sapiens
<400> 93
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaa 756
<210> 94
<211> 255
<212> DNA
<213> Homo sapiens
<400> 94
atgctgccca gaccccccaa agtgaccaaa gaggaacact tccagctgca ccaccagatg 60
cactacagcc agcagatcac cgtgtccctg gcccagggct acgagagaac cagcagcccc 120
aagccccggt tcaagagcta cgcctatacc caggccgcct acgtgaccac cagcgaccct 180
accagaagcc cattccccag ccagcatctg gaagcccccg aggacaagag cttcggcagc 240
agcctgatgg aaagc 255
<210> 95
<211> 327
<212> DNA
<213> Homo sapiens
<400> 95
gaagtgaacc tggacagata ccagaccgcc ctggaagagg tgctgagctg gctgctgagc 60
gccgaggata cactgcaggc tcagggcgag atcagcaacg acgtggaagt cgtgaaggac 120
cagttccaca cccacgaggg ctacatgatg gacctgacag cccaccaggg cagagtgggc 180
aacatcctgc agctgggctc caagctgatc ggcaccggca agctgagcga ggacgaagag 240
acagaggtgc aggaacagat gaacctgctg aacagcagat gggagtgcct gcgggtggcc 300
agcatggaaa agcagagcaa cctgcat 327
<210> 96
<211> 6
<212> DNA
<213> Homo sapiens
<400> 96
agggtc 6
<210> 97
<211> 333
<212> DNA
<213> Homo sapiens
<400> 97
ctgctgaagt ggcagcggct gaccgaggaa cagtgcctgt ttagcgcctg gctgtccgag 60
aaagaggacg ccgtgaacaa gatccacacc accggcttca aggaccagaa cgagatgctg 120
agcagcctgc agaaactggc cgtgctgaag gccgacctgg aaaagaaaaa gcagtccatg 180
ggcaagctgt actccctgaa gcaggacctg ctgtccaccc tgaagaacaa gagcgtgacc 240
cagaaaaccg aggcctggct ggacaacttc gcccggtgct gggacaacct ggtgcagaag 300
ctggaaaagt ccaccgccca gatctcccag gcc 333
<210> 98
<211> 147
<212> DNA
<213> Homo sapiens
<400> 98
gtgaccacaa cacagcccag cctgacccag accaccgtga tggaaaccgt gacaacagtg 60
accacccggg aacagatcct cgtgaagcac gcccaggaag aactgccccc tccacccccc 120
cagaagaaac ggcagatcac agtggac 147
<210> 99
<211> 12
<212> DNA
<213> Homo sapiens
<400> 99
agtgaagctc ag 12
<210> 100
<211> 60
<212> DNA
<213> Homo sapiens
<400> 100
atccacaccg tgcgggaaga gacaatgatg gtcatgacag aggacatgcc cctggaaatc 60
<210> 101
<211> 327
<212> DNA
<213> Homo sapiens
<400> 101
agctacgtgc ccagcaccta cctgaccgag atcacccatg tgtcccaggc cctgctggaa 60
gtggaacagc tgctgaacgc ccccgacctg tgcgccaagg atttcgagga cctgttcaag 120
caggaagaga gcctgaagaa tatcaaggat agcctgcagc agagcagcgg ccggatcgac 180
atcatccaca gcaagaaaac agccgccctg cagagcgcca cccccgtgga aagagtgaaa 240
ctgcaggaag ccctgtccca gctggacttc cagtgggaga aagtgaacaa aatgtacaag 300
gaccggcagg gcagattcga ccgcagc 327
<210> 102
<211> 321
<212> DNA
<213> Homo sapiens
<400> 102
gtggaaaagt ggcggcggtt ccactacgac atcaagatct tcaaccagtg gctgacagag 60
gccgagcagt tcctgagaaa gacccagatc cccgagaact gggagcacgc caagtacaag 120
tggtatctga aagagctgca ggacggcatc ggccagagac agacagtcgt gcggaccctg 180
aatgccaccg gcgaggaaat catccagcag tccagcaaga ccgacgccag cattctgcag 240
gaaaagctgg gcagcctgaa cctgcggtgg caggaagtgt gcaagcagct gtccgaccgg 300
aagaagcggc tggaagaaca g 321
<210> 103
<211> 324
<212> DNA
<213> Homo sapiens
<400> 103
ctggaacggc tgcaggaact gcaggaggcc accgacgagc tggacctgaa actgagacag 60
gccgaagtga tcaagggcag ctggcagcca gtgggcgacc tgctgatcga ctccctgcag 120
gaccatctgg aaaaagtgaa ggccctgaga ggcgagatcg cccccctgaa agaaaacgtg 180
tcccacgtga acgacctggc ccggcagctg acaacactgg gcattcagct gagcccctac 240
aacctgagca cactggaaga tctgaacacc cggtggaagc tgctgcaggt ggccgtggaa 300
gatagagtgc ggcagctgca cgag 324
<210> 104
<211> 215
<212> DNA
<213> Homo sapiens
<400> 104
gcccacagag attttggccc tgcctcccag cacttcctga gcaccagtgt gcagggccct 60
tgggagagag ccatctcccc taacaaggtg ccctactaca tcaaccacga gacacagacc 120
acctgttggg accaccccaa gatgaccgag ctgtaccaga gcctggctga cctgaacaac 180
gtgcggttca ggcctaccgg accgccatga agctg 215
<210> 105
<211> 1068
<212> DNA
<213> Homo sapiens
<400> 105
cggagactgc agaaagctct gtgcctggat ctgctgtccc tgtccgccgc ctgtgatgcc 60
ctggaccagc acaatctgaa gcagaacgac cagcccatgg atatcctgca gatcatcaac 120
tgcctgacca ccatctacga ccggctggaa caggaacaca acaatctcgt gaacgtgccc 180
ctgtgcgtgg acatgtgcct gaattggctg ctgaatgtgt acgacaccgg ccggacaggc 240
cggatcagag tgctgtcctt caagaccggc atcatcagcc tgtgcaaagc ccacctggaa 300
gataagtacc ggtatctgtt caaacaggtg gcctctagca ccggcttttg cgaccagaga 360
aggctgggcc tgctgctgca cgacagcatc cagatcccta gacagctggg cgaagtggcc 420
agctttggcg gcagcaacat cgagcctagc gtgcggagct gcttccagtt cgccaacaac 480
aagcccgaga tcgaggccgc cctgttcctg gactggatga gactggaacc ccagagcatg 540
gtgtggctgc ccgtgctgca tagagtggcc gctgccgaga cagccaagca ccaggccaag 600
tgcaacatct gcaaagagtg ccccatcatc ggcttccggt acagaagcct gaagcacttc 660
aactacgata tctgccagag ctgtttcttc agcggcaggg tggccaaggg ccacaaaatg 720
cactacccca tggtggaata ctgcaccccc accacaagcg gcgaggatgt gcgggatttc 780
gccaaggtgc tgaaaaacaa gttccggacc aagcggtact tcgccaaaca cccccggatg 840
ggctacctgc ctgtgcagac agtgctggaa ggcgacaaca tggaaaccga caccatgtga 900
tgatgatttg ggcagagcga tggagtcctt agtatcagtc atgacagatg aagaaggagc 960
agaataaatg ttttacaact cctgattccc gcatgcggcc agcttatcga taccgtcgaa 1020
ataaaagatc cttattttca ttggatctgt gtgttggttt tttgtgtg 1068
<210> 106
<211> 334
<212> DNA
<213> Homo sapiens
<400> 106
cctgcggccg ccttcggcac cattcctcac gacacccaaa tatggcgacg ggtgaggaat 60
ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 120
aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 180
acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc gcattcctgg 240
gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg gcggcccacg 300
agctacccgg aggagcggga ggctctagac cacc 334
<210> 107
<211> 756
<212> DNA
<213> Homo sapiens
<400> 107
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaa 756
<210> 108
<211> 255
<212> DNA
<213> Homo sapiens
<400> 108
atgctgccca gaccccccaa agtgaccaaa gaggaacact tccagctgca ccaccagatg 60
cactacagcc agcagatcac cgtgtccctg gctcagggct acgagcggac cagcagcccc 120
aagccccggt tcaagagcta cgcctacacc caggccgcct acgtgaccac cagcgacccc 180
accagaagcc cattccccag ccagcatctg gaagcccccg aggacaagag cttcggcagc 240
agcctgatgg aaagc 255
<210> 109
<211> 327
<212> DNA
<213> Homo sapiens
<400> 109
gaagtgaacc tggacagata ccagaccgcc ctggaagagg tgctgtcctg gctgctgagc 60
gccgaggata cactgcaggc ccagggcgag atcagcaacg acgtggaagt ggtgaaagac 120
cagttccaca cccacgaggg ctacatgatg gacctgaccg cccaccaggg cagagtgggc 180
aacatcctgc agctgggcag caagctgatc ggcaccggca agctgagcga ggacgaagag 240
acagaggtgc aggaacagat gaacctgctg aacagcagat gggagtgcct gcgggtggcc 300
agcatggaaa agcagagcaa cctgcac 327
<210> 110
<211> 60
<212> DNA
<213> Homo sapiens
<400> 110
atccacaccg tgcgggaaga gacaatgatg gtgatgaccg aggacatgcc cctggaaatc 60
<210> 111
<211> 327
<212> DNA
<213> Homo sapiens
<400> 111
agctacgtgc ccagcaccta cctgaccgag atcacccacg tgtcccaggc tctgctggaa 60
gtggaacagc tgctgaacgc ccccgacctg tgcgccaagg acttcgagga tctgttcaag 120
caggaagaga gcctgaagaa tatcaaggac tccctgcagc agtccagcgg ccggatcgac 180
atcatccaca gcaagaaaac agccgccctg cagtccgcca cccccgtgga aagagtgaag 240
ctgcaggaag ccctgagcca gctggacttc cagtgggaga aagtgaacaa gatgtacaag 300
gaccggcagg gcagattcga ccgcagc 327
<210> 112
<211> 321
<212> DNA
<213> Homo sapiens
<400> 112
gtggaaaagt ggcggcggtt ccactacgac atcaagatct tcaaccagtg gctgaccgag 60
gccgagcagt tcctgagaaa gacccagatc cccgagaact gggagcacgc caagtacaag 120
tggtatctga aagaactgca ggatggcatc ggccagcggc agaccgtggt gcgcacactg 180
aatgccaccg gcgaggaaat catccagcag agcagcaaga ccgacgccag catcctgcag 240
gaaaagctgg gctccctgaa cctgcggtgg caggaagtgt gcaagcagct gagcgaccgg 300
aagaagaggc tggaagaaca g 321
<210> 113
<211> 123
<212> DNA
<213> Homo sapiens
<400> 113
gcccctggcc tgaccaccat cggcgccagc cctacccaga ccgtgaccct ggtgacacag 60
cccgtggtga caaaagagac agccatctcc aagctggaaa tgcccagctc cctgatgctg 120
gaa 123
<210> 114
<211> 387
<212> DNA
<213> Homo sapiens
<400> 114
tctgaccagt ggaagcgtct gcacctttct ctgcaggaac ttctggtgtg gctacagctg 60
aaagatgatg aattaagccg gcaggcacct attggaggcg actttccagc agttcagaag 120
cagaacgatg tacatagggc cttcaagagg gaattgaaaa ctaaagaacc tgtaatcatg 180
agtactcttg agactgtacg aatatttctg acagagcagc ctttggaagg actagagaaa 240
ctctaccagg agcccagaga gctgcctcct gaggagagag cccagaatgt cactcggctt 300
ctacgaaagc aggctgagga ggtcaatact gagtgggaaa aattgaacct gcactccgct 360
gactggcaga gaaaaataga tgagacc 387
<210> 115
<211> 324
<212> DNA
<213> Homo sapiens
<400> 115
ctggaaaggc tgcaggaact gcaggaggcc accgacgagc tggacctgaa gctgcggcag 60
gccgaagtga tcaagggcag ctggcagccc gtgggcgacc tgctgatcga cagcctgcag 120
gaccacctgg aaaaagtgaa ggccctgaga ggcgagatcg cccccctgaa agaaaacgtg 180
tcccacgtga acgacctggc ccggcagctg accaccctgg gcatccagct gagcccctac 240
aacctgagca ccctggaaga tctgaacacc cggtggaagc tgctgcaggt ggccgtggaa 300
gatagagtgc ggcagctgca cgag 324
<210> 116
<211> 216
<212> DNA
<213> Homo sapiens
<400> 116
gcccacagag actttggccc tgccagccag cacttcctga gcacctctgt gcagggaccc 60
tgggagagag ccatcagccc caacaaggtg ccctactaca tcaaccacga gacacagacc 120
acctgttggg accaccccaa gatgaccgag ctgtaccaga gcctggccga cctgaacaat 180
gtgcggttca gcgcctaccg gaccgccatg aagctg 216
<210> 117
<211> 1059
<212> DNA
<213> Homo sapiens
<400> 117
aggcggctgc agaaagctct gtgcctggat ctgctgagcc tgagcgccgc ctgcgacgcc 60
ctggaccagc acaacctgaa gcagaacgac cagcccatgg atatcctgca gatcatcaac 120
tgcctgacca caatctacga caggctggaa caggaacaca acaatctggt caacgtgccc 180
ctgtgcgtgg acatgtgcct gaattggctg ctgaatgtgt acgacaccgg ccggaccggc 240
agaatccggg tgctgagctt caagaccggc atcatcagcc tgtgcaaggc ccacctggaa 300
gataagtacc gctacctgtt caaacaggtg gccagctcca ccggcttttg cgaccagcgg 360
agactgggcc tgctgctgca cgacagcatc cagatcccca gacagctggg cgaggtggcc 420
tccttcggcg gcagcaacat tgagcccagc gtgcggagct gcttccagtt cgccaacaac 480
aagcccgaga tcgaggccgc cctgttcctg gactggatga gactggaacc ccagagcatg 540
gtgtggctgc ccgtgctgca tcgggtggcc gctgccgaga cagccaagca ccaggccaag 600
tgcaacatct gcaaagagtg ccccatcatc ggcttccggt acagaagcct gaagcacttc 660
aactacgata tctgccagag ctgcttcttc agcggcagag tggccaaggg ccacaaaatg 720
cactacccca tggtggaata ctgcaccccc accaccagcg gcgaggatgt gcgggacttc 780
gccaaggtgc tgaaaaacaa gttccggacc aagcggtact ttgccaagca cccccggatg 840
ggctacctgc ccgtgcagac agtgctggaa ggcgacaaca tggaaacccc tgcccagatc 900
ctgatcagcc tggaaagcga ggaacggggc gagctggaac ggatcctggc cgatctggaa 960
gaggaaaacc ggaacctgca ggccgagtac gaccggctga agcagcagca cgagcacaag 1020
ggcctgagcc ccctgcctag cccccctgac accatgtga 1059
<210> 118
<211> 1327
<212> PRT
<213> Homo sapiens
<400> 118
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala
450 455 460
Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly
465 470 475 480
Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val
485 490 495
Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr
500 505 510
Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr
515 520 525
Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn
530 535 540
Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val
545 550 555 560
Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val
565 570 575
Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu
580 585 590
Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp
595 600 605
Ser Glu Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met
610 615 620
Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu
625 630 635 640
Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu
645 650 655
Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys
660 665 670
Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser
675 680 685
Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser
690 695 700
Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu
705 710 715 720
Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly
725 730 735
Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile
740 745 750
Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys
755 760 765
Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu
770 775 780
Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr
785 790 795 800
Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp
805 810 815
Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
820 825 830
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
835 840 845
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu
850 855 860
Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
865 870 875 880
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
885 890 895
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
900 905 910
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
915 920 925
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln
930 935 940
Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp
945 950 955 960
Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro
965 970 975
Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His
980 985 990
Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr
995 1000 1005
Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg
1010 1015 1020
Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp
1025 1030 1035
Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn
1040 1045 1050
Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn
1055 1060 1065
Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn
1070 1075 1080
Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu
1085 1090 1095
Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu
1100 1105 1110
Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
1115 1120 1125
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly
1130 1135 1140
Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile
1145 1150 1155
Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser
1160 1165 1170
Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
1175 1180 1185
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu
1190 1195 1200
Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala
1205 1210 1215
Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys
1220 1225 1230
Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe
1235 1240 1245
Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala
1250 1255 1260
Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro
1265 1270 1275
Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys
1280 1285 1290
Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met
1295 1300 1305
Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu
1310 1315 1320
Thr Asp Thr Met
1325
<210> 119
<211> 1321
<212> PRT
<213> Homo sapiens
<400> 119
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ile His
595 600 605
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
610 615 620
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
625 630 635 640
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
645 650 655
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
660 665 670
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
675 680 685
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
690 695 700
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
705 710 715 720
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
725 730 735
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
740 745 750
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
755 760 765
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
770 775 780
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
785 790 795 800
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
805 810 815
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
820 825 830
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Leu Glu Arg Leu Gln Glu
835 840 845
Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu
850 855 860
Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser
865 870 875 880
Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala
885 890 895
Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu
900 905 910
Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
915 920 925
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg
930 935 940
Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln
945 950 955 960
His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser
965 970 975
Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys
980 985 990
Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu
995 1000 1005
Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg
1010 1015 1020
Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala
1025 1030 1035
Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln
1040 1045 1050
Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr
1055 1060 1065
Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu
1070 1075 1080
Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr
1085 1090 1095
Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile
1100 1105 1110
Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu
1115 1120 1125
Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg
1130 1135 1140
Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu
1145 1150 1155
Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val
1160 1165 1170
Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala
1175 1180 1185
Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val
1190 1195 1200
Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
1205 1210 1215
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly
1220 1225 1230
Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln
1235 1240 1245
Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His
1250 1255 1260
Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp
1265 1270 1275
Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys
1280 1285 1290
Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln
1295 1300 1305
Thr Val Leu Glu Gly Asp Asn Met Glu Thr Asp Thr Met
1310 1315 1320
<210> 120
<211> 1347
<212> PRT
<213> Homo sapiens
<400> 120
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu
595 600 605
Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
610 615 620
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu
625 630 635 640
Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn
645 650 655
Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu
660 665 670
Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
675 680 685
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr
690 695 700
Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe
705 710 715 720
Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
725 730 735
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile
740 745 750
Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln
755 760 765
Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu
770 775 780
Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
785 790 795 800
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
805 810 815
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val
820 825 830
Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn
835 840 845
Ile Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu
850 855 860
Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu
865 870 875 880
Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg
885 890 895
Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu
900 905 910
Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu
915 920 925
Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala
930 935 940
Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly
945 950 955 960
Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu
965 970 975
Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
980 985 990
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser
995 1000 1005
Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala
1010 1015 1020
Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu
1025 1030 1035
Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys
1040 1045 1050
Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu
1055 1060 1065
Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val
1070 1075 1080
Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn
1085 1090 1095
Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe
1100 1105 1110
Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys
1115 1120 1125
Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys
1130 1135 1140
Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
1145 1150 1155
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile
1160 1165 1170
Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro
1175 1180 1185
Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro
1190 1195 1200
Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
1205 1210 1215
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys
1220 1225 1230
Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr
1235 1240 1245
Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly
1250 1255 1260
His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr
1265 1270 1275
Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys
1280 1285 1290
Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr
1295 1300 1305
Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Thr
1310 1315 1320
Pro Cys Asp Asp Asp Leu Gly Arg Ala Met Glu Ser Leu Val Ser
1325 1330 1335
Val Met Thr Asp Glu Glu Gly Ala Glu
1340 1345
<210> 121
<211> 1326
<212> PRT
<213> Homo sapiens
<400> 121
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu
595 600 605
Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
610 615 620
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu
625 630 635 640
Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn
645 650 655
Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu
660 665 670
Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
675 680 685
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr
690 695 700
Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe
705 710 715 720
Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
725 730 735
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile
740 745 750
Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln
755 760 765
Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu
770 775 780
Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
785 790 795 800
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
805 810 815
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val
820 825 830
Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Leu
835 840 845
Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys
850 855 860
Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp
865 870 875 880
Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu
885 890 895
Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp
900 905 910
Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn
915 920 925
Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val
930 935 940
Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe
945 950 955 960
Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp
965 970 975
Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu
980 985 990
Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln
995 1000 1005
Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr
1010 1015 1020
Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu
1025 1030 1035
Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu
1040 1045 1050
Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
1055 1060 1065
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu
1070 1075 1080
Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu
1085 1090 1095
Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser
1100 1105 1110
Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp
1115 1120 1125
Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe
1130 1135 1140
Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln
1145 1150 1155
Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn
1160 1165 1170
Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys
1175 1180 1185
Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu
1190 1195 1200
Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala
1205 1210 1215
Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu
1220 1225 1230
Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn
1235 1240 1245
Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys
1250 1255 1260
Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr
1265 1270 1275
Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn
1280 1285 1290
Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly
1295 1300 1305
Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
1310 1315 1320
Asp Thr Met
1325
<210> 122
<211> 1328
<212> PRT
<213> Homo sapiens
<400> 122
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu
595 600 605
Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
610 615 620
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu
625 630 635 640
Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn
645 650 655
Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu
660 665 670
Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
675 680 685
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr
690 695 700
Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe
705 710 715 720
Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
725 730 735
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile
740 745 750
Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln
755 760 765
Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu
770 775 780
Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
785 790 795 800
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
805 810 815
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val
820 825 830
Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn
835 840 845
Ile Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp
850 855 860
Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val
865 870 875 880
Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys
885 890 895
Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val
900 905 910
Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro
915 920 925
Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu
930 935 940
Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg
945 950 955 960
Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly
965 970 975
Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn
980 985 990
His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu
995 1000 1005
Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr
1010 1015 1020
Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu
1025 1030 1035
Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His
1040 1045 1050
Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile
1055 1060 1065
Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn
1070 1075 1080
Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp
1085 1090 1095
Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val
1100 1105 1110
Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu
1115 1120 1125
Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr
1130 1135 1140
Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser
1145 1150 1155
Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly
1160 1165 1170
Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn
1175 1180 1185
Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg
1190 1195 1200
Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val
1205 1210 1215
Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys
1220 1225 1230
Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His
1235 1240 1245
Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val
1250 1255 1260
Ala Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr
1265 1270 1275
Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu
1280 1285 1290
Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg
1295 1300 1305
Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met
1310 1315 1320
Glu Thr Asp Thr Met
1325
<210> 123
<211> 1327
<212> PRT
<213> Homo sapiens
<400> 123
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala
450 455 460
Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly
465 470 475 480
Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val
485 490 495
Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr
500 505 510
Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr
515 520 525
Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn
530 535 540
Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val
545 550 555 560
Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val
565 570 575
Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu
580 585 590
Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp
595 600 605
Ser Glu Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met
610 615 620
Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu
625 630 635 640
Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu
645 650 655
Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys
660 665 670
Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser
675 680 685
Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser
690 695 700
Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu
705 710 715 720
Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly
725 730 735
Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile
740 745 750
Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys
755 760 765
Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu
770 775 780
Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr
785 790 795 800
Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp
805 810 815
Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln
820 825 830
Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln
835 840 845
Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu
850 855 860
Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly
865 870 875 880
Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala
885 890 895
Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn
900 905 910
Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr
915 920 925
Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln
930 935 940
Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp
945 950 955 960
Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro
965 970 975
Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His
980 985 990
Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr
995 1000 1005
Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg
1010 1015 1020
Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp
1025 1030 1035
Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn
1040 1045 1050
Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn
1055 1060 1065
Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn
1070 1075 1080
Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu
1085 1090 1095
Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu
1100 1105 1110
Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
1115 1120 1125
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly
1130 1135 1140
Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile
1145 1150 1155
Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser
1160 1165 1170
Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
1175 1180 1185
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu
1190 1195 1200
Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala
1205 1210 1215
Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys
1220 1225 1230
Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe
1235 1240 1245
Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala
1250 1255 1260
Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro
1265 1270 1275
Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys
1280 1285 1290
Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met
1295 1300 1305
Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu
1310 1315 1320
Thr Asp Thr Met
1325
<210> 124
<211> 1332
<212> PRT
<213> Homo sapiens
<400> 124
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Leu Gln Asp Ile Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln
450 455 460
Cys Leu Phe Ser Ala Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys
465 470 475 480
Ile His Thr Thr Gly Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu
485 490 495
Gln Lys Leu Ala Val Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser
500 505 510
Met Gly Lys Leu Tyr Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys
515 520 525
Asn Lys Ser Val Thr Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala
530 535 540
Arg Cys Trp Asp Asn Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln
545 550 555 560
Ile Ser Gln Ala Val Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr
565 570 575
Val Met Glu Thr Val Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val
580 585 590
Lys His Ala Gln Glu Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg
595 600 605
Gln Ile Thr Val Asp Ser Glu Ala Gln Ile His Thr Val Arg Glu Glu
610 615 620
Thr Met Met Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val
625 630 635 640
Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu
645 650 655
Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe
660 665 670
Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp Ser
675 680 685
Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys Thr
690 695 700
Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys Leu Gln Glu
705 710 715 720
Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn Lys Met Tyr
725 730 735
Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg Arg
740 745 750
Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala Glu
755 760 765
Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala Lys
770 775 780
Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg Gln
785 790 795 800
Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln Gln
805 810 815
Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu
820 825 830
Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys
835 840 845
Arg Leu Glu Glu Gln Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr
850 855 860
Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser
865 870 875 880
Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu
885 890 895
Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn
900 905 910
Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile
915 920 925
Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg
930 935 940
Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His
945 950 955 960
Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr
965 970 975
Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro
980 985 990
Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys
995 1000 1005
Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg
1010 1015 1020
Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys
1025 1030 1035
Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala
1040 1045 1050
Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile
1055 1060 1065
Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu
1070 1075 1080
Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met
1085 1090 1095
Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly
1100 1105 1110
Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys
1115 1120 1125
Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val
1130 1135 1140
Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu
1145 1150 1155
Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala
1160 1165 1170
Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe
1175 1180 1185
Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu
1190 1195 1200
Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val
1205 1210 1215
Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys
1220 1225 1230
Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg
1235 1240 1245
Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe
1250 1255 1260
Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met Val
1265 1270 1275
Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe
1280 1285 1290
Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala
1295 1300 1305
Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu
1310 1315 1320
Gly Asp Asn Met Glu Thr Asp Thr Met
1325 1330
<210> 125
<211> 1325
<212> PRT
<213> Homo sapiens
<400> 125
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu
595 600 605
Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
610 615 620
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu
625 630 635 640
Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn
645 650 655
Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu
660 665 670
Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
675 680 685
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr
690 695 700
Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe
705 710 715 720
Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
725 730 735
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile
740 745 750
Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln
755 760 765
Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu
770 775 780
Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
785 790 795 800
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
805 810 815
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val
820 825 830
Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Leu Glu
835 840 845
Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu
850 855 860
Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu
865 870 875 880
Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg
885 890 895
Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu
900 905 910
Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu
915 920 925
Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala
930 935 940
Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly
945 950 955 960
Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu
965 970 975
Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
980 985 990
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser
995 1000 1005
Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala
1010 1015 1020
Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu
1025 1030 1035
Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys
1040 1045 1050
Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu
1055 1060 1065
Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val
1070 1075 1080
Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn
1085 1090 1095
Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe
1100 1105 1110
Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys
1115 1120 1125
Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys
1130 1135 1140
Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
1145 1150 1155
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile
1160 1165 1170
Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro
1175 1180 1185
Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro
1190 1195 1200
Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
1205 1210 1215
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys
1220 1225 1230
Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr
1235 1240 1245
Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly
1250 1255 1260
His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr
1265 1270 1275
Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys
1280 1285 1290
Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr
1295 1300 1305
Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Asp
1310 1315 1320
Thr Met
1325
<210> 126
<211> 1255
<212> PRT
<213> Homo sapiens
<400> 126
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Ile His
435 440 445
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
450 455 460
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
465 470 475 480
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
485 490 495
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
500 505 510
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
515 520 525
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
530 535 540
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
545 550 555 560
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
565 570 575
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
580 585 590
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
595 600 605
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
610 615 620
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
625 630 635 640
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
645 650 655
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
660 665 670
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Ala Pro Gly Leu Thr Thr
675 680 685
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val
690 695 700
Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu
705 710 715 720
Met Leu Glu Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu
725 730 735
Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln
740 745 750
Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys
755 760 765
Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser
770 775 780
His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu
785 790 795 800
Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys
805 810 815
Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala
820 825 830
His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val
835 840 845
Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr
850 855 860
Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr
865 870 875 880
Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala
885 890 895
Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu
900 905 910
Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn
915 920 925
Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys
930 935 940
Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val
945 950 955 960
Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val
965 970 975
Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr
980 985 990
Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr
995 1000 1005
Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg
1010 1015 1020
Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln
1025 1030 1035
Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser
1040 1045 1050
Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu
1055 1060 1065
Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met
1070 1075 1080
Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala
1085 1090 1095
Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile
1100 1105 1110
Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys
1115 1120 1125
Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met
1130 1135 1140
His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu
1145 1150 1155
Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr
1160 1165 1170
Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val
1175 1180 1185
Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Pro Ala Gln Ile
1190 1195 1200
Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile
1205 1210 1215
Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr
1220 1225 1230
Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu
1235 1240 1245
Pro Ser Pro Pro Asp Thr Met
1250 1255
<210> 127
<211> 1262
<212> PRT
<213> Homo sapiens
<400> 127
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp
450 455 460
Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile
465 470 475 480
Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala
485 490 495
Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu
500 505 510
Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile
515 520 525
Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro
530 535 540
Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln
545 550 555 560
Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp
565 570 575
Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe
580 585 590
Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile
595 600 605
Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu
610 615 620
Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala
625 630 635 640
Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile
645 650 655
Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys
660 665 670
Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Asp
675 680 685
Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val
690 695 700
Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys
705 710 715 720
Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Glu Arg Leu Gln Glu
725 730 735
Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu
740 745 750
Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser
755 760 765
Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala
770 775 780
Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu
785 790 795 800
Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
805 810 815
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg
820 825 830
Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln
835 840 845
His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser
850 855 860
Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys
865 870 875 880
Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu
885 890 895
Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg
900 905 910
Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys
915 920 925
Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp
930 935 940
Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu
945 950 955 960
Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys
965 970 975
Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile
980 985 990
Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His
995 1000 1005
Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser
1010 1015 1020
Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp
1025 1030 1035
Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly
1040 1045 1050
Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala
1055 1060 1065
Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met
1070 1075 1080
Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg
1085 1090 1095
Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile
1100 1105 1110
Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys
1115 1120 1125
His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg
1130 1135 1140
Val Ala Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys
1145 1150 1155
Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val
1160 1165 1170
Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro
1175 1180 1185
Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn
1190 1195 1200
Met Glu Thr Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu
1205 1210 1215
Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn
1220 1225 1230
Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu
1235 1240 1245
His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Asp Thr Met
1250 1255 1260
<210> 128
<211> 1249
<212> PRT
<213> Homo sapiens
<400> 128
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Ser Tyr
435 440 445
Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu
450 455 460
Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp
465 470 475 480
Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp
485 490 495
Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys Lys
500 505 510
Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys Leu Gln
515 520 525
Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn Lys Met
530 535 540
Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys Trp Arg
545 550 555 560
Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr Glu Ala
565 570 575
Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu His Ala
580 585 590
Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly Gln Arg
595 600 605
Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile Ile Gln
610 615 620
Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu Gly Ser
625 630 635 640
Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp Arg Lys
645 650 655
Lys Arg Leu Glu Glu Gln Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu
660 665 670
Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu
675 680 685
Leu Arg Lys Gln Ala Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn
690 695 700
Leu His Ser Ala Asp Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg
705 710 715 720
Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg
725 730 735
Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu
740 745 750
Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly
755 760 765
Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala
770 775 780
Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser
785 790 795 800
Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val
805 810 815
Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro
820 825 830
Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg
835 840 845
Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln
850 855 860
Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu
865 870 875 880
Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys
885 890 895
Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser
900 905 910
Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln
915 920 925
Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp
930 935 940
Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val
945 950 955 960
Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr
965 970 975
Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys
980 985 990
Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala
995 1000 1005
Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu
1010 1015 1020
His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser
1025 1030 1035
Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln
1040 1045 1050
Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp
1055 1060 1065
Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu
1070 1075 1080
His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys
1085 1090 1095
Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser
1100 1105 1110
Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser
1115 1120 1125
Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met Val Glu
1130 1135 1140
Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala
1145 1150 1155
Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
1160 1165 1170
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly
1175 1180 1185
Asp Asn Met Glu Thr Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser
1190 1195 1200
Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu
1205 1210 1215
Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln
1220 1225 1230
His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Asp Thr
1235 1240 1245
Met
<210> 129
<211> 1374
<212> PRT
<213> Homo sapiens
<400> 129
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Leu Leu
435 440 445
Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu
450 455 460
Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys
465 470 475 480
Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys
485 490 495
Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu
500 505 510
Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys
515 520 525
Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val
530 535 540
Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr
545 550 555 560
Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr
565 570 575
Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu
580 585 590
Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ile His
595 600 605
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
610 615 620
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
625 630 635 640
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
645 650 655
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
660 665 670
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
675 680 685
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
690 695 700
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
705 710 715 720
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
725 730 735
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
740 745 750
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
755 760 765
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
770 775 780
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
785 790 795 800
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
805 810 815
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
820 825 830
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Leu Glu Arg Leu Gln Glu
835 840 845
Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu
850 855 860
Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser
865 870 875 880
Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala
885 890 895
Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu
900 905 910
Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu
915 920 925
Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg
930 935 940
Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln
945 950 955 960
His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser
965 970 975
Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys
980 985 990
Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu
995 1000 1005
Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg
1010 1015 1020
Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala
1025 1030 1035
Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln
1040 1045 1050
Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr
1055 1060 1065
Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu
1070 1075 1080
Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr
1085 1090 1095
Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile
1100 1105 1110
Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu
1115 1120 1125
Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg
1130 1135 1140
Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu
1145 1150 1155
Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val
1160 1165 1170
Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala
1175 1180 1185
Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val
1190 1195 1200
Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys
1205 1210 1215
His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly
1220 1225 1230
Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln
1235 1240 1245
Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His
1250 1255 1260
Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp
1265 1270 1275
Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys
1280 1285 1290
Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln
1295 1300 1305
Thr Val Leu Glu Gly Asp Asn Met Glu Thr Pro Ala Gln Ile Leu
1310 1315 1320
Ile Ser Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu
1325 1330 1335
Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp
1340 1345 1350
Arg Leu Lys Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro
1355 1360 1365
Ser Pro Pro Asp Thr Met
1370
<210> 130
<211> 1365
<212> PRT
<213> Homo sapiens
<400> 130
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Ile His
435 440 445
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
450 455 460
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
465 470 475 480
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
485 490 495
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
500 505 510
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
515 520 525
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
530 535 540
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
545 550 555 560
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
565 570 575
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
580 585 590
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
595 600 605
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
610 615 620
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
625 630 635 640
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
645 650 655
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
660 665 670
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Ala Pro Gly Leu Thr Thr
675 680 685
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val
690 695 700
Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu
705 710 715 720
Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala Trp Thr Glu
725 730 735
Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile Lys Ser Gln Arg
740 745 750
Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu Met Ile Ile Lys Gln
755 760 765
Lys Ala Thr Met Gln Asp Leu Glu Gln Arg Arg Pro Gln Leu Glu Glu
770 775 780
Leu Ile Thr Ala Ala Gln Asn Leu Lys Asn Lys Thr Ser Asn Gln Glu
785 790 795 800
Ala Arg Thr Ile Ile Thr Asp Arg Ile Glu Arg Ile Gln Asn Gln Trp
805 810 815
Asp Glu Val Gln Glu His Leu Gln Asn Arg Arg Gln Gln Leu Asn Glu
820 825 830
Met Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp
835 840 845
Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val
850 855 860
Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys
865 870 875 880
Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val
885 890 895
Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro
900 905 910
Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu
915 920 925
Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg
930 935 940
Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly
945 950 955 960
Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn
965 970 975
His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu
980 985 990
Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg
995 1000 1005
Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp
1010 1015 1020
Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn
1025 1030 1035
Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn
1040 1045 1050
Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn
1055 1060 1065
Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu
1070 1075 1080
Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu
1085 1090 1095
Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu
1100 1105 1110
Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly
1115 1120 1125
Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile
1130 1135 1140
Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser
1145 1150 1155
Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn
1160 1165 1170
Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu
1175 1180 1185
Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala
1190 1195 1200
Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys
1205 1210 1215
Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe
1220 1225 1230
Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala
1235 1240 1245
Lys Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro
1250 1255 1260
Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys
1265 1270 1275
Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met
1280 1285 1290
Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu
1295 1300 1305
Thr Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly
1310 1315 1320
Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn
1325 1330 1335
Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys
1340 1345 1350
Gly Leu Ser Pro Leu Pro Ser Pro Pro Asp Thr Met
1355 1360 1365
<210> 131
<211> 1383
<212> PRT
<213> Homo sapiens
<400> 131
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu
450 455 460
Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly
465 470 475 480
Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu
485 490 495
Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His
500 505 510
Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala
515 520 525
Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys
530 535 540
Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys
545 550 555 560
Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser
565 570 575
Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp
580 585 590
Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala
595 600 605
Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys
610 615 620
Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr
625 630 635 640
Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln
645 650 655
Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Ile His Thr Val
660 665 670
Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu Glu Ile
675 680 685
Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln
690 695 700
Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala
705 710 715 720
Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile
725 730 735
Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser
740 745 750
Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys
755 760 765
Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn
770 775 780
Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys
785 790 795 800
Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr
805 810 815
Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu
820 825 830
His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly
835 840 845
Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile
850 855 860
Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu
865 870 875 880
Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp
885 890 895
Arg Lys Lys Arg Leu Glu Glu Gln Leu Glu Arg Leu Gln Glu Leu Gln
900 905 910
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
915 920 925
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
930 935 940
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
945 950 955 960
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
965 970 975
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
980 985 990
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
995 1000 1005
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His
1010 1015 1020
Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser
1025 1030 1035
Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr
1040 1045 1050
Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala
1055 1060 1065
Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys
1070 1075 1080
Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu
1085 1090 1095
Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn
1100 1105 1110
Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr
1115 1120 1125
Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val
1130 1135 1140
Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr
1145 1150 1155
Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr
1160 1165 1170
Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg
1175 1180 1185
Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln
1190 1195 1200
Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg
1205 1210 1215
Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro
1220 1225 1230
Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile
1235 1240 1245
Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser
1250 1255 1260
Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr
1265 1270 1275
Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile
1280 1285 1290
Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile
1295 1300 1305
Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys
1310 1315 1320
Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly
1325 1330 1335
Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg
1340 1345 1350
Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro
1355 1360 1365
Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr Asp Thr Met
1370 1375 1380
<210> 132
<211> 1384
<212> PRT
<213> Homo sapiens
<400> 132
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Ile His
435 440 445
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
450 455 460
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
465 470 475 480
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
485 490 495
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
500 505 510
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
515 520 525
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
530 535 540
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
545 550 555 560
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
565 570 575
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
580 585 590
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
595 600 605
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
610 615 620
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
625 630 635 640
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
645 650 655
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
660 665 670
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Ala Pro Gly Leu Thr Thr
675 680 685
Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro Val
690 695 700
Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser Ser Leu
705 710 715 720
Met Leu Glu Ser Asp Gln Trp Lys Arg Leu His Leu Ser Leu Gln Glu
725 730 735
Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu Ser Arg Gln Ala
740 745 750
Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln Asn Asp Val His
755 760 765
Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser
770 775 780
Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly
785 790 795 800
Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg
805 810 815
Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn
820 825 830
Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys
835 840 845
Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp
850 855 860
Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly Ser Trp
865 870 875 880
Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp His Leu Glu
885 890 895
Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu Lys Glu Asn Val
900 905 910
Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln
915 920 925
Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp
930 935 940
Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg Gln Leu His Glu
945 950 955 960
Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser
965 970 975
Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr
980 985 990
Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met
995 1000 1005
Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe
1010 1015 1020
Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu Gln Lys Ala
1025 1030 1035
Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu
1040 1045 1050
Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile Leu
1055 1060 1065
Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln
1070 1075 1080
Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys
1085 1090 1095
Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg
1100 1105 1110
Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys
1115 1120 1125
Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala
1130 1135 1140
Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu
1145 1150 1155
His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser
1160 1165 1170
Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln
1175 1180 1185
Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp
1190 1195 1200
Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp Leu Pro Val Leu
1205 1210 1215
His Arg Val Ala Ala Ala Glu Thr Ala Lys His Gln Ala Lys Cys
1220 1225 1230
Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser
1235 1240 1245
Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser
1250 1255 1260
Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro Met Val Glu
1265 1270 1275
Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala
1280 1285 1290
Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys
1295 1300 1305
His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly
1310 1315 1320
Asp Asn Met Glu Thr Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser
1325 1330 1335
Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu
1340 1345 1350
Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln
1355 1360 1365
His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Asp Thr
1370 1375 1380
Met
<210> 133
<211> 4152
<212> DNA
<213> Homo sapiens
<400> 133
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatag ggtcctgctg aagtggcagc ggctgaccga ggaacagtgc 1380
ctgtttagcg cctggctgtc cgagaaagag gacgccgtga acaagatcca caccaccggc 1440
ttcaaggacc agaacgagat gctgagcagc ctgcagaaac tggccgtgct gaaggccgac 1500
ctggaaaaga aaaagcagtc catgggcaag ctgtactccc tgaagcagga cctgctgtcc 1560
accctgaaga acaagagcgt gacccagaaa accgaggcct ggctggacaa cttcgcccgg 1620
tgctgggaca acctggtgca gaagctggaa aagtccaccg cccagatctc ccaggccgtg 1680
accacaacac agcccagcct gacccagacc accgtgatgg aaaccgtgac aacagtgacc 1740
acccgggaac agatcctcgt gaagcacgcc caggaagaac tgccccctcc acccccccag 1800
aagaaacggc agatcacagt ggacagtgaa gctcagatcc acaccgtgcg ggaagagaca 1860
atgatggtca tgacagagga catgcccctg gaaatcagct acgtgcccag cacctacctg 1920
accgagatca cccatgtgtc ccaggccctg ctggaagtgg aacagctgct gaacgccccc 1980
gacctgtgcg ccaaggattt cgaggacctg ttcaagcagg aagagagcct gaagaatatc 2040
aaggatagcc tgcagcagag cagcggccgg atcgacatca tccacagcaa gaaaacagcc 2100
gccctgcaga gcgccacccc cgtggaaaga gtgaaactgc aggaagccct gtcccagctg 2160
gacttccagt gggagaaagt gaacaaaatg tacaaggacc ggcagggcag attcgaccgc 2220
agcgtggaaa agtggcggcg gttccactac gacatcaaga tcttcaacca gtggctgaca 2280
gaggccgagc agttcctgag aaagacccag atccccgaga actgggagca cgccaagtac 2340
aagtggtatc tgaaagagct gcaggacggc atcggccaga gacagacagt cgtgcggacc 2400
ctgaatgcca ccggcgagga aatcatccag cagtccagca agaccgacgc cagcattctg 2460
caggaaaagc tgggcagcct gaacctgcgg tggcaggaag tgtgcaagca gctgtccgac 2520
cggaagaagc ggctggaaga acagctggaa cggctgcagg aactgcagga ggccaccgac 2580
gagctggacc tgaaactgag acaggccgaa gtgatcaagg gcagctggca gccagtgggc 2640
gacctgctga tcgactccct gcaggaccat ctggaaaaag tgaaggccct gagaggcgag 2700
atcgcccccc tgaaagaaaa cgtgtcccac gtgaacgacc tggcccggca gctgacaaca 2760
ctgggcattc agctgagccc ctacaacctg agcacactgg aagatctgaa cacccggtgg 2820
aagctgctgc aggtggccgt ggaagataga gtgcggcagc tgcacgaggc ccacagagat 2880
tttggccctg cctcccagca cttcctgagc accagtgtgc agggcccttg ggagagagcc 2940
atctccccta acaaggtgcc ctactacatc aaccacgaga cacagaccac ctgttgggac 3000
caccccaaga tgaccgagct gtaccagagc ctggctgacc tgaacaacgt gcggttcagc 3060
gcctaccgga ccgccatgaa gctgcggaga ctgcagaaag ctctgtgcct ggatctgctg 3120
tccctgtccg ccgcctgtga tgccctggac cagcacaatc tgaagcagaa cgaccagccc 3180
atggatatcc tgcagatcat caactgcctg accaccatct acgaccggct ggaacaggaa 3240
cacaacaatc tcgtgaacgt gcccctgtgc gtggacatgt gcctgaattg gctgctgaat 3300
gtgtacgaca ccggccggac aggccggatc agagtgctgt ccttcaagac cggcatcatc 3360
agcctgtgca aagcccacct ggaagataag taccggtatc tgttcaaaca ggtggcctct 3420
agcaccggct tttgcgacca gagaaggctg ggcctgctgc tgcacgacag catccagatc 3480
cctagacagc tgggcgaagt ggccagcttt ggcggcagca acatcgagcc tagcgtgcgg 3540
agctgcttcc agttcgccaa caacaagccc gagatcgagg ccgccctgtt cctggactgg 3600
atgagactgg aaccccagag catggtgtgg ctgcccgtgc tgcatagagt ggccgctgcc 3660
gagacagcca agcaccaggc caagtgcaac atctgcaaag agtgccccat catcggcttc 3720
cggtacagaa gcctgaagca cttcaactac gatatctgcc agagctgttt cttcagcggc 3780
agggtggcca agggccacaa aatgcactac cccatggtgg aatactgcac ccccaccaca 3840
agcggcgagg atgtgcggga tttcgccaag gtgctgaaaa acaagttccg gaccaagcgg 3900
tacttcgcca aacacccccg gatgggctac ctgcctgtgc agacagtgct ggaaggcgac 3960
aacatggaaa ccgacaccat gtgatgatga tttgggcaga gcgatggagt ccttagtatc 4020
agtcatgaca gatgaagaag gagcagaata aatgttttac aactcctgat tcccgcatgc 4080
ggccagctta tcgataccgt cgaaataaaa gatccttatt ttcattggat ctgtgtgttg 4140
gttttttgtg tg 4152
<210> 134
<211> 4134
<212> DNA
<213> Homo sapiens
<400> 134
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacat ccacaccgtg cgggaagaga caatgatggt catgacagag 1860
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccatgtg 1920
tcccaggccc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggat 1980
ttcgaggacc tgttcaagca ggaagagagc ctgaagaata tcaaggatag cctgcagcag 2040
agcagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gagcgccacc 2100
cccgtggaaa gagtgaaact gcaggaagcc ctgtcccagc tggacttcca gtgggagaaa 2160
gtgaacaaaa tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 2220
cggttccact acgacatcaa gatcttcaac cagtggctga cagaggccga gcagttcctg 2280
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagag 2340
ctgcaggacg gcatcggcca gagacagaca gtcgtgcgga ccctgaatgc caccggcgag 2400
gaaatcatcc agcagtccag caagaccgac gccagcattc tgcaggaaaa gctgggcagc 2460
ctgaacctgc ggtggcagga agtgtgcaag cagctgtccg accggaagaa gcggctggaa 2520
gaacagctgg aacggctgca ggaactgcag gaggccaccg acgagctgga cctgaaactg 2580
agacaggccg aagtgatcaa gggcagctgg cagccagtgg gcgacctgct gatcgactcc 2640
ctgcaggacc atctggaaaa agtgaaggcc ctgagaggcg agatcgcccc cctgaaagaa 2700
aacgtgtccc acgtgaacga cctggcccgg cagctgacaa cactgggcat tcagctgagc 2760
ccctacaacc tgagcacact ggaagatctg aacacccggt ggaagctgct gcaggtggcc 2820
gtggaagata gagtgcggca gctgcacgag gcccacagag attttggccc tgcctcccag 2880
cacttcctga gcaccagtgt gcagggccct tgggagagag ccatctcccc taacaaggtg 2940
ccctactaca tcaaccacga gacacagacc acctgttggg accaccccaa gatgaccgag 3000
ctgtaccaga gcctggctga cctgaacaac gtgcggttca gcgcctaccg gaccgccatg 3060
aagctgcgga gactgcagaa agctctgtgc ctggatctgc tgtccctgtc cgccgcctgt 3120
gatgccctgg accagcacaa tctgaagcag aacgaccagc ccatggatat cctgcagatc 3180
atcaactgcc tgaccaccat ctacgaccgg ctggaacagg aacacaacaa tctcgtgaac 3240
gtgcccctgt gcgtggacat gtgcctgaat tggctgctga atgtgtacga caccggccgg 3300
acaggccgga tcagagtgct gtccttcaag accggcatca tcagcctgtg caaagcccac 3360
ctggaagata agtaccggta tctgttcaaa caggtggcct ctagcaccgg cttttgcgac 3420
cagagaaggc tgggcctgct gctgcacgac agcatccaga tccctagaca gctgggcgaa 3480
gtggccagct ttggcggcag caacatcgag cctagcgtgc ggagctgctt ccagttcgcc 3540
aacaacaagc ccgagatcga ggccgccctg ttcctggact ggatgagact ggaaccccag 3600
agcatggtgt ggctgcccgt gctgcataga gtggccgctg ccgagacagc caagcaccag 3660
gccaagtgca acatctgcaa agagtgcccc atcatcggct tccggtacag aagcctgaag 3720
cacttcaact acgatatctg ccagagctgt ttcttcagcg gcagggtggc caagggccac 3780
aaaatgcact accccatggt ggaatactgc acccccacca caagcggcga ggatgtgcgg 3840
gatttcgcca aggtgctgaa aaacaagttc cggaccaagc ggtacttcgc caaacacccc 3900
cggatgggct acctgcctgt gcagacagtg ctggaaggcg acaacatgga aaccgacacc 3960
atgtgatgat gatttgggca gagcgatgga gtccttagta tcagtcatga cagatgaaga 4020
aggagcagaa taaatgtttt acaactcctg attcccgcat gcggccagct tatcgatacc 4080
gtcgaaataa aagatcctta ttttcattgg atctgtgtgt tggttttttg tgtg 4134
<210> 135
<211> 4145
<212> DNA
<213> Homo sapiens
<400> 135
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacag tgaagctcag atccacaccg tgcgggaaga gacaatgatg 1860
gtcatgacag aggacatgcc cctggaaatc agctacgtgc ccagcaccta cctgaccgag 1920
atcacccatg tgtcccaggc cctgctggaa gtggaacagc tgctgaacgc ccccgacctg 1980
tgcgccaagg atttcgagga cctgttcaag caggaagaga gcctgaagaa tatcaaggat 2040
agcctgcagc agagcagcgg ccggatcgac atcatccaca gcaagaaaac agccgccctg 2100
cagagcgcca cccccgtgga aagagtgaaa ctgcaggaag ccctgtccca gctggacttc 2160
cagtgggaga aagtgaacaa aatgtacaag gaccggcagg gcagattcga ccgcagcgtg 2220
gaaaagtggc ggcggttcca ctacgacatc aagatcttca accagtggct gacagaggcc 2280
gagcagttcc tgagaaagac ccagatcccc gagaactggg agcacgccaa gtacaagtgg 2340
tatctgaaag agctgcagga cggcatcggc cagagacaga cagtcgtgcg gaccctgaat 2400
gccaccggcg aggaaatcat ccagcagtcc agcaagaccg acgccagcat tctgcaggaa 2460
aagctgggca gcctgaacct gcggtggcag gaagtgtgca agcagctgtc cgaccggaag 2520
aagcggctgg aagaacagaa gaacatcctg caggaactgc aggaggccac cgacgagctg 2580
gacctgaaac tgagacaggc cgaagtgatc aagggcagct ggcagccagt gggcgacctg 2640
ctgatcgact ccctgcagga ccatctggaa aaagtgaagg ccctgagagg cgagatcgcc 2700
cccctgaaag aaaacgtgtc ccacgtgaac gacctggccc ggcagctgac aacactgggc 2760
attcagctga gcccctacaa cctgagcaca ctggaagatc tgaacacccg gtggaagctg 2820
ctgcaggtgg ccgtggaaga tagagtgcgg cagctgcacg aggcccacag agattttggc 2880
cctgcctccc agcacttcct gagcaccagt gtgcagggcc cttgggagag agccatctcc 2940
cctaacaagg tgccctacta catcaaccac gagacacaga ccacctgttg ggaccacccc 3000
aagatgaccg agctgtacca gagcctggct gacctgaaca acgtgcggtt cagcgcctac 3060
cggaccgcca tgaagctgcg gagactgcag aaagctctgt gcctggatct gctgtccctg 3120
tccgccgcct gtgatgccct ggaccagcac aatctgaagc agaacgacca gcccatggat 3180
atcctgcaga tcatcaactg cctgaccacc atctacgacc ggctggaaca ggaacacaac 3240
aatctcgtga acgtgcccct gtgcgtggac atgtgcctga attggctgct gaatgtgtac 3300
gacaccggcc ggacaggccg gatcagagtg ctgtccttca agaccggcat catcagcctg 3360
tgcaaagccc acctggaaga taagtaccgg tatctgttca aacaggtggc ctctagcacc 3420
ggcttttgcg accagagaag gctgggcctg ctgctgcacg acagcatcca gatccctaga 3480
cagctgggcg aagtggccag ctttggcggc agcaacatcg agcctagcgt gcggagctgc 3540
ttccagttcg ccaacaacaa gcccgagatc gaggccgccc tgttcctgga ctggatgaga 3600
ctggaacccc agagcatggt gtggctgccc gtgctgcata gagtggccgc tgccgagaca 3660
gccaagcacc aggccaagtg caacatctgc aaagagtgcc ccatcatcgg cttccggtac 3720
agaagcctga agcacttcaa ctacgatatc tgccagagct gtttcttcag cggcagggtg 3780
gccaagggcc acaaaatgca ctaccccatg gtggaatact gcacccccac cacaagcggc 3840
gaggatgtgc gggatttcgc caaggtgctg aaaaacaagt tccggaccaa gcggtacttc 3900
gccaaacacc cccggatggg ctacctgcct gtgcagacag tgctggaagg cgacaacatg 3960
gaaaccacac catgtgatga tgatttgggc agagcgatgg agtccttagt atcagtcatg 4020
acagatgaag aaggagcaga ataaatgttt tacaactcct gattcccgca tgcggccagc 4080
ttatcgatac cgtcgaaata aaagatcctt attttcattg gatctgtgtg ttggtttttt 4140
gtgtg 4145
<210> 136
<211> 4149
<212> DNA
<213> Homo sapiens
<400> 136
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacag tgaagctcag atccacaccg tgcgggaaga gacaatgatg 1860
gtcatgacag aggacatgcc cctggaaatc agctacgtgc ccagcaccta cctgaccgag 1920
atcacccatg tgtcccaggc cctgctggaa gtggaacagc tgctgaacgc ccccgacctg 1980
tgcgccaagg atttcgagga cctgttcaag caggaagaga gcctgaagaa tatcaaggat 2040
agcctgcagc agagcagcgg ccggatcgac atcatccaca gcaagaaaac agccgccctg 2100
cagagcgcca cccccgtgga aagagtgaaa ctgcaggaag ccctgtccca gctggacttc 2160
cagtgggaga aagtgaacaa aatgtacaag gaccggcagg gcagattcga ccgcagcgtg 2220
gaaaagtggc ggcggttcca ctacgacatc aagatcttca accagtggct gacagaggcc 2280
gagcagttcc tgagaaagac ccagatcccc gagaactggg agcacgccaa gtacaagtgg 2340
tatctgaaag agctgcagga cggcatcggc cagagacaga cagtcgtgcg gaccctgaat 2400
gccaccggcg aggaaatcat ccagcagtcc agcaagaccg acgccagcat tctgcaggaa 2460
aagctgggca gcctgaacct gcggtggcag gaagtgtgca agcagctgtc cgaccggaag 2520
aagcggctgg aagaacagaa gctggaacgg ctgcaggaac tgcaggaggc caccgacgag 2580
ctggacctga aactgagaca ggccgaagtg atcaagggca gctggcagcc agtgggcgac 2640
ctgctgatcg actccctgca ggaccatctg gaaaaagtga aggccctgag aggcgagatc 2700
gcccccctga aagaaaacgt gtcccacgtg aacgacctgg cccggcagct gacaacactg 2760
ggcattcagc tgagccccta caacctgagc acactggaag atctgaacac ccggtggaag 2820
ctgctgcagg tggccgtgga agatagagtg cggcagctgc acgaggccca cagagatttt 2880
ggccctgcct cccagcactt cctgagcacc agtgtgcagg gcccttggga gagagccatc 2940
tcccctaaca aggtgcccta ctacatcaac cacgagacac agaccacctg ttgggaccac 3000
cccaagatga ccgagctgta ccagagcctg gctgacctga acaacgtgcg gttcagcgcc 3060
taccggaccg ccatgaagct gcggagactg cagaaagctc tgtgcctgga tctgctgtcc 3120
ctgtccgccg cctgtgatgc cctggaccag cacaatctga agcagaacga ccagcccatg 3180
gatatcctgc agatcatcaa ctgcctgacc accatctacg accggctgga acaggaacac 3240
aacaatctcg tgaacgtgcc cctgtgcgtg gacatgtgcc tgaattggct gctgaatgtg 3300
tacgacaccg gccggacagg ccggatcaga gtgctgtcct tcaagaccgg catcatcagc 3360
ctgtgcaaag cccacctgga agataagtac cggtatctgt tcaaacaggt ggcctctagc 3420
accggctttt gcgaccagag aaggctgggc ctgctgctgc acgacagcat ccagatccct 3480
agacagctgg gcgaagtggc cagctttggc ggcagcaaca tcgagcctag cgtgcggagc 3540
tgcttccagt tcgccaacaa caagcccgag atcgaggccg ccctgttcct ggactggatg 3600
agactggaac cccagagcat ggtgtggctg cccgtgctgc atagagtggc cgctgccgag 3660
acagccaagc accaggccaa gtgcaacatc tgcaaagagt gccccatcat cggcttccgg 3720
tacagaagcc tgaagcactt caactacgat atctgccaga gctgtttctt cagcggcagg 3780
gtggccaagg gccacaaaat gcactacccc atggtggaat actgcacccc caccacaagc 3840
ggcgaggatg tgcgggattt cgccaaggtg ctgaaaaaca agttccggac caagcggtac 3900
ttcgccaaac acccccggat gggctacctg cctgtgcaga cagtgctgga aggcgacaac 3960
atggaaaccg acaccatgtg atgatgattt gggcagagcg atggagtcct tagtatcagt 4020
catgacagat gaagaaggag cagaataaat gttttacaac tcctgattcc cgcatgcggc 4080
cagcttatcg ataccgtcga aataaaagat ccttattttc attggatctg tgtgttggtt 4140
ttttgtgtg 4149
<210> 137
<211> 4155
<212> DNA
<213> Homo sapiens
<400> 137
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacag tgaagctcag atccacaccg tgcgggaaga gacaatgatg 1860
gtcatgacag aggacatgcc cctggaaatc agctacgtgc ccagcaccta cctgaccgag 1920
atcacccatg tgtcccaggc cctgctggaa gtggaacagc tgctgaacgc ccccgacctg 1980
tgcgccaagg atttcgagga cctgttcaag caggaagaga gcctgaagaa tatcaaggat 2040
agcctgcagc agagcagcgg ccggatcgac atcatccaca gcaagaaaac agccgccctg 2100
cagagcgcca cccccgtgga aagagtgaaa ctgcaggaag ccctgtccca gctggacttc 2160
cagtgggaga aagtgaacaa aatgtacaag gaccggcagg gcagattcga ccgcagcgtg 2220
gaaaagtggc ggcggttcca ctacgacatc aagatcttca accagtggct gacagaggcc 2280
gagcagttcc tgagaaagac ccagatcccc gagaactggg agcacgccaa gtacaagtgg 2340
tatctgaaag agctgcagga cggcatcggc cagagacaga cagtcgtgcg gaccctgaat 2400
gccaccggcg aggaaatcat ccagcagtcc agcaagaccg acgccagcat tctgcaggaa 2460
aagctgggca gcctgaacct gcggtggcag gaagtgtgca agcagctgtc cgaccggaag 2520
aagcggctgg aagaacagaa gaacatcctg gaacggctgc aggaactgca ggaggccacc 2580
gacgagctgg acctgaaact gagacaggcc gaagtgatca agggcagctg gcagccagtg 2640
ggcgacctgc tgatcgactc cctgcaggac catctggaaa aagtgaaggc cctgagaggc 2700
gagatcgccc ccctgaaaga aaacgtgtcc cacgtgaacg acctggcccg gcagctgaca 2760
acactgggca ttcagctgag cccctacaac ctgagcacac tggaagatct gaacacccgg 2820
tggaagctgc tgcaggtggc cgtggaagat agagtgcggc agctgcacga ggcccacaga 2880
gattttggcc ctgcctccca gcacttcctg agcaccagtg tgcagggccc ttgggagaga 2940
gccatctccc ctaacaaggt gccctactac atcaaccacg agacacagac cacctgttgg 3000
gaccacccca agatgaccga gctgtaccag agcctggctg acctgaacaa cgtgcggttc 3060
agcgcctacc ggaccgccat gaagctgcgg agactgcaga aagctctgtg cctggatctg 3120
ctgtccctgt ccgccgcctg tgatgccctg gaccagcaca atctgaagca gaacgaccag 3180
cccatggata tcctgcagat catcaactgc ctgaccacca tctacgaccg gctggaacag 3240
gaacacaaca atctcgtgaa cgtgcccctg tgcgtggaca tgtgcctgaa ttggctgctg 3300
aatgtgtacg acaccggccg gacaggccgg atcagagtgc tgtccttcaa gaccggcatc 3360
atcagcctgt gcaaagccca cctggaagat aagtaccggt atctgttcaa acaggtggcc 3420
tctagcaccg gcttttgcga ccagagaagg ctgggcctgc tgctgcacga cagcatccag 3480
atccctagac agctgggcga agtggccagc tttggcggca gcaacatcga gcctagcgtg 3540
cggagctgct tccagttcgc caacaacaag cccgagatcg aggccgccct gttcctggac 3600
tggatgagac tggaacccca gagcatggtg tggctgcccg tgctgcatag agtggccgct 3660
gccgagacag ccaagcacca ggccaagtgc aacatctgca aagagtgccc catcatcggc 3720
ttccggtaca gaagcctgaa gcacttcaac tacgatatct gccagagctg tttcttcagc 3780
ggcagggtgg ccaagggcca caaaatgcac taccccatgg tggaatactg cacccccacc 3840
acaagcggcg aggatgtgcg ggatttcgcc aaggtgctga aaaacaagtt ccggaccaag 3900
cggtacttcg ccaaacaccc ccggatgggc tacctgcctg tgcagacagt gctggaaggc 3960
gacaacatgg aaaccgacac catgtgatga tgatttgggc agagcgatgg agtccttagt 4020
atcagtcatg acagatgaag aaggagcaga ataaatgttt tacaactcct gattcccgca 4080
tgcggccagc ttatcgatac cgtcgaaata aaagatcctt attttcattg gatctgtgtg 4140
ttggtttttt gtgtg 4155
<210> 138
<211> 4152
<212> DNA
<213> Homo sapiens
<400> 138
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatag ggtcctgctg aagtggcagc ggctgaccga ggaacagtgc 1380
ctgtttagcg cctggctgtc cgagaaagag gacgccgtga acaagatcca caccaccggc 1440
ttcaaggacc agaacgagat gctgagcagc ctgcagaaac tggccgtgct gaaggccgac 1500
ctggaaaaga aaaagcagtc catgggcaag ctgtactccc tgaagcagga cctgctgtcc 1560
accctgaaga acaagagcgt gacccagaaa accgaggcct ggctggacaa cttcgcccgg 1620
tgctgggaca acctggtgca gaagctggaa aagtccaccg cccagatctc ccaggccgtg 1680
accacaacac agcccagcct gacccagacc accgtgatgg aaaccgtgac aacagtgacc 1740
acccgggaac agatcctcgt gaagcacgcc caggaagaac tgccccctcc acccccccag 1800
aagaaacggc agatcacagt ggacagtgaa gctcagatcc acaccgtgcg ggaagagaca 1860
atgatggtca tgacagagga catgcccctg gaaatcagct acgtgcccag cacctacctg 1920
accgagatca cccatgtgtc ccaggccctg ctggaagtgg aacagctgct gaacgccccc 1980
gacctgtgcg ccaaggattt cgaggacctg ttcaagcagg aagagagcct gaagaatatc 2040
aaggatagcc tgcagcagag cagcggccgg atcgacatca tccacagcaa gaaaacagcc 2100
gccctgcaga gcgccacccc cgtggaaaga gtgaaactgc aggaagccct gtcccagctg 2160
gacttccagt gggagaaagt gaacaaaatg tacaaggacc ggcagggcag attcgaccgc 2220
agcgtggaaa agtggcggcg gttccactac gacatcaaga tcttcaacca gtggctgaca 2280
gaggccgagc agttcctgag aaagacccag atccccgaga actgggagca cgccaagtac 2340
aagtggtatc tgaaagagct gcaggacggc atcggccaga gacagacagt cgtgcggacc 2400
ctgaatgcca ccggcgagga aatcatccag cagtccagca agaccgacgc cagcattctg 2460
caggaaaagc tgggcagcct gaacctgcgg tggcaggaag tgtgcaagca gctgtccgac 2520
cggaagaagc ggctggaaga acagctggaa cggctgcagg aactgcagga ggccaccgac 2580
gagctggacc tgaaactgag acaggccgaa gtgatcaagg gcagctggca gccagtgggc 2640
gacctgctga tcgactccct gcaggaccat ctggaaaaag tgaaggccct gagaggcgag 2700
atcgcccccc tgaaagaaaa cgtgtcccac gtgaacgacc tggcccggca gctgacaaca 2760
ctgggcattc agctgagccc ctacaacctg agcacactgg aagatctgaa cacccggtgg 2820
aagctgctgc aggtggccgt ggaagataga gtgcggcagc tgcacgaggc ccacagagat 2880
tttggccctg cctcccagca cttcctgagc accagtgtgc agggcccttg ggagagagcc 2940
atctccccta acaaggtgcc ctactacatc aaccacgaga cacagaccac ctgttgggac 3000
caccccaaga tgaccgagct gtaccagagc ctggctgacc tgaacaacgt gcggttcagc 3060
gcctaccgga ccgccatgaa gctgcggaga ctgcagaaag ctctgtgcct ggatctgctg 3120
tccctgtccg ccgcctgtga tgccctggac cagcacaatc tgaagcagaa cgaccagccc 3180
atggatatcc tgcagatcat caactgcctg accaccatct acgaccggct ggaacaggaa 3240
cacaacaatc tcgtgaacgt gcccctgtgc gtggacatgt gcctgaattg gctgctgaat 3300
gtgtacgaca ccggccggac aggccggatc agagtgctgt ccttcaagac cggcatcatc 3360
agcctgtgca aagcccacct ggaagataag taccggtatc tgttcaaaca ggtggcctct 3420
agcaccggct tttgcgacca gagaaggctg ggcctgctgc tgcacgacag catccagatc 3480
cctagacagc tgggcgaagt ggccagcttt ggcggcagca acatcgagcc tagcgtgcgg 3540
agctgcttcc agttcgccaa caacaagccc gagatcgagg ccgccctgtt cctggactgg 3600
atgagactgg aaccccagag catggtgtgg ctgcccgtgc tgcatagagt ggccgctgcc 3660
gagacagcca agcaccaggc caagtgcaac atctgcaaag agtgccccat catcggcttc 3720
cggtacagaa gcctgaagca cttcaactac gatatctgcc agagctgttt cttcagcggc 3780
agggtggcca agggccacaa aatgcactac cccatggtgg aatactgcac ccccaccaca 3840
agcggcgagg atgtgcggga tttcgccaag gtgctgaaaa acaagttccg gaccaagcgg 3900
tacttcgcca aacacccccg gatgggctac ctgcctgtgc agacagtgct ggaaggcgac 3960
aacatggaaa ccgacaccat gtgatgatga tttgggcaga gcgatggagt ccttagtatc 4020
agtcatgaca gatgaagaag gagcagaata aatgttttac aactcctgat tcccgcatgc 4080
ggccagctta tcgataccgt cgaaataaaa gatccttatt ttcattggat ctgtgtgttg 4140
gttttttgtg tg 4152
<210> 139
<211> 4167
<212> DNA
<213> Homo sapiens
<400> 139
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatag agtactgctc caagacatcc tgctgaagtg gcagcggctg 1380
accgaggaac agtgcctgtt tagcgcctgg ctgtccgaga aagaggacgc cgtgaacaag 1440
atccacacca ccggcttcaa ggaccagaac gagatgctga gcagcctgca gaaactggcc 1500
gtgctgaagg ccgacctgga aaagaaaaag cagtccatgg gcaagctgta ctccctgaag 1560
caggacctgc tgtccaccct gaagaacaag agcgtgaccc agaaaaccga ggcctggctg 1620
gacaacttcg cccggtgctg ggacaacctg gtgcagaagc tggaaaagtc caccgcccag 1680
atctcccagg ccgtgaccac aacacagccc agcctgaccc agaccaccgt gatggaaacc 1740
gtgacaacag tgaccacccg ggaacagatc ctcgtgaagc acgcccagga agaactgccc 1800
cctccacccc cccagaagaa acggcagatc acagtggaca gtgaagctca gatccacacc 1860
gtgcgggaag agacaatgat ggtcatgaca gaggacatgc ccctggaaat cagctacgtg 1920
cccagcacct acctgaccga gatcacccat gtgtcccagg ccctgctgga agtggaacag 1980
ctgctgaacg cccccgacct gtgcgccaag gatttcgagg acctgttcaa gcaggaagag 2040
agcctgaaga atatcaagga tagcctgcag cagagcagcg gccggatcga catcatccac 2100
agcaagaaaa cagccgccct gcagagcgcc acccccgtgg aaagagtgaa actgcaggaa 2160
gccctgtccc agctggactt ccagtgggag aaagtgaaca aaatgtacaa ggaccggcag 2220
ggcagattcg accgcagcgt ggaaaagtgg cggcggttcc actacgacat caagatcttc 2280
aaccagtggc tgacagaggc cgagcagttc ctgagaaaga cccagatccc cgagaactgg 2340
gagcacgcca agtacaagtg gtatctgaaa gagctgcagg acggcatcgg ccagagacag 2400
acagtcgtgc ggaccctgaa tgccaccggc gaggaaatca tccagcagtc cagcaagacc 2460
gacgccagca ttctgcagga aaagctgggc agcctgaacc tgcggtggca ggaagtgtgc 2520
aagcagctgt ccgaccggaa gaagcggctg gaagaacagc tggaacggct gcaggaactg 2580
caggaggcca ccgacgagct ggacctgaaa ctgagacagg ccgaagtgat caagggcagc 2640
tggcagccag tgggcgacct gctgatcgac tccctgcagg accatctgga aaaagtgaag 2700
gccctgagag gcgagatcgc ccccctgaaa gaaaacgtgt cccacgtgaa cgacctggcc 2760
cggcagctga caacactggg cattcagctg agcccctaca acctgagcac actggaagat 2820
ctgaacaccc ggtggaagct gctgcaggtg gccgtggaag atagagtgcg gcagctgcac 2880
gaggcccaca gagattttgg ccctgcctcc cagcacttcc tgagcaccag tgtgcagggc 2940
ccttgggaga gagccatctc ccctaacaag gtgccctact acatcaacca cgagacacag 3000
accacctgtt gggaccaccc caagatgacc gagctgtacc agagcctggc tgacctgaac 3060
aacgtgcggt tcagcgccta ccggaccgcc atgaagctgc ggagactgca gaaagctctg 3120
tgcctggatc tgctgtccct gtccgccgcc tgtgatgccc tggaccagca caatctgaag 3180
cagaacgacc agcccatgga tatcctgcag atcatcaact gcctgaccac catctacgac 3240
cggctggaac aggaacacaa caatctcgtg aacgtgcccc tgtgcgtgga catgtgcctg 3300
aattggctgc tgaatgtgta cgacaccggc cggacaggcc ggatcagagt gctgtccttc 3360
aagaccggca tcatcagcct gtgcaaagcc cacctggaag ataagtaccg gtatctgttc 3420
aaacaggtgg cctctagcac cggcttttgc gaccagagaa ggctgggcct gctgctgcac 3480
gacagcatcc agatccctag acagctgggc gaagtggcca gctttggcgg cagcaacatc 3540
gagcctagcg tgcggagctg cttccagttc gccaacaaca agcccgagat cgaggccgcc 3600
ctgttcctgg actggatgag actggaaccc cagagcatgg tgtggctgcc cgtgctgcat 3660
agagtggccg ctgccgagac agccaagcac caggccaagt gcaacatctg caaagagtgc 3720
cccatcatcg gcttccggta cagaagcctg aagcacttca actacgatat ctgccagagc 3780
tgtttcttca gcggcagggt ggccaagggc cacaaaatgc actaccccat ggtggaatac 3840
tgcaccccca ccacaagcgg cgaggatgtg cgggatttcg ccaaggtgct gaaaaacaag 3900
ttccggacca agcggtactt cgccaaacac ccccggatgg gctacctgcc tgtgcagaca 3960
gtgctggaag gcgacaacat ggaaaccgac accatgtgat gatgatttgg gcagagcgat 4020
ggagtcctta gtatcagtca tgacagatga agaaggagca gaataaatgt tttacaactc 4080
ctgattcccg catgcggcca gcttatcgat accgtcgaaa taaaagatcc ttattttcat 4140
tggatctgtg tgttggtttt ttgtgtg 4167
<210> 140
<211> 4146
<212> DNA
<213> Homo sapiens
<400> 140
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacag tgaagctcag atccacaccg tgcgggaaga gacaatgatg 1860
gtcatgacag aggacatgcc cctggaaatc agctacgtgc ccagcaccta cctgaccgag 1920
atcacccatg tgtcccaggc cctgctggaa gtggaacagc tgctgaacgc ccccgacctg 1980
tgcgccaagg atttcgagga cctgttcaag caggaagaga gcctgaagaa tatcaaggat 2040
agcctgcagc agagcagcgg ccggatcgac atcatccaca gcaagaaaac agccgccctg 2100
cagagcgcca cccccgtgga aagagtgaaa ctgcaggaag ccctgtccca gctggacttc 2160
cagtgggaga aagtgaacaa aatgtacaag gaccggcagg gcagattcga ccgcagcgtg 2220
gaaaagtggc ggcggttcca ctacgacatc aagatcttca accagtggct gacagaggcc 2280
gagcagttcc tgagaaagac ccagatcccc gagaactggg agcacgccaa gtacaagtgg 2340
tatctgaaag agctgcagga cggcatcggc cagagacaga cagtcgtgcg gaccctgaat 2400
gccaccggcg aggaaatcat ccagcagtcc agcaagaccg acgccagcat tctgcaggaa 2460
aagctgggca gcctgaacct gcggtggcag gaagtgtgca agcagctgtc cgaccggaag 2520
aagcggctgg aagaacagct ggaacggctg caggaactgc aggaggccac cgacgagctg 2580
gacctgaaac tgagacaggc cgaagtgatc aagggcagct ggcagccagt gggcgacctg 2640
ctgatcgact ccctgcagga ccatctggaa aaagtgaagg ccctgagagg cgagatcgcc 2700
cccctgaaag aaaacgtgtc ccacgtgaac gacctggccc ggcagctgac aacactgggc 2760
attcagctga gcccctacaa cctgagcaca ctggaagatc tgaacacccg gtggaagctg 2820
ctgcaggtgg ccgtggaaga tagagtgcgg cagctgcacg aggcccacag agattttggc 2880
cctgcctccc agcacttcct gagcaccagt gtgcagggcc cttgggagag agccatctcc 2940
cctaacaagg tgccctacta catcaaccac gagacacaga ccacctgttg ggaccacccc 3000
aagatgaccg agctgtacca gagcctggct gacctgaaca acgtgcggtt cagcgcctac 3060
cggaccgcca tgaagctgcg gagactgcag aaagctctgt gcctggatct gctgtccctg 3120
tccgccgcct gtgatgccct ggaccagcac aatctgaagc agaacgacca gcccatggat 3180
atcctgcaga tcatcaactg cctgaccacc atctacgacc ggctggaaca ggaacacaac 3240
aatctcgtga acgtgcccct gtgcgtggac atgtgcctga attggctgct gaatgtgtac 3300
gacaccggcc ggacaggccg gatcagagtg ctgtccttca agaccggcat catcagcctg 3360
tgcaaagccc acctggaaga taagtaccgg tatctgttca aacaggtggc ctctagcacc 3420
ggcttttgcg accagagaag gctgggcctg ctgctgcacg acagcatcca gatccctaga 3480
cagctgggcg aagtggccag ctttggcggc agcaacatcg agcctagcgt gcggagctgc 3540
ttccagttcg ccaacaacaa gcccgagatc gaggccgccc tgttcctgga ctggatgaga 3600
ctggaacccc agagcatggt gtggctgccc gtgctgcata gagtggccgc tgccgagaca 3660
gccaagcacc aggccaagtg caacatctgc aaagagtgcc ccatcatcgg cttccggtac 3720
agaagcctga agcacttcaa ctacgatatc tgccagagct gtttcttcag cggcagggtg 3780
gccaagggcc acaaaatgca ctaccccatg gtggaatact gcacccccac cacaagcggc 3840
gaggatgtgc gggatttcgc caaggtgctg aaaaacaagt tccggaccaa gcggtacttc 3900
gccaaacacc cccggatggg ctacctgcct gtgcagacag tgctggaagg cgacaacatg 3960
gaaaccgaca ccatgtgatg atgatttggg cagagcgatg gagtccttag tatcagtcat 4020
gacagatgaa gaaggagcag aataaatgtt ttacaactcc tgattcccgc atgcggccag 4080
cttatcgata ccgtcgaaat aaaagatcct tattttcatt ggatctgtgt gttggttttt 4140
tgtgtg 4146
<210> 141
<211> 3936
<212> DNA
<213> Homo sapiens
<400> 141
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacat ccacaccgtg cgggaagaga caatgatggt gatgaccgag 1380
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1440
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1500
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1560
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1620
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1680
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1740
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1800
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagaa 1860
ctgcaggatg gcatcggcca gcggcagacc gtggtgcgca cactgaatgc caccggcgag 1920
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggctcc 1980
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gaggctggaa 2040
gaacaggccc ctggcctgac caccatcggc gccagcccta cccagaccgt gaccctggtg 2100
acacagcccg tggtgacaaa agagacagcc atctccaagc tggaaatgcc cagctccctg 2160
atgctggaac tggaaaggct gcaggaactg caggaggcca ccgacgagct ggacctgaag 2220
ctgcggcagg ccgaagtgat caagggcagc tggcagcccg tgggcgacct gctgatcgac 2280
agcctgcagg accacctgga aaaagtgaag gccctgagag gcgagatcgc ccccctgaaa 2340
gaaaacgtgt cccacgtgaa cgacctggcc cggcagctga ccaccctggg catccagctg 2400
agcccctaca acctgagcac cctggaagat ctgaacaccc ggtggaagct gctgcaggtg 2460
gccgtggaag atagagtgcg gcagctgcac gaggcccaca gagactttgg ccctgccagc 2520
cagcacttcc tgagcacctc tgtgcaggga ccctgggaga gagccatcag ccccaacaag 2580
gtgccctact acatcaacca cgagacacag accacctgtt gggaccaccc caagatgacc 2640
gagctgtacc agagcctggc cgacctgaac aatgtgcggt tcagcgccta ccggaccgcc 2700
atgaagctga ggcggctgca gaaagctctg tgcctggatc tgctgagcct gagcgccgcc 2760
tgcgacgccc tggaccagca caacctgaag cagaacgacc agcccatgga tatcctgcag 2820
atcatcaact gcctgaccac aatctacgac aggctggaac aggaacacaa caatctggtc 2880
aacgtgcccc tgtgcgtgga catgtgcctg aattggctgc tgaatgtgta cgacaccggc 2940
cggaccggca gaatccgggt gctgagcttc aagaccggca tcatcagcct gtgcaaggcc 3000
cacctggaag ataagtaccg ctacctgttc aaacaggtgg ccagctccac cggcttttgc 3060
gaccagcgga gactgggcct gctgctgcac gacagcatcc agatccccag acagctgggc 3120
gaggtggcct ccttcggcgg cagcaacatt gagcccagcg tgcggagctg cttccagttc 3180
gccaacaaca agcccgagat cgaggccgcc ctgttcctgg actggatgag actggaaccc 3240
cagagcatgg tgtggctgcc cgtgctgcat cgggtggccg ctgccgagac agccaagcac 3300
caggccaagt gcaacatctg caaagagtgc cccatcatcg gcttccggta cagaagcctg 3360
aagcacttca actacgatat ctgccagagc tgcttcttca gcggcagagt ggccaagggc 3420
cacaaaatgc actaccccat ggtggaatac tgcaccccca ccaccagcgg cgaggatgtg 3480
cgggacttcg ccaaggtgct gaaaaacaag ttccggacca agcggtactt tgccaagcac 3540
ccccggatgg gctacctgcc cgtgcagaca gtgctggaag gcgacaacat ggaaacccct 3600
gcccagatcc tgatcagcct ggaaagcgag gaacggggcg agctggaacg gatcctggcc 3660
gatctggaag aggaaaaccg gaacctgcag gccgagtacg accggctgaa gcagcagcac 3720
gagcacaagg gcctgagccc cctgcctagc ccccctgaca ccatgtgatg atgatttggg 3780
cagagcgatg gagtccttag tatcagtcat gacagatgaa gaaggagcag aataaatgtt 3840
ttacaactcc tgattcccgc atgcggccag cttatcgata ccgtcgaaat aaaagatcct 3900
tattttcatt ggatctgtgt gttggttttt tgtgtg 3936
<210> 142
<211> 3957
<212> DNA
<213> Homo sapiens
<400> 142
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcaccg ggtgctgatc cacaccgtgc gggaagagac aatgatggtg 1380
atgaccgagg acatgcccct ggaaatcagc tacgtgccca gcacctacct gaccgagatc 1440
acccacgtgt cccaggctct gctggaagtg gaacagctgc tgaacgcccc cgacctgtgc 1500
gccaaggact tcgaggatct gttcaagcag gaagagagcc tgaagaatat caaggactcc 1560
ctgcagcagt ccagcggccg gatcgacatc atccacagca agaaaacagc cgccctgcag 1620
tccgccaccc ccgtggaaag agtgaagctg caggaagccc tgagccagct ggacttccag 1680
tgggagaaag tgaacaagat gtacaaggac cggcagggca gattcgaccg cagcgtggaa 1740
aagtggcggc ggttccacta cgacatcaag atcttcaacc agtggctgac cgaggccgag 1800
cagttcctga gaaagaccca gatccccgag aactgggagc acgccaagta caagtggtat 1860
ctgaaagaac tgcaggatgg catcggccag cggcagaccg tggtgcgcac actgaatgcc 1920
accggcgagg aaatcatcca gcagagcagc aagaccgacg ccagcatcct gcaggaaaag 1980
ctgggctccc tgaacctgcg gtggcaggaa gtgtgcaagc agctgagcga ccggaagaag 2040
aggctggaag aacagaagaa cgacctggcc cctggcctga ccaccatcgg cgccagccct 2100
acccagaccg tgaccctggt gacacagccc gtggtgacaa aagagacagc catctccaag 2160
ctggaaatgc ccagctccct gatgctggaa gtggaaaggc tgcaggaact gcaggaggcc 2220
accgacgagc tggacctgaa gctgcggcag gccgaagtga tcaagggcag ctggcagccc 2280
gtgggcgacc tgctgatcga cagcctgcag gaccacctgg aaaaagtgaa ggccctgaga 2340
ggcgagatcg cccccctgaa agaaaacgtg tcccacgtga acgacctggc ccggcagctg 2400
accaccctgg gcatccagct gagcccctac aacctgagca ccctggaaga tctgaacacc 2460
cggtggaagc tgctgcaggt ggccgtggaa gatagagtgc ggcagctgca cgaggcccac 2520
agagactttg gccctgccag ccagcacttc ctgagcacct ctgtgcaggg accctgggag 2580
agagccatca gccccaacaa ggtgccctac tacatcaacc acgagacaca gaccacctgt 2640
tgggaccacc ccaagatgac cgagctgtac cagagcctgg ccgacctgaa caatgtgcgg 2700
ttcagcgcct accggaccgc catgaagctg aggcggctgc agaaagctct gtgcctggat 2760
ctgctgagcc tgagcgccgc ctgcgacgcc ctggaccagc acaacctgaa gcagaacgac 2820
cagcccatgg atatcctgca gatcatcaac tgcctgacca caatctacga caggctggaa 2880
caggaacaca acaatctggt caacgtgccc ctgtgcgtgg acatgtgcct gaattggctg 2940
ctgaatgtgt acgacaccgg ccggaccggc agaatccggg tgctgagctt caagaccggc 3000
atcatcagcc tgtgcaaggc ccacctggaa gataagtacc gctacctgtt caaacaggtg 3060
gccagctcca ccggcttttg cgaccagcgg agactgggcc tgctgctgca cgacagcatc 3120
cagatcccca gacagctggg cgaggtggcc tccttcggcg gcagcaacat tgagcccagc 3180
gtgcggagct gcttccagtt cgccaacaac aagcccgaga tcgaggccgc cctgttcctg 3240
gactggatga gactggaacc ccagagcatg gtgtggctgc ccgtgctgca tcgggtggcc 3300
gctgccgaga cagccaagca ccaggccaag tgcaacatct gcaaagagtg ccccatcatc 3360
ggcttccggt acagaagcct gaagcacttc aactacgata tctgccagag ctgcttcttc 3420
agcggcagag tggccaaggg ccacaaaatg cactacccca tggtggaata ctgcaccccc 3480
accaccagcg gcgaggatgt gcgggacttc gccaaggtgc tgaaaaacaa gttccggacc 3540
aagcggtact ttgccaagca cccccggatg ggctacctgc ccgtgcagac agtgctggaa 3600
ggcgacaaca tggaaacccc tgcccagatc ctgatcagcc tggaaagcga ggaacggggc 3660
gagctggaac ggatcctggc cgatctggaa gaggaaaacc ggaacctgca ggccgagtac 3720
gaccggctga agcagcagca cgagcacaag ggcctgagcc ccctgcctag cccccctgac 3780
accatgtgat gatgatttgg gcagagcgat ggagtcctta gtatcagtca tgacagatga 3840
agaaggagca gaataaatgt tttacaactc ctgattcccg catgcggcca gcttatcgat 3900
accgtcgaaa taaaagatcc ttattttcat tggatctgtg tgttggtttt ttgtgtg 3957
<210> 143
<211> 3918
<212> DNA
<213> Homo sapiens
<400> 143
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1380
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1440
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1500
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1560
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1620
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1680
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1740
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagaa 1800
ctgcaggatg gcatcggcca gcggcagacc gtggtgcgca cactgaatgc caccggcgag 1860
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggctcc 1920
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gaggctggaa 1980
gaacagctgg aaggactgga aaagctgtac caggaaccca gagagctgcc ccccgaggaa 2040
cgggcccaga acgtgacccg gctgctgcgg aaacaggccg aagaggtgaa caccgagtgg 2100
gagaagctga acctgcactc cgccgactgg cagcggaaga tcgacgagac actggaaagg 2160
ctgcaggaac tgcaggaggc caccgacgag ctggacctga agctgcggca ggccgaagtg 2220
atcaagggca gctggcagcc cgtgggcgac ctgctgatcg acagcctgca ggaccacctg 2280
gaaaaagtga aggccctgag aggcgagatc gcccccctga aagaaaacgt gtcccacgtg 2340
aacgacctgg cccggcagct gaccaccctg ggcatccagc tgagccccta caacctgagc 2400
accctggaag atctgaacac ccggtggaag ctgctgcagg tggccgtgga agatagagtg 2460
cggcagctgc acgaggccca cagagacttt ggccctgcca gccagcactt cctgagcacc 2520
tctgtgcagg gaccctggga gagagccatc agccccaaca aggtgcccta ctacatcaac 2580
cacgagacac agaccacctg ttgggaccac cccaagatga ccgagctgta ccagagcctg 2640
gccgacctga acaatgtgcg gttcagcgcc taccggaccg ccatgaagct gaggcggctg 2700
cagaaagctc tgtgcctgga tctgctgagc ctgagcgccg cctgcgacgc cctggaccag 2760
cacaacctga agcagaacga ccagcccatg gatatcctgc agatcatcaa ctgcctgacc 2820
acaatctacg acaggctgga acaggaacac aacaatctgg tcaacgtgcc cctgtgcgtg 2880
gacatgtgcc tgaattggct gctgaatgtg tacgacaccg gccggaccgg cagaatccgg 2940
gtgctgagct tcaagaccgg catcatcagc ctgtgcaagg cccacctgga agataagtac 3000
cgctacctgt tcaaacaggt ggccagctcc accggctttt gcgaccagcg gagactgggc 3060
ctgctgctgc acgacagcat ccagatcccc agacagctgg gcgaggtggc ctccttcggc 3120
ggcagcaaca ttgagcccag cgtgcggagc tgcttccagt tcgccaacaa caagcccgag 3180
atcgaggccg ccctgttcct ggactggatg agactggaac cccagagcat ggtgtggctg 3240
cccgtgctgc atcgggtggc cgctgccgag acagccaagc accaggccaa gtgcaacatc 3300
tgcaaagagt gccccatcat cggcttccgg tacagaagcc tgaagcactt caactacgat 3360
atctgccaga gctgcttctt cagcggcaga gtggccaagg gccacaaaat gcactacccc 3420
atggtggaat actgcacccc caccaccagc ggcgaggatg tgcgggactt cgccaaggtg 3480
ctgaaaaaca agttccggac caagcggtac tttgccaagc acccccggat gggctacctg 3540
cccgtgcaga cagtgctgga aggcgacaac atggaaaccc ctgcccagat cctgatcagc 3600
ctggaaagcg aggaacgggg cgagctggaa cggatcctgg ccgatctgga agaggaaaac 3660
cggaacctgc aggccgagta cgaccggctg aagcagcagc acgagcacaa gggcctgagc 3720
cccctgccta gcccccctga caccatgtga tgatgatttg ggcagagcga tggagtcctt 3780
agtatcagtc atgacagatg aagaaggagc agaataaatg ttttacaact cctgattccc 3840
gcatgcggcc agcttatcga taccgtcgaa ataaaagatc cttattttca ttggatctgt 3900
gtgttggttt tttgtgtg 3918
<210> 144
<211> 4244
<212> DNA
<213> Homo sapiens
<400> 144
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatct gctgaagtgg cagcggctga ccgaggaaca gtgcctgttt 1380
agcgcctggc tgtccgagaa agaggacgcc gtgaacaaga tccacaccac cggcttcaag 1440
gaccagaacg agatgctgag cagcctgcag aaactggccg tgctgaaggc cgacctggaa 1500
aagaaaaagc agtccatggg caagctgtac tccctgaagc aggacctgct gtccaccctg 1560
aagaacaaga gcgtgaccca gaaaaccgag gcctggctgg acaacttcgc ccggtgctgg 1620
gacaacctgg tgcagaagct ggaaaagtcc accgcccaga tctcccaggc cgtgaccaca 1680
acacagccca gcctgaccca gaccaccgtg atggaaaccg tgacaacagt gaccacccgg 1740
gaacagatcc tcgtgaagca cgcccaggaa gaactgcccc ctccaccccc ccagaagaaa 1800
cggcagatca cagtggacat ccacaccgtg cgggaagaga caatgatggt catgacagag 1860
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccatgtg 1920
tcccaggccc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggat 1980
ttcgaggacc tgttcaagca ggaagagagc ctgaagaata tcaaggatag cctgcagcag 2040
agcagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gagcgccacc 2100
cccgtggaaa gagtgaaact gcaggaagcc ctgtcccagc tggacttcca gtgggagaaa 2160
gtgaacaaaa tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 2220
cggttccact acgacatcaa gatcttcaac cagtggctga cagaggccga gcagttcctg 2280
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagag 2340
ctgcaggacg gcatcggcca gagacagaca gtcgtgcgga ccctgaatgc caccggcgag 2400
gaaatcatcc agcagtccag caagaccgac gccagcattc tgcaggaaaa gctgggcagc 2460
ctgaacctgc ggtggcagga agtgtgcaag cagctgtccg accggaagaa gcggctggaa 2520
gaacagctgg aacggctgca ggaactgcag gaggccaccg acgagctgga cctgaaactg 2580
agacaggccg aagtgatcaa gggcagctgg cagccagtgg gcgacctgct gatcgactcc 2640
ctgcaggacc atctggaaaa agtgaaggcc ctgagaggcg agatcgcccc cctgaaagaa 2700
aacgtgtccc acgtgaacga cctggcccgg cagctgacaa cactgggcat tcagctgagc 2760
ccctacaacc tgagcacact ggaagatctg aacacccggt ggaagctgct gcaggtggcc 2820
gtggaagata gagtgcggca gctgcacgag gcccacagag attttggccc tgcctcccag 2880
cacttcctga gcaccagtgt gcagggccct tgggagagag ccatctcccc taacaaggtg 2940
ccctactaca tcaaccacga gacacagacc acctgttggg accaccccaa gatgaccgag 3000
ctgtaccaga gcctggctga cctgaacaac gtgcggttca gcgcctaccg gaccgccatg 3060
aagctgcgga gactgcagaa agctctgtgc ctggatctgc tgtccctgtc cgccgcctgt 3120
gatgccctgg accagcacaa tctgaagcag aacgaccagc ccatggatat cctgcagatc 3180
atcaactgcc tgaccaccat ctacgaccgg ctggaacagg aacacaacaa tctcgtgaac 3240
gtgcccctgt gcgtggacat gtgcctgaat tggctgctga atgtgtacga caccggccgg 3300
acaggccgga tcagagtgct gtccttcaag accggcatca tcagcctgtg caaagcccac 3360
ctggaagata agtaccggta tctgttcaaa caggtggcct ctagcaccgg cttttgcgac 3420
cagagaaggc tgggcctgct gctgcacgac agcatccaga tccctagaca gctgggcgaa 3480
gtggccagct ttggcggcag caacatcgag cctagcgtgc ggagctgctt ccagttcgcc 3540
aacaacaagc ccgagatcga ggccgccctg ttcctggact ggatgagact ggaaccccag 3600
agcatggtgt ggctgcccgt gctgcataga gtggccgctg ccgagacagc caagcaccag 3660
gccaagtgca acatctgcaa agagtgcccc atcatcggct tccggtacag aagcctgaag 3720
cacttcaact acgatatctg ccagagctgt ttcttcagcg gcagggtggc caagggccac 3780
aaaatgcact accccatggt ggaatactgc acccccacca caagcggcga ggatgtgcgg 3840
gatttcgcca aggtgctgaa aaacaagttc cggaccaagc ggtacttcgc caaacacccc 3900
cggatgggct acctgcctgt gcagacagtg ctggaaggcg acaacatgga aacccctgcc 3960
cagatcctga tcagcctgga atccgaggaa cggggcgagc tggaacggat cctggccgat 4020
ctggaagagg aaaaccggaa cctgcaggcc gagtacgacc ggctgaagca gcagcacgag 4080
cacaagggcc tgagccccct gcctagcccc cctgacacca tgtgatgatg atttgggcag 4140
agcgatggag tccttagtat cagtcatgac agatgaagaa ggagcagaat aaatgtttta 4200
caactcctga ttcccgcatg cggccagctt atcgataccg tcga 4244
<210> 145
<211> 4266
<212> DNA
<213> Homo sapiens
<400> 145
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacat ccacaccgtg cgggaagaga caatgatggt gatgaccgag 1380
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1440
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1500
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1560
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1620
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1680
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1740
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1800
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagaa 1860
ctgcaggatg gcatcggcca gcggcagacc gtggtgcgca cactgaatgc caccggcgag 1920
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggctcc 1980
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gaggctggaa 2040
gaacaggccc ctggcctgac caccatcggc gccagcccta cccagaccgt gaccctggtg 2100
acacagcccg tggtgacaaa agagacagcc atctccaagc tggaaatgcc cagctccctg 2160
atgctggaag tacctgctct ggcagatttc aaccgggctt ggacagaact taccgactgg 2220
ctttctctgc ttgatcaagt tataaaatca cagagggtga tggtgggtga ccttgaggat 2280
atcaacgaga tgatcatcaa gcagaaggca acaatgcagg atttggaaca gaggcgtccc 2340
cagttggaag aactcattac cgctgcccaa aatttgaaaa acaagaccag caatcaagag 2400
gctagaacaa tcattacgga tcgaattgaa agaattcaga atcagtggga tgaagtacaa 2460
gaacaccttc agaaccggag gcaacagttg aatgaaatgc tggaaaggct gcaggaactg 2520
caggaggcca ccgacgagct ggacctgaag ctgcggcagg ccgaagtgat caagggcagc 2580
tggcagcccg tgggcgacct gctgatcgac agcctgcagg accacctgga aaaagtgaag 2640
gccctgagag gcgagatcgc ccccctgaaa gaaaacgtgt cccacgtgaa cgacctggcc 2700
cggcagctga ccaccctggg catccagctg agcccctaca acctgagcac cctggaagat 2760
ctgaacaccc ggtggaagct gctgcaggtg gccgtggaag atagagtgcg gcagctgcac 2820
gaggcccaca gagactttgg ccctgccagc cagcacttcc tgagcacctc tgtgcaggga 2880
ccctgggaga gagccatcag ccccaacaag gtgccctact acatcaacca cgagacacag 2940
accacctgtt gggaccaccc caagatgacc gagctgtacc agagcctggc cgacctgaac 3000
aatgtgcggt tcagcgccta ccggaccgcc atgaagctga ggcggctgca gaaagctctg 3060
tgcctggatc tgctgagcct gagcgccgcc tgcgacgccc tggaccagca caacctgaag 3120
cagaacgacc agcccatgga tatcctgcag atcatcaact gcctgaccac aatctacgac 3180
aggctggaac aggaacacaa caatctggtc aacgtgcccc tgtgcgtgga catgtgcctg 3240
aattggctgc tgaatgtgta cgacaccggc cggaccggca gaatccgggt gctgagcttc 3300
aagaccggca tcatcagcct gtgcaaggcc cacctggaag ataagtaccg ctacctgttc 3360
aaacaggtgg ccagctccac cggcttttgc gaccagcgga gactgggcct gctgctgcac 3420
gacagcatcc agatccccag acagctgggc gaggtggcct ccttcggcgg cagcaacatt 3480
gagcccagcg tgcggagctg cttccagttc gccaacaaca agcccgagat cgaggccgcc 3540
ctgttcctgg actggatgag actggaaccc cagagcatgg tgtggctgcc cgtgctgcat 3600
cgggtggccg ctgccgagac agccaagcac caggccaagt gcaacatctg caaagagtgc 3660
cccatcatcg gcttccggta cagaagcctg aagcacttca actacgatat ctgccagagc 3720
tgcttcttca gcggcagagt ggccaagggc cacaaaatgc actaccccat ggtggaatac 3780
tgcaccccca ccaccagcgg cgaggatgtg cgggacttcg ccaaggtgct gaaaaacaag 3840
ttccggacca agcggtactt tgccaagcac ccccggatgg gctacctgcc cgtgcagaca 3900
gtgctggaag gcgacaacat ggaaacccct gcccagatcc tgatcagcct ggaaagcgag 3960
gaacggggcg agctggaacg gatcctggcc gatctggaag aggaaaaccg gaacctgcag 4020
gccgagtacg accggctgaa gcagcagcac gagcacaagg gcctgagccc cctgcctagc 4080
ccccctgaca ccatgtgatg atgatttggg cagagcgatg gagtccttag tatcagtcat 4140
gacagatgaa gaaggagcag aataaatgtt ttacaactcc tgattcccgc atgcggccag 4200
cttatcgata ccgtcgaaat aaaagatcct tattttcatt ggatctgtgt gttggttttt 4260
tgtgtg 4266
<210> 146
<211> 4320
<212> DNA
<213> Homo sapiens
<400> 146
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtcaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggatctgc tggaaggcct gaccggacag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctcgtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360
aagaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag caccagaaac tacccccaag tgaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaat gccctgatcc acagccacag acccgacctg 540
ttcgactgga acagcgtcgt gtgtcagcag agcgccaccc agaggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg accccgagga tgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgcct 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggatagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacattctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgagagtggc cagcatggaa 1320
aagcagagca acctgcaccg ggtgctgatg gatctgcaga accagaagct gaaagagctg 1380
aacgactggc tgaccaagac cgaggaacgg acccggaaga tggaagagga acccctggga 1440
ccagacctgg aagatctgaa aagacaggtg cagcagcaca aagtgctgca ggaagatctg 1500
gaacaggaac aggtgcgcgt gaacagcctg acccacatgg tcgtggtggt ggacgagagc 1560
agcggcgatc atgccacagc cgctctggaa gaacagctga aggtgctggg cgacagatgg 1620
gccaacatct gccggtggac cgaggataga tgggtgctgc tgcaggacat cctgctgaag 1680
tggcagcggc tgacagagga acagtgcctg ttctccgcct ggctgtccga gaaagaggac 1740
gccgtgaaca aaatccacac caccggcttc aaggaccaga acgagatgct gagcagcctg 1800
cagaaactgg ccgtgctgaa ggccgacctg gaaaagaaaa agcagtccat gggcaagctg 1860
tactccctga agcaggacct gctgtccacc ctgaagaaca agagcgtgac ccagaaaacc 1920
gaggcctggc tggacaactt cgcccggtgc tgggacaacc tggtgcagaa gctggaaaag 1980
tccaccgccc agatctccca ggccattcac accgtgcggg aagagacaat gatggtcatg 2040
actgaggaca tgcccctgga aatcagctac gtgccctcca cctacctgac cgagatcacc 2100
catgtgtccc aggccctgct ggaagtggaa cagctgctga acgcccccga tctgtgcgcc 2160
aaggacttcg aggatctgtt caagcaggaa gagagcctga agaatatcaa ggactctctg 2220
cagcagtcca gcggcagaat cgacatcatc cacagcaaga aaacagccgc cctgcagtcc 2280
gccacccccg tggaaagagt gaaactgcag gaagccctgt cccagctgga cttccagtgg 2340
gagaaagtga acaagatgta caaggaccgg cagggcagat tcgaccgcag cgtggaaaag 2400
tggcggcggt tccactacga catcaagatc ttcaaccagt ggctgaccga ggccgaacag 2460
ttcctgagaa agacccagat ccccgagaac tgggagcacg ccaagtacaa gtggtatctg 2520
aaagaactgc aggatggcat cggccagaga cagaccgtcg tgcggacact gaatgccacc 2580
ggcgaggaaa tcatccagca gagcagcaag accgacgcca gcatcctgca ggaaaagctg 2640
ggcagcctga acctgagatg gcaggaagtg tgcaagcagc tgtccgaccg gaagaagcgg 2700
ctggaagaac agctggaacg gctgcaggaa ctgcaggagg ccaccgacga gctggacctg 2760
aaactgagac aggccgaagt gatcaagggc agctggcagc cagtgggcga cctgctgatc 2820
gattctctgc aggaccacct ggaaaaagtg aaggccctga gaggcgagat cgcccccctg 2880
aaagaaaacg tgtcccacgt gaacgacctg gcccggcagc tgacaacact gggcatccag 2940
ctgagcccct acaacctgag cacactggaa gatctgaaca cccggtggaa gctgctgcag 3000
gtggccgtgg aagatagagt gcggcagctg cacgaggccc acagagattt tggccctgcc 3060
tcccagcact tcctgagcac ctcagtgcag ggcccttggg agagagccat ctcccctaac 3120
aaggtgccct actacatcaa ccacgagaca cagaccacct gttgggacca ccccaagatg 3180
accgagctgt accagagcct ggccgacctg aacaatgtgc ggttcagcgc ctaccggacc 3240
gccatgaagc tgcggagact gcagaaagct ctgtgcctgg atctgctgtc cctgagcgcc 3300
gcctgtgatg ccctggacca gcacaatctg aagcagaacg accagcccat ggatatcctg 3360
cagatcatta actgcctgac caccatctac gaccggctgg aacaggaaca caacaacctc 3420
gtgaacgtgc ccctgtgcgt ggacatgtgc ctgaattggc tgctgaatgt gtacgacacc 3480
ggccggacag gccggatcag agtgctgagc ttcaagaccg gcatcatcag cctgtgcaaa 3540
gcccatctgg aagataagta ccgctacctg ttcaaacagg tggccagctc taccggcttc 3600
tgcgatcaga gaaggctggg cctgctgctg catgactcca tccagatccc cagacagctg 3660
ggcgaggtgg cctctttcgg cggcagcaat atcgagccta gcgtgcggag ctgcttccag 3720
ttcgccaaca acaagcccga gatcgaggcc gccctgtttc tggactggat gagactggaa 3780
ccccagagca tggtgtggct gcccgtgctg catagagtgg ccgctgccga gacagccaag 3840
caccaggcca agtgcaatat ctgcaaagag tgccccatca tcggcttccg gtacagaagc 3900
ctgaagcact tcaactacga tatctgccag agctgtttct tcagcggcag ggtggccaag 3960
ggccacaaaa tgcactaccc catggtggaa tactgcaccc ccaccacaag cggagaggat 4020
gtgcgggact tcgccaaggt gctgaaaaac aagttccgga ccaagcggta tttcgccaaa 4080
cacccccgga tgggctacct gcctgtgcag acagtgctgg aaggcgacaa catggaaacc 4140
gacaccatgt gatgatgatt tgggcagagc gatggagtcc ttagtatcag tcatgacaga 4200
tgaagaagga gcagaataaa tgttttacaa ctcctgattc ccgcatgcgg ccagcttatc 4260
gataccgtcg aaataaaaga tccttatttt cattggatct gtgtgttggt tttttgtgtg 4320
<210> 147
<211> 4323
<212> DNA
<213> Homo sapiens
<400> 147
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacat ccacaccgtg cgggaagaga caatgatggt gatgaccgag 1380
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1440
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1500
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1560
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1620
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1680
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1740
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1800
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagaa 1860
ctgcaggatg gcatcggcca gcggcagacc gtggtgcgca cactgaatgc caccggcgag 1920
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggctcc 1980
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gaggctggaa 2040
gaacaggccc ctggcctgac caccatcggc gccagcccta cccagaccgt gaccctggtg 2100
acacagcccg tggtgacaaa agagacagcc atctccaagc tggaaatgcc cagctccctg 2160
atgctggaat ctgaccagtg gaagcgtctg cacctttctc tgcaggaact tctggtgtgg 2220
ctacagctga aagatgatga attaagccgg caggcaccta ttggaggcga ctttccagca 2280
gttcagaagc agaacgatgt acatagggcc ttcaagaggg aattgaaaac taaagaacct 2340
gtaatcatga gtactcttga gactgtacga atatttctga cagagcagcc tttggaagga 2400
ctagagaaac tctaccagga gcccagagag ctgcctcctg aggagagagc ccagaatgtc 2460
actcggcttc tacgaaagca ggctgaggag gtcaatactg agtgggaaaa attgaacctg 2520
cactccgctg actggcagag aaaaatagat gagaccctgg aaaggctgca ggaactgcag 2580
gaggccaccg acgagctgga cctgaagctg cggcaggccg aagtgatcaa gggcagctgg 2640
cagcccgtgg gcgacctgct gatcgacagc ctgcaggacc acctggaaaa agtgaaggcc 2700
ctgagaggcg agatcgcccc cctgaaagaa aacgtgtccc acgtgaacga cctggcccgg 2760
cagctgacca ccctgggcat ccagctgagc ccctacaacc tgagcaccct ggaagatctg 2820
aacacccggt ggaagctgct gcaggtggcc gtggaagata gagtgcggca gctgcacgag 2880
gcccacagag actttggccc tgccagccag cacttcctga gcacctctgt gcagggaccc 2940
tgggagagag ccatcagccc caacaaggtg ccctactaca tcaaccacga gacacagacc 3000
acctgttggg accaccccaa gatgaccgag ctgtaccaga gcctggccga cctgaacaat 3060
gtgcggttca gcgcctaccg gaccgccatg aagctgaggc ggctgcagaa agctctgtgc 3120
ctggatctgc tgagcctgag cgccgcctgc gacgccctgg accagcacaa cctgaagcag 3180
aacgaccagc ccatggatat cctgcagatc atcaactgcc tgaccacaat ctacgacagg 3240
ctggaacagg aacacaacaa tctggtcaac gtgcccctgt gcgtggacat gtgcctgaat 3300
tggctgctga atgtgtacga caccggccgg accggcagaa tccgggtgct gagcttcaag 3360
accggcatca tcagcctgtg caaggcccac ctggaagata agtaccgcta cctgttcaaa 3420
caggtggcca gctccaccgg cttttgcgac cagcggagac tgggcctgct gctgcacgac 3480
agcatccaga tccccagaca gctgggcgag gtggcctcct tcggcggcag caacattgag 3540
cccagcgtgc ggagctgctt ccagttcgcc aacaacaagc ccgagatcga ggccgccctg 3600
ttcctggact ggatgagact ggaaccccag agcatggtgt ggctgcccgt gctgcatcgg 3660
gtggccgctg ccgagacagc caagcaccag gccaagtgca acatctgcaa agagtgcccc 3720
atcatcggct tccggtacag aagcctgaag cacttcaact acgatatctg ccagagctgc 3780
ttcttcagcg gcagagtggc caagggccac aaaatgcact accccatggt ggaatactgc 3840
acccccacca ccagcggcga ggatgtgcgg gacttcgcca aggtgctgaa aaacaagttc 3900
cggaccaagc ggtactttgc caagcacccc cggatgggct acctgcccgt gcagacagtg 3960
ctggaaggcg acaacatgga aacccctgcc cagatcctga tcagcctgga aagcgaggaa 4020
cggggcgagc tggaacggat cctggccgat ctggaagagg aaaaccggaa cctgcaggcc 4080
gagtacgacc ggctgaagca gcagcacgag cacaagggcc tgagccccct gcctagcccc 4140
cctgacacca tgtgatgatg atttgggcag agcgatggag tccttagtat cagtcatgac 4200
agatgaagaa ggagcagaat aaatgtttta caactcctga ttcccgcatg cggccagctt 4260
atcgataccg tcgaaataaa agatccttat tttcattgga tctgtgtgtt ggttttttgt 4320
gtg 4323
<210> 148
<211> 4164
<212> DNA
<213> Homo sapiens
<400> 148
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacat ccacaccgtg cgggaagaga caatgatggt gatgaccgag 1380
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1440
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1500
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1560
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1620
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1680
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1740
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1800
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagag 1860
ctgcaggacg gcatcggcca gcggcagaca gtggtccgca ccctgaatgc caccggcgag 1920
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggcagc 1980
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gcggctggaa 2040
gaacaggccc ctggcctgac cacaatcggc gccagcccta cccagaccgt gaccctggtg 2100
acacagcccg tggtgacaaa agagacagcc atcagcaagc tggaaatgcc cagcagcctg 2160
atgctggaaa gcgaccagtg gaagcggctg cacctgagcc tgcaggaact gctggtctgg 2220
ctgcagctga aggacgacga gctgagcaga caggccccca tcggcggcga tttccccgcc 2280
gtgcagaaac agaacgacgt gcaccgggcc ttcaagcgcg agctgaaaac aaaagaaccc 2340
gtgatcatga gcaccctgga aaccgtgcgg atcttcctga ccgagcagcc cctggaaggc 2400
ctggaaaagc tgtaccagga acccagagag ctgccccccg aggaacgggc ccagaacgtg 2460
accagactgc tgcggaagca ggccgaagag gtcaacaccg agtgggagaa gctgaacctg 2520
cacagcgccg actggcagcg gaagatcgac gagacactgg aacggctgca ggaactgcag 2580
gaggccaccg acgagctgga cctgaagctg agacaggccg aagtgatcaa gggcagctgg 2640
cagcccgtgg gcgacctgct gatcgactcc ctgcaggacc acctggaaaa agtgaaggcc 2700
ctgcggggcg agatcgcccc cctgaaagaa aacgtgtccc acgtgaacga cctggcccgg 2760
cagctgacca ccctgggcat ccagctgagc ccctacaacc tgtccaccct ggaagatctg 2820
aacacccggt ggaagctgct gcaggtggcc gtggaagata gagtgcggca gctgcacgag 2880
gcccacagag actttggccc tgccagccag cacttcctga gcacctctgt gcagggaccc 2940
tgggagagag ccatcagccc caacaaggtg ccctactaca tcaaccacga gacacagacc 3000
acctgttggg accaccccaa gatgaccgag ctgtaccaga gcctggccga cctgaacaat 3060
gtgcggttca gcgcctaccg gaccgccatg aagctgaggc ggctgcagaa agctctgtgc 3120
ctggatctgc tgagcctgag cgccgcctgc gacgccctgg accagcacaa cctgaagcag 3180
aacgaccagc ccatggatat cctgcagatc atcaactgcc tgaccacaat ctacgacagg 3240
ctggaacagg aacacaacaa tctggtcaac gtgcccctgt gcgtggacat gtgcctgaat 3300
tggctgctga atgtgtacga caccggccgg accggcagaa tccgggtgct gagcttcaag 3360
accggcatca tcagcctgtg caaggcccac ctggaagata agtaccgcta cctgttcaaa 3420
caggtggcca gctccaccgg cttttgcgac cagcggagac tgggcctgct gctgcacgac 3480
agcatccaga tccccagaca gctgggcgag gtggcctcct tcggcggcag caacattgag 3540
cccagcgtgc ggagctgctt ccagttcgcc aacaacaagc ccgagatcga ggccgccctg 3600
ttcctggact ggatgagact ggaaccccag agcatggtgt ggctgcccgt gctgcatcgg 3660
gtggccgctg ccgagacagc caagcaccag gccaagtgca acatctgcaa agagtgcccc 3720
atcatcggct tccggtacag aagcctgaag cacttcaact acgatatctg ccagagctgc 3780
ttcttcagcg gcagagtggc caagggccac aaaatgcact accccatggt ggaatactgc 3840
acccccacca ccagcggcga ggatgtgcgg gacttcgcca aggtgctgaa aaacaagttc 3900
cggaccaagc ggtactttgc caagcacccc cggatgggct acctgcccgt gcagacagtg 3960
ctggaaggcg acaacatgga aaccgacacc atgtgatgat gatttgggca gagcgatgga 4020
gtccttagta tcagtcatga cagatgaaga aggagcagaa taaatgtttt acaactcctg 4080
attcccgcat gcggccagct tatcgatacc gtcgaaataa aagatcctta ttttcattgg 4140
atctgtgtgt tggttttttg tgtg 4164
<210> 149
<211> 4076
<212> DNA
<213> Homo sapiens
<400> 149
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggctc agggctacga gcggaccagc agccccaagc cccggttcaa gagctacgcc 900
tacacccagg ccgcctacgt gaccaccagc gaccccacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgtcct ggctgctgag cgccgaggat 1080
acactgcagg cccagggcga gatcagcaac gacgtggaag tggtgaaaga ccagttccac 1140
acccacgagg gctacatgat ggacctgacc gcccaccagg gcagagtggg caacatcctg 1200
cagctgggca gcaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcacat ccacaccgtg cgggaagaga caatgatggt gatgaccgag 1380
gacatgcccc tggaaatcag ctacgtgccc agcacctacc tgaccgagat cacccacgtg 1440
tcccaggctc tgctggaagt ggaacagctg ctgaacgccc ccgacctgtg cgccaaggac 1500
ttcgaggatc tgttcaagca ggaagagagc ctgaagaata tcaaggactc cctgcagcag 1560
tccagcggcc ggatcgacat catccacagc aagaaaacag ccgccctgca gtccgccacc 1620
cccgtggaaa gagtgaagct gcaggaagcc ctgagccagc tggacttcca gtgggagaaa 1680
gtgaacaaga tgtacaagga ccggcagggc agattcgacc gcagcgtgga aaagtggcgg 1740
cggttccact acgacatcaa gatcttcaac cagtggctga ccgaggccga gcagttcctg 1800
agaaagaccc agatccccga gaactgggag cacgccaagt acaagtggta tctgaaagag 1860
ctgcaggacg gcatcggcca gcggcagaca gtggtccgca ccctgaatgc caccggcgag 1920
gaaatcatcc agcagagcag caagaccgac gccagcatcc tgcaggaaaa gctgggcagc 1980
ctgaacctgc ggtggcagga agtgtgcaag cagctgagcg accggaagaa gcggctggaa 2040
gaacaggccc ctggcctgac cacaatcggc gccagcccta cccagaccgt gaccctggtg 2100
acacagcccg tggtgacaaa agagacagcc atcagcaagc tggaaatgcc cagcagcctg 2160
atgctggaaa gcgaccagtg gaagcggctg cacctgagcc tgcaggaact gctggtctgg 2220
ctgcagctga aggacgacga gctgagcaga caggccccca tcggcggcga tttccccgcc 2280
gtgcagaaac agaacgacgt gcaccgggcc ttcaagcgcg agctgaaaac aaaagaaccc 2340
gtgatcatga gcaccctgga aaccgtgcgg atcttcctga ccgagcagcc cctggaaggc 2400
ctggaaaagc tgtaccagga acccagagag ctgccccccg aggaacgggc ccagaacgtg 2460
accagactgc tgcggaagca ggccgaagag gtcaacaccg agtgggagaa gctgaacctg 2520
cacagcgccg actggcagcg gaagatcgac gagacactgg aacggctgca ggaactgcag 2580
gaggccaccg acgagctgga cctgaagctg agacaggccg aagtgatcaa gggcagctgg 2640
cagcccgtgg gcgacctgct gatcgactcc ctgcaggacc acctggaaaa agtgaaggcc 2700
ctgcggggcg agatcgcccc cctgaaagaa aacgtgtccc acgtgaacga cctggcccgg 2760
cagctgacca ccctgggcat ccagctgagc ccctacaacc tgtccaccct ggaagatctg 2820
aacacccggt ggaagctgct gcaggtggcc gtggaagata gagtgcggca gctgcacgag 2880
gcccacagag actttggccc tgccagccag cacttcctga gcacctctgt gcagggaccc 2940
tgggagagag ccatcagccc caacaaggtg ccctactaca tcaaccacga gacacagacc 3000
acctgttggg accaccccaa gatgaccgag ctgtaccaga gcctggccga cctgaacaat 3060
gtgcggttca gcgcctaccg gaccgccatg aagctgaggc ggctgcagaa agctctgtgc 3120
ctggatctgc tgagcctgag cgccgcctgc gacgccctgg accagcacaa cctgaagcag 3180
aacgaccagc ccatggatat cctgcagatc atcaactgcc tgaccacaat ctacgacagg 3240
ctggaacagg aacacaacaa tctggtcaac gtgcccctgt gcgtggacat gtgcctgaat 3300
tggctgctga atgtgtacga caccggccgg accggcagaa tccgggtgct gagcttcaag 3360
accggcatca tcagcctgtg caaggcccac ctggaagata agtaccgcta cctgttcaaa 3420
caggtggcca gctccaccgg cttttgcgac cagcggagac tgggcctgct gctgcacgac 3480
agcatccaga tccccagaca gctgggcgag gtggcctcct tcggcggcag caacattgag 3540
cccagcgtgc ggagctgctt ccagttcgcc aacaacaagc ccgagatcga ggccgccctg 3600
ttcctggact ggatgagact ggaaccccag agcatggtgt ggctgcccgt gctgcatcgg 3660
gtggccgctg ccgagacagc caagcaccag gccaagtgca acatctgcaa agagtgcccc 3720
atcatcggct tccggtacag aagcctgaag cacttcaact acgatatctg ccagagctgc 3780
ttcttcagcg gcagagtggc caagggccac aaaatgcact accccatggt ggaatactgc 3840
acccccacca ccagcggcga ggatgtgcgg gacttcgcca aggtgctgaa aaacaagttc 3900
cggaccaagc ggtactttgc caagcacccc cggatgggct acctgcccgt gcagacagtg 3960
ctggaaggcg acaacatgga aaccgacacc atgtgatgat gagaagtctt ttccacatgg 4020
cagatgaaat aaaagatcct tattttcatt ggatctgtgt gttggttttt tgtgtg 4076
<210> 150
<211> 10
<212> DNA
<213> Homo sapiens
<400> 150
gccrccaugg 10
<210> 151
<211> 10
<212> DNA
<213> Homo sapiens
<400> 151
gccaccatgg 10
<210> 152
<211> 1332
<212> PRT
<213> Homo sapiens
<400> 152
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Ile His
435 440 445
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
450 455 460
Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val
465 470 475 480
Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu
485 490 495
Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys
500 505 510
Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile
515 520 525
His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg
530 535 540
Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys
545 550 555 560
Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val
565 570 575
Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp
580 585 590
Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn
595 600 605
Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly
610 615 620
Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu
625 630 635 640
Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu
645 650 655
Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu
660 665 670
Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Lys Asn Asp Leu Ala Pro
675 680 685
Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val
690 695 700
Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met
705 710 715 720
Pro Ser Ser Leu Met Leu Glu Ser Asp Gln Trp Lys Arg Leu His Leu
725 730 735
Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu Lys Asp Asp Glu Leu
740 745 750
Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe Pro Ala Val Gln Lys Gln
755 760 765
Asn Asp Val His Arg Ala Phe Lys Arg Glu Leu Lys Thr Lys Glu Pro
770 775 780
Val Ile Met Ser Thr Leu Glu Thr Val Arg Ile Phe Leu Thr Glu Gln
785 790 795 800
Pro Leu Glu Gly Leu Glu Lys Leu Tyr Gln Glu Pro Arg Glu Leu Pro
805 810 815
Pro Glu Glu Arg Ala Gln Asn Val Thr Arg Leu Leu Arg Lys Gln Ala
820 825 830
Glu Glu Val Asn Thr Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp
835 840 845
Trp Gln Arg Lys Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln
850 855 860
Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile
865 870 875 880
Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln
885 890 895
Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu
900 905 910
Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr Thr
915 920 925
Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp Leu
930 935 940
Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val Arg
945 950 955 960
Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe
965 970 975
Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn
980 985 990
Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp
995 1000 1005
His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn
1010 1015 1020
Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg
1025 1030 1035
Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala
1040 1045 1050
Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro
1055 1060 1065
Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp
1070 1075 1080
Arg Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys
1085 1090 1095
Val Asp Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly
1100 1105 1110
Arg Thr Gly Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile
1115 1120 1125
Ser Leu Cys Lys Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe
1130 1135 1140
Lys Gln Val Ala Ser Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu
1145 1150 1155
Gly Leu Leu Leu His Asp Ser Ile Gln Ile Pro Arg Gln Leu Gly
1160 1165 1170
Glu Val Ala Ser Phe Gly Gly Ser Asn Ile Glu Pro Ser Val Arg
1175 1180 1185
Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu Ile Glu Ala Ala
1190 1195 1200
Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser Met Val Trp
1205 1210 1215
Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala Lys His
1220 1225 1230
Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly Phe
1235 1240 1245
Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser
1250 1255 1260
Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr
1265 1270 1275
Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val
1280 1285 1290
Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg
1295 1300 1305
Tyr Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr
1310 1315 1320
Val Leu Glu Gly Asp Asn Met Glu Thr
1325 1330
<210> 153
<211> 1322
<212> PRT
<213> Homo sapiens
<400> 153
Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val
1 5 10 15
Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe
20 25 30
Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg
35 40 45
Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys
50 55 60
Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala
65 70 75 80
Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser
85 90 95
Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp
100 105 110
Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met
115 120 125
Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val
130 135 140
Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr
145 150 155 160
Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His
165 170 175
Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala
180 185 190
Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly
195 200 205
Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp
210 215 220
Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro
225 230 235 240
Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg
245 250 255
Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met
260 265 270
His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg
275 280 285
Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala
290 295 300
Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln
305 310 315 320
His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu
325 330 335
Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu
340 345 350
Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile
355 360 365
Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly
370 375 380
Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu
385 390 395 400
Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu
405 410 415
Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu
420 425 430
Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val
435 440 445
Leu Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala
450 455 460
Trp Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly
465 470 475 480
Phe Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val
485 490 495
Leu Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr
500 505 510
Ser Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr
515 520 525
Gln Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn
530 535 540
Leu Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val
545 550 555 560
Thr Thr Thr Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val
565 570 575
Thr Thr Val Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu
580 585 590
Glu Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp
595 600 605
Ser Glu Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu
610 615 620
Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu
625 630 635 640
Ile Thr His Val Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn
645 650 655
Ala Pro Asp Leu Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu
660 665 670
Glu Ser Leu Lys Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg
675 680 685
Ile Asp Ile Ile His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr
690 695 700
Pro Val Glu Arg Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe
705 710 715 720
Gln Trp Glu Lys Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe
725 730 735
Asp Arg Ser Val Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile
740 745 750
Phe Asn Gln Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln
755 760 765
Ile Pro Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu
770 775 780
Leu Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn
785 790 795 800
Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser
805 810 815
Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val
820 825 830
Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu Gln Leu Glu
835 840 845
Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu
850 855 860
Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu
865 870 875 880
Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg
885 890 895
Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu
900 905 910
Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu
915 920 925
Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala
930 935 940
Val Glu Asp Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly
945 950 955 960
Pro Ala Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu
965 970 975
Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr
980 985 990
Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser
995 1000 1005
Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala
1010 1015 1020
Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu
1025 1030 1035
Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys
1040 1045 1050
Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys Leu
1055 1060 1065
Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu Val
1070 1075 1080
Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu Asn
1085 1090 1095
Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser Phe
1100 1105 1110
Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp Lys
1115 1120 1125
Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe Cys
1130 1135 1140
Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln Ile
1145 1150 1155
Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile
1160 1165 1170
Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro
1175 1180 1185
Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro
1190 1195 1200
Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala
1205 1210 1215
Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys
1220 1225 1230
Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr
1235 1240 1245
Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly
1250 1255 1260
His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr
1265 1270 1275
Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn Lys
1280 1285 1290
Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly Tyr
1295 1300 1305
Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr
1310 1315 1320
<210> 154
<211> 4043
<212> DNA
<213> Homo sapiens
<400> 154
atgctgtggt gggaggaagt ggaagattgc tacgagcgcg aggacgtgca gaagaaaacc 60
ttcaccaaat gggtgaacgc ccagttcagc aagttcggca agcagcacat cgagaacctg 120
ttcagcgacc tgcaggacgg cagacggctg ctggacctgc tggaaggcct gaccggccag 180
aagctgccca aagagaaggg cagcaccaga gtgcacgccc tgaacaacgt gaacaaggcc 240
ctgcgggtgc tgcagaacaa caacgtggac ctggtgaaca tcggcagcac cgacatcgtg 300
gacggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaggtc 360
aaaaacgtga tgaagaacat catggccggc ctgcagcaga ccaacagcga gaagatcctg 420
ctgagctggg tgcgccagag cacccggaac tacccccagg tcaacgtgat caacttcacc 480
acctcttgga gcgacggcct ggccctgaac gccctgatcc acagccaccg gcccgacctg 540
ttcgactgga acagcgtggt ctgccagcag agcgccaccc agcggctgga acacgccttc 600
aatatcgcca gataccagct gggcatcgag aagctgctgg atcccgagga cgtggacacc 660
acctaccccg acaagaaatc catcctgatg tatatcacca gcctgttcca ggtgctgccc 720
cagcaggtgt ccatcgaggc catccaggaa gtggaaatgc tgcccagacc ccccaaagtg 780
accaaagagg aacacttcca gctgcaccac cagatgcact acagccagca gatcaccgtg 840
tccctggccc agggctacga gagaaccagc agccccaagc cccggttcaa gagctacgcc 900
tatacccagg ccgcctacgt gaccaccagc gaccctacca gaagcccatt ccccagccag 960
catctggaag cccccgagga caagagcttc ggcagcagcc tgatggaaag cgaagtgaac 1020
ctggacagat accagaccgc cctggaagag gtgctgagct ggctgctgag cgccgaggat 1080
acactgcagg ctcagggcga gatcagcaac gacgtggaag tcgtgaagga ccagttccac 1140
acccacgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg caacatcctg 1200
cagctgggct ccaagctgat cggcaccggc aagctgagcg aggacgaaga gacagaggtg 1260
caggaacaga tgaacctgct gaacagcaga tgggagtgcc tgcgggtggc cagcatggaa 1320
aagcagagca acctgcatag ggtcctgctg aagtggcagc ggctgaccga ggaacagtgc 1380
ctgtttagcg cctggctgtc cgagaaagag gacgccgtga acaagatcca caccaccggc 1440
ttcaaggacc agaacgagat gctgagcagc ctgcagaaac tggccgtgct gaaggccgac 1500
ctggaaaaga aaaagcagtc catgggcaag ctgtactccc tgaagcagga cctgctgtcc 1560
accctgaaga acaagagcgt gacccagaaa accgaggcct ggctggacaa cttcgcccgg 1620
tgctgggaca acctggtgca gaagctggaa aagtccaccg cccagatctc ccaggccgtg 1680
accacaacac agcccagcct gacccagacc accgtgatgg aaaccgtgac aacagtgacc 1740
acccgggaac agatcctcgt gaagcacgcc caggaagaac tgccccctcc acccccccag 1800
aagaaacggc agatcacagt ggacagtgaa atccacaccg tgcgggaaga gacaatgatg 1860
gtcatgacag aggacatgcc cctggaaatc agctacgtgc ccagcaccta cctgaccgag 1920
atcacccatg tgtcccaggc cctgctggaa gtggaacagc tgctgaacgc ccccgacctg 1980
tgcgccaagg atttcgagga cctgttcaag caggaagaga gcctgaagaa tatcaaggat 2040
agcctgcagc agagcagcgg ccggatcgac atcatccaca gcaagaaaac agccgccctg 2100
cagagcgcca cccccgtgga aagagtgaaa ctgcaggaag ccctgtccca gctggacttc 2160
cagtgggaga aagtgaacaa aatgtacaag gaccggcagg gcagattcga ccgcagcgtg 2220
gaaaagtggc ggcggttcca ctacgacatc aagatcttca accagtggct gacagaggcc 2280
gagcagttcc tgagaaagac ccagatcccc gagaactggg agcacgccaa gtacaagtgg 2340
tatctgaaag agctgcagga cggcatcggc cagagacaga cagtcgtgcg gaccctgaat 2400
gccaccggcg aggaaatcat ccagcagtcc agcaagaccg acgccagcat tctgcaggaa 2460
aagctgggca gcctgaacct gcggtggcag gaagtgtgca agcagctgtc cgaccggaag 2520
aagcggctgg aagaacagct ggaacggctg caggaactgc aggaggccac cgacgagctg 2580
gacctgaaac tgagacaggc cgaagtgatc aagggcagct ggcagccagt gggcgacctg 2640
ctgatcgact ccctgcagga ccatctggaa aaagtgaagg ccctgagagg cgagatcgcc 2700
cccctgaaag aaaacgtgtc ccacgtgaac gacctggccc ggcagctgac aacactgggc 2760
attcagctga gcccctacaa cctgagcaca ctggaagatc tgaacacccg gtggaagctg 2820
ctgcaggtgg ccgtggaaga tagagtgcgg cagctgcacg aggcccacag agattttggc 2880
cctgcctccc agcacttcct gagcaccagt gtgcagggcc cttgggagag agccatctcc 2940
cctaacaagg tgccctacta catcaaccac gagacacaga ccacctgttg ggaccacccc 3000
aagatgaccg agctgtacca gagcctggct gacctgaaca acgtgcggtt cagcgcctac 3060
cggaccgcca tgaagctgcg gagactgcag aaagctctgt gcctggatct gctgtccctg 3120
tccgccgcct gtgatgccct ggaccagcac aatctgaagc agaacgacca gcccatggat 3180
atcctgcaga tcatcaactg cctgaccacc atctacgacc ggctggaaca ggaacacaac 3240
aatctcgtga acgtgcccct gtgcgtggac atgtgcctga attggctgct gaatgtgtac 3300
gacaccggcc ggacaggccg gatcagagtg ctgtccttca agaccggcat catcagcctg 3360
tgcaaagccc acctggaaga taagtaccgg tatctgttca aacaggtggc ctctagcacc 3420
ggcttttgcg accagagaag gctgggcctg ctgctgcacg acagcatcca gatccctaga 3480
cagctgggcg aagtggccag ctttggcggc agcaacatcg agcctagcgt gcggagctgc 3540
ttccagttcg ccaacaacaa gcccgagatc gaggccgccc tgttcctgga ctggatgaga 3600
ctggaacccc agagcatggt gtggctgccc gtgctgcata gagtggccgc tgccgagaca 3660
gccaagcacc aggccaagtg caacatctgc aaagagtgcc ccatcatcgg cttccggtac 3720
agaagcctga agcacttcaa ctacgatatc tgccagagct gtttcttcag cggcagggtg 3780
gccaagggcc acaaaatgca ctaccccatg gtggaatact gcacccccac cacaagcggc 3840
gaggatgtgc gggatttcgc caaggtgctg aaaaacaagt tccggaccaa gcggtacttc 3900
gccaaacacc cccggatggg ctacctgcct gtgcagacag tgctggaagg cgacaacatg 3960
gaaacctgag aagtcttttc cacatggcag atgaaataaa agatccttat tttcattgga 4020
tctgtgtgtt ggttttttgt gtg 4043
<210> 155
<211> 35
<212> PRT
<213> Homo sapiens
<400> 155
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ile
1 5 10 15
His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro
20 25 30
Leu Glu Ile
35
<210> 156
<211> 36
<212> PRT
<213> Homo sapiens
<400> 156
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser
1 5 10 15
Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met
20 25 30
Pro Leu Glu Ile
35
<210> 157
<211> 37
<212> PRT
<213> Homo sapiens
<400> 157
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser
1 5 10 15
Glu Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp
20 25 30
Met Pro Leu Glu Ile
35
<210> 158
<211> 36
<212> PRT
<213> Homo sapiens
<400> 158
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Gln
1 5 10 15
Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met
20 25 30
Pro Leu Glu Ile
35
<210> 159
<211> 37
<212> PRT
<213> Homo sapiens
<400> 159
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ala
1 5 10 15
Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp
20 25 30
Met Pro Leu Glu Ile
35
<210> 160
<211> 34
<212> PRT
<213> Homo sapiens
<400> 160
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Ile His
1 5 10 15
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
20 25 30
Glu Ile
<210> 161
<211> 34
<212> PRT
<213> Homo sapiens
<400> 161
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp His
1 5 10 15
Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu
20 25 30
Glu Ile
<210> 162
<211> 33
<212> PRT
<213> Homo sapiens
<400> 162
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val His Thr
1 5 10 15
Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro Leu Glu
20 25 30
Ile
<210> 163
<211> 37
<212> PRT
<213> Homo sapiens
<400> 163
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser
1 5 10 15
Gln Ile His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp
20 25 30
Met Pro Leu Glu Ile
35
<210> 164
<211> 35
<212> PRT
<213> Homo sapiens
<400> 164
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser
1 5 10 15
His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro
20 25 30
Leu Glu Ile
35
<210> 165
<211> 35
<212> PRT
<213> Homo sapiens
<400> 165
Leu Pro Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Gln Ile
1 5 10 15
His Thr Val Arg Glu Glu Thr Met Met Val Met Thr Glu Asp Met Pro
20 25 30
Leu Glu Ile
35
<210> 166
<211> 24
<212> PRT
<213> Homo sapiens
<400> 166
Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ala Gln Ile His Thr
1 5 10 15
Val Arg Glu Glu Thr Met Met Val
20
Claims (118)
- 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자이며, 여기서 소형화 디스트로핀 폴리펩티드는 디스트로핀의 스펙트린 반복부 2를 포함하지 않는 것인 핵산 분자.
- 제1항에 있어서, 소형화 디스트로핀 폴리펩티드가 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인, 스펙트린 반복부 22 (R22) 도메인 또는 스펙트린 반복부 23 (R23) 도메인 또는 그의 임의의 조합을 포함하지 않는 것인 핵산 분자.
- 제1항 또는 제2항에 있어서, R1 도메인이 펩티드 결합에 의해 R3 도메인에 직접 융합된 것인 핵산 분자.
- 제1항 또는 제2항에 있어서, R1 도메인 및 R3 도메인이 아미노산 ARG-VAL (RV)에 의해 융합된 것인 핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 있어서, H2 도메인 및 R16 도메인이 링커에 의해 융합된 것인 핵산 분자.
- 제5항에 있어서, 링커가 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하며, 여기서 아미노산 서열은 nNOS 신호전달을 개선시킬 수 있는 것인 핵산 분자.
- 서열식별번호: 75 (IHTVREE TMMVMTEDMP LEI)를 포함하는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자이며, 여기서 핵산 분자는 서열식별번호: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATC)에 대해 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일하고, 여기서 아미노산 서열은 nNOS 신호전달을 개선시킬 수 있는 것인 핵산 분자.
- 제7항에 있어서, 아미노산 서열이 디스트로핀의 제1 도메인을 디스트로핀의 제2 도메인에 연결하는 링커인 핵산 분자.
- 제8항에 있어서, 디스트로핀의 제1 도메인이 H2 도메인이고, 디스트로핀의 제2 도메인이 R16 도메인인 핵산 분자.
- 제6항 내지 제9항 중 어느 한 항에 있어서, 아미노산 서열이 N 말단에 서열식별번호: 74의 서열을 추가로 포함하는 것인 핵산 분자.
- 제7항 내지 제10항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드를 코딩하는 핵산 분자.
- 제11항에 있어서, 소형화 디스트로핀 폴리펩티드가 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 3 (R3) 도메인, 힌지 2 (H2) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하는 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 중 어느 한 항에 있어서, R1 도메인 및 R3 도메인이 아미노산 ARG-VAL (RV)에 의해 융합되고, H2 도메인 및 R16 도메인이 서열식별번호: 74-75의 조합에 제시된 아미노산 서열에 의해 융합된 것인 핵산 분자.
- 제1항 내지 제6항, 제12항 및 제13항 중 어느 한 항에 있어서, (i) H1 도메인 및 R1 도메인이 직접 융합되거나, (ii) R3 도메인 및 H2 도메인이 직접 융합되거나, (iii) R16 및 R17 도메인이 직접 융합되거나, (iv) R17 및 R24 도메인이 직접 융합되거나, 또는 (v) R24 및 H4 도메인이 직접 융합되거나, 또는 (vi) 그의 임의의 조합인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제14항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 ABD1 도메인 및/또는 CR 도메인을 추가로 포함하는 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제15항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 아미노산 RV, R3 도메인, H2 도메인, 서열식별번호: 74-75에 제시된 바와 같은 아미노산 서열, R16 도메인, R17 도메인, R24 도메인, H4 도메인 및 CR 도메인으로 본질적으로 이루어지거나 또는 이로 이루어진 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제16항 중 어느 한 항에 있어서, H1 도메인이 서열식별번호: 69에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제17항 중 어느 한 항에 있어서, R1 도메인이 서열식별번호: 70에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제18항 중 어느 한 항에 있어서, R3 도메인이 서열식별번호: 72에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제19항 중 어느 한 항에 있어서, H2 도메인이 서열식별번호: 73에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제20항 중 어느 한 항에 있어서, R16 도메인이 서열식별번호: 76에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제21항 중 어느 한 항에 있어서, R17 도메인이 서열식별번호: 77에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제22항 중 어느 한 항에 있어서, R24 도메인이 서열식별번호: 78에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제23항 중 어느 한 항에 있어서, H4 도메인이 서열식별번호: 79에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제24항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 68에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 N 말단에 추가로 포함하는 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제25항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 80에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 C 말단에 추가로 포함하는 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제26항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 118에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하는 것인 핵산 분자.
- 제27항에 있어서, 뉴클레오티드 서열이 서열식별번호: 133의 뉴클레오티드 서열에 대해 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열을 포함하는 것인 핵산 분자.
- 제1항 내지 제6항 및 제12항 내지 제28항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 (i) BXA-027741과 비교하여 더 낮은 CD4 증식을 갖는 것, (ii) BXA-027741과 비교하여 더 낮은 CD8 증식을 갖는 것, (iii) BXA-027741보다 더 높은 소형화 디스트로핀 폴리펩티드의 발현을 갖는 것, 및 (iv) 그의 임의의 조합으로 이루어진 군으로부터 선택된 1개 이상의 특성을 나타내는 것인 핵산 분자.
- 스펙트린 반복부 1 (R1) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 디스트로핀의 N 말단에서 C 말단으로 힌지 1 (H1) 도메인, 스펙트린 반복부 1 (R1) 도메인, 스펙트린 반복부 16 (R16) 도메인, 스펙트린 반복부 17 (R17) 도메인, 힌지 3 (H3) 도메인, 스펙트린 반복부 23 (R23) 도메인, 스펙트린 반복부 24 (R24) 도메인 및 힌지 4 (H4) 도메인을 포함하며, 여기서 R1 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제31항에 있어서, (i) H1 도메인 및 R1 도메인이 직접 융합되거나, (ii) R16 및 R17 도메인이 직접 융합되거나, (iii) R17 및 H3 도메인이 직접 융합되거나, (iv) R23 및 R24 도메인이 직접 융합되거나, 또는 (v) R24 및 H4 도메인이 직접 융합되거나, 또는 (vi) 그의 임의의 조합인 핵산 분자.
- 제30항 내지 제32항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 스펙트린 반복부 2 (R2) 도메인, 스펙트린 반복부 3 (R3) 도메인, 스펙트린 반복부 4 (R4) 도메인, 스펙트린 반복부 5 (R5) 도메인, 스펙트린 반복부 6 (R6) 도메인, 스펙트린 반복부 7 (R7) 도메인, 스펙트린 반복부 8 (R8) 도메인, 스펙트린 반복부 9 (R9) 도메인, 스펙트린 반복부 10 (R10) 도메인, 스펙트린 반복부 11 (R11) 도메인, 스펙트린 반복부 12 (R12) 도메인, 스펙트린 반복부 13 (R13) 도메인, 스펙트린 반복부 14 (R14) 도메인, 스펙트린 반복부 15 (R15) 도메인, 스펙트린 반복부 18 (R18) 도메인, 스펙트린 반복부 19 (R19) 도메인, 스펙트린 반복부 20 (R20) 도메인, 스펙트린 반복부 21 (R21) 도메인 및/또는 스펙트린 반복부 22 (R22) 도메인을 포함하지 않는 것인 핵산 분자.
- 제30항 내지 제33항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 ABD1 도메인 및/또는 CR 도메인을 추가로 포함하는 것인 핵산 분자.
- 제30항 내지 제34항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 디스트로핀의 N 말단에서 C 말단으로 ABD1 도메인, H1 도메인, R1 도메인, 서열식별번호: 84에 제시된 아미노산 서열, R16 도메인, R17 도메인, H3 도메인, R23 도메인, R24 도메인, H4 도메인 및 CR 도메인으로 본질적으로 이루어지거나 또는 이로 이루어진 것인 핵산 분자.
- 제30항 내지 제35항 중 어느 한 항에 있어서, H1 도메인이 서열식별번호: 82에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제36항 중 어느 한 항에 있어서, R1 도메인이 서열식별번호: 83에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제37항 중 어느 한 항에 있어서, R16 도메인이 서열식별번호: 85에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제38항 중 어느 한 항에 있어서, R17 도메인이 서열식별번호: 86에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제39항 중 어느 한 항에 있어서, H3 도메인이 서열식별번호: 87에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제40항 중 어느 한 항에 있어서, R23 도메인이 서열식별번호: 88에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제41항 중 어느 한 항에 있어서, R24 도메인이 서열식별번호: 89에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제42항 중 어느 한 항에 있어서, H4 도메인이 서열식별번호: 90에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열인 핵산 분자.
- 제30항 내지 제43항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 81에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 N 말단에 추가로 포함하는 것인 핵산 분자.
- 제30항 내지 제44항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 91에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 C 말단에 추가로 포함하는 것인 핵산 분자.
- 제30항 내지 제35항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 132에 대해 또는 C-말단 도메인이 결실된 서열식별번호: 132에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하는 것인 핵산 분자.
- 제46항에 있어서, 뉴클레오티드 서열이 서열식별번호: 147 또는 서열식별번호: 148 또는 서열식별번호: 149의 뉴클레오티드 서열에 대해 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 서열을 포함하는 것인 핵산 분자.
- 제38항 내지 제47항 중 어느 한 항에 있어서, 소형화 디스트로핀 폴리펩티드가 BXA-196481보다 더 높은 소형화 디스트로핀 폴리펩티드의 발현을 나타내는 것인 핵산 분자.
- 제38항에 있어서, 소형화 디스트로핀 폴리펩티드 발현이 BXA-196481 폴리펩티드 발현보다 적어도 약 1.5배, 적어도 약 1.6배, 적어도 약 1.7배, 적어도 약 1.8배, 적어도 약 1.9배, 적어도 약 2배, 적어도 약 2.1배, 적어도 약 2.2배, 적어도 약 2.3배, 적어도 약 2.4배, 적어도 약 2.5배, 적어도 약 2.6배, 적어도 약 2.7배, 적어도 약 2.8배, 적어도 약 2.9배 또는 적어도 약 3배 더 높은 것인 핵산 분자.
- 제1항 내지 제49항 중 어느 한 항에 있어서, 프로모터를 추가로 포함하는 핵산 분자.
- 제50항에 있어서, 프로모터가 조직-특이적 프로모터인 핵산 분자.
- 제50항 또는 제51항에 있어서, 프로모터가 간세포, 근육 세포, 내피 세포, 뉴런 세포, 동모양 세포 또는 그의 임의의 조합에서 치료 단백질의 발현을 구동하는 것인 핵산 분자.
- 제50항 내지 제52항 중 어느 한 항에 있어서, 프로모터가 마우스 티레틴 프로모터 (mTTR), 내인성 인간 인자 VIII 프로모터 (F8), 인간 알파-1-항트립신 프로모터 (hAAT), 인간 알부민 최소 프로모터, 마우스 알부민 프로모터, 트리스테트라프롤린 (TTP) 프로모터, CASI 프로모터, 시냅신 1 유전자 프로모터, CAG 프로모터, 시토메갈로바이러스 (CMV) 프로모터, α1-항트립신 (AAT), 근육 크레아틴 키나제 (MCK), 미오신 중쇄 알파 (αMHC), 미오글로빈 (MB), 데스민 (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK 및 포스포글리세레이트 키나제 (PGK) 프로모터로 이루어진 군으로부터 선택된 것인 핵산 분자.
- 제1항 내지 제53항 중 어느 한 항에 있어서, 인트론 서열을 추가로 포함하는 핵산 분자.
- 제54항에 있어서, 인트론 서열이 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 5'에 위치하는 것인 핵산 분자.
- 제54항 또는 제55항에 있어서, 인트론 서열이 프로모터의 3'에 위치하는 것인 핵산 분자.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 인트론 서열이 합성 인트론 서열을 포함하는 것인 핵산 분자.
- 제1항 내지 제57항 중 어느 한 항에 있어서, 전사후 조절 요소를 추가로 포함하는 핵산 분자.
- 제58항에 있어서, 전사후 조절 요소가 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열의 3'에 위치하는 것인 핵산 분자.
- 제58항 또는 제59항에 있어서, 전사후 조절 요소가 돌연변이된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), 마이크로RNA 결합 부위 또는 DNA 핵 표적화 서열 또는 그의 임의의 조합을 포함하는 것인 핵산 분자.
- 제1항 내지 제60항 중 어느 한 항에 있어서, 3'UTR 폴리(A) 테일 서열을 추가로 포함하는 핵산 분자.
- 제61항에 있어서, 3'UTR 폴리(A) 테일 서열이 bGH 폴리(A), 액틴 폴리(A), 헤모글로빈 폴리(A) 및 그의 임의의 조합으로 이루어진 군으로부터 선택된 것인 핵산 분자.
- 제61항 또는 제62항에 있어서, 3'UTR 폴리(A) 테일 서열이 bGH 폴리(A)를 포함하는 것인 핵산 분자.
- 제1항 내지 제63항 중 어느 한 항에 있어서, 인핸서 서열을 추가로 포함하는 핵산 분자.
- 제64항에 있어서, 제1 ITR 및/또는 제2 ITR을 추가로 포함하는 핵산 분자.
- 제65항에 있어서, 제1 ITR 및 제2 ITR이 동일한 것인 핵산 분자.
- 제65항 또는 제66항에 있어서, 제1 ITR 및/또는 제2 ITR이 아데노-연관 바이러스로부터 유래된 것인 핵산 분자.
- 제1항 내지 제67항 중 어느 한 항에 있어서, 이종 모이어티를 포함하는 핵산 분자.
- 제68항에 있어서, 이종 모이어티가 알부민 또는 그의 단편, 이뮤노글로불린 Fc 영역, 인간 융모성 고나도트로핀의 β 서브유닛의 C-말단 펩티드 (CTP), PAS 서열, HAP 서열, 트랜스페린 또는 그의 단편, 알부민-결합 모이어티 또는 그의 유도체 및 그의 임의의 조합으로 이루어진 군으로부터 선택된 것인 핵산 분자.
- 제1항 내지 제69항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제70항에 있어서, 아데노바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터, 바큘로바이러스 벡터, 헤르페스 바이러스 벡터로 이루어진 군으로부터 선택된 벡터.
- 제70항에 있어서, 아데노-연관 바이러스 (AAV) 벡터인 벡터.
- 제72항에 있어서, AAV 벡터가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11로부터 선택된 것인 벡터.
- 제72항에 있어서, AAV 벡터가 AAV9인 벡터.
- 제1항 내지 제74항 중 어느 한 항에 있어서, 전달 작용제와 함께 제제화된 핵산 분자 또는 벡터.
- 제75항에 있어서, 전달 작용제가 지질 나노입자를 포함하는 것인 핵산 분자 또는 벡터.
- 제75항에 있어서, 전달 작용제가 리포솜, 비-지질 중합체 분자, 엔도솜 및 그의 임의의 조합으로 이루어진 군으로부터 선택된 것인 핵산 분자 또는 벡터.
- 제1항 내지 제77항 중 어느 한 항에 있어서, 정맥내, 경피, 피내, 피하, 폐 또는 경구 전달 또는 그의 임의의 조합을 위해 제제화된 핵산 분자 또는 벡터.
- 제78항에 있어서, 정맥내 전달을 위해 제제화된 핵산 분자 또는 벡터.
- 제1항 내지 제69항 중 어느 한 항의 핵산 분자, 제70항 내지 제74항 중 어느 한 항의 벡터, 또는 제75항 내지 제79항 중 어느 한 항의 핵산 분자 또는 벡터에 의해 코딩된 폴리펩티드.
- 제1항 내지 제69항 중 어느 한 항의 핵산 분자 또는 제70항 내지 제74항 중 어느 한 항의 벡터를 포함하는 숙주 세포.
- 제81항에 있어서, CHO 세포, HEK293 세포, HBK 세포, COS 세포, NSO 세포 또는 HT1080 세포인 숙주 세포.
- (a) 제1항 내지 제69항 중 어느 한 항의 핵산, 제70항 내지 제74항 중 어느 한 항의 벡터, 제75항 내지 제79항 중 어느 한 항의 핵산 분자 또는 벡터, 제80항의 폴리펩티드, 또는 제81항 또는 제82항의 숙주 세포; 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물.
- 제1항 내지 제69항 중 어느 한 항의 핵산, 제70항 내지 제74항 중 어느 한 항의 벡터, 제75항 내지 제79항 중 어느 한 항의 핵산 분자 또는 벡터, 제80항의 폴리펩티드, 제81항 또는 제82항의 숙주 세포, 또는 제83항의 제약 조성물, 및 핵산 분자를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트.
- 제81항 또는 제82항의 숙주 세포를 적합한 조건 하에 배양하고, 소형화 디스트로핀 폴리펩티드를 회수하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드를 생산하는 방법.
- 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에게 제1항 내지 제69항 중 어느 한 항의 핵산, 제70항 내지 제74항 중 어느 한 항의 벡터, 제75항 내지 제79항 중 어느 한 항의 핵산 분자 또는 벡터, 제81항 또는 제82항의 숙주 세포, 또는 제83항의 제약 조성물을 투여하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에서 소형화 디스트로핀 폴리펩티드를 발현시키는 방법.
- 질환 또는 상태를 갖는 대상체에게 제1항 내지 제69항 중 어느 한 항의 핵산, 제70항 내지 제74항 중 어느 한 항의 벡터, 제75항 내지 제79항 중 어느 한 항의 핵산 분자 또는 벡터, 제80항의 폴리펩티드, 제81항 또는 제82항의 숙주 세포, 또는 제83항의 제약 조성물을 투여하는 것을 포함하는, 질환 또는 상태를 갖는 대상체를 치료하는 방법.
- 제87항에 있어서, 질환 또는 상태가 디스트로핀 결핍에 의해 유발된 질환인 방법.
- 제88항에 있어서, 질환이 근육감소증, 심장 질환, 악액질, 뒤시엔느 근육 이영양증 (DMD), 베커 근육 이영양증 (BMD), X-연관 확장성 심근병증 (XLDC), 안면견갑상완 근육 이영양증, 근긴장성 근육 이영양증, 지대 근육 이영양증, 안인두 근육 이영양증, 에머리-드레이푸스 근육 이영양증, 원위 근육 이영양증 및/또는 선천성 근육 이영양증인 방법.
- 제86항 내지 제89항 중 어느 한 항에 있어서, 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물이 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여되는 것인 방법.
- 제90항에 있어서, 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물이 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여되는 것인 방법.
- 제87항 내지 제91항 중 어느 한 항에 있어서, 대상체에게 제2 작용제를 투여하는 것을 추가로 포함하는 방법.
- 제86항 내지 제92항 중 어느 한 항에 있어서, 대상체가 인간인 방법.
- 제86항 내지 제93항 중 어느 한 항에 있어서, 대상체에게 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물을 투여하는 것이, 투여 전 대상체에서의 디스트로핀 단백질 발현에 비해 증가된 디스트로핀 단백질 발현을 유발하며, 여기서 디스트로핀 단백질 발현은 적어도 약 2배, 적어도 약 3배, 적어도 약 4배, 적어도 약 5배, 적어도 약 6배, 적어도 약 7배, 적어도 약 8배, 적어도 약 9배, 적어도 약 10배, 적어도 약 11배, 적어도 약 12배, 적어도 약 13배, 적어도 약 14배, 적어도 약 15배, 적어도 약 20배, 적어도 약 25배, 적어도 약 30배, 적어도 약 35배, 적어도 약 40배, 적어도 약 50배, 적어도 약 60배, 적어도 약 70배, 적어도 약 80배, 적어도 약 90배 또는 적어도 약 100배만큼 증가되는 것인 방법.
- 힌지 2 (H2) 도메인 및 스펙트린 16 (R16) 도메인을 포함하며, 여기서 H2 도메인 및 R16 도메인은 서열식별번호: 84에 제시된 아미노산 서열 (IHTVREETMMVMTEDMPLEI)을 포함하는 링커에 의해 융합된 것인 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제27항에 있어서, 소형화 디스트로핀 폴리펩티드가 서열식별번호: 153의 아미노산 서열을 포함하는 것인 핵산 분자.
- 서열식별번호: 152에 대해 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100% 동일한 아미노산 서열을 포함하는 소형화 디스트로핀 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제96항 또는 제97항의 핵산 분자를 포함하는 벡터.
- 제98항에 있어서, 아데노바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터, 바큘로바이러스 벡터, 헤르페스 바이러스 벡터로 이루어진 군으로부터 선택된 벡터.
- 제98항에 있어서, 아데노-연관 바이러스 (AAV) 벡터인 벡터.
- 제100항에 있어서, AAV 벡터가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11로부터 선택된 것인 벡터.
- 제100항에 있어서, AAV 벡터가 AAV9인 벡터.
- 제96항 내지 제102항 중 어느 한 항에 있어서, 전달 작용제와 함께 제제화된 핵산 분자 또는 벡터.
- 제103항에 있어서, 전달 작용제가 지질 나노입자를 포함하는 것인 핵산 분자 또는 벡터.
- 제103항에 있어서, 전달 작용제가 리포솜, 비-지질 중합체 분자, 엔도솜 및 그의 임의의 조합으로 이루어진 군으로부터 선택된 것인 핵산 분자 또는 벡터.
- 제96항 내지 제105항 중 어느 한 항에 있어서, 정맥내, 경피, 피내, 피하, 폐 또는 경구 전달 또는 그의 임의의 조합을 위해 제제화된 핵산 분자 또는 벡터.
- 제96항 또는 제97항의 핵산 분자, 제98항 내지 제102항 중 어느 한 항의 벡터, 또는 제103항 내지 제106항 중 어느 한 항의 핵산 분자 또는 벡터에 의해 코딩된 폴리펩티드.
- 제96항 또는 제97항의 핵산 분자 또는 제98항 내지 제102항 중 어느 한 항의 벡터를 포함하는 숙주 세포.
- 제108항에 있어서, CHO 세포, HEK293 세포, HBK 세포, COS 세포, NSO 세포 또는 HT1080 세포인 숙주 세포.
- (a) 제96항 또는 제97항의 핵산, 제98항 내지 제102항 중 어느 한 항의 벡터, 제103항 내지 제106항 중 어느 한 항의 핵산 분자 또는 벡터, 제107항의 폴리펩티드, 또는 제108항 또는 제109항의 숙주 세포; 및 (b) 제약상 허용되는 부형제를 포함하는 제약 조성물.
- 제96항 또는 제97항의 핵산, 제98항 내지 제102항 중 어느 한 항의 벡터, 제103항 내지 제106항 중 어느 한 항의 핵산 분자 또는 벡터, 제105항의 폴리펩티드, 제108항 또는 제109항의 숙주 세포, 또는 제110항의 제약 조성물, 및 핵산 분자를 그를 필요로 하는 대상체에게 투여하는 것에 대한 지침서를 포함하는 키트.
- 제108항 또는 제109항의 숙주 세포를 적합한 조건 하에 배양하고, 소형화 디스트로핀 폴리펩티드를 회수하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드를 생산하는 방법.
- 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에게 제96항 또는 제97항의 핵산, 제98항 내지 제102항 중 어느 한 항의 벡터, 제103항 내지 제106항 중 어느 한 항의 핵산 분자 또는 벡터, 제108항 또는 제109항의 숙주 세포, 또는 제110항의 제약 조성물을 투여하는 것을 포함하는, 소형화 디스트로핀 폴리펩티드의 발현을 필요로 하는 대상체에서 소형화 디스트로핀 폴리펩티드를 발현시키는 방법.
- 질환 또는 상태를 갖는 대상체에게 제96항 또는 제97항의 핵산, 제98항 내지 제102항 중 어느 한 항의 벡터, 제103항 내지 제106항 중 어느 한 항의 핵산 분자 또는 벡터, 제107항의 폴리펩티드, 제108항 또는 제109항의 숙주 세포, 또는 제110항의 제약 조성물을 투여하는 것을 포함하는, 질환 또는 상태를 갖는 대상체를 치료하는 방법.
- 제114항에 있어서, 질환이 근육감소증, 심장 질환, 악액질, 뒤시엔느 근육 이영양증 (DMD), 베커 근육 이영양증 (BMD), X-연관 확장성 심근병증 (XLDC), 안면견갑상완 근육 이영양증, 근긴장성 근육 이영양증, 지대 근육 이영양증, 안인두 근육 이영양증, 에머리-드레이푸스 근육 이영양증, 원위 근육 이영양증 및/또는 선천성 근육 이영양증인 방법.
- 제115항에 있어서, 핵산 분자, 벡터, 폴리펩티드, 숙주 세포 또는 제약 조성물이 정맥내로, 경피로, 피내로, 피하로, 경구로 또는 폐로 또는 그의 임의의 조합으로 투여되는 것인 방법.
- 제114항 내지 제116항 중 어느 한 항에 있어서, 대상체에게 제2 작용제를 투여하는 것을 추가로 포함하는 방법.
- 제114항 내지 제117항 중 어느 한 항에 있어서, 대상체가 인간인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862749982P | 2018-10-24 | 2018-10-24 | |
US62/749,982 | 2018-10-24 | ||
PCT/US2019/057855 WO2020086844A1 (en) | 2018-10-24 | 2019-10-24 | Miniaturized dystrophins and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210082193A true KR20210082193A (ko) | 2021-07-02 |
Family
ID=68582390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217015030A KR20210082193A (ko) | 2018-10-24 | 2019-10-24 | 소형화 디스트로핀 및 그의 용도 |
Country Status (16)
Country | Link |
---|---|
US (1) | US20210403947A1 (ko) |
EP (1) | EP3870202A1 (ko) |
JP (1) | JP2022505816A (ko) |
KR (1) | KR20210082193A (ko) |
CN (1) | CN113613668A (ko) |
AU (1) | AU2019368307A1 (ko) |
BR (1) | BR112021007480A2 (ko) |
CA (1) | CA3117738A1 (ko) |
CL (1) | CL2021000994A1 (ko) |
CO (1) | CO2021005083A2 (ko) |
EA (1) | EA202191123A1 (ko) |
IL (1) | IL282547A (ko) |
MX (1) | MX2021004688A (ko) |
PE (1) | PE20211110A1 (ko) |
SG (1) | SG11202104051VA (ko) |
WO (1) | WO2020086844A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115485291A (zh) | 2020-04-29 | 2022-12-16 | 百时美施贵宝公司 | 具血影蛋白融合结构域的微型化抗肌萎缩蛋白及其用途 |
JP2023535632A (ja) | 2020-07-27 | 2023-08-18 | アンジャリウム バイオサイエンシズ エージー | Dna分子の組成物、その作製方法、及びその使用方法 |
US20240003898A1 (en) * | 2020-10-30 | 2024-01-04 | Pfizer Inc. | Methods for measuring dystrophin in tissue samples |
WO2022241030A1 (en) * | 2021-05-11 | 2022-11-17 | Regenxbio Inc. | Treatment of duchenne muscular dystrophy and combinations thereof |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4522811A (en) | 1982-07-08 | 1985-06-11 | Syntex (U.S.A.) Inc. | Serial injection of muramyldipeptides and liposomes enhances the anti-infective activity of muramyldipeptides |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
AU2001296600A1 (en) * | 2000-10-06 | 2002-04-15 | Regents Of The University Of Michigan | Mini-dystrophin nucleic acid and peptide sequences |
AU2003295366B2 (en) | 2002-11-04 | 2011-11-24 | Advisys, Inc. | Synthetic muscle promoters with activities exceeding naturally occurring regulatory sequences in cardiac cells |
SG11201705324UA (en) * | 2015-01-16 | 2017-07-28 | Univ Washington | Novel micro-dystrophins and related methods of use |
CA2971303A1 (en) * | 2016-06-21 | 2017-12-21 | Bamboo Therapeutics, Inc. | Optimized mini-dystrophin genes and expression cassettes and their use |
-
2019
- 2019-10-24 KR KR1020217015030A patent/KR20210082193A/ko unknown
- 2019-10-24 WO PCT/US2019/057855 patent/WO2020086844A1/en unknown
- 2019-10-24 AU AU2019368307A patent/AU2019368307A1/en not_active Abandoned
- 2019-10-24 SG SG11202104051VA patent/SG11202104051VA/en unknown
- 2019-10-24 JP JP2021522489A patent/JP2022505816A/ja active Pending
- 2019-10-24 BR BR112021007480-5A patent/BR112021007480A2/pt unknown
- 2019-10-24 CN CN201980085325.5A patent/CN113613668A/zh active Pending
- 2019-10-24 US US17/288,029 patent/US20210403947A1/en active Pending
- 2019-10-24 CA CA3117738A patent/CA3117738A1/en active Pending
- 2019-10-24 EP EP19804968.6A patent/EP3870202A1/en active Pending
- 2019-10-24 MX MX2021004688A patent/MX2021004688A/es unknown
- 2019-10-24 EA EA202191123A patent/EA202191123A1/ru unknown
- 2019-10-24 PE PE2021000549A patent/PE20211110A1/es unknown
-
2021
- 2021-04-20 CL CL2021000994A patent/CL2021000994A1/es unknown
- 2021-04-21 IL IL282547A patent/IL282547A/en unknown
- 2021-04-21 CO CONC2021/0005083A patent/CO2021005083A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
EP3870202A1 (en) | 2021-09-01 |
EA202191123A1 (ru) | 2022-03-29 |
CO2021005083A2 (es) | 2021-04-30 |
IL282547A (en) | 2021-06-30 |
CL2021000994A1 (es) | 2021-09-20 |
WO2020086844A1 (en) | 2020-04-30 |
AU2019368307A1 (en) | 2021-06-10 |
US20210403947A1 (en) | 2021-12-30 |
PE20211110A1 (es) | 2021-06-17 |
BR112021007480A2 (pt) | 2021-08-10 |
CA3117738A1 (en) | 2020-04-30 |
SG11202104051VA (en) | 2021-05-28 |
CN113613668A (zh) | 2021-11-05 |
JP2022505816A (ja) | 2022-01-14 |
MX2021004688A (es) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102652994B1 (ko) | 조절성 폴리뉴클레오티드 | |
KR102606174B1 (ko) | 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략 | |
KR102427379B1 (ko) | 헌팅톤 질환을 치료하기 위한 조성물 및 방법 | |
KR20210082193A (ko) | 소형화 디스트로핀 및 그의 용도 | |
KR20220107222A (ko) | 마이크로디스트로핀 유전자 치료 작제물 및 이의 용도 | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
KR20230053735A (ko) | 게놈의 조정을 위한 개선된 방법 및 조성물 | |
KR20210092755A (ko) | 신경원성 세로이드 리포푸신증에 대한 유전자 요법 | |
KR20200126997A (ko) | 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법 | |
KR20200095462A (ko) | Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
CN114929735A (zh) | 因子viii构建体 | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
TW202227476A (zh) | 編碼GJB2之重組腺相關病毒(rAAV)及其用途 | |
US20230407331A1 (en) | Miniaturized dystrophins having spectrin fusion domains and uses thereof | |
KR20220157944A (ko) | 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법 | |
KR20210132109A (ko) | Dna-결합 도메인 전사활성화제 및 이의 용도 | |
JP2023542241A (ja) | 糖尿病を処置するための修飾型インスリンおよびグルコキナーゼ核酸 | |
CN113677697A (zh) | 使用重叠的aav载体生产大型拟抗肌萎缩蛋白 | |
EA046419B1 (ru) | Миниатюризированные дистрофины и их применения | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 | |
TW202227635A (zh) | 載體化抗體及其用途 | |
CN116997657A (zh) | 编码GJB2的重组腺相关病毒(rAAV)及其用途 | |
KR20240000542A (ko) | 근이영양증의 유전자 요법을 위한 AAVrh74 벡터 |