KR20220108036A - 최소 아레스틴 도메인 함유 단백질 1 (arrdc1) 구축물 - Google Patents
최소 아레스틴 도메인 함유 단백질 1 (arrdc1) 구축물 Download PDFInfo
- Publication number
- KR20220108036A KR20220108036A KR1020227013827A KR20227013827A KR20220108036A KR 20220108036 A KR20220108036 A KR 20220108036A KR 1020227013827 A KR1020227013827 A KR 1020227013827A KR 20227013827 A KR20227013827 A KR 20227013827A KR 20220108036 A KR20220108036 A KR 20220108036A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- arrdc1
- microvesicle
- minimal
- rna
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/70539—MHC-molecules, e.g. HLA-molecules
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/54—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
- A61K47/55—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds
- A61K47/552—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound the modifying agent being also a pharmacologically or therapeutically active agent, i.e. the entire conjugate being a codrug, i.e. a dimer, oligomer or polymer of pharmacologically or therapeutically active compounds one of the codrug's components being an antibiotic
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/69—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit
- A61K47/6905—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a colloid or an emulsion
- A61K47/6911—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the conjugate being characterised by physical or galenical forms, e.g. emulsion, particle, inclusion complex, stent or kit the form being a colloid or an emulsion the form being a liposome
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/10—Dispersions; Emulsions
- A61K9/127—Liposomes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Dispersion Chemistry (AREA)
- Cell Biology (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
아레스틴 도메인 함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)의 형성을 유도하는 최소 ARRDC1 구축물이 본원에 개시된다. 이들 소포는 다양한 분자 화물, 예컨대 소분자, 핵산, 및 단백질을 패키징하고 전달하도록 활용될 수 있다. 이러한 화물의 예는 게놈 편집제 Cas9이다.
Description
아레스틴 도메인 함유 단백질 1 (ARRDC1)은 ARRDC1-매개된 미세소포 (ARMM: ARRDC1-mediated microvesicle)로 공지된 세포외 소포의 형성을 유도하며, 이들 소포는 다양한 분자 화물, 예컨대 소분자, 단백질, 및 핵산을 패키징하고 전달하도록 활용될 수 있다.
아레스틴 도메인 함유 단백질 1 (ARRDC1)은 ARMM으로 공지된 세포외 소포의 형성을 유도하며 (Nabhan J et al., PNAS 2012), 이들 소포는 다양한 화물, 예컨대 단백질, 핵산, 및 소분자를 패키징하고 전달하도록 활용될 수 있다 (Wang Q and Lu Q, Nat Commun 2018). 전장 ARRDC1 단백질 (~46 kD의 433개의 아미노산)은 분자 화물과의 직접 융합을 통해 또는 단백질-단백질 상호작용을 통해 분자 화물을 소포 내로 동원하는데 사용되었다. ARRDC1 단백질 그 자체가 ARMM 내로 패키징되기 때문에, 및 소포의 크기가 제한되기 때문에 (~80-100 nm), 버딩을 유도하는데 있어서 여전히 기능할 수 있는 보다 작은 ARRDC1 단백질은 소포 내로 패키징될 수 있는 화물의 수를 잠재적으로 증가시킬 것이다. 더욱이, 보다 작은 ARRDC1은 상대적으로 큰 분자 화물의 동원을 허용할 수 있다.
ARMM 버딩을 유도하는데 충분한 최소 ARRDC1 단백질이 본원에 개시된다. 본원에 기재된 ARMM 전달 시스템은 세포에의 분자 화물, 예컨대 소분자, 단백질, 및 핵산의 안전하고 효율적인 전달을 방지하는 현재의 전달 시스템의 많은 한계를 다룬다. ARMM은 내인성 버딩 경로로부터 유도되기 때문에, 이들은 염증 반응을 촉발시키는 것으로 공지된 바이러스 전달 시스템과는 달리, 강한 면역 반응을 유발할 가능성이 적다 (Sen D. et al., "Cellular unfolded protein response against viruses used in gene therapy", Front Microbiology. 2014; 5:250, 1-16.). 추가로, ARMM은 관심의 임의의 화물 단백질 (예를 들어, 가이드 RNA (gRNA)를 갖는 표적화된 엔도뉴클레아제, 예컨대 Cas9 단백질, 또는 Cas9 변이체)의 특이적 패키징을 허용한다. 이어서 이들 화물은 항체 또는 다른 유형의 분자를 조직-특이적 마커를 인식하는 ARMM에 혼입함으로써 특이적 수용자 세포/조직에 의한 융합 또는 흡수에 의해 전달될 수 있다. 일부 측면에서, 표적화된 엔도뉴클레아제, 예컨대Cas9-gRNA 및 그들의 변이체는 표적 세포에의 전달을 위해 ARMM 내로 로딩될 수 있다.
ARMM은 엑소좀과는 별개인 미세소포이며, 버딩 바이러스와 같이, 직접적 형질막 버딩 (DPMB)에 의해 생산된다. DPMB는 그의 아레스틴 도메인을 통해 형질막에 국재화된 아레스틴-도메인-함유 단백질 ARRDC1 보조 단백질의 테트라펩티드 PSAP (서열식별번호(SEQ ID NO): 122) 또는 PTAP (서열식별번호: 123) 모티프와의 TSG101의 특이적 상호작용에 의해 유도된다. ARMM은 예를 들어, 그 전체 내용이 본원에 참조로 포함되는 루 큐.(Lu Q.) 등에 의해 2013년 2월 6일에 출원되고, 발명의 명칭이 "Arrdc1-매개된 미세소포 (ARMM) 및 그의 용도"인 PCT 출원 번호 PCT/US2013/024839 (WO 2013/119602 A1로서 공개됨); 그의 전체 내용이 본원에 참조로 포함되는 루 큐. 등에 의해 2015년 10월 30일에 출원되고, 발명의 명칭이 "ARRDC1-매개된 미세소포 (ARMM)를 통한 Cas9의 전달"인 미국 출원 번호 14/929177 (US 20160206566 A1로서 공개됨); 및 그의 전체 내용이 본원에 참조로 포함되는 루 큐. 등에 의해 2017년 10월 3일에 출원되고, 발명의 명칭이 "ARRDC1-매개된 미세소포를 통한 치료 RNA의 전달"인 PCT 출원 번호 PCT/US2017/054912 (WO 2018/067546 A1로서 공개됨)에 상세하게 기재되었다. ARRDC1/TSG101 상호작용은 엔도좀으로부터 형질막으로의 TSG101의 재배치를 발생시키고, TSG101, ARRDC1, 및 다른 세포 성분을 함유하는 미세소포의 방출을 매개한다.
따라서, 일부 실시양태에서, 본 개시내용은 하기를 포함하는 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)로서: 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프, 여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1을 제공한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 2개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 400개 미만의 아미노산의 길이이다. 일부 실시양태에서, PPXY 모티프 중 1개 이상은 PPEY (서열식별번호: 124)이다. 일부 실시양태에서, PPXY 모티프 중 1개 이상은 PPSY (서열식별번호: 115)이다. 일부 실시양태에서, 적어도 2개의 PPXY 모티프는 PPEY (서열식별번호: 124) 및 PPSY (서열식별번호: 115)이다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1에 제시된 아미노산 서열을 포함한다.
본 개시내용의 측면은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 제공한다: 지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체. 일부 실시양태에서, 최소 ARRDC1 단백질은 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧다. 일부 실시양태에서, 최소 ARRDC1 단백질은 서열식별번호: 1에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, 미세소포는 화물, 예를 들어, 핵산, 단백질, 및/또는 소분자를 추가로 포함한다.
일부 실시양태에서, 미세소포는 TSG101 단백질 또는 그의 단편을 추가로 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, 전달되는 화물은 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합된다. 일부 실시양태에서, 미세소포는 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함한다.
일부 실시양태에서, 미세소포는 Cas9 단백질 또는 Cas9 단백질 변이체, Oct4, Sox2, c-Myc, KLF4 재프로그래밍 인자, p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제;,BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre 리콤비나제, Dre 리콤비나제, FLP 리콤비나제, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, gp29, Cre, FLP, R, Lambda, HK101, HK022, pSAM2, CAS9 뉴클레아제 또는 다른 Cas9-유사 표적화된 엔도뉴클레아제, 예컨대 Cpf1, CasX, CasY, 또는 Geo), Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT, α1β1 인테그린, α2β1 인테그린, α4β1 인테그린, α5β1 인테그린, α6β1 인테그린, αLβ2 인테그린, αMβ2 인테그린, αIIbβ3 인테그린, αVβ3 인테그린, αVβ5 인테그린, αVβ6 인테그린, α6β4 인테그린, EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, MuSK 수용체, 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4, CCR5, 베타-아드레날린성 수용체, CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA로 이루어진 군으로부터 선택되는 작용제를 포함한다.
일부 실시양태에서, 전달되는 작용제 (페이로드 또는 화물)는 핵산이다. 일부 실시양태에서, 핵산은 RNA를 포함한다. 특정 실시양태에서, RNA는 RNAi 작용제이다. RNA는 코딩 RNA, 비-코딩 RNA, 안티센스 RNA, mRNA, 가이드 RNA, 작은 RNA, siRNA, shRNA, 마이크로RNA, snRNA, snoRNA, lincRNA, 또는 구조적 RNA, 또는 rRNA 또는 리보자임일 수 있다.
일부 실시양태에서, 핵산은 DNA를 포함한다. 일부 실시양태에서, DNA는 레트로트랜스포존 서열, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함한다.
일부 실시양태에서, 핵산 작용제는 단백질을 코딩한다. 일부 실시양태에서, 작용제는 검출가능한 표지를 포함한다.
일부 실시양태에서, 작용제는 치료제를 포함한다.
일부 실시양태에서, 작용제는 효소, 항체, Fab, Fab', F(ab')2, Fd, scFv, Fv, dsFv, 디아바디, 및 아피바디로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 작용제는 세포독성제를 포함한다.
일부 실시양태에서, 작용제는 단백질을 포함한다. 일부 실시양태에서, 작용제는 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 또는 리콤비나제를 포함한다.
일부 실시양태에서 작용제는 지질, 또는 지단백질, 또는 당단백질, 또는 다당류, 또는 지질다당류를 포함한다.
일부 실시양태에서, 작용제는 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 결합된다. 일부 실시양태에서, 작용제는 링커를 통해 ARRDC1 단백질 또는 그의 단편 또는 TSG101 단백질 또는 그의 단편에 접합된다. 일부 실시양태에서, 링커는 절단가능한 링커이다. 일부 실시양태에서, 링커는 프로테아제 인식 부위 또는 UV-절단가능한 모이어티, 광절단가능한 링커, 또는 생물학적 메커니즘, 공유 결합의 화학적 분해, 비-공유 회합의 해리, 열 불안정성 링크, 또는 pH 불안정성 링크에 의해 절단가능한 다른 링커를 포함한다.
일부 실시양태에서, 전달되는 작용제는 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된다. 일부 실시양태에서, 작용제는 2, 3, 4 또는 5개의 WW 도메인 또는 그의 변이체를 포함한다. 일부 실시양태에서, WW 도메인은 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래된다. 일부 실시양태에서, WW 도메인은 서열식별번호: 6 내지 14로 이루어진 군으로부터 선택되는 서열을 포함한다.
일부 실시양태에서, 작용제는 단백질이다. 일부 실시양태에서, 작용제는 Cas9 단백질을 포함한다. 일부 실시양태에서, Cas9 단백질 또는 그의 변이체는 적어도 1개의 핵 국재화 서열 (NLS)을 포함한다. 일부 실시양태에서, 미세소포는 가이드 RNA (gRNA)를 추가로 포함한다. 일부 실시양태에서, WW 도메인은 단백질의 N-말단에 융합된다. 일부 실시양태에서, WW 도메인은 단백질의 C-말단에 융합된다. 일부 실시양태에서, 미세소포는 엑소좀 바이오마커를 포함하지 않는다. 일부 실시양태에서, 미세소포는 엑소좀 바이오마커에 대해 음성이다.
일부 실시양태에서, 엑소좀 바이오마커는 CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA129, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 미세소포는 Lamp-1을 포함하지 않거나 또는 그에 대해 음성이다. 일부 실시양태에서, 미세소포 직경은 약 30 nm 내지 약 500 nm이다.
본 개시내용의 측면은 Cas9 화물 단백질을 추가로 포함하는 상기 기재된 바와 같은 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 개시한다. Cas9 화물 단백질은 최소 ARRDC1 단백질에 연결될 수 있다. ARRDC1 단백질은 Cas9 화물 단백질에 공유 연결될 수 있다. 일부 실시양태에서, 최소 ARRDC1 단백질은 절단가능한 링커를 통해 Cas9 단백질에 연결된다. 링커는 UV-절단가능한 링커일 수 있고, 프로테아제 인식 부위 또는 생물학적 메커니즘, 공유 결합의 화학적 분해, 비-공유 회합의 해리, 열 불안정성 링크, 또는 pH 불안정성 링크에 의해 절단가능한 다른 링커를 포함할 수 있다.
일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 화물 단백질, 여기서 화물 단백질은 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다. 일부 측면에서 화물 단백질은 화물-TSG101 융합 단백질로서의 발현에 의해 TSG101 단백질 또는 변이체에 연결된다.
일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 표적화된 엔도뉴클레아제, 여기서 표적화된 엔도뉴클레아제는 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다.
일부 측면에서, 본 개시내용은 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서: 최소 ARRDC1 단백질 또는 그의 변이체, 및 Cas9 화물 단백질, 여기서 Cas9 화물 단백질은 TSG101 단백질 또는 그의 변이체에 연결된 것인 미세소포를 제공한다.
본 개시내용의 일부 측면은 최소 ARRDC1 융합 단백질에 관한 것이다. 일부 실시양태에서, 최소 ARRDC1 융합 단백질은 최소 ARRDC1 단백질 또는 그의 변이체를 포함하고, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프, 적어도 1개의 PPXY 모티프, 및 Cas9 단백질 또는 그의 변이체를 포함한다.
일부 측면에서, 본 개시내용은 이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포를 제공한다. 일부 실시양태에서, 미세소포-생산 세포는 이종 프로모터의 제어 하에서 화물 단백질을 코딩하는 재조합 발현 구축물을 추가로 포함한다. 화물 단백질은 적어도 1개의 WW 도메인 또는 그의 변이체에 융합될 수 있다. 화물 단백질은 최소 ARRDC1과의 융합 단백질로서 발현될 수 있다. 화물 단백질은 TSG101과의 융합 단백질로서 발현될 수 있다. 일부 실시양태에서, 미세소포-생산 세포는 이종 프로모터의 제어 하에서 생산된 화물 핵산을 코딩하는 재조합 발현 구축물을 추가로 포함한다.
일부 측면에서, 본 개시내용은 이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포로서, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧고; 여기서 최소 ARRDC1 단백질은 Cas9 화물 단백질 또는 그의 변이체에 연결된 것인 미세소포-생산 세포를 포함한다. 일부 실시양태에서, 미세소포 생산 세포는 적어도 2개의 PPXY 모티프를 포함하는 최소 ARRDC1을 포함한다.
본 개시내용의 측면은 표적 세포를 본원에 개시된 임의의 미세소포 또는 미세소포-생산 세포와 접촉시킴으로써 화물을 표적 세포에 전달하는 방법을 포함한다. 본 개시내용의 일부 측면은 표적 세포를 본원에 개시된 임의의 미세소포 또는 미세소포-생산 세포와 접촉시키는 것을 포함하는, 유전자 편집의 방법을 제공한다.
본 발명의 다른 이점, 특색, 및 용도는 특정 예시적인 비-제한적 실시양태의 상세한 설명; 도면; 비-제한적 작업 실시예; 및 청구항으로부터 명백할 것이다.
도 1은 전장 ARRDC1 단백질 및 최소 ARRDC1의 예에서의 도메인/모티프를 제시하는 개략도이다.
도 2a 내지 2c - 도 2a는 전장 ARRDC1, 최소 ARRDC1의 예, 및 짧은 N-말단을 갖는 ARRDC1에서의 도메인/모티프를 제시하는 개략도이다. 도 2b는 웨스턴 블롯의 화상을 제시한다. 구축물 (모두 GFP 단백질에 융합됨)을 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 세포외 소포 (EV)를 초원심분리를 통해 단리하고, 항-GFP 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 2c는 나노사이트(Nanosight) NS300 기기에 의해 측정된 바와 같은 형질감염된 세포 (도 2b에서와 같음)로부터의 배양 배지에서의 EV의 수를 제시하는 그래프이다.
도 3a 내지 3c - 도 3a는 Cas9에의 최소 ARRDC1의 융합을 나타내는 개략도이다. 도 3b는 항-Flag 웨스턴 블롯팅의 결과를 제시한다. Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9 (모두 C-말단에 Flag 태그를 가짐)를 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하고, 항-Flag 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 3c는 Cas9/GFP-gRNA, 최소 ARRDC1-Cas9/GFP-gRNA, 및 대조군에 대한 gRNA 비 (ARMM/세포)를 제시하는 그래프이다. GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9 및 미니ARRDC1-Cas9를 공여자 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하였다. ARMM 중의 gRNA 양을 qRT-PCR에 의해 측정하고, 세포 gRNA에 대해 정규화하였다.
도 4는 미니ARRDC1-Cas9의 유전자 편집 활성을 제시한다. 단일 카피 GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9를 U2OS 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 게놈 DNA를 단리하고, gRNA 표적화 부위를 함유하는 GFP 단편을 증폭시키고, T7E1 절단 검정에 의해 분석하여 인델 (삽입 또는 결실)을 검출하였다.
도 5는 전장 ARRDC1 및 최소 ARRDC1의 예의 단백질 서열을 제시한다.
도 2a 내지 2c - 도 2a는 전장 ARRDC1, 최소 ARRDC1의 예, 및 짧은 N-말단을 갖는 ARRDC1에서의 도메인/모티프를 제시하는 개략도이다. 도 2b는 웨스턴 블롯의 화상을 제시한다. 구축물 (모두 GFP 단백질에 융합됨)을 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 세포외 소포 (EV)를 초원심분리를 통해 단리하고, 항-GFP 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 2c는 나노사이트(Nanosight) NS300 기기에 의해 측정된 바와 같은 형질감염된 세포 (도 2b에서와 같음)로부터의 배양 배지에서의 EV의 수를 제시하는 그래프이다.
도 3a 내지 3c - 도 3a는 Cas9에의 최소 ARRDC1의 융합을 나타내는 개략도이다. 도 3b는 항-Flag 웨스턴 블롯팅의 결과를 제시한다. Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9 (모두 C-말단에 Flag 태그를 가짐)를 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하고, 항-Flag 웨스턴 블롯팅에 사용하였다. 형질감염된 세포의 전체 세포 용해물이 포함되었다. 도 3c는 Cas9/GFP-gRNA, 최소 ARRDC1-Cas9/GFP-gRNA, 및 대조군에 대한 gRNA 비 (ARMM/세포)를 제시하는 그래프이다. GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9 및 미니ARRDC1-Cas9를 공여자 HEK293T 세포 내로 형질감염시켰다. 형질감염 후 48시간에, EV를 초원심분리를 통해 단리하였다. ARMM 중의 gRNA 양을 qRT-PCR에 의해 측정하고, 세포 gRNA에 대해 정규화하였다.
도 4는 미니ARRDC1-Cas9의 유전자 편집 활성을 제시한다. 단일 카피 GFP 유전자를 표적화하는 가이드 RNA (gRNA)와 함께 Cas9, ARRDC1-Cas9, 및 미니ARRDC1-Cas9를 U2OS 세포 내로 형질감염시켰다. 형질감염 후 48시간에, 게놈 DNA를 단리하고, gRNA 표적화 부위를 함유하는 GFP 단편을 증폭시키고, T7E1 절단 검정에 의해 분석하여 인델 (삽입 또는 결실)을 검출하였다.
도 5는 전장 ARRDC1 및 최소 ARRDC1의 예의 단백질 서열을 제시한다.
정의
ARRDC1: ARRDC1은 또한 본원에서 각각 PSAP (서열식별번호: 122) 및 PPXY 모티프로 지칭되는 PSAP (서열식별번호: 122) 및 PPXY 모티프를 그의 C-말단에 포함하고, 본원에 제시된 바와 같은 TSG101과 상호작용하는 단백질이다. 예시적인 비-제한적 ARRDC1 단백질 서열은 본원에서 제공되며, 본 발명의 측면에 따른 추가의 적합한 ARRDC1 단백질 변이체는 관련 기술분야에 공지되어 있다. 또한, 예시적인 비-제한적 최소 ARRDC1 단백질 서열은 본원에서 제공된다. 본 발명은 이에 관하여 제한되지 않음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 예시적인 ARRDC1 서열은 하기를 포함한다 (PSAP (서열식별번호: 122) 및 PPXY 모티프는 표시됨):
>gi|22748653|ref|NP_689498.1| 아레스틴 도메인-함유 단백질 1 [호모 사피엔스(Homo sapiens)]
>gi|244798004|ref|NP_001155957.1| 아레스틴 도메인-함유 단백질 1 이소형 a [무스 무스쿨루스(Mus musculus)]
>gi|244798112|ref|NP_848495.2| 아레스틴 도메인-함유 단백질 1 이소형 b [무스 무스쿨루스]
본원에 사용된 용어 "ARMM"은 ARRDC1 단백질 또는 그의 변이체, 및/또는 TSG101 단백질 또는 그의 변이체를 포함하는 미세소포를 지칭한다. 일부 실시양태에서, ARRDC1 단백질 또는 그의 변이체는 최소 ARRDC1 단백질 또는 그의 변이체이다. 일부 실시양태에서, ARMM은 세포로부터 쉐딩되고, 세포질에 존재하거나 세포의 막과 회합된 분자, 예를 들어, 핵산, 단백질, 또는 소분자를 포함한다. 일부 실시양태에서, ARMM은 트랜스진을 포함하는 재조합 발현 구축물을 포함하는 트랜스제닉 세포로부터 쉐딩되고, ARMM은 유전자 산물, 예를 들어, 발현 구축물에 의해 코딩되는 전사체 또는 단백질 (예를 들어, 화물 단백질)을 포함한다. 일부 실시양태에서, 발현 구축물에 의해 코딩되는 단백질은 최소 ARRDC1 단백질과 회합하여 ARMM 내로의 Cas9 화물 단백질의 로딩을 용이하게 할 수 있는 Cas9 융합 단백질, 또는 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 Cas9 화물 단백질이다. 일부 실시양태에서, ARMM은 합성적으로, 예를 들어, TSG101, 또는 그의 변이체의 존재 하에서 무세포 시스템에서 지질 이중층을 ARRDC1 단백질, 또는 그의 변이체와 접촉시킴으로써 생산된다. 다른 실시양태에서, ARMM은 지질 이중층을 HECT 도메인 리가제, 및 VPS4a와 접촉시킴으로써 합성적으로 생산된다. 일부 실시양태에서, ARMM은 후기 엔도좀 마커를 결여한다. 본원에서 제공된 바와 같은 일부 ARMM은 1종 이상의 엑소좀 바이오마커를 포함하지 않거나 또는 그에 대해 음성이다. 엑소좀 바이오마커는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA1, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB를 포함하나 이에 제한되지는 않는다. 예를 들어, 본원에서 제공된 일부 ARMM은 CD63을 결여하고, 일부 ARMM은 LAMP1을 결여하고, 일부 ARMM은 CD9를 결여하고, 일부 ARMM은 CD81을 결여하고, 일부 ARMM은 CD63 및 Lamp-1을 결여하고, 일부 ARMM은 CD63, Lamp-1, 및 CD9를 결여하고, 일부 ARMM은 CD63, Lamp-1, CD81, 및 CD9를 결여하는 등이다. 본원에서 제공된 특정 ARMM은 엑소좀 바이오마커를 포함할 수 있다. 따라서, 일부 ARMM은 1종 이상의 엑소좀 바이오마커에 대해 음성이지만, 1종 이상의 다른 엑소좀 바이오마커에 대해서는 양성일 수 있다. 예를 들어, 이러한 ARMM은 CD63 및 Lamp-1에 대해 음성일 수 있지만, PGK1 또는 GAPDH를 포함할 수 있거나; 또는 CD63, Lamp-1, CD9, 및 CD81에 대해 음성일 수 있지만, HLA-DRA에 대해서는 양성일 수 있다. 일부 실시양태에서, ARMM은 엑소좀 바이오마커를 포함하지만, 엑소좀에서 전형적으로 발견되는 것들보다 더 낮은 수준에서이다. 예를 들어, 일부 ARMM은 엑소좀에서 발견되는 그 바이오마커의 수준의 약 1% 미만, 약 5% 미만, 약 10% 미만, 약 20% 미만, 약 30% 미만, 약 40% 미만, 또는 약 50% 미만의 수준으로 1종 이상의 엑소좀 바이오마커를 포함한다. 비-제한적 예를 제공하기 위해, 일부 실시양태에서, ARMM은 CD63 및 Lamp-1에 대해 음성일 수 있고, 엑소좀에서 전형적으로 발견되는 CD9의 수준의 약 5% 미만의 수준으로 CD9를 포함하고, ACTB에 대해 양성일 수 있다. 상기 열거된 것들 외에도 엑소좀 바이오마커는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 이에 관하여 제한되지 않는다.
작용제 및 전달되는 작용제: 본원에 사용된 용어 "작용제"는 ARMM에, 예를 들어, ARMM의 액체 상 내로 또는 ARMM의 지질 이중층 내로 혼입될 수 있는 물질을 지칭한다. 용어 "전달되는 작용제"는 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 임의의 물질을 지칭한다. 일부 실시양태에서, 작용제는 표적 세포에 전달되는 작용제이다. 일부 실시양태에서, 전달되는 작용제는 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 생물학적 시스템, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우 그 대상체에 대해 생물학적 효과를 갖는 물질은 생물학적으로 활성인 것으로 간주된다. 일부 실시양태에서, 전달되는 작용제는 치료제이다. 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우, 유익한 효과를 갖는 임의의 작용제를 지칭한다. 용어 "치료제"는 대상체에게 투여되는 경우, 치료, 진단, 및/또는 예방 효과를 갖고/거나, 바람직한 생물학적 및/또는 약리학적 효과를 유발하는 임의의 작용제를 지칭한다. 본원에 사용된 용어 "치료제"는 그의 ARMM과의 회합 또는 그 내로의 포함을 통해 세포에 전달되는 핵산일 수 있다. 특정 실시양태에서, 전달되는 작용제는 핵산이다. 특정 실시양태에서, 전달되는 작용제는 DNA이다. 특정 실시양태에서, 전달되는 작용제는 RNA이다. 특정 실시양태에서, 전달되는 작용제는 펩티드 또는 단백질이다. 일부 실시양태에서, 세포 내로 전달되는 기능적 단백질 또는 펩티드는 전사 인자, 종양 서프레서, 발달 조절제, 재프로그래밍 인자, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 아연-핑거 뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제, Cas9 단백질, 또는 리콤비나제이다. 일부 실시양태에서, 전달되는 단백질은 p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, 또는 FLP 리콤비나제이다. 특정 실시양태에서, 전달되는 작용제는 소분자이다. 일부 실시양태에서, 소분자는 FDA-승인된 약물이다. 일부 실시양태에서, 전달되는 작용제는 진단제이다. 일부 실시양태에서, 전달되는 작용제는 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것들에서는 그렇지 않다.
동물: 본원에 사용된 용어 "동물"은 동물계의 임의의 구성원을 지칭한다. 일부 실시양태에서, "동물"은 임의의 발달 단계에 있는 양쪽 성별의 인간을 지칭한다. 일부 실시양태에서, "동물"은 임의의 발달 단계에 있는 비-인간 동물을 지칭한다. 특정 실시양태에서, 비-인간 동물은 포유동물 (예를 들어, 설치류, 마우스, 래트, 토끼, 원숭이, 개, 고양이, 양, 소, 영장류, 또는 돼지)이다. 일부 실시양태에서, 동물은 포유동물, 조류, 파충류, 양서류, 어류, 및 벌레를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 동물은 트랜스제닉 동물, 유전자-조작된 동물, 또는 클론이다. 일부 실시양태에서, 동물은 트랜스제닉 비-인간 동물, 유전자-조작된 비-인간 동물, 또는 비-인간 클론이다.
대략: 관심의 1개 이상의 값에 적용되는 바와 같은 본원에 사용된 용어 "대략" 또는 "약"은 언급된 참조 값과 유사한 값을 지칭한다. 특정 실시양태에서, 용어 "대략" 또는 "약"은 달리 언급되거나 다르게는 맥락으로부터 명백하지 않는 한 (이러한 수가 가능한 값의 100%를 초과한 경우를 제외하고), 언급된 참조 값의 양쪽 방향에서 (초과 또는 미만) 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 내에 해당하는 값의 범위를 지칭한다.
회합된: 2개 이상의 실체, 예를 들어, 모이어티, 분자, 및/또는 ARMM에 관하여 사용되는 경우 본원에 사용된 용어 "회합된", "접합된", "연결된", "부착된", 및 "묶인"은 실체가 직접적으로 또는 링커로서 역할을 하는 1개 이상의 추가의 모이어티를 통해 서로와 물리적으로 회합되거나 연결되어, 실체가 구조가 사용되는 조건, 예를 들어, 생리학적 조건 하에서 물리적으로 회합되어 남아 있도록, 충분히 안정한 구조를 형성함을 의미한다. ARMM은 전형적으로 공유 또는 비-공유 회합을 수반하는 메커니즘에 의해 작용제, 예를 들어, 핵산, 단백질, 또는 소분자와 회합된다. 특정 실시양태에서, 전달되는 작용제는 ARMM의 일부인 분자, 예를 들어, ARRCD1 단백질 또는 그의 단편, TSG101 단백질 또는 그의 단편, 또는 ARMM의 지질 이중층의 일부를 형성하는 지질 또는 단백질에 공유 결합된다. 일부 실시양태에서, 펩티드 또는 단백질은 공유 결합 (예를 들어, 아미드 결합)에 의해 ARRCD1 단백질 또는 그의 단편, TSG101 단백질 또는 그의 단편, 또는 지질 이중층-회합된 단백질과 회합된다. 일부 실시양태에서, 회합은 링커, 예를 들어, 절단가능한 링커를 통해서이다. 일부 실시양태에서, 실체는 ARMM에서의 포함에 의해, 예를 들어, ARMM 내의 실체 (예를 들어, 작용제)의 캡슐화에 의해 ARMM과 회합된다. 예를 들어, 일부 실시양태에서, ARMM-생산 세포의 세포질에 존재하는 작용제는 ARMM 버딩 시 ARMM에서의 작용제-포함 세포질의 캡슐화에 의해 ARMM과 회합된다. 유사하게, 막 단백질, 또는 ARMM 생산 세포의 세포막과 회합된 다른 분자는 버딩 시 ARMM 막 내로의 포함에 의해 세포에 의해 생산된 ARMM과 회합될 수 있다. 특정 실시양태에서, 전달되는 작용제는 ARMM의 일부인 분자에서 프롤린 함유 또는 프롤린 풍부 도메인에의 결합을 실행하는 WW 도메인을 포함한다.
생물학적으로 활성인: 본원에 사용된 어구 "생물학적으로 활성인"은 생물학적 시스템 및/또는 유기체에서 활성을 갖는 임의의 물질의 특징을 지칭한다. 예를 들어, 유기체에게 투여되는 경우 그 유기체에 대해 생물학적 효과를 갖는 물질은 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서, 핵산이 생물학적으로 활성인 경우, 전체 핵산의 적어도 하나의 생물학적 활성을 공유하는 그 핵산의 부분은 전형적으로 "생물학적으로 활성인" 부분으로 지칭된다. 한 예로서, 뉴클레아제 화물 단백질은 그것이 대상체에게 투여되는 경우 유전자 산물의 발현을 증가시키거나 감소시키는 경우 생물학적으로 활성인 것으로 간주될 수 있다.
바이오마커: ARMM-기반 진단의 맥락에서 본원에 사용된 용어 "바이오마커"는 ARMM을 함유하는 생물학적 샘플에 존재하거나 그로부터 유래된 검출가능한 분자 (예를 들어, 단백질, 펩티드, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (예를 들어, DNA, 예컨대 cDNA 또는 증폭된 DNA, 또는 RNA, 예컨대 mRNA), 유기 또는 무기 화학적 화합물, 소분자 (예를 들어, 제2 메신저, 대사물), 또는 상기 중 임의의 것의 식별 분자 또는 식별 단편), 또는 임의의 비의 이러한 분자, 또는 특이적 생물학적 특색 또는 프로세스의, 예를 들어, 세포 또는 소포 신원의, 정상적인 또는 병리학적 프로세스, 또는 치료 개입에 대한 약리학적 반응, 또는 그의 적응증의 지표로서 객관적으로 측정되거나 평가되는 임의의 다른 특징을 지칭한다. 문헌 [Atkinson, A. J., et al., Biomarkers and Surrogate Endpoints: Preferred Definitions and Conceptual Framework, Clinical Pharm. & Therapeutics, 2001 March; 69(3): 89-95]을 참조한다. 이 맥락에서, 용어 "로부터 유래된"은 검출되는 경우, 생물학적 샘플에 존재하는 특정 분자를 지시하는 화합물을 지칭한다. 예를 들어, 특정 cDNA의 검출은 생물학적 샘플에서의 특정 RNA 전사체 또는 단백질의 존재를 지시할 수 있다. 또 다른 예로서, 특정 항체의 검출 또는 그에의 결합은 생물학적 샘플에서의 특정 항원 (예를 들어, 단백질)의 존재를 지시할 수 있다. 일부 실시양태에서, 식별 분자 또는 단편은 검출되는 경우, 그의 존재가 지시하는 화합물의 존재 또는 풍부성을 지시하는 분자 또는 단편이다. 바이오마커는 예를 들어, ARMM으로부터 단리되거나, ARMM의 일부로서 직접적으로 측정되거나, ARMM에서 검출되거나 그에 포함되는 것으로 결정될 수 있다. 일부 실시양태에서, 대상체로부터의 샘플에서 또는 대상체로부터 얻어진 샘플로부터 유래된 세포 집단에서 검출된 ARMM의 양, 또는 대상체로부터 얻어진 샘플 또는 세포 집단 내의 ARMM 생성의 비율은 바이오마커로서 역할을 한다. 바이오마커의 검출을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 핵산 검출 방법, 단백질 검출 방법, 탄수화물 검출 방법, 항원 검출 방법, 소분자 검출 방법, 및 다른 적합한 방법을 포함한다.
바이오마커 프로파일: "바이오마커 프로파일"은 1종 이상의 바이오마커 (예를 들어, mRNA 분자, cDNA 분자, 단백질, 및/또는 탄수화물, 또는 그의 지표)를 포함한다. 바이오마커 프로파일의 바이오마커는 동일한 또는 상이한 부류, 예컨대, 예를 들어, 핵산, 탄수화물, 대사물, 및 단백질일 수 있다. 바이오마커 프로파일은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100종, 또는 그 초과의 바이오마커를 포함할 수 있다. 일부 실시양태에서, 바이오마커 프로파일은 수 백, 또는 심지어 수 천의 바이오마커를 포함한다. 바이오마커 프로파일은 1종 이상의 대조군 또는 내부 표준물을 추가로 포함할 수 있다. 일부 실시양태에서, 바이오마커 프로파일은 내부 표준물로서 역할을 하는 적어도 1종의 바이오마커를 포함한다. 일부 실시양태에서, 샘플 또는 세포 집단 중의 ARRDC1 또는 TSG101의 존재 또는 수준은 내부 표준물로서 사용된다. 몇명 상태, 질환, 및 병리증상에 대한, 및 또한 정상적인 상태에 대한 바이오마커 프로파일은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 임의의 특정 바이오마커 프로파일에 제한되지 않는다. 일부 실시양태에서, 본원에 기재된 바와 같은 ARMM-기반 진단 방법의 맥락에서 사용된 바이오마커 프로파일은 엑소좀-기반 진단에 유용한 것으로 기재된 바이오마커 프로파일이다. 엑소좀 바이오마커 프로파일은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 상이한 암, 뇌졸중, 자폐증, 및 다른 질환을 포함한 다양한 질환의 진단에 유용한 바이오마커 프로파일은 예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 카스(Kaas) 등에 의해 2011년 1월 19일에 출원되고, 발명의 명칭이 표현형을 결정하기 위해 엑소좀을 사용하는 방법 및 시스템인 미국 특허 출원 U.S.S.N. 13/009,285 (US 2011/0151460 A1로서 공개됨)에 기재되었다.
Cas9 또는 Cas9 단백질: 용어 "Cas9" 또는 "Cas9 단백질"은 Cas9 단백질, 또는 그의 변이체 (예를 들어, Cas9의 활성, 불활성, 또는 변경된 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)를 포함하는 RNA-가이드된 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casn1 뉴클레아제 또는 CRISPR (군집화된 규칙적으로 간격화된 짧은 회문구조 반복부)-연관된 뉴클레아제로 지칭된다. CRISPR은 이동성 유전자 요소 (바이러스, 수송가능한 요소 및 접합 플라스미드)에 대한 보호를 제공하는 적응성 면역계이다. CRISPR 클러스터는 스페이서, 선행 이동성 요소에 상보적인 서열, 및 표적 침입 핵산을 함유한다. CRISPR 클러스터는 CRISPR RNA (crRNA)로 전사되고 프로세싱된다. 유형 II CRISPR 시스템에서 프리-crRNA의 정확한 프로세싱은 트랜스-코딩된 작은 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질을 요구한다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조된 프로세싱을 위한 가이드로서 역할을 한다. 이어서, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 내핵산용해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵산용해적으로 절단되고, 이어서 3'-5' 외핵산용해적으로 트리밍된다. 자연에서, DNA-결합 및 절단은 전형적으로 단백질 및 둘 다의 RNA를 요구한다. 그러나, 단일 가이드 RNA ("sgRNA", 또는 간단히 "gNRA")는 단일 RNA 종 내로 crRNA 및 tracrRNA 둘 다의 측면을 혼입하도록 조작될 수 있다. 예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)]을 참조한다. Cas9는 CRISPR 반복 서열에서 짧은 모티프 (PAM 또는 프로토스페이서 인접 모티프)를 인식하여 자기 대 비-자기를 구별하는 것을 돕는다. Cas9 뉴클레아제 서열 및 구조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 그의 각각의 전체 내용이 본원에 참조로 포함되는 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)]; ["CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)]; 및 ["A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조). Cas9 오르토로그는 에스. 피오게네스(S. pyogenes) 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지는 않는 다양한 종에서 기재되었다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737]에 개시된 유기체 및 로커스로부터의 Cas9 서열을 포함한다. 일부 실시양태에서, Cas9 뉴클레아제는 불활성 (예를 들어, 불활성화된) DNA 절단 도메인을 갖는다.
뉴클레아제-불활성화된 Cas9 단백질은 "dCas9" 단백질 (뉴클레아제-"죽은" Cas9에 대해)로 상호교환가능하게 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질 (또는 그의 변이체)을 생성하는 방법은 공지되어 있다 (예를 들어, 그의 각각의 전체 내용이 본원에 참조로 포함되는 문헌 [Jinek et al., Science. 337:816-821(2012)]; [Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28;152(5):1173-83] 참조). 예를 들어, Cas9의 DNA 절단 도메인은 2개의 서브도메인, 즉, HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하는 반면, RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H841A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, Cas9의 변이체를 포함하는 단백질이 제공된다. 예를 들어, 일부 실시양태에서, 단백질은 2개의 Cas9 도메인 중 하나를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 실시양태에서, Cas9 또는 그의 변이체를 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9, 또는 그의 변이체와 상동성을 공유한다. 예를 들어, Cas9 변이체는 야생형 Cas9와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는, 변이체가 야생형 Cas9의 상응하는 변이체와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하도록, Cas9 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)의 변이체를 포함한다. 일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9 (NCBI 참조 서열: NC_017053.1, 서열식별번호: 108(뉴클레오티드); 서열식별번호: 2 (아미노산))에 상응한다.
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, 야생형 (에스. 피오게네스) Cas9는 서열식별번호: 3 (뉴클레오티드) 및/또는 서열식별번호: 4 (아미노산)에 상응하거나, 이를 포함한다:
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 1개 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 부분적으로 또는 전체적으로 상응하거나, 이를 포함한다. 예를 들어, 일부 실시양태에서, dCas9 도메인은 D10A 및/또는 H820A 돌연변이를 포함한다.
dCas9 (D10A 및 H840A):
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
다른 실시양태에서, 예를 들어, 뉴클레아제 불활성화된 Cas9 (dCas9)를 발생시키는 D10A 및 H820A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예로서, D10 및 H820에서 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내에 다른 치환 (예를 들어, HNH 뉴클레아제 서브도메인 및/또는 RuvC1 서브도메인에서의 치환)을 포함한다. 일부 실시양태에서, 서열식별번호:5와 적어도 약 70% 동일한, 적어도 약 80% 동일한, 적어도 약 90% 동일한, 적어도 약 95% 동일한, 적어도 약 98% 동일한, 적어도 약 99% 동일한, 적어도 약 99.5% 동일한, 또는 적어도 약 99.9% 동일한 dCas9의 변이체 또는 동족체 (예를 들어, 서열식별번호: 5의 변이체)가 제공된다. 일부 실시양태에서, 서열식별번호: 5보다 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 30개의 아미노산, 약 40개의 아미노산, 약 50개의 아미노산, 약 75개의 아미노산, 약 100개의 아미노산, 또는 그 초과만큼 더 짧거나, 더 긴 아미노산 서열을 갖는 dCas9의 변이체 (예를 들어, 서열식별번호: 5의 변이체)가 제공된다.
일부 실시양태에서, 본원에서 제공된 바와 같은 Cas9 융합 단백질은 Cas9 단백질의 전장 아미노산, 예를 들어, 상기 제공된 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에서 제공된 바와 같은 융합 단백질은 전장 Cas9 서열을 포함하지 않지만, 단지 그의 단편을 포함한다. 예를 들어, 일부 실시양태에서, 본원에서 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하고, 여기서 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들어, 그것이 단지 뉴클레아제 도메인의 말단절단된 버전을 포함하거나, 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서, 기능적 뉴클레아제 도메인을 포함하지 않는다. 적합한 Cas9 도메인 및 Cas9 단편의 예시적인 아미노산 서열은 본원에서 제공되고, Cas9 도메인 및 단편의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 명백할 것이다.
일부 실시양태에서, Cas9는 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI 참조: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI 참조: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola) (NCBI 참조: NC_021284.1); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI 참조: NC_017861.1); 스피로플라스마 타이와넨스(Spiroplasma taiwanense) (NCBI 참조: NC_021846.1); 스트렙토코쿠스 이니아에(Streptococcus iniae) (NCBI 참조: NC_021314.1); 벨리엘라 발티카(Belliella baltica) (NCBI 참조: NC_018010.1); 시크로플렉수스 토르퀴스(Psychroflexus torquis) (NCBI 참조: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI 참조: YP_820832.1); 리스테리아 인노쿠아(Listeria innocua) (NCBI 참조: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni) (NCBI 참조: YP_002344900.1); 또는 네이세리아 메닌기티디스(Neisseria meningitidis) (NCBI 참조: YP_002342100.1)로부터의 Cas9를 지칭한다.
최소-ARRDC1을 포함하는 ARRM에서 페이로드로서 Cas9 또는 Cas9-유사 분자의 전달에 관하여 본원의 교시내용은 비-제한적 예로서 제공된다. 관련 기술분야의 통상의 기술자는 본 개시내용이 세포내 전달을 필요로 하는 관련 기술분야에 공지된 것과 같은 다른 RNA 가이드된 DNA-뉴클레아제를 포함한 다른 표적화된 엔도뉴클레아제를 포함하나 이에 제한되지는 않는 다른 페이로드를 로딩하는 수단을 제공함을 인식할 것이다.
용어 "데아미나제"는 탈아미노화 반응을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 시토신의 우라실로의 가수분해적 탈아미노화를 촉매하는 시티딘 데아미나제이다.
화물 단백질: 본원에 사용된 용어 "화물 단백질"은 ARMM에, 예를 들어, ARMM의 액체 상 내로 또는 ARMM의 지질 이중층 내로 혼입될 수 있는 단백질을 지칭한다. 용어 "전달되는 화물 단백질"은 그의 ARMM과의 회합 또는 그에서의 포함을 통해 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 임의의 단백질을 지칭한다. 일부 실시양태에서, 화물 단백질은 시험관내에서, 생체내에서, 또는 생체외에서 표적 세포에 전달된다. 일부 실시양태에서, 전달되는 화물 단백질은 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 기관, 조직, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우 그 대상체에 대해 생물학적 효과를 갖는 단백질은 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서 화물 단백질은 뉴클레아제, 데아미나제, 리콤비나제, 또는 그의 변이체 (예를 들어, Cas9 단백질 또는 그의 변이체)이다. 특정 실시양태에서, 뉴클레아제는 Cas9 뉴클레아제, TALE 뉴클레아제, 아연 핑거 뉴클레아제, 또는 그의 임의의 변이체일 수 있다. Cas9 단백질 및 그들의 변이체를 포함한 뉴클레아제는 본원의 다른 곳에 보다 상세하게 기재되어 있다. 일부 실시양태에서, Cas9 단백질 또는 그의 변이체는 핵산과 회합된다. 예를 들어, 화물 단백질은 gRNA와 회합된 Cas9 단백질일 수 있다. 일부 실시양태에서, 전달되는 화물 단백질은 치료제이다. 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우 유익한 효과를 갖는 임의의 작용제를 지칭한다. 일부 실시양태에서, 세포에 전달되는 화물 단백질은 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 뉴클레아제, 이뮤노글로불린 또는 그의 단편, 수용체, T-세포 수용체, 시토카인, 효소 또는 리콤비나제이다. 일부 실시양태에서, 전달되는 단백질은 p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제, BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre 리콤비나제, Dre 리콤비나제, 또는 FLP 리콤비나제이다. 일부 실시양태에서, 화물 단백질은 소분자와 회합된다. 일부 실시양태에서, 전달되는 화물 단백질은 진단제이다. 일부 실시양태에서, 전달되는 화물 단백질은 예방제이다. 일부 실시양태에서, 전달되는 화물 단백질은 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것에서는 그렇지 않다.
보존된: 본원에 사용된 용어 "보존된"은 비교되는 2개 이상의 관련된 서열의 동일한 위치에서 비변경되어 발생하는 것들인, 각각 폴리뉴클레오티드 서열 또는 아미노산 서열의 뉴클레오티드 또는 아미노산 잔기를 지칭한다. 상대적으로 보존된 뉴클레오티드 또는 아미노산은 서열에서 다른 곳에서 나타나는 뉴클레오티드 또는 아미노산보다 더 관련된 서열 중에서 보존된 것들이다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 100% 동일한 경우 "완전히 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 또는 적어도 95% 동일한 경우 "고도로 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 약 70% 동일한, 약 80% 동일한, 약 90% 동일한, 약 95% 동일한, 약 98% 동일한, 또는 약 99% 동일한 경우 "고도로 보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 적어도 60% 동일한, 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 또는 적어도 95% 동일한 경우 "보존된" 것으로 이야기된다. 일부 실시양태에서, 2개 이상의 서열은 이들이 서로와 약 30% 동일한, 약 40% 동일한, 약 50% 동일한, 약 60% 동일한, 약 70% 동일한, 약 80% 동일한, 약 90% 동일한, 약 95% 동일한, 약 98% 동일한, 또는 약 99% 동일한 경우 "보존된" 것으로 이야기된다.
조작된: 본원에 사용된 용어 "조작된"은 인간에 의해 디자인된, 생산된, 제조된, 합성된, 및/또는 제작된 단백질, 핵산, 복합체, 물질, 또는 실체를 지칭한다. 따라서, 조작된 산물은 자연에서 발생하지 않는 산물이다. 일부 실시양태에서, 조작된 단백질 또는 핵산은 특정 요건을 충족시키도록 또는 특정 디자인 특색을 갖도록 디자인된 단백질 또는 핵산이다. 예를 들어, Cas9 화물 단백질은 1개 이상의 WW 도메인을 Cas9 단백질에 융합시킴으로써 최소 ARRDC1과 회합되어 ARMM 내로의 Cas9 화물 단백질의 로딩을 용이하게 하도록 조작될 수 있다. 또 다른 예로서, 가이드 RNA (gRNA)는 특이적 게놈 서열에의 Cas9 화물 단백질의 전달을 표적화하도록 조작될 수 있다.
발현: 본원에 사용된 핵산 서열의 "발현"은 하기 사건 중 하나 이상을 지칭한다: (1) DNA 서열로부터의 RNA 주형의 생성 (예를 들어, 전사에 의해); (2) RNA 전사체의 프로세싱 (예를 들어, 스플라이싱, 편집, 5' 캡 형성, 및/또는 3' 단부 프로세싱에 의해); (3) 폴리펩티드 또는 단백질로의 RNA의 번역; 및 (4) 폴리펩티드 또는 단백질의 번역후 변형.
기능적: 본원에 사용된 "기능적" 생물학적 분자는 그것이 특징규명되거나 유용한 특성 및/또는 활성을 나타내는 형태의 생물학적 분자이다.
융합 단백질: 본원에 사용된 "융합 단백질"은 제2 단백질 모이어티, 예를 들어, 표적 세포에 전달되는 단백질과의 펩티드 연결을 갖는 제1 단백질 모이어티, 예를 들어, ARRCD1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편을 포함한다. 특정 실시양태에서, 융합 단백질은 단일 융합 유전자에 의해 코딩된다.
유전자: 본원에 사용된 용어 "유전자"는 관련 기술분야에서 이해되는 바와 같은 그의 의미를 갖는다. 용어 "유전자"는 유전자 조절 서열 (예를 들어, 프로모터, 인핸서 등) 및/또는 인트론 서열을 포함할 수 있음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 유전자의 정의는 단백질을 코딩하지 않지만, 오히려 기능적 RNA 분자, 예컨대 gRNA, RNAi 작용제, 리보자임, tRNA, rRNA 등을 코딩하는 핵산에 대한 언급을 포함함이 추가로 인지될 것이다. 명확성의 목적을 위해, 본 출원에 사용된 용어 "유전자"는 일반적으로 단백질을 코딩하는 핵산의 부분을 지칭하며; 상기 용어는 관련 기술분야의 통상의 기술자에게 맥락으로부터 명백할 것인 바와 같이, 임의로 조절 서열을 포괄할 수 있음이 주목되어야 한다. 이 정의는 비-단백질-코딩 발현 단위에 대한 용어 "유전자"의 적용을 배제하는 것으로 의도되지 않으며, 오히려 대부분의 경우에, 본원에 사용된 용어가 단백질-코딩 핵산을 지칭함을 명확하게 하도록 의도된다.
유전자 산물 또는 발현 산물: 본원에 사용된 용어 "유전자 산물" 또는 "발현 산물"은 일반적으로 유전자로부터 전사된 RNA (프로세싱전 및/또는 프로세싱후) 또는 유전자로부터 전사된 RNA에 의해 코딩된 폴리펩티드 (변형전 및/또는 변형후)를 지칭한다.
녹색 형광 단백질: 본원에 사용된 용어 "녹색 형광 단백질" (GFP)은 원래 청색 광에 노출되는 경우 녹색을 형광시키는 해파리 아에쿠오레아 빅토리아(Aequorea victoria)로부터 단리된 단백질 또는 이러한 단백질의 유도체 (예를 들어, 단백질의 증진된 또는 파장-이동된 버전)를 지칭한다. 야생형 GFP의 아미노산 서열은 하기와 같다:
적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일한 단백질은 또한 녹색 형광 단백질인 것으로 간주된다.
상동성: 본원에 사용된 용어 "상동성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 일부 실시양태에서, 중합체성 분자는 그들의 서열이 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 동일한 경우 서로에 대해 "상동"인 것으로 간주된다. 일부 실시양태에서, 중합체성 분자는 그들의 서열이 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 유사한 경우 서로에 대해 "상동"인 것으로 간주된다. 용어 "상동"은 필수적으로 적어도 2개의 서열 (뉴클레오티드 서열 또는 아미노산 서열) 사이의 비교를 지칭한다. 본 발명에 따르면, 2개의 뉴클레오티드 서열은 이들이 코딩하는 폴리펩티드가 적어도 약 20개의 아미노산의 적어도 1개의 스트레치에 대해 적어도 약 50% 동일한, 적어도 약 60% 동일한, 적어도 약 70% 동일한, 적어도 약 80% 동일한, 또는 적어도 약 90% 동일한 경우 상동인 것으로 간주된다. 일부 실시양태에서, 상동 뉴클레오티드 서열은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 코딩하는 능력을 특징으로 한다. 서로에 비해 이들 아미노산의 동일성 및 대략적 간격 둘 다는 상동인 것으로 간주되는 뉴클레오티드 서열에 대해 고려되어야 한다. 60개 미만의 뉴클레오티드의 길이의 뉴클레오티드 서열에 대해, 상동성은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 코딩하는 능력에 의해 결정된다. 본 발명에 따르면, 2개의 단백질 서열은 단백질이 적어도 약 20개의 아미노산의 적어도 1개의 스트레치에 대해 적어도 약 50% 동일한, 적어도 약 60% 동일한, 적어도 약 70% 동일한, 적어도 약 80% 동일한, 또는 적어도 약 90% 동일한 경우 상동인 것으로 간주된다.
동일성: 본원에 사용된 용어 "동일성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 2개의 핵산 서열의 퍼센트 동일성의 계산은 예를 들어, 최적 비교 목적을 위해 2개의 서열을 정렬함으로써 수행될 수 있다 (예를 들어, 갭은 최적 정렬을 위해 제1 및 제2 핵산 서열 중 하나 또는 둘 다에 도입될 수 있고, 비-동일한 서열은 비교 목적을 위해 무시될 수 있음). 특정 실시양태에서, 비교 목적을 위해 정렬된 서열의 길이는 참조 서열의 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 100%이다. 이어서 상응하는 뉴클레오티드 위치에서의 뉴클레오티드가 비교된다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 뉴클레오티드에 의해 점유되는 경우, 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은 2개의 서열의 최적 정렬을 위해 도입될 필요가 있는 갭의 수, 및 각각의 갭의 길이를 고려한, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 2개의 서열 사이의 서열의 비교 및 퍼센트 동일성의 결정은 수학적 알고리즘을 사용하여 달성될 수 있다. 예를 들어, 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 그의 각각이 본원에 참조로 포함되는 문헌 [Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988]; [Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993]; [Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987]; [Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994]; 및 [Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991]에 기재된 것들과 같은 방법을 사용하여 결정될 수 있다. 예를 들어, 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 PAM120 가중치 잔기 표, 12의 갭 길이 페널티 및 4의 갭 페널티를 사용하여 ALIGN 프로그램 (버전 2.0)에 포함된 문헌 [Meyers and Miller (CABIOS, 1989, 4:11-17)]의 알고리즘을 사용하여 결정될 수 있다. 2개의 뉴클레오티드 서열 사이의 퍼센트 동일성은 대안적으로, NWSgapdna.CMP 매트릭스를 사용한 GCG 소프트웨어 패키지에서의 GAP 프로그램을 사용하여 결정될 수 있다. 서열 사이의 퍼센트 동일성을 결정하기 위해 통상적으로 채용되는 방법은 본원에 참조로 포함되는 문헌 [Carillo, H., and Lipman, D., SIAM J Applied Math., 48:1073 (1988)]에 개시된 것들을 포함하나 이에 제한되지는 않는다. 동일성을 결정하기 위한 기술은 공개적으로 이용가능한 컴퓨터 프로그램에서 성문화된다. 2개의 서열 사이의 상동성을 결정하기 위한 예시적인 컴퓨터 소프트웨어는 GCG 프로그램 패키지 (Devereux, J., et al., Nucleic Acids Research, 12(1), 387 (1984)), BLASTP, BLASTN, 및 FASTA (Atschul, S. F. et al., J. Molec. Biol., 215, 403 (1990))을 포함하나 이에 제한되지는 않는다.
유전자의 발현을 억제하다: 본원에 사용된 어구 "유전자의 발현을 억제하다"는 유전자의 발현 산물의 양의 검소를 유발하는 것을 의미한다. 발현 산물은 유전자로부터 전사된 RNA (예를 들어, mRNA) 또는 유전자로부터 전사된 mRNA로부터 번역된 폴리펩티드일 수 있다. 전형적으로 mRNA의 수준의 감소는 그로부터 번역되는 폴리펩티드의 수준의 감소를 발생시킨다. 유전자 발현의 수준은 mRNA 및/또는 단백질 수준을 측정하기 위한 표준 기술을 사용하여 결정될 수 있다.
시험관내에서: 본원에 사용된 용어 "시험관내에서"는 유기체 (예를 들어, 동물, 식물, 또는 미생물) 내에서라기 보다는 인공 환경에서, 예를 들어, 시험 튜브 또는 반응 용기에서, 세포 배양물에서, 페트리 디쉬에서 등에서 일어나는 사건을 지칭한다.
생체내에서: 본원에 사용된 용어 "생체내에서"는 유기체 (예를 들어, 동물, 식물, 또는 미생물) 내에서 일어나는 사건을 지칭한다.
단리된: 본원에 사용된 용어 "단리된"은 (1) 그것이 처음에 생산될 때 (자연에서든 또는 실험실 환경에서든) 그것이 회합된 성분의 적어도 일부로부터 분리된, 및/또는 (2) 사람의 손에 의해 생산된, 제조된, 및/또는 제작된 물질 또는 실체를 지칭한다. 단리된 물질 및/또는 실체는 이들이 처음에 회합된 다른 성분의 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 또는 그 초과로부터 분리될 수 있다. 일부 실시양태에서, 단리된 물질은 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 초과, 또는 약 99% 초과 순수하다. 본원에 사용된 물질은 그것이 다른 성분이 실질적으로 없는 경우 "순수하다."
링커: 본원에 사용된 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어, 최소 ARRDC1 단백질 및 표적, 예컨대 Cas9 뉴클레아제를 연결하는 화학적 모이어티를 지칭한다. 전형적으로, 링커는 2개의 기, 분자, 또는 다른 모이어티 사이에 위치하거나, 그에 의해 플랭킹되며, 공유 결합을 통해 매개에 연결되고, 따라서 2개를 연결한다. 일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)을 포함한다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 다른 화학적 모이어티이다. 일부 실시양태에서, 링커는 절단가능한 링커이며, 예를 들어, 링커는 예를 들어, UV 광 또는 가수분해 효소, 예컨대 프로테아제 또는 에스테라제에의 노출 시 절단될 수 있는 결합을 포함한다. 일부 실시양태에서, 링커는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 또는 그 초과의 아미노산을 갖는 아미노산의 임의의 스트레치이다. 다른 실시양태에서, 링커는 화학 결합 (예를 들어, 공유 결합)이다.
마이크로RNA (miRNA): 본원에 사용된 용어 "마이크로RNA" 또는 "miRNA"는 대략 21 뉴클레오티드 (nt) 내지 23 nt의 길이인 RNAi 작용제를 지칭한다. miRNA는 18 nt 내지 26 nt의 길이의 범위일 수 있다. 전형적으로, miRNA는 단일-가닥이다. 그러나, 일부 실시양태에서, miRNA는 적어도 부분적으로 이중-가닥일 수 있다. 특정 실시양태에서, miRNA는 RNA 듀플렉스 (본원에서 "듀플렉스 영역"으로 지칭됨)를 포함할 수 있고, 임의로 1 내지 3개의 단일-가닥 오버행을 추가로 포함할 수 있다. 일부 실시양태에서, RNAi 작용제는 15 bp 내지 29 bp의 길이의 범위이고 임의로 1 또는 2개의 단일-가닥 오버행을 추가로 포함하는 듀플렉스 영역을 포함한다. miRNA는 함께 혼성화하는 2개의 RNA 분자로부터 형성될 수 있거나, 또는 대안적으로 자기-혼성화 부분을 포함하는 단일 RNA 분자로부터 생성될 수 있다. 일반적으로, miRNA 분자의 유리 5' 단부는 포스페이트 기를 갖고, 유리 3' 단부는 히드록실 기를 갖는다. miRNA의 듀플렉스 부분은 통상적으로, 그러나 반드시 그렇지는 않지만, 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함한다. miRNA의 한 가닥은 표적 RNA와 혼성화하는 부분을 포함한다. 특정 실시양태에서, miRNA의 한 가닥은 표적 RNA의 영역과 정확하게 상보적이지는 않으며, 이는 miRNA가 1개 이상의 미스매치를 갖고 표적 RNA에 혼성화함을 의미한다. 일부 실시양태에서, miRNA의 한 가닥은 표적 RNA의 영역과 정확하게 상보적이며, 이는 miRNA가 미스매치 없이 표적 RNA에 혼성화함을 의미한다. 전형적으로, miRNA는 표적 전사체의 번역을 억제함으로써 유전자 발현의 억제를 매개하는 것으로 생각된다. 그러나, 일부 실시양태에서, miRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개할 수 있다.
본원에 사용된 용어 "미세소포"는 지질 이중층에 의해 둘러싸인 액체의 액적을 지칭한다. 일부 실시양태에서, 미세소포는 약 10 nm 내지 약 1000 nm의 직경을 갖는다. 일부 실시양태에서, 미세소포는 적어도 약 10 nm, 적어도 약 20 nm, 적어도 약 30 nm, 적어도 약 40 nm, 적어도 약 50 nm, 적어도 약 60 nm, 적어도 약 70 nm, 적어도 약 80 nm, 적어도 약 90 nm, 적어도 약 100 nm, 적어도 약 125 nm, 적어도 약 150 nm, 적어도 약 175 nm, 적어도 약 200 nm, 적어도 약 250 nm, 적어도 약 300 nm, 적어도 약 400 nm, 또는 적어도 약 500 nm의 직경을 갖는다. 일부 실시양태에서, 미세소포는 약 1000 nm 미만, 약 900 nm 미만, 약 800 nm 미만, 약 700 nm 미만, 약 600 nm 미만, 약 500 nm 미만, 약 400 nm 미만, 약 300 nm 미만, 약 250 nm 미만, 약 200 nm 미만, 약 150 nm 미만, 약 100 nm 미만, 약 90 nm 미만, 약 80 nm 미만, 약 70 nm 미만, 약 60 nm 미만, 또는 약 50 nm 미만의 직경을 갖는다. 용어 미세소포는 세포로부터 쉐딩된 미세소포 뿐만 아니라 합성적으로 생산된 미세소포를 포함한다. 세포로부터 쉐딩된 미세소포는 전형적으로 이들이 기원하는 세포의 항원 내용물을 포함한다. 세포로부터 쉐딩된 미세소포는 또한 전형적으로 이들이 기원하는 세포의 인지질 분포를 반영하는 인지질의 비대칭 분포를 포함한다. 일부 실시양태에서, 예를 들어, 일부 ARMM의 본원에서 제공된 미세소포의 내막은 지질 이중층 내에 대다수의 아미노인지질, 포스피타딜세린, 및/또는 포스파티딜에탄올아민을 포함한다.
최소 ARRDC1: 본원에 사용된 용어 "최소 ARRDC1"은 전장 ARRDC1 단백질보다 더 짧고, 적어도, 아레스틴 도메인의 부분, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하는 ARRDC1 단백질을 지칭한다. 예시적인 최소 ARRDC1은 서열식별번호: 1에 제공된다.
핵산: 그의 가장 넓은 의미에서 본원에 사용된 용어 "핵산"은 올리고뉴클레오티드 쇄 내로 혼입되거나 혼입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 실시양태에서, 핵산은 포스포디에스테르 연결을 통해 올리고뉴클레오티드 쇄 내로 혼입되거나 혼입될 수 있는 화합물 및/또는 물질이다. 일부 실시양태에서, "핵산"은 개별적 핵산 잔기 (예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 개별적 핵산 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체 (예를 들어, 적어도 2개의 뉴클레오티드의 스트링)를 지칭하기 위해 상호교환가능하게 사용될 수 있다. 일부 실시양태에서, "핵산"은 RNA 뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포괄한다. 더욱이, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 즉, 포스포디에스테르 백본 이외를 갖는 유사체를 포함한다. 예를 들어, 관련 기술분야에 공지되어 있고 백본에 포스포디에스테르 결합 대신 펩티드 결합을 갖는 소위 "펩티드 핵산"은 본 발명의 범위 내인 것으로 간주된다. 용어 "아미노산 서열을 코딩하는 뉴클레오티드 서열"은 서로의 축퇴성 버전이고/거나 동일한 아미노산 서열을 코딩하는 모든 뉴클레오티드 서열을 포함한다. 단백질 및/또는 RNA를 코딩하는 뉴클레오티드 서열은 인트론을 포함할 수 있다. 핵산은 자연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생산되고, 임의로 정제되고, 화학적으로 합성될 수 있는 등이다. 적절한 경우, 예를 들어, 화학적으로 합성된 분자의 경우, 핵산은 뉴클레오시드 유사체, 예컨대 화학적으로 변형된 염기 또는 당, 백본 변형 등을 갖는 유사체를 포함할 수 있다. 핵산 서열은 달리 지시되지 않는 한, 5'에서 3' 방향으로 제시된다. 용어 "핵산 절편"은 보다 긴 핵산 서열의 부분인 핵산 서열을 지칭하기 위해 본원에서 사용된다. 많은 실시양태에서, 핵산 절편은 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 잔기를 포함한다. 일부 실시양태에서, 핵산은 천연 뉴클레오시드 (예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘); 뉴클레오시드 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기 (예를 들어, 메틸화된 염기); 개재된 염기; 변형된 당 (예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스); 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트 및 5'-N-포스포로아미다이트 연결)이거나 이를 포함한다. 일부 실시양태에서, 본 발명은 구체적으로 "비변형된 핵산"에 관한 것이며, 이는 전달을 용이하게 하거나 달성하기 위해 화학적으로 변형되지 않은 핵산 (예를 들어, 뉴클레오티드 및/또는 뉴클레오시드를 포함한 폴리뉴클레오티드 및 잔기)을 의미한다.
단백질: 용어 "단백질"은 본원에서 용어 폴리펩티드 및 펩티드와 상호교환가능하게 사용되며, 폴리펩티드 (즉, 펩티드 결합에 의해 서로에 연결된 적어도 2개의 아미노산의 스트링)를 지칭한다. 단백질은 아미노산 이외의 모이어티를 포함할 수 있고/거나 (예를 들어, 당단백질일 수 있음), 다르게는 프로세싱되거나 변형될 수 있다. 관련 기술분야의 통상의 기술자는 "단백질"이 세포에 의해 생산된 바와 같은 완전한 폴리펩티드 쇄 (신호 서열을 갖거나 갖지 않음)일 수 있거나, 또는 그의 기능적 부분일 수 있음을 인지할 것이다. 통상의 기술자는 단백질이 때때로 예를 들어 1개 이상의 디술피드 결합에 의해 연결되거나 다른 수단에 의해 회합된 1개 초과의 폴리펩티드 쇄를 포함할 수 있음을 추가로 인지할 것이다. 폴리펩티드는 L-아미노산, D-아미노산, 또는 둘 다를 함유할 수 있고, 관련 기술분야에 공지된 임의의 다양한 아미노산 변형 또는 유사체를 함유할 수 있다. 유용한 변형은 예를 들어, 화학적 실체, 예컨대 탄수화물 기, 포스페이트 기, 파르네실 기, 이소파르네실 기, 지방산 기, 아미드 기, 말단 아세틸 기, 접합, 관능화, 또는 다른 변형 (예를 들어, 알파 아미드화)을 위한 링커 등의 첨가를 포함한다. 특정 실시양태에서, 펩티드의 변형은 보다 안정한 펩티드 (예를 들어, 생체내에서 보다 큰 반감기)를 초래한다. 이들 변형은 펩티드의 환화, D-아미노산의 혼입 등을 포함할 수 있다. 어떠한 변형도 펩티드의 바람직한 생물학적 활성을 실질적으로 방해하지 않아야 한다. 특정 실시양태에서, 펩티드의 변형은 보다 생물학적으로 활성인 펩티드를 초래한다. 일부 실시양태에서, 폴리펩티드는 천연 아미노산, 비-천연 아미노산, 합성 아미노산, 아미노산 유사체, 및 이들의 조합을 포함할 수 있다.
리콤비나제: 본원에 사용된 용어 "리콤비나제"는 리콤비나제 인식 서열 사이의 DNA 단편의 절제, 통합, 역전, 또는 교환 (예를 들어, 전위)을 발생시키는 리콤비나제 인식 서열 사이의 DNA의 재조합을 매개하는 부위-특이적 효소를 지칭한다. 리콤비나제는 2개의 별개의 패밀리로 분류될 수 있다: 세린 리콤비나제 (예를 들어, 리졸바제 및 인버타제) 및 티로신 리콤비나제 (예를 들어, 인테그라제). 세린 리콤비나제의 예는 제한 없이, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, 및 gp29를 포함한다. 티로신 리콤비나제의 예는 제한 없이, Cre, FLP, R, Lambda, HK101, HK022, 및 pSAM2를 포함한다. 세린 및 티로신 리콤비나제 명칭은 리콤비나제가 DNA를 공격하기 위해 사용하고 가닥 교환 동안 DNA에 공유 연결되게 되는 보존된 친핵성 아미노산 잔기로부터 유래한다. 리콤비나제는 유전자 넉아웃/넉-인의 생성 및 유전자 요법 적용을 포함한 다수의 적용을 갖는다. 예를 들어, 문헌 [Brown et al., "Serine recombinases as tools for genome engineering." Methods. 2011;53(4):372-9]; [Hirano et al., "Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011; 92(2):227-39]; [Chavez and Calos, "Therapeutic applications of the ΦC31 integrase system." Curr. Gene Ther. 2011;11(5):375-81]; [Turan and Bode, "Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011; 25(12):4088-107]; [Venken and Bellen, "Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase." Methods Mol. Biol. 2012; 859:203-28]; [Murphy, "Phage recombinases and their applications." Adv. Virus Res. 2012; 83:367-414]; [Zhang et al., "Conditional gene manipulation: Cre-ating a new biological era." J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24]; [Karpenshif and Bernstein, "From yeast to mammals: recent advances in genetic control of homologous recombination." DNA Repair (Amst). 2012; 1;11(10):781-8]을 참조하며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 본원에서 제공된 리콤비나제는 본 발명의 실시양태에 사용될 수 있는 리콤비나제의 배타적인 예인 것으로 의미되지 않는다. 본 발명의 방법 및 조성물은 새로운 직교 리콤비나제에 대한 데이터베이스를 채굴하거나 한정된 DNA 특이성을 갖는 합성 리콤비나제를 디자인함으로써 확장될 수 있다 (예를 들어, 문헌 [Groth et al., "Phage integrases: biology and applications." J. Mol. Biol. 2004; 335, 667-678]; [Gordley et al., "Synthesis of programmable integrases." Proc. Natl. Acad. Sci. U S A. 2009; 106, 5053-5058] 참조; 각각의 전체 내용은 그 전문이 본원에 참조로 포함됨). 본원에 기재된 방법 및 조성물에 유용한 리콤비나제의 다른 예는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 발견되거나 생성되는 임의의 새로운 리콤비나제는 본 발명의 상이한 실시양태에 사용될 수 있을 것으로 예상된다. 일부 실시양태에서, 리콤비나제 (또는 그의 촉매 도메인)는 Cas9 단백질 (예를 들어, dCas9)에 융합된다.
재조합하다: 핵산 변형 (예를 들어, 게놈 변형)의 맥락에서 용어 "재조합하다" 또는 "재조합"은 2개 이상의 핵산 분자, 또는 단일 핵산 분자의 2개 이상의 영역이 리콤비나제 단백질의 작용에 의해 변형되는 프로세스를 지칭하기 위해 사용된다. 재조합은 그 중에서도, 예를 들어 1개 이상의 핵산 분자에서 또는 그 사이에 핵산 서열의 삽입, 역전, 절제, 또는 전위를 발생시킬 수 있다.
재프로그래밍 인자: 본원에 사용된 용어 "재프로그래밍 인자"는 단독으로 또는 다른 인자와 조합으로 세포의 상태를 체세포, 분화된 상태로부터 다능성 줄기 세포 상태로 변화시킬 수 있는 인자를 지칭한다. 재프로그래밍 인자의 비-제한적 예는 단백질 (예를 들어, 전사 인자), 펩티드, 핵산, 또는 소분자를 포함한다. 세포 재프로그래밍에 유용한 공지된 재프로그래밍 인자는 Oct4, Sox2, Klf4, 및 c-myc를 포함하나 이에 제한되지는 않는다. 유사하게, 프로그래밍 인자는 세포 분화 또는 탈-분화를 조정하는데, 예를 들어, 바람직한 계통을 향한 세포 분화를 용이하게 하거나 유도하는데 사용될 수 있다.
RNA 간섭 (RNAi): 본원에 사용된 용어 "RNA 간섭" 또는 "RNAi"는 유전자 발현의 서열-특이적 억제 및/또는 RNA에 의해 매개되는 표적 RNA 수준의 감소를 지칭하며, 여기서 RNA는 표적 RNA에 실질적으로 상보적인 부분을 포함한다. 전형적으로, 실질적으로 상보적인 부분의 적어도 일부는 RNA의 이중 가닥 영역 내에 있다. 일부 실시양태에서, RNAi는 RNA의 선택적 세포내 분해를 통해 일어날 수 있다. 일부 실시양태에서, RNAi는 번역 억제에 의해 일어날 수 있다.
RNAi 작용제: 본원에 사용된 용어 "RNAi 작용제" 또는 "RNAi"는 RNAi 메커니즘을 통해 유전자 발현의 억제를 매개할 수 있는 분자의 구조 특징을 갖는 1종 이상의 뉴클레오티드 유사체 또는 변형을 임의로 포함하는 RNA를 지칭한다. 일부 실시양태에서, RNAi 작용제는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다. 일부 실시양태에서, RNAi 작용제는 표적 전사체의 번역을 억제함으로써 유전자 발현의 억제를 매개한다. 일반적으로, RNAi 작용제는 표적 RNA에 실질적으로 상보적인 부분을 포함한다. 일부 실시양태에서, RNAi 작용제는 적어도 부분적으로 이중-가닥이다. 일부 실시양태에서, RNAi 작용제는 단일-가닥이다. 일부 실시양태에서, 예시적인 RNAi 작용제는 siRNA, shRNA, 및/또는 miRNA를 포함할 수 있다. 일부 실시양태에서, RNAi 작용제는 천연 RNA 뉴클레오티드 (즉, 아데닌, 구아닌, 시토신, 및 우라실)로 전체적으로 구성될 수 있다. 일부 실시양태에서, RNAi 작용제는 1종 이상의 비-천연 RNA 뉴클레오티드 (예를 들어, 뉴클레오티드 유사체, DNA 뉴클레오티드 등)를 포함할 수 있다. 비-천연 RNA 핵산 잔기의 포함은 RNAi 작용제를 RNA보다 세포 분해에 더 저항성으로 만드는데 사용될 수 있다. 일부 실시양태에서, 용어 "RNAi 작용제"는 RNAi 효과 (예를 들어, 표적 RNA의 분해 및/또는 번역의 억제)를 유도하는 RNA를 코딩하는 임의의 RNA, RNA 유도체, 및/또는 핵산을 지칭할 수 있다. 일부 실시양태에서, RNAi 작용제는 다이서(Dicer) 기질로서 작용할 수 있는 블런트-단부 (즉, 오버행이 없는) dsRNA를 포함할 수 있다. 예를 들어, 이러한 RNAi 작용제는 임의로 화학적으로 변형되어 면역 반응을 철폐할 수 있는 ≥ 25 염기 쌍 길이인 블런트-단부 dsRNA를 포함할 수 있다.
RNAi-유도제: 본원에 사용된 용어 "RNAi-유도제"는 RNAi 작용제의 활성을 전달하고/거나, 조절하고/거나, 변형시키는 임의의 실체를 포괄한다. 일부 실시양태에서, RNAi-유도제는 세포 내의 그의 존재가 RNAi를 발생시키고 RNAi-유도제가 표적화되는 전사체의 감소된 발현을 초래하는 벡터 (사람의 손에 의해 변형되지 않은 천연 발생 분자 이외의)를 포함할 수 있다. 일부 실시양태에서, RNAi-유도제는 RNAi-유도 벡터이다. 일부 실시양태에서, RNAi-유도제는 RNAi 작용제 및 1종 이상의 제약상 허용되는 부형제 및/또는 담체를 포함하는 조성물이다. 일부 실시양태에서, RNAi-유도제는 "RNAi-유도 벡터"이며, 이는 세포 내의 그의 존재가 자기-혼성화하거나 서로에 혼성화하여 RNAi 작용제 (예를 들어 siRNA, shRNA, 및/또는 miRNA)를 형성하는 1종 이상의 RNA의 생산을 발생시키는 벡터를 지칭한다. 다양한 실시양태에서, 이 용어는 세포 내의 그의 존재가 자기-혼성화하거나 서로에 혼성화하여 RNAi 작용제를 형성하는 1종 이상의 RNA의 생산을 발생시키는 플라스미드, 예를 들어, DNA 벡터 (그의 서열이 바이러스로부터 유래된 서열 요소를 포함할 수 있음), 또는 바이러스 (사람의 손에 의해 변형되지 않은 천연 발생 바이러스 또는 플라스미드 이외의)를 포괄한다. 일반적으로, 벡터는 혼성화하거나 자기-혼성화하여 RNAi 작용제를 형성하는 1종 이상의 RNA가 벡터가 세포 내에 존재하는 경우 전사되도록 발현 신호(들)에 작동가능하게 연결된 핵산을 포함한다. 따라서 벡터는 RNA 또는 RNA들 또는 그의 전구체의 세포내 합성을 위한 주형을 제공한다. RNAi를 유도하는 목적을 위해, 세포에서의 바이러스 게놈의 존재 (예를 들어, 세포막과의 바이러스 외피의 융합 후)는 세포 내의 바이러스의 존재를 구성하는데 충분한 것으로 간주된다. 또한, RNAi를 유도하는 목적을 위해, 벡터는 그것이 세포 내에서 후속적으로 변형되거나 프로세싱되는지 여부와 무관하게, 그것이 세포 내로 도입되거나, 세포에 진입하거나, 모 세포로부터 유전되는 경우, 세포 내에 존재하는 것으로 간주된다. RNAi-유도 벡터는 세포 내의 벡터의 존재가 서로에 혼성화하거나 자기-혼성화하여 전사체에 표적화된 RNAi 작용제를 형성하는 1종 이상의 RNA의 생산을 발생시키는 경우, 즉, 세포 내의 벡터의 존재가 전사체에 표적화된 1종 이상의 RNAi 작용제의 생산을 발생시키는 경우, 전사체에 표적화되는 것으로 간주된다.
RNA-프로그램가능한 뉴클레아제: 용어 "RNA-프로그램가능한 뉴클레아제" 및 "RNA-가이드된 뉴클레아제"는 본원에서 상호교환가능하게 사용되며, 절단을 위한 표적이 아닌 1개 이상의 RNA 분자와 복합체를 형성하는 (예를 들어, 그와 결합하거나 회합하는) 뉴클레아제를 지칭한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는, RNA와의 복합체에서의 경우, 뉴클레아제:RNA 복합체로 지칭될 수 있다. RNA-프로그램가능한 뉴클레아제는 Cas9 뉴클레아제를 포함한다. 전형적으로, 결합된 RNA(들)는 가이드 RNA (gRNA)로 지칭된다. gRNA는 2개 이상의 RNA의 복합체로서, 또는 단일 RNA 분자로서 존재할 수 있다. 단일 RNA 분자로서 존재하는 gRNA는 단일-가이드 RNA (sgRNA)로 지칭될 수 있지만, "gRNA"는 단일 분자로서 또는 2개 이상의 분자로서 존재하는 가이드 RNA를 지칭하기 위해 상호교환가능하게 사용된다. 전형적으로, 단일 RNA 종으로서 존재하는 gRNA는 2개의 도메인을 포함한다: (1) 표적 핵산과 상동성을 공유하는 도메인 (예를 들어, 및 표적에의 Cas9 복합체의 결합을 지정함); 및 (2) 엔도뉴클레아제 효소 (예를 들어, Cas9 단백질)에 결합하는 도메인. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함하며, 이는 상기 표적 부위에의 뉴클레아제/RNA 복합체의 결합을 매개하고, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다.
짧은 간섭 RNA (siRNA): 본원에 사용된 용어 "짧은 간섭 RNA" 또는 "siRNA"는 대략 19 염기 쌍 (bp)의 길이이고 임의로 1 내지 3개의 단일-가닥 오버행을 추가로 포함하는 RNA 듀플렉스 (본원에서 "듀플렉스 영역"으로 지칭됨)를 포함하는 RNAi 작용제를 지칭한다. 일부 실시양태에서, RNAi 작용제는 15 bp 내지 29 bp의 길이의 범위이고 임의로 1 또는 2개의 단일-가닥 오버행을 추가로 포함하는 듀플렉스 영역을 포함한다. siRNA는 함께 혼성화하는 2개의 RNA 분자로부터 형성될 수 있거나, 또는 대안적으로 자기-혼성화 부분을 포함하는 단일 RNA 분자로부터 생성될 수 있다. 일반적으로, siRNA 분자의 유리 5'-단부는 포스페이트 기를 갖고, 유리 3'-단부는 히드록실 기를 갖는다. siRNA의 듀플렉스 부분은 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함할 수 있지만, 전형적으로 그렇지 않다. siRNA의 한 가닥은 표적 전사체와 혼성화하는 부분을 포함한다. 특정 실시양태에서, siRNA의 한 가닥은 표적 전사체의 영역과 정확하게 상보적이며, 이는 siRNA가 단일 미스매치 없이 표적 전사체에 혼성화함을 의미한다. 일부 실시양태에서, siRNA 및 표적 전사체의 표적화된 부분 사이에 1개 이상의 미스매치가 존재할 수 있다. 완벽한 상보성이 달성되지 않는 일부 실시양태에서, 임의의 미스매치는 일반적으로 siRNA 말단에 또는 그 부근에 위치한다. 일부 실시양태에서, siRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다.
짧은 헤어핀 RNA (shRNA): 본원에 사용된 용어 "짧은 헤어핀 RNA" 또는 "shRNA"는 혼성화된 또는 혼성화되어 RNAi를 매개하는데 충분히 긴 이중-가닥 (듀플렉스) 구조 (전형적으로 적어도 대략 19 bp의 길이)를 형성할 수 있는 적어도 2개의 상보적 부분, 및 루프를 형성하는 전형적으로 대략 1 뉴클레오티드 (nt) 내지 대략 10 nt의 길이의 범위인 적어도 1개의 단일-가닥 부분을 갖는 RNA를 포함하는 RNAi 작용제를 지칭한다. 일부 실시양태에서, shRNA는 15 bp 내지 29 bp의 길이의 범위인 듀플렉스 부분 및 루프를 형성하는 전형적으로 대략 1 nt 내지 대략 10 nt의 길이의 범위인 적어도 1개의 단일-가닥 부분을 포함한다. 듀플렉스 부분은 1개 이상의 비쌍형성된 뉴클레오티드로 이루어진 1개 이상의 벌지를 포함할 수 있지만, 전형적으로 그렇지 않다. 일부 실시양태에서, siRNA는 표적 전사체의 분해를 유발함으로써 유전자 발현의 억제를 매개한다. shRNA는 보존된 세포 RNAi 기구에 의해 siRNA로 프로세싱되는 것으로 생각된다. 따라서, shRNA는 siRNA의 전구체일 수 있다. 이와 무관하게, siRNA는 일반적으로 siRNA와 유사하게 표적 RNA의 발현을 억제할 수 있다.
소분자: 일반적으로, "소분자"는 실험실에서 제조되거나 자연에서 발견되는 실질적으로 비-펩티드성, 비-올리고머성 유기 화합물을 지칭한다. 본원에 사용된 소분자는 "천연 산물-유사"인 화합물을 지칭할 수 있지만, 용어 "소분자"는 "천연 산물-유사" 화합물에 제한되지 않는다. 오히려, 소분자는 전형적으로 그것이 몇몇 탄소-탄소 결합을 함유하고, 2000 g/mol 미만, 1500 g/mol 미만, 1250 g/mol 미만, 1000 g/mol 미만, 750 g/mol 미만, 500 g/mol 미만, 또는 250 g/mol 미만의 분자량을 갖는 것을 특징으로 하지만, 이 특징은 본 발명의 목적을 위해 제한적인 것으로 의도되지 않는다. 특정 다른 실시양태에서, 천연-산물-유사 소분자가 이용된다.
유사성: 본원에 사용된 용어 "유사성"은 중합체성 분자 사이의, 예를 들어, 핵산 분자 (예를 들어 DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩티드 분자 사이의 전체적 관련성을 지칭한다. 서로에 대한 중합체성 분자의 퍼센트 유사성의 계산은 퍼센트 유사성의 계산이 관련 기술분야에서 이해되어 있는 바와 같이 보존적 치환을 고려한다는 점을 제외하고는 퍼센트 동일성의 계산과 동일한 방식으로 수행될 수 있다.
대상체: 본원에 사용된 용어 "대상체" 또는 "환자"는 본 발명에 따른 조성물이 예를 들어, 실험, 진단, 예방, 및/또는 치료 목적으로 투여될 수 있는 임의의 유기체를 지칭한다. 전형적인 대상체는 동물 (예를 들어, 포유동물, 예컨대 마우스, 래트, 토끼, 비-인간 영장류, 및 인간) 및/또는 식물을 포함한다.
치료 유효량: 본원에 사용된 용어 "치료 유효량"은 질환, 장애, 및/또는 상태를 앓고 있거나 이에 대해 감수성인 대상체에게 투여되는 경우, 질환, 장애, 및/또는 상태를 치료하고/거나, 그의 증상을 개선시키고/거나, 진단하고/거나, 예방하고/거나, 그의 발병을 지연시키는데 충분한 전달되는 작용제 (예를 들어, 핵산, 약물, 치료제, 진단제, 예방제 등)의 양을 의미한다.
전사 인자: 본원에 사용된 용어 "전사 인자"는 예를 들어, 전사의 활성화 또는 억제에 의해 DNA의 RNA로의 전사를 조절하는 DNA-결합 단백질을 지칭한다. 일부 전사 인자는 단독으로 전사의 조절을 실행하는 반면, 다른 것들은 다른 단백질과 협력하여 작용한다. 일부 전사 인자는 특정 조건 하에서 전사를 활성화시키고 억제하는 둘 다를 할 수 있다. 일반적으로, 전사 인자는 표적 유전자의 조절 영역에서 특이적 컨센서스 서열과 매우 유사한 특이적 표적 서열 또는 서열들에 결합한다. 전사 인자는 단독으로 또는 다른 분자와 복합체로 표적 유전자의 전사를 조절할 수 있다. 전사 인자의 예는 Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, 및 NFAT를 포함하나 이에 제한되지는 않는다.
치료하는 것: 본원에 사용된 용어 "치료하는 것"은 특정 질환, 장애, 및/또는 상태의 1종 이상의 증상 또는 특색을 부분적으로 또는 완전히 경감시키고/거나, 개선시키고/거나, 개선시키고/거나, 완화시키고/거나, 그의 발병을 지연시키고/거나, 그의 진행을 억제하고/거나, 그의 중증도를 감소시키고/거나, 그의 발생을 감소시키는 것을 지칭한다. 예를 들어, 암을 "치료하는 것"은 종양의 생존, 성장, 및/또는 확산을 억제하는 것을 지칭할 수 있다. 치료는 질환, 장애, 및/또는 상태와 연관된 병리증상을 발달시킬 위험을 감소시킬 목적으로 질환, 장애, 및/또는 상태의 징후를 나타내지 않는 대상체에게 및/또는 질환, 장애, 및/또는 상태의 단지 초기 징후를 나타내는 대상체에게 투여될 수 있다.
벡터: 본원에 사용된 "벡터"는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 일부 실시양태에서, 벡터는 이들이 숙주 세포, 예컨대 진핵생물 및/또는 원핵생물 세포에서 연결되는 핵산의 염색체외 복제 및/또는 발현을 달성할 수 있다. 작동적으로 연결된 유전자의 발현을 지정할 수 있는 벡터는 본원에서 "발현 벡터"로 지칭된다.
WW 도메인: 본원에 기재된 용어 "WW 도메인"은 짧은 프롤린-풍부 또는 프롤린-함유 모티프와의 단백질-단백질 상호작용을 매개하는 C-말단에 2개의 염기성 잔기를 갖는 단백질 도메인이다. 2개의 염기성 C-말단 아미노산 잔기를 갖는 WW 도메인은 짧은 프롤린-풍부 또는 프롤린-함유 모티프 (즉, PPXY 모티프)와 회합하는 능력을 가질 수 있다. WW 도메인은 AARDC1에서 발견되는 코어 프롤린-풍부 서열, 예컨대 PPXY를 갖는 모티프를 포함한 다양한 별개의 펩티드 리간드에 결합한다. WW 도메인은 20 내지 22개의 아미노산만큼 이격된 2개의 시그니처 트립토판 잔기를 갖는 30 내지 40개의 아미노산 단백질 상호작용 도메인일 수 있다. WW 도메인의 3차원 구조는 이들이 일반적으로 2개의 리간드-결합 그루브를 갖는 3-가닥, 역평행 β 쉬트로 폴딩됨을 제시한다.
WW 도메인은 많은 진핵생물에서 발견되며, 대략 50개의 인간 단백질에 존재한다 (Bork, P. & Sudol, M. The WW domain: a signaling site in dystrophin? Trends Biochem Sci 19, 531-533 (1994)). WW 도메인은 막 표적화 도메인, 예컨대 NEDD4 패밀리 단백질에서의 C2, FE65 단백질에서의 포스포티로신-결합 (PTB) 도메인, CA150 및 FBPIl에서의 FF 도메인, 및 PLEKHA5에서의 플렉스트린 상동성 (PH) 도메인을 포함한 몇몇 다른 상호작용 도메인과 함께 존재할 수 있다. WW 도메인은 또한 NEDD4 패밀리 단백질에서의 HECT E3 단백질-유비퀴틴 리가제 도메인, Pinl에서의 로토머라제 또는 펩티딜 프롤릴이소머라제 도메인, 및 ArhGAP9 및 ArhGAP12에서의 Rho GAP 도메인을 포함한 다양한 촉매 도메인에 연결된다.
본 개시내용에서, WW 도메인은 C-말단에 2개의 염기성 아미노산을 천연적으로 갖는 WW 도메인일 수 있으며, 예를 들어 WW 도메인 또는 WW 도메인 변이체는 인간 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2로부터의 것일 수 있다. WW 도메인 함유 단백질의 예시적인 아미노산 서열 (WW 도메인은 밑줄침)은 하기 열거된다. 본원에 기재된 예시적인 단백질의 임의의 WW 도메인 또는 WW 도메인 변이체는 본 발명에 사용될 수 있으며, 제한적인 것으로 의미되지 않음이 인지되어야 한다.
인간 WWP1 아미노산 서열 (uniprot.org/uniprot/Q9H0M0). 4개의 밑줄친 WW 도메인은 아미노산 349 - 382 (WW1), 381 - 414 (WW2), 456 - 489 (WW3), 및 496 - 529 (WW4)에 상응한다.
인간 WWP2 아미노산 서열 (uniprot.org/uniprot/ O00308). 4개의 밑줄친 WW 도메인은 아미노산 300 - 333 (WW1), 330 - 363 (WW2), 405 - 437 (WW3), 및 444 - 547 (WW4)에 상응한다.
인간 Nedd4-1 아미노산 서열 (uniprot.org/uniprot/ P46934). 4개의 밑줄친 WW 도메인은 아미노산 610 - 643 (WW1), 767 - 800 (WW2), 840 - 873 (WW3), 및 892 - 925 (WW4)에 상응한다.
인간 Nedd4-2 아미노산 서열 (>gi|21361472|ref|NP_056092.2| E3 유비퀴틴-단백질 리가제 NEDD4-유사 이소형 3 [호모 사피엔스]). 4개의 밑줄친 WW 도메인은 아미노산 198 - 224 (WW1), 368 - 396 (WW2), 480 - 510 (WW3), 및 531 - 561 (WW4)에 상응한다.
인간 Smurf1 아미노산 서열 (uniprot.org/uniprot/ Q9HCE7). 2개의 밑줄친 WW 도메인은 아미노산 234 - 267 (WW1), 및 306 - 339 (WW2)에 상응한다.
인간 Smurf2 아미노산 서열 (uniprot.org/uniprot/Q9HAU4). 3개의 밑줄친 WW 도메인은 아미노산 157 - 190 (WW1), 251 - 284 (WW2), 및 297 - 330 (WW3)에 상응한다.
인간 ITCH 아미노산 서열 (uniprot.org/uniprot/Q96J02). 4개의 밑줄친 WW 도메인은 아미노산 326 - 359 (WW1), 358 - 391 (WW2), 438 - 471 (WW3), 및 478 - 511 (WW4)에 상응한다.
인간 NEDL1 아미노산 서열 (uniprot.org/uniprot/Q76N89). 2개의 밑줄친 WW 도메인은 아미노산 829 - 862 (WW1), 및 1018 - 1051 (WW2)에 상응한다.
인간 NEDL2 아미노산 서열 (uniprot.org/uniprot/ Q9P2P5). 2개의 밑줄친 WW 도메인은 아미노산 807 - 840 (WW1), 및 985 - 1018 (WW2)에 상응한다.
일부 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체를 포함한다. 다른 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체로 이루어진다. 또 다른 실시양태에서, WW 도메인은 아미노산 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로부터의 WW 도메인 또는 WW 도메인 변이체로 본질적으로 이루어진다. 본질적으로 이루어진다는 도메인, 펩티드 또는 폴리펩티드가 이러한 아미노산 서열이 도메인, 펩티드 또는 폴리펩티드에 단지 소수의 추가의 아미노산 잔기, 예를 들어, 약 1 내지 약 10개 또는 그러한 추가의 잔기, 전형적으로 1 내지 약 5개의 추가의 잔기와 함께 존재하는 경우 아미노산 서열로 본질적으로 이루어짐을 의미한다.
대안적으로, WW 도메인은 도메인의 C-말단에 2개의 염기성 아미노산을 포함하도록 변형된 WW 도메인일 수 있다. 기술은 관련 기술분야에 공지되어 있으며, 관련 기술분야에, 예를 들어, 문헌 [Sambrook et al. ((2001) Molecular Cloning: a Laboratory Manual, 3rd ed., Cold Spring Harbour Laboratory Press)]에 기재되어 있다. 따라서, 통상의 기술자는 C-말단에 2개의 염기성 잔기를 포함하도록 2개의 C-말단 염기성 잔기를 통상적으로 갖지 않는 기존의 WW 도메인을 용이하게 변형시킬 수 있다.
염기성 아미노산은 7 초과의 pKa를 갖는 측쇄 관능기를 갖는 아미노산이며, 리신, 아르기닌, 및 히스티딘, 뿐만 아니라 단백질에 통상적으로 포함되는 20개의 α-아미노산에 포함되지 않는 염기성 아미노산을 포함한다. WW 도메인의 C-말단에서의 2개의 염기성 아미노산은 동일한 염기성 아미노산일 수 있거나, 또는 상이한 염기성 아미노산일 수 있다. 한 실시양태에서, 2개의 염기성 아미노산은 2개의 아르기닌이다.
용어 WW 도메인은 또한 WW 도메인의 변이체를 포함하되, 임의의 이러한 변이체는 그의 C-말단에 2개의 염기성 아미노산을 갖고, PPXY 모티프와 회합하는 WW 도메인의 능력을 유지한다. 이러한 WW 도메인의 변이체는 PPXY 모티프 (즉, 최소 ARRDC1의 PPXY 모티프)와 회합하는 능력을 보유하고, 점, 삽입 또는 결실 돌연변이를 포함한 1개 이상의 아미노산에서 돌연변이되었지만, PPXY 모티프와 회합하는 능력을 여전히 보유하는 WW 도메인을 지칭한다. 따라서, 변이체 또는 유도체는 말단절단 및 단편을 포함한 결실; 삽입 및 부가, 예를 들어, 보존적 치환, 부위-지정 돌연변이체 및 대립유전자 변이체; 및 펩티드에 공유 연결된 1개 이상의 비-아미노 아실 기 (예를 들어, 당, 지질 등) 및 번역후 변형을 포함한 변형을 포함한다. 이러한 변화를 생성하는데 있어서, 유사한 아미노산 잔기의 치환은 측쇄 치환기의 상대적 유사성, 예를 들어, 그들의 크기, 전하, 소수성, 친수성 등에 기반하여 이루어질 수 있으며, 이러한 치환은 통상적인 시험에 의해 펩티드의 기능에 대한 그들의 효과에 대해 검정될 수 있다.
WW 도메인은 보다 긴 단백질의 일부일 수 있다. 따라서, 단백질은, 다양한 상이한 실시양태에서, 본원에서 정의된 바와 같이, WW 도메인을 포함하거나, WW 도메인으로 이루어지거나, 또는 WW 도메인으로 본질적으로 이루어진다. 폴리펩티드는 단백질 서열 내의 기능적 도메인으로서 WW 도메인을 포함하는 단백질일 수 있다. 일부 실시양태에서, 폴리펩티드는 엔도뉴클레아제이다. 일부 실시양태에서, 엔도뉴클레아제는 Cas9 단백질 또는 Cas9 단백질 변이체이다. 다른 실시양태에서, 폴리펩티드는 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)에 제시된 서열을 포함하거나, (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로 이루어지거나, 또는 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)로 본질적으로 이루어진다.
핵산 분자, 예컨대 뉴클레아제, 데아미나제, 및 전사 활성화제 또는 억제제에 결합하는 기능적 이펙터 단백질의 맥락에서 본원에 사용된 용어 "표적 부위"는 이펙터 단백질에 의해 결합되고 작용화된, 예를 들어, 뉴클레아제에 의해 절단되거나, 각각 전사 활성화제 또는 억제제에 의해 전사 활성화되거나 억제된 핵산 분자 내의 서열을 지칭한다. 표적 부위는 단일-가닥 또는 이중-가닥일 수 있다. RNA-가이드된 (예를 들어, RNA-프로그램가능한) 뉴클레아제 (예를 들어, Cas9 gRNA 결합 도메인 및 활성 Cas9 DNA 절단 도메인을 포함하는 단백질 이량체)의 맥락에서, 표적 부위는 전형적으로 RNA-프로그램가능한 뉴클레아제의 gRNA에 상보적인 뉴클레오티드 서열, 및 gRNA-상보적 서열에 인접한 3' 단부에 프로토스페이서 인접 모티프 (PAM)를 포함한다. RNA-가이드된 뉴클레아제 Cas9에 대해, 표적 부위는 일부 실시양태에서, 20개의 염기 쌍 플러스 3개의 염기 쌍 PAM (예를 들어, NNN, 여기서 N은 임의의 뉴클레오티드를 나타냄)일 수 있다. 전형적으로, PAM의 제1 뉴클레오티드는 임의의 뉴클레오티드일 수 있는 반면, 2개의 하류 뉴클레오티드는 특이적 RNA-가이드된 뉴클레아제에 따라 특정된다. RNA-가이드된 뉴클레아제, 예컨대 Cas9에 대한 예시적인 표적 부위는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 제한 없이, NNG, NGN, NAG, 및 NGG를 포함하고, 여기서 N은 임의의 뉴클레오티드를 나타낸다. 또한, 상이한 종 (예를 들어, 에스. 피오게네스 대신 에스. 써모필루스)으로부터의 Cas9 뉴클레아제는 서열 NGGNG를 포함하는 PAM을 인식한다. NNAGAAW (서열식별번호: 121) 및 NAAR을 포함하나 이에 제한되지는 않는 추가의 PAM 서열은 공지되어 있다 (예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Esvelt and Wang, Molecular Systems Biology, 9:641 (2013)] 참조). 예를 들어, RNA-가이드된 뉴클레아제, 예컨대, 예를 들어, Cas9의 표적 부위는 구조 [NZ]-[PAM]을 포함할 수 있고, 여기서 각각의 N은 독립적으로 임의의 뉴클레오티드이고, Z는 1 내지 50 (포함적)의 정수이다. 일부 실시양태에서, Z는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 또는 적어도 50이다. 일부 실시양태에서, Z는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50이다. 일부 실시양태에서, Z는 20이다. 일부 실시양태에서, "표적 부위"는 또한 뉴클레아제에 의해 결합되지만 절단되지 않는 핵산 분자 내의 서열을 지칭할 수 있다. 예를 들어, 본원에 기재된 특정 실시양태는 불활성 (또는 불활성화된) Cas9 DNA 절단 도메인을 포함하는 단백질을 제공한다. 이러한 단백질 (예를 들어, 또한 Cas9 RNA 결합 도메인을 포함하는 경우)은 gRNA에 의해 특정된 표적 부위에 결합할 수 있지만, DNA 절단 부위는 불활성화되기 때문에, 표적 부위는 특정 단백질에 의해 절단되지 않는다. 그러나, 본원에 기재된 바와 같은 이러한 단백질은 전형적으로 핵산 분자의 절단을 매개하는 또 다른 단백질 (예를 들어, 뉴클레아제 또는 전사 인자) 또는 분자와 회합된다. 일부 실시양태에서, 실제적으로 절단되는 서열은 핵산 분자의 절단을 매개하는 단백질 (예를 들어, 뉴클레아제) 또는 분자에 의존할 것이고, 일부 경우에, 예를 들어, 불활성화된 Cas9 단백질(들)이 결합되는 근접성 또는 거리와 관련될 것이다.
본 발명의 특정 실시양태의 상세한 설명
본 개시내용은 최소 ARRDC1 단백질이 화물을 효율적으로 패키징할 수 있다는 발견에 관한 것이다. 최소 ARRDC1의 과발현은 ARMM 내로의 화물의 패키징을 여전히 달성하면서, 전장 ARRDC1의 과발현보다 더 많은 양의 기능적 ARRDC1을 생산할 수 있다. 최소 ARRDC1 구축물은 ARMM에서 ARRDC1의 부피를 감소시킬 수 있으며, 따라서 ARMM의 로딩 용량을 증가시킬 수 있다. 화물의 패키징을 달성하는데 필요한 ARRDC1의 크기를 감소시키는 것은 또한 직접적 융합물로서 최소 ARRDC1과 함께 발현되거나 번역후에 최소 ARRDC1 분자에 연결될 수 있는 화물의 실제적 한계를 증가시킨다. 최소 ARRDC1 단백질에서의 모티프는 효율적인 ARMM 버딩을 생성한다: 아레스틴 도메인은 단백질을 형질막에 지정하고; 테트라펩티드 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123)는 TSG101 및 ESCRT I 복합체 단백질과 상호작용하고 이를 형질막에 동원하고; PPXY 모티프(들)는 NEDD4 E3 리가제의 WW 도메인과 상호작용하여 ARMM 버딩을 증진시킨다 (Nabhan et al., 2012).
본 개시내용의 측면은 전장 ARRDC1 단백질보다 더 짧지만, 미세소포 형성에 관하여 그의 동일한 기능을 유지하는 최소 ARRDC1을 제공한다. 일부 실시양태에서, 최소 ARRDC1은 아레스틴 도메인의 적어도 부분, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧다. 최소 ARRDC1의 비-제한적 예는 서열식별번호: 1에 제공된다.
최소 ARRDC1의 또 다른 비-제한적 예는 서열식별번호: 125에 제공된다:
최소 ARRDC1을 코딩하는 핵산 서열의 비-제한적 예는 서열식별번호: 126에 제공된다:
최소 ARRDC1은 서열식별번호: 1과 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 서열식별번호: 1로 이루어진다.
본원에서 제공된 바와 같은 최소 ARRDC1은 전장 ARRDC1보다 더 적은 아미노산인 임의의 길이 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 100 내지 400개의 아미노산을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 100 내지 350개의 아미노산, 100 내지 300개의 아미노산, 100 내지 250개의 아미노산, 100 내지 200개의 아미노산, 또는 100 내지 150개의 아미노산을 포함한다. 일부 실시양태에서, 최소 ARRDC1은 150 내지 350개의 아미노산, 200 내지 350개의 아미노산, 250 내지 350개의 아미노산, 또는 300 내지 350개의 아미노산을 포함한다.
일부 실시양태에서, 최소 ARRDC1은 최대 400개의 아미노산, 최대 375개의 아미노산, 최대 350개의 아미노산, 최대 325개의 아미노산, 최대 300개의 아미노산, 최대 275개의 아미노산, 최대 250개의 아미노산, 최대 225개의 아미노산, 최대 200개의 아미노산, 최대 200개의 아미노산, 최대 175개의 아미노산, 최대 150개의 아미노산, 최대 125개의 아미노산, 또는 최대 100개의 아미노산을 포함한다.
일부 실시양태에서, 최소 ARRDC1은 약 400개의 아미노산, 약 375개의 아미노산, 약 350개의 아미노산, 약 325개의 아미노산, 약 300개의 아미노산, 약 275개의 아미노산, 약 250개의 아미노산, 약 225개의 아미노산, 약 200개의 아미노산, 약 175개의 아미노산, 약 150개의 아미노산, 약 125개의 아미노산, 또는 약 100개의 아미노산을 포함한다.
일부 실시양태에서, 최소 ARRDC1은 아레스틴 도메인의 적어도 부분을 포함한다. 일부 실시양태에서, 아레스틴 도메인의 부분은 서열식별번호: 116의 아미노산 1-308을 포함한다.
본원에서 제공된 바와 같은 최소 ARRDC1은 임의의 수의 PSAP (서열식별번호: 122) 모티프 및/또는 PTAP (서열식별번호: 123) 모티프를 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프 또는 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PSAP (서열식별번호: 122) 모티프 및 적어도 1개의 PTAP (서열식별번호: 123) 모티프를 포함한다.
본원에서 제공된 바와 같은 최소 ARRDC1은 임의의 수의 PPXY 모티프를 포함할 수 있다. 일부 실시양태에서, 최소 ARRDC1은 적어도 1개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 2개의 PPXY 모티프를 포함한다. 일부 실시양태에서, 최소 ARRDC1은 적어도 3개의 PPXY 모티프를 포함한다.
최소 ARRDC1은, 일부 실시양태에서, 기능적 변이체를 포괄한다. 기능적 변이체는 그의 기능에 영향을 미치지 않는, 최소 ARRDC1의 기능적 도메인(들) 외부의 1개 이상의 돌연변이, 예를 들어, 아레스틴 도메인 외부의 돌연변이, 또는 아레스틴 도메인 내의 돌연변이를 함유할 수 있다. 기능적 도메인(들) 외부의 돌연변이는 단백질의 생물학적 활성에 영향을 미칠 것으로 예상되지 않을 것이다. 예를 들어, 기능적 도메인 외부의 돌연변이는 미세소포의 형성 또는 버딩에 실질적으로 영향을 미칠 것으로 예상되지 않을 것이다. 일부 실시양태에서, 기능적 변이체는 서열식별번호: 1과 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다.
대안적으로 또는 추가로, 기능적 돌연변이는 최소 ARRDC1에서의 1개 이상의 위치에 보존적 돌연변이(들)를 함유할 수 있다. 예를 들어, 기능적 변이체는 최대 20개의 위치, 최대 15개의 위치, 최대 10개의 위치, 최대 5개의 위치, 최대 4개의 위치, 최대 3개의 위치, 최대 2개의 위치에, 또는 단지 1개의 위치에 보존적 돌연변이를 함유할 수 있다.
WW-도메인-함유-화물을 갖는 미세소포
본 발명의 일부 측면은 WW 도메인에 융합된 화물을 함유하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)를 제공한다. 이러한 ARMM은 전형적으로 지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체를 포함한다. 일부 실시양태에서, 화물은 ARMM 내로의 화물의 로딩을 용이하게 할 수 있는 최소 ARRDC1의 PPXY (여기서 x는 임의의 아미노산임) 도메인과 회합하는 WW 도메인에 융합된다. 일부 실시양태에서, 화물은 단백질, 핵산, 또는 소분자이다. 일부 실시양태에서, 화물은 Cas9 단백질 또는 Cas9 변이체이다. 일부 실시양태에서 Cas9 단백질 또는 변이체는 융합 단백질이다. 예를 들어, Cas9 단백질 또는 Cas9 변이체는 1개 이상의 WW 도메인에 융합되어 ARMM 내로의 로딩을 용이하게 할 수 있다. 일부 실시양태에서, Cas9 융합 단백질 또는 Cas9 변이체는 1개 이상의 핵 국재화 서열 (NLS)에 융합되어 표적 세포의 핵 내로의 Cas9 융합 단백질의 전위를 용이하게 한다. 특정 실시양태에서 Cas9 변이체는 Cas9의 활성 또는 불활성 DNA 절단 도메인 또는 부분적으로 불활성 DNA 절단 도메인 (예를 들어, Cas9 "니카제"), 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 Cas9 단백질 또는 Cas9 단백질 변이체이다. 관련 기술분야에 공지된 임의의 수의 단백질, 핵산, 또는 소분자는 1개 이상의 WW 도메인에 융합되어 ARMM 내로 로딩될 수 있는 화물을 생성할 수 있고, 예를 들어, 재프로그래밍 인자 (예를 들어, Oct4, Sox2, c-Myc, 또는 KLF4)는 1개 이상의 WW 도메인에 융합되어 ARMM 내로의 1개 이상의 재프로그래밍 인자의 로딩을 용이하게 할 수 있음이 인지되어야 한다. 일부 실시양태에서, 화물 단백질은 1개 이상의 WW 도메인에 융합된 치료 단백질 (예를 들어, 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 아연 핑거 뉴클레아제, 또는 리콤비나제)이다. 다른 실시양태에서, ARMM은 ARMM의 방출을 용이하게 하는 비-화물 단백질, 예컨대 TSG101 단백질 또는 그의 변이체를 추가로 포함한다. TSG101 단백질은 ARRDC1과 상호작용하며, 이는 엔도좀으로부터 형질막으로의 TSG101의 재배치를 발생시키고, TSG101, ARRDC1, 및 예를 들어, 화물 단백질, 핵산 (즉, gRNA), 및 소분자를 포함한 다른 세포 성분을 함유하는 미세소포의 방출을 매개한다.
일부 실시양태에서, 최소 ARRDC1 단백질 단편, 및/또는 TSG101 단백질 단편을 포함하는 미세소포, 예를 들어, ARMM이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편 및/또는 TSG101 단백질 단편을 포함하는 융합 단백질이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편 및/또는 TSG101 단백질 단편을 코딩하는 발현 구축물이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 단편은 C-말단 최소 ARRDC1 단백질 단편이다. 일부 실시양태에서, ARRDC1 단백질 단편은 PSAP (서열식별번호: 122) 모티프 및 최소 ARRCD1 서열의 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, TSG101 단백질 단편은 UEV 도메인을 포함하고, TSG101 서열의 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다.
일부 실시양태에서, 최소 ARRDC1을 포함하는 본 발명 미세소포, 예를 들어, ARMM은 세포 표면 단백질, 예를 들어, 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함한다. 다른 세포 표면 단백질은 또한 ARMM에 포함될 수 있다. 본 발명의 실시양태와 함께 사용하는데 적합한 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 및 막-결합된 이뮤노글로불린은 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다. 예를 들어, 일부 실시양태에서, 인테그린은 α1β1, α2β1, α4β1, α5β1, α6β1, αLβ2, αMβ2, αIIbβ3, αVβ3, αVβ5, αVβ6, 또는 α6β4 인테그린이다. 일부 실시양태에서, 수용체 티로신 키나제는 EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, 또는 MuSK 수용체이다. 일부 실시양태에서, G-단백질 커플링된 수용체는 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 또는 베타-아드레날린성 수용체이다.
본 발명의 일부 측면은 ARMM이 표적 세포에 의해 흡수되고, ARMM 흡수가 표적 세포의 세포질 내로의 ARMM의 내용물의 방출을 발생시킨다는 인식에 관한 것이다. 본 발명의 일부 측면은 이것이 예를 들어, 표적 세포를 전달되는 작용제를 포함하는 ARMM과 접촉시킴으로써, ARMM에서의 작용제를 표적 세포 또는 표적 세포의 집단에 전달하는데 사용될 수 있다는 인식에 관한 것이다. 따라서, 본 발명의 일부 측면은 작용제, 예를 들어, 재조합 핵산, 재조합 단백질, 또는 합성 소분자를 포함하는 ARMM을 제공한다.
일부 실시양태에서, 작용제는 표적 세포의 바람직한 변화, 예를 들어, 세포 생존, 증식률의 변화, 분화 단계의 변화, 세포 신원의 변화, 염색질 상태의 변화, 1개 이상의 유전자의 전사율의 변화, 전사 프로파일의 변화, 또는 표적 세포의 유전자 압축의 전사후 변화를 실행하는 작용제이다. 전달되는 작용제는 표적 세포에서의 바람직한 효과에 따라 선택될 것임이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 예를 들어, 표적 세포의 분화 단계의 변화를 실행하기 위해, 예를 들어, 분화된 표적 세포를 배아 줄기 세포-유사 단계로 재프로그램하기 위해, 세포는 일부 실시양태에서, 재프로그래밍 인자, 예를 들어, Oct4, Sox2, c-Myc, 및/또는 KLF4를 갖는 ARMM과 접촉된다. 유사하게, 표적 세포의 염색질 상태의 변화를 실행하기 위해, 세포는 일부 실시양태에서, 염색질 조정제, 예를 들어, DNA 메틸트랜스퍼라제 또는 히스톤 데아세틸라제를 함유하는 ARMM과 접촉된다. 또 다른 예를 들어, 표적 세포의 생존이 감소되어야 하는 경우, 표적 세포는 일부 실시양태에서, 세포독성제, 예를 들어, 화학치료 약물을 포함하는 ARMM과 접촉된다. ARMM 내로의 포함에 및 표적 세포 또는 표적 세포 집단에의 ARMM-매개된 전달에 적합한 추가의 작용제는 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다.
일부 실시양태에서, 작용제는 ARMM을 생산하는 세포를 작용제와 접촉시킴으로써 ARMM에 포함된다. 예를 들어, 작용제가 소분자, 예를 들어 대상체의 신체 내의 표적 세포 집단에 전달되는 치료 약물인 경우, 약물을 함유하는 ARMM은 최소 ARRDC1을 발현하는 세포를 약물을 함유하는 ARMM을 생성하는데 충분한 양으로 및 시간 동안 약물과 접촉시킴으로써 생산된다. 또 다른 예를 들어, 작용제가 핵산 또는 단백질인 경우, 핵산 또는 단백질을 함유하는 ARMM은 예를 들어, 재조합 발현 구축물로부터 최소 ARRDC1 및 TSG101을 발현하는 세포에서 핵산 또는 단백질을 발현시킴으로써 생산된다.
일부 실시양태에서, 작용제는 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합된다. 일부 실시양태에서, 작용제가 단백질인 경우, 단백질은 단백질 작용제를 ARRDC1 단백질, ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편과의 융합물로서 발현시킴으로써, ARRDC 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합될 수 있다.
일부 실시양태에서, 재조합 또는 합성 핵산을 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. 이러한 ARMM은 재조합 또는 합성 핵산을 표적 세포 또는 표적 세포 집단에 전달하는데 사용될 수 있다. 일부 실시양태에서, 재조합 핵산은 RNA, 예를 들어, 단백질을 코딩하는 RNA (예를 들어, mRNA), 또는 비-코딩 RNA를 포함한다. 일부 실시양태에서, 핵산은 RNAi 작용제, 예를 들어, 안티센스 RNA, 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 마이크로RNA (miRNA), 작은 핵 RNA (snRNA), 작은 핵소체 RNA (snoRNA), 또는 긴 유전자간 비-코딩 RNA (lincRNA), 또는 그의 전구체를 포함한다. 일부 실시양태에서, 재조합 구조적 RNA, 리보자임, 또는 그의 전구체를 포함하는 ARMM이 제공된다.
코딩 RNA, RNAi 작용제, 구조적 RNA, 및 리보자임, 뿐만 아니라 그의 전구체는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있으며, 본 발명의 측면에 따른 적합한 RNA 및 RNAi 작용제는 통상의 기술자에게 명백할 것이다. 본 발명은 이에 관하여 제한되지 않음이 인지될 것이다. RNA를 포함하는 ARMM은 표적 세포의 유전자 조작에 대한 필요 없이 표적 세포에서 RNA 기능을 발현시키는데 사용될 수 있다. 예를 들어, 단백질-코딩 핵산을 포함하는 ARMM은 표적 세포 또는 세포 집단을 유전자 조작할 필요 없이 ARMM 흡수 시 표적 세포 또는 세포 집단에서 코딩된 단백질을 발현시키는데 사용될 수 있다. 또 다른 예를 들어, RNAi 작용제를 포함하는 ARMM은 유전자 보정된 청구항 부분 세포 또는 세포 집단에 대한 필요 없이 표적 세포 또는 표적 세포 집단에서 관심의 유전자를 넉 다운시키는데 사용될 수 있다. 세번째 예를 들어, 리보자임을 포함하는 ARMM은 유전자 조작에 대한 필요 없이 표적 핵산의 발현을 조정하거나, 표적 mRNA 및 표적 세포를 편집하는데 사용될 수 있다.
일부 실시양태에서, DNA, 예를 들어, 발현 구축물, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함하는 벡터를 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. DNA를 함유하는 ARMM은 세포로부터 세포로의 유전자 또는 DNA 요소의 전달, 또는, 일부 실시양태에서, 대상체에서 표적 세포 또는 표적 세포 유형, 예를 들어 병리학적 표적 세포 유형 내로의 유전자 또는 DNA 요소의 표적화된 삽입을 허용한다. 일부 실시양태에서, 단백질을 코딩하는 DNA를 포함하는 ARMM이 제공된다. 일부 실시양태에서, 비-코딩 RNA, 예를 들어, 안티센스 RNA, 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 마이크로RNA (miRNA), 작은 핵 RNA (snRNA), 작은 핵소체 RNA (snoRNA), 또는 긴 유전자간 비-코딩 RNA (lincRNA), 또는 그의 전구체를 코딩하는 DNA를 포함하는 ARMM이 제공된다. 일부 실시양태에서, DNA를 함유하는 ARMM의 사용은 단백질 또는 RNA의 직접적 전달과 비교하여 코딩된 단백질 또는 RNA의 보다 높은 수준의 발현 또는 보다 지속된 발현이 표적 세포에서 달성될 수 있다는 이점을 갖는다. 일부 실시양태에서, ARMM에 포함되는 DNA는 코딩된 단백질 또는 RNA의 징집을 제어하는 세포 유형 특이적 프로모터를 포함한다. 세포 유형 특이적 프로모터의 사용은 단백질의 표적화된 발현이 ARMM-전달된 DNA에 의해 코딩되는 RNA였음을 허용하며, 이는 예를 들어 일부 치료 실시양태에서, 표적화되지 않지만 ARMM을 흡수할 수 있는 하위집단에 대한 효과를 최소화하는데 사용될 수 있다.
일부 실시양태에서, 검출가능한 표지를 포함하는 최소 ARRDC1을 포함하는 ARMM이 제공된다. 이러한 ARMM은 유전자 조작 없이 표적 세포의 표지화를 허용한다. 표적 세포에의 직접적 전달에 적함한 검출가능한 표지는 관련 기술분야에 공지되어 있으며, 형광 단백질, 형광 염료, 막-결합된 염료, 및 효소, 예를 들어, 검출가능한 반응 산물을 발생시키는 반응을 촉매하는 막-결합된 효소를 포함하나 이에 제한되지는 않는다. 본 발명의 일부 측면에 따른 적합한 검출가능한 표지는 통상적으로 이용가능한 항체 또는 항원 결합제로 검출될 수 있는 막-결합된 항원, 예를 들어, 막-결합된 리간드를 추가로 포함한다.
일부 실시양태에서, 치료제를 포함하는 ARMM이 제공된다. ARMM을 쉐딩하는 세포 내로 도입될 수 있는 또는 합성 ARMM 내로 패키징될 수 있는 임의의 치료제는 본 발명의 일부 측면에 따른 ARMM 내로의 포함에 적합함이 인지될 것이다. 적합한 치료제는 또한 소분자로 지칭되는 작은 유기 분자, 또는 작은 화합물, 및 생물제제, 예를 들어, 치료 단백질, 또는 단백질 단편을 포함하나 이에 제한되지는 않는다. ARMM에서의 포함에 적합한 치료제의 일부 비-제한적 예는 항박테리아제, 항진균 항생제, 항미오박테리아제, 뉴라미니다제 억제제, 항신생물제, 세포독성제, 콜린성 작용제, 부교감신경흥분모방제, 항콜린성 작용제, 항우울제, 항정신병제, 호흡 및 뇌 자극제, 양성자 펌프 억제제, 호르몬 및 합성 치환체, 수용체 리간드, 키나제 억제제, 화학치료제, 신호전달 분자, 키나제, 포스파타제, 프로테아제, RNA 편집 효소, 뉴클레아제, 및 아연 핑거 단백질을 포함한다.
일부 실시양태에서, 표적 세포에 전달되는 단백질을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 단백질은 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 또는 리콤비나제이거나 이를 포함한다. 일부 실시양태에서, 단백질은 치료 단백질이다. 일부 실시양태에서 단백질은 표적 세포의 상태 또는 신원의 변화를 실행하는 단백질이다. 예를 들어, 일부 실시양태에서, 단백질은 재프로그래밍 인자이다. 적합한 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 리콤비나제, 및 재프로그래밍 인자는 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 본 발명은 이에 관하여 제한되지 않는다.
일부 실시양태에서, 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 또는 비-공유 결합되거나, 접합된 작용제, 예를 들어, 소분자, 핵산, 또는 단백질을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 작용제는 링커를 통해 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 접합된다. 링커는 절단가능하거나 또는 비절단가능할 수 있다. 일부 실시양태에서, 링커는 아미드, 에스테르, 에테르, 탄소-탄소, 또는 디술피드 결합을 포함하지만, 화학 기술분야에서의 임의의 공유 결합이 사용될 수 있다. 일부 실시양태에서, 링커는 그의 절단이 전달되는 펩티드 또는 단백질로부터의 초하전된 단백질의 분리를 발생시키는 불안정성 결합을 포함한다. 일부 실시양태에서, 링커는 표적 세포에서 발견되는 조건 (예를 들어, 특이적 pH, 환원 환경, 또는 세포성 효소의 존재) 하에서 절단된다. 일부 실시양태에서, 링커는 효소, 예를 들어, 세포성 효소에 의해 절단된다. 일부 실시양태에서, 효소는 세포성 프로테아제 또는 세포성 에스테라제이다. 일부 실시양태에서, 세포성 프로테아제는 세포질 프로테아제, 엔도좀 프로테아제, 또는 엔도좀 에스테라제이다. 일부 실시양태에서, 세포성 효소는 표적 세포 또는 세포 유형에서 특이적으로 발현되어, 표적 세포 또는 세포 유형에서의 기능적 단백질 또는 펩티드의 우선적 또는 특이적 방출을 발생시킨다. 프로테아제의 표적 서열은 전달되는 작용제 및 최소 ARRDC1 단백질 또는 TSG101 단백질 또는 그의 단편 사이의 링커 내로 조작될 수 있다. 일부 실시양태에서, 표적 세포 또는 세포 유형은 암 세포 또는 암 세포 유형, 면역계의 세포 또는 세포 유형, 또는 병리학적 또는 질환에 걸린 세포 또는 세포 유형이고, 링커는 효소에 의해 또는 표적 세포에 대해 특이적인 특징에 기반하여 절단된다. 일부 실시양태에서, 링커는 AGVF (서열식별번호: 114), GFLG (서열식별번호: 117), FK, AL, ALAL (서열식별번호: 118), 또는 ALALA (서열식별번호: 119)를 포함하는 군으로부터 선택되는 아미노산 서열을 포함한다. 다른 적합한 링커는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 링커는 절단가능한 링커이다. 일부 실시양태에서, 링커는 프로테아제 인식 부위를 포함한다. 특정 실시양태에서, 링커는 UV-절단가능한 모이어티이다. 적합한 링커, 예를 들어, 프로테아제 인식 부위를 포함하는 링커, 또는 UV 절단가능한 모이어티를 포함하는 링커는 관련 기술분야의 통상의 기술자에게 공지되어 있다. 일부 실시양태에서, 작용제는 소르타제 반응을 통해 최소 ARRDC1 단백질 또는 그의 단편에 접합되고, 링커는 LPXTG (서열식별번호: 120) 모티프를 포함한다. 본 발명의 일부 측면에 따른 작용제를 단백질에 접합시키기 위한 방법 및 시약은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 따라서, ARMM에 포함되는 작용제를 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 접합시키는 적합한 방법은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이다.
ARMM을 단리하는 방법이 또한 본원에서 제공된다. 한 예시적인 방법은 미세소포-생산 세포를 포함하는 세포 배양물의 배양 배지, 또는 상청액을 수집하는 것을 포함한다. 일부 실시양태에서, 세포 배양물은 대상체로부터 얻어진 세포, 예를 들어, 병리학적 표현형, 예를 들어, 과다증식성 표현형을 나타낼 것으로 의심되는 세포를 포함한다. 일부 실시양태에서, 세포 배양물은 ARMM을 생산하는 유전자 조작된 세포, 예를 들어, 재조합 ARMM 단백질, 예를 들어, 재조합 최소 ARRDC1 또는 TSG101 단백질, 예컨대 최소 ARRDC1 또는 TSG101 융합 단백질을 발현하는 세포를 포함한다. 일부 실시양태에서, 상청액은 원심분리에 의해, 예를 들어, 증가하는 G 값 (예를 들어, 500G 및 2000G)의 2회의 연속적 원심분리에 의해 세포 데브리스가 사전-청소된다. 일부 실시양태에서, 방법은 상청액을 0.2 μm 필터를 통해 통과시키고, 세포 데브리스의 모든 큰 조각 및 전체 세포를 제거하는 것을 포함한다. 일부 실시양태에서, 상청액은 원심분리물의 부피에 따라, 예를 들어, 120,000g에서 2시간 동안 초원심분리로 처리된다. 얻어진 펠릿은 미세소포를 포함한다. 일부 실시양태에서, 엑소좀은 본원에 기재된 바와 같은 엑소좀 마커를 사용한 염색 및/또는 분류에 의해 (예를 들어, FACS 또는 MACS에 의해) 미세소포 펠릿으로부터 고갈된다. 단리된 또는 풍부화된 ARMM은 본원에 기재된 바와 같이 배양 배지 또는 적합한 완충제에 현탁될 수 있다.
WW 도메인 함유 화물
본 개시내용의 측면은 적어도 1개의 WW 도메인과 회합된 화물을 포함하는 ARMM에 관한 것이다. 일부 측면에서, 적어도 1개의 WW 도메인을 갖는 화물 단백질을 포함하는 융합 단백질이 제공된다. 일부 측면에서, 적어도 1개의 WW 도메인과 회합된 화물 단백질을 코딩하는 발현 구축물이 제공된다. 화물 단백질의 WW 도메인은 ARRDC1, 또는 그의 변이체의 PPXY 모티프와 회합하여 ARMM 내로의 화물 단백질과의 회합 또는 그의 포함을 용이하게 할 수 있다. ARRDC1의 PPXY 모티프와 회합하는 WW 도메인에 융합된 Cas9 화물 단백질의 개략적 제시는 도 2에서 볼 수 있다. 일부 실시양태에서, 화물 단백질은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 WW 도메인에 융합된다. WW 도메인은 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래될 수 있다 (도 1). 예를 들어, WW 도메인은 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); 또는 (서열식별번호: 14)에 제시된 아미노산 서열로부터의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다. 특정 실시양태에서, 화물 단백질은 하기 아미노산 서열을 갖는 인간 ITCH 단백질로부터의 2개의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다:
다른 실시양태에서, 화물 단백질은 하기 아미노산 서열을 갖는 인간 ITCH 단백질로부터의 4개의 WW 도메인 또는 WW 도메인 변이체를 포함할 수 있다:
적어도 1개의 WW 도메인 또는 WW 도메인 변이체에 융합된 본원에 기재된 화물 단백질은 비-천연 발생이며, 즉, 이들은 자연에 존재하지 않는다.
일부 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질의 N-말단에 융합될 수 있다. 다른 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질의 C-말단 또는 N-말단에 융합될 수 있다. 추가의 다른 실시양태에서, 1개 이상의 WW 도메인은 화물 단백질 내로 삽입될 수 있다. WW 도메인은 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 시험될 수 있는, 화물 단백질의 기능을 유지하는 임의의 수의 방식으로 배치될 수 있음이 인지되어야 한다.
본 발명 미세소포의 화물 단백질은 적어도 1개의 WW 도메인을 포함하는 단백질일 수 있다. 예를 들어, 화물 단백질은 WW 도메인 함유 단백질 또는 적어도 1개의 WW 도메인에 융합된 단백질일 수 있다. 일부 실시양태에서, 화물 단백질은 적어도 1개의 WW 도메인에 융합된 Cas9 단백질 또는 Cas9 변이체일 수 있다. 일부 실시양태에서, 화물 단백질은 재조합 화물 단백질일 수 있다. 예를 들어 재조합 화물 단백질은 적어도 1개의 핵 국재화 서열 (NLS)에 융합된 Cas9 단백질, 또는 Cas9 변이체일 수 있다. 본원에 지칭된 NLS는 핵 수송에 의해 세포 핵 내로의 단백질의 이입을 용이하게 하는 아미노산 서열이다. 일부 실시양태에서, NLS는 Cas9 단백질, 또는 Cas9 변이체의 N-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질, 또는 Cas9 변이체의 C-말단에 융합된다. 일부 실시양태에서, Cas9는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 핵 국재화 서열 (NLS)에 융합된다. 특정 실시양태에서, 하나의 NLS는 N-말단에 융합되고, 하나의 NLS는 Cas9 단백질의 C-말단에 융합되어 재조합 NLS:Cas9:NLS 융합 단백질을 생성한다. 특정 실시양태에서, 적어도 1개의 NLS에 융합된 Cas9 단백질, 또는 Cas9 변이체는 또한 적어도 1개의 WW 도메인에 융합될 수 있다. 상기 기재된 바와 같이, WW 도메인은 Cas9 단백질 또는 Cas9 변이체가 표적 세포에의 전달을 위해 ARMM 내로 로딩되고, 표적 세포의 핵 내로 전위되어 그의 뉴클레아제 기능을 수행할 수 있도록 하는 임의의 수의 방식으로 배치될 수 있음이 인지되어야 한다. 특정 실시양태에서, 1개 이상의 WW 도메인은 재조합 NLS:Cas9:NLS 융합 단백질의 N-말단에 융합된다. 특정 실시양태에서, 1개 이상의 WW 도메인은 재조합 NLS:Cas9:NLS 융합 단백질의 C-말단에 융합된다. 특정 실시양태에서, 화물 단백질은 서열 (서열식별번호: 109) 또는 (서열식별번호: 110)을 포함한다. 특정 실시양태에서, 화물 단백질은 서열 (서열식별번호: 109) 또는 (서열식별번호: 110)으로 이루어진다. 특정 실시양태에서, 화물 단백질은 (서열식별번호: 109) 또는 (서열식별번호: 110)으로 본질적으로 이루어진다.
하기 아미노산 서열은 pX330 플라스미드 (애드진(Addgene))의 AgeI 부위 내로 클로닝된 2개의 WW 도메인 (서열식별번호: 109) 또는 4개의 WW 도메인 (서열식별번호: 110) 중 어느 하나를 갖는 예시적인 Cas9 화물 단백질 서열이다.
본원에 기재된 미세소포는 핵산을 추가로 포함할 수 있다. 일부 실시양태에서, 미세소포는 예를 들어, 뉴클레아제 또는 니카제와 회합될 수 있는 적어도 1개의 가이드 RNA (gRNA)를 포함할 수 있다. 한 예로서, gRNA는 Cas9 화물 단백질 또는 Cas9 변이체 화물 단백질과 회합될 수 있다. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함할 수 있으며, 이는 상기 표적 부위에의 뉴클레아제/RNA 복합체의 결합을 매개하고, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다. 특정 실시양태에서, gRNA는 관련 기술분야에 공지된 임의의 표적에 상보적인 뉴클레오티드 서열을 포함한다. 예를 들어, gRNA는 치료 표적 (예를 들어, APOC3, 알파 1 안티트립신, HBV, 또는 HIV)에 상보적인 뉴클레오티드 서열을 포함할 수 있다. 특정 실시양태에서 gRNA는 증진된 녹색 형광 단백질 (EGFP)에 상보적인 서열을 포함한다. 예를 들어, gRNA 서열은 서열식별번호: 113에 제시된 핵산 서열에 의해 코딩될 수 있다.
하기는 EGFP를 표적화하는 가이드 RNA (gRNA)를 코딩하는 예시적인 핵산 서열이다. EGFP 표적 서열은 하기에서 밑줄친다.
TSG101
특정 실시양태에서, 본 발명 미세소포는 TSG101을 추가로 포함한다. 또한 본원에서 TSG101로 지칭되는 종양 감수성 유전자 101은 유비퀴틴-접합 효소의 명백하게 불활성인 동족체의 군에 속하는 이 유전자에 의해 코딩되는 단백질이다. 단백질은 종양형성에 연루된 시토졸 인단백질인 스타트민과 상호작용하는 코일화-코일 도메인을 함유한다. TSG101은 UEV 도메인을 포함하는 단백질이며, ARRDC1과 상호작용한다. 예시적인 비-제한적 TSG101 단백질 서열은 본원에 제공되며, 본 발명의 측면에 따른 추가의 적합한 TSG101 단백질 서열, 이소형, 및 변이체는 관련 기술분야에 공지되어 있다. 본 발명은 이에 관하여 제한되지 않음이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 예시적인 TSG101 서열은 하기를 포함한다:
>gi|5454140|ref|NP_006283.1| 종양 감수성 유전자 101 단백질 [호모 사피엔스]
>gi|11230780|ref|NP_068684.1| 종양 감수성 유전자 101 단백질 [무스 무스쿨루스]
>gi|48374087|ref|NP_853659.2| 종양 감수성 유전자 101 단백질 [라투스 노르베기쿠스]
이들 서열에서의 UEV 도메인은 아미노산 1-145 (상기 서열에서 밑줄침)를 포함한다. UEV 도메인의 구조는 관련 기술분야의 통상의 기술자에게 공지되어 있다 (예를 들어, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Owen Pornillos et al., Structure and functional interactions of the Tsg101 UEV domain, EMBO J. 2002 May 15; 21(10): 2397-2406] 참조).
최소 ARRDC1에 융합된 Cas9 화물 단백질
일부 측면에서, Cas9 단백질 또는 Cas9 변이체에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체를 포함하는 미세소포, 예를 들어, ARMM이 제공된다. 일부 측면에서, Cas9 단백질에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체 및/또는 Cas9 단백질에 융합된 TSG101 단백질, 또는 그의 변이체를 포함하는 융합 단백질이 제공된다. 일부 측면에서, Cas9 화물 단백질에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체 및/또는 Cas9 화물 단백질에 융합된 TSG101 단백질, 또는 그의 변이체를 코딩하는 발현 구축물이 제공된다. 일부 실시양태에서, 최소 ARRDC1 단백질 변이체는 C-말단 최소 ARRDC1 단백질 변이체이다. 일부 실시양태에서, TSG101 단백질 변이체는 TSG101 UEV 도메인을 포함한다. 일부 실시양태에서, TSG101 단백질 변이체는 UEV 도메인을 포함하고, TSG101 서열의 적어도 150개, 적어도 160개, 적어도 170개, 적어도 180개, 적어도 190개, 적어도 200개, 적어도 210개, 적어도 220개, 적어도 230개, 적어도 240개, 적어도 250개, 적어도 260개, 적어도 270개, 적어도 280개, 적어도 290개, 또는 적어도 300개의 인접한 아미노산을 포함한다.
본 발명의 일부 측면은 최소 ARRDC1 단백질 또는 그의 변이체, 및 최소 ARRDC1 단백질 또는 그의 변이체와 회합된 엔도뉴클레아제 (예를 들어, Cas9 단백질, 또는 Cas9 변이체)를 포함하는 ARRDC1 융합 단백질을 제공한다. 일부 실시양태에서 엔도뉴클레아제는 최소 ARRDC1 단백질, 또는 그의 변이체에 공유 연결된다. 엔도뉴클레아제는 예를 들어, 최소 ARRDC1 단백질의 N-말단, C-말단에 공유 연결되거나, 또는 그의 아미노산 서열 내에 있을 수 있다.
특정 실시양태에서, 엔도뉴클레아제 (예를 들어, Cas9 단백질 또는 Cas9 변이체)는 최소 ARRDC1 단백질 또는 단백질 변이체의 C-말단에, 또는 TSG101 단백질 또는 단백질 변이체의 C-말단에 융합된다. Cas9 단백질 또는 Cas9 변이체는 또한 최소 ARRDC1 단백질 또는 단백질 변이체의 N 말단에, 또는 TSG101 단백질 또는 단백질 변이체의 N 말단에 융합될 수 있다. 일부 실시양태에서, Cas9 단백질 또는 Cas9 변이체는 최소 ARRDC1 또는 TSG101 단백질 또는 그의 변이체 내에 있을 수 있다.
특정 실시양태에서, Cas9 단백질은 공유 결합을 통해 최소 ARRDC1 단백질, 최소 ARRDC1 변이체, TSG101 단백질, 또는 TSG101 변이체와 회합된다. 일부 실시양태에서, Cas9 단백질은 링커를 통해 최소 ARRDC1 단백질, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된다. 일부 실시양태에서, 링커는 절단가능한 링커이며, 예를 들어, 링커는 프로테아제 인식 부위를 함유할 수 있다. 링커의 프로테아제 인식 부위는 표적 세포에서 발현되는 프로테아제에 의해 인식되어, ARMM의 흡수 시 표적 세포의 세포질 내로 방출되는 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체에 융합된 Cas9 단백질을 발생시킬 수 있다. 관련 기술분야의 통상의 기술자는 임의의 수의 링커가 Cas9 단백질 또는 Cas9 변이체를 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체에 융합시키는데 사용될 수 있음을 인지할 것이다.
최소 ARRDC1 단백질, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된 Cas9 단백질 또는 Cas9 변이체는 핵 국재화 서열 (NLS)을 추가로 포함할 수 있다. 일부 실시양태에서, Cas9 융합 단백질은 적어도 1개의 NLS에 융합된다. 일부 실시양태에서, 1개 이상의 핵 국재화 서열 (NLS)은 Cas9의 N-말단에 융합된다. 일부 실시양태에서, 1개 이상의 NLS는 Cas9의 C-말단에 융합된다. 일부 실시양태에서, Cas9는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 또는 그 초과의 NLS에 융합된다. 1개 이상의 NLS는 Cas9에 융합되어 표적 세포의 핵 내로의 Cas9 융합 단백질의 전위를 허용할 수 있음이 인지되어야 한다. 일부 실시양태에서, 적어도 1개의 NLS에 융합된 Cas9 단백질은 링커를 통해 ARRDC1, 최소 ARRDC1 단백질 변이체, TSG101 단백질, 또는 TSG101 단백질 변이체와 회합된다. 일부 실시양태에서, 링커는 프로테아제 인식 부위를 함유한다. 다른 실시양태에서, 링커는 UV-절단가능한 모이어티를 함유한다. 일부 실시양태에서, 프로테아제 인식 부위는 표적 세포에서 발현되는 프로테아제에 의해 인식되어, 최소 ARRDC1 단백질 또는 그의 변이체 또는 TSG101 단백질 또는 그의 변이체로부터 세포질 내로 방출되는 적어도 1개의 NLS에 융합된 Cas9 단백질을 발생시키고, 여 기서 이는 ARMM의 흡수 시 핵 내로 전위될 수 있다.
RNA 결합 단백질
본 개시내용의 일부 측면은 RNA에 결합하는 단백질에 관한 것이다. 일부 실시양태에서, RNA 결합 단백질은 RNA, 예를 들어, 특이적 서열 또는 구조를 갖는 RNA에 결합하는 천연-발생 단백질, 또는 그의 비-천연-발생 변이체, 또는 비-천연 발생 단백질이다.
특정 실시양태에서, RNA 결합 단백질은 전사-활성화 반응 요소 (TAR 요소)에 특이적으로 결합하는 전사의 전사-활성화제 (Tat) 단백질이다. 예시적인 Tat 단백질은 서열식별번호: 65에 제시된 바와 같은 아미노산 서열을 포함한다 (표 1). TAR 요소에 결합하는 Tat 단백질, 뿐만 아니라 Tat 단백질 단편의 예시적인 아미노산 서열은 표 1에 제시된다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84 중 어느 하나의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84 중 어느 하나의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 적어도 115개, 적어도 120개, 적어도 125개, 또는 적어도 130개의 동일한 인접한 아미노산을 갖고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84에 제시된 아미노산 서열 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, TAR 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 65 내지 84에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Tat 단백질은 서열식별번호: 65 내지 84 중 어느 하나에 제시된 바와 같은 아미노산 서열을 포함한다. RNA 결합 단백질은 또한 TAR 요소와 회합할 수 있는 Tat 단백질의 변이체일 수 있다. TAR 요소에 결합하는 Tat 단백질, 뿐만 아니라 Tat 단백질의 변이체는 관련 기술분야에 공지되어 있으며, 예를 들어, 문헌 [Kamine et al., "Mapping of HIV-1 Tat Protein Sequences Required for Binding to Tar RNA", Virology 182, 570-577 (1991)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 이전에 기재되었으며; 그의 각각의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, Tat 단백질은 HIV-1 Tat 단백질, 또는 그의 변이체이다. 일부 실시양태에서, Tat 단백질은 소 면역결핍 바이러스 (BIV) Tat 단백질, 또는 그의 변이체이다.
Tat 단백질은 LTR 프로모터로부터의 바이러스 전사 및 복제에 필수적인 바이러스 유전자 발현의 핵 전사 활성화제이며; 이는 세포 전사 기구의 성분을 바이러스 RNA에 지정하여 RNA 폴리머라제 II (RNA pol II) 복합체에 의한 진행적 전사 신장을 촉진시킴으로써, 전장 전사체의 수준을 증가시키는 서열-특이적 분자 어댑터로서 작용한다. Tat는 CCNT1-독립적 방식으로 전사활성화 반응성 RNA 요소 (TAR RNA)로 지칭되는 모든 발생기 바이러스 mRNA의 5'-단부에서 헤어핀 구조에 결합한다.
Tat 단백질은 몇몇 도메인으로 이루어지며, 하나는 핵 국재화에 중요한 짧은 리신 및 아르기닌 풍부 영역이다. HIV-1 Tat의 9 아미노산 염기성 영역은 서열식별번호: 65의 위치 49 내지 57에서 발견되고, TAR 요소에 결합할 수 있다. 일부 실시양태에서, Tat 서열은 Tat (서열식별번호: 73)의 9 아미노산 염기성 영역을 포함한다. 일부 실시양태에서 RNA 결합 단백질은 서열식별번호: 65 내지 67, 69, 70, 또는 73 내지 84에 제시된 바와 같은 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Tat 단백질은 융합 단백질이다.
표 1. Tat 서열
일부 실시양태에서, RNA 결합 단백질은 Rev 반응 요소 (RRE)에 결합하는 비리온 발현 (Rev) 단백질 (예를 들어, HIV-1로부터의 Rev), 또는 그의 변이체의 조절제이다. Rev 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 공지되어 있다. 예를 들어, Rev 단백질은 문헌 [Fernandes et al., "The HIV-1 Rev response element: An RNA scaffold that directs the cooperative assembly of a homo-oligomeric ribonucleoprotein complex" RNA Biology 9:1, 6-11; January 2012]; [Cochrane et al., "The human immunodeficiency virus Rev protein is a nuclear phosphoprotein" Virology 171 (1):264-266, 1989]; [Grate et al., "Role REVersal: understanding how RRE RNA binds its peptide ligand" Structure. 1997 Jan 15;5(1):7-11]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 예시적인 Rev 단백질은 서열식별번호: 93 내지 95 (표 3)에 제시된 바와 같은 아미노산 서열을 포함한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95 중 어느 하나의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95 중 어느 하나의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 또는 적어도 115개의 동일한 인접한 아미노산을 갖고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95에 제시된 아미노산 서열 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, Rev 반응 요소에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 93 내지 95에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, RNA 결합 단백질은 RRE에 결합할 수 있는 서열식별번호: 93 내지 95에 제시된 바와 같은 아미노산 서열 중 어느 하나의 변이체를 포함한다. 이러한 변이체는 본 개시내용 및 관련 기술분야의 지식에 기반하여 통상의 기술자에게 명백할 것이고, 관련 기술분야에 공지된 통상적인 방법을 사용하여 (예를 들어 RRE에의 결합에 대해) 시험될 수 있다.
일부 실시양태에서, RNA 결합 단백질은 MS2 RNA에 특이적으로 결합하는 MS2 박테리오파지의 코트 단백질이다. MS2 RNA에 특이적으로 결합하는 MS2 박테리오파지 코트 단백질은 관련 기술분야에 공지되어 있다. 예를 들어 MS2 파지 코트 단백질은 문헌 [Parrott et al., "RNA aptamers for the MS2 bacteriophage coat protein and the wild-type RNA operator have similar solution behavior" Nucl. Acids Res. 28(2):489-497 (2000)]; [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins" Biol. Cell. 100(2): 125-38 (2008)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 예시적인 MS2 파지 코트 단백질은 서열식별번호: 99에 제시된 바와 같은 아미노산 서열을 포함한다 (표 4). 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99의 아미노산 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일하고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99의 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 105개, 적어도 110개, 또는 적어도 115개의 동일한 인접한 아미노산을 갖고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖고, MS2 RNA에 결합한다. 일부 실시양태에서, RNA 결합 단백질은 서열식별번호: 99에 제시된 아미노산 서열을 포함한다. 일부 실시양태에서, RNA 결합 단백질은 MS2 RNA에 결합할 수 있는 서열식별번호: 99의 단편 또는 변이체를 포함한다. MS2 파지 코트 단백질의 변이체 또는 단편이 MS2 RNA (예를 들어, 서열식별번호: 99)에 결합하는지 여부를 시험하는 방법은 통상적인 실험을 사용하여 수행될 수 있으며, 통상의 기술자에게 명백할 것이다.
일부 실시양태에서, RNA 결합 단백질은 P22 boxB RNA에 결합하는 P22 N 단백질 (예를 들어, 박테리오파지로부터의 P22 N), 또는 그의 변이체이다. P22 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, P22 N 단백질은 문헌 [Cai et al., "Solution structure of P22 transcriptional antitermination N peptide-boxB RNA complex" Nat Struct Biol. 1998 Mar;5(3):203-12]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 단백질 P22 boxB RNA에 특이적으로 결합하는 예시적인 P22 N은 아미노산 서열 NAKTRRHERRRKLAIERDTI (서열식별번호: 100)를 포함한다.
일부 실시양태에서, RNA 결합 단백질은 λ boxB RNA에 결합하는 λ N 단백질 (예를 들어, 박테리오파지로부터의 λ N), 또는 그의 변이체이다. λ N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, λ N 단백질은 문헌 [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins" Biol Cell. 2008 Feb;100(2):125-38]; [Legault et al., "NMR structure of the bacteriophage lambda N peptide/boxB RNA complex: recognition of a GNRA fold by an arginine-rich motif" Cell. 1998 Apr 17;93(2):289-99]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. λ boxB에 특이적으로 결합하는 예시적인 λ N 단백질은 아미노산 서열 GSMDAQTRRRERRAEKQAQWKAAN (서열식별번호: 101)을 포함한다.
일부 실시양태에서, RNA 결합 단백질은 φ21 boxB RNA에 결합하는 φ21 N 단백질 (예를 들어, 박테리오파지로부터의 φ21 N), 또는 그의 변이체이다. φ21 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, φ21 단백질은 문헌 [Cilley et al. "Structural mimicry in the phage φ21 N peptide-boxB RNA complex." RNA. 2003;9(6):663-676]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. φ21 boxB RNA에 특이적으로 결합하는 예시적인 φ21 N 단백질은 아미노산 서열 GTAKSRYKARRAELIAERR(서열식별번호: 102)을 포함한다. N 펩티드는 α-나선으로서 결합하고, boxB RNA 줄기-루프의 5' 절반의 주요 그루브 측과 지배적으로 상호작용한다. 이 결합 계면은 극성 및 비극성 상호작용의 표면 상보성에 의해 한정된다. φ21 boxB 루프의 노출된 면과 복합체화된 N 펩티드는 관련된 λ 및 P22 박테리오파지 N 펩티드-boxB RNA 복합체의 GNRA 테트라루프-유사 폴드와 유사하다.
일부 실시양태에서, RNA 결합 단백질은 SL3 ψ RNA에 결합하는 HIV-1 뉴클레오캡시드 (예를 들어, HIV-1로부터의 뉴클레오캡시드), 또는 그의 변이체이다. HIV-1 뉴클레오캡시드 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, HIV-1 뉴클레오캡시드 단백질은 문헌 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다. SL3 ψ RNA에 특이적으로 결합하는 예시적인 HIV-1 뉴클레오캡시드는 아미노산 서열: MQKGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQAN (서열식별번호: 103)을 포함한다.
결합 RNA
본 개시내용의 일부 측면은 단백질에 결합하는 RNA 분자에 관한 것이다. 일부 실시양태에서, 결합 RNA는 특이적 아미노산 서열 또는 구조를 갖는 단백질에 결합하는 천연 발생 RNA, 또는 그의 비-천연 발생 변이체, 또는 비-천연 발생 RNA이다.
특정 실시양태에서, 결합 RNA는 발생기 인간 면역결핍 바이러스-1 (HIV-1) 전사체의 5' 단부에서 발견되고 전사의 전사-활성화제 (Tat) 단백질에 특이적으로 결합하는 RNA 줄기-루프 구조인 전사-활성화 반응 요소 (TAR 요소)이다. 일부 실시양태에서, TAR 요소는 소 면역결핍 바이러스 (BIV) TAR이다. 예시적인 TAR 요소는 서열식별번호: 84에 제시된 바와 같은 핵산 서열을 포함한다. 추가의 예시적인 TAR 서열은 표 2에서 발견될 수 있지만; 이들 서열은 제한적인 것으로 의미되지 않으며, Tat 단백질, 또는 그의 변이체에 결합하는 추가의 TAR 요소 서열은 또한 본 개시내용의 범위 내에 있다. 결합 RNA는 또한 바이러스 게놈의 전사에 관여하는 조절 단백질인 RNA 결합 단백질, 전사의 전사-활성화제 (Tat 단백질)와 회합할 수 있는 TAR 요소의 변이체일 수 있다. Tat 단백질과 회합할 수 있는 TAR 요소의 변이체는 본 개시내용 및 관련 기술분야의 지식에 기반하여 통상의 기술자에게 명백할 것이며, 본 개시내용의 범위 내에 있다. 또한, TAR 변이체 및 Tat 단백질, 또는 Tat 단백질 변이체 사이의 회합은 통상적인 방법을 사용하여 시험될 수 있다. Tat 단백질에 결합하는 TAR 요소 및 TAR 요소의 변이체는 관련 기술분야에 공지되어 있고, 예를 들어 문헌 [Kamine et al., "Mapping of HIV-1 Tat Protein Sequences Required for Binding to Tar RNA" Virology 182, 570-577 (1991)]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 이전에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 결합 RNA는 서열식별번호: 85 내지 90에 제시된 바와 같은 핵산 서열을 포함한다. 일부 실시양태에서, 결합 RNA는 Tat 단백질 또는 그의 변이체에 결합할 수 있는 서열식별번호: 85 내지 90에 제시된 임의의 핵산 서열의 변이체를 포함한다.
임의의 특정 이론에 구애되기를 원하지는 않지만, TAR 요소는 천연 바이러스 RNA에서 안정한 줄기-루프 구조를 형성할 수 있다 (Muesing et al., 1987). TAR의 줄기 상에, 3개의 뉴클레오티드 벌지는 TAR 요소에의 Tat 단백질의 고-친화도 결합에서 역할을 하는 것으로 입증되었다 (Roy et al., 1990; Cordingley et al., 1990; Dingwall et al., 1989; Weeks et al., 1990). TAR 요소에서, 줄기 및 벌지의 초기 U22의 통합성은 Tat 단백질 결합에 기여할 수 있다 (Roy et al., 1990b). TAR 부위에의 Tat 단백질의 결합에 영향을 미치지 않을 수 있는 다른 서열은 생체내에서 전사의 전사-활성화에서 역할을 한다. 한 이러한 영역은 Tat 단백질과 상호작용하여 전사활성화를 매개할 수 있는 세포 인자의 결합에 요구되는 루프에서의 서열이다 (Gatignol et al., 1989; Gaynor et al., 1989; Marciniak et al., 1990a; Gatignol et al., 1991).
표 2. TAR 서열
일부 실시양태에서, 결합 RNA는 Rev 단백질 (예를 들어, HIV-1로부터의 Rev)에 결합하는 Rev 반응 요소 (RRE), 또는 그의 변이체이다. Rev 반응 요소는 관련 기술분야에 공지되어 있으며, 본 발명에서 사용하기 위해 통상의 기술자에게 명백할 것이다. 예를 들어, Rev 반응 요소는 문헌 [Fernandes et al., "The HIV-1 Rev response element: An RNA scaffold that directs the cooperative assembly of a homo-oligomeric ribonucleoprotein complex." RNA Biology 9:1, 6-11, January 2012]; [Cook et al., "Characterization of HIV-1 REV protein: binding stoichiometry and minimal RNA substrate." Nucleic Acids Res. Apr 11; 19(7):1577-1583, 1991]; [Grate et al., "Role REVersal: understanding how RRE RNA binds its peptide ligand" Structure. 1997 Jan 15;5(1):7-11]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 상기 참고문헌에 기재된 임의의 RRE 핵산 서열 또는 RRE 핵산 서열의 임의의 단편은 본 개시내용에 따른 결합 RNA로서 사용될 수 있다. Rev에 결합하는 예시적인 RRE 핵산 서열은 제한 없이, 서열식별번호: 91 및 92에 제시된 핵산 서열을 포함한다 (표 3).
일부 실시양태에서, Rev 펩티드는 특정 구조를 채택할 수 있고, 단일 아르기닌이라기 보다는 몇몇 아미노산은 서열-특이적 RNA 상호작용에 참여할 수 있다. 임의의 특정 이론에 구애되기를 원하지는 않지만, RRE의 Rev 인식은, TAR의 Tat 인식과 같이, 직접적 결합에 기인한다. 결합은 긴밀하고 (Kd =1 내지 3 nM), RRE에 대해 고도로 특이적일 수 있다. Rev의 농도가 증가함에 따라, 점차적으로 보다 큰 RRE RNA와의 복합체가 형성되는 반면, Tat는 TAR RNA와 일-대-일 복합체를 형성한다.
일반적으로, Rev 단백질은 처음에 고 친화도 부위에 결합할 수 있고, 이어서 추가의 Rev 분자는 보다 낮은 친화도 부위를 점유한다. Rev에 결합하는 RNA는 문헌 [Heaphy et al., "HIV-1 regulator of virion expression (Rev) protein binds to an RNA stem-loop structure located within the Rev-response element region" Cell, 1990. 60, 685-693]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다.
표 3. RRE/Rev 서열
일부 실시양태에서, 결합 RNA는 MS2 파지 코트 단백질에 특이적으로 결합하는 MS2 RNA이다. 전형적으로, RNA 박테리오파지 MS2의 코트 단백질은 바이러스 RNA (예를 들어, MS2 RNA)에서 특이적 줄기-루프 구조에 결합하여 게놈의 외피화 및 레플리카제 합성의 번역 억제를 달성한다. MS2 파지 코트 단백질에 특이적으로 결합하는 RNA는 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어 MS2 파지 코트 단백질에 결합하는 RNA는 문헌 [Parrott et al., "RNA aptamers for the MS2 bacteriophage coat protein and the wild-type RNA operator have similar solution behavior." Nucl. Acids Res. 28(2): 489-497 (2000)]; [Witherell et al., "Specific interaction between RNA phage coat proteins and RNA." Prog Nucleic Acid Res Mol Biol. 1991;40:185-220]; [Stockley et al., "Probing sequence-specific RNA recognition by the bacteriophage MS2 coat protein." Nucleic Acids Res. 1995 Jul 11;23(13):2512-8]; [Keryer-Bibens C., et al., "Tethering of proteins to RNAs by bacteriophage proteins." Biol. Cell. 100(2): 125-38 (2008)]; 및 [Patel. "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, MS2 파지 코트 단백질에 특이적으로 결합하는 예시적인 MS2 RNA는 서열식별번호: 96 내지 98 중 어느 하나에 제시된 바와 같은 핵산 서열을 포함한다 (표 4). 일부 실시양태에서, 결합 RNA는 서열식별번호: 96, 97, 또는 98 중 어느 하나의 핵산 서열을 포함한다.
표 4. MS2 서열
일부 실시양태에서, 결합 RNA믐 P22 N 단백질 (예를 들어, 박테리오파지로부터의 P22 N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. P22 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, P22 N 단백질은 문헌 [Cai et al., "Solution structure of P22 transcriptional antitermination N peptide-boxB RNA complex" Nat Struct Biol. 1998 Mar;5(3):203-12]; [Weiss, "RNA-mediated signaling in transcription" Nat Struct Biol. 1998 May;5(5):329-33]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules" Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. P22 N 단백질에 특이적으로 결합하는 예시적인 P22 boxB RNA는 gcgcugacaaagcgc (서열식별번호: 104)에 제시된 바와 같은 핵산 서열을 포함한다.
일부 실시양태에서, 결합 RNA는 λ N 단백질 (예를 들어, 박테리오파지로부터의 λ N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. λ N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, λ N 단백질은 문헌 [Keryer-Bibens et al., "Tethering of proteins to RNAs by bacteriophage proteins." Biol Cell. 2008 Feb;100(2):125-38]; [Weiss. "RNA-mediated signaling in transcription." Nat Struct Biol. 1998 May;5(5):329-33]; [Legault et al., "NMR structure of the bacteriophage lambda N peptide/boxB RNA complex: recognition of a GNRA fold by an arginine-rich motif." Cell. 1998 Apr 17;93(2):289-99]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. λ N 단백질에 특이적으로 결합하는 예시적인 λ boxB RNA는 gggcccugaagaagggccc (서열식별번호: 105)에 제시된 바와 같은 핵산 서열을 포함한다.
일부 실시양태에서, 결합 RNA는 φ21 N 단백질 (예를 들어, 박테리오파지로부터의 φ21 N), 또는 그의 변이체에 특이적으로 결합하는 RNA이다. φ21 N 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, φ21 단백질은 문헌 [Cilley et al. "Structural mimicry in the phage φ21 N peptide-boxB RNA complex." RNA. 2003;9(6):663-676]; 및 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. φ21 N 단백질에 특이적으로 결합하는 예시적인 φ21 boxB RNA는 ucucaaccuaaccguugaga (서열식별번호: 106)에 제시된 바와 같은 핵산 서열을 포함한다.
일부 실시양태에서, 결합 RNA는 HIV-1 뉴클레오캡시드 단백질 (예를 들어, HIV-1로부터의 뉴클레오캡시드) 또는 그의 변이체에 특이적으로 결합하는 RNA이다. HIV-1 뉴클레오캡시드 단백질은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, HIV-1 뉴클레오캡시드 단백질은 문헌 [Patel, "Adaptive recognition in RNA complexes with peptides and protein modules." Curr Opin Struct Biol. 1999 Feb;9(1):74-87]에 기재되었으며; 그의 전체 내용은 본원에 참조로 포함된다. HIV-1 뉴클레오캡시드에 특이적으로 결합하는 예시적인 SL3 ψ RNA는 ggacuagcggaggcuagucc (서열식별번호: 107)에 제시된 바와 같은 핵산 서열을 포함한다.
본 개시내용의 결합 RNA는 단백질 결합 상대를 인식한 천연-발생 RNA 또는 그의 비-천연-발생 변이체에 제한될 필요가 없음이 인지되어야 한다. 일부 실시양태에서, 결합 RNA는 또한 합성적으로 생산된 RNA, 예를 들어 단백질 (예를 들어, RNA 결합 단백질)에 특이적으로 결합하도록 디자인된 RNA일 수 있다. 일부 실시양태에서, 결합 RNA는 임의의 관심의 단백질, 예를 들어 ARRDC1에 특이적으로 결합하도록 디자인된다. 일부 실시양태에서, 결합 RNA는 지수적 풍부화에 의한 리간드의 체계적 진화 (SELEX)에 의해 생산된 RNA이다. SELEX 방법론은 통상의 기술자에게 명백할 것이며, 예를 들어 미국 특허 번호 5,270,163; 5,817,785; 5,595,887; 5,496,938; 5,475,096; 5,861,254; 5,958,691; 5,962,219; 6,013,443; 6,030,776; 6,083,696; 6,110,900; 6,127,119; 및 6,147,204; 미국 출원 20030175703 및 20030083294, 문헌 [Potti et al., Expert Opin. Biol. Ther. 4:1641-1647 (2004)], 및 [Nimjee et al., Annu. Rev. Med. 56:555-83 (2005)]에 이전에 기재되었다. SELEX의 기술은 다양한 표적 단백질에 대한 극도로 높은 결합 친화도를 갖는 압타머를 진화시키는데 사용되었다. 예를 들어, 혈관 내피 성장 인자 (VEGF)에 결합하는 압타머를 디자인하기 위해 SELEX를 사용하는 그의 개시내용에 대해 문헌 [Trujillo U. H., et al., "DNA and RNA aptamers: from tools for basic research towards therapeutic applications". Comb Chem High Throughput Screen 9 (8): 619-32 (2006)]을 참조한다. 일부 실시양태에서, 결합 RNA는 표적 단백질, 예를 들어, ARMM에서 발견되는 단백질 (예를 들어, ARRDC1 또는 TSG101)에 특이적으로 결합하는 압타머이다.
화물 RNA
본 개시내용의 일부 측면은 ARMM과 회합된, 예를 들어, 그의 액체 상 내로 혼입된 RNA를 제공한다. 일부 실시양태에서, 화물 RNA는 그의 ARMM와의 회합 또는 그에서의 포함을 통해 대상체, 기관, 조직, 또는 세포에 전달될 수 있는 RNA 분자이다. 일부 실시양태에서, 화물 RNA는 시험관내에서, 생체내에서, 또는 생체외에서 표적 세포에 전달된다. 일부 실시양태에서, 전달되는 화물 RNA는 생물학적으로 활성인 작용제이며, 즉, 이는 세포, 기관, 조직, 및/또는 대상체에서 활성을 갖는다. 예를 들어, 대상체에게 투여되는 경우, 그 대상체에 대해 생물학적 효과를 갖는 RNA는 생물학적으로 활성인 것으로 간주된다. 특정 실시양태에서, 화물 RNA는 메신저 RNA 또는 세포에서 단백질을 발현하는 RNA이다. 특정 실시양태에서, 화물 RNA는 세포에서 1종 이상의 유전자의 발현을 억제하는 작은 간섭 RNA (siRNA)이다. 일부 실시양태에서, 전달되는 화물 RNA는 치료제, 예를 들어, 대상체에게 투여되는 경우 대상체에 대해 유익한 효과를 갖는 작용제이다. 일부 실시양태에서, 세포에 전달되는 화물 RNA는 전사 인자, 종양 서프레서, 발달 조절제, 성장 인자, 전이 서프레서, 프로-아폽토시스 단백질, 뉴클레아제, 또는 리콤비나제를 발현하는 RNA이다. 일부 실시양태에서, 전달되는 화물 RNA는 p53, Rb (망막모세포종 단백질), BIM 단백질, BRCA1, BRCA2, PTEN, 선종성 결장 폴립증 (APC), CDKN1B, 시클린-의존성 키나제 억제제 1C, HEPACAM, INK4, Mir-145, p16, p63, p73, SDHB, SDHD, 분비된 프리즐드-관련된 단백질 1, TCF21, TIG1, TP53, 결절성 경화증 복합체 종양 서프레서, 폰 히펠-린다우 (VHL) 종양 서프레서, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α, TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, 또는 FLP 리콤비나제를 발현하는 RNA이다.
일부 실시양태에서, 화물 RNA는 세포에서 1종 이상의 유전자의 발현을 억제하는 RNA일 수 있다. 예를 들어, 일부 실시양태에서, 화물 RNA는 마이크로RNA (miRNA), 작은 간섭 RNA (siRNA), 또는 안티센스 RNA (asRNA)이다.
일부 실시양태에서, 전달되는 화물 RNA는 메신저 RNA (mRNA), 리보솜 RNA (rRNA), 신호 인식 입자 RNA (SRP RNA), 또는 운반 RNA (tRNA)를 포함한다. 일부 실시양태에서, 전달되는 화물 RNA는 작은 핵 RNA (snRNA), 작은 핵소체 (snoRNA), SmY RNA (smY), 가이드 RNA (gRNA), 리보뉴클레아제 P (RN아제 P), 리보뉴클레아제 MRP (RN아제 MRP), Y RNA, 텔로머라제 RNA 성분 (TERC), 또는 스플라이싱된 리더 RNA (SL RNA)를 포함한다. 일부 실시양태에서, 전달되는 화물 RNA는 안티센스 RNA (asRNA), 시스-천연 안티센스 서열 (시스-NAT), CRISPR RNA (crRNA), 긴 비코딩 RNA (lncRNA), 마이크로RNA (miRNA), 피위-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 또는 트랜스-작용 siRNA (tasiRNA)를 포함한다.
일부 실시양태에서, 전달되는 화물 RNA는 진단제이다. 일부 실시양태에서, 전달되는 화물 RNA는 예방제이다. 일부 실시양태에서, 전달되는 화물 RNA는 영상화제로서 유용하다. 이들 실시양태의 일부에서, 진단제 또는 영상화제는 생물학적으로 활성이고, 다른 것들에서 이는 그렇지 않다.
일부 실시양태에서, 본원에서 제공된 임의의 화물 RNA는 결합 RNA와 회합된다. 일부 실시양태에서, 화물 RNA는 결합 RNA와 공유 회합된다. 일부 실시양태에서, 화물 RNA 및 결합 RNA는 동일한 RNA 분자 (예를 들어, 단일 전사체로부터의 RNA)의 일부이다. 일부 실시양태에서, 화물 RNA 및 결합 RNA는 링커를 통해 공유 회합된다. 일부 실시양태에서, 링커는 뉴클레오티드 또는 핵산 (예를 들어, DNA 또는 RNA)을 포함한다. 일부 실시양태에서, 링커는 RNA를 포함한다. 일부 실시양태에서, 링커는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 100개, 적어도 150개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 또는 적어도 500개의 뉴클레오티드 (예를 들어, DNA 또는 RNA)를 포함한다.
다른 실시양태에서, 화물 RNA는 결합 RNA와 비-공유 회합된다. 예를 들어, 화물 RNA는 상보적 염기 쌍형성을 통해 결합 RNA와 회합할 수 있다. 일부 실시양태에서, 화물 RNA는 인접하거나 비-인접할 수 있는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개의 상보적 염기 쌍을 통해 결합 RNA에 결합된다. 일부 실시양태에서, 화물 RNA는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 50개의 인접한 상보적 염기 쌍을 통해 결합 RNA에 결합된다.
본원에서 제공된 임의의 RNA (예를 들어, 결합 RNA, 화물 RNA, 및/또는 화물 RNA에 융합된 결합 RNA)는 1개 이상의 변형된 올리고뉴클레오티드를 포함할 수 있음이 인지되어야 한다. 일부 실시양태에서, 본원에 기재된 임의의 RNA는 변형될 수 있으며, 예를 들어, 변형된 당 모이어티, 변형된 뉴클레오시드간 연결, 변형된 뉴클레오티드 및/또는 이들의 조합을 포함할 수 있다. 일부 실시양태에서, 본 발명의 RNA 올리고뉴클레오티드는 핵산분해적 분해에 대해, 예컨대 변형, 예를 들어, 뉴클레오티드 변형의 혼입에 의해 안정화될 수 있다. 예를 들어, 본 발명의 핵산 서열은 뉴클레오티드 서열의 5' 또는 3' 단부에 포스포로티오에이트 적어도 제1, 제2, 또는 제3 뉴클레오티드간 연결을 포함한다. 또 다른 예로서, 핵산 서열은 2'-변형된 뉴클레오티드, 예를 들어, 2'-데옥시, 2'-데옥시-2'-플루오로, 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), 2'-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE), 또는 2'-O--N-메틸아세트아미도 (2'-O--NMA)를 포함할 수 있다. 또 다른 예로서, 핵산 서열은 적어도 1개의 2'-O-메틸-변형된 뉴클레오티드를 포함할 수 있고, 일부 실시양태에서, 모든 뉴클레오티드는 2'-O-메틸 변형을 포함한다. 일부 실시양태에서, 핵산은 "잠금되고", 즉, 리보스 고리가 2'-O 원자 및 4'-C 원자를 연결하는 메틸렌 가교에 의해 "잠금된" 핵산 유사체를 포함한다.
본원에 기재된 RNA 올리고뉴클레오티드의 임의의 변형된 화학 또는 형식은 서로와 조합될 수 있고, 그 1, 2, 3, 4, 5, 또는 그 초과의 상이한 유형의 변형은 동일한 분자 내에 포함될 수 있다.
일부 실시양태에서, RNA 올리고뉴클레오티드는 적어도 1개의 가교된 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, 올리고뉴클레오티드는 가교된 뉴클레오티드, 예컨대 잠금된 핵산 (LNA) 뉴클레오티드, 구속된 에틸 (cEt) 뉴클레오티드, 또는 에틸렌 가교된 핵산 (ENA) 뉴클레오티드를 포함할 수 있다. 이러한 뉴클레오티드의 예는 본원에 개시되어 있으며, 관련 기술분야에 공지되어 있다. 일부 실시양태에서, 올리고뉴클레오티드는 하기 미국 특허 또는 특허 출원 공개 중 하나에 개시된 뉴클레오티드 유사체를 포함하며, 그의 각각의 전체 내용은 모든 목적을 위해 본원에 참조로 포함된다: US 7,399,845, US 7,741,457, US 8,022,193, US 7,569,686, US 7,335,765, US 7,314,923, US 7,335,765, 및 US 7,816,333, US 20110009471. 올리고뉴클레오티드는 1개 이상의 2' O-메틸 뉴클레오티드를 가질 수 있다. 올리고뉴클레오티드는 2' O-메틸 뉴클레오티드로 전적으로 이루어질 수 있다.
발현 구축물
본 발명의 일부 측면은 본원에 기재된 임의의 최소 ARRDC1 융합 단백질, TSG101 융합 단백질, 또는 화물 융합 단백질을 코딩하는 발현 구축물을 제공한다. 일부 실시양태에서, 본원에 기재된 발현 구축물은 가이드 RNA (gRNA)를 추가로 코딩할 수 있다. gRNA는 동일한 프로모터 서열 또는 상이한 프로모터 서열의 제어 하에서 본원에 기재된 임의의 융합 단백질로서 발현될 수 있음이 인지되어야 한다. 일부 실시양태에서, gRNA를 코딩하는 발현 구축물은 본원에 기재된 임의의 발현 구축물과 공동-발현될 수 있다.
일부 실시양태에서, 본원에 기재된 발현 구축물은 이러한 구축물을 함유하는 세포에서 ARMM의 생성을 유도하거나 용이하게 하는 유전자 산물 또는 유전자 산물들을 추가로 코딩할 수 있다. 일부 실시양태에서, 발현 구축물은 최소 ARRDC1 단백질, 또는 그의 변이체, 및/또는 TSG101 단백질, 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 세포에서의 이들 유전자 산물 중 어느 하나 또는 둘 다의 과발현은 세포에서 ARMM의 생산을 증가시키고, 따라서 세포를 미세소포 생산 세포로 변화시킨다. 일부 실시양태에서, 이러한 발현 구축물은 코딩되는 최소 ARRDC1 및/또는 TSG101 단백질 또는 그의 변이체의 C-말단에서, 또는 N-말단에서 융합되는 Cas9 서열의 인-프레임 클로닝을 허용하는 적어도 1개의 제한 또는 재조합 부위를 포함한다.
일부 실시양태에서, 발현 구축물은 (a) 이종 프로모터에 작동가능하게 연결된 최소 ARRDC1 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) ARRDC1-코딩 뉴클레오티드 서열과 프레임 내에서 추가의 폴리펩티드를 코딩하는 뉴클레오티드 서열의 삽입을 허용하는 최소 ARRDC1-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함한다. 일부 실시양태에서, 발현 구축물은 (a) 이종 프로모터에 작동가능하게 연결된 최소 ARRDC1 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) 최소 ARRDC1-코딩 뉴클레오티드 서열과 프레임 내에서 Cas9 또는 Cas9 변이체 서열의 삽입을 허용하는 최소 ARRDC1-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함한다. 본 발명의 일부 측면은 (a) 이종 프로모터에 작동가능하게 연결된 TSG101 단백질, 또는 그의 변이체를 코딩하는 뉴클레오티드 서열, 및 (b) TSG101-코딩 뉴클레오티드 서열과 프레임 내에서 Cas9 또는 Cas9 변이체 서열의 삽입을 허용하는 TSG101-코딩 뉴클레오티드 서열에 인접하여 위치한 제한 부위 또는 재조합 부위를 포함하는 발현 구축물을 제공한다.
발현 구축물은 적어도 1개의 WW 도메인에 융합된 화물 단백질을 코딩할 수 있다. 일부 실시양태에서, 발현 구축물은 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 Cas9 단백질, 또는 그의 변이체를 코딩한다. 본원에 기재된 임의의 발현 구축물은 임의의 WW 도메인 또는 그의 변이체를 코딩할 수 있다. 예를 들어, 발현 구축물은 폴리 펩티드 서열 (서열식별번호: 6); (서열식별번호: 7); (서열식별번호: 8); (서열식별번호: 9); (서열식별번호: 10); (서열식별번호: 11); (서열식별번호: 12); (서열식별번호: 13); (서열식별번호: 14); (서열식별번호: 18) 또는 (서열식별번호: 19)로부터의 WW 도메인 또는 그의 변이체를 코딩할 수 있는 임의의 뉴클레오티드 서열을 포함할 수 있다.
본원에 기재된 발현 구축물은 WW 도메인 또는 그의 변이체를 코딩할 수 있는 임의의 핵산 서열을 포함할 수 있다. 예를 들어, WW 도메인 또는 WW 도메인 변이체를 코딩하는 핵산 서열은 인간 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2로부터의 것일 수 있다. WW 도메인 함유 단백질의 예시적인 핵산 서열은 하기 열거된다. 본원에 기재된 예시적인 단백질의 WW 도메인 또는 WW 도메인 변이체를 코딩하는 임의의 핵산은 본 발명에 사용될 수 있으며, 제한적인 것으로 의미되지 않음이 인지되어야 한다.
특정 실시양태에서, 핵산은 하기 핵산 서열을 갖는 인간 ITCH 단백질로부터의 2개의 WW 도메인 또는 WW 도메인 변이체를 갖는 화물 단백질을 코딩할 수 있다:
다른 실시양태에서, 핵산은 하기 핵산 서열을 갖는 인간 ITCH 단백질로부터의 4개의 WW 도메인 또는 WW 도메인 변이체를 갖는 화물 단백질을 코딩할 수 있다:
적어도 1개의 WW 도메인 또는 WW 도메인 변이체에 융합된 본원에 기재된 화물 단백질을 코딩하는 핵산 구축물은 비-천연 발생이며, 즉, 이들은 자연에 존재하지 않는다.
일부 실시양태에서 발현 구축물은 핵산 서열 (서열식별번호: 23); (서열식별번호: 24); (서열식별번호: 25); (서열식별번호: 26); (서열식별번호: 27); (서열식별번호: 28); (서열식별번호: 29); (서열식별번호: 30); (서열식별번호: 31); (서열식별번호: 32) 또는 (서열식별번호: 33)으로부터의 WW 도메인, 또는 그의 변이체를 코딩하는 핵산 서열을 포함한다. 특정 실시양태에서, 발현 구축물은 WW 도메인 또는 다수의 WW 도메인, 핵 국재화 서열 (NLS), 및 Cas9 단백질 또는 그의 변이체를 포함하는 융합 단백질을 코딩한다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)를 포함한다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)로 이루어진다. 특정 실시양태에서, 발현 구축물은 핵산 서열 (서열식별번호: 111) 또는 (서열식별번호: 112)로 본질적으로 이루어진다.
하기 핵산 서열은 pX330 플라스미드 (애드진)의 AgeI 부위 내로 클로닝된 2개의 WW 도메인 (서열식별번호: 109) 또는 4개의 WW 도메인 (서열식별번호: 110) 중 어느 하나를 갖는 예시적인 Cas9 화물 단백질 서열을 코딩한다.
본원에 기재된 임의의 단백질을 코딩하는 핵산은 관련 기술분야에 공지된 임의의 수의 핵산 "벡터"에 있을 수 있다. 본원에 사용된 "벡터"는 숙주 세포 내로 핵산을 전달하는데 사용될 수 있는 임의의 핵산 또는 핵산-함유 입자, 세포, 또는 유기체를 포함할 수 있다. 용어 "벡터"는 바이러스 및 비바이러스 산물 둘 다 및 세포 내로 핵산을 도입하는 수단을 포함한다. "벡터"는 시험관내에서, 생체외에서, 또는 생체내에서 사용될 수 있다. 비-바이러스 벡터는 플라스미드, 코스미드, 인공 염색체 (예를 들어, 박테리아 인공 염색체 또는 효모 인공 염색체)를 포함하고, 예를 들어 리포솜, 전기적으로 하전된 지질 (시토펙틴), DNA-단백질 복합체, 및 생체중합체를 포함할 수 있다. 바이러스 벡터는 예를 들어 레트로바이러스, 렌티바이러스, 아데노-연관된 바이러스, 폭스 바이러스, 바쿨로바이러스, 레오바이러스, 백시니아 바이러스, 단순 포진 바이러스, 엡스타인-바르 바이러스, 및 아데노바이러스 벡터를 포함한다. 벡터는 또한 바이러스의 전체 게놈 서열 또는 재조합 게놈 서열을 포함할 수 있다. 벡터는 또한 세포를 감염시키거나, 그에 진입하거나, 그에 도입되어 그 안에 핵산을 전달할 수 있는 바이러스의 생산을 위한 기능적 서열을 포함하는 게놈의 부분을 포함할 수 있다.
본원에 기재된 임의의 융합 단백질의 발현은 관련 기술분야에 공지된 임의의 조절 서열 (예를 들어 프로모터 서열)에 의해 제어될 수 있다. 본원에 기재된 바와 같은 조절 서열은 핵산 서열의 발현을 조절하는 핵산 서열이다. 조절 또는 제어 서열은 특정 핵산 (즉, Cas9 화물 단백질)을 발현하는 것을 담당하는 서열을 포함할 수 있거나, 또는 다른 서열, 예컨대 이종, 합성, 또는 부분적으로 합성 서열을 포함할 수 있다. 서열은 특이적 또는 비-특이적 방식으로 및 유도성 또는 비-유도성 방식으로 유전자의 전사를 자극시키거나 억제하는 진핵생물, 원핵생물 또는 바이러스 기원의 것일 수 있다. 조절 또는 제어 영역은 복제 원점, RNA 스플라이스 부위, 인트론, 키메라 또는 하이브리드 인트론, 프로모터, 인핸서, 전사 종결 서열, 폴리 A 부위, 로커스 제어 영역, 표적 세포의 분비 경로 내로 폴리펩티드를 지정하는 신호 서열, 및 인트론을 포함할 수 있다. 이종 조절 영역은 그것이 연결되는 발현된 핵산과 자연적으로 회합되지 않는다. 이종 조절 영역 중에서 포함되는 것은 상이한 종으로부터의 조절 영역, 상이한 유전자로부터의 조절 영역, 하이브리드 조절 서열, 및 자연에서 발생하지 않지만, 관련 기술분야의 통상의 기술자에 의해 디자인된 조절 서열이다.
용어 작동가능하게 연결된은 성분이 그들의 통상적인 또는 의도된 기능을 수행하도록 구성된 서열 또는 영역의 배열을 지칭한다. 따라서, 코딩 서열에 작동가능하게 연결된 조절 또는 제어 서열은 코딩 서열의 발현에 영향을 미칠 수 있다. 조절 또는 제어 서열은 이들이 적절한 발현 또는 폴리펩티드 생산을 지정하도록 기능하는 한, 코딩 서열과 인접할 필요는 없다. 따라서, 예를 들어, 개재하는 비번역되지만 전사된 서열은 프로모터 서열 및 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 작동가능하게 연결된 것으로 간주될 수 있다. 본원에 기재된 바와 같은 프로모터 서열은 RNA 폴리머라제에 대한 결합 부위로서 작용하는 유전자의 5' 단부로부터 짧은 거리의 DNA 조절 영역이다. 프로모터 서열은 세포에서 RNA 폴리머라제에 결합하고/거나, 하류 (3' 방향) 코딩 서열의 전사를 개시할 수 있다. 프로모터 서열은 원핵생물 또는 진핵생물에서 전사를 개시할 수 있는 프로모터일 수 있다. 진핵생물 프로모터의 일부 비-제한적 예는 시토메갈로바이러스 (CMV) 프로모터, 닭 β-액틴 (CBA) 프로모터, 및 CBA 프로모터의 하이브리드 형태 (CBh)를 포함한다.
특정 실시양태에서, Cas9 화물 단백질은 pX330 플라스미드 (애드진)로부터 발현된다. 밑줄친 (단일 밑줄) 5' AgeI 클로닝 부위 및 밑줄친 (이중 밑줄) 3' EcoRI 클로닝 부위를 갖는 pX330 플라스미드의 예시적인 핵산 서열은 (서열식별번호: 34)로서 제시된다. 본원에 기재된 WW 도메인 또는 WW 도메인 변이체를 코딩하는 임의의 핵산은 서열식별번호: 34로부터의 Cas9를 코딩하는 서열과 프레임 내에서 클로닝될 수 있다. 예를 들어, 핵산 서열 (서열식별번호: 32), 또는 (서열식별번호: 33)에서 코딩된 2개의 ITCH WW 도메인 또는 4개의 ITCH WW 도메인은 5' AgeI 클로닝 부위 또는 3' EcoRI 클로닝 부위 내로 클로닝될 수 있다. 본원에 기재된 임의의 WW 도메인 또는 WW 도메인 변이체를 코딩하는 핵산은 (서열식별번호: 34)의 Cas9 서열 내로 클로닝될 수 있으며, 제공된 예는 제한적인 것으로 의미되지 않음이 인지되어야 한다.
화물 단백질을 함유하는 미세소포를 생산하는 세포
본 발명의 미세소포-생산 세포는 본원에 기재된 임의의 발현 구축물 또는 임의의 화물 단백질을 함유하는 세포일 수 있다. 예를 들어, 본 발명 미세소포-생산 세포는 이종 프로모터의 제어 하에서 (1) 최소 ARRDC1 단백질, 또는 그의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 23) 모티프-함유 변이체, 및 (2) 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 화물 단백질을 코딩하는 1종 이상의 재조합 발현 구축물을 함유할 수 있다. 특정 실시양태에서, 미세소포 생산 세포에서의 발현 구축물은 1개 이상의 WW 도메인 또는 그의 변이체를 갖는 화물 단백질을 코딩한다. 일부 실시양태에서, 발현 구축물은 1개 이상의 WW 도메인 또는 그의 변이체에 융합된 Cas9 화물 단백질 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 발현 구축물은 적어도 1개의 WW 도메인 및 적어도 1개의 NLS에 융합된 Cas9 화물 단백질 또는 그의 변이체를 코딩한다. 일부 실시양태에서, 발현 구축물은 가이드 RNA (gRNA)를 추가로 코딩한다. 일부 실시양태에서, 발현 구축물은 TSG101 단백질, 또는 TSG101 단백질 변이체를 추가로 코딩한다. 이러한 미세소포 생산 세포에 의해 상산되는 ARMM은 전형적으로 본원에 기재된 발현 구축물에 의해 코딩되는 화물 단백질을 함유하는 WW 도메인을 포함함이 인지되어야 한다.
또 다른 본 발명 미세소포-생산 세포는 이종 프로모터의 제어 하에서 (2) Cas9 화물 단백질, 또는 그의 변이체에 연결된 (1) 최소 ARRDC1 단백질, 또는 그의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 23) 모티프-함유 변이체를 코딩하는 재조합 발현 구축물을 함유할 수 있다. 본 발명의 일부 측면은 이종 프로모터의 제어 하에서 (2) Cas9 화물 단백질 또는 그의 변이체에 연결된 (1) TSG101 단백질, 또는 그의 UEV 도메인-함유 변이체를 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포를 제공한다.
본원에 기재된 임의의 발현 구축물은 세포의 게놈 내로 안정하게 삽입될 수 있다. 일부 실시양태에서, 발현 구축물은 세포에서 유지되지만, 세포의 게놈 내로 삽입되지 않는다. 일부 실시양태에서, 발현 구축물은 벡터, 예를 들어, 플라스미드 벡터, 코스미드 벡터, 바이러스 벡터, 또는 인공 염색체에 있다. 일부 실시양태에서, 발현 구축물은 미세소포-생산 세포에서 발현 구축물의 유지 및/또는 복제를 용이하게 하는, 또는 세포에서 융합 단백질의 발현을 개선시키는 추가의 서열 또는 요소를 추가로 포함한다. 이러한 추가의 서열 또는 요소는 예를 들어, 복제 원점, 항생제 저항성 카세트, 폴리A 서열, 및/또는 전사 단리제를 포함할 수 있다. 본 발명의 측면에 따른 미세소포 생산 세포의 생산에 적합한 일부 발현 구축물은 본원의 다른 곳에 기재되어 있다. 본 발명의 측면에 따른 미세소포 생산 세포의 생성에 적합한 추가의 발현 구축물의 생성을 위한 방법 및 시약은 본 개시내용에 기반하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 미세소포 생산 세포는 포유동물 세포, 예를 들어, 마우스 세포, 래트 세포, 햄스터 세포, 설치류 세포, 또는 비인간 영장류 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 인간 세포이다.
관련 기술분야의 통상의 기술자는 통상적인 기술, 예컨대 분자 또는 세포 생물학, 바이러스학, 미생물학, 및 재조합 DNA 기술을 채용할 수 있다. 예시적인 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 본 발명을 생성하고 사용하기 위해 하기 일반 텍스트에 의존할 수 있다: 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York], 및 [Sambrook et al. Third Edition (2001)]; [DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985)]; [Oligonucleotide Synthesis (M.J. Gaited. 1984)]; [Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds. (1985))]; [Transcription and Translation Hames & Higgins, eds. (1984)]; [Animal Cell Culture (RI. Freshney, ed. (1986))]; [Immobilized Cells And Enzymes (IRL Press, (1986))]; [Gennaro et al. (eds.) Remington's Pharmaceutical Sciences, 18th edition]; [B. Perbal, A Practical Guide To Molecular Cloning (1984)]; [F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc.(updates through 2001)], [Coligan et al. (eds.), Current Protocols in Immunology, John Wiley & Sons, Inc.(updates through 2001)]; [W. Paul et al. (eds.) Fundamental Immunology, Raven Press]; [E.J. Murray et al. (ed.) Methods in Molecular Biology: Gene Transfer and Expression Protocols, The Humana Press Inc. (1991)(especially vol.7)]; 및 [J.E. Celis et al., Cell Biology: A Laboratory Handbook, Academic Press (1994)].
화물 단백질을 함유하는 ARMM의 전달
본원에 기재된 화물 단백질을 함유하는 본 발명 미세소포 (예를 들어, ARMM)는 표적화 모이어티를 추가로 가질 수 있다. 표적화 모이어티는 특이적 세포 유형에의 ARMM의 전달을 표적화하여, 특이적 표적화된 세포 유형의 세포질 내로의 ARMM의 내용물의 방출을 발생시키는데 사용될 수 있다. 표적화 모이어티는 표적 세포의 항원에 선택적으로 결합할 수 있다. 예를 들어, 표적화 모이어티는 막-결합된 이뮤노글로불린, 인테그린, 수용체, 수용체 리간드, 압타머, 소분자, 또는 그의 변이체일 수 있다. 임의의 수의 세포 표면 단백질은 또한 표적 세포에의 ARMM의 결합을 용이하게 하기 위해 및/또는 표적 세포 내로의 ARMM의 흡수를 용이하게 하기 위해 ARMM에 포함될 수 있다. 본 발명의 실시양태에 사용하는데 적합한 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 및 막-결합된 이뮤노글로불린은 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다. 예를 들어, 일부 실시양태에서, 인테그린은 α1β1, α2β1, α4β1, α5β1, α6β1, αLβ2, αMβ2, αIIbβ3, αVβ3, αVβ5, αVβ6, 또는 α6β4 인테그린이다. 일부 실시양태에서, 수용체 티로신 키나제는 EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, 또는 MuSK 수용체이다. 일부 실시양태에서, G-단백질 커플링된 수용체는 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 또는 베타-아드레날린성 수용체이다.
관련 기술분야에 공지된 임의의 수의 막-결합된 이뮤노글로불린은 임의의 수의 표적 세포 유형에의 화물 단백질을 함유하는 ARMM의 전달을 표적화하는 표적화 모이어티로서 사용될 수 있다. 특정 실시양태에서, 막-결합된 이뮤노글로불린 표적화 모이어티는 종양 연관된 또는 종양 특이적 항원에 결합한다. 종양 항원의 일부 비-제한적 예는 CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA를 포함한다 (문헌 [Bigbee W., et al. "Tumor markers and immunodiagnosis.", Cancer Medicine. 6th ed. Hamilton, Ontario, Canada: BC Decker Inc., 2003.]; [Andriole G, et al. "Mortality results from a randomized prostate-cancer screening trial.", New England Journal of Medicine, 360(13):1310-1319, 2009.]; [Schroeder FH, et al. "Screening and prostate-cancer mortality in a randomized European study." New England Journal of Medicine, 360(13):1320-1328, 2009.]; [Buys SS, et al. "Effect of screening on ovarian cancer mortality: the Prostate, Lung, Colorectal and Ovarian (PLCO) Cancer Screening Randomized Controlled Trial.", JAMA, 305(22):2295-2303, 2011]; [Cramer DW et al. "Ovarian cancer biomarker performance in prostate, lung, colorectal, and ovarian cancer screening trial specimens." Cancer Prevention Research, 4(3):365-374, 2011.]; [Roy DM, et al. "Candidate prognostic markers in breast cancer: focus on extracellular proteases and their inhibitors.", Breast Cancer. Jul 3;6:81-91, 2014.]; [Tykodi SS. et al. "PD-1 as an emerging therapeutic target in renal cell carcinoma: current evidence." Onco Targets Ther. Jul 25;7:1349-59, 2014.]; 및 [Weinberg RA. The Biology of Cancer, Garland Science, Taylor & Francis Group LLC, New York, NY, 2007.]; 각각의 전체 내용은 본원에 참조로 포함됨).
특정 실시양태에서, 막-결합된 이뮤노글로불린 표적화 모이어티는 특이적 세포 유형의 항원에 결합한다. 세포 유형은 줄기 세포, 예컨대 다능성 줄기 세포일 수 있다. 다능성 줄기 세포에 특이적인 항원의 일부 비-제한적 예는 배아 줄기 세포에서 초기 배아 발생 및 다능성 유지 둘 다에 필수적인 것으로 확인된 최초 단백질인 Oct4 및 나노그(Nanog)를 포함한다 (Nichols J, et al. "Formation of pluripotent stem cells in the mammalian embryo depends on the POU transcription factor Oct4.", Cell. 95:379-91, 1998; 그의 내용은 본원에 참조로 포함됨). Oct4, Sox2 및 나노그 외에도, Sall4, Dax1, Essrb, Tbx3, Tcl1, Rif1, Nac1 및 Zfp281을 포함한 많은 다른 다능성 줄기 세포 마커가 확인되었다 (Loh Y, et al. "The Oct4 and Nanog transcription network regulates pluripotency in mouse embryonic stem cells.", Nat Genet. 38:431-40, 2006). 막-결합된 이뮤노글로불린 표적화 모이어티는 또한 분화된 세포 유형의 항원에 결합할 수 있다. 예를 들어, 표적화 모이어티는 폐 상피 세포에의 ARMM 화물 단백질의 전달을 지정하는 폐 상피 세포에 대해 특이적인 항원에 결합할 수 있다. 비-제한적 예로서, 막-결합된 이뮤노글로불린 표적화 모이어티는 화물 단백질을 폐포 상피 유형 1 세포에 전달하는 폐포 상피 유형 1 세포 특이적 단백질 RTI40 또는 HTI56에 결합할 수 있다 (McElroy MC et al. "The use of alveolar epithelial type I cell-selective markers to investigate lung injury and repair.", European Respiratory Journal 24:4, 664-673, 2004; 그의 전체 내용은 본원에 참조로 포함됨). 또 다른 예로서, 표적화 모이어티는 뮤신, 예컨대 muc5ac, 또는 muc5b에 결합할 수 있다. 본 출원에서 제공된 항원의 예는 제한적이지 않으며, 표적화 모이어티는 관련 기술분야에 공지된 임의의 세포 항원에 결합할 수 있는 임의의 모이어티일 수 있음이 인지되어야 한다.
본 발명의 일부 측면은 ARMM이 표적 세포에 의해 흡수되고, ARMM 흡수는 표적 세포의 세포질 내로의 ARMM의 내용물의 방출을 발생시킨다는 인식에 관한 것이다. 일부 실시양태에서, 융합 단백질은 표적 세포에서 바람직한 변화, 예를 들어, 세포 생존, 증식률의 변화, 분화 상태의 변화, 세포 신원의 변화, 염색질 상태의 변화, 1개 이상의 유전자의 전사율의 변화, 전사 프로파일의 변화, 또는 표적 세포의 유전자 압축의 전사후 변화에 영향을 미치는 작용제이다. 전달되는 작용제는 표적 세포에서의 바람직한 효과에 따라 선택될 것임이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다.
표적 세포의 게놈은 본원에 개시된 전략 또는 방법을 통해 세포에 전달되는 뉴클레아제에 의해, 예를 들어, RNA-프로그램가능한 뉴클레아제 (예를 들어, Cas9), TALEN, 또는 아연-핑거 뉴클레아제, 또는 이러한 뉴클레아제의 복수 또는 조합에 의해 편집될 수 있다. 본 발명의 일부 비-제한적 측면은 ARMM이 예를 들어, 표적 세포를 전달되는 융합 단백질을 포함하는 ARMM과 접촉시킴으로써, ARMM에서의 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 화물 단백질, 또는 Cas9 융합 단백질을 표적 세포 또는 표적 세포의 집단에 전달하는데 사용될 수 있다는 인식에 관한 것이다. 따라서, 본 발명의 일부 측면은 융합 단백질, 예를 들어, WW 도메인, 최소 ARRDC1단백질, 또는 그의 변이체, 또는 TSG101 단백질 또는 그의 변이체에 융합된 Cas9 단백질, 또는 그의 변이체를 포함하는 ARMM을 제공한다.
본원에 기재된 임의의 뉴클레아제, 또는 관련 기술분야에 공지된 임의의 뉴클레아제를 사용하여, 단일- 또는 이중-가닥 파단은 뉴클레아제에 의해 표적 세포의 게놈 내의 특이적 부위에서 도입되어, 표적화된 게놈 서열의 파괴를 발생시킬 수 있다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 내의 핵산 서열이다. 일부 실시양태에서, 뉴클레아제에 의해 도입된 가닥 파단은 코딩된 유전자 산물의 발현을 손상시키는 표적 유전자 내의 돌연변이를 초래한다. 일부 실시양태에서, 핵산은 뉴클레아제와 함께 세포에 공동-전달된다. 일부 실시양태에서, 핵산은 뉴클레아제 표적 부위에 인접한 서열과 동일하거나 상동인 서열을 포함한다. 일부 이러한 실시양태에서, 뉴클레아제에 의해 실행된 가닥 파단은 공동-전달된 핵산의 전부 또는 일부를 파단 부위에서의 세포 DNA 내로 도입하여, 공동-전달된 핵산, 또는 그의 일부의 표적화된 삽입을 발생시키는 세포 DNA 복구 기구에 의해 복구된다. 일부 실시양태에서, 삽입은 병리학적 대립유전자의 파괴 또는 복구를 발생시킨다. 일부 실시양태에서, 삽입은 적합한 검정, 예를 들어, DNA 시퀀싱 검정, 서던 블롯 검정, 또는 공동-전달된 핵산에 의해 코딩되는 리포터 유전자, 예를 들어, 형광 단백질 또는 항생제에 대한 저항성에 대한 검정에 의해 검출된다. 일부 실시양태에서, 핵산은 초하전된 단백질에의 회합에 의해 공동-전달된다. 일부 실시양태에서, 초하전된 단백질은 또한 기능적 이펙터 단백질, 예를 들어, 뉴클레아제에 회합된다. 일부 실시양태에서, 표적 세포에의 뉴클레아제의 전달은 유전자의 기능의 임상적으로 또는 치료적으로 유익한 파괴를 발생시킨다.
일부 실시양태에서, 대상체로부터의 세포가 얻어지고, 뉴클레아제는 생체외에서 본원에서 제공된 시스템 또는 방법에 의해 세포에 전달된다. 일부 실시양태에서, 처리된 세포는 바람직한 뉴클레아제-매개된 게놈 편집 사건이 실행된 세포에 대해 선택된다. 일부 실시양태에서, 바람직한 게놈 돌연변이 또는 변경을 운반하는 처리된 세포는 이들이 얻어진 대상체로 복귀된다.
특이적 서열을 표적화하는 뉴클레아제, 예를 들어, Cas9, TALE, 또는 아연 핑거 뉴클레아제의 조작, 생성, 및 단리, 및 특이적 표적 서열에서 세포 게놈을 편집하는 방법은 관련 기술분야에 널리 공지되어 있다 (예를 들어, 문헌 [Mani et al., Biochemical and Biophysical Research Communications 335:447-457, 2005]; [Perez et al., Nature Biotechnology 26:808-16, 2008]; [Kim et al., Genome Research, 19:1279-88, 2009]; [Urnov et al., Nature 435:646-51, 2005]; [Carroll et al., Gene Therapy 15:1463-68, 2005]; [Lombardo et al., Nature Biotechnology 25:1298-306, 2007]; [Kandavelou et al., Biochemical and Biophysical Research Communications 388:56-61, 2009]; 및 [Hockemeyer et al., Nature Biotechnology 27(9):851-59, 2009], 뿐만 아니라 각각의 뉴클레아제에 대한 각각의 섹션에 나열된 참고문헌 참조). 통상의 기술자는 본원에서 제공된 지침에 기반하여 본 개시내용의 맥락에서 사용하기 위한 적합한 방법을 확인할 수 있을 것이다.
또 다른 예로서, 표적 세포의 분화 단계를 증강시키기 위해, 예를 들어, 분화된 표적 세포를 배아 줄기 세포-유사 단계로 재프로그램하기 위해, 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 재프로그래밍 인자, 예를 들어, Oct4, Sox2, c-Myc, 및/또는 KLF4를 갖는 ARMM과 접촉된다. 유사하게, 표적 세포의 염색질 상태의 변화에 영향을 미치기 위해, 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인, 또는 그의 변이체에 융합된 염색질 조정제, 예를 들어, DNA 메틸트랜스퍼라제, 또는 히스톤 데아세틸라제를 함유하는 ARMM과 접촉된다. 또 다른 예를 들어, 표적 세포의 생존이 감소되어야 하는 경우, 표적 세포는 일부 실시양태에서, 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 세포독성제, 예를 들어, 세포독성 단백질을 포함하는 ARMM과 접촉된다. ARMM 내로의 포함에 및 표적 세포 또는 표적 세포 집단에의 ARMM-매개된 전달에 적합한 추가의 작용제는 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 발명은 이에 관하여 제한되지 않는다.
일부 실시양태에서, 검출가능한 표지를 추가로 포함하는, WW 도메인, 또는 그의 변이체에 융합된 화물을 포함하는 ARMM이 제공된다. 이러한 ARMM은 유전자 조작 없이 표적 세포의 표지화를 허용한다. 표적 세포에의 직접적 전달에 적합한 검출가능한 표지는 관련 기술분야에 공지되어 있으며, 형광 단백질, 형광 염료, 막-결합된 염료, 및 효소, 예를 들어, 검출가능한 반응 산물을 발생시키는 반응을 촉매하는 막-결합된 또는 시토졸 효소를 포함하나 이에 제한되지는 않는다. 본 발명의 일부 측면에 따른 적합한 검출가능한 표지는 통상적으로 이용가능한 항체 또는 항원 결합제로 검출될 수 있는 막-결합된 항원, 예를 들어, 막-결합된 리간드를 추가로 포함한다.
일부 실시양태에서, 표적 세포에 전달되는 WW 도메인 또는 그의 변이체를 포함하는 단백질 또는 융합 단백질을 함유하는 WW 도메인을 포함하는 ARMM이 제공된다. 일부 실시양태에서, 융합 단백질은 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 또는 리콤비나제이거나 이를 포함한다. 일부 실시양태에서, 단백질은 치료 단백질이다. 일부 실시양태에서 단백질은 표적 세포의 상태 또는 신원의 변화에 영향을 미치는 단백질이다. 예를 들어, 일부 실시양태에서, 단백질은 재프로그래밍 인자이다. 적합한 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 염색질 조정제, 리콤비나제, 및 재프로그래밍 인자는 ARMM 내로의 그들의 혼입을 용이하게 하는 1개 이상의 WW 도메인에 융합될 수 있고, 그들의 기능은 관련 기술분야의 통상의 기술자에게 공지된 임의의 방법에 의해 시험될 수 있으며, 본 발명은 이에 관하여 제한되지 않는다.
본원에 기재된 ARMM을 단리하는 방법이 또한 제공된다. 한 예시적인 방법은 미세소포-생산 세포를 포함하는 세포 배양물의 배양 배지, 또는 상청액을 수집하는 것을 포함한다. 일부 실시양태에서, 세포 배양물은 대상체로부터 얻어진 세포, 예를 들어, 병리학적 표현형, 예를 들어, 과다증식성 표현형을 나타낼 것으로 의심되는 세포를 포함한다. 일부 실시양태에서, 세포 배양물은 ARMM을 생산하는 유전자 조작된 세포, 예를 들어, 재조합 ARMM 단백질, 예를 들어, 재조합 ARRDC1 또는 TSG101 단백질, 예컨대 Cas9 단백질 또는 그의 변이체에 융합된 최소 ARRDC1 또는 TSG101 단백질을 발현하는 세포를 포함한다. 일부 실시양태에서, 상청액은 원심분리에 의해, 예를 들어, 증가하는 G 값 (예를 들어, 500G 및 2000G)의 2회의 연속적 원심분리에 의해 세포 데브리스가 사전-청소된다. 일부 실시양태에서, 방법은 상청액을 0.2 μm 필터를 통해 통과시키고, 세포 데브리스의 모든 큰 조각 및 전체 세포를 제거하는 것을 포함한다. 일부 실시양태에서, 상청액은 원심분리물의 부피에 따라, 예를 들어, 120,000G에서 2시간 동안 초원심분리로 처리된다. 얻어진 펠릿은 미세소포를 포함한다. 일부 실시양태에서, 엑소좀은 본원에 기재된 바와 같은 엑소좀 마커를 사용한 염색 및/또는 분류에 의해 (예를 들어, FACS 또는 MACS에 의해) 미세소포 펠릿으로부터 고갈된다. 단리된 또는 풍부화된 ARMM은 본원에 기재된 바와 같이 배양 배지 또는 적합한 완충제에 현탁될 수 있다.
화물의 미세소포-매개된 전달의 방법
본 발명의 일부 측면은 작용제, 예를 들어, WW 도메인에 융합된 화물 (예를 들어, WW 도메인에 융합된 Cas9 단백질)을 표적 세포에 전달하는 방법을 제공한다. 표적 세포는 상이한 방식으로 최소 ARRDC1을 포함하는 ARMM과 접촉될 수 있다. 예를 들어, 표적 세포는 본원에 기재된 바와 같은 ARMM과, 또는 미세소포 생산 세포로부터의 단리된 ARMM과 직접적으로 접촉될 수 있다. 접촉은 배양 디쉬에서 ARMM을 표적 세포에 투여함으로써 시험관내에서, 또는 ARMM을 대상체에게 투여함으로써 생체내에서 수행될 수 있다. 대안적으로, 표적 세포는 예를 들어, 표적 세포 및 미세소포 생산 세포를 공동-배양함으로써 시험관내에서, 또는 미세소포 생산 세포를 표적 세포를 함유하는 대상체에게 투여함으로써 생체내에서 본원에 기재된 바와 같은 미세소포 생산 세포와 접촉될 수 있다. 따라서, 방법은 표적 세포를 미세소포, 예를 들어, 본원에 기재된 바와 같은 전달되는 임의의 화물 단백질을 함유하는 ARMM과 접촉시키는 것을 포함할 수 있다. 표적 세포는 본원에 기재된 바와 같은 미세소포-생산 세포와, 또는 지질 이중층, 최소 ARRDC1 단백질 또는 그의 변이체, 및 화물 단백질을 갖는 단리된 미세소포와 접촉될 수 있다.
표적 세포는 임의의 기원의 것일 수 있음이 인지되어야 한다. 예를 들어, 표적 세포는 인간 세포일 수 있다. 표적 세포는 포유동물 세포일 수 있다. 포유동물 세포의 일부 비-제한적 예는 마우스 세포, 래트 세포, 햄스터 세포, 설치류 세포, 및 비인간 영장류 세포를 포함한다. 표적 세포는 임의의 세포 유형의 것일 수 있음이 또한 인지되어야 한다. 예를 들어, 표적 세포는 배아 줄기 세포, 유도 다능성 줄기 세포 (iPS 세포), 태아 줄기 세포, 제대혈 줄기 세포, 또는 성체 줄기 세포 (즉, 조직 특이적 줄기 세포)를 포함할 수 있는 줄기 세포일 수 있다. 다른 경우에, 표적 세포는 대상체에서 발견되는 임의의 분화된 세포 유형일 수 있다. 일부 실시양태에서, 표적 세포는 시험관내에서의 세포이고, 방법은 시험관내에서 미세소포를 세포에 투여하거나, 시험관내에서 표적 세포를 미세소포-생산 세포와 공동-배양하는 것을 포함한다. 일부 실시양태에서, 표적 세포는 대상체에서의 세포이고, 방법은 미세소포 또는 미세소포-생산 세포를 대상체에게 투여하는 것을 포함한다. 일부 실시양태에서, 대상체는 포유동물 대상체, 예를 들어, 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류이다. 일부 실시양태에서, 대상체는 인간 대상체이다.
일부 실시양태에서, 표적 세포는 병리학적 세포이다. 일부 실시양태에서, 표적 세포는 암 세포이다. 일부 실시양태에서, 미세소포는 표적 세포의 표면 상의 항원에 선택적으로 결합하는 결합제와 회합된다. 일부 실시양태에서, 표적 세포의 항원은 세포 표면 항원이다. 일부 실시양태에서, 결합제는 막-결합된 이뮤노글로불린, 인테그린, 수용체, 또는 수용체 리간드이다. 예를 들어 특이적 표적 세포 유형의 표적 세포, 예를 들어 암 세포의 적합한 표면 항원은 이러한 항원에 특이적으로 결합하는 적합한 작용제인 바와 같이, 관련 기술분야의 통상의 기술자에게 공지되어 있다. 암 세포의 표면 상에 발현된 표면 항원에 특이적으로 결합하는 막-결합된 결합제, 예를 들어, 막-결합된 이뮤노글로불린, 예를 들어, 막-결합된 항체 또는 항체 단편을 생산하는 방법은 또한 관련 기술분야의 통상의 기술자에게 공지되어 있다. 결합제의 선택은 물론 표적 세포의 신원 또는 유형에 의존할 것이다. 막-결합된 결합제를 포함하는 ARMM에 의해 표적화될 수 있는 다양한 유형의 세포 상에 특이적으로 발현되는 세포 표면 항원은 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본 발명은 이에 관하여 제한되지 않음이 인지될 것이다.
공동-배양 시스템
본 발명의 일부 측면은 적어도 2가지 유형의 세포: 미세소포 생산 세포 및 생산된 미세소포를 흡수하는 표적 세포를 갖는 시험관내 세포 배양 시스템을 제공한다. 따라서, 본원에서 제공된 공동-배양 시스템에서, 표적 세포에 대한 미세소포 (예를 들어, 최소 ARRDC1을 포함하는 ARMM)의 내용물의 셔플링이 있다. 이러한 공동-배양 시스템은 표적 세포의 유전자 조작 없이 표적 세포에서 미세소포 생산 세포에 의해 생성된 유전자 산물 또는 다수의 유전자 산물의 발현을 허용한다.
일부 실시양태에서, (a) (i) 이종 프로모터의 제어 하에서 화물 (예를 들어, 엔도뉴클레아제, 예컨대 Cas9 단백질 또는 그의 변이체)에 융합된 최소 ARRDC1 단백질, 또는 그의 변이체, 및/또는 (ii) 이종 프로모터의 제어 하에서 Cas9 단백질 또는 그의 변이체에 융합된 TSG101 단백질 또는 그의 변이체, 및/또는 (iii) WW 도메인에 융합된 화물 단백질을 코딩하는 재조합 발현 구축물을 갖는 미세소포-생산 세포 집단; 및 (b) 표적 세포 집단을 포함하는 공동-배양 시스템이 제공된다. 일부 실시양태에서, 최소 ARRDC1 변이체는 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프를 포함하고/거나, TSG101 변이체는 UEV 도메인을 포함한다. 일부 실시양태에서, 발현 구축물은 표적 부위에의 뉴클레아제 (예를 들어, Cas9 뉴클레아제)의 결합을 매개함으로써 뉴클레아제:RNA 복합체의 서열 특이성을 제공하는 표적 부위를 보완하는 뉴클레오티드 서열을 포함할 수 있는 가이드 RNA (gRNA)를 추가로 코딩한다. 일부 실시양태에서, 숙주 세포는 복수의 최소 ARRDC1:Cas9 융합 단백질 및/또는 TSG101:Cas9 융합 단백질 및/또는 WW 도메인에 융합된 화물 단백질을 코딩하는 복수의 발현 구축물을 포함한다.
본원에서 제공된 바와 같은 공동-배양 시스템의 한 예시적인 적용은 유전자 조작 없는 표적 세포의 프로그래밍 또는 재프로그래밍이다. 예를 들어, 일부 실시양태에서, 표적 세포는 분화된 세포, 예를 들어, 섬유모세포 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 공급자 세포 또는 비-증식 세포이다. 일부 실시양태에서, 미세소포 생산 세포는 1개 이상의 WW 도메인에 융합된 재프로그래밍 인자, 또는 1개 이상의 WW 도메인에 융합된 복수의 재프로그래밍 인자를 포함하는 ARMM을 생산한다. 일부 실시양태에서, 미세소포 생산 세포와의 분화된 표적 세포의 공동-배양은 배아 상태로의 분화된 표적 세포의 재프로그래밍을 발생시킨다. 일부 실시양태에서, 미세소포 생산 세포와의 분화된 표적 세포의 공동-배양은 표적 세포의 원래 세포 상태와 상이한 분화된 세포 상태로의 표적 세포의 프로그래밍, 또는 직접교차-분화를 발생시킨다.
본원에서 제공된 바와 같은 공동-배양 시스템의 또 다른 예시적인 적용은 배아 줄기 세포의 지정된 분화이다. 일부 실시양태에서, 표적 세포는 비분화된 배아 줄기 세포이고, 미세소포 생산 세포는 1개 이상의 WW 도메인에 융합된 1종 이상의 분화 인자, 예를 들어, 바람직한 계통의 분화된 세포, 예를 들어 뉴런 세포, 또는 중간엽 세포로의 배아 줄기 세포의 분화를 촉발시키거나 용이하게 하는 신호전달 분자 또는 전사 인자를 발현한다.
본원에서 제공된 바와 같은 공동-배양 시스템의 추가의 또 다른 예시적인 적용은 비분화된 상태의 줄기 세포의, 예를 들어, 배아 줄기 세포의 또는 성체 줄기 세포의 유지이다. 일부 이러한 실시양태에서, 미세소포 생산 세포는 줄기 세포 유지를 촉진시키고/거나 줄기 세포 분화를 억제하는 1개 이상의 WW 도메인에 융합된 신호전달 분자 및/또는 전사 인자를 발현한다. 미세소포 생산 세포는 천연 발생 줄기 세포 니체를 모방하는 줄기 세포에 대한 미세환경을 생성할 수 있다.
배양 시스템의 미세소포-생산 세포는 본원에 기재된 임의의 ARMM을 생산할 수 있는 임의의 유형 또는 기원의 세포일 수 있다. 예를 들어, 미세소포-생산 세포는 포유동물 세포일 수 있으며, 그의 예는 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류로부터의 세포를 포함하나 이에 제한되지는 않는다. 미세소포-생산 세포는 또한 인간으로부터의 것일 수 있다. ARMM을 생산할 수 있는 미세소포-생산 세포의 한 비-제한적 예는 인간 배아 신장 293T 세포이다. 미세소포-생산 세포는 증식 또는 비-증식 세포일 수 있다. 일부 실시양태에서, 미세소포-생산 세포는 배양에서 다른 세포의 성장을 지지하는 공급자 세포이다. 공급자 세포는 부착 기질, 영양분, 또는 배양에서 세포의 성장에 필요한 다른 인자를 제공할 수 있다.
배양 시스템의 표적 세포는 본원에 기재된 임의의 미세소포-생산 세포로부터의 ARMM과 접촉될 수 있는 임의의 유형 또는 기원의 세포일 수 있다. 예를 들어, 표적 세포는 포유동물 세포일 수 있으며, 그의 예는 설치류, 마우스, 래트, 햄스터, 또는 비-인간 영장류로부터의 세포를 포함하나 이에 제한되지는 않는다. 표적 세포는 또한 인간으로부터의 것일 수 있다. 표적 세포는 확립된 세포주 (예를 들어, 293T 세포), 또는 생체외에서 배양된 1차 세포 (예를 들어, 대상체로부터 얻어지고 배양에서 성장된 세포)로부터의 것일 수 있다. 표적 세포는 혈액 세포 (예를 들어, 조혈 줄기 세포, 백혈구, 혈소판 또는 적혈구), 또는 고형 조직으로부터의 세포, 예컨대 간 세포, 신장 세포, 폐 세포, 심장 세포, 뼈 세포, 피부 세포, 뇌 세포, 또는 대상체에서 발견되는 임의의 다른 세포일 수 있다. 대상체로부터 얻어진 세포는 미세소포-생산 세포로부터의 ARMM과 접촉되고, 이어서 동일한 또는 또 다른 대상체 내로 재-도입될 수 있다. 일부 실시양태에서, 표적 세포는 줄기 세포이다. 줄기 세포는 배아 및 배아외 세포 유형으로 분화될 수 있는 전능성 줄기 세포일 수 있다. 줄기 세포는 또한 다능성 줄기 세포, 다분화능 줄기 세포, 올리고분화능 줄기 세포 또는 단일분화능 줄기 세포일 수 있다. 다른 실시양태에서, 표적 세포는 분화된 세포이다.
유전자 편집 방법
본 발명의 일부 측면은 표적 세포를 본원에 기재된 임의의 RNA-프로그램가능한 융합 단백질 (즉, Cas9 융합 단백질)을 함유하는 ARMM과 접촉시키는 것에 의한 유전자 편집을 위한 방법을 제공한다. 본 발명의 다른 측면은 표적 세포를 본원에 기재된 임의의 RNA-프로그램가능한 융합 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포와 접촉시키는 것에 의한 유전자 편집을 위한 방법을 제공한다. RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질은 본원에서 제공된 임의의 시스템 또는 방법에 의해 표적 세포에 전달될 수 있다. 예를 들어, RNA-프로그램가능한 융합 단백질은 본원에서 제공된 시스템 또는 방법에 의해 표적 세포에 전달될 수 있는 Cas9 뉴클레아제, 또는 그의 변이체, 1개 이상의 WW 도메인, 또는 그의 변이체, 또는 임의로 1개 이상의 NLS를 함유할 수 있다.
일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는 본원에 기재된 임의의 Cas9 융합 단백질을 포함한다. RNA-프로그램가능한 뉴클레아제 (즉, Cas9)는 RNA:DNA 혼성화를 사용하여 표적 DNA 절단 부위를 결정하기 때문에, 이들 단백질은 원칙적으로 가이드 RNA에 의해 특정된 임의의 서열을 절단할 수 있다. 부위-특이적 절단을 위한 (예를 들어, 게놈을 변형시키기 위한) RNA-프로그램가능한 뉴클레아제, 예컨대 Cas9를 사용하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013)]; [Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013)]; [Hwang, W.Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013)]; [Jinek, M. et al. RNA-programmed genome editing in human cells. eLife 2, e00471 (2013)]; [Dicarlo, J.E. et al. Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013)]; [Jiang, W. et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)] 참조; 그의 각각의 전체 내용은 본원에 참조로 포함됨).
본 개시내용의 일부 측면은 gRNA에 결합할 수 있고, 이는 다시 표적 핵산 서열에 결합하는 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (즉, Cas9 단백질, 또는 Cas9 변이체); 및 DNA-편집 도메인을 갖는 융합 단백질을 제공한다. DNA-편집 도메인의 일부 비-제한적 예는 뉴클레아제, 니카제, 리콤비나제 또는 데아미나제를 포함하나 이에 제한되지는 않는다. 한 예로서, 핵염기, 예컨대, 예를 들어, 시티딘을 탈아미노화할 수 있는 데아미나제 도메인은 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질에 융합된다. 일부 실시양태에서, 데아미나제는 본원에 기재된 임의의 Cas9 융합 단백질에 융합된다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 초래할 수 있으며, 이는 본원에서 핵산 편집으로 지칭된다. 따라서 Cas9 단백질 또는 Cas9 변이체, DNA 편집 도메인, 및 ARMM 내로의 화물 단백질의 혼입을 용이하게 할 수 있는 단백질 (예를 들어, WW 도메인, 최소 ARRDC1 단백질, 또는 TSG101 단백질)을 갖는 화물 단백질은 핵산 서열의 표적화된 편집에 사용될 수 있다. 관련 기술분야에 공지된 임의의 수의 DNA 편집 도메인 (예를 들어, 뉴클레아제, 니카제, 리콤비나제 및 데아미나제)은 (i) RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (예를 들어, Cas9 또는 Cas9 변이체), 및 (ii) 1개 이상의 WW 도메인 또는 WW 도메인 변이체, 또는 (iii) 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 (iv) TSG101 단백질, 또는 그의 변이체에 융합될 수 있음이 인지되어야 한다. 이러한 융합 단백질은 시험관내에서 DNA의 표적화된 편집에, 예를 들어, 돌연변이체 세포 또는 동물의 생성에; 표적화된 돌연변이의 도입에, 예를 들어, 이어서 동일한 또는 또 다른 대상체 내로 재-도입되는 생체외에서의 세포에서, 예를 들어, 대상체로부터 얻어진 세포에서, 유전적 결함의 교정에; 및 표적화된 돌연변이의 도입, 예를 들어, 대상체에서 유전적 결함의 교정 또는 질환-연관된 유전자에서의 탈활성화 돌연변이의 도입에 유용하다. 본원에 기재된 임의의 화물 단백질은 생체내에서 DNA의 표적화된 편집에, 예를 들어, 대상체에서 돌연변이체 세포의 생성에 유용함이 또한 인지되어야 한다. 본원에 기재된 임의의 융합 단백질을 함유하는 ARMM의 전달은 본원에 기재된 임의의 방법 또는 시스템에 의해 대상체에게 투여될 수 있다.
본원에 기재된 유전자 편집의 방법은 유전적 결함의 교정, 예를 들어, 유전자 산물에서 기능의 소실을 초래하는 점 돌연변이의 교정을 발생시킬 수 있다. 일부 실시양태에서, 유전적 결함은 질환 또는 장애, 예를 들어, 리소좀 저장 장애 또는 대사 질환, 예컨대, 예를 들어, 제I형 당뇨병과 연관된다. 일부 실시양태에서, 본원에서 제공된 방법은 질환 또는 장애와 연관된 유전자 산물을 코딩하는 유전자 또는 대립유전자 내로 탈활성화 점 돌연변이를 도입하는데 사용된다. 예를 들어, 일부 실시양태에서, DNA 편집 화물 단백질 및 적어도 1개의 WW 도메인, 또는 그의 변이체, 또는 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 TSG101 단백질, 또는 그의 변이체에 융합된 RNA-가이드된 또는 RNA-프로그램가능한 융합 단백질 (즉, Cas9 단백질, 또는 Cas9 변이체)을 채용하여 종양유전자 내로 탈활성화 점 돌연변이를 도입하는 방법이 본원에서 제공된다. 탈활성화 돌연변이는 일부 실시양태에서, 전장 단백질의 기능을 결여한 말단절단된 유전자 산물, 예를 들어, 말단절단된 단백질의 발현을 발생시키는 코딩 서열에서 조숙한 정지 코돈을 생성할 수 있다.
본원에서 제공된 방법의 목적은 게놈 편집을 통해 기능이상 유전자의 기능을 복원시키는데 사용될 수 있다. 본원에서 제공된 화물 단백질은 예를 들어, 인간 세포 배양물에서 질환-연관된 돌연변이를 교정함으로써, 시험관내에서 유전자 편집-기반 인간 치료제에 대해 확인될 수 있다. 본원에서 제공된 화물 단백질, 예를 들어, Cas9 단백질 또는 Cas9 변이체, 핵산 편집 도메인, 및 적어도 1개의 WW 도메인 또는 최소 ARRDC1 단백질 또는 TSG101 단백질을 포함하는 융합 단백질은 임의의 단일 점 T>C 또는 A>G 돌연변이를 교정하는데 사용될 수 있음이 통상의 기술자에 의해 이해될 것이다. 예를 들어, 돌연변이체 C의 다시 U로의 탈아미노화는 돌연변이를 교정하고, 후자의 경우에, 돌연변이체 G와 염기-쌍형성된 C의 탈아미노화, 이어서 복제의 라운드는 돌연변이를 교정한다.
시험관내에서 또는 생체내에서 본원에서 제공된 화물 단백질에 의해 교정될 수 있는 예시적인 질환-관련 돌연변이는 PIK3CA 단백질에서의 H1047R (A3140G) 다형성이다. 포스포이노시티드-3-키나제, 촉매 알파 서브유닛 (PIK3CA) 단백질은 포스파티딜이노시톨의 이노시톨 고리의 3-OH 기를 인산화하도록 작용한다. PIK3CA 유전자는 많은 상이한 암종에서 돌연변이되는 것으로 밝혀졌으며, 따라서 이는 매우 강력한 종양유전자인 것으로 간주된다 (Lee JWet al. "PIK3CA gene is frequently mutated in breast carcinomas and hepatocellular carcinomas.", Oncogene. 2005; 24(8):1477-80; 그의 전체 내용은 본원에 참조로 포함됨). 사실, A3140G 돌연변이는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (ATCC)으로부터 용이하게 입수가능한 몇몇 NCI-60 암 세포주, 예컨대 HCT116, SKOV3, 및 T47D 세포주에 존재한다 (Ikediobi ON et al. "Mutation analysis of 24 known cancer genes in the NCI-60 cell line set.", Mol Cancer Ther. 2006; 5(11):2606-12).
일부 실시양태에서, 교정될 돌연변이를 운반하는 세포, 예를 들어, PIK3CA 단백질에서 H1047R 또는 A3140G 치환을 발생시키는 점 돌연변이를 운반하는 세포는 (ii) 적어도 1개의 WW 도메인 또는 그의 변이체, 또는 최소 ARRDC1 단백질 또는 그의 변이체, 또는 TSG101 단백질 또는 그의 변이체에 융합된 (i) Cas9 단백질 또는 Cas9 변이체, (iii) 데아미나제 융합 단백질 및 융합 단백질을 코딩 PIK3CA 유전자에서 각각의 돌연변이 부위에 표적화하는 적절하게 디자인된 gRNA를 함유하는 ARMM과 접촉된다. gRNA가 융합 단백질을 PIK3CA 유전자 내에 있는 비-C 잔기에 표적화하도록 디자인된 대조 실험이 수행될 수 있다. 처리된 세포의 게놈 DNA를 추출하고, PIK3CA 유전자의 관련 서열을 PCR 증폭시키고, 시퀀싱하여 인간 세포 배양물에서 융합 단백질의 활성을 평가할 수 있다.
PIK3CA에서 점 돌연변이를 교정하는 예는 예시 목적을 위해 제공되며, 본 개시내용을 제한하는 것으로 의미되지 않음이 이해될 것이다. 통상의 기술자는 본원에 기재된 본 개시된 DNA-편집 화물 단백질이 다른 점 돌연변이 및 다른 암과 및 암 이외의 질환과 연관된 돌연변이를 교정하는데 사용될 수 있음을 이해할 것이다.
본원에 기재된 임의의 ARMM 또는 융합 단백질을 사용한 질환-연관된 유전자 및 대립유전자에서의 돌연변이의 성공적인 교정은 질환 치료제 및 유전자 연구에서의 적용을 갖는 유전자 교정을 위한 새로운 전략을 열고 있다. DNA-편집 도메인 및 적어도 1개의 WW 단백질 또는 최소 ARRDC1 단백질 또는 TSG101 단백질에 융합된 개시된 Cas9 변이체와 같은 부위-특이적 뉴클레오티드 변형 단백질은 또한 유전자 기능이 의도적으로 억제되거나 없어진 "역" 유전자 요법에서의 적용을 갖는다. 이들 경우에, Trp (TGG), Gln (CAA 및 CAG), 또는 Arg (CGA) 잔기를 조숙한 정지 코돈 (TAA, TAG, TGA)으로 부위-특이적으로 돌연변이시키는 것은 시험관내에서, 생체외에서, 또는 생체내에서 단백질 기능을 없애는데 사용될 수 있다.
본 개시내용은 본원에서 제공된 임의의 DNA 편집 화물 단백질에 의해 교정될 수 있는 돌연변이와 연관되거나 그에 의해 유발되는 질환으로 진단된 대상체의 치료를 위한 방법을 제공한다. 예를 들어, 일부 실시양태에서, 점 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입하는 본원에 기재된 임의의 화물 단백질을 함유하는 ARMM의 유효량을 상기 기재된 바와 같은 이러한 질환 (예를 들어, PIK3CA 점 돌연변이와 연관된 암)을 갖는 대상체에게 투여하는 것을 포함하는 방법이 제공된다. 본 발명 ARMM은 본원에 기재된 임의의 표적 세포에의 본원에 기재된 임의의 화물 단백질의 전달을 표적화하는데 사용될 수 있음이 인지되어야 한다. 일부 실시양태에서, 질환은 신생물성 질환이다. 일부 실시양태에서, 질환은 대사 질환이다. 일부 실시양태에서, 질환은 리소좀 저장 질환이다. 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입함으로써 치료될 수 있는 다른 질환은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이며, 본 개시내용은 이에 관하여 제한되지 않는다.
일부 실시양태에서, 표적 세포의 게놈은 본원에 개시된 시스템 또는 방법을 통해 표적 세포에 전달되는 뉴클레아제에 의해, 예를 들어, 본원에 기재된 임의의 ARMM 또는 ARMM 생산 세포를 사용하여 임의의 Cas9 융합 단백질을 전달함으로써 편집된다. 일부 실시양태에서, 단일- 또는 이중-가닥 파단은 Cas9 단백질에 의해 표적 세포의 게놈 내의 특이적 부위에서 도입되어, 표적화된 게놈 서열의 파괴를 발생시킨다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 내의 핵산 서열이다. 일부 실시양태에서, 표적화된 게놈 서열은 유전자의 코딩 영역 외부의 핵산 서열이며, 예를 들어, 표적화된 게놈 서열은 유전자의 프로모터 영역 내에 있을 수 있다. 일부 실시양태에서, 뉴클레아제에 의해 도입된 가닥 파단은 코딩된 유전자 산물의 발현을 손상시키는 표적 유전자 내의 돌연변이를 초래한다.
핵산 (예를 들어, gRNA)은 DNA 편집 도메인 및 적어도 1개의 WW 도메인, 또는 그의 변이체, 또는 최소 ARRDC1 단백질, 또는 그의 변이체, 또는 TSG101 단백질, 또는 그의 변이체에 융합된 RNA-가이드된 단백질 (예를 들어, Cas9 단백질, 또는 Cas9 변이체)과 회합될 수 있다. 전형적으로, gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 함유하며, 이는 표적 부위에의 단백질:RNA 복합체의 결합을 매개하고, 단백질:RNA 복합체의 서열 특이성을 제공한다. 따라서, 핵산 (예를 들어, gRNA)은 본원에 기재된 임의의 RNA-가이드된 융합 단백질에 표적 서열 특이성을 부여하기 위해, 본원에 기재된 임의의 화물 단백질과 공동-발현될 수 있다. 한 비-제한적 예로서, WW 도메인에 융합된 Cas9 변이체는 gRNA가 Cas9 융합 단백질과 회합하고, gRNA와 복합체로 Cas9 융합 단백질이 ARMM 내로 로딩되도록 세포에서 gRNA와 공동-발현될 수 있다. 일부 실시양태에서, 핵산은 뉴클레아제 표적 부위에 인접한 서열과 동일하거나 상동인 서열을 갖는다. 일부 이러한 실시양태에서, 뉴클레아제에 의해 실행된 가닥 파단은 공동-전달된 핵산의 전부 또는 일부를 파단 부위에서의 세포 DNA 내로 도입하여, 공동-전달된 핵산, 또는 그의 일부의 표적화된 삽입을 발생시키는 세포 DNA 복구 기구에 의해 복구된다. 일부 실시양태에서, 삽입은 병리학적 대립유전자의 파괴 또는 복구를 발생시킨다.
특정 실시양태에서, 촉매적으로 불활성인 Cas9 융합 단백질은 (그의 gRNA-결합 능력을 보유하는) 불활성 효소를 공지된 조절 도메인에 융합시킴으로써 유전자 발현을 활성화시키거나 억제하는데 사용된다. 유전자 발현을 제어하는데 사용될 수 있는 Cas9 변이체는 예를 들어, 우 에프.(Wu F.) 등에 의해 2014년 3월 17일에 출원된, 발명의 명칭이 게놈 변형 및 유전자 조정을 위한 Crispr/cas 시스템인 미국 특허 출원 번호 USSN 14/216,655 (US 2014-0273226 A1으로서 공개됨)에, 및 장 에프.(Zhang F.) 등에 의해 2013년 12월 12일에 출원된, 발명의 명칭이 기능적 도메인으로의 서열 조작을 위한 시스템, 방법 및 조성물의 조작 및 최적화인 PCT 출원 번호 PCT/US2013/074736 (WO 2014/093655 A2로서 공개됨)에 상세하게 기재되었으며; 각각의 전체 내용은 본원에 참조로 포함된다. 예를 들어, 촉매적으로 불활성인 Cas9 융합 단백질은 전사 활성화제 (예를 들어 VP64)에 융합될 수 있다. 특정 실시양태에서, 본원에 기재된 임의의 Cas9 융합 단백질은 전사 활성화제에 융합되는 경우 표적화된 유전자의 유전자 전사를 상향-조절하여 발현을 증진시킬 수 있다. 일부 실시양태에서, 촉매적으로 불활성인 Cas9 융합 단백질은 전사 억제제 (예를 들어 KRAB)에 융합될 수 있다. 특정 실시양태에서, 본원에 기재된 임의의 Cas9 융합 단백질은 전사 억제제에 융합되어 표적화된 유전자의 유전자 전사를 하향-조절하여 발현을 감소시킬 수 있다. 일부 실시양태에서, 표적 세포에의 뉴클레아제의 전달은 유전자의 기능의 임상적으로 또는 치료적으로 유익한 파괴 또는 증진을 발생시킨다. 본원에 기재된 방법은 제한적인 것으로 의미되지 않으며, 관련 기술분야에 널리 공지된 Cas9를 사용하는 임의의 방법을 포함할 수 있음이 인지되어야 한다.
본 발명의 이들 및 다른 실시양태의 기능 및 이점은 하기 실시예로부터 보다 완전히 이해될 것이다. 하기 실시예는 본 발명의 이익을 예시하고 특정 실시양태를 기재하는 것으로 의도되지만, 본 발명의 완전한 범위를 예시하는 것으로 의도되지 않는다. 따라서, 실시예는 본 발명의 범위를 제한하는 것으로 의미되지 않음이 이해될 것이다.
실시예
실시예 1: 최소 ARRDC1은 전장 ARRDC1 단백질만큼 효율적으로 ARMM 형성 및 버딩을 유도한다
아레스틴 도메인, PSAP (서열식별번호: 122) 모티프 및 2개의 PPXY 모티프를 함유하는 ARRDC1 구축물을 제조하였다. 이 "최소" ARRDC1은 약 330개 아미노산 길이이다 (전장 ARRDC1보다 100개의 아미노산이 더 짧음) (도 1 및 도 5). HEK293T 세포에서 발현되는 경우, 최소 ARRDC1은 전장 ARRDC1만큼 효율적으로 EV로 버딩한다 (도 2b). 음성 대조군으로서, 유사한 크기의 것이지만 N-말단 아레스틴 도메인의 일부를 결여한 또 다른 ARRDC1 구축물은 버딩하지 않았다. 중요하게는, 최소 ARRDC1 발현에 의해 생성된 세포외 소포의 수는 전장 ARRDC1의 그것과 필적한다 (도 2c). 이들 데이터는 최소 ARRDC1이 전장 ARRDC1 단백질만큼 효율적으로 ARMM 형성 및 버딩을 유도할 수 있음을 지시한다.
실시예 2: ARMM 내로 화물을 패키징하는데 있어서 최소 ARRDC1
ARMM 내로 화물을 패키징하는데 있어서 최소 ARRDC1의 능력을 시험하였다. Cas9 단백질에의 최소 ARRDC1의 융합 구축물 (도 3a)을 제조하였다. HEK293T 세포에서 발현되는 경우, 미니ARRDC1-Cas9 단백질은 세포외 소포 (EV)로 버딩할 수 있는 반면, 전장 ARRDC1에의 Cas9 융합은 버딩하지 않았다 (도 3b). 더욱이, Cas9와 회합된 가이드 RNA (gRNA)는 대조군 Cas9보다 미니ARRDC1-Cas9 융합 단백질로부터 생산된 ARMM에서 훨씬 더 풍부화되었다. 중요하게는, 미니ARRDC1-Cas9 융합 단백질은 GFP DNA 로커스를 표적화하는 검정에 의해 입증된 바와 같이 효율적인 유전자 편집 활성을 유지한다 (도 4). 이들 결과는 최소 ARRDC1이 Cas9 및 회합된 gRNA를 지정을 통해 ARMM 내로 패키징할 수 있음을 지시한다.
상기 열거된 항목을 포함한 본원에 언급된 모든 간행물, 특허 및 서열 데이터베이스 엔트리는 각각의 개별적 간행물 또는 특허가 구체적으로 및 개별적으로 참조로 포함되는 것으로 지시된 것처럼 그 전문이 본원에 참조로 포함된다. 상충되는 경우, 본원의 임의의 정의를 포함한 본 출원이 지배할 것이다.
등가물 및 범위
관련 기술분야의 통상의 기술자는 통상적인 실험 이하를 사용하여, 본원에 기재된 본 발명의 구체적인 실시양태에 대한 많은 등가물을 인식하거나, 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명에 제한되는 것으로 의도되지 않으며, 오히려 첨부된 청구항에 제시된 바와 같다.
청구항에서 단수형은 반대로 지시되거나 다르게는 맥락으로부터 명백하지 않는 한, 하나 또는 하나 초과를 의미할 수 있다. 군의 하나 이상의 구성원 사이에 "또는"을 포함하는 청구항 또는 설명은 반대로 지시되거나 다르게는 맥락으로부터 명백하지 않는 한, 군 구성원의 하나, 하나 초과, 또는 전부가 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 경우 충족되는 것으로 간주된다. 본 발명은 군의 정확하게 하나의 구성원이 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 실시양태를 포함한다. 본 발명은 또한 군의 하나 초과, 또는 전부가 주어진 산물 또는 프로세스에 존재하거나, 그에 채용되거나, 다르게는 그와 관련되는 실시양태를 포함한다.
더욱이, 본 발명은 청구항 중 하나 이상으로부터 또는 설명의 관련 부분으로부터 하나 이상의 제한, 요소, 조항, 설명적 용어 등이 또 다른 청구항 내로 도입되는 모든 변형, 조합, 및 순열을 포괄함이 이해되어야 한다. 예를 들어, 또 다른 청구항에 종속하는 임의의 청구항은 동일한 기초 청구항에 종속하는 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 더욱이, 청구항이 조성물을 나열하는 경우, 달리 지시되지 않는 한, 또는 그것이 모순 또는 불일치가 발생할 것으로 관련 기술분야의 통상의 기술자에게 명백할 것이지 않는 한, 본원에 개시된 임의의 목적을 위해 조성물을 사용하는 방법이 포함되고, 본원에 개시된 임의의 제조 방법 또는 관련 기술분야에 공지된 다른 방법에 따라 조성물을 제조하는 방법이 포함됨이 이해되어야 한다.
요소가 목록으로서 제시되는 경우, 예를 들어, 마쿠시 군 형식에서, 요소의 각각의 하위군이 또한 개시되고, 임의의 요소(들)는 군으로부터 제거될 수 있음이 이해되어야 한다. 용어 "포함하는"은 개방적인 것으로 의도되며, 추가의 요소 또는 단계의 포함을 허용함이 또한 주목된다. 일반적으로, 본 발명, 또는 본 발명의 측면이 특정 요소, 특색, 단계 등을 포함하는 것으로 지칭되는 경우, 본 발명 또는 본 발명의 측면의 특정 실시양태는 이러한 요소, 특색, 단계 등으로 이루어지거나, 이로 본질적으로 이루어짐이 이해되어야 한다. 간결함의 목적을 위해 그들 실시양태는 본원에 문자 그대로 구체적으로 제시되지는 않았다. 따라서, 하나 이상의 요소, 특색, 단계 등을 포함하는 본 발명의 각각의 실시양태에 대해, 본 발명은 또한 그들 요소, 특색, 단계 등으로 이루어지거나 이로 본질적으로 이루어진 실시양태를 제공한다.
범위가 주어지는 경우, 종점이 포함된다. 더욱이, 달리 지시되거나 다르게는 맥락 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 본 발명의 상이한 실시양태에서 언급된 범위 내의 임의의 구체적인 값을 맥락이 달리 명백하게 나타내지 않는 한, 범위의 하한의 단위의 1/10까지 가정할 수 있음이 이해되어야 한다. 달리 지시되거나 다르게는 맥락 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 주어진 범위 내의 임의의 하위범위를 가정할 수 있음이 또한 이해되어야 하고, 여기서 하위범위의 종점은 범위의 하한의 단위의 1/10과 동일한 정확성의 정도까지 표현된다.
또한, 본 발명의 임의의 특정 실시양태는 청구항 중 임의의 하나 이상으로부터 명백하게 배제될 수 있음이 이해되어야 한다. 범위가 주어지는 경우, 범위 내의 임의의 값은 청구항 중 임의의 하나 이상으로부터 명백하게 배제될 수 있다. 본 발명의 조성물 및/또는 방법의 임의의 실시양태, 요소, 특색, 적용, 또는 측면은 임의의 하나 이상의 청구항으로부터 배제될 수 있다. 간결성의 목적을 위해, 하나 이상의 요소, 특색, 목적, 또는 측면이 배제된 모든 실시양태는 본원에서 명백하게 제시되지 않는다.
SEQUENCE LISTING
<110> President and Fellows of Harvard College
<120> MINIMAL ARRESTIN DOMAIN CONTAINING PROTEIN 1(ARRDC1) CONSTRUCTS
<130> H0824.70331WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 62/906,685
<151> 2019-09-26
<160> 124
<170> PatentIn version 3.5
<210> 1
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 1
Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val
1 5 10 15
Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu
20 25 30
Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser
35 40 45
Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu
50 55 60
Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro
65 70 75 80
Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala
85 90 95
Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg
100 105 110
Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu
115 120 125
Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile
130 135 140
Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu
145 150 155 160
Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly
165 170 175
Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln
180 185 190
Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val
195 200 205
Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu
210 215 220
Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu
225 230 235 240
Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser
245 250 255
Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu
260 265 270
Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His
275 280 285
Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro
290 295 300
Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Pro Pro
305 310 315 320
Glu Tyr Pro Tyr Glu Ala Pro Pro Ser Tyr
325 330
<210> 2
<211> 1367
<212> PRT
<213> Streptococcus pyogenes
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 4212
<212> DNA
<213> Homo Sapiens
<400> 3
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aaggctgcag ga 4212
<210> 4
<211> 1368
<212> PRT
<213> Homo Sapiens
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 5
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 5
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 6
<211> 922
<212> PRT
<213> Homo Sapiens
<400> 6
Met Ala Thr Ala Ser Pro Arg Ser Asp Thr Ser Asn Asn His Ser Gly
1 5 10 15
Arg Leu Gln Leu Gln Val Thr Val Ser Ser Ala Lys Leu Lys Arg Lys
20 25 30
Lys Asn Trp Phe Gly Thr Ala Ile Tyr Thr Glu Val Val Val Asp Gly
35 40 45
Glu Ile Thr Lys Thr Ala Lys Ser Ser Ser Ser Ser Asn Pro Lys Trp
50 55 60
Asp Glu Gln Leu Thr Val Asn Val Thr Pro Gln Thr Thr Leu Glu Phe
65 70 75 80
Gln Val Trp Ser His Arg Thr Leu Lys Ala Asp Ala Leu Leu Gly Lys
85 90 95
Ala Thr Ile Asp Leu Lys Gln Ala Leu Leu Ile His Asn Arg Lys Leu
100 105 110
Glu Arg Val Lys Glu Gln Leu Lys Leu Ser Leu Glu Asn Lys Asn Gly
115 120 125
Ile Ala Gln Thr Gly Glu Leu Thr Val Val Leu Asp Gly Leu Val Ile
130 135 140
Glu Gln Glu Asn Ile Thr Asn Cys Ser Ser Ser Pro Thr Ile Glu Ile
145 150 155 160
Gln Glu Asn Gly Asp Ala Leu His Glu Asn Gly Glu Pro Ser Ala Arg
165 170 175
Thr Thr Ala Arg Leu Ala Val Glu Gly Thr Asn Gly Ile Asp Asn His
180 185 190
Val Pro Thr Ser Thr Leu Val Gln Asn Ser Cys Cys Ser Tyr Val Val
195 200 205
Asn Gly Asp Asn Thr Pro Ser Ser Pro Ser Gln Val Ala Ala Arg Pro
210 215 220
Lys Asn Thr Pro Ala Pro Lys Pro Leu Ala Ser Glu Pro Ala Asp Asp
225 230 235 240
Thr Val Asn Gly Glu Ser Ser Ser Phe Ala Pro Thr Asp Asn Ala Ser
245 250 255
Val Thr Gly Thr Pro Val Val Ser Glu Glu Asn Ala Leu Ser Pro Asn
260 265 270
Cys Thr Ser Thr Thr Val Glu Asp Pro Pro Val Gln Glu Ile Leu Thr
275 280 285
Ser Ser Glu Asn Asn Glu Cys Ile Pro Ser Thr Ser Ala Glu Leu Glu
290 295 300
Ser Glu Ala Arg Ser Ile Leu Glu Pro Asp Thr Ser Asn Ser Arg Ser
305 310 315 320
Ser Ser Ala Phe Glu Ala Ala Lys Ser Arg Gln Pro Asp Gly Cys Met
325 330 335
Asp Pro Val Arg Gln Gln Ser Gly Asn Ala Asn Thr Glu Thr Leu Pro
340 345 350
Ser Gly Trp Glu Gln Arg Lys Asp Pro His Gly Arg Thr Tyr Tyr Val
355 360 365
Asp His Asn Thr Arg Thr Thr Thr Trp Glu Arg Pro Gln Pro Leu Pro
370 375 380
Pro Gly Trp Glu Arg Arg Val Asp Asp Arg Arg Arg Val Tyr Tyr Val
385 390 395 400
Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr Met Glu Ser
405 410 415
Val Arg Asn Phe Glu Gln Trp Gln Ser Gln Arg Asn Gln Leu Gln Gly
420 425 430
Ala Met Gln Gln Phe Asn Gln Arg Tyr Leu Tyr Ser Ala Ser Met Leu
435 440 445
Ala Ala Glu Asn Asp Pro Tyr Gly Pro Leu Pro Pro Gly Trp Glu Lys
450 455 460
Arg Val Asp Ser Thr Asp Arg Val Tyr Phe Val Asn His Asn Thr Lys
465 470 475 480
Thr Thr Gln Trp Glu Asp Pro Arg Thr Gln Gly Leu Gln Asn Glu Glu
485 490 495
Pro Leu Pro Glu Gly Trp Glu Ile Arg Tyr Thr Arg Glu Gly Val Arg
500 505 510
Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro Arg
515 520 525
Asn Gly Lys Ser Ser Val Thr Lys Gly Gly Pro Gln Ile Ala Tyr Glu
530 535 540
Arg Gly Phe Arg Trp Lys Leu Ala His Phe Arg Tyr Leu Cys Gln Ser
545 550 555 560
Asn Ala Leu Pro Ser His Val Lys Ile Asn Val Ser Arg Gln Thr Leu
565 570 575
Phe Glu Asp Ser Phe Gln Gln Ile Met Ala Leu Lys Pro Tyr Asp Leu
580 585 590
Arg Arg Arg Leu Tyr Val Ile Phe Arg Gly Glu Glu Gly Leu Asp Tyr
595 600 605
Gly Gly Leu Ala Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu
610 615 620
Asn Pro Met Tyr Cys Leu Phe Glu Tyr Ala Gly Lys Asn Asn Tyr Cys
625 630 635 640
Leu Gln Ile Asn Pro Ala Ser Thr Ile Asn Pro Asp His Leu Ser Tyr
645 650 655
Phe Cys Phe Ile Gly Arg Phe Ile Ala Met Ala Leu Phe His Gly Lys
660 665 670
Phe Ile Asp Thr Gly Phe Ser Leu Pro Phe Tyr Lys Arg Met Leu Ser
675 680 685
Lys Lys Leu Thr Ile Lys Asp Leu Glu Ser Ile Asp Thr Glu Phe Tyr
690 695 700
Asn Ser Leu Ile Trp Ile Arg Asp Asn Asn Ile Glu Glu Cys Gly Leu
705 710 715 720
Glu Met Tyr Phe Ser Val Asp Met Glu Ile Leu Gly Lys Val Thr Ser
725 730 735
His Asp Leu Lys Leu Gly Gly Ser Asn Ile Leu Val Thr Glu Glu Asn
740 745 750
Lys Asp Glu Tyr Ile Gly Leu Met Thr Glu Trp Arg Phe Ser Arg Gly
755 760 765
Val Gln Glu Gln Thr Lys Ala Phe Leu Asp Gly Phe Asn Glu Val Val
770 775 780
Pro Leu Gln Trp Leu Gln Tyr Phe Asp Glu Lys Glu Leu Glu Val Met
785 790 795 800
Leu Cys Gly Met Gln Glu Val Asp Leu Ala Asp Trp Gln Arg Asn Thr
805 810 815
Val Tyr Arg His Tyr Thr Arg Asn Ser Lys Gln Ile Ile Trp Phe Trp
820 825 830
Gln Phe Val Lys Glu Thr Asp Asn Glu Val Arg Met Arg Leu Leu Gln
835 840 845
Phe Val Thr Gly Thr Cys Arg Leu Pro Leu Gly Gly Phe Ala Glu Leu
850 855 860
Met Gly Ser Asn Gly Pro Gln Lys Phe Cys Ile Glu Lys Val Gly Lys
865 870 875 880
Asp Thr Trp Leu Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu
885 890 895
Pro Pro Tyr Lys Ser Tyr Glu Gln Leu Lys Glu Lys Leu Leu Phe Ala
900 905 910
Ile Glu Glu Thr Glu Gly Phe Gly Gln Glu
915 920
<210> 7
<211> 870
<212> PRT
<213> Homo Sapiens
<400> 7
Met Ala Ser Ala Ser Ser Ser Arg Ala Gly Val Ala Leu Pro Phe Glu
1 5 10 15
Lys Ser Gln Leu Thr Leu Lys Val Val Ser Ala Lys Pro Lys Val His
20 25 30
Asn Arg Gln Pro Arg Ile Asn Ser Tyr Val Glu Val Ala Val Asp Gly
35 40 45
Leu Pro Ser Glu Thr Lys Lys Thr Gly Lys Arg Ile Gly Ser Ser Glu
50 55 60
Leu Leu Trp Asn Glu Ile Ile Ile Leu Asn Val Thr Ala Gln Ser His
65 70 75 80
Leu Asp Leu Lys Val Trp Ser Cys His Thr Leu Arg Asn Glu Leu Leu
85 90 95
Gly Thr Ala Ser Val Asn Leu Ser Asn Val Leu Lys Asn Asn Gly Gly
100 105 110
Lys Met Glu Asn Met Gln Leu Thr Leu Asn Leu Gln Thr Glu Asn Lys
115 120 125
Gly Ser Val Val Ser Gly Gly Glu Leu Thr Ile Phe Leu Asp Gly Pro
130 135 140
Thr Val Asp Leu Gly Asn Val Pro Asn Gly Ser Ala Leu Thr Asp Gly
145 150 155 160
Ser Gln Leu Pro Ser Arg Asp Ser Ser Gly Thr Ala Val Ala Pro Glu
165 170 175
Asn Arg His Gln Pro Pro Ser Thr Asn Cys Phe Gly Gly Arg Ser Arg
180 185 190
Thr His Arg His Ser Gly Ala Ser Ala Arg Thr Thr Pro Ala Thr Gly
195 200 205
Glu Gln Ser Pro Gly Ala Arg Ser Arg His Arg Gln Pro Val Lys Asn
210 215 220
Ser Gly His Ser Gly Leu Ala Asn Gly Thr Val Asn Asp Glu Pro Thr
225 230 235 240
Thr Ala Thr Asp Pro Glu Glu Pro Ser Val Val Gly Val Thr Ser Pro
245 250 255
Pro Ala Ala Pro Leu Ser Val Thr Pro Asn Pro Asn Thr Thr Ser Leu
260 265 270
Pro Ala Pro Ala Thr Pro Ala Glu Gly Glu Glu Pro Ser Thr Ser Gly
275 280 285
Thr Gln Gln Leu Pro Ala Ala Ala Gln Ala Pro Asp Ala Leu Pro Ala
290 295 300
Gly Trp Glu Gln Arg Glu Leu Pro Asn Gly Arg Val Tyr Tyr Val Asp
305 310 315 320
His Asn Thr Lys Thr Thr Thr Trp Glu Arg Pro Leu Pro Pro Gly Trp
325 330 335
Glu Lys Arg Thr Asp Pro Arg Gly Arg Phe Tyr Tyr Val Asp His Asn
340 345 350
Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr Ala Glu Tyr Val Arg Asn
355 360 365
Tyr Glu Gln Trp Gln Ser Gln Arg Asn Gln Leu Gln Gly Ala Met Gln
370 375 380
His Phe Ser Gln Arg Phe Leu Tyr Gln Ser Ser Ser Ala Ser Thr Asp
385 390 395 400
His Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Gln Asp
405 410 415
Asn Gly Arg Val Tyr Tyr Val Asn His Asn Thr Arg Thr Thr Gln Trp
420 425 430
Glu Asp Pro Arg Thr Gln Gly Met Ile Gln Glu Pro Ala Leu Pro Pro
435 440 445
Gly Trp Glu Met Lys Tyr Thr Ser Glu Gly Val Arg Tyr Phe Val Asp
450 455 460
His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro Arg Pro Gly Phe Glu
465 470 475 480
Ser Gly Thr Lys Gln Gly Ser Pro Gly Ala Tyr Asp Arg Ser Phe Arg
485 490 495
Trp Lys Tyr His Gln Phe Arg Phe Leu Cys His Ser Asn Ala Leu Pro
500 505 510
Ser His Val Lys Ile Ser Val Ser Arg Gln Thr Leu Phe Glu Asp Ser
515 520 525
Phe Gln Gln Ile Met Asn Met Lys Pro Tyr Asp Leu Arg Arg Arg Leu
530 535 540
Tyr Ile Ile Met Arg Gly Glu Glu Gly Leu Asp Tyr Gly Gly Ile Ala
545 550 555 560
Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu Asn Pro Met Tyr
565 570 575
Cys Leu Phe Glu Tyr Ala Gly Lys Asn Asn Tyr Cys Leu Gln Ile Asn
580 585 590
Pro Ala Ser Ser Ile Asn Pro Asp His Leu Thr Tyr Phe Arg Phe Ile
595 600 605
Gly Arg Phe Ile Ala Met Ala Leu Tyr His Gly Lys Phe Ile Asp Thr
610 615 620
Gly Phe Thr Leu Pro Phe Tyr Lys Arg Met Leu Asn Lys Arg Pro Thr
625 630 635 640
Leu Lys Asp Leu Glu Ser Ile Asp Pro Glu Phe Tyr Asn Ser Ile Val
645 650 655
Trp Ile Lys Glu Asn Asn Leu Glu Glu Cys Gly Leu Glu Leu Tyr Phe
660 665 670
Ile Gln Asp Met Glu Ile Leu Gly Lys Val Thr Thr His Glu Leu Lys
675 680 685
Glu Gly Gly Glu Ser Ile Arg Val Thr Glu Glu Asn Lys Glu Glu Tyr
690 695 700
Ile Met Leu Leu Thr Asp Trp Arg Phe Thr Arg Gly Val Glu Glu Gln
705 710 715 720
Thr Lys Ala Phe Leu Asp Gly Phe Asn Glu Val Ala Pro Leu Glu Trp
725 730 735
Leu Arg Tyr Phe Asp Glu Lys Glu Leu Glu Leu Met Leu Cys Gly Met
740 745 750
Gln Glu Ile Asp Met Ser Asp Trp Gln Lys Ser Thr Ile Tyr Arg His
755 760 765
Tyr Thr Lys Asn Ser Lys Gln Ile Gln Trp Phe Trp Gln Val Val Lys
770 775 780
Glu Met Asp Asn Glu Lys Arg Ile Arg Leu Leu Gln Phe Val Thr Gly
785 790 795 800
Thr Cys Arg Leu Pro Val Gly Gly Phe Ala Glu Leu Ile Gly Ser Asn
805 810 815
Gly Pro Gln Lys Phe Cys Ile Asp Lys Val Gly Lys Glu Thr Trp Leu
820 825 830
Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro Tyr Lys
835 840 845
Ser Tyr Glu Gln Leu Arg Glu Lys Leu Leu Tyr Ala Ile Glu Glu Thr
850 855 860
Glu Gly Phe Gly Gln Glu
865 870
<210> 8
<211> 1319
<212> PRT
<213> Homo Sapiens
<400> 8
Met Ala Gln Ser Leu Arg Leu His Phe Ala Ala Arg Arg Ser Asn Thr
1 5 10 15
Tyr Pro Leu Ser Glu Thr Ser Gly Asp Asp Leu Asp Ser His Val His
20 25 30
Met Cys Phe Lys Arg Pro Thr Arg Ile Ser Thr Ser Asn Val Val Gln
35 40 45
Met Lys Leu Thr Pro Arg Gln Thr Ala Leu Ala Pro Leu Ile Lys Glu
50 55 60
Asn Val Gln Ser Gln Glu Arg Ser Ser Val Pro Ser Ser Glu Asn Val
65 70 75 80
Asn Lys Lys Ser Ser Cys Leu Gln Ile Ser Leu Gln Pro Thr Arg Tyr
85 90 95
Ser Gly Tyr Leu Gln Ser Ser Asn Val Leu Ala Asp Ser Asp Asp Ala
100 105 110
Ser Phe Thr Cys Ile Leu Lys Asp Gly Ile Tyr Ser Ser Ala Val Val
115 120 125
Asp Asn Glu Leu Asn Ala Val Asn Asp Gly His Leu Val Ser Ser Pro
130 135 140
Ala Ile Cys Ser Gly Ser Leu Ser Asn Phe Ser Thr Ser Asp Asn Gly
145 150 155 160
Ser Tyr Ser Ser Asn Gly Ser Asp Phe Gly Ser Cys Ala Ser Ile Thr
165 170 175
Ser Gly Gly Ser Tyr Thr Asn Ser Val Ile Ser Asp Ser Ser Ser Tyr
180 185 190
Thr Phe Pro Pro Ser Asp Asp Thr Phe Leu Gly Gly Asn Leu Pro Ser
195 200 205
Asp Ser Thr Ser Asn Arg Ser Val Pro Asn Arg Asn Thr Thr Pro Cys
210 215 220
Glu Ile Phe Ser Arg Ser Thr Ser Thr Asp Pro Phe Val Gln Asp Asp
225 230 235 240
Leu Glu His Gly Leu Glu Ile Met Lys Leu Pro Val Ser Arg Asn Thr
245 250 255
Lys Ile Pro Leu Lys Arg Tyr Ser Ser Leu Val Ile Phe Pro Arg Ser
260 265 270
Pro Ser Thr Thr Arg Pro Thr Ser Pro Thr Ser Leu Cys Thr Leu Leu
275 280 285
Ser Lys Gly Ser Tyr Gln Thr Ser His Gln Phe Ile Ile Ser Pro Ser
290 295 300
Glu Ile Ala His Asn Glu Asp Gly Thr Ser Ala Lys Gly Phe Leu Ser
305 310 315 320
Thr Ala Val Asn Gly Leu Arg Leu Ser Lys Thr Ile Cys Thr Pro Gly
325 330 335
Glu Val Arg Asp Ile Arg Pro Leu His Arg Lys Gly Ser Leu Gln Lys
340 345 350
Lys Ile Val Leu Ser Asn Asn Thr Pro Arg Gln Thr Val Cys Glu Lys
355 360 365
Ser Ser Glu Gly Tyr Ser Cys Val Ser Val His Phe Thr Gln Arg Lys
370 375 380
Ala Ala Thr Leu Asp Cys Glu Thr Thr Asn Gly Asp Cys Lys Pro Glu
385 390 395 400
Met Ser Glu Ile Lys Leu Asn Ser Asp Ser Glu Tyr Ile Lys Leu Met
405 410 415
His Arg Thr Ser Ala Cys Leu Pro Ser Ser Gln Asn Val Asp Cys Gln
420 425 430
Ile Asn Ile Asn Gly Glu Leu Glu Arg Pro His Ser Gln Met Asn Lys
435 440 445
Asn His Gly Ile Leu Arg Arg Ser Ile Ser Leu Gly Gly Ala Tyr Pro
450 455 460
Asn Ile Ser Cys Leu Ser Ser Leu Lys His Asn Cys Ser Lys Gly Gly
465 470 475 480
Pro Ser Gln Leu Leu Ile Lys Phe Ala Ser Gly Asn Glu Gly Lys Val
485 490 495
Asp Asn Leu Ser Arg Asp Ser Asn Arg Asp Cys Thr Asn Glu Leu Ser
500 505 510
Asn Ser Cys Lys Thr Arg Asp Asp Phe Leu Gly Gln Val Asp Val Pro
515 520 525
Leu Tyr Pro Leu Pro Thr Glu Asn Pro Arg Leu Glu Arg Pro Tyr Thr
530 535 540
Phe Lys Asp Phe Val Leu His Pro Arg Ser His Lys Ser Arg Val Lys
545 550 555 560
Gly Tyr Leu Arg Leu Lys Met Thr Tyr Leu Pro Lys Thr Ser Gly Ser
565 570 575
Glu Asp Asp Asn Ala Glu Gln Ala Glu Glu Leu Glu Pro Gly Trp Val
580 585 590
Val Leu Asp Gln Pro Asp Ala Ala Cys His Leu Gln Gln Gln Gln Glu
595 600 605
Pro Ser Pro Leu Pro Pro Gly Trp Glu Glu Arg Gln Asp Ile Leu Gly
610 615 620
Arg Thr Tyr Tyr Val Asn His Glu Ser Arg Arg Thr Gln Trp Lys Arg
625 630 635 640
Pro Thr Pro Gln Asp Asn Leu Thr Asp Ala Glu Asn Gly Asn Ile Gln
645 650 655
Leu Gln Ala Gln Arg Ala Phe Thr Thr Arg Arg Gln Ile Ser Glu Glu
660 665 670
Thr Glu Ser Val Asp Asn Arg Glu Ser Ser Glu Asn Trp Glu Ile Ile
675 680 685
Arg Glu Asp Glu Ala Thr Met Tyr Ser Asn Gln Ala Phe Pro Ser Pro
690 695 700
Pro Pro Ser Ser Asn Leu Asp Val Pro Thr His Leu Ala Glu Glu Leu
705 710 715 720
Asn Ala Arg Leu Thr Ile Phe Gly Asn Ser Ala Val Ser Gln Pro Ala
725 730 735
Ser Ser Ser Asn His Ser Ser Arg Arg Gly Ser Leu Gln Ala Tyr Thr
740 745 750
Phe Glu Glu Gln Pro Thr Leu Pro Val Leu Leu Pro Thr Ser Ser Gly
755 760 765
Leu Pro Pro Gly Trp Glu Glu Lys Gln Asp Glu Arg Gly Arg Ser Tyr
770 775 780
Tyr Val Asp His Asn Ser Arg Thr Thr Thr Trp Thr Lys Pro Thr Val
785 790 795 800
Gln Ala Thr Val Glu Thr Ser Gln Leu Thr Ser Ser Gln Ser Ser Ala
805 810 815
Gly Pro Gln Ser Gln Ala Ser Thr Ser Asp Ser Gly Gln Gln Val Thr
820 825 830
Gln Pro Ser Glu Ile Glu Gln Gly Phe Leu Pro Lys Gly Trp Glu Val
835 840 845
Arg His Ala Pro Asn Gly Arg Pro Phe Phe Ile Asp His Asn Thr Lys
850 855 860
Thr Thr Thr Trp Glu Asp Pro Arg Leu Lys Ile Pro Ala His Leu Arg
865 870 875 880
Gly Lys Thr Ser Leu Asp Thr Ser Asn Asp Leu Gly Pro Leu Pro Pro
885 890 895
Gly Trp Glu Glu Arg Thr His Thr Asp Gly Arg Ile Phe Tyr Ile Asn
900 905 910
His Asn Ile Lys Arg Thr Gln Trp Glu Asp Pro Arg Leu Glu Asn Val
915 920 925
Ala Ile Thr Gly Pro Ala Val Pro Tyr Ser Arg Asp Tyr Lys Arg Lys
930 935 940
Tyr Glu Phe Phe Arg Arg Lys Leu Lys Lys Gln Asn Asp Ile Pro Asn
945 950 955 960
Lys Phe Glu Met Lys Leu Arg Arg Ala Thr Val Leu Glu Asp Ser Tyr
965 970 975
Arg Arg Ile Met Gly Val Lys Arg Ala Asp Phe Leu Lys Ala Arg Leu
980 985 990
Trp Ile Glu Phe Asp Gly Glu Lys Gly Leu Asp Tyr Gly Gly Val Ala
995 1000 1005
Arg Glu Trp Phe Phe Leu Ile Ser Lys Glu Met Phe Asn Pro Tyr
1010 1015 1020
Tyr Gly Leu Phe Glu Tyr Ser Ala Thr Asp Asn Tyr Thr Leu Gln
1025 1030 1035
Ile Asn Pro Asn Ser Gly Leu Cys Asn Glu Asp His Leu Ser Tyr
1040 1045 1050
Phe Lys Phe Ile Gly Arg Val Ala Gly Met Ala Val Tyr His Gly
1055 1060 1065
Lys Leu Leu Asp Gly Phe Phe Ile Arg Pro Phe Tyr Lys Met Met
1070 1075 1080
Leu His Lys Pro Ile Thr Leu His Asp Met Glu Ser Val Asp Ser
1085 1090 1095
Glu Tyr Tyr Asn Ser Leu Arg Trp Ile Leu Glu Asn Asp Pro Thr
1100 1105 1110
Glu Leu Asp Leu Arg Phe Ile Ile Asp Glu Glu Leu Phe Gly Gln
1115 1120 1125
Thr His Gln His Glu Leu Lys Asn Gly Gly Ser Glu Ile Val Val
1130 1135 1140
Thr Asn Lys Asn Lys Lys Glu Tyr Ile Tyr Leu Val Ile Gln Trp
1145 1150 1155
Arg Phe Val Asn Arg Ile Gln Lys Gln Met Ala Ala Phe Lys Glu
1160 1165 1170
Gly Phe Phe Glu Leu Ile Pro Gln Asp Leu Ile Lys Ile Phe Asp
1175 1180 1185
Glu Asn Glu Leu Glu Leu Leu Met Cys Gly Leu Gly Asp Val Asp
1190 1195 1200
Val Asn Asp Trp Arg Glu His Thr Lys Tyr Lys Asn Gly Tyr Ser
1205 1210 1215
Ala Asn His Gln Val Ile Gln Trp Phe Trp Lys Ala Val Leu Met
1220 1225 1230
Met Asp Ser Glu Lys Arg Ile Arg Leu Leu Gln Phe Val Thr Gly
1235 1240 1245
Thr Ser Arg Val Pro Met Asn Gly Phe Ala Glu Leu Tyr Gly Ser
1250 1255 1260
Asn Gly Pro Gln Ser Phe Thr Val Glu Gln Trp Gly Thr Pro Glu
1265 1270 1275
Lys Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu Pro
1280 1285 1290
Pro Tyr Glu Ser Phe Glu Glu Leu Trp Asp Lys Leu Gln Met Ala
1295 1300 1305
Ile Glu Asn Thr Gln Gly Phe Asp Gly Val Asp
1310 1315
<210> 9
<211> 955
<212> PRT
<213> Homo Sapiens
<400> 9
Met Ala Thr Gly Leu Gly Glu Pro Val Tyr Gly Leu Ser Glu Asp Glu
1 5 10 15
Gly Glu Ser Arg Ile Leu Arg Val Lys Val Val Ser Gly Ile Asp Leu
20 25 30
Ala Lys Lys Asp Ile Phe Gly Ala Ser Asp Pro Tyr Val Lys Leu Ser
35 40 45
Leu Tyr Val Ala Asp Glu Asn Arg Glu Leu Ala Leu Val Gln Thr Lys
50 55 60
Thr Ile Lys Lys Thr Leu Asn Pro Lys Trp Asn Glu Glu Phe Tyr Phe
65 70 75 80
Arg Val Asn Pro Ser Asn His Arg Leu Leu Phe Glu Val Phe Asp Glu
85 90 95
Asn Arg Leu Thr Arg Asp Asp Phe Leu Gly Gln Val Asp Val Pro Leu
100 105 110
Ser His Leu Pro Thr Glu Asp Pro Thr Met Glu Arg Pro Tyr Thr Phe
115 120 125
Lys Asp Phe Leu Leu Arg Pro Arg Ser His Lys Ser Arg Val Lys Gly
130 135 140
Phe Leu Arg Leu Lys Met Ala Tyr Met Pro Lys Asn Gly Gly Gln Asp
145 150 155 160
Glu Glu Asn Ser Asp Gln Arg Asp Asp Met Glu His Gly Trp Glu Val
165 170 175
Val Asp Ser Asn Asp Ser Ala Ser Gln His Gln Glu Glu Leu Pro Pro
180 185 190
Pro Pro Leu Pro Pro Gly Trp Glu Glu Lys Val Asp Asn Leu Gly Arg
195 200 205
Thr Tyr Tyr Val Asn His Asn Asn Arg Thr Thr Gln Trp His Arg Pro
210 215 220
Ser Leu Met Asp Val Ser Ser Glu Ser Asp Asn Asn Ile Arg Gln Ile
225 230 235 240
Asn Gln Glu Ala Ala His Arg Arg Phe Arg Ser Arg Arg His Ile Ser
245 250 255
Glu Asp Leu Glu Pro Glu Pro Ser Glu Gly Gly Asp Val Pro Glu Pro
260 265 270
Trp Glu Thr Ile Ser Glu Glu Val Asn Ile Ala Gly Asp Ser Leu Gly
275 280 285
Leu Ala Leu Pro Pro Pro Pro Ala Ser Pro Gly Ser Arg Thr Ser Pro
290 295 300
Gln Glu Leu Ser Glu Glu Leu Ser Arg Arg Leu Gln Ile Thr Pro Asp
305 310 315 320
Ser Asn Gly Glu Gln Phe Ser Ser Leu Ile Gln Arg Glu Pro Ser Ser
325 330 335
Arg Leu Arg Ser Cys Ser Val Thr Asp Ala Val Ala Glu Gln Gly His
340 345 350
Leu Pro Pro Pro Ser Val Ala Tyr Val His Thr Thr Pro Gly Leu Pro
355 360 365
Ser Gly Trp Glu Glu Arg Lys Asp Ala Lys Gly Arg Thr Tyr Tyr Val
370 375 380
Asn His Asn Asn Arg Thr Thr Thr Trp Thr Arg Pro Ile Met Gln Leu
385 390 395 400
Ala Glu Asp Gly Ala Ser Gly Ser Ala Thr Asn Ser Asn Asn His Leu
405 410 415
Ile Glu Pro Gln Ile Arg Arg Pro Arg Ser Leu Ser Ser Pro Thr Val
420 425 430
Thr Leu Ser Ala Pro Leu Glu Gly Ala Lys Asp Ser Pro Val Arg Arg
435 440 445
Ala Val Lys Asp Thr Leu Ser Asn Pro Gln Ser Pro Gln Pro Ser Pro
450 455 460
Tyr Asn Ser Pro Lys Pro Gln His Lys Val Thr Gln Ser Phe Leu Pro
465 470 475 480
Pro Gly Trp Glu Met Arg Ile Ala Pro Asn Gly Arg Pro Phe Phe Ile
485 490 495
Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro Arg Leu Lys Phe
500 505 510
Pro Val His Met Arg Ser Lys Thr Ser Leu Asn Pro Asn Asp Leu Gly
515 520 525
Pro Leu Pro Pro Gly Trp Glu Glu Arg Ile His Leu Asp Gly Arg Thr
530 535 540
Phe Tyr Ile Asp His Asn Ser Lys Ile Thr Gln Trp Glu Asp Pro Arg
545 550 555 560
Leu Gln Asn Pro Ala Ile Thr Gly Pro Ala Val Pro Tyr Ser Arg Glu
565 570 575
Phe Lys Gln Lys Tyr Asp Tyr Phe Arg Lys Lys Leu Lys Lys Pro Ala
580 585 590
Asp Ile Pro Asn Arg Phe Glu Met Lys Leu His Arg Asn Asn Ile Phe
595 600 605
Glu Glu Ser Tyr Arg Arg Ile Met Ser Val Lys Arg Pro Asp Val Leu
610 615 620
Lys Ala Arg Leu Trp Ile Glu Phe Glu Ser Glu Lys Gly Leu Asp Tyr
625 630 635 640
Gly Gly Val Ala Arg Glu Trp Phe Phe Leu Leu Ser Lys Glu Met Phe
645 650 655
Asn Pro Tyr Tyr Gly Leu Phe Glu Tyr Ser Ala Thr Asp Asn Tyr Thr
660 665 670
Leu Gln Ile Asn Pro Asn Ser Gly Leu Cys Asn Glu Asp His Leu Ser
675 680 685
Tyr Phe Thr Phe Ile Gly Arg Val Ala Gly Leu Ala Val Phe His Gly
690 695 700
Lys Leu Leu Asp Gly Phe Phe Ile Arg Pro Phe Tyr Lys Met Met Leu
705 710 715 720
Gly Lys Gln Ile Thr Leu Asn Asp Met Glu Ser Val Asp Ser Glu Tyr
725 730 735
Tyr Asn Ser Leu Lys Trp Ile Leu Glu Asn Asp Pro Thr Glu Leu Asp
740 745 750
Leu Met Phe Cys Ile Asp Glu Glu Asn Phe Gly Gln Thr Tyr Gln Val
755 760 765
Asp Leu Lys Pro Asn Gly Ser Glu Ile Met Val Thr Asn Glu Asn Lys
770 775 780
Arg Glu Tyr Ile Asp Leu Val Ile Gln Trp Arg Phe Val Asn Arg Val
785 790 795 800
Gln Lys Gln Met Asn Ala Phe Leu Glu Gly Phe Thr Glu Leu Leu Pro
805 810 815
Ile Asp Leu Ile Lys Ile Phe Asp Glu Asn Glu Leu Glu Leu Leu Met
820 825 830
Cys Gly Leu Gly Asp Val Asp Val Asn Asp Trp Arg Gln His Ser Ile
835 840 845
Tyr Lys Asn Gly Tyr Cys Pro Asn His Pro Val Ile Gln Trp Phe Trp
850 855 860
Lys Ala Val Leu Leu Met Asp Ala Glu Lys Arg Ile Arg Leu Leu Gln
865 870 875 880
Phe Val Thr Gly Thr Ser Arg Val Pro Met Asn Gly Phe Ala Glu Leu
885 890 895
Tyr Gly Ser Asn Gly Pro Gln Leu Phe Thr Ile Glu Gln Trp Gly Ser
900 905 910
Pro Glu Lys Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu
915 920 925
Pro Pro Tyr Glu Thr Phe Glu Asp Leu Arg Glu Lys Leu Leu Met Ala
930 935 940
Val Glu Asn Ala Gln Gly Phe Glu Gly Val Asp
945 950 955
<210> 10
<211> 757
<212> PRT
<213> Homo Sapiens
<400> 10
Met Ser Asn Pro Gly Thr Arg Arg Asn Gly Ser Ser Ile Lys Ile Arg
1 5 10 15
Leu Thr Val Leu Cys Ala Lys Asn Leu Ala Lys Lys Asp Phe Phe Arg
20 25 30
Leu Pro Asp Pro Phe Ala Lys Ile Val Val Asp Gly Ser Gly Gln Cys
35 40 45
His Ser Thr Asp Thr Val Lys Asn Thr Leu Asp Pro Lys Trp Asn Gln
50 55 60
His Tyr Asp Leu Tyr Val Gly Lys Thr Asp Ser Ile Thr Ile Ser Val
65 70 75 80
Trp Asn His Lys Lys Ile His Lys Lys Gln Gly Ala Gly Phe Leu Gly
85 90 95
Cys Val Arg Leu Leu Ser Asn Ala Ile Ser Arg Leu Lys Asp Thr Gly
100 105 110
Tyr Gln Arg Leu Asp Leu Cys Lys Leu Asn Pro Ser Asp Thr Asp Ala
115 120 125
Val Arg Gly Gln Ile Val Val Ser Leu Gln Thr Arg Asp Arg Ile Gly
130 135 140
Thr Gly Gly Ser Val Val Asp Cys Arg Gly Leu Leu Glu Asn Glu Gly
145 150 155 160
Thr Val Tyr Glu Asp Ser Gly Pro Gly Arg Pro Leu Ser Cys Phe Met
165 170 175
Glu Glu Pro Ala Pro Tyr Thr Asp Ser Thr Gly Ala Ala Ala Gly Gly
180 185 190
Gly Asn Cys Arg Phe Val Glu Ser Pro Ser Gln Asp Gln Arg Leu Gln
195 200 205
Ala Gln Arg Leu Arg Asn Pro Asp Val Arg Gly Ser Leu Gln Thr Pro
210 215 220
Gln Asn Arg Pro His Gly His Gln Ser Pro Glu Leu Pro Glu Gly Tyr
225 230 235 240
Glu Gln Arg Thr Thr Val Gln Gly Gln Val Tyr Phe Leu His Thr Gln
245 250 255
Thr Gly Val Ser Thr Trp His Asp Pro Arg Ile Pro Ser Pro Ser Gly
260 265 270
Thr Ile Pro Gly Gly Asp Ala Ala Phe Leu Tyr Glu Phe Leu Leu Gln
275 280 285
Gly His Thr Ser Glu Pro Arg Asp Leu Asn Ser Val Asn Cys Asp Glu
290 295 300
Leu Gly Pro Leu Pro Pro Gly Trp Glu Val Arg Ser Thr Val Ser Gly
305 310 315 320
Arg Ile Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp
325 330 335
Pro Arg Leu His His Ile Met Asn His Gln Cys Gln Leu Lys Glu Pro
340 345 350
Ser Gln Pro Leu Pro Leu Pro Ser Glu Gly Ser Leu Glu Asp Glu Glu
355 360 365
Leu Pro Ala Gln Arg Tyr Glu Arg Asp Leu Val Gln Lys Leu Lys Val
370 375 380
Leu Arg His Glu Leu Ser Leu Gln Gln Pro Gln Ala Gly His Cys Arg
385 390 395 400
Ile Glu Val Ser Arg Glu Glu Ile Phe Glu Glu Ser Tyr Arg Gln Ile
405 410 415
Met Lys Met Arg Pro Lys Asp Leu Lys Lys Arg Leu Met Val Lys Phe
420 425 430
Arg Gly Glu Glu Gly Leu Asp Tyr Gly Gly Val Ala Arg Glu Trp Leu
435 440 445
Tyr Leu Leu Cys His Glu Met Leu Asn Pro Tyr Tyr Gly Leu Phe Gln
450 455 460
Tyr Ser Thr Asp Asn Ile Tyr Met Leu Gln Ile Asn Pro Asp Ser Ser
465 470 475 480
Ile Asn Pro Asp His Leu Ser Tyr Phe His Phe Val Gly Arg Ile Met
485 490 495
Gly Leu Ala Val Phe His Gly His Tyr Ile Asn Gly Gly Phe Thr Val
500 505 510
Pro Phe Tyr Lys Gln Leu Leu Gly Lys Pro Ile Gln Leu Ser Asp Leu
515 520 525
Glu Ser Val Asp Pro Glu Leu His Lys Ser Leu Val Trp Ile Leu Glu
530 535 540
Asn Asp Ile Thr Pro Val Leu Asp His Thr Phe Cys Val Glu His Asn
545 550 555 560
Ala Phe Gly Arg Ile Leu Gln His Glu Leu Lys Pro Asn Gly Arg Asn
565 570 575
Val Pro Val Thr Glu Glu Asn Lys Lys Glu Tyr Val Arg Leu Tyr Val
580 585 590
Asn Trp Arg Phe Met Arg Gly Ile Glu Ala Gln Phe Leu Ala Leu Gln
595 600 605
Lys Gly Phe Asn Glu Leu Ile Pro Gln His Leu Leu Lys Pro Phe Asp
610 615 620
Gln Lys Glu Leu Glu Leu Ile Ile Gly Gly Leu Asp Lys Ile Asp Leu
625 630 635 640
Asn Asp Trp Lys Ser Asn Thr Arg Leu Lys His Cys Val Ala Asp Ser
645 650 655
Asn Ile Val Arg Trp Phe Trp Gln Ala Val Glu Thr Phe Asp Glu Glu
660 665 670
Arg Arg Ala Arg Leu Leu Gln Phe Val Thr Gly Ser Thr Arg Val Pro
675 680 685
Leu Gln Gly Phe Lys Ala Leu Gln Gly Ser Thr Gly Ala Ala Gly Pro
690 695 700
Arg Leu Phe Thr Ile His Leu Ile Asp Ala Asn Thr Asp Asn Leu Pro
705 710 715 720
Lys Ala His Thr Cys Phe Asn Arg Ile Asp Ile Pro Pro Tyr Glu Ser
725 730 735
Tyr Glu Lys Leu Tyr Glu Lys Leu Leu Thr Ala Val Glu Glu Thr Cys
740 745 750
Gly Phe Ala Val Glu
755
<210> 11
<211> 748
<212> PRT
<213> Homo Sapiens
<400> 11
Met Ser Asn Pro Gly Gly Arg Arg Asn Gly Pro Val Lys Leu Arg Leu
1 5 10 15
Thr Val Leu Cys Ala Lys Asn Leu Val Lys Lys Asp Phe Phe Arg Leu
20 25 30
Pro Asp Pro Phe Ala Lys Val Val Val Asp Gly Ser Gly Gln Cys His
35 40 45
Ser Thr Asp Thr Val Lys Asn Thr Leu Asp Pro Lys Trp Asn Gln His
50 55 60
Tyr Asp Leu Tyr Ile Gly Lys Ser Asp Ser Val Thr Ile Ser Val Trp
65 70 75 80
Asn His Lys Lys Ile His Lys Lys Gln Gly Ala Gly Phe Leu Gly Cys
85 90 95
Val Arg Leu Leu Ser Asn Ala Ile Asn Arg Leu Lys Asp Thr Gly Tyr
100 105 110
Gln Arg Leu Asp Leu Cys Lys Leu Gly Pro Asn Asp Asn Asp Thr Val
115 120 125
Arg Gly Gln Ile Val Val Ser Leu Gln Ser Arg Asp Arg Ile Gly Thr
130 135 140
Gly Gly Gln Val Val Asp Cys Ser Arg Leu Phe Asp Asn Asp Leu Pro
145 150 155 160
Asp Gly Trp Glu Glu Arg Arg Thr Ala Ser Gly Arg Ile Gln Tyr Leu
165 170 175
Asn His Ile Thr Arg Thr Thr Gln Trp Glu Arg Pro Thr Arg Pro Ala
180 185 190
Ser Glu Tyr Ser Ser Pro Gly Arg Pro Leu Ser Cys Phe Val Asp Glu
195 200 205
Asn Thr Pro Ile Ser Gly Thr Asn Gly Ala Thr Cys Gly Gln Ser Ser
210 215 220
Asp Pro Arg Leu Ala Glu Arg Arg Val Arg Ser Gln Arg His Arg Asn
225 230 235 240
Tyr Met Ser Arg Thr His Leu His Thr Pro Pro Asp Leu Pro Glu Gly
245 250 255
Tyr Glu Gln Arg Thr Thr Gln Gln Gly Gln Val Tyr Phe Leu His Thr
260 265 270
Gln Thr Gly Val Ser Thr Trp His Asp Pro Arg Val Pro Arg Asp Leu
275 280 285
Ser Asn Ile Asn Cys Glu Glu Leu Gly Pro Leu Pro Pro Gly Trp Glu
290 295 300
Ile Arg Asn Thr Ala Thr Gly Arg Val Tyr Phe Val Asp His Asn Asn
305 310 315 320
Arg Thr Thr Gln Phe Thr Asp Pro Arg Leu Ser Ala Asn Leu His Leu
325 330 335
Val Leu Asn Arg Gln Asn Gln Leu Lys Asp Gln Gln Gln Gln Gln Val
340 345 350
Val Ser Leu Cys Pro Asp Asp Thr Glu Cys Leu Thr Val Pro Arg Tyr
355 360 365
Lys Arg Asp Leu Val Gln Lys Leu Lys Ile Leu Arg Gln Glu Leu Ser
370 375 380
Gln Gln Gln Pro Gln Ala Gly His Cys Arg Ile Glu Val Ser Arg Glu
385 390 395 400
Glu Ile Phe Glu Glu Ser Tyr Arg Gln Val Met Lys Met Arg Pro Lys
405 410 415
Asp Leu Trp Lys Arg Leu Met Ile Lys Phe Arg Gly Glu Glu Gly Leu
420 425 430
Asp Tyr Gly Gly Val Ala Arg Glu Trp Leu Tyr Leu Leu Ser His Glu
435 440 445
Met Leu Asn Pro Tyr Tyr Gly Leu Phe Gln Tyr Ser Arg Asp Asp Ile
450 455 460
Tyr Thr Leu Gln Ile Asn Pro Asp Ser Ala Val Asn Pro Glu His Leu
465 470 475 480
Ser Tyr Phe His Phe Val Gly Arg Ile Met Gly Met Ala Val Phe His
485 490 495
Gly His Tyr Ile Asp Gly Gly Phe Thr Leu Pro Phe Tyr Lys Gln Leu
500 505 510
Leu Gly Lys Ser Ile Thr Leu Asp Asp Met Glu Leu Val Asp Pro Asp
515 520 525
Leu His Asn Ser Leu Val Trp Ile Leu Glu Asn Asp Ile Thr Gly Val
530 535 540
Leu Asp His Thr Phe Cys Val Glu His Asn Ala Tyr Gly Glu Ile Ile
545 550 555 560
Gln His Glu Leu Lys Pro Asn Gly Lys Ser Ile Pro Val Asn Glu Glu
565 570 575
Asn Lys Lys Glu Tyr Val Arg Leu Tyr Val Asn Trp Arg Phe Leu Arg
580 585 590
Gly Ile Glu Ala Gln Phe Leu Ala Leu Gln Lys Gly Phe Asn Glu Val
595 600 605
Ile Pro Gln His Leu Leu Lys Thr Phe Asp Glu Lys Glu Leu Glu Leu
610 615 620
Ile Ile Cys Gly Leu Gly Lys Ile Asp Val Asn Asp Trp Lys Val Asn
625 630 635 640
Thr Arg Leu Lys His Cys Thr Pro Asp Ser Asn Ile Val Lys Trp Phe
645 650 655
Trp Lys Ala Val Glu Phe Phe Asp Glu Glu Arg Arg Ala Arg Leu Leu
660 665 670
Gln Phe Val Thr Gly Ser Ser Arg Val Pro Leu Gln Gly Phe Lys Ala
675 680 685
Leu Gln Gly Ala Ala Gly Pro Arg Leu Phe Thr Ile His Gln Ile Asp
690 695 700
Ala Cys Thr Asn Asn Leu Pro Lys Ala His Thr Cys Phe Asn Arg Ile
705 710 715 720
Asp Ile Pro Pro Tyr Glu Ser Tyr Glu Lys Leu Tyr Glu Lys Leu Leu
725 730 735
Thr Ala Ile Glu Glu Thr Cys Gly Phe Ala Val Glu
740 745
<210> 12
<211> 903
<212> PRT
<213> Homo Sapiens
<400> 12
Met Ser Asp Ser Gly Ser Gln Leu Gly Ser Met Gly Ser Leu Thr Met
1 5 10 15
Lys Ser Gln Leu Gln Ile Thr Val Ile Ser Ala Lys Leu Lys Glu Asn
20 25 30
Lys Lys Asn Trp Phe Gly Pro Ser Pro Tyr Val Glu Val Thr Val Asp
35 40 45
Gly Gln Ser Lys Lys Thr Glu Lys Cys Asn Asn Thr Asn Ser Pro Lys
50 55 60
Trp Lys Gln Pro Leu Thr Val Ile Val Thr Pro Val Ser Lys Leu His
65 70 75 80
Phe Arg Val Trp Ser His Gln Thr Leu Lys Ser Asp Val Leu Leu Gly
85 90 95
Thr Ala Ala Leu Asp Ile Tyr Glu Thr Leu Lys Ser Asn Asn Met Lys
100 105 110
Leu Glu Glu Val Val Val Thr Leu Gln Leu Gly Gly Asp Lys Glu Pro
115 120 125
Thr Glu Thr Ile Gly Asp Leu Ser Ile Cys Leu Asp Gly Leu Gln Leu
130 135 140
Glu Ser Glu Val Val Thr Asn Gly Glu Thr Thr Cys Ser Glu Asn Gly
145 150 155 160
Val Ser Leu Cys Leu Pro Arg Leu Glu Cys Asn Ser Ala Ile Ser Ala
165 170 175
His Cys Asn Leu Cys Leu Pro Gly Leu Ser Asp Ser Pro Ile Ser Ala
180 185 190
Ser Arg Val Ala Gly Phe Thr Gly Ala Ser Gln Asn Asp Asp Gly Ser
195 200 205
Arg Ser Lys Asp Glu Thr Arg Val Ser Thr Asn Gly Ser Asp Asp Pro
210 215 220
Glu Asp Ala Gly Ala Gly Glu Asn Arg Arg Val Ser Gly Asn Asn Ser
225 230 235 240
Pro Ser Leu Ser Asn Gly Gly Phe Lys Pro Ser Arg Pro Pro Arg Pro
245 250 255
Ser Arg Pro Pro Pro Pro Thr Pro Arg Arg Pro Ala Ser Val Asn Gly
260 265 270
Ser Pro Ser Ala Thr Ser Glu Ser Asp Gly Ser Ser Thr Gly Ser Leu
275 280 285
Pro Pro Thr Asn Thr Asn Thr Asn Thr Ser Glu Gly Ala Thr Ser Gly
290 295 300
Leu Ile Ile Pro Leu Thr Ile Ser Gly Gly Ser Gly Pro Arg Pro Leu
305 310 315 320
Asn Pro Val Thr Gln Ala Pro Leu Pro Pro Gly Trp Glu Gln Arg Val
325 330 335
Asp Gln His Gly Arg Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr
340 345 350
Thr Trp Asp Arg Pro Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val
355 360 365
Asp Asn Met Gly Arg Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr
370 375 380
Thr Trp Gln Arg Pro Thr Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp
385 390 395 400
Gln Leu Gln Arg Ser Gln Leu Gln Gly Ala Met Gln Gln Phe Asn Gln
405 410 415
Arg Phe Ile Tyr Gly Asn Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys
420 425 430
Glu Phe Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr
435 440 445
Asp Ser Asn Gly Arg Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr
450 455 460
Gln Trp Glu Asp Pro Arg Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu
465 470 475 480
Pro Glu Gly Trp Glu Met Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe
485 490 495
Val Asp His Asn Arg Arg Thr Thr Thr Tyr Ile Asp Pro Arg Thr Gly
500 505 510
Lys Ser Ala Leu Asp Asn Gly Pro Gln Ile Ala Tyr Val Arg Asp Phe
515 520 525
Lys Ala Lys Val Gln Tyr Phe Arg Phe Trp Cys Gln Gln Leu Ala Met
530 535 540
Pro Gln His Ile Lys Ile Thr Val Thr Arg Lys Thr Leu Phe Glu Asp
545 550 555 560
Ser Phe Gln Gln Ile Met Ser Phe Ser Pro Gln Asp Leu Arg Arg Arg
565 570 575
Leu Trp Val Ile Phe Pro Gly Glu Glu Gly Leu Asp Tyr Gly Gly Val
580 585 590
Ala Arg Glu Trp Phe Phe Leu Leu Ser His Glu Val Leu Asn Pro Met
595 600 605
Tyr Cys Leu Phe Glu Tyr Ala Gly Lys Asp Asn Tyr Cys Leu Gln Ile
610 615 620
Asn Pro Ala Ser Tyr Ile Asn Pro Asp His Leu Lys Tyr Phe Arg Phe
625 630 635 640
Ile Gly Arg Phe Ile Ala Met Ala Leu Phe His Gly Lys Phe Ile Asp
645 650 655
Thr Gly Phe Ser Leu Pro Phe Tyr Lys Arg Ile Leu Asn Lys Pro Val
660 665 670
Gly Leu Lys Asp Leu Glu Ser Ile Asp Pro Glu Phe Tyr Asn Ser Leu
675 680 685
Ile Trp Val Lys Glu Asn Asn Ile Glu Glu Cys Asp Leu Glu Met Tyr
690 695 700
Phe Ser Val Asp Lys Glu Ile Leu Gly Glu Ile Lys Ser His Asp Leu
705 710 715 720
Lys Pro Asn Gly Gly Asn Ile Leu Val Thr Glu Glu Asn Lys Glu Glu
725 730 735
Tyr Ile Arg Met Val Ala Glu Trp Arg Leu Ser Arg Gly Val Glu Glu
740 745 750
Gln Thr Gln Ala Phe Phe Glu Gly Phe Asn Glu Ile Leu Pro Gln Gln
755 760 765
Tyr Leu Gln Tyr Phe Asp Ala Lys Glu Leu Glu Val Leu Leu Cys Gly
770 775 780
Met Gln Glu Ile Asp Leu Asn Asp Trp Gln Arg His Ala Ile Tyr Arg
785 790 795 800
His Tyr Ala Arg Thr Ser Lys Gln Ile Met Trp Phe Trp Gln Phe Val
805 810 815
Lys Glu Ile Asp Asn Glu Lys Arg Met Arg Leu Leu Gln Phe Val Thr
820 825 830
Gly Thr Cys Arg Leu Pro Val Gly Gly Phe Ala Asp Leu Met Gly Ser
835 840 845
Asn Gly Pro Gln Lys Phe Cys Ile Glu Lys Val Gly Lys Glu Asn Trp
850 855 860
Leu Pro Arg Ser His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro Tyr
865 870 875 880
Lys Ser Tyr Glu Gln Leu Lys Glu Lys Leu Leu Phe Ala Ile Glu Glu
885 890 895
Thr Glu Gly Phe Gly Gln Glu
900
<210> 13
<211> 1606
<212> PRT
<213> Homo Sapiens
<400> 13
Met Leu Leu His Leu Cys Ser Val Lys Asn Leu Tyr Gln Asn Arg Phe
1 5 10 15
Leu Gly Leu Ala Ala Met Ala Ser Pro Ser Arg Asn Ser Gln Ser Arg
20 25 30
Arg Arg Cys Lys Glu Pro Leu Arg Tyr Ser Tyr Asn Pro Asp Gln Phe
35 40 45
His Asn Met Asp Leu Arg Gly Gly Pro His Asp Gly Val Thr Ile Pro
50 55 60
Arg Ser Thr Ser Asp Thr Asp Leu Val Thr Ser Asp Ser Arg Ser Thr
65 70 75 80
Leu Met Val Ser Ser Ser Tyr Tyr Ser Ile Gly His Ser Gln Asp Leu
85 90 95
Val Ile His Trp Asp Ile Lys Glu Glu Val Asp Ala Gly Asp Trp Ile
100 105 110
Gly Met Tyr Leu Ile Asp Glu Val Leu Ser Glu Asn Phe Leu Asp Tyr
115 120 125
Lys Asn Arg Gly Val Asn Gly Ser His Arg Gly Gln Ile Ile Trp Lys
130 135 140
Ile Asp Ala Ser Ser Tyr Phe Val Glu Pro Glu Thr Lys Ile Cys Phe
145 150 155 160
Lys Tyr Tyr His Gly Val Ser Gly Ala Leu Arg Ala Thr Thr Pro Ser
165 170 175
Val Thr Val Lys Asn Ser Ala Ala Pro Ile Phe Lys Ser Ile Gly Ala
180 185 190
Asp Glu Thr Val Gln Gly Gln Gly Ser Arg Arg Leu Ile Ser Phe Ser
195 200 205
Leu Ser Asp Phe Gln Ala Met Gly Leu Lys Lys Gly Met Phe Phe Asn
210 215 220
Pro Asp Pro Tyr Leu Lys Ile Ser Ile Gln Pro Gly Lys His Ser Ile
225 230 235 240
Phe Pro Ala Leu Pro His His Gly Gln Glu Arg Arg Ser Lys Ile Ile
245 250 255
Gly Asn Thr Val Asn Pro Ile Trp Gln Ala Glu Gln Phe Ser Phe Val
260 265 270
Ser Leu Pro Thr Asp Val Leu Glu Ile Glu Val Lys Asp Lys Phe Ala
275 280 285
Lys Ser Arg Pro Ile Ile Lys Arg Phe Leu Gly Lys Leu Ser Met Pro
290 295 300
Val Gln Arg Leu Leu Glu Arg His Ala Ile Gly Asp Arg Val Val Ser
305 310 315 320
Tyr Thr Leu Gly Arg Arg Leu Pro Thr Asp His Val Ser Gly Gln Leu
325 330 335
Gln Phe Arg Phe Glu Ile Thr Ser Ser Ile His Pro Asp Asp Glu Glu
340 345 350
Ile Ser Leu Ser Thr Glu Pro Glu Ser Ala Gln Ile Gln Asp Ser Pro
355 360 365
Met Asn Asn Leu Met Glu Ser Gly Ser Gly Glu Pro Arg Ser Glu Ala
370 375 380
Pro Glu Ser Ser Glu Ser Trp Lys Pro Glu Gln Leu Gly Glu Gly Ser
385 390 395 400
Val Pro Asp Gly Pro Gly Asn Gln Ser Ile Glu Leu Ser Arg Pro Ala
405 410 415
Glu Glu Ala Ala Val Ile Thr Glu Ala Gly Asp Gln Gly Met Val Ser
420 425 430
Val Gly Pro Glu Gly Ala Gly Glu Leu Leu Ala Gln Val Gln Lys Asp
435 440 445
Ile Gln Pro Ala Pro Ser Ala Glu Glu Leu Ala Glu Gln Leu Asp Leu
450 455 460
Gly Glu Glu Ala Ser Ala Leu Leu Leu Glu Asp Gly Glu Ala Pro Ala
465 470 475 480
Ser Thr Lys Glu Glu Pro Leu Glu Glu Glu Ala Thr Thr Gln Ser Arg
485 490 495
Ala Gly Arg Glu Glu Glu Glu Lys Glu Gln Glu Glu Glu Gly Asp Val
500 505 510
Ser Thr Leu Glu Gln Gly Glu Gly Arg Leu Gln Leu Arg Ala Ser Val
515 520 525
Lys Arg Lys Ser Arg Pro Cys Ser Leu Pro Val Ser Glu Leu Glu Thr
530 535 540
Val Ile Ala Ser Ala Cys Gly Asp Pro Glu Thr Pro Arg Thr His Tyr
545 550 555 560
Ile Arg Ile His Thr Leu Leu His Ser Met Pro Ser Ala Gln Gly Gly
565 570 575
Ser Ala Ala Glu Glu Glu Asp Gly Ala Glu Glu Glu Ser Thr Leu Lys
580 585 590
Asp Ser Ser Glu Lys Asp Gly Leu Ser Glu Val Asp Thr Val Ala Ala
595 600 605
Asp Pro Ser Ala Leu Glu Glu Asp Arg Glu Glu Pro Glu Gly Ala Thr
610 615 620
Pro Gly Thr Ala His Pro Gly His Ser Gly Gly His Phe Pro Ser Leu
625 630 635 640
Ala Asn Gly Ala Ala Gln Asp Gly Asp Thr His Pro Ser Thr Gly Ser
645 650 655
Glu Ser Asp Ser Ser Pro Arg Gln Gly Gly Asp His Ser Cys Glu Gly
660 665 670
Cys Asp Ala Ser Cys Cys Ser Pro Ser Cys Tyr Ser Ser Ser Cys Tyr
675 680 685
Ser Thr Ser Cys Tyr Ser Ser Ser Cys Tyr Ser Ala Ser Cys Tyr Ser
690 695 700
Pro Ser Cys Tyr Asn Gly Asn Arg Phe Ala Ser His Thr Arg Phe Ser
705 710 715 720
Ser Val Asp Ser Ala Lys Ile Ser Glu Ser Thr Val Phe Ser Ser Gln
725 730 735
Asp Asp Glu Glu Glu Glu Asn Ser Ala Phe Glu Ser Val Pro Asp Ser
740 745 750
Met Gln Ser Pro Glu Leu Asp Pro Glu Ser Thr Asn Gly Ala Gly Pro
755 760 765
Trp Gln Asp Glu Leu Ala Ala Pro Ser Gly His Val Glu Arg Ser Pro
770 775 780
Glu Gly Leu Glu Ser Pro Val Ala Gly Pro Ser Asn Arg Arg Glu Gly
785 790 795 800
Glu Cys Pro Ile Leu His Asn Ser Gln Pro Val Ser Gln Leu Pro Ser
805 810 815
Leu Arg Pro Glu His His His Tyr Pro Thr Ile Asp Glu Pro Leu Pro
820 825 830
Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg Val Phe Tyr Val
835 840 845
Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro Thr Ala Ala Ala
850 855 860
Thr Pro Asp Gly Met Arg Arg Ser Gly Ser Ile Gln Gln Met Glu Gln
865 870 875 880
Leu Asn Arg Arg Tyr Gln Asn Ile Gln Arg Thr Ile Ala Thr Glu Arg
885 890 895
Ser Glu Glu Asp Ser Gly Ser Gln Ser Cys Glu Gln Ala Pro Ala Gly
900 905 910
Gly Gly Gly Gly Gly Gly Ser Asp Ser Glu Ala Glu Ser Ser Gln Ser
915 920 925
Ser Leu Asp Leu Arg Arg Glu Gly Ser Leu Ser Pro Val Asn Ser Gln
930 935 940
Lys Ile Thr Leu Leu Leu Gln Ser Pro Ala Val Lys Phe Ile Thr Asn
945 950 955 960
Pro Glu Phe Phe Thr Val Leu His Ala Asn Tyr Ser Ala Tyr Arg Val
965 970 975
Phe Thr Ser Ser Thr Cys Leu Lys His Met Ile Leu Lys Val Arg Arg
980 985 990
Asp Ala Arg Asn Phe Glu Arg Tyr Gln His Asn Arg Asp Leu Val Asn
995 1000 1005
Phe Ile Asn Met Phe Ala Asp Thr Arg Leu Glu Leu Pro Arg Gly
1010 1015 1020
Trp Glu Ile Lys Thr Asp Gln Gln Gly Lys Ser Phe Phe Val Asp
1025 1030 1035
His Asn Ser Arg Ala Thr Thr Phe Ile Asp Pro Arg Ile Pro Leu
1040 1045 1050
Gln Asn Gly Arg Leu Pro Asn His Leu Thr His Arg Gln His Leu
1055 1060 1065
Gln Arg Leu Arg Ser Tyr Ser Ala Gly Glu Ala Ser Glu Val Ser
1070 1075 1080
Arg Asn Arg Gly Ala Ser Leu Leu Ala Arg Pro Gly His Ser Leu
1085 1090 1095
Val Ala Ala Ile Arg Ser Gln His Gln His Glu Ser Leu Pro Leu
1100 1105 1110
Ala Tyr Asn Asp Lys Ile Val Ala Phe Leu Arg Gln Pro Asn Ile
1115 1120 1125
Phe Glu Met Leu Gln Glu Arg Gln Pro Ser Leu Ala Arg Asn His
1130 1135 1140
Thr Leu Arg Glu Lys Ile His Tyr Ile Arg Thr Glu Gly Asn His
1145 1150 1155
Gly Leu Glu Lys Leu Ser Cys Asp Ala Asp Leu Val Ile Leu Leu
1160 1165 1170
Ser Leu Phe Glu Glu Glu Ile Met Ser Tyr Val Pro Leu Gln Ala
1175 1180 1185
Ala Phe His Pro Gly Tyr Ser Phe Ser Pro Arg Cys Ser Pro Cys
1190 1195 1200
Ser Ser Pro Gln Asn Ser Pro Gly Leu Gln Arg Ala Ser Ala Arg
1205 1210 1215
Ala Pro Ser Pro Tyr Arg Arg Asp Phe Glu Ala Lys Leu Arg Asn
1220 1225 1230
Phe Tyr Arg Lys Leu Glu Ala Lys Gly Phe Gly Gln Gly Pro Gly
1235 1240 1245
Lys Ile Lys Leu Ile Ile Arg Arg Asp His Leu Leu Glu Gly Thr
1250 1255 1260
Phe Asn Gln Val Met Ala Tyr Ser Arg Lys Glu Leu Gln Arg Asn
1265 1270 1275
Lys Leu Tyr Val Thr Phe Val Gly Glu Glu Gly Leu Asp Tyr Ser
1280 1285 1290
Gly Pro Ser Arg Glu Phe Phe Phe Leu Leu Ser Gln Glu Leu Phe
1295 1300 1305
Asn Pro Tyr Tyr Gly Leu Phe Glu Tyr Ser Ala Asn Asp Thr Tyr
1310 1315 1320
Thr Val Gln Ile Ser Pro Met Ser Ala Phe Val Glu Asn His Leu
1325 1330 1335
Glu Trp Phe Arg Phe Ser Gly Arg Ile Leu Gly Leu Ala Leu Ile
1340 1345 1350
His Gln Tyr Leu Leu Asp Ala Phe Phe Thr Arg Pro Phe Tyr Lys
1355 1360 1365
Ala Leu Leu Arg Leu Pro Cys Asp Leu Ser Asp Leu Glu Tyr Leu
1370 1375 1380
Asp Glu Glu Phe His Gln Ser Leu Gln Trp Met Lys Asp Asn Asn
1385 1390 1395
Ile Thr Asp Ile Leu Asp Leu Thr Phe Thr Val Asn Glu Glu Val
1400 1405 1410
Phe Gly Gln Val Thr Glu Arg Glu Leu Lys Ser Gly Gly Ala Asn
1415 1420 1425
Thr Gln Val Thr Glu Lys Asn Lys Lys Glu Tyr Ile Glu Arg Met
1430 1435 1440
Val Lys Trp Arg Val Glu Arg Gly Val Val Gln Gln Thr Glu Ala
1445 1450 1455
Leu Val Arg Gly Phe Tyr Glu Val Val Asp Ser Arg Leu Val Ser
1460 1465 1470
Val Phe Asp Ala Arg Glu Leu Glu Leu Val Ile Ala Gly Thr Ala
1475 1480 1485
Glu Ile Asp Leu Asn Asp Trp Arg Asn Asn Thr Glu Tyr Arg Gly
1490 1495 1500
Gly Tyr His Asp Gly His Leu Val Ile Arg Trp Phe Trp Ala Ala
1505 1510 1515
Val Glu Arg Phe Asn Asn Glu Gln Arg Leu Arg Leu Leu Gln Phe
1520 1525 1530
Val Thr Gly Thr Ser Ser Val Pro Tyr Glu Gly Phe Ala Ala Leu
1535 1540 1545
Arg Gly Ser Asn Gly Leu Arg Arg Phe Cys Ile Glu Lys Trp Gly
1550 1555 1560
Lys Ile Thr Ser Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu
1565 1570 1575
Asp Leu Pro Pro Tyr Pro Ser Tyr Ser Met Leu Tyr Glu Lys Leu
1580 1585 1590
Leu Thr Ala Val Glu Glu Thr Ser Thr Phe Gly Leu Glu
1595 1600 1605
<210> 14
<211> 1572
<212> PRT
<213> Homo Sapiens
<400> 14
Met Ala Ser Ser Ala Arg Glu His Leu Leu Phe Val Arg Arg Arg Asn
1 5 10 15
Pro Gln Met Arg Tyr Thr Leu Ser Pro Glu Asn Leu Gln Ser Leu Ala
20 25 30
Ala Gln Ser Ser Met Pro Glu Asn Met Thr Leu Gln Arg Ala Asn Ser
35 40 45
Asp Thr Asp Leu Val Thr Ser Glu Ser Arg Ser Ser Leu Thr Ala Ser
50 55 60
Met Tyr Glu Tyr Thr Leu Gly Gln Ala Gln Asn Leu Ile Ile Phe Trp
65 70 75 80
Asp Ile Lys Glu Glu Val Asp Pro Ser Asp Trp Ile Gly Leu Tyr His
85 90 95
Ile Asp Glu Asn Ser Pro Ala Asn Phe Trp Asp Ser Lys Asn Arg Gly
100 105 110
Val Thr Gly Thr Gln Lys Gly Gln Ile Val Trp Arg Ile Glu Pro Gly
115 120 125
Pro Tyr Phe Met Glu Pro Glu Ile Lys Ile Cys Phe Lys Tyr Tyr His
130 135 140
Gly Ile Ser Gly Ala Leu Arg Ala Thr Thr Pro Cys Ile Thr Val Lys
145 150 155 160
Asn Pro Ala Val Met Met Gly Ala Glu Gly Met Glu Gly Gly Ala Ser
165 170 175
Gly Asn Leu His Ser Arg Lys Leu Val Ser Phe Thr Leu Ser Asp Leu
180 185 190
Arg Ala Val Gly Leu Lys Lys Gly Met Phe Phe Asn Pro Asp Pro Tyr
195 200 205
Leu Lys Met Ser Ile Gln Pro Gly Lys Lys Ser Ser Phe Pro Thr Cys
210 215 220
Ala His His Gly Gln Glu Arg Arg Ser Thr Ile Ile Ser Asn Thr Thr
225 230 235 240
Asn Pro Ile Trp His Arg Glu Lys Tyr Ser Phe Phe Ala Leu Leu Thr
245 250 255
Asp Val Leu Glu Ile Glu Ile Lys Asp Lys Phe Ala Lys Ser Arg Pro
260 265 270
Ile Ile Lys Arg Phe Leu Gly Lys Leu Thr Ile Pro Val Gln Arg Leu
275 280 285
Leu Glu Arg Gln Ala Ile Gly Asp Gln Met Leu Ser Tyr Asn Leu Gly
290 295 300
Arg Arg Leu Pro Ala Asp His Val Ser Gly Tyr Leu Gln Phe Lys Val
305 310 315 320
Glu Val Thr Ser Ser Val His Glu Asp Ala Ser Pro Glu Ala Val Gly
325 330 335
Thr Ile Leu Gly Val Asn Ser Val Asn Gly Asp Leu Gly Ser Pro Ser
340 345 350
Asp Asp Glu Asp Met Pro Gly Ser His His Asp Ser Gln Val Cys Ser
355 360 365
Asn Gly Pro Val Ser Glu Asp Ser Ala Ala Asp Gly Thr Pro Lys His
370 375 380
Ser Phe Arg Thr Ser Ser Thr Leu Glu Ile Asp Thr Glu Glu Leu Thr
385 390 395 400
Ser Thr Ser Ser Arg Thr Ser Pro Pro Arg Gly Arg Gln Asp Ser Leu
405 410 415
Asn Asp Tyr Leu Asp Ala Ile Glu His Asn Gly His Ser Arg Pro Gly
420 425 430
Thr Ala Thr Cys Ser Glu Arg Ser Met Gly Ala Ser Pro Lys Leu Arg
435 440 445
Ser Ser Phe Pro Thr Asp Thr Arg Leu Asn Ala Met Leu His Ile Asp
450 455 460
Ser Asp Glu Glu Asp His Glu Phe Gln Gln Asp Leu Gly Tyr Pro Ser
465 470 475 480
Ser Leu Glu Glu Glu Gly Gly Leu Ile Met Phe Ser Arg Ala Ser Arg
485 490 495
Ala Asp Asp Gly Ser Leu Thr Ser Gln Thr Lys Leu Glu Asp Asn Pro
500 505 510
Val Glu Asn Glu Glu Ala Ser Thr His Glu Ala Ala Ser Phe Glu Asp
515 520 525
Lys Pro Glu Asn Leu Pro Glu Leu Ala Glu Ser Ser Leu Pro Ala Gly
530 535 540
Pro Ala Pro Glu Glu Gly Glu Gly Gly Pro Glu Pro Gln Pro Ser Ala
545 550 555 560
Asp Gln Gly Ser Ala Glu Leu Cys Gly Ser Gln Glu Val Asp Gln Pro
565 570 575
Thr Ser Gly Ala Asp Thr Gly Thr Ser Asp Ala Ser Gly Gly Ser Arg
580 585 590
Arg Ala Val Ser Glu Thr Glu Ser Leu Asp Gln Gly Ser Glu Pro Ser
595 600 605
Gln Val Ser Ser Glu Thr Glu Pro Ser Asp Pro Ala Arg Thr Glu Ser
610 615 620
Val Ser Glu Ala Ser Thr Arg Pro Glu Gly Glu Ser Asp Leu Glu Cys
625 630 635 640
Ala Asp Ser Ser Cys Asn Glu Ser Val Thr Thr Gln Leu Ser Ser Val
645 650 655
Asp Thr Arg Cys Ser Ser Leu Glu Ser Ala Arg Phe Pro Glu Thr Pro
660 665 670
Ala Phe Ser Ser Gln Glu Glu Glu Asp Gly Ala Cys Ala Ala Glu Pro
675 680 685
Thr Ser Ser Gly Pro Ala Glu Gly Ser Gln Glu Ser Val Cys Thr Ala
690 695 700
Gly Ser Leu Pro Val Val Gln Val Pro Ser Gly Glu Asp Glu Gly Pro
705 710 715 720
Gly Ala Glu Ser Ala Thr Val Pro Asp Gln Glu Glu Leu Gly Glu Val
725 730 735
Trp Gln Arg Arg Gly Ser Leu Glu Gly Ala Ala Ala Ala Ala Glu Ser
740 745 750
Pro Pro Gln Glu Glu Gly Ser Ala Gly Glu Ala Gln Gly Thr Cys Glu
755 760 765
Gly Ala Thr Ala Gln Glu Glu Gly Ala Thr Gly Gly Ser Gln Ala Asn
770 775 780
Gly His Gln Pro Leu Arg Ser Leu Pro Ser Val Arg Gln Asp Val Ser
785 790 795 800
Arg Tyr Gln Arg Val Asp Glu Ala Leu Pro Pro Asn Trp Glu Ala Arg
805 810 815
Ile Asp Ser His Gly Arg Ile Phe Tyr Val Asp His Val Asn Arg Thr
820 825 830
Thr Thr Trp Gln Arg Pro Thr Ala Pro Pro Ala Pro Gln Val Leu Gln
835 840 845
Arg Ser Asn Ser Ile Gln Gln Met Glu Gln Leu Asn Arg Arg Tyr Gln
850 855 860
Ser Ile Arg Arg Thr Met Thr Asn Glu Arg Pro Glu Glu Asn Thr Asn
865 870 875 880
Ala Ile Asp Gly Ala Gly Glu Glu Ala Asp Phe His Gln Ala Ser Ala
885 890 895
Asp Phe Arg Arg Glu Asn Ile Leu Pro His Ser Thr Ser Arg Ser Arg
900 905 910
Ile Thr Leu Leu Leu Gln Ser Pro Pro Val Lys Phe Leu Ile Ser Pro
915 920 925
Glu Phe Phe Thr Val Leu His Ser Asn Pro Ser Ala Tyr Arg Met Phe
930 935 940
Thr Asn Asn Thr Cys Leu Lys His Met Ile Thr Lys Val Arg Arg Asp
945 950 955 960
Thr His His Phe Glu Arg Tyr Gln His Asn Arg Asp Leu Val Gly Phe
965 970 975
Leu Asn Met Phe Ala Asn Lys Gln Leu Glu Leu Pro Arg Gly Trp Glu
980 985 990
Met Lys His Asp His Gln Gly Lys Ala Phe Phe Val Asp His Asn Ser
995 1000 1005
Arg Thr Thr Thr Phe Ile Asp Pro Arg Leu Pro Leu Gln Ser Ser
1010 1015 1020
Arg Pro Thr Ser Ala Leu Val His Arg Gln His Leu Thr Arg Gln
1025 1030 1035
Arg Ser His Ser Ala Gly Glu Val Gly Glu Asp Ser Arg His Ala
1040 1045 1050
Gly Pro Pro Val Leu Pro Arg Pro Ser Ser Thr Phe Asn Thr Val
1055 1060 1065
Ser Arg Pro Gln Tyr Gln Asp Met Val Pro Val Ala Tyr Asn Asp
1070 1075 1080
Lys Ile Val Ala Phe Leu Arg Gln Pro Asn Ile Phe Glu Ile Leu
1085 1090 1095
Gln Glu Arg Gln Pro Asp Leu Thr Arg Asn His Ser Leu Arg Glu
1100 1105 1110
Lys Ile Gln Phe Ile Arg Thr Glu Gly Thr Pro Gly Leu Val Arg
1115 1120 1125
Leu Ser Ser Asp Ala Asp Leu Val Met Leu Leu Ser Leu Phe Glu
1130 1135 1140
Glu Glu Ile Met Ser Tyr Val Pro Pro His Ala Leu Leu His Pro
1145 1150 1155
Ser Tyr Cys Gln Ser Pro Arg Gly Ser Pro Val Ser Ser Pro Gln
1160 1165 1170
Asn Ser Pro Gly Thr Gln Arg Ala Asn Ala Arg Ala Pro Ala Pro
1175 1180 1185
Tyr Lys Arg Asp Phe Glu Ala Lys Leu Arg Asn Phe Tyr Arg Lys
1190 1195 1200
Leu Glu Thr Lys Gly Tyr Gly Gln Gly Pro Gly Lys Leu Lys Leu
1205 1210 1215
Ile Ile Arg Arg Asp His Leu Leu Glu Asp Ala Phe Asn Gln Ile
1220 1225 1230
Met Gly Tyr Ser Arg Lys Asp Leu Gln Arg Asn Lys Leu Tyr Val
1235 1240 1245
Thr Phe Val Gly Glu Glu Gly Leu Asp Tyr Ser Gly Pro Ser Arg
1250 1255 1260
Glu Phe Phe Phe Leu Val Ser Arg Glu Leu Phe Asn Pro Tyr Tyr
1265 1270 1275
Gly Leu Phe Glu Tyr Ser Ala Asn Asp Thr Tyr Thr Val Gln Ile
1280 1285 1290
Ser Pro Met Ser Ala Phe Val Asp Asn His His Glu Trp Phe Arg
1295 1300 1305
Phe Ser Gly Arg Ile Leu Gly Leu Ala Leu Ile His Gln Tyr Leu
1310 1315 1320
Leu Asp Ala Phe Phe Thr Arg Pro Phe Tyr Lys Ala Leu Leu Arg
1325 1330 1335
Ile Leu Cys Asp Leu Ser Asp Leu Glu Tyr Leu Asp Glu Glu Phe
1340 1345 1350
His Gln Ser Leu Gln Trp Met Lys Asp Asn Asp Ile His Asp Ile
1355 1360 1365
Leu Asp Leu Thr Phe Thr Val Asn Glu Glu Val Phe Gly Gln Ile
1370 1375 1380
Thr Glu Arg Glu Leu Lys Pro Gly Gly Ala Asn Ile Pro Val Thr
1385 1390 1395
Glu Lys Asn Lys Lys Glu Tyr Ile Glu Arg Met Val Lys Trp Arg
1400 1405 1410
Ile Glu Arg Gly Val Val Gln Gln Thr Glu Ser Leu Val Arg Gly
1415 1420 1425
Phe Tyr Glu Val Val Asp Ala Arg Leu Val Ser Val Phe Asp Ala
1430 1435 1440
Arg Glu Leu Glu Leu Val Ile Ala Gly Thr Ala Glu Ile Asp Leu
1445 1450 1455
Ser Asp Trp Arg Asn Asn Thr Glu Tyr Arg Gly Gly Tyr His Asp
1460 1465 1470
Asn His Ile Val Ile Arg Trp Phe Trp Ala Ala Val Glu Arg Phe
1475 1480 1485
Asn Asn Glu Gln Arg Leu Arg Leu Leu Gln Phe Val Thr Gly Thr
1490 1495 1500
Ser Ser Ile Pro Tyr Glu Gly Phe Ala Ser Leu Arg Gly Ser Asn
1505 1510 1515
Gly Pro Arg Arg Phe Cys Val Glu Lys Trp Gly Lys Ile Thr Ala
1520 1525 1530
Leu Pro Arg Ala His Thr Cys Phe Asn Arg Leu Asp Leu Pro Pro
1535 1540 1545
Tyr Pro Ser Phe Ser Met Leu Tyr Glu Lys Leu Leu Thr Ala Val
1550 1555 1560
Glu Glu Thr Ser Thr Phe Gly Leu Glu
1565 1570
<210> 15
<211> 433
<212> PRT
<213> Homo Sapiens
<400> 15
Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val
1 5 10 15
Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu
20 25 30
Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser
35 40 45
Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu
50 55 60
Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro
65 70 75 80
Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala
85 90 95
Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg
100 105 110
Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu
115 120 125
Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile
130 135 140
Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu
145 150 155 160
Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly
165 170 175
Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln
180 185 190
Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val
195 200 205
Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu
210 215 220
Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu
225 230 235 240
Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser
245 250 255
Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu
260 265 270
Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His
275 280 285
Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro
290 295 300
Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Glu
305 310 315 320
Ala Ala Ala Gly Gly Pro His Phe Leu Asp Pro Val Phe Leu Ser Thr
325 330 335
Lys Ser His Ser Gln Arg Gln Pro Leu Leu Ala Thr Leu Ser Ser Val
340 345 350
Pro Gly Ala Pro Glu Pro Cys Pro Gln Asp Gly Ser Pro Ala Ser His
355 360 365
Pro Leu His Pro Pro Leu Cys Ile Ser Thr Gly Ala Thr Val Pro Tyr
370 375 380
Phe Ala Glu Gly Ser Gly Gly Pro Val Pro Thr Thr Ser Thr Leu Ile
385 390 395 400
Leu Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro
405 410 415
Ser Tyr Glu Gln Ser Cys Gly Gly Val Glu Pro Ser Leu Thr Pro Glu
420 425 430
Ser
<210> 16
<211> 434
<212> PRT
<213> Mus musculus
<400> 16
Met Gly Arg Val Gln Leu Phe Glu Ile Arg Leu Ser Gln Gly Arg Val
1 5 10 15
Val Tyr Gly Pro Gly Glu Pro Leu Ala Gly Thr Val His Leu Arg Leu
20 25 30
Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Met Gly Ser
35 40 45
Cys Gly Val Ser Thr Lys Ala Asn Asp Gly Ala Trp Val Val Glu Glu
50 55 60
Ser Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro
65 70 75 80
Ala Gly Glu His Asn Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala
85 90 95
Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg
100 105 110
Ala Ser Ile Asp Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu
115 120 125
Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile
130 135 140
Glu Gln Pro Asn Val Ala Ser Thr Thr Lys Lys Phe Ser Tyr Lys Leu
145 150 155 160
Val Lys Thr Gly Asn Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly
165 170 175
Tyr Val Val Gly Gln Val Leu Arg Leu Gln Ala Asp Ile Glu Asn Gln
180 185 190
Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val
195 200 205
Ser Tyr Lys Ala Lys Arg Trp Ile Tyr Asp Val Arg Thr Ile Ala Glu
210 215 220
Val Glu Gly Thr Gly Val Lys Ala Trp Arg Arg Ala Gln Trp Gln Glu
225 230 235 240
Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser
245 250 255
Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Met Lys Ala Pro Glu
260 265 270
Ala Thr Val Thr Leu Pro Leu Phe Val Gly Asn Ile Ala Val Asn Gln
275 280 285
Thr Pro Leu Ser Pro Cys Pro Gly Arg Glu Ser Ser Pro Gly Thr Leu
290 295 300
Ser Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Val
305 310 315 320
Ala Ser Gly Pro His Phe Ser Asp Pro Val Ser Leu Ser Thr Lys Ser
325 330 335
His Ser Gln Gln Gln Pro Leu Ser Ala Pro Leu Gly Ser Val Ser Val
340 345 350
Thr Thr Thr Glu Pro Trp Val Gln Val Gly Ser Pro Ala Arg His Ser
355 360 365
Leu His Pro Pro Leu Cys Ile Ser Ile Gly Ala Thr Val Pro Tyr Phe
370 375 380
Ala Glu Gly Ser Ala Gly Pro Val Pro Thr Thr Ser Ala Leu Ile Leu
385 390 395 400
Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro Ser
405 410 415
Tyr Glu Gln Ser Cys Gly Ala Ala Gly Thr Asp Leu Gly Leu Ile Pro
420 425 430
Gly Ser
<210> 17
<211> 433
<212> PRT
<213> Mus musculus
<400> 17
Met Gly Arg Val Gln Leu Phe Glu Ile Arg Leu Ser Gln Gly Arg Val
1 5 10 15
Val Tyr Gly Pro Gly Glu Pro Leu Ala Gly Thr Val His Leu Arg Leu
20 25 30
Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Met Gly Ser
35 40 45
Cys Gly Val Ser Thr Lys Ala Asn Asp Gly Ala Trp Val Val Glu Glu
50 55 60
Ser Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro
65 70 75 80
Ala Gly Glu His Asn Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala
85 90 95
Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg
100 105 110
Ala Ser Ile Asp Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu
115 120 125
Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile
130 135 140
Glu Gln Pro Asn Val Ala Ser Thr Thr Lys Lys Phe Ser Tyr Lys Leu
145 150 155 160
Val Lys Thr Gly Asn Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly
165 170 175
Tyr Val Val Gly Gln Val Leu Arg Leu Gln Ala Asp Ile Glu Asn Gln
180 185 190
Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Val Ser
195 200 205
Tyr Lys Ala Lys Arg Trp Ile Tyr Asp Val Arg Thr Ile Ala Glu Val
210 215 220
Glu Gly Thr Gly Val Lys Ala Trp Arg Arg Ala Gln Trp Gln Glu Gln
225 230 235 240
Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser Leu
245 250 255
Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Met Lys Ala Pro Glu Ala
260 265 270
Thr Val Thr Leu Pro Leu Phe Val Gly Asn Ile Ala Val Asn Gln Thr
275 280 285
Pro Leu Ser Pro Cys Pro Gly Arg Glu Ser Ser Pro Gly Thr Leu Ser
290 295 300
Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Val Ala
305 310 315 320
Ser Gly Pro His Phe Ser Asp Pro Val Ser Leu Ser Thr Lys Ser His
325 330 335
Ser Gln Gln Gln Pro Leu Ser Ala Pro Leu Gly Ser Val Ser Val Thr
340 345 350
Thr Thr Glu Pro Trp Val Gln Val Gly Ser Pro Ala Arg His Ser Leu
355 360 365
His Pro Pro Leu Cys Ile Ser Ile Gly Ala Thr Val Pro Tyr Phe Ala
370 375 380
Glu Gly Ser Ala Gly Pro Val Pro Thr Thr Ser Ala Leu Ile Leu Pro
385 390 395 400
Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro Ser Tyr
405 410 415
Glu Gln Ser Cys Gly Ala Ala Gly Thr Asp Leu Gly Leu Ile Pro Gly
420 425 430
Ser
<210> 18
<211> 65
<212> PRT
<213> Homo Sapiens
<400> 18
Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg Val
1 5 10 15
Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro Glu
20 25 30
Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg Ile
35 40 45
Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr
50 55 60
Leu
65
<210> 19
<211> 185
<212> PRT
<213> Homo Sapiens
<400> 19
Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg Val
1 5 10 15
Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro Glu
20 25 30
Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg Ile
35 40 45
Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr
50 55 60
Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp Gln Leu Gln Arg Ser Gln
65 70 75 80
Leu Gln Gly Ala Met Gln Gln Phe Asn Gln Arg Phe Ile Tyr Gly Asn
85 90 95
Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys Glu Phe Asp Pro Leu Gly
100 105 110
Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg Val
115 120 125
Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro Arg
130 135 140
Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu Pro Glu Gly Trp Glu Met
145 150 155 160
Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe Val Asp His Asn Arg Arg
165 170 175
Thr Thr Thr Tyr Ile Asp Pro Arg Thr
180 185
<210> 20
<211> 390
<212> PRT
<213> Homo Sapiens
<400> 20
Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Val Ser Lys Tyr Lys
1 5 10 15
Tyr Arg Asp Leu Thr Val Arg Glu Thr Val Asn Val Ile Thr Leu Tyr
20 25 30
Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser
35 40 45
Ser Arg Glu Leu Met Asn Leu Thr Gly Thr Ile Pro Val Pro Tyr Arg
50 55 60
Gly Asn Thr Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr
65 70 75 80
Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr
85 90 95
Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro
100 105 110
Tyr Leu His Glu Trp Lys His Pro Gln Ser Asp Leu Leu Gly Leu Ile
115 120 125
Gln Val Met Ile Val Val Phe Gly Asp Glu Pro Pro Val Phe Ser Arg
130 135 140
Pro Ile Ser Ala Ser Tyr Pro Pro Tyr Gln Ala Thr Gly Pro Pro Asn
145 150 155 160
Thr Ser Tyr Met Pro Gly Met Pro Gly Gly Ile Ser Pro Tyr Pro Ser
165 170 175
Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro Pro
180 185 190
Gly Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln Pro
195 200 205
Pro Val Thr Thr Val Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu Asp
210 215 220
Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg Trp
225 230 235 240
Arg Met Lys Glu Glu Met Asp Arg Ala Gln Ala Glu Leu Asn Ala Leu
245 250 255
Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu Glu
260 265 270
Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn Ile
275 280 285
Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu Lys
290 295 300
Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile Pro
305 310 315 320
Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu Asn
325 330 335
Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg Gly
340 345 350
Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser Arg
355 360 365
Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr Ala
370 375 380
Gly Leu Ser Asp Leu Tyr
385 390
<210> 21
<211> 391
<212> PRT
<213> Mus musculus
<400> 21
Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Met Ser Lys Tyr Lys
1 5 10 15
Tyr Arg Asp Leu Thr Val Arg Gln Thr Val Asn Val Ile Ala Met Tyr
20 25 30
Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser
35 40 45
Ser Arg Glu Leu Val Asn Leu Thr Gly Thr Ile Pro Val Arg Tyr Arg
50 55 60
Gly Asn Ile Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr
65 70 75 80
Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr
85 90 95
Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro
100 105 110
Tyr Leu His Asp Trp Lys His Pro Arg Ser Glu Leu Leu Glu Leu Ile
115 120 125
Gln Ile Met Ile Val Ile Phe Gly Glu Glu Pro Pro Val Phe Ser Arg
130 135 140
Pro Thr Val Ser Ala Ser Tyr Pro Pro Tyr Thr Ala Thr Gly Pro Pro
145 150 155 160
Asn Thr Ser Tyr Met Pro Gly Met Pro Ser Gly Ile Ser Ala Tyr Pro
165 170 175
Ser Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro
180 185 190
Pro Ala Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln
195 200 205
Pro Pro Val Thr Thr Val Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu
210 215 220
Asp Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg
225 230 235 240
Trp Arg Met Lys Glu Glu Met Asp Gly Ala Gln Ala Glu Leu Asn Ala
245 250 255
Leu Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu
260 265 270
Glu Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn
275 280 285
Ile Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu
290 295 300
Lys Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile
305 310 315 320
Pro Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu
325 330 335
Asn Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg
340 345 350
Gly Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser
355 360 365
Arg Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr
370 375 380
Ala Gly Leu Ser Asp Leu Tyr
385 390
<210> 22
<211> 391
<212> PRT
<213> Rattus norvegicus
<400> 22
Met Ala Val Ser Glu Ser Gln Leu Lys Lys Met Met Ser Lys Tyr Lys
1 5 10 15
Tyr Arg Asp Leu Thr Val Arg Gln Thr Val Asn Val Ile Ala Met Tyr
20 25 30
Lys Asp Leu Lys Pro Val Leu Asp Ser Tyr Val Phe Asn Asp Gly Ser
35 40 45
Ser Arg Glu Leu Val Asn Leu Thr Gly Thr Ile Pro Val Arg Tyr Arg
50 55 60
Gly Asn Ile Tyr Asn Ile Pro Ile Cys Leu Trp Leu Leu Asp Thr Tyr
65 70 75 80
Pro Tyr Asn Pro Pro Ile Cys Phe Val Lys Pro Thr Ser Ser Met Thr
85 90 95
Ile Lys Thr Gly Lys His Val Asp Ala Asn Gly Lys Ile Tyr Leu Pro
100 105 110
Tyr Leu His Asp Trp Lys His Pro Arg Ser Glu Leu Leu Glu Leu Ile
115 120 125
Gln Ile Met Ile Val Ile Phe Gly Glu Glu Pro Pro Val Phe Ser Arg
130 135 140
Pro Thr Val Ser Ala Ser Tyr Pro Pro Tyr Thr Ala Ala Gly Pro Pro
145 150 155 160
Asn Thr Ser Tyr Leu Pro Ser Met Pro Ser Gly Ile Ser Ala Tyr Pro
165 170 175
Ser Gly Tyr Pro Pro Asn Pro Ser Gly Tyr Pro Gly Cys Pro Tyr Pro
180 185 190
Pro Ala Gly Pro Tyr Pro Ala Thr Thr Ser Ser Gln Tyr Pro Ser Gln
195 200 205
Pro Pro Val Thr Thr Ala Gly Pro Ser Arg Asp Gly Thr Ile Ser Glu
210 215 220
Asp Thr Ile Arg Ala Ser Leu Ile Ser Ala Val Ser Asp Lys Leu Arg
225 230 235 240
Trp Arg Met Lys Glu Glu Met Asp Gly Ala Gln Ala Glu Leu Asn Ala
245 250 255
Leu Lys Arg Thr Glu Glu Asp Leu Lys Lys Gly His Gln Lys Leu Glu
260 265 270
Glu Met Val Thr Arg Leu Asp Gln Glu Val Ala Glu Val Asp Lys Asn
275 280 285
Ile Glu Leu Leu Lys Lys Lys Asp Glu Glu Leu Ser Ser Ala Leu Glu
290 295 300
Lys Met Glu Asn Gln Ser Glu Asn Asn Asp Ile Asp Glu Val Ile Ile
305 310 315 320
Pro Thr Ala Pro Leu Tyr Lys Gln Ile Leu Asn Leu Tyr Ala Glu Glu
325 330 335
Asn Ala Ile Glu Asp Thr Ile Phe Tyr Leu Gly Glu Ala Leu Arg Arg
340 345 350
Gly Val Ile Asp Leu Asp Val Phe Leu Lys His Val Arg Leu Leu Ser
355 360 365
Arg Lys Gln Phe Gln Leu Arg Ala Leu Met Gln Lys Ala Arg Lys Thr
370 375 380
Ala Gly Leu Ser Asp Leu Tyr
385 390
<210> 23
<211> 3475
<212> DNA
<213> Homo Sapiens
<400> 23
gaattcgcgg ccgcgtcgac cgcttctgtg gccacggcag atgaaacaga aaggctaaag 60
agggctggag tcaggggact tctcttccac cagcttcacg gtgatgatat ggcatctgcc 120
agctctagcc gggcaggagt ggccctgcct tttgagaagt ctcagctcac tttgaaagtg 180
gtgtccgcaa agcccaaggt gcataatcgt caacctcgaa ttaactccta cgtggaggtg 240
gcggtggatg gactccccag tgagaccaag aagactggga agcgcattgg gagctctgag 300
cttctctgga atgagatcat cattttgaat gtcacggcac agagtcattt agatttaaag 360
gtctggagct gccatacctt gagaaatgaa ctgctaggca ccgcatctgt caacctctcc 420
aacgtcttga agaacaatgg gggcaaaatg gagaacatgc agctgaccct gaacctgcag 480
acggagaaca aaggcagcgt tgtctcaggc ggaaaactga caattttcct ggacgggcca 540
actgttgatc tgggaaatgt gcctaatggc agtgccctga cagatggatc acagctgcct 600
tcgagagact ccagtggaac agcagtagct ccagagaacc ggcaccagcc ccccagcaca 660
aactgctttg gtggaagatc ccggacgcac agacattcgg gtgcttcagc cagaacaacc 720
ccagcaaccg gcgagcaaag ccccggtgct cggagccggc accgccagcc cgtcaagaac 780
tcaggccaca gtggcttggc caatggcaca gtgaatgatg aacccacaac agccactgat 840
cccgaagaac cttccgttgt tggtgtgacg tccccacctg ctgcaccctt gagtgtgacc 900
ccgaatccca acacgacttc tctccctgcc ccagccacac cggctgaagg agaggaaccc 960
agcacttcgg gtacacagca gctcccagcg gctgcccagg cccccgacgc tctgcctgct 1020
ggatgggaac agcgagagct gcccaacgga cgtgtctatt atgttgacca caataccaag 1080
accaccacct gggagcggcc ccttcctcca ggctgggaaa aacgcacaga tccccgaggc 1140
aggttttact atgtggatca caatactcgg accaccacct ggcagcgtcc gaccgcggag 1200
tacgtgcgca actatgagca gtggcagtcg cagcggaatc agctccaggg ggccatgcag 1260
cacttcagcc aaagattcct ataccagttt tggagtgctt cgactgacca tgatcccctg 1320
ggccccctcc ctcctggttg ggagaaaaga caggacaatg gacgggtgta ttacgtgaac 1380
cataacactc gcacgaccca gtgggaggat ccccggaccc aggggatgat ccaggaacca 1440
gctttgcccc caggatggga gatgaaatac accagcgagg gggtgcgata ctttgtggac 1500
cacaataccc gcaccaccac ctttaaggat cctcgcccgg ggtttgagtc ggggacgaag 1560
caaggttccc ctggtgctta tgaccgcagt tttcggtgga agtatcacca gttccgtttc 1620
ctctgccatt caaatgccct acctagccac gtgaagatca gcgtttccag gcagacgctt 1680
ttcgaagatt ccttccaaca gatcatgaac atgaaaccct atgacctgcg ccgccggctt 1740
tacatcatca tgcgtggcga ggagggcctg gactatgggg gcatcgccag agagtggttt 1800
ttcctcctgt ctcacgaggt gctcaaccct atgtattgtt tatttgaata tgccggaaag 1860
aacaattact gcctgcagat caaccccgcc tcctccatca acccggacca cctcacctac 1920
tttcgcttta taggcagatt catcgccatg gcgctgtacc atggaaagtt catcgacacg 1980
ggcttcaccc tccctttcta caagcggatg ctcaataaga gaccaaccct gaaagacctg 2040
gagtccattg accctgagtt ctacaactcc attgtctgga tcaaagagaa caacctggaa 2100
gaatgtggcc tggagctgta cttcatccag gacatggaga tactgggcaa ggtgacgacc 2160
cacgagctga aggagggcgg cgagagcatc cgggtcacgg aggagaacaa ggaagagtac 2220
atcatgctgc tgactgactg gcgtttcacc cgaggcgtgg aagagcagac caaagccttc 2280
ctggatggct tcaacgaggt ggccccgctg gagtggctgc gctactttga cgagaaagag 2340
ctggagctga tgctgtgcgg catgcaggag atagacatga gcgactggca gaagagcacc 2400
atctaccggc actacaccaa gaacagcaag cagatccagt ggttctggca ggtggtgaag 2460
gagatggaca acgagaagag gatccggctg ctgcagtttg tcaccggtac ctgccgcctg 2520
cccgtcgggg gatttgccga actcatcggt agcaacggac cacagaagtt ttgcattgac 2580
aaagttggca aggaaacctg gctgcccaga agccacacct gcttcaaccg tctggatctt 2640
ccaccctaca agagctacga acagctgaga gagaagctgc tgtatgccat tgaggagacc 2700
gagggctttg gacaggagta accgaggccg cccctcccac gccccccagc gcacatgtag 2760
tcctgagtcc tccctgcctg agaggccact ggccccgcag cccttgggag gcccccgtgg 2820
atgtggccct gtgtgggacc acactgtcat ctcgctgctg gcagaaaagc ctgatcccag 2880
gaggccctgc agttcccccg acccgcggat ggcagtctgg aataaagccc cctagttgcc 2940
tttggcccca cctttgcaaa gttccagagg gctgaccctc tctgcaaaac tctcccctgt 3000
cctctagacc ccaccctggg tgtatgtgag tgtgcaaggg aaggtgttgc atccccaggg 3060
gctgccgcag aggccggaga cctcctggac tagttcggcg aggagactgg ccactggggg 3120
tggctgttcg ggactgagag cgccaagggt ctttgccagc aaaggaggtt ctgcctgtaa 3180
ttgagcctct ctgatgatgg agatgaagtg aaggtctgag ggacgggccc tggggctagg 3240
ccatctctgc ctgcctccct agcaggcgcc agcggtggag gctgagtcgc aggacacatg 3300
ccggccagtt aattcattct cagcaaatga aggtttgtct aagctgcctg ggtatccacg 3360
ggacaaaaac agcaaactcc ctccagactt tgtccatgtt ataaacttga aagttggttg 3420
ttgtttgtta ggtttgccag gtttttttgt ttacgcctgc tgtcactttc ctgtc 3475
<210> 24
<211> 3475
<212> DNA
<213> Homo Sapiens
<400> 24
gaattcgcgg ccgcgtcgac cgcttctgtg gccacggcag atgaaacaga aaggctaaag 60
agggctggag tcaggggact tctcttccac cagcttcacg gtgatgatat ggcatctgcc 120
agctctagcc gggcaggagt ggccctgcct tttgagaagt ctcagctcac tttgaaagtg 180
gtgtccgcaa agcccaaggt gcataatcgt caacctcgaa ttaactccta cgtggaggtg 240
gcggtggatg gactccccag tgagaccaag aagactggga agcgcattgg gagctctgag 300
cttctctgga atgagatcat cattttgaat gtcacggcac agagtcattt agatttaaag 360
gtctggagct gccatacctt gagaaatgaa ctgctaggca ccgcatctgt caacctctcc 420
aacgtcttga agaacaatgg gggcaaaatg gagaacatgc agctgaccct gaacctgcag 480
acggagaaca aaggcagcgt tgtctcaggc ggaaaactga caattttcct ggacgggcca 540
actgttgatc tgggaaatgt gcctaatggc agtgccctga cagatggatc acagctgcct 600
tcgagagact ccagtggaac agcagtagct ccagagaacc ggcaccagcc ccccagcaca 660
aactgctttg gtggaagatc ccggacgcac agacattcgg gtgcttcagc cagaacaacc 720
ccagcaaccg gcgagcaaag ccccggtgct cggagccggc accgccagcc cgtcaagaac 780
tcaggccaca gtggcttggc caatggcaca gtgaatgatg aacccacaac agccactgat 840
cccgaagaac cttccgttgt tggtgtgacg tccccacctg ctgcaccctt gagtgtgacc 900
ccgaatccca acacgacttc tctccctgcc ccagccacac cggctgaagg agaggaaccc 960
agcacttcgg gtacacagca gctcccagcg gctgcccagg cccccgacgc tctgcctgct 1020
ggatgggaac agcgagagct gcccaacgga cgtgtctatt atgttgacca caataccaag 1080
accaccacct gggagcggcc ccttcctcca ggctgggaaa aacgcacaga tccccgaggc 1140
aggttttact atgtggatca caatactcgg accaccacct ggcagcgtcc gaccgcggag 1200
tacgtgcgca actatgagca gtggcagtcg cagcggaatc agctccaggg ggccatgcag 1260
cacttcagcc aaagattcct ataccagttt tggagtgctt cgactgacca tgatcccctg 1320
ggccccctcc ctcctggttg ggagaaaaga caggacaatg gacgggtgta ttacgtgaac 1380
cataacactc gcacgaccca gtgggaggat ccccggaccc aggggatgat ccaggaacca 1440
gctttgcccc caggatggga gatgaaatac accagcgagg gggtgcgata ctttgtggac 1500
cacaataccc gcaccaccac ctttaaggat cctcgcccgg ggtttgagtc ggggacgaag 1560
caaggttccc ctggtgctta tgaccgcagt tttcggtgga agtatcacca gttccgtttc 1620
ctctgccatt caaatgccct acctagccac gtgaagatca gcgtttccag gcagacgctt 1680
ttcgaagatt ccttccaaca gatcatgaac atgaaaccct atgacctgcg ccgccggctt 1740
tacatcatca tgcgtggcga ggagggcctg gactatgggg gcatcgccag agagtggttt 1800
ttcctcctgt ctcacgaggt gctcaaccct atgtattgtt tatttgaata tgccggaaag 1860
aacaattact gcctgcagat caaccccgcc tcctccatca acccggacca cctcacctac 1920
tttcgcttta taggcagatt catcgccatg gcgctgtacc atggaaagtt catcgacacg 1980
ggcttcaccc tccctttcta caagcggatg ctcaataaga gaccaaccct gaaagacctg 2040
gagtccattg accctgagtt ctacaactcc attgtctgga tcaaagagaa caacctggaa 2100
gaatgtggcc tggagctgta cttcatccag gacatggaga tactgggcaa ggtgacgacc 2160
cacgagctga aggagggcgg cgagagcatc cgggtcacgg aggagaacaa ggaagagtac 2220
atcatgctgc tgactgactg gcgtttcacc cgaggcgtgg aagagcagac caaagccttc 2280
ctggatggct tcaacgaggt ggccccgctg gagtggctgc gctactttga cgagaaagag 2340
ctggagctga tgctgtgcgg catgcaggag atagacatga gcgactggca gaagagcacc 2400
atctaccggc actacaccaa gaacagcaag cagatccagt ggttctggca ggtggtgaag 2460
gagatggaca acgagaagag gatccggctg ctgcagtttg tcaccggtac ctgccgcctg 2520
cccgtcgggg gatttgccga actcatcggt agcaacggac cacagaagtt ttgcattgac 2580
aaagttggca aggaaacctg gctgcccaga agccacacct gcttcaaccg tctggatctt 2640
ccaccctaca agagctacga acagctgaga gagaagctgc tgtatgccat tgaggagacc 2700
gagggctttg gacaggagta accgaggccg cccctcccac gccccccagc gcacatgtag 2760
tcctgagtcc tccctgcctg agaggccact ggccccgcag cccttgggag gcccccgtgg 2820
atgtggccct gtgtgggacc acactgtcat ctcgctgctg gcagaaaagc ctgatcccag 2880
gaggccctgc agttcccccg acccgcggat ggcagtctgg aataaagccc cctagttgcc 2940
tttggcccca cctttgcaaa gttccagagg gctgaccctc tctgcaaaac tctcccctgt 3000
cctctagacc ccaccctggg tgtatgtgag tgtgcaaggg aaggtgttgc atccccaggg 3060
gctgccgcag aggccggaga cctcctggac tagttcggcg aggagactgg ccactggggg 3120
tggctgttcg ggactgagag cgccaagggt ctttgccagc aaaggaggtt ctgcctgtaa 3180
ttgagcctct ctgatgatgg agatgaagtg aaggtctgag ggacgggccc tggggctagg 3240
ccatctctgc ctgcctccct agcaggcgcc agcggtggag gctgagtcgc aggacacatg 3300
ccggccagtt aattcattct cagcaaatga aggtttgtct aagctgcctg ggtatccacg 3360
ggacaaaaac agcaaactcc ctccagactt tgtccatgtt ataaacttga aagttggttg 3420
ttgtttgtta ggtttgccag gtttttttgt ttacgcctgc tgtcactttc ctgtc 3475
<210> 25
<211> 2914
<212> DNA
<213> Homo Sapiens
<400> 25
acagttgcct gccctgggcg ggggcgagcg cgtccggttt gctggaagcg ttcggaaatg 60
gcaacttgcg cggtggaggt gttcgggctc ctggaggacg aggaaaattc acgaattgtg 120
agagtaagag ttatagccgg aataggcctt gccaagaagg atatattggg agctagtgat 180
ccttacgtga gagtgacgtt atatgaccca atgaatggag ttcttacaag tgtgcaaaca 240
aaaaccatta aaaagagttt gaatccaaag tggaatgaag aaatattatt cagagttcat 300
cctcagcagc accggcttct ttttgaagtg tttgacgaaa accgattgac aagagatgat 360
ttcctaggtc aagtggatgt tccactttat ccattaccga cagaaaatcc aagattggag 420
agaccatata catttaagga ttttgttctt catccaagaa gtcacaaatc aagagttaaa 480
ggttatctga gactaaaaat gacttattta cctaaaacca gtggctcaga agatgataat 540
gcagaacagg ctgaggaatt agagcctggc tgggttgttt tggaccaacc agatgctgct 600
tgccatttgc agcaacaaca agaaccttct cctctacctc cagggtggga agagaggcag 660
gatatccttg gaaggaccta ttatgtaaac catgaatcta gaagaacaca gtggaaaaga 720
ccaacccctc aggacaacct aacagatgct gagaatggca acattcaact gcaagcacaa 780
cgtgcattta ccaccaggcg gcagatatcc gaggaaacag aaagtgttga caaccaagag 840
tcttccgaga actgggaaat tataagagaa gatgaagcca ccatgtatag cagccaggcc 900
ttcccatcac ctccaccgtc aagtaacttg gatgttccaa ctcatcttgc agaagaattg 960
aatgccagac tcaccatttt tggaaattca gccgtgagcc agccagcatc gagctcaaat 1020
cattccagca gaagaggcag cttacaagcc tatacttttg aggaacaacc tacacttcct 1080
gtgcttttgc ctacttcatc tggattacca ccaggttggg aagaaaaaca agatgaaaga 1140
ggaagatcat attatgtaga tcacaattcc agaacgacta cttggacaaa gcccactgta 1200
caggccacag tggagaccag tcagctgacc tcaagccaga gttctgcagg ccctcaatca 1260
caagcctcca ccagtgattc aggccagcag gtgacccagc catctgaaat tgagcaagga 1320
ttccttccta aaggctggga agtccggcat gcaccaaatg ggaggccttt ctttattgac 1380
cacaacacta aaaccaccac ctgggaagat ccaagattga aaattccagc ccatctgaga 1440
ggaaagacat cacttgatac ttccaatgat ctagggcctt tacctccagg atgggaagag 1500
agaactcaca cagatggaag aatcttctac ataaatcaca atataaaaag aacacaatgg 1560
gaagatcctc ggttggagaa tgtagcaata actggaccag cagtgcccta ctccagggat 1620
tacaaaagaa agtatgagtt cttccgaaga aagttgaaga agcagaatga cattccaaac 1680
aaatttgaaa tgaaacttcg ccgagcaact gttcttgaag actcttaccg gagaattatg 1740
ggtgtcaaga gagcagactt cctgaaggct cgactgtgga ttgagtttga tggtgaaaag 1800
ggattggatt atggaggagt tgccagagaa tggttcttcc tgatctcaaa ggaaatgttt 1860
aacccttatt atgggttgtt tgaatattct gctacggaca attataccct acagataaat 1920
ccaaactctg gattgtgtaa cgaagatcac ctctcttact tcaagtttat tggtcgggta 1980
gctggaatgg cagtttatca tggcaaactg ttggatggtt ttttcatccg cccattttac 2040
aagatgatgc ttcacaaacc aataaccctt catgatatgg aatctgtgga tagtgaatat 2100
tacaattccc taagatggat tcttgaaaat gacccaacag aattggacct caggtttatc 2160
atagatgaag aactttttgg acagacacat caacatgagc tgaaaaatgg tggatcagaa 2220
atagttgtca ccaataagaa caaaaaggaa tatatttatc ttgtaataca atggcgattt 2280
gtaaaccgaa tccagaagca aatggctgct tttaaagagg gattctttga actaatacca 2340
caggatctca tcaaaatttt tgatgaaaat gaactagagc ttcttatgtg tggaccggga 2400
gatgttgatg tgaatgactg gagggaacat acaaagtata aaaatggcta cagtgcaaat 2460
catcaggtta tacagtggtt ttggaaggct gttttaatga tggattcaga aaaaagaata 2520
agattacttc agtttgtcac tggcacatct cgggtgccta tgaatggatt tgctgaacta 2580
tacggttcaa atggaccaca gtcatttaca gttgaacagt ggggtactcc tgaaaagctg 2640
ccaagagctc atacctgttt taatcgcctg gacttgccac cttatgaatc atttgaagaa 2700
ttatgggata aacttcagat ggcaattgaa aacacccagg gctttgatgg agttgattag 2760
attacaaata acaatctgta gtgtttttac tgccatagtt ttataaccaa aatcttgact 2820
taaaattttc cggggaacta ctaaaatgtg gccactgagt cttcccagat cttgaagaaa 2880
atcatataaa aagcatttga agaaatagta cgac 2914
<210> 26
<211> 2868
<212> DNA
<213> Homo Sapiens
<400> 26
atggcgaccg ggctcgggga gccggtctat ggactttccg aagacgaggg agagtcccgt 60
attctcagag taaaagttgt ttctggaatt gatctcgcca aaaaggacat ctttggagcc 120
agtgatccgt atgtgaaact ttcattgtac gtagcggatg agaatagaga acttgctttg 180
gtccagacaa aaacaattaa aaagacactg aacccaaaat ggaatgaaga attttatttc 240
agggtaaacc catctaatca cagactccta tttgaagtat ttgacgaaaa tagactgaca 300
cgagacgact tcctgggcca ggtggacgtg ccccttagtc accttccgac agaagatcca 360
accatggagc gaccctatac atttaaggac tttctcctca gaccaagaag tcataagtct 420
cgagttaagg gatttttgcg attgaaaatg gcctatatgc caaaaaatgg aggtcaagat 480
gaagaaaaca gtgaccagag ggatgacatg gagcatggat gggaagttgt tgactcaaat 540
gactcggctt ctcagcacca agaggaactt cctcctcctc ctctgcctcc cgggtgggaa 600
gaaaaagtgg acaatttagg ccgaacttac tatgtcaacc acaacaaccg gaccactcag 660
tggcacagac caagcctgat ggacgtgtcc tcggagtcgg acaataacat cagacagatc 720
aaccaggagg cagcacaccg gcgcttccgc tcccgcaggc acatcagcga agacttggag 780
cccgagccct cggagggcgg ggatgtcccc gagccttggg agaccatttc agaggaagtg 840
aatatcgctg gagactctct cggtctggct ctgcccccac caccggcctc cccaggatct 900
cggaccagcc ctcaggagct gtcagaggaa ctaagcagaa ggcttcagat cactccagac 960
tccaatgggg aacagttcag ctctttgatt caaagagaac cctcctcaag gttgaggtca 1020
tgcagtgtca ccgacgcagt tgcagaacag ggccatctac caccgccatc agtggcctat 1080
gtacatacca cgccgggtct gccttcaggc tgggaagaaa gaaaagatgc taaggggcgc 1140
acatactatg tcaatcataa caatcgaacc acaacttgga ctcgacctat catgcagctt 1200
gcagaagatg gtgcgtccgg atcagccaca aacagtaaca accatctaat cgagcctcag 1260
atccgccggc ctcgtagcct cagctcgcca acagtaactt tatctgcccc gctggagggt 1320
gccaaggact cacccgtacg tcgggctgtg aaagacaccc tttccaaccc acagtcccca 1380
cagccatcac cttacaactc ccccaaacca caacacaaag tcacacagag cttcttgcca 1440
cccggctggg aaatgaggat agcgccaaac ggccggccct tcttcattga tcataacaca 1500
aagactacaa cctgggaaga tccacgtttg aaatttccag tacatatgcg gtcaaagaca 1560
tctttaaacc ccaatgacct tggccccctt cctcctggct gggaagaaag aattcacttg 1620
gatggccgaa cgttttatat tgatcataat agcaaaatta ctcagtggga agacccaaga 1680
ctgcagaacc cagctattac tggtccggct gtcccttact ccagagaatt taagcagaaa 1740
tatgactact tcaggaagaa attaaagaaa cctgctgata tccccaatag gtttgaaatg 1800
aaacttcaca gaaataacat atttgaagag tcctatcgga gaattatgtc cgtgaaaaga 1860
ccagatgtcc taaaagctag actgtggatt gagtttgaat cagagaaagg tcttgactat 1920
gggggtgtgg ccagagaatg gttcttctta ctgtccaaag agatgttcaa cccctactac 1980
ggcctctttg agtactctgc cacggacaac tacacccttc agatcaaccc taattcaggc 2040
ctctgtaatg aggatcattt gtcctacttc acttttattg gaagagttgc tggtctggcc 2100
gtatttcatg ggaagctctt agatggtttc ttcattagac cattttacaa gatgatgttg 2160
ggaaagcaga taaccctgaa tgacatggaa tctgtggata gtgaatatta caactctttg 2220
aaatggatcc tggagaatga ccctactgag ctggacctca tgttctgcat agacgaagaa 2280
aactttggac agacatatca agtggatttg aagcccaatg ggtcagaaat aatggtcaca 2340
aatgaaaaca aaagggaata tatcgactta gtcatccagt ggagatttgt gaacagggtc 2400
cagaagcaga tgaacgcctt cttggaggga ttcacagaac tacttcctat tgatttgatt 2460
aaaatttttg atgaaaatga gctggagttg ctcatgtgcg gcctcggtga tgtggatgtg 2520
aatgactgga gacagcattc tatttacaag aacggctact gcccaaacca ccccgtcatt 2580
cagtggttct ggaaggctgt gctactcatg gacgccgaaa agcgtatccg gttactgcag 2640
tttgtcacag ggacatcgcg agtacctatg aatggatttg ccgaacttta tggttccaat 2700
ggtcctcagc tgtttacaat agagcaatgg ggcagtcctg agaaactgcc cagagctcac 2760
acatgcttta atcgccttga cttacctcca tatgaaacct ttgaagattt acgagagaaa 2820
cttctcatgg ccgtggaaaa tgctcaagga tttgaagggg tggattaa 2868
<210> 27
<211> 2274
<212> DNA
<213> Homo Sapiens
<400> 27
atgtcgaacc ccgggacacg caggaacggc tccagcatca agatccgtct gacagtgtta 60
tgtgccaaga accttgcaaa gaaagacttc ttcaggctcc ctgacccttt tgcaaagatt 120
gtcgtggatg ggtctgggca gtgccactca accgacactg tgaaaaacac attggaccca 180
aagtggaacc agcactatga tctatatgtt gggaaaacgg attcgataac cattagcgtg 240
tggaaccata agaaaattca caagaaacag ggagctggct tcctgggctg tgtgcggctg 300
ctctccaatg ccatcagcag attaaaagat accggatacc agcgtttgga tctatgcaaa 360
ctaaacccct cagatactga tgcagttcgt ggccagatag tggtcagttt acagacacga 420
gacagaatag gaaccggcgg ctcggtggtg gactgcagag gactgttaga aaatgaagga 480
acggtgtatg aagactccgg gcctgggagg ccgctcagct gcttcatgga ggaaccagcc 540
ccttacacag atagcaccgg tgctgctgct ggaggaggga attgcaggtt cgtggagtcc 600
ccaagtcaag atcaaagact tcaggcacag cggcttcgaa accctgatgt gcgaggttca 660
ctacagacgc cccagaaccg accacacggc caccagtccc cggaactgcc cgaaggctac 720
gaacaaagaa caacagtcca gggccaagtt tactttttgc atacacagac tggagttagc 780
acgtggcacg accccaggat accaagtccc tcggggacca ttcctggggg agatgcagct 840
tttctatacg aattccttct acaaggccat acatctgagc ccagagacct taacagtgtg 900
aactgtgatg aacttggacc actgccgcca ggctgggaag tcagaagtac agtttctggg 960
aggatatatt ttgtagatca taataaccga acaacccagt ttacagaccc aaggttacac 1020
cacatcatga atcaccagtg ccaactcaag gagcccagcc agccgctgcc actgcccagt 1080
gagggctctc tggaggacga ggagcttcct gcccagagat acgaaagaga tctagtccag 1140
aagctgaaag tcctcagaca cgaactgtcg cttcagcagc cccaagctgg tcattgccgc 1200
atcgaagtgt ccagagaaga aatctttgag gagtcttacc gccagataat gaagatgcga 1260
ccgaaagact tgaaaaaacg gctgatggtg aaattccgtg gggaagaagg tttggattac 1320
ggtggtgtgg ccagggagtg gctttacttg ctgtgccatg aaatgctgaa tccttattac 1380
gggctcttcc agtattctac ggacaatatt tacatgttgc aaataaatcc ggattcttca 1440
atcaaccccg accacttgtc ttatttccac tttgtggggc ggatcatggg gctggctgtg 1500
ttccatggac actacatcaa cgggggcttc acagtgccct tctacaagca gctgctgggg 1560
aagcccatcc agctctcaga tctggaatct gtggacccag agctgcataa gagcttggtg 1620
tggatcctag agaacgacat cacgcctgta ctggaccaca ccttctgcgt ggaacacaac 1680
gccttcgggc ggatcctgca gcatgaactg aaacccaatg gcagaaatgt gccagtcaca 1740
gaggagaata agaaagaata cgtccggttg tatgtaaact ggaggtttat gagaggaatc 1800
gaagcccagt tcttagctct gcagaagggg ttcaatgagc tcatccctca acatctgctg 1860
aagccttttg accagaagga actggagctg atcataggcg gcctggataa aatagacttg 1920
aacgactgga agtcgaacac gcggctgaag cactgtgtgg ccgacagcaa catcgtgcgg 1980
tggttctggc aagcggtgga gacgttcgat gaagaaagga gggccaggct cctgcagttt 2040
gtgactgggt ccacgcgagt cccgctccaa ggcttcaagg ctttgcaagg ttctacaggc 2100
gcggcagggc cccggctgtt caccatccac ctgatagacg cgaacacaga caaccttccg 2160
aaggcccata cctgctttaa ccggatcgac attccaccat atgagtccta tgagaagctc 2220
tacgagaagc tgctgacagc cgtggaggag acctgcgggt ttgctgtgga gtga 2274
<210> 28
<211> 2247
<212> DNA
<213> Homo Sapiens
<400> 28
atgtctaacc ccggacgccg gaggaacggg cccgtcaagc tgcgcctgac agtactctgt 60
gcaaaaaacc tggtgaaaaa ggattttttc cgacttcctg atccatttgc taaggtggtg 120
gttgatggat ctgggcaatg ccattctaca gatactgtga agaatacgct tgatccaaag 180
tggaatcagc attatgacct gtatattgga aagtctgatt cagttacgat cagtgtatgg 240
aatcacaaga agatccataa gaaacaaggt gctggatttc tcggttgtgt tcgtcttctt 300
tccaatgcca tcaaccgcct caaagacact ggttatcaga ggttggattt atgcaaactc 360
gggccaaatg acaatgatac agttagagga cagatagtag taagtcttca gtccagagac 420
cgaataggca caggaggaca agttgtggac tgcagtcgtt tatttgataa cgatttacca 480
gacggctggg aagaaaggag aaccgcctct ggaagaatcc agtatctaaa ccatataaca 540
agaactacgc aatgggagcg cccaacacga ccggcatccg aatattctag ccctggcaga 600
cctcttagct gctttgttga tgagaacact ccaattagtg gaacaaatgg tgcaacatgt 660
ggacagtctt cagatcccag gctggcagag aggagagtca ggtcacaacg acatagaaat 720
tacatgagca gaacacattt acatactcct ccagacctac cagaaggcta tgaacagagg 780
acaacgcaac aaggccaggt gtatttctta catacacaga ctggtgtgag cacatggcat 840
gatccaagag tgcccaggga tcttagcaac atcaattgtg aagagcttgg tccattgcct 900
cctggatggg agatccgtaa tacggcaaca ggcagagttt atttcgttga ccataacaac 960
agaacaacac aatttacaga tcctcggctg tctgctaact tgcatttagt tttaaatcgg 1020
cagaaccaat tgaaagacca acagcaacag caagtggtat cgttatgtcc tgatgacaca 1080
gaatgcctga cagtcccaag gtacaagcga gacctggttc agaaactaaa aattttgcgg 1140
caagaacttt cccaacaaca gcctcaggca ggtcattgcc gcattgaggt ttccagggaa 1200
gagatttttg aggaatcata tcgacaggtc atgaaaatga gaccaaaaga tctctggaag 1260
cgattaatga taaaatttcg tggagaagaa ggccttgact atggaggcgt tgccagggaa 1320
tggttgtatc tcttgtcaca tgaaatgttg aatccatact atggcctctt ccagtattca 1380
agagatgata tttatacatt gcagatcaat cctgattctg cagttaatcc ggaacattta 1440
tcctatttcc actttgttgg acgaataatg ggaatggctg tgtttcatgg acattatatt 1500
gatggtggtt tcacattgcc tttttataag caattgcttg ggaagtcaat taccttggat 1560
gacatggagt tagtagatcc ggatcttcac aacagtttag tgtggatact tgagaatgat 1620
attacaggtg ttttggacca taccttctgt gttgaacata atgcatatgg tgaaattatt 1680
cagcatgaac ttaaaccaaa tggcaaaagt atccctgtta atgaagaaaa taaaaaagaa 1740
tatgtcaggc tctatgtgaa ctggagattt ttacgaggca ttgaggctca attcttggct 1800
ctgcagaaag gatttaatga agtaattcca caacatctgc tgaagacatt tgatgagaag 1860
gagttagagc tcattatttg tggacttgga aagatagatg ttaatgactg gaaggtaaac 1920
acccggttaa aacactgtac accagacagc aacattgtca aatggttctg gaaagctgtg 1980
gagttttttg atgaagagcg acgagcaaga ttgcttcagt ttgtgacagg atcctctcga 2040
gtgcctctgc agggcttcaa agcattgcaa ggtgctgcag gcccgagact ctttaccata 2100
caccagattg atgcctgcac taacaacctg ccgaaagccc acacttgctt caatcgaata 2160
gacattccac cctatgaaag ctatgaaaag ctatatgaaa agctgctaac agccattgaa 2220
gaaacatgtg gatttgctgt ggaatga 2247
<210> 29
<211> 2869
<212> DNA
<213> Homo Sapiens
<400> 29
ggagtcgccg ccgccccgag ttccggtacc atgcatttca cggtggcctt gtggagacaa 60
cgccttaacc caaggaagtg actcaaactg tgagaactcc aggttttcca acctattggt 120
ggtatgtctg acagtggatc acaacttggt tcaatgggta gcctcaccat gaaatcacag 180
cttcagatca ctgtcatctc agcaaaactt aaggaaaata agaagaattg gtttggacca 240
agtccttacg tagaggtcac agtagatgga cagtcaaaga agacagaaaa atgcaacaac 300
acaaacagtc ccaagtggaa gcaacccctt acagttatcg ttacccctgt gagtaaatta 360
cattttcgtg tgtggagtca ccagacactg aaatctgatg ttttgttggg aactgctgca 420
ttagatattt atgaaacatt aaagtcaaac aatatgaaac ttgaagaagt agttgtgact 480
ttgcagcttg gaggtgacaa agagccaaca gagacaatag gagacttgtc aatttgtctt 540
gatgggctac agttagagtc tgaagttgtt accaatggtg aaactacatg ttcagaaagt 600
gcttctcaga atgatgatgg ctccagatcc aaggatgaaa caagagtgag cacaaatgga 660
tcagatgacc ctgaagatgc aggagctggt gaaaatagga gagtcagtgg gaataattct 720
ccatcactct caaatggtgg ttttaaacct tctagacctc caagaccttc acgaccacca 780
ccacccaccc cacgtagacc agcatctgtc aatggttcac catctgccac ttctgaaagt 840
gatgggtcta gtacaggctc tctgccgccg acaaatacaa atacaaatac atctgaagga 900
gcaacatctg gattaataat tcctcttact atatctggag gctcaggccc taggccatta 960
aatcctgtaa ctcaagctcc cttgccacct ggttgggagc agagagtgga ccagcacggg 1020
cgagtttact atgtagatca tgttgagaaa agaacaacat gggatagacc agaacctcta 1080
cctcctggct gggaacggcg ggttgacaac atgggacgta tttattatgt tgaccatttc 1140
acaagaacaa caacgtggca gaggccaaca ctggaatccg tccggaacta tgaacaatgg 1200
cagctacagc gtagtcagct tcaaggagca atgcagcagt ttaaccagag attcatttat 1260
gggaatcaag atttatttgc tacatcacaa agtaaagaat ttgatcctct tggtccattg 1320
ccacctggat gggagaagag aacagacagc aatggcagag tatatttcgt caaccacaac 1380
acacgaatta cacaatggga agaccccaga agtcaaggtc aattaaatga aaagccctta 1440
cctgaaggtt gggaaatgag attcacagtg gatggaattc catattttgt ggaccacaat 1500
agaagaacta ccacctatat agatccccgc acaggaaaat ctgccctaga caatggacct 1560
cagatagcct atgttcggga cttcaaagca aaggttcagt atttccggtt ctggtgtcag 1620
caactggcca tgccacagca cataaagatt acagtgacaa gaaaaacatt gtttgaggat 1680
tcctttcaac agataatgag cttcagtccc caagatctgc gaagacgttt gtgggtgatt 1740
tttccaggag aagaaggttt agattatgga ggtgtagcaa gagaatggtt ctttcttttg 1800
tcacatgaag tgttgaaccc aatgtattgc ctgtttgaat atgcagggaa ggataactac 1860
tgcttgcaga taaaccccgc ttcttacatc aatccagatc acctgaaata ttttcgtttt 1920
attggcagat ttattgccat ggctctgttc catgggaaat tcatagacac gggtttttct 1980
ttaccattct ataagcgtat cttgaacaaa ccagttggac tcaaggattt agaatctatt 2040
gatccagaat tttacaattc tctcatctgg gttaaggaaa acaatattga ggaatgtgat 2100
ttggaaatgt acttctccgt tgacaaagaa attctaggtg aaattaagag tcatgatctg 2160
aaacctaatg gtggcaatat tcttgtaaca gaagaaaata aagaggaata catcagaatg 2220
gtagctgagt ggaggttgtc tcgaggtgtt gaagaacaga cacaagcttt ctttgaaggc 2280
tttaatgaaa ttcttcccca gcaatatttg caatactttg atgcaaagga attagaggtc 2340
cttttatgtg gaatgcaaga gattgatttg aatgactggc aaagacatgc catctaccgt 2400
cattatgcaa ggaccagcaa acaaatcatg tggttttggc agtttgttaa agaaattgat 2460
aatgagaaga gaatgagact tctgcagttt gttactggaa cctgccgatt gccagtagga 2520
ggatttgctg atctcatggg gagcaatgga ccacagaaat tctgcattga aaaagttggg 2580
aaagaaaatt ggctacccag aagtcatacc tgttttaatc gcctggacct gccaccatac 2640
aagagctatg agcaactgaa ggaaaagctg ttgtttgcca tagaagaaac agaaggattt 2700
ggacaagagt aacttctgag aacttgcacc atgaatgggc aagaacttat ttgcaatgtt 2760
tgtccttctc tgcctgttgc acatcttgta aaattggaca atggctcttt agagagttat 2820
ctgagtgtaa gtaaattaat gttctcattt aaaaaaaaaa aaaaaaaaa 2869
<210> 30
<211> 5169
<212> DNA
<213> Homo Sapiens
<400> 30
gcgcatcagg cgctgttgtt ggagccggaa caccgtgcga ctctgaccga accggccccc 60
tcctcgcgca cacactcgcc gagccgcgcg cgcccctccg ccgtgacagt ggccgtggcc 120
tccgctctct cggggcaccc ggcagccaga gcgcagcgag agcgggcggt cgccagggtc 180
ccctccccag ccagtcccag gcgcccggtg cactatgcgg ggcacgtgcg ccccccagct 240
ctaatctgcg cgctgacagg agcatgatct gtgcccaggc cagggctgcc aaggaattga 300
tgcgcgtaca cgtggtgggt cattatgctg ctacacctgt gtagtgtgaa gaatctgtac 360
cagaacaggt ttttaggcct ggccgccatg gcgtctcctt ctagaaactc ccagagccga 420
cgccggtgca aggagccgct ccgatacagc tacaaccccg accagttcca caacatggac 480
ctcaggggcg gcccccacga tggcgtcacc attccccgct ccaccagcga cactgacctg 540
gtcacctcgg acagccgctc cacgctcatg gtcagcagct cctactattc catcgggcac 600
tctcaggacc tggtcatcca ctgggacata aaggaggaag tggacgctgg ggactggatt 660
ggcatgtacc tcattgatga ggtcttgtcc gaaaactttc tggactataa aaaccgtgga 720
gtcaatggtt ctcatcgggg ccagatcatc tggaagatcg atgccagctc gtactttgtg 780
gaacctgaaa ctaagatctg cttcaaatac taccatggag tgagtggggc cctgcgagca 840
accaccccca gtgtcacggt caaaaactcg gcagctccta tttttaaaag cattggtgct 900
gatgagaccg tccaaggaca aggaagtcgg aggctgatca gcttctctct ctcagatttc 960
caagccatgg ggttgaagaa agggatgttt ttcaacccag acccttatct gaagatttcc 1020
attcagcctg ggaaacacag catcttcccc gccctccctc accatggaca ggagaggaga 1080
tccaagatca taggcaacac cgtgaacccc atctggcagg ccgagcaatt cagttttgtg 1140
tccttgccca ctgacgtgct ggaaattgag gtgaaggaca agtttgccaa gagccgcccc 1200
atcatcaagc gcttcttggg aaagctgtcg atgcccgttc aaagactcct ggagagacac 1260
gccatagggg atagggtggt cagctacaca cttggccgca ggcttccaac agatcatgtg 1320
agtggacagc tgcaattccg atttgagatc acttcctcca tccacccaga tgatgaggag 1380
atttccctga gtaccgagcc tgagtcagcc caaattcagg acagccccat gaacaacctg 1440
atggaaagcg gcagtgggga acctcggtct gaggcaccag agtcctctga gagctggaag 1500
ccagagcagc tgggtgaggg cagtgtcccc gatggtccag ggaaccaaag catagagctt 1560
tccagaccag ctgaggaagc agcagtcatc acggaggcag gagaccaggg catggtctct 1620
gtgggacctg aaggggctgg ggagctcctg gcccaggtgc aaaaggacat ccagcctgcc 1680
cccagtgcag aagagctggc cgagcagctg gacctgggtg aggaggcatc agcactgctg 1740
ctggaagacg gtgaagcccc agccagcacc aaggaggagc ccttggagga ggaagcaacg 1800
acccagagcc gggctggaag ggaagaagag gagaaggagc aggaggagga gggagatgtg 1860
tctaccctgg agcagggaga gggcaggctg cagctgcggg cctcggtgaa gagaaaaagc 1920
aggccctgct ccttgcctgt gtccgagctg gagacggtga tcgcgtcagc ctgcggggac 1980
cccgagaccc cgcggacaca ctacatccgc atccacaccc tgctgcacag catgccctcc 2040
gcccagggcg gcagcgcggc agaggaggag gacggcgcgg aggaggagtc caccctcaag 2100
gactcctcgg agaaggatgg gctcagcgag gtggacacgg tggccgctga cccgtctgcc 2160
ctggaagagg acagagaaga gcccgagggg gctactccag gcacggcgca ccctggccac 2220
tccgggggcc acttccccag cctggccaat ggcgcggccc aggatggcga cacgcacccc 2280
agcaccggga gcgagagcga ctccagcccc aggcaaggcg gggaccacag ttgcgagggc 2340
tgtgacgcgt cctgctgcag cccctcgtgc tacagctcct cgtgctacag cacgtcctgc 2400
tacagcagct cgtgctacag cgcctcgtgc tacagcccct cctgctacaa cggcaacagg 2460
ttcgccagcc acacgcgctt ctcctccgtg gacagcgcca agatctccga gagcacggtc 2520
ttctcctcgc aagacgacga ggaggaggag aacagcgcgt tcgagtcggt acccgactcc 2580
atgcagagcc ctgagctgga cccggagtcc acgaacggcg ctgggccgtg gcaagacgag 2640
ctggccgccc ctagcgggca cgtggaaaga agcccggaag gtctggaatc ccccgtggca 2700
ggtccaagca atcggagaga agactgggaa gctcgaattg acagccacgg gcgggtcttt 2760
tatgtggacc acgtgaaccg cacaaccacc tggcagcgtc cgacggcagc agccaccccg 2820
gatggcatgc ggagatcggg gtccatccag cagatggagc aactcaacag gcggtatcaa 2880
aacattcagc gaaccattgc aacagagagg tccgaagaag attctggcag ccaaagctgc 2940
gagcaagccc cagcaggagg aggcggaggt ggagggagtg actcagaagc cgaatcttcc 3000
cagtccagct tagatctaag gagagagggg tcactttctc cagtgaactc acaaaaaatc 3060
accttgctgc tgcagtcccc agcggtcaag ttcatcacca accccgagtt cttcactgtg 3120
ctacacgcca attatagtgc ctaccgagtc ttcaccagta gcacctgctt aaagcacatg 3180
attctgaaag tccgacggga tgctcgcaat tttgaacgct accagcacaa ccgggacttg 3240
gtgaatttca tcaacatgtt cgcagacact cggctggaac tgccccgggg ctgggagatc 3300
aaaacggacc agcagggaaa gtcttttttc gtggaccaca acagtcgagc taccactttc 3360
attgaccccc gaatccctct tcagaacggt cgtcttccca atcatctaac tcaccgacag 3420
cacctccaga ggctccgaag ttacagcgcc ggagaggcct cagaagtttc tagaaacaga 3480
ggagcctctt tactggccag gccaggacac agcttagtag ctgctattcg aagccaacat 3540
caacatgagt cattgccact ggcatataat gacaagattg tggcatttct tcgccagcca 3600
aacatttttg aaatgctgca agagcgtcag ccaagcttag caagaaacca cacactcagg 3660
gagaaaatcc attacattcg gactgagggt aatcacgggc ttgagaagtt gtcctgtgat 3720
gcggatctgg tcattttgct gagtctcttt gaagaagaga ttatgtccta cgtccccctg 3780
caggctgcct tccaccctgg gtatagcttc tctccccgat gttcaccctg ttcttcacct 3840
cagaactccc caggtttaca gagagccagt gcaagagccc cttcccccta ccgaagagac 3900
tttgaggcca agctccgcaa tttctacaga aaactggaag ccaaaggatt tggtcagggt 3960
ccggggaaaa ttaagctcat tattcgccgg gatcatttgt tggagggaac cttcaatcag 4020
gtgatggcct attcgcggaa agagctccag cgaaacaagc tctacgtcac ctttgttgga 4080
gaggagggcc tggactacag tggcccctcg cgggagttct tcttccttct gtctcaggag 4140
ctcttcaacc cttactatgg actctttgag tactcggcaa atgatactta cacggtgcag 4200
atcagcccca tgtccgcatt tgtagaaaac catcttgagt ggttcaggtt tagcggtcgc 4260
atcctgggtc tggctctgat ccatcagtac cttcttgacg ctttcttcac gaggcccttc 4320
tacaaggcac tcctgagact gccctgtgat ttgagtgacc tggaatattt ggatgaggaa 4380
ttccaccaga gtttgcagtg gatgaaggac aacaacatca cagacatctt agacctcact 4440
ttcactgtta atgaagaggt ttttggacag gtcacggaaa gggagttgaa gtctggagga 4500
gccaacacac aggtgacgga gaaaaacaag aaggagtaca tcgagcgcat ggtgaagtgg 4560
cgggtggagc gcggcgtggt acagcagacc gaggcgctgg tgcgcggctt ctacgaggtt 4620
gtagactcga ggctggtgtc cgtgtttgat gccagggagc tggagctggt gatagctggc 4680
accgcggaaa tcgacctaaa tgactggcgg aataacactg agtaccgggg aggttaccac 4740
gatgggcatc ttgtgatccg ctggttctgg gctgcggtgg agcgcttcaa taatgagcag 4800
aggctgagat tactgcagtt tgtcacggga acatccagcg tgccctacga aggcttcgca 4860
gccctccgtg ggagcaatgg gcttcggcgc ttctgcatag agaaatgggg gaaaattact 4920
tctctcccca gggcacacac atgcttcaac cgactggatc ttccaccgta tccctcgtac 4980
tccatgttgt atgaaaagct gttaacagca gtagaggaaa ccagcacctt tggacttgag 5040
tgaggacatg gaacctcgcc tgacattttc ctggccagtg acatcaccct tcctgggatg 5100
atcccctttt ccctttccct taatcaactc tcctttgatt ttggtattcc atgattttta 5160
ttttcaaac 5169
<210> 31
<211> 2715
<212> DNA
<213> Homo Sapiens
<400> 31
agagttccat cagagcctgc agtggatgaa agacaatgat atccatgaca tcctagacct 60
cacgttcact gtgaacgaag aagtatttgg gcagataact gaacgagaat taaagccagg 120
gggtgccaat atcccagtta cagagaagaa caagaaggag tacatcgaga ggatggtgaa 180
gtggaggatt gagaggggtg ttgtacagca aacagagagc ttagtgcgtg gcttctatga 240
ggtggtggat gccaggctgg tatctgtttt tgatgcaaga gaactggaat tggtcatcgc 300
aggcacagct gaaatagacc taagtgattg gagaaacaac acagaatata gaggaggata 360
ccatgacaat catattgtaa ttcggtggtt ctgggctgca gtggaaagat tcaacaatga 420
acaacgacta aggttgttac agtttgttac aggcacatcc agcattccct atgaaggatt 480
tgcttcactc cgagggagta acggcccaag aagattctgt gtggagaaat gggggaaaat 540
cactgctctt cccagagcgc atacatgttt taaccgtctg gatctgcctc cctacccatc 600
cttttccatg ctttatgaaa aactgttgac agcagttgaa gaaaccagta cttttggact 660
tgagtgacct ggaagctgaa tgcccatctc tgtggacagg cagtttcaga agctgccttc 720
tagaagaatg attgaacatt ggaagtttca agaggatgct tcctttagga taaagctacg 780
tgctgttgtt ttccaggaac aagtgctctg tcacatttgg ggactggaga tgagtcctct 840
tggaaggatt tgggtgagct tgatgcccag ggaacaaccc aaccgtcttt caatcaacag 900
ttcttgactg ccaaactttt tccatttgtt atgttccaag acaaagatga acccatacat 960
gatcagctcc acggtaattt ttagggactc aggagaatct tgaaacttac ccttgaacgt 1020
ggttcaagcc aaactggcag catttggccc aatctccaaa ttagagcaag ttaaataata 1080
taataaaagt aaatatattt cctgaaagta cattcattta agccctaagt tataacagaa 1140
tattcatttc ttgcttatga gtgcctgcat ggtgtgcacc ataggtttcc gctttcatgg 1200
gacatgagtg aaaatgaaac caagtcaata tgaggtacct ttacagattt gcaataagat 1260
ggtctgtgac aatgtatatg caagtggtat gtgtgtaatt atggctaaag acaaaccatt 1320
attcagtgaa ttactaatga cagattttat gctttataat gcatgaaaac aattttaaaa 1380
taactagcaa ttaatcacag catatcagga aaaagtacac agtgagttct gtttattttt 1440
tgtaggctca ttatgtttat gttctttaag atgtatataa gaacctactt atcatgctgt 1500
atgtatcact cattccattt tcatgttcca tgcatactcg ggcatcatgc taatatgtat 1560
ccttttaagc actctcaagg aaacaaaagg gccttttatt tttataaagg taaaaaaaat 1620
tccccaaata ttttgcactg aatgtaccaa aggtgaaggg acattacaat atgactaaca 1680
gcaactccat cacttgagaa gtataataga aaatagcttc taaatcaaac ttccttcaca 1740
gtgccgtgtc taccactaca aggactgtgc atctaagtaa taatttttta agattcacta 1800
tatgtgatag tatgatatgc atttatttaa aatgcattag actctcttcc atccatcaaa 1860
tactttacag gatggcattt aatacagata tttcgtattt cccccactgc tttttatttg 1920
tacagcatca ttaaacacta agctcagtta aggagccatc agcaacactg aagagatcag 1980
tagtaagaat tccattttcc ctcatcagtg aagacaccac aaattgaaac tcagaactat 2040
atttctaagc ctgcattttc actgatgcat aattttctta ttaatattaa gagacagttt 2100
ttctatggca tctccaaaac tgcatgacat cactagtctt acttctgctt aattttatga 2160
gaaggtattc ttcattttaa ttgcttttgg gattactcca catctttgtt tatttcttga 2220
ctaatcagat tttcaataga gtgaagttaa attgggggtc ataaaagcat tggattgaca 2280
tatggtttgc cagcctatgg gtttacaggc attgcccaaa catttctttg agatctatat 2340
ttataagcag ccatggaatt cctattatgg gatgttggca atcttacatt ttatagaggt 2400
catatgcata gttttcatag gtgttttgta agaactgatt gctctcctgt gagttaagct 2460
atgtttacta ctgggaccct caagaggaat accacttatg ttacactcct gcactaaagg 2520
cacgtactgc agtgtgaaga aatgttctga aaaagggtta tagaaatctg gaaataagaa 2580
aggaagagct ctctgtattc tataattgga agagaaaaaa agaaaaactt ttaactggaa 2640
atgttagttt gtacttattg atcatgaata caagtatata tttaattttg caaaaaaaaa 2700
aaaaaaaaaa aaaag 2715
<210> 32
<211> 195
<212> DNA
<213> Homo Sapiens
<400> 32
cccttgccac ctggttggga gcagagagtg gaccagcacg ggcgagttta ctatgtagat 60
catgttgaga aaagaacaac atgggataga ccagaacctc tacctcctgg ctgggaacgg 120
cgggttgaca acatgggacg tatttattat gttgaccatt tcacaagaac aacaacgtgg 180
cagaggccaa cactg 195
<210> 33
<211> 555
<212> DNA
<213> Homo Sapiens
<400> 33
cccttgccac ctggttggga gcagagagtg gaccagcacg ggcgagttta ctatgtagat 60
catgttgaga aaagaacaac atgggataga ccagaacctc tacctcctgg ctgggaacgg 120
cgggttgaca acatgggacg tatttattat gttgaccatt tcacaagaac aacaacgtgg 180
cagaggccaa cactggaatc cgtccggaac tatgaacaat ggcagctaca gcgtagtcag 240
cttcaaggag caatgcagca gtttaaccag agattcattt atgggaatca agatttattt 300
gctacatcac aaagtaaaga atttgatcct cttggtccat tgccacctgg atgggagaag 360
agaacagaca gcaatggcag agtatatttc gtcaaccaca acacacgaat tacacaatgg 420
gaagacccca gaagtcaagg tcaattaaat gaaaagccct tacctgaagg ttgggaaatg 480
agattcacag tggatggaat tccatatttt gtggaccaca atagaagaac taccacctat 540
atagatcccc gcaca 555
<210> 34
<211> 8506
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 34
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttg ttttagagct 360
agaaatagca agttaaaata aggctagtcc gtttttagcg cgtgcgccaa ttctgcagac 420
aaatggctct agaggtaccc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 480
ccaacgaccc ccgcccattg acgtcaatag taacgccaat agggactttc cattgacgtc 540
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 600
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tgtgcccagt 660
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 720
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 780
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 840
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 900
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 960
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 1020
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1080
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1140
ctgagcaaga ggtaagggtt taagggatgg ttggttggtg gggtattaat gtttaattac 1200
ctggagcacc tgcctgaaat cacttttttt caggttggac cggtgccacc atggactata 1260
aggaccacga cggagactac aaggatcatg atattgatta caaagacgat gacgataaga 1320
tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacaagaagt 1380
acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc accgacgagt 1440
acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga 1500
agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc acccggctga 1560
agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat ctgcaagaga 1620
tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg gaagagtcct 1680
tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac atcgtggacg 1740
aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa ctggtggaca 1800
gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg atcaagttcc 1860
ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg gacaagctgt 1920
tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc aacgccagcg 1980
gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc 2040
tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg attgccctga 2100
gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat gccaaactgc 2160
agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag atcggcgacc 2220
agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg ctgagcgaca 2280
tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg atcaagagat 2340
acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg 2400
agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc tacattgacg 2460
gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa aagatggacg 2520
gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag cagcggacct 2580
tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc attctgcggc 2640
ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag aagatcctga 2700
ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga ttcgcctgga 2760
tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg gtggacaagg 2820
gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac ctgcccaacg 2880
agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat aacgagctga 2940
ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc ggcgagcaga 3000
aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga 3060
aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag 3120
atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc aaggacaagg 3180
acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg accctgacac 3240
tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg 3300
acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgagccgga 3360
agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ttcctgaagt 3420
ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ctgaccttta 3480
aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac gagcacattg 3540
ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg aaggtggtgg 3600
acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc gaaatggcca 3660
gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg aagcggatcg 3720
aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc 3780
agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat atgtacgtgg 3840
accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc gtgcctcaga 3900
gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac aagaaccggg 3960
gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac tactggcggc 4020
agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc aaggccgaga 4080
gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg gtggaaaccc 4140
ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact aagtacgacg 4200
agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg 4260
atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac caccacgccc 4320
acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg 4380
aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg atcgccaaga 4440
gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcatgaact 4500
ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct ctgatcgaga 4560
caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc accgtgcgga 4620
aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct 4680
tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc agaaagaagg 4740
actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat tctgtgctgg 4800
tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg 4860
ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt ctggaagcca 4920
agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac tccctgttcg 4980
agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag aagggaaacg 5040
aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac tatgagaagc 5100
tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag cacaagcact 5160
acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc ctggccgacg 5220
ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc atcagagagc 5280
aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct gccgccttca 5340
agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gtgctggacg 5400
ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac ctgtctcagc 5460
tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa aagaaaaagt 5520
aagaattcct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 5580
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 5640
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 5700
tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 5760
gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 5820
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 5880
gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 5940
tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 6000
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 6060
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 6120
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 6180
gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 6240
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 6300
ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 6360
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 6420
atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 6480
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 6540
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 6600
tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 6660
gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 6720
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 6780
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 6840
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 6900
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 6960
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 7020
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 7080
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 7140
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 7200
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 7260
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 7320
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 7380
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 7440
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 7500
ggctggttta ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca 7560
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 7620
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 7680
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 7740
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 7800
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 7860
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 7920
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 7980
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 8040
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 8100
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 8160
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 8220
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 8280
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 8340
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 8400
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 8460
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 8506
<210> 35
<211> 238
<212> PRT
<213> Aequorea victoria
<400> 35
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe
50 55 60
Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
165 170 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
180 185 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
195 200 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
210 215 220
Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 36
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 36
Glu Thr Leu Pro Ser Gly Trp Glu Gln Arg Lys Asp Pro His Gly Arg
1 5 10 15
Thr Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Glu Arg Pro
20 25 30
Gln Pro
<210> 37
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 37
Gln Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asp Arg Arg Arg
1 5 10 15
Val Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro
20 25 30
Thr Met
<210> 38
<211> 39
<212> PRT
<213> Homo Sapiens
<400> 38
Glu Asn Asp Pro Tyr Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Val
1 5 10 15
Asp Ser Thr Asp Arg Val Tyr Phe Val Asn His Asn Thr Lys Thr Thr
20 25 30
Gln Trp Glu Asp Pro Arg Thr
35
<210> 39
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 39
Glu Pro Leu Pro Glu Gly Trp Glu Ile Arg Tyr Thr Arg Glu Gly Val
1 5 10 15
Arg Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro
20 25 30
Arg Asn
<210> 40
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 40
Asp Ala Leu Pro Ala Gly Trp Glu Gln Arg Glu Leu Pro Asn Gly Arg
1 5 10 15
Val Tyr Tyr Val Asp His Asn Thr Lys Thr Thr Thr Trp Glu Arg Pro
20 25 30
Leu Pro
<210> 41
<211> 33
<212> PRT
<213> Homo Sapiens
<400> 41
Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Pro Arg Gly Arg Phe
1 5 10 15
Tyr Tyr Val Asp His Asn Thr Arg Thr Thr Thr Trp Gln Arg Pro Thr
20 25 30
Ala
<210> 42
<211> 37
<212> PRT
<213> Homo Sapiens
<400> 42
His Asp Pro Leu Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Gln Asp
1 5 10 15
Asn Gly Arg Val Tyr Tyr Val Asn His Asn Thr Arg Thr Thr Gln Trp
20 25 30
Glu Asp Pro Arg Thr
35
<210> 43
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 43
Pro Ala Leu Pro Pro Gly Trp Glu Met Lys Tyr Thr Ser Glu Gly Val
1 5 10 15
Arg Tyr Phe Val Asp His Asn Thr Arg Thr Thr Thr Phe Lys Asp Pro
20 25 30
Arg Pro
<210> 44
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 44
Ser Pro Leu Pro Pro Gly Trp Glu Glu Arg Gln Asp Ile Leu Gly Arg
1 5 10 15
Thr Tyr Tyr Val Asn His Glu Ser Arg Arg Thr Gln Trp Lys Arg Pro
20 25 30
Thr Pro
<210> 45
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 45
Ser Gly Leu Pro Pro Gly Trp Glu Glu Lys Gln Asp Glu Arg Gly Arg
1 5 10 15
Ser Tyr Tyr Val Asp His Asn Ser Arg Thr Thr Thr Trp Thr Lys Pro
20 25 30
Thr Val
<210> 46
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 46
Gly Phe Leu Pro Lys Gly Trp Glu Val Arg His Ala Pro Asn Gly Arg
1 5 10 15
Pro Phe Phe Ile Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro
20 25 30
Arg Leu
<210> 47
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 47
Gly Pro Leu Pro Pro Gly Trp Glu Glu Arg Thr His Thr Asp Gly Arg
1 5 10 15
Ile Phe Tyr Ile Asn His Asn Ile Lys Arg Thr Gln Trp Glu Asp Pro
20 25 30
Arg Leu
<210> 48
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 48
Pro Glu Leu Pro Glu Gly Tyr Glu Gln Arg Thr Thr Val Gln Gly Gln
1 5 10 15
Val Tyr Phe Leu His Thr Gln Thr Gly Val Ser Thr Trp His Asp Pro
20 25 30
Arg Ile
<210> 49
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 49
Gly Pro Leu Pro Pro Gly Trp Glu Val Arg Ser Thr Val Ser Gly Arg
1 5 10 15
Ile Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp Pro
20 25 30
Arg Leu
<210> 50
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 50
Asn Asp Leu Pro Asp Gly Trp Glu Glu Arg Arg Thr Ala Ser Gly Arg
1 5 10 15
Ile Gln Tyr Leu Asn His Ile Thr Arg Thr Thr Gln Trp Glu Arg Pro
20 25 30
Thr Arg
<210> 51
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 51
Pro Asp Leu Pro Glu Gly Tyr Glu Gln Arg Thr Thr Gln Gln Gly Gln
1 5 10 15
Val Tyr Phe Leu His Thr Gln Thr Gly Val Ser Thr Trp His Asp Pro
20 25 30
Arg Val
<210> 52
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 52
Gly Pro Leu Pro Pro Gly Trp Glu Ile Arg Asn Thr Ala Thr Gly Arg
1 5 10 15
Val Tyr Phe Val Asp His Asn Asn Arg Thr Thr Gln Phe Thr Asp Pro
20 25 30
Arg Leu
<210> 53
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 53
Ala Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg
1 5 10 15
Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro
20 25 30
Glu Pro
<210> 54
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 54
Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg
1 5 10 15
Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro
20 25 30
Thr Leu
<210> 55
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 55
Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg
1 5 10 15
Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro
20 25 30
Arg Ser
<210> 56
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 56
Lys Pro Leu Pro Glu Gly Trp Glu Met Arg Phe Thr Val Asp Gly Ile
1 5 10 15
Pro Tyr Phe Val Asp His Asn Arg Arg Thr Thr Thr Tyr Ile Asp Pro
20 25 30
Arg Thr
<210> 57
<211> 33
<212> PRT
<213> Homo Sapiens
<400> 57
Pro Leu Pro Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg Val
1 5 10 15
Phe Tyr Val Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro Thr
20 25 30
Ala
<210> 58
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 58
Leu Glu Leu Pro Arg Gly Trp Glu Ile Lys Thr Asp Gln Gln Gly Lys
1 5 10 15
Ser Phe Phe Val Asp His Asn Ser Arg Ala Thr Thr Phe Ile Asp Pro
20 25 30
Arg Ile
<210> 59
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 59
Glu Ala Leu Pro Pro Asn Trp Glu Ala Arg Ile Asp Ser His Gly Arg
1 5 10 15
Ile Phe Tyr Val Asp His Val Asn Arg Thr Thr Thr Trp Gln Arg Pro
20 25 30
Thr Ala
<210> 60
<211> 34
<212> PRT
<213> Homo Sapiens
<400> 60
Leu Glu Leu Pro Arg Gly Trp Glu Met Lys His Asp His Gln Gly Lys
1 5 10 15
Ala Phe Phe Val Asp His Asn Ser Arg Thr Thr Thr Phe Ile Asp Pro
20 25 30
Arg Leu
<210> 61
<211> 27
<212> PRT
<213> Homo Sapiens
<400> 61
Gly Trp Glu Glu Lys Val Asp Asn Leu Gly Arg Thr Tyr Tyr Val Asn
1 5 10 15
His Asn Asn Arg Thr Thr Gln Trp His Arg Pro
20 25
<210> 62
<211> 29
<212> PRT
<213> Homo Sapiens
<400> 62
Pro Ser Gly Trp Glu Glu Arg Lys Asp Ala Lys Gly Arg Thr Tyr Tyr
1 5 10 15
Val Asn His Asn Asn Arg Thr Thr Thr Trp Thr Arg Pro
20 25
<210> 63
<211> 31
<212> PRT
<213> Homo Sapiens
<400> 63
Pro Pro Gly Trp Glu Met Arg Ile Ala Pro Asn Gly Arg Pro Phe Phe
1 5 10 15
Ile Asp His Asn Thr Lys Thr Thr Thr Trp Glu Asp Pro Arg Leu
20 25 30
<210> 64
<211> 31
<212> PRT
<213> Homo Sapiens
<400> 64
Pro Pro Gly Trp Glu Glu Arg Ile His Leu Asp Gly Arg Thr Phe Tyr
1 5 10 15
Ile Asp His Asn Ser Lys Ile Thr Gln Trp Glu Asp Pro Arg Leu
20 25 30
<210> 65
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 65
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe
20 25 30
His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr
50 55 60
His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp
65 70 75 80
Gln Thr Gly Pro Lys Glu Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Lys Pro
100
<210> 66
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 66
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe
20 25 30
His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr
50 55 60
His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp
65 70 75 80
Gln Thr Gly Pro Lys Glu
85
<210> 67
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 67
Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg
1 5 10 15
Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser
20 25 30
Leu Ser Lys Gln
35
<210> 68
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 68
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Thr Cys Tyr Cys Lys Lys Cys Cys Phe
20 25 30
His Cys Gln Val Cys Phe Thr Thr Lys Ala Leu Gly Ile
35 40 45
<210> 69
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 69
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr
1 5 10 15
His Gln Val Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp
20 25 30
Gln Thr Gly Pro Lys Glu
35
<210> 70
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 70
Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val
1 5 10 15
Ser Leu Ser Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly
20 25 30
Pro Lys Glu
35
<210> 71
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 71
Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser Leu Ser
1 5 10 15
Lys Gln Pro Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly Pro Lys Glu
20 25 30
<210> 72
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 72
Pro Pro Gln Gly Ser Gln Thr His Gln Val Ser Leu Ser Lys Gln Pro
1 5 10 15
Ser Ser Gln Pro Arg Gly Asp Gln Thr Gly Pro Lys Glu
20 25
<210> 73
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 73
Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5
<210> 74
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 74
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro
1 5 10
<210> 75
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 75
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly
1 5 10
<210> 76
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 76
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln
1 5 10 15
<210> 77
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 77
Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln Thr
1 5 10 15
His
<210> 78
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 78
Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg
1 5 10 15
Arg Gln Arg Arg Arg
20
<210> 79
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 79
Cys Phe Thr Thr Lys Ala Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg
1 5 10 15
Arg Gln Arg Arg Arg Pro Pro Gln Gly Ser Gln
20 25
<210> 80
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 80
Gly Arg Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro
1 5 10
<210> 81
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 81
Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Gly
1 5 10 15
Ser Gln Thr His
20
<210> 82
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 82
Met Glu Thr Pro Leu Lys Ala Pro Glu Gly Ser Leu Gly Ser Tyr Asn
1 5 10 15
Glu Pro Ser Ser Cys Thr Ser Glu Gln Asp Ala Ala Ala Gln Gly Leu
20 25 30
Val Ser Pro Gly Asp Glu Ile Leu Tyr Gln Leu Tyr Gln Pro Leu Glu
35 40 45
Ala Cys Asp Asn Lys Cys Tyr Cys Lys Lys Cys Cys Tyr His Cys Gln
50 55 60
Met Cys Phe Leu Asn Lys Gly Leu Gly Ile Trp Tyr Glu Arg Lys Gly
65 70 75 80
Arg Arg Arg Arg Thr Pro Lys Lys Thr Lys Ala His Ser Ser Ser Ala
85 90 95
Ser Asp Lys Ser Ile Ser Thr Arg Thr Gly Asn Ser Gln Pro Glu Lys
100 105 110
Lys Gln Lys Lys Thr Leu Glu Thr Ala Leu Glu Thr Ile Gly Gly Pro
115 120 125
Gly Arg
130
<210> 83
<211> 103
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 83
Met Pro Gly Pro Trp Val Ala Met Ile Met Leu Pro Gln Pro Lys Glu
1 5 10 15
Ser Phe Gly Gly Lys Pro Ile Gly Trp Leu Phe Trp Asn Thr Cys Lys
20 25 30
Gly Pro Arg Arg Asp Cys Pro His Cys Cys Cys Pro Ile Cys Ser Trp
35 40 45
His Cys Gln Leu Cys Phe Leu Gln Lys Asn Leu Gly Ile Asn Tyr Gly
50 55 60
Ser Gly Pro Arg Arg Arg Gly Thr Arg Gly Lys Gly Arg Arg Ile Arg
65 70 75 80
Arg Thr Ala Ser Gly Gly Asp Gln Arg Arg Glu Ala Asp Ser Gln Arg
85 90 95
Ser Phe Thr Asn Met Asp Gln
100
<210> 84
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 84
Ser Gly Pro Arg Pro Arg Gly Thr Arg Gly Lys Gly Arg Arg Ile Arg
1 5 10 15
Arg
<210> 85
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 85
gggcccggag accagacgag ccgggagccc ggcaacaggg aacccacg 48
<210> 86
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 86
gggcccggag accagacgag ccgggccggc aacagggaac ccacg 45
<210> 87
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 87
gggcccggag accagacgag ccgggagccc ggcaacaggg aacc 44
<210> 88
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 88
agacgagccg ggagccc 17
<210> 89
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 89
gccggagccg ggaagcccga gc 22
<210> 90
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 90
cggagccaag cccga 15
<210> 91
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 91
ggcgggcgca gcgcaagcga cggacaggcc 30
<210> 92
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 92
ggcggaccga ccggacggag aaacagcc 28
<210> 93
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 93
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val
1 5 10 15
Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu
50 55 60
Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser
100 105 110
Gly Thr Lys Glu
115
<210> 94
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 94
Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln
1 5 10 15
Arg
<210> 95
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 95
Arg Asp Arg Arg Arg Arg Gly Ser Arg Pro Ser Gly Ala Glu Arg Arg
1 5 10 15
Arg Arg Arg Ala Ala Ala Ala
20
<210> 96
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 96
acaugaggau uacccaugu 19
<210> 97
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 97
ccggaggauc accacggg 18
<210> 98
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 98
ccacagucac uggg 14
<210> 99
<211> 129
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 99
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly
1 5 10 15
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr
<210> 100
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 100
Asn Ala Lys Thr Arg Arg His Glu Arg Arg Arg Lys Leu Ala Ile Glu
1 5 10 15
Arg Asp Thr Ile
20
<210> 101
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 101
Gly Ser Met Asp Ala Gln Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys
1 5 10 15
Gln Ala Gln Trp Lys Ala Ala Asn
20
<210> 102
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 102
Gly Thr Ala Lys Ser Arg Tyr Lys Ala Arg Arg Ala Glu Leu Ile Ala
1 5 10 15
Glu Arg Arg
<210> 103
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 103
Met Gln Lys Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys Cys Phe
1 5 10 15
Asn Cys Gly Lys Glu Gly His Ile Ala Lys Asn Cys Arg Ala Pro Arg
20 25 30
Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp
35 40 45
Cys Thr Glu Arg Gln Ala Asn
50 55
<210> 104
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 104
gcgcugacaa agcgc 15
<210> 105
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 105
gggcccugaa gaagggccc 19
<210> 106
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 106
ucucaaccua accguugaga 20
<210> 107
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 107
ggacuagcgg aggcuagucc 20
<210> 108
<211> 4104
<212> DNA
<213> Streptococcus pyogenes
<400> 108
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600
attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720
ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960
atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160
catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220
gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280
gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340
aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400
gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460
atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520
gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580
aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640
tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700
aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760
gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820
aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880
ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940
catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000
ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060
attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120
atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180
ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240
acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300
acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360
cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420
tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480
gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540
ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600
agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660
aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720
tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780
cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840
ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900
atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960
gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020
gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080
ttgagtcagc taggaggtga ctga 4104
<210> 109
<211> 1493
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 109
Met Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg
1 5 10 15
Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro
20 25 30
Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg
35 40 45
Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro
50 55 60
Thr Leu Thr Gly Ala Thr Met Asp Tyr Lys Asp His Asp Gly Asp Tyr
65 70 75 80
Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro
85 90 95
Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Asp Lys
100 105 110
Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala
115 120 125
Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu
130 135 140
Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu
145 150 155 160
Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr
165 170 175
Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln
180 185 190
Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His
195 200 205
Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg
210 215 220
His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys
225 230 235 240
Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp
245 250 255
Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys
260 265 270
Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser
275 280 285
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
290 295 300
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
305 310 315 320
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
325 330 335
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
340 345 350
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
355 360 365
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
370 375 380
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
385 390 395 400
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
405 410 415
Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
420 425 430
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val
435 440 445
Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
450 455 460
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu
465 470 475 480
Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu
485 490 495
Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
500 505 510
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu
515 520 525
His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
530 535 540
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr
545 550 555 560
Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
565 570 575
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp
580 585 590
Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
595 600 605
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr
610 615 620
Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr
625 630 635 640
Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala
645 650 655
Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
660 665 670
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu
675 680 685
Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
690 695 700
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu
705 710 715 720
Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
725 730 735
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
740 745 750
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp
755 760 765
Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
770 775 780
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg
785 790 795 800
Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
805 810 815
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
820 825 830
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
835 840 845
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys
850 855 860
Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln
865 870 875 880
Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly
885 890 895
Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
900 905 910
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
915 920 925
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
930 935 940
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser
945 950 955 960
Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
965 970 975
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
980 985 990
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
995 1000 1005
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1010 1015 1020
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1025 1030 1035
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1040 1045 1050
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1055 1060 1065
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1070 1075 1080
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1085 1090 1095
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1100 1105 1110
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1115 1120 1125
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1130 1135 1140
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1145 1150 1155
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1160 1165 1170
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1175 1180 1185
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1190 1195 1200
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1205 1210 1215
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1220 1225 1230
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1235 1240 1245
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1250 1255 1260
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1265 1270 1275
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1280 1285 1290
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1295 1300 1305
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1310 1315 1320
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1325 1330 1335
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1340 1345 1350
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1355 1360 1365
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1370 1375 1380
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1385 1390 1395
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1400 1405 1410
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1415 1420 1425
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1430 1435 1440
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1445 1450 1455
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1460 1465 1470
Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1475 1480 1485
Ala Lys Lys Lys Lys
1490
<210> 110
<211> 1616
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 110
Met Pro Leu Pro Pro Gly Trp Glu Gln Arg Val Asp Gln His Gly Arg
1 5 10 15
Val Tyr Tyr Val Asp His Val Glu Lys Arg Thr Thr Trp Asp Arg Pro
20 25 30
Glu Pro Leu Pro Pro Gly Trp Glu Arg Arg Val Asp Asn Met Gly Arg
35 40 45
Ile Tyr Tyr Val Asp His Phe Thr Arg Thr Thr Thr Trp Gln Arg Pro
50 55 60
Thr Leu Glu Ser Val Arg Asn Tyr Glu Gln Trp Gln Leu Gln Arg Ser
65 70 75 80
Gln Leu Gln Gly Ala Met Gln Gln Phe Asn Gln Arg Phe Ile Tyr Gly
85 90 95
Asn Gln Asp Leu Phe Ala Thr Ser Gln Ser Lys Glu Phe Asp Pro Leu
100 105 110
Gly Pro Leu Pro Pro Gly Trp Glu Lys Arg Thr Asp Ser Asn Gly Arg
115 120 125
Val Tyr Phe Val Asn His Asn Thr Arg Ile Thr Gln Trp Glu Asp Pro
130 135 140
Arg Ser Gln Gly Gln Leu Asn Glu Lys Pro Leu Pro Glu Gly Trp Glu
145 150 155 160
Met Arg Phe Thr Val Asp Gly Ile Pro Tyr Phe Val Asp His Asn Arg
165 170 175
Arg Thr Thr Thr Tyr Ile Asp Pro Arg Thr Gly Gly Gly Thr Gly Ala
180 185 190
Thr Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile
195 200 205
Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys
210 215 220
Val Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly
225 230 235 240
Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu
245 250 255
Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg
260 265 270
His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly
275 280 285
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
290 295 300
Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn
305 310 315 320
Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser
325 330 335
Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
340 345 350
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr
355 360 365
His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg
370 375 380
Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
385 390 395 400
Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu
405 410 415
Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro
420 425 430
Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu
435 440 445
Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu
450 455 460
Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
465 470 475 480
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu
485 490 495
Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
500 505 510
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu
515 520 525
Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile
530 535 540
Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
545 550 555 560
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro
565 570 575
Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
580 585 590
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile
595 600 605
Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
610 615 620
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
625 630 635 640
Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
645 650 655
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile
660 665 670
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
675 680 685
Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr
690 695 700
Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
705 710 715 720
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn
725 730 735
Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
740 745 750
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys
755 760 765
Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu
770 775 780
Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
785 790 795 800
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu
805 810 815
Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
820 825 830
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu
835 840 845
Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
850 855 860
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met
865 870 875 880
Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
885 890 895
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu
900 905 910
Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu
915 920 925
Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln
930 935 940
Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
945 950 955 960
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val
965 970 975
Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
980 985 990
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn
995 1000 1005
Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu
1010 1015 1020
Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu
1025 1030 1035
Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp
1040 1045 1050
Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr
1055 1060 1065
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser
1070 1075 1080
Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
1085 1090 1095
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
1100 1105 1110
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
1115 1120 1125
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu
1130 1135 1140
Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
1145 1150 1155
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
1160 1165 1170
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
1175 1180 1185
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln
1190 1195 1200
Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
1205 1210 1215
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1220 1225 1230
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1235 1240 1245
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1250 1255 1260
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1265 1270 1275
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1280 1285 1290
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1295 1300 1305
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1310 1315 1320
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1325 1330 1335
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1340 1345 1350
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1355 1360 1365
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1370 1375 1380
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1385 1390 1395
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1400 1405 1410
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1415 1420 1425
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1430 1435 1440
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1445 1450 1455
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1460 1465 1470
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1475 1480 1485
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1490 1495 1500
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1505 1510 1515
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1520 1525 1530
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1535 1540 1545
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1550 1555 1560
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1565 1570 1575
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1580 1585 1590
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1595 1600 1605
Ala Gly Gln Ala Lys Lys Lys Lys
1610 1615
<210> 111
<211> 4479
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 111
atgcccttgc cacctggttg ggagcagaga gtggaccagc acgggcgagt ttactatgta 60
gatcatgttg agaaaagaac aacatgggat agaccagaac ctctacctcc tggctgggaa 120
cggcgggttg acaacatggg acgtatttat tatgttgacc atttcacaag aacaacaacg 180
tggcagaggc caacactgac cggtgccacc atggactata aggaccacga cggagactac 240
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 300
aaggtcggta tccacggagt cccagcagcc gacaagaagt acagcatcgg cctggacatc 360
ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 420
ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat cggagccctg 480
ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc cagaagaaga 540
tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 600
aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggataag 660
aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 720
taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 780
cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag 840
ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 900
tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggccatc 960
ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca gctgcccggc 1020
gagaagaaga atggcctgtt cggaaacctg attgccctga gcctgggcct gacccccaac 1080
ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 1140
gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgtttctg 1200
gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1260
atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1320
ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agagattttc 1380
ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag ccaggaagag 1440
ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1500
aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc 1560
caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga tttttaccca 1620
ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat cccctactac 1680
gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1740
accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc ccagagcttc 1800
atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1860
agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa atacgtgacc 1920
gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1980
ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 2040
atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa cgcctccctg 2100
ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga caatgaggaa 2160
aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga cagagagatg 2220
atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat gaagcagctg 2280
aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa cggcatccgg 2340
gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaacaga 2400
aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat ccagaaagcc 2460
caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc cggcagcccc 2520
gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2580
ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca gaccacccag 2640
aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat caaagagctg 2700
ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2760
tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact ggacatcaac 2820
cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2880
atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga caacgtgccc 2940
tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg 3000
attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct gagcgaactg 3060
gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac aaagcacgtg 3120
gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa gctgatccgg 3180
gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3240
ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3300
gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3360
gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3420
gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgagattacc 3480
ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga aaccggggag 3540
atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag catgccccaa 3600
gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3660
cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc taagaagtac 3720
ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa agtggaaaag 3780
ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3840
agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa agaagtgaaa 3900
aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggccggaag 3960
agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct gccctccaaa 4020
tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc ccccgaggat 4080
aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga gatcatcgag 4140
cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga caaagtgctg 4200
tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa tatcatccac 4260
ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga caccaccatc 4320
gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4380
atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga caaaaggccg 4440
gcggccacga aaaaggccgg ccaggcaaaa aagaaaaag 4479
<210> 112
<211> 4848
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 112
atgcccttgc cacctggttg ggagcagaga gtggaccagc acgggcgagt ttactatgta 60
gatcatgttg agaaaagaac aacatgggat agaccagaac ctctacctcc tggctgggaa 120
cggcgggttg acaacatggg acgtatttat tatgttgacc atttcacaag aacaacaacg 180
tggcagaggc caacactgga atccgtccgg aactatgaac aatggcagct acagcgtagt 240
cagcttcaag gagcaatgca gcagtttaac cagagattca tttatgggaa tcaagattta 300
tttgctacat cacaaagtaa agaatttgat cctcttggtc cattgccacc tggatgggag 360
aagagaacag acagcaatgg cagagtatat ttcgtcaacc acaacacacg aattacacaa 420
tgggaagacc ccagaagtca aggtcaatta aatgaaaagc ccttacctga aggttgggaa 480
atgagattca cagtggatgg aattccatat tttgtggacc acaatagaag aactaccacc 540
tatatagatc cccgcacagg cggaggaacc ggtgccacca tggactataa ggaccacgac 600
ggagactaca aggatcatga tattgattac aaagacgatg acgataagat ggccccaaag 660
aagaagcgga aggtcggtat ccacggagtc ccagcagccg acaagaagta cagcatcggc 720
ctggacatcg gcaccaactc tgtgggctgg gccgtgatca ccgacgagta caaggtgccc 780
agcaagaaat tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 840
ggagccctgc tgttcgacag cggcgaaaca gccgaggcca cccggctgaa gagaaccgcc 900
agaagaagat acaccagacg gaagaaccgg atctgctatc tgcaagagat cttcagcaac 960
gagatggcca aggtggacga cagcttcttc cacagactgg aagagtcctt cctggtggaa 1020
gaggataaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 1080
cacgagaagt accccaccat ctaccacctg agaaagaaac tggtggacag caccgacaag 1140
gccgacctgc ggctgatcta tctggccctg gcccacatga tcaagttccg gggccacttc 1200
ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 1260
gtgcagacct acaaccagct gttcgaggaa aaccccatca acgccagcgg cgtggacgcc 1320
aaggccatcc tgtctgccag actgagcaag agcagacggc tggaaaatct gatcgcccag 1380
ctgcccggcg agaagaagaa tggcctgttc ggaaacctga ttgccctgag cctgggcctg 1440
acccccaact tcaagagcaa cttcgacctg gccgaggatg ccaaactgca gctgagcaag 1500
gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 1560
ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc tgagcgacat cctgagagtg 1620
aacaccgaga tcaccaaggc ccccctgagc gcctctatga tcaagagata cgacgagcac 1680
caccaggacc tgaccctgct gaaagctctc gtgcggcagc agctgcctga gaagtacaaa 1740
gagattttct tcgaccagag caagaacggc tacgccggct acattgacgg cggagccagc 1800
caggaagagt tctacaagtt catcaagccc atcctggaaa agatggacgg caccgaggaa 1860
ctgctcgtga agctgaacag agaggacctg ctgcggaagc agcggacctt cgacaacggc 1920
agcatccccc accagatcca cctgggagag ctgcacgcca ttctgcggcg gcaggaagat 1980
ttttacccat tcctgaagga caaccgggaa aagatcgaga agatcctgac cttccgcatc 2040
ccctactacg tgggccctct ggccagggga aacagcagat tcgcctggat gaccagaaag 2100
agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg tggacaaggg cgcttccgcc 2160
cagagcttca tcgagcggat gaccaacttc gataagaacc tgcccaacga gaaggtgctg 2220
cccaagcaca gcctgctgta cgagtacttc accgtgtata acgagctgac caaagtgaaa 2280
tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa aaaggccatc 2340
gtggacctgc tgttcaagac caaccggaaa gtgaccgtga agcagctgaa agaggactac 2400
ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga tcggttcaac 2460
gcctccctgg gcacatacca cgatctgctg aaaattatca aggacaagga cttcctggac 2520
aatgaggaaa acgaggacat tctggaagat atcgtgctga ccctgacact gtttgaggac 2580
agagagatga tcgaggaacg gctgaaaacc tatgcccacc tgttcgacga caaagtgatg 2640
aagcagctga agcggcggag atacaccggc tggggcaggc tgagccggaa gctgatcaac 2700
ggcatccggg acaagcagtc cggcaagaca atcctggatt tcctgaagtc cgacggcttc 2760
gccaacagaa acttcatgca gctgatccac gacgacagcc tgacctttaa agaggacatc 2820
cagaaagccc aggtgtccgg ccagggcgat agcctgcacg agcacattgc caatctggcc 2880
ggcagccccg ccattaagaa gggcatcctg cagacagtga aggtggtgga cgagctcgtg 2940
aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg aaatggccag agagaaccag 3000
accacccaga agggacagaa gaacagccgc gagagaatga agcggatcga agagggcatc 3060
aaagagctgg gcagccagat cctgaaagaa caccccgtgg aaaacaccca gctgcagaac 3120
gagaagctgt acctgtacta cctgcagaat gggcgggata tgtacgtgga ccaggaactg 3180
gacatcaacc ggctgtccga ctacgatgtg gaccatatcg tgcctcagag ctttctgaag 3240
gacgactcca tcgacaacaa ggtgctgacc agaagcgaca agaaccgggg caagagcgac 3300
aacgtgccct ccgaagaggt cgtgaagaag atgaagaact actggcggca gctgctgaac 3360
gccaagctga ttacccagag aaagttcgac aatctgacca aggccgagag aggcggcctg 3420
agcgaactgg ataaggccgg cttcatcaag agacagctgg tggaaacccg gcagatcaca 3480
aagcacgtgg cacagatcct ggactcccgg atgaacacta agtacgacga gaatgacaag 3540
ctgatccggg aagtgaaagt gatcaccctg aagtccaagc tggtgtccga tttccggaag 3600
gatttccagt tttacaaagt gcgcgagatc aacaactacc accacgccca cgacgcctac 3660
ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc ctaagctgga aagcgagttc 3720
gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggaa 3780
atcggcaagg ctaccgccaa gtacttcttc tacagcaaca tcatgaactt tttcaagacc 3840
gagattaccc tggccaacgg cgagatccgg aagcggcctc tgatcgagac aaacggcgaa 3900
accggggaga tcgtgtggga taagggccgg gattttgcca ccgtgcggaa agtgctgagc 3960
atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga caggcggctt cagcaaagag 4020
tctatcctgc ccaagaggaa cagcgataag ctgatcgcca gaaagaagga ctgggaccct 4080
aagaagtacg gcggcttcga cagccccacc gtggcctatt ctgtgctggt ggtggccaaa 4140
gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag agctgctggg gatcaccatc 4200
atggaaagaa gcagcttcga gaagaatccc atcgactttc tggaagccaa gggctacaaa 4260
gaagtgaaaa aggacctgat catcaagctg cctaagtact ccctgttcga gctggaaaac 4320
ggccggaaga gaatgctggc ctctgccggc gaactgcaga agggaaacga actggccctg 4380
ccctccaaat atgtgaactt cctgtacctg gccagccact atgagaagct gaagggctcc 4440
cccgaggata atgagcagaa acagctgttt gtggaacagc acaagcacta cctggacgag 4500
atcatcgagc agatcagcga gttctccaag agagtgatcc tggccgacgc taatctggac 4560
aaagtgctgt ccgcctacaa caagcaccgg gataagccca tcagagagca ggccgagaat 4620
atcatccacc tgtttaccct gaccaatctg ggagcccctg ccgccttcaa gtactttgac 4680
accaccatcg accggaagag gtacaccagc accaaagagg tgctggacgc caccctgatc 4740
caccagagca tcaccggcct gtacgagaca cggatcgacc tgtctcagct gggaggcgac 4800
aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 4848
<210> 113
<211> 717
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 113
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717
<210> 114
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 114
Ala Gly Val Phe
1
<210> 115
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 115
Pro Pro Ser Tyr
1
<210> 116
<211> 433
<212> PRT
<213> Homo Sapiens
<400> 116
Met Gly Arg Val Gln Leu Phe Glu Ile Ser Leu Ser His Gly Arg Val
1 5 10 15
Val Tyr Ser Pro Gly Glu Pro Leu Ala Gly Thr Val Arg Val Arg Leu
20 25 30
Gly Ala Pro Leu Pro Phe Arg Ala Ile Arg Val Thr Cys Ile Gly Ser
35 40 45
Cys Gly Val Ser Asn Lys Ala Asn Asp Thr Ala Trp Val Val Glu Glu
50 55 60
Gly Tyr Phe Asn Ser Ser Leu Ser Leu Ala Asp Lys Gly Ser Leu Pro
65 70 75 80
Ala Gly Glu His Ser Phe Pro Phe Gln Phe Leu Leu Pro Ala Thr Ala
85 90 95
Pro Thr Ser Phe Glu Gly Pro Phe Gly Lys Ile Val His Gln Val Arg
100 105 110
Ala Ala Ile His Thr Pro Arg Phe Ser Lys Asp His Lys Cys Ser Leu
115 120 125
Val Phe Tyr Ile Leu Ser Pro Leu Asn Leu Asn Ser Ile Pro Asp Ile
130 135 140
Glu Gln Pro Asn Val Ala Ser Ala Thr Lys Lys Phe Ser Tyr Lys Leu
145 150 155 160
Val Lys Thr Gly Ser Val Val Leu Thr Ala Ser Thr Asp Leu Arg Gly
165 170 175
Tyr Val Val Gly Gln Ala Leu Gln Leu His Ala Asp Val Glu Asn Gln
180 185 190
Ser Gly Lys Asp Thr Ser Pro Val Val Ala Ser Leu Leu Gln Lys Val
195 200 205
Ser Tyr Lys Ala Lys Arg Trp Ile His Asp Val Arg Thr Ile Ala Glu
210 215 220
Val Glu Gly Ala Gly Val Lys Ala Trp Arg Arg Ala Gln Trp His Glu
225 230 235 240
Gln Ile Leu Val Pro Ala Leu Pro Gln Ser Ala Leu Pro Gly Cys Ser
245 250 255
Leu Ile His Ile Asp Tyr Tyr Leu Gln Val Ser Leu Lys Ala Pro Glu
260 265 270
Ala Thr Val Thr Leu Pro Val Phe Ile Gly Asn Ile Ala Val Asn His
275 280 285
Ala Pro Val Ser Pro Arg Pro Gly Leu Gly Leu Pro Pro Gly Ala Pro
290 295 300
Pro Leu Val Val Pro Ser Ala Pro Pro Gln Glu Glu Ala Glu Ala Glu
305 310 315 320
Ala Ala Ala Gly Gly Pro His Phe Leu Asp Pro Val Phe Leu Ser Thr
325 330 335
Lys Ser His Ser Gln Arg Gln Pro Leu Leu Ala Thr Leu Ser Ser Val
340 345 350
Pro Gly Ala Pro Glu Pro Cys Pro Gln Asp Gly Ser Pro Ala Ser His
355 360 365
Pro Leu His Pro Pro Leu Cys Ile Ser Thr Gly Ala Thr Val Pro Tyr
370 375 380
Phe Ala Glu Gly Ser Gly Gly Pro Val Pro Thr Thr Ser Thr Leu Ile
385 390 395 400
Leu Pro Pro Glu Tyr Ser Ser Trp Gly Tyr Pro Tyr Glu Ala Pro Pro
405 410 415
Ser Tyr Glu Gln Ser Cys Gly Gly Val Glu Pro Ser Leu Thr Pro Glu
420 425 430
Ser
<210> 117
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 117
Gly Phe Leu Gly
1
<210> 118
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 118
Ala Leu Ala Leu
1
<210> 119
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 119
Ala Leu Ala Leu Ala
1 5
<210> 120
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 120
Leu Pro Xaa Thr Gly
1 5
<210> 121
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 121
Asn Asn Ala Gly Ala Ala Trp
1 5
<210> 122
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 122
Pro Ser Ala Pro
1
<210> 123
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 123
Pro Thr Ala Pro
1
<210> 124
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 124
Pro Pro Glu Tyr
1
Claims (65)
- 하기를 포함하는 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)로서:
아레스틴 도메인,
적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및
적어도 1개의 PPXY 모티프,
여기서 최소 ARRDC1은 전장 ARRDC1 단백질보다 더 짧은 것인
최소 ARRDC1. - 제1항에 있어서, ARRDC1이 적어도 2개의 PPXY 모티프를 포함하는 것인 최소 ARRDC1.
- 제1항 또는 제2항에 있어서, 최소 ARRDC1이 400개 미만의 아미노산의 길이인 최소 ARRDC1.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 최소 ARRDC1이 350개 미만의 아미노산의 길이인 최소 ARRDC1.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 1개의 PPXY 모티프가 PPEY (서열식별번호: 124)인 최소 ARRDC1.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 1개의 PPXY 모티프가 PPSY (서열식별번호: 125)인 최소 ARRDC1.
- 제2항에 있어서, 적어도 2개의 PPXY 모티프가 PPEY (서열식별번호: 124) 및 PPSY (서열식별번호: 125)인 최소 ARRDC1.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 최소 ARRDC1이 서열식별번호: 1에 제시된 아미노산 서열과 적어도 85% 동일한, 또는 임의로 90% 동일한, 또는 임의로 95% 동일한 아미노산 서열을 포함하는 것인 최소 ARRDC1.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 최소 ARRDC1이 서열식별번호: 1에 제시된 아미노산 서열을 포함하는 것인 최소 ARRDC1.
- 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM)로서:
지질 이중층 및 최소 ARRDC1 단백질 또는 그의 변이체,
여기서 ARRDC1 단백질은 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프 및 적어도 1개의 PPXY 모티프를 포함하고, 여기서 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧은 것인
미세소포. - 제10항에 있어서, 최소 ARRDC1이 적어도 2개의 PPXY 모티프를 포함하는 것인 미세소포.
- 제10항 또는 제11항에 있어서, 최소 ARRDC1 단백질이 서열식별번호: 1에 제시된 아미노산 서열을 포함하는 것인 미세소포.
- 제10항 내지 제12항 중 어느 한 항에 있어서, 작용제를 추가로 포함하는 미세소포.
- 제13항에 있어서, 작용제가 핵산, 단백질, 및 소분자로 이루어진 군으로부터 선택되는 것인 미세소포.
- 제10항 내지 제14항 중 어느 한 항에 있어서, 미세소포가 TSG101 단백질 또는 그의 단편을 추가로 포함하는 것인 미세소포.
- 제15항에 있어서, TSG101 단백질 단편이 TSG101 UEV 도메인을 포함하는 것인 미세소포.
- 제10항 내지 제16항 중 어느 한 항에 있어서, 작용제가 최소 ARRDC1 단백질, 최소 ARRDC1 단편, TSG101 단백질, 또는 TSG101 단편에 접합되거나, 또는 그와의 융합 단백질로서 발현되는 것인 미세소포.
- 제10항 내지 제17항 중 어느 한 항에 있어서, 미세소포가 인테그린, 수용체 티로신 키나제, G-단백질 커플링된 수용체, 또는 막-결합된 이뮤노글로불린을 추가로 포함하는 것인 미세소포.
- 제10항 내지 제18항 중 어느 한 항에 있어서, 미세소포가 Cas9 단백질 또는 Cas9 단백질 변이체, Oct4, Sox2, c-Myc, 및 KLF4 재프로그래밍 인자, p53, Rb (망막모세포종 단백질), BRCA1, BRCA2, PTEN, APC, CD95, ST7, ST14, BCL-2 패밀리 단백질, 카스파제; BRMS1, CRSP3, DRG1, KAI1, KISS1, NM23, TIMP-패밀리 단백질, BMP-패밀리 성장 인자, EGF, EPO, FGF, G-CSF, GM-CSF, GDF-패밀리 성장 인자, HGF, HDGF, IGF, PDGF, TPO, TGF-α TGF-β, VEGF; 아연 핑거 뉴클레아제, Cre, Dre, FLP 리콤비나제, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, gp29, Cre, FLP, R, Lambda, HK101, HK022, pSAM2, CAS9 뉴클레아제, Sp1, NF1, CCAAT, GATA, HNF, PIT-1, MyoD, Myf5, Hox, 날개 나선, SREBP, p53, CREB, AP-1, Mef2, STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT, α1β1 인테그린, α2β1 인테그린, α4β1 인테그린, α5β1 인테그린, α6β1 인테그린, αLβ2 인테그린, αMβ2 인테그린, αIIbβ3 인테그린, αVβ3 인테그린, αVβ5 인테그린, αVβ6 인테그린, α6β4 인테그린, EGF 수용체 (ErbB 패밀리), 인슐린 수용체, PDGF 수용체, FGF 수용체, VEGF 수용체, HGF 수용체, Trk 수용체, Eph 수용체, AXL 수용체, LTK 수용체, TIE 수용체, ROR 수용체, DDR 수용체, RET 수용체, KLG 수용체, RYK 수용체, MuSK 수용체, 로돕신-유사 수용체, 세크레틴 수용체, 대사자극성 글루타메이트/페로몬 수용체, 시클릭 AMP 수용체, 프리즐드/스무든드 수용체, CXCR4 수용체, CCR5 수용체, 베타-아드레날린성 수용체, CA19-9, c-met, PD-1, CTLA-4, ALK, AFP, EGFR, 에스트로겐 수용체 (ER), 프로게스테론 수용체 (PR), HER2/neu, KIT, B-RAF, S100, MAGE, 티로글로불린, MUC-1, 및 PSMA로 이루어진 군으로부터 선택되는 작용제를 포함하는 것인 미세소포.
- 제14항 내지 제19항 중 어느 한 항에 있어서, 핵산이 RNA를 포함하는 것인 미세소포.
- 제14항 내지 제20항 중 어느 한 항에 있어서, 핵산이 RNAi 작용제를 포함하는 것인 미세소포.
- 제14항 내지 제20항 중 어느 한 항에 있어서, 핵산이 코딩 RNA, 비-코딩 RNA, 안티센스 RNA, mRNA, 작은 RNA, siRNA, shRNA, 마이크로RNA, snRNA, snoRNA, lincRNA, 구조적 RNA, 리보자임, 또는 그의 전구체를 포함하는 것인 미세소포.
- 제14항 내지 제19항 중 어느 한 항에 있어서, 핵산이 DNA를 포함하는 것인 미세소포.
- 제23항에 있어서, DNA가 레트로트랜스포존 서열, LINE 서열, SINE 서열, 복합 SINE 서열, 또는 LTR-레트로트랜스포존 서열을 포함하는 것인 미세소포.
- 제14항 내지 제24항 중 어느 한 항에 있어서, 핵산이 단백질을 코딩하는 것인 미세소포.
- 제13항 내지 제25항 중 어느 한 항에 있어서, 작용제가 검출가능한 표지를 포함하는 것인 미세소포.
- 제13항 내지 제26항 중 어느 한 항에 있어서, 작용제가 치료제를 포함하는 것인 미세소포.
- 제27항에 있어서, 작용제가 효소, 항체, Fab, Fab', F(ab')2, Fd, scFv, Fv, dsFv, 디아바디, 및 아피바디로 이루어진 군으로부터 선택되는 것인 미세소포.
- 제13항 내지 제28항 중 어느 한 항에 있어서, 작용제가 세포독성제를 포함하는 것인 미세소포.
- 제13항 내지 제29항 중 어느 한 항에 있어서, 작용제가 단백질을 포함하는 것인 미세소포.
- 제30항에 있어서, 작용제가 전사 인자, 전사 억제제, 형광 단백질, 키나제, 포스파타제, 프로테아제, 리가제, 또는 리콤비나제를 포함하는 것인 미세소포.
- 제13항 내지 제31항 중 어느 한 항에 있어서, 작용제가 최소 ARRDC1 단백질 또는 그의 단편, 또는 TSG101 단백질 또는 그의 단편에 공유 결합된 것인 미세소포.
- 제13항 내지 제32항 중 어느 한 항에 있어서, 작용제가 링커를 통해 최소 ARRDC1 단백질 또는 그의 단편 또는 TSG101 단백질 또는 그의 단편에 접합된 것인 미세소포.
- 제33항에 있어서, 링커가 절단가능한 링커인 미세소포.
- 제34항에 있어서, 링커가 프로테아제 인식 부위 또는 UV-절단가능한 모이어티를 포함하는 것인 미세소포.
- 제13항 내지 제31항 중 어느 한 항에 있어서, 작용제가 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 것인 미세소포.
- 제36항에 있어서, 작용제가 2, 3, 4, 또는 5개의 WW 도메인 또는 그의 변이체를 포함하는 것인 미세소포.
- 제36항 또는 제37항에 있어서, WW 도메인이 유비퀴틴 리가제 WWP1, WWP2, Nedd4-1, Nedd4-2, Smurf1, Smurf2, ITCH, NEDL1, 또는 NEDL2의 WW 도메인으로부터 유래된 것인 미세소포.
- 제36항 내지 제38항 중 어느 한 항에 있어서, WW 도메인이 서열식별번호: 6 내지 14로 이루어진 군으로부터 선택되는 서열을 포함하는 것인 미세소포.
- 제36항 내지 제39항 중 어느 한 항에 있어서, 작용제가 단백질이고, 임의로 작용제가 융합 단백질인 미세소포.
- 제36항 내지 제40항 중 어느 한 항에 있어서, 작용제가 Cas9 단백질인 미세소포.
- 제41항에 있어서, Cas9 단백질 또는 그의 변이체가 적어도 1개의 핵 국재화 서열 (NLS)을 포함하는 것인 미세소포.
- 제41항 또는 제42항에 있어서, 가이드 RNA (gRNA)를 추가로 포함하는 미세소포.
- 제36항 내지 제43항 중 어느 한 항에 있어서, WW 도메인이 단백질의 N-말단에 융합된 것인 미세소포.
- 제36항 내지 제44항 중 어느 한 항에 있어서, WW 도메인이 단백질의 C-말단에 융합된 것인 미세소포.
- 제10항 내지 제45항 중 어느 한 항에 있어서, 미세소포가 엑소좀 바이오마커를 포함하지 않는 것인 미세소포.
- 제10항 내지 제46항 중 어느 한 항에 있어서, 미세소포가 엑소좀 바이오마커에 대해 음성인 미세소포.
- 제46항 또는 제47항에 있어서, 엑소좀 바이오마커가 CD63, Lamp-1, Lamp-2, CD9, HSPA8, GAPDH, CD81, SDCBP, PDCD6IP, ENO1, ANXA2, ACTB, YWHAZ, HSP90AA129, ANXA5, EEF1A1, YWHAE, PPIA, MSN, CFL1, ALDOA, PGK1, EEF2, ANXA1, PKM2, HLA-DRA, 및 YWHAB로 이루어진 군으로부터 선택되는 것인 미세소포.
- 제46항 내지 제48항 중 어느 한 항에 있어서, 미세소포가 CD63 및 Lamp-1을 포함하지 않거나 또는 그에 대해 음성인 미세소포.
- 제10항 내지 제49항 중 어느 한 항에 있어서, 미세소포 직경이 약 30 nm 내지 약 500 nm인 미세소포.
- 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM):
지질 이중층;
ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질 또는 그의 변이체; 및
최소 ARRDC1 단백질에 연결된 Cas9 화물 단백질. - 제51항에 있어서, 최소 ARRDC1 단백질이 Cas9 화물 단백질에 공유 연결된 것인 미세소포.
- 제51항 또는 제52항에 있어서, 최소 ARRDC1 단백질이 절단가능한 링커를 통해 Cas9 단백질에 연결된 것인 미세소포.
- 제51항 내지 제53항 중 어느 한 항에 있어서, 링커가 프로테아제 인식 부위를 포함하는 것인 미세소포.
- 제51항 내지 제54항 중 어느 한 항에 있어서, 링커가 UV-절단가능한 링커를 포함하는 것인 미세소포.
- 하기를 포함하는 아레스틴 도메인-함유 단백질 1 (ARRDC1)-매개된 미세소포 (ARMM):
지질 이중층;
최소 ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 및/또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 최소 ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질;
TSG101 단백질 또는 그의 변이체; 및
TSG101 단백질 또는 그의 변이체에 연결된 Cas9 단백질. - 하기를 포함하는 최소 ARRDC1 융합 단백질:
최소 ARRDC1 단백질이 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 최소 ARRDC1 단백질이 전장 ARRDC1 단백질보다 더 짧은 것인 최소 ARRDC1 단백질 또는 그의 변이체; 및
Cas9 단백질 또는 그의 변이체. - 하기를 포함하는 미세소포-생산 세포:
이종 프로모터의 제어 하에서 제A1항 내지 제A7항 중 어느 한 항의 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물, 및
이종 프로모터의 제어 하에서 화물 단백질을 코딩하는 재조합 발현 구축물. - 제58항에 있어서, 화물 단백질이 적어도 1개의 WW 도메인 또는 그의 변이체에 융합된 것인 미세소포-생산 세포.
- 이종 프로모터의 제어 하에서 최소 ARRDC1 단백질을 코딩하는 재조합 발현 구축물을 포함하는 미세소포-생산 세포로서, 여기서 최소 ARRDC1 단백질은 아레스틴 도메인, 적어도 1개의 PSAP (서열식별번호: 122) 및/또는 PTAP (서열식별번호: 123) 모티프, 및 적어도 2개의 PPXY 모티프를 포함하고, 여기서 최소 ARRDC1 단백질은 전장 ARRDC1 단백질보다 더 짧고; 여기서 최소 ARRDC1 단백질은 Cas9 화물 단백질 또는 그의 변이체에 연결된 것인 미세소포-생산 세포.
- 표적 세포를 제10항 내지 제56항 중 어느 한 항의 미세소포와 접촉시키는 것을 포함하는, 화물을 표적 세포에 전달하는 방법.
- 표적 세포를 제58항 내지 제60항 중 어느 한 항의 미세소포-생산 세포와 접촉시키는 것을 포함하는, 화물을 표적 세포에 전달하는 방법.
- 표적 세포를 제10항 내지 제56항 중 어느 한 항의 미세소포와 접촉시키는 것을 포함하는, 유전자 편집의 방법.
- 표적 세포를 제58항 내지 제60항 중 어느 한 항의 미세소포-생산 세포와 접촉시키는 것을 포함하는, 유전자 편집의 방법.
- 제1항 내지 제8항 중 어느 한 항의 최소 아레스틴 도메인-함유 단백질 1 (ARRDC1)을 코딩하는 뉴클레오티드 서열을 포함하는 핵산.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962906685P | 2019-09-26 | 2019-09-26 | |
US62/906,685 | 2019-09-26 | ||
PCT/US2020/052784 WO2021062196A1 (en) | 2019-09-26 | 2020-09-25 | Minimal arrestin domain containing protein 1 (arrdc1) constructs |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220108036A true KR20220108036A (ko) | 2022-08-02 |
Family
ID=75166435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227013827A KR20220108036A (ko) | 2019-09-26 | 2020-09-25 | 최소 아레스틴 도메인 함유 단백질 1 (arrdc1) 구축물 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220403003A1 (ko) |
EP (1) | EP4034088A4 (ko) |
JP (1) | JP2022550130A (ko) |
KR (1) | KR20220108036A (ko) |
CN (1) | CN114901257A (ko) |
AU (1) | AU2020353149A1 (ko) |
CA (1) | CA3152414A1 (ko) |
WO (1) | WO2021062196A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023129993A2 (en) * | 2021-12-29 | 2023-07-06 | Intima Bioscience, Inc. | Antigen delivery platform and methods of use |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013119602A1 (en) * | 2012-02-06 | 2013-08-15 | President And Fellows Of Harvard College | Arrdc1-mediated microvesicles (armms) and uses thereof |
US9816080B2 (en) * | 2014-10-31 | 2017-11-14 | President And Fellows Of Harvard College | Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs) |
WO2018067546A1 (en) * | 2016-10-03 | 2018-04-12 | President And Fellows Of Harvard College | Delivery of therapeutic rnas via arrdc1-mediated microvesicles |
JP7395355B2 (ja) * | 2017-05-08 | 2023-12-11 | フラッグシップ パイオニアリング イノベーションズ ブイ, インコーポレイテッド | 膜融合を促進するための組成物およびその使用 |
GB201802163D0 (en) * | 2018-02-09 | 2018-03-28 | Evox Therapeutics Ltd | Compositions for EV storage and formulation |
-
2020
- 2020-09-25 CN CN202080081537.9A patent/CN114901257A/zh active Pending
- 2020-09-25 KR KR1020227013827A patent/KR20220108036A/ko unknown
- 2020-09-25 JP JP2022519466A patent/JP2022550130A/ja active Pending
- 2020-09-25 US US17/764,013 patent/US20220403003A1/en active Pending
- 2020-09-25 WO PCT/US2020/052784 patent/WO2021062196A1/en unknown
- 2020-09-25 CA CA3152414A patent/CA3152414A1/en active Pending
- 2020-09-25 AU AU2020353149A patent/AU2020353149A1/en active Pending
- 2020-09-25 EP EP20869845.6A patent/EP4034088A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4034088A1 (en) | 2022-08-03 |
CN114901257A (zh) | 2022-08-12 |
AU2020353149A1 (en) | 2022-04-14 |
EP4034088A4 (en) | 2023-10-11 |
JP2022550130A (ja) | 2022-11-30 |
US20220403003A1 (en) | 2022-12-22 |
CA3152414A1 (en) | 2021-04-01 |
WO2021062196A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11827910B2 (en) | Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs) | |
US11643652B2 (en) | Methods and compositions for prime editing nucleotide sequences | |
US20240067982A1 (en) | Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis | |
Pintacuda et al. | hnRNPK recruits PCGF3/5-PRC1 to the Xist RNA B-repeat to establish polycomb-mediated chromosomal silencing | |
KR102588469B1 (ko) | 변형된 줄기세포 기억 t 세포, 이의 제조 방법 및 사용 방법 | |
Schöller et al. | Balancing of mitochondrial translation through METTL8-mediated m3C modification of mitochondrial tRNAs | |
US20200010903A1 (en) | AAV-Mediated Direct In vivo CRISPR Screen in Glioblastoma | |
JP2023022254A (ja) | Crispr/cpf1システム及び方法 | |
EP3518981A1 (en) | Delivery of therapeutic rnas via arrdc1-mediated microvesicles | |
KR20190116407A (ko) | 고-충실도 Cas9 변이체 및 그의 적용 | |
KR20180029953A (ko) | 세포 또는 유기체의 게놈으로의 DNA 서열의 표적화 혼입을 위한 Cas 9 레트로바이러스 인테그라제 시스템 및 Cas 9 재조합효소 시스템 | |
US20240018270A1 (en) | Compositions and methods for detection and measurement of rna modifications through targeted rna editing | |
CN113711046B (zh) | 用于揭示与Tau聚集相关的基因脆弱性的CRISPR/Cas脱落筛选平台 | |
KR20220019794A (ko) | 표적화된 유전자 편집 작제물 및 이의 사용 방법 | |
CN116234583A (zh) | Arrdc1介导的基于微泡的向神经系统的递送 | |
KR20220108036A (ko) | 최소 아레스틴 도메인 함유 단백질 1 (arrdc1) 구축물 | |
US20200017917A1 (en) | Mapping a Functional Cancer Genome Atlas of Tumor Suppressors Using AAV-CRISPR Mediated Direct In Vivo Screening | |
WO2023245141A2 (en) | Compositions and methods for reducing complement activation |